SUMMARY
Data yang diunggah Globocan pada tahun 2020, jumlah kasus baru kanker payudara di Indonesia mencapai 68.858 kasus (16,6%) dari total 396.914 kasus baru kanker, dengan jumlah kematiannya mencapai lebih dari 22 ribu jiwa kasus. dibidang kesehatan dan medis, klasifikasi berbasis pembelajaran mesin banyak digunakan untuk membantu dokter dan profesional kesehatan mengklasifikasikan penyakit kanker untuk menentukan tindakan terbaik, bahwa ada beberapa algoritma, teknik dan alat yang dipakai dalam memprediksi penyakit kanker payudara dengan hasil akurasi yang berbeda-beda. Dengan membandingkan algoritma klasifikasi dan metode Ensemble Learning Bagging dan metode biasa pada penelitian ini serta dengan menggunakan data yang berasal dari SEER NCI yang diunggah ke dalam website Kaggle.com dengan jumlah atribut yaitu 16 dan jumlah record nya sebesar 4025 record, bahwa hasil dari perbandingan model algoritma baik menggunakan teknik Ensemble Learning Bagging atau tidak, algoritma dengan nilai kinerja akurasi terbaik yaitu algoritma Random Forest, semua kinerja akurasi pada setiap algoritma bertambah dengan rata-rata kenaikan 1% dengan menggunakan teknik Ensemble Learning Bagging, menunjukan bahwa teknik ini dapat digunakan untuk meningkatkan kinerja akurasi dibandingkan dengan teknik default pada setiap algoritma ataupun dengan perhitungan manual, selain itu jumlah record juga dapat mempengaruhi kinerja algoritma. Dengan menambahkan model algoritma lain nya seperti AdaBoost, logistic Regression, XGBClassifier, LGBMClassifier, ExstraTreeClasifier, dan teknik Ensemble Learning Heterogenous serta proses pembuatan Machine Learning dengan framework Streamlit maka proses untuk prediksi penyakit kanker payudara akan semakin baik.