Implementasi Metode Random Forest pada Kategori Konten Kanal Youtube

Authors

  • Siti Mahmuda Universitas Mulawarman

DOI:

https://doi.org/10.57008/jjm.v2i01.633

Keywords:

Random forest, klasifikasi ensemble, youtube, akurasi

Abstract

Random Forest adalah metode klasifikasi ensemble dalam algoritma pembelajaran mesin. Metode klasifikasi ensemble bertujuan untuk meningkatkan akurasi model dan kinerja klasifikasi. Berdasarkan ukuran akurasi, Random Forest menunjukkan performa terbaik diantara metode klasifikasi yang ada, seperti Support Vector Machine (SVM) dan AdaBoost. Oleh karena itu, penelitian ini menerapkan metode klasifikasi Random Forest pada kategori konten kanal Youtube. Variabel prediktor klasifikasi adalah jumlahsubscribers, jumlah video, jumlah penayangan video, dan lama kanal Youtube. Metode Random Forest menunjukkan jumlah pohon yang dipilih adalah 100 dan mtry adalah 1. Jumlah subscribers merupakan variabel yang paling berpengaruh dalam pengkategorian konten kanal Youtube dengan tingkat kepentingan sebesar 19,04%. Akurasi klasifikasi yang dihasilkan sebesar 77,27%.

References

Arumnisa R.I. dan Wijayanto A.W. (2023). Perbandingan Metode Ensemble Learning: Random Forest, SVM, AdaBoost pada Klasifikasi Indeks Pembangunan Manusia (IPM). Jurnal Sistem Informasi, vol.12(1).

Breiman. L. (2001). Random Forest. Machine Learning Journal, vol. 45(5).

Dewi N.K., Syafitri U.D., dan Mulyadi S.Y. (2011) . Penerapan Metode Random Forest dalam Driver Analysis. Statistics and Its Application, vol.16(1).

Dhawangkara M. dan Riksakomora E. (2014). Prediksi Intensitas Hujan Kota Surabaya dengan Matlab Menggunakan Teknik Random Forest dan CART (Studi Kasus Kota Surabaya). Jurnal Teknik ITS, vol.6(1).

Dian S. (2014). Klasifikasi Rumah tangga Sangat Miskin di Kabupaten Jombang Menurut Paket Bantuan Rumah Tangga yang Diharapkan dengan Pendekatan Random Forest Classification and Regression Trees (RF-CART). Jurnal Sains dan Seni, pp 1-7.

Diettarich T.G. (2000). Ensemble Method in Machine Learning. Springer-Verlag Berlin, vol.1857, pp.1-15.

Global Youtube Statistitics 2023 Dataset. https://www.kaggle.com/datasets/nelgiriyewithana/global-youtube-statistics-2023. Diakses pada tanggal 29 November 2023.

Lareno B. (2014). Analisa dan Perbandingan Akurasi Model Prediksi Rentet Waktu Arus Lintas Jangka Pendek. CSRID Journal, vol. 6(3).

Li Y dan Weidong C. (2020). A Comparative Perfomance Assesment of Ensemble Learning for Credit Scoring. Mathematics, vol.8(10).

Lingga P.R.D. (2011). Deteksi Gempa Berdasarkan Data Twitter menggunakan Decision Tree, Random Forest, dan SVM. Jurnal Teknik ITS, vol.160.

Rahmawati I. (2015). Klasifikasi Faktor-faktor yang Mempengaruhi Korban Kecelakaan Lalu Lintas di Surabaya dengan Pendekatan Regresi Logistik Multinomial dan Random Forest. Tesis ITS. Surabaya.

Samudra A.Y. (2019). Pendekatan Random Forest untuk Model Peramalan Harga Tembakau Rajangan di Kabupaten Temanggung. Tesis. Yogyakarta.

Sartono B dan Dharmawan H. (2023). Pemodelan Prediksi Berbasis Pohon Klasifikasi. IPB Press Bogor.

Syarif I dkk. (2012). Application of bagging, Boosting, and Stacking to Intrusion Detection. Springer-Verlag Berlin, vol.7376, pp.593-602.

Wulansari M.J. (2018). Analisis Faktor-faktor yang Mempengaruhi Seseorang Terkena Penyakit Diabetes Melitus Menggunakan Regresi Random Forest. Tesis. Yogyakarta.

Downloads

Published

2024-01-25

How to Cite

Mahmuda, S. (2024). Implementasi Metode Random Forest pada Kategori Konten Kanal Youtube. JURNAL JENDELA MATEMATIKA, 2(01), 21–31. https://doi.org/10.57008/jjm.v2i01.633