+62 813-8532-9115 info@scirepid.com

 
ISAINTEK - Jurnal Informasi, Sains dan Teknologi - Vol. 4 Issue. 2 (2021)

Klasifikasi Konten Web Radikal Di Indonesia menggunakan Web Content Mining Dan Algoritma K-Nearest Neighbor

Subhan Subhan,



Abstract

Konten radikal dalam arti procedural adalah konten memprovokasi kekerasan menyebarkan kebencian dan anti nasionalisme. Definisi radikal di setiap negara sangat berbeda, khususnya di Indonesia, konten radikal lebih identik dan sering dikaitkan dengan isu provokasi, kebencian terhadap Suku dan Agama (SARA) tertentu. Konten SARA masih sangat sulit dideteksi, selain karena jumlahnya sangat banyak, tidak terstruktur dan banyak noise juga menimbukan multitafsir Sehingga dapat mengancam persatuan dan kerukunan umat beragama. Berdasarkan hal tersebut, maka dibutuhkan solusi berupa sistem yang mampu membedakan antara konten radikal atau bukan. Pada penelitian ini, kami mengusulkan sistem tersebut melalui pendekatan text mining dengan menggunakan DF Threshold dan Human Brain sebagai ekstraksi fiturnya. Dimana system ini dibagi beberapa tahap yaitu, collecting data dan preprocessing, text mining, fitur seleksi, klasifikasi untuk mengelompokkan data dengan kelas label yang ada, perhitungan kemiripan data latih, terakhir visualisasi konten terkategori radikal atau bukan radikal. Pengujian dilakukan melalui 10-cross validation dengan k-Nearest Neighbor (kNN) sebagai metode klasifikasinya. Berdasarkan uji coba tersebut, maka didapatkan performansi, berupa nilai akurasi, tertinggi dari proposed method sebesar 66.37% dengan nilai k pada kNN sebesar 7.
 
 







DOI :


Sitasi :

0

PISSN :

2621-0940

EISSN :

2829-2758

Date.Create Crossref:

30-May-2022

Date.Issue :

01-Dec-2021

Date.Publish :

01-Dec-2021

Date.PublishOnline :

01-Dec-2021



PDF File :

Resource :

Open

License :