Pada masa sekarang ini aliran informasi berita telah meningkat dalam jumlah besar setiap harinya. Hal ini terbukti berdasarkan situs http://search.dmoz.org/cgibin/ search?search=berita pada sekitar bulan awal januari 2009 terdapat 548 situs berita berbahasa Indonesia dengan berbagai kategori telah online. Oleh karena itu kebutuhan pengklasifikasian berita secara otomatis semakin diperlukan demi mengefisiensi waktu dan sumber daya manusia dalam penggolongan berita serta mempermudah pencarian informasi berita mengenai suatu kejadian atau bidang tertentu. Penelitian dilakukan dengan menggunakan metode text mining serta menggunakan algoritma naive bayes classifier. Klasifikasi ini ditekankan untuk dokumen berbahasa Indonesia saja. Sedangkan keterkaitan antar berita diukur berdasarkan nilai probabilitas dari dokumen dan kata dalam tiap dokumen. Berita untuk pengujian algoritma akan diambilkan dari surat kabar berbahasa Indonesia online. Adapun hasil uji coba menunjukkan bahwa klasifikasi berita dengan algoritma ini memiliki nilai keakuratan yang cukup tinggi. Nilai akurat akan meningkat dengan meningkatnya data latih dan efesiensi sistem semakin menurun dengan meningkatnya data latih. Kualitas ini tercermin dari hasil uji dari 80 dokumen data latih memiliki nilai akurat 70 % dan dari 720 dokumen data latih memiliki nilai akurat sebanyak 86%.
No comments:
Post a Comment