Penggunaan Web Crawler Untuk Menghimpun Tweets dengan Metode Pre-Processing Text Mining
Main Article Content
Abstract
Saat ini jumlah data di media sosial sudah terbilang sangat besar, namun jumlah data tersebut masih belum banyak dimanfaatkan atau diolah untuk menjadi sesuatu yang bernilai guna, salah satunya adalah tweets pada media sosial twitter. Paper ini menguraikan hasil penggunaan engine web crawel menggunakan metode pre-processing text mining. Penggunaan engine web crawel itu sendiri bertujuan untuk menghimpun tweets melalui API twitter sebagai data teks tidak terstruktur yang kemudian direpresentasikan kembali kedalam bentuk web. Sedangkan penggunaan metode pre-processing bertujuan untuk menyaring tweets melalui tiga tahap, yaitu cleansing, case folding, dan parsing. Aplikasi yang dirancang pada penelitian ini menggunakan metode pengembangan perangkat lunak yaitu model waterfall dan diimplementasikan dengan bahasa pemrograman PHP. Sedangkan untuk pengujiannya menggunakan black box testing untuk memeriksa apakah hasil perancangan sudah dapat berjalan sesuai dengan harapan atau belum. Hasil dari penelitian ini adalah berupa aplikasi yang dapat mengubah tweets yang telah dihimpun menjadi data yang siap diolah lebih lanjut sesuai dengan kebutuhan user berdasarkan kata kunci dan tanggal pencarian. Hal ini dilakukan karena dari beberapa penelitian terkait terlihat bahwa data pada media sosial khususnya twitter saat ini menjadi tujuan perusahaan atau instansi untuk memahami opini masyarakat
Downloads
Article Details
Authors who publish with this journal agree to the following terms:
- Authors retain copyright and grant the journal right of first publication with the work simultaneously licensed under a Creative Commons Attribution License that allows others to share the work with an acknowledgement of the work's authorship and initial publication in this journal.
- Authors are able to enter into separate, additional contractual arrangements for the non-exclusive distribution of the journal's published version of the work (e.g., post it to an institutional repository or publish it in a book), with an acknowledgement of its initial publication in this journal.
- Authors are permitted and encouraged to post their work online (e.g., in institutional repositories or on their website) prior to and during the submission process, as it can lead to productive exchanges, as well as earlier and greater citation of published work
References
[2] Castillo, C. 2004. EffectiveWeb Crawling. (p. i). Dept. of Science: University of Chile
[3] Feldman, R & Snager, J. 2007. The Text Mining Handbook: Advanced Approaches in Analyzing Unstructured Data. Cambridge University Press, New York
[4] Khanna, Rajiv A dan Kasliwal, Sourabh. 2007. Designing A Web Crawler.
[5] Nur, Muhamad Yunus., & Santika, Diaz. D. (2011). Analisis Sentimen pada Dokumen Berbahasa Indonesia dengan Pendekatan Support Vector Machine. Konferensi Nasional Sistem dan Informatika, (Vol. 009). Bali.
[6] Pitria, Pipit. 2014. Analisis Sentimen Pengguna Twitter Pada Akun Resmi Samsung Indonesia Dengan Menggunakan Naïve Bayes. Hyperlink: http://elib.unikom.ac.id/index.php/gdl.php?mod=browse&op=read&id=jbptunikompp-gdl-pipitpitri-35651 diakses 7 April 2015.
[7] Pressman, S. Roger. 2010. Software Engineering: A Practitioner's Approach.
[8] Rosmala, Dewi & Syafei, Rizqia Riyani. 2011. Implementasi Webcrawler pada Social Media Monitoring. Hyperlink: http://lib.itenas.ac.id/kti/wp-content/uploads/2013/10/No.-2-Vol.-2-Mei-Agustus-2011-5.pdf diakses 7 april 2015.
[9] Sigit, Yohanes & dkk. 2012. Analisis dan Perancangan Alat Bantu Monitor Brand Universitas Atma Jaya Yogyakarta di Situs Jejaring Sosial Twitter. Hyperlink: http://jurnal.uajy.ac.id/jbi/2012/01/11/analisis-dan-perancangan-alat-bantu-monitor-brand-universitas-atma-jaya-yogyakarta-di-situs-jejaring-sosial-twitter/ diakses 8 April 2015.
[10] Twitter. 2014. Tweets " Twitter Developers. Online. Hyperlink:https://dev.twitter.com/docs/platform-objects/tweets) diakses 6 April 2015.