ARTICLE
TITLE

Analisis Sentimen Twitter untuk Teks Berbahasa Indonesia dengan Maximum Entropy dan Support Vector Machine

SUMMARY

AbstrakAnalisis sentimen dalam penelitian ini merupakan proses klasifikasi dokumen tekstual ke dalam dua kelas, yaitu kelas sentimen positif dan negatif.  Data opini diperoleh dari jejaring sosial Twitter berdasarkan query dalam Bahasa Indonesia. Penelitian ini bertujuan untuk menentukan sentimen publik terhadap objek tertentu yang disampaikan di Twitter dalam bahasa Indonesia, sehingga membantu usaha untuk melakukan riset pasar atas opini publik. Data yang sudah terkumpul dilakukan proses preprocessing dan POS tagger untuk menghasilkan model klasifikasi melalui proses pelatihan. Teknik pengumpulan kata yang memiliki sentimen dilakukan dengan pendekatan berdasarkan kamus, yang dihasilkan dalam penelitian ini berjumlah 18.069 kata. Algoritma Maximum Entropy digunakan untuk POS tagger dan algoritma yang digunakan untuk membangun model klasifikasi atas data pelatihan dalam penelitian ini adalah Support Vector Machine. Fitur yang digunakan adalah unigram dengan fitur pembobotan TFIDF. Implementasi klasifikasi diperoleh akurasi 86,81 %  pada pengujian 7 fold cross validation untuk tipe kernel Sigmoid. Pelabelan kelas secara manual dengan POS tagger menghasilkan akurasi 81,67%.  Kata kunci—analisis sentimen, klasifikasi, maximum entropy POS tagger, support vector machine, twitter.  AbstractSentiment analysis in this research classified textual documents into two classes, positive and negative sentiment. Opinion data obtained a query from social networking site Twitter of Indonesian tweet. This research uses  Indonesian tweets. This study aims to determine public sentiment toward a particular object presented in Twitter businesses conduct market. Collected data then prepocessed to help POS tagged to generate classification models through the training process. Sentiment word collection has done the dictionary based approach, which is generated in this study consists 18.069 words. Maximum Entropy algorithm is used for POS tagger and the algorithms used to build the classification model on the training data is Support Vector Machine. The unigram features used are the features of TFIDF weighting.Classification implementation 86,81 % accuration at examination of 7 validation cross fold for the type of kernel of Sigmoid. Class labeling manually with POS tagger yield accuration 81,67 %. Keywords—sentiment analysis, classification, maximum entropy POS tagger, support vector machine, twitter.

 Articles related

Fefbiansyah Hasibuan,Wowon Priatna,Tyastuti Sri Lestari    

Penelitian ini untuk mendapatkan opini masyarakat di media sosial twitter terkait tentang Kementrian Perdagangan Republik Indonesia dengan mengimplementasikan algoritma Naïve Bayes untuk melakukan analisis sentimen terhadap opini yang ada. Penelitian ini... see more

Revista: Techno.Com

Heri Santoso,Armansyah Armansyah,Dita Desliani    

Pemerintah Indonesia melalui 4 kementerian yaitu Menteri Kesehatan, Menteri Dalam Negeri, Menteri Agama serta Menteri Pendidikan dan Kebudayaan, menerbitkan surat keputusan bersama mangenai Panduan Penyelenggaraan Pembelajaran Di Masa Pandemi Coronavirus... see more

Revista: Techno.Com

Bobby Kurniadi Widodo,Nur Hafifah Matondang,Desta Sandya Prasvita    

Aplikasi Jobstreet merupakan sebuah aplikasi lowongan pekerjaan yang sudah didownload oleh lebih dari 10 juta masyarakat yang menyediakan beberapa jenis pekerjaan seperti akuntansi, sumber daya manusia, pemasaran, komunikasi, pelayanan, dan lainnya. Deng... see more

Revista: Techno.Com

Suryadi - -    

Abstrak- Wisatawan saat melakukan pemesanan hotel seringkali mengalami kesulitan dalam menentukan hotel mana yang akan dipilih. Traveloka merupakan salah satu situs pemesanan hotel yang memiliki berbagai fitur bagi pengunjung dalam menentukan hotel yang ... see more


Chaeril Aksan,Bambang Pramono,Adha Mashur Sajiah    

MRT (Mass Rapid Transit) Jakarta adalah sebuah sistem transportasi transit cepat yang dapat mengangkut penumpang dalam jumlah besar yang bertujuan untuk mengurangi kepadatan lalu lintas di Jakarta. Dari proyek tersebut, tidak sedikit dari masyarakat memb... see more

Revista: semanTIK