Futbolla ilişkin twitter paylaşımlarının duygu analiz
Abstract
İnternetin ve sosyal medyanın hızlı bir şekilde yaygınlaşıp kabul görmesi, önceden bir konu hakkında pek mümkün ve kolay olmayan görüş bildirimini son kullanıcılar için de mümkün kılmıştır. Facebook, Instagram ve Twitter gibi sosyal medya platformları son yıllarda giderek daha popüler hâle gelmiştir. Sosyal medya paylaşımları işlenip duygu bakımından analiz edilerek ilgili konu hakkında kişilerin duyguları ortaya çıkarılabilmektedir.
Bu çalışmada bir sosyal medya platformu olan Twitter üzerinde paylaşılan futbol müsabakaları hakkındaki Türkçe görüşler üzerinden duygu analizi yapılmıştır. Twitter üzerinde futbol müsabakası hakkında paylaşılmış olan Türkçe tweetler alınarak el ile etiketlemesi yapılmıştır. Bu etiketlemede duygu sınıfı olarak olumlu, olumsuz, tarafsız ve alakasız olarak 4 sınıf kullanılmıştır. Bu etiketlenmiş tweetlerden farklı özniteliklere sahip 12 farklı eğitim seti oluşturulmuştur. Oluşturulan bu eğitim setleri kullanılarak farklı sınıflama algoritmaları ile modeller çıkarılmış ve bu modellerin çapraz doğrulama ile sınıflama başarımları bulunmuştur. Eğitim setlerindeki özniteliksel farklılıklara bağlı olarak bu modeller için yapılan testlerde en iyi sınıflama başarımının; Naive Bayes algoritması için %84.30, KNN algoritması için %87.73, C4.5 algoritması için %89.60, SVM algoritması için %92.30 olduğu tespit edilmiştir. Çalışma sonucunda Türkçe tweetlerde imla ve anlama dayalı yazım denetimi yapılmasının sınıflama başarımında önemli oranda artış sağladığı görülmüştür.
Ayrıca sınıflama için elde edilmiş olan bu modeller içinden en başarılı modelleri kullanan bir uygulama hazırlanmıştır. Bu uygulama futbol müsabakaları hakkında paylaşılan tweetleri anlık olarak toplayıp, oluşturulan modeller ile bu tweetlerin sınıfını tespit ederek sınıflara ait sonuçları gerçek zamanlı görselleştirmektedir. Facebook, Instagram, and Twitter social media platforms have become increasingly popular in recent years. The widespread use and acceptance of social media have made it possible and easier for end-users to share opinions on a topic. Social media posts can be processed and analyzed to reveal the emotions of people on a certain topic.
In this study, emotion analysis was conducted based on Turkish posts about the football competitions shared on Twitter. Turkish tweets about the football competitions were collected and tagged manually. For this labeling, 4 classes were utilized as emotion classes: positive, negative, neutral and irrelevant.
Twelve different training sets with different features were built based on these tagged tweets. Using these training sets, models were created with different classification algorithms and the classification performances of these models were evaluated by cross-validation. Depending on the qualitative differences in the training sets, the classification accuracies in the tests for these models were found as: 84.30% for the Naive Bayes algorithm, 87.73% for the KNN algorithm, 89.60% for the C4.5 algorithm, and 92.30% for the SVM algorithm.
As a further result of this study, it is demonstrated that checking and correcting the spelling of the tweets provides a significant increase in classification performance. In addition, an application which employs the most successful models of these
classification models was created. This application collects tweets about football competitions instantly, determines the class of these tweets based on the models and visualizes the results of the classes in real time.
Collections
- Tez Koleksiyonu [1162]