DSpace Repository

DOĞAL DİL İŞLEME YÖNTEMLERİYLE TÜRKÇE SOSYAL MEDYA VERİLERİ ÜZERİNDE DUYGU ANALİZİ

Show simple item record

dc.contributor.author Yelmen, İlkay
dc.date.accessioned 2019-04-29T06:15:26Z
dc.date.available 2019-04-29T06:15:26Z
dc.date.issued 2016-08
dc.identifier.uri http://hdl.handle.net/11547/1592
dc.description.abstract İnternetin sürekli olarak gelişmesi ve hayatımızın vazgeçilmesi olması ile beraber birtakım sosyal paylaşım siteleri ortaya çıkmıştır. İnsanların fikirlerini paylaştığı ve etkileşimde bulunduğu bu sosyal medya platformları veri kaynağı açısından bilim insanlarının adresi olmuştur. İnsanlar günümüzde istedikleri bilgiye internet üzerinden yaptıkları aramalarla kolaylıkla ulaşabilmektedir. İnternetteki bilgilerin çoğu geribildirime açık olup bu geri bildirimler anketler ve forum siteleri aracılığıyla yeni fikirlerin analizi için toplanmaktadır. Çok fazla internet kullanıcısı olmasından dolayı geri bildirimlerin insan tarafından analiz edilmesi çok zordur. İşte bu noktada duygu analizi kavramı ortaya çıkmıştır. Duygu analizi, metinlerdeki bir konu hakkındaki duygu ve düşüncenin analiz edilerek duygunun pozitif ve negatif olarak sınıflandırılmasını amaçlar. Öznitelik seçimi sınıflandırma performansı ve başarısını arttırmak için günümüzde sıklıkla kullanılmaktadır. Bu seçimde farklı metotlar kullanılmakta olup amaçlanan veri kümesi içinden sınıflandırmadaki başarıyı etkileyen alakasız niteliklerin devre dışı bırakılıp önemli niteliklerin seçilmesidir. Bu şekilde başarı oranı arttırılabilir. Bu tez çalışmasında günlük konuşma dili ile yazılan Türkçe metinlerden öznitelik seçimine odaklanılmış olup detaylı ön işlemeden geçen veri üzerinde destek vektör makineleri, yapay sinir ağları ve centroid tabanlı sınıflandırma algoritmaları kullanılmıştır. 3 ayrı GSM operatörünün takipçilerine ait tweetler üzerinde Gini İndeks, Bilgi Kazancı ve Genetik Algoritma 3 farklı sınıflandırma algoritmasıyla hibrit olarak kullanılmıştır. Özellikle boyut indirgemede önemli bir yere sahip olan ve sezgisel olarak çalışan genetik algoritma ile destek vektör makineleri hibrit olarak kullanıldığında 3 farklı GSM operatörü için de %100 başarı elde edilmiştir. tr_TR
dc.language.iso tr tr_TR
dc.publisher İSTANBUL AYDIN ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ tr_TR
dc.subject Duygu Analizi tr_TR
dc.subject Öznitelik Seçimi tr_TR
dc.subject Genetik Algoritma tr_TR
dc.subject Sosyal Medya tr_TR
dc.subject Twitter tr_TR
dc.subject Sınıflandırma tr_TR
dc.subject Metin Madenciliği tr_TR
dc.subject Sentiment Analysis tr_TR
dc.subject Fature Selection tr_TR
dc.subject Genetic Algorithm tr_TR
dc.subject Social Media tr_TR
dc.subject Twitter tr_TR
dc.subject Classification tr_TR
dc.subject Text Mining tr_TR
dc.title DOĞAL DİL İŞLEME YÖNTEMLERİYLE TÜRKÇE SOSYAL MEDYA VERİLERİ ÜZERİNDE DUYGU ANALİZİ tr_TR
dc.type Thesis tr_TR
dc.description.abstractol Several social media websites are showed up as Internet’s improving continously and becoming an irreplaceable part of our lives. Those sites that people share their opinions and interact with others have become the address of scientists in terms of data source. People can access any information they need easily by doing research on Internet these days. Many of the data are open for feedbacks and these feedbacks are gathered for analyses of new ideas by surveys and forum sites. It is too hard to analyze feedbacks by a person as there are so many Internet users. At this point, emotion analysis concept showed up. Emotion analysis is aimed at classify the emotion as positive and negative by analyze the emotion and thought about a topic in texts. Entity property selection is used frequently nowadays in order to increase the performance and success in classification. Different methods are used in this selection and it is selecting the important qualities by eliminating the irrelevant features that affect the success in classification in target data set. Thus, hit ratio may increase. In this thesis, feature selection from Turkish texts written as colloquial is focused and support vector machine, artificial neural networks and centroid based classification algorithms are used on data that has detailed preprocessing. Gini Index, Information Gain and Genetic Algorithm are used as hybrids with 3 different classification algorithms on tweets belonging to 3 different GSM operators’ followers. 100% success is achieved for 3 different GSM operators when genetic algorithm, which works as intuitively and has an important role in dimension reduction, and support vector machines are used hybridly. tr_TR
dc.publisher.firstpagenumber 1 tr_TR
dc.publisher.lastpagenumber 71 tr_TR


Files in this item

This item appears in the following Collection(s)

Show simple item record

Search DSpace


Advanced Search

Browse

My Account