dc.descriptionabstract |
ÖZET
Günümüzde teknoloji takip edilmesi zor bir hızla ilerlemektedir. Bu ilerlemenin bir
sonucu olarak teknolojiden direkt veya dolaylı olarak etkilenen sektörlerde birçok yeni iş
alanları ve alt sektörleri oluşmuştur. Bilişim teknolojilerinin alt dallarından biri olan veri
tabanı sistemleri de bu teknolojik gelişimden etkilenmiş ve kendi içerisinde yeni
teknolojik dallara sahip olmuştur. Veri tabanı analizi veya veri madenciliği buna
örnektir. Önceki zamanlarda verilerin önemli olanları saklanmakta ve geri kalanı
oluşturdukları ek depolama maliyetleri yüzünden kullanılmamakta iken, gelişen yapay
zeka ve bilimsel esnek hesaplama yöntemleri ile bu önemsiz gibi gözüken veriler ciddi
önem kazanmıştır. Veri madenciliği üzerinde bilgi sahibi olan bireyler çalıştıkları
sektörler ile paralel olarak; geleceğe yönelik çeşitli tahminler, firmalarının içinde
bulundukları durumun anlık incelenmesi, sosyal medya verilerine göre müşteri
memnuniyeti ve bunu arttırmak için yapılması gerekenler gibi birçok alanda başarılı
sonuçlar elde edebilirler. Daha çok tahmin ve analiz işlemlerinin önem kazandığı bu
günlerde, tez çalışmamızda bu işlemlerin kullanıldığı kümleme algoritmaları ele
alınmıştır. Bu tez çalışmasındaki amacımız K-Means kümeleme algoritması, Expectation
Maximization kümeleme algoritması ve Hiyerarşik kümeleme algoritmları üzerinde
derinlemesine bilgi sahibi olmak ve edindiğimiz bilgileri uygun yazılım platformları
üzerinde denemektir. Bu amaçla, Boğaziçi Üniversitesi Kandilli Rasathanesi ve Deprem
Araştırma Enstitüsünden alınan iklim verileri anlatılan kümeleme algoritmaları üzerinde
denenmiştir. Kümeleme algoritmalarının herbiri MATLAB ve WEKA programları
üzerinde uygulanmıştır. Elde edilen sonuçlar üzerinden kullanmış olduğumuz
programlar ve algoritmaların karşılaştırılmaları yapılmıştır. Son olarak MATLAB ve
WEKA kullanımlarının avantajları ve dezavantajlarından bahsedilmiştir. |
tr_TR |