Türkçe için derlem tabanlı bir anafor çözümleme çalışması
Yükleniyor...
Dosyalar
Tarih
2008
Yazarlar
Dergi Başlığı
Dergi ISSN
Cilt Başlığı
Yayıncı
Trakya Üniversitesi Fen Bilimleri Enstitüsü
Erişim Hakkı
info:eu-repo/semantics/openAccess
Özet
Bu tez çalışmasının temelde iki amacı vardır. Bunlardan ilki, Türkçe gibi artgönderim çözümlemesi bakış açısıyla üzerinde çok çalışılmamış ve makine öğrenmesi deneylerine fazlaca konu olmamış bir dilde, çeşitli makine öğrenmesi modelleri kullanarak artgönderim çözümlemesinin modellenmeye çalışılmasıdır. Çalışmanın bir diğer amacı da, elimizdeki bir iş için kullanılacak modelin seçimine ilişkin, öğrenme modellerinin sınıflandırma performansları açısından değerlendirmesini yaparak, bu konuda yol gösterici olmaktır. Beklenen bir gözlem olan ve deneyler sonucunda elde edilen, her bir modelin aşırı ve yetersiz uyumdan kaçınarak optimum düzeyinin belirlenmesi gerekliliğinin yanında, elde edilen sonuçlara göre doğrusal olmayan modeller aşırı uyumdan kaçınacak şekilde düzgün olarak eniyileştirildiklerinde doğrusal olan modelleri de geride bırakmıştır.
The aim of this thesis is two-fold. On the one hand, it attempts to explore several machine learning models for pronoun resolution in Turkish, a language not sufficiently studied with respect to anaphora resolution and rarely being subjected to machine learning experiments. On the other hand, the thesis offers an evaluation of the classification performances of the learning models in order to gain insight into the question of how to match a model to the task at hand. In addition to the expected observation that each model should be tuned to an optimum level of expressive power so as to avoid underfitting and overfitting, the results also suggest that non-linear models properly tuned to avoid overfitting outperform linear ones when applied to the data used in the experiments.
The aim of this thesis is two-fold. On the one hand, it attempts to explore several machine learning models for pronoun resolution in Turkish, a language not sufficiently studied with respect to anaphora resolution and rarely being subjected to machine learning experiments. On the other hand, the thesis offers an evaluation of the classification performances of the learning models in order to gain insight into the question of how to match a model to the task at hand. In addition to the expected observation that each model should be tuned to an optimum level of expressive power so as to avoid underfitting and overfitting, the results also suggest that non-linear models properly tuned to avoid overfitting outperform linear ones when applied to the data used in the experiments.
Açıklama
Yüksek Lisans Tezi
Anahtar Kelimeler
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control