Abstract:
Bu çalışmada, Türkçe metin koleksiyonları üzerinde kullanılmak üzere soru cevap sistemlerinin yapısının tasarımını ve bu sistemlerin gerçekleştirilmesini araştırdık. Bu konu üzerinde yapılan çalışmalar ve araştırmalar da göstermiştir ki, soru cevap sistemleri birkaç modülden oluştuğu için kompleks bir yapıya sahiptir. Yaptığımız araştırmalar neticesinde soru cevap sistemleri yapı tasarımı olarak 3 temel aşamada ele alınmıştır. Bu aşamalar soru işleme, doküman işleme ve cevap işleme aşamalarıdır._x000B_İlk olarak, genişletilmiş varlık ismi hiyerarşisini yönetme, veri koleksiyonlarını işaretleme, kural-tabanlı ve sözlük-tabanlı varlık isimlerini çıkarma ve performans değerlendirmesi yapmayı sağlama yeteneğine sahip olan varlık ismi tanıma (VİT) aracı geliştirdik. Türkçe'de VİT için bir takım kurallar ve sözlükler de oluşturduk ve tüm uygulama sistemini detaylıca hazırladık. ODTÜ Türkçe Derlemini kullanarak VİT sistemlerinin performansını değerlendirmek için bir küme deneyler gerçekleştirdik. Deneylerden elde ettiğimiz sonuçlar göstermiştir ki bizim VİT yaklaşımımız iyi sonuçlar üretti._x000B_Daha sonra, Türkçe koleksiyonlar için varlık ismine dayalı soru cevap sistemleri yaklaşımını önerdik. Sistemimizi doğrusal bilgi gerigetirimi yapısı içinde tasarladık ve gerçekleştirdik. Bilgi geri getirimi için indeksleme yapısı oluşturuldu and ilgili dökümanlar sonuç olarak geri getirildi. Daha sonra, varlık ismi hiyerarşisini kullanarak dökümanlarda ve sorularda geçen varlık isimlerini bulduk ve bunları eşleştirdik. Özetle, bu araştırma alanında bu çalışma bir başlangıç çalışmasıdır ve performans açısından en iyi sonuçları üreteceği düşünülmektedir. In this study, we investigated the design and implementation of named-entity (NE) based question answering system for Turkish text collections. Researches and works on this subject have shown that question answering systems has a complex structure composed of several modules. Thus, we first discussed the structure of a question answering system in three basic phases: question processing, document analysis and answer processing._x000B_Firstly, we developed named-entity recognition (NER) tool, which is capable to manage extended named entity hierarchy, annotate data collection, rule-based and dictionary-based named entities extraction and provides a performance evaluation. We also provide a set of rules and dictionaries for NER in Turkish and we present the whole application system in detail. We run a set of experimentation to evaluate the performance of NER system using METU Turkish Corpus. The results we gained from experimentations show that our NER approach produced good results._x000B_Then, we propose a new approach, which is named-entity based Questions Answering system for Turkish collections. We designed and implemented our system in structure of boolean information retrieval. We created the structure of indexing for information retrieval and retrieved the relevant documents as results. Then, we found named entities in documents and questions and we matched them using named entity hierarchy. In summary, this work is a starting work in this research area and is thought to produce the best results in terms of performance.