Abstract:
Bu makalede, Doğal Dil İşleme (DDİ)‟nin bir konusu olan okunabilirlik kavramı ve kullanım alanları ele alınmıştır. İngilizce için tanımlanmış olan ve günümüzde farklı alanlarda kullanılan, birbirinden farklı niceliklerle oluşturulmuş okunabilirlik ölçütleri incelenmiştir. Sözkonusu formüllerin Türkçe için uygunlukları ve uyarlanabilirlikleri, geliştirilen bir yazılım kütüphanesi ile farklı türlerde ve seviyelerdeki Türkçe kitap metinleri kullanılarak incelenmiştir. Ayrıca, Türkçe‟nin bir takım istatistiksel özellikleri belirlenerek Türkçe için yeni bir okunabilirlik ölçütü formülü önerilmiştir. C programlama dilinde geliştirilen ve platform bağımsız olarak kullanılabilen söz konusu kütüphanenin, bu konuda çalışacak araştırmacılara bir kaynak olacağı; önerilen okunabilirlik ölçütünün de Türkçe metinlerin seviyesi hakkında fikir vermesi açısından yaygın kullanım alanı bulabileceği öngörülmektedir. In this article, as a matter of Natural Language Processing, the concept of readability and its possible areas of application have been considered. Readability metrics, which have so far been defined for English by considering different aspects and used in different areas, are investigated quantitatively. Eligibility and applicability of the existing metrics for Turkish have been analyzed via Turkish books of various types and levels by means of a software library developed by ourselves. In addition, statistical characteristics of Turkish were determined and a new readability formula for Turkish is proposed. Being developed with the C programming language with the main feature of platform independency, the software library is expected to serve as a resource for the upcoming researches in this topic; meanwhile the proposed readability metric is expected to find wide application area for prediction of the readability levels of Turkish texts.