A SOFTWARE LIBRARY FOR MEASUREMENT OF READABILITY OF TEXTS AND A NEW READABILITY METRIC FOR TURKISH
Journal Name:
- Dokuz Eylül Üniversitesi Mühendislik Fakültesi Fen ve Mühendislik Dergisi
Key Words:
Keywords (Original Language):
Author Name | University of Author |
---|---|
Abstract (2. Language):
In this article, as a matter of Natural Language Processing, the concept of readability and its
possible areas of application have been considered. Readability metrics, which have so far been
defined for English by considering different aspects and used in different areas, are investigated
quantitatively. Eligibility and applicability of the existing metrics for Turkish have been analyzed via
Turkish books of various types and levels by means of a software library developed by ourselves. In
addition, statistical characteristics of Turkish were determined and a new readability formula for
Turkish is proposed. Being developed with the C programming language with the main feature of
platform independency, the software library is expected to serve as a resource for the upcoming
researches in this topic; meanwhile the proposed readability metric is expected to find wide
application area for prediction of the readability levels of Turkish texts.
Bookmark/Search this post with
Abstract (Original Language):
Bu makalede, Doğal Dil İşleme (DDİ)‟nin bir konusu olan okunabilirlik kavramı ve kullanım
alanları ele alınmıştır. İngilizce için tanımlanmış olan ve günümüzde farklı alanlarda kullanılan,
birbirinden farklı niceliklerle oluşturulmuş okunabilirlik ölçütleri incelenmiştir. Sözkonusu
formüllerin Türkçe için uygunlukları ve uyarlanabilirlikleri, geliştirilen bir yazılım kütüphanesi ile
farklı türlerde ve seviyelerdeki Türkçe kitap metinleri kullanılarak incelenmiştir. Ayrıca, Türkçe‟nin
bir takım istatistiksel özellikleri belirlenerek Türkçe için yeni bir okunabilirlik ölçütü formülü
önerilmiştir. C programlama dilinde geliştirilen ve platform bağımsız olarak kullanılabilen söz konusu
kütüphanenin, bu konuda çalışacak araştırmacılara bir kaynak olacağı; önerilen okunabilirlik
ölçütünün de Türkçe metinlerin seviyesi hakkında fikir vermesi açısından yaygın kullanım alanı
bulabileceği öngörülmektedir.
FULL TEXT (PDF):
- 3
49-62