Birleşik ve eğik Türkçe el yazısı tanıma sistemi

Yükleniyor...
Küçük Resim

Tarih

2007

Dergi Başlığı

Dergi ISSN

Cilt Başlığı

Yayıncı

Trakya Üniversitesi Fen Bilimleri Enstitüsü

Erişim Hakkı

info:eu-repo/semantics/openAccess

Özet

Yüksek Lisans Tezi Trakya Üniversitesi Fen Bilimleri Enstitüsü Bilgisayar Mühendisliği Bölümü ÖZET Bu çalışmada, birleşik ve eğik Türkçe el yazısı için bir tanıma sistemi tasarlanmıştır. Tasarlanan sistemde el yazısı tanıma sistemlerindeki aşamaların çoğu kullanılmıştır. Bunlar, dökümanın taranması, görüntüdeki gürültünün temizlenmesi, satırların ayıklanması, kelimelerin ayıklanması, kelime eğiminin düzeltilmesi, karakterlerin ayrıştırılması, tanınması ve doğrulama aşamalarıdır. Tanıma sistemi büyük harf, küçük harf ve rakam olmak üzere üç tipteki karakteri ayrı ayrı tanıyacak şekilde tasarlanmıştır. Bu çalışma esnasında, yaşları 15 ile 45 arasında değişen toplam 172 kişiden, 29 adet büyük harf, 29 adet küçük harf ve 10 adet rakam olmak üzere toplam 11696 el yazısı karakter örneği toplanmıştır. Satırların ayrıştırılması aşamasında yatay doğrultudaki histogram bilgisinden yararlanılmıştır. Karakterlerin ayrıştırılması aşamasında, dikey doğrultudaki histogram bilgisi kullanılmıştır. Karakter tanıma aşamasında Korelasyon yöntemi kullanılarak K- en yakın komşuluk sınıflama yöntemi ile sistem kuvvetlendirilmiştir. Doğrulama aşamasında sınırlı sayıda kelime içeren bir sözlük kullanılmıştır. Bu sözlük kullanımı ile anlamsız harf gruplarının seçilmesi engellenmiştir. Visual Basic.Net ortamında Türkçe elyazısı tanıma işlemini gerçekleştiren bir uygulama geliştirilmiştir. Bu sistem ile yüksek başarı oranı elde edilmiştir. Giriş bölümünde karakter tanıma işleminin önemi, gerekliliği ve sağladığı faydalar anlatılmıştır. Karakter tanımaya genel bakış bölümünde ?optik karakter tanıma? nın tanımı ve çeşitleri hakkında bilgiler verildi. Makine baskısı ve el yazısı karakterlerin tanınması üzerine yapılan bir çok çalışma incelenmiştir. Karakter tanıma işleminin aşamaları bölümünde karakter tanıma işleminin aşamaları hakkında ayrıntılı bilgiler verilmiştir. Geliştirilen uygulama bölümde ise yapılan deneysel çalışma anlatılmıştır. Sonuç bölümünde, tanıma sisteminin, rakam guruplarında, ayrık yazılan kelimelerde ve birleşik yazılan kelimelerdeki başarı oranları gösterilmiştir. Anahtar kelimeler : Karakter Tanıma, Korelasyon, K-en yakın komşuluk, görüntü işleme, sözlük. Yıl : 2007 Sayfa : 105
Master Thesis Trakya University Graduate School of Natural and Applied Sciences Department of Computer Engineering A Character Recognition System for connected and slant handwritten Turkish texts is designed in this study. Most of levels used in handwritten recognition systems are used in this system. These levels are scanning document, noise reduction, appointing the satires of text, appointing words, smoothing the slant of the word, finding the characters, character recognition and verification. Recognition system consists of three recognition modules which are designed for recognize uppercase characters, lowercase characters and numbers. In this study handwritten character examples are collected from 172 persons whom ages are between 15 and 45. 29 uppercase, 29 lowercase characters and 10 digits are collected from every person. Total 11696 character examples are collected. Horizontal histogram graphic is used at satire finding level. Vertical histogram graphic is used at character finding level. Correlation algorithm is used at character recognition level and system strengthened by K-n neighbor classification algorithm. A limited dictionary is used at verification level. Returning meaningless character groups is prevented by using dictionary. First chapter is about the importance, necessity and usefulness of the character recognition process. iv Second chapter gives information about the explanation and types of optic character recognition. Lots of study about printed and handwritten character recognition is studied at this section. Detailed information about the levels of character recognition is showed at the third section. At the fourth chapter, the experimental work is explained. At the fifth chapter the test results of recognition system is studied. Key Words : Character recoginiton, Correlation, K-nn, image processing, lexicon. Year : 2007 Page : 105

Açıklama

Yüksek Lisans Tezi

Anahtar Kelimeler

Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control

Kaynak

WoS Q Değeri

Scopus Q Değeri

Cilt

Sayı

Künye