Tez Arşivi

Tez aramanızı kolaylaştıracak arama motoru. Yazar, danışman, başlık ve özetlere göre tezleri arayabilirsiniz.


İstanbul Teknik Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Anabilim Dalı

2005

A real-time optical character recognition system

Gerçek zamanlı bir optik karakter tanıma sistemi

Bu tez, YÖK tez merkezinde bulunmaktadır. Teze erişmek için tıklayın. Eğer tez bulunamazsa, YÖK Tez Merkezi'ndeki tarama bölümünde tez numarasını arayabilirsiniz. Tez numarası: 166791

Tezi Bul
Özet:

GERÇEK ZAMANLI BİR OPTİK KARAKTER TANIMA SİSTEMİ ÖZET Optik karakter tanıma sistemleri endüstriyel ve/veya günlük hayatta kullanılan birçok akıllı sistemden biridir. Basım endüstrisi, optik karakter tanıma sistemlerinin kalite kontrolü ve geri bildirimi amacıyla kullanıldığı, bahsedilen alanlardan biridir. Hazırlanan tez çalışması basım endüstrisinde kullanılacak bir optik karakter tanıma ve doğrulama sisteminin tasarım, geliştirme ve performans optimizasyonu çalışmaları üzerine eğilmektedir. Optik karakter tanıma konusu ABD'de 1950'li yılların başında geliştirilmiş ve belge sayısallaştırma amaçlan için kullanılmaya başlanmıştır. Optik karakter tanımayı günlük hayatta kullanmak ülkemizde, 1 960-1 970'li yıllardan beri posta servislerinde bu tür sistemleri kullanan yabancı birçok ülkeye göre pek yaygın bir konu değildir. Optik karakter tanıma aslında dış dünyadan bir nakledici ile alınan bilgilerin işlenerek sayısal veriye dönüştürüldüğü bir örüntü tanıma işlemidir. İşleme süreci tanıma operasyonuna hazırlık amaçlı yürütülen görüntü işleme ve bölütleme operasyonlarım ve birçok yapay zeka yönteminin kullanıldığı tanıma operasyonunu içerir. Yapay sinir ağlan optik karakter tanıma sistemlerinin tanıma motorlarında en yaygın kullanılan yöntemlerden biridir. Tez çalışmalar dahilinde hazırlanan sistem zamanın kritik ölçüt olduğu bir basım otomasyon sisteminde kalite kontrolünde kullanılmak üzere tasarlanmıştır. Söz konusu otomasyon sisteminde mekanik taşıyıcı sistem ile dijital basım sistemi arasında oluşan senkronizasyon uyuşmazlıklarından dolayı zaman zaman hatalı sonuçlar doğabilmektedir. Hatalı basılan ürünleri ayıklamak için otomasyon sistemine bir kontrol sisteminin gömülmesi kaçınılmazdır. Bu kontrol sistemi basılan sadece rakamlar içeren veriyi okumalı ve elde bulunan verilerle uyumunu kontrol etmelidir. Otomasyon sisteminin çalışma hızı nedeniyle bu amaçla bir sayısal sistemin geliştirilmesi kaçınılmazdır. Bu noktada optik karakter tanıma sürece dahil edilerek sayısal kameraların ve senkronizasyon üniteleri yardımıyla bir optik karakter tanıma sistemi kullanılan otomasyon sistemine entegre edilmiştir. Optik karakter tanıma sistemi basılan ortam sürekli çıktılar ürettiğinden gerçek zamanlı çalışmak zorundadır. Bütün bu sebeplerden ötürü optik karakter doğrulama sisteminin karakter tanıma motoru öngörülen bir başarım oranının altına düşmeyerek saniyede yüzlerce karakter tanıyacak şekilde çalışması için optimize edilmelidir. Yapay sinir ağlan sistemin yüksek başarım oranlan ve esnek yapılan nedeniyle karakter tanıma motorunda kullanılmak üzere tercih edilmiştir. Optik karakter doğrulama sisteminin ihtiyacı olan performans-başarının oram sistemin karakter tanıma motorunda kullanılan yapay sinir ağlan için bilinen bir ikilemdir. Bu ikilemi aşmak amacıyla her sınıflayıcı yapay sinir ağı türünden bir örnek seçilerekgerçekleştirilmiş ve soruna ne derece çözüm getirdiği incelenmiştir. Tez çalışması boyunca incelenen her yapay sinir ağı ayrıca başka kullanım alanlarda öne çıkan kendine has özellikler de taşır. Ayrıca yenilikçi bir çözüm olarak evrimsel hesaplama yöntemleri de en iyi performansı sağlayacak şekilde budanarak özel olarak tasarlanmış bir yapay sinir ağının eğitiminde kullanılmıştır. Tez çalışmalarının deneysel kısmında söz edilen yöntemler gerçekleştirilmiş ve gerçek sistemde test edilerek performansları doğrulanmıştır. Deneylerin sonuçlan sistem için önemli olan başarım oram ve hesap maliyeti açısından incelenmiştir. Böylece her bölümde gerçeklenen yapay sinir ağlı yapısı ve kabul ettiği girdi türüyle takdim edilmiş ve başarım oranıyla hesap maliyeti tartışılarak avantaj ve dezavantajları kullanılması olası durumları öngörme amacıyla ortaya konmuştur. Son olarak yapılan deneysel çalışmalarda kullanılan yapay sinir ağları ve yöntemler arasından tasarlanan sistemde kullanılmaya en elverişli olanına ulaşmak amacıyla bir karşılaştırma yapılmıştır. Bunun ötesinde, sistem yenilemeleri veya gelecekte yapılabilecek olası çalışmalar tartışılarak tercih edilmeyen yöntemlerin etkin olarak kullanılabileceği durumlar ortaya konmuştur. Tez çalışmasının sonunda sistemde kullanılmaya uygun birçok yapay sinir ağı sınırlayıcısı ile çalışılmış ve bir gerçek zaman sisteminin karakter tanıma motorundaki yerleri Üzerine fikir yürütülmüştür. xı

Summary:

A REAL-TIME OPTICAL CHARACTER RECOGNITION SYSTEM SUMMARY Optical character recognition systems are one of many intelligent systems which are used in industry and/or daily work. Printing industry is one of these areas where OCR systems are used for quality control and feedback. The thesis is mainly about the studies on designing, developing, performance optimization of a real-time optical character recognition and verification system which is going to be used for practical issues in printing industry. The subject of OCR itself is developed in the beginning of 1950s in USA and is still being used widely in many areas as a tool for document digitalization. Embedding OCR to daily work is not a common topic in our country with respect to other countries where OCR systems is being used in postal services since 1960s-1970s. OCR is actually a pattern recognition task where the images that are recieved from the real world by the help of a transducer are processed and transformed into the digital data. The mentioned process consist image processing and segmentation in order to prepare the image for the recognition process and the recognition process where various artificial intelligence methods are used. Artificial neural networks are one of the most common methods used for recognition engines of the OCR systems. The prepared system is actually a solution for the need of a quality control system in a printing automation system where time is the critic measure. In the automation system there may exist printing problems based on the synchronization problem between the mechanical conveyor system and the digital printing system. In order to eliminate the erroneous printed media there must be a control mechanism embedded to automation system. This control system ought to read the printed data, which are only numeric in this case, and control it with the data in hand to detect an erroneous operation. Artificial neural networks are chosen to be used in the character recognition engine of the system because of their high success rates and flexible structures. Because of the automation system's working speed a digital system is mandatory to be developed. At this point OCR comes into action where digital cameras and synchronization units are used to embed the OCR system to the present automation system. The OCR system has to work real time where the printing media continously flowing thus a batch processing system is not probable. Because of these reasons the character recognition engine of the optical character verification system must be optimized to recognize hundreds of characters in a second and do not perform below a predetermined value of success rate. The performance-success rate that the OCV system suffers from is a well-known dilemma for artificial neural networks which are used in the character recognition engine. In order to overcome this dilemma a neural network from each type of xnclassifier neural networks is selected and realized in order to investigate how much it brings a solution to the problem. The neural networks Ihat are experimented through the thesis study also has different authentic properties which brings mem forward in another area for usage. Also an innovating concept, evolutionary computation, is used to train a specially designed network which is optimized for providing the best performance by pruning. In the experimental part of the thesis these mentioned concepts are realized and their performance is verified by being experimented in the real world system. The results of the experiments are examined in a manner that considers the two important subjects about the neural network, which are the success rate and the computational cost of the neural network. So in each part the realized neural network is introduced by its structure and the inputs that it accepts, and then the sucees rate and the computational cost of the network is argued to reveal the advantages and disadvantages of the neural network and foresee the situation that it might be suitable to use them. Finally at the final part the comparison between the experimented neural networks and methods is introduced and the most appropriate method choice to be used in current is system is argued. Beyond mis, an update to system or future work is brought up in order to use the each remaning method effectively with the system. By the end of the thesis study most of the possible neural classifiers have been experimented and their place in the recognition engine of a real-time system has been argued. xiu