Türkçe El Yazısı Tanıma Sistemi Geliştirildi

Türkçe El Yazısı Tanıma Sistemi Geliştirildi

LISTEN
Published on 21.11.2018 10:53

Mühendislik ve Doğa Bilimleri Fakültesi öğretim üyemiz Berrin Yanıkoğlu liderliğindeki ekip "Akıllı Sınıflarda Kullanılacak El Yazısı Tanıma Teknolojilerinin Geliştirilmesi ve Uygulanması" projesi kapsamında Türkçe el yazısı tanıma sistemi geliştirdi.  


Milli Eğitim Bakanlığı FATİH Projesi (Eğitimde Fırsatları Artırma Teknolojiyi İyileştirme Hareketi) kapsamında mevcut içerik ve teknolojilerin daha rahat ve etkili kullanımı için, el yazısı tanıma teknolojileri ve bu teknolojiyi kullanan ilköğretim öğrencilerine, öğretim teknolojileri temelli e-içerik desteği sağlamayı amaçlayan çalışmayı Berrin Yanıkoğlu şu şekilde özetliyor:

Türkçe el yazısı tanıma sistemi nedir ve nasıl çalışır? 

El yazısı tanıma, kişinin kalemle, tablet gibi dokunmaya hassas bir cihaza yazdığı yazının otomatik olarak tanınması ve makinenin anlayacağı bir şekle dönüştürmesidir. El yazısı tanıma uzun yıllardır (1960lar) dünyada üzerinde uğraşılan bir problemdir ve OCR (Optical Character Recognition) ve el yazısı için de ICR (Intelligent Character Recognition) isimleri ile bilinir. Ses tanıma gibi, el yazısı tanıma da insan-makine iletişimini kolaylaştırmayı amaçlamaktadır. Örneğin tablete veya telefona yazılan el yazısı notların tanınarak aranabilir dokümanlara çevrilmesi, küçük klavye ile yazma sorununa bir alternatif oluşturur.

Dünyada örnek çalışmalar var mı? Türkçe uygulama ile kıyaslayabilir miyiz?

İngilizce için geliştirilen el yazısı tanıma sistemleri 2000 yıllarından itibaren tablet ve telefonlarda yer almaya başlamışlardır; ancak Türkçe'nin eklemeli morfolojisinden dolayı problem daha karmaşıktır. Basitçe anlatılırsa, kalemle yazılan girdinin oluşturduğu sinyal, makine öğrenme yöntemleri kullanılarak, sözcük dağarcığındaki kelimelerle karşılaştırılır. Türkçe'de  sözcük dağarcığının çok büyük olması ve kelimelerin birbirine benzerliği dolayısıyla (örn. gittim, gittin, gitti...), sistem başarısı İngilizce'ye göre düşüktür (daha küçük dağarcık ile %90 üstü, geniş dağarcıkla ise %70 gibi kelime tanıma başarısı).

Çalışmanız hangi aşamada?

Ben doktora tezimden başlayarak, uzun yıllar hem İngilizce, hem Türkçe; ve hem resim, hem tabletten (resim+zaman bilgisi) yazı tanıma üstünde çalıştım. Bu sene doktora öğrencim Esma Bilgin Taşdemir bu konuda tezini sundu. Burada bahsedilen ve Tübitak 1003 projesi kapsamında desteklenen bu çalışmada da Türkçeye yönelik en ileri tanıma sistemi geliştirildi ve özellikle ilkokul öğrencilerine yönelik kullanıma yönelik modüller ve arayüz geliştirildi. Öğrencilerin neredeyse hepsi soruları tablette yapmayı kalem/kağıtla yapmaya tercih etti, ama henüz ürünleşmesi veya yaygın kullanılması gerçekleşmedi; olmasını çok isterim.