PROGRAMSKI SUSTAV ZA RASPOZNAVANJE TISKANOG TEKSTA Autor: Mladen Jurković Mentor: Prof.dr.sc. Zoran Kalafatić Broj rada: 858 Datum: 10.7.2009.
Sadržaj Uvod Metoda izrade sustava Modeli sustava Prikaz faza Prikaz rada programa Zaključak
Uvod Optičko raspoznavanje znakova Računalni vid Raspoznavanje uzoraka
Metoda izrade sustava Učenje s učiteljem Dvije faze: Faza učenja Faza odlučivanja
Slike za učenje JPG format Svako slovo prikazano s 19 fontova
Model faze učenja
Model faze odlučivanja
Ulazna slika
Pretprocesirana slika
Pronalaženje kontura
Polovice slova
Izlučivanje značajki Vektor značajki je 5-dimenzionalan Prva značajka: broj rupa u slovu Ostale: Hu-ovi invarijantni momenti
gdje je i-ti član vektora značajki uzorka A Sličnost uzoraka Udaljenost između vektora gdje je i-ti član vektora značajki uzorka A Ukupna sličnost: umnožak sličnosti svake od polovica slika i cijele slike
Klasifikacija nepoznatih uzoraka 1-NN metoda Klasifikacija pomoću jednog prototipa Konačna odluka: kombinacija ovih metoda
Problemi kod prepoznavanja Sljepljivanje slova Nezatvorenost kontura Razlomljena slova
Prikaz rada programa
Slika za testiranje
Prepoznati tekst THE QUICK BROMN DOG JUMPS OVER THE AZY FON THE QUECK BMOWN DOG JUMFS OVES THE LAY FOX THE QUICK BROKN DOC JUMPS OVER THE LAY FOZ TNE QUICK BROWN DOG JUMPS OVER TNE LAZY FOX TME QUICK BRONS SOG JUMPS OVER TME AY FOX TGE QUICE BROSM DOG JXMPS OVER TME LAZY FON TNE QUICK BROMN DOG JUMPS OVER TNE AZV FOX
Testiranje i uspješnost Testirano na 7 nepoznatih fontova Pogrešna klasifikacija: 5,66 % Baza slika za učenje: 26 x 19 slova Baza slika za testiranje: 7 x 400 slova
Programska potpora Programski jezik: c++ Korištenje funkcija knjižnice OpenCV Visual Studio 2008
Zaključak Uspješnost ostvarenog programskog sustava > 94% Moguća poboljšanja: korištenje rječnika
Hvala na pažnji Pitanja?