Download presentation
Presentation is loading. Please wait.
Published byNikola Ћирковић Modified over 5 years ago
1
Podatkovni višemedijski prijenos i računalne mreže Speech Recognition
Sveučilište u Zagrebu Fakultet Elektrotehnike i računarstva Zavod za elektroničke sustave i obradbu informacija Podatkovni višemedijski prijenos i računalne mreže Speech Recognition Joško Rogulj Joško Rokov Nino Talian Siječanj 2006.
2
Sadržaj Uvod Princip rada Opća kategorizacija sustava Primjene
Komercijalni sustavi Besplatni sustavi Zaključak Literatura
3
Uvod Prepoznavanje govora je proces kojim računalo identificira izgovorene riječi Velik broj rješenja s tehnologijom raspoznavanja govora Kompleksnost problema
4
Princip rada Koraci sustava za raspoznavanje
Snimanje govora i detekcija iskaza Predfiltriranje Uokviravanje Filtriranje (opcionalan korak) Usporedba Djelovanje
5
Opća kategorizacija sustava
Podjela s obzirom na tipove iskaza koji se mogu detektirati: Izolirane riječi Povezane riječi Kontinuirani govor Spontani govor Provjeravanje/identifikacija govora
6
Primjene Diktiranje Naredbe/kontrola Telefonija Prijenosni uređaji
Medicinske svrhe Ugrađeni (embedded) sustavi
7
Komercijalni sustavi Dragon Naturally speaking (Nuance) -- IBM ViaVoice -- SpeakToText (CoolSoft) -- VR Commander (Interactive Voice Technologies) -- Audiomatic (Wise Riddles Software) -- e-Speaking (e-speaking) -- Realize Voice Lite (Realize Software) -- Voice Studio (Ultimate Interactive Desktops) -- Abbot (Softsound) -- Dictation Buddy (High Criteria) -- MacSpeech iListen -- ...
8
Besplatni (OpenSource) sustavi
Xvoice -- Open Mind Speech -- CMU Sphinx -- NICO toolkit -- GVoice -- CVoiceControl -- ...
9
Zaključak Očekivanja: Veći broj komercijalnih proizvoda
Niže cijene postojećih rješenja Razvoj boljih algoritama Veći broj OpenSource rješenja Nove primjene
10
Literatura http://www.tldp.org/HOWTO/Speech-Recognition-HOWTO/
...
Similar presentations
© 2024 SlidePlayer.com. Inc.
All rights reserved.