Razpoznavanje govora v domeni dnevno-informativnih oddaj / Speech Recognition in the Broadcast News Domain

Mirjam Sepesy Maučec in Andrej Žgank
 
Anali PAZU, 1 (2011), št. / No. 1, strani / pages 54-56
Celotno besedilo / Full text (PDF)
 
Povzetek: V članku bomo predstavili splošno zgradbo razpoznavalnika govora. Na kratko bomo opisali vse njegove ključne komponente.V nadaljevanju se bomo posvetili razpoznavalniku slovenskega tekočega govora UMB BN, ki trenutno predstavlja najkompleksnejši razpoznavalnik slovenskega govora, katerega razvoj poteka že nekaj let. Namenjen je razpoznavanju govora za domeno dnevno-informativnih oddaj. V članku se bomo posvetili tudi jezikovnim virom, ki so ključnega pomena ne samo pri razvoju razpoznavalnika ampak pri razvoju poljubnih jezikovnih oz. govornih tehnologij.
Ključne besede: tekoči govor; razpoznavanje govora; pregibni jezik.

Abstract: In this paper the structure of a speech recognition system is presented. We focus on Slovenian speech recognition.  UMB BN system is described. Currently, it is the most complex large vocabulary continuous speech recognition system for Slovenian language. It is designed for transcribing TV-news shows. In the paper language resources are also described being crucial in developing such systems.
Key words: speech recognition; highly inflective language; language resources

Vsi prispevki avtorja: 
Številka revije: