Numer: 11/2016 Str. 301
Autorzy: Piotr Kozierski , Talar Sadalla , Szymon Drgas , Adam Dąbrowski , Dariusz Horla :
Tytuł: Narzędzia Kaldi w rozpoznawaniu polskiej mowy szeptanej
Streszczenie: W artykule przedstawiono automatyczne rozpoznawanie mowy. Wykorzystane narzędzia, biblioteki i korpus opisano w artykule. Uzyskane wyniki wskazują, że wykorzystując różne modele akustyczne dla mowy zwykłej i szeptanej uzyskuje się polepszenie skuteczności rozpoznawania mowy. W wyniku wykonanych badań wskazano również optymalną kolejność kroków treningu. Dzięki dodatkowym obliczeniom stwierdzono, że użyty korpus (ponad 9 godzin zwykłej mowy i drugie tyle szeptu) jest zdecydowanie za mały do dobrego wytrenowania systemu rozpoznawania mowy i w przyszłości musi zostać powiększony.
Słowa kluczowe: rozpoznawanie mowy, ASR, mowa szeptana, baza danych.