Odezírání

Odezírání

Práce si klade za cíl vytvořit model, který bude schopný generovat textový přepis lidské řeči pomocí odezírání z úst ve videu beze zvuku. Model by měl cílit na český jazyk a pro trénování může využít filmy s titulky nebo televizní vysílání s titulky.

Zdroje:

https://dspace5.zcu.cz/handle/11025/39247?locale=en

Lip Reading using Deep Neural Networks, Jan Horák 2018, CTU FIT

https://www.researchgate.net/profile/Stephen-Cox-17/publication/280624514_Improving_Lip-reading_Performance_for_Robust_Audiovisual_Speech_Recognition_using_DNNs/links/55bf891308ae092e9666988f/Improving-Lip-reading-Performance-for-Robust-Audiovisual-Speech-Recognition-using-DNNs.pdf

Zaujalo tě téma?

Ozvi se nám!