VoxForge
Per chi fosse interessato:
"CLIPS, ovvero Corpora e Lessici dell'Italiano Parlato e Scritto, è uno degli otto progetti (Progetto n. 2) del Cluster C18 "LINGUISTICA COMPUTAZIONALE: RICERCHE MONOLINGUI E MULTILINGUI" (Legge 488), finanziato dal Ministero dell'Istruzione, dell'Università e della Ricerca (MIUR)."
Ho visionato buona parte dei corpora, a mio avviso sono di scarsa qualità, ma son sempre qualcosa ;-)
Inoltre, per chi come me ha un sistema di creazione automatica di modelli acustici, c'è necessità di scrivere una terza parte che aggiorna il modello di linguaggio e il lessico seguendo i tag proposti dal sito. Sono presenti anche parole dialettali, personalmente le ho scartate, perchè poco trainate e -a mio avviso- non idonee a un riconoscimento vocale utilizzabile in ambiti accademici e/o commerciali.
Basta iscriversi, confermare la mail e dopo è possibile accede e scaricare quel che si vuole.
Per chi volesse collaborare con me, la mia mail è [email protected].
Buone cose C.