Italian

Flat
Free Italian Speech corpus
User: calel
Date: 6/24/2013 6:11 am
Views: 4933
Rating: 12

Per chi fosse interessato:

"CLIPS, ovvero Corpora e Lessici dell'Italiano Parlato e Scritto, è uno degli otto progetti (Progetto n. 2) del Cluster C18 "LINGUISTICA COMPUTAZIONALE: RICERCHE MONOLINGUI E MULTILINGUI" (Legge 488), finanziato dal Ministero dell'Istruzione, dell'Università e della Ricerca (MIUR)."

Ho visionato buona parte dei corpora, a mio avviso sono di scarsa qualità, ma son sempre qualcosa ;-)

Inoltre, per chi come me ha un sistema di creazione automatica di modelli acustici, c'è necessità di scrivere una terza parte che aggiorna il modello di linguaggio e il lessico seguendo i tag proposti dal sito. Sono presenti anche parole dialettali, personalmente le ho scartate, perchè poco trainate e -a mio avviso- non idonee a un riconoscimento vocale utilizzabile in ambiti accademici e/o commerciali.

Basta iscriversi, confermare la mail e dopo è possibile accede e scaricare quel che si vuole.

Per chi volesse collaborare con me, la mia mail è [email protected].

Buone cose C.

PreviousNext