语言
VoxForge
VoxForge创建的初衷是为免费和开源的语音识别引擎收集标注录音(在Linux/Unix,Windows以及Mac平台上)。
我们以GPL协议开放所有提交的录音文件,并制作声学模型,以供开源语音识别引擎使用,如CMUSphinx,ISIP,Julias(github)和HTK(注意:HTK有分发限制)。
为什么需要免费的GPL协议的录音?
开源语音识别(或语音转写)引擎使用的声学模型是闭源的。使用者没有接触用于制作这些声学模型的音频和标注文件(即语料库)的权限。
造成这一现象的原因是,真正能够用于制作语音识别引擎声学模型的语料库没有免费的。开源项目需要购买有限版权的语料库,也就是说不允许他们分发语料数据,但是可以分发用这些数据制作的声学模型。
如何贡献
点击“用你的计算机提交录音”图标,学习如何用你的计算机录制你的声音并提交至VoxForge。