sphinx系统是一个拥有悠久历史的语音识别系统,
传说中是第一个实用的10数字语音系统。
是由卡奈基.美隆大学研发。
sphinx3.x是基于C语言的最新版本,sphinx和sphinx2请大家不要去研究了。
sphinx for ppc是一个在PocketPc上实现的嵌入式语音识别系统。
而sphinx4是完全用JAVA编写实现的语音识别系统,
因为JAVA的特性,在平台间移植方便很多。
需要注意的是sphinx3和sphinx4不是先后的关系,而是平行的,
主要区别是前一个用C语言实现,后一个用JAVA语言实现。
因为种种原因我研究sphinx4有一个月时间了,
根据自己需要阅读修改了FrontEnd部分源代码,
下面回贴中,我将一步步的讲述,
如何开始Sphinx4研究之旅。
1.sphinx4主页是
http://cmusphinx.sourceforge.net/sphinx4/
请把它加入收藏,谢谢。
上面有下载的连接。
现在最新的版本应该是这个sphinx4-1.0beta-bin.zip
解压到e:\sphinx4
(我以这个目录为例,以后的讲述都是假设这个为根目录,
而且以"sphinx4>"这个代替命令行下的这个目录 )
给PC接上麦克风(Mic),cmd进入命令行
运行
sphinx4> java -jar bin/HelloDigits.jar
这是一个识别单个数字的DEMO程序
2.如果你还没能用那个识别数字的DEMO
检查了一下自己英语数字的发音。
那么说明你环境有问题,请检查以下事项
a.是否有JAVA运行环境,在命令行下敲 java
若没有,这样的一些演示
“Usage: java [-options] class [args... "
说明JAVA运行环境有问题,
到http://java.sun.com/j2se/1.4.2/download.html
点连接"Download J2SE JRE "下载并安装JAVA运行环境。
b.若可以启动,但对着麦克风说话,DEMO没能正确识别出来。
那么请检查麦克风是否接好,在QQ,或MSN,或SKYPE中语聊一会
确认自己的麦克风连接没有问题。
如果你是用的LINUX系统或其他类UNIX系统,
那么需要修改配置文件,才能正确开始。
3. 如果你已经成功运行DEMO,那么你已经对SPHINX4有了感性认识。
下面来深入一些,了解从语音到识别的这样一个过程。
附件是识别器的示意图。
下面简单说一下各模块的用处
FrontEnd:
前端处理模块,把语音转换成特征就是由这个模块完成。
FrontEnd经过简单的配置后可以
将Wav文件、麦克风甚至倒谱(cepstrum)文件做为输入。
Decoder:
解码器,将搜索语言模型,找出与特征相对应的识别项(一般是音素)
Linguist:
金山给的翻译是语言学家,这样称为语言模型更贴切。
它包括三个部分,
AcousticModel:声学模型,建立输入声音和音素的关系
Dictionary:字典,可以接受的音素范围。
LanguageModel:语言模型,建立字与字之间先后语言关系。
这三个模型是预先建立好的,我会在模型创建那段去
仔细讲这三个模型。
更详细的信息从下面的白皮书上可以查到
http://cmusphinx.sourceforge.net/sphinx4/doc/Sphinx4Whitepaper.pdf
本文来自CSDN博客,转载请标明出处:http://blog.csdn.net/nicolas16/archive/2008/03/14/2181599.aspx
分享到:
相关推荐
sphinx系统是一个拥有悠久历史的语音识别系统,李开复自称第一个sphinx是他写的。 传说 中是第一个实用的10数字语音系统。 是由卡奈基.美隆大学研发。 sphinx3.x是基于C语言的最新版本,sphinx和 sphinx2请大家...
基于Sphinx的汉语连续语音识别论文
Android平台使用PocketSphinx做离线语音识别,小范围语音99%识别率.zip
sphinx 语音识别,以及中文声学模型。字典与语言可以通过http://www.speech.cs.cmu.edu/tools/lmtool-new.html 在线生成
pocketsphinx在windows下的中文语音识别 http://blog.csdn.net/itas109/article/details/78999477
Android平台使用PocketSphinx做离线语音识别,小范围语音99%识别率.zip,太多无法一一验证是否可用,程序如果跑不起来需要自调,部分代码功能进行参考学习。
Python 语音识别 03使用PocketSphinx实现语音转换为文本.mp4
最新的pocketsphinx语音识别在android下的demo 不用像以前版本编辑jni 直接调用jar的接口
Pocketsphinx.js 是一个在浏览器上通过纯 JavaScript 实现语音识别的功能,支持 Chrome 和 Firefox 浏览器。提供录音的功能。特性:100% 纯 JavaScript API,可通过 Web Workers 录制支持 PocketSphinx 所支持的所有...
sphinx3-0.7 - Speech recognition system CMU的语音识别系统,很不错。
Pocketsphinx.js 是一个在浏览器上通过纯 JavaScript 实现语音识别的功能,支持 Chrome 和 Firefox 浏览器。提供录音的功能。 特性: 100% 纯 JavaScript API, 可通过 Web Workers 录制 支持 PocketSphinx 所...
Linux平台下Sphinx语音识别.pdf
语音识别技术,也被称为自动语音识别,目标是以电脑自动...应的文字和文字转换为语音,可以使用使用 pyttsx,SAPI ,SpeechLib ,PocketSphinx 实现文本转换语音,内含有视频讲解,想要深入这一块,这个是必不可少的!
Sphinx用于汉语连续数字语音识别的研究,王韵,张雪英,本文介绍了一个基于Sphinx的汉语连续数字语音识别系统,其声学模型采用SphinxTrain训练生成,语言模型由cmuclmtk统计语言模型生成,识别��
Android离线语音识别 PocketSphinx的demo 已封装 即下即用 ! 支持中英两种语言离线识别
android离线语音识别 利用pocketsphinx在安卓手机上建立一个语言识别的程序
#资源达人分享计划#
Android平台使用PocketSphinx做离线语音识别,小范围语音99%识别率