嵌入式语音识别

想要快速实现嵌入式语音识别系统,有没有现成的开发板买,哪个比较好?

推荐使用YQ5969,这个语音识别模块可以支持1--8个咪头,还可以支持本地和云端识别不同需求。5米内本地识别率 93%以上,云端识别率97%。YQ5969语音识别模块语言模型是用来约束单词搜索的。它定义了哪些词能跟在上一个已经识别的词的后面(匹配是一个顺序的处理过程),这样就可以为匹配过程排除一些不可能的单词。

想要快速实现嵌入式语音识别系统,有没有现成的开发板买,哪个比较好? 10分

搜索到一个VUI模块,

"VUI标准模块 v280"

号称是二次开发模块。有8路IO输出,输出识别结果。

用户在PC机上改汉字或者拼音作识别字,通过USB送入模块。

说8米的识别距离。哈哈。

做一个嵌入式的语音识别软件(手机上的),需要什么哪些硬件和软件资源。 10分

科大讯飞的语言识别软件是必须的,一般的手机MTK6225以上平台的硬件资源就差不多了。

当然识别丹件不是免费的,具体的可以咨询科大讯飞的商务。

语音识别开放化开发平台有哪些

语音识别开发平台有很多,具体总结如下:(更详细的介绍参见本人的博文:几个常见的语音交互平台的简介和比较)

1.商业化的语音交互平台

1)微软Speech API

微软的Speech API(简称为SAPI)是微软推出的包含语音识别(SR)和语音合成(SS)引擎的应用编程接口(API),在Windows下应用 广泛。目前,微软已发布了多个SAPI版本(最新的是SAPI 5.4版),这些版本要么作为于Speech SDK开发包发布,要么直接被包含在windows 操作系统中发布。SAPI支持多种语言的识别和朗读,包括英文、中文、日文等。

2).IBM viaVoice

IBM是较早开始语音识别方面的研究的机构之一,早在20世纪50年代末期,IBM就开始了语音识别的研究,计算机被设计用来检测特定的语言 模式并得出声音和它对应的文字之间的统计相关性。1999年,IBM发布了VoiceType的一个免费版。2003年,IBM授权ScanSoft公司拥有基于ViaVoice的桌面产品的全球独家经销权,随后ScanSoft与Nuance合并,如今viaVoice早已淡出人们的视线,取而代之的是Nuance。

3)Nuance

Nuance通讯是一家跨国计算机软件技术公司,总部设在美国马萨诸塞州伯灵顿,主要提供语音和图像方面的解决方案和应用。目前的业务集中 在服务器和嵌入式语音识别,电话转向系统,自动电话目录服务等。Nuance语音技术除了语音识别技术外,还包扩语音合成、声纹识别等技术。世界语音技术市场,有超过80%的语音识别是采用Nuance识别引擎技术, 其名下有超过1000个专利技术,公司研发的语音产品可以支持超过50种语言,在全球拥有超过20亿用户。苹果的iPhone 4S的Siri语音识别中就应用了Nuance的语音识别服务。

4)科大讯飞

科大讯飞作为中国最大的智能语音技术提供商,在智能语音技术领域有着长期的研究积累,并在中文语音合成、语音识别、口语评测等多项 技术上拥有国际领先的成果。占有中文语音技术市场60%以上市场份额,语音合成产品市场份额达到70%以上。

5)其他

其他的影响力较大商用语音交互平台有谷歌的语音搜索(Google Voice Search),百度和搜狗的语音输入法等等。

2.开源的语音交互平台

1)CMU-Sphinx

CMU-Sphinx也简称为Sphinx(狮身人面像),是卡内基 - 梅隆大学( Carnegie Mellon University,CMU)开发的一款开源的语音识别系统, 它包括一系列的语音识别器和声学模型训练工具。最早的Sphinx-I 由@李开复 (Kai-Fu Lee)于1987年左右开发,使用了固定的HMM模型(含3个大小为256的codebook),它被号称为第一个高性能的连续语音识别 系统(在Resource Management数据库上准确率达到了90%+)。 最新的Sphinx语音识别系统包含如下软件包:

 Pocketsphinx — recognizer library written in C.

 Sphinxbase — support library required by Pocketsphinx

 Sphinx4 — adjustable, modifiable recognizer written in Java

 CMUclmtk — language model too......余下全文>>

语音识别芯片的基本原理

嵌入式语音识别系统都采用了模式匹配的原理。录入的语音信号首先经过预处理,包括语音信号的采样、反混叠滤波、语音增强,接下来是特征提取,用以从语音信号波形中提取一组或几组能够描述语音信号特征的参数。特征提取之后的数据一般分为两个步骤,第一步是系统“学习”或“训练”阶段,这一阶段的任务是构建参考模式库,词表中每个词对应一个参考模式,它由这个词重复发音多遍,再经特征提取和某种训练中得到。第二是“识别”或“测试”阶段,按照一定的准则求取待测语音特征参数和语音信息与模式库中相应模板之间的失真测度,最匹配的就是识别结果。

推荐几款合适的DSP开发板。主要用于语音识别,大学生用。

如果是为了自己编程序写算法,建议用TI的Dsp,高端的有浮点运算。

如果是为了实现语音识别功能,搭建语音识别系统,建议用icroute公司的B-ld3320语音识别开发板,是51加语音识别芯片的现成系统。见到过一篇论文,是用Dsp作主控,用ld3320模块实现语音识别。

电子信息工程和电子信息科学与技术,这两个专业哪一个与嵌入式系统比较相近?急

电子科学技术主要研究方向包括:嵌入式系统的研究与开发、消费类电子产品的应用软件开发、语音识别技术、数据采集及测量技术、语音信号处理、高速集成电路测试、CAD技术等。信息工程专业的研究方向包括:信号的产生、信息传输、交换与处理以及在计算机通信、卫星通信、光纤通信、蜂窝通信、个人通信、多媒体技术、数字程控交换技术以及智能仪器等方面的理论和工程应用等技术。选则电子信息工程专业与你的爱好贴得比较近。

买抽油烟机有没有必要买语音识别的系统?

这个要看楼主怎么选择了,价位和质量都是值得考虑的地方。我用的是华帝的抽油烟机就是语音控制的。有时做饭的时候手忙脚乱的这个就非常有用,而且我的油手就没有动过它的控制地方。

用C语言做一个语音识别程序。

你老师给的例子,做到什么程度?

例子发一个到yahoo.com.cn的hztj2005。标题写语音识别程序。

sdk不用发。

语音识别问题

统计全部或部分语音数据的最大值,可乘以一个权重值当作最大音量

统计全部或部分语音数据音量的平均值,可分段计算最大值后平均

计算全部或部分语音数据的最大值和最小值之间的一个数为音量,比如中值

统计FFT后,将其中第2波峰后面几个波峰的数据滤波下来统计它们的平均或最大音量

扫一扫手机访问

发表评论