语音识别技术的发展历史

如题所述

推荐答案 2016-05-14

语音识别的研究工作可以追溯到20世纪50年代AT&T贝尔实验室的Audry系统，它是第一个可以识别十个英文数字的语音识别系统。
但真正取得实质性进展，并将其作为一个重要的课题开展研究则是在60年代末70年代初。这首先是因为计算机技术的发展为语音识别的实现提供了硬件和软件的可能，更重要的是语音信号线性预测编码（LPC）技术和动态时间规整（DTW）技术的提出，有效的解决了语音信号的特征提取和不等长匹配问题。这一时期的语音识别主要基于模板匹配原理，研究的领域局限在特定人，小词汇表的孤立词识别，实现了基于线性预测倒谱和DTW技术的特定人孤立词语音识别系统；同时提出了矢量量化(VQ)和隐马尔可夫模型(HMM)理论。
随着应用领域的扩大，小词汇表、特定人、孤立词等这些对语音识别的约束条件需要放宽，与此同时也带来了许多新的问题：第一，词汇表的扩大使得模板的选取和建立发生困难；第二，连续语音中，各个音素、音节以及词之间没有明显的边界，各个发音单位存在受上下文强烈影响的协同发音（Co-articulation）现象；第三，非特定人识别时，不同的人说相同的话相应的声学特征有很大的差异，即使相同的人在不同的时间、生理、心理状态下，说同样内容的话也会有很大的差异；第四，识别的语音中有背景噪声或其他干扰。因此原有的模板匹配方法已不再适用。
实验室语音识别研究的巨大突破产生于20世纪80年代末：人们终于在实验室突破了大词汇量、连续语音和非特定人这三大障碍，第一次把这三个特性都集成在一个系统中，比较典型的是卡耐基梅隆大学(CarnegieMellonUniversity)的Sphinx系统，它是第一个高性能的非特定人、大词汇量连续语音识别系统。
这一时期，语音识别研究进一步走向深入，其显著特征是HMM模型和人工神经元网络(ANN)在语音识别中的成功应用。HMM模型的广泛应用应归功于AT&TBell实验室Rabiner等科学家的努力，他们把原本艰涩的HMM纯数学模型工程化,从而为更多研究者了解和认识，从而使统计方法成为了语音识别技术的主流。
统计方法将研究者的视线从微观转向宏观，不再刻意追求语音特征的细化，而是更多地从整体平均（统计）的角度来建立最佳的语音识别系统。在声学模型方面，以Markov链为基础的语音序列建模方法HMM（隐式Markov链）比较有效地解决了语音信号短时稳定、长时时变的特性，并且能根据一些基本建模单元构造成连续语音的句子模型，达到了比较高的建模精度和建模灵活性。在语言层面上，通过统计真实大规模语料的词之间同现概率即N元统计模型来区分识别带来的模糊音和同音词。另外，人工神经网络方法、基于文法规则的语言处理机制等也在语音识别中得到了应用。
20世纪90年代前期，许多著名的大公司如IBM、苹果、AT&T和NTT都对语音识别系统的实用化研究投以巨资。语音识别技术有一个很好的评估机制，那就是识别的准确率，而这项指标在20世纪90年代中后期实验室研究中得到了不断的提高。比较有代表性的系统有：IBM公司推出的ViaVoice和DragonSystem公司的NaturallySpeaking,Nuance公司的NuanceVoicePlatform语音平台，Microsoft的Whisper,Sun的VoiceTone等。
其中IBM公司于1997年开发出汉语ViaVoice语音识别系统，次年又开发出可以识别上海话、广东话和四川话等地方口音的语音识别系统ViaVoice'98。它带有一个32,000词的基本词汇表，可以扩展到65,000词,还包括办公常用词条，具有“纠错机制”，其平均识别率可以达到95%。该系统对新闻语音识别具有较高的精度，是目前具有代表性的汉语连续语音识别系统。我国语音识别研究工作起步于五十年代，但近年来发展很快。研究水平也从实验室逐步走向实用。从1987年开始执行国家863计划后，国家863智能计算机专家组为语音识别技术研究专门立项，每两年滚动一次。我国语音识别技术的研究水平已经基本上与国外同步，在汉语语音识别技术上还有自己的特点与优势，并达到国际先进水平。中科院自动化所、声学所、清华大学、北京大学、哈尔滨工业大学、上海交通大学、中国科技大学、北京邮电大学、华中科技大学等科研机构都有实验室进行过语音识别方面的研究，其中具有代表性的研究单位为清华大学电子工程系与中科院自动化研究所模式识别国家重点实验室。
清华大学电子工程系语音技术与专用芯片设计课题组，研发的非特定人汉语数码串连续语音识别系统的识别精度，达到94.8%（不定长数字串）和96.8%（定长数字串）。在有5%的拒识率情况下，系统识别率可以达到96.9%（不定长数字串）和98.7%（定长数字串），这是目前国际最好的识别结果之一，其性能已经接近实用水平。研发的5000词邮包校核非特定人连续语音识别系统的识别率达到98.73%，前三选识别率达99.96%；并且可以识别普通话与四川话两种语言，达到实用要求。
中科院自动化所及其所属模式科技(Pattek)公司2002年发布了他们共同推出的面向不同计算平台和应用的“天语”中文语音系列产品——PattekASR，结束了中文语音识别产品自1998年以来一直由国外公司垄断的历史。

温馨提示：答案为网友推荐，仅供参考

当前网址：http://55.wendadaohang.com/zd/I4Q44Q8QLLIQ8IFL4GG.html

其他回答

第1个回答 2023-11-15

20世纪50年代初期，贝尔实验室的研究人员开始尝试将语音转化为文本。他们使用了一种叫做“Audrey”的设备，通过对话框架来实现语音识别。这种设备仍然十分原始，只能够识别一些简单的单词和数字。
20世纪60年代，语音识别技术得到了进一步的发展。美国国防部资助了一项名为“Harpy”的研究计划，旨在开发一种可以识别语音的系统。Harpy系统可以识别1,011个单词，但是其准确率仍然较低。
20世纪70年代，语音识别技术得到了一些重大的进展。IBM公司开发了一种名为“Shoebox”的语音识别系统，可以识别1,000个单词。这种系统使用了一些新的技术，如动态时间规整（DTW）等。
20世纪80年代，语音识别技术得到了更加显著的进步。美国国防部资助了一项名为“Dragon”的研究计划，旨在开发一种可以识别语音的系统。这个项目为语音识别技术的发展做出了重要的贡献，使得语音识别技术开始逐渐应用于商业领域。
20世纪90年代，随着计算机技术的不断发展，语音识别技术得到了更加广泛的应用。语音识别技术开始应用于电话系统、自动语音应答系统（IVR）、语音邮件等领域。此外，语音识别技术还开始应用于语音助手、智能家居等领域。
21世纪，随着人工智能技术的快速发展，语音识别技术得到了更加广泛的应用。语音识别技术开始应用于智能音箱、智能手机等消费电子产品中。此外，语音识别技术还开始应用于语音翻译、智能客服、语音搜索等领域。语音识别技术的准确率也得到了极大的提升，可以达到甚至超过人类语音识别的水平。

第2个回答 2020-06-02

NRK10语音识别芯片为广州九芯电子自主研发的一款高性能、低成本的离线语音识别芯片，具有语音识别及播报功能，需要外挂 SPI-Flash，存储词条或者语音播内容。他具有识别率高，工业级性能、简单易用，更新词条方便等优势。广泛应用在智能家居、AI人工智能、玩具等多种领域。

相似回答

语音识别技术的历史答：早在计算机发明之前，自动语音识别的设想就已经被提上了议事日程，早期的声码器可被视作语音识别及合成的雏形。而1920年代生产的Radio Rex玩具狗可能是最早的语音识别器，当这只狗的名字被呼唤的时候，它能够从底座上弹出来。最早的基于电子计算机的语音识别系统是由AT&T贝尔实验室开发的Audrey语音识别系统...

为什么是这个课题了语音识别从一九四六年开始就有人研究这个历史和电子...答：语音识别技术的研究可以追溯到20世纪40年代。早在1946年，美国发明家贝尔（Bell）和他的同事们就开始了对语音识别技术的研究。1、他们试图通过分析语音的音频特征，来识别语音内容。然而，由于当时的技术和计算机能力的限制，他们的研究并没有取得太大的进展。随着电子计算机的发展，人们开始尝试使用计算机来...

什么时候开始人类基本上能够让计算机把人的语音变成文字?答：人类基本上能够让计算机把人的语音变成文字的时间可以追溯到上世纪80年代，当时语音识别技术已经开始应用于商业和工业领域，但大多数系统只能识别少量的语音词汇，并且需要使用特定的语音输入设备，例如麦克风和语音控制棒等。到了1990年代，随着语音识别算法和计算机处理能力的不断提高，语音识别技术的应用范围不...

基于单片机的语音识别的国内外发展及意义答：语音识别的研究工作大约开始于50年代，当时AT& T Bell实验室实现了第一个可识别十个英文数字的语音识别系统--Audry系统。--60年代，计算机的应用推动了语音识别的发展。这时期的重要成果是提出了动态规划（DP）和线性预测分析技术（LP），其中后者较好地解决了语音信号产生模型的问题，对语音识别的发展产生...

语音识别技术最早是谁发明的?答：打印机是由约翰·沃特（JohnVaught）、戴夫·唐纳德发明的（他两个合作发明了打印机）。　将计算机的运算结果或中间结果以人所能识别的数字、字母、符号和图形等，依照规定的格式印在纸上的设备。打印机正向轻、薄、短、小、低功耗、高速度和智能化方向发展。

大家正在搜

语音识别技术的现状语音识别的关键技术语音识别技术的缩写智能语音识别技术语音识别技术原理基于语音识别的最好的语音识别语音识别的应用有哪些语音识别开发