CN1764943A - 依赖于说话人识别语音的方法和语音识别系统 - Google Patents

依赖于说话人识别语音的方法和语音识别系统 Download PDF

Info

Publication number
CN1764943A
CN1764943A CNA2004800078941A CN200480007894A CN1764943A CN 1764943 A CN1764943 A CN 1764943A CN A2004800078941 A CNA2004800078941 A CN A2004800078941A CN 200480007894 A CN200480007894 A CN 200480007894A CN 1764943 A CN1764943 A CN 1764943A
Authority
CN
China
Prior art keywords
phonetic representation
recognition system
instruction
speech recognition
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2004800078941A
Other languages
English (en)
Other versions
CN100559464C (zh
Inventor
R·奥保尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens AG
Original Assignee
Siemens AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens AG filed Critical Siemens AG
Publication of CN1764943A publication Critical patent/CN1764943A/zh
Application granted granted Critical
Publication of CN100559464C publication Critical patent/CN100559464C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • G10L2015/0631Creating reference templates; Clustering

Landscapes

  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • User Interface Of Digital Computer (AREA)
  • Electrically Operated Instructional Devices (AREA)
  • Machine Translation (AREA)
  • Telephonic Communication Services (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

在一种用于利用语音识别系统来依赖于说话人识别语音的方法中,其中训练用户的语音表达并且给所训练的语音表达分配指令,通过以下方式来解决节省时间地执行训练新指令(5)的任务,即在未识别出(3)语音表达时,通过语音识别系统建议用户直接将语音表达分配给新的指令(9)。

Description

依赖于说话人识别语音的方法和语音识别系统
本发明涉及一种用于利用语音识别系统来依赖于说话人识别语音的方法,其中训练用户的语音表达(Sprachuβerung)并且给所训练的语音表达分配指令,以及涉及一种用于执行该方法的语音识别系统。
按照现有技术将这种方法划分成语音识别模式和训练模式。在语音识别模式下,采集用户的语音表达,于是在数据库中找到分配给该语音表达的指令,只要该语音表达显示出与属于该指令的并且在以前的时刻所录制和存储的语音表达的足够的一致性。在语音识别模式下,不能在新的语音表达和新的指令之间进行新的分配。更确切地说,在训练模式下实现这些过程,其中用户说出语音表达,并且在录制了这些语音表达之后给每个单个语音表达分配指令。在数据库中存储所获得的分配。所分配的指令例如可以是通信网用户的拨号过程,或者可以是语音控制指令。
按照现有技术的方法具有以下缺点,即就每次必须由用户主动地从语音识别模式转换到训练模式这点而言,新的指令的训练是麻烦的。这也负面地影响语音识别系统在市场上的认可度。
由此出发,本发明所基于的任务在于给出一种用于依赖于说话人识别语音的方法以及一种用于此的语音识别系统,其中可以节省时间地执行新的指令的训练。
该任务在文章开头所述的那种方法方面通过以下方式来解决,即在未识别出语音表达时,通过语音识别系统向用户建议,将该语音表达直接分配给新的指令。
在执行本方法时,语音识别系统总是处于语音识别模式下,其中但是提供以下选择,即在未识别出语音表达时直接进行新的指令分配。以此方式将新的指令的训练结合到语音识别本身中,并且当未识别出语音表达时,则可以进行新的指令的训练。如果例如用户恰好处于他想训练用于语音识别系统的新的指令的情况下,则清晰地说出迄今未使用的语音表达就足够了,在此之后语音识别系统确定未识别出该新的语音表达,然后提供将该新的语音表达分配给新的指令的选择。在进行了分配之后可以直接实施该指令。
在一种优选的实施形式中,在未识别出语音表达时,用户可以通过语音识别系统可选地重复语音表达或者将该语音表达分配给新的指令。该实施形式考虑到以下事实,即一种语音表达可能恰好位于与一种已经被分配给所希望的指令的语音表达的相似范围之外。在此情况下,不打算将新的语音表达分配给新的指令。更确切地说,必须重复该语音表达,以便与已经训练的指令相联系。
关于语音识别系统的初始状态,优选地针对本方法规定,在还未给语音表达分配指令的情况下,语音识别系统在其激活之后立即提供新的指令的训练。当语音识别系统自然地未识别出第一语音表达并且提供训练新的指令的选择时,这自动地发生。
在另一种实施形式中可以规定,在针对已经训练的指令而未识别出语音表达时,用户可以通过语音识别系统选择指令并且将该语音表达分配给该指令。这涉及以下情况,即在包含语音表达和所属的所训练的指令之间的分配的数据库中存在语音表达的“不良的”版本,以致语音识别常常失败。在此情况下,可以给已经训练的指令分配新的语音表达。
优选地为识别语音表达而生成分配给该语音表达的语音模型。于是在数据库中也采用这种语音模型,该语音模型基于语音表达的主要语音特征的提取,该数据库在此情况下包含语音模型和所训练的指令之间的分配。在语音表达的录制之后将每种语音表达转换成语音模型,然后进一步处理该语音模型,例如用于以下决策,即它是否是可识别的,也就是说它是否已经存在于数据库中的语音模型的相似范围之内。
在这方面,看作优选的是,在向语音表达分配指令之前检查,该语音表达是否与以前存储的语音表达相似。以此方式避免在语音识别时出现不同指令之间的混淆,因为分别所属的语音表达彼此太相似了。为此可以例如在采用语音模型的提取特征的情况下定义允许的相似范围。
上述任务在语音识别系统方面通过用于依赖于说话人识别语音的语音识别系统来解决,该语音识别系统具有:用于录制语音识别系统的用户的语音表达的语音录制设备;被构造用于访问包含语音表达和指令之间的分配的数据库以便找到分配给语音表达的指令的搜索机;用于转换基于语音表达所找到的指令的转换设备,其中如此来构造该语音识别系统,使得在未识别出语音表达时通过该语音识别系统来建议用户,将该语音表达直接分配给新的指令。
这种语音识别系统允许执行上述方法,并且相对于已知的语音识别系统其特征在于,在语音识别模式之内能够实现新的指令的训练。
语音录制设备优选地与存储器相连接,在该存储器中暂存语音表达,并且该存储器与数据库相连接,以便将语音表达读入数据库中。在已知的语音识别系统中情况不是如此,因为在那里对于训练模式而言直接访问数据库,而在语音识别模式下,虽然针对搜索机功能而暂存语音表达,但是之后所使用的存储器不是被构造/连接用于将语音表达读入数据库中。
优选地在语音录制设备和存储器之间设置用于由语音表达生成语音模型的特征提取设备,并且语音模型代替语音表达。
已经在上面借助用于依赖于说话人识别语音的方法的说明,阐述了语音识别系统的其它优点和特征。
以下还将借助附图详细地阐述本发明的实施例。唯一的图展示了用于依赖于说话人识别语音的方法的流程图。
从现在起,借助图1来阐述一种用于借助语音识别系统依赖于说话人来识别语音的方法。在启动例如被实现为具有显示设备的计算机系统的语音识别系统之后,首先给用户显示合适的用户界面,该用户界面还包含用于录制语音表达的激活(“按键通话”激活)。在第一方法步骤1中录制用户/说话人的语音表达,也就是借助合适的语音录制设备来实现。在第二步骤2中借助特征提取设备生成语音表达的语音模型,其中通过所提取的表示特征的语音特征的组合来定义语音模型。在存储器中暂存该语音模型。
在第三步骤3中,借助搜索机来询问,在数据库中是否包含所生成的语音模型,其中该数据库包含语音模型和指令之间的分配。该数据库在语音识别系统的训练模式下配备有内容,其中该训练模式被集成到语音识别的过程中。如果将语音模型识别为在数据库中已经存在并且找到了所属的指令,则在第四步骤中实施该指令,在此之后终止语音识别系统的运行过程。在此情况下,自动地进行本实施例中从步骤1直至步骤4的流程。
如果在步骤3中未识别出所生成的语音模型,用户则通过计算机系统的用户界面获得给未识别出的语音模型或未识别出的语音表达分配新的指令的选择。这在本方法的第五步骤5中实现。在此,只要新的指令的分配是所希望的或自动引起的,语音识别系统就被转换到训练模式下。替代第五步骤5,用户也可以借助用户界面来触发新的语音表达录制,使得返回到第一步骤1,以便重复语音表达。
如果选择向未识别出的语音模型分配新的指令,则在第六步骤6中进行语音表达的录制,该语音表达相当于第一步骤中未识别出的语音表达。紧接着在第七步骤7中,由在第六步骤6中所录制的语音表达生成语音模型,也就是以与在上述第二步骤2中相同的方式生成语音模型。
在第八步骤8中,执行来自第七步骤7的新的语音模型和来自第二步骤2的语音模型之间的相似性检查。如果在两个语音模型之间不存在所希望的一致性量度,则本方法重新开始,直至对于在第二步骤2中和在第七步骤7中所生成的语音模型的相似性而言存在令人满意的结果为止。在此情况下可以跳过第三步骤3和第五步骤5。
在第八步骤8中也可以如下进行相似性检查,即新录制的语音表达的语音模型是否相对于已经在数据库中存在的语音模型保持足够的距离。在否定的情况下,可以要求用户将另一种语音表达用于新指令的分配。针对该新的语音表达,本方法重新开始。
紧接着在第九步骤9中,给在第二步骤2中所生成的语音模型分配指令,也就是通过用户借助语音识别系统的用户界面进行合适的选择来实现。为此,从存储器中读出语音模型,其中该语音模型在第二步骤2中被暂存在该存储器中,使该语音模型与在步骤7中所生成的语音模型例如通过两个语音模型的各个特性的平均值计算而适当地相联系,并且与新的指令一起写入数据库中。
在最后的步骤10中实施新分配的指令,在此之后结束具有集成的训练模式的语音识别过程。
要强调的是,借助用于转换指令的转换设备来进行在第四和最后步骤中实现的指令实施。指令可以例如是通信网络中电话号码的拨打,或者可以是语音指令,利用该语音指令来控制连接到网络上的设备。
当然在本方法的一种简化的实施形式中,在按照第九步骤9分配指令时,可以舍弃前面的步骤6至8的执行。以此方式,直接按照来自第五步骤5的询问来进行指令的分配。也可以在执行本方法时舍弃新训练的指令的直接实施(第十步骤)。

Claims (9)

1.用于利用语音识别系统来依赖于说话人识别语音的方法,其中训练用户的语音表达并且给所训练的语音表达分配指令,
其特征在于,
在未识别出语音表达时,通过所述语音识别系统来建议所述用户,直接将所述语音表达分配给新的指令。
2.按权利要求1的方法,其特征在于,在未识别出语音表达时,所述用户可以通过所述语音识别系统可选地重复所述语音表达或者将所述语音表达分配给新的指令。
3.按权利要求1或2之一的方法,其特征在于,在还未给语音表达分配指令的情况下,所述语音识别系统在其激活之后提供新的指令的训练。
4.按权利要求1至3之一的方法,其特征在于,在针对已经训练的指令而未识别出语音表达时,所述用户可以通过所述语音识别系统选择所述指令,并且可以给所述指令分配所述语音表达。
5.按权利要求1至4之一的方法,其特征在于,为了识别语音表达,生成分配给所述语音表达的语音模型。
6.按权利要求1至5之一的方法,其特征在于,在向语音表达分配指令之前检查,所述语音表达是否与以前存储的语音表达相似。
7.用于依赖于说话人识别语音的语音识别系统,具有:
语音录制设备,用于录制所述语音识别系统的用户的语音表达,
搜索机,该搜索机被构造用于访问包含语音表达和指令之间的分配的数据库,以便找到分配给所述语音表达的指令,
转换设备,用于转换基于所述语音表达所找到的指令,
其特征在于,
如此来构造所述语音识别系统,使得在未识别出语音表达时,通过所述语音识别系统建议所述用户,将所述语音表达直接分配给新的指令。
8.按权利要求7的语音识别系统,其特征在于,所述语音录制设备与存储器相连接,在所述存储器中暂存所述语音表达,并且所述存储器与所述数据库相连接,以便将所述语音表达读入所述数据库中。
9.按权利要求7或8之一的语音识别系统,其特征在于,在所述语音录制设备和所述存储器之间设置有用于由所述语音表达生成语音模型的特征提取设备,并且所述语音模型代替所述语音表达。
CNB2004800078941A 2003-03-25 2004-03-03 依赖于说话人识别语音的方法和语音识别系统 Expired - Fee Related CN100559464C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE10313310.0 2003-03-25
DE10313310A DE10313310A1 (de) 2003-03-25 2003-03-25 Verfahren zur sprecherabhängigen Spracherkennung und Spracherkennungssystem dafür

Publications (2)

Publication Number Publication Date
CN1764943A true CN1764943A (zh) 2006-04-26
CN100559464C CN100559464C (zh) 2009-11-11

Family

ID=33015971

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2004800078941A Expired - Fee Related CN100559464C (zh) 2003-03-25 2004-03-03 依赖于说话人识别语音的方法和语音识别系统

Country Status (8)

Country Link
US (1) US7835913B2 (zh)
EP (1) EP1606794B1 (zh)
JP (2) JP4437119B2 (zh)
KR (1) KR100742408B1 (zh)
CN (1) CN100559464C (zh)
DE (2) DE10313310A1 (zh)
ES (1) ES2278308T3 (zh)
WO (1) WO2004086360A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102347060A (zh) * 2010-08-04 2012-02-08 鸿富锦精密工业(深圳)有限公司 电子记录装置及方法
CN104238379A (zh) * 2013-06-07 2014-12-24 艾默生过程控制流量技术有限公司 变送器、现场仪表以及用于控制变送器的方法

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4639094B2 (ja) * 2005-02-04 2011-02-23 株式会社日立製作所 音声認識システム、音声認識装置及び音声認識プログラム
US7697827B2 (en) * 2005-10-17 2010-04-13 Konicek Jeffrey C User-friendlier interfaces for a camera
DE602007004620D1 (de) 2007-10-01 2010-03-18 Harman Becker Automotive Sys Sprachgesteuerte Einstellung von Fahrzeugteilen
US8374872B2 (en) * 2008-11-04 2013-02-12 Verizon Patent And Licensing Inc. Dynamic update of grammar for interactive voice response
KR101556594B1 (ko) * 2009-01-14 2015-10-01 삼성전자 주식회사 신호처리장치 및 신호처리장치에서의 음성 인식 방법
US8977547B2 (en) * 2009-01-30 2015-03-10 Mitsubishi Electric Corporation Voice recognition system for registration of stable utterances
CN102682767B (zh) * 2011-03-18 2015-04-08 株式公司Cs 一种应用于家庭网络的语音识别方法
US8818810B2 (en) 2011-12-29 2014-08-26 Robert Bosch Gmbh Speaker verification in a health monitoring system
KR101284594B1 (ko) * 2012-10-26 2013-07-10 삼성전자주식회사 영상처리장치 및 그 제어방법, 영상처리 시스템
KR101427528B1 (ko) 2013-06-10 2014-08-07 이장호 외국어 동영상 컨텐츠를 이용한 대화형 외국어 학습 방법 및 그것을 위한 장치
TWI536366B (zh) * 2014-03-18 2016-06-01 財團法人工業技術研究院 新增口說語彙的語音辨識系統與方法及電腦可讀取媒體
KR102371697B1 (ko) * 2015-02-11 2022-03-08 삼성전자주식회사 음성 기능 운용 방법 및 이를 지원하는 전자 장치
DE102018103965A1 (de) * 2018-02-22 2019-08-22 Schuler Pressen Gmbh Verfahren zur Mensch-Maschine-Kommunikation mittels einer Mensch-Maschine-Schnittstelle und Vorrichtung hierfür
RU2744063C1 (ru) 2018-12-18 2021-03-02 Общество С Ограниченной Ответственностью "Яндекс" Способ и система определения говорящего пользователя управляемого голосом устройства

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5764800A (en) * 1980-10-09 1982-04-20 Sanyo Electric Co Voice recognizing device
JPS57102699A (en) 1980-12-18 1982-06-25 Matsushita Electric Ind Co Ltd Voice recognizer
JPS584198A (ja) 1981-06-30 1983-01-11 株式会社日立製作所 音声認識装置における標準パタ−ン登録方式
JPS61133996A (ja) * 1984-12-05 1986-06-21 株式会社リコー 音声認識装置
JPS62206596A (ja) * 1986-03-07 1987-09-11 株式会社東芝 音声認識システム
JP2838848B2 (ja) * 1989-02-10 1998-12-16 株式会社リコー 標準パターン登録方式
JPH07109560B2 (ja) * 1990-11-30 1995-11-22 富士通テン株式会社 音声認識装置
JP3314481B2 (ja) * 1993-10-12 2002-08-12 松下電器産業株式会社 構内交換電話装置
JPH0749697A (ja) * 1994-06-03 1995-02-21 Fujitsu Ten Ltd 音声認識装置
US5774841A (en) * 1995-09-20 1998-06-30 The United States Of America As Represented By The Adminstrator Of The National Aeronautics And Space Administration Real-time reconfigurable adaptive speech recognition command and control apparatus and method
US5852801A (en) * 1995-10-04 1998-12-22 Apple Computer, Inc. Method and apparatus for automatically invoking a new word module for unrecognized user input
US5719921A (en) * 1996-02-29 1998-02-17 Nynex Science & Technology Methods and apparatus for activating telephone services in response to speech
US5832429A (en) * 1996-09-11 1998-11-03 Texas Instruments Incorporated Method and system for enrolling addresses in a speech recognition database
US6295391B1 (en) * 1998-02-19 2001-09-25 Hewlett-Packard Company Automatic data routing via voice command annotation
DE19825760A1 (de) * 1998-06-09 1999-12-16 Nokia Mobile Phones Ltd Verfahren zum Zuweisen einer auswählbaren Möglichkeit zu einem Stellmittel
JP2000029585A (ja) * 1998-07-08 2000-01-28 Canon Inc 音声コマンド認識画像処理装置
US6185530B1 (en) * 1998-08-14 2001-02-06 International Business Machines Corporation Apparatus and methods for identifying potential acoustic confusibility among words in a speech recognition system
US6208972B1 (en) * 1998-12-23 2001-03-27 Richard Grant Method for integrating computer processes with an interface controlled by voice actuated grammars
US6233560B1 (en) * 1998-12-16 2001-05-15 International Business Machines Corporation Method and apparatus for presenting proximal feedback in voice command systems
JP2000259172A (ja) 1999-03-11 2000-09-22 Canon Inc 音声認識装置と音声データの認識方法
US6487530B1 (en) * 1999-03-30 2002-11-26 Nortel Networks Limited Method for recognizing non-standard and standard speech by speaker independent and speaker dependent word models
US6327566B1 (en) * 1999-06-16 2001-12-04 International Business Machines Corporation Method and apparatus for correcting misinterpreted voice commands in a speech recognition system
JP4314680B2 (ja) * 1999-07-27 2009-08-19 ソニー株式会社 音声認識制御システム及び音声認識制御方法
DE19942869A1 (de) 1999-09-08 2001-03-15 Volkswagen Ag Verfahren und Einrichtung zum Betrieb einer sprachgesteuerten Einrichtung bei Kraftfahrzeugen
KR100633228B1 (ko) * 1999-12-31 2006-10-11 주식회사 케이티 가우시안 확률밀도 표현 방법 및 그를 얻기 위한 음성인식 훈련 방법
US6587824B1 (en) * 2000-05-04 2003-07-01 Visteon Global Technologies, Inc. Selective speaker adaptation for an in-vehicle speech recognition system
DE10122828A1 (de) * 2001-05-11 2002-11-14 Philips Corp Intellectual Pty Verfahren zum Training oder zur Adaption eines Spracherkenners
JP2003241790A (ja) * 2002-02-13 2003-08-29 Internatl Business Mach Corp <Ibm> 音声コマンド処理システム、コンピュータ装置、音声コマンド処理方法およびプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102347060A (zh) * 2010-08-04 2012-02-08 鸿富锦精密工业(深圳)有限公司 电子记录装置及方法
CN104238379A (zh) * 2013-06-07 2014-12-24 艾默生过程控制流量技术有限公司 变送器、现场仪表以及用于控制变送器的方法

Also Published As

Publication number Publication date
KR20060014369A (ko) 2006-02-15
ES2278308T3 (es) 2007-08-01
KR100742408B1 (ko) 2007-07-24
EP1606794A1 (de) 2005-12-21
JP4437119B2 (ja) 2010-03-24
DE502004002300D1 (de) 2007-01-25
US20070100632A1 (en) 2007-05-03
DE10313310A1 (de) 2004-10-21
US7835913B2 (en) 2010-11-16
JP2006514753A (ja) 2006-05-11
EP1606794B1 (de) 2006-12-13
WO2004086360A1 (de) 2004-10-07
JP2009211103A (ja) 2009-09-17
CN100559464C (zh) 2009-11-11

Similar Documents

Publication Publication Date Title
CN1764943A (zh) 依赖于说话人识别语音的方法和语音识别系统
EP2176858B1 (de) Verfahren zur spracherkennung
DE10040214B4 (de) Verfahren und System zur automatischen Erkennung einer Aktualisierung eines Sprachmodells in einem Spracherkennungssystem
US5839107A (en) Method and apparatus for automatically generating a speech recognition vocabulary from a white pages listing
US6356869B1 (en) Method and apparatus for discourse management
EP1611568B1 (de) Dreistufige einzelworterkennung
CN101231692A (zh) 通过指纹特征值调整的学习型智能指纹识别比对方法
CN101231691A (zh) 通过指纹数据数量调整的学习型智能指纹识别比对方法
CN102770910B (zh) 声音识别装置
DE102007015497A1 (de) Spracherkennungsvorrichtung und Spracherkennungsprogramm
CN1639768B (zh) 自动语音识别方法及装置
CN104299623A (zh) 语音应用中用于自动确认和消歧模块的方法和系统
CN103811000A (zh) 语音识别系统及方法
JP5454469B2 (ja) 音声認識辞書作成支援装置,処理プログラム,および処理方法
DE102005030965B4 (de) Erweiterung des dynamischen Vokabulars eines Spracherkennungssystems um weitere Voiceenrollments
US7587322B2 (en) Robust speech recognition with data bank accession organized by semantic attribute
CN105719650A (zh) 一种语音识别的方法及系统
DE10122087C1 (de) Verfahren zum Training und Betrieb eines Spracherkenners, Spracherkenner und Spracherkenner-Trainingssystem
EP2058799B1 (en) Method for preparing data for speech recognition and speech recognition system
DE10244722A1 (de) Verfahren und Vorrichtung zum rechnergestützten Vergleich einer ersten Folge lautsprachlicher Einheiten mit einer zweiten Folge lautsprachlicher Einheiten, Spracherkennungseinrichtung und Sprachsyntheseeinrichtung
DE10017717B4 (de) Spracheingabe gesteuertes Steuergerät
DE10244169A1 (de) Spracherkennungseinrichtung, Steuereinrichtung und Verfahren zum rechnergestützten Ergänzen eines elektronischen Wörterbuches für eine Spracherkennungseinrichtung
WO2001037261A1 (en) Coding and training of the vocabulary for speech recognition

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20091111

Termination date: 20200303

CF01 Termination of patent right due to non-payment of annual fee