JP4437119B2 - 話者に依存する音声認識方法および音声認識システム - Google Patents
話者に依存する音声認識方法および音声認識システム Download PDFInfo
- Publication number
- JP4437119B2 JP4437119B2 JP2005518261A JP2005518261A JP4437119B2 JP 4437119 B2 JP4437119 B2 JP 4437119B2 JP 2005518261 A JP2005518261 A JP 2005518261A JP 2005518261 A JP2005518261 A JP 2005518261A JP 4437119 B2 JP4437119 B2 JP 4437119B2
- Authority
- JP
- Japan
- Prior art keywords
- speech
- recognition system
- utterance
- pattern
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
- G10L2015/0631—Creating reference templates; Clustering
Description
Claims (6)
- ユーザの発話がトレーニングされ、トレーニングされた発話に命令が割り当てられる形式の、音声認識システムを用いた話者に依存する音声認識方法において、
該音声認識システム内で類似した音声パターンを見つけ出せず、または十分な類似度をもつ音声パターンを見つけ出せず、該音声認識システムによって発話が認識されないとき、該音声認識システムは、該発話を新しい命令に即座に割り当てることをユーザに提示し、該新しい命令に即座に割り当てることには、認識されなかった発話に対応する新たな発話をユーザに発生させて該発話を記録するステップと、記録された該発話から新たな音声パターンを生成するステップと、該新たな音声パターンと認識されなかった発話から形成されていた音声パターンとの類似性をチェックするステップと、類似性があれば、前記認識されなかった発話から形成されていた音声パターンと前記新たな音声パターンとを結合したものを、認識されなかった発話に新たな命令として割り当てるステップが含まれていることを特徴とする、
音声認識方法。 - 請求項1記載の方法において、
まだいかなる発話にも新しい命令が割り当てられていないとき、音声認識システムは該システムの起動後、新しい命令のトレーニングの実施を提示することを特徴とする方法。 - 請求項1記載の方法において、
前記音声認識システムが発話を認識するために、該音声認識システムは前記発話から、音声特徴の組み合わせから成る音声パターンを生成することを特徴とする方法。 - 音声認識システムのユーザが発話したときに該発話を記録するための音声記録装置と、
前記発話に割り当てられる命令を見つけ出すために発話と命令との対応づけが格納されているデータベースへのアクセスを行うサーチマシンと、
前記発話に基づき見つけ出された命令を実行可能な命令に変換する変換装置が設けられている、
話者に依存して音声を認識するための音声認識システムにおいて、
該音声認識システム内で類似した音声パターンを見つけ出せず、または十分な類似度をもつ音声パターンを見つけ出せず、該音声認識システムによって発話が認識されないとき、該音声認識システムは、該発話を新しい命令に即座に割り当てることをユーザに提示し、
該新しい命令に即座に割り当てる際に音声認識システムは、認識されなかった発話に対応する新たな発話をユーザに発生させて該発話を記録し、記録された発話から新たな音声パターンを生成し、該新たな音声パターンと認識されなかった発話から形成されていた音声パターンとの類似性をチェックし、類似性があれば前記認識されなかった発話から形成されていた音声パターンと前記新たな音声パターンとの結合により形成された音声パターンに新たな命令を割り当てることを特徴とする、
音声認識システム。 - 請求項4記載の音声認識システムにおいて、
前記音声記録装置は記憶装置と接続されており、音声認識システムのユーザが発話したとき前記記憶装置内に該発話が一時的に記憶され、該記憶装置はデータベースへ前記発話を読み込ませるためにデータベースと接続されていることを特徴とする音声認識システム。 - 請求項5記載の音声認識システムにおいて、
音声認識システムのユーザが発話したとき、該発話から音声パターンを生成するため、前記音声記録装置と前記記憶装置との間に特徴抽出装置が設けられており、該特徴抽出装置は前記発話を音声パターンと置き換えることを特徴とする音声認識システム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE10313310A DE10313310A1 (de) | 2003-03-25 | 2003-03-25 | Verfahren zur sprecherabhängigen Spracherkennung und Spracherkennungssystem dafür |
PCT/EP2004/002137 WO2004086360A1 (de) | 2003-03-25 | 2004-03-03 | Verfahren zur sprecherabhängigen spracherkennung und spracherkennungssystem |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009149711A Division JP2009211103A (ja) | 2003-03-25 | 2009-06-24 | 話者に依存して音声を認識する方法および音声認識システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006514753A JP2006514753A (ja) | 2006-05-11 |
JP4437119B2 true JP4437119B2 (ja) | 2010-03-24 |
Family
ID=33015971
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005518261A Expired - Fee Related JP4437119B2 (ja) | 2003-03-25 | 2004-03-03 | 話者に依存する音声認識方法および音声認識システム |
JP2009149711A Pending JP2009211103A (ja) | 2003-03-25 | 2009-06-24 | 話者に依存して音声を認識する方法および音声認識システム |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009149711A Pending JP2009211103A (ja) | 2003-03-25 | 2009-06-24 | 話者に依存して音声を認識する方法および音声認識システム |
Country Status (8)
Country | Link |
---|---|
US (1) | US7835913B2 (ja) |
EP (1) | EP1606794B1 (ja) |
JP (2) | JP4437119B2 (ja) |
KR (1) | KR100742408B1 (ja) |
CN (1) | CN100559464C (ja) |
DE (2) | DE10313310A1 (ja) |
ES (1) | ES2278308T3 (ja) |
WO (1) | WO2004086360A1 (ja) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4639094B2 (ja) * | 2005-02-04 | 2011-02-23 | 株式会社日立製作所 | 音声認識システム、音声認識装置及び音声認識プログラム |
US7697827B2 (en) | 2005-10-17 | 2010-04-13 | Konicek Jeffrey C | User-friendlier interfaces for a camera |
DE602007004620D1 (de) | 2007-10-01 | 2010-03-18 | Harman Becker Automotive Sys | Sprachgesteuerte Einstellung von Fahrzeugteilen |
US8374872B2 (en) * | 2008-11-04 | 2013-02-12 | Verizon Patent And Licensing Inc. | Dynamic update of grammar for interactive voice response |
KR101556594B1 (ko) * | 2009-01-14 | 2015-10-01 | 삼성전자 주식회사 | 신호처리장치 및 신호처리장치에서의 음성 인식 방법 |
CN102301419B (zh) * | 2009-01-30 | 2013-06-12 | 三菱电机株式会社 | 声音识别装置 |
CN102347060A (zh) * | 2010-08-04 | 2012-02-08 | 鸿富锦精密工业(深圳)有限公司 | 电子记录装置及方法 |
CN102682767B (zh) * | 2011-03-18 | 2015-04-08 | 株式公司Cs | 一种应用于家庭网络的语音识别方法 |
US8818810B2 (en) | 2011-12-29 | 2014-08-26 | Robert Bosch Gmbh | Speaker verification in a health monitoring system |
KR101284594B1 (ko) * | 2012-10-26 | 2013-07-10 | 삼성전자주식회사 | 영상처리장치 및 그 제어방법, 영상처리 시스템 |
CN104238379B (zh) * | 2013-06-07 | 2017-07-28 | 艾默生过程控制流量技术有限公司 | 变送器、现场仪表以及用于控制变送器的方法 |
KR101427528B1 (ko) | 2013-06-10 | 2014-08-07 | 이장호 | 외국어 동영상 컨텐츠를 이용한 대화형 외국어 학습 방법 및 그것을 위한 장치 |
TWI536366B (zh) * | 2014-03-18 | 2016-06-01 | 財團法人工業技術研究院 | 新增口說語彙的語音辨識系統與方法及電腦可讀取媒體 |
KR102371697B1 (ko) * | 2015-02-11 | 2022-03-08 | 삼성전자주식회사 | 음성 기능 운용 방법 및 이를 지원하는 전자 장치 |
DE102018103965A1 (de) * | 2018-02-22 | 2019-08-22 | Schuler Pressen Gmbh | Verfahren zur Mensch-Maschine-Kommunikation mittels einer Mensch-Maschine-Schnittstelle und Vorrichtung hierfür |
RU2744063C1 (ru) * | 2018-12-18 | 2021-03-02 | Общество С Ограниченной Ответственностью "Яндекс" | Способ и система определения говорящего пользователя управляемого голосом устройства |
Family Cites Families (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5764800A (en) * | 1980-10-09 | 1982-04-20 | Sanyo Electric Co | Voice recognizing device |
JPS57102699A (en) | 1980-12-18 | 1982-06-25 | Matsushita Electric Ind Co Ltd | Voice recognizer |
JPS584198A (ja) | 1981-06-30 | 1983-01-11 | 株式会社日立製作所 | 音声認識装置における標準パタ−ン登録方式 |
JPS61133996A (ja) * | 1984-12-05 | 1986-06-21 | 株式会社リコー | 音声認識装置 |
JPS62206596A (ja) * | 1986-03-07 | 1987-09-11 | 株式会社東芝 | 音声認識システム |
JP2838848B2 (ja) * | 1989-02-10 | 1998-12-16 | 株式会社リコー | 標準パターン登録方式 |
JPH07109560B2 (ja) * | 1990-11-30 | 1995-11-22 | 富士通テン株式会社 | 音声認識装置 |
JP3314481B2 (ja) * | 1993-10-12 | 2002-08-12 | 松下電器産業株式会社 | 構内交換電話装置 |
JPH0749697A (ja) * | 1994-06-03 | 1995-02-21 | Fujitsu Ten Ltd | 音声認識装置 |
US5774841A (en) | 1995-09-20 | 1998-06-30 | The United States Of America As Represented By The Adminstrator Of The National Aeronautics And Space Administration | Real-time reconfigurable adaptive speech recognition command and control apparatus and method |
US5852801A (en) * | 1995-10-04 | 1998-12-22 | Apple Computer, Inc. | Method and apparatus for automatically invoking a new word module for unrecognized user input |
US5719921A (en) * | 1996-02-29 | 1998-02-17 | Nynex Science & Technology | Methods and apparatus for activating telephone services in response to speech |
US5832429A (en) * | 1996-09-11 | 1998-11-03 | Texas Instruments Incorporated | Method and system for enrolling addresses in a speech recognition database |
US6295391B1 (en) * | 1998-02-19 | 2001-09-25 | Hewlett-Packard Company | Automatic data routing via voice command annotation |
DE19825760A1 (de) * | 1998-06-09 | 1999-12-16 | Nokia Mobile Phones Ltd | Verfahren zum Zuweisen einer auswählbaren Möglichkeit zu einem Stellmittel |
JP2000029585A (ja) * | 1998-07-08 | 2000-01-28 | Canon Inc | 音声コマンド認識画像処理装置 |
US6185530B1 (en) * | 1998-08-14 | 2001-02-06 | International Business Machines Corporation | Apparatus and methods for identifying potential acoustic confusibility among words in a speech recognition system |
US6208972B1 (en) * | 1998-12-23 | 2001-03-27 | Richard Grant | Method for integrating computer processes with an interface controlled by voice actuated grammars |
US6233560B1 (en) * | 1998-12-16 | 2001-05-15 | International Business Machines Corporation | Method and apparatus for presenting proximal feedback in voice command systems |
JP2000259172A (ja) | 1999-03-11 | 2000-09-22 | Canon Inc | 音声認識装置と音声データの認識方法 |
US6487530B1 (en) * | 1999-03-30 | 2002-11-26 | Nortel Networks Limited | Method for recognizing non-standard and standard speech by speaker independent and speaker dependent word models |
US6327566B1 (en) * | 1999-06-16 | 2001-12-04 | International Business Machines Corporation | Method and apparatus for correcting misinterpreted voice commands in a speech recognition system |
JP4314680B2 (ja) * | 1999-07-27 | 2009-08-19 | ソニー株式会社 | 音声認識制御システム及び音声認識制御方法 |
DE19942869A1 (de) | 1999-09-08 | 2001-03-15 | Volkswagen Ag | Verfahren und Einrichtung zum Betrieb einer sprachgesteuerten Einrichtung bei Kraftfahrzeugen |
KR100633228B1 (ko) * | 1999-12-31 | 2006-10-11 | 주식회사 케이티 | 가우시안 확률밀도 표현 방법 및 그를 얻기 위한 음성인식 훈련 방법 |
US6587824B1 (en) * | 2000-05-04 | 2003-07-01 | Visteon Global Technologies, Inc. | Selective speaker adaptation for an in-vehicle speech recognition system |
DE10122828A1 (de) * | 2001-05-11 | 2002-11-14 | Philips Corp Intellectual Pty | Verfahren zum Training oder zur Adaption eines Spracherkenners |
JP2003241790A (ja) * | 2002-02-13 | 2003-08-29 | Internatl Business Mach Corp <Ibm> | 音声コマンド処理システム、コンピュータ装置、音声コマンド処理方法およびプログラム |
-
2003
- 2003-03-25 DE DE10313310A patent/DE10313310A1/de not_active Ceased
-
2004
- 2004-03-03 US US10/550,481 patent/US7835913B2/en not_active Expired - Fee Related
- 2004-03-03 ES ES04716578T patent/ES2278308T3/es not_active Expired - Lifetime
- 2004-03-03 DE DE502004002300T patent/DE502004002300D1/de not_active Expired - Lifetime
- 2004-03-03 KR KR1020057017953A patent/KR100742408B1/ko not_active IP Right Cessation
- 2004-03-03 WO PCT/EP2004/002137 patent/WO2004086360A1/de active IP Right Grant
- 2004-03-03 EP EP04716578A patent/EP1606794B1/de not_active Expired - Fee Related
- 2004-03-03 CN CNB2004800078941A patent/CN100559464C/zh not_active Expired - Fee Related
- 2004-03-03 JP JP2005518261A patent/JP4437119B2/ja not_active Expired - Fee Related
-
2009
- 2009-06-24 JP JP2009149711A patent/JP2009211103A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
CN1764943A (zh) | 2006-04-26 |
EP1606794B1 (de) | 2006-12-13 |
KR20060014369A (ko) | 2006-02-15 |
JP2006514753A (ja) | 2006-05-11 |
DE10313310A1 (de) | 2004-10-21 |
US7835913B2 (en) | 2010-11-16 |
JP2009211103A (ja) | 2009-09-17 |
DE502004002300D1 (de) | 2007-01-25 |
WO2004086360A1 (de) | 2004-10-07 |
CN100559464C (zh) | 2009-11-11 |
US20070100632A1 (en) | 2007-05-03 |
KR100742408B1 (ko) | 2007-07-24 |
ES2278308T3 (es) | 2007-08-01 |
EP1606794A1 (de) | 2005-12-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2009211103A (ja) | 話者に依存して音声を認識する方法および音声認識システム | |
US8428944B2 (en) | System and method for performing compensated speech recognition | |
JP5233989B2 (ja) | 音声認識システム、音声認識方法、および音声認識処理プログラム | |
JP2002304190A (ja) | 発音変化形生成方法及び音声認識方法 | |
EP1525577B1 (en) | Method for automatic speech recognition | |
JP2004101901A (ja) | 音声対話装置及び音声対話プログラム | |
CN111192585A (zh) | 一种音乐播放控制系统、控制方法及智能家电 | |
CN105047196A (zh) | 语音识别系统中的语音假象补偿系统和方法 | |
US20170270923A1 (en) | Voice processing device and voice processing method | |
CN1217314C (zh) | 由有限的用户圈用语音控制启动可在设备内执行的动作的方法 | |
WO2018088534A1 (ja) | 電子機器、電子機器の制御方法及び電子機器の制御プログラム | |
US7587322B2 (en) | Robust speech recognition with data bank accession organized by semantic attribute | |
KR101945190B1 (ko) | 음성인식 작동 시스템 및 방법 | |
KR102417899B1 (ko) | 차량의 음성인식 시스템 및 방법 | |
WO2000022609A1 (en) | Speech recognition and control system and telephone | |
JP5519126B2 (ja) | 音声認識装置及び音声認識方法 | |
JP6811865B2 (ja) | 音声認識装置および音声認識方法 | |
JP2003177788A (ja) | 音声対話システムおよびその方法 | |
KR100994930B1 (ko) | 음성인식 기반 홈네트워크 시스템의 적응화 음성 인식 제어방법 및 그 시스템 | |
KR102279319B1 (ko) | 음성분석장치 및 음성분석장치의 동작 방법 | |
KR20170135098A (ko) | 모바일용 녹음장치 | |
JP2020085942A (ja) | 情報処理装置、情報処理方法、およびプログラム | |
US20060080097A1 (en) | Voice acknowledgement independent of a speaker while dialling by name | |
JPH07210193A (ja) | 音声対話装置 | |
JP2020034832A (ja) | 辞書生成装置、音声認識システムおよび辞書生成方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20071109 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20080206 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20080214 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20080310 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20080317 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20080407 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20080414 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080508 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080730 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20081028 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20081105 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20081128 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20081205 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20081225 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20090227 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090624 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20090706 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090819 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090825 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20091204 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100104 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4437119 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130108 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130108 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |