JP4950024B2 - 会話システムおよび会話ソフトウェア - Google Patents
会話システムおよび会話ソフトウェア Download PDFInfo
- Publication number
- JP4950024B2 JP4950024B2 JP2007505922A JP2007505922A JP4950024B2 JP 4950024 B2 JP4950024 B2 JP 4950024B2 JP 2007505922 A JP2007505922 A JP 2007505922A JP 2007505922 A JP2007505922 A JP 2007505922A JP 4950024 B2 JP4950024 B2 JP 4950024B2
- Authority
- JP
- Japan
- Prior art keywords
- unit
- language
- order
- primary
- output
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000006870 function Effects 0.000 claims description 40
- 238000000034 method Methods 0.000 description 11
- 229910052709 silver Inorganic materials 0.000 description 9
- 239000004332 silver Substances 0.000 description 9
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 7
- 229910052737 gold Inorganic materials 0.000 description 7
- 239000010931 gold Substances 0.000 description 7
- 238000010586 diagram Methods 0.000 description 2
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
Description
=ed(xi,xj)/ln[min(|xi|,|xj|)+1]‥(1)
式(1)において|x|は言語単位xに含まれている音素(または音韻)の数である。音素とは、1つの言語で用いられる音を弁別機能の見地から規定された最小単位を意味する。
=W1・c1(yk1)+W2・c2(yk1)+W3・pd(x1,yk1),
scorei+1(yki+1)
=W1・c1(yki+1)+W2・c2(yki+1)+W3・pd(xi,yki+1)
+W4・pd(yki,yki+1) ‥(2)
式(2)において、W1〜W4は重み係数である。c1(yki)は第k種のi次出力言語単位ykiの観念的な認識難易度(なじみやすさ)を表す第1因子である。第1因子としては、i次出力言語単位ykiをキーとしたときのインターネット検索エンジンのヒット数や、主要新聞や放送等のマスメディアにおける出現頻度等が採用される。また、c2(yki)は第k種のi次出力言語単位ykiの音響的な認識難易度(発音一意性、ききわけやすさ)を表す第2因子である。第2因子としては、たとえば所定数(たとえば10)の他の言語単位(同音異義語など)との音響距離の最小平均値が採用される。pd(x,y)は、式(1)で定義される、言語単位xおよびyの音響距離である。
(第1の会話例)
S0: 目的地はどこですか。
(第2の会話例)
S0: Can you tell me the departure
city?
U0: from Austin.
S1: Is the first letter of the city “b” in “bravo”?
U1: No.
S2: Then is the first letter of the city “a” in“alpha”?
U2: Yes.
システム100の発話S0は初期質問に該当する(図2/S1)。
Claims (14)
- ユーザの発話を認識する第1発話部と、発話を出力する第2発話部とを備えている会話システムであって、
前記第1発話部により認識された発話に含まれている1次入力言語単位に音響的に類似する言語単位を第1辞書DBから検索可能であることを要件として、当該1次入力言語単位に関連する複数の言語単位を第2辞書DBから検索して複数の1次出力言語単位として認識する第1処理部と、
前記第1処理部により認識された前記複数の1次出力言語単位のそれぞれの認識難易度を表す因子に基づき、当該複数の1次出力言語単位から1つを選定し、当該選定した1次出力言語単位に基づいてユーザの真意を問う1次質問を生成して前記第2発話部に出力させ、当該1次質問に対する前記ユーザの回答として前記第1発話部により認識された1次回答に基づき、当該ユーザの真意と前記1次入力言語単位との整合および不整合を判別する第2処理部とを備えていることを特徴とする会話システム。 - 請求項1記載の会話システムにおいて、
前記第2処理部が、前記第1処理部により認識された前記複数の1次出力言語単位のそれぞれの観念的な認識難易度もしくは所定範囲における出現頻度を表す第1因子、および音響的な認識難易度もしくは所定数の他の言語単位との音響距離の最低平均値を表す第2因子のうち一方または両方に基づき、前記複数の1次出力言語単位から1つを選定することを特徴とする会話システム。 - 請求項1記載の会話システムにおいて、
前記第2処理部が前記1次入力言語単位と、前記第1処理部により認識された前記複数の1次出力言語単位のそれぞれとの音響距離に基づき、当該複数の1次出力言語単位から1つを選定することを特徴とする会話システム。 - 請求項1記載の会話システムにおいて、
前記第1処理部が、
前記1次入力言語単位とこれに音響的に類似する言語単位との相違部分を含む第1種言語単位と、
当該相違部分の本来の読み方と異なる読み方を表す第2種言語単位と、
他の言語体系において当該相違部分に対応する言語単位の読み方を表す第3種言語単位と、
当該相違部分に含まれる1つの音素を表す第4種言語単位と、
前記1次入力言語単位と概念的に類似する第5種言語単位とのうち、一部または全部を前記1次出力言語単位として認識することを特徴とする会話システム。 - 請求項4記載の会話システムにおいて、
前記第1処理部が、第k種言語単位群(k=1〜5)から複数の言語単位を前記複数の1次出力言語単位として認識することを特徴とする会話システム。 - 請求項1記載の会話システムにおいて、
前記第2処理部により前記ユーザの真意とi次入力言語単位(i=1,2,‥)とが整合していないと判定された場合、
前記第1処理部が、前記i次入力言語単位に音響的に類似する言語単位を前記第1辞書DBから検索してi+1次入力言語単位として認識し、前記i+1次入力言語単位に関連する言語単位を前記第2辞書DBから検索してi+1次出力言語単位として認識し、かつ、
前記第2処理部が、前記第1処理部により認識された前記i+1次出力言語単位に基づき、前記ユーザの真意を問うi+1次質問を生成して前記第2発話部に出力させ、当該i+1次質問に対する前記ユーザの回答として前記第1発話部により認識されたi+1次回答に基づき、当該ユーザの真意と前記i+1次入力言語単位との整合および不整合を判別する特徴とする会話システム。 - 請求項6記載の会話システムにおいて、
前記第1処理部が複数のi+1次出力言語単位を認識し、
前記第2処理部が、前記第1処理部により認識された前記複数のi+1次出力言語単位のそれぞれの認識難易度を表す因子に基づき、当該複数のi+1次出力言語単位から1つを選定し、当該選定したi+1次出力言語単位に基づいて前記i+1次質問を生成することを特徴とする会話システム。 - 請求項7記載の会話システムにおいて、
前記第2処理部が、前記第1処理部により認識された前記複数のi+1次出力言語単位のそれぞれの観念的な認識難易度もしくは所定範囲における出現頻度を表す第1因子、および音響的な認識難易度もしくは所定数の他の言語単位との音響距離の最低平均値を表す第2因子のうち一方または両方に基づき、当該複数のi+1次出力言語単位から1つを選定することを特徴とする会話システム。 - 請求項6記載の会話システムにおいて、
前記第2処理部が前記i次入力言語単位と前記第1処理部により認識された前記複数のi+1次出力言語単位のそれぞれとの音響距離、および前記i+1次入力言語単位と前記複数のi+1次出力言語単位のそれぞれとの音響距離のうち一方または両方に基づき、当該複数のi+1次出力言語単位から1つを選定することを特徴とする会話システム。 - 請求項7記載の会話システムにおいて、
前記第1処理部が、
前記i+1次入力言語単位およびこれに音響的に類似する言語単位の相違部分を含む第1種言語単位と、
当該相違部分の本来の読み方と異なる読み方を表す第2種言語単位と、
他の言語体系において当該相違部分に対応する言語単位の読み方を表す第3種言語単位と、
当該相違部分に含まれる1つの音素を表す第4種言語単位と、
前記i+1次入力言語単位と概念的に類似する第5種言語単位とのうち、一部または全部を2次出力言語単位として認識することを特徴とする会話システム。 - 請求項8記載の会話システムにおいて、
前記第1処理部が、第k種言語単位群(k=1〜5)から複数の言語単位を前記複数のi+1次出力言語単位として認識することを特徴とする会話システム。 - 請求項6記載の会話システムにおいて、
前記第2処理部により前記ユーザの真意とj次入力言語単位(j≧2)とが整合していないと判定された場合、
前記第2処理部が、前記ユーザの再度の発話を促す質問を生成して、これを前記第2発話部に出力させることを特徴とする会話システム。 - ユーザの発話を認識する第1発話機能と、発話を出力する第2発話機能とを有するコンピュータの記憶機能に格納される会話ソフトウェアであって、
前記第1発話機能により認識された発話に含まれている1次入力言語単位に音響的に類似する言語単位を第1辞書DBから検索可能であることを要件として、当該1次入力言語単位に関連する複数の言語単位を第2辞書DBから検索して複数の1次出力言語単位として認識する第1処理機能と、
前記第1処理機能により認識された前記複数の1次出力言語単位のそれぞれの認識難易度を表す因子に基づき、当該複数の1次出力言語単位から1つを選定し、当該選定した1次出力言語単位に基づいてユーザの真意を問う1次質問を生成して前記第2発話機能によって出力し、当該1次質問に対する前記ユーザの回答として前記第1発話機能により認識された1次回答に基づき、当該ユーザの真意と前記1次入力言語単位との整合および不整合を判別する第2処理機能とを前記コンピュータに付与することを特徴とする会話ソフトウェア。 - 請求項13記載の会話ソフトウェアにおいて、
前記第2処理機能によりユーザの真意とi次入力言語単位(i=1,2,‥)とが整合していないと判定された場合、
前記第1処理機能として、前記i次入力言語単位に音響的に類似する言語単位を前記第1辞書DBから検索してi+1次入力言語単位として認識し、前記i+1次入力言語単位に関連する言語単位を前記第2辞書DBから検索してi+1次出力言語単位として認識する機能と、
前記第2処理機能として、前記第1処理機能により認識されたi+1次出力言語単位に基づき、ユーザの真意を問うi+1次質問を生成して前記第2発話機能によって出力し、当該i+1次質問に対する前記ユーザの回答として前記第1発話機能により認識されたi+1次回答に基づき、当該ユーザの真意と前記i+1次入力言語単位との整合および不整合を判別する機能とを前記コンピュータに対して付与することを特徴とする会話ソフトウェア。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US65721905P | 2005-02-28 | 2005-02-28 | |
US60/657,219 | 2005-02-28 | ||
PCT/JP2006/303613 WO2006093092A1 (ja) | 2005-02-28 | 2006-02-27 | 会話システムおよび会話ソフトウェア |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2006093092A1 JPWO2006093092A1 (ja) | 2008-08-07 |
JP4950024B2 true JP4950024B2 (ja) | 2012-06-13 |
Family
ID=36941121
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007505922A Expired - Fee Related JP4950024B2 (ja) | 2005-02-28 | 2006-02-27 | 会話システムおよび会話ソフトウェア |
Country Status (4)
Country | Link |
---|---|
US (1) | US20080065371A1 (ja) |
JP (1) | JP4950024B2 (ja) |
DE (1) | DE112006000225B4 (ja) |
WO (1) | WO2006093092A1 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8751240B2 (en) * | 2005-05-13 | 2014-06-10 | At&T Intellectual Property Ii, L.P. | Apparatus and method for forming search engine queries based on spoken utterances |
JP2010282083A (ja) * | 2009-06-05 | 2010-12-16 | Nippon Telegr & Teleph Corp <Ntt> | 誤認識訂正装置、方法及びプログラム |
US20110131040A1 (en) * | 2009-12-01 | 2011-06-02 | Honda Motor Co., Ltd | Multi-mode speech recognition |
JP6621613B2 (ja) * | 2015-08-10 | 2019-12-18 | クラリオン株式会社 | 音声操作システム、サーバー装置、車載機器および音声操作方法 |
CN107203265B (zh) * | 2017-05-17 | 2021-01-22 | 广东美的制冷设备有限公司 | 信息交互方法和装置 |
WO2020202314A1 (ja) * | 2019-03-29 | 2020-10-08 | 株式会社Aill | コミュニケーション支援サーバ、コミュニケーション支援システム、コミュニケーション支援方法、及びコミュニケーション支援プログラム |
US20220180069A1 (en) * | 2019-03-29 | 2022-06-09 | Aill Inc. | Communication assistance server, communication assistance system, communication assistance method, and communication assistance program |
KR102479379B1 (ko) * | 2022-09-19 | 2022-12-20 | 헬로칠드런 주식회사 | 현실세계의 다양한 소리, 이미지를 위치 정보 및 시간 정보와 연계한 홍보 이벤트 시스템 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10269226A (ja) * | 1997-03-25 | 1998-10-09 | Nippon Telegr & Teleph Corp <Ntt> | 情報検索後処理方法及び装置 |
JPH11153998A (ja) * | 1997-11-19 | 1999-06-08 | Canon Inc | 音声応答装置及びその方法、コンピュータ可読メモリ |
JP2003228394A (ja) * | 2002-01-31 | 2003-08-15 | Nippon Telegr & Teleph Corp <Ntt> | 音声入力を利用する名詞特定装置およびその方法 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5454063A (en) * | 1993-11-29 | 1995-09-26 | Rossides; Michael T. | Voice input system for data retrieval |
US6070140A (en) * | 1995-06-05 | 2000-05-30 | Tran; Bao Q. | Speech recognizer |
US6064958A (en) * | 1996-09-20 | 2000-05-16 | Nippon Telegraph And Telephone Corporation | Pattern recognition scheme using probabilistic models based on mixtures distribution of discrete distribution |
US5995928A (en) * | 1996-10-02 | 1999-11-30 | Speechworks International, Inc. | Method and apparatus for continuous spelling speech recognition with early identification |
US6021384A (en) * | 1997-10-29 | 2000-02-01 | At&T Corp. | Automatic generation of superwords |
JP3000999B1 (ja) * | 1998-09-08 | 2000-01-17 | セイコーエプソン株式会社 | 音声認識方法および音声認識装置ならびに音声認識処理プログラムを記録した記録媒体 |
US6556970B1 (en) * | 1999-01-28 | 2003-04-29 | Denso Corporation | Apparatus for determining appropriate series of words carrying information to be recognized |
US7013280B2 (en) * | 2001-02-27 | 2006-03-14 | International Business Machines Corporation | Disambiguation method and system for a voice activated directory assistance system |
GB2376335B (en) * | 2001-06-28 | 2003-07-23 | Vox Generation Ltd | Address recognition using an automatic speech recogniser |
US7124085B2 (en) * | 2001-12-13 | 2006-10-17 | Matsushita Electric Industrial Co., Ltd. | Constraint-based speech recognition system and method |
US20050049868A1 (en) * | 2003-08-25 | 2005-03-03 | Bellsouth Intellectual Property Corporation | Speech recognition error identification method and system |
GB0426347D0 (en) * | 2004-12-01 | 2005-01-05 | Ibm | Methods, apparatus and computer programs for automatic speech recognition |
US7827032B2 (en) * | 2005-02-04 | 2010-11-02 | Vocollect, Inc. | Methods and systems for adapting a model for a speech recognition system |
-
2006
- 2006-02-27 US US11/577,566 patent/US20080065371A1/en not_active Abandoned
- 2006-02-27 DE DE112006000225.2T patent/DE112006000225B4/de not_active Expired - Fee Related
- 2006-02-27 WO PCT/JP2006/303613 patent/WO2006093092A1/ja active Application Filing
- 2006-02-27 JP JP2007505922A patent/JP4950024B2/ja not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10269226A (ja) * | 1997-03-25 | 1998-10-09 | Nippon Telegr & Teleph Corp <Ntt> | 情報検索後処理方法及び装置 |
JPH11153998A (ja) * | 1997-11-19 | 1999-06-08 | Canon Inc | 音声応答装置及びその方法、コンピュータ可読メモリ |
JP2003228394A (ja) * | 2002-01-31 | 2003-08-15 | Nippon Telegr & Teleph Corp <Ntt> | 音声入力を利用する名詞特定装置およびその方法 |
Also Published As
Publication number | Publication date |
---|---|
US20080065371A1 (en) | 2008-03-13 |
DE112006000225B4 (de) | 2020-03-26 |
WO2006093092A1 (ja) | 2006-09-08 |
JPWO2006093092A1 (ja) | 2008-08-07 |
DE112006000225T5 (de) | 2007-12-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5377430B2 (ja) | 質問応答データベース拡張装置および質問応答データベース拡張方法 | |
US9911413B1 (en) | Neural latent variable model for spoken language understanding | |
US7529678B2 (en) | Using a spoken utterance for disambiguation of spelling inputs into a speech recognition system | |
US6910012B2 (en) | Method and system for speech recognition using phonetically similar word alternatives | |
US10170107B1 (en) | Extendable label recognition of linguistic input | |
US7996218B2 (en) | User adaptive speech recognition method and apparatus | |
JP4950024B2 (ja) | 会話システムおよび会話ソフトウェア | |
JP2008233229A (ja) | 音声認識システム、および、音声認識プログラム | |
US20130289987A1 (en) | Negative Example (Anti-Word) Based Performance Improvement For Speech Recognition | |
JP4684409B2 (ja) | 音声認識方法及び音声認識装置 | |
JP3660512B2 (ja) | 音声認識方法、その装置及びプログラム記録媒体 | |
CN108806691B (zh) | 语音识别方法及系统 | |
JPH10274996A (ja) | 音声認識装置 | |
JP3444108B2 (ja) | 音声認識装置 | |
KR20130126570A (ko) | 핵심어에서의 음소 오류 결과를 고려한 음향 모델 변별 학습을 위한 장치 및 이를 위한 방법이 기록된 컴퓨터 판독 가능한 기록매체 | |
JP2006084966A (ja) | 発話音声の自動評定装置およびコンピュータプログラム | |
US20020184022A1 (en) | Proofreading assistance techniques for a voice recognition system | |
JP2005275348A (ja) | 音声認識方法、この方法を実施する装置、プログラムおよび記録媒体 | |
EP2608196B1 (en) | Combinatorial method for generating filler words | |
JP3104900B2 (ja) | 音声認識方法 | |
JP2965529B2 (ja) | 音声認識装置 | |
CN111078937A (zh) | 语音信息检索方法、装置、设备和计算机可读存储介质 | |
US8688452B2 (en) | Automatic generation of distractors for special-purpose speech recognition grammars | |
KR100445907B1 (ko) | 음성언어 식별 장치 및 방법 | |
JPH0736481A (ja) | 補完音声認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090113 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111004 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111201 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120306 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120308 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150316 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4950024 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |