JP4684583B2 - 対話装置 - Google Patents
対話装置 Download PDFInfo
- Publication number
- JP4684583B2 JP4684583B2 JP2004202060A JP2004202060A JP4684583B2 JP 4684583 B2 JP4684583 B2 JP 4684583B2 JP 2004202060 A JP2004202060 A JP 2004202060A JP 2004202060 A JP2004202060 A JP 2004202060A JP 4684583 B2 JP4684583 B2 JP 4684583B2
- Authority
- JP
- Japan
- Prior art keywords
- difference
- search
- recognition
- response
- candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Traffic Control Systems (AREA)
- Navigation (AREA)
Description
前記認識候補の各シンボルに対し、全ての認識候補数と当該シンボルの出現した認識候補数に基づく関数で定義された差異情報を付与する差異抽出手段と、
前記認識結果の各認識候補の各シンボルに付与した差異情報に基づき、差異を有する他の認識候補のシンボルと該差異が明確になるよう当該シンボルの文字の表示形態又は音声合成による当該シンボルの音声の韻律を変化させる応答を生成する差異明確化応答生成手段を備える。
実施の形態1.
図1は、実施の形態1に係る対話装置の構成を示すブロック図である。同図において、1001は認識手段、1002は差異抽出手段、1003は差異明確化応答生成手段、1004は応答提示手段を表す。以下、各機能ブロックの動作を説明する。
差異明確化応答生成手段1003は、差異情報に基づき差異が明確になるユーザへの応答を生成する。
応答提示手段1004は、差異明確化応答生成手段1003により生成された応答をユーザへ提示する。
ユーザが目的地を発声により入力すると、次に、認識手段1001はユーザの入力を受理し、解析・認識処理をする(ステップS12)。具体的には、入力音声を時間周期Tでサンプリングし、離散化された時刻tに対する信号系列x[t] を得る。これを10ms単位で特徴ベクトル(例えば12次元のメルケプストラム)に変換する。さらに、得られた特徴ベクトルを対話装置内に設けられた図示しない音響辞書および言語辞書と照合して、照合の尤度が高いn個の認識結果の候補r[1]〜r[n]を得る。認識結果の候補は、それぞれ認識単位であるシンボルの列である。また、認識結果の候補それぞれについて、妥当性を表すスコアs[1]〜s[n] を得る。
d(○○百貨店 ; r[1], r[2]) = 2-1 = 1
d(○×百貨店 ; r[1], r[2]) = 2-1 = 1
d(横浜店 ; r[1], r[2]) = 2-2 = 0
図3は、実施の形態2に係る対話装置の構成を示すブロック図である。同図において、2001は名称データベース、2002は名称データベース2001を検索する検索手段、1002は差異抽出手段、1003は差異明確化応答生成手段、1004は応答提示手段を表す。以下、各機能ブロックの動作を説明する。ただし、既に説明したものは同じ番号を付与して説明を省略する。
d(○○百貨店 ; r[1], r[2]) = 2-2 = 0
d(横浜店 ; r[1], r[2]) = 2-1 = 1
d(川崎 ; r[1], r[2]) = 2-1 = 1
この場合、r[0]=「○○百貨店」が差異抽出手段1002の入力になり、上述の差異指標値付与方法により、シンボルに付与される差異指標値は下記のようになる。この結果、入力した検索キーワードr[0]=「○○百貨店」以外が一層明確になる。
d(○○百貨店 ; r[0, r[1], r[2]) = 3-3 = 0
d(横浜店 ; r[0], r[1], r[2]) = 3-1 = 2
d(川崎 ; r[0], r[1], r[1]) = 3-1 = 2
図6は、実施の形態3に係る対話装置の構成を示すブロック図である。同図において、1001は認識手段、2001は名称データベース、2002は検索手段、1002は差異抽出手段、1003は差異明確化応答生成手段、1004は応答提示手段を表す。各機能ブロックについては、既に説明の通りである。次に、図7に示すフローチャートを参照し、「○○百貨店」という発声が行われた場合を例として動作を説明する。
認識結果の候補は、それぞれ認識単位であるシンボルの列である。また、認識結果の候補それぞれについて、妥当性を表すスコアs[1]〜s[n] を得る。ここでは、2個の認識結果「○○百貨店」「○×百貨店」が得られたとする。
d(○○百貨店 ; r[1], r[2], r[3]) = 3-2 = 1
d(○×百貨店 ; r[1], r[2], r[3]) = 3-1 = 2
d(横浜店 ; r[1], r[2],r [3]) = 3-2 = 1
d(川崎 ; r[1], r[2], r[3]) = 3-1 = 2
図8は、実施の形態4に係る対話装置の構成を示すブロック図である。同図において、1001は認識手段、2001は名称データベース、2002は検索手段、4001は差異抽出手段としての候補対差異抽出手段、4002は候補並べ替え手段、1003は差異明確化応答生成手段、1004は応答提示手段を表す。本実施の形態では、隣接する2候補間の差異が少なくなるように並べ替えて、応答を提示することで、ユーザに差異が明確になる応答を返すことができる。以下、各機能ブロックについて説明する。ただし、既に説明した機能ブロックについては、同一の番号を付し説明を省略する。
d(○○百貨店 ; r[1], r[2]) = 2-1 = 1
d(○×百貨店 ; r[1], r[2]) = 2-1 = 1
d(横浜店 ; r[1], r[2]) = 2-2 = 0
よって、差異距離D(r[1], r[2])=2,差異内容{○○百貨店、○×百貨店}となる。同様に図10に示すように候補対の差異距離および差異内容を求める。
図11は、実施の形態5に係る対話装置の構成を示すブロック図である。同図において、1001は認識手段、2001は階層構造データベース、2002は検索手段、5001は差異抽出手段としての候補対階層構造差異抽出手段、4002は候補並べ替え手段、1003は差異明確化応答生成手段、1004は応答提示手段を表す。本実施の形態では、データベースの検索結果が階層構造を有する場合について、隣接する2候補間の差異が少なくなるように並べ替えて、応答を提示することで、ユーザに差異が明確になる応答を返すことができる。以下、各機能ブロックについて説明する。ただし、既に説明した機能ブロックについては、同一の番号を付し説明を省略する。
Claims (7)
- 入力された音声を認識して、言語単位又は認識単位であるシンボルの系列からなる認識結果の認識候補を複数リスト化した候補リストを出力する認識手段と、
前記認識候補の各シンボルに対し、全ての認識候補数と当該シンボルの出現した認識候補数に基づく関数で定義された差異情報を付与する差異抽出手段と、
前記認識結果の各認識候補の各シンボルに付与した差異情報に基づき、差異を有する他の認識候補のシンボルと該差異が明確になるよう当該シンボルの文字の表示形態又は音声合成による当該シンボルの音声の韻律を変化させる応答を生成する差異明確化応答生成手段と、
生成した応答を提示する応答提示手段を備えることを特徴とする対話装置。 - 認識手段による認識結果の候補リストのシンボルを検索キーワードとし、この検索キーワードを用いて別途設けられたデータベースを検索し検索結果を複数の検索候補として出力する検索手段をさらに備え、
差異抽出手段は請求項1記載の差異抽出手段に替え、前記検索手段の複数の検索候補の各シンボルに対して全ての検索候補数と当該シンボルが出現した検索候補数に基づく関数で定義された差異情報を付与する構成にされたことを特徴とする請求項1記載の対話装置。 - 差異明確化応答生成手段は、請求項1または2の差異明確化応答生成手段に替え、テキスト・画面による応答表現の生成において差異の度合いに応じて認識候補又は検索候補を構成するシンボルごとに表示位置または表示形態の少なくとも一方を変化させて候補間の差異を強調する応答を生成する構成にされたことを特徴とする請求項1または2に記載の対話装置。
- 差異明確化応答生成手段は、請求項1または2の差異明確化応答生成手段に替え、テキスト・画面による応答表現の生成において、差異抽出手段で付与された差異情報により差異がない認識候補又は検索候補を構成する共通のシンボルは2回目の出現以降、同一であることを表す記号へ置換し差異部分を強調する応答を生成する構成にされたことを特徴とする請求項1または2に記載の対話装置。
- 差異明確化応答生成手段は、請求項1または2の差異明確化応答生成手段に替え、音声による応答表現の生成において、差異の度合いに応じて認識候補又は検索候補を構成するシンボルごとに声の高さ・声の大きさ・発話速度・ポーズの少なくとも1つを通常発声と変えて差異を強調する構成にされたことを特徴とする請求項1または2に記載の対話装置。
- 検索手段は入力された検索キーワードが施設名称の通称であるとき、施設名称の正式名称、施設ジャンル、住所の少なくとも1つを含む検索結果の検索候補を出力することを特徴とする請求項2に記載の対話装置。
- 検索手段はデータベースの検索結果の検索候補を所定の観点で区分され、かつ優先順位が定められた複数のフィールドに分類し、応答提示手段は優先順位が高いフィールドの検索結果の検索候補に差異があれば、それよりも低い優先順位のフィールドの差異を提示しないことを特徴とした、請求項2に記載の対話装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004202060A JP4684583B2 (ja) | 2004-07-08 | 2004-07-08 | 対話装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004202060A JP4684583B2 (ja) | 2004-07-08 | 2004-07-08 | 対話装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006023572A JP2006023572A (ja) | 2006-01-26 |
JP4684583B2 true JP4684583B2 (ja) | 2011-05-18 |
Family
ID=35796869
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004202060A Expired - Fee Related JP4684583B2 (ja) | 2004-07-08 | 2004-07-08 | 対話装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4684583B2 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007213112A (ja) * | 2006-02-07 | 2007-08-23 | Oki Electric Ind Co Ltd | データエントリ処理システム |
CN101558443B (zh) | 2006-12-15 | 2012-01-04 | 三菱电机株式会社 | 声音识别装置 |
JP5526396B2 (ja) | 2008-03-11 | 2014-06-18 | クラリオン株式会社 | 情報検索装置、情報検索システム及び情報検索方法 |
JP5004863B2 (ja) * | 2008-04-30 | 2012-08-22 | 三菱電機株式会社 | 音声検索装置および音声検索方法 |
JP2010139826A (ja) * | 2008-12-12 | 2010-06-24 | Toyota Motor Corp | 音声認識システム |
JP6221301B2 (ja) * | 2013-03-28 | 2017-11-01 | 富士通株式会社 | 音声処理装置、音声処理システムおよび音声処理方法 |
JP6427755B2 (ja) * | 2014-02-24 | 2018-11-28 | パナソニックIpマネジメント株式会社 | データ入力装置、データ入力方法、プログラム及び車載機 |
CN108885117A (zh) * | 2016-03-29 | 2018-11-23 | 三菱电机株式会社 | 语音引导装置和语音引导方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04232997A (ja) * | 1990-12-28 | 1992-08-21 | Sharp Corp | 音声認識装置における認識結果表示方式 |
JPH0720979A (ja) * | 1993-07-02 | 1995-01-24 | Mitsubishi Electric Corp | コマンド入力支援システム |
JPH09114491A (ja) * | 1995-10-16 | 1997-05-02 | Sony Corp | 音声認識装置,音声認識方法,ナビゲーション装置,ナビゲート方法及び自動車 |
JPH11242582A (ja) * | 1998-02-25 | 1999-09-07 | Sharp Corp | 文字入力装置及び文字入力プログラムを記録した記録媒体 |
JPH11250077A (ja) * | 1998-02-27 | 1999-09-17 | Minolta Co Ltd | 情報処理装置、情報処理方法及び記録媒体 |
JP2002358309A (ja) * | 2001-06-04 | 2002-12-13 | Hitachi Software Eng Co Ltd | プロファイルデータベース及びプロファイル作成方法 |
JP2003186491A (ja) * | 2001-12-13 | 2003-07-04 | Telecommunication Advancement Organization Of Japan | 電子化テキスト作成支援システム |
-
2004
- 2004-07-08 JP JP2004202060A patent/JP4684583B2/ja not_active Expired - Fee Related
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04232997A (ja) * | 1990-12-28 | 1992-08-21 | Sharp Corp | 音声認識装置における認識結果表示方式 |
JPH0720979A (ja) * | 1993-07-02 | 1995-01-24 | Mitsubishi Electric Corp | コマンド入力支援システム |
JPH09114491A (ja) * | 1995-10-16 | 1997-05-02 | Sony Corp | 音声認識装置,音声認識方法,ナビゲーション装置,ナビゲート方法及び自動車 |
JPH11242582A (ja) * | 1998-02-25 | 1999-09-07 | Sharp Corp | 文字入力装置及び文字入力プログラムを記録した記録媒体 |
JPH11250077A (ja) * | 1998-02-27 | 1999-09-17 | Minolta Co Ltd | 情報処理装置、情報処理方法及び記録媒体 |
JP2002358309A (ja) * | 2001-06-04 | 2002-12-13 | Hitachi Software Eng Co Ltd | プロファイルデータベース及びプロファイル作成方法 |
JP2003186491A (ja) * | 2001-12-13 | 2003-07-04 | Telecommunication Advancement Organization Of Japan | 電子化テキスト作成支援システム |
Also Published As
Publication number | Publication date |
---|---|
JP2006023572A (ja) | 2006-01-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8380505B2 (en) | System for recognizing speech for searching a database | |
KR100679042B1 (ko) | 음성인식 방법 및 장치, 이를 이용한 네비게이션 시스템 | |
US20080162137A1 (en) | Speech recognition apparatus and method | |
US8666743B2 (en) | Speech recognition method for selecting a combination of list elements via a speech input | |
JP3935844B2 (ja) | 入力された音声のトランスクリプションおよび表示 | |
JP5189874B2 (ja) | 多言語の非ネイティブ音声の認識 | |
JP5089955B2 (ja) | 音声対話装置 | |
JP4680714B2 (ja) | 音声認識装置および音声認識方法 | |
JP5073024B2 (ja) | 音声対話装置 | |
JP4634156B2 (ja) | 音声対話方法および音声対話装置 | |
JP4684583B2 (ja) | 対話装置 | |
KR100467590B1 (ko) | 발음 사전 갱신 장치 및 방법 | |
JP4661239B2 (ja) | 音声対話装置及び音声対話方法 | |
JP4600706B2 (ja) | 音声認識装置および音声認識方法、並びに記録媒体 | |
JP5004863B2 (ja) | 音声検索装置および音声検索方法 | |
JP5196114B2 (ja) | 音声認識装置およびプログラム | |
JP3472101B2 (ja) | 音声入力解釈装置及び音声入力解釈方法 | |
JP3663012B2 (ja) | 音声による入力装置 | |
JP3790038B2 (ja) | サブワード型不特定話者音声認識装置 | |
JP2002532763A (ja) | 音声によって動作される自動問合せシステム | |
KR20040008546A (ko) | 연속 음성인식 기기의 오인식 수정 방법 | |
JP4600705B2 (ja) | 音声認識装置および音声認識方法、並びに記録媒体 | |
JP2009146108A (ja) | 音声検索装置 | |
JPS6211732B2 (ja) | ||
JP4696400B2 (ja) | 音声認識装置および音声認識方法、並びにプログラムおよび記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070604 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100414 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100427 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100624 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100727 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100917 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101026 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101208 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110208 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110209 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140218 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4684583 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |