JP5201973B2 - 音声検索装置 - Google Patents
音声検索装置 Download PDFInfo
- Publication number
- JP5201973B2 JP5201973B2 JP2007321887A JP2007321887A JP5201973B2 JP 5201973 B2 JP5201973 B2 JP 5201973B2 JP 2007321887 A JP2007321887 A JP 2007321887A JP 2007321887 A JP2007321887 A JP 2007321887A JP 5201973 B2 JP5201973 B2 JP 5201973B2
- Authority
- JP
- Japan
- Prior art keywords
- search
- candidate
- keyword
- voice
- speech recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
また、検索対象の重要度は特に考慮していないため、重要度の低い検索対象を追加していくに従い著名な検索対象を検索しにくくなる問題がある。
複数の単語が組合わされてなる検索対象を検索するために各検索単語の音声による発話を認識する音声認識手段と、
前記音声認識手段の音声認識結果がN個であり、そのN個のなかの認識結果に含まれる重複する単語がR個であるときの重複度をR/Nとしたとき、重複度が所定のしきい値より小さい前記音声認識結果を競合キーワードとして抽出する競合キーワード抽出手段と、
前記各検索単語の前記音声認識手段による各認識結果を用い、それぞれにあいまい性を考慮して検索データベースの検索を行うデータベース検索手段と、
前記競合キーワードと組合わされる前記検索単語の前記音声認識手段の認識結果によるデータベース検索手段の検索結果を所定基準で集約する候補集約手段と、
前記候補集約手段の処理結果である集約されたキーワードとその他の検索結果を提示する候補提示絞込み手段を備える。
図1は、実施の形態1に係る音声検索装置の構成を示すブロック図である。図に示す音声検索装置は、音声認識手段101、音響標準パタン102、認識用単語辞書103、データベース検索手段104、検索用データベース105、候補集約手段106、集約キーワードリスト107、候補提示絞り込み手段108からなる。
ここでは、部分一致に基づく施設名称の検索を例について具体的な動作を説明する。また、説明を単純にするため、ユーザは「ワタリ」と1単語発声し、「ワタリ」を含む施設名を検索することを意図したものとする。
検索用データベース105について、予め単語と音節に区切られた索引が作成されており、任意の単語に対して検索が可能であるものとする。
まず、音声認識手段101は、入力された音声を認識してデータベース検索手段104への入力となる認識結果を出力する。例の場合、「ワタリ」という発話に対する音声認識結果が取得される。
次に、データベース検索手段104は、検索用データベース105を参照し検索結果を出力する。
このとき、発話「ワタリ」に対して、音声認識のあいまい性を考慮した結果、「ワタミ」「タタミ」「ワタリ」というキーワードを含む検索結果が取得されたものとする。検索結果と検索キーワードの対応付けは前処理あるいは後処理により対応付けしておく。ここでは、「ワタミ」がチェーン店名称のため多数の候補がヒットし、対応する検索結果がそれぞれ50個、3個、5個の候補があるものとする。
次に、候補集約手段106は、検索結果候補数をしきい値(TH1)と比較し、大きい場合ステップS104へ進む。そうでない場合はステップS107へ進む。
候補集約手段106は、検索結果候補数がしきい値より大きい場合、検索結果の集約を試みる。具体的には、集約キーワードリスト107に記載されているキーワードについてキーワードKを含む検索結果の最大数N(K)を算出する。
算出されたN(K)をしきい値(TH2)と比較し、大きい場合ステップS106へ進む。そうでない場合、ステップS107へ進む。
該当条件のキーワードを含む検索結果を集約し、提示する候補リストを更新する。また、該当キーワードを選択した場合のための絞込み用候補リストを作成する。
例の場合、「ワタミ」という一つの提示語彙とするとともに、「ワタミ」を選択した場合の絞込み候補リスト(50個)を作成する。
候補提示絞込み手段108は候補リストをユーザへ提示する。このとき、集約されたキーワードは、さらに絞込み可能であり色や字体など、提示形態を変えたり説明を加えたりすることによってユーザへ説明しても良い。
図8は、6個の候補を画面提示した場合の例である。集約したキーワード「ワタミ」は太字として絞込み件数を提示している。「ワタリ」を含む候補は集約前は54位以降であり同時提示候補数が6個の場合、該当する候補は9画面目以降の提示となるが、集約した場合1画面目の5番目から候補の一部を提示可能となる。
ユーザが集約した候補を選択した場合、ステップS109に進む。そうでない場合、候補選択は完了し処理を終了する。
ユーザが集約した候補を選択した場合は、選択した集約候補のリストを提示する。
集約キーワードリストは任意の語彙に選択可能である。例えば、出現しうる全ての語彙を指定してもよいし、単独で出現可能な自立語を対象としても良い。また、確実性を高めるためにキーワードの長さを制限して抽出しても良い。要は所定基準に従い作成すれば良い。
また、候補集約手段106は所定の基準を保持し、集約キーワードリスト107を参照せずに検索結果を所定の基準に従って集約処理をしても良い。
上記の例では、絞込みキーワード選択時、候補提示絞込み手段が集約したキーワードのリストを提示する処理となっていた。集約したキーワードに対する検索結果が定義できている場合、従来どおり検索結果提示手段により候補を提示することも可能である。
また、上記の動作例では、集約処理を1度のみ適用していたが絞込み結果を再度別キーワードで集約するようにすれば複数回の階層的な絞込みを行うことも可能である。
図9は、実施の形態2に係る音声検索装置の構成を示すブロック図である。図に示す音声検索装置は、音声認識手段101、音響標準パタン102、認識用単語辞書103、データベース検索手段104、検索用データベース105、候補集約手段106、集約属性リスト201、候補提示絞り込み手段108からなる。
以下、実施の形態2に係る音声検索装置の構成および動作を説明する。ただし、既に説明済みの機能ブロックについては同一の符号を付し説明を省略する。
ここでは、ユーザは「ワタリ」と発声し、「ワタリ」を含む施設名を検索することを意図したとする。
まず、音声認識手段101は、入力された音声を認識してデータベース検索手段104への入力となる認識結果を出力する。この例の場合、「ワタリ」という発話に対する音声認識結果が取得される。
次に、データベース検索手段104は、検索用データベース105を参照し検索結果を出力する。
このとき、発話「ワタリ」に対して、音声認識のあいまい性を考慮した結果、多数の候補が検索される。この中には属性「チェーン店」に対応する属性値が「ワタミ」であるものが50件含まれているものとする。
次に、候補集約手段105は、検索結果候補数をしきい値(TH1)と比較し、大きい場合ステップS204へ進む。そうでない場合はステップS207へ進む。
候補集約手段106は、検索結果候補数がしきい値より大きい場合、検索結果の集約を試みる。具体的には、集約属性リスト201に記載されている属性・属性値の組合せについて属性条件Cに合致する検索結果の最大数N(C)を算出する。
算出されたN(C)としきい値(TH2)を比較し、大きい場合ステップS206へ進む。そうでない場合、ステップS207へ進む。
該当条件の属性・属性値の組合せを含む検索結果を集約し、提示する候補リストを更新する。また、該当キーワードを選択した場合のための絞込み用候補リストを作成する。
例の場合、「(チェーン店)ワタミ」という一つの提示語彙に集約するとともに、「ワタミ」を選択した場合の絞込み候補リスト(50個)を作成する。
候補提示絞込み手段108は候補リストをユーザへ提示する。このとき、集約されたキーワードは、さらに絞込み可能であり色や字体など、提示形態を変えたり説明を加えたりすることによってユーザへ説明しても良い。
ユーザが集約した候補を選択した場合、ステップS209に進む。そうでない場合、候補選択は完了し処理を終了する。
ユーザが集約した候補を選択した場合は、選択した集約候補のリストを提示する。
集約キーワードリストは任意の語彙に選択可能である。例えば、出現しうる全ての語彙を指定してもよいし、単独で出現可能な自立語を対象としても良い。また、確実性を高めるためにキーワードの長さを制限して抽出しても良い。
上記の例では、絞込みキーワード選択時、候補提示絞込み手段が集約したキーワードのリストを提示する処理となっていたが、別の絞込み手段をとることも可能である。
また、上記の動作例では、集約処理を1度のみ適用していたが絞込み結果を再度別キーワードで集約するようにすれば複数回の階層的な絞込みを行うことも可能である。
図12は、実施の形態3に係る音声検索装置の構成を示すブロック図である。図に示す音声検索装置は、音声認識手段101、音響標準パタン102、認識用単語辞書103、データベース検索手段104、検索用データベース105、候補集約手段106、集約キーワードリスト107、候補提示絞り込み手段108、競合キーワード抽出手段301からなる。
また、実施の形態1と異なる本実施の形態3に特徴的な部分は、競合キーワード抽出手段301をさらに備え、音声認識結果のあいまい性として競合するキーワードに限定して候補を集約して提示し、集約した候補についてさらに集約して提示ができるようにした点である。
以下、実施の形態3に係る音声検索装置の構成および動作を説明する。ただし、既に説明済みの機能ブロックについては同一の符号を付し説明を省略する。
例えば「ワタリ ヨコハマ」「ワタミ ヨコハマ」「タタミ ヨコハマ」の認識結果があるとき、「ワタリ」「ワタミ」「タタミ」の重複度は1/3、「ヨコハマ」の重複度は1となる。
ここでは、部分一致に基づく施設名称の検索を例について具体的な動作を説明する。また、説明を単純にするため、ユーザは「ヨコハマ ワタリ」と2単語発声し、「ヨコハマ」「ワタリ」を含む施設名を検索することを意図したとする。
まず、音声認識手段101は、入力された音声を認識して検索手段への入力となる1つ以上の認識結果を出力する。この結果、「ヨコハマ ワタリ」という発話に対して、スコア順に「ヨコハマ ワタミ」「ヨコハマ タタミ」「ヨコハマ ワタリ」という3つの認識結果候補が出力されたものとする。
次に、データベース検索手段104は、検索用データベース105を参照し検索結果を出力する。
また、例の音声認識結果候補「ヨコハマ ワタミ」「ヨコハマ タタミ」「ヨコハマ ワタリ」に対してそれぞれ5個、2個、1個の候補があるものとする。
次に、候補集約手段105は、検索結果候補数をしきい値(TH1)と比較し、大きい場合ステップS304へ進む。そうでない場合はステップS308へ進む。
競合キーワード抽出手段301は、複数の音声認識結果から競合キーワードを抽出し参照するキーワードリストを競合するものに限定する。
具体的には、しきい値TH3を設定し、重複度がしきい値以下のキーワードを集約対象とする。この結果、 3つの検索結果全てに含まれるキーワード「ヨコハマ」は集約キーワードリスト107に含まれるものの競合キーワードから除外される。
候補集約手段106は、検索結果候補数がしきい値より大きい場合、検索結果の集約を試みる。具体的には、競合キーワードとなっており集約キーワードリスト107に記載された中からキーワードKを含む検索結果の最大数N(K)を算出する。
算出されたN(K)をしきい値(TH2)と比較し、大きい場合ステップS307へ進む。そうでない場合、ステップS308へ進む。
該当条件のキーワードを含む検索結果を集約し、提示する候補リストを更新する。また、該当キーワードを選択した場合のための絞込み用候補リストを作成する。
例の場合、キーワード「ワタミ」という一つの提示語彙とするとともに、「ワタミ」を選択した場合の絞込み候補リスト(5個)を作成する。
候補提示絞込み手段108は候補リストをユーザへ提示する。このとき、集約されたキーワードは、さらに絞込み可能であり色や字体など、提示形態を変えたり説明を加えたりすることによってユーザへ説明しても良い。
ユーザが集約した候補を選択した場合、ステップS310に進む。そうでない場合、候補選択は完了し処理を終了する。
ユーザが集約した候補を選択した場合は、選択した集約候補のリストを提示する。
集約した場合11画面目の4番目に候補を提示可能となる。
集約した候補内の絞り込みにおいても同様の処理を行うことが可能である。また、実施の形態1または実施の形態2との組合せることもできる。
Claims (4)
- 複数の単語が組合わされてなる検索対象を検索するために各検索単語の音声による発話を認識する音声認識手段と、
前記音声認識手段の音声認識結果がN個であり、そのN個のなかの認識結果に含まれる重複する単語がR個であるときの重複度をR/Nとしたとき、重複度が所定のしきい値より小さい前記音声認識結果を競合キーワードとして抽出する競合キーワード抽出手段と、
前記各検索単語の前記音声認識手段による各認識結果を用い、それぞれにあいまい性を考慮して検索データベースの検索を行うデータベース検索手段と、
前記競合キーワードと組合わされる前記検索単語の前記音声認識手段の認識結果によるデータベース検索手段の検索結果を所定基準で集約する候補集約手段と、
前記候補集約手段の処理結果である集約されたキーワードとその他の検索結果を提示する候補提示絞込み手段を備えることを特徴とする音声検索装置。 - 前記候補提示絞込み手段は、前記候補集約手段の処理結果である集約されたキーワードとその他の検索結果を提示し、集約されたキーワードが選択された場合にはキーワードに集約された検索結果を提示する構成にされたことを特徴とする請求項1記載の音声検索装置。
- 前記候補集約手段は、集約キーワードリストを参照し、前記データベース検索手段の検索結果に含まれるキーワードに基づいて候補を集約する構成にされたことを特徴とした請求項1または請求項2記載の音声検索装置。
- 前記候補集約手段は、属性リストを参照し、前記データベース検索手段の検索結果に含まれる属性と属性値の対応付けに基づいて候補を集約する構成にされたことを特徴とした請求項1または請求項2記載の音声検索装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007321887A JP5201973B2 (ja) | 2007-12-13 | 2007-12-13 | 音声検索装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007321887A JP5201973B2 (ja) | 2007-12-13 | 2007-12-13 | 音声検索装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009146108A JP2009146108A (ja) | 2009-07-02 |
JP5201973B2 true JP5201973B2 (ja) | 2013-06-05 |
Family
ID=40916654
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007321887A Expired - Fee Related JP5201973B2 (ja) | 2007-12-13 | 2007-12-13 | 音声検索装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5201973B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5542559B2 (ja) * | 2010-07-16 | 2014-07-09 | 三菱電機株式会社 | 音声検索インタフェース装置及び音声入力検索方法 |
CN102254557B (zh) * | 2011-07-04 | 2013-07-24 | 深圳市车音网科技有限公司 | 基于自然语音识别的导航方法和系统 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006031385A (ja) * | 2004-07-15 | 2006-02-02 | Nec Corp | 音声入力による検索システムと方法並びにプログラム |
JP2007080205A (ja) * | 2005-09-16 | 2007-03-29 | Canon Inc | 検索装置及び検索方法 |
JP2007205894A (ja) * | 2006-02-02 | 2007-08-16 | Alpine Electronics Inc | 車載用ナビゲーション装置及び検索施設表示方法 |
-
2007
- 2007-12-13 JP JP2007321887A patent/JP5201973B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2009146108A (ja) | 2009-07-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5089955B2 (ja) | 音声対話装置 | |
US10210862B1 (en) | Lattice decoding and result confirmation using recurrent neural networks | |
US7949524B2 (en) | Speech recognition correction with standby-word dictionary | |
EP1936606B1 (en) | Multi-stage speech recognition | |
JP4465564B2 (ja) | 音声認識装置および音声認識方法、並びに記録媒体 | |
WO2015118645A1 (ja) | 音声検索装置および音声検索方法 | |
KR100679042B1 (ko) | 음성인식 방법 및 장치, 이를 이용한 네비게이션 시스템 | |
JP4802434B2 (ja) | 音声認識装置及び音声認識方法、並びにプログラムを記録した記録媒体 | |
Alleva et al. | An improved search algorithm using incremental knowledge for continuous speech recognition | |
JP2001249684A (ja) | 音声認識装置および音声認識方法、並びに記録媒体 | |
JP2015520410A (ja) | 音声認識に対する負例(アンチワード)に基づく性能改善 | |
US20070016420A1 (en) | Dictionary lookup for mobile devices using spelling recognition | |
JP5183120B2 (ja) | 平方根ディスカウンティングを使用した統計的言語による音声認識 | |
JP5201973B2 (ja) | 音声検索装置 | |
JP5004863B2 (ja) | 音声検索装置および音声検索方法 | |
JP2001242885A (ja) | 音声認識装置および音声認識方法、並びに記録媒体 | |
JP4987530B2 (ja) | 音声認識辞書作成装置および音声認識装置 | |
JP2965529B2 (ja) | 音声認識装置 | |
JP3708747B2 (ja) | 音声認識方法 | |
WO2009147745A1 (ja) | 検索装置 | |
JP2009282835A (ja) | 音声検索装置及びその方法 | |
JP3663012B2 (ja) | 音声による入力装置 | |
JP2008083165A (ja) | 音声認識処理プログラム及び音声認識処理方法 | |
JP4736962B2 (ja) | キーワード選択方法、音声認識方法、キーワード選択システム、およびキーワード選択装置 | |
JP4600705B2 (ja) | 音声認識装置および音声認識方法、並びに記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100929 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120515 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120705 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130115 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130212 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160222 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |