JP5201973B2 - 音声検索装置 - Google Patents

音声検索装置 Download PDF

Info

Publication number
JP5201973B2
JP5201973B2 JP2007321887A JP2007321887A JP5201973B2 JP 5201973 B2 JP5201973 B2 JP 5201973B2 JP 2007321887 A JP2007321887 A JP 2007321887A JP 2007321887 A JP2007321887 A JP 2007321887A JP 5201973 B2 JP5201973 B2 JP 5201973B2
Authority
JP
Japan
Prior art keywords
search
candidate
keyword
voice
speech recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007321887A
Other languages
English (en)
Other versions
JP2009146108A (ja
Inventor
洋平 岡登
利行 花沢
知弘 岩崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2007321887A priority Critical patent/JP5201973B2/ja
Publication of JP2009146108A publication Critical patent/JP2009146108A/ja
Application granted granted Critical
Publication of JP5201973B2 publication Critical patent/JP5201973B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

この発明は、音声入力によるあいまい性を含む検索結果を提示する音声検索装置に関するものである。
音声による入力は、キーボードやタッチパネルに比べて初心者でも素早い入力が可能であり、他のタスクで目や手がふさがっている場合でも実行可能という利点がある。近年では、大語彙連続音声認識とデータベース検索を組合せた音声による全文検索や名称検索が検討されている。典型的な音声認識とデータベース検索の組合せは、図14に示すように音声認識結果に基づいてデータベース検索を行うものである。このとき、音声認識の出力は、認識可能な語彙の制限があること、認識誤りが含まれることを考慮する必要がある。
このための具体的な方策として、特許文献1では、未知語を考慮した音声認識を行い、未知語を抽出した場合に推定された未知語と類似する語を追加して検索する方法を開示している。また、特許文献2では、音声認識の確からしさを表すスコアを考慮して認識結果に含まれる複数の単語を検索に用いる方法を開示している。さらに、特許文献3では、音声認識誤りを考慮して認識結果から検索に用いる単語を拡大する方法を開示している。
特開2003-271629号公報 特開2004-5600号公報 特開2004-348552号公報
上記の各開示された技術は、語彙制限・誤認識による音声認識のあいまい性を考慮して、検索対象を拡大するものである。このため、検索結果の候補数は、あいまい性を考慮しない場合と比べて増加する。この結果、特に携帯電話やカーナビのように、画面が小さい情報携帯端末で利用する際に一覧性が低いことが問題となる。
また、検索対象の重要度は特に考慮していないため、重要度の低い検索対象を追加していくに従い著名な検索対象を検索しにくくなる問題がある。
この発明は、上記を鑑みて、音声認識による、あいまい性を考慮した検索において検索の操作性を改善することを目的としたものである。
この発明による音声検索装置は、
複数の単語が組合わされてなる検索対象を検索するために各検索単語の音声による発話を認識する音声認識手段と、
前記音声認識手段の音声認識結果がN個であり、そのN個のなかの認識結果に含まれる重複する単語がR個であるときの重複度をR/Nとしたとき、重複度が所定のしきい値より小さい前記音声認識結果を競合キーワードとして抽出する競合キーワード抽出手段と、
前記各検索単語の前記音声認識手段による各認識結果を用い、それぞれにあいまい性を考慮して検索データベースの検索を行うデータベース検索手段と、
前記競合キーワードと組合わされる前記検索単語の前記音声認識手段の認識結果によるデータベース検索手段の検索結果を所定基準で集約する候補集約手段と、
前記候補集約手段の処理結果である集約されたキーワードとその他の検索結果を提示する候補提示絞込み手段を備える。
この発明に係る音声検索装置によれば、複数の単語が組合わされてなる検索対象を検索するために音声による検索発話が音声認識手段で認識された各認識結果の重複度を算出し、重複度が所定値以下の場合の認識結果を競合キーワードとして抽出し、この競合キーワードと組合わされる検索単語の音声認識手段での認識結果を、データベース検索手段であいまい性を考慮して検索データベースの検索を行い、この検索結果を候補集約手段により所定基準で集約する。この結果、1度に提示する候補数を集約でき、小さい画面での提示に利便性が増し、検索に要する時間を削減でき、さらに音声認識のあいまい性を優先して集約する結果、絞込み後の候補提示では音声認識誤りが減少し、効率的な検索が可能である。
実施の形態1.
図1は、実施の形態1に係る音声検索装置の構成を示すブロック図である。図に示す音声検索装置は、音声認識手段101、音響標準パタン102、認識用単語辞書103、データベース検索手段104、検索用データベース105、候補集約手段106、集約キーワードリスト107、候補提示絞り込み手段108からなる。
従来の音声検索装置と異なるこの発明に係る実施の形態1に特徴的な部分は、候補集約手段106、集約キーワードリスト107、候補提示絞込み手段108を備え、集約キーワードリスト107の集約キーワードに記述された検索結果について候補を集約して提示するととともに、集約した候補から絞り込みができるようにした点である。以下、実施の形態1に係る音声検索装置の構成および動作を説明する。
音声認識手段101は、入力された音声を音響標準パタン102および認識用単語辞書103と照合し、照合の度合いを表すスコアが高い単語の組合せを認識結果として出力する。具体的な処理は、音声分析処理、照合処理、探索処理からなる。
音声分析処理は、入力音声を音声認識に好適な音響特徴量へ変換する処理である。
照合処理は、音声分析処理で算出した音響特徴量と音響標準パタン102を照合し、照合度合いを表すスコアを算出する処理である。例えば、音響特徴量の算出方法として、標本化周期16kHz・16ビットでA/D変換し、時間フレーム10ms間隔で256点フーリエ変換によりパワースペクトルを求め、振幅および周波数軸を対数化した後で逆フーリエ変換を行い12次元のメルケプストラムと、その時間方向の1次回帰係数12次元の合計24次元を用いる。
探索処理は、認識用単語辞書103に記載される音響標準パタンと単語の対応付けと、単語の組合せを参照し、単語の接続関係を参照して音声全体に対する累積スコアが高くなる認識候補を探索し認識結果の単語列を出力する。
認識結果は、スコアが大きい上位の複数候補を出力したり、スコアを出力することも可能である。音声認識の詳細な方法については、非特許文献4に詳細に説明されている。
非特許文献4:「音声認識の基礎(上)(下)」,Lawrence Rabiner, Biing-Hwang Juang共著、古井貞煕監訳、NTTアドバンステクノロジ株式会社
音響標準パタン102は、音素など音声認識の最小単位に対応する音声のスペクトルおよび時間的な特徴を表す。例えば、音素を単位とする時系列を自己回帰アークあり、後戻りアーク無しの3状態の隠れマルコフモデルを用いる。各状態に対応する音響特徴量は、共分散を保持する8混合ガウス分布で表す。図2は上記の隠れマルコフモデルの構造を図示したものである。音響標準パタンのパラメータは、予め多数の話者の学習用音声データから推定しておく。
認識用単語辞書103は、認識対象を音響標準パタンの組合せで記述するための辞書である。具体的には、音響標準パタンの中に対象の言語的な出力対象と制約を記述する単語定義辞書と、単語間のつながりを記述する単語接続辞書からなる。単語定義辞書の例を図3に示す。また、3つの単語の連鎖(トライグラム)する確率として単語接続を記述する例を図4に示す。
データベース検索手段104は、検索用データベース105を参照し検索結果を取得する。音声認識のあいまい性を考慮する場合、既に説明したように複数の音声認識候補を考慮して検索を行う。検索結果は、いくつかの属性と対応付けられている。例えば施設名の場合、施設名称、ジャンル名、住所、電話番号等である。
検索用データベース105は、検索対象のデータベースである。通常、予め検索用の索引を生成しておき検索を効率化することができる。データベースからの情報検索方法および索引作成方法については、非特許文献5に説明されている。データベースは、図5の例に示すように複数の属性レコードを持ち、検索結果から参照可能であるものとする。
非特許文献5:「情報検索アルゴリズム」 北研二、津田和彦、獅子堀正幹 共著、共立出版2002
候補集約手段106は、集約キーワードリスト107を参照し、データベース検索手段104が取得した検索結果のリストから集約キーワードによる検索結果を抽出し、候補リストの集約および絞込み対象リストを生成する。
集約キーワードリスト107は、集約対象とするキーワードのリストである。設定するキーワードは、ユーザの発話によく出現し、複数の名称で共通的に出現する語彙である。例えば、チェーン店の名称(セブンイレブン)や地域(横浜)、名称に含まれやすい言葉(警察署)等を設定する。集約キーワードリストの例を図6に示す。
候補提示絞り込み手段108は、候補集約手段106が生成した提示候補リストおよび絞込み対象リストに基づいてユーザへ候補提示するとともに絞込み制御を行う。
次に、図7のフローチャートを参照し、実施の形態1に係る音声検索装置の動作を説明する。
ここでは、部分一致に基づく施設名称の検索を例について具体的な動作を説明する。また、説明を単純にするため、ユーザは「ワタリ」と1単語発声し、「ワタリ」を含む施設名を検索することを意図したものとする。
検索用データベース105について、予め単語と音節に区切られた索引が作成されており、任意の単語に対して検索が可能であるものとする。
(ステップS101)
まず、音声認識手段101は、入力された音声を認識してデータベース検索手段104への入力となる認識結果を出力する。例の場合、「ワタリ」という発話に対する音声認識結果が取得される。
(ステップS102)
次に、データベース検索手段104は、検索用データベース105を参照し検索結果を出力する。
このとき、発話「ワタリ」に対して、音声認識のあいまい性を考慮した結果、「ワタミ」「タタミ」「ワタリ」というキーワードを含む検索結果が取得されたものとする。検索結果と検索キーワードの対応付けは前処理あるいは後処理により対応付けしておく。ここでは、「ワタミ」がチェーン店名称のため多数の候補がヒットし、対応する検索結果がそれぞれ50個、3個、5個の候補があるものとする。
(ステップS103)
次に、候補集約手段106は、検索結果候補数をしきい値(TH1)と比較し、大きい場合ステップS104へ進む。そうでない場合はステップS107へ進む。
(ステップS104)
候補集約手段106は、検索結果候補数がしきい値より大きい場合、検索結果の集約を試みる。具体的には、集約キーワードリスト107に記載されているキーワードについてキーワードKを含む検索結果の最大数N(K)を算出する。
(ステップS105)
算出されたN(K)をしきい値(TH2)と比較し、大きい場合ステップS106へ進む。そうでない場合、ステップS107へ進む。
(ステップS106)
該当条件のキーワードを含む検索結果を集約し、提示する候補リストを更新する。また、該当キーワードを選択した場合のための絞込み用候補リストを作成する。
例の場合、「ワタミ」という一つの提示語彙とするとともに、「ワタミ」を選択した場合の絞込み候補リスト(50個)を作成する。
(ステップS107)
候補提示絞込み手段108は候補リストをユーザへ提示する。このとき、集約されたキーワードは、さらに絞込み可能であり色や字体など、提示形態を変えたり説明を加えたりすることによってユーザへ説明しても良い。
図8は、6個の候補を画面提示した場合の例である。集約したキーワード「ワタミ」は太字として絞込み件数を提示している。「ワタリ」を含む候補は集約前は54位以降であり同時提示候補数が6個の場合、該当する候補は9画面目以降の提示となるが、集約した場合1画面目の5番目から候補の一部を提示可能となる。
(ステップS108)
ユーザが集約した候補を選択した場合、ステップS109に進む。そうでない場合、候補選択は完了し処理を終了する。
(ステップS109)
ユーザが集約した候補を選択した場合は、選択した集約候補のリストを提示する。
このように、実施の形態1に係る検索装置は、集約キーワードリストを考慮して検索結果を集約する。この結果、1度に提示する候補数を集約でき、検索に要する時間を削減できる。
集約キーワードリストは任意の語彙に選択可能である。例えば、出現しうる全ての語彙を指定してもよいし、単独で出現可能な自立語を対象としても良い。また、確実性を高めるためにキーワードの長さを制限して抽出しても良い。要は所定基準に従い作成すれば良い。
また、候補集約手段106は所定の基準を保持し、集約キーワードリスト107を参照せずに検索結果を所定の基準に従って集約処理をしても良い。
上記の例では、絞込みキーワード選択時、候補提示絞込み手段が集約したキーワードのリストを提示する処理となっていた。集約したキーワードに対する検索結果が定義できている場合、従来どおり検索結果提示手段により候補を提示することも可能である。
また、上記の動作例では、集約処理を1度のみ適用していたが絞込み結果を再度別キーワードで集約するようにすれば複数回の階層的な絞込みを行うことも可能である。
実施の形態2.
図9は、実施の形態2に係る音声検索装置の構成を示すブロック図である。図に示す音声検索装置は、音声認識手段101、音響標準パタン102、認識用単語辞書103、データベース検索手段104、検索用データベース105、候補集約手段106、集約属性リスト201、候補提示絞り込み手段108からなる。
従来の音声検索装置と異なるこの発明の実施の形態2に特徴的な部分は、候補集約手段106が集約属性リスト201を参照し、検索結果を属性に応じて集約することであり、また、実施の形態1と異なる特徴的な部分は、候補集約手段106が参照するリストが集約キーワードリスト107でなく、集約属性リスト201であることである。
以下、実施の形態2に係る音声検索装置の構成および動作を説明する。ただし、既に説明済みの機能ブロックについては同一の符号を付し説明を省略する。
集約属性リスト201は、データベース検索結果に付与される属性および属性値と対応した集約提示対象のリストである。例を図10に示す。
次に、図11のフローチャートを参照し、実施の形態2に係る音声検索装置の動作を説明する。
ここでは、ユーザは「ワタリ」と発声し、「ワタリ」を含む施設名を検索することを意図したとする。
(ステップS201)
まず、音声認識手段101は、入力された音声を認識してデータベース検索手段104への入力となる認識結果を出力する。この例の場合、ワタリ」という発話に対する音声認識結果が取得される。
(ステップS202)
次に、データベース検索手段104は、検索用データベース105を参照し検索結果を出力する。
このとき、発話「ワタリ」に対して、音声認識のあいまい性を考慮した結果、多数の候補が検索される。この中には属性「チェーン店」に対応する属性値が「ワタミ」であるものが50件含まれているものとする。
(ステップS203)
次に、候補集約手段105は、検索結果候補数をしきい値(TH1)と比較し、大きい場合ステップS204へ進む。そうでない場合はステップS207へ進む。
(ステップS204)
候補集約手段106は、検索結果候補数がしきい値より大きい場合、検索結果の集約を試みる。具体的には、集約属性リスト201に記載されている属性・属性値の組合せについて属性条件Cに合致する検索結果の最大数N(C)を算出する。
(ステップS205)
算出されたN(C)としきい値(TH2)を比較し、大きい場合ステップS206へ進む。そうでない場合、ステップS207へ進む。
(ステップS206)
該当条件の属性・属性値の組合せを含む検索結果を集約し、提示する候補リストを更新する。また、該当キーワードを選択した場合のための絞込み用候補リストを作成する。
例の場合、「(チェーン店)ワタミ」という一つの提示語彙に集約するとともに、「ワタミ」を選択した場合の絞込み候補リスト(50個)を作成する。
(ステップS207)
候補提示絞込み手段108は候補リストをユーザへ提示する。このとき、集約されたキーワードは、さらに絞込み可能であり色や字体など、提示形態を変えたり説明を加えたりすることによってユーザへ説明しても良い。
(ステップS208)
ユーザが集約した候補を選択した場合、ステップS209に進む。そうでない場合、候補選択は完了し処理を終了する。
(ステップS209)
ユーザが集約した候補を選択した場合は、選択した集約候補のリストを提示する。
このように、実施の形態2に係る検索装置は、集約キーワードリストを考慮して検索結果を集約する。この結果、1度に提示する候補数を集約でき、検索に要する時間を削減できる。
集約キーワードリストは任意の語彙に選択可能である。例えば、出現しうる全ての語彙を指定してもよいし、単独で出現可能な自立語を対象としても良い。また、確実性を高めるためにキーワードの長さを制限して抽出しても良い。
上記の例では、絞込みキーワード選択時、候補提示絞込み手段が集約したキーワードのリストを提示する処理となっていたが、別の絞込み手段をとることも可能である。
また、上記の動作例では、集約処理を1度のみ適用していたが絞込み結果を再度別キーワードで集約するようにすれば複数回の階層的な絞込みを行うことも可能である。
実施の形態3.
図12は、実施の形態3に係る音声検索装置の構成を示すブロック図である。図に示す音声検索装置は、音声認識手段101、音響標準パタン102、認識用単語辞書103、データベース検索手段104、検索用データベース105、候補集約手段106、集約キーワードリスト107、候補提示絞り込み手段108、競合キーワード抽出手段301からなる。
従来の音声検索装置と異なる本実施の形態3に特徴的な部分は、候補集約手段106、集約キーワードリスト107、候補提示絞込み手段108及び競合キーワード抽出手段301を備え、音声認識結果のあいまい性として競合するキーワードに限定して候補を集約して提示し、集約した候補について集約キーワードに記述された検索結果について候補をさらに集約して提示するととともに、集約した候補から絞り込みができるようにした点である。
また、実施の形態1と異なる本実施の形態3に特徴的な部分は、競合キーワード抽出手段301をさらに備え、音声認識結果のあいまい性として競合するキーワードに限定して候補を集約して提示し、集約した候補についてさらに集約して提示ができるようにした点である。
以下、実施の形態3に係る音声検索装置の構成および動作を説明する。ただし、既に説明済みの機能ブロックについては同一の符号を付し説明を省略する。
競合キーワード抽出手段301は、あいまい性を考慮して複数提示された音声認識結果の単語列から単語の重複度を算出し競合キーワードを抽出する。具体的には、音声認識結果をN個取得し、うちR個の認識結果に含まれる単語の重複度はR/Nとする。認識結果に含まれる単語ごとに重複度を順位付けし、重複度が設定したしきい値より小さいものを競合キーワードとする。
例えば「ワタリ ヨコハマ」「ワタミ ヨコハマ」「タタミ ヨコハマ」の認識結果があるとき、「ワタリ」「ワタミ」「タタミ」の重複度は1/3、「ヨコハマ」の重複度は1となる。
この例のように音声認識結果として、類似している表現が多いキーワードは重複度が小さくなる。認識結果の単語時間情報を取得することで、重複度の算出の際に、時間的な重複を考慮するも可能である。
次に、図13のフローチャートを参照し、実施の形態3に係る音声検索装置の動作を説明する。
ここでは、部分一致に基づく施設名称の検索を例について具体的な動作を説明する。また、説明を単純にするため、ユーザは「ヨコハマ ワタリ」と2単語発声し、「ヨコハマ」「ワタリ」を含む施設名を検索することを意図したとする。
(ステップS301)
まず、音声認識手段101は、入力された音声を認識して検索手段への入力となる1つ以上の認識結果を出力する。この結果、「ヨコハマ ワタリ」という発話に対して、スコア順に「ヨコハマ ワタミ」「ヨコハマ タタミ」「ヨコハマ ワタリ」という3つの認識結果候補が出力されたものとする。
(ステップS302)
次に、データベース検索手段104は、検索用データベース105を参照し検索結果を出力する。
また、例の音声認識結果候補「ヨコハマ ワタミ」「ヨコハマ タタミ」「ヨコハマ ワタリ」に対してそれぞれ5個、2個、1個の候補があるものとする。
(ステップS303)
次に、候補集約手段105は、検索結果候補数をしきい値(TH1)と比較し、大きい場合ステップS304へ進む。そうでない場合はステップS308へ進む。
(ステップS304)
競合キーワード抽出手段301は、複数の音声認識結果から競合キーワードを抽出し参照するキーワードリストを競合するものに限定する。
具体的には、しきい値TH3を設定し、重複度がしきい値以下のキーワードを集約対象とする。この結果、 3つの検索結果全てに含まれるキーワード「ヨコハマ」は集約キーワードリスト107に含まれるものの競合キーワードから除外される。
(ステップS305)
候補集約手段106は、検索結果候補数がしきい値より大きい場合、検索結果の集約を試みる。具体的には、競合キーワードとなっており集約キーワードリスト107に記載された中からキーワードKを含む検索結果の最大数N(K)を算出する。
(ステップS306)
算出されたN(K)をしきい値(TH2)と比較し、大きい場合ステップS307へ進む。そうでない場合、ステップS308へ進む。
(ステップS307)
該当条件のキーワードを含む検索結果を集約し、提示する候補リストを更新する。また、該当キーワードを選択した場合のための絞込み用候補リストを作成する。
例の場合、キーワード「ワタミ」という一つの提示語彙とするとともに、「ワタミ」を選択した場合の絞込み候補リスト(5個)を作成する。
(ステップS308)
候補提示絞込み手段108は候補リストをユーザへ提示する。このとき、集約されたキーワードは、さらに絞込み可能であり色や字体など、提示形態を変えたり説明を加えたりすることによってユーザへ説明しても良い。
(ステップS309)
ユーザが集約した候補を選択した場合、ステップS310に進む。そうでない場合、候補選択は完了し処理を終了する。
(ステップS310)
ユーザが集約した候補を選択した場合は、選択した集約候補のリストを提示する。
集約した場合11画面目の4番目に候補を提示可能となる。
このように、実施の形態3に係る検索装置は、音声認識の結果で生じた競合キーワードについて検索結果を集約できる。この結果、音声認識のあいまい性を優先して集約する。この結果、絞込み後の候補提示では音声認識誤りが減少しているため、効率的な検索が可能である。
集約した候補内の絞り込みにおいても同様の処理を行うことが可能である。また、実施の形態1または実施の形態2との組合せることもできる。
この発明は、音声により例えば、ホテルや旅館、美術館や映画館などの施設或いは観光スポットなどの検索が可能なカーナビや形態電話などの音声検索装置に利用可能である。
この発明の第1の実施形態の機能ブロック図である。 隠れマルコフモデル(Hidden Markov Model;HMM)のトポロジーの例を示す図である。 認識用単語辞書例の説明図である。 認識用言語辞書に単語間トライグラム確率を用いた場合の記載内容例の説明図である。 検索対象のデータベースに記憶される情報例の説明図である。 集約キーワードリスト例の説明図である。 実施の形態1に係る音声検索装置の動作説明用フローチャートである。 キーワード集約処理後の提示候補例の説明図である。 この発明の実施の形態2の機能ブロック図である。 集約属性リスト例の説明図である。 実施の形態2に係る音声認識装置の動作説明用フローチャートである。 この発明の実施の形態3の機能ブロック図である。 実施の形態3に係る音声認識装置の動作説明用フローチャートである。 従来の音声認識装置の機能ブロック図である。
符号の説明
101;音声認識手段、102;音響標準パタン、103;認識用単語辞書、104;データベース検索手段、105;検索用データベース、106;候補集約手段、107;集約キーワードリスト、108;候補提示絞り込み手段、201;集約属性リスト、301;競合キーワード抽出手段。

Claims (4)

  1. 複数の単語が組合わされてなる検索対象を検索するために各検索単語の音声による発話を認識する音声認識手段と、
    前記音声認識手段の音声認識結果がN個であり、そのN個のなかの認識結果に含まれる重複する単語がR個であるときの重複度をR/Nとしたとき、重複度が所定のしきい値より小さい前記音声認識結果を競合キーワードとして抽出する競合キーワード抽出手段と、
    前記各検索単語の前記音声認識手段による各認識結果を用い、それぞれにあいまい性を考慮して検索データベースの検索を行うデータベース検索手段と、
    前記競合キーワードと組合わされる前記検索単語の前記音声認識手段の認識結果によるデータベース検索手段の検索結果を所定基準で集約する候補集約手段と、
    前記候補集約手段の処理結果である集約されたキーワードとその他の検索結果を提示する候補提示絞込み手段を備えることを特徴とする音声検索装置。
  2. 前記候補提示絞込み手段は、前記候補集約手段の処理結果である集約されたキーワードとその他の検索結果を提示し、集約されたキーワードが選択された場合にはキーワードに集約された検索結果を提示する構成にされたことを特徴とする請求項1記載の音声検索装置。
  3. 前記候補集約手段は、集約キーワードリストを参照し、前記データベース検索手段の検索結果に含まれるキーワードに基づいて候補を集約する構成にされたことを特徴とした請求項1または請求項2記載の音声検索装置。
  4. 前記候補集約手段は、属性リストを参照し、前記データベース検索手段の検索結果に含まれる属性と属性値の対応付けに基づいて候補を集約する構成にされたことを特徴とした請求項1または請求項2記載の音声検索装置。
JP2007321887A 2007-12-13 2007-12-13 音声検索装置 Expired - Fee Related JP5201973B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007321887A JP5201973B2 (ja) 2007-12-13 2007-12-13 音声検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007321887A JP5201973B2 (ja) 2007-12-13 2007-12-13 音声検索装置

Publications (2)

Publication Number Publication Date
JP2009146108A JP2009146108A (ja) 2009-07-02
JP5201973B2 true JP5201973B2 (ja) 2013-06-05

Family

ID=40916654

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007321887A Expired - Fee Related JP5201973B2 (ja) 2007-12-13 2007-12-13 音声検索装置

Country Status (1)

Country Link
JP (1) JP5201973B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5542559B2 (ja) * 2010-07-16 2014-07-09 三菱電機株式会社 音声検索インタフェース装置及び音声入力検索方法
CN102254557B (zh) * 2011-07-04 2013-07-24 深圳市车音网科技有限公司 基于自然语音识别的导航方法和系统

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006031385A (ja) * 2004-07-15 2006-02-02 Nec Corp 音声入力による検索システムと方法並びにプログラム
JP2007080205A (ja) * 2005-09-16 2007-03-29 Canon Inc 検索装置及び検索方法
JP2007205894A (ja) * 2006-02-02 2007-08-16 Alpine Electronics Inc 車載用ナビゲーション装置及び検索施設表示方法

Also Published As

Publication number Publication date
JP2009146108A (ja) 2009-07-02

Similar Documents

Publication Publication Date Title
JP5089955B2 (ja) 音声対話装置
US10210862B1 (en) Lattice decoding and result confirmation using recurrent neural networks
US7949524B2 (en) Speech recognition correction with standby-word dictionary
EP1936606B1 (en) Multi-stage speech recognition
JP4465564B2 (ja) 音声認識装置および音声認識方法、並びに記録媒体
WO2015118645A1 (ja) 音声検索装置および音声検索方法
KR100679042B1 (ko) 음성인식 방법 및 장치, 이를 이용한 네비게이션 시스템
JP4802434B2 (ja) 音声認識装置及び音声認識方法、並びにプログラムを記録した記録媒体
Alleva et al. An improved search algorithm using incremental knowledge for continuous speech recognition
JP2001249684A (ja) 音声認識装置および音声認識方法、並びに記録媒体
JP2015520410A (ja) 音声認識に対する負例(アンチワード)に基づく性能改善
US20070016420A1 (en) Dictionary lookup for mobile devices using spelling recognition
JP5183120B2 (ja) 平方根ディスカウンティングを使用した統計的言語による音声認識
JP5201973B2 (ja) 音声検索装置
JP5004863B2 (ja) 音声検索装置および音声検索方法
JP2001242885A (ja) 音声認識装置および音声認識方法、並びに記録媒体
JP4987530B2 (ja) 音声認識辞書作成装置および音声認識装置
JP2965529B2 (ja) 音声認識装置
JP3708747B2 (ja) 音声認識方法
WO2009147745A1 (ja) 検索装置
JP2009282835A (ja) 音声検索装置及びその方法
JP3663012B2 (ja) 音声による入力装置
JP2008083165A (ja) 音声認識処理プログラム及び音声認識処理方法
JP4736962B2 (ja) キーワード選択方法、音声認識方法、キーワード選択システム、およびキーワード選択装置
JP4600705B2 (ja) 音声認識装置および音声認識方法、並びに記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100929

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120515

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120705

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130115

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130212

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160222

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees