JP2010231433A - 検索装置 - Google Patents

検索装置 Download PDF

Info

Publication number
JP2010231433A
JP2010231433A JP2009077365A JP2009077365A JP2010231433A JP 2010231433 A JP2010231433 A JP 2010231433A JP 2009077365 A JP2009077365 A JP 2009077365A JP 2009077365 A JP2009077365 A JP 2009077365A JP 2010231433 A JP2010231433 A JP 2010231433A
Authority
JP
Japan
Prior art keywords
keyword
candidate
search
unit
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009077365A
Other languages
English (en)
Other versions
JP5364412B2 (ja
Inventor
Masahiro Kamiya
昌宏 神谷
Osamu Iwata
收 岩田
Toshiyuki Nanba
利行 難波
Hiroaki Sekiyama
博昭 関山
Yoshihiro Oe
義博 大栄
Kunio Yokoi
邦雄 横井
Naoki Miura
直樹 三浦
Iko Terasawa
位好 寺澤
Kinichi Wada
錦一 和田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Denso Ten Ltd
Aisin AW Co Ltd
Denso Corp
Toyota Motor Corp
Toyota Central R&D Labs Inc
Original Assignee
Denso Ten Ltd
Aisin AW Co Ltd
Denso Corp
Toyota Motor Corp
Toyota Central R&D Labs Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Denso Ten Ltd, Aisin AW Co Ltd, Denso Corp, Toyota Motor Corp, Toyota Central R&D Labs Inc filed Critical Denso Ten Ltd
Priority to JP2009077365A priority Critical patent/JP5364412B2/ja
Publication of JP2010231433A publication Critical patent/JP2010231433A/ja
Application granted granted Critical
Publication of JP5364412B2 publication Critical patent/JP5364412B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】音声認識結果に誤りがあった場合に、誤りのあった単語のみを訂正することができ、訂正のための再発声回数を可及的に低減することができる検索装置を提供する。
【解決手段】利用者の声を音声認識して得られた検索キーワード列を検索条件として所定のデータベースを検索する検索装置に、検索キーワード列の各検索キーワード毎に複数のキーワード候補をデータベースから抽出する候補抽出手段と、抽出したキーワード候補を重複なく候補リストとして各検索キーワード単位で格納する候補リスト格納手段と、各検索キーワードを表示させて不正解キーワードを利用者に選択させる選択手段と、選択手段により不正解キーワードが選択された場合に、選択された不正解キーワードに対応する候補リスト内のキーワード候補を表示させ、検索キーワードとして利用者に選択させる候補提示手段とを設けた。
【選択図】 図1

Description

この発明は、利用者による発声を音声認識することで得られた検索キーワード列を検索条件として所定のデータベースを検索する検索装置に関するものである。
従来から、GPS(Global Positioning System)、ジャイロ、車速センサ等を利用して現在位置を算出し、自車位置と周辺の道路や建物についての地図情報とを合成してディスプレイへ表示するカーナビゲーションシステムが知られている。
また、利用者の利便性を向上させる観点から、マイクロフォンを経由して取り込んだ利用者の声を音声認識し、音声認識結果に基づいてカーナビゲーションシステムを作動させることも行われている。
かかる利用者の声により動作するカーナビゲーションシステムに導入可能な装置として、特許文献1には、利用者が複数の単語列からなる音声を入力した際、一部の単語が誤認識された場合に、その単語のみを訂正可能とした装置が開示されている。
この装置は、利用者により入力された音声を複数の単語データとして認識処理した後、各単語データ毎に複数の候補単語のリストを作成して記憶し、各リストにおける各第1候補の候補単語からなる単語列を認識した単語列として出力するように構成されている。
そして、この装置は、出力した単語列の中に、利用者が発声した単語と異なる単語(装置が誤認識した単語)が含まれていた場合、利用者が所望する正しい単語を再発声すると、その単語と、先に記憶しておいたリスト中の全ての名詞(単語)とを順次照合し、照合により一致した単語と誤認識した単語とを入れ替えた単語列を再度出力することによって、誤認識した単語のみを訂正するように構成されていた。
特開平11−133993号公報
しかしながら、特許文献1に記載の装置では、単語を誤認識した場合に、利用者が再発声した単語と、先に記憶したリスト中の全ての名詞(単語)とを照合していたため、正しく認識した単語と再発声された単語とが類似していた場合、正しく認識していた方の単語が訂正されて、誤認識した方の単語を訂正されず、利用者が所望するような単語の訂正を行えない恐れがあった。
また、この装置では、再度出力した単語列に誤認識した単語が含まれていた場合、利用者は、所望する単語を再び発声しなければならず、誤認識が度重なると何度も同じ単語を発声することとなり、その行為が面倒で操作性が低下するおそれがあった。
本発明は、上述した従来技術による問題点を解消するためになされたものであって、音声認識結果に誤りがあった場合に、誤りのあった単語のみを訂正することができ、訂正のための利用者による単語の再発声回数を可及的に低減することができる検索装置を提供することを目的とする。
上述した課題を解決し、目的を達成するため、本発明では、利用者による発声を音声認識することで得られた検索キーワード列を検索条件として所定のデータベースを検索する検索装置に、前記検索キーワード列の各検索キーワード毎に、前記検索キーワードに発音の類似した複数のキーワード候補を前記データベースから抽出する候補抽出手段と、前記候補抽出手段により抽出したキーワード候補を重複なく候補リストとして各検索キーワード単位で格納する候補リスト格納手段と、前記検索キーワード列に含まれる各検索キーワードを表示させて修正対象となる検索キーワードを示す不正解キーワードを利用者に選択させる選択手段と、前記選択手段により前記不正解キーワードが選択された場合に、選択された不正解キーワードに対応する前記候補リスト内の前記キーワード候補を表示させ、当該表示させたキーワード候補を前記検索キーワードとして利用者に選択させる候補提示手段とを設けた。
本発明によれば、利用者による発声を音声認識することで得られた検索キーワード列を検索条件として所定のデータベースを検索する検索装置に、前記検索キーワード列の各検索キーワード毎に、前記検索キーワードに発音の類似した複数のキーワード候補を前記データベースから抽出する候補抽出手段と、前記候補抽出手段により抽出したキーワード候補を重複なく候補リストとして各検索キーワード単位で格納する候補リスト格納手段と、前記検索キーワード列に含まれる各検索キーワードを表示させて修正対象となる検索キーワードを示す不正解キーワードを利用者に選択させる選択手段と、前記選択手段により前記不正解キーワードが選択された場合に、選択された不正解キーワードに対応する前記候補リスト内の前記キーワード候補を表示させ、当該表示させたキーワード候補を前記検索キーワードとして利用者に選択させる候補提示手段とを設けたため、音声認識結果に誤りがあった場合に、誤りのあった単語のみを訂正することができ、利用者は、候補提示手段により表示されるキーワード候補を選択することによって、不正解キーワードの修正を行うことができるので、訂正のための利用者による単語の再発声回数を可及的に低減することができる。
本実施形態に係る検索装置の構成を示すブロック図である。 音声認識部の構成例を示す図である。 候補抽出部による候補リストの作成手順の一例を示す説明図である。 タッチパネルディスプレイに表示する画像の一例を示す説明図である。 タッチパネルディスプレイに表示する画像の一例を示す説明図である。 検索装置が実行する処理手順を示すフローチャートである。 検索装置が実行する処理手順を示すフローチャートである。 検索装置が実行する処理手順を示すフローチャートである。
以下、本発明に係る検索装置の一実施形態について、図面を参照して説明する。なお、本実施形態では、自動車などの車両に搭載され、利用者により音声入力された検索キーワード列を検索条件として所定のデータベースを検索し、利用者が所望する施設の位置情報を利用者へ提供する検索装置に対して本発明を適用した場合について説明するが、本発明は、これに限定されるものではなく、利用者による発声を音声認識することで得られた検索キーワード列を検索条件として所定のデータベースを検索する他の検索装置に対して適用することができる。
図1は、本実施形態に係る検索装置100の構成を示すブロック図である。同図に示すように、検索装置100は、マイク200と、タッチパネルディスプレイ300と、制御部400と、記憶部500とを備えている。
また、制御部400は、音声認識部401と、キーワード抽出部402と、不正解キーワード選択部403と、候補提示部404と、検索部405と、地図情報合成部406と、再音声認識開始部407と、候補抽出部408と、候補リスト格納部409とを備えている。そして、記憶部500は、データベース501と、地図情報502とを記憶する。
マイク200は、利用者の発声内容を取得するマイクロフォンであり、取得した発声内容をデジタル信号へ変換したうえで、制御部400の音声認識部401へ通知する。また、タッチパネルディスプレイ300は、液晶ディスプレイの表面に入力用のタッチパネルを重ねた入出力デバイスであり、音声認識結果や検索結果を含んだ各種画面、テンキーを摸した入力用画面などを表示するとともに、利用者による入力操作を受け付ける。
なお、本実施形態では、入出力デバイスとしてタッチパネルディスプレイ300を用いる場合について示したが、ディスプレイなどの出力デバイスと、操作ボタンなどの入力デバイスとを用いることとしてもよい。
制御部400は、マイク200から通知された発声内容を音声認識するとともに、音声認識結果から抽出した検索キーワード列をタッチパネル300に表示させると共に、各検索キーワード毎に、検索キーワードに発音の類似した複数のキーワード候補を重複なく候補リストとして各検索キーワード単位で格納しておき、表示中の検索キーワード列から利用者によって修正対象となる検索キーワード(以下、「不正解キーワード」という。)が選択された場合に、選択された不正解キーワードに対応する候補リスト内のキーワード候補を表示させ、そのキーワード候補が利用者により検索キーワードとして選択されると、不正解キーワードを選択されたキーワード候補に入れ替えた検索キーワード列に基づいて、検索処理を実行する処理を行う処理部である。
音声認識部401は、マイク200から受け取った発声内容を音声認識して単語列へ変換し、キーワード抽出部402へ通知する処理を行う処理部である。ここで、音声認識部401の構成例について図2を用いて説明しておく。図2は、音声認識部401の構成例を示す図である。
図2に示すように、音声認識部401は、雑音処理部401aと、特徴抽出部401bと、音素照合部401cと、単語照合部401dとを備えている。なお、同図に示す音素辞書501aおよび単語/文法辞書501bは、たとえば、記憶部500に記憶されているものとする。
雑音処理部401aは、マイク200から受け取ったデジタル信号をフィルタリングすることでデジタル信号に含まれる雑音(ノイズ)を補正する処理を行う処理部である。特徴抽出部401bは、雑音処理部401aによって雑音が補正された信号について、イントネーションなどの音声の高低や音声の長さといった分析を行うことで音声特徴を抽出する処理を行う処理部である。
また、音素照合部401cは、音素辞書501aにあらかじめ登録されている音素(たとえば、「あ」、「い」など)と、特徴抽出部401bから受け取った信号とを照合することで、音声信号に含まれる各音素を、文字へ変換する処理を行う処理部である。
そして、単語照合部401dは、音素照合部401cによって生成された文字の集合を、単語/文法辞書501bにあらかじめ登録されている単語と照合することで、単語列へと変換する処理を行う。また、単語照合部401dは、単語/文法辞書501bにあらかじめ登録されている文法を単語列に対して適用することで、単語列に含まれる助詞などの単語を、検索キーワードとすべき単語と区別してキーワード抽出部402へ通知する。
ここで、単語/文法辞書501bの内容は、後述するデータベース501を用いて更新することが可能であり、単語/文法辞書501bの更新内容は、音素辞書501aにも反映される。たとえば、データベース501にあらたな店舗名や施設名が追加された場合には、追加された店舗名や施設名があらたな単語として単語/文法辞書501bへ追加される。
図1の説明に戻りキーワード抽出部402について説明する。キーワード抽出部402は、音声認識部401から受け取った単語列から、単語列に含まれる助詞などの単語を除去することで、検索キーワードを抽出する処理を行う処理部である。また、このキーワード抽出部402は、抽出した各検索キーワードを候補抽出部408へ通知する。
候補抽出部408は、キーワード抽出部402から通知された各検索キーワード毎に、その検索キーワードに発音の類似した複数のキーワード候補をデータベース501から検索して取得して候補リスト格納部409へ出力する処理部である。
このとき、候補抽出部408は、複数のキーワード候補を候補リスト格納部409へ出力する際、候補リスト格納部409に各検索キーワードに対応して設けられた後述のスロット(図1に示すスロット(1)〜(3)409a〜409c)と称する一次記憶エリアに、重複がないようにキーワード候補を記憶させることによって、各スロット内に、それぞれ検索キーワードに対応したキーワード候補のリスト(以下、「候補リスト」という。)を格納させる。
ここで、候補抽出部408による候補リストの作成手順について、図3を参照して説明する。図3は、候補抽出部408による候補リストの作成手順の一例を示す説明図である。ここでは、利用者が音声入力として、「新宿のカフェでコーヒー」と発声し、音声認識部401が「コーヒー」を「紅茶」と誤認識した場合を例に挙げて説明する。
図3(a)に示すように、利用者が「新宿のカフェでコーヒー」と発声した場合、ここで音声認識部401が「コーヒー」を「紅茶」と誤認識しているため、候補抽出部408には、キーワード抽出部402から「新宿」、「カフェ」、「紅茶」という検索キーワードが入力される。
この場合、候補抽出部402は、データベース501を検索して「新宿」、「カフェ」、「紅茶」という検索キーワード列と発音の類似する複数のキーワード候補の列(ここでは、第1〜第5候補)を抽出する。このとき、第1候補の語列がキーワード抽出部402により抽出された検索キーワード列となる。
このとき、候補抽出部408は、第1〜第5候補の各候補における1番目(先頭)の単語が重複しないようにスロット(1)409aに対応する記憶エリアへ記憶させることによって、図3(b)に示すように、場所に関するキーワード候補の候補リストをスロット(1)409aへ格納させる。同様に、候補抽出部408は、第1〜第5候補の各候補における2番目(真中)の単語が重複しないように、ジャンル(店種)に関する候補リストをスロット(2)409bへ格納させ、第1〜第5候補の各候補における3番目(末尾)の単語が重複しないように、商品に関する候補リストをスロット(3)409cへ格納させる。
図1の説明に戻り候補リスト格納部409について説明する。候補リスト格納部409は、フラッシュメモリ等の書き込み、及び書き換え可能な記憶デバイスにより構成している。この候補リスト格納部409は、内部にスロット(1)409a、スロット(2)409b、スロット(3)409cと称する複数の記憶エリアを備えている。
これらスロット(1)409a、スロット(2)409b、スロット(3)409cには、候補抽出部408から入力される各検索キーワード毎のキーワード候補が候補リストとしてそれぞれ格納される。なお、ここでは、一例として、3つのスロットが形成されているが、候補リスト格納部409は、検索キーワードの語数に応じて形成するスロット数を変更可能に構成している。
すなわち、この候補リスト格納部409は、記憶領域に割当てたアドレスを指定することによって、任意にスロットとして機能させる記憶エリア数を変更できるように構成している。本実施形態では、候補抽出部408がキーワード抽出部402から入力された検索キーワードの語数に応じて、候補リスト格納部409に形成させるスロット数を決定する。
そのため、候補抽出部408は、候補リスト格納409へ検索キーワード及びキーワード候補を出力する際に、候補リスト格納部409内における記憶先のアドレスを指定して検索キーワード及びキーワード候補の出力を行う。
次に、不正解キーワード選択部403について説明する。不正解キーワード選択部403は、キーワード抽出部402によって抽出された各検索キーワードを、タッチパネルディスプレイ300へ表示させると共に、利用者が修正の意図を示した検索キーワードを「不正解キーワード」として取得して、候補提示部404へ通知する処理を行う処理部である。
候補提示部404は、不正解キーワード選択部403により通知された不正解キーワードに対応するスロット(スロット(1)409a、スロット(2)409b、スロット(3)409c)を参照して、不正解キーワードに関する候補リストに記憶されているキーワード候補をタッチパネルディスプレイ300に表示させることにより、当該表示させたキーワード候補を検索キーワードとして利用者に選択させる処理を行う処理部である。
ここで、図4(a)〜(c)を参照して、候補提示部404がタッチパネルディスプレイ300に表示させる画像の一例について説明する。ここでは、利用者が音声入力として、「新宿のカフェでコーヒー」と発声し、音声認識部401が「コーヒー」を「紅茶」と誤認識した場合を例に挙げて説明する。
この場合、図4(a)に示すように、タッチパネルディスプレイ300の表示領域301には、キーワード抽出部402によって抽出された各検索キーワードからなる検索キーワード列302が表示される。なお、図4(a)〜(c)における符号303は、表示中の検索キーワード列を検索条件として検索を開始させるための完了ボタン、符号304は、音声認識をやり直すための再発声ボタンに相当する画像である。
このとき、利用者は、「コーヒー」と発声したにもかかわらず、検索キーワードとして「紅茶」の文字が表示されているため、表示領域301内の「紅茶」という検索キーワードが表示されている位置に触れて、「紅茶」という検索キーワードを不正解キーワードとして選択する。
こうして利用者により不正解キーワードが選択されると、候補提示部404は、図4(a)に示すように、「紅茶」という不正解キーワードの色を反転させ、その後、図4(b)に示すように、商品に関する候補リストが格納されているスロット(3)409cから、「紅茶」の次候補である「コーラ」というキーワード候補を読み出して、表示中の「紅茶」を「コーラ」に置換して表示領域301に表示させる。
このとき、利用者は、自身が発声した「コーヒー」という検索キーワードではなく、「コーラ」という検索キーワードが表示されたため、再度検索キーワードを修正するために、「コーラ」という検索キーワードが表示されている位置に触れて、「コーラ」という検索キーワードを不正解キーワードとして選択する。
こうして利用者により不正解キーワードが選択されると、候補提示部404は、図4(b)に示すように、「コーラ」という不正解キーワードの色を反転させ、その後、図4(c)に示すように、商品に関する候補リストが格納されているスロット(3)409cから、「コーラ」の次候補である「コーヒー」というキーワード候補を読み出して、表示中の「コーラ」を「コーヒー」に置換して表示領域301に表示させる。
このとき、利用者は、自身が発声した「コーヒー」という検索キーワードが表示されるため、完了ボタン303が表示されている位置に触れて検索キーワードの入力を完了させる。こうして完了ボタン303が操作されると、候補提示部404は、検索部405へ検索の開始を支持する信号を出力する。
このように、本実施形態の検索装置100では、候補提示部404が、選択手段により選択された不正解キーワードをキーワード候補に置換してタッチパネルディスプレイ300に表示させ、当該表示させたキーワード候補が修正対象として利用者により選択される度に、表示中のキーワード候補だけを表示中のキーワード候補が格納されている候補リスト中の他のキーワード候補に順次置換して表示させるので、利用者は、「コーヒー」という検索キーワードを何度も再発声する必要がなく、候補示部408により表示されるキーワード候補を選択するだけで、不正解キーワードの修正を行うことができる。
ここでは、利用者がタッチパネルディスプレイ300に表示されたキーワード候補を不正解キーワードとして選択する度に、候補提示部404が不正解キーワードと同じ候補リストに記憶されている次候補のキーワード候補を順次表示させるように構成しているが、本実施形態の検索装置100では、各スロットに各検索キーワード単位で検索キーワードの候補リストを格納させているため、次候補のキーワード候補を表示させる代わりに、キーワード候補を一覧として表示させることもできる。
ここで、図5(a)〜(c)を参照して、候補提示部404がキーワード候補を一覧としてタッチパネルディスプレイ300に表示させる際の画像の一例について説明する。ここでも、利用者が音声入力として、「新宿のカフェでコーヒー」と発声し、音声認識部401が「コーヒー」を「紅茶」と誤認識した場合を例に挙げて説明する。なお、図5において、図4と同一の用件には同一の符号を付している。
この場合、図5(a)に示すように、タッチパネルディスプレイ300の表示領域301には、キーワード抽出部402によって抽出された各検索キーワードからなる検索キーワード列302が表示される。
このとき、利用者は、「コーヒー」と発声したにもかかわらず、検索キーワードとして「紅茶」の文字が表示されているため、表示領域301内の「紅茶」という検索キーワードが表示されている位置に触れて、「紅茶」という検索キーワードを不正解キーワードとして選択する。
こうして利用者により不正解キーワードが選択されると、候補提示部404は、図5(a)に示すように、「紅茶」という不正解キーワードの色を反転させ、その後、図5(b)に示すように、商品に関する不正解キーワードに関するキーワード候補が格納されているスロット(3)409cから、候補リスト内の全てのキーワード候補を読み出して、候補一覧305として表示領域301に表示させる。なお、図5(b)中の符号305aは、キーワード候補が多い場合に、候補一覧をスライドさせるために用いるスクロールボタンに相当する画像である。
このとき、利用者は、候補一覧305の中から、自身が発声した「コーヒー」という検索キーワードが表示されている位置に触れて、「コーヒー」というキーワード候補を検索キーワードとして選択する。
こうして利用者により検索キーワードが選択されると、候補提示部404は、図5(c)に示すように、「コーヒー」という不正解キーワードの色を反転させ、その後、図5(c)に示すように、表示中の「コーラ」を「コーヒー」に置換して表示領域301に表示させる。
このとき、利用者は、自身が発声した「コーヒー」という検索キーワードが表示されるため、完了ボタン303が表示されている位置に触れて検索キーワードの入力を完了させる。こうして完了ボタン303が操作されると、候補提示部404は、検索部405へ検索の開始を支持する信号を出力する。
また、利用者は、候補提示部404により候補一覧305が表示された際、候補一覧305の中に所望するキーワード候補が含まれて居なかった場合、再発声ボタン304に触れることによって、再度音声入力を行う。
このように、本実施形態の検索装置100では、利用者により検索キーワード列から不正解キーワードが選択された場合に、その不正解キーワードに対応する候補リスト内の全てのキーワード候補を候補一覧305として表示させ、利用者により候補一覧305からキーワード候補が選択された場合に、選択部402により選択された不正解キーワードを候補一覧305から選択されたキーワード候補に置換して表示させるため、利用者は、「コーヒー」という検索キーワードを何度も再発声する必要がなく、候補示部408により表示される候補一覧305から所望するキーワード候補を選択するだけで、不正解キーワードの修正を行うことができる。
しかも、利用者は、候補一覧305を参照するだけで、自身が所望するキーワード候補が候補リストに存在するか否かを一目で確認することができるため、候補リスト305に所望のキーワード候補が存在しなかった場合に、すぐに再発声ボタン304を操作することによって、再度音声入力を開始させることができるので、検索キーワードの音声入力を迅速にさせることができる。
図1の説明に戻り検索部405について説明する。検索部405は、タッチパネルディスプレイ300から完了ボタン303が操作されたことを示す信号が入力されると、キーワード抽出部402により抽出され、修正が行われなかった検索キーワードと、候補提示部404により不正解キーワードと置換されたキーワード候補とからなる検索キーワード列を取得し、その検索キーワード列を用いてデータベース501を検索して、検索キーワードに該当する複数の施設や店舗に関する情報(住所、電話番号、GPSによる位置情報等)をデータベース501から取得して、地図情報合成部406へ出力する処理を行う処理部である。ここで、データベース501は、検索対象となる飲食店などの施設名や、各施設の住所や位置といった位置情報、各施設が提供する商品などの情報を関連付けて記憶しているものとする。
地図情報合成部406は、検索部405から入力された検索キーワードに該当する複数の施設や店舗に関する情報と、記憶部500の地図情報502とを合成する処理を行う処理部である。たとえば、「新宿」の近くにある「カフェ」で「コーヒー」を提供している店舗の所在位置や、住所、メニュー一覧が通知された場合、地図情報合成部406は、新宿周辺の地図に、検索したカフェの所在位置を示すマークを合成してタッチパネルディスプレイ300へ表示する。そして、利用者が特定の「カフェ」を示すマークに触れた場合には、そのカフェの住所やメニュー一覧を表示する。
再音声認識開始部407は、利用者が表示領域301における再発声ボタン304の表示位置に触れた場合に、候補リスト格納部409へ削除信号を出力することによって、候補リスト格納部409内の全てのスロット(スロット(1)409a、スロット(2)409b、スロット(3)409c)に格納している全ての候補リストを削除させる。
記憶部500は、不揮発性メモリやハードディスクドライブといった記憶デバイスで構成される記憶部であり、データベース501と、地図情報502とを記憶する。データベース501は、検索対象となる飲食店などの施設名や、各施設の住所や位置といった位置情報、各施設が提供する商品などの情報を関連付けたデータベースである。また、地図情報502は、道路や施設、地名などが含まれたマップ情報である。
次に、本実施形態に係る検索装置100が実行する処理手順について図6〜図8を参照して説明する。図6は、候補提示部404がキーワード候補を順次タッチパネルディスプレイ300に表示させる場合に、検索装置100が実行する処理手順を示すフローチャートであり、図7は、候補提示部404がキーワード候補の候補一覧305をタッチパネルディスプレイ300に表示させる場合に、検索装置100が実行する処理手順を示すフローチャートであり、図8は、候補抽出部408がキーワード候補を各スロットに重複なく格納させる際に、検索装置100が実行する処理手順を示すフローチャートである。
候補提示部404がキーワード候補を順次タッチパネルディスプレイ300に表示させる場合、検索装置100では、図6に示すように、音声認識部401が音声入力を検知すると(ステップS101:Yes)、その音声をデジタルデータに変換し、複数の単語からなる単語列を生成してキーワード抽出部402へ出力する。一方、音声認識部401が音声入力を検知しない場合(ステップS101:No)、処理が終了される。
キーワード抽出部402は、音声認識部401から入力される単語列から助詞や助動詞等の単語を除いて、複数の名詞からなる検索キーワードを抽出し、抽出した複数の検索キーワードからなるキーワード列を候補抽出部408へ出力する(ステップS102)。
候補抽出部408は、キーワード抽出部402から入力された検索キーワード列の認識結果候補として、複数のキーワード列の候補(たとえば、図3に示す第1〜第5候補)を作成する(ステップS103)。
その後、候補抽出部408は、各認識結果候補における各単語(キーワード候補)を「場所」、「ジャンル」、「商品」等のカテゴリーに分類したうえで、キーワード抽出部により抽出された各検索キーワード毎に作成したキーワード候補の候補リストを、対応する各スロットに格納する候補リスト格納処理を実行する(ステップS104)。この候補リスト格納処理は、後に図8を参照して具体的に説明する。
その後、不正解キーワード選択部403は、候補リスト格納部409の各スロットから検索キーワードを取得してタッチパネルディスプレイ300へ表示(図4(a)参照)させる(ステップS105)。その後、不正キーワード選択部403は、利用者による検索キーワードの修正操作を検知したか否かを判定する(ステップS106)。ここで、不正解キーワード選択部403は、表示中の3つの検索キーワードのうち、いずれかの検索キーワードが表示されている位置が利用者により触れられたこと(図4(a)参照)を検知した場合に、修正操作を検知する。
そして、不正解キーワード選択部403は、利用者による修正操作を検知した場合(ステップS106:Yes)、利用者により不正解キーワードとして選択された検索キーワードに関する情報を候補提示部へ出力して、処理をステップS107へ移し、利用者による修正操作を検知しなかった場合には(ステップS106:No)、処理をステップS108へ移す。
処理がステップS107に移ると、候補提示部404は、不正解キーワード選択部403から入力された検索キーワード(不正解キーワード)に対応するスロットから次候補のキーワード候補を読み出し、不正解キーワードと入れ替えて表示領域301に表示させる(図4(b)参照)。
その後、候補提示部404は、利用者による完了操作を検知したか否かを判定する(ステップS108)。ここで、候補提示部404は、表示領域301において完了ボタン303の表示位置が利用者に触れられたことを検知した場合に、完了操作を検知したと判定して(ステップS108:Yes)、その旨を検索部405へ通知する。
この通知を受け付けると、検索部406は、表示中の検索キーワード列を検索条件としてデータベース501を検索し、該当する施設に関する情報を取得して地図情報合成部406へ出力する。地図情報合成部406は、検索部405から入力された情報と地図情報502とを合成したうえで、タッチパネルディスプレイ12に表示させる(ステップS109)。
一方、候補提示部404は、利用者による完了操作を検知していないと判定した場合に(ステップS108:No)、処理をステップS111へ移す。ステップS111において、再音声認識開始部407は、利用者による再発声操作を検知したか否かを判定する。
ここで、再音声認識開始部407は、表示領域における再発声ボタン304の表示位置が利用者により触れられたことを検知した場合に再発声操作を検知したと判定して(ステップS111:Yes)、候補リスト格納部409に格納している候補リストを削除し(ステップS112)、その後、処理をステップS101へ移す。このとき、再音声認識開始部407は、ステップS206で選択された不正解キーワードに対応するスロットに格納している候補リストだけを削除する。なお、このとき、再音声認識開始部407は、全てのスロットに格納している候補リストを削除するように構成してもよい。
一方、再音声認識開始部407は、利用者による再発声操作を検知していないと判定した場合には(ステップS111:No)、処理をステップS106へ移す。
そして、この検索装置100では、修正操作が検知され(ステップS106:Yes)、その後、完了操作が検知されず(ステップS108:No)、再発声操作も検知されなかった場合(ステップS111:No)、候補提示部404がステップS107の処理を実行する度に、次候補のキーワード候補を順次表示させる。
次に、候補提示部404がキーワード候補の候補一覧305をタッチパネルディスプレイ300に表示させる場合について説明する。図7に示すフローチャートにおけるステップS201〜ステップS205の処理は、図6に示すステップS101〜ステップS105の処理と同一の処理であるため、これらの処理については簡単に説明する。
図7に示すように、候補提示部404がキーワード候補の候補一覧305をタッチパネルディスプレイ300に表示させる場合、検索装置100では、図7に示すように、利用者による音声入力を検知すると(ステップS201:Yes)、その音声から検索キーワードを抽出し(ステップS202)、その後、認識結果である検索キーワード列と、キーワード列の各検索キーワード毎に、複数のキーワード候補を作成する(ステップS203)。なお、利用者による音声入力を検知しない場合には(ステップS201:No)、処理を終了する。
次に、検索装置100では、ステップS204で作成した候補リストを候補リスト格納部409に格納して(ステップS204)、キーワード抽出部402により抽出した検索キーワード列をタッチパネルディスプレイ300に表示させる(ステップS205)。
次に、検査装置100では、不正解キーワード選択部403が利用者による検索キーワードの修正操作を検知したか否かの判定を行い(ステップS206)、修正操作を検知した場合に(ステップS206:Yes)、修正操作により選択された検索キーワード(不正解キーワード)を候補提示部404へ出力して処理をステップS207へ移し、修正操作を検知しなかった場合には(ステップS206:No)、処理をステップS209へ移す。
ステップS207において、候補提示部404は、不正解キーワード選択部403から入力された検索キーワード(不正解キーワード)に対応するスロットから、そのスロットに格納している候補リスト内の全てのキーワード候補を候補一覧305として表示領域301に表示させ、その後、処理をステップS208へ移す。
ステップS208において、候補提示部404は、利用者により候補一覧305からキーワード候補が選択されたか否かを判定する。このとき、候補提示部404は、表示している候補一覧305中のいずれかのキーワード候補が利用者により触れられた場合に、キーワード候補が選択されたと判断する。
そして、候補提示部404は、いずれかのキーワード候補が選択されたと判定した場合に(ステップS208:Yes)、処理をステップS209へ移し、キーワード候補が選択されていないと判定した場合に(ステップS208:No)、処理をステップS211へ移す。
ステップS209において、候補提示部404は、完了操作を検知したか否かを判定し、完了操作を検知した場合に(ステップS209:Yes)、表示中の検索キーワード列を検索部へ出力して処理をステップS210へ移し、完了操作を検知しなかった場合に(ステップS209:No)、処理をステップS211へ移す。
ステップS210において、検索部405は、候補提示部404から入力された検索キーワード列を検索条件としてデータベース501を検索し、該当する施設に関する情報を取得して地図情報合成部406へ出力する。地図情報合成部406は、検索部405から入力された情報と地図情報502とを合成したうえで、タッチパネルディスプレイ12に表示させる。
また、ステップS211において、再音声認識開始部407は、再発声操作を検知したか否かを判定し、再発声操作を検知した場合に(ステップS211:Yes)、候補リスト格納部409に格納している候補リストを削除して(ステップS212)、処理をステップS201へ移す。このとき、再音声認識開始部407は、ステップS206で選択された不正解キーワードに対応するスロットに格納している候補リストだけを削除する。なお、このとき、再音声認識開始部407は、全てのスロットに格納している候補リストを削除するように構成してもよい。
一方、再音声認識開始部407は、利用者による再発声操作を検知していないと判定した場合には(ステップS211:No)、処理をステップS209へ移す。
次に、図6のステップS104、及び図7のステップS204で実行される候補リスト格納処理について図8を参照して説明する。図8において、Kは、認識結果候補の数(図3に示した例では、第1〜第5候補:5)、Nは、スロットの数(図3に示した例では、スロット(1)〜(3):3)を示しており、iは、認識結果候補の番号、jは、スロットの番号を示している。
図8に示すように、この候補リスト格納処理が開始されると、候補抽出部408は、まず、変数iに1を代入し(ステップS301)、その後、iがK以下であるか否かを判定する(ステップS302)。そして、候補抽出部408は、iがK以下でないと判定した場合に(ステップS302:No)、この候補リスト格納処理を終了し、iがK以下であると判定した場合に(ステップS302:Yes)、変数jに1を代入する(ステップS303)。
続いて、候補抽出部408は、jがN以下であるか否かの判定を行い(ステップS304)、jがN以下でないと判定した場合に(ステップS304:No)、変数iを1インクリメントし(ステップS309)、その後、処理をステップS302へ移す。
一方、候補抽出部408は、jがN以下であると判定した場合に(ステップS304:Yes)、i番目の音声認識結果候補(単語列:キーワード候補列)からスロット(j)のための単語(キーワード候補)を抽出する(ステップS305)。
続いて、候補抽出部408は、ステップS305で抽出した単語(キーワード候補)がスロット(j)の候補リストに存在するか否かを判定し(ステップS306)、存在すると判定した場合(ステップS306:Yes)、処理をステップS308へ移し、存在しないと判定した場合(ステップS306:No)、ステップS305で抽出した単語(キーワード候補)をスロット(j)の候補リストに格納させ(ステップS307)、その後、変数jを1インクリメントして(ステップS308)、処理をステップS304へ移す。
候補抽出部408は、上記ステップS301〜S309の処理を実行することによって、複数の音声認識結果候補における各単語(キーワード候補)を、キーワード抽出部402により抽出した各検索キーワードにそれぞれ対応するスロットへ重複なく格納させる。
ところで、上記した実施形態では、候補抽出部408がキーワード抽出部402により抽出された各検索キーワードと発音の類似するキーワード候補をデータベースから抽出して、各検索キーワード単位でキーワード候補の候補リストを作成し、各スロットに格納するように構成しているが、候補抽出部408によるキーワード候補の選択方法は、これに限定されるものではない。
たとえば、検索装置100にGPS(Global Positioning System)を設け、候補抽出部408と記憶部500内の地図情報とを接続する構成とし、場所に関するキーワード候補を候補抽出部408がデータベースから抽出する際に、検索装置100の現在位置と地図情報502とから、検索キーワードに発音が類似し、且つ検索装置100の現在位置に最も近い場所を示すキーワード候補を候補抽出部408に抽出させるように構成してもよい。
このように検索装置100を構成することによって、たとえば、利用者が各地に複数存在する地名を音声入力した場合であっても、候補抽出部408により検索装置100の現在位置に近い地名のキーワード候補を抽出することができるため、利用者は、所望する地名を検索装置100に入力することができるようになり、検索装置100の現在位置から遠く離れた場所の地名がキーワード候補として抽出されないので、再音声認識のために再発声する回数を低減させることができる。
100 検索装置
200 マイク
300 タッチパネルディスプレイ
400 制御部
401 音声認識部
402 キーワード抽出部
403 不正解キーワード選択部
404 候補提示部
405 検索部
406 地図情報合成部
407 再音声認識開始部
408 候補抽出部
409 候補リスト格納部
409a〜409c スロット(1)〜(3)
500 記憶部
501 データベース
502 地図情報

Claims (4)

  1. 利用者による発声を音声認識することで得られた検索キーワード列を検索条件として所定のデータベースを検索する検索装置であって、
    前記検索キーワード列の各検索キーワード毎に、前記検索キーワードに発音の類似した複数のキーワード候補を前記データベースから抽出する候補抽出手段と、
    前記候補抽出手段により抽出したキーワード候補を重複なく候補リストとして各検索キーワード単位で格納する候補リスト格納手段と、
    前記検索キーワード列に含まれる各検索キーワードを表示させて修正対象となる検索キーワードを示す不正解キーワードを利用者に選択させる選択手段と、
    前記選択手段により前記不正解キーワードが選択された場合に、選択された不正解キーワードに対応する前記候補リスト内の前記キーワード候補を表示させ、当該表示させたキーワード候補を前記検索キーワードとして利用者に選択させる候補提示手段と
    を有することを特徴とする検索装置。
  2. 前記候補提示手段は、前記選択手段により選択された前記不正解キーワードを前記キーワード候補に置換して表示させ、当該表示させたキーワード候補が修正対象として利用者により選択される度に、表示中のキーワード候補を前記表示中のキーワード候補が格納されている前記候補リスト中の他のキーワード候補に順次置換して表示させることを特徴とする請求項1に記載の検索装置。
  3. 前記候補提示手段は、前記選択手段により選択された不正解キーワードに対応する前記候補リスト内の全ての前記キーワード候補を一覧として表示させ、利用者により前記一覧からキーワード候補が選択された場合に、前記選択手段により選択された前記不正解キーワードを前記一覧から選択されたキーワード候補に置換して表示させることを特徴とする請求項1に記載の検索装置。
  4. 前記候補リスト格納手段により格納した前記候補リストを削除して、利用者による発声の音声認識を再度開始させるために操作する再音声認識開始手段を有することを特徴とする請求項1〜3のいずれか1項に記載の検索装置。
JP2009077365A 2009-03-26 2009-03-26 検索装置 Active JP5364412B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009077365A JP5364412B2 (ja) 2009-03-26 2009-03-26 検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009077365A JP5364412B2 (ja) 2009-03-26 2009-03-26 検索装置

Publications (2)

Publication Number Publication Date
JP2010231433A true JP2010231433A (ja) 2010-10-14
JP5364412B2 JP5364412B2 (ja) 2013-12-11

Family

ID=43047193

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009077365A Active JP5364412B2 (ja) 2009-03-26 2009-03-26 検索装置

Country Status (1)

Country Link
JP (1) JP5364412B2 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012063770A1 (ja) * 2010-11-10 2012-05-18 楽天株式会社 関連語登録装置、情報処理装置、関連語登録方法、関連語登録装置用プログラム、および、記録媒体
JP2012237997A (ja) * 2011-05-12 2012-12-06 Nhn Corp 単語レベルの変換候補生成に基づく音声認識システム及び方法
DE112011103473T5 (de) 2010-10-14 2013-08-01 Ntn Corporation Eine eine Verbindung tätigende Vorrichtung
CN103366742A (zh) * 2012-03-31 2013-10-23 盛乐信息技术(上海)有限公司 语音输入方法及系统
WO2014041607A1 (ja) 2012-09-11 2014-03-20 株式会社東芝 情報処理装置、情報処理方法およびプログラム
KR20160032564A (ko) * 2014-09-16 2016-03-24 삼성전자주식회사 영상표시장치, 영상표시장치의 구동방법 및 컴퓨터 판독가능 기록매체

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001005809A (ja) * 1999-06-25 2001-01-12 Toshiba Corp 文書作成装置、文書作成方法、及び文書作成プログラムが記録された記録媒体
JP2005275228A (ja) * 2004-03-26 2005-10-06 Equos Research Co Ltd ナビゲーション装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001005809A (ja) * 1999-06-25 2001-01-12 Toshiba Corp 文書作成装置、文書作成方法、及び文書作成プログラムが記録された記録媒体
JP2005275228A (ja) * 2004-03-26 2005-10-06 Equos Research Co Ltd ナビゲーション装置

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE112011103473T5 (de) 2010-10-14 2013-08-01 Ntn Corporation Eine eine Verbindung tätigende Vorrichtung
DE112011103473B4 (de) 2010-10-14 2024-06-06 Ntn Corporation Eine verbindungstätigende Vorrichtung
KR101368594B1 (ko) * 2010-11-10 2014-02-27 라쿠텐 인코포레이티드 관련어 등록 장치, 정보 처리 장치, 관련어 등록 방법 및 기록 매체
JP5101759B2 (ja) * 2010-11-10 2012-12-19 楽天株式会社 関連語登録装置、情報処理装置、関連語登録方法、関連語登録装置用プログラム、および、記録媒体
US8606565B2 (en) 2010-11-10 2013-12-10 Rakuten, Inc. Related-word registration device, information processing device, related-word registration method, program for related-word registration device, and recording medium
KR101361403B1 (ko) 2010-11-10 2014-02-11 라쿠텐 인코포레이티드 관련어 등록 장치, 정보 처리 장치, 관련어 등록 방법 및 기록 매체
WO2012063770A1 (ja) * 2010-11-10 2012-05-18 楽天株式会社 関連語登録装置、情報処理装置、関連語登録方法、関連語登録装置用プログラム、および、記録媒体
JP2013008372A (ja) * 2010-11-10 2013-01-10 Rakuten Inc 関連語登録装置、情報処理装置、関連語登録方法、関連語登録装置用プログラム、および、記録媒体
US8738366B2 (en) 2010-11-10 2014-05-27 Rakuten, Inc. Related-word registration device, information processing device, related-word registration method, program for related-word registration device, and recording medium
JP2012237997A (ja) * 2011-05-12 2012-12-06 Nhn Corp 単語レベルの変換候補生成に基づく音声認識システム及び方法
US9002708B2 (en) 2011-05-12 2015-04-07 Nhn Corporation Speech recognition system and method based on word-level candidate generation
CN103366742A (zh) * 2012-03-31 2013-10-23 盛乐信息技术(上海)有限公司 语音输入方法及系统
WO2014041607A1 (ja) 2012-09-11 2014-03-20 株式会社東芝 情報処理装置、情報処理方法およびプログラム
JPWO2014041607A1 (ja) * 2012-09-11 2016-08-12 株式会社東芝 情報処理装置、情報処理方法およびプログラム
KR102348084B1 (ko) * 2014-09-16 2022-01-10 삼성전자주식회사 영상표시장치, 영상표시장치의 구동방법 및 컴퓨터 판독가능 기록매체
KR20160032564A (ko) * 2014-09-16 2016-03-24 삼성전자주식회사 영상표시장치, 영상표시장치의 구동방법 및 컴퓨터 판독가능 기록매체

Also Published As

Publication number Publication date
JP5364412B2 (ja) 2013-12-11

Similar Documents

Publication Publication Date Title
US8949133B2 (en) Information retrieving apparatus
RU2379767C2 (ru) Коррекция ошибок для систем распознавания речи
JP5364412B2 (ja) 検索装置
US7310602B2 (en) Navigation apparatus
JP4466379B2 (ja) 車載音声認識装置
JP2010230918A (ja) 検索装置
JP5705312B2 (ja) 情報機器
WO2016088411A1 (ja) 情報処理装置、情報処理方法およびプログラム
JP2006031033A (ja) 情報処理装置
JP6100101B2 (ja) 音声認識を利用した候補選択装置および候補選択方法
JP2005044220A (ja) 文字入力装置
JP2005275228A (ja) ナビゲーション装置
JP5396426B2 (ja) 音声認識装置、音声認識方法及び音声認識プログラム
JP2009140287A (ja) 検索結果表示装置
JP5455355B2 (ja) 音声認識装置及びプログラム
JP4926689B2 (ja) 施設検索装置
JP4381632B2 (ja) ナビゲーションシステムおよびその目的地入力方法
US20150192425A1 (en) Facility search apparatus and facility search method
JP3903841B2 (ja) 自動通訳装置及び自動通訳用プログラム
JP2010038751A (ja) ナビゲーション装置
JPH0916191A (ja) ナビゲータ用音声認識装置および方法
JP2005018442A (ja) 表示処理装置、表示処理方法、表示処理プログラム、および記録媒体
JP2004309928A (ja) 音声認識装置、電子辞書装置、音声認識方法、検索方法、及びプログラム
JP2005316022A (ja) ナビゲーション装置及びプログラム
JP6115202B2 (ja) 音声認識システム、方法およびプログラム

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20120216

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120217

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120220

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20120216

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130412

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130416

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130614

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130813

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130909

R150 Certificate of patent or registration of utility model

Ref document number: 5364412

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250