JP2014137636A

JP2014137636A - 情報検索装置及び情報検索方法

Info

Publication number: JP2014137636A
Application number: JP2013004761A
Authority: JP
Inventors: Shin Oguri; 伸小栗; Shinya Iizuka; 真也飯塚; Fumihiko Kato; 文彦加藤; Chisa Takeda; 千沙竹田
Original assignee: NTT Docomo Inc
Current assignee: NTT Docomo Inc
Priority date: 2013-01-15
Filing date: 2013-01-15
Publication date: 2014-07-28
Anticipated expiration: 2033-01-15
Also published as: JP5583230B2

Abstract

【課題】文字列を用いて所定のデータベースを検索する際における検索誤りを効率よく低減することができる情報検索装置及び情報検索方法を提供する。
【解決手段】情報検索装置１は、１つの検索用情報として、文字列を示す文字列情報を１以上取得する文字列情報取得部１２と、文字列情報取得部１２により取得された文字列情報毎に、当該文字列情報が示す文字列の文字数を計数する文字数計数部１３と、文字列情報取得部１２により取得された検索用情報を用いて、文字数計数部１３により計数された当該文字列情報毎の文字数に応じた検索を実行することにより検索結果を取得する検索部１５と、検索部１５により取得された検索結果を出力する検索結果出力部１７と、を備える。
【選択図】図１

Description

本発明は、文字列を用いて所定のデータベースからデータを検索する情報検索装置及び情報検索方法に関する。

従来から、ユーザの発話音声を入力し、当該音声を認識することによりテキスト形式の音声認識結果を得て、当該音声認識結果を検索キーワードとして所定のデータベースを検索する技術が知られている（下記特許文献１参照）。

下記特許文献１では、音声認識結果に基づいて例文検索を行う場合において、まずユーザに音声認識結果を提示し、ユーザ自身に誤認識した単語を除く操作を実行させることにより、誤認識した単語を含む文字列での検索を防止する方法が提案されている。

特開２００３−３３０９２５号公報

しかしながら、上記方法では、ユーザによる確認及び操作を要するため、ユーザの手間がかかる。また、ユーザが一旦音声認識結果を確認及び操作する処理が介在することにより、一連の検索処理が完了するまでにより多くの時間がかかってしまうという問題もある。また、上記方法では、分節された複数の文字列毎に検索を行う場合において分節誤りが生じた際の対策はされていない。以下、これについて具体例を用いて説明する。

例えば、「斉藤洋子さんに電話」という入力音声について形態素解析等による音声認識がされて、「斉藤／洋子／さん／に／電話」のように「／」で分節された５つの文字列（音声認識結果）が得られる場合を考える。このようにして得られた各文字列を検索キーワードとして、例えば氏名及び電話番号を示す情報等が互いに関連付けられたデータを格納した電話帳データベースを検索することにより、氏名を示す情報が「斉藤洋子」であるデータを取得し、ユーザに提示することが可能になる。

しかしながら、上記例において、音声認識処理で「佐／伊藤／洋子さん／に／電話」と誤認識（変換誤り及び分節誤り等）が生じた場合には、不適切な検索キーワード（「佐」）が得られる。このような不適切な検索キーワードを用いて検索を実行すると、例えば「佐藤」及び「佐々木」等のユーザの意図しない検索結果がユーザに提示され、ユーザの利便性を損なうという問題が生じ得る。

本発明は、上記の課題に鑑みてなされたものであり、文字列を用いて所定のデータベースを検索する際における検索誤りを効率よく低減することができる情報検索装置及び情報検索方法を提供することを目的とする。

本発明に係る情報検索装置は、１つの検索用情報として、文字列を示す文字列情報を１以上取得する文字列情報取得手段と、文字列情報取得手段により取得された文字列情報毎に、当該文字列情報が示す文字列の文字数を計数する文字数計数手段と、文字列情報取得手段により取得された検索用情報を用いて、文字数計数手段により計数された当該文字列情報毎の文字数に応じた検索を実行することにより検索結果を取得する検索手段と、検索手段により取得された検索結果を出力する検索結果出力手段と、を備える。

本発明に係る情報検索装置では、１つの検索用情報として１以上の文字列情報を取得し、当該文字列情報毎の文字数に応じた検索を実行する。これにより、例えば、検索誤りを生じやすい文字列情報を文字数に基づいて抽出し、当該文字列情報を検索用情報から除外する等の適切な処理を行った上で検索を実行することができる。したがって、取得した文字列情報をそのまま用いて検索した場合に生じる検索誤りを防止することができる。即ち、文字列を用いて所定のデータベースを検索する際における検索誤りを効率よく低減することができる。

上記情報検索装置では、検索手段は、文字数が１文字の文字列情報を除外し、文字数が２文字以上の文字列情報を用いて検索を実行してもよい。

上記構成によれば、検索用文字列として用いた場合に検索誤りを生じる可能性の高い文字列情報（文字数が１文字の文字列情報）を検索用情報から除外することにより、検索誤りを効率よく低減することができる。

上記情報検索装置では、文字列情報取得手段は、予め順序付けされた複数の文字列情報を取得し、検索手段は、上記順序付けに基づいて文字数が１文字の異なる２つの文字列情報が互いに隣接するか否かを判定し、当該２つの文字列情報が互いに隣接する場合には、当該２つの文字列情報が示す文字列同士を連結して新たな文字列を生成し、当該新たな文字列を示す情報を含む文字数が２文字以上の文字列情報を用いて検索を実行してもよい。

例えば、文字列情報取得手段は、元々１つの文字列が本来分離すべきではない箇所（例えば「加護（カゴ）」という氏名を示す文字列についての「カ」と「ゴ」との間）で分割（分節）されて生成された各文字列を示す文字列情報を取得する場合がある。このような場合、上記構成によれば、「カ」と「ゴ」とを連結して「カゴ」（新たな文字列）を生成し、当該新たな文字列を検索用文字列として用いて検索することが可能となる。これにより、検索誤りの発生を防止すると共に、より検索に適した新たな文字列（「カゴ」）を用いて検索を実行することができるため、検索精度を向上させることが期待できる。

上記情報検索装置では、検索手段は、文字数が１文字の文字列情報を用いた検索と文字数が２文字以上の文字列情報を用いた検索とについて、互いに異なる検索条件に基づいて検索を実行してもよい。

例えば人の氏名等を示す文字列情報を含むデータベースを検索する場合等には、文字数が１文字の文字列は、分節誤りにより得られた文字列である可能性が高く、検索用文字列として適切ではない可能性が高いと考えられる。そのため、例えば、文字数が１文字の文字列を検索用文字列として、当該検索用文字列が部分的に含まれていれば検索結果として抽出する部分一致検索等のあいまい検索を行った場合には、大量の検索誤りが生じるおそれがある。一方で、例えば「李（り）」や「津（つ）」等、文字数が１文字の苗字（氏）も存在し得る。上記構成によれば、例えば、文字数が２文字以上の文字列については上述のあいまい検索を実行し、文字数が１文字の文字列については当該文字列が過不足なく含まれている場合に限り検索結果として抽出する完全一致検索を実行するというように、文字数に応じて適切な検索条件に基づいて検索を実行することが可能となる。これにより、ユーザの所望する情報を取得できる可能性を高めると共に、検索誤りを効率よく低減することができる。

上記情報検索装置は、ユーザの一連の発話音声を入力し、当該発話音声に対して音声認識処理を行うことにより文字列情報を生成する音声認識手段を更に備え、文字列情報取得手段は、音声認識手段により生成された文字列情報を取得してもよい。

上記構成によれば、文字列情報取得手段は、音声認識手段によってユーザの発話音声から文字列情報を取得することができる。また、当該文字列情報が音声認識によって分節誤りが生じた結果としての文字列情報である場合であっても、上述した各手段によって検索誤りを効率よく低減することができる。

上記情報検索装置では、第１の文字種別とは異なる第２の文字種別で示される文字列情報を用いて検索を実行することにより検索結果を取得する第２の検索手段を更に備え、文字列情報取得手段は、検索用情報としての第１の文字種別で示される第１の文字列情報と、当該第１の文字列情報と対応し且つ第２の文字種別で示される第２の文字列情報とを取得し、文字数計数手段及び検索手段は、第１の文字列情報に対して各処理を実行し、第２の検索手段は、第２の文字列情報を用いて検索を実行し、検索結果出力手段は、検索手段により取得された第１の検索結果と第２の検索手段により取得された第２の検索結果とに基づいて検索結果を出力してもよい。

上記構成によれば、例えばカタカナ（第１の文字種別）で示される文字列情報（第１の文字列情報。例えば「カゴ」）について上述の検索を実行し、検索結果（第１の検索結果）を取得する。それと同時に、例えば漢字（第２の文字種別）で示される文字列情報（第２の文字列情報。例えば「加護」）について任意の方法による検索を実行した検索結果（第２の検索結果）を取得する。これにより、検索結果出力手段は、各々の検索結果に基づいてユーザに提示する検索結果を出力することができる。即ち、複数の文字種別の各々について検索を実行し、各検索結果を総合的に評価して検索結果を出力することにより、検索の品質を向上させることが期待できる。

上記情報検索装置では、第２の検索手段は、第２の文字列情報に対して、検索手段が当該第２の文字列情報と対応する第１の文字列情報に対して当該第１の文字列情報の文字数に応じて実行する処理と同一の処理を実行し、当該第２の文字列情報を用いて検索を実行してもよい。

上記構成によれば、検索手段が第１の文字列情報に対して文字数に応じて何らかの処理（例えば、除外処理等）を行った上で検索を実行する場合には、第２の検索手段は、当該第１の文字列情報に対応する第２の文字列情報についても同様の処理を行った上で、検索手段と同様の検索方法により検索を実行する。これにより、例えば検索用情報から除外された第１の文字列情報に対応する第２の文字列情報についても検索用情報から除外することができ、検索誤りをより効率よく低減することができる。

ところで、本発明は、上記のように情報検索装置の発明として記述できる他に、以下のように情報検索方法の発明としても記述することができる。これらの発明はカテゴリが異なるだけで、実質的に同一の発明であるため、同様の作用及び効果を奏する。

即ち、本発明に係る情報検索方法は、１つの検索用情報として、文字列を示す文字列情報を１以上取得する文字列情報取得ステップと、文字列情報取得ステップにおいて取得された文字列情報毎に、当該文字列情報が示す文字列の文字数を計数する文字数計数ステップと、文字列情報取得ステップにおいて取得された検索用情報を用いて、文字数計数ステップにおいて計数された当該文字列情報毎の文字数に応じた検索を実行することにより検索結果を取得する検索ステップと、検索ステップにおいて取得された検索結果を出力する検索結果出力ステップと、を含む。

本発明によれば、文字列を用いて所定のデータベースを検索する際における検索誤りを効率よく低減することができる。

本発明の一実施形態に係る情報検索装置の機能構成を示すブロック図である。本発明の一実施形態に係る情報検索装置のハードウェア構成を示す図である。ユーザの発話音声に対する音声認識結果の例を示す図である。特定の文字についての変換の一例（長音ヨミ変換）を示す図である。情報検索装置の動作を説明するために用いる情報の例を示す図である。第１の例における情報検索装置の動作を示す図である。第２の例における情報検索装置の動作を示す図である。第３の例における情報検索装置の動作を示す図である。

以下、添付図面を参照しながら本発明の実施形態を詳細に説明する。なお、図面の説明において同一又は同等の要素には同一の符号を付し、重複する説明を省略する。

図１は、本発明に係る情報検索装置の一実施形態の構成図である。本実施形態に係る情報検索装置１は、例えばユーザに携帯される携帯端末等のユーザ端末であって、ユーザ利便性及び操作性を向上させるために、ユーザの発話音声に基づく検索サービスを提供可能としたものである。具体的には、情報検索装置１は、ユーザの発話音声を音声認識して得られた１以上の文字列情報を検索用情報として取得し、当該検索用情報を用いて所定のデータベースを検索する装置である。

本実施形態では、所定のデータベースとして、人の氏名を示す文字列情報と電話番号を示す情報とを関連付けて格納した電話帳データベースを想定している。即ち、情報検索装置１は、上述の検索用情報を検索キーワードとし、電話帳データベースに格納された人の氏名を示す文字列情報を検索対象として電話帳データベースを検索することにより、電話帳データベースから該当する情報（人の氏名及び電話番号）を取得する電話帳検索の機能をユーザに提供する装置である。

ただし、情報検索装置１の形態は上記に限定されない。例えば、情報検索装置１の各機能は、ユーザ端末から通信ネットワークを介して利用可能なサーバ上に備えられてもよい。この場合、ユーザはユーザ端末を介して情報検索装置１が提供する機能を利用することができる。また、情報検索装置１の各機能は、例えばユーザ端末とサーバとで分散され、ユーザ端末及びサーバが互いに協働して動作することにより実現されてもよい。

図１に示すように、本実施形態に係る情報検索装置１は、音声認識部１１と、文字列情報取得部１２と、文字数計数部１３と、電話帳データベースである文字列情報データベース１４と、検索処理を実行する検索部１５及び第２検索部１６と、検索結果を出力する検索結果出力部１７とを備える。

図２は、本実施形態に係る情報検索装置１のハードウェア構成図である。図２を用いて、情報検索装置１のハードウェア構成について説明する。図２に示すように、情報検索装置１は、オペレーティングシステムやアプリケーションプログラムなどを実行するＣＰＵ１０１と、ＲＯＭ及びＲＡＭで構成される主記憶部１０２と、ハードディスクメモリなどで構成される補助記憶部１０３と、データ通信を行う通信制御部１０４と、液晶モニタなどで構成される出力部１０５と、入力デバイスであるキーボード、マウス及びマイク等で構成される入力部１０６と、ＵＳＢメモリ、ＣＤ−ＲＯＭ、ＤＶＤなどの記録媒体１０８を読み取る記録媒体読取部１０７とを備える。

図１に示す情報検索装置１の各機能は、ＣＰＵ１０１の制御の下で、主記憶部１０２に所定のソフトウェアプログラムを読み込ませて実行することにより実現される。その際、ＣＰＵ１０１は、ソフトウェアプログラムの処理手順に従い、主記憶部１０２及び補助記憶部１０３におけるデータの読み出し及び書き込み動作を制御し、入力部１０６、出力部１０５及び通信制御部１０４の動作を制御する。以下、図１に示す情報検索装置１の各機能要素について説明する。

音声認識部１１は、ユーザの一連の発話音声を入力し、当該発話音声に対して従来の音声認識技術を用いて音声認識処理を実行し、音声認識結果としての文字列情報を生成する音声認識手段である。音声認識部１１は、例えば情報検索装置１に内蔵されたマイク等の音声入力を行うハードウェアと、当該ハードウェアを介して入力された音声に対して音声認識処理を実行して文字列情報を生成する音声認識ミドルウェアとを備えるものとして実現される。

音声認識部１１は、例えば「斎藤陽子さんに電話」という内容をユーザが意図して発話した音声を入力すると、当該発話音声に対して形態素解析等を用いて音声認識処理を実行する。その結果、音声認識部１１は、ヨミを示す文字列情報として、例えばカタカナ（第１の文字種別）で示される「サ／イトウ／ヨウコ／サン／ニ／デンワ」という文字列情報（第１の文字列情報）を取得する。ここで、「／」は、音声認識部１１が音声認識により単語の境界であると判定した箇所を示す。音声認識部１１は、「／」を境界として分節（分割）された一群の文字列情報（「／」で区切られた各々の単語が１つの文字列情報）を音声認識結果として取得する。なお、音声認識部１１が取得する音声認識結果は、必ずしも分節されている必要はなく、区切りのない１つの文字列情報であってもよい。

また、音声認識部１１は、第１の文字列情報に対応し、表記を示す文字列情報（第２の文字列情報）として、例えばひらがな、カタカナ及び漢字等が混在する文字種別（第２の文字種別）で示される「差／伊藤／洋子／さん／に／電話」という文字列情報（第２の文字列情報）を併せて取得してもよい。このような第２の文字列情報は、例えば情報検索装置１が内部に保持する変換辞書（ヨミを示す文字列と当該単語のかな漢字表記を示す文字列とを関連付けて格納した辞書）を用いて第１の文字列情報を変換すること等により得ることができる。

ここで、音声認識処理の精度は、周囲の雑音、及びユーザの発音の明瞭性等に依存するため、正しい音声認識結果が常に得られるとは限らない。そこで、音声認識部１１は、音声認識結果の候補（ｉ−Ｂｅｓｔ認識結果）を複数取得するものであってもよい。図３に、ユーザの発話音声に対する音声認識結果の例を示す。図３に示すように、例えば、音声認識部１１は、「斎藤陽子さんに電話」という内容をユーザが意図して発話した音声に対して音声認識処理を実行し、音声認識結果の第１候補（１−Ｂｅｓｔ認識結果）として、「サ／イトウ／ヨウコ／サン／ニ／デンワ」及び「差／伊藤／洋子／さん／に／電話」を取得し、第２候補（２−Ｂｅｓｔ認識結果）として、「サイトー／ヨウコ／サン／ニ／デンワ」及び「斎藤／陽子／さん／に／電話」を取得してもよい。ここで、「ｉ−Ｂｅｓｔ認識結果」における「ｉ」の値が小さいほど音声認識順位（音声認識の推定精度の順位）が高いことを示している。なお、上記の音声認識結果の候補の例は一例である。

文字列情報取得部１２は、１つの検索用情報として、文字列情報を１以上取得する文字列情報取得手段である。「１つの検索用情報」とは、例えば、音声認識結果の１つの候補（ｉ−Ｂｅｓｔ認識結果）に含まれる１以上の文字列情報である。具体的には、１つの検索用情報には、ヨミを示す第１の文字列情報（例えば「サ／イトウ／ヨウコ／サン／ニ／デンワ」）と、表記を示す第２の文字列情報（例えば「差／伊藤／洋子／さん／に／電話」）とが含まれる。後述する検索部１５及び第２の検索手段１６による検索によって、１つの検索用情報に対して１つの検索結果（順位付けされた検索結果）が得られる。

文字列情報取得部１２は、音声認識部１１により生成された音声認識結果（文字列情報）を取得する。図３に示すように、音声認識部１１が２つの音声認識結果の候補を生成した場合には、「１−Ｂｅｓｔ認識結果」に対応する文字列情報（ヨミ・表記）及び「２−Ｂｅｓｔ認識結果」に対応する文字列情報（ヨミ・表記）をそれぞれ１つの検索用情報として取得する。文字列情報取得部１２によって取得された第１の文字列情報（ヨミ）は、後述する検索部１５による検索に用いられ、第２の文字列情報（表記）は、後述する第２の検索部１６による検索に用いられる。音声認識結果の候補毎に得られる順位付けされた検索結果は、後述する検索結果出力部１７によって総合的に評価され、最終的に出力（ユーザに提示）されるユーザによる１つの発話に対応する１つの検索結果が生成及び出力される。

また、文字列情報取得部１２は、形態素解析等の技術を用いることによって、上述のように取得した文字列情報に対して、敬称削除及び名詞取得等の処理を行ってもよい。このような処理を行うことにより、文字列情報データベース１４を検索する際に適切な検索キーワードとなり得る文字列情報を効率よく抽出することができる。例えば、図３に示す「１−Ｂｅｓｔ認識結果」に対応する検索用情報について敬称削除及び名詞取得の処理を行った場合には、敬称を示す「サン（さん）」が特定されて削除される。さらに残った文字列情報の中からある基準を満たす名詞文節（例えば、「サ（差）」、「イトウ（伊藤）」、「ヨウコ（洋子）」）が特定及び取得される。ただし、上述の処理は、情報検索装置１において必須の処理ではなく省略されてもよい。

文字数計数部１３は、文字列情報取得部１２により取得された第１の文字列情報毎に、当該文字列情報が示す文字列の文字数を計数する文字数計数手段である。文字数計数部１３は、文字列を構成する文字の個数をカウントすることで第１の文字列情報毎の文字数を取得する。具体的には、文字数計数部１３は、例えば「サ」については１文字、「イトウ」については３文字と計数する。文字数計数部１３により計数された第１の文字列情報毎の文字数は、後述する検索部１５により利用される。

文字列情報データベース１４は、情報検索装置１において検索対象となる文字列情報を含むデータ（レコード）を記憶する記憶手段である。具体的には、文字列情報データベース１４は、人の氏名を示す文字列情報と電話番号を示す情報とを関連付けて記憶した電話帳データベースである。文字列情報データベース１４には、例えば、氏名の表記をひらがな、カタカナ及び漢字等により示す文字列情報（例えば「斎藤洋子」）と、氏名のヨミをカタカナにより示す文字列情報（例えば「サイトウヨウコ」）と、電話番号を示す情報とを相互に関連付けたレコード情報が、ユーザによる操作（情報入力及び登録）等により予め複数記憶されている。

検索部１５は、文字列情報取得部１２により取得された検索用情報のうちの第１の文字列情報を用いて、文字数計数部１３により計数された第１の文字列情報毎の文字数に応じた検索を実行することにより検索結果（第１の検索結果）を取得する検索手段である。第２検索部１６は、文字列情報取得部１２により取得された検索用情報のうちの第２の文字列情報を用いて検索を実行することにより検索結果（第２の検索結果）を取得する検索手段（第２の検索手段）である。検索結果出力部１７は、第１の検索結果と第２の検索結果とを総合的に評価した結果に基づいて最終的にユーザに提示する検索結果を出力する検索結果出力手段である。検索部１５、第２検索部１６、及び検索結果出力部１７の具体的な機能については、以下に示す具体例の中で詳細に説明する。

（第１の例）
第１の例における情報検索装置１では、検索部１５Ａは、文字数が１文字の文字列情報を除外する。具体的には、検索部１５Ａは、文字列情報取得部１２が検索用情報として取得した文字列情報のうち第１の文字列情報について、文字数計数部１３によって計数された文字数を取得し、当該文字数が１文字であると判定した場合に、当該第１の文字列情報を検索用情報から除外（削除・破棄）する。

例えばユーザが「加護（かご）」という内容を意図して発話した際に、音声認識部１１が誤認識して取得した第１の文字列情報「タ／ゴ」が、文字列情報取得部１２により検索用情報として取得された場合を考える。この場合、検索部１５Ａは、文字数計数部１３が計数した各第１の文字列情報（「タ」及び「ゴ」）の文字数を取得し、これらの第１の文字列情報の文字数が１文字であるか否かを判定する。「タ」及び「ゴ」はいずれも１文字であるため、検索部１５Ａは、「タ」及び「ゴ」を検索用情報から除外する。検索部１５Ａは、文字数が２文字以上の第１の文字列情報（例えば「カゴ」、「タナカ」等）については除外せず、当該文字列情報を検索キーワードとして用いて検索を実行する。

検索部１５Ａは、例えば「あいまい検索」による検索を実行する。具体的には、検索部１５Ａは、個々の第１の文字列情報を個々の検索キーワード（検索用文字列）とし、検索キーワード毎に、検索対象の文字列情報（文字列情報データベース１４に記憶された文字列情報）との比較を行い、ある特定の基準を満たすか否かを判定し、当該基準を満たすと判定した場合に、当該検索対象の文字列情報を含むレコード情報を検索結果として取得する検索方法である。

あいまい検索の具体例としては、完全一致検索及び部分一致検索により検索する方法がある。完全一致検索とは、検索キーワードと検索対象の文字列情報とが完全に一致するか否かを判定し、完全に一致すると判定した場合に、当該文字列情報を検索結果として取得する検索方法である。また、部分一致検索とは、検索キーワードが検索対象の文字列情報に部分的に含まれるか否かを判定し、含まれると判定した場合に、当該文字列情報を検索結果として取得する検索方法である。部分一致検索には、検索対象の文字列情報の前方部分、後方部分、及びこれら以外の部分に検索キーワードが含まれるか否かを判定する方法（前方部分一致、後方部分一致、及び部分一致）等の種類がある。部分一致検索においては、これらの種類のうち１つだけを用いてもよいし、複数組み合わせて用いてもよい。

例えば、検索キーワードが「加護」である場合、検索対象の文字列情報が「加護」であれば完全一致検索により検索結果として取得される。また、検索対象の文字列情報が「加護ちゃん」、「東京の加護」、及び「東京の加護ちゃん」の場合には、それぞれ前方部分一致、後方部分一致、及び部分一致に分類される部分一致検索により検索結果として取得される。

その他のあいまい検索の例として、子母音マッチングによる検索方法がある。子母音マッチングとは、検索キーワードと検索対象の文字列情報との比較において、例えば第一ワード（１番目の文字）の母音同士が一致し且つ第２ワード（２番目の文字）の子音同士及び母音同士がそれぞれ一致するか否かを判定し、一致すると判定した場合に検索対象の文字列情報を検索結果として取得する方法である。ただし、ここで用いられる判定方法は上記に限定されず、例えば上記条件を緩和して、第１ワードの母音同士及び第２ワードの母音同士がそれぞれ一致する場合等に、検索対象の文字列情報を検索結果として取得するようにしてもよい。

例えば、検索キーワードが「加護（ｋａｇｏ）」である場合、検索対象の文字列情報が「田護（ｔａｇｏ）」であれば、第１ワードの母音（ａ）同士が一致し且つ第２ワードの子音（ｇ）同士及び母音（ｏ）同士がそれぞれ一致するため、上記いずれの子母音マッチングによる検索方法によっても、検索対象の文字列情報が検索結果として取得される。一方、検索対象の文字列情報が「賀古（ｋａｋｏ）」であれば、第１ワードの母音（ａ）同士及び第２ワードの母音（ａ）同士がそれぞれ一致するが、第２ワードの子音は一致しない（ｇとｋ）。したがって、この場合には、検索対象の文字列情報は、前者の子母音マッチングによる検索方法では検索結果として取得されないが、後者の子母音マッチングによる検索方法では検索結果として取得される。

検索部１５Ａは、２文字以上の第１の文字列情報を用いてあいまい検索を実行する前に、当該第１の文字列情報の一部又は全部として含まれる部分文字列を特定の文字に変換する処理を行ってもよい。具体的には、例えば、検索部１５Ａは、変換前の文字列と変換後の文字列との対応情報を記憶する辞書データを予め保持しておく。検索部１５Ａは、当該辞書データを参照することにより、第１の文字列情報に含まれる全ての部分文字列について、辞書データに記憶されている変換前の文字列と一致するか否かを判定する。検索部１５Ａは、上記判定により変換前の文字列と一致すると判定された部分文字列を、当該変換前の文字列と対応する変換後の文字列に変換する。これにより、検索部１５Ａは、変換後の第１の文字列情報を取得する。

図４は、特定の文字についての変換の一例（長音ヨミ変換）を示す図である。このような変換により、例えば「オーノ」及び「サイトー」等の長音記号を含む第１の文字列情報から、「オオノ」及び「サイトウ」等の長音記号を含まない第１の文字列情報を取得することができる。通常、人の氏名のフリガナ（ヨミを示す文字列情報）として登録されるデータには長音記号は含まれないと想定されるため、上記変換処理によって、より検索に適した検索キーワードを取得することができる。なお、検索部１５Ａは、変換後の第１の文字列情報のみを用いて検索を実行してもよいし、変換前及び変換後両方の第１の文字列情報を用いて検索を実行してもよい。

検索部１５Ａは、文字数が２文字以上の第１の文字列情報を検索キーワードとして用いて文字列情報データベース１４を検索（文字列情報毎に検索）し、検索用情報毎に、検索ヒットした（検索により取得された）文字列情報データベース１４上のレコードに関連付けて、検索ヒット回数に応じた検索スコア（初期値は「０」）を算出する。「検索スコア」は、１回の検索ヒットに対して固定値（例えば「１」）を加算するものであってもよいし、例えば第１候補（１−Ｂｅｓｔ認識結果）に対応する第１の文字列情報を検索キーワードとして検索ヒットした場合には「１」を加算し、第２候補（２−Ｂｅｓｔ認識結果）に対応する第１の文字列情報を検索キーワードとして検索ヒットした場合には「０．８」を加算する等、音声認識順位がより高い文字列情報を用いて検索ヒットした際により多くの検索スコアが加算されるように設定されてもよい。

本実施形態においては、検索スコアは後者の方法で計算されるものとする。ここで、各レコードに関連付けられた検索用情報毎の検索スコアを示す情報は、例えば情報検索装置１上において一時的に確保された記憶領域上に記憶され、後述する検索結果出力部１７が検索結果を出力する際等に参照される。

第２検索部１６は、検索用情報として取得した第２の文字列情報を用いて、検索部１５Ａと同様に、「あいまい検索」による検索を実行する。ただし、第２の文字列情報にヨミを示す情報（子音及び母音を示す情報）が含まれない場合には、子母音マッチングによるあいまい検索を除く。また、第２検索部１６は、検索部１５Ａと同様の方法により、検索により取得されたレコード毎に関連付けて検索用情報毎の検索スコアを算出する。

検索結果出力部１７は、検索用情報毎に、検索部１５Ａが第１の文字列情報を用いた検索により算出した検索スコアと、第２検索部１６が第２の文字列情報を用いた検索により算出した検索スコアとの和を算出する。そして、検索結果出力部１７は、検索スコアの和が大きい順に、文字列情報データベース１３に記憶されたレコード情報に含まれる文字列情報（例えば氏名及び電話情報を示す情報）を並べて検索結果として出力する。

ここで、複数の検索用情報（複数の音声認識結果の候補）を用いて検索を行った場合には、上述のとおり、各検索結果（レコード）の検索スコアは、検索用情報毎に算出されることになる。この場合には、例えば、検索結果出力部１７は、各レコードについて、検索用情報毎に算出された検索スコアのうち最大の検索スコアを各レコードに関連付けられる検索スコア（代表スコア）として抽出する。これについて、以下に具体例を用いて説明する。

例えば、第１候補の音声認識結果に対応する検索用情報が「田／後（タ／ゴ）」であり、第２候補の音声認識結果に対応する検索用情報が「加／護（カ／ゴ）」であったような場合を考える。この場合において、「加護（カゴ）」を含むレコードの第１候補についての検索スコアが「１」であり、第２候補についての検索スコアが「１．６」であったような場合には、検索結果出力部１７は、「加護（カゴ）」を含むレコードに関連付けられる代表スコアとして「１．６」を取得する。これにより、各レコードについて、最も検索スコアが高く算出された（検索適合度が高かった）方の検索スコアを代表スコアとして抽出できる。このような代表スコアは、レコード間の検索順位（検索適合順位）を比較するにあたって適切な指標の１つと考えられる。

このような処理を行うことにより、検索結果出力部１７は、レコード毎に一意に関連付けられた代表スコアを取得する。検索結果出力部１７は、例えば情報検索装置１が備えるディスプレイ等の出力部１０５に、当該代表スコアが高い順に検索結果（例えば氏名及び電話情報を示す情報）を検索スコア順に並べて出力表示する。

ここで、検索結果出力部１７が第１の検索結果（ヨミを示す第１の文字列情報による検索結果）と第２の検索結果（表記を示す第２の文字列情報による検索結果）の両方の検索スコアに基づいて検索結果を出力する理由について、上記とは別の例を用いて説明する。

例えば、文字列情報データベース１４に、「斎藤洋子（サイトウヨウコ）」、「斎藤ひろし（サイトウヒロシ）」、「小野ヨーコ」等の文字列情報を含むレコードが記憶されている場合を考える。この場合において、ヨミを示す第１の文字列情報として「サイトウ／ヨウコ」が取得され、表記を示す第２の文字列情報（表記）として「斎藤／陽子」が取得された場合、第１の文字列情報による検索では、「斎藤洋子」と「小野ヨーコ」の両方に同一の検索スコアが付き、第２の文字列情報による検索では、「斎藤洋子」と「斎藤ひろし」の両方に同一の検索スコアが付くような場合が想定される。

このように、第１の文字列情報又は第２の文字列情報のいずれか一方のみを用いて検索した場合には、検索スコアに差がつかない場合であっても、第１の文字列情報及び第２の文字列情報の両方を総合（検索スコアを合算）して判断することにより、ユーザの意図する「斎藤洋子」の検索スコアが大きくなるようにし、上位に表示させることが期待できる。

続いて、図５及び図６を用いて、第１の例における情報検索装置１により実行される処理の動作について説明する。図５は、情報検索装置１により実行される処理を説明するために用いる情報の例を示す図である。図６は、第１の例における情報検索装置１の動作を示すフロー図である。また、以下の説明において、検索部１５Ａ及び第２検索部１６は、上述の完全一致検索及び部分一致検索（前方部分一致、後方部分一致、及び部分一致の全てを含む）をあいまい検索として実行するものとする。

まず、音声認識部１１は、ユーザが「加護さんに電話」という内容を意図して発話した音声を入力し、音声認識処理を実行する（ステップＳ１０１）。続いて、文字列情報取得部１２は、当該音声認識処理により生成された文字列情報（第１候補の音声認識結果として「タ／ゴ／サン／ニ／デンワ」及び「田／後／さん／に／電話」、第２候補の音声認識結果として「カゴ／サン／ニ／デンワ」及び「加護／さん／に／電話」）を取得する（ステップＳ１０２）。文字列情報取得部１２は、第１候補の音声認識結果を取得し（ステップＳ１０３）、敬称削除及び名詞取得の処理を実行することにより、検索用情報（「タ／ゴ」及び「田／後」）を取得する（ステップＳ１０４、文字列情報取得ステップ）。ここで、ステップＳ１０４の処理を行わない場合には、ステップＳ１０３が文字列情報取得ステップに相当する。

続いて、文字数計数部１３は、文字列情報取得部１２が取得したヨミを示す検索用情報（「タ／ゴ」）に含まれる各文字列情報の文字数を計数する（ステップＳ１０５，文字数計数ステップ）。これにより、文字数計数部１３は、「タ」及び「ゴ」それぞれの文字数（１文字）を取得する。

続いて、検索部１５Ａは、ステップＳ１０５で計数された文字数に基づいて検索処理を実行する（ステップＳ１０６、検索ステップ）。具体的には、検索部１５Ａは、文字列情報取得部１２が取得した文字列情報「タ」を取得し（ステップＳ１０６Ａ）、文字数が１文字か否かを判定する（ステップＳ１０６Ｂ）。ここで、「タ」の文字数は１文字であるため、検索部１５Ａは、「タ」を用いた検索処理（あいまい検索）をスキップ（「タ」を検索用情報から除外）する（ステップＳ１０６Ｂ：ＹＥＳ）。その後、次の文字列情報「ゴ」についても、検索部１５Ａにより同様の処理がされる（ステップＳ１０６Ｅ：ＮＯ，Ｓ１０６Ａ，Ｓ１０６Ｂ：ＹＥＳ）。

一方、第２検索部１６は、文字列情報取得部１２が取得した表記を示す文字列情報（「田／後」）から、文字列情報「田」を取得し（ステップＳ１０７）、当該文字列情報を用いてあいまい検索を実行する（ステップＳ１０８）。ここで、第２検索部１６は、当該あいまい検索により検索ヒットした「田原」及び「田辺」を含むレコードの第１候補についての検索スコアを１だけ加算する。

続いて、第２検索部１６は、「田」の次の文字列情報「後」を用いたあいまい検索を実行する（ステップＳ１０９：ＮＯ，Ｓ１０７，Ｓ１０８）。ここで、第２検索部１６は、当該あいまい検索により検索ヒットした「後藤」を含むレコードの第１候補についての検索スコアを１だけ加算する。

第１候補の音声認識結果に対応する検索用情報に含まれる全ての文字列情報についての検索部１５Ａ及び第２検索部１６による検索処理が完了したら（ステップＳ１０６Ｅ：ＹＥＳ，Ｓ１０９：ＹＥＳ）、それぞれの検索により得られたレコード毎の検索スコアが合算されて、第１候補の音声認識結果に対応する検索用情報に関する各レコードの検索スコアが確定する（ステップＳ１１０）。即ち、「後藤」を含むレコード、「田原」を含むレコード、及び「田辺」を含むレコードの第１候補についての検索スコアがそれぞれ「１」と確定する。

続いて、文字列情報取得部１２は、第２候補の音声認識結果を取得し（ステップＳ１１１：ＮＯ，Ｓ１０３）、敬称削除及び名詞取得の処理を実行することにより、検索用情報（「カゴ」及び「加護」）を取得する（ステップＳ１０４、文字列情報取得ステップ）。

続いて、文字数計数部１３は、文字列情報取得部１２が取得したヨミを示す検索用情報（「カゴ」）に含まれる各文字列情報の文字数を計数する（ステップＳ１０５，文字数計数ステップ）。これにより、文字数計数部１３は、「カゴ」の文字数（２文字）を取得する。続いて、検索部１５Ａは、「カゴ」を取得し（ステップＳ１０６Ａ）、文字数が１文字か否かを判定する（ステップＳ１０６Ｂ）。「カゴ」の文字数は２文字であるため、検索部１５Ａは、「カゴ」について特定の文字を変換する処理（例えば図４に示す長音ヨミ変換）を必要に応じて実行し（ステップＳ１０６Ｂ：ＮＯ，Ｓ１０６Ｃ）、「カゴ」を用いてあいまい検索を実行する（ステップＳ１０６Ｄ）。検索部１５Ａは、当該あいまい検索により検索ヒットした「カゴ」を含むレコードの第２候補についての検索スコアを０．８だけ加算する。

一方、第２検索部１６は、文字列情報取得部１２が取得した表記を示す検索用情報（「加護」）を取得し（ステップＳ１０７）、当該文字列情報を用いてあいまい検索を実行する（ステップＳ１０８）。ここで、第２検索部１６は、当該あいまい検索により検索ヒットした「加護」を含むレコードの第２候補についての検索スコアを０．８だけ加算する。

検索部１５Ａ及び第２検索部１６によって検索用情報に含まれる全ての文字列情報についての検索処理が完了したら（ステップＳ１０６Ｅ：ＹＥＳ，Ｓ１０９：ＹＥＳ）、それぞれの検索により得られたレコード毎の検索スコアが合算されて、第２候補の音声認識結果に対応する検索用情報に関する各レコードの検索スコアが確定する（ステップＳ１１０）。即ち、「加護」を含むレコードの第２候補についての検索スコアが「１．６」と確定する。

全ての音声認識結果の候補について処理が完了したら（ステップＳ１１１：ＹＥＳ）、検索結果出力部１７が、検索部１５Ａ及び第２検索部１６により取得された検索結果について代表スコアを抽出する。検索結果出力部１７は、当該検索結果を代表スコア順（「加護」（１．６）→「後藤」（１）→「田原」（１）→「田辺」（１）→…。ここで、括弧内の数字は代表スコアを示す。）に並べて、情報検索装置１が備えるディスプレイ等の出力部１０５に出力する（ステップＳ１１２、検索結果出力ステップ）。

以上の処理において、仮に文字数計数部１３及び検索部１５ＡによるステップＳ１０６及びステップＳ１０７Ａの処理がされなければ、「タ」及び「ゴ」についての検索処理がスキップされず、ステップＳ１０７Ｃにおいてあいまい検索がされる。その結果、「後藤」を含むレコード、「田原」を含むレコード、及び「田辺」を含むレコードの検索スコア（代表スコア）は、「２」となり、「加護」を含むレコードの検索スコア（代表スコア）である「１．６」を上回る。したがって、ステップＳ１１３において検索結果出力部１７により並べられる順序は、「後藤」→「田原」→「田辺」→「加護」となってしまい、ユーザが意図（所望）する「加護」を含むレコードよりもユーザの意図しないレコードが上位に表示されてしまうという問題が生じる。特に上記例のように、１文字のキーワードを用いてあいまい検索を行った場合には、ユーザの意図しないレコードが多数検索ヒットして検索スコアが高く算出されてしまうおそれが高くなると考えられる。

第１の例における情報検索装置１によれば、上述のとおり、検索誤りを生じる可能性の高い文字列情報（文字数が１文字の文字列情報）を検索キーワードから除外することにより、検索誤りによる影響を低減できる。即ち、検索誤りによってユーザの意図しない検索結果が大量に表示（上位に表示）されてしまい、ユーザの所望する検索結果が表示されない（又は下位に表示される）といった状況が生じるおそれを低減できる。

（第２の例）
第２の例における情報検索装置１について、第１の例と主に相違する点について説明する。第２の例における情報検索装置１では、文字列情報取得部１２は、予め順序付けされた文字列情報を検索用情報として取得する。文字列情報取得部１２は、例えば図３に示すような音声認識結果から、分節された各文字列を先頭から順に取得し、取得した順序を各文字列の順序として対応付けることができる。また、検索部１５Ｂは、順序付けに基づいて文字数が１文字の異なる２つの文字列情報が互いに隣接するか否かを判定する。具体的な判定処理の手順の一例については、後述のフローの説明において示す。検索部１５Ｂは、当該２つの文字列情報が互いに隣接すると判定した場合には、当該２つの文字列情報が示す文字列同士を連結して新たな文字列を生成し、当該新たな文字列を示す情報を含む文字数が２文字以上の文字列情報を用いて検索を実行する。

続いて、図５及び図７を用いて、第２の例における情報検索装置１により実行される処理の動作を説明する。図７は、第２の例における情報検索装置１の動作を示すフロー図である。ただし、ステップＳ２０１〜Ｓ２０５，Ｓ２０７〜Ｓ２１２の処理は、図６に示す第１の例における情報検索装置１により実行されるステップＳ１０１〜Ｓ１０５，Ｓ１０７〜Ｓ１１２の処理と同様であるため詳細な説明を省略する。また、以下の説明において、検索部１５Ｂ及び第２検索部１６は、上述の完全一致検索及び部分一致検索（前方部分一致、後方部分一致、及び部分一致の全てを含む）をあいまい検索として実行するものとする。

ステップＳ２０１〜Ｓ２０４の処理によって、文字列情報取得部１２は、検索用情報（「タ／ゴ」及び「田／後」）を取得する。続いて、ステップＳ２０５の処理によって、文字数計数部１３は、文字列情報「タ」及び「ゴ」それぞれの文字数（１文字）を計数により取得する。

続いて、検索部１５Ｂは、ステップＳ２０５で計数された文字数に基づいて検索処理を実行する（ステップＳ２０６、検索ステップ）。具体的には、検索部１５Ｂは、文字列情報取得部１２が取得した文字列情報「タ」を取得し（ステップＳ２０６Ａ）、文字数が１文字か否かを判定する（ステップＳ２０６Ｂ）。ここで、「タ」の文字数は１文字であるため、検索部１５Ｂは、１つ次の文字列情報（次分節）が１文字か否かを判定する（ステップＳ２０６Ｃ）。ここで、文字列情報「タ」の次の文字列情報「ゴ」も１文字であるため（ステップＳ２０６Ｃ：ＹＥＳ）、「タ」と「ゴ」とを連結して新たな文字列「タゴ」を生成する（ステップＳ２０６Ｄ）。

続いて、検索部１５Ｂは、当該新たな文字列「タゴ」について特定の文字を変換する処理（例えば図４に示す長音ヨミ変換）を必要に応じて実行し（ステップＳ２０６Ｅ）、「タゴ」を用いてあいまい検索を実行する（ステップＳ２０６Ｆ）。図５に示す文字列情報データベース１３に格納された文字列情報の中には「タゴ」を用いたあいまい検索により検索ヒットするレコードはないため、どのレコードの検索スコアも加算されない。

その後、第２検索部１６による検索処理（ステップＳ２０７〜Ｓ２０９）を含め、全ての音声認識結果の候補についての処理が完了したら（ステップＳ２１１：ＹＥＳ）、検索結果出力部１７が、検索部１５Ｂ及び第２検索部１６により取得された検索結果について代表スコアを抽出する。検索結果出力部１７は、当該検索結果を代表スコア順（「加護」（１．６）→「後藤」（１）→「田原」（１）→「田辺」（１）→…。ここで、括弧内の数字は代表スコアを示す。）に並べて、情報検索装置１が備えるディスプレイ等の出力部１０５に出力する（ステップＳ２１２、検索結果出力ステップ）。

以上のように、第２の例における情報検索装置１によれば、検索部１５Ｂが互いに隣接する１文字の文字列情報（「タ」と「ゴ」）を連結して「タゴ」（新たな文字列）を生成し、当該新たな文字列を検索用文字列として用いて検索することによって、第１の例と同様に、検索誤りによる影響を低減できる。

また、例えばユーザが「加護さんに電話」という内容を意図して発話した場合であって、音声認識誤りによって「カ／ゴ」と分節された文字列情報が得られた場合を考える。この場合、検索部１５Ｂが、互いに隣接する１文字の文字列情報である「カ」及び「ゴ」を除外するのではなく、これらの文字列情報を連結して生成した新たな文字列情報「カゴ」を用いて検索することにより、ユーザの意図する「加護（カゴ）」を含むレコードを検索結果として取得し、当該レコードの検索スコアを加算することができる。したがって、ユーザの意図する「加護（カゴ）」を含むレコードが、検索結果出力部１７により上位に出力（表示）される可能性を高めることができ、検索精度を向上させることが期待できる。

なお、第２の例では、検索部１５Ｂは、文字列情報を順次処理し、１つ次の文字列情報が１文字か否かを判定することにより文字列情報同士を連結するか否かを判定するものとして説明したが、判定方法はこれに限定されない。例えば、検索部１５Ｂは、文字列情報を順次処理し、１つ前の文字列情報が１文字か否かを判定することにより文字列情報同士を連結するか否かを判定してもよい。また、検索部１５Ｂは、順序付けされた文字列情報を最初に全て走査し、１文字の文字列情報が隣接する箇所を検出したら当該文字列情報同士を連結するようにしてもよい。

（第３の例）
第３の例における情報検索装置１について、第１の例と主に相違する点について説明する。第３の例における情報検索装置１では、検索部１５Ｃは、文字数が１文字の文字列情報を用いた検索と文字数が２文字以上の文字列情報を用いた検索とについて、互いに異なる検索条件に基づいて検索を実行する。具体的には、検索部１５Ｃは、文字数が２文字以上の第１の文字列情報については上述のあいまい検索を実行し、文字数が１文字の第１の文字列情報については完全一致検索のみを実行する。

続いて、図５及び図８を用いて、第３の例における情報検索装置１により実行される処理の動作を説明する。図８は、第３の例における情報検索装置１の動作を示すフロー図である。ただし、ステップＳ３０１〜Ｓ３０５，Ｓ３０７〜Ｓ３１２の処理は、図６に示す第１の例における情報検索装置１により実行されるステップＳ１０１〜Ｓ１０５，Ｓ１０７〜Ｓ１１２の処理と同様であるため詳細な説明を省略する。また、以下の説明において、検索部１５Ｃ及び第２検索部１６は、上述の完全一致検索及び部分一致検索（前方部分一致、後方部分一致、及び部分一致の全てを含む）をあいまい検索として実行するものとする。

ステップＳ３０１〜Ｓ３０４の処理によって、文字列情報取得部１２は、検索用情報（「タ／ゴ」及び「田／後」）を取得する。続いて、ステップＳ３０５の処理によって、文字数計数部１３は、文字列情報「タ」及び「ゴ」それぞれの文字数（１文字）を計数により取得する。

続いて、検索部１５Ｃは、ステップＳ３０５で計数された文字数に基づいて検索処理を実行する（ステップＳ３０６、検索ステップ）。まず、検索部１５Ｃは、文字列情報取得部１２が取得した文字列情報「タ」を取得し（ステップＳ３０６Ａ）、特定の文字を変換する処理（例えば図４に示す長音ヨミ変換）を必要に応じて実行する（ステップＳ３０６Ｂ）。続いて、検索部１５Ｃは、文字列情報「タ」について文字数が１文字か否かを判定する（ステップＳ３０６Ｃ）。ここで、「タ」の文字数は１文字であるため、検索部１５Ｃは、文字列情報「タ」を用いて完全一致検索を実行する（ステップＳ３０６Ｄ）。ここで、文字列情報データベース１３は、「タ」と完全一致する文字列情報を記憶していないため、検索ヒットするレコードは存在せず、どのレコードの検索スコアも加算されない。その後、次の文字列情報「ゴ」についても、検索部１５Ｃにより同様の処理がされる（ステップＳ３０６Ｆ：ＮＯ，Ｓ３０６Ａ，Ｓ３０６Ｂ，Ｓ３０６Ｃ：ＹＥＳ，Ｓ３０６Ｄ）。

その後、第２検索部１６による検索処理（ステップＳ３０７〜Ｓ３０９）を含め、全ての音声認識結果の候補についての処理が完了したら（ステップＳ３１１：ＹＥＳ）、検索結果出力部１７が、検索部１５Ｃ及び第２検索部１６により取得された検索結果について代表スコアを抽出する。検索結果出力部１７は、当該検索結果を代表スコア順（「加護」（１．６）→「後藤」（１）→「田原」（１）→「田辺」（１）→…。ここで、括弧内の数字は代表スコアを示す。）に並べて、情報検索装置１が備えるディスプレイ等の出力部１０５に出力する（ステップＳ３１２、検索結果出力ステップ）。

以上のように、検索部１５Ｃが１文字の文字列情報（「タ」と「ゴ」）についてはあいまい検索を許容せず、完全一致検索を実行することにより、１文字の文字列情報を用いてあいまい検索を行った場合に生じ得る大量の検索誤りによる影響を低減できる。

また、例えばユーザが「李さんに電話」という内容を意図して発話した場合であって、正しく音声認識されて文字列情報「リ」が得られた場合を考える。この場合、検索部１５Ｃが、「リ」を単純に除外するのではなく、「リ」を用いて完全一致検索を実行することにより、ユーザの所望する情報（「李（リ）」を含むレコード）を取得する（当該レコードの検索スコアを高くし、検索結果出力部１７により上位に表示させる）ことができる。

以上、本実施形態に係る情報検索装置１について第１の例から第３の例まで説明したが、これらの例において、第２検索部１６は、検索用情報として取得した第２の文字列情報に対して、検索部１５が当該第２の文字列情報と対応する第１の文字列情報に対して当該第１の文字列情報の文字数に応じて実行する処理と同一の処理を実行し、当該第２の文字列情報を用いて検索を実行してもよい。

例えば、図５に示す例において、検索部１５が除外処理を行った第１の文字列情報「タ」と対応する第２の文字列情報「田」については、第２検索部１６は検索部１５と同様に除外処理を行ってもよい。例えば、検索部１５が、そのまま検索用情報として用いるのに適さないと判断して第１の文字列情報を除外及び連結等の処理を実行した場合には、当該第１の文字列情報に対応する第２の文字列情報についても同様に検索用情報として用いるのに適さない可能性が高いと考えられる。したがって、上記構成によれば、第１の文字列情報と当該第１の文字列情報に対応する第２の文字列情報とについて、同一の考え方に則った同一の方法（除外・連結等の処理、及び検索方法（完全一致検索及び部分一致検索等）等）によって検索を実行するため、検索誤りをより効率よく低減することができる。

上記構成によれば、上述の第１の例〜第３の例において、第２検索部１６によって「田」及び「後」を用いたあいまい検索が実行されないため、「後藤」、「田原」、及び「田辺」を含むレコードは検索結果として取得されず、検索スコアが加算されない。これにより、検索結果出力部１７によって、検索結果として取得された「加護」のみが表示される。即ち、上記構成によれば、ユーザの意図しない検索結果の表示（誤りデータ件数）を抑制できることがわかる。

また、情報検索装置１は、第１の例と第２の例とを組み合わせた構成として実現されてもよい。即ち、検索部１５による処理において、検索用情報として取得した第１の文字列情報について、互いに隣接する２つの１文字の文字列情報については連結し、互いに隣接しない１文字の文字列情報については除外する構成としてもよい。

また、情報検索装置１は、第２の例と第３の例とを組み合わせた構成として実現されてもよい。即ち、検索部１５による処理において、検索用情報として取得した第１の文字列情報について、互いに隣接する２つの１文字の文字列情報については連結し、互いに隣接しない１文字の文字列情報については完全一致検索を実行する構成としてもよい。

なお、本実施形態では、文字列情報データベース１４が電話帳データベースであり、情報検索装置１が電話帳検索の機能をユーザに提供する装置である場合の例を示したが、必ずしもこれらに限定されるものではない。文字列情報データベース１４は、検索対象となり得る文字列情報（例えば、人名及び地名等の固有名詞を示す情報）を含むものであれば何でもよく、情報検索装置１は、例えば電話帳検索と同様に人の氏名等を示す文字列情報を検索キーワードとしてメール検索（送信者による宛先メールアドレスの検索）及びスケジュール検索（特定個人のスケジュールの検索）等を行う検索装置に適用可能である。また、駅名及び地名等の固有名詞を示す文字列情報を検索キーワードとして駅名検索及び地図（地名）検索等を行う検索装置にも適用可能である。

１…情報検索装置、１１…音声認識部、１２…文字列情報取得部、１３…文字数計数部、１４…文字列情報データベース、１５（１５Ａ，１５Ｂ，１５Ｃ）…検索部、１６…第２検索部、１７…検索結果出力部。

上記情報検索装置では、検索手段は、文字数が１文字の文字列情報を除外し、文字数が２文字以上の文字列情報を用いて検索を実行する。

上記情報検索装置では、文字列情報取得手段は、予め順序付けされた複数の文字列情報を取得し、検索手段は、上記順序付けに基づいて文字数が１文字の異なる２つの文字列情報が互いに隣接するか否かを判定し、当該２つの文字列情報が互いに隣接する場合には、当該２つの文字列情報が示す文字列同士を連結して新たな文字列を生成し、当該新たな文字列を示す情報を含む文字数が２文字以上の文字列情報を用いて検索を実行する。

即ち、本発明に係る情報検索方法は、１つの検索用情報として、文字列を示す文字列情報を１以上取得する文字列情報取得ステップと、文字列情報取得ステップにおいて取得された文字列情報毎に、当該文字列情報が示す文字列の文字数を計数する文字数計数ステップと、文字列情報取得ステップにおいて取得された検索用情報を用いて、文字数計数ステップにおいて計数された当該文字列情報毎の文字数に応じた検索を実行することにより検索結果を取得する検索ステップと、検索ステップにおいて取得された検索結果を出力する検索結果出力ステップと、を含み、検索ステップにおいて、文字数が１文字の文字列情報を除外し、文字数が２文字以上の文字列情報を用いて検索を実行する。また、本発明に係る情報検索方法は、１つの検索用情報として、文字列を示す文字列情報を１以上取得する文字列情報取得ステップと、文字列情報取得ステップにおいて取得された文字列情報毎に、当該文字列情報が示す文字列の文字数を計数する文字数計数ステップと、文字列情報取得ステップにおいて取得された検索用情報を用いて、文字数計数ステップにおいて計数された当該文字列情報毎の文字数に応じた検索を実行することにより検索結果を取得する検索ステップと、検索ステップにおいて取得された検索結果を出力する検索結果出力ステップと、を含み、文字列情報取得ステップにおいて、予め順序付けされた複数の文字列情報を取得し、検索ステップにおいて、上記順序付けに基づいて文字数が１文字の異なる２つの文字列情報が互いに隣接するか否かを判定し、当該２つの文字列情報が互いに隣接する場合には、当該２つの文字列情報が示す文字列同士を連結して新たな文字列を生成し、当該新たな文字列を示す情報を含む文字数が２文字以上の文字列情報を用いて検索を実行する。

本発明に係る情報検索装置は、１つの検索用情報として、文字列を示す文字列情報を複数取得する文字列情報取得手段と、文字列情報取得手段により取得された文字列情報毎に、当該文字列情報が示す文字列の文字数を計数する文字数計数手段と、文字列情報取得手段により取得された検索用情報を用いて、文字数計数手段により計数された当該文字列情報毎の文字数に応じた検索を実行することにより検索結果を取得する検索手段と、検索手段により取得された検索結果を出力する検索結果出力手段と、を備える。

本発明に係る情報検索装置では、１つの検索用情報として複数の文字列情報を取得し、当該文字列情報毎の文字数に応じた検索を実行する。これにより、例えば、検索誤りを生じやすい文字列情報を文字数に基づいて抽出し、当該文字列情報を検索用情報から除外する等の適切な処理を行った上で検索を実行することができる。したがって、取得した文字列情報をそのまま用いて検索した場合に生じる検索誤りを防止することができる。即ち、文字列を用いて所定のデータベースを検索する際における検索誤りを効率よく低減することができる。

即ち、本発明に係る情報検索方法は、１つの検索用情報として、文字列を示す文字列情報を複数取得する文字列情報取得ステップと、文字列情報取得ステップにおいて取得された文字列情報毎に、当該文字列情報が示す文字列の文字数を計数する文字数計数ステップと、文字列情報取得ステップにおいて取得された検索用情報を用いて、文字数計数ステップにおいて計数された当該文字列情報毎の文字数に応じた検索を実行することにより検索結果を取得する検索ステップと、検索ステップにおいて取得された検索結果を出力する検索結果出力ステップと、を含み、検索ステップにおいて、文字数が１文字の文字列情報を除外し、文字数が２文字以上の文字列情報を用いて検索を実行する。また、本発明に係る情報検索方法は、１つの検索用情報として、文字列を示す文字列情報を１以上取得する文字列情報取得ステップと、文字列情報取得ステップにおいて取得された文字列情報毎に、当該文字列情報が示す文字列の文字数を計数する文字数計数ステップと、文字列情報取得ステップにおいて取得された検索用情報を用いて、文字数計数ステップにおいて計数された当該文字列情報毎の文字数に応じた検索を実行することにより検索結果を取得する検索ステップと、検索ステップにおいて取得された検索結果を出力する検索結果出力ステップと、を含み、文字列情報取得ステップにおいて、予め順序付けされた複数の文字列情報を取得し、検索ステップにおいて、上記順序付けに基づいて文字数が１文字の異なる２つの文字列情報が互いに隣接するか否かを判定し、当該２つの文字列情報が互いに隣接する場合には、当該２つの文字列情報が示す文字列同士を連結して新たな文字列を生成し、当該新たな文字列を示す情報を含む文字数が２文字以上の文字列情報を用いて検索を実行する。

Claims

１つの検索用情報として、文字列を示す文字列情報を１以上取得する文字列情報取得手段と、
前記文字列情報取得手段により取得された前記文字列情報毎に、当該文字列情報が示す文字列の文字数を計数する文字数計数手段と、
前記文字列情報取得手段により取得された前記検索用情報を用いて、前記文字数計数手段により計数された当該文字列情報毎の文字数に応じた検索を実行することにより検索結果を取得する検索手段と、
前記検索手段により取得された検索結果を出力する検索結果出力手段と、を備える情報検索装置。
前記検索手段は、文字数が１文字の文字列情報を除外し、文字数が２文字以上の文字列情報を用いて検索を実行する、請求項１記載の情報検索装置。
前記文字列情報取得手段は、予め順序付けされた複数の文字列情報を取得し、
前記検索手段は、前記順序付けに基づいて文字数が１文字の異なる２つの文字列情報が互いに隣接するか否かを判定し、当該２つの文字列情報が互いに隣接する場合には、当該２つの文字列情報が示す文字列同士を連結して新たな文字列を生成し、当該新たな文字列を示す情報を含む文字数が２文字以上の文字列情報を用いて検索を実行する、請求項１記載の情報検索装置。
前記検索手段は、文字数が１文字の文字列情報を用いた検索と文字数が２文字以上の文字列情報を用いた検索とについて、互いに異なる検索条件に基づいて検索を実行する、請求項１又は３記載の情報検索装置。
ユーザの一連の発話音声を入力し、当該発話音声に対して音声認識処理を行うことにより前記文字列情報を生成する音声認識手段を更に備え、
前記文字列情報取得手段は、前記音声認識手段により生成された前記文字列情報を取得する、請求項１〜４のいずれか一項記載の情報検索装置。
第１の文字種別とは異なる第２の文字種別で示される文字列情報を用いて検索を実行することにより検索結果を取得する第２の検索手段を更に備え、
前記文字列情報取得手段は、前記検索用情報としての前記第１の文字種別で示される第１の文字列情報と、当該第１の文字列情報と対応し且つ前記第２の文字種別で示される第２の文字列情報とを取得し、
前記文字数計数手段及び前記検索手段は、前記第１の文字列情報に対して各処理を実行し、
前記第２の検索手段は、前記第２の文字列情報を用いて検索を実行し、
前記検索結果出力手段は、前記検索手段により取得された第１の検索結果と前記第２の検索手段により取得された第２の検索結果とに基づいて検索結果を出力する、請求項１〜５のいずれか一項記載の情報検索装置。
前記第２の検索手段は、前記第２の文字列情報に対して、前記検索手段が当該第２の文字列情報と対応する前記第１の文字列情報に対して当該第１の文字列情報の文字数に応じて実行する処理と同一の処理を実行し、当該第２の文字列情報を用いて検索を実行する、請求項６記載の情報検索装置。
１つの検索用情報として、文字列を示す文字列情報を１以上取得する文字列情報取得ステップと、
前記文字列情報取得ステップにおいて取得された前記文字列情報毎に、当該文字列情報が示す文字列の文字数を計数する文字数計数ステップと、
前記文字列情報取得ステップにおいて取得された前記検索用情報を用いて、前記文字数計数ステップにおいて計数された当該文字列情報毎の文字数に応じた検索を実行することにより検索結果を取得する検索ステップと、
前記検索ステップにおいて取得された検索結果を出力する検索結果出力ステップと、を含む情報検索方法。