JP3682958B2

JP3682958B2 - 音声入力された複合名詞の検索装置、検索方法およびデータベース

Info

Publication number: JP3682958B2
Application number: JP2001295353A
Authority: JP
Inventors: 久美子大森; 正信東田
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: Nippon Telegraph and Telephone Corp
Priority date: 2000-10-13
Filing date: 2001-09-27
Publication date: 2005-08-17
Anticipated expiration: 2021-09-27
Also published as: JP2003085197A

Description

【０００１】
【発明の属する技術分野】
本発明は、複数の単名詞で構成される複合名詞を、利用者が音声入力し、この音声入力された複合名詞を特定する複合名詞の検索装置および検索方法に関するものである。
【０００２】
つまり、本発明において、検索対象となる検索語は、複数の単名詞の羅列で構成されている複合名詞であり、多数の検索語が、検索データベースに保持されている場合、音声認識処理と検索とに要する時間を利用者に感じさせることなく、しかも、音声認識処理の欠陥等による不自然な対話を利用者に生じさせることなく、検索語を特定する装置および方法に関するものである。
【０００３】
【従来の技術】
音声認識装置を利用した従来のデータベース検索処理では、ユーザが入力した音声と認識対象データベースとを照合し、認識対象データベース中の全語彙と入力音声との類似度を、認識尤度として算出する。
【０００４】
現在の認識技術では、対話処理実時間（検索装置と利用者とがやりとりする場合、上記利用者にストレスまたは不自然さを感じさせない時間）内に認識できる語彙数が限られ、この対話処理実時間を超える語彙数を認識対象にすると、処理時間が長くなり、利用者を待機させることになる。一方、認識対象語彙数が多ければ、また、認識対象が非常に似通った語彙で構成されていれば、人間同士の対話でさえも、聞き間違え、聞き損じが起こるように、認識精度の低下を避けることができない。
【０００５】
さらに、認識精度は、発話者や発話環境に大きく依存し、周囲の雑音等の影響によっては、常に１００％の精度が得られるという保証はない。
【０００６】
したがって、音声認識技術を利用する従来の検索装置では、利用者による入力音声を音声認識した結果の候補が、正しく認識できているか否かを判断する場合、利用者に上記候補の正誤確認を行い、認識尤度の高い順に正解が確認できるまで、上記候補の提示を繰り返す。
【０００７】
【発明が解決しようとする課題】
音声認識装置を用い、所定のデータベースの中から、利用者が意図する検索語を検索し、確定する検索装置において、上記データベースを構成する検索語の数が、対話処理実時間内に処理可能な数よりも多ければ、認識処理の間、利用者を待機させ、この待機後に、認識装置が出力した候補を利用者に提示し、正誤確認を行うことによって、正しく認識できたか否かを判断する。
【０００８】
利用者にとって、発話後に待たされ、この待たされた後に、正誤の確認を強いられることは、対話の不自然さにつながり、大きなストレスになるという問題がある。
【０００９】
一方、オペレータ対応のシステムでは、聞き間違え、聞き損じが生じたとしても、自然な対話の流れの中で、自らの意図をオペレータに伝えることができるので、対話の不自然さがなく、大きなストレスは生じない。
【００１０】
音声入力された検索語を検索する検索装置において、利用者満足度を獲得するためには、オペレータ対応のように、リアルタイムに応答できること、しかも、利用者の意図を正確に把握できること、何よりも、利用者との間における自然な対話の流れの中で、利用者意図を確定することが必要である。
【００１１】
本発明は、対話処理実時間内で処理可能な検索語数を超える数の複合名詞が検索データベースに登録され、しかも、互いに似通った候補が数多く存在する複合名詞が検索データベースに登録されている場合、利用者が音声入力した検索語を、短時間で効率良く検索することができる音声入力された複合名詞の検索装置、検索方法およびデータベースを提供することを目的とするものである。
【００１２】
【課題を解決するための手段】
本発明は、複数の単名詞で構成されている複合名詞が検索語として登録され、しかも、上記検索語が各単名詞に区切られて登録されている検索データベースと、上記検索データベースに登録されている全検索語を構成する単名詞が、その頻度の高い順に登録され、しかも、この頻度の高い順に登録されている複数の単名詞が、その頻度の高い方から順に、所定の数毎に分割されて、複数の単名詞集合群が形成されている検索補助データベースとを有するデータベースを利用して、利用者が音声入力した複合名詞を検索するものである。
【００１３】
【発明の実施の形態および実施例】
図１は、本発明の第１の実施例である音声入力された複合名詞の検索装置１を示すブロック図である。
【００１４】
音声入力された複合名詞の検索装置１は、音声入力部２と、音声認識部３と、音声認識用ソフトウェア３Ｓと、音声認識結果出力部４と、実在検索語候補リスト作成部５と、対話制御部６と、音声出力部７と、音声出力用ソフトウェア７Ｓと、システムデータベース８とを有する。
【００１５】
音声入力された複合名詞の検索装置１において、音声入力部２を介して入力された利用者Ｐの音声が音声認識部３へ送られ、音声認識部３は、入力音声を音声認識処理する際に、システムデータベース８を利用する。また、音声認識部３は、利用者Ｐによる入力音声について、音声認識用ソフトウェア３Ｓを利用して、認識処理を実行する。
【００１６】
システムデータベース８は、検索データベース８１と、検索補助データベース８２と、ＹＥＳ／ＮＯデータベース８３とによって構成されている。
【００１７】
検索データベース８１は、複数の単名詞で構成されている複合名詞が検索語として登録され、しかも、上記検索語が各単名詞に区切られて登録されているデータベースである。
【００１８】
検索補助データベース８２は、検索データベース８１に登録されている全検索語を構成する単名詞が、その頻度の高い順に登録され、しかも、この頻度の高い順に登録されている単名詞が、その頻度の高い方から順に、所定の数（検索装置１では５００）毎に分割されて、複数の単名詞集合群が形成されているデータベースである。
【００１９】
ＹＥＳ／ＮＯデータベース８３は、利用者Ｐが応答した内容（たとえば、はい／いいえ、ＹＥＳ／ＮＯ）を認識するデータベースである。
【００２０】
音声認識用ソフトウェア３Ｓは、検索装置１の処理の場面に合わせて、検索データベース８１または検索補助データベース８２を、システムデータベース８から選択するものである。
【００２１】
検索語が音声入力されると、検索補助データベース８２を参照し、また、利用者Ｐへの正誤確認に対する応答を認識する場合は、ＹＥＳ／ＮＯデータベース８３が参照される。
【００２２】
また、音声認識部３は、音声認識処理の際に、音声認識用ソフトウェア３Ｓを使用し、音声出力部７は、音声出力の際に、音声出力用ソフトウェア７Ｓを使用する。
【００２３】
次に、検索装置１について、より具体的に説明する。
【００２４】
なお、以下の説明では、企業名等、法人名義を確定するサービスの入力インタフェース部分に、音声入力された複合名詞の検索装置１が設けられている場合について説明する。
【００２５】
日本全国の電話帳に掲載されている法人名義は２２００万件も存在し、２２００万件の中から１つの法人名義を特定するには相当の時間がかかり、したがって、現行の音声認識技術では、対話処理実時間（検索装置と利用者Ｐとがやりとりする場合、上記利用者Ｐにストレスまたは不自然さを感じさせない時間）内で法人名義を認識処理することが不可能であり、しかも、この場合、非常に似通ったデータが多いので、認識精度が非常に低い。
【００２６】
図２は、検索データベース８１中の法人名義が複合名詞で構成され、この複合名詞が、それを構成する単名詞毎に区切って登録されている具体例を示す図である。
【００２７】
検索データベース８１に登録されている法人名義を構成している各名詞の頻度を調べ、単名詞を頻度順に記録し、検索補助データベース８２を作成する。つまり、検索補助データベース８２は、検索データベース８１に登録されている法人名義を構成している各単名詞について、その頻度をカウントし、頻度順に登録してあるデータベースである。
【００２８】
なお、上記２２００万件の法人名義を構成する単名詞の総数は、６５０万種類である。
【００２９】
図３は、検索装置１において、検索補助データベース８２の具体例を示す図である。
【００３０】
検索補助データベース８２中の単名詞は、検索データベース８１２登録されている複合名詞を構成する単名詞であり、その使用頻度の高い順に並べられ、使用頻度が高い方から５００個づつ取り出し、この５００個の名詞を１つの単名詞集合群とする。
【００３１】
使用頻度が最も高い単名詞を含む集合群を、第１の単名詞集合群Ｇ１（他の単名詞集合群よりも優先して認識する対象である単名詞集合群）とし、その次に使用頻度が高い単名詞を含む単名詞集合群を、第２の単名詞集合群Ｇ２とし、以下、使用頻度が高い順に、第３の単名詞集合群Ｇ３、第４の単名詞集合群Ｇ４、……とする。
【００３２】
１つの集合群を構成する名詞の数をｎとすると、検索装置１では、ｎ＝５００であり、この数は、次のようにして決められる。つまり、対話処理実時間（検索装置と利用者Ｐとがやりとりする場合、上記利用者Ｐにストレスまたは不自然さを感じさせない時間である）内に音声認識用ソフトウェア３Ｓが処理可能な単名詞の数をＴとし、検索データベース８１に登録されている全検索語の平均単名詞数をＭとすると、ｎ＝Ｔ／Ｍである。
【００３３】
具体的には、対話処理実時間内に音声認識用ソフトウェア３Ｓが処理可能な単名詞の数Ｔが１５００であるとし、検索データベース８１に登録されている全検索語の平均単名詞数Ｍが３であるとすると、ｎ＝Ｔ／Ｍ＝１５００／３＝５００である。
【００３４】
なお、単名詞集合群Ｇ１、Ｇ２、Ｇ３、Ｇ４、……のそれぞれを構成する単名詞の数ｎは、５００以外の数でもよいが、上記のように、対話処理実時間内に処理可能な単名詞の数Ｔ（音声認識用ソフトウェア３Ｓの性能）と、検索データベース８１に登録されている検索語が有する単名詞の数の平均Ｍとによって定められる。
【００３５】
図４は、検索装置１において、検索語を確定する処理プロセスを具体的に示すフローチャートである。
【００３６】
この前提として、検索データベース８１、検索補助データベース８２が作成されているとする。
【００３７】
まず、検索したい法人名義（複合名詞）を、単名詞に区切った形で音声入力するように、利用者Ｐに要求する（Ｓ０）。そして、単名詞集合群の順位を示す関数ｋを１とする。
【００３８】
ここで、複合名詞「横須賀／市民／病院」が検索語として音声入力された場合について考える。まず、音声入力された単名詞「横須賀」、「市民」、「病院」のそれぞれについて、第１の単名詞集合群Ｇ１を使用し、音声認識部３が認識処理を行う（Ｓ１）。つまり、第１の単名詞集合群Ｇ１の範囲内で、音声認識部３が認識処理を行う。そして、音声認識結果出力部４が、その認識結果を出力する。
【００３９】
音声入力された単名詞「横須賀」、「市民」、「病院」のうちで、単名詞「横須賀」、「病院」は、第１の単名詞集合群Ｇ１に含まれているが、「市民」の頻度順位は、図３に示すように、頻度順位７９０位であるので、第１の単名詞集合群Ｇ１には含まれ図、第２の単名詞集合群Ｇ２に含まれている。
【００４０】
図５は、検索装置１において、音声入力された検索語（複合名詞）を構成する各単名詞に対する認識結果と、その認識尤度とが対応している認識結果リストの具体例を示す図である。
【００４１】
１つの単名詞が音声入力されると、この音声入力された単名詞に対する複数の構成名詞候補と、これら複数の構成名詞候補のそれぞれに対する認識尤度とを、音声認識結果出力部４が出力し、この出力された構成名詞候補と認識尤度とを対応させて、認識結果リストを作成する（Ｓ１）。このようにして作成された認識結果リストが、図５に示されている。
【００４２】
たとえば、単名詞「横須賀」を音声入力すると、この入力された音声を、音声認識部３が、図５に示すように、「横須賀」、「横浜」、「須加浜」、「横横」、……と認識し、「横須賀」の認識尤度が９７であり、「横浜」の認識尤度が９０であり、「須加浜」の認識尤度が８９であり、「横横」の認識尤度が８０である。
【００４３】
なお、構成名詞候補についての認識尤度は、検索データベース８１を作るときに、予め定められている。
【００４４】
ここで、認識尤度が所定の閾値以上である構成名詞候補を、有力構成名詞候補とする。なお、検索装置１では、上記所定の閾値を８０とする。つまり、認識尤度が８０以上である構成名詞候補が、有力構成名詞候補である。
【００４５】
そして、図５に示す各認識結果から、認識尤度が８０以上である単名詞を、有力構成名詞候補として選択する（Ｓ２）。
【００４６】
図５に示すように、音声入力された単名詞「横須賀」については、「横須賀」、「横浜」、「須加浜」、「横々」の４候補が有力構成名詞候補として選択され、音声入力された単名詞「市民」ついては、「市立」の１つの候補が有力構成名詞候補として選択され、音声入力された単名詞「病院」については、「病院」、「美容院」の２候補が有力構成名詞候補として選択される。これら有力構成名詞候補を利用し、実在検索語候補リストを作成する（Ｓ３）。なお、実在検索語候補リストは、検索データベース８１に実在する検索語のうちで、利用者Ｐに提示し、確認を求める検索語の候補を集めたリストである。
【００４７】
ところで、補助データベース８２における単名詞「市民」の頻度順位は、図２に示すように、７９０位であるので、第１の単名詞集合群Ｇ１には、単名詞「市民」が含まれていない。したがって、図５に示す「市民」に対する認識結果には、単名詞「市民」が含まれていない。
【００４８】
図６は、検索装置１において、実在検索語候補リスト作成の様子を示す図である。
【００４９】
図５に示す認識結果のうちで認識尤度が８０以上である単名詞を組み合わせた場合、この組み合わせのうちで、検索データベース８１に登録されている単名詞の組合わせは、「横須賀／市立／病院」と「横浜／市立／病院」との２つの組み合わせであり、この２つの組み合わせが、検索データベース８１に実在する検索語候補である実在検索語候補として選択される。このようにして選択された実在検索語候補をリスト化すると、図６の下部に示す実在検索語候補リストが作成される（Ｓ３）。
【００５０】
検索装置１において、検索語認識尤度は、図６に示すように、各単名詞の認識尤度を加算したものである。なお、検索語認識尤度を算出する場合、各単名詞の認識尤度を乗算するようにしてもよい。
【００５１】
そして、実在検索語候補リストの中に、利用者Ｐによる確認処理のみで検索語を確定することができる条件を満たす候補が存在する否かを、判断する（Ｓ２１）。
【００５２】
ここで、検索語認識尤度の閾値が予め定められ、所定の検索語候補の検索語認識尤度が、検索語認識尤度の閾値を越えていれば、その検索語候補は、利用者Ｐによる確認処理のみで検索語を確定することができる条件を満たしていると判断する。なお、検索装置１においては、上記検索語認識尤度の閾値が２７０であると定められているとする。
【００５３】
そして、検索語候補を利用者Ｐにディスプレイ等で提示し、確認を求め（Ｓ２２）、利用者ＰがＹＥＳの応答をすれば（Ｓ２３）、検索処理を終了する。
【００５４】
図６に示す実在検索語候補リスト中の検索語候補は、それらのどれも、検索語認識尤度の閾値２７０を越えないので、図６に示す実在検索語候補リスト中の検索語候補は、全て、利用者Ｐによる確認処理のみでは検索語を確定することができない。
【００５５】
このように検索語を確定することができない場合に備えて、第２の単名詞集合群Ｇ２の範囲で単名詞の認識、認識尤度の算出等の処理を、予め実行しておく。すなわち、検索語候補を利用者Ｐにディスプレイ等で提示し、確認を求める処理（Ｓ２２）および利用者Ｐによる応答（Ｓ２３）と並行して、第２の単名詞集合群Ｇ２の範囲で単名詞の認識、認識尤度の算出（Ｓ１２）、有力構成名詞候補の再選出（Ｓ１３）、実在検索語候補リストの更新（Ｓ１４）を実行する。
【００５６】
つまり、まず、単名詞集合群の順位を示す関数ｋを１インクリメントし（Ｓ１１）、ｋ＝２とし、認識処理が終了した第１の単名詞集合群Ｇ１の次に使用頻度が高い第２の単名詞集合群Ｇ２（頻度順位が５００位〜１，０００位である単名詞によって構成されている単名詞集合群）の範囲で、認識し、この認識結果を利用し、有力構成名詞候補の再抽出を試みる（Ｓ１２、Ｓ１３、Ｓ１４）。
【００５７】
図４に示すフローチャートにおいて、ステップＳ３の後に、ステップ２１に進むルートとは別に、ステップＳ１１に進むルートが破線で示されている。これは、ステップＳ２１〜Ｓ２３のルーチンと、ステップＳ１１〜Ｓ１５のルーチンとが並行処理されるという意味である。つまり、第１の単名詞集合群Ｇ１について利用者Ｐとの対話処理（Ｓ２１〜Ｓ２３）が実行されている間に、第２の単名詞集合群Ｇ２について、有力構成名詞候補の再選出、実在検索語候補リストの更新等（Ｓ１１〜Ｓ１５）が実行される。
【００５８】
また、その後に、必要であれば、第２の単名詞集合群Ｇ２について利用者Ｐとの対話処理（Ｓ２１〜Ｓ２３）が実行されている間に、第３の単名詞集合群Ｇ３について、有力構成名詞候補の再選出、実在検索語候補リストの更新等（Ｓ１１〜Ｓ１５）が実行され、さらに、第３の単名詞集合群Ｇ３について利用者Ｐとの対話処理（Ｓ２１〜Ｓ２３）が実行されている間に、第４の単名詞集合群Ｇ４について、有力構成名詞候補の再選出、実在検索語候補リストの更新等（Ｓ１１〜Ｓ１５）が実行される。これらの並行処理が、必要に応じて、さらに繰り返される。
【００５９】
図７は、検索装置１において、更新された認識結果リストの具体例を示す図である。
【００６０】
図７では、第２の単名詞集合群Ｇ２の範囲で認識された認識結果が追加され、有力構成名詞候補が更新されたリストが示されている。
【００６１】
なお、図２に示すように、補助データベース８２における単名詞「市民」の頻度順位は、７９０位であるので、第２の単名詞集合群Ｇ２に単名詞「市民」が含まれ、したがって、図７に示す更新された認識結果リストには、音声入力された単名詞「市民」に対する認識結果の中に、有力構成名詞候補として、「市民」が含まれている。
【００６２】
図８は、検索装置１において、実在検索語候補リストを作成する処理を実行した結果、得られる実在検索語候補リストを示す図である。
【００６３】
実在検索語候補リストを作成する処理を実行した結果、図８に示す実在検索語候補リストが得られ、上記閾値２７０を越える検索語認識尤度を有している検索語候補は、「横須賀／市民／病院」、「横浜／市民／病院」であり、これらのうちの「横須賀／市民／病院」について、利用者Ｐに提示し、その正誤確認を行う（Ｓ２２）。
【００６４】
正誤確認において、利用者Ｐから肯定を示す応答（ＹＥＳ）が得られると（Ｓ２３）、検索語が確定されたものとして処理を終了する。
【００６５】
ところで、音声認識対象語彙数が大規模であり、しかも、似通った語彙が多い場合、従来の音声認識技術では認識処理時間が長くなるので、従来例では、利用者Ｐが音声入力した検索語を、その利用者Ｐにストレスを与えずに一定時間内で検索することは、非常に困難であり、また、認識装置の精度の低下が避けられない。
【００６６】
そこで、検索装置１では、検索対象（検索語）を、単名詞の羅列からなる複合名詞だけに限定し、単名詞で１つづつ区切って、検索語を入力するように利用者Ｐに指示し、利用者Ｐが入力した各単名詞について、検索語を構成する単名詞を使用頻度順に保持している検索補助データベース８２を認識対象として認識処理する。この点が、検索装置１の特徴である。
【００６７】
検索データベース８１に登録されている検索語の総数よりも、検索補助データベース８２に登録されている単名詞の総数が少ないことが期待されるが、検索補助データベース８２に登録されている単名詞の総数は、対話処理実時間内で処理不可能な数である場合が多い。このように、検索補助データベース８２に登録されている単名詞の総数が、対話処理実時間内で処理不可能な数であり、しかも、検索補助データベース８２に登録されている単名詞を一度に処理しようとすれば、利用者Ｐを待機させざるを得ない。
【００６８】
そこで、検索装置１では、検索補助データベース８２中の単名詞を、使用頻度順に並べ、これを、対話処理実時間内で処理可能な一定の所定数づつに分割して、複数の単名詞集合群を構成し、使用頻度の高い単名詞順に認識処理を行い、各単名詞集合群に対する認識結果を検索語候補選定対話する時間に、残りの単名詞集合群に対する認識処理を行う。これによって、１つの検索語について１回目の検索語候補選定対話が終わると、直ちに、２回目の検索語候補選定対話が行われ、必要ならば、３回目、４回目、……の検索語候補選定対話が引き続いておこなわれるので、利用者Ｐを待機させる暇がない。
【００６９】
すわなち、検索装置１の内部の処理状況を利用者Ｐが一切見ることができないので、あたかも、検索データベース８１に登録されている検索語を一括して認識処理を行っているかのように見える。
【００７０】
また、検索装置１によれば、各単名詞に対する認識結果から、有力構成名詞候補を選択し、これら選択された有力構成名詞候補の全組み合わせの中から、検索データベース８１に実在する検索語候補のみを選択し、利用者Ｐによる確認処理のみで確定できる条件を満たすと判断できる検索語候補を、利用者Ｐに提示をする。したがって、検索装置１では、存在確率が高い検索語順に、認識結果を抽出することができる。
【００７１】
すなわち、検索装置１では、１回で認識処理する単名詞の数を絞ることによって、利用者Ｐを待機させることがなく、しかも、使用される頻度の高い単名詞から順に、認識処理することによって、存在確率が高い検索語順に、認識結果を抽出することができる。
【００７２】
換言すれば、検索装置１では、音声認識を利用して複合名詞を検索する場合、認識対象が大多数であることから生じる認識処理時間の長さを利用者Ｐに感じさせず、誤認識によって正誤確認の繰り返しを余儀なくさせることによるストレスを、利用者Ｐに感じさせず、しかも、高精度な自然性を備えている。
【００７３】
図９は、検索装置１における検索データベース８１を一般的に示す図である。
【００７４】
検索データベース８１は、対話処理実時間内で音声認識処理が不可能な数の検索語を保持し、各検索語は、単名詞に分割された形で登録されている。
【００７５】
つまり、たとえば検索語である複合名詞Ｎ₁は、単名詞ｎ₁、ｎ₂、ｎ₃によって構成され、検索データベース８１には、複合名詞Ｎ₁として、単名詞ｎ₁、ｎ₂、ｎ₃が、単名詞毎に区切られた状態で登録されている。
【００７６】
図１０は、検索補助データベース８２を一般的に示す図である。
【００７７】
検索補助データベース８２は、検索データベース８１に登録されている全検索語を構成する各単名詞の使用頻度をそれぞれ算出し、単名詞を頻度順に並べた状態で登録しているデータベースである。
【００７８】
検索補助データベース８２が登録している単名詞の数は、検索データベース８１の検索語数よりも少ないことが予想されるが、対話処理実時間内には処理不可能な数で構成される。
【００７９】
検索補助データベース８２では、頻度が高い順に単名詞が並べられ（序列化し）、予め定められた対話処理実時間内に処理可能な単名詞の数づつ、単名詞を分割し（単名詞の上記序列を分割し）、単名詞集合群を形成した状態で登録されている。最も頻度の高い単名詞を含む単名詞集合群を、第１の単名詞集合群Ｇ１という。
【００８０】
また、検索装置１を、記録媒体の発明として把握することができる。
【００８１】
つまり、検索装置１は、複数の単名詞で構成されている複合名詞が検索語として登録され、しかも、上記検索語が各単名詞に区切られて登録されている検索データベースを作成する検索データベース作成手順と、上記検索データベースに登録されている全検索語を構成する単名詞が、その頻度の高い順に登録され、しかも、この頻度の高い順に登録されている単名詞が、その頻度の高い方から順に、所定の数毎に分割されて、複数の単名詞集合群が形成されている検索補助データベースを作成する検索補助データベース作成手順と、利用者Ｐが上記検索語を単名詞毎に入力すると、上記入力された単名詞毎に、上記複数の単名詞集合群のうちで、最も頻度が高い単名詞を含む第１の単名詞集合群の範囲内で認識処理し、認識尤度を対応させて、認識結果リストを作成する認識結果リスト作成手順と、上記認識処理された単名詞である構成名詞候補と、上記構成名詞候補についての認識尤度との組が認識尤度順に並べられている認識結果リストを、上記音声入力された単名詞のそれぞれついて作成し、上記認識結果リストに記載されている構成名詞候補のうちで、所定の閾値を超える認識尤度を具備する構成名詞候補を、有力構成名詞候補として選出する有力構成名詞候補選出手順と、上記有力構成名詞候補の全組合わせの中から、上記検索データベースに実在する検索語のみを選択し、各有力構成名詞候補の認識尤度に所定の演算を行い、検索語認識尤度を算出し、この算出された検索語認識尤度の大きい順に並べた実在検索語候補リストを作成する実在検索語候補リスト作成手順と、上記実在検索語候補リスト中の検索語候補が、利用者Ｐによる確認処理のみで検索語を特定することができる条件を満たす場合は、上記利用者Ｐとの間で必要な対話を実行し、検索語を確定する検索語候補選定対話手順とをコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体の例である。
【００８２】
なお、上記記録媒体として、ＦＤ、ＣＤ、ＤＶＤ、ＨＤ、半導体メモリ等が考えられる。
【００８３】
なお、商品配送サービスや、電話番号検索や郵便番号検索等における入力インタフェース部分において、検索装置１で行った法人名義の確定作業を、幅広く適用することができる。
【００８４】
図１１は、本発明の第２の実施例である音声入力された複合名詞の検索装置１０１を示すブロック図である。
【００８５】
音声入力された複合名詞の検索装置１０１は、音声入力部１０２と、音声認識部１０３と、音声認識用ソフトウェア１０３Ｓと、音声認識結果出力部１０４と、実在検索語候補リスト作成部１０５と、対話制御部１０６と、音声出力部１０７と、音声出力用ソフトウェア１０７Ｓと、システムデータベース１０８とを有する。
【００８６】
音声入力された複合名詞の検索装置１０１において、音声入力部１０２を介して入力された利用者Ｐの音声が音声認識部１０３へ送られ、音声認識部１０３は、入力音声を音声認識処理する際に、システムデータベース１０８を利用する。また、音声認識部１０３は、利用者Ｐによる入力音声について、音声認識用ソフトウェア１０３Ｓを利用して、認識処理を実行する。
【００８７】
システムデータベース１０８は、検索データベース１８１と、検索補助データベース１８２と、ＹＥＳ／ＮＯデータベース１８３とによって構成されている。
【００８８】
検索データベース１８１は、複数の単名詞で構成されている複合名詞が検索語として登録され、しかも、上記検索語が各単名詞に区切られて登録されているデータベースである。
【００８９】
検索補助データベース１８２は、登録されている各複合名詞のｎ番目（ｎは整数値）に表記されている単名詞を集めた群を、ｎ番目表記の単名詞集合群と呼び、上記ｎ番目表記の単名詞集合群が、その頻度の高い順に登録され、しかも、この頻度の高い順に登録されている単名詞が、その頻度の高い方から順に、所定の数（第２の実施例では５００個）毎にまとめられ、複数のサブ集合群が形成されている検索補助データベースである。
【００９０】
ＹＥＳ／ＮＯデータベース１８３は、利用者Ｐが応答した内容（たとえば、はい／いいえ、ＹＥＳ／ＮＯ）を認識するデータベースである。
【００９１】
音声認識用ソフトウェア１０３Ｓは、検索装置１０１の処理の場面に合わせて、検索データベース１８１または検索補助データベース１８２を、システムデータベース１０８から選択するものである。
【００９２】
検索語が音声入力されると、検索補助データベース１８２を参照し、また、利用者Ｐへの正誤確認に対する応答を認識する場合は、ＹＥＳ／ＮＯデータベース１８３が参照される。
【００９３】
また、音声認識部１０３は、音声認識処理の際に、音声認識用ソフトウェア１０３Ｓを使用し、音声出力部１０７は、音声出力の際に、音声出力用ソフトウェア１０７Ｓを使用する。
【００９４】
次に、第２の実施例について、より具体的に説明する。
【００９５】
なお、以下の説明では、企業名等、法人名義を確定するサービスの入力インタフェース部分に、音声入力された複合名詞の検索装置１０１が設けられている場合について説明する。
【００９６】
日本全国の電話帳に掲載されている法人名義は２２００万件も存在し、２２００万件の中から１つの法人名義を、入力した音声に基づいて、特定するには相当の時間がかかり、したがって、現行の音声認識技術では、対話処理実時間（検索装置と利用者Ｐとがやりとりする場合、上記利用者Ｐにストレスまたは不自然さを感じさせない時間）内で法人名義を認識処理することが不可能であり、しかも、この場合、非常に似通ったデータが多いので、認識精度が非常に低い。
【００９７】
図１２は、第２の実施例において、検索データベース１８１中の法人名義が複合名詞で構成され、この複合名詞が、それを構成する単名詞毎に区切って登録されている具体例を示す図である。
【００９８】
検索データベース１８１に登録されている法人名義を構成している各名詞の頻度を調べ、単名詞を頻度順に記録し、検索補助データベース１８２を作成する。
【００９９】
なお、上記２２００万件の法人名義を構成する単名詞の総数は、６５０万種類である。また、法人名義２，２００万件を構成する名詞のうち、１番目表記の単名詞（法人名義中の第１単語目に位置する単名詞）の総数は、約３６０万種類であり、２番目表記の単名詞（法人名義中の第２単語目に位置する単名詞）の総数は、約２５０万種類であり、３番目表記の単名詞（法人名義中の第３単語目に位置する単名詞）の総数は、約２７０万種類であり、４番目表記の単名詞（法人名義中の第４単語目に位置する単名詞）の総数は、約１００万種類、…（最長構成単語数７）であり、対話処理実時間内では、１つの複合名詞に対する各単名詞の認識処理は不可能であり、精度も低いことが予想される。
【０１００】
図１３は、第２の実施例において、検索補助データベース１８２に格納されているデータの具体例を示す図である。
【０１０１】
検索補助データベース１８２中の単名詞は、検索データベース１８１に登録されている複合名詞を構成する単名詞であり、複合名詞における表記の順番毎に、単名詞集合群が形成されている。複合名詞における表記の順番が最初である単名詞だけを集めて、１番目表記の単名詞集合群Ｇａ１が形成され、１番目表記の単名詞集合群Ｇａ１において、その使用頻度の高い順に単名詞が登録され、しかも、これら登録されている単名詞が、その頻度の高い方から順に、５００個の単名詞毎にまとめられ、複数のサブ集合群が形成され、頻度の高い順に、第１サブ集合群Ｇａ１−１、第２サブ集合群Ｇａ１−２、……、第ｍサブ集合群Ｇａ１−ｍが形成されている。
【０１０２】
なお、使用頻度が最も高い単名詞を含む第１サブ集合群Ｇａ１−１は、他のサブ集合群Ｇａ１−２〜Ｇａ１−ｍよりも優先して認識する対象である。
【０１０３】
また、複合名詞における表記の順番が２番目である単名詞だけを集めて、２番目表記の単名詞集合群Ｇａ２が形成され、２番目表記の単名詞集合群Ｇａ２において、その使用頻度の高い順に単名詞が登録され、しかも、これら登録されている単名詞が、その頻度の高い方から順に、５００個の単名詞毎にまとめられ、複数のサブ集合群が形成され、頻度の高い順に、第１サブ集合群Ｇａ２−１、第２サブ集合群Ｇａ２−２、……、第ｍサブ集合群Ｇａ２−ｍが形成されている。
【０１０４】
なお、使用頻度が最も高い単名詞を含む第１サブ集合群Ｇａ２−１は、他のサブ集合群Ｇａ２−２〜Ｇａ２−ｍよりも優先して認識する対象である。
【０１０５】
以下、上記と同様に、複合名詞における表記の順番がｎ番目である単名詞だけを集めて、ｎ番目表記の単名詞集合群Ｇａｎが形成され、ｎ番目表記の単名詞集合群Ｇａｎにおいて、その使用頻度の高い順に単名詞が登録され、しかも、これら登録されている単名詞が、その頻度の高い方から順に、５００個の単名詞毎にまとめられ、複数のサブ集合群が形成され、頻度の高い順に、第１サブ集合群Ｇａｎ１、第２サブ集合群Ｇａｎ２、……、第ｎサブ集合群Ｇａｎ−ｍが形成されている。
【０１０６】
なお、使用頻度が最も高い単名詞を含む第１サブ集合群Ｇａｎ−１は、他のサブ集合群Ｇａｎ−２〜Ｇｎ−ｍよりも優先して認識する対象である。
【０１０７】
ところで、１つのサブ集合群を構成する名詞の数をＮとすると、第２の実施例では、Ｎ＝５００であり、この数は、次のようにして決められる。つまり、対話処理実時間（検索装置と利用者Ｐとがやりとりする場合、上記利用者Ｐにストレスまたは不自然さを感じさせない時間である）内に音声認識用ソフトウェア１０３Ｓが処理可能な単名詞の数をＴとし、検索データベース１８１に登録されている全検索語の平均単名詞数をＭとすると、Ｎ＝Ｔ／Ｍである。
【０１０８】
具体的には、対話処理実時間内に音声認識用ソフトウェア１０３Ｓが処理可能な単名詞の数Ｔが１５００であるとし、検索データベース１８１に登録されている全検索語の平均単名詞数Ｍが３であるとすると、Ｎ＝Ｔ／Ｍ＝１５００／３＝５００である。
【０１０９】
なお、各サブ集合群Ｇａ１−１〜Ｇａｎ−ｍのそれぞれを構成する単名詞の数Ｎは、５００以外の数でもよいが、上記のように、対話処理実時間内に処理可能な単名詞の数Ｔ（音声認識用ソフトウェア１０３Ｓの性能）と、検索データベース１８１に登録されている検索語が有する単名詞の数の平均Ｍとによって定められる。
【０１１０】
図１４は、第２の実施例において、検索語を確定する処理プロセスを具体的に示すフローチャートである。
【０１１１】
この前提として、検索データベース１８１、検索補助データベース１８２が作成されているとする。
【０１１２】
まず、検索したい法人名義（複合名詞）を、単名詞に区切った形で音声入力するように、利用者Ｐに要求する（Ｓ１００）。そして、検索語である複合名詞に関する各単名詞集合群におけるサブ集合群の関数（サブ集合群の順位を示す関数）ｋを１とする。つまり、サブ集合群の関数ｋ＝１であれば、複数のサブ集合群のうちで、サブ集合群Ｇａ１−１、Ｇａ２−１、Ｇａ３−１、……を使用して、各単名詞が認識される。
【０１１３】
ここで、複合名詞「横浜／グランド／ホテル」が検索語として音声入力された場合について考える。
【０１１４】
まず、音声入力された単名詞「横浜」、「グランド」、「ホテル」のそれぞれについて、１番目表記の単名詞集合群Ｇａ１中の第１サブ集合群Ｇａ１−１、２番目表記の単名詞集合群Ｇａ２中の第１サブ集合群Ｇａ２−１、３番目表記の単名詞集合群Ｇａ３中の第１サブ集合群Ｇａ３−１を使用し、音声認識部１０３が認識処理を行う（Ｓ１０１）。つまり、音声入力された単名詞「横浜」について、第１サブ集合群Ｇａ１−１の範囲内で認識処理し、音声入力された単名詞「グランド」について、第１サブ集合群Ｇａ２−１の範囲内で認識処理し、音声入力された単名詞「ホテル」について、第１サブ集合群Ｇａ３−１の範囲内で認識処理する。そして、音声認識結果出力部１０４が、その認識結果を出力する。
【０１１５】
音声入力された単名詞「横浜」、「グランド」、「ホテル」のうちで、単名詞「横浜」は、図１３に示すように、第１サブ集合群Ｇａ１−１に含まれ、単名詞「ホテル」も、第１サブ集合群Ｇａ３−１に含まれているとする。しかし、単名詞「グランド」の頻度順位は、図１３に示すように、頻度順位９５１位であるので、第１サブ集合群Ｇａ２−１には含まれず、第２サブ集合群Ｇａ２−２に含まれている。
【０１１６】
図１５は、第２の実施例において、音声入力された検索語（複合名詞）を構成する各単名詞に対する認識結果と、その認識尤度とが対応している認識結果リストの具体例を示す図である。
【０１１７】
１つの単名詞が音声入力されると、この音声入力された単名詞に対する複数の構成名詞候補と、これら複数の構成名詞候補のそれぞれに対する認識尤度とを、音声認識結果出力部１０４が出力し、この出力された構成名詞候補と認識尤度とを対応させて、認識結果リストを作成する（Ｓ１０１）。このようにして作成された認識結果リストが、図１５に示されている。
【０１１８】
たとえば、単名詞「横浜」を音声入力すると、この入力された音声を、音声認識部１０３が、図１５に示すように、「横浜」、「横須賀」、「横山」、「横山」、……と認識し、「横浜」の認識尤度が９５であり、「横須賀」の認識尤度が９０であり、「横溝」の認識尤度が８１であり、「横山」の認識尤度が７５である。
【０１１９】
なお、各単名詞についての認識尤度は、その単名詞が音声入力されたときに、音声認識装置３Ｓが、個々に判断する。
【０１２０】
ここで、認識尤度が所定の閾値以上である構成名詞候補を、有力構成名詞候補とする。なお、第２の実施例では、上記所定の閾値を８０とする。つまり、認識尤度が８０以上である構成名詞候補が、有力構成名詞候補である。上記所定の閾値が８０であることは、データベース８１、８２を作るときに、予め設定されている。
【０１２１】
そして、図１５に示す各認識結果から、認識尤度が８０以上である単名詞を、有力構成名詞候補として選択する（Ｓ１０２）。
【０１２２】
図１５に示すように、音声入力された単名詞「横浜」については、「横浜」、「横須賀」、「横溝」の３候補が有力構成名詞候補として選択され、音声入力された単名詞「グランド」ついては、有力構成名詞候補として選択されたものがなく、音声入力された単名詞「ホテル」については、「ホテル」、「ホール」の２候補が有力構成名詞候補として選択される。
【０１２３】
そして、これら有力構成名詞候補を利用し、実在検索語候補リストを作成する（Ｓ１０３）。なお、実在検索語候補リストは、検索データベース１８１に実在する検索語のうちで、利用者Ｐに提示し、確認を求める検索語の候補を集めたリストである。
【０１２４】
ところで、２番目表記の単名詞「グランド」の頻度順位は、補助データベース８２に格納されている２番目表記の単名詞集合群Ｇａ２において、図１２に示すように、９５１位であるので、２番目表記の単名詞集合群Ｇａ２の第１サブ集合群Ｇａ２−１には、単名詞「グランド」が含まれていない。よって、図１５に示す音声入力された単名詞「グランド」に対する認識結果には、単名詞「グランド」が含まれていない。
【０１２５】
したがって、実在検索語候補リストを作成するステップ（Ｓ１０３）では、実在検索語候補リストが作成されない。
【０１２６】
そして、確認処理のみで検索語特定可能な条件を満たさないので（Ｓ１２１）、サブ集合群の関数ｋを１インクリメントし（Ｓ１１１）、検索対象のサブ集合群が、Ｇａ１−２、Ｇａ２−２、Ｇａ３−１になり、音声入力された各単名詞について、新たな集合群Ｇａ２−２を使用して、認識し、認識尤度を算出する（Ｓ１１２）。そして、新たに認識した認識結果を追加した状態で（更新された認識結果リストをしようして）、有力構成名詞候補を再選出し（Ｓ１１３）、実在検索語候補リストを更新する（Ｓ１１４）。
【０１２７】
図１６は、第２の実施例において、更新された認識結果リストの具体例を示す図である。
【０１２８】
図１６では、第２サブ集合群Ｇａ１−２、Ｇａ２−２、Ｇａ３−２の範囲で認識された認識結果が追加され、有力構成名詞候補が更新されたリストが示されている。
【０１２９】
なお、図１３に示すように、補助データベース８２において、２番目表記の単名詞集合群Ｇａ２における単名詞「グランド」の頻度順位は、９５１位であるので、第２サブ集合群Ｇａ２−２に単名詞「グランド」が含まれ、したがって、図１６に示す更新された認識結果リストには、音声入力された単名詞「グランド」に対する認識結果の中に、有力構成名詞候補として、「グランド」が含まれている。
【０１３０】
図１７は、第２の実施例において、実在検索語候補リスト作成の様子を示す図である。
【０１３１】
有力構成名詞候補を選出できなかった音声入力単名詞「グランド」におけるサブ集合群を新たにして、認識し、この認識結果のうちで認識尤度が８０以上である単名詞を組み合わせ、この組み合わせのうちで、検索データベース１８１に登録されている単名詞の組合わせは、図１７に示すように、「横浜／グランド／ホテル」と「横浜／ゴールド／ホール」との２つの組み合わせであり、この２つの組み合わせが、検索データベース１８１に実在する検索語候補である実在検索語候補として選択される。このようにして選択された実在検索語候補について、実在検索語候補リストを作成すると、図１７の下部に示す実在検索語候補リストが更新される（Ｓ１１４）。
【０１３２】
第２の実施例において、検索語認識尤度は、図１７に示すように、各単名詞の認識尤度を加算したものである。なお、検索語認識尤度を算出する場合、各単名詞の認識尤度を乗算するようにしてもよい。
【０１３３】
そして、実在検索語候補リストの中に、利用者Ｐによる確認処理のみで検索語を確定することができる条件を満たす候補が存在する否かを、判断する（Ｓ１２１）。
【０１３４】
ここで、検索語認識尤度の閾値が予め定められ、所定の検索語候補の検索語認識尤度が、検索語認識尤度の閾値を越えていれば、その検索語候補は、利用者Ｐによる確認処理のみで検索語を確定することができる条件を満たしていると判断する。なお、第２の実施例においては、上記検索語認識尤度の閾値が２８０であると定められているとする。
【０１３５】
そして、検索語候補を利用者Ｐにディスプレイ等で提示し、確認を求め（Ｓ１２２）、利用者ＰがＹＥＳの応答をすれば（Ｓ１２３）、検索処理を終了する。
【０１３６】
図１７に示す実在検索語候補リスト中の検索語候補のうちで１つの候補が、検索語認識尤度の閾値２８０以上であるという条件を満たすので、図１７に示す実在検索語候補リスト中の検索語候補は、利用者Ｐによる確認処理のみで検索語を確定することができる。
【０１３７】
もし、実在検索語候補リスト中の検索語候補のいずれも、検索語認識尤度の閾値２８０以上であるという条件を満たしていなければ、それら実在検索語候補リスト中の検索語候補は、全て、利用者Ｐによる確認処理のみでは検索語を確定することができない。
【０１３８】
このように検索語を確定することができない場合に備えて、第３サブ集合群Ｇａ１−３、Ｇ２−３、Ｇ３−３の範囲で単名詞の認識、認識尤度の算出等の処理を、予め実行しておく。すなわち、検索語候補を利用者Ｐにディスプレイ等で提示し、確認を求める処理（Ｓ１２２）および利用者Ｐによる応答（Ｓ１２３）と並行して、第３サブ集合群Ｇａ１−３、Ｇａ２−３、Ｇａ３−３の範囲で単名詞の認識、認識尤度の算出（Ｓ１１２）、有力構成名詞候補の再選出（Ｓ１１３）、実在検索語候補リストの更新（Ｓ１１４）を実行する。
【０１３９】
つまり、サブ集合群の順位を示す関数ｋをさらに１インクリメントし（Ｓ１１１）、ｋ＝３とし、認識処理が終了した第２サブ集合群の次に使用頻度が高い第３サブ集合群Ｇａ１−３、Ｇａ２−３、Ｇａ３−３（頻度順位が１００１位〜１，５００位である単名詞によって構成されているサブ集合群Ｇａ１−３、Ｇａ２−３、Ｇａ３−３の範囲で、認識し、この認識結果を利用し、有力構成名詞候補の再抽出を試みる（Ｓ１１２、Ｓ１１３、Ｓ１１４）。
【０１４０】
図１４に示すフローチャートにおいて、ステップＳ３の後に、ステップ２１に進むルートとは別に、ステップＳ1１１に進むルートが破線で示されている。これは、ステップＳ1２１〜Ｓ1２３のルーチンと、ステップＳ１１１〜Ｓ１１５のルーチンとが並行処理されるという意味である。
【０１４１】
つまり、第１サブ集合群Ｇａ１−１、Ｇａ２−１、Ｇａ３−１について利用者Ｐとの対話処理（Ｓ１２１〜Ｓ1２３）が実行されている間に、第２サブ集合群Ｇａ１−２、Ｇａ２−２、Ｇａ３−２について、有力構成名詞候補の再選出、実在検索語候補リストの更新等（Ｓ１１１〜Ｓ１１５）が実行される。
【０１４２】
また、その後に、必要であれば、第２サブ集合群Ｇａ１−２、Ｇａ２−２、Ｇａ３−２について利用者Ｐとの対話処理（Ｓ１２１〜Ｓ１２３）が実行されている間に、第３サブ集合群Ｇａ１−３、Ｇａ２−３、Ｇａ３−３について、有力構成名詞候補の再選出、実在検索語候補リストの更新等（Ｓ１１１〜Ｓ１１５）が実行され、さらに、第３サブ集合群Ｇａ１−３、Ｇａ２−３、Ｇａ３−３について利用者Ｐとの対話処理（Ｓ１２１〜Ｓ１２３）が実行されている間に、第４サブ集合群Ｇａ１−４、Ｇａ２−４、Ｇａ３−４について、有力構成名詞候補の再選出、実在検索語候補リストの更新等（Ｓ１１１〜Ｓ１１５）が実行される。これらの並行処理が、必要に応じて、さらに繰り返される。
【０１４３】
ところで、音声認識対象語彙数が大規模であり、しかも、似通った語彙が多い場合、従来の音声認識技術では認識処理時間が長くなるので、従来例では、利用者Ｐが音声入力した検索語を、その利用者Ｐにストレスを与えずに一定時間内で検索することは、非常に困難であり、また、認識装置の精度の低下が避けられない。
【０１４４】
そこで、第２の実施例では、検索対象（検索語）を、単名詞の羅列からなる複合名詞だけに限定し、単名詞で１つづつ区切って、検索語を入力するように利用者Ｐに指示し、利用者Ｐが入力した各単名詞について、上記複合名詞において表記されている位置毎に、単名詞集合群が形成され、しかも、上記単名詞集合群毎に、その頻度の高い順に登録され、この頻度の高い順に登録されている複数の単名詞が、その頻度の高い方から順に、所定の数毎にまとめられ、複数のサブ集合群が形成されている検索補助データベースとを有するデータベースを利用して、利用者が音声入力した複合名詞を検索するものである。
【０１４５】
上記のように、複合名詞における単名詞の位置に応じて、単名詞毎に、単名詞集合群が形成され、この単名詞集合群が、複数のサブ集合群に分割され、そのうちで、使用頻度が高い単名詞が含まれているものから、認識する点が、第２の実施例の特徴である。
【０１４６】
検索データベース１８１に登録されている検索語の総数よりも、検索補助データベース１８２に登録されている単名詞の総数が少ないことが期待されるが、検索補助データベース１８２に登録されている単名詞の総数は、対話処理実時間内で処理不可能な数である場合が多い。このように、検索補助データベース１８２に登録されている単名詞の総数が、対話処理実時間内で処理不可能な数であり、しかも、検索補助データベース１８２に登録されている単名詞を一度に処理しようとすれば、利用者Ｐを待機させざるを得ない。
【０１４７】
そこで、第２の実施例では、検索補助データベース１８２中の単名詞を、使用頻度順に並べ、これを、対話処理実時間内で処理可能な一定の所定数づつに分割して、複数のサブ集合群を構成し、使用頻度の高い単名詞順に認識処理を行い、各サブ集合群に対する認識結果を検索語候補選定対話する時間に、残りのサブ集合群に対する認識処理を行う。これによって、１つの検索語について１回目の検索語候補選定対話が終わると、直ちに、２回目の検索語候補選定対話が行われ、必要ならば、３回目、４回目、……の検索語候補選定対話が引き続いて行われるので、利用者Ｐを待機させる暇がない。
【０１４８】
すなわち、検索装置１０１の内部の処理状況を利用者Ｐが一切見ることができないので、あたかも、検索データベース１８１に登録されている検索語を一括して認識処理を行っているかのように見える。
【０１４９】
また、第２の実施例によれば、各単名詞に対する認識結果から、有力構成名詞候補を選択し、これら選択された有力構成名詞候補の全組み合わせの中から、検索データベース１８１に実在する検索語候補のみを選択し、利用者Ｐによる確認処理のみで確定できる条件を満たすと判断できる検索語候補を、利用者Ｐに提示をする。したがって、第２の実施例では、存在確率が高い検索語順に、認識結果を抽出することができる。
【０１５０】
すなわち、第２の実施例では、１回で認識処理する単名詞の数を絞ることによって、利用者Ｐを待機させることがなく、しかも、使用される頻度の高い単名詞から順に、認識処理することによって、存在確率が高い検索語順に、認識結果を抽出することができる。
【０１５１】
換言すれば、第２の実施例では、音声認識を利用して複合名詞を検索する場合、認識対象が大多数であることから生じる認識処理時間の長さを利用者Ｐに感じさせず、誤認識によって正誤確認の繰り返しを余儀なくさせることによるストレスを、利用者Ｐに感じさせず、しかも、高精度な自然性を備えている。
【０１５２】
ところで、複合名詞「横浜／グランド／ホテル」の２番目表記の単名詞（複合名詞における２番目の単名詞）である「グランド」は、全検索語を構成する単名詞の全てを頻度順に並べた場合、２，４５０番目に位置するので、検索データベース１８１に格納されている全ての単名詞をその使用頻度順に並べて、５００単語ずつの単名詞について認識処理すると、上位から５つ目の５００単語の組に初めて出現することになる。この場合、少なくとも、認識処理と実在検索語リスト作成処理とを５回繰返すことになり、その過程において、検索語認識尤度が規定閾値を超える実在検索語候補が存在した場合は、利用者への提示が行われることになり、利用者Ｐが違和感を抱く。ところが、第２の実施例では、「横浜／グランド／ホテル」の２番目表記の単名詞（複合名詞における２番目の単名詞）である「グランド」は、２番目表記の単名詞集合群Ｇａ２では、頻度順位が９５１番目であるので、認識処理と実在検索語リスト作成処理とを２回実行すれば、検索語を確定することができ、利用者Ｐは違和感を抱かない。
【０１５３】
また、第２の実施例を、記録媒体の発明として把握することができる。
【０１５４】
つまり、第２の実施例は、複数の単名詞で構成されている複合名詞が検索語として登録され、しかも、上記検索語が各単名詞に区切られて登録されている検索データベースを作成する検索データベース作成手順と、上記登録されている各複合名詞のｎ番目（ｎは整数値）に表記されている単名詞の群を、ｎ番目表記の単名詞集合群と呼び、上記ｎ番目表記の単名詞集合群が、その頻度の高い順に登録され、しかも、この頻度の高い順に登録されている単名詞が、その頻度の高い方から順に、所定の数毎にまとめられ、複数のサブ集合群が形成されている検索補助データベースを作成する検索補助データベース作成手順と、利用者が上記検索語である複合語を単名詞毎に入力すると、上記複合名詞のｎ番目表記の単名詞については、上記ｎ番目表記の単名詞集合群で認識し、しかも上記ｎ番目表記の単名詞集合群のうちで、最も頻度が高い単名詞を含む第１サブ集合群の範囲内で認識処理し、認識尤度を対応させて、認識結果リストを作成する認識結果リスト作成手順と、上記認識処理された単名詞である構成名詞候補と、上記構成名詞候補についての認識尤度との組が認識尤度順に並べられている認識結果リストを、上記音声入力された単名詞のそれぞれついて作成し、上記認識結果リストに記載されている構成名詞候補のうちで、所定の閾値を超える認識尤度を具備する構成名詞候補を、有力構成名詞候補として選出する有力構成名詞候補選出手順と、上記有力構成名詞候補の全組合わせの中から、上記検索データベースに実在する検索語のみを選択し、各有力構成名詞候補の認識尤度に所定の演算を行い、検索語認識尤度を算出し、この算出された検索語認識尤度の大きい順に並べた実在検索語候補リストを作成する実在検索語候補リスト作成手順と、上記実在検索語候補リスト中の検索語候補が、利用者による確認処理のみで検索語を特定することができる条件を満たす場合は、上記利用者との間で必要な対話を実行し、検索語を確定する検索語候補選定対話手順とをコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体の例である。
【０１５５】
ここで、上記記録媒体として、ＦＤ、ＣＤ、ＤＶＤ、ＨＤ、半導体メモリ等が考えられる。
【０１５６】
なお、商品配送サービスや、電話番号検索や郵便番号検索等における入力インタフェース部分において、第２の実施例で行った法人名義の確定作業を、幅広く適用することができる。
【０１５７】
図１８は、本発明の第３の実施例である音声入力された複合名詞の検索装置２０１を示すブロック図である。
【０１５８】
音声入力された複合名詞の検索装置２０１は、音声入力部２０２と、音声認識部２０３と、音声認識用ソフトウェアを使用する音声認識装置２０３Ｓと、音声認識結果出力部２０４と、音声認識結果リスト作成部２０４ａと、実在検索語候補リスト作成部２０５と、対話制御部２０６と、音声出力部２０７と、音声出力用ソフトウェアを使用する音声出力装置２０７Ｓと、システムデータベース２０８とを有する。
【０１５９】
音声入力された複合名詞の検索装置２０１において、音声入力部２０２を介して入力された利用者２１０の音声が音声認識部２０３へ送られ、音声認識部２０３は、入力音声を音声認識処理する際に、システムデータベース２０８を利用する。また、音声認識部２０３は、利用者２１０による入力音声について、音声認識装置２０３Ｓにおける音声認識用ソフトウェアを利用して、認識処理を実行する。
【０１６０】
システムデータベース２０８は、検索データベース２８１と、順序順序検索補助データベース２８２と、逆順検索補助データベース２８３と、ＹＥＳ／ＮＯデータベース２８４とによって構成されている。
【０１６１】
検索データベース２８１は、複数の単名詞で構成されている複合名詞が検索語として登録され、しかも、上記検索語が各単名詞に区切られて登録されているデータベースである。
【０１６２】
順序検索補助データベース２８２は、検索データベース２８１に登録されている各複合名詞のｎ番目（ｎは整数値）に位置する単名詞の集合であるｎ単語目に位置する単名詞集合が、登録されているデータベースであり、上記ｎ単語目に位置する単名詞集合に属する単名詞が、使用頻度の高い単名詞順にしかも所定数（たとえば５００）毎に分割されることによって、複数のｎ番目の単名詞サブ集合が構成されている。
【０１６３】
逆順検索補助データベース２８３は、検索データベース２８１に登録されている各複合名詞の逆順ｍ単語目（ｍは整数値）に位置する単名詞の集合である逆順ｍ単語目に位置する単名詞集合が、登録されているデータベースであり、上記逆順ｍ単語目に位置する単名詞集合に属する単名詞が、使用頻度の高い単名詞順にしかも所定数毎に分割されることによって、複数の逆順ｍ単語目の単名詞サブ集合が構成されている。
【０１６４】
ＹＥＳ／ＮＯデータベース２８４は、利用者２１０が応答した内容（たとえば、はい／いいえ、ＹＥＳ／ＮＯ）を認識するデータベースである。
【０１６５】
音声認識装置２０３Ｓで使用される音声認識用ソフトウェアは、検索装置２０１の処理の場面に合わせて、検索データベース２８１、順序検索補助データベース２８２または逆順検索補助データベース２８３を、システムデータベース２０８から選択するものである。
【０１６６】
検索語が音声入力されると、順序検索補助データベース２８２または逆順検索補助データベース２８３を参照し、また、利用者２１０への正誤確認に対する応答を認識する場合は、ＹＥＳ／ＮＯデータベース２８４が参照される。
【０１６７】
音声認識部２０３は、音声認識処理する際に、音声認識用ソフトウェア２０３Ｓを使用し、音声出力部２０７は、音声出力する際に、音声出力用ソフトウェア７Ｓを使用する。
【０１６８】
なお、以下の説明では、企業名等、法人名義を確定するサービスの入力インタフェース部分に、音声入力された複合名詞の検索装置２０１が設けられている場合について説明する。
【０１６９】
ところで、日本全国の電話帳に掲載されている法人名義は２２００万件も存在し、２２００万件の中から１つの法人名義を特定するには相当の時間がかかり、したがって、現行の音声認識技術では、対話処理実時間（検索装置２０１と利用者２１０とがやりとりする場合、上記利用者２１０にストレスまたは不自然さを感じさせない時間）内で法人名義を認識処理することが不可能であり、しかも、この場合、非常に似通ったデータが多いので、認識精度が非常に低い。
【０１７０】
図１９は、複合名詞の検索装置２０１において、検索データベース２８１中の法人名義が複合名詞で構成され、この複合名詞が、それを構成する単名詞毎に区切って登録されている具体例を示す図である。
【０１７１】
検索データベース２８１に登録されている法人名義を構成している各名詞の頻度を調べ、単名詞を頻度順に記録し、順序検索補助データベース２８２を作成する。つまり、順序検索補助データベース２８２は、検索データベース２８１に登録されている法人名義を構成している各単名詞について、その頻度をカウントし、頻度順に登録してあるデータベースである。
【０１７２】
なお、上記２２００万件の法人名義を構成する単名詞の総数は、６５０万種類である。
【０１７３】
音声認識部２０３は、利用者２１０が、検索語を単名詞毎に区切って音声入力すると、音声入力された複合名詞における１単語目に位置する単名詞（最初から１つ目の単名詞）、２単語目に位置する単名詞（最初から２つ目の単名詞）、……の順で、認識処理を実行するとともに、音声入力された複合名詞における逆順１単語目に位置する単名詞（最後から１つ目の単名詞）、逆順２単語目に位置する単名詞（最後から２つ目の単名詞）、……の順で、認識処理を実行する部分である。
【０１７４】
音声認識結果出力部２０４は、認識結果を音声認識結果リスト作成部２０４ａへ送る部分である。
【０１７５】
音声認識結果リスト作成部２０４ａは、順序検索補助データベース２８２を使用した場合における認識結果と、逆順検索補助データベース２８３を使用した場合における認識結果とを、単名詞毎に、音声認識装置２０３Ｓが算出した認識尤度を利用してマージし、認識結果リストを作成し、実在検索語候補リスト作成部２０５へ送る部分である。
【０１７６】
この時点で、順序検索補助データベース２８２、逆順検索補助データベース２８３の中に、まだ認識処理が終了していない単名詞が存在する場合には、音声認識部２０３は、使用頻度が次に高い単名詞によって構成される単名詞の集合の範囲で認識処理を再びスタートさせ、音声認識結果出力部２０４は、認識結果を出力し、音声認識結果リスト作成部２０４ａへ送り、認識結果リストを作成し、実在検索語候補リスト作成部２０５へ送る処理を繰返す。
【０１７７】
実在検索語候補リスト作成部２０５は、認識結果に基づいて、有力構成名詞候補を選択し、有力構成名詞候補の全ての組合わせを作成し、検索データベース２８１を参照しながら、実在する検索語を抽出した実在検索語候補リスト作成し、対話制御部２０６へ送る部分である。
【０１７８】
対話制御部２０６は、実在検索語候補リストを参照し、実在検索語候補リスト中の検索語候補が、利用者２１０との確認処理のみで検索語特定可能な所定の条件を満たす場合は、確認処理ガイダンスの出力命令を音声出力部２０７へ送るものである。
【０１７９】
実在検索語候補リスト中の検索語候補が、利用者２１０との確認処理のみでは検索語特定可能な条件を満たさない場合は、使用頻度が次に高い単名詞の集合について認識処理し、この認識処理結果が得られた有力構成名詞候補を利用して更新実在検索語候補リストを利用し、検索語候補選定対話の実行を繰返す。
【０１８０】
音声出力部２０７は、確認処理ガイダンス出力命令を受けると、検索語候補と指定された候補の正誤確認を、利用者２１０に行うガイダンスを出力する。
【０１８１】
そして、確認処理ガイダンスに対する応答が、音声入力部２０２に再び入力されると、音声認識部２０３は、ＹＥＳ／ＮＯデータベース２８４を参照し、利用者２１０の応答を認識し、音声認識結果出力部１１が認識結果を出力し、利用者２１０から肯定を表す応答が得られると、検索語特定が完了した旨を利用者２１０ヘガイダンスする命令を、対話制御部２０６が音声出力部２０７へ送る。
【０１８２】
検索語が特定できるまで、実在検索語候補リストの更新と、検索語候補選定対話とを繰返し、順序検索補助データベース２８２と逆順検案補助データベース２８３とに格納されている全ての単名詞の集合に対する認識処理が終了し、実在検索語候補リストの更新が、これ以上不可能な状態になった時点で、対話制御部２０６は、実在検索語候補リストの上位から、検索語候補を利用者２１０に提示するガイダンス出力命令を音声出力部２０７へ送る。
【０１８３】
検索装置２０１は、実在検索語候補リストの更新と検索語候補選定対話とが行われている間に、優先認識対象以外の単名詞のうちの少なくとも１集合に対して、認識処理が終了しているように、上記１集合を構成する単名詞の数を規定する。
【０１８４】
次に、複合名詞の検索装置２０１における検索語確定の処理プロセスについて具体的に説明する。
【０１８５】
図２０は、複合名詞の検索装置２０１における順序検索補助データベース２８２の具体例を示す図である。
【０１８６】
順序検索補助データベース２８２に格納されている複数の単名詞は、ｎ単語目に位置する単名詞集合Ｇｂｎに分割され、つまり、１単語目に位置する単名詞集合Ｇｂ１と、２単語目に位置する単名詞集合Ｇｂ２と、３単語目に位置する単名詞集合Ｇｂ３と、……に分類されている。
【０１８７】
また、ｎ単語目に位置する単名詞集合に属する単名詞が、使用頻度の高い単名詞順に５００個毎に分割されることによって、複数のｎ番目の単名詞サブ集合が構成され、つまり、１単語目に位置する単名詞集合Ｇｂ１は、使用頻度の高い単名詞順に５００個毎に、単名詞サブ集合Ｇｂ１−１と、単名詞サブ集合Ｇｂ１−２と、単名詞サブ集合Ｇｂ１−３と、……に分割され、２単語目に位置する単名詞集合Ｇｂ２は、使用頻度の高い単名詞順に５００個毎に、単名詞サブ集合Ｇｂ２−１と、単名詞サブ集合Ｇｂ２−２と、単名詞サブ集合Ｇｂ２−３と、……に分割されている。
【０１８８】
なお、上記分割する場合における数ｃとして、複合名詞の検索装置２０１では、５００を設定しているが、上記分割する場合の数ｃは、使用する音声認識装置２０３Ｓの性能によって規定される。
【０１８９】
図２１は、複合名詞の検索装置２０１における逆順検索補助データベース２８３の具体例を示す図である。
【０１９０】
逆順検索補助データベース２８３に格納されている複数の単名詞は、逆順ｍ単語目に位置する単名詞集合Ｇｂｍに分割されている。つまり、音声入力された複合名詞における逆順１単語目に位置する単名詞（最後から１つ目の単名詞）の集合である逆順単名詞集合Ｈ１と、音声入力された複合名詞における逆順２単語目に位置する単名詞（最後から２つ目の単名詞）の集合である逆順単名詞集合Ｈ２と、音声入力された複合名詞における逆順３単語目に位置する単名詞（最後から３つ目の単名詞）の集合である逆順単名詞集合Ｈ３と、……に分類されている。
【０１９１】
また、逆順ｍ単語目に位置する単名詞集合に属する単名詞が、使用頻度の高い単名詞順に５００個毎に分割されることによって、複数の逆順ｍ単語目に位置する逆順単名詞サブ集合が構成され、つまり、逆順１単語目に位置する逆順単名詞集合Ｈ１は、使用頻度の高い単名詞順に５００個毎に、逆順単名詞サブ集合Ｈ１−１と、逆順単名詞サブ集合Ｈ１−２と、逆順単名詞サブ集合Ｈ１−３と、……に分割され、逆順２単語目に位置する逆順単名詞集合Ｈ２は、使用頻度の高い単名詞順に５００個毎に、逆順単名詞サブ集合Ｈ２−１と、逆順単名詞サブ集合Ｈ２−２と、逆順単名詞サブ集合Ｈ２−３と、……に分割されている。
【０１９２】
なお、上記分割する場合における数ｃとして、複合名詞の検索装置２０１では、５００を設定しているが、上記分割する場合の数ｃは、使用する音声認識装置２０３Ｓの性能によって規定される。
【０１９３】
図２２は、複合名詞の検索装置２０１における検索語確定の処理プロセスを示すフローチャートである。
【０１９４】
まず、利用者２１０は、検索目的である法人名義を、単名詞に区切って音声入力する（Ｓ２００）。複合名詞の検索装置２０１では「横須賀／セントラル／ホテル」が検索語として入力された場合について考える。
【０１９５】
ここで、複合名詞を構成する単名詞が、その複数名詞において何単語目に位置するかを示す変数ｎとして、「１」を設定し、そのｎ単語目に位置する単名詞集合Ｇｂｎを構成する単名詞サブ集合Ｇｂｎ−ｐにおける順位（使用頻度の高さを示す順位）の変数ｐとして、「１」を設定する（Ｓ２０１）。
【０１９６】
そして、「横須賀」、「セントラル」、「ホテル」のそれぞれに対して、単名詞サブ集合Ｇｂ１−１、単名詞サブ集合Ｇｂ２−１、単名詞サブ集合Ｇｂ３−１について、認識処理を行なう（Ｓ２０２、Ｓ２０３）。続いて、単名詞毎に、認識尤度を対応させて、順序検索した場合における認識結果リストを作成する（Ｓ２０４）。続いて、認識尤度が８０以上である単名詞を、有力構成名詞候補として選出する（Ｓ２０５）。
【０１９７】
上記「有力構成名詞候補」は、認識尤度が所定の閾値以上である構成名詞候補であり、複合名詞の検索装置２０１では、上記閾値を８０とする。つまり、認識尤度が８０以上である構成名詞候補が、有力構成名詞候補である。なお、有力構成名詞候補を選択する場合に使用する認識尤度は、検索データベース２８１を作るときに、予め定められている。
【０１９８】
図２３は、複合名詞の検索装置２０１において、順序検索した場合における認識結果リストの具体例を示す図である。
【０１９９】
なお、「順序検索」は、順序検索補助データベース２８２を使用して、音声入力された複合名詞におけるｎ単語目に位置する単名詞を、ｎ単語目に位置する単名詞集合Ｇｂｎの範囲で認識し、検索する動作である。、
また、後述の「逆順検索」は、逆順検索補助データベース２８３を使用して、音声入力された複合名詞における逆順ｍ単語目に位置する単名詞を、逆順ｍ単語目に位置する単名詞集合Ｇｂｍの範囲で認識し、検索する動作である。、
一方、上記順序検索における認識動作と並行して、逆順検索における認識動作が行われる。
【０２００】
つまり、複合名詞を構成する単名詞が、その複数名詞における逆順で何番目であるかを示す変数ｍとして、「１」を設定し、その逆順ｍ単語目に位置する単名詞集合Ｇｂｍを構成する単名詞サブ集合Ｇｂｍ−ｑにおける順位（使用頻度の高さを示す順位）の変数ｑとして、「１」を設定する（Ｓ２１１）。
【０２０１】
そして、「横須賀」、「セントラル」、「ホテル」のそれぞれに対して、逆順単名詞サブ集合Ｈ１−１、逆順単名詞サブ集合Ｈ２−１、逆順単名詞サブ集合Ｈ３−１について、認識処理を行なう（Ｓ２１２、Ｓ２１３）。続いて、単名詞毎に、認識尤度を対応させて、逆順検索した場合における認識結果リストを作成する（Ｓ２１４）。そして、認識尤度が８０以上である単名詞を、有力構成名詞候補として選出する（Ｓ２１５）。
【０２０２】
複合名詞の検索装置２０１において、上記のように、順序検索における認識動作と並行して、逆順検索における認識動作が行われるが、この場合、順序検索（Ｓ２０１〜Ｓ２０５）を１つのＣＰＵで実行し、逆順検索（Ｓ２１１〜Ｓ２１５）を別のＣＰＵで実行するようにしてもよく、または、１つのＣＰＵで、順序検索（Ｓ２０１〜Ｓ２０５）と逆順検索（Ｓ２１１〜Ｓ２１５）とを実行するようにしてもよい。
【０２０３】
図２４は、複合名詞の検索装置２０１において、逆順検索した場合における認識結果リストの具体例を示す図である。
【０２０４】
順序検索補助データベース２８２における使用頻度順位は、音声入力した複合名詞における１単語目に位置する単名詞「横須賀」は、図２０に示すように、４２０位であり、同２単語目に位置する単名詞「セントラル」は、１２５０位であり、同３単語目に位置する単名詞「ホテル」は、８９２位である。「セントラル」、「ホテル」は、５００位以下であるので、優先認識対象である単名詞サブ集合Ｇｂ２−１、Ｇｂ３−１には含まれず、最初に認識する対象ではない。
【０２０５】
ところが、逆順検索補助データベース２８３における使用頻度順位は、音声入力した複合名詞における逆順２単語目に位置する単名詞「セントラル」は、図２１に示すように、９位であり、同逆順１単語目の単名詞「ホテル」は、１位であるので、逆順単名詞サブ集合Ｈ２−１、Ｈ１−１に含まれ、優先認識対象であり、順序検索する場合よりも、早く認識される。
【０２０６】
図２５は、複合名詞の検索装置２０１において、順序検索した場合における認識結果と、逆順検索した場合における認識結果とをマージした場合における認識結果リストの具体例を示す図である。
【０２０７】
図２３に示す順序検索した場合における認識結果と、図２４に示す逆順検索した場合における認識結果とをマージする（Ｓ２２１）と、図２５に示すように、統合された認識結果リストができ上がり、有力構成名詞候補を選択する。
【０２０８】
複合名詞の検索装置２０１では、認識尤度が８０以上である単名詞を、有力構成名詞候補と定め、これによって、図２５に示すように、音声入力された単名詞「横須賀」に対して、「横浜」、「横須賀」の２候補が有力構成名詞候補として選択され、音声入力された単名詞「セントラル」に対して、「セントラル」が有力構成名詞候補として選択され、音声入力された単名詞「ホテル」に対して、「ホテル」、「ホール」の２候補が有力構成名詞候補として選択される。
【０２０９】
図２６は、複合名詞の検索装置２０１において、実在検索語候補リスト作成直前の状態を示す図である。
【０２１０】
検索装置２０１は、図２５に示すマージされた認識結果における有力構成名詞候補を利用し、実在検索語リスト作成処理を行う（Ｓ２２２）。
【０２１１】
検索装置２０１は、有力構成名詞候補の全組み合わせと、検索データベース２８１に格納されている複合名詞とに基づいて、図２６に示すように、実在する検索語候補をリストアップする。
【０２１２】
複合名詞の検索装置２０１では、「横須賀／セントラル／ホテル」（検索語認識尤度９０＋９５＋９５＝２８０）が、実在検索語候補としてリストアップされる。複合名詞の検索装置２０１において、検索語認識尤度は、図２６に示すように、各単名詞の認識尤度を加算する方式で計算する。
【０２１３】
複合名詞の検索装置２０１において、利用者２１０との確認処理のみで検索語確定可能か否かの判断（Ｓ２２３）の基準は、複合名詞の検索装置２０１が予め規定した閾値と上記検索語認識尤度とを比較し、上記規定した閾値を越える検索語認識尤度を持つ検索語候補は、「確認処理のみで検索語確定可能な条件を満たす」と判断する。
【０２１４】
なお、実在検索語候補リストは、検索データベース２８１に実在する検索語のうちで、利用者２１０に提示し、確認を求める検索語の候補を集めたリストである。
【０２１５】
複合名詞の検索装置２０１では、検索語認識尤度に対する規定閾値を２８０と定める。複合名詞の検索装置２０１において、検索語認識尤度が２８０以上の検索語候補である「横須賀／セントラル／ホテル」が実在検索語リストから選択され、利用者２１０に提示される（Ｓ２２４）。正誤確認に対して利用者２１０から肯定を示す応答が得られると（Ｓ２２５）、検索語を確定することができたとして処理を終了する。
【０２１６】
ところで、検索語である複合名詞を構成する単名詞の数が３、４、５、……、８であると仮定した場合、つまり、最多単名詞数が８であると仮定した場合、複合名詞の逆順１番目の単名詞（末尾の単名詞）として使用される可能性が高い「ホテル」、「銀行」、「センター」等の単名詞は、複合名詞が３つの単名詞で構成されていれば、３単語目に位置する単名詞としてカウントされ、複合名詞が４つの単名詞で構成されていれば、４単語目に位置する単名詞としてカウントされるので、使用されている「ホテル」、「銀行」、「センター」の単名詞の９９％が、逆順１番目の単名詞（末尾の単名詞）として使用されているとしても、頻度統計は分散する。したがって、図２０に示すように、「ホテル」、「銀行」、「センター」は、使用頻度の高い優先認識対象にはならず、このために、迅速な検索が行なわれないことが多い。
【０２１７】
ところが、複合名詞の検索装置２０１において、末尾から数えた単名詞の位置（逆順番目）毎に頻度統計をカウントして、逆順検索補助データベース２８２に格納されるので、図２１に示すように、末尾から１番目に使用される頻度が高い単名詞の集合である逆順１単語目に位置する逆順単名詞集合Ｈ１として、「ホテル」、「銀行」、「センター」等が登録され、優先認識対象となる。また、末尾から２番目に使用される頻度が高い単名詞の集合である逆順２単語目に位置する逆順単名詞集合Ｈ２として、「セントラル」「グランド」等が登録される。したがって、複合名詞の検索装置２０１では、短時間で認識動作が実行される。
【０２１８】
また、複合名詞の検索装置２０１において、実在検索語リスト作成処理（Ｓ２２２）と同時に、単名詞サブ集合Ｇｂｎ−２、逆順単名詞サブ集合Ｈｍ−２について、認識処理をスタートするようにしてもよい。つまり、検索語候補を利用者２１０に提示し、確認を求めている（Ｓ２２４）間に、使用頻度が次に高い単名詞の範囲で認識を行うと、利用者２１０から見れば、認識する動作の合間に、何もせずに待つ必要がなく、認識動作をしないで、検索語候補が次々と提示されているように思える。
【０２１９】
検索装置２０１からの質問と、この質問に対する利用者２１０からの応答とを、１ターンとした場合、複合名詞の検索装置２０１では、利用者２１０との間で、できる限り少ない対話ターン数で、検索語特定を実現することができ、これによって、対話時間の減少を図り、より迅速に検索処理を行うことができる。
【０２２０】
複合名詞の検索装置２０１における検索の基本方針は、検索語を単名詞毎に区切って音声入力し、先頭からの位置を考慮し、単名詞毎に頻度統計の大きい順に、優先的に認識処理を行い、各単名詞に対する認識結果を組合わせ、実在する検索語のみを選択することによって、認識装置の処理時間と精度の不完全性とを補い、利用者２１０にストレスを与えずに検索語を特定することである。
【０２２１】
上記基本方針に加えて、複合名詞の検索装置２０１の大きな特徴は、単名詞毎に行なう認識処理と並行して、検索語である複合名詞の末尾から数えて、１単語目、２単語目、３単語目、……毎に、頻度統計を調べ、頻度統計順に並べた逆順検索補助データベース２８３について、音声入力が終了した時点で、優先的に認識処理を行い、各単名詞に対する認識結果を組合わせ、実在する検索語のみを選択することによって、認識装置の処理時間と精度の不完全性とを補い、利用者２１０にストレスを与えずに検索語を特定する点である。
【０２２２】
また、順序検索補助データベース２８２を利用した認識結果と、逆順検索補助データベース２８３を利用した認識結果とをマージするようにし、これによって、認識処理の精度をより向上させることができ、検索時間をさらに短縮することができる。
【０２２３】
図２７は、本発明の第４の実施例の動作を示すフローチャートである。
【０２２４】
第４の実施例は、順序検索を実行せずに、逆順検索のみを実行する実施例である。
【０２２５】
図２７において、まず、検索語を、単名詞毎に区切って音声入力することを要求し（Ｓ２３０），複合名詞を構成する単名詞が、その複数名詞における逆順で何単語目に位置するかを示す変数ｍとして、「１」を設定し、その逆順ｍ単語目に位置する逆順単名詞集合Ｇｂｍを構成する単名詞サブ集合Ｇｂｍ−ｑにおける順番ｑとして、「１」を設定する（Ｓ２３１）。そして、「横須賀」、「セントラル」、「ホテル」のそれぞれに対して、逆順単名詞サブ集合Ｈ１−１、逆順単名詞サブ集合Ｈ２−１、逆順単名詞サブ集合Ｈ３−１について、認識処理を行なう（Ｓ２３２、Ｓ２３３）。続いて、単名詞毎に、認識尤度を対応させて、逆順検索した場合における認識結果リストを作成する（Ｓ２３４）。そして、有力構成名詞候補を選出し（Ｓ２３５）、実在検索語候補リストを作成し（Ｓ２３６）、確認処理のみで検索語を特定可能な条件を満たせば（Ｓ２３７）、検索語候補を利用者に提示し（Ｓ２３８）、利用者による応答がＹＥＳであれば（Ｓ２３９）、検索を終了し、一方、確認処理のみで検索語を特定可能な条件を満たす候補が存在しなければ（Ｓ２３７）、使用頻度が次に高い逆順単名詞サブ集合の範囲で認識を行う。
【０２２６】
つまり、上記第４の実施例は、音声入力された複合名詞における逆順ｍ単語目に位置する単名詞については、データベースに登録されている各複合名詞の逆順ｍ単語目（ｍは整数値）に位置する単名詞の集合である逆順ｍ単語目に位置する単名詞集合の範囲で認識する音声入力された複合名詞の検索装置である。
【０２２７】
具体的には、上記第４の実施例は、複数の単名詞で構成されている複合名詞が検索語として登録され、しかも、上記検索語が各単名詞に区切られて登録されている検索データベースと、上記登録されている各複合名詞の逆順ｍ単語目（ｍは整数値）に位置する単名詞の集合である逆順ｍ単語目に位置する単名詞集合が、登録されている逆順検索補助データベースと、利用者が上記検索語である複合名詞を単名詞毎に音声入力し終わると、音声入力された複合名詞の逆順ｍ単語目に位置する単名詞については、上記逆順ｍ単語目に位置する単名詞集合の範囲で認識し、上記認識された単名詞である構成名詞候補と、上記構成名詞候補についての認識尤度との組が認識尤度順に並べられている逆順認識結果リストを作成する逆順認識結果リスト作成手段と、上記逆順認識結果リストを、上記音声入力された単名詞のそれぞれについて作成し、上記逆順認識結果リストに記載されている構成名詞候補のうちで、所定の閾値を超える認識尤度を具備する構成名詞候補を、逆順有力構成名詞候補として選出する逆順有力構成名詞候補選出手段と、上記逆順有力構成名詞候補の全組合わせのそれぞれについて、上記有力構成名詞候補の認識尤度に所定の演算を行なうことによって、検索語認識尤度を算出し、この演算された検索語認識尤度の大きい順に並べた実在検索語候補リストを作成する実在検索語候補リスト作成手段と、上記実在検索語候補のうちで、上記検索語認識尤度が所定の閾値以上である実在検索語について、上記利用者との間で必要な対話を実行し、検索語を確定する検索語候補選定対話手段とを有する音声入力された複合名詞の検索装置である。
【０２２８】
なお、上記実施例を、プログラムの実施例として把握することができる。つまり、上記実施例は、複数の単名詞で構成されている複合名詞が検索語として登録され、しかも、上記検索語が各単名詞に区切られて登録されている検索データベースと、上記登録されている各複合名詞の逆順ｍ単語目（ｍは整数値）に位置する単名詞の集合である逆順ｍ単語目に位置する単名詞集合が、登録されている逆順検索補助データベースとを使用し、音声入力された複合名詞を検索する手順と、利用者が上記検索語である複合名詞を単名詞毎に音声入力し終わると、音声入力された複合名詞の逆順ｍ単語目に位置する単名詞については、上記逆順ｍ単語目に位置する単名詞集合の範囲で認識し、上記認識された単名詞である構成名詞候補と、上記構成名詞候補についての認識尤度との組が認識尤度順に並べられている逆順認識結果リストを作成する逆順認識結果リスト作成手順と、上記逆順認識結果リストを、上記音声入力された単名詞のそれぞれについて作成し、上記逆順認識結果リストに記載されている構成名詞候補のうちで、所定の閾値を超える認識尤度を具備する構成名詞候補を、逆順有力構成名詞候補として選出する逆順有力構成名詞候補選出手順と、上記逆順有力構成名詞候補の全組合わせのそれぞれについて、上記有力構成名詞候補の認識尤度に所定の演算を行なうことによって、検索語認識尤度を算出し、この演算された検索語認識尤度の大きい順に並べた実在検索語候補リストを作成する実在検索語候補リスト作成手順と、上記実在検索語候補のうちで、上記検索語認識尤度が所定の閾値以上である実在検索語について、上記利用者との間で必要な対話を実行し、検索語を確定する検索語候補選定対話手順とをコンピュータに実行させるプログラムの例である。
【０２２９】
また、上記プログラムが記録されている記録媒体の実施例として、上記実施例を把握することができる。なお、上記記録媒体として、ＦＤ、ＣＤ、ＤＶＤ、ＨＤ、半導体メモリ等が考えられる。
【０２３０】
なお、商品配送サービスや、電話番号検索や郵便番号検索等における入力インタフェース部分において、上記実施例で行った法人名義の確定作業を、幅広く適用することができる。
【０２３１】
上記実施例によれば、先頭からの構成順序のみを考慮するのではなく、末尾に使用される頻度の高い構成名詞、末尾から２単語目に使用される頻度の高い構成名詞というように、頻度をカウントすることによって、同じ末尾に使われていても、構成単語数によって、先頭から数えると異なる単語目にカウントされ、使用頻度上位単語とは認識されない単語を、優先認識対象と捕らえることができる。
【０２３２】
なお、上記実施例において、検索語認識尤度は、図２６に示すように、各単名詞の認識尤度を加算したものであるが、検索語認識尤度を算出する場合、各単名詞の認識尤度を乗算するようにしてもよい。
【０２３３】
また、実在検索語候補リスト中の検索語候補における検索語認識尤度が、その閾値（たとえばその閾値が２８０であるとする）以上であれば、利用者２１０による確認処理のみで検索語を確定することができ、逆に、検索語認識尤度が上記閾値未満であれば、利用者２１０による確認処理のみで検索語を確定することができない。
【０２３４】
上記のように検索語を確定することができない場合に備えて、単名詞サブ集合Ｇｂ２−ｐ、逆順単名詞サブ集合Ｈ２−ｑの範囲で単名詞の認識、認識尤度の算出等の処理を、予め実行しておくようにしてもよい。すなわち、検索語候補を利用者２１０にディスプレイ等で提示し、確認を求める処理（Ｓ２２４）および利用者２１０による応答（Ｓ２２５）と並行して、使用頻度が次に高い単名詞サブ集合、逆順単名詞サブ集合の範囲で単名詞の認識、認識尤度の算出（Ｓ２０２、Ｓ２１２）、有力構成名詞候補の再選出（Ｓ２０４、Ｓ２１４）、実在検索語候補リストの更新（Ｓ２２２）を実行する。
【０２３５】
このようにすれば、検索装置２０１の内部の処理状況を利用者２１０が一切見ることができないので、利用者２１０には、あたかも、検索データベース２８１に登録されている検索語を一括してしかも非常に高速で認識処理を行っているかのように見える。
【０２３６】
図２８は、本発明の第５の実施例である音声対話型複合名詞の検索装置３０１を示すブロック図である。
【０２３７】
この音声対話型複合名詞の検索装置３０１は、音声入力部３０２と、音声認識部３０３と、音声認識用ソフトウェア３０３Ｓと、音声認識結果出力部３０４と、実在検索語候補リスト作成部３０５と、対話制御部３０６と、音声出力部３０７と、音声出力用ソフトウェア３０７Ｓとによって構成されている。
【０２３８】
音声入力された複合名詞の検索装置３０１において、音声入力部３０２を介して入力された利用者Ｐの音声が音声認識部３０３へ送られ、音声認識部３０３は、入力音声を音声認識処理する際に、システムデータベース３０８を利用する。また、音声認識部３０３は、利用者Ｐによる入力音声について、音声認識用ソフトウェア３０３Ｓを利用して、認識処理を実行する。
【０２３９】
システムデータベース３０８は、検索データベース３８１と、検索補助データベース３８２と、ＹＥＳ／ＮＯデータベース３８３とを有する。
【０２４０】
検索データベース３８１は、複数の単名詞で構成されている複合名詞が検索語として登録され、しかも、上記検索語が各単名詞に区切られて登録されているデータベースである。
【０２４１】
検索補助データベース３８２は、登録されている各複合名詞のｎ番目（ｎは整数値）に表記されている単名詞の群を、ｎ番目表記の単名詞集合群と呼び、上記ｎ番目表記の単名詞集合群が、その頻度の高い順に登録され、しかも、この頻度の高い順に登録されている単名詞が、その頻度の高い方から順に、所定の数（検索装置３０１では５００個）毎にまとめられ、複数のサブ集合群が形成されているデータベースである。
【０２４２】
ＹＥＳ／ＮＯデータベース３８３は、利用者Ｐが応答した内容（たとえば、はい／いいえ、ＹＥＳ／ＮＯ）を認識するデータベースである。
【０２４３】
音声認識用ソフトウェア３０３Ｓは、検索装置３０１の処理の場面に合わせて、検索データベース３８１または検索補助データベース３８２を、システムデータベース３０８から選択するものである。
【０２４４】
検索語が音声入力されると、検索補助データベース３８２を参照し、また、利用者Ｐへの正誤確認に対する応答を認識する場合は、ＹＥＳ／ＮＯデータベース３８３が参照される。
【０２４５】
また、音声認識部３０３は、音声認識処理の際に、音声認識用ソフトウェア３０３Ｓを使用し、音声出力部３０７は、音声出力の際に、音声出力用ソフトウェア３０７Ｓを使用する。
【０２４６】
音声認識結果出力部３０４は、利用者が検索語である複合語を単名詞毎に入力すると、上記複合名詞のｎ番目表記の単名詞については、上記ｎ番目表記の単名詞集合群で認識し、しかも上記ｎ番目表記の単名詞集合群のうちで、最も頻度が高い単名詞を含む第１サブ集合群の範囲内で認識処理し、認識尤度を対応させて、認識結果リストを作成する認識結果リスト作成手段の例である。
【０２４７】
また、音声認識結果出力部３０４は、上記認識処理された単名詞である構成名詞候補と、上記構成名詞候補についての認識尤度との組が認識尤度順に並べられている認識結果リストを、上記音声入力された単名詞のそれぞれについて作成し、上記認識結果リストに記載されている構成名詞候補のうちで、所定の第１の閾値を超える認識尤度を具備する構成名詞候補を、有力構成名詞候補として選出する有力構成名詞候補選出手段の例である。
【０２４８】
実在検索語候補リスト作成部３０５は、実在検索語リスト作成部３５１と、部分一致検索語リスト作成部３５２とによって構成されている。
【０２４９】
実在検索語リスト作成部３５１は、音声認識結果出力部３０４が出力した音声認識結果に基づいて、検索データベース３８１格納されている検索語から、実在検索語を抽出する部分である。
【０２５０】
部分一致検索語リスト作成部３５２は、上記検索語を構成する複数の単名詞のうちで一部の単名詞のみの尤度が上記第１の所定の閾値を超える場合、上記第１の閾値を超える尤度を具備する上記単名詞を備え、上記検索語を構成する単名詞と同じ数の単名詞を備えている部分一致検索語候補を、上記検索データベースから抽出する部分一致検索語候補抽出手段の例である。
【０２５１】
また、対話制御部３０６は、検索語候補選定対話部３６１と、部分一致検索語候補選定対話部３６２とによって構成されている。
【０２５２】
部分一致検索語候補選定対話部３６２は、上記抽出された部分一致検索語候補を構成する各単名詞の尤度を所定の演算方法で演算して部分一致尤度を演算する部分一致尤度演算手段の例である。なお、上記部分一致尤度を演算する上記所定の演算方法は、検索装置３０１では、各単名詞の尤度を加算する方法であるが、上記加算の代わりに、乗算するようにしてもよい。
【０２５３】
音声出力部３０７は、音声出力用ソフトウェア３０７Ｓを使用して、音声出力するものである。
【０２５４】
なお、音声認識部３０３は、上記演算された部分一致尤度が、所定の第２の閾値を超えている上記部分一致検索語候補について、音声認識処理を行う部分一致検索語候補用音声認識処理手段の例である。
【０２５５】
次に、検索装置３０１について、より具体的に説明する。
【０２５６】
なお、以下の説明では、企業名等、法人名義を確定するサービスの入力インタフェース部分に、音声入力された複合名詞の検索装置３０１が設けられている場合について説明する。
【０２５７】
日本全国の電話帳に掲載されている法人名義は２２００万件も存在し、２２００万件の中から１つの法人名義を、入力した音声に基づいて、特定するには相当の時間がかかり、したがって、現行の音声認識技術では、対話処理実時間（検索装置と利用者Ｐとがやりとりする場合、上記利用者Ｐにストレスまたは不自然さを感じさせない時間）内で法人名義を認識処理することが不可能であり、しかも、この場合、非常に似通ったデータが多いので、認識精度が非常に低い。
【０２５８】
図２９は、検索装置３０１において、検索データベース３８１中の法人名義が複合名詞で構成され、この複合名詞が、それを構成する単名詞毎に区切って登録されている具体例を示す図である。
【０２５９】
検索データベース３８１に登録されている法人名義を構成している各名詞の頻度を調べ、単名詞を頻度順に記録し、検索補助データベース３８２を作成する。
【０２６０】
なお、上記２２００万件の法人名義を構成する単名詞の総数は、６５０万種類である。また、法人名義２，２００万件を構成する名詞のうち、１番目表記の単名詞（法人名義中の第１単語目に位置する単名詞）の総数は、約３６０万種類であり、２番目表記の単名詞（法人名義中の第２単語目に位置する単名詞）の総数は、約２５０万種類であり、３番目表記の単名詞（法人名義中の第３単語目に位置する単名詞）の総数は、約２７０万種類であり、４番目表記の単名詞（法人名義中の第４単語目に位置する単名詞）の総数は、約１００万種類、…（最長構成単語数７）であり、対話処理実時間内では、１つの複合名詞に対する各単名詞の認識処理は不可能であり、精度も低いことが予想される。
【０２６１】
図３０は、検索装置３０１において、検索補助データベース３８２に格納されているデータの具体例を示す図である。
【０２６２】
検索補助データベース３８２中の単名詞は、検索データベース３８１に登録されている複合名詞を構成する単名詞であり、複合名詞における表記の順番毎に、単名詞集合群が形成されている。複合名詞における表記の順番が最初である単名詞だけを集めて、１番目表記の単名詞集合群Ｇｃ１が形成され、１番目表記の単名詞集合群Ｇｃ１において、その使用頻度の高い順に単名詞が登録され、しかも、これら登録されている単名詞が、その頻度の高い方から順に、５００個の単名詞毎にまとめられ、複数のサブ集合群が形成され、頻度の高い順に、第１サブ集合群Ｇｃ１−１、第２サブ集合群Ｇｃ１−２、……、第ｍサブ集合群Ｇｃ１−ｍが形成されている。
【０２６３】
なお、使用頻度が最も高い単名詞を含む第１サブ集合群Ｇｃ１−１は、他のサブ集合群Ｇｃ１−２、……、Ｇｃ１−ｍよりも優先して認識する対象である。
【０２６４】
また、複合名詞における表記の順番が２番目である単名詞だけを集めて、２番目表記の単名詞集合群Ｇｃ２が形成され、２番目表記の単名詞集合群Ｇｃ２において、その使用頻度の高い順に単名詞が登録され、しかも、これら登録されている単名詞が、その頻度の高い方から順に、５００個の単名詞毎にまとめられ、複数のサブ集合群が形成され、頻度の高い順に、第１サブ集合群Ｇｃ２−１、第２サブ集合群Ｇｃ２−２、……、第ｍサブ集合群Ｇｃ２−ｍが形成されている。
【０２６５】
なお、使用頻度が最も高い単名詞を含む第１サブ集合群Ｇｃ２−１は、他のサブ集合群Ｇｃ２−２、……、Ｇｃ２−ｍよりも優先して認識する対象である。
【０２６６】
以下、上記と同様に、複合名詞における表記の順番がｎ番目である単名詞だけを集めて、ｎ番目表記の単名詞集合群Ｇｃｎが形成され、ｎ番目表記の単名詞集合群Ｇｃｎにおいて、その使用頻度の高い順に単名詞が登録され、しかも、これら登録されている単名詞が、その頻度の高い方から順に、５００個の単名詞毎にまとめられ、複数のサブ集合群が形成され、頻度の高い順に、第１サブ集合群Ｇｃｎ１、第２サブ集合群Ｇｃｎ２、……、第ｎサブ集合群Ｇｃｎ−ｍが形成されている。
【０２６７】
なお、使用頻度が最も高い単名詞を含む第１サブ集合群Ｇｃｎ−１は、他のサブ集合群Ｇｃｎ−２、……、Ｇｃｎ−ｍよりも優先して認識する対象である。
【０２６８】
ところで、１つのサブ集合群を構成する名詞の数をＮとすると、検索装置３０１では、Ｎ＝５００であり、この数は、次のようにして決められる。つまり、対話処理実時間（検索装置と利用者Ｐとがやりとりする場合、上記利用者Ｐにストレスまたは不自然さを感じさせない時間である）内に音声認識用ソフトウェア３０３Ｓが処理可能な単名詞の数をＴとし、検索データベース３８１に登録されている全検索語の平均単名詞数をＭとすると、Ｎ＝Ｔ／Ｍである。
【０２６９】
具体的には、対話処理実時間内に音声認識用ソフトウェア３０３Ｓが処理可能な単名詞の数Ｔが１５００であるとし、検索データベース３８１に登録されている全検索語の平均単名詞数Ｍが３であるとすると、Ｎ＝Ｔ／Ｍ＝１５００／３＝５００である。
【０２７０】
なお、各サブ集合群Ｇｃ１−１、……、Ｇｃｎ−ｍのそれぞれを構成する単名詞の数Ｎは、５００以外の数でもよいが、上記のように、対話処理実時間内に処理可能な単名詞の数Ｔ（音声認識用ソフトウェア３０３Ｓの性能）と、検索データベース３８１に登録されている検索語が有する単名詞の数の平均Ｍとによって定められる。
【０２７１】
次に、検索装置３０１の動作について説明する。
【０２７２】
図３１は、検索装置３０１において、検索語を確定する処理プロセスを具体的に示すフローチャートである。
【０２７３】
この前提として、検索データベース３８１、検索補助データベース３８２が作成されているとする。
【０２７４】
まず、検索したい法人名義（複合名詞）を、単名詞に区切った形で音声入力するように、利用者Ｐに要求する（Ｓ３００）。そして、検索語である複合名詞に関する各単名詞集合群におけるサブ集合群の関数（サブ集合群の順位を示す関数）ｋを１とする。つまり、サブ集合群の関数ｋ＝１であれば、複数のサブ集合群のうちで、サブ集合群Ｇｃ１−１、Ｇｃ２−１、Ｇｃ３−１、……を使用して、各単名詞が認識される。
【０２７５】
ここで、複合名詞「横浜／東急／ホテル」が検索語として音声入力された場合について考える。
【０２７６】
まず、音声入力された単名詞「横浜」、「東急」、「ホテル」について、それぞれ、１番目表記の単名詞集合群Ｇｃ１中の第１サブ集合群Ｇｃ１−１、２番目表記の単名詞集合群Ｇｃ２中の第１サブ集合群Ｇｃ２−１、３番目表記の単名詞集合群Ｇｃ３中の第１サブ集合群Ｇｃ３−１を、使用し、音声認識部３０３が認識処理を行う（Ｓ３０１）。つまり、音声入力された単名詞「横浜」について、第１サブ集合群Ｇｃ１−１の範囲内で認識処理し、音声入力された単名詞「東急」について、第１サブ集合群Ｇｃ２−１の範囲内で認識処理し、音声入力された単名詞「ホテル」について、第１サブ集合群Ｇｃ３−１の範囲内で認識処理する。そして、音声認識結果出力部３０４が、その認識結果を出力する。
【０２７７】
音声入力された単名詞「横浜」、「東急」、「ホテル」のうちで、単名詞「横浜」は、図３０に示すように、第１サブ集合群Ｇｃ１−１に含まれており、単名詞「ホテル」が、第１サブ集合群Ｇｃ３−１に含まれているとする。ところが、単名詞「東急」の頻度順位は、図３０に示すように、頻度順位９５１位であるので、第１サブ集合群Ｇｃ２−１には含まれず、第２サブ集合群Ｇｃ２−２に含まれている。
【０２７８】
図３２は、検索装置３０１において、音声入力された検索語（複合名詞）を構成する各単名詞に対する認識結果と、その認識尤度とが対応している認識結果リストの具体例を示す図である。
【０２７９】
１つの単名詞が音声入力されると、この音声入力された単名詞に対する複数の構成名詞候補と、これら複数の構成名詞候補のそれぞれに対する認識尤度とを、音声認識結果出力部３０４が出力し、この出力された構成名詞候補と認識尤度とを対応させて、認識結果リストを作成する（Ｓ３０１）。このようにして作成された認識結果リストの具体例を、図３２に示してある。
【０２８０】
たとえば、単名詞「横浜」を音声入力すると、この入力された音声を、音声認識部３０３が、図３２に示すように、「横浜」、「横須賀」、「横溝」、「横山」、……と認識し、「横浜」の認識尤度が９５であり、「横須賀」の認識尤度が９０であり、「横溝」の認識尤度が８１であり、「横山」の認識尤度が７５である。
【０２８１】
なお、各単名詞についての認識尤度は、その単名詞が音声入力されたときに、音声認識用ソフトウェア３０３Ｓが、個々に判断する。
【０２８２】
ここで、認識尤度が所定の閾値以上である構成名詞候補を、有力構成名詞候補とする。なお、検索装置３０１では、上記所定の閾値を８０とする。つまり、認識尤度が８０以上である構成名詞候補が、有力構成名詞候補である。上記所定の閾値が８０であることは、データベース８１、８２を作るときに、予め設定されている。
【０２８３】
そして、図３２に示す各認識結果から、認識尤度が８０以上である単名詞を、有力構成名詞候補として選択する（Ｓ３０２）。
【０２８４】
この時点で、各検索補助データベース３８２中に、認識処理がまだ終了していない第１サブ集合群が存在する場合、音声認識部２は、第１サブ集合群に対する認識処理を再びスタートさせ、音声認識結果出力部３は、認識結果を出力し、検索語候補リスト作成部３０５へ送る処理を繰り返す。
【０２８５】
検索語候補リスト作成部３０５において、実在検索語候補リスト作成部３０５１は、認識結果に基づいて、有力構成名詞候補を選択し、有力構成名詞候補の全ての組み合わせを作成し、検索データベース３８１を参照しながら、実在する検索語を抽出した実在検索語候補リストを作成し（Ｓ３０３）、対話制御部３０６へ送る。
【０２８６】
なお、実在検索語候補リストは、検索データベース３８１に実在している検索語のうちで、利用者Ｐに提示し、確認を求める検索語の候補を集めたリストである。
【０２８７】
ところで、２番目表記の単名詞「東急」の頻度順位は、補助データベース８２に格納されている２番目表記の単名詞集合群Ｇｃ２において、図２９に示すように、９５１位であるので、２番目表記の単名詞集合群Ｇｃ２の第１サブ集合群Ｇｃ２−１には、単名詞「東急」が含まれていない。よって、図３２に示す音声入力された単名詞「東急」に対する認識結果には、単名詞「東急」が含まれていない。
【０２８８】
したがって、実在検索語候補リストを作成するステップ（Ｓ３０３）では、実在検索語候補リストが作成されない。
【０２８９】
これと同時に、部分一致検索語リスト作成部３５２は、部分一致検索語候補における部分一致尤度を計算し（Ｓ３３１）、部分一致検索語候補を、検索データベース３８１から抽出し、対話制御部３０６へ送る。
【０２９０】
なお、部分一致検索語候補は、検索語を構成する複数の単名詞のうちで一部の単名詞のみの尤度が第１の所定の閾値を超える場合、上記第１の閾値を超える尤度を具備する上記単名詞を備え、上記検索語を構成する単名詞と同じ数の単名詞を備えている検索語候補である。
【０２９１】
また、部分一致尤度は、上記抽出された部分一致検索語候補を構成する各単名詞の尤度を所定の演算方法で演算して求めた尤度である。
【０２９２】
対話制御部３０６は、実在検索語候補と、上記部分一致検索語候補とを利用して、検索語候補選定対話を実行する。
【０２９３】
すなわち、実在検索語候補リスト中の検索語候補が、利用者との確認処理のみで、検索語特定可能な検索装置の規定条件を満たす場合は、確認処理ガイダンスの出力命令を、音声出力部３０７へ送る。
【０２９４】
逆に、実在検索語候補リスト中の検索語候補が、利用者との確認処理のみでは、検索語特定可能な条件を満たさない場合（Ｓ３２１）、または実在検索語候補が抽出されない場合は、それら部分一致検索語候補を利用して、音声入力部１に最初に入力された音声を、音声認識部３０３が、再度、音声認識処理し（Ｓ３３２）、認識尤度の算出を行う。
【０２９５】
そして、この算出された認識尤度が、利用者との確認処理のみで検索語特定可能な検索装置の規定状態を満たす場合（Ｓ３２１）は、確認処理ガイダンスの出力命令を音声出力部３０７へ送り、検索語候補を提示し、利用者Ｐに確認を求める（Ｓ３２２）。
【０２９６】
確認処理のみで特定可能な検索語候補が、実在検索語候補からも、部分一致検索語候補を利用した部分一致検索語処理からも抽出されない場合（Ｓ３２１）は、この時点で、認識処理を終了し、使用頻度が次に高い構成名詞集合群について（Ｓ３１１）、認識処理の結果得られた有力構成名詞候補を利用し（Ｓ３１２、Ｓ３１３）、実在検索語候補リストと部分一致検索語リストとを更新し（Ｓ３１４）、検索語候補選定対話と、部分一致検索語処理とを繰り返す（Ｓ３１５）。
【０２９７】
音声出力部３０７は、確認処理ガイダンス出力命令を受けた場合は、利用者に検索語候補と指定された候補について正誤確認を行うガイダンスを出力する。
【０２９８】
そして、確認処理ガイダンスに対する応答が、音声入力部３０２から再び入力されると、音声認識部３０３は、ＹＥＳ／ＮＯデータベース３８３を参照し、利用者の応答を認識し、音声認識結果出力部３０４から認識結果を出力し、利用者から、肯定を表す応答を得ることができた場合（Ｓ３１５）は、検索語特定が完了した旨を利用者へガイダンスする命令を、対話制御部３０６が音声出力部３０７へ送る。
【０２９９】
検索語が特定できるまで、検索語候補リストの更新（Ｓ３１４）と、検索語候補選定対話と、部分一致検索語処理（部分一致検索語候補を検索データベース３８１から抽出し、この抽出された部分一致検索語候補を構成する単名詞の尤度の合計尤度である部分一致尤度を計算する処理）とを繰り返す。
【０３００】
検索補助データベース３８２中の全ての構成名詞集合群に対する認識処理が終了し、実在検索語候補リストをそれ以上更新不可能な場合（Ｓ３１５）は、対話制御部３０６は、実在検索語候補リストの上位から、検索語候補を利用者に提示するガイダンス出力命令を、音声出力部３０７へ送る。
【０３０１】
すなわち、検索装置３０１は、実在検索語候補リストの更新と検索語候補選定対話とが行われている間、優先認識対象名詞群以外の構成名詞集合群の少なくとも１集合（規定数からなる集合１つ分）について、認識処理が終了しているように構成名詞数を規定する。
【０３０２】
次に、検索装置３０１の動作をより具体的に説明する。
【０３０３】
これら有力構成名詞候補を利用して、実在検索語候補リスト作成処理を行うが、２番目表記の単名詞にする関する第１サブ集合群Ｇｃ２−１については、「東急」に関する有力構成名詞候補が選択されていないので、検索装置３０１は、第１サブ集合群Ｇｃ１−１、Ｇｃ３−１に対する認識処理が終了次第、部分一致検索処理を行う。
【０３０４】
つまり、１番目の単名詞である１番目表記の単名詞集合群Ｇｃ１中の第１サブ集合群Ｇｃ１−１における有力構成名詞候補「横浜」または「横須賀」を、１番目の単名詞に持つ検索語候補であって、３番目の単名詞である３番目表記の単名詞集合群Ｇｃ３中の第１サブ集合群Ｇｃ３−１における有力構成名詞候補「ホテル」または「ホール」を、３番目の単名詞に持つ検索語候補を、検索データベース３８１から検索する。
【０３０５】
図３３（１）は、検索装置３０１において、部分一致検索語候補と部分一致尤度との例を示す図である。
【０３０６】
検索装置３０１において、「横浜／グランド／ホテル」、「横浜／東急／ホテル」「横浜／東武／ホテル」、「横須賀／セントラル／ホテル」、「横浜／セントラル／ホール」、「横浜／グランド／ホール」、「横浜／音楽／ホール」、「横浜／中央／ホール」、「横須賀／芸術／ホール」の９候補が、部分一致検索語候補として、検索されている。
【０３０７】
上記例において、たとえば「横浜／グランド／ホテル」のうちで、「横浜」と「ホテル」とが、図３２に示すように、有力構成名詞候補であり、「グランド」が有力構成名詞候補ではない。つまり、「横浜／グランド／ホテル」のうちで、一部の単名詞のみが有力構成名詞候補であり、したがって、「横浜／グランド／ホテル」は、部分一致検索語候補である。
【０３０８】
また、たとえば「横浜／グランド／ホテル」のうちで、「横浜」の認識尤度が、図３２に示すように９５であり、「ホテル」の認識尤度が、図３２に示すように８８であり、これら有力構成名詞候補の各認識尤度を加算した値（９５＋８８＝１８３）である１８３が部分一致尤度である。
【０３０９】
検索装置３０１において、部分一致尤度における閾値（第２の閾値）が、１３０であるとする。
【０３１０】
そして、これら９候補を認識対象として、最初の入力検索語に対する音声認識処理を、音声認識部３０３において、再度、実行する。
【０３１１】
この結果、図３３（２）に示すように、「横浜／東急／ホテル」、「横浜／東武／ホテル」の検索語認識尤度が、それぞれ、９５、８１であり、上記閾値(第２の閾値)である８０を超え、したがって、「横浜／東急／ホテル」、「横浜／東武／ホテル」が検索語候補として抽出さる。上位から提示確認を行うことによって、検索語特定が完了する。
【０３１２】
検索装置３０１において、上記部分一致検索語処理の結果について、利用者との確認処理のみで検索語確定可能か否かの判断基準は、複合名詞検索装置が予め規定した閾値と、検索語認識尤度とを比較し、再認識された結果についての閾値（第３の閾値）が８０であるとした場合、第３の閾値８０を越える検索語認識尤度を持つ検索語候補が、確認処理のみで検索語確定可能な条件を満たすと判断する。
【０３１３】
したがって、検索装置３０１において、再認識後において、確認処理のみで検索語確定可能な条件を満たす検索語候補は、図３３（２）に示すように、「横浜／東急／ホテル」、「横浜／東武／ホテル」である。
【０３１４】
検索装置３０１では、実在検索語リスト作成処理、検索語候補選定対話を行っている間を利用して、残りの構成名詞について認識処理するだけでなく、部分一致尤度を利用した部分一致検索語処理を行う。
【０３１５】
部分一致検索語処理の結果、算出した部分一致尤度を利用して、検索語候補選定対話を行う。規定閾値(第３の閾値)を超える部分一致尤度を有する検索語候補が存在しない場合、または、部分一致検索語処理の結果、選定される検索語候補が存在しない場合は、第２サブ集合群について認識した結果を利用した実在検索語リスト作成処理、検索語候補選定対話を続ける。これと同時に、有力構成名詞リストを更新しながら、部分一致検索語処理、その結果に対する検索語候補選定対話を繰り返す。
【０３１６】
検索装置３０１において、第２サブ集合群Ｇｃ２−２に単名詞「東急」が含まれているので、第２サブ集合群について認識した結果を利用した実在検索語リスト作成処理を行うと、選定される検索語候補が存在するようになる。一方、部分一致検索語処理の結果、算出した部分一致尤度を利用して、検索語候補選定対話を行い、規定閾値(第３の閾値)を超える部分一致尤度を有する検索語候補が存在するようになる。この場合、これら２つの結果をマージするようにしてもよい。
【０３１７】
検索装置３０１は、構成順序毎の構成名詞の集合群に対する認識結果に基づいて実在検索語リスト作成処理を行う際、同時に、検索装置が予め定めた条件を満たす有力構成名詞候補における部分的な情報を利用した部分一致検索語リストの作成処理を行う。すなわち、有力構成名詞候補を利用して部分一致尤度を算出し、規定閾値以上の部分一致尤度を有する検索語を抽出し、この抽出された検索語を、認識対象と定め、最初に入力された検索語の認識処理を、再度実行し、認識尤度を算出する。
【０３１８】
算出された認識尤度が、利用者との確認処理のみで検索語を特定することができる条件を満たすと判断できる場合は、検索語候補選定対話を行う。規定閾値以上の部分一致尤度を有する検索語候補が存在しない場合、または、検索語候補選定対話の結果、選定される検索語候補が存在しない場合は、残りの各第ｎ構成名詞集合群について認識処理した結果、更新された有力構成名詞候補を利用し、実在検索語リスト作成処理と、検索語候補選定対話と、部分一致検索語処理と、検索語候補選定対話とを繰り返す。
【０３１９】
このように、構成名詞の部分的情報を利用することによって、各構成名詞の偏りに左右されずに、正確かつ迅速に、検索処理を実行することができる
ところで、実際には、検索語を構成する各単名詞の全てが高頻度であることが少なく、また、検索語を構成する各単名詞の全てが低頻度であることが少なく、頻度に偏りがある場合が多く、各単名詞のうちで、高頻度で使用される単名詞は、第１サブ集合群に設定されるので、最初の認識処理結果で出力されるが、使用頻度の低い単名詞は、その単語が含まれるサブ集合群についての認識処理が行われるまで、認識結果として出力されないので、規定閾値以上の尤度を有する各構成名詞候補の組み合わせを作成し、実在する検索語候補を抽出しても、正解は存在しない。
【０３２０】
そこで、検索装置３０１では、全部を認識対象に定めて実時間内に正しく認識処理することが不可能である大語彙検索語の中から、部分的に有力構成名詞を含む検索語を、部分一致検索語候補として検索データベース３８１から抽出することによって、有力候補を絞込むことができる。この絞込みによって、利用者を待機させることなく、検索処理が可能になる。
【０３２１】
つまり、検索装置３０１によれば、単名詞の部分的情報を併用することによって、正解検索語を絞り込み、さらに、認識精度を認識速度とを向上させることができる。
【０３２２】
図３１に示すフローチャートにおいて、ステップＳ３０３の後に、ステップＳ３２１に進むルートとは別に、ステップＳ３１１に進むルートと、ステップＳ３３１に進むルートとが破線で示されている。これは、ステップＳ３２１〜Ｓ３２３のルーチンと、ステップＳ３１１〜Ｓ３１５のルーチンと、ステップＳ３３１、Ｓ３３２のルートとが並行処理されるという意味である。
【０３２３】
また、検索装置３０１を、プログラムの発明として把握することができる。
【０３２４】
つまり、検索装置３０１は、検索語を構成する複数の単名詞のうちで一部の単名詞のみの尤度が第１の所定の閾値を超える場合、上記第１の閾値を超える尤度を具備する上記単名詞を備え、上記検索語を構成する単名詞と同じ数の単名詞を備えている部分一致検索語候補を、検索データベースから抽出する部分一致検索語候補抽出手順と、上記抽出された部分一致検索語候補を構成する各単名詞の尤度を所定の演算方法で演算して部分一致尤度を計算する部分一致尤度計算手順と、上記計算された部分一致尤度が、所定の第２の閾値を超えている検索語候補について、音声認識処理を行う部分一致検索語候補用音声認識処理手順とをコンピュータに実行させるプログラムの例である。
【０３２５】
また、検索装置３０１は、複数の単名詞で構成されている複合名詞が検索語として登録され、しかも、上記検索語が各単名詞に区切られて登録されている検索データベースと、上記登録されている各複合名詞のｎ番目（ｎは整数値）に表記されている単名詞の群を、ｎ番目表記の単名詞集合群と呼び、上記ｎ番目表記の単名詞集合群が、その頻度の高い順に登録され、しかも、この頻度の高い順に登録されている単名詞が、その頻度の高い方から順に、所定の数毎にまとめられ、複数のサブ集合群が形成されている検索補助データベースとを使用して、複合名詞を検索するプログラムであって、利用者が上記検索語である複合語を単名詞毎に入力すると、上記複合名詞のｎ番目表記の単名詞については、上記ｎ番目表記の単名詞集合群で認識し、しかも上記ｎ番目表記の単名詞集合群のうちで、最も頻度が高い単名詞を含む第１サブ集合群の範囲内で認識処理し、認識尤度を対応させて、認識結果リストを作成する認識結果リスト作成手順と、上記認識処理された単名詞である構成名詞候補と、上記構成名詞候補についての認識尤度との組が認識尤度順に並べられている認識結果リストを、上記音声入力された単名詞のそれぞれについて作成し、上記認識結果リストに記載されている構成名詞候補のうちで、所定の第１の閾値を超える認識尤度を具備する構成名詞候補を、有力構成名詞候補として選出する有力構成名詞候補選出手順と、上記検索語を構成する複数の単名詞のうちで一部の単名詞のみの尤度が上記第１の所定の閾値を超える場合、上記第１の閾値を超える尤度を具備する上記単名詞を備え、上記検索語を構成する単名詞と同じ数の単名詞を備えている部分一致検索語候補を、上記検索データベースから抽出する部分一致検索語候補抽出手順と、上記抽出された部分一致検索語候補を構成する各単名詞の尤度を所定の演算方法で演算して部分一致尤度を演算する部分一致尤度演算手順と、上記演算された部分一致尤度が、所定の第２の閾値を超えている上記部分一致検索語候補について、音声認識処理を行う部分一致検索語候補用音声認識処理手順とをコンピュータに実行させるプログラムの例である。
【０３２６】
なお、商品配送サービスや、電話番号検索や郵便番号検索等における入力インタフェース部分において、検索装置３０１で行った法人名義の確定作業を、幅広く適用することができる。
【０３２７】
図３４は、本発明の第６の実施例である音声対話型音声対話型検索装置４０１を示すブロック図である。
【０３２８】
この音声対話型検索装置４０１は、音声入力部４０２と、音声識別部４０３と、対話制御部４０４と、音声出力部４０５と、音声出力用ソフトウェア４０５Ｓと、音声認識装置４０６と、システムデータベース４０８とによって構成されている。
【０３２９】
音声識別部４０３は、音声認識部４３１と、認識結果調整部４３２とによって構成されている。
【０３３０】
音声識別部４０３では、音声認識装置４０６を使用し、音声出力部４０５では、音声出力用ソフトウェア４０５Ｓを使用している。また、音声識別部４０３での入力音声に対する音声認識処理と、対話制御部４０４とは、システムデータベース４０８を使用する。
【０３３１】
システムデータベース４０８は、検索対象である検索情報を記録した検索情報データベース４８１、拍データベース４８２，ＹＥＳ／ＮＯデータベース４８３によって構成されている。
【０３３２】
図３５は、音声対話型検索装置４０１で使用されている検索情報データベース４８１の全体像の一例を示す図である。
【０３３３】
検索情報データベース４８１には、検索対象である検索情報そのものが記録されている。
【０３３４】
第３６図は、音声対話型検索装置４０１で使用されている拍データベース４８２の一例を示す図である。
【０３３５】
拍データベース４８２には、検索対象である検索情報を、所定の方法で、先頭拍、２番目拍、３番目拍、……と、分割する。そして、先頭拍だけを取り出し、この取り出された先頭拍を、使用頻度順に並べ、各先頭拍に続く２番目拍を、使用頻度の高い順に並べ、各２番目拍に続く３番目拍を、使用頻度の高い順に並べ、これら並べた拍を、拍データベース４８２に格納する。
【０３３６】
対話処理実時間内に処理することができない大語彙によって検索情報データベース４８１が構成されている場合、拍データベース４８２を構成する各拍について、所定の対話処理実時間内に処理可能な数として、所定の数を定める。
【０３３７】
音声識別部４０３では、音声認識装置４０６を用いて、ユーザ入力について、認識処理する。音声認識装置４０６は、検索装置の処理の場面に合わせて、認識対象とするデータベースを、システムデータベース４０８から選択する。すなわち、ユーザが検索情報入力した場合、拍データベース４８２を参照し、候補の提示に対してユーザが応答した場合に、ＹＥＳ／ＮＯデータベース４８３を参照する。
【０３３８】
利用者が、検索対象である検索情報を入力すると、この入力された検索情報が、音声識別部４０３に送られる。音声識別部４０３では、音声認識部４３１が、拍データベース４８２に格納されている先頭拍について認識処理し、この認識処理結果を、認識結果調整部４３２へ送る。認識結果調整部４３２は、先頭拍の認識結果に基づいて、所定のスコア以上のスコアを有する先頭拍である有力先頭拍を抽出し、音声識別部４０３へ情報を送付する。
【０３３９】
音声認識部４３１は、２番目拍認識対象に、上記各有力先頭拍に繋がる頻度が高い２番目拍の候補を、優先的に認識処理し、これと同様に、３番目拍、４拍目、……と、最後の拍まで、認識結果調整部４３２との間で情報やりとりをしながら、候補を絞込む。
【０３４０】
対話制御部４０４は、送られてきた認識結果に対して、各拍の認識結果スコアを加算する等によって、トータルスコアを算出し、この算出されたトータルスコアが、利用者が確認処理するのみで確定可能であるスコアに達していると、検索装置４０１が判断すれば、ユーザに提示確認を行うように、音声出力部２に命令する。
【０３４１】
そして、上記提示に対する正誤の応答の入力を、ユーザに求め、Ｙｅｓという応答が認識できた時点で、検索は成功になる。
【０３４２】
確認処理するに値しないと判断された場合、音声識別部４０３に保管されている各拍の認識結果に基づいて、先頭拍のうちで、認識スコアの高い順に、提示するために、音声出力部４０５に、先頭拍候補の提示を指示する。
【０３４３】
先頭拍の提示に対する正誤の応答の入力を求め、Ｙｅｓという応答が認識できたら、音声識別部４０３は、確定した先頭拍に続く２番目拍について、使用頻度の高い順に、優先的に認識処理し、上記と同様に、２番目拍を確定しというように、順次認識対象を絞込みながら、検索対象である検索情報を確定する。
【０３４４】
提示確認に対するユーザの応答の際、音声認識部４３１は、ＹＥＳ／ＮＯデータベース４８３を認識対象として、ユーザ応答を認識する。
【０３４５】
次に、個人姓の確定をタスクとする入力インタフェースに、音声対話型検索装置４０１を適用した場合における情報検索動作について、具体的に説明する。
【０３４６】
この場合における検索情報は、個人姓である。日本全国の個人姓の種類は、１８万種類存在する。
【０３４７】
図３７は、音声対話型検索装置４０１における検索情報データベース４８１の具体例を示す図である。
【０３４８】
この具体例において、個人姓を、拍で分割する場合、姓を漢字表記したときに、漢字１文字の読みを１拍と数えるようにして分割する。
【０３４９】
図３８は、音声対話型検索装置４０１における拍データベース４８２の一例を示す図である。
【０３５０】
先頭拍の種類数は、３０００種類あり、使用頻度の高い順に、拍データベース４８２に格納され、第３９図に示すように、先頭拍のそれぞれについて、それに続く２番目拍を、使用頻度の高い順に格納し、これと同様に、２番目拍のそれぞれについて、２番目拍に続く３番目拍を、使用頻度の高い順に格納し、……というようにして、拍データベース４８２を作成する。
【０３５１】
ところで、音声認識技術の現状は、個人姓１８万件について一括認識処理すると、膨大な認識処理時間を必要とし、また、非常に似通った姓が多く存在するので、認識精度が非常に低い。特に、１８万件の認識対象数について、利用者が不自然を感じない時間内に認識処理を終了し、ある程度の精度を持った応答を返すことは、不可能であることが知られている。
【０３５２】
音声対話型検索装置４０１において、音声入力された検索情報について、認識した各拍の結果から有力候補を抽出する場合、認識スコアと閾値とを比較し、閾値を越える認識スコアを持つ候補を、有力候補と定める。これと同様に、ユーザが確認処理するのみで検索情報を特定することが可能であるか否かを判断する場合、検索対象である検索情報について計算されたトータルスコアが、閾値を超えれば、ユーザが確認処理するのみで検索情報を特定することが可能であると判断する。
【０３５３】
次に、音声対話型検索装置４０１について、より具体的に説明する。
【０３５４】
図３９は、音声対話型検索装置４０１における検索情報を確定する動作を示すフローチャートである。
【０３５５】
ユーザが「まつもと」を音声入力し（Ｓ４０１）、この音声入力された「まつもと」を、確定する場合の動作について説明する。
【０３５６】
ユーザによる音声入力について、拍データベース４８２中の先頭拍候補を、使用頻度の高い順に、優先的に認識処理する（Ｓ４０２）。
【０３５７】
図４０は、音声対話型検索装置４０１において、ユーザが音声入力した検索情報を構成する先頭拍に対応する拍データベース４８２中の先頭拍候補を、使用頻度の高い（スコアが多い）順に並べ、この並べられた先頭拍候補のうちで、所定の数の先頭拍を、優先的に認識処理し、この認識理結果を示す図である。
【０３５８】
ここで、有力先頭拍としての閾値が８０であると定めた場合、「ます」、「まつ」、「まさ」が、有力先頭拍として抽出される（Ｓ４０３）。
【０３５９】
これら各有力先頭拍に繋がる２番目拍候補を認識対象とし（Ｓ４０４）、上記２番目拍候補を、使用頻度の高い（スコアが多い）順に並べ、この並べられた２番目拍候補のうちで、所定の数の２番目拍を、優先的に認識処理する（Ｓ４０５）。
【０３６０】
音声対話型検索装置４０１において、抽出された２番目拍候補を、図３８に示してある。
【０３６１】
先頭拍候補（１番目拍）である「ます」に繋がり、頻度が最も高い２番目拍候補が「だ」であり、最優先順位であり、２番目の先頭拍候補である「まつ」に繋がり、頻度が最も高い２番目拍候補が「もと」であり、３番目の先頭拍候補である「まさ」に繋がり、頻度が最も高い２番目拍候補が「もと」であり、先頭拍候補である「ます」に繋がり、頻度が２番目に高い２番目拍候補が「た」であり、先頭拍候補である「まつ」に繋がり、頻度が２番目に高い２番目拍候補が「ざか」であり、……というように、２番目拍候補に対する認識処理を行う。
【０３６２】
そして、音声入力された検索情報の終端まで認識されていない場合、続けて認識処理を実行する（Ｓ４０６）。
【０３６３】
図４１は、音声対話型検索装置４０１において、先頭拍有力候補の認識結果であるスコアと、２番目拍候補の認識結果であるスコアとの統合結果（トータルスコア）を示す図である。
【０３６４】
これらの結果が、対話制御部４０４へ送られ、先頭拍のスコアと２番目拍のスコアとのトータルスコアを算出し（Ｓ４０７）、確認処理のみで確定可能であるか否かを判断する（Ｓ４１１）。上記例においては、各拍の認識スコアを加算してトータルスコアを求め、ユーザが確認処理するのみで検索情報の確定が可能であると判断する閾値を１６０と定め、トータルスコアが上記閾値１６０を超えている検索情報候補を抽出する。
【０３６５】
この結果、検索情報候補「まつもと」、「まさもと」、「まつのと」、……のうちで、閾値１６０を超える検索情報候補は、「まつもと」１候補であり、この検索情報候補「まつもと」について、ユーザに確認提示を行う（Ｓ４１２）。ユーザから、Ｙｅｓの応答が得られると（Ｓ４１３）、検索、確定が終了する。
【０３６６】
音声対話型検索装置４０１によれば、検索情報を構成する拍の使用頻度を考慮し、しかも、その拍同士の繋がりやすさを考慮しているので、認識対象が大語彙である場合でも、実時間内に処理可能である。また、ユーザにとって許容範囲と思われる精度を持った応答が可能な認識対象数づつ、認識処理を並行して行う（Ｓ４２１〜Ｓ４２７、Ｓ４３１）ことによって、待機時間によるユーザのストレス、誤認識によるユーザのストレスが軽減される。
【０３６７】
個人姓は、非常に種類数が多く、似通った候補が多いが、この個人姓の認識は、コールセンタ受付け業務や、商品配送サービス等、幅広くカスタマケア全般で利用可能である。
【０３６８】
音声対話型検索装置４０１は、認識対象語彙である検索情報を拍毎に分解し、拍毎に認識処理を施し、その際、全ての拍を均一に扱うのではなく、使用頻度の高い拍は、より発話される可能性が高いという予測のもとに、使用頻度の高いものほど優先して認識し、この場合、優先する方法としては認識結果に対して重み付けをする等の方法が考えられる。
【０３６９】
加えて、拍同士の接続可能性と接続頻度とを利用して２番目拍、３番目拍に対しては、１つ前の拍毎に、次に繋がる拍のみを使用頻度の高い順に並べ、認識処理を前方拍から順に行うことによって、１つ前の拍に対する認識結果に基づいて、有力先頭拍として抽出された先頭拍に対して記録された２番目拍のみを、使用頻度の高い順に優先順位をつけ、認識対象と定め、認識処理を行い、同様に３番目拍、４番目拍、……、のように、最後の拍まで認識処理を続ける。
【０３７０】
万が一、前方拍の有力候補抽出を誤り、正解候補を導けない場合は、前方拍より順に確定することによって、拍の階層構造を利用した絞込み対話を進める機能を持ち、検索情報そのものを認識処理するよりも、性能良く効率的に、候補を絞込むことが期待できる。
【０３７１】
また、検索情報データベースが、対話処理実時間内に処理不可能な大語彙から構成される場合は、実時間内に処理可能であり、しかも、ユーザにとって許容可能な精度をもった応答を返すことが可能な、予め規定された対象数を、使用頻度の高い順に優先認識対象と定め、認識処理する。
【０３７２】
有力先頭拍候補が抽出できたら、それに繋がる２番目拍に対して、実時間内処理可能な規定数を優先認識対象と定め認識処理を行い、同様に３番目、４番目の拍に対して認識処理を進め、トータルスコアを計算する、優先認識対象先頭拍に対する認識処理が終了した時点で、残りの使用頻度の高い先頭拍から実時間内に処理可能な規定数に対して認識処理をスタートさせる、そこから新たに有力先頭拍候補が抽出された場合は、それに繋がる２番目拍、３番目拍に対して、処理を続ける。
【０３７３】
トータルスコアが算出できた時点で、ユーザが確認処理するのみで確定が可能であると判断できる候補が存在すれば、提示確認を行い、ユーザが確認処理するのみで確定が可能であると判断できる候補が存在しない場合は、その時点で、次に使用頻度が高い各拍の認識対象リストに対する認識処理結果が、並行処理（Ｓ４２１〜Ｓ４２５）によって出ているはずであるので、そのトータルスコアを見て（Ｓ４２６）、確定処理をするか否かを判断し（Ｓ４１１）、確定できるまで繰返す（Ｓ４３１）ことによって、目的情報の確定を行う認識エンジンの精度を、検索方法によって補う音声対話型情報検索装置である。
【０３７４】
ユーザには、システム内部の処理状態が一切見えず、検索情報データベース中の検索情報に対して、一様に音声認識処理が行われ、結果が提示されるのと何ら変わりはない。したがって、ユーザに、不自然さとストレスとを感じさせずに、適切な時間内に、入力された検索情報に対して認識処理を行い、確度の高い精度で認識結果を提示することができる。
【０３７５】
なお、拍の切り出し方には、次の方法がある。つまり、上記検索情報を平仮名表記した場合における平仮名１文字を１拍とする切り出し方（拗音（ッャ、ュ、ョ）、撥音、長音は前の平仮名と合わせて１拍と数える）、上記検索情報を平仮名表記した場合に、先頭から順に、所定の平仮名文字数毎に、１拍とする切り出し方（拗音、撥音、長音は、前の平仮名と合わせて１文字と数える）、構成平仮名数に応じて、１拍を構成する文字数を規定する切り出し方（たとえば、４文字からなる検索情報は、先頭から２文字毎に１拍と数え、３文字からなる検索情報は、先頭から１文字毎に１拍と数える等）、上記検索情報を漢字表記した場合に、漢字１文字の読みを１拍とする切り出し方がある
つまり、音声対話型検索装置４０１は、検索対象である検索情報が格納されている検索情報データベースと、上記検索情報データベースに格納されている検索情報を分解して切り出された拍のうちで、上記各検索情報の先頭を構成する拍である先頭拍が、上記検索情報データベースの中で使用されている頻度順に格納され、上記先頭拍に続く拍についても、使用頻度順に格納されている拍データベースと、ユーザが検索情報を音声入力すると、上記拍データベース中の先頭拍について、上記検索情報データベースにおける使用頻度の高い拍から、優先的に認識処理する認識処理手段と、上記先頭拍を認識した結果、利用者が入力した拍である可能性が高い有力先頭拍であると判断した場合、上記有力先頭拍に繋がり、使用頻度が高い拍から、優先的に認識処理し、有力２番目拍を抽出し、上記検索情報を構成する最後の拍まで、認識処理を繰返す認識処理繰り返し手段と、全ての拍に対する認識処理が終了した時点で、出力された検索情報毎に、トータルスコアを計算するトータルスコア計算手段と、ユーザが確認処理するのみで上記検索情報を特定できる条件を、上記トータルスコアが満たす場合、ユーザとの間で必要な対話を行い、上記検索情報を確定する対話手段とを有する音声対話型情報検索装置の例である。
【０３７６】
この場合、先頭拍と２番目拍とについて認識処理した結果、ユーザが確認処理するのみで上記検索情報を特定できる上記条件を、上記トータルスコアが満たさない場合、２番目拍の認識結果と３番目拍の認識結果とを統合している間に、残りの各拍について、使用頻度の高い順に、実時間内に処理可能な数を認識対象と定め、先頭拍から順に並行処理する並行処理手段を有する。
【０３７７】
また、この場合、上記並行処理手段は、ユーザが確認処理する場合、確認処理の質疑応答時間内に残りの対象について並行処理を行う手段である。しかも、ユーザが確認処理しない場合、認識処理に要する時間を考慮して、認識対象として選択する各拍数を決定する。
【０３７８】
また、音声対話型検索装置４０１は、検索情報データベースに格納されている検索情報を分解して切り出された拍のうちで、上記各検索情報の先頭を構成する拍である先頭拍が、検索情報データベースの中で使用されている頻度順に格納され、上記先頭拍に続く拍についても、使用頻度順に格納されている拍データベース中の先頭拍について、検索情報データベースにおける使用頻度の高い拍から、優先的に認識処理する認識処理手段と、上記先頭拍を認識した結果、利用者が入力した拍である可能性が高い有力先頭拍であると判断した場合、上記有力先頭拍に繋がり、使用頻度が高い拍から、優先的に認識処理し、有力２番目拍を抽出し、上記検索情報を構成する最後の拍まで、認識処理を繰返す認識処理繰り返し手段と、全ての拍に対する認識処理が終了した時点で、出力された検索情報毎に、トータルスコアを計算するトータルスコア計算手段と、ユーザが確認処理するのみで上記検索情報を特定できる条件を、上記トータルスコアが満たす場合、ユーザとの間で必要な対話を行い、上記検索情報を確定する対話手段とを有する音声対話型情報検索装置の例である。
【０３７９】
さらに、拍データベース４８２は、検索情報の先頭に位置している拍である先頭拍が、使用頻度の高い順に並べられている先頭拍群と、上記先頭拍のそれぞれについて、上記先頭拍の次に繋がる拍である２番目拍が、使用頻度の高い順に並べられている２番目拍群と、上記２番目拍のそれぞれについて、上記２番目拍の次に繋がる拍である３番目拍が、使用頻度の高い順に並べられている３番目拍群とを有する拍データベースの例である。
【０３８０】
これを、方法の発明として把握すれば、検索情報の先頭に位置している拍である先頭拍を、使用頻度の高い順に並べる段階と、上記先頭拍のそれぞれについて、上記先頭拍の次に繋がる拍である２番目拍を、使用頻度の高い順に並べる段階と、上記２番目拍のそれぞれについて、上記２番目拍の次に繋がる拍である３番目拍を、使用頻度の高い順に並べる段階とを有する拍データベース作成方法である。
【０３８１】
そして、音声対話型検索装置４０１をプログラムの発明として把握することができる。つまり、検索情報データベースに格納されている検索情報を分解して切り出された拍のうちで、上記各検索情報の先頭を構成する拍である先頭拍が、検索情報データベースの中で使用されている頻度順に格納され、上記先頭拍に続く拍についても、使用頻度順に格納されている拍データベース中の先頭拍について、検索情報データベースにおける使用頻度の高い拍から、優先的に認識処理する認識処理手順と、上記先頭拍を認識した結果、利用者が入力した拍である可能性が高い有力先頭拍であると判断した場合、上記有力先頭拍に繋がり、使用頻度が高い拍から、優先的に認識処理し、有力２番目拍を抽出し、上記検索情報を構成する最後の拍まで、認識処理を繰返す認識処理繰り返し手順と、全ての拍に対する認識処理が終了した時点で、出力された検索情報毎に、トータルスコアを計算するトータルスコア計算手順と、ユーザが確認処理するのみで上記検索情報を特定できる条件を、上記トータルスコアが満たす場合、ユーザとの間で必要な対話を行い、上記検索情報を確定する対話手順とをコンピュータに実行させるプログラムとして把握することができる。
【０３８２】
また、検索情報の先頭に位置している拍である先頭拍を、使用頻度の高い順に並べる手順と、上記先頭拍のそれぞれについて、上記先頭拍の次に繋がる拍である２番目拍を、使用頻度の高い順に並べる手順と、上記２番目拍のそれぞれについて、上記２番目拍の次に繋がる拍である３番目拍を、使用頻度の高い順に並べる手順とをコンピュータに実行させるプログラムとして把握することができる。
【０３８３】
さらに、上記プログラムを、ＦＤ、ＣＤ、ＭＤ、ＤＶＤ、ＨＤ、光ディスク、光磁気ディスク、半導体メモリ等の記録媒体に記録するようにしてもよい。
【０３８４】
【発明の効果】
本発明によれば、利用者を待機させることなく、しかも、存在確率の高い検索語順に、認識結果を抽出することができるという効果を奏する。
【図面の簡単な説明】
【図１】本発明の第１の実施例である音声入力された複合名詞の検索装置１を示すブロック図である。
【図２】検索データベース８１中の法人名義が複合名詞で構成され、この複合名詞が、それを構成する単名詞毎に区切って登録されている具体例を示す図である。
【図３】検索装置１において、検索補助データベース８２の具体例を示す図である。
【図４】検索装置１において、検索語を確定する処理プロセスを具体的に示すフローチャートである。
【図５】検索装置１において、音声入力された検索語（複合名詞）を構成する各単名詞に対する認識結果と、その認識尤度とが対応している認識結果リストの具体例を示す図である。
【図６】検索装置１において、実在検索語候補リスト作成の様子を示す図である。
【図７】検索装置１において、更新された認識結果リストの具体例を示す図である。
【図８】検索装置１において、実在検索語候補リストを作成する処理を実行した結果、得られる実在検索語候補リストを示す図である。
【図９】検索装置１における検索データベース８１を一般的に示す図である。
【図１０】検索補助データベース８２を一般的に示す図である。
【図１１】本発明の第２の実施例である音声入力された複合名詞の検索装置１０１を示すブロック図である。
【図１２】検索データベース１８１中の法人名義が複合名詞で構成され、この複合名詞が、それを構成する単名詞毎に区切って登録されている具体例を示す図である。
【図１３】第２の実施例において、検索補助データベース１８２の具体例を示す図である。
【図１４】第２の実施例において、検索語を確定する処理プロセスを具体的に示すフローチャートである。
【図１５】第２の実施例において、音声入力された検索語（複合名詞）を構成する各単名詞に対する認識結果と、その認識尤度とが対応している認識結果リストの具体例を示す図である。
【図１６】第２の実施例において、更新された認識結果リストの具体例を示す図である。
【図１７】第２の実施例において、実在検索語候補リスト作成の様子を示す図である。
【図１８】本発明の第３の実施例である音声入力された複合名詞の検索装置２０１を示すブロック図である。
【図１９】複合名詞の検索装置２０１において、検索データベース２８１中の法人名義が複合名詞で構成され、この複合名詞が、それを構成する単名詞毎に区切って登録されている具体例を示す図である。
【図２０】複合名詞の検索装置２０１における順序検索補助データベース２８２の具体例を示す図である。
【図２１】複合名詞の検索装置２０１における逆順検索補助データベース２８３の具体例を示す図である。
【図２２】複合名詞の検索装置２０１における検索語確定の処理プロセスを示すフローチャートである。
【図２３】複合名詞の検索装置２０１において、順序検索した場合における認識結果リストの具体例を示す図である。
【図２４】複合名詞の検索装置２０１において、逆順検索した場合における認識結果リストの具体例を示す図である。
【図２５】複合名詞の検索装置２０１において、順序検索した場合における認識結果と、逆順検索した場合における認識結果とをマージした場合における認識結果リストの具体例を示す図である。
【図２６】複合名詞の検索装置２０１において、実在検索語候補リスト作成直前の状態を示す図である。
【図２７】本発明の第４の実施例の動作を示すフローチャートである。
【図２８】本発明の第５の実施例である音声対話型複合名詞の検索装置３０１を示すブロック図である。
【図２９】検索装置３０１において、検索データベース３８１中の法人名義が複合名詞で構成され、この複合名詞が、それを構成する単名詞毎に区切って登録されている具体例を示す図である。
【図３０】検索装置３０１において、検索補助データベース３８２に格納されているデータの具体例を示す図である。
【図３１】検索装置３０１において、検索語を確定する処理プロセスを具体的に示すフローチャートである。
【図３２】検索装置３０１において、音声入力された検索語（複合名詞）を構成する各単名詞に対する認識結果と、その認識尤度とが対応している認識結果リストの具体例を示す図である。
【図３３】検索装置３０１において、部分一致検索語候補と部分一致尤度との例と、再認識結果の例とを示す図である。
【図３４】本発明の第６の実施例である音声対話型検索装置４０１である音声対話型音声対話型検索装置４０１を示すブロック図である。
【図３５】音声対話型検索装置４０１で使用されている検索情報データベース４８１の全体像の一例を示す図である。
【図３６】音声対話型検索装置４０１で使用されている拍データベース４８２の一例を示す図である。
【図３７】音声対話型検索装置４０１における検索情報データベースの具体例を示す図である。
【図３８】音声対話型検索装置４０１において、拍データベース４８２に格納されている拍の例を示す図である。
【図３９】音声対話型検索装置４０１における検索情報を確定する動作を示すフローチャートである。
【図４０】音声対話型検索装置４０１において、ユーザが音声入力した検索情報を構成する先頭拍に対応する拍データベース４８２中の先頭拍候補を、使用頻度の高い（スコアが多い）順に並べ、この並べられた先頭拍候補のうちで、所定の数の先頭拍を、優先的に認識処理し、この認識理結果を示す図である。
【図４１】音声対話型検索装置４０１において、先頭拍有力候補の認識結果であるスコアと、２番目拍候補の認識結果であるスコアとの統合結果（トータルスコア）を示す図である。
【符号の説明】
１…音声入力された複合名詞の検索装置、
２…音声入力部、
３…音声認識部、
４…音声認識結果出力部、
５…実在検索語候補リスト作成部、
６…対話制御部、
７…音声出力部、
８…システムデータベース、
８１…検索データベース、
８２…検索補助データベース、
８３…ＹＥＳ／ＮＯデータベース、
Ｇ１…第１の単名詞集合群、
Ｇ２…第２の単名詞集合群、
Ｇ３…第３の単名詞集合群、
Ｇ４…第４の単名詞集合群、
１０１…音声入力された複合名詞の検索装置、
１０２…音声入力部、
１０３…音声認識部、
１０４…音声認識結果出力部、
１０５…実在検索語候補リスト作成部、
１０６…対話制御部、
１０７…音声出力部、
１０８…システムデータベース、
１８１…検索データベース、
１８２…検索補助データベース、
１８３…ＹＥＳ／ＮＯデータベース、
Ｇａ１…１番目表記の単名詞集合群、
Ｇａ１−１…１番目表記の単名詞集合群Ｇａ１における第１サブ集合群、
Ｇａ１−２…１番目表記の単名詞集合群Ｇａ１における第２サブ集合群、
Ｇａ１−３…１番目表記の単名詞集合群Ｇａ１における第３サブ集合群、
Ｇａ２…２番目表記の単名詞集合群、
Ｇａ２−１…２番目表記の単名詞集合群Ｇａ２における第１サブ集合群、
Ｇａ２−２…２番目表記の単名詞集合群Ｇａ２における第２サブ集合群、
Ｇａ２−３…２番目表記の単名詞集合群Ｇａ２における第３サブ集合群、
２０１…音声入力された複合名詞の検索装置、
２０２…音声入力部、
２０３…音声認識部、
２０３Ｓ…音声認識装置、
２０４…音声認識結果出力部、
２０４ａ…音声認識結果リスト作成部、
２０５…実在検索語候補リスト作成部、
２０６…対話制御部、
２０７…音声出力部、
２０７Ｓ…音声出力装置、
２０８…システムデータベース、
２８１…検索データベース、
２８２…順序検索補助データベース、
２８３…逆順検索補助データベース、
２８４…ＹＥＳ／ＮＯデータベース、
３０１…音声対話型複合名詞の検索装置、
３０２…音声入力部、
３０３…音声認識部、
３０３Ｓ…音声認識用ソフトウェア、
３０４…音声認識結果出力部、
３０５…実在検索語候補リスト作成部、
３０６…対話制御部、
３０７…音声出力部、
３０７Ｓ…音声出力用ソフトウェア、
３０８…システムデータベース、
３８１…検索データベース、
３８２…検索補助データベース、
３８３…ＹＥＳ／ＮＯデータベース、
Ｇｃ１…１番目表記の単名詞集合群、
Ｇｃ１−１…１番目表記の単名詞集合群Ｇｃ１における第１サブ集合群、
Ｇｃ１−２…１番目表記の単名詞集合群Ｇｃ１における第２サブ集合群、
Ｇｃ２…２番目表記の単名詞集合群、
Ｇｃ２−１…２番目表記の単名詞集合群Ｇｃ２における第１サブ集合群、
Ｇｃ２−２…２番目表記の単名詞集合群Ｇｃ２における第２サブ集合群、
４０１…音声対話型検索装置、
４０２…音声入力部、
４０３…音声識別部、
４３１…音声認識部、
４３２…認識結果調整部、
４０４…対話制御部、
４０５…音声出力部、
４０５Ｓ…音声出力用ソフトウェア、
４０６…音声認識装置、
４０８…システムデータベース、
４８１…検索情報データベース、
４８２…拍データベース。

Claims

複数の単名詞で構成されている複合名詞が検索語として登録され、しかも、上記検索語が各単名詞に区切られて登録されている検索データベースと；
上記検索データベースに登録されている全検索語を構成する単名詞が、その頻度の高い順に登録され、しかも、この頻度の高い順に登録されている単名詞が、その頻度の高い方から順に、所定の数毎に分割されて、複数の単名詞集合群が形成されている検索補助データベースと；
利用者が上記検索語を単名詞毎に音声入力すると、上記入力された単名詞毎に、上記複数の単名詞集合群のうちで、最も頻度が高い単名詞を含む第１の単名詞集合群の範囲内で認識処理し、認識尤度を対応させて、認識結果リストを作成する認識結果リスト作成手段と；
上記認識処理された単名詞である構成名詞候補と、上記構成名詞候補についての認識尤度との組が認識尤度順に並べられている認識結果リストを、上記音声入力された単名詞のそれぞれついて作成し、上記認識結果リストに記載されている構成名詞候補のうちで、所定の閾値を超える認識尤度を具備する構成名詞候補を、有力構成名詞候補として選出する有力構成名詞候補選出手段と；
上記有力構成名詞候補の全組合わせの中から、上記検索データベースに実在する検索語のみを選択し、各有力構成名詞候補の認識尤度に所定の演算を行い、検索語認識尤度を算出し、この算出された検索語認識尤度の大きい順に並べた実在検索語候補リストを作成する実在検索語候補リスト作成手段と；
上記実在検索語候補リスト中の検索語候補が、利用者による確認処理のみで検索語を特定することができる条件を満たす場合は、上記実在検索語候補リスト中の検索語候補を所定のディスプレイに表示することによって、上記利用者との間で対話を実行し、検索語を確定する検索語候補選定対話手段と；
を有することを特徴とする音声入力された複合名詞の検索装置。
請求項１において、
上記検索語候補選定対話を実行する時間に、残りの１つの上記単名詞集合群の範囲内における認識と、上記各単名詞毎に上記閾値を超える有力構成名詞候補の選出と、実在検索語候補リストの更新とを並行して処理する並行処理手段を有することを特徴とする音声入力された複合名詞の検索装置。
請求項２において、
上記検索語候補選定対話において、上記実在検索語候補リスト中の検索語候補が、利用者による確認処理のみでは検索語を特定することができる条件を満たさない場合、または、上記検索語候補選定対話において提示した検索語候補が、利用者から否定された場合に、上記更新された実在検索語候補リストを利用して、検索語候補選定対話を実行することを特徴とする音声入力された複合名詞の検索装置。
請求項１において、
上記検索補助データベースにおいて１つの上記単名詞集合群を構成する単名詞の上記所定の数は、システムが予め規定した対話処理実時間内に処理可能な数であることを特徴とする音声入力された複合名詞の検索装置。
請求項１において、
上記検索補助データベースにおいて１つの上記単名詞集合群を構成する単名詞の上記所定の数をｎとし、上記利用者が音声入力した単名詞を音声認識する音声認識部が対話処理実時間内に処理可能な単名詞の数をＴとし、上記検索データベースに登録されている検索語が有する単名詞の数の平均をＭとした場合、
ｎ＝Ｔ／Ｍ（ｎは整数値）であることを特徴とする音声入力された複合名詞の検索装置。
請求項１において、
検索語を名詞単位に区切って音声入力するように、利用者に指示する区切り音声入力指示手段を有することを特徴とする音声入力された複合名詞の検索装置。
請求項１または請求項２において、
上記各有力構成名詞候補の認識尤度について行う所定の演算は、上記各有力構成名詞候補の認識尤度を加算または乗算することによって、上記検索語認識尤度を算出する演算であることを特徴とする音声入力された複合名詞の検索装置。
複数の単名詞で構成されている複合名詞が検索語として登録され、しかも、上記検索語が各単名詞に区切られて登録されている検索データベースと、上記検索データベースに登録されている全検索語を構成する単名詞が、その頻度の高い順に登録され、しかも、この頻度の高い順に登録されている単名詞が、その頻度の高い方から順に、所定の数毎に分割されて、複数の単名詞集合群が形成されている検索補助データベースをと用いる音声入力された複合名詞の検索方法において、
利用者が上記検索語を単名詞毎に音声入力すると、上記入力された単名詞毎に、上記複数の単名詞集合群のうちで、最も頻度が高い単名詞を含む第１の単名詞集合群の範囲内で、音声認識部が認識処理し、認識尤度を対応させて、認識結果リストを作成する認識結果リスト作成段階と；
上記認識処理された単名詞である構成名詞候補と、上記構成名詞候補についての認識尤度との組が認識尤度順に並べられている認識結果リストを、上記音声入力された単名詞のそれぞれついて作成し、上記認識結果リストに記載されている構成名詞候補のうちで、所定の閾値を超える認識尤度を具備する構成名詞候補を、有力構成名詞候補として選出する有力構成名詞候補選出段階と；
上記有力構成名詞候補の全組合わせの中から、上記検索データベースに実在する検索語のみを選択し、各有力構成名詞候補の認識尤度に所定の演算を行い、検索語認識尤度を算出し、この算出された検索語認識尤度の大きい順に並べた実在検索語候補リストを、実在検索語候補リスト作成部が作成する実在検索語候補リスト作成段階と；
上記実在検索語候補リスト中の検索語候補が、利用者による確認処理のみで検索語を特定することができる条件を満たす場合は、上記実在検索語候補リスト中の検索語候補を所定のディスプレイに表示することによって、上記利用者との間で対話を実行し、検索語を確定する検索語候補選定対話段階と；
を有することを特徴とする音声入力された複合名詞の検索方法。
請求項８において、
上記検索語候補選定対話を実行する時間に、残りの１つの上記単名詞集合群の範囲内における認識と、上記各単名詞毎に上記閾値を超える有力構成名詞候補の選出と、実在検索語候補リストの更新とを並行して処理する並行処理段階を有することを特徴とする音声入力された複合名詞の検索方法。
請求項９において、
上記検索語候補選定対話において、上記実在検索語候補リスト中の検索語候補が、利用者による確認処理のみでは検索語を特定することができる条件を満たさない場合、または、上記検索語候補選定対話において提示した検索語候補が、利用者から否定された場合に、上記更新された実在検索語候補リストを利用して、検索語候補選定対話を実行することを特徴とする音声入力された複合名詞の検索方法。
請求項８において、
上記検索補助データベースにおいて１つの上記単名詞集合群を構成する単名詞の上記所定の数は、システムが予め規定した対話処理実時間内に処理可能な数であることを特徴とする音声入力された複合名詞の検索方法。
請求項８において、
上記検索補助データベースにおいて１つの上記単名詞集合群を構成する単名詞の上記所定の数をｎとし、上記利用者が音声入力した単名詞を音声認識する音声認識部が対話処理実時間内に処理可能な単名詞の数をＴとし、上記検索データベースに登録されている検索語が有する単名詞の数の平均をＭとした場合、
ｎ＝Ｔ／Ｍ（ｎは整数値）であることを特徴とする音声入力された複合名詞の検索方法。
請求項８において、
検索語を名詞単位に区切って音声入力するように、利用者に指示する区切り音声入力指示段階を有することを特徴とする音声入力された複合名詞の検索方法。
請求項８または請求項９において、
上記各有力構成名詞候補の認識尤度について行う所定の演算は、上記各有力構成名詞候補の認識尤度を加算または乗算することによって、上記検索語認識尤度を算出する演算であることを特徴とする音声入力された複合名詞の検索方法。
複数の単名詞で構成されている複合名詞が検索語として登録され、しかも、上記検索語が各単名詞に区切られて登録されている検索データベースと、上記検索データベースに登録されている全検索語を構成する単名詞が、その頻度の高い順に登録され、しかも、この頻度の高い順に登録されている単名詞が、その頻度の高い方から順に、所定の数毎に分割されて、複数の単名詞集合群が形成されている検索補助データベースとを用い、
利用者が上記検索語を単名詞毎に音声入力すると、上記入力された単名詞毎に、上記複数の単名詞集合群のうちで、最も頻度が高い単名詞を含む第１の単名詞集合群の範囲内で、音声認識部が認識処理し、認識尤度を対応させて、認識結果リストを作成する認識結果リスト作成手順と；
上記認識処理された単名詞である構成名詞候補と、上記構成名詞候補についての認識尤度との組が認識尤度順に並べられている認識結果リストを、上記音声入力された単名詞のそれぞれついて作成し、上記認識結果リストに記載されている構成名詞候補のうちで、所定の閾値を超える認識尤度を具備する構成名詞候補を、有力構成名詞候補として選出する有力構成名詞候補選出手順と；
上記有力構成名詞候補の全組合わせの中から、上記検索データベースに実在する検索語のみを選択し、各有力構成名詞候補の認識尤度に所定の演算を行い、検索語認識尤度を算出し、この算出された検索語認識尤度の大きい順に並べた実在検索語候補リストを、実在検索語候補リスト作成部が作成する実在検索語候補リスト作成手順と；
上記実在検索語候補リスト中の検索語候補が、利用者による確認処理のみで検索語を特定することができる条件を満たす場合は、上記実在検索語候補リスト中の検索語候補を所定のディスプレイに表示することによって、上記利用者との間で対話を実行し、検索語を確定する検索語候補選定対話手順と；
をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体。