JP2003085197A - 音声入力された複合名詞の検索装置、検索方法およびデータベース - Google Patents

音声入力された複合名詞の検索装置、検索方法およびデータベース

Info

Publication number
JP2003085197A
JP2003085197A JP2001295353A JP2001295353A JP2003085197A JP 2003085197 A JP2003085197 A JP 2003085197A JP 2001295353 A JP2001295353 A JP 2001295353A JP 2001295353 A JP2001295353 A JP 2001295353A JP 2003085197 A JP2003085197 A JP 2003085197A
Authority
JP
Japan
Prior art keywords
noun
search
recognition
nouns
search word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001295353A
Other languages
English (en)
Other versions
JP3682958B2 (ja
Inventor
Kumiko Omori
久美子 大森
Masanobu Higashida
正信 東田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2001295353A priority Critical patent/JP3682958B2/ja
Publication of JP2003085197A publication Critical patent/JP2003085197A/ja
Application granted granted Critical
Publication of JP3682958B2 publication Critical patent/JP3682958B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 対話処理実時間内で処理可能な検索語数を超
える数の複合名詞が検索データベースに登録され、しか
も、互いに似通った候補が数多く存在する複合名詞が検
索データベースに登録されている場合、利用者が音声入
力した検索語を、短時間で効率良く検索することができ
るようにするものである。 【解決手段】 複合名詞が検索語として登録され、ま
た、上記検索語が各単名詞に区切られて登録されている
検索データベースと、上記検索データベースに登録され
ている全検索語を構成する単名詞が、その頻度の高い順
に登録され、しかも、この頻度の高い順に登録されてい
る複数の単名詞が、その頻度の高い方から順に、所定の
数毎に分割され、複数の単名詞集合群が形成されている
検索補助データベースとを有するデータベースを利用し
て、利用者が音声入力した複合名詞を検索するものであ
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、複数の単名詞で構
成される複合名詞を、利用者が音声入力し、この音声入
力された複合名詞を特定する複合名詞の検索装置および
検索方法に関するものである。
【0002】つまり、本発明において、検索対象となる
検索語は、複数の単名詞の羅列で構成されている複合名
詞であり、多数の検索語が、検索データベースに保持さ
れている場合、音声認識処理と検索とに要する時間を利
用者に感じさせることなく、しかも、音声認識処理の欠
陥等による不自然な対話を利用者に生じさせることな
く、検索語を特定する装置および方法に関するものであ
る。
【0003】
【従来の技術】音声認識装置を利用した従来のデータベ
ース検索処理では、ユーザが入力した音声と認識対象デ
ータベースとを照合し、認識対象データベース中の全語
彙と入力音声との類似度を、認識尤度として算出する。
【0004】現在の認識技術では、対話処理実時間(検
索装置と利用者とがやりとりする場合、上記利用者にス
トレスまたは不自然さを感じさせない時間)内に認識で
きる語彙数が限られ、この対話処理実時間を超える語彙
数を認識対象にすると、処理時間が長くなり、利用者を
待機させることになる。一方、認識対象語彙数が多けれ
ば、また、認識対象が非常に似通った語彙で構成されて
いれば、人間同士の対話でさえも、聞き間違え、聞き損
じが起こるように、認識精度の低下を避けることができ
ない。
【0005】さらに、認識精度は、発話者や発話環境に
大きく依存し、周囲の雑音等の影響によっては、常に1
00%の精度が得られるという保証はない。
【0006】したがって、音声認識技術を利用する従来
の検索装置では、利用者による入力音声を音声認識した
結果の候補が、正しく認識できているか否かを判断する
場合、利用者に上記候補の正誤確認を行い、認識尤度の
高い順に正解が確認できるまで、上記候補の提示を繰り
返す。
【0007】
【発明が解決しようとする課題】音声認識装置を用い、
所定のデータベースの中から、利用者が意図する検索語
を検索し、確定する検索装置において、上記データベー
スを構成する検索語の数が、対話処理実時間内に処理可
能な数よりも多ければ、認識処理の間、利用者を待機さ
せ、この待機後に、認識装置が出力した候補を利用者に
提示し、正誤確認を行うことによって、正しく認識でき
たか否かを判断する。
【0008】利用者にとって、発話後に待たされ、この
待たされた後に、正誤の確認を強いられることは、対話
の不自然さにつながり、大きなストレスになるという問
題がある。
【0009】一方、オペレータ対応のシステムでは、聞
き間違え、聞き損じが生じたとしても、自然な対話の流
れの中で、自らの意図をオペレータに伝えることができ
るので、対話の不自然さがなく、大きなストレスは生じ
ない。
【0010】音声入力された検索語を検索する検索装置
において、利用者満足度を獲得するためには、オペレー
タ対応のように、リアルタイムに応答できること、しか
も、利用者の意図を正確に把握できること、何よりも、
利用者との間における自然な対話の流れの中で、利用者
意図を確定することが必要である。
【0011】本発明は、対話処理実時間内で処理可能な
検索語数を超える数の複合名詞が検索データベースに登
録され、しかも、互いに似通った候補が数多く存在する
複合名詞が検索データベースに登録されている場合、利
用者が音声入力した検索語を、短時間で効率良く検索す
ることができる音声入力された複合名詞の検索装置、検
索方法およびデータベースを提供することを目的とする
ものである。
【0012】
【課題を解決するための手段】本発明は、複数の単名詞
で構成されている複合名詞が検索語として登録され、し
かも、上記検索語が各単名詞に区切られて登録されてい
る検索データベースと、上記検索データベースに登録さ
れている全検索語を構成する単名詞が、その頻度の高い
順に登録され、しかも、この頻度の高い順に登録されて
いる複数の単名詞が、その頻度の高い方から順に、所定
の数毎に分割されて、複数の単名詞集合群が形成されて
いる検索補助データベースとを有するデータベースを利
用して、利用者が音声入力した複合名詞を検索するもの
である。
【0013】
【発明の実施の形態および実施例】図1は、本発明の第
1の実施例である音声入力された複合名詞の検索装置1
を示すブロック図である。
【0014】音声入力された複合名詞の検索装置1は、
音声入力部2と、音声認識部3と、音声認識用ソフトウ
ェア3Sと、音声認識結果出力部4と、実在検索語候補
リスト作成部5と、対話制御部6と、音声出力部7と、
音声出力用ソフトウェア7Sと、システムデータベース
8とを有する。
【0015】音声入力された複合名詞の検索装置1にお
いて、音声入力部2を介して入力された利用者Pの音声
が音声認識部3へ送られ、音声認識部3は、入力音声を
音声認識処理する際に、システムデータベース8を利用
する。また、音声認識部3は、利用者Pによる入力音声
について、音声認識用ソフトウェア3Sを利用して、認
識処理を実行する。
【0016】システムデータベース8は、検索データベ
ース81と、検索補助データベース82と、YES/N
Oデータベース83とによって構成されている。
【0017】検索データベース81は、複数の単名詞で
構成されている複合名詞が検索語として登録され、しか
も、上記検索語が各単名詞に区切られて登録されている
データベースである。
【0018】検索補助データベース82は、検索データ
ベース81に登録されている全検索語を構成する単名詞
が、その頻度の高い順に登録され、しかも、この頻度の
高い順に登録されている単名詞が、その頻度の高い方か
ら順に、所定の数(検索装置1では500)毎に分割さ
れて、複数の単名詞集合群が形成されているデータベー
スである。
【0019】YES/NOデータベース83は、利用者
Pが応答した内容(たとえば、はい/いいえ、YES/
NO)を認識するデータベースである。
【0020】音声認識用ソフトウェア3Sは、検索装置
1の処理の場面に合わせて、検索データベース81また
は検索補助データベース82を、システムデータベース
8から選択するものである。
【0021】検索語が音声入力されると、検索補助デー
タベース82を参照し、また、利用者Pへの正誤確認に
対する応答を認識する場合は、YES/NOデータベー
ス83が参照される。
【0022】また、音声認識部3は、音声認識処理の際
に、音声認識用ソフトウェア3Sを使用し、音声出力部
7は、音声出力の際に、音声出力用ソフトウェア7Sを
使用する。
【0023】次に、検索装置1について、より具体的に
説明する。
【0024】なお、以下の説明では、企業名等、法人名
義を確定するサービスの入力インタフェース部分に、音
声入力された複合名詞の検索装置1が設けられている場
合について説明する。
【0025】日本全国の電話帳に掲載されている法人名
義は2200万件も存在し、2200万件の中から1つ
の法人名義を特定するには相当の時間がかかり、したが
って、現行の音声認識技術では、対話処理実時間(検索
装置と利用者Pとがやりとりする場合、上記利用者Pに
ストレスまたは不自然さを感じさせない時間)内で法人
名義を認識処理することが不可能であり、しかも、この
場合、非常に似通ったデータが多いので、認識精度が非
常に低い。
【0026】図2は、検索データベース81中の法人名
義が複合名詞で構成され、この複合名詞が、それを構成
する単名詞毎に区切って登録されている具体例を示す図
である。
【0027】検索データベース81に登録されている法
人名義を構成している各名詞の頻度を調べ、単名詞を頻
度順に記録し、検索補助データベース82を作成する。
つまり、検索補助データベース82は、検索データベー
ス81に登録されている法人名義を構成している各単名
詞について、その頻度をカウントし、頻度順に登録して
あるデータベースである。
【0028】なお、上記2200万件の法人名義を構成
する単名詞の総数は、650万種類である。
【0029】図3は、検索装置1において、検索補助デ
ータベース82の具体例を示す図である。
【0030】検索補助データベース82中の単名詞は、
検索データベース812登録されている複合名詞を構成
する単名詞であり、その使用頻度の高い順に並べられ、
使用頻度が高い方から500個づつ取り出し、この50
0個の名詞を1つの単名詞集合群とする。
【0031】使用頻度が最も高い単名詞を含む集合群
を、第1の単名詞集合群G1(他の単名詞集合群よりも
優先して認識する対象である単名詞集合群)とし、その
次に使用頻度が高い単名詞を含む単名詞集合群を、第2
の単名詞集合群G2とし、以下、使用頻度が高い順に、
第3の単名詞集合群G3、第4の単名詞集合群G4、…
…とする。
【0032】1つの集合群を構成する名詞の数をnとす
ると、検索装置1では、n=500であり、この数は、
次のようにして決められる。つまり、対話処理実時間
(検索装置と利用者Pとがやりとりする場合、上記利用
者Pにストレスまたは不自然さを感じさせない時間であ
る)内に音声認識用ソフトウェア3Sが処理可能な単名
詞の数をTとし、検索データベース81に登録されてい
る全検索語の平均単名詞数をMとすると、n=T/Mで
ある。
【0033】具体的には、対話処理実時間内に音声認識
用ソフトウェア3Sが処理可能な単名詞の数Tが150
0であるとし、検索データベース81に登録されている
全検索語の平均単名詞数Mが3であるとすると、n=T
/M=1500/3=500である。
【0034】なお、単名詞集合群G1、G2、G3、G
4、……のそれぞれを構成する単名詞の数nは、500
以外の数でもよいが、上記のように、対話処理実時間内
に処理可能な単名詞の数T(音声認識用ソフトウェア3
Sの性能)と、検索データベース81に登録されている
検索語が有する単名詞の数の平均Mとによって定められ
る。
【0035】図4は、検索装置1において、検索語を確
定する処理プロセスを具体的に示すフローチャートであ
る。
【0036】この前提として、検索データベース81、
検索補助データベース82が作成されているとする。
【0037】まず、検索したい法人名義(複合名詞)
を、単名詞に区切った形で音声入力するように、利用者
Pに要求する(S0)。そして、単名詞集合群の順位を
示す関数kを1とする。
【0038】ここで、複合名詞「横須賀/市民/病院」
が検索語として音声入力された場合について考える。ま
ず、音声入力された単名詞「横須賀」、「市民」、「病
院」のそれぞれについて、第1の単名詞集合群G1を使
用し、音声認識部3が認識処理を行う(S1)。つま
り、第1の単名詞集合群G1の範囲内で、音声認識部3
が認識処理を行う。そして、音声認識結果出力部4が、
その認識結果を出力する。
【0039】音声入力された単名詞「横須賀」、「市
民」、「病院」のうちで、単名詞「横須賀」、「病院」
は、第1の単名詞集合群G1に含まれているが、「市
民」の頻度順位は、図3に示すように、頻度順位790
位であるので、第1の単名詞集合群G1には含まれ図、
第2の単名詞集合群G2に含まれている。
【0040】図5は、検索装置1において、音声入力さ
れた検索語(複合名詞)を構成する各単名詞に対する認
識結果と、その認識尤度とが対応している認識結果リス
トの具体例を示す図である。
【0041】1つの単名詞が音声入力されると、この音
声入力された単名詞に対する複数の構成名詞候補と、こ
れら複数の構成名詞候補のそれぞれに対する認識尤度と
を、音声認識結果出力部4が出力し、この出力された構
成名詞候補と認識尤度とを対応させて、認識結果リスト
を作成する(S1)。このようにして作成された認識結
果リストが、図5に示されている。
【0042】たとえば、単名詞「横須賀」を音声入力す
ると、この入力された音声を、音声認識部3が、図5に
示すように、「横須賀」、「横浜」、「須加浜」、「横
横」、……と認識し、「横須賀」の認識尤度が97であ
り、「横浜」の認識尤度が90であり、「須加浜」の認
識尤度が89であり、「横横」の認識尤度が80であ
る。
【0043】なお、構成名詞候補についての認識尤度
は、検索データベース81を作るときに、予め定められ
ている。
【0044】ここで、認識尤度が所定の閾値以上である
構成名詞候補を、有力構成名詞候補とする。なお、検索
装置1では、上記所定の閾値を80とする。つまり、認
識尤度が80以上である構成名詞候補が、有力構成名詞
候補である。
【0045】そして、図5に示す各認識結果から、認識
尤度が80以上である単名詞を、有力構成名詞候補とし
て選択する(S2)。
【0046】図5に示すように、音声入力された単名詞
「横須賀」については、「横須賀」、「横浜」、「須加
浜」、「横々」の4候補が有力構成名詞候補として選択
され、音声入力された単名詞「市民」ついては、「市
立」の1つの候補が有力構成名詞候補として選択され、
音声入力された単名詞「病院」については、「病院」、
「美容院」の2候補が有力構成名詞候補として選択され
る。これら有力構成名詞候補を利用し、実在検索語候補
リストを作成する(S3)。なお、実在検索語候補リス
トは、検索データベース81に実在する検索語のうち
で、利用者Pに提示し、確認を求める検索語の候補を集
めたリストである。
【0047】ところで、補助データベース82における
単名詞「市民」の頻度順位は、図2に示すように、79
0位であるので、第1の単名詞集合群G1には、単名詞
「市民」が含まれていない。したがって、図5に示す
「市民」に対する認識結果には、単名詞「市民」が含ま
れていない。
【0048】図6は、検索装置1において、実在検索語
候補リスト作成の様子を示す図である。
【0049】図5に示す認識結果のうちで認識尤度が8
0以上である単名詞を組み合わせた場合、この組み合わ
せのうちで、検索データベース81に登録されている単
名詞の組合わせは、「横須賀/市立/病院」と「横浜/
市立/病院」との2つの組み合わせであり、この2つの
組み合わせが、検索データベース81に実在する検索語
候補である実在検索語候補として選択される。このよう
にして選択された実在検索語候補をリスト化すると、図
6の下部に示す実在検索語候補リストが作成される(S
3)。
【0050】検索装置1において、検索語認識尤度は、
図6に示すように、各単名詞の認識尤度を加算したもの
である。なお、検索語認識尤度を算出する場合、各単名
詞の認識尤度を乗算するようにしてもよい。
【0051】そして、実在検索語候補リストの中に、利
用者Pによる確認処理のみで検索語を確定することがで
きる条件を満たす候補が存在する否かを、判断する(S
21)。
【0052】ここで、検索語認識尤度の閾値が予め定め
られ、所定の検索語候補の検索語認識尤度が、検索語認
識尤度の閾値を越えていれば、その検索語候補は、利用
者Pによる確認処理のみで検索語を確定することができ
る条件を満たしていると判断する。なお、検索装置1に
おいては、上記検索語認識尤度の閾値が270であると
定められているとする。
【0053】そして、検索語候補を利用者Pにディスプ
レイ等で提示し、確認を求め(S22)、利用者PがY
ESの応答をすれば(S23)、検索処理を終了する。
【0054】図6に示す実在検索語候補リスト中の検索
語候補は、それらのどれも、検索語認識尤度の閾値27
0を越えないので、図6に示す実在検索語候補リスト中
の検索語候補は、全て、利用者Pによる確認処理のみで
は検索語を確定することができない。
【0055】このように検索語を確定することができな
い場合に備えて、第2の単名詞集合群G2の範囲で単名
詞の認識、認識尤度の算出等の処理を、予め実行してお
く。すなわち、検索語候補を利用者Pにディスプレイ等
で提示し、確認を求める処理(S22)および利用者P
による応答(S23)と並行して、第2の単名詞集合群
G2の範囲で単名詞の認識、認識尤度の算出(S1
2)、有力構成名詞候補の再選出(S13)、実在検索
語候補リストの更新(S14)を実行する。
【0056】つまり、まず、単名詞集合群の順位を示す
関数kを1インクリメントし(S11)、k=2とし、
認識処理が終了した第1の単名詞集合群G1の次に使用
頻度が高い第2の単名詞集合群G2(頻度順位が500
位〜1,000位である単名詞によって構成されている
単名詞集合群)の範囲で、認識し、この認識結果を利用
し、有力構成名詞候補の再抽出を試みる(S12、S1
3、S14)。
【0057】図4に示すフローチャートにおいて、ステ
ップS3の後に、ステップ21に進むルートとは別に、
ステップS11に進むルートが破線で示されている。こ
れは、ステップS21〜S23のルーチンと、ステップ
S11〜S15のルーチンとが並行処理されるという意
味である。つまり、第1の単名詞集合群G1について利
用者Pとの対話処理(S21〜S23)が実行されてい
る間に、第2の単名詞集合群G2について、有力構成名
詞候補の再選出、実在検索語候補リストの更新等(S1
1〜S15)が実行される。
【0058】また、その後に、必要であれば、第2の単
名詞集合群G2について利用者Pとの対話処理(S21
〜S23)が実行されている間に、第3の単名詞集合群
G3について、有力構成名詞候補の再選出、実在検索語
候補リストの更新等(S11〜S15)が実行され、さ
らに、第3の単名詞集合群G3について利用者Pとの対
話処理(S21〜S23)が実行されている間に、第4
の単名詞集合群G4について、有力構成名詞候補の再選
出、実在検索語候補リストの更新等(S11〜S15)
が実行される。これらの並行処理が、必要に応じて、さ
らに繰り返される。
【0059】図7は、検索装置1において、更新された
認識結果リストの具体例を示す図である。
【0060】図7では、第2の単名詞集合群G2の範囲
で認識された認識結果が追加され、有力構成名詞候補が
更新されたリストが示されている。
【0061】なお、図2に示すように、補助データベー
ス82における単名詞「市民」の頻度順位は、790位
であるので、第2の単名詞集合群G2に単名詞「市民」
が含まれ、したがって、図7に示す更新された認識結果
リストには、音声入力された単名詞「市民」に対する認
識結果の中に、有力構成名詞候補として、「市民」が含
まれている。
【0062】図8は、検索装置1において、実在検索語
候補リストを作成する処理を実行した結果、得られる実
在検索語候補リストを示す図である。
【0063】実在検索語候補リストを作成する処理を実
行した結果、図8に示す実在検索語候補リストが得ら
れ、上記閾値270を越える検索語認識尤度を有してい
る検索語候補は、「横須賀/市民/病院」、「横浜/市
民/病院」であり、これらのうちの「横須賀/市民/病
院」について、利用者Pに提示し、その正誤確認を行う
(S22)。
【0064】正誤確認において、利用者Pから肯定を示
す応答(YES)が得られると(S23)、検索語が確
定されたものとして処理を終了する。
【0065】ところで、音声認識対象語彙数が大規模で
あり、しかも、似通った語彙が多い場合、従来の音声認
識技術では認識処理時間が長くなるので、従来例では、
利用者Pが音声入力した検索語を、その利用者Pにスト
レスを与えずに一定時間内で検索することは、非常に困
難であり、また、認識装置の精度の低下が避けられな
い。
【0066】そこで、検索装置1では、検索対象(検索
語)を、単名詞の羅列からなる複合名詞だけに限定し、
単名詞で1つづつ区切って、検索語を入力するように利
用者Pに指示し、利用者Pが入力した各単名詞につい
て、検索語を構成する単名詞を使用頻度順に保持してい
る検索補助データベース82を認識対象として認識処理
する。この点が、検索装置1の特徴である。
【0067】検索データベース81に登録されている検
索語の総数よりも、検索補助データベース82に登録さ
れている単名詞の総数が少ないことが期待されるが、検
索補助データベース82に登録されている単名詞の総数
は、対話処理実時間内で処理不可能な数である場合が多
い。このように、検索補助データベース82に登録され
ている単名詞の総数が、対話処理実時間内で処理不可能
な数であり、しかも、検索補助データベース82に登録
されている単名詞を一度に処理しようとすれば、利用者
Pを待機させざるを得ない。
【0068】そこで、検索装置1では、検索補助データ
ベース82中の単名詞を、使用頻度順に並べ、これを、
対話処理実時間内で処理可能な一定の所定数づつに分割
して、複数の単名詞集合群を構成し、使用頻度の高い単
名詞順に認識処理を行い、各単名詞集合群に対する認識
結果を検索語候補選定対話する時間に、残りの単名詞集
合群に対する認識処理を行う。これによって、1つの検
索語について1回目の検索語候補選定対話が終わると、
直ちに、2回目の検索語候補選定対話が行われ、必要な
らば、3回目、4回目、……の検索語候補選定対話が引
き続いておこなわれるので、利用者Pを待機させる暇が
ない。
【0069】すわなち、検索装置1の内部の処理状況を
利用者Pが一切見ることができないので、あたかも、検
索データベース81に登録されている検索語を一括して
認識処理を行っているかのように見える。
【0070】また、検索装置1によれば、各単名詞に対
する認識結果から、有力構成名詞候補を選択し、これら
選択された有力構成名詞候補の全組み合わせの中から、
検索データベース81に実在する検索語候補のみを選択
し、利用者Pによる確認処理のみで確定できる条件を満
たすと判断できる検索語候補を、利用者Pに提示をす
る。したがって、検索装置1では、存在確率が高い検索
語順に、認識結果を抽出することができる。
【0071】すなわち、検索装置1では、1回で認識処
理する単名詞の数を絞ることによって、利用者Pを待機
させることがなく、しかも、使用される頻度の高い単名
詞から順に、認識処理することによって、存在確率が高
い検索語順に、認識結果を抽出することができる。
【0072】換言すれば、検索装置1では、音声認識を
利用して複合名詞を検索する場合、認識対象が大多数で
あることから生じる認識処理時間の長さを利用者Pに感
じさせず、誤認識によって正誤確認の繰り返しを余儀な
くさせることによるストレスを、利用者Pに感じさせ
ず、しかも、高精度な自然性を備えている。
【0073】図9は、検索装置1における検索データベ
ース81を一般的に示す図である。
【0074】検索データベース81は、対話処理実時間
内で音声認識処理が不可能な数の検索語を保持し、各検
索語は、単名詞に分割された形で登録されている。
【0075】つまり、たとえば検索語である複合名詞N
1は、単名詞n1、n2、n3によって構成され、検索デー
タベース81には、複合名詞N1として、単名詞n1、n
2、n3が、単名詞毎に区切られた状態で登録されてい
る。
【0076】図10は、検索補助データベース82を一
般的に示す図である。
【0077】検索補助データベース82は、検索データ
ベース81に登録されている全検索語を構成する各単名
詞の使用頻度をそれぞれ算出し、単名詞を頻度順に並べ
た状態で登録しているデータベースである。
【0078】検索補助データベース82が登録している
単名詞の数は、検索データベース81の検索語数よりも
少ないことが予想されるが、対話処理実時間内には処理
不可能な数で構成される。
【0079】検索補助データベース82では、頻度が高
い順に単名詞が並べられ(序列化し)、予め定められた
対話処理実時間内に処理可能な単名詞の数づつ、単名詞
を分割し(単名詞の上記序列を分割し)、単名詞集合群
を形成した状態で登録されている。最も頻度の高い単名
詞を含む単名詞集合群を、第1の単名詞集合群G1とい
う。
【0080】また、検索装置1を、記録媒体の発明とし
て把握することができる。
【0081】つまり、検索装置1は、複数の単名詞で構
成されている複合名詞が検索語として登録され、しか
も、上記検索語が各単名詞に区切られて登録されている
検索データベースを作成する検索データベース作成手順
と、上記検索データベースに登録されている全検索語を
構成する単名詞が、その頻度の高い順に登録され、しか
も、この頻度の高い順に登録されている単名詞が、その
頻度の高い方から順に、所定の数毎に分割されて、複数
の単名詞集合群が形成されている検索補助データベース
を作成する検索補助データベース作成手順と、利用者P
が上記検索語を単名詞毎に入力すると、上記入力された
単名詞毎に、上記複数の単名詞集合群のうちで、最も頻
度が高い単名詞を含む第1の単名詞集合群の範囲内で認
識処理し、認識尤度を対応させて、認識結果リストを作
成する認識結果リスト作成手順と、上記認識処理された
単名詞である構成名詞候補と、上記構成名詞候補につい
ての認識尤度との組が認識尤度順に並べられている認識
結果リストを、上記音声入力された単名詞のそれぞれつ
いて作成し、上記認識結果リストに記載されている構成
名詞候補のうちで、所定の閾値を超える認識尤度を具備
する構成名詞候補を、有力構成名詞候補として選出する
有力構成名詞候補選出手順と、上記有力構成名詞候補の
全組合わせの中から、上記検索データベースに実在する
検索語のみを選択し、各有力構成名詞候補の認識尤度に
所定の演算を行い、検索語認識尤度を算出し、この算出
された検索語認識尤度の大きい順に並べた実在検索語候
補リストを作成する実在検索語候補リスト作成手順と、
上記実在検索語候補リスト中の検索語候補が、利用者P
による確認処理のみで検索語を特定することができる条
件を満たす場合は、上記利用者Pとの間で必要な対話を
実行し、検索語を確定する検索語候補選定対話手順とを
コンピュータに実行させるプログラムを記録したコンピ
ュータ読み取り可能な記録媒体の例である。
【0082】なお、上記記録媒体として、FD、CD、
DVD、HD、半導体メモリ等が考えられる。
【0083】なお、商品配送サービスや、電話番号検索
や郵便番号検索等における入力インタフェース部分にお
いて、検索装置1で行った法人名義の確定作業を、幅広
く適用することができる。
【0084】図11は、本発明の第2の実施例である音
声入力された複合名詞の検索装置101を示すブロック
図である。
【0085】音声入力された複合名詞の検索装置101
は、音声入力部102と、音声認識部103と、音声認
識用ソフトウェア103Sと、音声認識結果出力部10
4と、実在検索語候補リスト作成部105と、対話制御
部106と、音声出力部107と、音声出力用ソフトウ
ェア107Sと、システムデータベース108とを有す
る。
【0086】音声入力された複合名詞の検索装置101
において、音声入力部102を介して入力された利用者
Pの音声が音声認識部103へ送られ、音声認識部10
3は、入力音声を音声認識処理する際に、システムデー
タベース108を利用する。また、音声認識部103
は、利用者Pによる入力音声について、音声認識用ソフ
トウェア103Sを利用して、認識処理を実行する。
【0087】システムデータベース108は、検索デー
タベース181と、検索補助データベース182と、Y
ES/NOデータベース183とによって構成されてい
る。
【0088】検索データベース181は、複数の単名詞
で構成されている複合名詞が検索語として登録され、し
かも、上記検索語が各単名詞に区切られて登録されてい
るデータベースである。
【0089】検索補助データベース182は、登録され
ている各複合名詞のn番目(nは整数値)に表記されて
いる単名詞を集めた群を、n番目表記の単名詞集合群と
呼び、上記n番目表記の単名詞集合群が、その頻度の高
い順に登録され、しかも、この頻度の高い順に登録され
ている単名詞が、その頻度の高い方から順に、所定の数
(第2の実施例では500個)毎にまとめられ、複数の
サブ集合群が形成されている検索補助データベースであ
る。
【0090】YES/NOデータベース183は、利用
者Pが応答した内容(たとえば、はい/いいえ、YES
/NO)を認識するデータベースである。
【0091】音声認識用ソフトウェア103Sは、検索
装置101の処理の場面に合わせて、検索データベース
181または検索補助データベース182を、システム
データベース108から選択するものである。
【0092】検索語が音声入力されると、検索補助デー
タベース182を参照し、また、利用者Pへの正誤確認
に対する応答を認識する場合は、YES/NOデータベ
ース183が参照される。
【0093】また、音声認識部103は、音声認識処理
の際に、音声認識用ソフトウェア103Sを使用し、音
声出力部107は、音声出力の際に、音声出力用ソフト
ウェア107Sを使用する。
【0094】次に、第2の実施例について、より具体的
に説明する。
【0095】なお、以下の説明では、企業名等、法人名
義を確定するサービスの入力インタフェース部分に、音
声入力された複合名詞の検索装置101が設けられてい
る場合について説明する。
【0096】日本全国の電話帳に掲載されている法人名
義は2200万件も存在し、2200万件の中から1つ
の法人名義を、入力した音声に基づいて、特定するには
相当の時間がかかり、したがって、現行の音声認識技術
では、対話処理実時間(検索装置と利用者Pとがやりと
りする場合、上記利用者Pにストレスまたは不自然さを
感じさせない時間)内で法人名義を認識処理することが
不可能であり、しかも、この場合、非常に似通ったデー
タが多いので、認識精度が非常に低い。
【0097】図12は、第2の実施例において、検索デ
ータベース181中の法人名義が複合名詞で構成され、
この複合名詞が、それを構成する単名詞毎に区切って登
録されている具体例を示す図である。
【0098】検索データベース181に登録されている
法人名義を構成している各名詞の頻度を調べ、単名詞を
頻度順に記録し、検索補助データベース182を作成す
る。
【0099】なお、上記2200万件の法人名義を構成
する単名詞の総数は、650万種類である。また、法人
名義2,200万件を構成する名詞のうち、1番目表記
の単名詞(法人名義中の第1単語目に位置する単名詞)
の総数は、約360万種類であり、2番目表記の単名詞
(法人名義中の第2単語目に位置する単名詞)の総数
は、約250万種類であり、3番目表記の単名詞(法人
名義中の第3単語目に位置する単名詞)の総数は、約2
70万種類であり、4番目表記の単名詞(法人名義中の
第4単語目に位置する単名詞)の総数は、約100万種
類、…(最長構成単語数7)であり、対話処理実時間内
では、1つの複合名詞に対する各単名詞の認識処理は不
可能であり、精度も低いことが予想される。
【0100】図13は、第2の実施例において、検索補
助データベース182に格納されているデータの具体例
を示す図である。
【0101】検索補助データベース182中の単名詞
は、検索データベース181に登録されている複合名詞
を構成する単名詞であり、複合名詞における表記の順番
毎に、単名詞集合群が形成されている。複合名詞におけ
る表記の順番が最初である単名詞だけを集めて、1番目
表記の単名詞集合群Ga1が形成され、1番目表記の単
名詞集合群Ga1において、その使用頻度の高い順に単
名詞が登録され、しかも、これら登録されている単名詞
が、その頻度の高い方から順に、500個の単名詞毎に
まとめられ、複数のサブ集合群が形成され、頻度の高い
順に、第1サブ集合群Ga1−1、第2サブ集合群Ga
1−2、……、第mサブ集合群Ga1−mが形成されて
いる。
【0102】なお、使用頻度が最も高い単名詞を含む第
1サブ集合群Ga1−1は、他のサブ集合群Ga1−2
〜Ga1−mよりも優先して認識する対象である。
【0103】また、複合名詞における表記の順番が2番
目である単名詞だけを集めて、2番目表記の単名詞集合
群Ga2が形成され、2番目表記の単名詞集合群Ga2
において、その使用頻度の高い順に単名詞が登録され、
しかも、これら登録されている単名詞が、その頻度の高
い方から順に、500個の単名詞毎にまとめられ、複数
のサブ集合群が形成され、頻度の高い順に、第1サブ集
合群Ga2−1、第2サブ集合群Ga2−2、……、第
mサブ集合群Ga2−mが形成されている。
【0104】なお、使用頻度が最も高い単名詞を含む第
1サブ集合群Ga2−1は、他のサブ集合群Ga2−2
〜Ga2−mよりも優先して認識する対象である。
【0105】以下、上記と同様に、複合名詞における表
記の順番がn番目である単名詞だけを集めて、n番目表
記の単名詞集合群Ganが形成され、n番目表記の単名
詞集合群Ganにおいて、その使用頻度の高い順に単名
詞が登録され、しかも、これら登録されている単名詞
が、その頻度の高い方から順に、500個の単名詞毎に
まとめられ、複数のサブ集合群が形成され、頻度の高い
順に、第1サブ集合群Gan1、第2サブ集合群Gan
2、……、第nサブ集合群Gan−mが形成されてい
る。
【0106】なお、使用頻度が最も高い単名詞を含む第
1サブ集合群Gan−1は、他のサブ集合群Gan−2
〜Gn−mよりも優先して認識する対象である。
【0107】ところで、1つのサブ集合群を構成する名
詞の数をNとすると、第2の実施例では、N=500で
あり、この数は、次のようにして決められる。つまり、
対話処理実時間(検索装置と利用者Pとがやりとりする
場合、上記利用者Pにストレスまたは不自然さを感じさ
せない時間である)内に音声認識用ソフトウェア103
Sが処理可能な単名詞の数をTとし、検索データベース
181に登録されている全検索語の平均単名詞数をMと
すると、N=T/Mである。
【0108】具体的には、対話処理実時間内に音声認識
用ソフトウェア103Sが処理可能な単名詞の数Tが1
500であるとし、検索データベース181に登録され
ている全検索語の平均単名詞数Mが3であるとすると、
N=T/M=1500/3=500である。
【0109】なお、各サブ集合群Ga1−1〜Gan−
mのそれぞれを構成する単名詞の数Nは、500以外の
数でもよいが、上記のように、対話処理実時間内に処理
可能な単名詞の数T(音声認識用ソフトウェア103S
の性能)と、検索データベース181に登録されている
検索語が有する単名詞の数の平均Mとによって定められ
る。
【0110】図14は、第2の実施例において、検索語
を確定する処理プロセスを具体的に示すフローチャート
である。
【0111】この前提として、検索データベース18
1、検索補助データベース182が作成されているとす
る。
【0112】まず、検索したい法人名義(複合名詞)
を、単名詞に区切った形で音声入力するように、利用者
Pに要求する(S100)。そして、検索語である複合
名詞に関する各単名詞集合群におけるサブ集合群の関数
(サブ集合群の順位を示す関数)kを1とする。つま
り、サブ集合群の関数k=1であれば、複数のサブ集合
群のうちで、サブ集合群Ga1−1、Ga2−1、Ga
3−1、……を使用して、各単名詞が認識される。
【0113】ここで、複合名詞「横浜/グランド/ホテ
ル」が検索語として音声入力された場合について考え
る。
【0114】まず、音声入力された単名詞「横浜」、
「グランド」、「ホテル」のそれぞれについて、1番目
表記の単名詞集合群Ga1中の第1サブ集合群Ga1−
1、2番目表記の単名詞集合群Ga2中の第1サブ集合
群Ga2−1、3番目表記の単名詞集合群Ga3中の第
1サブ集合群Ga3−1を使用し、音声認識部103が
認識処理を行う(S101)。つまり、音声入力された
単名詞「横浜」について、第1サブ集合群Ga1−1の
範囲内で認識処理し、音声入力された単名詞「グラン
ド」について、第1サブ集合群Ga2−1の範囲内で認
識処理し、音声入力された単名詞「ホテル」について、
第1サブ集合群Ga3−1の範囲内で認識処理する。そ
して、音声認識結果出力部104が、その認識結果を出
力する。
【0115】音声入力された単名詞「横浜」、「グラン
ド」、「ホテル」のうちで、単名詞「横浜」は、図13
に示すように、第1サブ集合群Ga1−1に含まれ、単
名詞「ホテル」も、第1サブ集合群Ga3−1に含まれ
ているとする。しかし、単名詞「グランド」の頻度順位
は、図13に示すように、頻度順位951位であるの
で、第1サブ集合群Ga2−1には含まれず、第2サブ
集合群Ga2−2に含まれている。
【0116】図15は、第2の実施例において、音声入
力された検索語(複合名詞)を構成する各単名詞に対す
る認識結果と、その認識尤度とが対応している認識結果
リストの具体例を示す図である。
【0117】1つの単名詞が音声入力されると、この音
声入力された単名詞に対する複数の構成名詞候補と、こ
れら複数の構成名詞候補のそれぞれに対する認識尤度と
を、音声認識結果出力部104が出力し、この出力され
た構成名詞候補と認識尤度とを対応させて、認識結果リ
ストを作成する(S101)。このようにして作成され
た認識結果リストが、図15に示されている。
【0118】たとえば、単名詞「横浜」を音声入力する
と、この入力された音声を、音声認識部103が、図1
5に示すように、「横浜」、「横須賀」、「横山」、
「横山」、……と認識し、「横浜」の認識尤度が95で
あり、「横須賀」の認識尤度が90であり、「横溝」の
認識尤度が81であり、「横山」の認識尤度が75であ
る。
【0119】なお、各単名詞についての認識尤度は、そ
の単名詞が音声入力されたときに、音声認識装置3S
が、個々に判断する。
【0120】ここで、認識尤度が所定の閾値以上である
構成名詞候補を、有力構成名詞候補とする。なお、第2
の実施例では、上記所定の閾値を80とする。つまり、
認識尤度が80以上である構成名詞候補が、有力構成名
詞候補である。上記所定の閾値が80であることは、デ
ータベース81、82を作るときに、予め設定されてい
る。
【0121】そして、図15に示す各認識結果から、認
識尤度が80以上である単名詞を、有力構成名詞候補と
して選択する(S102)。
【0122】図15に示すように、音声入力された単名
詞「横浜」については、「横浜」、「横須賀」、「横
溝」の3候補が有力構成名詞候補として選択され、音声
入力された単名詞「グランド」ついては、有力構成名詞
候補として選択されたものがなく、音声入力された単名
詞「ホテル」については、「ホテル」、「ホール」の2
候補が有力構成名詞候補として選択される。
【0123】そして、これら有力構成名詞候補を利用
し、実在検索語候補リストを作成する(S103)。な
お、実在検索語候補リストは、検索データベース181
に実在する検索語のうちで、利用者Pに提示し、確認を
求める検索語の候補を集めたリストである。
【0124】ところで、2番目表記の単名詞「グラン
ド」の頻度順位は、補助データベース82に格納されて
いる2番目表記の単名詞集合群Ga2において、図12
に示すように、951位であるので、2番目表記の単名
詞集合群Ga2の第1サブ集合群Ga2−1には、単名
詞「グランド」が含まれていない。よって、図15に示
す音声入力された単名詞「グランド」に対する認識結果
には、単名詞「グランド」が含まれていない。
【0125】したがって、実在検索語候補リストを作成
するステップ(S103)では、実在検索語候補リスト
が作成されない。
【0126】そして、確認処理のみで検索語特定可能な
条件を満たさないので(S121)、サブ集合群の関数
kを1インクリメントし(S111)、検索対象のサブ
集合群が、Ga1−2、Ga2−2、Ga3−1にな
り、音声入力された各単名詞について、新たな集合群G
a2−2を使用して、認識し、認識尤度を算出する(S
112)。そして、新たに認識した認識結果を追加した
状態で(更新された認識結果リストをしようして)、有
力構成名詞候補を再選出し(S113)、実在検索語候
補リストを更新する(S114)。
【0127】図16は、第2の実施例において、更新さ
れた認識結果リストの具体例を示す図である。
【0128】図16では、第2サブ集合群Ga1−2、
Ga2−2、Ga3−2の範囲で認識された認識結果が
追加され、有力構成名詞候補が更新されたリストが示さ
れている。
【0129】なお、図13に示すように、補助データベ
ース82において、2番目表記の単名詞集合群Ga2に
おける単名詞「グランド」の頻度順位は、951位であ
るので、第2サブ集合群Ga2−2に単名詞「グラン
ド」が含まれ、したがって、図16に示す更新された認
識結果リストには、音声入力された単名詞「グランド」
に対する認識結果の中に、有力構成名詞候補として、
「グランド」が含まれている。
【0130】図17は、第2の実施例において、実在検
索語候補リスト作成の様子を示す図である。
【0131】有力構成名詞候補を選出できなかった音声
入力単名詞「グランド」におけるサブ集合群を新たにし
て、認識し、この認識結果のうちで認識尤度が80以上
である単名詞を組み合わせ、この組み合わせのうちで、
検索データベース181に登録されている単名詞の組合
わせは、図17に示すように、「横浜/グランド/ホテ
ル」と「横浜/ゴールド/ホール」との2つの組み合わ
せであり、この2つの組み合わせが、検索データベース
181に実在する検索語候補である実在検索語候補とし
て選択される。このようにして選択された実在検索語候
補について、実在検索語候補リストを作成すると、図1
7の下部に示す実在検索語候補リストが更新される(S
114)。
【0132】第2の実施例において、検索語認識尤度
は、図17に示すように、各単名詞の認識尤度を加算し
たものである。なお、検索語認識尤度を算出する場合、
各単名詞の認識尤度を乗算するようにしてもよい。
【0133】そして、実在検索語候補リストの中に、利
用者Pによる確認処理のみで検索語を確定することがで
きる条件を満たす候補が存在する否かを、判断する(S
121)。
【0134】ここで、検索語認識尤度の閾値が予め定め
られ、所定の検索語候補の検索語認識尤度が、検索語認
識尤度の閾値を越えていれば、その検索語候補は、利用
者Pによる確認処理のみで検索語を確定することができ
る条件を満たしていると判断する。なお、第2の実施例
においては、上記検索語認識尤度の閾値が280である
と定められているとする。
【0135】そして、検索語候補を利用者Pにディスプ
レイ等で提示し、確認を求め(S122)、利用者Pが
YESの応答をすれば(S123)、検索処理を終了す
る。
【0136】図17に示す実在検索語候補リスト中の検
索語候補のうちで1つの候補が、検索語認識尤度の閾値
280以上であるという条件を満たすので、図17に示
す実在検索語候補リスト中の検索語候補は、利用者Pに
よる確認処理のみで検索語を確定することができる。
【0137】もし、実在検索語候補リスト中の検索語候
補のいずれも、検索語認識尤度の閾値280以上である
という条件を満たしていなければ、それら実在検索語候
補リスト中の検索語候補は、全て、利用者Pによる確認
処理のみでは検索語を確定することができない。
【0138】このように検索語を確定することができな
い場合に備えて、第3サブ集合群Ga1−3、G2−
3、G3−3の範囲で単名詞の認識、認識尤度の算出等
の処理を、予め実行しておく。すなわち、検索語候補を
利用者Pにディスプレイ等で提示し、確認を求める処理
(S122)および利用者Pによる応答(S123)と
並行して、第3サブ集合群Ga1−3、Ga2−3、G
a3−3の範囲で単名詞の認識、認識尤度の算出(S1
12)、有力構成名詞候補の再選出(S113)、実在
検索語候補リストの更新(S114)を実行する。
【0139】つまり、サブ集合群の順位を示す関数kを
さらに1インクリメントし(S111)、k=3とし、
認識処理が終了した第2サブ集合群の次に使用頻度が高
い第3サブ集合群Ga1−3、Ga2−3、Ga3−3
(頻度順位が1001位〜1,500位である単名詞に
よって構成されているサブ集合群Ga1−3、Ga2−
3、Ga3−3の範囲で、認識し、この認識結果を利用
し、有力構成名詞候補の再抽出を試みる(S112、S
113、S114)。
【0140】図14に示すフローチャートにおいて、ス
テップS3の後に、ステップ21に進むルートとは別
に、ステップS111に進むルートが破線で示されてい
る。これは、ステップS121〜S123のルーチンと、
ステップS111〜S115のルーチンとが並行処理さ
れるという意味である。
【0141】つまり、第1サブ集合群Ga1−1、Ga
2−1、Ga3−1について利用者Pとの対話処理(S
121〜S123)が実行されている間に、第2サブ集
合群Ga1−2、Ga2−2、Ga3−2について、有
力構成名詞候補の再選出、実在検索語候補リストの更新
等(S111〜S115)が実行される。
【0142】また、その後に、必要であれば、第2サブ
集合群Ga1−2、Ga2−2、Ga3−2について利
用者Pとの対話処理(S121〜S123)が実行され
ている間に、第3サブ集合群Ga1−3、Ga2−3、
Ga3−3について、有力構成名詞候補の再選出、実在
検索語候補リストの更新等(S111〜S115)が実
行され、さらに、第3サブ集合群Ga1−3、Ga2−
3、Ga3−3について利用者Pとの対話処理(S12
1〜S123)が実行されている間に、第4サブ集合群
Ga1−4、Ga2−4、Ga3−4について、有力構
成名詞候補の再選出、実在検索語候補リストの更新等
(S111〜S115)が実行される。これらの並行処
理が、必要に応じて、さらに繰り返される。
【0143】ところで、音声認識対象語彙数が大規模で
あり、しかも、似通った語彙が多い場合、従来の音声認
識技術では認識処理時間が長くなるので、従来例では、
利用者Pが音声入力した検索語を、その利用者Pにスト
レスを与えずに一定時間内で検索することは、非常に困
難であり、また、認識装置の精度の低下が避けられな
い。
【0144】そこで、第2の実施例では、検索対象(検
索語)を、単名詞の羅列からなる複合名詞だけに限定
し、単名詞で1つづつ区切って、検索語を入力するよう
に利用者Pに指示し、利用者Pが入力した各単名詞につ
いて、上記複合名詞において表記されている位置毎に、
単名詞集合群が形成され、しかも、上記単名詞集合群毎
に、その頻度の高い順に登録され、この頻度の高い順に
登録されている複数の単名詞が、その頻度の高い方から
順に、所定の数毎にまとめられ、複数のサブ集合群が形
成されている検索補助データベースとを有するデータベ
ースを利用して、利用者が音声入力した複合名詞を検索
するものである。
【0145】上記のように、複合名詞における単名詞の
位置に応じて、単名詞毎に、単名詞集合群が形成され、
この単名詞集合群が、複数のサブ集合群に分割され、そ
のうちで、使用頻度が高い単名詞が含まれているものか
ら、認識する点が、第2の実施例の特徴である。
【0146】検索データベース181に登録されている
検索語の総数よりも、検索補助データベース182に登
録されている単名詞の総数が少ないことが期待される
が、検索補助データベース182に登録されている単名
詞の総数は、対話処理実時間内で処理不可能な数である
場合が多い。このように、検索補助データベース182
に登録されている単名詞の総数が、対話処理実時間内で
処理不可能な数であり、しかも、検索補助データベース
182に登録されている単名詞を一度に処理しようとす
れば、利用者Pを待機させざるを得ない。
【0147】そこで、第2の実施例では、検索補助デー
タベース182中の単名詞を、使用頻度順に並べ、これ
を、対話処理実時間内で処理可能な一定の所定数づつに
分割して、複数のサブ集合群を構成し、使用頻度の高い
単名詞順に認識処理を行い、各サブ集合群に対する認識
結果を検索語候補選定対話する時間に、残りのサブ集合
群に対する認識処理を行う。これによって、1つの検索
語について1回目の検索語候補選定対話が終わると、直
ちに、2回目の検索語候補選定対話が行われ、必要なら
ば、3回目、4回目、……の検索語候補選定対話が引き
続いて行われるので、利用者Pを待機させる暇がない。
【0148】すなわち、検索装置101の内部の処理状
況を利用者Pが一切見ることができないので、あたか
も、検索データベース181に登録されている検索語を
一括して認識処理を行っているかのように見える。
【0149】また、第2の実施例によれば、各単名詞に
対する認識結果から、有力構成名詞候補を選択し、これ
ら選択された有力構成名詞候補の全組み合わせの中か
ら、検索データベース181に実在する検索語候補のみ
を選択し、利用者Pによる確認処理のみで確定できる条
件を満たすと判断できる検索語候補を、利用者Pに提示
をする。したがって、第2の実施例では、存在確率が高
い検索語順に、認識結果を抽出することができる。
【0150】すなわち、第2の実施例では、1回で認識
処理する単名詞の数を絞ることによって、利用者Pを待
機させることがなく、しかも、使用される頻度の高い単
名詞から順に、認識処理することによって、存在確率が
高い検索語順に、認識結果を抽出することができる。
【0151】換言すれば、第2の実施例では、音声認識
を利用して複合名詞を検索する場合、認識対象が大多数
であることから生じる認識処理時間の長さを利用者Pに
感じさせず、誤認識によって正誤確認の繰り返しを余儀
なくさせることによるストレスを、利用者Pに感じさせ
ず、しかも、高精度な自然性を備えている。
【0152】ところで、複合名詞「横浜/グランド/ホ
テル」の2番目表記の単名詞(複合名詞における2番目
の単名詞)である「グランド」は、全検索語を構成する
単名詞の全てを頻度順に並べた場合、2,450番目に
位置するので、検索データベース181に格納されてい
る全ての単名詞をその使用頻度順に並べて、500単語
ずつの単名詞について認識処理すると、上位から5つ目
の500単語の組に初めて出現することになる。この場
合、少なくとも、認識処理と実在検索語リスト作成処理
とを5回繰返すことになり、その過程において、検索語
認識尤度が規定閾値を超える実在検索語候補が存在した
場合は、利用者への提示が行われることになり、利用者
Pが違和感を抱く。ところが、第2の実施例では、「横
浜/グランド/ホテル」の2番目表記の単名詞(複合名
詞における2番目の単名詞)である「グランド」は、2
番目表記の単名詞集合群Ga2では、頻度順位が951
番目であるので、認識処理と実在検索語リスト作成処理
とを2回実行すれば、検索語を確定することができ、利
用者Pは違和感を抱かない。
【0153】また、第2の実施例を、記録媒体の発明と
して把握することができる。
【0154】つまり、第2の実施例は、複数の単名詞で
構成されている複合名詞が検索語として登録され、しか
も、上記検索語が各単名詞に区切られて登録されている
検索データベースを作成する検索データベース作成手順
と、上記登録されている各複合名詞のn番目(nは整数
値)に表記されている単名詞の群を、n番目表記の単名
詞集合群と呼び、上記n番目表記の単名詞集合群が、そ
の頻度の高い順に登録され、しかも、この頻度の高い順
に登録されている単名詞が、その頻度の高い方から順
に、所定の数毎にまとめられ、複数のサブ集合群が形成
されている検索補助データベースを作成する検索補助デ
ータベース作成手順と、利用者が上記検索語である複合
語を単名詞毎に入力すると、上記複合名詞のn番目表記
の単名詞については、上記n番目表記の単名詞集合群で
認識し、しかも上記n番目表記の単名詞集合群のうち
で、最も頻度が高い単名詞を含む第1サブ集合群の範囲
内で認識処理し、認識尤度を対応させて、認識結果リス
トを作成する認識結果リスト作成手順と、上記認識処理
された単名詞である構成名詞候補と、上記構成名詞候補
についての認識尤度との組が認識尤度順に並べられてい
る認識結果リストを、上記音声入力された単名詞のそれ
ぞれついて作成し、上記認識結果リストに記載されてい
る構成名詞候補のうちで、所定の閾値を超える認識尤度
を具備する構成名詞候補を、有力構成名詞候補として選
出する有力構成名詞候補選出手順と、上記有力構成名詞
候補の全組合わせの中から、上記検索データベースに実
在する検索語のみを選択し、各有力構成名詞候補の認識
尤度に所定の演算を行い、検索語認識尤度を算出し、こ
の算出された検索語認識尤度の大きい順に並べた実在検
索語候補リストを作成する実在検索語候補リスト作成手
順と、上記実在検索語候補リスト中の検索語候補が、利
用者による確認処理のみで検索語を特定することができ
る条件を満たす場合は、上記利用者との間で必要な対話
を実行し、検索語を確定する検索語候補選定対話手順と
をコンピュータに実行させるプログラムを記録したコン
ピュータ読み取り可能な記録媒体の例である。
【0155】ここで、上記記録媒体として、FD、C
D、DVD、HD、半導体メモリ等が考えられる。
【0156】なお、商品配送サービスや、電話番号検索
や郵便番号検索等における入力インタフェース部分にお
いて、第2の実施例で行った法人名義の確定作業を、幅
広く適用することができる。
【0157】図18は、本発明の第3の実施例である音
声入力された複合名詞の検索装置201を示すブロック
図である。
【0158】音声入力された複合名詞の検索装置201
は、音声入力部202と、音声認識部203と、音声認
識用ソフトウェアを使用する音声認識装置203Sと、
音声認識結果出力部204と、音声認識結果リスト作成
部204aと、実在検索語候補リスト作成部205と、
対話制御部206と、音声出力部207と、音声出力用
ソフトウェアを使用する音声出力装置207Sと、シス
テムデータベース208とを有する。
【0159】音声入力された複合名詞の検索装置201
において、音声入力部202を介して入力された利用者
210の音声が音声認識部203へ送られ、音声認識部
203は、入力音声を音声認識処理する際に、システム
データベース208を利用する。また、音声認識部20
3は、利用者210による入力音声について、音声認識
装置203Sにおける音声認識用ソフトウェアを利用し
て、認識処理を実行する。
【0160】システムデータベース208は、検索デー
タベース281と、順序順序検索補助データベース28
2と、逆順検索補助データベース283と、YES/N
Oデータベース284とによって構成されている。
【0161】検索データベース281は、複数の単名詞
で構成されている複合名詞が検索語として登録され、し
かも、上記検索語が各単名詞に区切られて登録されてい
るデータベースである。
【0162】順序検索補助データベース282は、検索
データベース281に登録されている各複合名詞のn番
目(nは整数値)に位置する単名詞の集合であるn単語
目に位置する単名詞集合が、登録されているデータベー
スであり、上記n単語目に位置する単名詞集合に属する
単名詞が、使用頻度の高い単名詞順にしかも所定数(た
とえば500)毎に分割されることによって、複数のn
番目の単名詞サブ集合が構成されている。
【0163】逆順検索補助データベース283は、検索
データベース281に登録されている各複合名詞の逆順
m単語目(mは整数値)に位置する単名詞の集合である
逆順m単語目に位置する単名詞集合が、登録されている
データベースであり、上記逆順m単語目に位置する単名
詞集合に属する単名詞が、使用頻度の高い単名詞順にし
かも所定数毎に分割されることによって、複数の逆順m
単語目の単名詞サブ集合が構成されている。
【0164】YES/NOデータベース284は、利用
者210が応答した内容(たとえば、はい/いいえ、Y
ES/NO)を認識するデータベースである。
【0165】音声認識装置203Sで使用される音声認
識用ソフトウェアは、検索装置201の処理の場面に合
わせて、検索データベース281、順序検索補助データ
ベース282または逆順検索補助データベース283
を、システムデータベース208から選択するものであ
る。
【0166】検索語が音声入力されると、順序検索補助
データベース282または逆順検索補助データベース2
83を参照し、また、利用者210への正誤確認に対す
る応答を認識する場合は、YES/NOデータベース2
84が参照される。
【0167】音声認識部203は、音声認識処理する際
に、音声認識用ソフトウェア203Sを使用し、音声出
力部207は、音声出力する際に、音声出力用ソフトウ
ェア7Sを使用する。
【0168】なお、以下の説明では、企業名等、法人名
義を確定するサービスの入力インタフェース部分に、音
声入力された複合名詞の検索装置201が設けられてい
る場合について説明する。
【0169】ところで、日本全国の電話帳に掲載されて
いる法人名義は2200万件も存在し、2200万件の
中から1つの法人名義を特定するには相当の時間がかか
り、したがって、現行の音声認識技術では、対話処理実
時間(検索装置201と利用者210とがやりとりする
場合、上記利用者210にストレスまたは不自然さを感
じさせない時間)内で法人名義を認識処理することが不
可能であり、しかも、この場合、非常に似通ったデータ
が多いので、認識精度が非常に低い。
【0170】図19は、複合名詞の検索装置201にお
いて、検索データベース281中の法人名義が複合名詞
で構成され、この複合名詞が、それを構成する単名詞毎
に区切って登録されている具体例を示す図である。
【0171】検索データベース281に登録されている
法人名義を構成している各名詞の頻度を調べ、単名詞を
頻度順に記録し、順序検索補助データベース282を作
成する。つまり、順序検索補助データベース282は、
検索データベース281に登録されている法人名義を構
成している各単名詞について、その頻度をカウントし、
頻度順に登録してあるデータベースである。
【0172】なお、上記2200万件の法人名義を構成
する単名詞の総数は、650万種類である。
【0173】音声認識部203は、利用者210が、検
索語を単名詞毎に区切って音声入力すると、音声入力さ
れた複合名詞における1単語目に位置する単名詞(最初
から1つ目の単名詞)、2単語目に位置する単名詞(最
初から2つ目の単名詞)、……の順で、認識処理を実行
するとともに、音声入力された複合名詞における逆順1
単語目に位置する単名詞(最後から1つ目の単名詞)、
逆順2単語目に位置する単名詞(最後から2つ目の単名
詞)、……の順で、認識処理を実行する部分である。
【0174】音声認識結果出力部204は、認識結果を
音声認識結果リスト作成部204aへ送る部分である。
【0175】音声認識結果リスト作成部204aは、順
序検索補助データベース282を使用した場合における
認識結果と、逆順検索補助データベース283を使用し
た場合における認識結果とを、単名詞毎に、音声認識装
置203Sが算出した認識尤度を利用してマージし、認
識結果リストを作成し、実在検索語候補リスト作成部2
05へ送る部分である。
【0176】この時点で、順序検索補助データベース2
82、逆順検索補助データベース283の中に、まだ認
識処理が終了していない単名詞が存在する場合には、音
声認識部203は、使用頻度が次に高い単名詞によって
構成される単名詞の集合の範囲で認識処理を再びスター
トさせ、音声認識結果出力部204は、認識結果を出力
し、音声認識結果リスト作成部204aへ送り、認識結
果リストを作成し、実在検索語候補リスト作成部205
へ送る処理を繰返す。
【0177】実在検索語候補リスト作成部205は、認
識結果に基づいて、有力構成名詞候補を選択し、有力構
成名詞候補の全ての組合わせを作成し、検索データベー
ス281を参照しながら、実在する検索語を抽出した実
在検索語候補リスト作成し、対話制御部206へ送る部
分である。
【0178】対話制御部206は、実在検索語候補リス
トを参照し、実在検索語候補リスト中の検索語候補が、
利用者210との確認処理のみで検索語特定可能な所定
の条件を満たす場合は、確認処理ガイダンスの出力命令
を音声出力部207へ送るものである。
【0179】実在検索語候補リスト中の検索語候補が、
利用者210との確認処理のみでは検索語特定可能な条
件を満たさない場合は、使用頻度が次に高い単名詞の集
合について認識処理し、この認識処理結果が得られた有
力構成名詞候補を利用して更新実在検索語候補リストを
利用し、検索語候補選定対話の実行を繰返す。
【0180】音声出力部207は、確認処理ガイダンス
出力命令を受けると、検索語候補と指定された候補の正
誤確認を、利用者210に行うガイダンスを出力する。
【0181】そして、確認処理ガイダンスに対する応答
が、音声入力部202に再び入力されると、音声認識部
203は、YES/NOデータベース284を参照し、
利用者210の応答を認識し、音声認識結果出力部11
が認識結果を出力し、利用者210から肯定を表す応答
が得られると、検索語特定が完了した旨を利用者210
ヘガイダンスする命令を、対話制御部206が音声出力
部207へ送る。
【0182】検索語が特定できるまで、実在検索語候補
リストの更新と、検索語候補選定対話とを繰返し、順序
検索補助データベース282と逆順検案補助データベー
ス283とに格納されている全ての単名詞の集合に対す
る認識処理が終了し、実在検索語候補リストの更新が、
これ以上不可能な状態になった時点で、対話制御部20
6は、実在検索語候補リストの上位から、検索語候補を
利用者210に提示するガイダンス出力命令を音声出力
部207へ送る。
【0183】検索装置201は、実在検索語候補リスト
の更新と検索語候補選定対話とが行われている間に、優
先認識対象以外の単名詞のうちの少なくとも1集合に対
して、認識処理が終了しているように、上記1集合を構
成する単名詞の数を規定する。
【0184】次に、複合名詞の検索装置201における
検索語確定の処理プロセスについて具体的に説明する。
【0185】図20は、複合名詞の検索装置201にお
ける順序検索補助データベース282の具体例を示す図
である。
【0186】順序検索補助データベース282に格納さ
れている複数の単名詞は、n単語目に位置する単名詞集
合Gbnに分割され、つまり、1単語目に位置する単名
詞集合Gb1と、2単語目に位置する単名詞集合Gb2
と、3単語目に位置する単名詞集合Gb3と、……に分
類されている。
【0187】また、n単語目に位置する単名詞集合に属
する単名詞が、使用頻度の高い単名詞順に500個毎に
分割されることによって、複数のn番目の単名詞サブ集
合が構成され、つまり、1単語目に位置する単名詞集合
Gb1は、使用頻度の高い単名詞順に500個毎に、単
名詞サブ集合Gb1−1と、単名詞サブ集合Gb1−2
と、単名詞サブ集合Gb1−3と、……に分割され、2
単語目に位置する単名詞集合Gb2は、使用頻度の高い
単名詞順に500個毎に、単名詞サブ集合Gb2−1
と、単名詞サブ集合Gb2−2と、単名詞サブ集合Gb
2−3と、……に分割されている。
【0188】なお、上記分割する場合における数cとし
て、複合名詞の検索装置201では、500を設定して
いるが、上記分割する場合の数cは、使用する音声認識
装置203Sの性能によって規定される。
【0189】図21は、複合名詞の検索装置201にお
ける逆順検索補助データベース283の具体例を示す図
である。
【0190】逆順検索補助データベース283に格納さ
れている複数の単名詞は、逆順m単語目に位置する単名
詞集合Gbmに分割されている。つまり、音声入力され
た複合名詞における逆順1単語目に位置する単名詞(最
後から1つ目の単名詞)の集合である逆順単名詞集合H
1と、音声入力された複合名詞における逆順2単語目に
位置する単名詞(最後から2つ目の単名詞)の集合であ
る逆順単名詞集合H2と、音声入力された複合名詞にお
ける逆順3単語目に位置する単名詞(最後から3つ目の
単名詞)の集合である逆順単名詞集合H3と、……に分
類されている。
【0191】また、逆順m単語目に位置する単名詞集合
に属する単名詞が、使用頻度の高い単名詞順に500個
毎に分割されることによって、複数の逆順m単語目に位
置する逆順単名詞サブ集合が構成され、つまり、逆順1
単語目に位置する逆順単名詞集合H1は、使用頻度の高
い単名詞順に500個毎に、逆順単名詞サブ集合H1−
1と、逆順単名詞サブ集合H1−2と、逆順単名詞サブ
集合H1−3と、……に分割され、逆順2単語目に位置
する逆順単名詞集合H2は、使用頻度の高い単名詞順に
500個毎に、逆順単名詞サブ集合H2−1と、逆順単
名詞サブ集合H2−2と、逆順単名詞サブ集合H2−3
と、……に分割されている。
【0192】なお、上記分割する場合における数cとし
て、複合名詞の検索装置201では、500を設定して
いるが、上記分割する場合の数cは、使用する音声認識
装置203Sの性能によって規定される。
【0193】図22は、複合名詞の検索装置201にお
ける検索語確定の処理プロセスを示すフローチャートで
ある。
【0194】まず、利用者210は、検索目的である法
人名義を、単名詞に区切って音声入力する(S20
0)。複合名詞の検索装置201では「横須賀/セント
ラル/ホテル」が検索語として入力された場合について
考える。
【0195】ここで、複合名詞を構成する単名詞が、そ
の複数名詞において何単語目に位置するかを示す変数n
として、「1」を設定し、そのn単語目に位置する単名
詞集合Gbnを構成する単名詞サブ集合Gbn−pにお
ける順位(使用頻度の高さを示す順位)の変数pとし
て、「1」を設定する(S201)。
【0196】そして、「横須賀」、「セントラル」、
「ホテル」のそれぞれに対して、単名詞サブ集合Gb1
−1、単名詞サブ集合Gb2−1、単名詞サブ集合Gb
3−1について、認識処理を行なう(S202、S20
3)。続いて、単名詞毎に、認識尤度を対応させて、順
序検索した場合における認識結果リストを作成する(S
204)。続いて、認識尤度が80以上である単名詞
を、有力構成名詞候補として選出する(S205)。
【0197】上記「有力構成名詞候補」は、認識尤度が
所定の閾値以上である構成名詞候補であり、複合名詞の
検索装置201では、上記閾値を80とする。つまり、
認識尤度が80以上である構成名詞候補が、有力構成名
詞候補である。なお、有力構成名詞候補を選択する場合
に使用する認識尤度は、検索データベース281を作る
ときに、予め定められている。
【0198】図23は、複合名詞の検索装置201にお
いて、順序検索した場合における認識結果リストの具体
例を示す図である。
【0199】なお、「順序検索」は、順序検索補助デー
タベース282を使用して、音声入力された複合名詞に
おけるn単語目に位置する単名詞を、n単語目に位置す
る単名詞集合Gbnの範囲で認識し、検索する動作であ
る。、また、後述の「逆順検索」は、逆順検索補助デー
タベース283を使用して、音声入力された複合名詞に
おける逆順m単語目に位置する単名詞を、逆順m単語目
に位置する単名詞集合Gbmの範囲で認識し、検索する
動作である。、一方、上記順序検索における認識動作と
並行して、逆順検索における認識動作が行われる。
【0200】つまり、複合名詞を構成する単名詞が、そ
の複数名詞における逆順で何番目であるかを示す変数m
として、「1」を設定し、その逆順m単語目に位置する
単名詞集合Gbmを構成する単名詞サブ集合Gbm−q
における順位(使用頻度の高さを示す順位)の変数qと
して、「1」を設定する(S211)。
【0201】そして、「横須賀」、「セントラル」、
「ホテル」のそれぞれに対して、逆順単名詞サブ集合H
1−1、逆順単名詞サブ集合H2−1、逆順単名詞サブ
集合H3−1について、認識処理を行なう(S212、
S213)。続いて、単名詞毎に、認識尤度を対応させ
て、逆順検索した場合における認識結果リストを作成す
る(S214)。そして、認識尤度が80以上である単
名詞を、有力構成名詞候補として選出する(S21
5)。
【0202】複合名詞の検索装置201において、上記
のように、順序検索における認識動作と並行して、逆順
検索における認識動作が行われるが、この場合、順序検
索(S201〜S205)を1つのCPUで実行し、逆
順検索(S211〜S215)を別のCPUで実行する
ようにしてもよく、または、1つのCPUで、順序検索
(S201〜S205)と逆順検索(S211〜S21
5)とを実行するようにしてもよい。
【0203】図24は、複合名詞の検索装置201にお
いて、逆順検索した場合における認識結果リストの具体
例を示す図である。
【0204】順序検索補助データベース282における
使用頻度順位は、音声入力した複合名詞における1単語
目に位置する単名詞「横須賀」は、図20に示すよう
に、420位であり、同2単語目に位置する単名詞「セ
ントラル」は、1250位であり、同3単語目に位置す
る単名詞「ホテル」は、892位である。「セントラ
ル」、「ホテル」は、500位以下であるので、優先認
識対象である単名詞サブ集合Gb2−1、Gb3−1に
は含まれず、最初に認識する対象ではない。
【0205】ところが、逆順検索補助データベース28
3における使用頻度順位は、音声入力した複合名詞にお
ける逆順2単語目に位置する単名詞「セントラル」は、
図21に示すように、9位であり、同逆順1単語目の単
名詞「ホテル」は、1位であるので、逆順単名詞サブ集
合H2−1、H1−1に含まれ、優先認識対象であり、
順序検索する場合よりも、早く認識される。
【0206】図25は、複合名詞の検索装置201にお
いて、順序検索した場合における認識結果と、逆順検索
した場合における認識結果とをマージした場合における
認識結果リストの具体例を示す図である。
【0207】図23に示す順序検索した場合における認
識結果と、図24に示す逆順検索した場合における認識
結果とをマージする(S221)と、図25に示すよう
に、統合された認識結果リストができ上がり、有力構成
名詞候補を選択する。
【0208】複合名詞の検索装置201では、認識尤度
が80以上である単名詞を、有力構成名詞候補と定め、
これによって、図25に示すように、音声入力された単
名詞「横須賀」に対して、「横浜」、「横須賀」の2候
補が有力構成名詞候補として選択され、音声入力された
単名詞「セントラル」に対して、「セントラル」が有力
構成名詞候補として選択され、音声入力された単名詞
「ホテル」に対して、「ホテル」、「ホール」の2候補
が有力構成名詞候補として選択される。
【0209】図26は、複合名詞の検索装置201にお
いて、実在検索語候補リスト作成直前の状態を示す図で
ある。
【0210】検索装置201は、図25に示すマージさ
れた認識結果における有力構成名詞候補を利用し、実在
検索語リスト作成処理を行う(S222)。
【0211】検索装置201は、有力構成名詞候補の全
組み合わせと、検索データベース281に格納されてい
る複合名詞とに基づいて、図26に示すように、実在す
る検索語候補をリストアップする。
【0212】複合名詞の検索装置201では、「横須賀
/セントラル/ホテル」(検索語認識尤度90+95+
95=280)が、実在検索語候補としてリストアップ
される。複合名詞の検索装置201において、検索語認
識尤度は、図26に示すように、各単名詞の認識尤度を
加算する方式で計算する。
【0213】複合名詞の検索装置201において、利用
者210との確認処理のみで検索語確定可能か否かの判
断(S223)の基準は、複合名詞の検索装置201が
予め規定した閾値と上記検索語認識尤度とを比較し、上
記規定した閾値を越える検索語認識尤度を持つ検索語候
補は、「確認処理のみで検索語確定可能な条件を満た
す」と判断する。
【0214】なお、実在検索語候補リストは、検索デー
タベース281に実在する検索語のうちで、利用者21
0に提示し、確認を求める検索語の候補を集めたリスト
である。
【0215】複合名詞の検索装置201では、検索語認
識尤度に対する規定閾値を280と定める。複合名詞の
検索装置201において、検索語認識尤度が280以上
の検索語候補である「横須賀/セントラル/ホテル」が
実在検索語リストから選択され、利用者210に提示さ
れる(S224)。正誤確認に対して利用者210から
肯定を示す応答が得られると(S225)、検索語を確
定することができたとして処理を終了する。
【0216】ところで、検索語である複合名詞を構成す
る単名詞の数が3、4、5、……、8であると仮定した
場合、つまり、最多単名詞数が8であると仮定した場
合、複合名詞の逆順1番目の単名詞(末尾の単名詞)と
して使用される可能性が高い「ホテル」、「銀行」、
「センター」等の単名詞は、複合名詞が3つの単名詞で
構成されていれば、3単語目に位置する単名詞としてカ
ウントされ、複合名詞が4つの単名詞で構成されていれ
ば、4単語目に位置する単名詞としてカウントされるの
で、使用されている「ホテル」、「銀行」、「センタ
ー」の単名詞の99%が、逆順1番目の単名詞(末尾の
単名詞)として使用されているとしても、頻度統計は分
散する。したがって、図20に示すように、「ホテ
ル」、「銀行」、「センター」は、使用頻度の高い優先
認識対象にはならず、このために、迅速な検索が行なわ
れないことが多い。
【0217】ところが、複合名詞の検索装置201にお
いて、末尾から数えた単名詞の位置(逆順番目)毎に頻
度統計をカウントして、逆順検索補助データベース28
2に格納されるので、図21に示すように、末尾から1
番目に使用される頻度が高い単名詞の集合である逆順1
単語目に位置する逆順単名詞集合H1として、「ホテ
ル」、「銀行」、「センター」等が登録され、優先認識
対象となる。また、末尾から2番目に使用される頻度が
高い単名詞の集合である逆順2単語目に位置する逆順単
名詞集合H2として、「セントラル」「グランド」等が
登録される。したがって、複合名詞の検索装置201で
は、短時間で認識動作が実行される。
【0218】また、複合名詞の検索装置201におい
て、実在検索語リスト作成処理(S222)と同時に、
単名詞サブ集合Gbn−2、逆順単名詞サブ集合Hm−
2について、認識処理をスタートするようにしてもよ
い。つまり、検索語候補を利用者210に提示し、確認
を求めている(S224)間に、使用頻度が次に高い単
名詞の範囲で認識を行うと、利用者210から見れば、
認識する動作の合間に、何もせずに待つ必要がなく、認
識動作をしないで、検索語候補が次々と提示されている
ように思える。
【0219】検索装置201からの質問と、この質問に
対する利用者210からの応答とを、1ターンとした場
合、複合名詞の検索装置201では、利用者210との
間で、できる限り少ない対話ターン数で、検索語特定を
実現することができ、これによって、対話時間の減少を
図り、より迅速に検索処理を行うことができる。
【0220】複合名詞の検索装置201における検索の
基本方針は、検索語を単名詞毎に区切って音声入力し、
先頭からの位置を考慮し、単名詞毎に頻度統計の大きい
順に、優先的に認識処理を行い、各単名詞に対する認識
結果を組合わせ、実在する検索語のみを選択することに
よって、認識装置の処理時間と精度の不完全性とを補
い、利用者210にストレスを与えずに検索語を特定す
ることである。
【0221】上記基本方針に加えて、複合名詞の検索装
置201の大きな特徴は、単名詞毎に行なう認識処理と
並行して、検索語である複合名詞の末尾から数えて、1
単語目、2単語目、3単語目、……毎に、頻度統計を調
べ、頻度統計順に並べた逆順検索補助データベース28
3について、音声入力が終了した時点で、優先的に認識
処理を行い、各単名詞に対する認識結果を組合わせ、実
在する検索語のみを選択することによって、認識装置の
処理時間と精度の不完全性とを補い、利用者210にス
トレスを与えずに検索語を特定する点である。
【0222】また、順序検索補助データベース282を
利用した認識結果と、逆順検索補助データベース283
を利用した認識結果とをマージするようにし、これによ
って、認識処理の精度をより向上させることができ、検
索時間をさらに短縮することができる。
【0223】図27は、本発明の第4の実施例の動作を
示すフローチャートである。
【0224】第4の実施例は、順序検索を実行せずに、
逆順検索のみを実行する実施例である。
【0225】図27において、まず、検索語を、単名詞
毎に区切って音声入力することを要求し(S230),
複合名詞を構成する単名詞が、その複数名詞における逆
順で何単語目に位置するかを示す変数mとして、「1」
を設定し、その逆順m単語目に位置する逆順単名詞集合
Gbmを構成する単名詞サブ集合Gbm−qにおける順
番qとして、「1」を設定する(S231)。そして、
「横須賀」、「セントラル」、「ホテル」のそれぞれに
対して、逆順単名詞サブ集合H1−1、逆順単名詞サブ
集合H2−1、逆順単名詞サブ集合H3−1について、
認識処理を行なう(S232、S233)。続いて、単
名詞毎に、認識尤度を対応させて、逆順検索した場合に
おける認識結果リストを作成する(S234)。そし
て、有力構成名詞候補を選出し(S235)、実在検索
語候補リストを作成し(S236)、確認処理のみで検
索語を特定可能な条件を満たせば(S237)、検索語
候補を利用者に提示し(S238)、利用者による応答
がYESであれば(S239)、検索を終了し、一方、
確認処理のみで検索語を特定可能な条件を満たす候補が
存在しなければ(S237)、使用頻度が次に高い逆順
単名詞サブ集合の範囲で認識を行う。
【0226】つまり、上記第4の実施例は、音声入力さ
れた複合名詞における逆順m単語目に位置する単名詞に
ついては、データベースに登録されている各複合名詞の
逆順m単語目(mは整数値)に位置する単名詞の集合で
ある逆順m単語目に位置する単名詞集合の範囲で認識す
る音声入力された複合名詞の検索装置である。
【0227】具体的には、上記第4の実施例は、複数の
単名詞で構成されている複合名詞が検索語として登録さ
れ、しかも、上記検索語が各単名詞に区切られて登録さ
れている検索データベースと、上記登録されている各複
合名詞の逆順m単語目(mは整数値)に位置する単名詞
の集合である逆順m単語目に位置する単名詞集合が、登
録されている逆順検索補助データベースと、利用者が上
記検索語である複合名詞を単名詞毎に音声入力し終わる
と、音声入力された複合名詞の逆順m単語目に位置する
単名詞については、上記逆順m単語目に位置する単名詞
集合の範囲で認識し、上記認識された単名詞である構成
名詞候補と、上記構成名詞候補についての認識尤度との
組が認識尤度順に並べられている逆順認識結果リストを
作成する逆順認識結果リスト作成手段と、上記逆順認識
結果リストを、上記音声入力された単名詞のそれぞれに
ついて作成し、上記逆順認識結果リストに記載されてい
る構成名詞候補のうちで、所定の閾値を超える認識尤度
を具備する構成名詞候補を、逆順有力構成名詞候補とし
て選出する逆順有力構成名詞候補選出手段と、上記逆順
有力構成名詞候補の全組合わせのそれぞれについて、上
記有力構成名詞候補の認識尤度に所定の演算を行なうこ
とによって、検索語認識尤度を算出し、この演算された
検索語認識尤度の大きい順に並べた実在検索語候補リス
トを作成する実在検索語候補リスト作成手段と、上記実
在検索語候補のうちで、上記検索語認識尤度が所定の閾
値以上である実在検索語について、上記利用者との間で
必要な対話を実行し、検索語を確定する検索語候補選定
対話手段とを有する音声入力された複合名詞の検索装置
である。
【0228】なお、上記実施例を、プログラムの実施例
として把握することができる。つまり、上記実施例は、
複数の単名詞で構成されている複合名詞が検索語として
登録され、しかも、上記検索語が各単名詞に区切られて
登録されている検索データベースと、上記登録されてい
る各複合名詞の逆順m単語目(mは整数値)に位置する
単名詞の集合である逆順m単語目に位置する単名詞集合
が、登録されている逆順検索補助データベースとを使用
し、音声入力された複合名詞を検索する手順と、利用者
が上記検索語である複合名詞を単名詞毎に音声入力し終
わると、音声入力された複合名詞の逆順m単語目に位置
する単名詞については、上記逆順m単語目に位置する単
名詞集合の範囲で認識し、上記認識された単名詞である
構成名詞候補と、上記構成名詞候補についての認識尤度
との組が認識尤度順に並べられている逆順認識結果リス
トを作成する逆順認識結果リスト作成手順と、上記逆順
認識結果リストを、上記音声入力された単名詞のそれぞ
れについて作成し、上記逆順認識結果リストに記載され
ている構成名詞候補のうちで、所定の閾値を超える認識
尤度を具備する構成名詞候補を、逆順有力構成名詞候補
として選出する逆順有力構成名詞候補選出手順と、上記
逆順有力構成名詞候補の全組合わせのそれぞれについ
て、上記有力構成名詞候補の認識尤度に所定の演算を行
なうことによって、検索語認識尤度を算出し、この演算
された検索語認識尤度の大きい順に並べた実在検索語候
補リストを作成する実在検索語候補リスト作成手順と、
上記実在検索語候補のうちで、上記検索語認識尤度が所
定の閾値以上である実在検索語について、上記利用者と
の間で必要な対話を実行し、検索語を確定する検索語候
補選定対話手順とをコンピュータに実行させるプログラ
ムの例である。
【0229】また、上記プログラムが記録されている記
録媒体の実施例として、上記実施例を把握することがで
きる。なお、上記記録媒体として、FD、CD、DV
D、HD、半導体メモリ等が考えられる。
【0230】なお、商品配送サービスや、電話番号検索
や郵便番号検索等における入力インタフェース部分にお
いて、上記実施例で行った法人名義の確定作業を、幅広
く適用することができる。
【0231】上記実施例によれば、先頭からの構成順序
のみを考慮するのではなく、末尾に使用される頻度の高
い構成名詞、末尾から2単語目に使用される頻度の高い
構成名詞というように、頻度をカウントすることによっ
て、同じ末尾に使われていても、構成単語数によって、
先頭から数えると異なる単語目にカウントされ、使用頻
度上位単語とは認識されない単語を、優先認識対象と捕
らえることができる。
【0232】なお、上記実施例において、検索語認識尤
度は、図26に示すように、各単名詞の認識尤度を加算
したものであるが、検索語認識尤度を算出する場合、各
単名詞の認識尤度を乗算するようにしてもよい。
【0233】また、実在検索語候補リスト中の検索語候
補における検索語認識尤度が、その閾値(たとえばその
閾値が280であるとする)以上であれば、利用者21
0による確認処理のみで検索語を確定することができ、
逆に、検索語認識尤度が上記閾値未満であれば、利用者
210による確認処理のみで検索語を確定することがで
きない。
【0234】上記のように検索語を確定することができ
ない場合に備えて、単名詞サブ集合Gb2−p、逆順単
名詞サブ集合H2−qの範囲で単名詞の認識、認識尤度
の算出等の処理を、予め実行しておくようにしてもよ
い。すなわち、検索語候補を利用者210にディスプレ
イ等で提示し、確認を求める処理(S224)および利
用者210による応答(S225)と並行して、使用頻
度が次に高い単名詞サブ集合、逆順単名詞サブ集合の範
囲で単名詞の認識、認識尤度の算出(S202、S21
2)、有力構成名詞候補の再選出(S204、S21
4)、実在検索語候補リストの更新(S222)を実行
する。
【0235】このようにすれば、検索装置201の内部
の処理状況を利用者210が一切見ることができないの
で、利用者210には、あたかも、検索データベース2
81に登録されている検索語を一括してしかも非常に高
速で認識処理を行っているかのように見える。
【0236】図28は、本発明の第5の実施例である音
声対話型複合名詞の検索装置301を示すブロック図で
ある。
【0237】この音声対話型複合名詞の検索装置301
は、音声入力部302と、音声認識部303と、音声認
識用ソフトウェア303Sと、音声認識結果出力部30
4と、実在検索語候補リスト作成部305と、対話制御
部306と、音声出力部307と、音声出力用ソフトウ
ェア307Sとによって構成されている。
【0238】音声入力された複合名詞の検索装置301
において、音声入力部302を介して入力された利用者
Pの音声が音声認識部303へ送られ、音声認識部30
3は、入力音声を音声認識処理する際に、システムデー
タベース308を利用する。また、音声認識部303
は、利用者Pによる入力音声について、音声認識用ソフ
トウェア303Sを利用して、認識処理を実行する。
【0239】システムデータベース308は、検索デー
タベース381と、検索補助データベース382と、Y
ES/NOデータベース383とを有する。
【0240】検索データベース381は、複数の単名詞
で構成されている複合名詞が検索語として登録され、し
かも、上記検索語が各単名詞に区切られて登録されてい
るデータベースである。
【0241】検索補助データベース382は、登録され
ている各複合名詞のn番目(nは整数値)に表記されて
いる単名詞の群を、n番目表記の単名詞集合群と呼び、
上記n番目表記の単名詞集合群が、その頻度の高い順に
登録され、しかも、この頻度の高い順に登録されている
単名詞が、その頻度の高い方から順に、所定の数(検索
装置301では500個)毎にまとめられ、複数のサブ
集合群が形成されているデータベースである。
【0242】YES/NOデータベース383は、利用
者Pが応答した内容(たとえば、はい/いいえ、YES
/NO)を認識するデータベースである。
【0243】音声認識用ソフトウェア303Sは、検索
装置301の処理の場面に合わせて、検索データベース
381または検索補助データベース382を、システム
データベース308から選択するものである。
【0244】検索語が音声入力されると、検索補助デー
タベース382を参照し、また、利用者Pへの正誤確認
に対する応答を認識する場合は、YES/NOデータベ
ース383が参照される。
【0245】また、音声認識部303は、音声認識処理
の際に、音声認識用ソフトウェア303Sを使用し、音
声出力部307は、音声出力の際に、音声出力用ソフト
ウェア307Sを使用する。
【0246】音声認識結果出力部304は、利用者が検
索語である複合語を単名詞毎に入力すると、上記複合名
詞のn番目表記の単名詞については、上記n番目表記の
単名詞集合群で認識し、しかも上記n番目表記の単名詞
集合群のうちで、最も頻度が高い単名詞を含む第1サブ
集合群の範囲内で認識処理し、認識尤度を対応させて、
認識結果リストを作成する認識結果リスト作成手段の例
である。
【0247】また、音声認識結果出力部304は、上記
認識処理された単名詞である構成名詞候補と、上記構成
名詞候補についての認識尤度との組が認識尤度順に並べ
られている認識結果リストを、上記音声入力された単名
詞のそれぞれについて作成し、上記認識結果リストに記
載されている構成名詞候補のうちで、所定の第1の閾値
を超える認識尤度を具備する構成名詞候補を、有力構成
名詞候補として選出する有力構成名詞候補選出手段の例
である。
【0248】実在検索語候補リスト作成部305は、実
在検索語リスト作成部351と、部分一致検索語リスト
作成部352とによって構成されている。
【0249】実在検索語リスト作成部351は、音声認
識結果出力部304が出力した音声認識結果に基づい
て、検索データベース381格納されている検索語か
ら、実在検索語を抽出する部分である。
【0250】部分一致検索語リスト作成部352は、上
記検索語を構成する複数の単名詞のうちで一部の単名詞
のみの尤度が上記第1の所定の閾値を超える場合、上記
第1の閾値を超える尤度を具備する上記単名詞を備え、
上記検索語を構成する単名詞と同じ数の単名詞を備えて
いる部分一致検索語候補を、上記検索データベースから
抽出する部分一致検索語候補抽出手段の例である。
【0251】また、対話制御部306は、検索語候補選
定対話部361と、部分一致検索語候補選定対話部36
2とによって構成されている。
【0252】部分一致検索語候補選定対話部362は、
上記抽出された部分一致検索語候補を構成する各単名詞
の尤度を所定の演算方法で演算して部分一致尤度を演算
する部分一致尤度演算手段の例である。なお、上記部分
一致尤度を演算する上記所定の演算方法は、検索装置3
01では、各単名詞の尤度を加算する方法であるが、上
記加算の代わりに、乗算するようにしてもよい。
【0253】音声出力部307は、音声出力用ソフトウ
ェア307Sを使用して、音声出力するものである。
【0254】なお、音声認識部303は、上記演算され
た部分一致尤度が、所定の第2の閾値を超えている上記
部分一致検索語候補について、音声認識処理を行う部分
一致検索語候補用音声認識処理手段の例である。
【0255】次に、検索装置301について、より具体
的に説明する。
【0256】なお、以下の説明では、企業名等、法人名
義を確定するサービスの入力インタフェース部分に、音
声入力された複合名詞の検索装置301が設けられてい
る場合について説明する。
【0257】日本全国の電話帳に掲載されている法人名
義は2200万件も存在し、2200万件の中から1つ
の法人名義を、入力した音声に基づいて、特定するには
相当の時間がかかり、したがって、現行の音声認識技術
では、対話処理実時間(検索装置と利用者Pとがやりと
りする場合、上記利用者Pにストレスまたは不自然さを
感じさせない時間)内で法人名義を認識処理することが
不可能であり、しかも、この場合、非常に似通ったデー
タが多いので、認識精度が非常に低い。
【0258】図29は、検索装置301において、検索
データベース381中の法人名義が複合名詞で構成さ
れ、この複合名詞が、それを構成する単名詞毎に区切っ
て登録されている具体例を示す図である。
【0259】検索データベース381に登録されている
法人名義を構成している各名詞の頻度を調べ、単名詞を
頻度順に記録し、検索補助データベース382を作成す
る。
【0260】なお、上記2200万件の法人名義を構成
する単名詞の総数は、650万種類である。また、法人
名義2,200万件を構成する名詞のうち、1番目表記
の単名詞(法人名義中の第1単語目に位置する単名詞)
の総数は、約360万種類であり、2番目表記の単名詞
(法人名義中の第2単語目に位置する単名詞)の総数
は、約250万種類であり、3番目表記の単名詞(法人
名義中の第3単語目に位置する単名詞)の総数は、約2
70万種類であり、4番目表記の単名詞(法人名義中の
第4単語目に位置する単名詞)の総数は、約100万種
類、…(最長構成単語数7)であり、対話処理実時間内
では、1つの複合名詞に対する各単名詞の認識処理は不
可能であり、精度も低いことが予想される。
【0261】図30は、検索装置301において、検索
補助データベース382に格納されているデータの具体
例を示す図である。
【0262】検索補助データベース382中の単名詞
は、検索データベース381に登録されている複合名詞
を構成する単名詞であり、複合名詞における表記の順番
毎に、単名詞集合群が形成されている。複合名詞におけ
る表記の順番が最初である単名詞だけを集めて、1番目
表記の単名詞集合群Gc1が形成され、1番目表記の単
名詞集合群Gc1において、その使用頻度の高い順に単
名詞が登録され、しかも、これら登録されている単名詞
が、その頻度の高い方から順に、500個の単名詞毎に
まとめられ、複数のサブ集合群が形成され、頻度の高い
順に、第1サブ集合群Gc1−1、第2サブ集合群Gc
1−2、……、第mサブ集合群Gc1−mが形成されて
いる。
【0263】なお、使用頻度が最も高い単名詞を含む第
1サブ集合群Gc1−1は、他のサブ集合群Gc1−
2、……、Gc1−mよりも優先して認識する対象であ
る。
【0264】また、複合名詞における表記の順番が2番
目である単名詞だけを集めて、2番目表記の単名詞集合
群Gc2が形成され、2番目表記の単名詞集合群Gc2
において、その使用頻度の高い順に単名詞が登録され、
しかも、これら登録されている単名詞が、その頻度の高
い方から順に、500個の単名詞毎にまとめられ、複数
のサブ集合群が形成され、頻度の高い順に、第1サブ集
合群Gc2−1、第2サブ集合群Gc2−2、……、第
mサブ集合群Gc2−mが形成されている。
【0265】なお、使用頻度が最も高い単名詞を含む第
1サブ集合群Gc2−1は、他のサブ集合群Gc2−
2、……、Gc2−mよりも優先して認識する対象であ
る。
【0266】以下、上記と同様に、複合名詞における表
記の順番がn番目である単名詞だけを集めて、n番目表
記の単名詞集合群Gcnが形成され、n番目表記の単名
詞集合群Gcnにおいて、その使用頻度の高い順に単名
詞が登録され、しかも、これら登録されている単名詞
が、その頻度の高い方から順に、500個の単名詞毎に
まとめられ、複数のサブ集合群が形成され、頻度の高い
順に、第1サブ集合群Gcn1、第2サブ集合群Gcn
2、……、第nサブ集合群Gcn−mが形成されてい
る。
【0267】なお、使用頻度が最も高い単名詞を含む第
1サブ集合群Gcn−1は、他のサブ集合群Gcn−
2、……、Gcn−mよりも優先して認識する対象であ
る。
【0268】ところで、1つのサブ集合群を構成する名
詞の数をNとすると、検索装置301では、N=500
であり、この数は、次のようにして決められる。つま
り、対話処理実時間(検索装置と利用者Pとがやりとり
する場合、上記利用者Pにストレスまたは不自然さを感
じさせない時間である)内に音声認識用ソフトウェア3
03Sが処理可能な単名詞の数をTとし、検索データベ
ース381に登録されている全検索語の平均単名詞数を
Mとすると、N=T/Mである。
【0269】具体的には、対話処理実時間内に音声認識
用ソフトウェア303Sが処理可能な単名詞の数Tが1
500であるとし、検索データベース381に登録され
ている全検索語の平均単名詞数Mが3であるとすると、
N=T/M=1500/3=500である。
【0270】なお、各サブ集合群Gc1−1、……、G
cn−mのそれぞれを構成する単名詞の数Nは、500
以外の数でもよいが、上記のように、対話処理実時間内
に処理可能な単名詞の数T(音声認識用ソフトウェア3
03Sの性能)と、検索データベース381に登録され
ている検索語が有する単名詞の数の平均Mとによって定
められる。
【0271】次に、検索装置301の動作について説明
する。
【0272】図31は、検索装置301において、検索
語を確定する処理プロセスを具体的に示すフローチャー
トである。
【0273】この前提として、検索データベース38
1、検索補助データベース382が作成されているとす
る。
【0274】まず、検索したい法人名義(複合名詞)
を、単名詞に区切った形で音声入力するように、利用者
Pに要求する(S300)。そして、検索語である複合
名詞に関する各単名詞集合群におけるサブ集合群の関数
(サブ集合群の順位を示す関数)kを1とする。つま
り、サブ集合群の関数k=1であれば、複数のサブ集合
群のうちで、サブ集合群Gc1−1、Gc2−1、Gc
3−1、……を使用して、各単名詞が認識される。
【0275】ここで、複合名詞「横浜/東急/ホテル」
が検索語として音声入力された場合について考える。
【0276】まず、音声入力された単名詞「横浜」、
「東急」、「ホテル」について、それぞれ、1番目表記
の単名詞集合群Gc1中の第1サブ集合群Gc1−1、
2番目表記の単名詞集合群Gc2中の第1サブ集合群G
c2−1、3番目表記の単名詞集合群Gc3中の第1サ
ブ集合群Gc3−1を、使用し、音声認識部303が認
識処理を行う(S301)。つまり、音声入力された単
名詞「横浜」について、第1サブ集合群Gc1−1の範
囲内で認識処理し、音声入力された単名詞「東急」につ
いて、第1サブ集合群Gc2−1の範囲内で認識処理
し、音声入力された単名詞「ホテル」について、第1サ
ブ集合群Gc3−1の範囲内で認識処理する。そして、
音声認識結果出力部304が、その認識結果を出力す
る。
【0277】音声入力された単名詞「横浜」、「東
急」、「ホテル」のうちで、単名詞「横浜」は、図30
に示すように、第1サブ集合群Gc1−1に含まれてお
り、単名詞「ホテル」が、第1サブ集合群Gc3−1に
含まれているとする。ところが、単名詞「東急」の頻度
順位は、図30に示すように、頻度順位951位である
ので、第1サブ集合群Gc2−1には含まれず、第2サ
ブ集合群Gc2−2に含まれている。
【0278】図32は、検索装置301において、音声
入力された検索語(複合名詞)を構成する各単名詞に対
する認識結果と、その認識尤度とが対応している認識結
果リストの具体例を示す図である。
【0279】1つの単名詞が音声入力されると、この音
声入力された単名詞に対する複数の構成名詞候補と、こ
れら複数の構成名詞候補のそれぞれに対する認識尤度と
を、音声認識結果出力部304が出力し、この出力され
た構成名詞候補と認識尤度とを対応させて、認識結果リ
ストを作成する(S301)。このようにして作成され
た認識結果リストの具体例を、図32に示してある。
【0280】たとえば、単名詞「横浜」を音声入力する
と、この入力された音声を、音声認識部303が、図3
2に示すように、「横浜」、「横須賀」、「横溝」、
「横山」、……と認識し、「横浜」の認識尤度が95で
あり、「横須賀」の認識尤度が90であり、「横溝」の
認識尤度が81であり、「横山」の認識尤度が75であ
る。
【0281】なお、各単名詞についての認識尤度は、そ
の単名詞が音声入力されたときに、音声認識用ソフトウ
ェア303Sが、個々に判断する。
【0282】ここで、認識尤度が所定の閾値以上である
構成名詞候補を、有力構成名詞候補とする。なお、検索
装置301では、上記所定の閾値を80とする。つま
り、認識尤度が80以上である構成名詞候補が、有力構
成名詞候補である。上記所定の閾値が80であること
は、データベース81、82を作るときに、予め設定さ
れている。
【0283】そして、図32に示す各認識結果から、認
識尤度が80以上である単名詞を、有力構成名詞候補と
して選択する(S302)。
【0284】この時点で、各検索補助データベース38
2中に、認識処理がまだ終了していない第1サブ集合群
が存在する場合、音声認識部2は、第1サブ集合群に対
する認識処理を再びスタートさせ、音声認識結果出力部
3は、認識結果を出力し、検索語候補リスト作成部30
5へ送る処理を繰り返す。
【0285】検索語候補リスト作成部305において、
実在検索語候補リスト作成部3051は、認識結果に基
づいて、有力構成名詞候補を選択し、有力構成名詞候補
の全ての組み合わせを作成し、検索データベース381
を参照しながら、実在する検索語を抽出した実在検索語
候補リストを作成し(S303)、対話制御部306へ
送る。
【0286】なお、実在検索語候補リストは、検索デー
タベース381に実在している検索語のうちで、利用者
Pに提示し、確認を求める検索語の候補を集めたリスト
である。
【0287】ところで、2番目表記の単名詞「東急」の
頻度順位は、補助データベース82に格納されている2
番目表記の単名詞集合群Gc2において、図29に示す
ように、951位であるので、2番目表記の単名詞集合
群Gc2の第1サブ集合群Gc2−1には、単名詞「東
急」が含まれていない。よって、図32に示す音声入力
された単名詞「東急」に対する認識結果には、単名詞
「東急」が含まれていない。
【0288】したがって、実在検索語候補リストを作成
するステップ(S303)では、実在検索語候補リスト
が作成されない。
【0289】これと同時に、部分一致検索語リスト作成
部352は、部分一致検索語候補における部分一致尤度
を計算し(S331)、部分一致検索語候補を、検索デ
ータベース381から抽出し、対話制御部306へ送
る。
【0290】なお、部分一致検索語候補は、検索語を構
成する複数の単名詞のうちで一部の単名詞のみの尤度が
第1の所定の閾値を超える場合、上記第1の閾値を超え
る尤度を具備する上記単名詞を備え、上記検索語を構成
する単名詞と同じ数の単名詞を備えている検索語候補で
ある。
【0291】また、部分一致尤度は、上記抽出された部
分一致検索語候補を構成する各単名詞の尤度を所定の演
算方法で演算して求めた尤度である。
【0292】対話制御部306は、実在検索語候補と、
上記部分一致検索語候補とを利用して、検索語候補選定
対話を実行する。
【0293】すなわち、実在検索語候補リスト中の検索
語候補が、利用者との確認処理のみで、検索語特定可能
な検索装置の規定条件を満たす場合は、確認処理ガイダ
ンスの出力命令を、音声出力部307へ送る。
【0294】逆に、実在検索語候補リスト中の検索語候
補が、利用者との確認処理のみでは、検索語特定可能な
条件を満たさない場合(S321)、または実在検索語
候補が抽出されない場合は、それら部分一致検索語候補
を利用して、音声入力部1に最初に入力された音声を、
音声認識部303が、再度、音声認識処理し(S33
2)、認識尤度の算出を行う。
【0295】そして、この算出された認識尤度が、利用
者との確認処理のみで検索語特定可能な検索装置の規定
状態を満たす場合(S321)は、確認処理ガイダンス
の出力命令を音声出力部307へ送り、検索語候補を提
示し、利用者Pに確認を求める(S322)。
【0296】確認処理のみで特定可能な検索語候補が、
実在検索語候補からも、部分一致検索語候補を利用した
部分一致検索語処理からも抽出されない場合(S32
1)は、この時点で、認識処理を終了し、使用頻度が次
に高い構成名詞集合群について(S311)、認識処理
の結果得られた有力構成名詞候補を利用し(S312、
S313)、実在検索語候補リストと部分一致検索語リ
ストとを更新し(S314)、検索語候補選定対話と、
部分一致検索語処理とを繰り返す(S315)。
【0297】音声出力部307は、確認処理ガイダンス
出力命令を受けた場合は、利用者に検索語候補と指定さ
れた候補について正誤確認を行うガイダンスを出力す
る。
【0298】そして、確認処理ガイダンスに対する応答
が、音声入力部302から再び入力されると、音声認識
部303は、YES/NOデータベース383を参照
し、利用者の応答を認識し、音声認識結果出力部304
から認識結果を出力し、利用者から、肯定を表す応答を
得ることができた場合(S315)は、検索語特定が完
了した旨を利用者へガイダンスする命令を、対話制御部
306が音声出力部307へ送る。
【0299】検索語が特定できるまで、検索語候補リス
トの更新(S314)と、検索語候補選定対話と、部分
一致検索語処理(部分一致検索語候補を検索データベー
ス381から抽出し、この抽出された部分一致検索語候
補を構成する単名詞の尤度の合計尤度である部分一致尤
度を計算する処理)とを繰り返す。
【0300】検索補助データベース382中の全ての構
成名詞集合群に対する認識処理が終了し、実在検索語候
補リストをそれ以上更新不可能な場合(S315)は、
対話制御部306は、実在検索語候補リストの上位か
ら、検索語候補を利用者に提示するガイダンス出力命令
を、音声出力部307へ送る。
【0301】すなわち、検索装置301は、実在検索語
候補リストの更新と検索語候補選定対話とが行われてい
る間、優先認識対象名詞群以外の構成名詞集合群の少な
くとも1集合(規定数からなる集合1つ分)について、
認識処理が終了しているように構成名詞数を規定する。
【0302】次に、検索装置301の動作をより具体的
に説明する。
【0303】これら有力構成名詞候補を利用して、実在
検索語候補リスト作成処理を行うが、2番目表記の単名
詞にする関する第1サブ集合群Gc2−1については、
「東急」に関する有力構成名詞候補が選択されていない
ので、検索装置301は、第1サブ集合群Gc1−1、
Gc3−1に対する認識処理が終了次第、部分一致検索
処理を行う。
【0304】つまり、1番目の単名詞である1番目表記
の単名詞集合群Gc1中の第1サブ集合群Gc1−1に
おける有力構成名詞候補「横浜」または「横須賀」を、
1番目の単名詞に持つ検索語候補であって、3番目の単
名詞である3番目表記の単名詞集合群Gc3中の第1サ
ブ集合群Gc3−1における有力構成名詞候補「ホテ
ル」または「ホール」を、3番目の単名詞に持つ検索語
候補を、検索データベース381から検索する。
【0305】図33(1)は、検索装置301におい
て、部分一致検索語候補と部分一致尤度との例を示す図
である。
【0306】検索装置301において、「横浜/グラン
ド/ホテル」、「横浜/東急/ホテル」「横浜/東武/
ホテル」、「横須賀/セントラル/ホテル」、「横浜/
セントラル/ホール」、「横浜/グランド/ホール」、
「横浜/音楽/ホール」、「横浜/中央/ホール」、
「横須賀/芸術/ホール」の9候補が、部分一致検索語
候補として、検索されている。
【0307】上記例において、たとえば「横浜/グラン
ド/ホテル」のうちで、「横浜」と「ホテル」とが、図
32に示すように、有力構成名詞候補であり、「グラン
ド」が有力構成名詞候補ではない。つまり、「横浜/グ
ランド/ホテル」のうちで、一部の単名詞のみが有力構
成名詞候補であり、したがって、「横浜/グランド/ホ
テル」は、部分一致検索語候補である。
【0308】また、たとえば「横浜/グランド/ホテ
ル」のうちで、「横浜」の認識尤度が、図32に示すよ
うに95であり、「ホテル」の認識尤度が、図32に示
すように88であり、これら有力構成名詞候補の各認識
尤度を加算した値(95+88=183)である183
が部分一致尤度である。
【0309】検索装置301において、部分一致尤度に
おける閾値(第2の閾値)が、130であるとする。
【0310】そして、これら9候補を認識対象として、
最初の入力検索語に対する音声認識処理を、音声認識部
303において、再度、実行する。
【0311】この結果、図33(2)に示すように、
「横浜/東急/ホテル」、「横浜/東武/ホテル」の検
索語認識尤度が、それぞれ、95、81であり、上記閾
値(第2の閾値)である80を超え、したがって、「横浜
/東急/ホテル」、「横浜/東武/ホテル」が検索語候
補として抽出さる。上位から提示確認を行うことによっ
て、検索語特定が完了する。
【0312】検索装置301において、上記部分一致検
索語処理の結果について、利用者との確認処理のみで検
索語確定可能か否かの判断基準は、複合名詞検索装置が
予め規定した閾値と、検索語認識尤度とを比較し、再認
識された結果についての閾値(第3の閾値)が80であ
るとした場合、第3の閾値80を越える検索語認識尤度
を持つ検索語候補が、確認処理のみで検索語確定可能な
条件を満たすと判断する。
【0313】したがって、検索装置301において、再
認識後において、確認処理のみで検索語確定可能な条件
を満たす検索語候補は、図33(2)に示すように、
「横浜/東急/ホテル」、「横浜/東武/ホテル」であ
る。
【0314】検索装置301では、実在検索語リスト作
成処理、検索語候補選定対話を行っている間を利用し
て、残りの構成名詞について認識処理するだけでなく、
部分一致尤度を利用した部分一致検索語処理を行う。
【0315】部分一致検索語処理の結果、算出した部分
一致尤度を利用して、検索語候補選定対話を行う。規定
閾値(第3の閾値)を超える部分一致尤度を有する検索語
候補が存在しない場合、または、部分一致検索語処理の
結果、選定される検索語候補が存在しない場合は、第2
サブ集合群について認識した結果を利用した実在検索語
リスト作成処理、検索語候補選定対話を続ける。これと
同時に、有力構成名詞リストを更新しながら、部分一致
検索語処理、その結果に対する検索語候補選定対話を繰
り返す。
【0316】検索装置301において、第2サブ集合群
Gc2−2に単名詞「東急」が含まれているので、第2
サブ集合群について認識した結果を利用した実在検索語
リスト作成処理を行うと、選定される検索語候補が存在
するようになる。一方、部分一致検索語処理の結果、算
出した部分一致尤度を利用して、検索語候補選定対話を
行い、規定閾値(第3の閾値)を超える部分一致尤度を有
する検索語候補が存在するようになる。この場合、これ
ら2つの結果をマージするようにしてもよい。
【0317】検索装置301は、構成順序毎の構成名詞
の集合群に対する認識結果に基づいて実在検索語リスト
作成処理を行う際、同時に、検索装置が予め定めた条件
を満たす有力構成名詞候補における部分的な情報を利用
した部分一致検索語リストの作成処理を行う。すなわ
ち、有力構成名詞候補を利用して部分一致尤度を算出
し、規定閾値以上の部分一致尤度を有する検索語を抽出
し、この抽出された検索語を、認識対象と定め、最初に
入力された検索語の認識処理を、再度実行し、認識尤度
を算出する。
【0318】算出された認識尤度が、利用者との確認処
理のみで検索語を特定することができる条件を満たすと
判断できる場合は、検索語候補選定対話を行う。規定閾
値以上の部分一致尤度を有する検索語候補が存在しない
場合、または、検索語候補選定対話の結果、選定される
検索語候補が存在しない場合は、残りの各第n構成名詞
集合群について認識処理した結果、更新された有力構成
名詞候補を利用し、実在検索語リスト作成処理と、検索
語候補選定対話と、部分一致検索語処理と、検索語候補
選定対話とを繰り返す。
【0319】このように、構成名詞の部分的情報を利用
することによって、各構成名詞の偏りに左右されずに、
正確かつ迅速に、検索処理を実行することができるとこ
ろで、実際には、検索語を構成する各単名詞の全てが高
頻度であることが少なく、また、検索語を構成する各単
名詞の全てが低頻度であることが少なく、頻度に偏りが
ある場合が多く、各単名詞のうちで、高頻度で使用され
る単名詞は、第1サブ集合群に設定されるので、最初の
認識処理結果で出力されるが、使用頻度の低い単名詞
は、その単語が含まれるサブ集合群についての認識処理
が行われるまで、認識結果として出力されないので、規
定閾値以上の尤度を有する各構成名詞候補の組み合わせ
を作成し、実在する検索語候補を抽出しても、正解は存
在しない。
【0320】そこで、検索装置301では、全部を認識
対象に定めて実時間内に正しく認識処理することが不可
能である大語彙検索語の中から、部分的に有力構成名詞
を含む検索語を、部分一致検索語候補として検索データ
ベース381から抽出することによって、有力候補を絞
込むことができる。この絞込みによって、利用者を待機
させることなく、検索処理が可能になる。
【0321】つまり、検索装置301によれば、単名詞
の部分的情報を併用することによって、正解検索語を絞
り込み、さらに、認識精度を認識速度とを向上させるこ
とができる。
【0322】図31に示すフローチャートにおいて、ス
テップS303の後に、ステップS321に進むルート
とは別に、ステップS311に進むルートと、ステップ
S331に進むルートとが破線で示されている。これ
は、ステップS321〜S323のルーチンと、ステッ
プS311〜S315のルーチンと、ステップS33
1、S332のルートとが並行処理されるという意味で
ある。
【0323】また、検索装置301を、プログラムの発
明として把握することができる。
【0324】つまり、検索装置301は、検索語を構成
する複数の単名詞のうちで一部の単名詞のみの尤度が第
1の所定の閾値を超える場合、上記第1の閾値を超える
尤度を具備する上記単名詞を備え、上記検索語を構成す
る単名詞と同じ数の単名詞を備えている部分一致検索語
候補を、検索データベースから抽出する部分一致検索語
候補抽出手順と、上記抽出された部分一致検索語候補を
構成する各単名詞の尤度を所定の演算方法で演算して部
分一致尤度を計算する部分一致尤度計算手順と、上記計
算された部分一致尤度が、所定の第2の閾値を超えてい
る検索語候補について、音声認識処理を行う部分一致検
索語候補用音声認識処理手順とをコンピュータに実行さ
せるプログラムの例である。
【0325】また、検索装置301は、複数の単名詞で
構成されている複合名詞が検索語として登録され、しか
も、上記検索語が各単名詞に区切られて登録されている
検索データベースと、上記登録されている各複合名詞の
n番目(nは整数値)に表記されている単名詞の群を、
n番目表記の単名詞集合群と呼び、上記n番目表記の単
名詞集合群が、その頻度の高い順に登録され、しかも、
この頻度の高い順に登録されている単名詞が、その頻度
の高い方から順に、所定の数毎にまとめられ、複数のサ
ブ集合群が形成されている検索補助データベースとを使
用して、複合名詞を検索するプログラムであって、利用
者が上記検索語である複合語を単名詞毎に入力すると、
上記複合名詞のn番目表記の単名詞については、上記n
番目表記の単名詞集合群で認識し、しかも上記n番目表
記の単名詞集合群のうちで、最も頻度が高い単名詞を含
む第1サブ集合群の範囲内で認識処理し、認識尤度を対
応させて、認識結果リストを作成する認識結果リスト作
成手順と、上記認識処理された単名詞である構成名詞候
補と、上記構成名詞候補についての認識尤度との組が認
識尤度順に並べられている認識結果リストを、上記音声
入力された単名詞のそれぞれについて作成し、上記認識
結果リストに記載されている構成名詞候補のうちで、所
定の第1の閾値を超える認識尤度を具備する構成名詞候
補を、有力構成名詞候補として選出する有力構成名詞候
補選出手順と、上記検索語を構成する複数の単名詞のう
ちで一部の単名詞のみの尤度が上記第1の所定の閾値を
超える場合、上記第1の閾値を超える尤度を具備する上
記単名詞を備え、上記検索語を構成する単名詞と同じ数
の単名詞を備えている部分一致検索語候補を、上記検索
データベースから抽出する部分一致検索語候補抽出手順
と、上記抽出された部分一致検索語候補を構成する各単
名詞の尤度を所定の演算方法で演算して部分一致尤度を
演算する部分一致尤度演算手順と、上記演算された部分
一致尤度が、所定の第2の閾値を超えている上記部分一
致検索語候補について、音声認識処理を行う部分一致検
索語候補用音声認識処理手順とをコンピュータに実行さ
せるプログラムの例である。
【0326】なお、商品配送サービスや、電話番号検索
や郵便番号検索等における入力インタフェース部分にお
いて、検索装置301で行った法人名義の確定作業を、
幅広く適用することができる。
【0327】図34は、本発明の第6の実施例である音
声対話型音声対話型検索装置401を示すブロック図で
ある。
【0328】この音声対話型検索装置401は、音声入
力部402と、音声識別部403と、対話制御部404
と、音声出力部405と、音声出力用ソフトウェア40
5Sと、音声認識装置406と、システムデータベース
408とによって構成されている。
【0329】音声識別部403は、音声認識部431
と、認識結果調整部432とによって構成されている。
【0330】音声識別部403では、音声認識装置40
6を使用し、音声出力部405では、音声出力用ソフト
ウェア405Sを使用している。また、音声識別部40
3での入力音声に対する音声認識処理と、対話制御部4
04とは、システムデータベース408を使用する。
【0331】システムデータベース408は、検索対象
である検索情報を記録した検索情報データベース48
1、拍データベース482,YES/NOデータベース
483によって構成されている。
【0332】図35は、音声対話型検索装置401で使
用されている検索情報データベース481の全体像の一
例を示す図である。
【0333】検索情報データベース481には、検索対
象である検索情報そのものが記録されている。
【0334】第36図は、音声対話型検索装置401で
使用されている拍データベース482の一例を示す図で
ある。
【0335】拍データベース482には、検索対象であ
る検索情報を、所定の方法で、先頭拍、2番目拍、3番
目拍、……と、分割する。そして、先頭拍だけを取り出
し、この取り出された先頭拍を、使用頻度順に並べ、各
先頭拍に続く2番目拍を、使用頻度の高い順に並べ、各
2番目拍に続く3番目拍を、使用頻度の高い順に並べ、
これら並べた拍を、拍データベース482に格納する。
【0336】対話処理実時間内に処理することができな
い大語彙によって検索情報データベース481が構成さ
れている場合、拍データベース482を構成する各拍に
ついて、所定の対話処理実時間内に処理可能な数とし
て、所定の数を定める。
【0337】音声識別部403では、音声認識装置40
6を用いて、ユーザ入力について、認識処理する。音声
認識装置406は、検索装置の処理の場面に合わせて、
認識対象とするデータベースを、システムデータベース
408から選択する。すなわち、ユーザが検索情報入力
した場合、拍データベース482を参照し、候補の提示
に対してユーザが応答した場合に、YES/NOデータ
ベース483を参照する。
【0338】利用者が、検索対象である検索情報を入力
すると、この入力された検索情報が、音声識別部403
に送られる。音声識別部403では、音声認識部431
が、拍データベース482に格納されている先頭拍につ
いて認識処理し、この認識処理結果を、認識結果調整部
432へ送る。認識結果調整部432は、先頭拍の認識
結果に基づいて、所定のスコア以上のスコアを有する先
頭拍である有力先頭拍を抽出し、音声識別部403へ情
報を送付する。
【0339】音声認識部431は、2番目拍認識対象
に、上記各有力先頭拍に繋がる頻度が高い2番目拍の候
補を、優先的に認識処理し、これと同様に、3番目拍、
4拍目、……と、最後の拍まで、認識結果調整部432
との間で情報やりとりをしながら、候補を絞込む。
【0340】対話制御部404は、送られてきた認識結
果に対して、各拍の認識結果スコアを加算する等によっ
て、トータルスコアを算出し、この算出されたトータル
スコアが、利用者が確認処理するのみで確定可能である
スコアに達していると、検索装置401が判断すれば、
ユーザに提示確認を行うように、音声出力部2に命令す
る。
【0341】そして、上記提示に対する正誤の応答の入
力を、ユーザに求め、Yesという応答が認識できた時
点で、検索は成功になる。
【0342】確認処理するに値しないと判断された場
合、音声識別部403に保管されている各拍の認識結果
に基づいて、先頭拍のうちで、認識スコアの高い順に、
提示するために、音声出力部405に、先頭拍候補の提
示を指示する。
【0343】先頭拍の提示に対する正誤の応答の入力を
求め、Yesという応答が認識できたら、音声識別部4
03は、確定した先頭拍に続く2番目拍について、使用
頻度の高い順に、優先的に認識処理し、上記と同様に、
2番目拍を確定しというように、順次認識対象を絞込み
ながら、検索対象である検索情報を確定する。
【0344】提示確認に対するユーザの応答の際、音声
認識部431は、YES/NOデータベース483を認
識対象として、ユーザ応答を認識する。
【0345】次に、個人姓の確定をタスクとする入力イ
ンタフェースに、音声対話型検索装置401を適用した
場合における情報検索動作について、具体的に説明す
る。
【0346】この場合における検索情報は、個人姓であ
る。日本全国の個人姓の種類は、18万種類存在する。
【0347】図37は、音声対話型検索装置401にお
ける検索情報データベース481の具体例を示す図であ
る。
【0348】この具体例において、個人姓を、拍で分割
する場合、姓を漢字表記したときに、漢字1文字の読み
を1拍と数えるようにして分割する。
【0349】図38は、音声対話型検索装置401にお
ける拍データベース482の一例を示す図である。
【0350】先頭拍の種類数は、3000種類あり、使
用頻度の高い順に、拍データベース482に格納され、
第39図に示すように、先頭拍のそれぞれについて、そ
れに続く2番目拍を、使用頻度の高い順に格納し、これ
と同様に、2番目拍のそれぞれについて、2番目拍に続
く3番目拍を、使用頻度の高い順に格納し、……という
ようにして、拍データベース482を作成する。
【0351】ところで、音声認識技術の現状は、個人姓
18万件について一括認識処理すると、膨大な認識処理
時間を必要とし、また、非常に似通った姓が多く存在す
るので、認識精度が非常に低い。特に、18万件の認識
対象数について、利用者が不自然を感じない時間内に認
識処理を終了し、ある程度の精度を持った応答を返すこ
とは、不可能であることが知られている。
【0352】音声対話型検索装置401において、音声
入力された検索情報について、認識した各拍の結果から
有力候補を抽出する場合、認識スコアと閾値とを比較
し、閾値を越える認識スコアを持つ候補を、有力候補と
定める。これと同様に、ユーザが確認処理するのみで検
索情報を特定することが可能であるか否かを判断する場
合、検索対象である検索情報について計算されたトータ
ルスコアが、閾値を超えれば、ユーザが確認処理するの
みで検索情報を特定することが可能であると判断する。
【0353】次に、音声対話型検索装置401につい
て、より具体的に説明する。
【0354】図39は、音声対話型検索装置401にお
ける検索情報を確定する動作を示すフローチャートであ
る。
【0355】ユーザが「まつもと」を音声入力し(S4
01)、この音声入力された「まつもと」を、確定する
場合の動作について説明する。
【0356】ユーザによる音声入力について、拍データ
ベース482中の先頭拍候補を、使用頻度の高い順に、
優先的に認識処理する(S402)。
【0357】図40は、音声対話型検索装置401にお
いて、ユーザが音声入力した検索情報を構成する先頭拍
に対応する拍データベース482中の先頭拍候補を、使
用頻度の高い(スコアが多い)順に並べ、この並べられ
た先頭拍候補のうちで、所定の数の先頭拍を、優先的に
認識処理し、この認識理結果を示す図である。
【0358】ここで、有力先頭拍としての閾値が80で
あると定めた場合、「ます」、「まつ」、「まさ」が、
有力先頭拍として抽出される(S403)。
【0359】これら各有力先頭拍に繋がる2番目拍候補
を認識対象とし(S404)、上記2番目拍候補を、使
用頻度の高い(スコアが多い)順に並べ、この並べられ
た2番目拍候補のうちで、所定の数の2番目拍を、優先
的に認識処理する(S405)。
【0360】音声対話型検索装置401において、抽出
された2番目拍候補を、図38に示してある。
【0361】先頭拍候補(1番目拍)である「ます」に
繋がり、頻度が最も高い2番目拍候補が「だ」であり、
最優先順位であり、2番目の先頭拍候補である「まつ」
に繋がり、頻度が最も高い2番目拍候補が「もと」であ
り、3番目の先頭拍候補である「まさ」に繋がり、頻度
が最も高い2番目拍候補が「もと」であり、先頭拍候補
である「ます」に繋がり、頻度が2番目に高い2番目拍
候補が「た」であり、先頭拍候補である「まつ」に繋が
り、頻度が2番目に高い2番目拍候補が「ざか」であ
り、……というように、2番目拍候補に対する認識処理
を行う。
【0362】そして、音声入力された検索情報の終端ま
で認識されていない場合、続けて認識処理を実行する
(S406)。
【0363】図41は、音声対話型検索装置401にお
いて、先頭拍有力候補の認識結果であるスコアと、2番
目拍候補の認識結果であるスコアとの統合結果(トータ
ルスコア)を示す図である。
【0364】これらの結果が、対話制御部404へ送ら
れ、先頭拍のスコアと2番目拍のスコアとのトータルス
コアを算出し(S407)、確認処理のみで確定可能で
あるか否かを判断する(S411)。上記例において
は、各拍の認識スコアを加算してトータルスコアを求
め、ユーザが確認処理するのみで検索情報の確定が可能
であると判断する閾値を160と定め、トータルスコア
が上記閾値160を超えている検索情報候補を抽出す
る。
【0365】この結果、検索情報候補「まつもと」、
「まさもと」、「まつのと」、……のうちで、閾値16
0を超える検索情報候補は、「まつもと」1候補であ
り、この検索情報候補「まつもと」について、ユーザに
確認提示を行う(S412)。ユーザから、Yesの応
答が得られると(S413)、検索、確定が終了する。
【0366】音声対話型検索装置401によれば、検索
情報を構成する拍の使用頻度を考慮し、しかも、その拍
同士の繋がりやすさを考慮しているので、認識対象が大
語彙である場合でも、実時間内に処理可能である。ま
た、ユーザにとって許容範囲と思われる精度を持った応
答が可能な認識対象数づつ、認識処理を並行して行う
(S421〜S427、S431)ことによって、待機
時間によるユーザのストレス、誤認識によるユーザのス
トレスが軽減される。
【0367】個人姓は、非常に種類数が多く、似通った
候補が多いが、この個人姓の認識は、コールセンタ受付
け業務や、商品配送サービス等、幅広くカスタマケア全
般で利用可能である。
【0368】音声対話型検索装置401は、認識対象語
彙である検索情報を拍毎に分解し、拍毎に認識処理を施
し、その際、全ての拍を均一に扱うのではなく、使用頻
度の高い拍は、より発話される可能性が高いという予測
のもとに、使用頻度の高いものほど優先して認識し、こ
の場合、優先する方法としては認識結果に対して重み付
けをする等の方法が考えられる。
【0369】加えて、拍同士の接続可能性と接続頻度と
を利用して2番目拍、3番目拍に対しては、1つ前の拍
毎に、次に繋がる拍のみを使用頻度の高い順に並べ、認
識処理を前方拍から順に行うことによって、1つ前の拍
に対する認識結果に基づいて、有力先頭拍として抽出さ
れた先頭拍に対して記録された2番目拍のみを、使用頻
度の高い順に優先順位をつけ、認識対象と定め、認識処
理を行い、同様に3番目拍、4番目拍、……、のよう
に、最後の拍まで認識処理を続ける。
【0370】万が一、前方拍の有力候補抽出を誤り、正
解候補を導けない場合は、前方拍より順に確定すること
によって、拍の階層構造を利用した絞込み対話を進める
機能を持ち、検索情報そのものを認識処理するよりも、
性能良く効率的に、候補を絞込むことが期待できる。
【0371】また、検索情報データベースが、対話処理
実時間内に処理不可能な大語彙から構成される場合は、
実時間内に処理可能であり、しかも、ユーザにとって許
容可能な精度をもった応答を返すことが可能な、予め規
定された対象数を、使用頻度の高い順に優先認識対象と
定め、認識処理する。
【0372】有力先頭拍候補が抽出できたら、それに繋
がる2番目拍に対して、実時間内処理可能な規定数を優
先認識対象と定め認識処理を行い、同様に3番目、4番
目の拍に対して認識処理を進め、トータルスコアを計算
する、優先認識対象先頭拍に対する認識処理が終了した
時点で、残りの使用頻度の高い先頭拍から実時間内に処
理可能な規定数に対して認識処理をスタートさせる、そ
こから新たに有力先頭拍候補が抽出された場合は、それ
に繋がる2番目拍、3番目拍に対して、処理を続ける。
【0373】トータルスコアが算出できた時点で、ユー
ザが確認処理するのみで確定が可能であると判断できる
候補が存在すれば、提示確認を行い、ユーザが確認処理
するのみで確定が可能であると判断できる候補が存在し
ない場合は、その時点で、次に使用頻度が高い各拍の認
識対象リストに対する認識処理結果が、並行処理(S4
21〜S425)によって出ているはずであるので、そ
のトータルスコアを見て(S426)、確定処理をする
か否かを判断し(S411)、確定できるまで繰返す
(S431)ことによって、目的情報の確定を行う認識
エンジンの精度を、検索方法によって補う音声対話型情
報検索装置である。
【0374】ユーザには、システム内部の処理状態が一
切見えず、検索情報データベース中の検索情報に対し
て、一様に音声認識処理が行われ、結果が提示されるの
と何ら変わりはない。したがって、ユーザに、不自然さ
とストレスとを感じさせずに、適切な時間内に、入力さ
れた検索情報に対して認識処理を行い、確度の高い精度
で認識結果を提示することができる。
【0375】なお、拍の切り出し方には、次の方法があ
る。つまり、上記検索情報を平仮名表記した場合におけ
る平仮名1文字を1拍とする切り出し方(拗音(ッャ、
ュ、ョ)、撥音、長音は前の平仮名と合わせて1拍と数
える)、上記検索情報を平仮名表記した場合に、先頭か
ら順に、所定の平仮名文字数毎に、1拍とする切り出し
方(拗音、撥音、長音は、前の平仮名と合わせて1文字
と数える)、構成平仮名数に応じて、1拍を構成する文
字数を規定する切り出し方(たとえば、4文字からなる
検索情報は、先頭から2文字毎に1拍と数え、3文字か
らなる検索情報は、先頭から1文字毎に1拍と数える
等)、上記検索情報を漢字表記した場合に、漢字1文字
の読みを1拍とする切り出し方があるつまり、音声対話
型検索装置401は、検索対象である検索情報が格納さ
れている検索情報データベースと、上記検索情報データ
ベースに格納されている検索情報を分解して切り出され
た拍のうちで、上記各検索情報の先頭を構成する拍であ
る先頭拍が、上記検索情報データベースの中で使用され
ている頻度順に格納され、上記先頭拍に続く拍について
も、使用頻度順に格納されている拍データベースと、ユ
ーザが検索情報を音声入力すると、上記拍データベース
中の先頭拍について、上記検索情報データベースにおけ
る使用頻度の高い拍から、優先的に認識処理する認識処
理手段と、上記先頭拍を認識した結果、利用者が入力し
た拍である可能性が高い有力先頭拍であると判断した場
合、上記有力先頭拍に繋がり、使用頻度が高い拍から、
優先的に認識処理し、有力2番目拍を抽出し、上記検索
情報を構成する最後の拍まで、認識処理を繰返す認識処
理繰り返し手段と、全ての拍に対する認識処理が終了し
た時点で、出力された検索情報毎に、トータルスコアを
計算するトータルスコア計算手段と、ユーザが確認処理
するのみで上記検索情報を特定できる条件を、上記トー
タルスコアが満たす場合、ユーザとの間で必要な対話を
行い、上記検索情報を確定する対話手段とを有する音声
対話型情報検索装置の例である。
【0376】この場合、先頭拍と2番目拍とについて認
識処理した結果、ユーザが確認処理するのみで上記検索
情報を特定できる上記条件を、上記トータルスコアが満
たさない場合、2番目拍の認識結果と3番目拍の認識結
果とを統合している間に、残りの各拍について、使用頻
度の高い順に、実時間内に処理可能な数を認識対象と定
め、先頭拍から順に並行処理する並行処理手段を有す
る。
【0377】また、この場合、上記並行処理手段は、ユ
ーザが確認処理する場合、確認処理の質疑応答時間内に
残りの対象について並行処理を行う手段である。しか
も、ユーザが確認処理しない場合、認識処理に要する時
間を考慮して、認識対象として選択する各拍数を決定す
る。
【0378】また、音声対話型検索装置401は、検索
情報データベースに格納されている検索情報を分解して
切り出された拍のうちで、上記各検索情報の先頭を構成
する拍である先頭拍が、検索情報データベースの中で使
用されている頻度順に格納され、上記先頭拍に続く拍に
ついても、使用頻度順に格納されている拍データベース
中の先頭拍について、検索情報データベースにおける使
用頻度の高い拍から、優先的に認識処理する認識処理手
段と、上記先頭拍を認識した結果、利用者が入力した拍
である可能性が高い有力先頭拍であると判断した場合、
上記有力先頭拍に繋がり、使用頻度が高い拍から、優先
的に認識処理し、有力2番目拍を抽出し、上記検索情報
を構成する最後の拍まで、認識処理を繰返す認識処理繰
り返し手段と、全ての拍に対する認識処理が終了した時
点で、出力された検索情報毎に、トータルスコアを計算
するトータルスコア計算手段と、ユーザが確認処理する
のみで上記検索情報を特定できる条件を、上記トータル
スコアが満たす場合、ユーザとの間で必要な対話を行
い、上記検索情報を確定する対話手段とを有する音声対
話型情報検索装置の例である。
【0379】さらに、拍データベース482は、検索情
報の先頭に位置している拍である先頭拍が、使用頻度の
高い順に並べられている先頭拍群と、上記先頭拍のそれ
ぞれについて、上記先頭拍の次に繋がる拍である2番目
拍が、使用頻度の高い順に並べられている2番目拍群
と、上記2番目拍のそれぞれについて、上記2番目拍の
次に繋がる拍である3番目拍が、使用頻度の高い順に並
べられている3番目拍群とを有する拍データベースの例
である。
【0380】これを、方法の発明として把握すれば、検
索情報の先頭に位置している拍である先頭拍を、使用頻
度の高い順に並べる段階と、上記先頭拍のそれぞれにつ
いて、上記先頭拍の次に繋がる拍である2番目拍を、使
用頻度の高い順に並べる段階と、上記2番目拍のそれぞ
れについて、上記2番目拍の次に繋がる拍である3番目
拍を、使用頻度の高い順に並べる段階とを有する拍デー
タベース作成方法である。
【0381】そして、音声対話型検索装置401をプロ
グラムの発明として把握することができる。つまり、検
索情報データベースに格納されている検索情報を分解し
て切り出された拍のうちで、上記各検索情報の先頭を構
成する拍である先頭拍が、検索情報データベースの中で
使用されている頻度順に格納され、上記先頭拍に続く拍
についても、使用頻度順に格納されている拍データベー
ス中の先頭拍について、検索情報データベースにおける
使用頻度の高い拍から、優先的に認識処理する認識処理
手順と、上記先頭拍を認識した結果、利用者が入力した
拍である可能性が高い有力先頭拍であると判断した場
合、上記有力先頭拍に繋がり、使用頻度が高い拍から、
優先的に認識処理し、有力2番目拍を抽出し、上記検索
情報を構成する最後の拍まで、認識処理を繰返す認識処
理繰り返し手順と、全ての拍に対する認識処理が終了し
た時点で、出力された検索情報毎に、トータルスコアを
計算するトータルスコア計算手順と、ユーザが確認処理
するのみで上記検索情報を特定できる条件を、上記トー
タルスコアが満たす場合、ユーザとの間で必要な対話を
行い、上記検索情報を確定する対話手順とをコンピュー
タに実行させるプログラムとして把握することができ
る。
【0382】また、検索情報の先頭に位置している拍で
ある先頭拍を、使用頻度の高い順に並べる手順と、上記
先頭拍のそれぞれについて、上記先頭拍の次に繋がる拍
である2番目拍を、使用頻度の高い順に並べる手順と、
上記2番目拍のそれぞれについて、上記2番目拍の次に
繋がる拍である3番目拍を、使用頻度の高い順に並べる
手順とをコンピュータに実行させるプログラムとして把
握することができる。
【0383】さらに、上記プログラムを、FD、CD、
MD、DVD、HD、光ディスク、光磁気ディスク、半
導体メモリ等の記録媒体に記録するようにしてもよい。
【0384】
【発明の効果】本発明によれば、利用者を待機させるこ
となく、しかも、存在確率の高い検索語順に、認識結果
を抽出することができるという効果を奏する。
【図面の簡単な説明】
【図1】本発明の第1の実施例である音声入力された複
合名詞の検索装置1を示すブロック図である。
【図2】検索データベース81中の法人名義が複合名詞
で構成され、この複合名詞が、それを構成する単名詞毎
に区切って登録されている具体例を示す図である。
【図3】検索装置1において、検索補助データベース8
2の具体例を示す図である。
【図4】検索装置1において、検索語を確定する処理プ
ロセスを具体的に示すフローチャートである。
【図5】検索装置1において、音声入力された検索語
(複合名詞)を構成する各単名詞に対する認識結果と、
その認識尤度とが対応している認識結果リストの具体例
を示す図である。
【図6】検索装置1において、実在検索語候補リスト作
成の様子を示す図である。
【図7】検索装置1において、更新された認識結果リス
トの具体例を示す図である。
【図8】検索装置1において、実在検索語候補リストを
作成する処理を実行した結果、得られる実在検索語候補
リストを示す図である。
【図9】検索装置1における検索データベース81を一
般的に示す図である。
【図10】検索補助データベース82を一般的に示す図
である。
【図11】本発明の第2の実施例である音声入力された
複合名詞の検索装置101を示すブロック図である。
【図12】検索データベース181中の法人名義が複合
名詞で構成され、この複合名詞が、それを構成する単名
詞毎に区切って登録されている具体例を示す図である。
【図13】第2の実施例において、検索補助データベー
ス182の具体例を示す図である。
【図14】第2の実施例において、検索語を確定する処
理プロセスを具体的に示すフローチャートである。
【図15】第2の実施例において、音声入力された検索
語(複合名詞)を構成する各単名詞に対する認識結果
と、その認識尤度とが対応している認識結果リストの具
体例を示す図である。
【図16】第2の実施例において、更新された認識結果
リストの具体例を示す図である。
【図17】第2の実施例において、実在検索語候補リス
ト作成の様子を示す図である。
【図18】本発明の第3の実施例である音声入力された
複合名詞の検索装置201を示すブロック図である。
【図19】複合名詞の検索装置201において、検索デ
ータベース281中の法人名義が複合名詞で構成され、
この複合名詞が、それを構成する単名詞毎に区切って登
録されている具体例を示す図である。
【図20】複合名詞の検索装置201における順序検索
補助データベース282の具体例を示す図である。
【図21】複合名詞の検索装置201における逆順検索
補助データベース283の具体例を示す図である。
【図22】複合名詞の検索装置201における検索語確
定の処理プロセスを示すフローチャートである。
【図23】複合名詞の検索装置201において、順序検
索した場合における認識結果リストの具体例を示す図で
ある。
【図24】複合名詞の検索装置201において、逆順検
索した場合における認識結果リストの具体例を示す図で
ある。
【図25】複合名詞の検索装置201において、順序検
索した場合における認識結果と、逆順検索した場合にお
ける認識結果とをマージした場合における認識結果リス
トの具体例を示す図である。
【図26】複合名詞の検索装置201において、実在検
索語候補リスト作成直前の状態を示す図である。
【図27】本発明の第4の実施例の動作を示すフローチ
ャートである。
【図28】本発明の第5の実施例である音声対話型複合
名詞の検索装置301を示すブロック図である。
【図29】検索装置301において、検索データベース
381中の法人名義が複合名詞で構成され、この複合名
詞が、それを構成する単名詞毎に区切って登録されてい
る具体例を示す図である。
【図30】検索装置301において、検索補助データベ
ース382に格納されているデータの具体例を示す図で
ある。
【図31】検索装置301において、検索語を確定する
処理プロセスを具体的に示すフローチャートである。
【図32】検索装置301において、音声入力された検
索語(複合名詞)を構成する各単名詞に対する認識結果
と、その認識尤度とが対応している認識結果リストの具
体例を示す図である。
【図33】検索装置301において、部分一致検索語候
補と部分一致尤度との例と、再認識結果の例とを示す図
である。
【図34】本発明の第6の実施例である音声対話型検索
装置401である音声対話型音声対話型検索装置401
を示すブロック図である。
【図35】音声対話型検索装置401で使用されている
検索情報データベース481の全体像の一例を示す図で
ある。
【図36】音声対話型検索装置401で使用されている
拍データベース482の一例を示す図である。
【図37】音声対話型検索装置401における検索情報
データベースの具体例を示す図である。
【図38】音声対話型検索装置401において、拍デー
タベース482に格納されている拍の例を示す図であ
る。
【図39】音声対話型検索装置401における検索情報
を確定する動作を示すフローチャートである。
【図40】音声対話型検索装置401において、ユーザ
が音声入力した検索情報を構成する先頭拍に対応する拍
データベース482中の先頭拍候補を、使用頻度の高い
(スコアが多い)順に並べ、この並べられた先頭拍候補
のうちで、所定の数の先頭拍を、優先的に認識処理し、
この認識理結果を示す図である。
【図41】音声対話型検索装置401において、先頭拍
有力候補の認識結果であるスコアと、2番目拍候補の認
識結果であるスコアとの統合結果(トータルスコア)を
示す図である。
【符号の説明】
1…音声入力された複合名詞の検索装置、 2…音声入力部、 3…音声認識部、 4…音声認識結果出力部、 5…実在検索語候補リスト作成部、 6…対話制御部、 7…音声出力部、 8…システムデータベース、 81…検索データベース、 82…検索補助データベース、 83…YES/NOデータベース、 G1…第1の単名詞集合群、 G2…第2の単名詞集合群、 G3…第3の単名詞集合群、 G4…第4の単名詞集合群、 101…音声入力された複合名詞の検索装置、 102…音声入力部、 103…音声認識部、 104…音声認識結果出力部、 105…実在検索語候補リスト作成部、 106…対話制御部、 107…音声出力部、 108…システムデータベース、 181…検索データベース、 182…検索補助データベース、 183…YES/NOデータベース、 Ga1…1番目表記の単名詞集合群、 Ga1−1…1番目表記の単名詞集合群Ga1における
第1サブ集合群、 Ga1−2…1番目表記の単名詞集合群Ga1における
第2サブ集合群、 Ga1−3…1番目表記の単名詞集合群Ga1における
第3サブ集合群、 Ga2…2番目表記の単名詞集合群、 Ga2−1…2番目表記の単名詞集合群Ga2における
第1サブ集合群、 Ga2−2…2番目表記の単名詞集合群Ga2における
第2サブ集合群、 Ga2−3…2番目表記の単名詞集合群Ga2における
第3サブ集合群、 201…音声入力された複合名詞の検索装置、 202…音声入力部、 203…音声認識部、 203S…音声認識装置、 204…音声認識結果出力部、 204a…音声認識結果リスト作成部、 205…実在検索語候補リスト作成部、 206…対話制御部、 207…音声出力部、 207S…音声出力装置、 208…システムデータベース、 281…検索データベース、 282…順序検索補助データベース、 283…逆順検索補助データベース、 284…YES/NOデータベース、 301…音声対話型複合名詞の検索装置、 302…音声入力部、 303…音声認識部、 303S…音声認識用ソフトウェア、 304…音声認識結果出力部、 305…実在検索語候補リスト作成部、 306…対話制御部、 307…音声出力部、 307S…音声出力用ソフトウェア、 308…システムデータベース、 381…検索データベース、 382…検索補助データベース、 383…YES/NOデータベース、 Gc1…1番目表記の単名詞集合群、 Gc1−1…1番目表記の単名詞集合群Gc1における
第1サブ集合群、 Gc1−2…1番目表記の単名詞集合群Gc1における
第2サブ集合群、 Gc2…2番目表記の単名詞集合群、 Gc2−1…2番目表記の単名詞集合群Gc2における
第1サブ集合群、 Gc2−2…2番目表記の単名詞集合群Gc2における
第2サブ集合群、 401…音声対話型検索装置、 402…音声入力部、 403…音声識別部、 431…音声認識部、 432…認識結果調整部、 404…対話制御部、 405…音声出力部、 405S…音声出力用ソフトウェア、 406…音声認識装置、 408…システムデータベース、 481…検索情報データベース、 482…拍データベース。
フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G06F 17/28 G06F 17/28 V G10L 15/18 G10L 3/00 537C 15/22 537G 537H 571V (31)優先権主張番号 特願2001−203164(P2001−203164) (32)優先日 平成13年7月4日(2001.7.4) (33)優先権主張国 日本(JP) Fターム(参考) 5B009 KB05 MB14 ME01 5B075 ND20 PP07 PR04 UU01 5B091 AA13 AB11 BA02 BA12 CB12 CC02 CC12 DA02 EA09 5D015 AA04 BB01

Claims (84)

    【特許請求の範囲】
  1. 【請求項1】 複数の単名詞で構成されている複合名詞
    が検索語として登録され、しかも、上記検索語が各単名
    詞に区切られて登録されている検索データベースと;上
    記検索データベースに登録されている全検索語を構成す
    る単名詞が、その頻度の高い順に登録され、しかも、こ
    の頻度の高い順に登録されている単名詞が、その頻度の
    高い方から順に、所定の数毎に分割されて、複数の単名
    詞集合群が形成されている検索補助データベースと;利
    用者が上記検索語を単名詞毎に入力すると、上記入力さ
    れた単名詞毎に、上記複数の単名詞集合群のうちで、最
    も頻度が高い単名詞を含む第1の単名詞集合群の範囲内
    で認識処理し、認識尤度を対応させて、認識結果リスト
    を作成する認識結果リスト作成手段と;上記認識処理さ
    れた単名詞である構成名詞候補と、上記構成名詞候補に
    ついての認識尤度との組が認識尤度順に並べられている
    認識結果リストを、上記音声入力された単名詞のそれぞ
    れついて作成し、上記認識結果リストに記載されている
    構成名詞候補のうちで、所定の閾値を超える認識尤度を
    具備する構成名詞候補を、有力構成名詞候補として選出
    する有力構成名詞候補選出手段と;上記有力構成名詞候
    補の全組合わせの中から、上記検索データベースに実在
    する検索語のみを選択し、各有力構成名詞候補の認識尤
    度に所定の演算を行い、検索語認識尤度を算出し、この
    算出された検索語認識尤度の大きい順に並べた実在検索
    語候補リストを作成する実在検索語候補リスト作成手段
    と;上記実在検索語候補リスト中の検索語候補が、利用
    者による確認処理のみで検索語を特定することができる
    条件を満たす場合は、上記利用者との間で必要な対話を
    実行し、検索語を確定する検索語候補選定対話手段と;
    を有することを特徴とする音声入力された複合名詞の検
    索装置。
  2. 【請求項2】 請求項1において、 上記検索語候補選定対話を実行する時間に、残りの1つ
    の上記単名詞集合群の範囲内における認識と、上記各単
    名詞毎に上記閾値を超える有力構成名詞候補の選出と、
    実在検索語候補リストの更新とを並行して処理する並行
    処理手段を有することを特徴とする音声入力された複合
    名詞の検索装置。
  3. 【請求項3】 請求項2において、 上記検索語候補選定対話において、上記実在検索語候補
    リスト中の検索語候補が、利用者による確認処理のみで
    は検索語を特定することができる条件を満たさない場
    合、または、上記検索語候補選定対話において提示した
    検索語候補が、利用者から否定された場合に、上記更新
    された実在検索語候補リストを利用して、検索語候補選
    定対話を実行することを特徴とする音声入力された複合
    名詞の検索装置。
  4. 【請求項4】 請求項1において、 上記検索補助データベースにおいて1つの上記単名詞集
    合群を構成する単名詞の上記所定の数は、上記利用者に
    ストレスまたは不自然さを感じさせない時間である対話
    処理実時間内に処理可能な数であることを特徴とする音
    声入力された複合名詞の検索装置。
  5. 【請求項5】 請求項1において、 上記検索補助データベースにおいて1つの上記単名詞集
    合群を構成する単名詞の上記所定の数をnとし、上記利
    用者が音声入力した単名詞を音声認識する音声認識部が
    対話処理実時間内に処理可能な単名詞の数をTとし、上
    記検索データベースに登録されている検索語が有する単
    名詞の数の平均をMとした場合、 n=T/M(nは整数値)であることを特徴とする音声
    入力された複合名詞の検索装置。
  6. 【請求項6】 請求項1において、 検索語を名詞単位に区切って音声入力するように、利用
    者に指示する区切り音声入力指示手段を有することを特
    徴とする音声入力された複合名詞の検索装置。
  7. 【請求項7】 請求項1または請求項2において、 上記各有力構成名詞候補の認識尤度について行う所定の
    演算は、上記各有力構成名詞候補の認識尤度を加算また
    は乗算することによって、上記検索語認識尤度を算出す
    る演算であることを特徴とする音声入力された複合名詞
    の検索装置。
  8. 【請求項8】 複数の単名詞で構成されている複合名詞
    が検索語として登録され、しかも、上記検索語が各単名
    詞に区切られて登録されている検索データベースを作成
    する検索データベース作成段階と;上記検索データベー
    スに登録されている全検索語を構成する単名詞が、その
    頻度の高い順に登録され、しかも、この頻度の高い順に
    登録されている単名詞が、その頻度の高い方から順に、
    所定の数毎に分割されて、複数の単名詞集合群が形成さ
    れている検索補助データベースを作成する検索補助デー
    タベース作成段階と;利用者が上記検索語を単名詞毎に
    入力すると、上記入力された単名詞毎に、上記複数の単
    名詞集合群のうちで、最も頻度が高い単名詞を含む第1
    の単名詞集合群の範囲内で認識処理し、認識尤度を対応
    させて、認識結果リストを作成する認識結果リスト作成
    段階と;上記認識処理された単名詞である構成名詞候補
    と、上記構成名詞候補についての認識尤度との組が認識
    尤度順に並べられている認識結果リストを、上記音声入
    力された単名詞のそれぞれついて作成し、上記認識結果
    リストに記載されている構成名詞候補のうちで、所定の
    閾値を超える認識尤度を具備する構成名詞候補を、有力
    構成名詞候補として選出する有力構成名詞候補選出段階
    と;上記有力構成名詞候補の全組合わせの中から、上記
    検索データベースに実在する検索語のみを選択し、各有
    力構成名詞候補の認識尤度に所定の演算を行い、検索語
    認識尤度を算出し、この算出された検索語認識尤度の大
    きい順に並べた実在検索語候補リストを作成する実在検
    索語候補リスト作成段階と;上記実在検索語候補リスト
    中の検索語候補が、利用者による確認処理のみで検索語
    を特定することができる条件を満たす場合は、上記利用
    者との間で必要な対話を実行し、検索語を確定する検索
    語候補選定対話段階と;を有することを特徴とする音声
    入力された複合名詞の検索方法。
  9. 【請求項9】 請求項8において、 上記検索語候補選定対話を実行する時間に、残りの1つ
    の上記単名詞集合群の範囲内における認識と、上記各単
    名詞毎に上記閾値を超える有力構成名詞候補の選出と、
    実在検索語候補リストの更新とを並行して処理する並行
    処理段階を有することを特徴とする音声入力された複合
    名詞の検索方法。
  10. 【請求項10】 請求項9において、 上記検索語候補選定対話において、上記実在検索語候補
    リスト中の検索語候補が、利用者による確認処理のみで
    は検索語を特定することができる条件を満たさない場
    合、または、上記検索語候補選定対話において提示した
    検索語候補が、利用者から否定された場合に、上記更新
    された実在検索語候補リストを利用して、検索語候補選
    定対話を実行することを特徴とする音声入力された複合
    名詞の検索方法。
  11. 【請求項11】 請求項8において、 上記検索補助データベースにおいて1つの上記単名詞集
    合群を構成する単名詞の上記所定の数は、上記利用者に
    ストレスまたは不自然さを感じさせない時間である対話
    処理実時間内に処理可能な数であることを特徴とする音
    声入力された複合名詞の検索方法。
  12. 【請求項12】 請求項8において、 上記検索補助データベースにおいて1つの上記単名詞集
    合群を構成する単名詞の上記所定の数をnとし、上記利
    用者が音声入力した単名詞を音声認識する音声認識部が
    対話処理実時間内に処理可能な単名詞の数をTとし、上
    記検索データベースに登録されている検索語が有する単
    名詞の数の平均をMとした場合、 n=T/M(nは整数値)であることを特徴とする音声
    入力された複合名詞の検索方法。
  13. 【請求項13】 請求項8において、 検索語を名詞単位に区切って音声入力するように、利用
    者に指示する区切り音声入力指示段階を有することを特
    徴とする音声入力された複合名詞の検索方法。
  14. 【請求項14】 請求項8または請求項9において、 上記各有力構成名詞候補の認識尤度について行う所定の
    演算は、上記各有力構成名詞候補の認識尤度を加算また
    は乗算することによって、上記検索語認識尤度を算出す
    る演算であることを特徴とする音声入力された複合名詞
    の検索方法。
  15. 【請求項15】 複数の単名詞で構成されている複合名
    詞が検索語として登録され、しかも、上記検索語が各単
    名詞に区切られて登録されている検索データベースを作
    成する検索データベース作成手順と;上記検索データベ
    ースに登録されている全検索語を構成する単名詞が、そ
    の頻度の高い順に登録され、しかも、この頻度の高い順
    に登録されている単名詞が、その頻度の高い方から順
    に、所定の数毎に分割されて、複数の単名詞集合群が形
    成されている検索補助データベースを作成する検索補助
    データベース作成手順と;利用者が上記検索語を単名詞
    毎に入力すると、上記入力された単名詞毎に、上記複数
    の単名詞集合群のうちで、最も頻度が高い単名詞を含む
    第1の単名詞集合群の範囲内で認識処理し、認識尤度を
    対応させて、認識結果リストを作成する認識結果リスト
    作成手順と;上記認識処理された単名詞である構成名詞
    候補と、上記構成名詞候補についての認識尤度との組が
    認識尤度順に並べられている認識結果リストを、上記音
    声入力された単名詞のそれぞれついて作成し、上記認識
    結果リストに記載されている構成名詞候補のうちで、所
    定の閾値を超える認識尤度を具備する構成名詞候補を、
    有力構成名詞候補として選出する有力構成名詞候補選出
    手順と;上記有力構成名詞候補の全組合わせの中から、
    上記検索データベースに実在する検索語のみを選択し、
    各有力構成名詞候補の認識尤度に所定の演算を行い、検
    索語認識尤度を算出し、この算出された検索語認識尤度
    の大きい順に並べた実在検索語候補リストを作成する実
    在検索語候補リスト作成手順と;上記実在検索語候補リ
    スト中の検索語候補が、利用者による確認処理のみで検
    索語を特定することができる条件を満たす場合は、上記
    利用者との間で必要な対話を実行し、検索語を確定する
    検索語候補選定対話手順と;をコンピュータに実行させ
    るプログラムを記録したコンピュータ読み取り可能な記
    録媒体。
  16. 【請求項16】 複数の単名詞で構成されている複合名
    詞が検索語として登録され、しかも、上記検索語が各単
    名詞に区切られて登録されていることを特徴とする検索
    データベース。
  17. 【請求項17】 検索データベースに登録されている全
    検索語を構成する単名詞が、その頻度の高い順に登録さ
    れ、しかも、この頻度の高い順に登録されている単名詞
    が、その頻度の高い方から順に、所定の数毎に分割され
    て、複数の単名詞集合群が形成されている検索補助デー
    タベース。
  18. 【請求項18】 複数の単名詞で構成されている複合名
    詞が検索語として登録され、しかも、上記検索語が各単
    名詞に区切られて登録されている検索データベースと;
    上記検索データベースに登録されている全検索語を構成
    する単名詞が、その頻度の高い順に登録され、しかも、
    この頻度の高い順に登録されている単名詞が、その頻度
    の高い方から順に、所定の数毎に分割されて、複数の単
    名詞集合群が形成されている検索補助データベースと;
    を有することを特徴とするデータベース。
  19. 【請求項19】 請求項18において、 1つの上記単名詞集合群を構成する単名詞の数は、検索
    装置と利用者とがやりとりする場合、上記利用者にスト
    レスまたは不自然さを感じさせない時間である対話処理
    実時間内に処理可能な数であることを特徴とするデータ
    ベース。
  20. 【請求項20】 請求項18において、1つの上記単名
    詞集合群を構成する単名詞の数をnとし、検索装置にお
    ける音声認識装置が対話処理実時間内に処理可能な単名
    詞の数をTとし、上記検索データベースに登録されてい
    る検索語が有する単名詞の数の平均をMとした場合、 n=T/M(nは整数値)であることを特徴とするデー
    タベース。
  21. 【請求項21】 複数の単名詞で構成されている複合名
    詞が検索語として登録され、しかも、上記検索語が各単
    名詞に区切られて登録されている検索データベースと;
    上記検索データベースに登録されている全検索語を構成
    する単名詞が、その頻度の高い順に登録され、しかも、
    この頻度の高い順に登録されている単名詞が、その頻度
    の高い方から順に、所定の数毎に分割されて、複数の単
    名詞集合群が形成されている検索補助データベースと;
    利用者が検索語を音声入力する音声入力手段と;上記検
    索データベースと上記検索補助データベースとを使用し
    て、上記音声入力された検索語を検索する検索手段と;
    を有することを特徴とする音声入力された複合名詞の検
    索装置。
  22. 【請求項22】 複数の単名詞で構成されている複合名
    詞が検索語として登録され、しかも、上記検索語が各単
    名詞に区切られて登録されている検索データベースと;
    上記登録されている各複合名詞のn番目(nは整数値)
    に表記されている単名詞の群を、n番目表記の単名詞集
    合群と呼び、上記n番目表記の単名詞集合群が、その頻
    度の高い順に登録され、しかも、この頻度の高い順に登
    録されている単名詞が、その頻度の高い方から順に、所
    定の数毎にまとめられ、複数のサブ集合群が形成されて
    いる検索補助データベースと;利用者が上記検索語であ
    る複合語を単名詞毎に入力すると、上記複合名詞のn番
    目表記の単名詞については、上記n番目表記の単名詞集
    合群で認識し、しかも上記n番目表記の単名詞集合群の
    うちで、最も頻度が高い単名詞を含む第1サブ集合群の
    範囲内で認識処理し、認識尤度を対応させて、認識結果
    リストを作成する認識結果リスト作成手段と;上記認識
    処理された単名詞である構成名詞候補と、上記構成名詞
    候補についての認識尤度との組が認識尤度順に並べられ
    ている認識結果リストを、上記音声入力された単名詞の
    それぞれついて作成し、上記認識結果リストに記載され
    ている構成名詞候補のうちで、所定の閾値を超える認識
    尤度を具備する構成名詞候補を、有力構成名詞候補とし
    て選出する有力構成名詞候補選出手段と;上記有力構成
    名詞候補の全組合わせの中から、上記検索データベース
    に実在する検索語のみを選択し、各有力構成名詞候補の
    認識尤度に所定の演算を行い、検索語認識尤度を算出
    し、この算出された検索語認識尤度の大きい順に並べた
    実在検索語候補リストを作成する実在検索語候補リスト
    作成手段と;上記実在検索語候補リスト中の検索語候補
    が、利用者による確認処理のみで検索語を特定すること
    ができる条件を満たす場合は、上記利用者との間で必要
    な対話を実行し、検索語を確定する検索語候補選定対話
    手段と;を有することを特徴とする音声入力された複合
    名詞の検索装置。
  23. 【請求項23】 請求項22において、 上記検索語候補選定対話を実行する時間に、残りの1つ
    のサブ集合群の範囲内における認識と、上記各単名詞毎
    に上記閾値を超える有力構成名詞候補の選出と、実在検
    索語候補リストの更新とを並行して処理する並行処理手
    段を有することを特徴とする音声入力された複合名詞の
    検索装置。
  24. 【請求項24】 請求項23において、 上記検索語候補選定対話において、上記実在検索語候補
    リスト中の検索語候補が、利用者による確認処理のみで
    は検索語を特定することができる条件を満たさない場
    合、または、上記検索語候補選定対話において提示した
    検索語候補が、利用者から否定された場合に、上記更新
    された実在検索語候補リストを利用して、検索語候補選
    定対話を実行することを特徴とする音声入力された複合
    名詞の検索装置。
  25. 【請求項25】 請求項22において、 上記検索補助データベースにおいて1つの上記サブ集合
    群を構成する単名詞の上記所定の数は、上記利用者にス
    トレスまたは不自然さを感じさせない時間である対話処
    理実時間内に処理可能な数であることを特徴とする音声
    入力された複合名詞の検索装置。
  26. 【請求項26】 請求項22において、 上記検索補助データベースにおいて1つの上記サブ集合
    群を構成する単名詞の上記所定の数をNとし、上記利用
    者が音声入力した単名詞を音声認識する音声認識部が対
    話処理実時間内に処理可能な単名詞の数をTとし、上記
    検索データベースに登録されている検索語が有する単名
    詞の数の平均をMとした場合、 N=T/M(Nは整数値)であることを特徴とする音声
    入力された複合名詞の検索装置。
  27. 【請求項27】 請求項22において、 検索語を名詞単位に区切って音声入力するように、利用
    者に指示する区切り音声入力指示手段を有することを特
    徴とする音声入力された複合名詞の検索装置。
  28. 【請求項28】 請求項22または請求項23におい
    て、 上記各有力構成名詞候補の認識尤度について行う所定の
    演算は、上記各有力構成名詞候補の認識尤度を加算また
    は乗算することによって、上記検索語認識尤度を算出す
    る演算であることを特徴とする音声入力された複合名詞
    の検索装置。
  29. 【請求項29】 複数の単名詞で構成されている複合名
    詞が検索語として登録され、しかも、上記検索語が各単
    名詞に区切られて登録されている検索データベースを作
    成する検索データベース作成段階と;上記登録されてい
    る各複合名詞のn番目(nは整数値)に表記されている
    単名詞の群を、n番目表記の単名詞集合群と呼び、上記
    n番目表記の単名詞集合群が、その頻度の高い順に登録
    され、しかも、この頻度の高い順に登録されている単名
    詞が、その頻度の高い方から順に、所定の数毎にまとめ
    られ、複数のサブ集合群が形成されている検索補助デー
    タベースを作成する検索補助データベース作成段階と;
    利用者が上記検索語である複合語を単名詞毎に入力する
    と、上記複合名詞のn番目表記の単名詞については、上
    記n番目表記の単名詞集合群で認識し、しかも上記n番
    目表記の単名詞集合群のうちで、最も頻度が高い単名詞
    を含む第1サブ集合群の範囲内で認識処理し、認識尤度
    を対応させて、認識結果リストを作成する認識結果リス
    ト作成段階と;上記認識処理された単名詞である構成名
    詞候補と、上記構成名詞候補についての認識尤度との組
    が認識尤度順に並べられている認識結果リストを、上記
    音声入力された単名詞のそれぞれついて作成し、上記認
    識結果リストに記載されている構成名詞候補のうちで、
    所定の閾値を超える認識尤度を具備する構成名詞候補
    を、有力構成名詞候補として選出する有力構成名詞候補
    選出段階と;上記有力構成名詞候補の全組合わせの中か
    ら、上記検索データベースに実在する検索語のみを選択
    し、各有力構成名詞候補の認識尤度に所定の演算を行
    い、検索語認識尤度を算出し、この算出された検索語認
    識尤度の大きい順に並べた実在検索語候補リストを作成
    する実在検索語候補リスト作成段階と;上記実在検索語
    候補リスト中の検索語候補が、利用者による確認処理の
    みで検索語を特定することができる条件を満たす場合
    は、上記利用者との間で必要な対話を実行し、検索語を
    確定する検索語候補選定対話段階と;を有することを特
    徴とする音声入力された複合名詞の検索方法。
  30. 【請求項30】 請求項29において、 上記検索語候補選定対話を実行する時間に、残りの1つ
    のサブ集合群の範囲内における認識と、上記各単名詞毎
    に上記閾値を超える有力構成名詞候補の選出と、実在検
    索語候補リストの更新とを並行して処理する並行処理段
    階を有することを特徴とする音声入力された複合名詞の
    検索方法。
  31. 【請求項31】 請求項30において、 上記検索語候補選定対話において、上記実在検索語候補
    リスト中の検索語候補が、利用者による確認処理のみで
    は検索語を特定することができる条件を満たさない場
    合、または、上記検索語候補選定対話において提示した
    検索語候補が、利用者から否定された場合に、上記更新
    された実在検索語候補リストを利用して、検索語候補選
    定対話を実行することを特徴とする音声入力された複合
    名詞の検索方法。
  32. 【請求項32】 請求項29において、 上記検索補助データベースにおいて1つの上記サブ集合
    群を構成する単名詞の上記所定の数は、上記利用者にス
    トレスまたは不自然さを感じさせない時間である対話処
    理実時間内に処理可能な数であることを特徴とする音声
    入力された複合名詞の検索方法。
  33. 【請求項33】 請求項29において、 上記検索補助データベースにおいて1つの上記サブ集合
    群を構成する単名詞の上記所定の数をNとし、上記利用
    者が音声入力した単名詞を音声認識する音声認識部が対
    話処理実時間内に処理可能な単名詞の数をTとし、上記
    検索データベースに登録されている検索語が有する単名
    詞の数の平均をMとした場合、 N=T/M(Nは整数値)であることを特徴とする音声
    入力された複合名詞の検索方法。
  34. 【請求項34】 請求項29において、 検索語を名詞単位に区切って音声入力するように、利用
    者に指示する区切り音声入力指示段階を有することを特
    徴とする音声入力された複合名詞の検索方法。
  35. 【請求項35】 請求項29または請求項30におい
    て、 上記各有力構成名詞候補の認識尤度について行う所定の
    演算は、上記各有力構成名詞候補の認識尤度を加算また
    は乗算することによって、上記検索語認識尤度を算出す
    る演算であることを特徴とする音声入力された複合名詞
    の検索方法。
  36. 【請求項36】 複数の単名詞で構成されている複合名
    詞が検索語として登録され、しかも、上記検索語が各単
    名詞に区切られて登録されている検索データベースを作
    成する検索データベース作成手順と;上記登録されてい
    る各複合名詞のn番目(nは整数値)に表記されている
    単名詞の群を、n番目表記の単名詞集合群と呼び、上記
    n番目表記の単名詞集合群が、その頻度の高い順に登録
    され、しかも、この頻度の高い順に登録されている単名
    詞が、その頻度の高い方から順に、所定の数毎にまとめ
    られ、複数のサブ集合群が形成されている検索補助デー
    タベースを作成する検索補助データベース作成手順と;
    利用者が上記検索語である複合語を単名詞毎に入力する
    と、上記複合名詞のn番目表記の単名詞については、上
    記n番目表記の単名詞集合群で認識し、しかも上記n番
    目表記の単名詞集合群のうちで、最も頻度が高い単名詞
    を含む第1サブ集合群の範囲内で認識処理し、認識尤度
    を対応させて、認識結果リストを作成する認識結果リス
    ト作成手順と;上記認識処理された単名詞である構成名
    詞候補と、上記構成名詞候補についての認識尤度との組
    が認識尤度順に並べられている認識結果リストを、上記
    音声入力された単名詞のそれぞれついて作成し、上記認
    識結果リストに記載されている構成名詞候補のうちで、
    所定の閾値を超える認識尤度を具備する構成名詞候補
    を、有力構成名詞候補として選出する有力構成名詞候補
    選出手順と;上記有力構成名詞候補の全組合わせの中か
    ら、上記検索データベースに実在する検索語のみを選択
    し、各有力構成名詞候補の認識尤度に所定の演算を行
    い、検索語認識尤度を算出し、この算出された検索語認
    識尤度の大きい順に並べた実在検索語候補リストを作成
    する実在検索語候補リスト作成手順と;上記実在検索語
    候補リスト中の検索語候補が、利用者による確認処理の
    みで検索語を特定することができる条件を満たす場合
    は、上記利用者との間で必要な対話を実行し、検索語を
    確定する検索語候補選定対話手順と;をコンピュータに
    実行させるプログラムを記録したコンピュータ読み取り
    可能な記録媒体。
  37. 【請求項37】 複数の単名詞で構成されている複合名
    詞が検索語として登録され、しかも、上記検索語が各単
    名詞に区切られて登録されている検索データベースと;
    上記登録されている各複合名詞のn番目(nは整数値)
    に表記されている単名詞の群を、n番目表記の単名詞集
    合群と呼び、上記n番目表記の単名詞集合群が、その頻
    度の高い順に登録され、しかも、この頻度の高い順に登
    録されている単名詞が、その頻度の高い方から順に、所
    定の数毎にまとめられ、複数のサブ集合群が形成されて
    いる検索補助データベースと;を有することを特徴とす
    るデータベース。
  38. 【請求項38】 請求項37において、 上記検索補助データベースにおいて1つの上記サブ集合
    群を構成する単名詞の上記所定の数は、上記利用者にス
    トレスまたは不自然さを感じさせない時間である対話処
    理実時間内に処理可能な数であることを特徴とするデー
    タベース。
  39. 【請求項39】 請求項37において、 上記検索補助データベースにおいて1つの上記サブ集合
    群を構成する単名詞の上記所定の数をNとし、上記利用
    者が音声入力した単名詞を音声認識する音声認識部が対
    話処理実時間内に処理可能な単名詞の数をTとし、上記
    検索データベースに登録されている検索語が有する単名
    詞の数の平均をMとした場合、 N=T/M(Nは整数値)であることを特徴とするデー
    タベース。
  40. 【請求項40】 複数の単名詞で構成されている複合名
    詞が検索語として登録され、しかも、上記検索語が各単
    名詞に区切られて登録されている検索データベースと;
    上記登録されている各複合名詞のn番目(nは整数値)
    に表記されている単名詞の群を、n番目表記の単名詞集
    合群と呼び、上記n番目表記の単名詞集合群が、その頻
    度の高い順に登録され、しかも、この頻度の高い順に登
    録されている単名詞が、その頻度の高い方から順に、所
    定の数毎にまとめられ、複数のサブ集合群が形成されて
    いる検索補助データベースと;利用者が検索語を音声入
    力する音声入力手段と;上記検索データベースと上記検
    索補助データベースとを使用して、上記音声入力された
    検索語を検索する検索手段と;を有することを特徴とす
    る音声入力された複合名詞の検索装置。
  41. 【請求項41】 音声入力された複合名詞における逆順
    m単語目に位置する単名詞については、データベースに
    登録されている各複合名詞の逆順m単語目(mは整数
    値)に位置する単名詞の集合である逆順m単語目に位置
    する単名詞集合の範囲で認識することを特徴とする音声
    入力された複合名詞の検索装置。
  42. 【請求項42】 請求項41において、 音声入力された複合名詞におけるn単語目に位置する単
    名詞については、データベースに登録されている各複合
    名詞のn単語目(nは整数値)に位置する単名詞の集合
    であるn単語目に位置する単名詞集合の範囲で認識し、
    この認識された結果と、 上記逆順m単語目に位置する単名詞について、上記逆順
    m単語目に位置する単名詞集合の範囲で認識された結果
    とをマージすることを特徴とする音声入力された複合名
    詞の検索装置。
  43. 【請求項43】 複数の単名詞で構成されている複合名
    詞が検索語として登録され、しかも、上記検索語が各単
    名詞に区切られて登録されている検索データベースと;
    上記登録されている各複合名詞の逆順m単語目(mは整
    数値)に位置する単名詞の集合である逆順m単語目に位
    置する単名詞集合が、登録されている逆順検索補助デー
    タベースと;利用者が上記検索語である複合名詞を単名
    詞毎に音声入力し終わると、音声入力された複合名詞の
    逆順m単語目に位置する単名詞については、上記逆順m
    単語目に位置する単名詞集合の範囲で認識し、上記認識
    された単名詞である構成名詞候補と、上記構成名詞候補
    についての認識尤度との組が認識尤度順に並べられてい
    る逆順認識結果リストを作成する逆順認識結果リスト作
    成手段と;上記逆順認識結果リストを、上記音声入力さ
    れた単名詞のそれぞれについて作成し、上記逆順認識結
    果リストに記載されている構成名詞候補のうちで、所定
    の閾値を超える認識尤度を具備する構成名詞候補を、逆
    順有力構成名詞候補として選出する逆順有力構成名詞候
    補選出手段と;上記逆順有力構成名詞候補の全組合わせ
    のそれぞれについて、上記有力構成名詞候補の認識尤度
    に所定の演算を行なうことによって、検索語認識尤度を
    算出し、この演算された検索語認識尤度の大きい順に並
    べた実在検索語候補リストを作成する実在検索語候補リ
    スト作成手段と;上記実在検索語候補のうちで、上記検
    索語認識尤度が所定の閾値以上である実在検索語につい
    て、上記利用者との間で必要な対話を実行し、検索語を
    確定する検索語候補選定対話手段と;を有することを特
    徴とする音声入力された複合名詞の検索装置。
  44. 【請求項44】 請求項43において、 上記逆順m単語目に位置する単名詞集合に属する単名詞
    が、使用頻度の高い単名詞順にしかも所定数毎に分割さ
    れることによって、複数の逆順m単語目の単名詞サブ集
    合が構成され、 上記逆順認識結果リスト作成手段は、上記逆順m単語目
    の単名詞サブ集合のうちで、最も頻度が高い単名詞を含
    む逆順単名詞サブ集合について認識処理し、上記逆順認
    識結果リストを作成する手段であることを特徴とする音
    声入力された複合名詞の検索装置。
  45. 【請求項45】 請求項44において、 上記検索語候補選定対話を実行する時間に、複数の上記
    逆順m単語目の単名詞サブ集合のうちで残っている上記
    逆順m単語目の単名詞サブ集合の範囲で行なう認識処理
    と、上記各単名詞毎に上記閾値以上の逆順有力構成名詞
    候補の選出と、実在検索語候補リストの更新とを並行し
    て処理する並行処理手段を有することを特徴とする音声
    入力された複合名詞の検索装置。
  46. 【請求項46】 請求項44において、 上記所定の数は、上記利用者にストレスまたは不自然さ
    を感じさせない時間である対話処理実時間内に処理可能
    な数であることを特徴とする音声入力された複合名詞の
    検索装置。
  47. 【請求項47】 請求項43において、 検索語を名詞単位に区切って音声入力するように、利用
    者に指示する区切り音声入力指示手段を有することを特
    徴とする音声入力された複合名詞の検索装置。
  48. 【請求項48】 請求項43において、 上記実在検索語候補リスト作成手段における所定の演算
    は、上記各有力構成名詞候補の認識尤度を加算または乗
    算することによって、上記検索語認識尤度を算出する演
    算であることを特徴とする音声入力された複合名詞の検
    索装置。
  49. 【請求項49】 請求項43において、 上記登録されている各複合名詞のn番目(nは整数値)
    に位置する単名詞の集合であるn単語目に位置する単名
    詞集合が、登録されている順序検索補助データベース
    と;音声入力された複合名詞のn番目に位置する単名詞
    については、上記n単語目に位置する単名詞集合の範囲
    で認識し、上記認識された単名詞である構成名詞候補
    と、上記構成名詞候補についての認識尤度との組が認識
    尤度順に並べられている認識結果リストを作成する認識
    結果リスト作成手段と;上記認識結果リストを、上記音
    声入力された単名詞のそれぞれについて作成し、上記認
    識結果リストに記載されている構成名詞候補のうちで、
    所定の閾値を超える認識尤度を具備する構成名詞候補
    を、有力構成名詞候補として選出する順序有力構成名詞
    候補選出手段と;を有し、上記実在検索語候補リスト作
    成手段は、上記逆順有力構成名詞候補選出手段が選出し
    た逆順有力構成名詞候補と、上記順序有力構成名詞候補
    選出手段が選出した順序有力構成名詞候補とをマージ
    し、このマージされた有力構成名詞候補の全組合わせの
    それぞれについて、上記有力構成名詞候補の認識尤度に
    所定の演算を行なうことによって、検索語認識尤度を算
    出し、この演算された検索語認識尤度の大きい順に並べ
    た実在検索語候補リストを作成する手段であることを特
    徴とする音声入力された複合名詞の検索装置。
  50. 【請求項50】 請求項49において、 上記逆順m単語目に位置する単名詞集合に属する単名詞
    が、使用頻度の高い単名詞順にしかも所定数毎に分割さ
    れることによって、複数の逆順m単語目の単名詞サブ集
    合が構成され、 上記認識結果リスト作成手段は、上記逆順m単語目の単
    名詞サブ集合のうちで、最も頻度が高い単名詞を含む逆
    順単名詞サブ集合の範囲で認識処理し、上記認識結果リ
    ストを作成する手段であることを特徴とする音声入力さ
    れた複合名詞の検索装置。
  51. 【請求項51】 音声入力された複合名詞における逆順
    m単語目に位置する単名詞については、データベースに
    登録されている各複合名詞の逆順m単語目(mは整数
    値)に位置する単名詞の集合である逆順m単語目に位置
    する単名詞集合の範囲で認識することを特徴とする音声
    入力された複合名詞の検索方法。
  52. 【請求項52】 請求項51において、 音声入力された複合名詞におけるn単語目に位置する単
    名詞については、データベースに登録されている各複合
    名詞のn単語目(nは整数値)に位置する単名詞の集合
    であるn単語目に位置する単名詞集合の範囲で認識し、
    この認識された結果と、 上記逆順m単語目に位置する単名詞について、上記逆順
    m単語目に位置する逆順単名詞集合の範囲で認識された
    結果とをマージすることを特徴とする音声入力された複
    合名詞の検索方法。
  53. 【請求項53】 複数の単名詞で構成されている複合名
    詞が検索語として登録され、しかも、上記検索語が各単
    名詞に区切られて登録されている検索データベースと、
    上記登録されている各複合名詞の逆順m単語目(mは整
    数値)に位置する単名詞の集合である逆順m単語目に位
    置する単名詞集合が、登録されている逆順検索補助デー
    タベースとを使用し、音声入力された複合名詞を検索す
    る検索方法であって、 利用者が上記検索語である複合名詞を単名詞毎に音声入
    力し終わると、音声入力された複合名詞の逆順m単語目
    に位置する単名詞については、上記逆順m単語目に位置
    する単名詞集合の範囲で認識し、上記認識された単名詞
    である構成名詞候補と、上記構成名詞候補についての認
    識尤度との組が認識尤度順に並べられている逆順認識結
    果リストを作成する逆順認識結果リスト作成段階と;上
    記逆順認識結果リストを、上記音声入力された単名詞の
    それぞれについて作成し、上記逆順認識結果リストに記
    載されている構成名詞候補のうちで、所定の閾値を超え
    る認識尤度を具備する構成名詞候補を、逆順有力構成名
    詞候補として選出する逆順有力構成名詞候補選出段階
    と;上記逆順有力構成名詞候補の全組合わせのそれぞれ
    について、上記有力構成名詞候補の認識尤度に所定の演
    算を行なうことによって、検索語認識尤度を算出し、こ
    の演算された検索語認識尤度の大きい順に並べた実在検
    索語候補リストを作成する実在検索語候補リスト作成段
    階と;上記実在検索語候補のうちで、上記検索語認識尤
    度が所定の閾値以上である実在検索語について、上記利
    用者との間で必要な対話を実行し、検索語を確定する検
    索語候補選定対話段階と;を有することを特徴とする音
    声入力された複合名詞の検索方法。
  54. 【請求項54】 請求項53において、 上記逆順m単語目に位置する単名詞集合に属する単名詞
    が、使用頻度の高い単名詞順にしかも所定数毎に分割さ
    れることによって、複数の逆順m単語目の単名詞サブ集
    合が構成され、 上記逆順認識結果リスト作成段階は、上記逆順m単語目
    の単名詞サブ集合のうちで、最も頻度が高い単名詞を含
    む逆順単名詞サブ集合について認識処理し、上記逆順認
    識結果リストを作成する段階であることを特徴とする音
    声入力された複合名詞の検索方法。
  55. 【請求項55】 請求項54において、 上記検索語候補選定対話を実行する時間に、複数の上記
    逆順m単語目の単名詞サブ集合のうちで残っている上記
    逆順m単語目の単名詞サブ集合の範囲で行なう認識処理
    と、上記各単名詞毎に上記閾値以上の逆順有力構成名詞
    候補の選出と、実在検索語候補リストの更新とを並行し
    て処理する並行処理段階を有することを特徴とする音声
    入力された複合名詞の検索方法。
  56. 【請求項56】 請求項54において、 上記所定の数は、上記利用者にストレスまたは不自然さ
    を感じさせない時間である対話処理実時間内に処理可能
    な数であることを特徴とする音声入力された複合名詞の
    検索方法。
  57. 【請求項57】 請求項53において、 検索語を名詞単位に区切って音声入力するように、利用
    者に指示する区切り音声入力指示段階を有することを特
    徴とする音声入力された複合名詞の検索方法。
  58. 【請求項58】 請求項53において、 上記実在検索語候補リスト作成段階における所定の演算
    は、上記各有力構成名詞候補の認識尤度を加算または乗
    算することによって、上記検索語認識尤度を算出する演
    算であることを特徴とする音声入力された複合名詞の検
    索方法。
  59. 【請求項59】 請求項53において、 上記登録されている各複合名詞のn番目(nは整数値)
    に位置する単名詞の集合であるn単語目に位置する単名
    詞集合が、登録されている順序検索補助データベースを
    使用し、音声入力された複合名詞を検索する検索方法で
    あって、 音声入力された複合名詞のn番目に位置する単名詞につ
    いては、上記n単語目に位置する単名詞集合の範囲で認
    識し、上記認識された単名詞である構成名詞候補と、上
    記構成名詞候補についての認識尤度との組が認識尤度順
    に並べられている認識結果リストを作成する認識結果リ
    スト作成段階と;上記認識結果リストを、上記音声入力
    された単名詞のそれぞれについて作成し、上記認識結果
    リストに記載されている構成名詞候補のうちで、所定の
    閾値を超える認識尤度を具備する構成名詞候補を、有力
    構成名詞候補として選出する順序有力構成名詞候補選出
    段階と;を有し、上記実在検索語候補リスト作成段階
    は、上記逆順有力構成名詞候補選出段階が選出した逆順
    有力構成名詞候補と、上記順序有力構成名詞候補選出段
    階が選出した順序有力構成名詞候補とをマージし、この
    マージされた有力構成名詞候補の全組合わせのそれぞれ
    について、上記有力構成名詞候補の認識尤度に所定の演
    算を行なうことによって、検索語認識尤度を算出し、こ
    の演算された検索語認識尤度の大きい順に並べた実在検
    索語候補リストを作成する段階であることを特徴とする
    音声入力された複合名詞の検索方法。
  60. 【請求項60】 請求項59において、 上記逆順m単語目に位置する逆順単名詞集合に属する単
    名詞が、使用頻度の高い単名詞順にしかも所定数毎に分
    割されることによって、複数の逆順m単語目の単名詞サ
    ブ集合が構成され、 上記認識結果リスト作成段階は、上記逆順m単語目の単
    名詞サブ集合のうちで、最も頻度が高い単名詞を含む逆
    順単名詞サブ集合の範囲で認識処理し、上記認識結果リ
    ストを作成する段階であることを特徴とする音声入力さ
    れた複合名詞の検索方法。
  61. 【請求項61】 複数の単名詞で構成されている複合名
    詞が検索語として登録され、しかも、上記検索語が各単
    名詞に区切られて登録されている検索データベースと、
    上記登録されている各複合名詞の逆順m単語目(mは整
    数値)に位置する単名詞の集合である逆順m単語目に位
    置する単名詞集合が、登録されている逆順検索補助デー
    タベースとを使用し、音声入力された複合名詞を検索す
    る手順と;利用者が上記検索語である複合名詞を単名詞
    毎に音声入力し終わると、音声入力された複合名詞の逆
    順m単語目に位置する単名詞については、上記逆順m単
    語目に位置する単名詞集合の範囲で認識し、上記認識さ
    れた単名詞である構成名詞候補と、上記構成名詞候補に
    ついての認識尤度との組が認識尤度順に並べられている
    逆順認識結果リストを作成する逆順認識結果リスト作成
    手順と;上記逆順認識結果リストを、上記音声入力され
    た単名詞のそれぞれについて作成し、上記逆順認識結果
    リストに記載されている構成名詞候補のうちで、所定の
    閾値を超える認識尤度を具備する構成名詞候補を、逆順
    有力構成名詞候補として選出する逆順有力構成名詞候補
    選出手順と;上記逆順有力構成名詞候補の全組合わせの
    それぞれについて、上記有力構成名詞候補の認識尤度に
    所定の演算を行なうことによって、検索語認識尤度を算
    出し、この演算された検索語認識尤度の大きい順に並べ
    た実在検索語候補リストを作成する実在検索語候補リス
    ト作成手順と;上記実在検索語候補のうちで、上記検索
    語認識尤度が所定の閾値以上である実在検索語につい
    て、上記利用者との間で必要な対話を実行し、検索語を
    確定する検索語候補選定対話手順と;をコンピュータに
    実行させるプログラム。
  62. 【請求項62】 複数の単名詞で構成されている複合名
    詞が検索語として登録され、しかも、上記検索語が各単
    名詞に区切られて登録されている検索データベースと、
    上記登録されている各複合名詞の逆順m単語目(mは整
    数値)に位置する単名詞の集合である逆順m単語目に位
    置する単名詞集合が、登録されている逆順検索補助デー
    タベースとを使用し、音声入力された複合名詞を検索す
    る手順と;利用者が上記検索語である複合名詞を単名詞
    毎に音声入力し終わると、音声入力された複合名詞の逆
    順m単語目に位置する単名詞については、上記逆順m単
    語目に位置する単名詞集合の範囲で認識し、上記認識さ
    れた単名詞である構成名詞候補と、上記構成名詞候補に
    ついての認識尤度との組が認識尤度順に並べられている
    逆順認識結果リストを作成する逆順認識結果リスト作成
    手順と;上記逆順認識結果リストを、上記音声入力され
    た単名詞のそれぞれについて作成し、上記逆順認識結果
    リストに記載されている構成名詞候補のうちで、所定の
    閾値を超える認識尤度を具備する構成名詞候補を、逆順
    有力構成名詞候補として選出する逆順有力構成名詞候補
    選出手順と;上記逆順有力構成名詞候補の全組合わせの
    それぞれについて、上記有力構成名詞候補の認識尤度に
    所定の演算を行なうことによって、検索語認識尤度を算
    出し、この演算された検索語認識尤度の大きい順に並べ
    た実在検索語候補リストを作成する実在検索語候補リス
    ト作成手順と;上記実在検索語候補のうちで、上記検索
    語認識尤度が所定の閾値以上である実在検索語につい
    て、上記利用者との間で必要な対話を実行し、検索語を
    確定する検索語候補選定対話手順と;をコンピュータに
    実行させるプログラムを記録したコンピュータ読取可能
    な記録媒体。
  63. 【請求項63】 複数の単名詞で構成されている複合名
    詞が検索語として登録され、しかも、上記検索語が各単
    名詞に区切られて登録されている検索データベースと;
    上記登録されている各複合名詞の逆順m単語目(mは整
    数値)に位置する単名詞の集合を、逆順m単語目に位置
    する逆順単名詞集合と呼び、上記逆順m単語目に位置す
    る単名詞集合が、頻度の高い順に登録されている逆順検
    索補助データベースと;を有することを特徴とするデー
    タベース。
  64. 【請求項64】 検索語を構成する複数の単名詞のうち
    で一部の単名詞のみの尤度が第1の所定の閾値を超える
    場合、上記第1の閾値を超える尤度を具備する上記単名
    詞を備え、上記検索語を構成する単名詞と同じ数の単名
    詞を備えている部分一致検索語候補を、検索データベー
    スから抽出する部分一致検索語候補抽出手段と;上記抽
    出された部分一致検索語候補を構成する各単名詞の尤度
    を所定の演算方法で演算して部分一致尤度を計算する部
    分一致尤度計算手段と;上記計算された部分一致尤度
    が、所定の第2の閾値を超えている検索語候補につい
    て、音声認識処理を行う部分一致検索語候補用音声認識
    処理手段と;を有することを特徴とする音声対話型複合
    名詞の検索装置。
  65. 【請求項65】 複数の単名詞で構成されている複合名
    詞が検索語として登録され、しかも、上記検索語が各単
    名詞に区切られて登録されている検索データベースと;
    上記登録されている各複合名詞のn番目(nは整数値)
    に表記されている単名詞の群を、n番目表記の単名詞集
    合群と呼び、上記n番目表記の単名詞集合群が、その頻
    度の高い順に登録され、しかも、この頻度の高い順に登
    録されている単名詞が、その頻度の高い方から順に、所
    定の数毎にまとめられ、複数のサブ集合群が形成されて
    いる検索補助データベースと;利用者が上記検索語であ
    る複合語を単名詞毎に入力すると、上記複合名詞のn番
    目表記の単名詞については、上記n番目表記の単名詞集
    合群で認識し、しかも上記n番目表記の単名詞集合群の
    うちで、最も頻度が高い単名詞を含む第1サブ集合群の
    範囲内で認識処理し、認識尤度を対応させて、認識結果
    リストを作成する認識結果リスト作成手段と;上記認識
    処理された単名詞である構成名詞候補と、上記構成名詞
    候補についての認識尤度との組が認識尤度順に並べられ
    ている認識結果リストを、上記音声入力された単名詞の
    それぞれについて作成し、上記認識結果リストに記載さ
    れている構成名詞候補のうちで、所定の第1の閾値を超
    える認識尤度を具備する構成名詞候補を、有力構成名詞
    候補として選出する有力構成名詞候補選出手段と;上記
    検索語を構成する複数の単名詞のうちで一部の単名詞の
    みの尤度が上記第1の所定の閾値を超える場合、上記第
    1の閾値を超える尤度を具備する上記単名詞を備え、上
    記検索語を構成する単名詞と同じ数の単名詞を備えてい
    る部分一致検索語候補を、上記検索データベースから抽
    出する部分一致検索語候補抽出手段と;上記抽出された
    部分一致検索語候補を構成する各単名詞の尤度を所定の
    演算方法で演算して部分一致尤度を演算する部分一致尤
    度演算手段と;上記演算された部分一致尤度が、所定の
    第2の閾値を超えている上記部分一致検索語候補につい
    て、音声認識処理を行う部分一致検索語候補用音声認識
    処理手段と;を有することを特徴とする音声対話型複合
    名詞の検索装置。
  66. 【請求項66】 請求項65において、 上記第1サブ集合群を利用して行なう実在検索語候補選
    定処理と、上記認識処理の結果、演算された尤度が、利
    用者との確定処理のみで検索語を特定可能な条件を満た
    す尤度である場合は、利用者との必要な対話を実行し、
    検索語確定を行う検索語候補選定対話と、上記部分一致
    検索語候補を上記検索データベースから抽出し、上記抽
    出された部分一致検索語候補を構成する各単名詞の尤度
    を所定の演算方法で演算して部分一致尤度を演算する部
    分一致検索語処理とを、並行して処理する並行処理手段
    と;上記部分一致検索語処理を実行した結果、検索語候
    補選定対話に利用可能な検索語が選定できない場合は、
    引き続き、第2サブ集合群以降のサブ集合群について、
    利用者との対話時間を利用して、上記認識処理を行い、
    上記実在検索語候補選定処理と、上記検索語候補選定対
    話と、上記部分一致検索語処理と、その結果に対する検
    索語候補選定対話とを、繰り返す繰り返し手段と;を有
    することを特徴とする音声対話型複合名詞の検索装置。
  67. 【請求項67】 請求項64または請求項65におい
    て、 上記部分一致尤度を演算する上記所定の演算方法は、上
    記各単名詞の尤度を加算または乗算する方法であること
    を特徴とする音声対話型複合名詞の検索装置。
  68. 【請求項68】 検索語を構成する複数の単名詞のうち
    で一部の単名詞のみの尤度が第1の所定の閾値を超える
    場合、上記第1の閾値を超える尤度を具備する上記単名
    詞を備え、上記検索語を構成する単名詞と同じ数の単名
    詞を備えている部分一致検索語候補を、検索データベー
    スから抽出する部分一致検索語候補抽出段階と;上記抽
    出された部分一致検索語候補を構成する各単名詞の尤度
    を所定の演算方法で演算して部分一致尤度を計算する部
    分一致尤度計算段階と;上記計算された部分一致尤度
    が、所定の第2の閾値を超えている検索語候補につい
    て、音声認識処理を行う部分一致検索語候補用音声認識
    処理段階と;を有することを特徴とする音声対話型複合
    名詞の検索方法。
  69. 【請求項69】 複数の単名詞で構成されている複合名
    詞が検索語として登録され、しかも、上記検索語が各単
    名詞に区切られて登録されている検索データベースと、
    上記登録されている各複合名詞のn番目(nは整数値)
    に表記されている単名詞の群を、n番目表記の単名詞集
    合群と呼び、上記n番目表記の単名詞集合群が、その頻
    度の高い順に登録され、しかも、この頻度の高い順に登
    録されている単名詞が、その頻度の高い方から順に、所
    定の数毎にまとめられ、複数のサブ集合群が形成されて
    いる検索補助データベースとを使用して、複合名詞を検
    索する方法であって、 利用者が上記検索語である複合語を単名詞毎に入力する
    と、上記複合名詞のn番目表記の単名詞については、上
    記n番目表記の単名詞集合群で認識し、しかも上記n番
    目表記の単名詞集合群のうちで、最も頻度が高い単名詞
    を含む第1サブ集合群の範囲内で認識処理し、認識尤度
    を対応させて、認識結果リストを作成する認識結果リス
    ト作成段階と;上記認識処理された単名詞である構成名
    詞候補と、上記構成名詞候補についての認識尤度との組
    が認識尤度順に並べられている認識結果リストを、上記
    音声入力された単名詞のそれぞれについて作成し、上記
    認識結果リストに記載されている構成名詞候補のうち
    で、所定の第1の閾値を超える認識尤度を具備する構成
    名詞候補を、有力構成名詞候補として選出する有力構成
    名詞候補選出段階と;上記検索語を構成する複数の単名
    詞のうちで一部の単名詞のみの尤度が上記第1の所定の
    閾値を超える場合、上記第1の閾値を超える尤度を具備
    する上記単名詞を備え、上記検索語を構成する単名詞と
    同じ数の単名詞を備えている部分一致検索語候補を、上
    記検索データベースから抽出する部分一致検索語候補抽
    出段階と;上記抽出された部分一致検索語候補を構成す
    る各単名詞の尤度を所定の演算方法で演算して部分一致
    尤度を演算する部分一致尤度演算段階と;上記演算され
    た部分一致尤度が、所定の第2の閾値を超えている上記
    部分一致検索語候補について、音声認識処理を行う部分
    一致検索語候補用音声認識処理段階と;を有することを
    特徴とする音声対話型複合名詞の検索方法。
  70. 【請求項70】 検索語を構成する複数の単名詞のうち
    で一部の単名詞のみの尤度が第1の所定の閾値を超える
    場合、上記第1の閾値を超える尤度を具備する上記単名
    詞を備え、上記検索語を構成する単名詞と同じ数の単名
    詞を備えている部分一致検索語候補を、検索データベー
    スから抽出する部分一致検索語候補抽出手順と;上記抽
    出された部分一致検索語候補を構成する各単名詞の尤度
    を所定の演算方法で演算して部分一致尤度を計算する部
    分一致尤度計算手順と;上記計算された部分一致尤度
    が、所定の第2の閾値を超えている検索語候補につい
    て、音声認識処理を行う部分一致検索語候補用音声認識
    処理手順と;をコンピュータに実行させるプログラム。
  71. 【請求項71】 複数の単名詞で構成されている複合名
    詞が検索語として登録され、しかも、上記検索語が各単
    名詞に区切られて登録されている検索データベースと、
    上記登録されている各複合名詞のn番目(nは整数値)
    に表記されている単名詞の群を、n番目表記の単名詞集
    合群と呼び、上記n番目表記の単名詞集合群が、その頻
    度の高い順に登録され、しかも、この頻度の高い順に登
    録されている単名詞が、その頻度の高い方から順に、所
    定の数毎にまとめられ、複数のサブ集合群が形成されて
    いる検索補助データベースとを使用して、複合名詞を検
    索するプログラムであって、 利用者が上記検索語である複合語を単名詞毎に入力する
    と、上記複合名詞のn番目表記の単名詞については、上
    記n番目表記の単名詞集合群で認識し、しかも上記n番
    目表記の単名詞集合群のうちで、最も頻度が高い単名詞
    を含む第1サブ集合群の範囲内で認識処理し、認識尤度
    を対応させて、認識結果リストを作成する認識結果リス
    ト作成手順と;上記認識処理された単名詞である構成名
    詞候補と、上記構成名詞候補についての認識尤度との組
    が認識尤度順に並べられている認識結果リストを、上記
    音声入力された単名詞のそれぞれについて作成し、上記
    認識結果リストに記載されている構成名詞候補のうち
    で、所定の第1の閾値を超える認識尤度を具備する構成
    名詞候補を、有力構成名詞候補として選出する有力構成
    名詞候補選出手順と;上記検索語を構成する複数の単名
    詞のうちで一部の単名詞のみの尤度が上記第1の所定の
    閾値を超える場合、上記第1の閾値を超える尤度を具備
    する上記単名詞を備え、上記検索語を構成する単名詞と
    同じ数の単名詞を備えている部分一致検索語候補を、上
    記検索データベースから抽出する部分一致検索語候補抽
    出手順と;上記抽出された部分一致検索語候補を構成す
    る各単名詞の尤度を所定の演算方法で演算して部分一致
    尤度を演算する部分一致尤度演算手順と;上記演算され
    た部分一致尤度が、所定の第2の閾値を超えている上記
    部分一致検索語候補について、音声認識処理を行う部分
    一致検索語候補用音声認識処理手順と;をコンピュータ
    に実行させるプログラム。
  72. 【請求項72】 検索対象である検索情報が格納されて
    いる検索情報データベースと;上記検索情報データベー
    スに格納されている検索情報を分解して切り出された拍
    のうちで、上記各検索情報の先頭を構成する拍である先
    頭拍が、上記検索情報データベースの中で使用されてい
    る頻度順に格納され、上記先頭拍に続く拍についても、
    使用頻度順に格納されている拍データベースと;ユーザ
    が検索情報を音声入力すると、上記拍データベース中の
    先頭拍について、上記検索情報データベースにおける使
    用頻度の高い拍から、優先的に認識処理する認識処理手
    段と;上記先頭拍を認識した結果、利用者が入力した拍
    である可能性が高い有力先頭拍であると判断した場合、
    上記有力先頭拍に繋がり、使用頻度が高い拍から、優先
    的に認識処理し、有力2番目拍を抽出し、上記検索情報
    を構成する最後の拍まで、認識処理を繰返す認識処理繰
    り返し手段と;全ての拍に対する認識処理が終了した時
    点で、出力された検索情報毎に、トータルスコアを計算
    するトータルスコア計算手段と;ユーザが確認処理する
    のみで上記検索情報を特定できる条件を、上記トータル
    スコアが満たす場合、ユーザとの間で必要な対話を行
    い、上記検索情報を確定する対話手段と;を有すること
    を特徴とする音声対話型情報検索装置。
  73. 【請求項73】 請求項72において、 ユーザが確認処理するのみで上記検索情報を特定できる
    上記条件を、上記トータルスコアが満たさない場合は、
    上記先頭拍から確認処理を、順次行い、拍毎の確定を行
    い、検索情報の確定を実現することを特徴とする音声対
    話型情報検索装置。
  74. 【請求項74】 請求項72において、 上記先頭拍と2番目拍とについて認識処理した結果、ユ
    ーザが確認処理するのみで上記検索情報を特定できる上
    記条件を、上記トータルスコアが満たさない場合、2番
    目拍の認識結果と3番目拍の認識結果とを統合している
    間に、残りの各拍について、使用頻度の高い順に、実時
    間内に処理可能な数を認識対象と定め、先頭拍から順に
    並行処理する並行処理手段を有することを特徴とする音
    声対話型情報検索装置。
  75. 【請求項75】 請求項74において、 上記並行処理手段は、ユーザが確認処理する場合、確認
    処理の質疑応答時間内に残りの対象について並行処理を
    行う手段であることを特徴とする音声対話型情報検索装
    置。
  76. 【請求項76】 請求項74において、 ユーザが確認処理しない場合、認識処理に要する時間を
    考慮して、認識対象として選択する各拍数を決定するこ
    とを特徴とする音声対話型情報検索装置。
  77. 【請求項77】 請求項72において、 上記検索情報を分解して拍を切り出す切り出し方は、 上記検索情報を平仮名表記したときにおける平仮名1文
    字を1拍とする切り出し方(ただし、拗音、撥音、長音
    は前の平仮名と合わせて1拍と数える)、 上記検索情報を平仮名表記した場合に、先頭から順に、
    所定の平仮名文字数毎に、1拍とする切り出し方(ただ
    し、拗音、撥音、長音は、前の平仮名と合わせて1文字
    と数える)、 上記検索情報を平仮名表記した場合に、上記表記された
    平仮名の構成数に応じて、1拍を構成する文字数を規定
    する切り出し方、 上記検索情報を漢字表記した場合に、漢字1文字の読み
    を1拍とする切り出し方、 のうちで、いずれか1つの切り出し方であることを特徴
    とする音声対話型情報検索装置。
  78. 【請求項78】 請求項77において、 上記検索情報を平仮名表記した場合に、上記表記された
    平仮名の構成数に応じて、1拍を構成する文字数を規定
    する切り出し方は、4文字からなる検索情報は、先頭か
    ら2文字毎に1拍と数え、3文字からなる検索情報は、
    先頭から1文字毎に1拍と数えることによって切り出す
    切り出し方であることを特徴とする音声対話型情報検索
    装置。
  79. 【請求項79】 検索情報データベースに格納されてい
    る検索情報を分解して切り出された拍のうちで、上記各
    検索情報の先頭を構成する拍である先頭拍が、検索情報
    データベースの中で使用されている頻度順に格納され、
    上記先頭拍に続く拍についても、使用頻度順に格納され
    ている拍データベース中の先頭拍について、検索情報デ
    ータベースにおける使用頻度の高い拍から、優先的に認
    識処理する認識処理手段と;上記先頭拍を認識した結
    果、利用者が入力した拍である可能性が高い有力先頭拍
    であると判断した場合、上記有力先頭拍に繋がり、使用
    頻度が高い拍から、優先的に認識処理し、有力2番目拍
    を抽出し、上記検索情報を構成する最後の拍まで、認識
    処理を繰返す認識処理繰り返し手段と;全ての拍に対す
    る認識処理が終了した時点で、出力された検索情報毎
    に、トータルスコアを計算するトータルスコア計算手段
    と;ユーザが確認処理するのみで上記検索情報を特定で
    きる条件を、上記トータルスコアが満たす場合、ユーザ
    との間で必要な対話を行い、上記検索情報を確定する対
    話手段と;を有することを特徴とする音声対話型情報検
    索装置。
  80. 【請求項80】 検索情報データベースに格納されてい
    る検索情報を分解して切り出された拍のうちで、上記各
    検索情報の先頭を構成する拍である先頭拍が、検索情報
    データベースの中で使用されている頻度順に格納され、
    上記先頭拍に続く拍についても、使用頻度順に格納され
    ている拍データベース中の先頭拍について、検索情報デ
    ータベースにおける使用頻度の高い拍から、優先的に認
    識処理する認識処理段階と;上記先頭拍を認識した結
    果、利用者が入力した拍である可能性が高い有力先頭拍
    であると判断した場合、上記有力先頭拍に繋がり、使用
    頻度が高い拍から、優先的に認識処理し、有力2番目拍
    を抽出し、上記検索情報を構成する最後の拍まで、認識
    処理を繰返す認識処理繰り返し段階と;全ての拍に対す
    る認識処理が終了した時点で、出力された検索情報毎
    に、トータルスコアを計算するトータルスコア計算段階
    と;ユーザが確認処理するのみで上記検索情報を特定で
    きる条件を、上記トータルスコアが満たす場合、ユーザ
    との間で必要な対話を行い、上記検索情報を確定する対
    話段階と;を有することを特徴とする音声対話型情報検
    索方法。
  81. 【請求項81】 検索情報データベースに格納されてい
    る検索情報を分解して切り出された拍のうちで、上記各
    検索情報の先頭を構成する拍である先頭拍が、検索情報
    データベースの中で使用されている頻度順に格納され、
    上記先頭拍に続く拍についても、使用頻度順に格納され
    ている拍データベース中の先頭拍について、検索情報デ
    ータベースにおける使用頻度の高い拍から、優先的に認
    識処理する認識処理手順と;上記先頭拍を認識した結
    果、利用者が入力した拍である可能性が高い有力先頭拍
    であると判断した場合、上記有力先頭拍に繋がり、使用
    頻度が高い拍から、優先的に認識処理し、有力2番目拍
    を抽出し、上記検索情報を構成する最後の拍まで、認識
    処理を繰返す認識処理繰り返し手順と;全ての拍に対す
    る認識処理が終了した時点で、出力された検索情報毎
    に、トータルスコアを計算するトータルスコア計算手順
    と;ユーザが確認処理するのみで上記検索情報を特定で
    きる条件を、上記トータルスコアが満たす場合、ユーザ
    との間で必要な対話を行い、上記検索情報を確定する対
    話手順と;をコンピュータに実行させるプログラム。
  82. 【請求項82】 検索情報の先頭に位置している拍であ
    る先頭拍が、使用頻度の高い順に並べられている先頭拍
    群と;上記先頭拍のそれぞれについて、上記先頭拍の次
    に繋がる拍である2番目拍が、使用頻度の高い順に並べ
    られている2番目拍群と;上記2番目拍のそれぞれにつ
    いて、上記2番目拍の次に繋がる拍である3番目拍が、
    使用頻度の高い順に並べられている3番目拍群と;を有
    することを特徴とする拍データベース。
  83. 【請求項83】 検索情報の先頭に位置している拍であ
    る先頭拍を、使用頻度の高い順に並べる段階と;上記先
    頭拍のそれぞれについて、上記先頭拍の次に繋がる拍で
    ある2番目拍を、使用頻度の高い順に並べる段階と;上
    記2番目拍のそれぞれについて、上記2番目拍の次に繋
    がる拍である3番目拍を、使用頻度の高い順に並べる段
    階と;を有することを特徴とする拍データベース作成方
    法。
  84. 【請求項84】 検索情報の先頭に位置している拍であ
    る先頭拍を、使用頻度の高い順に並べる手順と;上記先
    頭拍のそれぞれについて、上記先頭拍の次に繋がる拍で
    ある2番目拍を、使用頻度の高い順に並べる手順と;上
    記2番目拍のそれぞれについて、上記2番目拍の次に繋
    がる拍である3番目拍を、使用頻度の高い順に並べる手
    順と;をコンピュータに実行させるプログラム。
JP2001295353A 2000-10-13 2001-09-27 音声入力された複合名詞の検索装置、検索方法およびデータベース Expired - Lifetime JP3682958B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001295353A JP3682958B2 (ja) 2000-10-13 2001-09-27 音声入力された複合名詞の検索装置、検索方法およびデータベース

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
JP2000-313098 2000-10-13
JP2000313098 2000-10-13
JP2000-350622 2000-11-17
JP2000350622 2000-11-17
JP2001-42101 2001-02-19
JP2001042101 2001-02-19
JP2001203164 2001-07-04
JP2001-203164 2001-07-04
JP2001295353A JP3682958B2 (ja) 2000-10-13 2001-09-27 音声入力された複合名詞の検索装置、検索方法およびデータベース

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2005126969A Division JP3846896B2 (ja) 2000-10-13 2005-04-25 音声入力された複合名詞の検索装置、検索方法およびデータベース

Publications (2)

Publication Number Publication Date
JP2003085197A true JP2003085197A (ja) 2003-03-20
JP3682958B2 JP3682958B2 (ja) 2005-08-17

Family

ID=27531678

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001295353A Expired - Lifetime JP3682958B2 (ja) 2000-10-13 2001-09-27 音声入力された複合名詞の検索装置、検索方法およびデータベース

Country Status (1)

Country Link
JP (1) JP3682958B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005084422A (ja) * 2003-09-09 2005-03-31 Denso Corp 音声認識検索装置
JP2005202165A (ja) * 2004-01-15 2005-07-28 Advanced Media Inc 音声認識システム
JP2006031278A (ja) * 2004-07-14 2006-02-02 Nec Corp 音声検索システムおよび方法ならびにプログラム
WO2006065158A1 (en) * 2004-12-13 2006-06-22 Purino Philipp M Modular impermanent housing system
US7818173B2 (en) 2005-01-31 2010-10-19 Kabushiki Kaisha Toshiba Information retrieval system, method, and program

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112767924A (zh) 2021-02-26 2021-05-07 北京百度网讯科技有限公司 语音识别方法、装置、电子设备及存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06162098A (ja) * 1992-11-24 1994-06-10 Fujitsu Ltd 類義語生成処理方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06162098A (ja) * 1992-11-24 1994-06-10 Fujitsu Ltd 類義語生成処理方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005084422A (ja) * 2003-09-09 2005-03-31 Denso Corp 音声認識検索装置
JP2005202165A (ja) * 2004-01-15 2005-07-28 Advanced Media Inc 音声認識システム
JP2006031278A (ja) * 2004-07-14 2006-02-02 Nec Corp 音声検索システムおよび方法ならびにプログラム
JP4595415B2 (ja) * 2004-07-14 2010-12-08 日本電気株式会社 音声検索システムおよび方法ならびにプログラム
WO2006065158A1 (en) * 2004-12-13 2006-06-22 Purino Philipp M Modular impermanent housing system
US7818173B2 (en) 2005-01-31 2010-10-19 Kabushiki Kaisha Toshiba Information retrieval system, method, and program

Also Published As

Publication number Publication date
JP3682958B2 (ja) 2005-08-17

Similar Documents

Publication Publication Date Title
US7899669B2 (en) Multi-voice speech recognition
EP1800294B1 (en) System and methods for improving accuracy of speech recognition
JPH07507880A (ja) 複合ワードを有する言語のための音声認識装置
US8620668B2 (en) System and method for configuring voice synthesis
JP6675788B2 (ja) 検索結果表示装置、検索結果表示方法、及びプログラム
US20070016420A1 (en) Dictionary lookup for mobile devices using spelling recognition
US7769592B2 (en) Automatic selection of a disambiguation data field for a speech interface
US20210165831A1 (en) Search result display device, search result display method, and non-transitory computer readable recording medium
JPH06208389A (ja) 情報処理方法及び装置
JP3530109B2 (ja) 大規模情報データベースに対する音声対話型情報検索方法、装置および記録媒体
JP2003085197A (ja) 音声入力された複合名詞の検索装置、検索方法およびデータベース
JP3846896B2 (ja) 音声入力された複合名詞の検索装置、検索方法およびデータベース
JP4056546B2 (ja) 音声入力された複合名詞の検索装置、検索方法およびデータベース
Collingham et al. The Durham telephone enquiry system
JP3340163B2 (ja) 音声認識装置
JP3678360B2 (ja) 音声入力を利用する漢字文字列特定装置およびその方法
JP3663012B2 (ja) 音声による入力装置
JPS63163496A (ja) 並列検索照合型認識システム
JP3377684B2 (ja) 音声認識による検索装置
JP2004085826A (ja) 音声入力された複合名詞の検索装置および検索方法
JP3748429B2 (ja) 音声入力型複合名詞の検索装置および音声入力型複合名詞の検索方法
KR100867231B1 (ko) 상표명 발음의 음소배열 방법 및 음소배열 데이터베이스 구조, 유사 상표명 발음의 모집단 데이터베이스 구조, 상표데이터의 배열방법 및 그를 저장한 저장매체, 그리고, 유사 상표명 발음의 검색 시스템 및 방법
JP2000305590A (ja) 音声認識方法
JP2020021486A (ja) 検索結果表示装置、検索結果表示方法、及びプログラム
JPH09259144A (ja) 音声による情報検索装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050225

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050425

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050520

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050523

R150 Certificate of patent or registration of utility model

Ref document number: 3682958

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090603

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090603

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100603

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100603

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110603

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120603

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130603

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140603

Year of fee payment: 9

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350