JP4140248B2 - データベース検索装置 - Google Patents

データベース検索装置 Download PDF

Info

Publication number
JP4140248B2
JP4140248B2 JP2002059445A JP2002059445A JP4140248B2 JP 4140248 B2 JP4140248 B2 JP 4140248B2 JP 2002059445 A JP2002059445 A JP 2002059445A JP 2002059445 A JP2002059445 A JP 2002059445A JP 4140248 B2 JP4140248 B2 JP 4140248B2
Authority
JP
Japan
Prior art keywords
keyword
database
morpheme
entry
generation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2002059445A
Other languages
English (en)
Other versions
JP2003256458A (ja
Inventor
泰久 渡辺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Omron Corp
Original Assignee
Omron Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Omron Corp filed Critical Omron Corp
Priority to JP2002059445A priority Critical patent/JP4140248B2/ja
Publication of JP2003256458A publication Critical patent/JP2003256458A/ja
Application granted granted Critical
Publication of JP4140248B2 publication Critical patent/JP4140248B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、データベースの各エントリを検索するためのデータベース検索装置に関する。
【0002】
【従来の技術】
従来の音声対話データベース検索装置における、データベースの各エントリに対応する認識語彙の生成方法として、特開2000−504510号公報に開示の技術がある。
【0003】
この技術では、データベースのエントリに対応する3つの辞書を設ける。3つの辞書はそれぞれ、データベースエントリ、音声出力、入力語に対応弁別可能な表現を出力する。
【0004】
【発明が解決しようとする課題】
しかしながら、このような従来技術にあっては、データベースが大規模になるにつれ、辞書の構築に時間がかかる場合や、データの検索精度が低下するなどの問題がある。
【0005】
本発明の目的は、このような従来の問題点に着目してなされたもので、辞書の構築の時間を短縮し、データの検索性能を向上することが可能なデータベース検索装置を提供することを目的とする。
【0006】
【課題を解決するための手段】
上記目的を達成するために、本発明に係るデータベース検索装置は、データベースに格納されたエントリに対応するエントリを格納したIテーブルと、検索で用いるキーワードを格納したKテーブルと、音素文字列を格納したPテーブルと、前記Iテーブルに格納されたエントリと前記Kテーブルに格納されたキーワードとを対応付けるI−K対応テーブルと、前記Kテーブルに格納されたキーワードと前記Pテーブルに格納された音素文字列とを対応付けるK−P対応テーブルと、入力音声に対応する音素文字列を認識する音声認識手段と、前記音声認識手段の認識結果、前記Pテーブル、前記K−P対応テーブル及び前記I−K対応テーブル用いて前記データベースのエントリを検索する検索手段とを備えることを特徴とする。
【0007】
また、本発明に係るデータベース検索装置は、前記データベースのエントリに含まれる文字列を形態素に分解し、該分解結果を元に、あらかじめ定めた生成ルールを用いてキーワードを生成し、該生成されたキーワードを前記Kテーブルに格納するキーワード生成手段と、生成したキーワードのそれぞれに対し、前記キーワードを呼び出すための1つ以上の音素文字列を生成し、前記Pテーブルに格納する音素文字列生成手段とを備えることを特徴とする。
【0008】
また、本発明に係るデータベース検索装置は、前記キーワード生成手段は、前記データベースのエントリに含まれる文字列を形態素に分解する形態素解析手段と、前記キーワードを生成するための1つ以上の生成ルールを格納した生成ルール格納手段と、前記形態素解析手段の結果の信頼度を評価する解析結果評価手段と、前記解析結果評価手段の評価に基づいて、前記生成ルール格納手段に格納された生成ルールの中から生成ルールを選択する生成ルール選択手段と、前記選択された生成ルールに基づいて形態素を結合する形態素結合手段とを備えることを特徴とする。
【0009】
また、本発明に係るデータベース検索装置は、前記解析結果評価手段は、前記形態素解析結果に含まれる読み情報と、前記データベースのエントリ中の読み情報とを比較し、一致しない部分に対応する形態素の有無、及び一致しない部分に対応する形態素が有る場合はさらにその位置情報を用いて解析結果の評価を行うことを特徴とする。
【0010】
また、本発明に係るデータベース検索装置は、前記生成ルールに、前記形態素解析手段の生成した形態素の読みがデータベースのエントリ中の読みと一致しない場合、前記形態素解析手段の生成した形態素の正しい読みと同じ読みをもち、かつ形態素解析に成功したエントリがあれば、その結果を用いて解析結果を修復する生成ルールが含まれることを特徴とする。
【0011】
また、本発明に係るデータベース検索装置は、前記形態素解析手段は1個以上の解析結果を候補として解析結果評価手段に返し、前記解析結果評価手段は、前記形態素解析手段から返された形態素解析結果に含まれる読み情報と、前記データベースのエントリ中の読み情報とを比較し、読みの一致した解析結果候補を採用することを特徴とする。
【0012】
また、本発明に係るデータベース検索装置は、前記Iテーブルに格納されたエントリに対応する同義語テーブルを備え、前記キーワード生成手段は、前記同義語テーブルのエントリに含まれる文字列を形態素に分解し、該分解結果を元に、あらかじめ定めた生成ルールを用いてキーワードを生成し、前記Kテーブルに格納することを特徴とする。
【0013】
また、本発明に係るデータベース検索装置は、前記生成ルールに、モーラ数があらかじめ定めた範囲を超え、かつ、完全一致でないキーワードの生成を抑制する生成ルールが含まれることを特徴とする。
【0014】
また、本発明に係るデータベース検索装置は、優先キーワードを格納した優先キーワード辞書を備え、前記生成ルールに、形態素解析結果をまとめ上げる際、まとめた形態素が優先キーワード辞書に格納された前記優先キーワードと一致する場合、他の生成ルールにかかわらず前記まとめた形態素をキーワードとする生成ルールが含まれることを特徴とする。
【0015】
また、本発明に係るデータベース検索装置は、前記優先キーワード辞書は格納されたエントリ固有の生成ルールを格納し、前記キーワード生成手段は、前記形態素解析手段が生成した結果に含まれる形態素のいくつかが前記優先キーワード辞書に含まれる場合、その形態素に関してはあらかじめ定めた生成ルールによらず、前記優先キーワード辞書に格納された前記エントリ固有の生成ルールに従って前記Kテーブルに格納されるキーワードを生成することを特徴とする。
【0016】
また、本発明に係るデータベース検索装置は、前記Pテーブルに格納されたエントリと前記Iテーブルに格納されたエントリとの対応付けを格納したI−P対応テーブルを備え、前記検索手段は、前記音声認識手段の認識結果及び前記I−P対応テーブルを用いて、PテーブルのエントリからIテーブルのエントリを参照して検索を実行することを特徴とする。
【0017】
また、本発明に係るデータベース検索装置は、前記I−P対応テーブルを格納する音声認識辞書を備え、前記音声認識手段が、該音声認識辞書に格納された前記I−P対応テーブルに基づいてIテーブルのエントリを出力することを特徴とする。
【0018】
この発明によれば、データベースの各エントリに対応する項目をもつテーブル(以下、Iテーブル)と、検索で用いるキーワードを格納したテーブル(以下、Kテーブル)と、音声認識で使う音素文字列を格納したテーブル(以下、Pテーブル)と、IテーブルとKテーブル及びKテーブルとPテーブルの各エントリを関連付ける対応情報としてのI−K対応テーブル及びK−P対応テーブルとを備える構成とすることにより、大規模データベースの音声認識辞書の構築が高速化できる。
【0019】
また、本発明では、形態素解析手段と、解析結果評価手段と、生成ルール選択手段と、生成ルール格納手段と、キーワード生成手段とを備える構成にすることにより、大規模データベースの音声認識辞書の構築をより高速化できる。
【0020】
また、本発明では、発音のゆれや意味のゆれを吸収するメカニズムにより検索精度が向上できる。
【0021】
また、本発明では、音声認識上の環境の違い(認識エンジンの種類、マイクの特性、周囲の雑音など)に応じて、発話バリエーション単体のチューニングが行える。
【0022】
また、本発明では、アプリケーションの仕様の違い(完全一致のみ許可、ターゲットユーザの層など)に応じて、検索キーのバリエーション(キーワード分割方法や同義語の扱い)を認識側と独立に調整することができる。
【0023】
また、本発明では、形態素解析結果のよくないデータベースエントリに対しても、可能な限り正しく分割された部分一致検索キーワードの生成ができる。
【0024】
ここで、請求項について説明を加える。請求項において、「前記形態素解析手段は1個以上の解析結果を候補として解析結果評価手段に返し」の「返し」とは、解析結果を解析結果評価手段に対して出力することを意味する。
【0025】
また、「前記解析結果評価手段は、前記形態素解析手段から返された形態素解析結果に含まれる読み情報と、前記データベースのエントリ中の読み情報とを比較し、読みの一致した解析結果候補を採用する」の「採用」とは、複数個の解析結果の中から、最も適した結果を選択することを意味する。
【0026】
また、請求項以外の発明では、形態素解析手段が出力する解析結果はただ一つである。そして、解析結果評価部は、その唯一の解析結果に対して、例えば後述の図10のステップ114で説明するような結果の評価を行う。
【0027】
これに対し、請求項に記載の発明では、請求項に記載した形態素解析手段は、複数個の解析結果候補を出力することを想定している。
【0028】
そして、請求項に記載の発明では、複数の解析結果を受け取った解析結果評価手段は、その中から最適なものを選択する。
【0029】
そして、請求項に記載の発明では、その選択の基準として、読みの一致を用いる。こうすることにより、請求項に記載の発明では、ルール1が適用されるデータを増やすことができる。
【0030】
言い換えると、請求項に記載の発明以外では、形態素解析手段だけが最適な解析結果の選択を行うが、請求項に記載の発明では、形態素解析手段と解析結果評価手段の両方が最適な解析結果の選択を行うといえる。
【0031】
次に、請求項に記載の発明について説明を加える。請求項において、「完全一致でない」という記載があるのは、文字列の短いデータエントリに対処するためである。
【0032】
つまり、モーラ数による生成キーワードの制限は、認識率向上のために必要な処理であるが、一律にモーラ長制限をしてしまうと、もともと短い文字列のエントリに対するキーワードがすべて除外されてしまう。
【0033】
これを防ぐため、請求項に記載の発明では、完全一致のキーワード(=データエントリの読みそのものに対しては、モーラ数制限の対象外とした。
【0034】
次に、請求項に記載の発明について説明を加える。請求項に記載の発明は、請求項で記述したI−P対応テーブルを「音声認識辞書」の中に含めることで、検索時の処理を軽減するものである。
【0035】
【発明の実施の形態】
以下に図面を参照して、この発明の好適な実施の形態を例示的に詳しく説明する。ただし、この実施の形態に記載されている構成部品の寸法、材質、形状、その相対配置などは、特に特定的な記載がない限りは、この発明の範囲をそれらのみに限定する趣旨のものではない。
【0036】
また、以下の図面において既述の図面に記載された部材と同様の部材には同じ番号を付す。
【0037】
(データベース検索装置の第1の実施形態)
まず、本発明に係るデータベース検索装置の第1の実施形態について説明する。本実施形態は、音声入力を用いてデータベース検索を行うデータベース検索装置において、認識に必要な単語を自動的に生成する機能を備えたデータベース検索装置である。
【0038】
図1は、本発明に係るデータベース検索装置の第1の実施形態を用いたアプリケーションのイメージ図である。図1に示されるように、本実施形態は、音声を用いて、書籍情報や楽曲情報などの大規模データベースを検索する手段を提供するものである。
【0039】
本発明に係るデータベース検索装置の第1の実施形態は、発話された検索キーワードに従って、順に絞り込み検索を行い、検索結果を音声で出力する。
【0040】
検索キーワードには、データエントリ中の文字列(例:書籍の題名)の一部も含まれる。つまり、検索したいデータの一部を話すだけでもよいようになっている。
【0041】
図2は、本発明に係るデータベース検索装置の第1の実施形態の動作の概略を示した概略図である。本実施形態では、与えられたデータベース2から、音声認識部4に与える音声認識辞書3を生成する。
【0042】
データベース2から音声認識辞書3を生成する過程において3層のテーブルを設ける。3つのテーブルは、データベース参照テーブル、検索キーワードテーブル、音素文字列テーブルからなる。
【0043】
データベース参照テーブルは、データベースの各エントリに対応付けられており、表記と読みをもったテーブルである。
【0044】
検索キーワードテーブルは、発話されるキーワードを持つテーブルである。音素文字列テーブルは、音声認識部3が出力する認識結果に対応する音素文字列を持つテーブルである。
【0045】
データの一部だけを発話しても検索できるよう、検索キーワードテーブルには、データベース参照テーブルの文字列の部分文字列も含まれている。これらの文字列は、形態素解析を用いてデータベース参照テーブルのエントリ文字列を形態素に分割した後、特定のルールに従って生成される。
【0046】
また、検索キーワードテーブルの各エントリから、音素文字列テーブルを生成する。
【0047】
音素文字列テーブルの生成では、元になる検索キーワードテーブルのエントリに対し、発音のゆれを考慮したバリエーションを生成し、音素文字列テーブルに格納する。
【0048】
最後に、音素文字列テーブルを用いて音声認識辞書を生成する(なお、本実施形態では、後者の認識辞書の生成アルゴリズムについては言及しない。)。
【0049】
図3は、本発明に係るデータベース検索装置の第1の実施形態の概略ブロック図である。101は、音声認識辞書110を用いて入力された音声データを認識する音声認識部である。
【0050】
102は、K−P対応テーブル107、I−K対応テーブル105を元に1つ以上の音声認識結果を用いてデータベース内を検索し、あらかじめ定めた出力結果を出力する検索部である。
【0051】
103は、検索結果を出力する音声出力部である。104は、データベース109の各エントリに対応し、検索に使用する表記文字列および読み文字列を少なくとも含むデータベース参照テーブル(以下、Iテーブルと呼ぶ)である。
【0052】
106は、データベース参照テーブル104の文字列を音声で呼び出すための部分文字列を保持する検索キーワードテーブル(以下、Kテーブルと呼ぶ)である。
【0053】
108は、検索キーワードテーブル106の文字列を発音するための音素文字列を保持する音素文字列テーブル(以下、Pテーブルと呼ぶ)である。
【0054】
105は、データベース参照テーブル104と検索キーワードテーブル106の各エントリの対応づけを格納するI−K対応テーブルである。
【0055】
107は、検索キーワードテーブル106と音素文字列テーブル108の各エントリの対応づけを保持するK−P対応テーブルである。109は、検索対象となるデータベースである。
【0056】
110は、音声認識対象となる単語を格納した音声認識辞書である。111は、データベース参照テーブル104の各エントリから検索キーワードを生成する検索キーワード生成部である。
【0057】
112は、検索キーワードテーブル106の各エントリから音声認識用の音素文字列を生成する音素文字列生成部である。
【0058】
113は、音素文字列テーブル108の各エントリから音声認識辞書110を生成する音声認識辞書生成部である。
【0059】
ここで、図3においては、音声認識辞書生成部113および音声認識辞書110を設けているが、音声認識部101を抽象的にとらえるのなら、音声認識辞書生成部113および音声認識辞書110が不要になる場合がある。
【0060】
したがって、音声認識部101が直接、Pテーブル108を参照するようにしても良い。
【0061】
図4は、図3における検索キーワード生成部111の構成を説明したブロック図である。
【0062】
201は、入力文字列中に含まれる特殊記号などに読みを与えたり、読み文字列の不備を補うなど、形態素解析の前処理を行う前処理部である。
【0063】
202は、形態素解析を行い、形態素に分割した結果とそれらの読み情報を生成して返す形態素解析部である。
【0064】
203は、形態素解析部202が出力した読み情報と、データがもつ読み情報とを比較して評価し、評価結果を出力する解析結果評価部である。
【0065】
204は、解析結果評価部203の結果をもとに、最適なキーワード生成ルールを選択する生成ルール選択部である。
【0066】
205は、生成ルール選択部204で選択されたルールに基づいて、形態素同士を結合し、検索用部分文字列を生成する形態素結合部である。
【0067】
206は、1つ以上の生成ルールを保持する生成ルールセットである。
【0068】
次に、Iテーブルについて説明する。図5は、本発明に係るデータベース検索装置の第1の実施形態のIテーブルの概念図である。
【0069】
図5において、「iID」は、各エントリ固有の番号である。「属性の種類」は、そのエントリがデータベース中のどの属性をもつかを示した値である。
【0070】
図5において、「表記」は、そのエントリを表現する文字列である。この文字列をもとに、検索キーワードを生成する。
【0071】
図5において、「読み」は、表記の読み方をかなで表した文字列である。形態素解析の際の解析結果評価部で参照される。
【0072】
次に、Kテーブルについて説明する。図6は、本発明に係るデータベース検索装置の第1の実施形態におけるKテーブルの概念図である。
【0073】
図6において、「kID」は、各エントリ固有の番号であり、「読み」は「表記」の読み方をかなで表した文字列である。
【0074】
次に、I−K対応テーブルについて説明する。図7は、本発明に係るデータベース検索装置の第1の実施形態においてI−K対応テーブルの概念図である。
【0075】
図7において、「iID」は、Iテーブルのエントリ固有の番号であり、「kID」は、Kテーブルのエントリ固有の番号である。
【0076】
図7において、「出現位置フラグ」は、kIDに対応する文字列がiIDに対応する文字列のどの位置から抽出した文字列かを示す値である。
【0077】
次に、Pテーブルについて説明する。図8は、本発明に係るデータベース検索装置の第1の実施形態におけるPテーブルの概念図である。
【0078】
図8において、「pID」は、各エントリ固有の番号である。
【0079】
図8において、「音素列」は、Kテーブルのエントリから生成された、発音を表す文字列である。これは音声認識部101で使用される。
【0080】
次に、K−P対応テーブルについて説明する。図9は、本発明に係るデータベース検索装置の第1の実施形態におけるK−P対応テーブルの概念図である。
【0081】
図9において、「kID」は、Kテーブルのエントリ固有の番号であり、「pID」は、Pテーブルのエントリ固有の番号である。
【0082】
次に、本発明に係るデータベース検索装置の第1の実施形態におけるテーブル生成動作について図10を参照して説明する。図10は、本発明に係るデータベース検索装置の第1の実施形態におけるテーブル生成処理のフローチャートである。
【0083】
ステップ111で、検索キーワード生成部104がデータベース参照テーブルから、iID、表記文字列、読み文字列の3つ組みを読み込む。
【0084】
ステップ112で、検索キーワード生成部104が形態素解析にかける前の前処理を行う。前処理の例としては、不要な記号類の削除、特殊な省略により表記と読みが対応しない場合の修正などがあげられる。データベースの内容に依存したものが中心である。
【0085】
ステップ113で、検索キーワード生成部104が前処理を行った表記文字列を形態素解析する。形態素解析には公知の解析モジュールを用いるが、形態素に分割された結果と、読み情報が生成されるものとする。
【0086】
ステップ114で、形態素解析部が生成した読みとデータベース参照テーブルの読みとを比較し、読みが一致しない箇所に対応する形態素の有無、及びその位置情報を求める。
【0087】
ステップ115で、検索キーワード生成部111は、読みが一致する、すなわち形態素解析が成功した場合は、ルール1(読み一致用ルール)を適用してキーワードの集合を生成する。検索キーワード生成部111は、読みが一致せず、かつ一致しない箇所が生成した形態素の境界に収まる場合は、ルール2(読み不一致用ルール)を適用してキーワードの集合を生成する。検索キーワード生成部111は、それ以外の場合、ルール3を適用する。
【0088】
ステップ120で、検索キーワード生成部111は、生成されたキーワードの集合からキーワードを1個取り出し、なくなればステップ111に戻る。
【0089】
ステップ121で、検索キーワード生成部111は、取り出したキーワードと同一の表記および読みをもつキーワードがすでに検索キーワードテーブルにないか調べる。ない場合は、新たに重複しないIDをそのキーワード用に採番し、検索キーワードテーブルにIDと表記・読みを追加する。
【0090】
ある場合は、検索キーワード生成部111は、そのIDを得て、kIDと置く。ステップ122で、検索キーワード生成部111は、ステップ111で取得したiIDと、ステップ121で求めたkIDとの対応情報を、I−K対応テーブルに格納する。
【0091】
次に、ルール1処理について説明する。ルール1は、形態素解析に成功した際に実行されるキーワード分割のアルゴリズムである。ルール1は、与えられた形態素の部分列が、以下の1〜4のいずれかに該当する場合、キーワードとして適合しないと定める。
【0092】
1.接頭語または接尾語と連接する自立語があり、その接頭語または接尾語と自立語との間で区切れている組み合わせ
例:「第/一/級」→(「第」「一」「級」のようには切らない)
【0093】
2.自立語の後ろに、「格助詞・係助詞・連体化助詞」以外の付属語が1個以上連接し、かつその連接部分で区切れている組み合わせ。
なお、付属語には形式動詞などの非自立語相当語を含む。
例:「書い/て」→(「書い」と「て」には切らない)
例:「泣い/て/い/ます」→(「泣いて」と「います」には切らない)
【0094】
3.「格助詞・係助詞・連体化助詞」が先頭に来る組み合わせ
例:「秘密/の/花園」→(「の」「の花園」は生成させない)
【0095】
4.別途定義したノイズワードが単独で現れた組み合わせ
対象:「こと」「とき」「もの」など
例:「どんな/こと/で/も」(「こと」は生成させない)
【0096】
次に、上述のルール1の処理について図11を参照して説明する。図11は、本発明に係るデータベース検索装置の第1の実施形態におけるルール1のフローチャートである。
【0097】
ステップ201で、検索キーワード生成部111は、与えられた形態素列を順にS[0],S[1],・・,S[n−1]に代入する。ここでnは形態素数とする。
【0098】
検索キーワード生成部111は、ステップ202,ステップ203で、形態素列の全部分列を取り出すため、始点i・終点jの2重ループを構成する。
【0099】
検索キーワード生成部111は、ステップ204で、形態素列の部分列S[i],S[i+1],...,S[j]に対し、ルール適合のチェックをする。
【0100】
適合する場合、検索キーワード生成部111は、その部分形態素列を結果リストに追加して、ループを継続する。
【0101】
次に、ルール2について説明する。ルール2は、形態素解析の一部が不成功だったが、不成功の箇所が生成した形態素の境界に一致している場合に適用されるキーワード分割のアルゴリズムである。
【0102】
例として、当て字など、形態素がそのデータ中で特殊な読みを持ち、かつその前後までは正しく解析できている場合に該当する。
【0103】
次に、ルール2について図12を参照して説明する。図12は、本発明に係るデータベース検索装置の第1の実施形態におけるルール2のフローチャートである。
【0104】
検索キーワード生成部111は、ステップ301で、与えられた形態素列のうち、読みの一致しない箇所に該当する元データの読みをYとする。
【0105】
ステップ302で、検索キーワード生成部111は、データベース参照テーブルを検索し、読みがYで、かつ分割に成功しているエントリを検索する。
【0106】
そのようなエントリが見つかった場合、検索キーワード生成部111は、そのエントリに対して行われた形態素の分割と同じ方法で読みYを区切った後、結果の形態素列に反映する(ステップ303,304)。
【0107】
ここで、ステップ304及びステップ305について説明する。
[ステップ304の例]
元データ表記「小春日和」 元データ読み「インディアンサマー」
形態素解析結果「小春日和」「コハルビヨリ」
データベース中に、次の項目があったとする
元データ表記「インディアンサマー」 元データ読み「インディアンサマー」
形態素解析結果「インディアン/サマー」 「インディアン/サマー」
【0108】
この結果を用いて不一致部分を置換
ルール適用結果「小春日和」「インディアン/サマー」
【0109】
[ステップ305の例]
元データ表記「恋は賭け事」 元データ読み「コイハギャンブル」
形態素解析結果「恋/は/賭け事」「コイ/ハ/カケゴト」
ルール適用結果 「恋/は/賭け事」「コイ/ハ/ギャンブル」
【0110】
そのようなエントリが見つからなかった場合、検索キーワード生成部111は、一致しない形態素列をひとつの形態素にまとめ上げ、品詞を名詞とし、読みをYとした後、結果の形態素列に反映する(ステップ303,305)。ステップ306で、検索キーワード生成部111は、修正した形態素列に対し、ルール1を適用する。
【0111】
ここで、上記ルール2における説明についてさらに詳細に説明を加える。
【0112】
まず、上述の「読みYを区切」るとは、「読みYを(正しいと思われる)形態素に区切る」という意味である。
【0113】
すなわち、過去の解析結果の中に成功例があった場合、その結果と同じ区切り方を用いて現在対象としている結果の形態素列を区切る、ということを指す。
【0114】
また、上述の「結果の形態素列に反映する。」とは、「結果の形態素列」のうち、当該失敗箇所を、上述の「形態素に区切った読みY」で置き換える、という意味である。これは、結果の形態素列を、過去の成功例を用いて修復することに相当する。
【0115】
また、上述の「一致しない形態素列をひとつの形態素にまとめ上げ」とは、読みの一致しない箇所にある文字列を、名詞相当の形態素一つとみなした後、置き換える、という意味である。
【0116】
これは、過去の成功例がなかったため、失敗箇所を1語の名詞とみなして、結果の形態素列を修復することに相当する。
【0117】
次にルール3について説明する。ルール3は、ルール1・ルール2のいずれにも該当しないケース、つまり形態素解析に失敗していて、かつ単語の入れ替えでは修復が不可能な場合に適用されるキーワード分割のアルゴリズムである。
【0118】
図13は、本発明に係るデータベース検索装置の第1の実施形態におけるルール3のフローチャートである。
【0119】
ステップ311で、検索キーワード生成部111は、元データの表記文字列中に、あらかじめ定めた区切り文字(句読点、中黒やダッシュ記号など)が含まれるかどうかチェックする。含まれない場合、検索キーワード生成部111は、これ以上のキーワード分割はあきらめ、全体をひとつのキーワードとして生成し、終了する(ステップ312,314)。
【0120】
含まれる場合、検索キーワード生成部111は、形態素解析結果の読み文字列にも区切り文字が含まれているため、これと、元データの読み文字列(こちらは一般に、区切り文字が含まれていない)と比較し、後者に区切り文字を挿入する。区切り位置の推定には公知の文書比較アルゴリズムを用いる(ステップ313)。
【0121】
検索キーワード生成部111は、区切られた読み・表記のそれぞれに対し、ルール1〜3を再帰的に適用し、生成されたすべてのキーワード文字列を結果とする(ステップ315)。
【0122】
次に、検索実行時の動作について説明する。図14は、本発明に係るデータベース検索装置の第1の実施形態における検索実行時の処理のフローチャートである。
【0123】
本実施形態のデータベース検索装置は、検索条件をクリアし(ステップ401)、ガイダンス出力後(ステップ402)、ステップ403で、音声認識部からの入力を待つ。結果をpIDで表す。
【0124】
ステップ404において、本実施形態のデータベース検索装置は、pIDが終了したか否かを判断し、終了していれば動作を終え、終了していなければ、ステップ405に移行する。
【0125】
ステップ405で、検索部102が、K−P対応テーブル、I−K対応テーブルを順にたどり、認識結果のpIDに対応するiIDの集合を得る。ステップ406で、検索部102がこの集合を用いてデータベース検索を行う。
【0126】
そして、本実施形態のデータベース検索装置は、ステップ407において検索結果件数を判別し、事前にnを定めておいて件数nよりもおおきければステップ408に移行し、n以下であればステップ409に移行し、0であればステップ410に移行する。
【0127】
本実施形態のデータベース検索装置は、ステップ408では、追加検索キーワードを促すガイダンスを出力し、ステップ409では、検索結果を出力し、ステップ410では、「検索結果がない」旨をガイダンス出力する。
【0128】
このように、本発明に係るデータベース検索装置の第1の実施形態によれば、データベース109のエントリを格納したデータベース参照テーブル(Iテーブル)104、検索するためのキーワードを格納した検索キーワードテーブル(Kテーブル)106、音素文字列を格納した音素文字列テーブル(Pテーブル)108を作成し、さらに、これらのテーブルを対応付けるI−K対応テーブル105及びK−P対応テーブル107を作成することにより、辞書の構築の時間を短縮し、データの検索性能を向上することができる。
【0129】
なお、本実施形態の別形態として、形態素解析部の処理を変更したものも考えられる。
【0130】
すなわち、形態素解析部は複数の解析結果を候補として返すことができそれらの結果のうち、読みがIテーブルのエントリにある元データと一致するものを採用するようにしてもよい。このようにすることにより、形態素解析の精度の向上を図ることができる。
【0131】
また、別の形態として、テーブル間の対応付けの処理を変更したものも考えられる。
【0132】
すなわち、PテーブルとIテーブルとの直接の対応付けをもつテーブル(I−P対応テーブル)をもちI−K対応テーブル、K−P対応テーブルを結合した対応づけを事前に格納しておき、検索実行時にはI−P対応テーブルを直接参照して検索を実行するような構成にしてもよい。こうすることにより、検索速度の高速化を図ることができる。
【0133】
また、別の形態として、音声認識辞書の構成を変更したものも考えられる。すなわち、音声認識部が返す値として音素列ではなくIテーブルのID(iID)を直接返すようにする。iIDは同時に複数個返すことを可能とする。
【0134】
音声認識辞書の生成時に、I−K対応テーブル、K−P対応テーブルの対応付けを用いて音声認識辞書に対応するiIDを格納する。
【0135】
検索実行時には音声認識部の返す値(複数個の可能性あり)を用いて直接データベースを検索するような構成にしてもよい。こうすることにより、検索速度の高速化を図ることができる。
【0136】
(データベース検索装置の第2の実施形態)
次に、本発明に係るデータベース検索装置の第2の実施形態について説明する。本実施形態は、第1の実施形態において、Kテーブルに部分発話キーワードに加えて同義語を登録できるようにしたものである。
【0137】
なお、本実施形態の説明において、前述の第1の実施形態を構成する部品と同じ番号を付された部品は、前述の第1の実施形態を構成する部品と同様の構成及び動作をなすため、その詳細な説明は省略する。
【0138】
図15は、本発明に係るデータベース検索装置の第2の実施形態の動作の概略を示した概略図である。本実施形態では、第1の実施形態に加えて、Iテーブルのエントリに対しその同義語が登録されている。同義語は事前に用意した同義語テーブルから取得する。
【0139】
図16は、本発明に係るデータベース検索装置の第2の実施形態の概略ブロック図である。114は、Iテーブルのエントリに対しその同義語が登録される同義語テーブルである。
【0140】
図17は、本発明に係るデータベース検索装置の第2の実施形態における同義語辞書の概念図である。「iID」は、同義語の登録対象となるデータベース参照テーブルのエントリのidである。
【0141】
図17において、「同義語表記」は、その同義語を表現する文字列である。本実施形態のデータベース検索装置は、データベース参照テーブルと同様、この文字列を元に、検索キーワードを生成する。
【0142】
図17において、「同義語読み」は、その同義語をかなで表した文字列である。本実施形態のデータベース検索装置はこの「同義語読み」を、データベース参照テーブルと同様、形態素解析の際の検索結果評価部で参照する。
【0143】
図18は、本発明に係るデータベース検索装置の第2の実施形態のフローチャートである。
【0144】
ステップ1801において、Kテーブル、I−K対応テーブルをクリアする。ステップ1802で、データベース参照テーブルについて第1の実施形態にある処理を行い、KテーブルおよびI−K対応テーブルを生成する。
【0145】
ステップ1803で、同様に同義語テーブルに対して、第1の実施形態と同様の処理を行う。
【0146】
この際、データベース参照テーブルを同義語テーブルと読み替えて処理を行う。さらに、生成結果はステップ1802で生成したKテーブル、I−K対応テーブルに追加する形で行う。このようにすることで、kIDの採番を統合する。
【0147】
したがって、本発明に係るデータベース検索装置の第2の実施形態によれば、前述の本発明に係るデータベース検索装置の第1の実施形態と同様の効果を得ることができると共に、同義語に基づくデータの検索を行うこともできる。
【0148】
(データベース検索装置の第3の実施形態)
本実施形態は、第1の実施形態において、音声認識処理上の都合などにより生成キーワードの個数を調整できるように、キーワード生成の処理を変更したものである。
【0149】
したがって本実施形態では前述の第1の実施形態と略同様の構成及び動作となるが、以下の説明では主に、前述の第1の実施形態と異なる構成及び動作の部分について説明する。
【0150】
生成ルール中に、キーワードのモーラ数による制限を設ける。ここで、モーラとは音声における一定の長さの単位で、日本語の場合通常かな1文字が1モーラに相当する。ただし「きゃ」などの拗音はそれ全体で1モーラとなる。俳句などで用いる五七五の拍の単位に相当する。
【0151】
生成したキーワードのうち、あらかじめ指定したモーラ数の範囲を超えるものを生成キーワードから除外する。それと同時に、検索キーワードとして必ず採用する語を格納した優先キーワード辞書を設ける。形態素解析結果が優先キーワード辞書内の単語を含んでいる場合、その単語については、モーラ数の制限にかかわらず生成結果に含めるようにする。
【0152】
これにより、キーワードとして広く使用される単語が除外されることを防ぐことができる。
【0153】
図19は、本発明に係るデータベース検索装置の第3の実施形態における検索キーワード生成部の概略ブロック図である。図19において、図4に示される部品と同様の部品についての説明は省略する。
【0154】
207は、モーラ数制限値208によらずキーワードとして用いることのできる単語を登録した優先キーワード辞書である。
【0155】
208は、生成キーワードをモーラ数で制限するための範囲(最小値および最大値)を表したモーラ数制限値である。
【0156】
図20は、本発明に係るデータベース検索装置の第3の実施形態において使用される優先キーワード辞書の概念図である。
【0157】
図20において、「表記」は、優先キーワードのエントリを表現する文字列である。
【0158】
図20において、「読み」は、優先キーワードの表記の読み方をかなで表した文字列である。
【0159】
図20において、「生成キーワード」は、そのエントリの語をどのような検索キーワードに展開するかを示したものである。
【0160】
この構成例では、次のような意味を表す。生成キーワード中に「ビジネスモデル」が含まれた場合、「ビジネスモデル」をそれ以上分割せずにキーワードを展開する。つまり、「ビジネス」「モデル」のように分割しない。
【0161】
生成キーワード中に「受注」が含まれた場合、「受注」をそれ以上分割せずにキーワードを展開する。その際、「受注」の部分の読みとして、「ジュチュー」「ウケチュー」の両方を用いて展開する。
【0162】
図21は、本発明に係るデータベース検索装置の第3の実施形態のフローチャートである。図21において、ステップ111からステップ120までの動作は、図10におけるそれぞれの対応するステップの動作と略同様であるため、その詳細な説明を省略する。
【0163】
ステップ2101、ステップ2102で、生成したキーワードがモーラ数制限値の範囲内か、または優先キーワード辞書に登録されている場合は、検索キーワード生成部111は、第1の実施形態と同様の方法でキーワードをKテーブルに格納する。そうでなければそのキーワードを採用しない。
【0164】
ステップ2103で、検索キーワード生成部111は、キーワードが優先キーワード辞書に登録されている場合は、そこに記された生成キーワードに従ってキーワードを展開して生成する。
【0165】
そして、ステップ2104において、検索キーワード生成部111は、検索キーワードテーブルになければ、新たにIDを採番(→kID)し、検索キーワードテーブルに格納する。
【0166】
そして、ステップ2105において、検索キーワード生成部111は、iIDとkIDの対応付け情報をI−K対応テーブルに格納し、その後ステップ120に移行する。
【0167】
したがって、本実施形態によれば、前述の第1の実施形態と同様の効果を得ることができると共に、音声認識処理上の都合などがあっても、容易に生成キーワードの個数を調整することができる。
【0168】
【発明の効果】
以上説明したように、本発明は、それぞれデータベースのエントリ、検索するためのキーワード、音素文字列を格納した3つのテーブルを作成し、さらに、これらのテーブルを対応付けるテーブルを作成することにより、辞書の構築の時間を短縮し、データの検索性能を向上することが可能なデータベース検索装置を提供することができる。
【図面の簡単な説明】
【図1】本発明に係るデータベース検索装置の第1の実施形態を用いたアプリケーションのイメージ図である。
【図2】本発明に係るデータベース検索装置の第1の実施形態の動作の概略を示した概略図である。
【図3】本発明に係るデータベース検索装置の第1の実施形態の概略ブロック図である。
【図4】図3における検索キーワード生成部111の構成を説明したブロック図である。
【図5】本発明に係るデータベース検索装置の第1の実施形態のIテーブルの概念図である。
【図6】本発明に係るデータベース検索装置の第1の実施形態におけるKテーブルの概念図である。
【図7】本発明に係るデータベース検索装置の第1の実施形態においてI−K対応テーブルの概念図である。
【図8】本発明に係るデータベース検索装置の第1の実施形態におけるPテーブルの概念図である。
【図9】本発明に係るデータベース検索装置の第1の実施形態におけるK−P対応テーブルの概念図である。
【図10】本発明に係るデータベース検索装置の第1の実施形態におけるテーブル生成処理のフローチャートである。
【図11】本発明に係るデータベース検索装置の第1の実施形態におけるルール1のフローチャートである。
【図12】本発明に係るデータベース検索装置の第1の実施形態におけるルール2のフローチャートである。
【図13】本発明に係るデータベース検索装置の第1の実施形態におけるルール3のフローチャートである。
【図14】本発明に係るデータベース検索装置の第1の実施形態における検索実行時の処理のフローチャートである。
【図15】本発明に係るデータベース検索装置の第2の実施形態の動作の概略を示した概略図である。
【図16】本発明に係るデータベース検索装置の第2の実施形態の概略ブロック図である。
【図17】本発明に係るデータベース検索装置の第2の実施形態における同義語辞書の概念図である。
【図18】本発明に係るデータベース検索装置の第2の実施形態のフローチャートである。
【図19】本発明に係るデータベース検索装置の第3の実施形態における検索キーワード生成部の概略ブロック図である。
【図20】本発明に係るデータベース検索装置の第3の実施形態において使用される優先キーワード辞書の概念図である。
【図21】本発明に係るデータベース検索装置の第3の実施形態のフローチャートである。
【符号の説明】
2 データベース
3 音声認識辞書
4 音声認識部
101 音声認識部(音声認識手段)
102 検索部(検索手段)
103 音声出力部
104 データベース参照テーブル(Iテーブル)
105 I−K対応テーブル
106 検索キーワードテーブル(Kテーブル)
107 K−P対応テーブル
108 音素文字列テーブル(Pテーブル)
109 データベース
110 音声認識辞書
111 検索キーワード生成部(キーワード生成手段)
112 音素文字列生成部(音素文字列生成手段)
113 音声認識辞書生成部
114 同義語テーブル
201 前処理部
202 形態素解析部(形態素解析手段)
203 解析結果評価部(解析結果評価手段)
204 生成ルール選択部(生成ルール選択手段)
205 形態素結合部(形態素結合手段)
206 生成ルールセット(生成ルール格納手段)
207 優先キーワード辞書
208 モーラ数制限値

Claims (9)

  1. データベースに格納されたエントリに対応するエントリを格納したIテーブルと、
    検索で用いるキーワードを格納したKテーブルと、
    音素文字列を格納したPテーブルと、
    前記Iテーブルに格納されたエントリと前記Kテーブルに格納されたキーワードとを対応付けるI−K対応テーブルと、
    前記Kテーブルに格納されたキーワードと前記Pテーブルに格納された音素文字列とを対応付けるK−P対応テーブルと、
    入力音声に対応する音素文字列を認識する音声認識手段と、
    前記音声認識手段の認識結果、前記Pテーブル、前記K−P対応テーブル及び前記I−K対応テーブル用いて前記データベースのエントリを検索する検索手段と
    を備えさらに、
    前記データベースのエントリに含まれる文字列を形態素に分解し、該分解結果を元に、あらかじめ定めた生成ルールを用いてキーワードを生成し、該生成されたキーワードを前記Kテーブルに格納するキーワード生成手段と、
    生成したキーワードのそれぞれに対し、前記キーワードを呼び出すための1つ以上の音素文字列を生成し、前記Pテーブルに格納する音素文字列生成手段と、
    を備えるデータベース装置であって、
    前記キーワード生成手段は、
    前記データベースのエントリに含まれる文字列を形態素に分解する形態素解析手段と、
    前記キーワードを生成するための1つ以上の生成ルールを格納した生成ルール格納手段と、
    前記形態素解析手段の結果の信頼度を評価する解析結果評価手段と、
    前記解析結果評価手段の評価に基づいて、前記生成ルール格納手段に格納された生成ルールの中から生成ルールを選択する生成ルール選択手段と、
    前記選択された生成ルールに基づいて形態素を結合する形態素結合手段と、
    を備え、
    前記解析結果評価手段は、前記形態素解析結果に含まれる読み情報と、前記データベースのエントリ中の読み情報とを比較し、一致しない部分に対応する形態素の有無、及び一致しない部分に対応する形態素が有る場合はさらにその位置情報を用いて解析結果の評価
    を行う
    ことを特徴とするデータベース検索装置。
  2. 前記生成ルールに、
    前記形態素解析手段の生成した形態素の読みがデータベースのエントリ中の読みと一致しない場合、前記形態素解析手段の生成した形態素の正しい読みと同じ読みをもち、かつ形態素解析に成功したエントリがあれば、その結果を用いて解析結果を修復する生成ルールが含まれることを特徴とする請求項に記載のデータベース検索装置。
  3. 前記形態素解析手段は1個以上の解析結果を候補として解析結果評価手段に返し、
    前記解析結果評価手段は、前記形態素解析手段から返された形態素解析結果に含まれる読み情報と、前記データベースのエントリ中の読み情報とを比較し、読みの一致した解析結果候補を採用することを特徴とする請求項に記載のデータベース検索装置。
  4. 前記Iテーブルに格納されたエントリに対応する同義語テーブルを備え、
    前記キーワード生成手段は、前記同義語テーブルのエントリに含まれる文字列を形態素に分解し、該分解結果を元に、あらかじめ定めた生成ルールを用いてキーワードを生成し、前記Kテーブルに格納することを特徴とする請求項に記載のデータベース検索装置。
  5. 前記生成ルールに、
    モーラ数があらかじめ定めた範囲を超え、かつ、完全一致でないキーワードの生成を抑制する生成ルールが含まれることを特徴とする請求項に記載のデータベース検索装置。
  6. 優先キーワードを格納した優先キーワード辞書を備え、
    前記生成ルールに、
    形態素解析結果をまとめ上げる際、まとめた形態素が優先キーワード辞書に格納された前記優先キーワードと一致する場合、他の生成ルールにかかわらず前記まとめた形態素をキーワードとする生成ルールが含まれることを特徴とする請求項に記載のデータベース検索装置。
  7. 前記優先キーワード辞書は格納されたエントリ固有の生成ルールを格納し、
    前記キーワード生成手段は、
    前記形態素解析手段が生成した結果に含まれる形態素のいくつかが前記優先キーワード辞書に含まれる場合、その形態素に関してはあらかじめ定めた生成ルールによらず、前記優先キーワード辞書に格納された前記エントリ固有の生成ルールに従って前記Kテーブルに格納されるキーワードを生成することを特徴とする請求項に記載のデータベース検索装置。
  8. 前記Pテーブルに格納されたエントリと前記Iテーブルに格納されたエントリとの対応付けを格納したI−P対応テーブルを備え、
    前記検索手段は、前記音声認識手段の認識結果及び前記I−P対応テーブルを用いて、PテーブルのエントリからIテーブルのエントリを参照して検索を実行することを特徴とする請求項1からのいずれか1項に記載のデータベース検索装置。
  9. 前記I−P対応テーブルを格納する音声認識辞書を備え、
    前記音声認識手段が、該音声認識辞書に格納された前記I−P対応テーブルに基づいてIテーブルのエントリを出力することを特徴とする請求項に記載のデータベース検索装置。
JP2002059445A 2002-03-05 2002-03-05 データベース検索装置 Expired - Fee Related JP4140248B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002059445A JP4140248B2 (ja) 2002-03-05 2002-03-05 データベース検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002059445A JP4140248B2 (ja) 2002-03-05 2002-03-05 データベース検索装置

Publications (2)

Publication Number Publication Date
JP2003256458A JP2003256458A (ja) 2003-09-12
JP4140248B2 true JP4140248B2 (ja) 2008-08-27

Family

ID=28669134

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002059445A Expired - Fee Related JP4140248B2 (ja) 2002-03-05 2002-03-05 データベース検索装置

Country Status (1)

Country Link
JP (1) JP4140248B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5821639B2 (ja) 2012-01-05 2015-11-24 株式会社デンソー 音声認識装置

Also Published As

Publication number Publication date
JP2003256458A (ja) 2003-09-12

Similar Documents

Publication Publication Date Title
US6223150B1 (en) Method and apparatus for parsing in a spoken language translation system
US6442524B1 (en) Analyzing inflectional morphology in a spoken language translation system
US6278968B1 (en) Method and apparatus for adaptive speech recognition hypothesis construction and selection in a spoken language translation system
US8352266B2 (en) System and methods for improving accuracy of speech recognition utilizing concept to keyword mapping
EP2317507B1 (en) Corpus compilation for language model generation
JP5440177B2 (ja) 単語カテゴリ推定装置、単語カテゴリ推定方法、音声認識装置、音声認識方法、プログラム、および記録媒体
US20020198713A1 (en) Method and apparatus for perfoming spoken language translation
JP2005010691A (ja) 音声認識装置、音声認識方法、会話制御装置、会話制御方法及びこれらのためのプログラム
JP2004005600A (ja) データベースに格納された文書をインデックス付け及び検索する方法及びシステム
JP2003036093A (ja) 音声入力検索システム
JP2004133880A (ja) インデックス付き文書のデータベースとで使用される音声認識器のための動的語彙を構成する方法
JP5073024B2 (ja) 音声対話装置
JPWO2010044123A1 (ja) 検索装置、検索用索引作成装置、および検索システム
KR100704508B1 (ko) N-gram 네트워크를 이용하는 한국어 연속음성인식의언어모델 적응장치 및 그 방법
JP2006243673A (ja) データ検索装置および方法
JP2006106748A (ja) 音声認識の精度を改善するためのシステムおよび方法
JP5623380B2 (ja) 誤り文修正装置、誤り文修正方法およびプログラム
Llitjós et al. Improving pronunciation accuracy of proper names with language origin classes
JP2005257954A (ja) 音声検索装置、音声検索方法および音声検索プログラム
JP4140248B2 (ja) データベース検索装置
JP2011007862A (ja) 音声認識装置、音声認識プログラム、および音声認識方法
JP2005284209A (ja) 音声認識方式
JP2007086404A (ja) 音声合成装置
JP2000276482A (ja) 文書検索装置及び文書検索方法
KR20040018008A (ko) 품사 태깅 장치 및 태깅 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050118

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080219

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080421

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080520

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080602

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110620

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110620

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120620

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees