JP3758241B2

JP3758241B2 - 音声情報検索装置

Info

Publication number: JP3758241B2
Application number: JP20377996A
Authority: JP
Inventors: 芳春阿部
Original assignee: Mitsubishi Electric Corp
Current assignee: Mitsubishi Electric Corp
Priority date: 1996-08-01
Filing date: 1996-08-01
Publication date: 2006-03-22
Anticipated expiration: 2016-08-01
Also published as: JPH1049187A

Description

【０００１】
【発明の属する技術分野】
本発明は、音声による入力を文字列として認識し、この文字列を手がかりとしてデータを検索する音声情報検索装置に関するものである。
【０００２】
【従来の技術】
図２０は従来の音声情報検索装置を示す構成図である。図において、４０は複数のデータ記事を記憶されているデータベース記憶部、４１は予めデータベース記憶部４１中の語彙の知識、文字列間の概念的な繋がりを記憶されている概念ネットワーク記憶部、４２は利用者の発声を入力する音声入力部、４３は音声認識用辞書部であり、予め発音記号を示す音節列と、この音節列に対応する文字列とを記憶された静的辞書と、後述する辞書生成部により生成された発音記号を示す音節列及び音節列に対応する文字列を記憶する動的辞書とを含んでいる。
【０００３】
４４は入力された音声を音節列とし、この音節列に対する複数の候補文字列を出力する音声認識部、４５は音声認識用辞書部４３の動的辞書に記憶する音節列及びこの音節列に対応する文字列を生成する辞書生成部、４６は候補文字列を指示する文字列入力部、４７は文字列入力部４６からの指示により候補文字列を選択し出力する文字列選択部、４８はデータベース記憶部４０を検索するデータベース検索部、４９は文字列選択部４７からの出力とデータベース検索部４８の検索結果とを表示出力する表示部である。５０は音声情報検索装置であり、上述の符号４０〜４９を付した構成を含んでいる。
【０００４】
次に従来の音声情報検索装置の動作を図２０により説明する。
利用者が音声入力部４２により音声入力をすると、音声認識部４４は、この入力された音声を音声認識用辞書部４３の静的辞書を用いて複数の候補文字列を文字列選択部４７に出力する。これら複数の候補文字列は文字列選択部４７から出力され表示部４９の画面上に表示される。
【０００５】
利用者が文字列入力部４６により、表示された複数の候補文字列の何れかを指定すると、文字列選択部４７は指定された候補文字列を選択しデータベース検索部４８と辞書生成部４５とに選択した候補文字列を出力する。
データベース検索部４８は文字列選択部４７からの候補文字列を手掛かりにデータベース記憶部４０を検索し、検索結果を表示部４９に出力する。表示部４９は検索結果を表示する。
【０００６】
辞書生成部４５は概念ネットワーク記憶部４１に記憶された文字列間の概念的な繋がりから、文字列選択部４７からの候補文字列に対して関連する文字列を求めさせ、求めた文字列に対応する音節列を生成し、求めた文字列と音節列とを音声認識用辞書部４３の動的辞書に記憶させる。即ち、辞書生成部４５は音声認識用辞書部４３の動的辞書に対して、所謂学習機能を持たせている。
【０００７】
また、再度利用者が音声入力部４２により音声入力を行うと、音声認識部４４は、辞書生成部４５により生成された音声認識用辞書部４３の動的辞書を用い、入力された音声に対する複数の候補文字列を文字列選択部４７に出力する。これら複数の候補文字列は文字列選択部４７から表示部４９に出力され画面上に表示される。また、これら複数の候補文字列は文字列選択部４７からデータベース検索部４８に出力され、データベース検索部４８がデータベース記憶部４０を検索し、検索結果を表示部４９に出力する。
【０００８】
【発明が解決しようとする課題】
従来の音声情報検索装置５０は、以上のように構成されているので、音声認識部４４による音声認識処理に先立ち、音声認識の対象となる単語や文等の文字列を予め音声認識用辞書部４３の静的辞書や動的辞書に記憶させる必要がある。この為、利用者が音声で入力できる単語や文等は、音声認識用辞書部４３の静的辞書や動的辞書に記憶された単語や文等に限定される。
特に、特許文や新聞記事の内容の検索や図書のタイトルの検索などのような文字列を手掛かりとして文献を検索する場合、特に、発音が同じでデータ中の文字列の表記が異なる同音意義語や送りがなの付け方や漢字の用い方の好みなどのいわゆる表記のゆれが存在するために検索のための単語や文の種類をあらかじめ限定できないことが多く、以上のような文献の検索を行うことは事実上不可能であるという問題がある。
【０００９】
また、音声認識部４４の認識対象が広いと単語や文等の種類が極めて大きくなるため、音声認識の認識性能が低下し、非常に多数の候補文字列が出力されるので、利用者が候補文字列から検索用の文字列を指定するに際し、利用者の負担が増加するという問題がある。
この問題に関して、学習機能を持つ音声認識用辞書部４３の動的辞書を用いることによりある程度利用者の負担を軽減できるが、音声認識用辞書部４３の動的辞書の生成には時間がかかるという問題がある。
【００１０】
この発明は、上述の問題を解決するためなされたもので、同音意義語や送りがなの付け方や漢字の用い方の好みなどの所謂表記のゆれの存在するデータ記事を検索でき、また、音声認識結果として出力される候補文字列を利用者が効率的に選択でき、また、辞書に文字列として登録されていない単語や文等でも検索を可能とする音声情報検索装置を得ることを目的とする。
【００１２】
【課題を解決するための手段】
この発明の音声情報検索装置は、複数のデータを記憶したデータベース部と、上記データに含まれる文字列を上記データが上記データベース部の何れに記憶されているかを示す索引を付与し索引文字列として抽出し記憶する索引部と、文節に区切られた音声を入力して文字列として認識して出力した少なくとも１つの候補文字列を有する第１の認識ブロックと上記候補文字列の信憑性を示す評価値とを出力する音声認識部と、上記索引文字列の索引を除いた文字列が上記データ中に出現する回数を上記索引文字列と対応させて記憶している文字列頻度記憶部と、上記音声認識部の出力を受け上記第１の認識ブロックから上記索引文字列と表記が一致しない候補文字列を削除して第２の認識ブロックと上記第２の認識ブロックの候補文字列の上記評価値とを求め、上記第２の認識ブロック内に同音異表記の異表記候補文字列がある場合には、上記異表記候補文字列毎に文字列が一致する上記索引文字列の出現回数を上記文字列頻度記憶部より求め、上記出現回数が多い異表記候補文字列の信憑性が上記出現回数が少ない異表記候補文字列の信憑性よりも高くなるように上記第２の認識ブロックの異表記候補文字列の評価値を補正し、上記第２の認識ブロックと補正後の上記第２の認識ブロックの候補文字列を出力するフィルタ部と、上記フィルタ部の出力を受け上記第２の認識ブロックの候補文字列を上記評価値に応じた順位で表示する表示部と、入力部からの指示により上記表示部に表示された上記候補文字列から所要の索引文字列を選択する文字列選択部と、上記所定の索引文字列と関連するデータを上記データベース部から検索するデータベース検索部と、を備えたものである。
【００１８】
【発明の実施の形態】
実施の形態１．
この発明の音声情報検索装置の一実施の形態を説明する。図１は、この発明の実施の形態１による音声情報検索装置を示す構成図である。図１において、図２０に示すものと同一又は相当部分には同一符号を付し説明を省略する。１はデータベース記憶部４０に記憶された複数のデータ記事に含まれる文字列を、複数のデータ記事がデータベース記憶部４０の何れに記憶されているか示す論理アドレスとともに、データベース記憶部４０から抽出し、この抽出した文字列と論理アドレスとを付与した索引文字列を記憶した索引部である。
【００１９】
２は索引部１が抽出した文字列と、文字列各々がデータ記事中に出現する回数とを出力する文字列頻度抽出部、３は予め文字列頻度抽出部２からの文字列と、文字列各々の出現回数とを記憶した文字列頻度記憶部である。４は入力された音声を音節列とし、この音節列に対する複数の候補文字列を出力する音声認識部、５は音声認識部４からの出力を受け、この出力に含まれる候補文字列を選別して出力するフィルタ部である。
６はフィルタ部からの出力をそのまま表示部４９に出力し、また、候補文字列を選択して出力する文字列選択部、７はデータベース記憶部４０を検索し検索結果を表示部４９に出力するデータベース検索部である。
８は音声情報検索装置１であり、上述の符号１〜７を付した構成及びデータベース記憶部４０と音声入力部４２と文字列入力部４６と表示部４９とを含んでいる。
【００２０】
図２は図１に示す索引部１の索引文字列と論理アドレスとの関係を示す説明図であり、１ａは索引文字列を記憶した索引文字列部、１ｂは索引文字列に付与された論理アドレス部である。
図３は図１に示す音声認識部４の詳細図であり、４ａは音声を音節に変換するための音響辞書及び音節ネットワーク部、４ｂは音声入力を発声ブロツク毎に音節又は音節列に変換して音節グラフを出力する音響処理部、４ｃは音節グラフを記憶する音節グラフ部、４ｄは音節グラフの音節に対応する文字列を記憶した辞書部、４ｅは文法規則を記憶した文法部、４ｆは、辞書部４ｄと文法部４ｅを用いて発声ブロツク毎の音節グラフの音節列に対応して候補文字列からなる認識ブロックを出力する言語処理部である。
【００２１】
次に動作を図１乃至図３により説明する。
利用者は、音声で検索のための文字列を１〜数文節ごとに区切って、音声入力部４２に音声入力する。例えば、／温泉の／人気に／関する／記事／、あるいは／湾岸戦争の／停戦の／記事／等のように入力する音声を区切る。尚、記号の／は音声の切れ目を示すものである。
【００２２】
音声認識部４の音響処理部４ｂは、音声入力部４２からの１区切りの音声入力である上述の／で区切られた音声入力を処理単位（以下発声ブロックと称す）とし、発声ブロック毎に音節列とする。例えば、／温泉の／人気に／関する／記事／という４つの音声入力に関する音響処理部４ｂの動作を図４により説明する。図４は発声ブロック毎の音節グラフに関する説明図であり、発声ブロックＡ〜Ｄは各々、１区切りの入力音声、／温泉の／、／人気に／、／関する／、／記事／に各々対応している。音節グラフＡ〜Ｄは、発声ブロックＡ〜Ｄの入力音声を音響処理部４ｂが音節列としたものである。
各音節グラフＡ〜Ｄは、左端の＠印で示された音節の始端から矢印の方向に右端の＠印で示された音節の終端までの節点にかけての有向グラフであり、＠印間の節点の各枝には音節名と音節の評価値とが付与されている。また、各音節グラフＡ〜Ｄには音響処理部４ｂの認識結果の曖昧さを、例えば、発声ブロックＡの「え」と「ん」や発声ブロックＢの「しき」と「き」等のように含む。音節の始端から終端までの任意の経路によって音声入力に対する音節列が形成されており、音節グラフＡ、Ｂ、Ｄは各々２つの音節列を含んでいる。
【００２３】
音響処理部４ｂは音響辞書及び音節ネットワーク部４ａを用いて、発声ブロックＡ〜Ｄ毎に、図４に示す音節グラフＡ〜Ｄを音節グラフ部４ｃに出力する。
音節グラフ部４ｃは音響処理部４ｂからの音節グラフＡ〜Ｄを一時的に記憶するバッファで、言語処理部４ｆの要求に応じて音節グラフＡ〜Ｄを出力する。
【００２４】
次に、言語処理部４ｆの動作を図５乃至図７により説明する。図５は図４に示す音節グラフを文字列として認識した認識ブロックに関する説明図であり、認識ブロックＡ〜Ｄは各々発声ブロックＡ〜Ｄに対応している。又、各認識ブロックＡ〜Ｄは、発声ブロックＡ〜Ｄの音節グラフの音節列を文字列に認識した複数の候補文字列から構成される。例えば図５に示すように認識ブロックＡは、｛「音声の」、「おんせえの」、「温泉の」、「おん泉の」、「おんせんの」、「音栓の」、「おん栓の」｝の７つの候補文字列により構成される。尚、｛｝で区切ったものは認識ブロックを示し、「」内の文字列が候補文字列を示している。
図６は図３に示す辞書部４ｄの詳細を示す説明図であり、４ｇは漢字又はかな文字又は漢字かな交じり文字等の文字列を記憶した表記部、４ｈは表記４ｇに記憶された文字列に対応して音節を記憶した音節列部、４ｉは表記４ｇに記憶された文字列に対応して品詞を記憶した品詞部である。図７は図３に示す文法部４ｅの詳細を示す説明図であり、４ｊは文法規則を記憶した文法規則部、４ｋは文法規則部４ｊに記憶した文法規則を適用した場合の文法上の確かさの評価値を示すスコア部である。
【００２５】
言語処理部４ｆは音節グラフ部４ｃからの各発声ブロックＡ〜Ｄについて、音節の始端から終端までの任意の経路について文脈自由文法に基づき、形態素解析及び構文解釈を行う。この実施の形態１に示す文法部４ｅの文法規則は、句標識として「文」となるものが、文法的に正しい「文」として解釈するように規定されている。従って図７に示すように、「体言」及び「連体句」及び「連用句」などの句標識を有する文節の前後をポーズで挟んだものが文法的な「文」であり、この文法部４ｅの文法規則では、複数の文節の連続も文法的な「文」とするが、文節数が１増えるとスコアを−１とし、１発声ブロックが複数文節として解析された候補は１発声ブロックが１文節として解析された候補に比べ文法上の確かさの評価値を下げるようにしている。
【００２６】
言語処理部４ｆは、辞書部４ｄに記憶された辞書及び文法部４ｅに記憶された文法規則等に照らして音節の経路を探索し、文法的に正しい候補文字列を含む認識ブロックＡ〜Ｄと候補文字列各々の認識結果の信憑性を示す評価値とをフィルタ部５に出力する。例えば、図５に示すように発声ブロックＡの認識ブロックＡの｛「音声の」、「おんせえの」、「温泉の」、「おん泉の」、「おんせんの」」、「音栓の」、「おん栓の」｝と、発声ブロックＢの認識ブロックＢの｛「認識に」、「人気に」｝と、発声ブロックＣの認識ブロックＣの｛「関する」｝と、発声ブロックＤの認識ブロックＤの｛「記事」、「支持」｝と、音節グラフを候補文字列として認識した場合の、それら候補文字列各々の認識結果の信憑性を示す評価値とをフィルタ部５に出力する。
【００２７】
次に、フィルタ部５は音声認識部４からの候補文字列を含む認識ブロックＡ〜Ｄを受け、まず、認識ブロック毎に文字列頻度記憶部３に記憶された文字列と自立語としての表記が一致しない候補文字列を削除するフィルタ処理を行う。
ここで、以下説明の都合上、フィルタ処理前の認識ブロックを第１の認識ブロックと称し、フィルタ処理後の認識ブロックを第２の認識ブロックと称する。
例えば、第１の認識ブロックに相当する認識ブロックＡについて、具体的に説明すると、認識ブロックＡ内には｛「音声の」、「おんせえの」、「温泉の」、「おん泉の」、「おんせんの」、「音栓の」、「おん栓の」｝の候補文字列がある。ここで、それらの評価値が言語処理部４ｆにより、例えば、各々順に（−１０．４５、−１０．４５、−１２．１０、−１２．１０、−１２．１０、−１５．２０、−１５．２０）とされ音声認識部４から出力されたとする。仮に、データベース記憶部４０に記憶されたデータ記事中には「音声」、「おん泉」、「温泉」、「音栓」という４種類の表記があり、文字列頻度記憶部３にはそれら４種類の文字列が記憶されているとすると、上述のフィルタ処理後である第２の認識ブロックに相当する認識ブロックＡの候補文字列は｛「音声の」、「おん泉の」、「温泉の」、「音栓の」」｝となる。また、各々の評価値も候補文字列の削除に伴い削除され順に（−１０．４５、−１２．１０、−１２．１０、−１５．２０）となる。
尚、残された候補文字列の中の「おん泉の」と「温泉の」は、発音が同じで評価値が同一であり、かつ、表記が異なる類似な候補文字列である。
【００２８】
次に、フィルタ部５は、上述のフィルタ処理の後に、第２の認識ブロック内の候補文字列に「おん泉の」、「温泉の」のように、発音が同一で、評価値が同一又は所定の閾値の範囲内で、表記が異なる類似な候補文字列が複数ある場合、これら類似な候補文字列の評価値の補正を行う。この補正は、フィルタ部５が文字列頻度記憶部３に記憶された補正対象の候補文字列と自立語としての表記が一致する文字列の出現回数と、文字列頻度記憶部３に記憶された補正対象の候補文字列と発音が同じ文字列全ての出現回数とを文字列頻度記憶部４から求め、さらに、前者を後者で正規化した値（以下分岐確率と称す）を求め、さらにこの分岐確率の対数値に小さな係数をかけた補正値を、補正対象の候補文字列の評価値に加えることで行われる。
【００２９】
例えば、上述の「おん泉の」、「温泉の」について説明すると、検索対象とするデータ記事中では「おん泉の」という表記が３０回、「温泉の」という表記が、２７０回出現し、各々が文字列頻度記憶部３に記憶されていた場合には、「おん泉の」の分岐確率が３０／３００で０．１であり、対数値では−２．３０となる。また、「温泉の」の分岐確率が２７０／３００で０．９であり対数値では−０．１１となる。ここで係数を０．００１とすると、「おん泉の」の補正値は−２．３０×０．００１で−０．００２３、「温泉の」の補正値は−０．１１×０．００１で−０．００１１となる。これらを各々の元の評価値に各々加えると、認識ブロックＡの｛「音声の」、「温泉の」、「おん泉の」、「音栓の」｝の評価値は補正により（−１０．４５、−１２．１０１１、−１２．１０２３、−１５．２０）となる。これにより対象のデータ記事中での出現回数の多い「温泉の」が「おん泉の」よりも評価値が上となる。
また、頻度を表す分岐確率の対数値に小さな係数の０．００１をかけて、「おん泉の」と「温泉の」とが評価値の低い他の候補である「音栓の」と順位が入れ替わるのを防止している。
フィルタ部５は上述のフィルタ処理、評価値の補正をした後、第２の認識ブロックに相当する認識ブロックＡ〜Ｄを評価値と共に文字列選択部６に出力する。
【００３０】
次に、文字列選択部６、データベース検索部７、表示部４９の動作を図１、図２、図８により説明する。図８は図１に示す表示部４９の表示状態を示す説明図である。図８において、４９ａは認識ブロック毎の候補文字列及び検索結果を表示する画面、４９ｂは候補文字列を確定させるための確定ボタンである。
文字列選択部６は、まずフィルタ部５からの第２の認識ブロックに相当する認識ブロックＡ〜Ｄを認識ブロック毎に評価値の高い順に上から候補文字列を表示するように表示部４９に出力する。表示部４９では図８に示すように、認識ブロック毎に評価値の高い順に上から候補文字列（但し図８では検索語と記載している。）を表示する。尚、図８では認識ブロックを３つ示しているが、認識ブロックの数が多く一度に表示しきれない場合は、認識ブロックをスクロール表示できるようにしておけばよい。
【００３１】
また、文字列選択部６は利用者から文字列入力部４６により候補文字列の何れかを指定されると、指定された候補文字列を選択し、選択された候補文字列を表示部４９に出力し、候補文字列の表示を変える。図８では選択された候補文字列の表示色を反転させた場合を示している。
また、文字列選択部６は利用者から文字列入力部４６により確定ボタン４９ｂを指定されると候補文字列の選択を確定し、選択された全ての候補文字列をデータベース検索部７に出力する。
【００３２】
尚、ここでは説明の都合上、認識ブロックＡ〜Ｄから順に「温泉の」、「人気に」、「関する」、「記事」が文字列選択部６に選択され、データベース検索部７に出力されたとする。
【００３３】
データベース検索部７は文字列選択部６からの出力を受けて、候補文字列がデータベース検索部７内に記憶された「〜関する記事」や「〜は？」や「〜についての記事」や「〜のニュース」や「〜関する情報」等々の文型に適合するか否かを判断する。
そして、データベース検索部７は候補文字列が文型に適合する場合には、文型中の「〜」の不特定部分に適合する候補文字列と表記が同一の索引文字列を図２に示す索引文字列部１ａから求め、求めた索引文字列に対応して論理アドレス部１ｂに記憶されているデータ記事の論理アドレスにより、データベース記憶部４０を検索し索引文字列を含むデータ記事又は関連事項を出力する。
【００３４】
データベース検索部７は、例えば候補文字列の「関する」、「記事」が文型の「〜関する記事」に適合するので、文型の「〜」に適合する「温泉の」、「人気に」と表記が同一の索引文字列を索引文字列部１ａから求め、求めた索引文字列に対応する論理アドレスによりデータベース記憶部４０を検索する。
また、データベース検索部７は、文型と候補文字列とが適合しない場合、入力した全ての候補文字列に対して表記が同一の索引文字列を索引文字列部１ａから求め、同様にデータベース記憶部４０を検索する。
そして、データベース検索部７は、検索結果の該当件数が極めて多い場合は記事の件数だけを、また該当件数が中程度であれば記事の見出し部分を、また該当件数が小数であればデータ記事全体を表示部４９に出力する。
【００３５】
上述のように、この実施の形態１に示す音声情報検索装置８によれば、フィルタ部５が、音声認識部４から出力される認識ブロック（フィルタ処理前の第１の認識ブロックに相当）から文字列頻度記憶部３に記憶された文字列と表記の一致しない候補文字列を削除するフィルタ処理を行うので、表示部４９には、フィルタ処理後の第２の認識ブロックが出力され、検索対象のデータ記事中に存在する文字列と表記が一致する候補文字列のみが表示されることになり、利用者は候補文字列を効率的に選択することができる。
【００３６】
さらにフィルタ部５はフィルタ処理の後、第２の認識ブロック内の候補文字列のうち、発音が同一で、評価値が同一又は所定の閾値の範囲内で、表記が異なる類似な候補文字列が複数ある場合、それら類似な候補文字列と表記が一致する文字列のデータ記事中での出現頻度に応じて、類似な候補文字列各々の評価値を補正するので、表示部４９にはデータ記事中での出現頻度に応じた順位で類似な候補文字列が表示されることになり、利用者による候補文字列選択の負担を軽減することができる。
また、データベース検索部７は、索引文字列に対応して記憶されたデータ記事の論理アドレスによりデータベース記憶部４０を検索するので、データ検索が容易となる。
【００３７】
尚、この実施の形態１による音声情報検索装置７は、利用者が文字列入力部４６により確定ボタンを指定し、文字列選択部６が候補文字列を確定した後に、データベース検索部７がデータベース記憶部４０を検索するように構成したが、利用者が文字列入力部４６により確定ボタンを指定するまでは、文字列選択部６が選択された候補文字列及びこの選択された候補文字列の認識ブロックを除く未選択の認識ブロックの候補文字列のうち評価値が最上位の候補文字列を自動的にデータベース検索部７に出力するようにし、データベース検索部７がその出力によりデータベース記憶部４０を検索し、検索結果としてデータ記事の件数を表示部４９に出力させるようにしてもよい。このようにすれば、順次候補文字列を選択することにより検索の絞り込みの状況を把握することができる。
【００３８】
実施の形態２．
この発明の音声情報検索装置の他の実施の形態について説明する。図９は、実施の形態２による音声情報検索装置１２を示す全体構成図である。図９において、図１と同一又は相当部分は同一符号を付し説明を省略する。９は後述する文字列間の関連性を示す関連値を記憶した関連度記憶部、１０は音声認識部４からの候補文字列からなる認識ブロックと候補文字列の評価値とを受け、認識ブロック毎に候補文字列をその評価値に応じた順位で表示部４９に表示させ、また、文字列入力部４６からの指示により候補文字列を選択し、その選択した候補文字列と他の認識ブロックの候補文字列との関連値を関連度記憶部９より求め、他の認識ブロックの候補文字列の評価値を補正し、また、文字列入力部４６からの指示によりデータベース記憶部４０を検索するための候補文字列を出力する文字列選択部、１１は文字列選択部１０からの出力を受けデータベース記憶部４０を検索し検索結果を表示部４９に出力するデータベース検索部、１２は音声情報検索装置であり、上述の符号９〜１１を付した構成及びデータベース記憶部４０と音声入力部４２と文字列入力部４６と表示部４９と音声認識部４とを含んでいる。
【００３９】
次に、動作を図９により説明する。
利用者が音声で検索のための文字列を、例えば、／温泉の／人気に／関する／記事／と音声入力部４２に入力すると、音声認識部４は音声入力部４２からの音声入力を受け、上述の実施の形態１に説明した音声認識部４の動作と同様に動作し、図３に示す音響処理部４ｂが入力音声を音節列として、図４に示す発声ブロックＡ〜Ｄ毎の音節グラフＡ〜Ｄを図３に示す音節グラフ部４ｃに出力し、言語処理部４ｆは音節グラフ部４ｃからの音節グラフＡ〜Ｄ各々を文字列として認識して、図５に示す、認識ブロックＡの｛「音声の」、「おんせえの」、「温泉の」、「おん泉の」、「おんせんの」、「音栓の」、「おん栓の」｝と、認識ブロックＢの｛「認識に」、「人気に」｝と、認識ブロックＣの｛「関する」｝と、認識ブロックＤの｛「記事」、「支持」｝とを、音節列の候補文字列として認識した場合の、その候補文字列の信憑性を示す評価値と共に文字列選択部１０に出力する。
【００４０】
次に、文字列選択部１０は、音声認識部４からの認識ブロックと評価値とを受け、認識ブロック毎に候補文字列を評価値の高い順に上から表示するようにして認識ブロックを表示部４９に出力する。次に、文字列選択部１０は、利用者から文字列入力部４６により、１つの認識ブロックの候補文字列を指定されると、指定された候補文字列を選択し、この候補文字列の評価値を補正し、選択した候補文字列を最も上位の候補として表示部４９に表示させる。
【００４１】
さらに、文字列選択部１０の詳細動作を説明する。図１０は関連度記憶部９の詳細説明図である。図中、９ａは、例えば、類語辞典等から文字列の表わす概念を代表するような複数の代表文字列を抽出して記憶した表記部、９ｂは、代表文字列が表わす概念に類似する内容を示す複数の類似文字列を上述の類語辞典等より抽出し、この類似文字列に類似の近さを示す符号を付し、類似文字列と符号とにより構成した概念コードを、代表文字列と対応させて記憶した第１の概念コード部である。例えば、表記部９ａの代表文字列「音声」に対して類似文字列「声」に符号「３２４」を付した概念コード「声：３２４」、類似文字列「音韻」に符号「８３１」を付した概念コード「音韻：８３１」等を第１の概念コード部９ｂに記憶している。この実施の形態２では、代表文字列、類似文字列及び類似の近さを示す符号を「大野普著：角川類語新辞典」より抽出した。９ｃは類似部であり上述の表記部９ａと第１の概念コード部９ｂとを含む。９ｄは、第１の概念コード部９ｂに記憶した概念コードを全て記憶した第２の概念コード部である。９ｅは、所定のデータ記事中に、任意の概念コードの類似文字列とほぼ連続して現れる他の概念コードの類似文字列（以下関連類似文字列と称す）がある場合、この関連類似文字列と上述の符号とにより構成される概念コードを記憶した関連概念コード部である。９ｆは、複数の所定のデータ記事中に第２の概念コード部９ｄに記憶された概念コードの類似文字列と関連概念コード部９ｅに記憶された概念コードの関連類似文字列とがほぼ連続して現れる回数を全データ記事数で正規化した値である共起確率を求め、この共起確率の対数値を関連値として記憶する関連値部である。この関連値は、各々対応する第２の概念コード９ｄに記憶した概念コードと関連概念コード部９ｅに記憶した概念コードとの関連性、又は、類似文字列と関連類似文字列間の関連性を示すものである。９ｇは関連部であり上述の第２概念コード部９ｄと関連概念コード部９ｅと関連値部９ｆとを含む。
【００４２】
文字列選択部１０は、文字列入力部４６の指示により認識ブロックから選択した候補文字列と表記が一致する代表文字列（以下指定代表文字列と称す）が、図１０に示す類似部９ｃの表記部９ａに記憶されているか否かを関連度記憶部９に問い合わせる。
表記部９ａに指定代表文字列が記憶されている場合、文字列選択部１０は、指定された候補文字列を含む認識ブロックの前又は後の認識ブロックに含まれる未選択の候補文字列と表記が一致する代表文字列（以下関連代表文字列と称す）が類似部９ｃの表記部９ａに記憶されているか否かを関連度記憶部９に問い合わせる。関連代表文字列が表記部９ａに記憶されている場合、文字列選択部１０は、指定代表文字列と関連代表文字列との関連値を関連度記憶部９に問い合わせる。
【００４３】
関連度記憶部９は、文字列選択部１０の問い合わせに応じて、指定代表文字列、関連代表文字列を記憶しているか否かの応答、関連値の回答を行う。ここで、関連度記憶部９は、指定代表文字列と関連代表文字列との関連値に関しては、関連部９ｇの第２の概念コード部９ｄに記憶された指定代表文字列に対応する類似文字列と、関連概念コード部９ｅに記憶された関連代表文字列に対応する関連類似文字列との関連値が関連値部９ｆに記憶されている場合、その関連値を指定代表文字列と関連代表文字列との関連値として、文字列選択部１０に出力する。
【００４４】
例えば、利用者から文字列入力部４６により図５に示す認識ブロックＡの「温泉の」が指定されたとすると、文字列選択部１０は、「温泉の」に対する指定代表文字列が類似部９ｃの表記部９ａに記憶されているか否かを関連度記憶部９に問い合わせる。図１０に示すように、表記部９ａには「温泉の」と自立語としての表記が一致する「温泉」が記憶されているので、関連度記憶部９はその旨を回答する。
文字列選択部１０はこの回答を受け、図５に示す認識ブロックＢの候補文字列と表記が一致する代表文字列が表記部９ａに記憶されているか否かを関連度記憶部９に問い合わせる。図１０に示すように表記部９ａには認識ブロックＢの「認識に」と自立語としての表記が一致する「認識」が記憶され、認識ブロックＢの「人気に」と自立語としての表記が一致する「人気」が記憶されているので、関連度記憶部９はその旨を回答する。
【００４５】
文字列選択部１０は、さらに、関連度記憶部９に対して図５に示す認識ブロックＡの「温泉の」に対する指定代表文字列の「温泉」と、図５に示す認識ブロックＢの「認識に」、「人気に」に対応する関連代表文字列「認識」、「人気」との間の関連値を問い合わせる。
関連度記憶部９は、指定代表文字列、関連代表文字列に対応する概念コードを第１の概念コード部９ｂより求める。関連度記憶部９は求めた指定代表文字列の概念コードを、第２の概念コード部９ｄに記憶された概念コードと照合し、照合した概念コードに対応して、関連代表文字列に対応する概念コードが関連概念コード部９ｅに記憶されているかを調べる。関連度記憶部９は関連代表文字列に対応する概念コードが関連概念コード部９ｅに記憶されていれば、それら概念コード間の関連値、即ち、それら概念コードに含まれる類似文字列と関連類似文字列間の関連値を関連値部９ｆより求め、この関連値を指定代表文字列と関連代表文字列との関連値として文字列選択部１０に出力する。
図１０に示すように、第１の概念コード部９ｂには「温泉」に対する概念コード「泉：０３７」、「認識」に対する概念コード「認識：４１３」、「人気」に対する概念コード「評判：７５４」が記憶されている。また、関連部９ｇには、第２の概念コード部９ｄの概念コード「泉：０３７」に対して、関連概念コード部９ｅに「評判：７５４」が記憶され、関連値部９ｆに関連値−８．５が記憶されている。関連度記憶部９は、この関連値−８．５を「温泉」と「人気」間の関連値として文字列選択部１０に出力する。尚、関連度記憶部９は概念コード「泉：０３７」と概念コード「認識：４１３」との関連値はないので「温泉」と「認識」との関連値は出力しない。
【００４６】
次に、文字列選択部１０は、関連度記憶部９からの関連値と、後述の式（１）により、選択された候補文字列の認識ブロックの前又は後の認識ブロックの候補文字列の信憑性を示す評価値の補正を行う。
ある認識ブロックＭのｎ番目の候補文字列を選択した場合の認識ブロックＭの前又は後の認識ブロックの候補文字列の評価値は次式により補正される。
補正値＝Σｉ，ｊＬ〔Ｋ（Ｍ，ｎ），Ｋ（ｉ，ｊ）〕＋Ｓ（ｉ，ｊ）・・（１）但し、Ｋ（Ｍ，ｎ）は指定文字列の概念コード、Ｋ（ｉ，ｊ）は関連代表文字列の概念コード、Ｌ〔Ｋ（Ｍ，ｎ），Ｋ（ｉ，ｊ）〕はＫ（Ｍ，ｎ）とＫ（ｉ，ｊ）との関連値、Ｓ（ｉ，ｊ）は認識ブロックＭの前又は後の認識ブロックの候補文字列の評価値、ｉ≠Ｍ、ｊ≠ｎである。尚、この関連値を関連度記憶部９から得られなかった場合は、関連値を−∞とする。
【００４７】
例えば、上述の音声認識部４が、認識ブロックＢの各候補文字列の｛「認識に」、「人気に」｝の評価値を各々（−１０．４５、−１２．１４）と出力した場合の評価値の補正について述べる。文字列選択部１０は認識ブロックＢの候補文字列「認識に」に対して、指定代表文字列「温泉」と関連代表文字列「認識」との関連値の回答がないので、式（１）中の「認識に」の関連値を−∞とし、その評価値を−∞＋（−１０．４５）＝−∞と補正する。又、文字列選択部１０は候補文字列の「人気に」に対して、指定代表文字列「温泉」と関連代表文字列「人気」との関連値の−８．５を用いて、その評価値を−８．５＋（−１２．１４）＝−２０．６４と補正し、補正した評価値の順位に応じて表示されるように表示部４９に出力する。
これにより、補正前は、「認識に」の評価値が−１０．４５、「人気に」の評価値が−１２．１４であり、「認識に」が上位の候補として表示部９に表示されていたが、補正後は、「認識に」の評価値−∞に対し、「人気に」の評価値が−２０．６４と高くなり、選択された「温泉の」に関連性の高い候補文字列である「人気に」が上位の候補として表示部４９に表示される。
【００４８】
次に、文字列選択部１０は、利用者から文字列入力部４６により、図８に示す確定ボタン４９ｂを指定されることにより候補文字列の選択を確定すると、選択された全ての候補文字列をデータベース検索部１１に出力する。
データベース検索部１１は、図１に示すデータベース検索部７と同様の文型を記憶しており、その文型に対して、文字列選択部１０からの候補文字列が適合するか否か判断する。そして、文型に候補文字列が適合する場合、実施の形態１に示した「〜関する記事」等の文型中の「〜」の不特定部分に適合する候補文字列によりデータベース記憶部４０を検索し候補文字列と同一表記の文字列を含むデータ記事又は関連事項を出力する。
また、データベース検索部１１は、文型と候補文字列とが適合しない場合、入力した全ての候補文字列により同様にデータベース記憶部４０を検索する。
そして、データベース検索部１１は、検索結果の該当件数が極めて多い場合は記事の件数だけを、また該当件数が中程度であれば記事の見出し部分を、また該当件数が小数であればデータ記事全体を表示部４９に出力する。表示部４９はデータベース検索部１１の出力を表示する。
【００４９】
尚、この実施の形態２においても、上述の実施の形態１で示した索引部１を設けて、索引文字列のデータの論理アドレスによりデータベース記憶部４０を検索してもよい。
また、認識ブロックは１文節からなる場合について説明したが、認識ブロックの候補が複数文節であってもよい。
【００５０】
また、この実施の形態２では、関連値は特に分野を限定せずに多数のデータ記事から求めたが、関連値を分野毎に分類したデータ記事から求めてもよい。
即ち、例えば、関連値を求めるデータ記事を自然、社会、文化、芸術等々の分野に分類して求めたり、関連値を求めるデータ記事を新聞記事、特許、学術論文等々の分野毎に分類して求める。又、データベース記憶部４０に記憶するデータ記事が新聞記事のみの場合は、経済面、社会面や芸能・スポーツ欄等々に分類して、この分類毎に関連値を求めるものである。以下に、関連値を分野毎に求める場合についての動作を説明する。
但し、関連度記憶部９と文字列選択部１０の動作は上述の通りであるので、要点のみ詳細に説明する。
【００５１】
利用者が／劇団の／公演に／と音声入力したとすると、音声認識部４が上述のとおり動作し、例えば、音声入力の／劇団の／により、認識ブロック｛「劇団の」｝と各候補文字列の評価値とを出力する。又、音声入力の／公演に／により、認識ブロック｛「講演に」、「公演に」、「公園に」、「後援に」、「好演に」、「後円に」｝と各候補文字列の評価値とを出力する。これらは文字列選択部１０を介して表示部４９に評価値の順に表示される。
利用者から文字列入力部４６により、前の認識ブロックの「劇団の」が指定された場合、文字列選択部１０は、「劇団の」の指定代表文字列が表記部９ａに記憶されているか否かを関連度記憶部９に問い合わせ、記憶されていた場合、後の認識ブロック｛「講演に」、「公演に」、「公園に」、「後援に」、「好演に」、「後円に」｝の関連代表文字列が表記部９ａに記憶されているか否かを関連度記憶部９に問い合わせる。表記部９ａに指定代表文字列、関連代表文字列が記憶されていた場合、文字列選択部１０は、指定代表文字列と関連代表文字列の関連値を関連度記憶部９に問い合わせる。
【００５２】
ここで、関連度記憶部９の関連値部９ｆに記憶された関連値が、例えば、芸術、の分野に分類されたデータ記事から求められていた場合、そのデータ記事中には、比較的に芸術の分野と関連する「公演に」、「好演に」等々に概念的に類似な文字列は、その他の比較的に自然の分野と関連する「公園に」、又は比較的に文化、政治の分野と関連する「講演に」、「後援に」等に概念的に類似な文字列よりも、データ記事中で「劇団に」と概念的に類似な文字列と略連続して出現する頻度が高くなっているものと考えられる。関連値は上述したように、概念的に類似な文字列が略連続して出現する頻度から求めているので、関連値部９ｆには「公演に」、「好演に」等々に概念的に類似な文字列と、「劇団に」と概念的に類似な文字列との間では高い関連値が記憶されているものと考えられる。したがって、「公演に」、「好演に」等々は「劇団に」との間に高い関連値が得られると考えられる。
【００５３】
即ち、文字列選択部１０は、関連度記憶部９からの関連値と、上述の式（１）とにより、後の認識ブロックの｛「講演に」、「公演に」、「公園に」、「後援に」、「好演に」、「後円に」｝の評価値を補正して、「公演に」、「好演に」が上位の候補として表示されるように表示部４９に出力する。これにより利用者の候補文字列選択の負担をより軽減できる。
【００５４】
上述のように、この実施の形態２による音声情報検索装置１２によれば、利用者によって１つの認識ブロックの候補文字列を指定されると、文字列選択部１０が、選択された候補文字列を含む認識ブロックの前又は後の認識ブロックの未選択の候補文字列の評価値を、関連度記憶部９の関連値部９ｆに記憶された関連値に応じて補正し、選択した候補文字列と関連性の高い候補文字列が上位として表示されるようにするので、利用者が多数の認識ブロックから候補文字列を指定する際の負担を軽減することができる。
また、関連値として用いた概念コード間の共起確率は多くの文書の統計的処理によって求めているので、文字列間の関連性を構成する際に人間による意味的な分析や解析を用いなくても済むと言う利点がある。
【００５５】
また、関連値を分野毎に求めることにより、任意の分野を対象とする場合に比べ、選択した候補文字列との関連性がより高い候補文字列を上位の候補として表示できるので、利用者の希望に沿う結果が得られる可能性が高くなり、より利用者の候補文字列選択の際の負担を軽減できる。
【００５６】
実施の形態３．
この発明の音声情報検索装置の他の実施の形態について説明する。図１１は、実施の形態３による音声情報検索装置を示す全体構成図である。図１１において、図１又は図９と同一又は相当部分は同一符号を付し説明を省略する。
１３は音声認識部４からの候補文字列からなる認識ブロックと候補文字列の評価値とを受け、認識ブロック毎に候補文字列をその評価値に応じた順位で表示部４９に表示させ、また、文字列入力部４６からの指示により候補文字列を選択し、その選択した候補文字列と他の認識ブロックの候補文字列との関連値を関連度記憶部９より求め、他の認識ブロックの候補文字列の評価値を補正し、また、文字列入力部４６からの指示によりデータベース記憶部４０を検索するための候補文字列を出力する文字列選択部、１４は音声情報検索装置であり、上述の文字列選択部１３とデータベース記憶部４０と音声入力部４２と文字列入力部４６と表示部４９と音声認識部４と関連度記憶部９とデータベース検索部１１とを含む。
【００５７】
次に、動作を図１１により説明する。
例えば、利用者が／温泉の／と音声入力部４２に音声入力すると、音声認識部４が上述の実施の形態２で示した音声認識部４の動作と同様に動作し、図５に示す認識ブロックＡの｛「音声の」、「おんせいの」、「温泉の」、「おん泉の」、「おんせんの」、「音栓の」、「おん栓の」｝を認識結果の信憑性を示す評価値と共に文字列選択部１３に出力する。
【００５８】
文字列選択部１３は音声認識部４からの認識ブロックＡと評価値とを受け、候補文字列を評価値の高い順に表示部４９に表示させる。又、文字列選択部１３は、利用者から文字列入力部４６により、例えば、「温泉の」を指定された場合、この「温泉の」を最も上位の候補として表示部４９に表示させ、「温泉の」と表記が一致する代表文字列（以下指定代表文字列と称す）が関連度記憶部９の表記部９ａに記憶されているか否かを関連度記憶部９に問い合わせる。関連度記憶部９は、図１０に示すように表記部９ａに自立語として一致する「温泉」が記憶されているので、記憶されている旨を回答する。文字列選択部１３は、その回答を記憶する。
【００５９】
次に、利用者が／人気に／と音声入力部４２に音声入力すると、音声認識部４が上述のように動作し、図５に示す認識ブロックＢの｛「人気に」、「認識に」｝と、例えば評価値として各々（−１２．１４、−１０．４５）を文字列選択部１３に出力する。文字列選択部１３は、音声認識部４からの認識ブロックＢの候補文字列をその評価値に応じて表示部４９に表示させる前に、「温泉の」と「認識に」、「温泉の」と「人気に」等々の各々の関連性により「認識に」、「人気に」の評価値の補正を行う。
文字列選択部１３は、先の音声入力の／温泉の／に対応する指定代表文字列である「温泉」が表記部９ａに記憶されている旨の回答受けているので、次の音声入力による「人気に」、「認識に」と表記が一致する代表文字列（以下関連代表文字列と称す）が表記部９ａに記憶されているか否かを関連度記憶部９に問い合わせる。関連度記憶部９は、文字列選択部１３の問い合わせに応じて、関連代表文字列を記憶しているか否かの応答を文字列選択部１３に対して行う。
【００６０】
文字列選択部１３は、関連代表文字列が表記部９ａに記憶されている旨の回答を受けた場合、指定代表文字列と関連代表文字列との関連値を関連度記憶部９に問い合わせる。関連度記憶部９は、上述の実施の形態２で示した動作と同様に動作し、図１０に示す第２の概念コード部９ｄに記憶した概念コードの類似文字列と関連概念コード部９ｅに記憶した概念コードの関連類似文字列との関連値を関連値部９ｆより求め、この関連値を指定代表文字列と関連代表文字列との関連値として文字列選択部１３に出力する。
文字列選択部１３は、関連度記憶部９からの関連値と上述の実施の形態２で示した式（１）により、上述の実施の形態２で示したと同様に「人気に」、の評価値を（−２０．６４）、「認識に」の評価値を（−∞）と補正して、「人気に」を上位の候補として表示部４９に表示させる。これにより、「温泉の」と関連性の高い、「人気に」が表示部４９に上位の候補として表示されるので、利用者の候補文字列の選択の負担を軽減できる。
【００６１】
次に、例えば、利用者が文字列入力部４６により「人気に」を指定し、文字列選択部１３が「人気に」を選択すると、文字列選択部１３が「人気に」の指定代表文字列が関連度記憶部９に記憶されている旨を記憶し、利用者からの次の音声入力の際には、文字列選択部１３と関連度記憶部９とが上述のように動作し、自動的に「人気に」と関連性の高い候補文字列が上位の候補として表示部４９に表示される。
【００６２】
上述のように、この実施の形態３の音声情報検索装置１４によれば、音声入力毎に以前に選択した候補文字列と関連性の高い候補文字列が上位の候補として表示されるので、利用者の候補文字列選択の際の負担が軽減される。
【００６３】
実施の形態４．
この発明の音声情報検索装置の他の実施の形態について説明する。図１２は、この実施の形態４による音声情報検索装置を示す全体構成図である。図１２において、図１と同一又は相当部分は同一符号を付し説明を省略する。１５はデータベース記憶部４０に記憶された複数のデータ記事に含まれる文字列を、複数のデータ記事がデータベース記憶部４０の何れに記憶されているか示す論理アドレスとともに、データベース記憶部４０から抽出し、この抽出した文字列と論理アドレスとを付与した索引文字列とを記憶し、かつ後述する発音記号付与部からの音節列に該当する論理アドレスを付して索引音節列を記憶した索引部、１６は、予め索引部１５の索引文字列の文字列を発音記号としての音節列に変換し、この音節列を索引部１５に記憶させた発音記号付与部、１７は入力された音声を音節列とし、この音節列に対する複数の候補文字列を出力する音声認識部、１８は音声情報検索装置であり、上述の符号１５〜１７を付した構成と、データベース記憶部４０と音声入力部４２と表示部４９とデータベース検索部７とを含む。尚、この実施の形態４において、発音記号としての音節列は、かな文字として表記する。
【００６４】
図１３は図１２に示す索引部１５の索引文字列と音節列と論理アドレスとの関係を示す説明図であり、１５ａは索引文字列を記憶した索引文字列部、１５ｂは発音記号付与部１６からのかな文字列を索引文字列部１５ａの索引文字列に対応させて記憶した音節列部、１５ｃは索引文字列に付与された論理アドレス部である。
【００６５】
図１４は図１２に示す音声認識部１７の詳細説明図である。図１２において図３と同一又は相当部分は同一符号を付し説明を省略する。１７ａは音節グラフ部４ｃの音節グラフの音節列に対応するかな文字列を記憶された辞書部、１７ｂは辞書部１７ａと文法部４ｅとを用い、図４に示すような音節グラフの音節列に対応するかな文字列を出力する言語処理部である。
【００６６】
次に、動作を図１２乃至図１４により説明する。
利用者が、例えば／音声の／認識に／と音声入力部４２に音声入力すると、この入力された音声は、図１４に示す音声認識部１７の音響処理部４ｂにより音響処理され、各々発声ブロック毎に、音節グラフとして音節グラフ部４ｃに記憶される。言語処理部１７ｂは、辞書部１７ａ及び文法部４ｅを用いて文法的に正しくなるように音節グラフをかな文字列として認識し、複数の候補音節列からなる認識ブロックをデータベース検索部７に出力する。
例えば、音声認識部１７により、／音声の／は、認識ブロック｛「おんせえの」、「おんせんの」｝としてデータベース検索部７に出力され、／認識に／は、認識ブロック｛「にんしきに」、「にんきに」｝としてデータベース検索部７に出力される。尚、これら認識ブロックの候補音節列は、発音記号としての音節列をかな文字列として表記してあるので、同音意義語や表記のゆれ等の問題は生じない。
【００６７】
データベース検索部７は、各認識ブロックから候補音節列を１づつ抽出し音声入力順に組み合わせる。この場合「おんせえの」と「にんしきに」、「おんせえの」と「にんきに」、「おんせんの」と「にんしきに」、「おんせんの」と「にんきに」の４通りの組合わせが得られる。
次に、データベース検索部７は、全ての組合わせについて、各候補音節列の自立語相当部分と表記が一致するかな文字列を、図１３に示す音節列部１５ｂから求め、この求めたかな文字列に対応する索引文字列を索引文字列部１７ａから求め、求めた索引文字列に付与されているデータ記事の論理アドレスにより、データベース記憶部４０を検索し、検索結果を表示部４９に出力する。
【００６８】
上述のように、この実施の形態４に示す音声情報検索装置１８でによれば、発音記号としての音節列をかな文字列として表記し、このかな文字列を手掛かりとしてデータベース記憶部４０を検索しているので、データ記事中に同音意義語や表記のゆれがあっても、データベース記憶部４０の検索が可能である。
また、データベース検索部７は、索引文字列に付加されたデータ記事の論理アドレスリストによりデータベース記憶部４０を検索するので、データ検索が容易となる。
【００６９】
尚、この実施の形態４では、発音記号として音節列を用いたが、音素や音韻記号を用いてもよいことは言うまでもない。
【００７０】
実施の形態５．
この発明の音声情報検索装置の他の実施の形態について説明する。図１５は、この実施の形態５による音声情報検索装置を示す全体構成図である。図１５において図１１又は図１２と同一又は相当するものは同一符号を付し説明を省略する。
【００７１】
１９はデータベース記憶部４０に記憶されているデータ記事に含まれる文字列全てを記憶し、文字列各々をかな文字列に変換し、文字列とかな文字列を対応させて記憶した記憶部である。
２０は音声情報検索装置であり、上述の記憶部１９とデータベース記憶部４０と音声入力部４２と表示部４９とデータベース検索部１１と音声認識部１７とを含む。
【００７２】
次に、動作を図１５により説明する。
利用者が、例えば、／音声の／認識に／と音声入力部４２に音声入力すると、この入力された音声は、図１４に示す音声認識部１７の音響処理部４ｂにより音響処理され、各々音節グラフとして音節グラフ部４ｃに記憶される。言語処理部１７ｂは、辞書部１７ａ及び文法部４ｅを用いて文法的に正しくなるように音節グラフをかな文字列として認識し複数の候補音節列からなる認識ブロックをデータベース検索部１１に出力する。
例えば、音声認識部１７により、／音声の／は、上述の実施の形態４と同様に認識ブロックの｛「おんせえの」、「おんせんの」｝としてデータベース検索部１１に出力され、／認識に／は、認識ブロックの｛「にんしきに」、「にんきに」｝としてデータベース検索部１１に出力される。尚、これら認識ブロックの候補音節列は発音記号としての音節列をかな文字列として表記してあるので、同音意義語や表記のゆれ等の問題は生じない。
【００７３】
データベース検索部１１は、各認識ブロックから候補音節列を１づつ抽出し音声入力順に組み合わせる。この場合、「おんせえの」と「にんしきに」、「おんせえの」と「にんきに」、「おんせんの」と「にんしきに」、「おんせんの」と「にんきに」の４通りの組合わせが得られる。
次に、データベース検索部１１は、全ての組合わせについて、各候補音節列の自立語相当部分と表記が一致するかな文字列に対応する文字列を記憶部１９から求め、求めた文字列により、データベース記憶部４０を検索し、検索結果を表示部４９に出力する。
【００７４】
上述のように、この実施の形態５に示す音声情報検索装置２０によれば、発音記号としての音節列をかな文字列として表記し、このかな文字列を手掛かりにデータベース記憶部４０を検索しているため、データ記事中に同音意義語や表記のゆれがあっても、データベース記憶部４０の検索が可能である。
【００７５】
実施の形態６．
この発明の音声情報検索装置の他の実施の形態について説明する。図１６は、この実施の形態６による音声情報検索装置を示す全体構成図である。図１６において図１と同一又は相当部分は同一符号を付し説明を省略する。２１は入力された音声を音節列とし、この音節列に対する複数の候補文字列を出力する音声認識部、２２は音声情報検索装置であり、上述の音声認識部２１とデータベース記憶部４０と音声入力部４２と文字列入力部４６と索引部１と文字列頻度抽出部２と文字列頻度記憶部３とフィルタ部５と文字列選択部６とデータベース検索部７と表示部４９とを含む。
【００７６】
図１７は図１６に示す音声認識部２１の詳細説明図である。図１７において、図３と同一又は相当部分は同一符号を付し説明を省略する。２１ａは図４に示すような音節グラフの音節に対応する文字列を記憶した辞書部であり、図６に示す辞書部４ｄと同等の内容を記憶した第１の辞書部と後述する第２の辞書部とを含む。２１ｆは文法規則を記憶した文法部、２１ｉは、辞書部２１ａと文法部２１ｆを用いて発声ブロツク毎の音節グラフの音節列に対応して第１の候補文字列と第２の候補文字列からなる認識ブロックを出力する言語処理部である。
また、図１８は図１７に示す辞書部２１ａに記憶された第２の辞書部を示す説明図である。図１８において、２１ｂは英字を１文字毎、数字を１字毎及び片仮名文字を記憶した表記部、２１ｃは表記部２１ｂに記憶した文字の発音記号としての音節列を記憶した音節列部、２１ｄは表記部２１ｂに記憶した文字に対応して品詞を記憶した品詞部、２１ｅは辞書部２ａの第２の辞書部であり、上述の符号２１ｂ〜２１ｄを付した構成を含む。
図１９は図１７に示す文法部２１ｆに記憶された文法規則を示す説明図である。図１９において、２１ｇは文法規則を記憶した文法規則部、２１ｈはその文法規則を適用した場合に文字列の文法上の確からしさ補正するための補正値を記憶したスコア部である。
【００７７】
次に、動作を図１６乃至図１９により説明する。
例えば、利用者がデータ記事中に「オンセエ」と片仮名文字で記載されているデータ記事を検索したい場合、利用者が、／オンセエ／と音声入力部４２に音声入力すると、図１７に示す音声認識部２１の音響処理部４ｂは音響辞書及び音節ネットワーク部４ａを用いて図４に示す音節グラフを出力する。
【００７８】
言語処理部２１ｉは、音節グラフを受け、この音節グラフを辞書部２１ａに含まれた、図６に示す辞書部４ｄと同等の内容を記憶した第１の辞書部と第２の辞書部２ｅに記憶された上述の内容及び文法部２１ｆに記憶された文法規則等に照らして音節の経路を探索し複数の候補文字列と各々の認識結果の信憑性を示す評価値とをフィルタ部５に出力する。例えば、言語処理部２１ｉは辞書部２１ａの第１の辞書部と文法部２１ｈにより｛「音声」、「おんせえ」、「温泉」、「おん泉」、「おんせん」、「音栓」、「おん栓」｝等を第１の候補文字列とし、図１８に示す第２の辞書部２ｅの表記部２１ｂに記憶された、英字、数字、片仮名文字等を組合わせた第２の候補文字列を生成し、この第２の候補文字列と上述の第１の候補文字列とからなる認識ブロックをフィルタ部５に出力する。例えば、言語処理部２１ｉは、片仮名文字を組み合わせた第２の候補文字列である「オンセエ」、「オンセン」等と上述の第１の候補文字列とからなる認識ブロックを第１、第２の候補文字列各々の認識結果の信憑性を示す評価値と共にフィルタ部５に出力する。
尚、言語処理部２１ｉは、新たに生成した第２の候補文字列の「オンセエ」、「オンセン」等は特殊な文字列として扱い、この文字列を名詞とする場合は、図１９に示すスコア部２１ｈに記憶した補正値により、文字列の文法上の確からしさを補正する。このため、第２の候補文字列の「オンセエ」及び「オンセン」等は、品詞とした場合に、上述の第１の候補文字列に比べ評価値が低くなる。
【００７９】
次に、フィルタ部５は、音声認識部２１からの認識ブロックと評価値について上述の実施の形態１で述べたフィルタ処理及び必要によって類似な候補文字列の評価値の補正を行った後、第１の候補文字列と第２の候補文字列とからなる認識ブロックと評価値とを文字列選択部６に出力する。フィルタ部５と文字列頻度記憶部３の動作は上述の実施の形態１で述べたものと同等であるので詳細な説明は省略するが、例えば、ここでデータベース記憶部４０に記憶されたデータ記事中に「オンセエ」という文字列が頻繁に出現しているならば、文字列頻度記憶部３には「オンセエ」の出現回数が多く記憶されていることになるので、フィルタ部５は「オンセエ」の評価値を高く補正することになる。
文字列選択部６はフィルタ部５からの認識ブロックに含まれる第１の候補文字列と第２の候補文字列とを評価値の高い順に表示部４９に表示させる。また、文字列選択部６は、例えば、利用者から文字列入力部４６により「オンセエ」を指定されると、「オンセエ」を選択し、この「オンセエ」を検索用の候補文字列としてデータベース検索部７に出力する。データベース検索部７は「オンセエ」と表記が一致する索引文字列を実施の形態１と同様に索引部１の図２に示す索引文字列部１ａより求め、求めた索引文字列に付与されているデータ記事の論理アドレスによりデータベース記憶部４０を検索し、検索結果を表示部４９に出力する。
【００８０】
上述のように、この実施の形態６に示す音声情報検索装置２２によれば、音声認識部２１の言語処理部２１ｉが辞書部２１ａの第２の辞書部２１ｅに記憶された英字、数字、片仮名文字等を組み合わせて、音声入力に対応する第２の候補文字列を出力するので、音声入力に対応する第１の候補文字列が辞書部２１ａに記憶されていない場合でも、データベース記憶部４０の検索が可能である。
【００８１】
尚、上述の説明では、言語処理部２１ｉが片仮名文字を組み合わせた場合について説明したが、例えば、辞書部２１ａに第１の候補文字列として記憶されていない／ＵＡＷ／、／Ｇ７／等を利用者が音声入力した場合、音声認識部２１の言語処理部２１ｉは、辞書部２１ａの第２の辞書部２１ｅに記憶された上述の内容及び文法部２１ｆに記憶された文法規則等に照らして音節の経路を探索し、音声入力の／ＵＡＷ／に対しては、例えば、英字を組み合わせた「ＵＡＷ」、又は片仮名文字を組み合わせた「ユーエーダブリュー」等の第２の候補文字列を生成し、この第２の候補文字列からなる認識ブロックを第２の候補文字列各々の評価値と共にフィルタ部５に出力する。又、言語処理部２１ｉは音声入力の／Ｇ７／に対しては、例えば、英字と数字を組み合わせた「Ｇ７」等の第２の候補文字列を生成して、この第２の候補文字列からなる認識ブロックを第２の候補文字列各々の評価値と共にフィルタ部５に出力する。尚、第２の辞書部２１ｅにひらがなを加え、英字、数字、片仮名文字、ひらがな等により第２の候補文字列を生成するようにしてもよい。
【００８３】
【発明の効果】
この発明の音声情報検索装置によれば、索引文字列の索引を除いた文字列がデータ中に出現する回数を索引文字列と対応させて記憶した文字列頻度記憶部を設け、フィルタ部は第２の認識ブロックのうちに同音異表記の異表記候補文字列がある場合には、異表記候補文字列毎に文字列が一致する上記索引文字列の出現回数を上記文字列頻度記憶部より求め、出現回数が多い異表記候補文字列の信憑性が出現回数が少ない異表記候補文字列の信憑性よりも高くなるように上記第２の認識ブロックの上記異表記候補文字列の評価値を補正するので、異表記候補文字列をデータ中の出現回数に応じて表示するので、より利用者の索引文字列の選択の負担を軽減することができる。
【図面の簡単な説明】
【図１】この発明の実施の形態１の音声情報検索装置８を示す構成図である。
【図２】索引部１の索引文字列１ａと論理アドレス１ｂとの関係を示す説明図である。
【図３】音声認識部４の詳細説明図である。
【図４】音節グラフの説明図である。
【図５】音節グラフに対応した認識ブロックを示す説明図、
【図６】辞書部４ｄの一例を示す説明図である。
【図７】文法部４ｅの一例を示す説明図である。
【図８】表示部４９の表示状態を示す説明図である。
【図９】この発明の実施の形態２の音声情報検索装置１２を示す構成図である。
【図１０】関連度記憶部９の詳細説明図である。
【図１１】この発明の実施の形態３の音声情報検索装置１４を示す構成図である。
【図１２】この発明の実施の形態４の音声情報検索装置１８を示す構成図である。
【図１３】索引部１５の索引文字列部１５ａと音節列部１５ｂと論理アドレス１５ｃとの関係を示す説明図である。
【図１４】音声認識部１７の詳細説明図である。
【図１５】この発明の実施の形態５の音声情報検索装置２０を示す構成図である。
【図１６】この発明の実施の形態６の音声情報検索装置２２を示す構成図である。
【図１７】音声認識部２１の詳細説明図である。
【図１８】第２の辞書部２１ｅに記憶された内容を示す説明図である。
【図１９】文法部２１ｆに記憶されたの文法規則を示す説明図である。
【図２０】従来の音声情報検索装置５０を示す構成図である。
【符号の説明】
１索引部、２文字列頻度抽出部、３文字列頻度記憶部、４音声認識部、５フィルタ部、６文字列選択部、７データベース検索部、８音声情報検索装置、９関連度記憶部、１０文字列選択部、１２音声情報検索装置、１３文字列選択部、１４音声情報検索装置、１５索引部、１７音声認識部、１８音声情報検索装置、１９記憶部、２０音声情報検索装置、２１音声認識部、２２音声情報検索装置

Claims

複数のデータを記憶したデータベース部と、
上記データに含まれる文字列を上記データが上記データベース部の何れに記憶されているかを示す索引を付与し索引文字列として抽出し記憶する索引部と、
文節に区切られた音声を入力して文字列として認識して出力した少なくとも１つの候補文字列を有する第１の認識ブロックと上記候補文字列の信憑性を示す評価値とを出力する音声認識部と、
上記索引文字列の索引を除いた文字列が上記データ中に出現する回数を上記索引文字列と対応させて記憶している文字列頻度記憶部と、
上記音声認識部の出力を受け上記第１の認識ブロックから上記索引文字列と表記が一致しない候補文字列を削除して第２の認識ブロックと上記第２の認識ブロックの候補文字列の上記評価値とを求め、上記第２の認識ブロック内に同音異表記の異表記候補文字列がある場合には、上記異表記候補文字列毎に文字列が一致する上記索引文字列の出現回数を上記文字列頻度記憶部より求め、上記出現回数が多い異表記候補文字列の信憑性が上記出現回数が少ない異表記候補文字列の信憑性よりも高くなるように上記第２の認識ブロックの異表記候補文字列の評価値を補正し、上記第２の認識ブロックと補正後の上記第２の認識ブロックの候補文字列を出力するフィルタ部と、
上記フィルタ部の出力を受け上記第２の認識ブロックの候補文字列を上記評価値に応じた順位で表示する表示部と、
入力部からの指示により上記表示部に表示された上記候補文字列から所要の索引文字列を選択する文字列選択部と、
上記所定の索引文字列と関連するデータを上記データベース部から検索するデータベース検索部と、
を備えたことを特徴とする音声情報検索装置。