JPH1049187A - 音声情報検索装置 - Google Patents

音声情報検索装置

Info

Publication number
JPH1049187A
JPH1049187A JP8203779A JP20377996A JPH1049187A JP H1049187 A JPH1049187 A JP H1049187A JP 8203779 A JP8203779 A JP 8203779A JP 20377996 A JP20377996 A JP 20377996A JP H1049187 A JPH1049187 A JP H1049187A
Authority
JP
Japan
Prior art keywords
character string
unit
candidate
string
index
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP8203779A
Other languages
English (en)
Other versions
JP3758241B2 (ja
Inventor
Yoshiharu Abe
芳春 阿部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP20377996A priority Critical patent/JP3758241B2/ja
Publication of JPH1049187A publication Critical patent/JPH1049187A/ja
Application granted granted Critical
Publication of JP3758241B2 publication Critical patent/JP3758241B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 音声認識結果として出力される候補文字列を
利用者が効率的に選択できる音声情報検索装置を得る。 【解決手段】 データベース部と、データに含まれる文
字列を上記データが上記データベース部の何れに記憶さ
れているかを示す索引を付与し索引文字列として抽出し
記憶する索引部と、候補文字列を出力する音声認識部
と、上記音声認識部の出力を受け上記索引文字列と表記
が一致しない候補文字列を削除するフィルタ部と、上記
フィルタ部の出力を受け上記第2の認識ブロックの候補
文字列を上記評価値に応じた順位で表示する表示部と、
入力部からの指示により上記候補文字列から所定の索引
文字列を選択する文字列選択部と、上記所定の索引文字
列と関連するデータを上記データベース部から検索する
データベース検索部とを備えた。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声による入力を
文字列として認識し、この文字列を手がかりとしてデー
タを検索する音声情報検索装置に関するものである。
【0002】
【従来の技術】図20は従来の音声情報検索装置を示す
構成図である。図において、40は複数のデータ記事を
記憶されているデータベース記憶部、41は予めデータ
ベース記憶部41中の語彙の知識、文字列間の概念的な
繋がりを記憶されている概念ネットワーク記憶部、42
は利用者の発声を入力する音声入力部、43は音声認識
用辞書部であり、予め発音記号を示す音節列と、この音
節列に対応する文字列とを記憶された静的辞書と、後述
する辞書生成部により生成された発音記号を示す音節列
及び音節列に対応する文字列を記憶する動的辞書とを含
んでいる。
【0003】44は入力された音声を音節列とし、この
音節列に対する複数の候補文字列を出力する音声認識
部、45は音声認識用辞書部43の動的辞書に記憶する
音節列及びこの音節列に対応する文字列を生成する辞書
生成部、46は候補文字列を指示する文字列入力部、4
7は文字列入力部46からの指示により候補文字列を選
択し出力する文字列選択部、48はデータベース記憶部
40を検索するデータベース検索部、49は文字列選択
部47からの出力とデータベース検索部48の検索結果
とを表示出力する表示部である。50は音声情報検索装
置であり、上述の符号40〜49を付した構成を含んで
いる。
【0004】次に従来の音声情報検索装置の動作を図2
0により説明する。利用者が音声入力部42により音声
入力をすると、音声認識部44は、この入力された音声
を音声認識用辞書部43の静的辞書を用いて複数の候補
文字列を文字列選択部47に出力する。これら複数の候
補文字列は文字列選択部47から出力され表示部49の
画面上に表示される。
【0005】利用者が文字列入力部46により、表示さ
れた複数の候補文字列の何れかを指定すると、文字列選
択部47は指定された候補文字列を選択しデータベース
検索部48と辞書生成部45とに選択した候補文字列を
出力する。データベース検索部48は文字列選択部47
からの候補文字列を手掛かりにデータベース記憶部40
を検索し、検索結果を表示部49に出力する。表示部4
9は検索結果を表示する。
【0006】辞書生成部45は概念ネットワーク記憶部
41に記憶された文字列間の概念的な繋がりから、文字
列選択部47からの候補文字列に対して関連する文字列
を求めさせ、求めた文字列に対応する音節列を生成し、
求めた文字列と音節列とを音声認識用辞書部43の動的
辞書に記憶させる。即ち、辞書生成部45は音声認識用
辞書部43の動的辞書に対して、所謂学習機能を持たせ
ている。
【0007】また、再度利用者が音声入力部42により
音声入力を行うと、音声認識部44は、辞書生成部45
により生成された音声認識用辞書部43の動的辞書を用
い、入力された音声に対する複数の候補文字列を文字列
選択部47に出力する。これら複数の候補文字列は文字
列選択部47から表示部49に出力され画面上に表示さ
れる。また、これら複数の候補文字列は文字列選択部4
7からデータベース検索部48に出力され、データベー
ス検索部48がデータベース記憶部40を検索し、検索
結果を表示部49に出力する。
【0008】
【発明が解決しようとする課題】従来の音声情報検索装
置50は、以上のように構成されているので、音声認識
部44による音声認識処理に先立ち、音声認識の対象と
なる単語や文等の文字列を予め音声認識用辞書部43の
静的辞書や動的辞書に記憶させる必要がある。この為、
利用者が音声で入力できる単語や文等は、音声認識用辞
書部43の静的辞書や動的辞書に記憶された単語や文等
に限定される。特に、特許文や新聞記事の内容の検索や
図書のタイトルの検索などのような文字列を手掛かりと
して文献を検索する場合、特に、発音が同じでデータ中
の文字列の表記が異なる同音意義語や送りがなの付け方
や漢字の用い方の好みなどのいわゆる表記のゆれが存在
するために検索のための単語や文の種類をあらかじめ限
定できないことが多く、以上のような文献の検索を行う
ことは事実上不可能であるという問題がある。
【0009】また、音声認識部44の認識対象が広いと
単語や文等の種類が極めて大きくなるため、音声認識の
認識性能が低下し、非常に多数の候補文字列が出力され
るので、利用者が候補文字列から検索用の文字列を指定
するに際し、利用者の負担が増加するという問題があ
る。この問題に関して、学習機能を持つ音声認識用辞書
部43の動的辞書を用いることによりある程度利用者の
負担を軽減できるが、音声認識用辞書部43の動的辞書
の生成には時間がかかるという問題がある。
【0010】この発明は、上述の問題を解決するためな
されたもので、同音意義語や送りがなの付け方や漢字の
用い方の好みなどの所謂表記のゆれの存在するデータ記
事を検索でき、また、音声認識結果として出力される候
補文字列を利用者が効率的に選択でき、また、辞書に文
字列として登録されていない単語や文等でも検索を可能
とする音声情報検索装置を得ることを目的とする。
【0011】
【課題を解決するための手段】この発明の音声情報検索
装置は、複数のデータを記憶したデータベース部と、上
記データに含まれる文字列を上記データが上記データベ
ース部の何れに記憶されているかを示す索引を付与し索
引文字列として抽出し記憶する索引部と、文節に区切ら
れた音声を入力して文字列として認識して出力した少な
くとも1つの候補文字列を有する第1の認識ブロックと
上記候補文字列の信憑性を示す評価値とを出力する音声
認識部と、上記音声認識部の出力を受け上記第1の認識
ブロックから上記索引文字列と表記が一致しない候補文
字列を削除した第2の認識ブロックと上記第2の認識ブ
ロックの候補文字列の上記評価値とを出力するフィルタ
部と、上記フィルタ部の出力を受け上記第2の認識ブロ
ックの候補文字列を上記評価値に応じた順位で表示する
表示部と、入力部からの指示により上記表示部に表示さ
れた上記候補文字列から所要の索引文字列を選択する文
字列選択部と、上記所定の索引文字列と関連するデータ
を上記データベース部から検索するデータベース検索部
とを備えたものである。
【0012】さらに、索引文字列の索引を除いた文字列
がデータ中に出現する回数を上記索引文字列と対応させ
て記憶した文字列頻度記憶部を設け、フィルタ部は第2
の認識ブロックの内に同音異表記の異表記候補文字列が
ある場合には、上記異表記候補文字毎に文字列が一致す
る上記索引文字列の出現回数を上記文字列頻度記憶部よ
り求め、上記出現回数に応じて上記第2の認識ブロック
の上記異表記候補文字列の評価値を補正するものであ
る。
【0013】また、複数のデータを記憶したデータベー
ス部と、所定の記事に含まれる複数の代表文字列及びこ
の複数の代表文字列に類似する複数の類似文字列とを記
憶し、上記所定の記事又は他の記事中に上記類似文字列
にほぼ続いて現れる関連類似文字列と当該類似文字列と
の関連性を示す関連値を記憶する関連度記憶部と、文節
に区切られた音声を入力して文字列として認識して出力
した少なくとも1つの候補文字列を含む認識ブロックと
上記候補文字列の信憑性を示す評価値とを出力する音声
認識部と、上記音声認識部の出力を複数受け、入力部か
らの指示に応じて一方の認識ブロック内のある候補文字
列を特定候補文字列として指定すると、上記関連度記憶
部に問い合わせ、上記特定候補文字列と表記が一致する
上記類似文字列と他方の認識ブロック内の未特定の候補
文字列と表記が一致する上記関連類似文字列との間の上
記関連値に応じて、上記未特定の候補文字列の評価値を
補正し、この補正した評価値に応じた順位で上記他方の
認識ブロック内の未特定の候補文字列を表示部に表示さ
せ、上記入力部からの指示に応じて上記他方の認識ブロ
ックから所要の検索文字列を選択する文字列選択部と、
上記所要の検索文字列を含むデータを上記データベース
部から検索するデータベース検索部とを備えたものであ
る。
【0014】さらに、他の記事を分野毎に分類し、関連
度記憶部は上記分野毎の記事について関連値を記憶した
ものである。
【0015】また、複数のデータを記憶したデータベー
ス部と、上記データに含まれる文字列を上記データが上
記データベース部の何れに記憶されているかを示す索引
を付与し索引文字列として抽出し記憶し、かつ上記索引
文字列を音節列に変換した索引音節列を記憶する索引部
と、文節に区切られた音声を入力して音節列として認識
し候補音節列を出力する音声認識部と、上記候補音節列
と一致する上記索引音節列に対応する上記索引文字列に
関連するデータを上記データベース部から検索するデー
タベース検索部とを備えたものである。
【0016】また、複数のデータを記憶したデータベー
ス部と、上記データに含まれる文字列を音節列に変換し
索引音節列として記憶する記憶部と、文節に区切られた
音声を入力して音節列として認識し候補音節列を出力す
る音声認識部と、上記音声認識部の出力を受け上記候補
音節列と一致する上記索引音節列を上記記憶部から求め
て、求めた索引音節列に対応する上記文字列を含むデー
タを上記データベース部から検索するデータベース検索
部とを備えたものである。
【0017】また、複数のデータを記憶したデータベー
ス部と、上記データに含まれる文字列を上記データが上
記データベース部の何れに記憶されているかを示す索引
を付与し索引文字列として抽出し記憶する索引部と、文
節に区切られて入力された音声を音節列に変換して候補
音節列を出力する音響処理部と、複数の文字列とこの複
数の文字列を音節列として記憶する第1の辞書部と複数
の文字とこの複数の文字を音節として記憶する第2の辞
書部とを有する辞書部と、上記音響処理部の出力を受け
上記第1の辞書部から上記候補音節列と一致する音節列
に対応する文字列を第1の候補文字列として選択し、上
記第2の辞書部の音節を組み合わせて上記候補音節列と
一致させ、この一致した音節に対応する文字の組み合わ
せを第2の候補文字列として生成し、上記第1の候補文
字列と上記第2の候補文字列とを出力すると共に、上記
第1の候補文字列と上記第2の候補文字列との信憑性を
示す評価値とを出力する言語処理部と、上記第1の候補
文字列と上記第2の候補文字列とを上記評価値に応じた
順位で表示する表示部と、入力部からの指示に応じて上
記表示部に表示された上記第1の候補文字列又は上記第
2の候補文字列から所要の索引文字列を選択する文字列
選択部と、この選択された索引文字列に関連するデータ
を上記データベース部から検索するデータベース検索部
とを備えたものである。
【0018】
【発明の実施の形態】
実施の形態1.この発明の音声情報検索装置の一実施の
形態を説明する。図1は、この発明の実施の形態1によ
る音声情報検索装置を示す構成図である。図1におい
て、図20に示すものと同一又は相当部分には同一符号
を付し説明を省略する。1はデータベース記憶部40に
記憶された複数のデータ記事に含まれる文字列を、複数
のデータ記事がデータベース記憶部40の何れに記憶さ
れているか示す論理アドレスとともに、データベース記
憶部40から抽出し、この抽出した文字列と論理アドレ
スとを付与した索引文字列を記憶した索引部である。
【0019】2は索引部1が抽出した文字列と、文字列
各々がデータ記事中に出現する回数とを出力する文字列
頻度抽出部、3は予め文字列頻度抽出部2からの文字列
と、文字列各々の出現回数とを記憶した文字列頻度記憶
部である。4は入力された音声を音節列とし、この音節
列に対する複数の候補文字列を出力する音声認識部、5
は音声認識部4からの出力を受け、この出力に含まれる
候補文字列を選別して出力するフィルタ部である。6は
フィルタ部からの出力をそのまま表示部49に出力し、
また、候補文字列を選択して出力する文字列選択部、7
はデータベース記憶部40を検索し検索結果を表示部4
9に出力するデータベース検索部である。8は音声情報
検索装置1であり、上述の符号1〜7を付した構成及び
データベース記憶部40と音声入力部42と文字列入力
部46と表示部49とを含んでいる。
【0020】図2は図1に示す索引部1の索引文字列と
論理アドレスとの関係を示す説明図であり、1aは索引
文字列を記憶した索引文字列部、1bは索引文字列に付
与された論理アドレス部である。図3は図1に示す音声
認識部4の詳細図であり、4aは音声を音節に変換する
ための音響辞書及び音節ネットワーク部、4bは音声入
力を発声ブロツク毎に音節又は音節列に変換して音節グ
ラフを出力する音響処理部、4cは音節グラフを記憶す
る音節グラフ部、4dは音節グラフの音節に対応する文
字列を記憶した辞書部、4eは文法規則を記憶した文法
部、4fは、辞書部4dと文法部4eを用いて発声ブロ
ツク毎の音節グラフの音節列に対応して候補文字列から
なる認識ブロックを出力する言語処理部である。
【0021】次に動作を図1乃至図3により説明する。
利用者は、音声で検索のための文字列を1〜数文節ごと
に区切って、音声入力部42に音声入力する。例えば、
/温泉の/人気に/関する/記事/、あるいは/湾岸戦
争の/停戦の/記事/等のように入力する音声を区切
る。尚、記号の/は音声の切れ目を示すものである。
【0022】音声認識部4の音響処理部4bは、音声入
力部42からの1区切りの音声入力である上述の/で区
切られた音声入力を処理単位(以下発声ブロックと称
す)とし、発声ブロック毎に音節列とする。例えば、/
温泉の/人気に/関する/記事/という4つの音声入力
に関する音響処理部4bの動作を図4により説明する。
図4は発声ブロック毎の音節グラフに関する説明図であ
り、発声ブロックA〜Dは各々、1区切りの入力音声、
/温泉の/、/人気に/、/関する/、/記事/に各々
対応している。音節グラフA〜Dは、発声ブロックA〜
Dの入力音声を音響処理部4bが音節列としたものであ
る。各音節グラフA〜Dは、左端の@印で示された音節
の始端から矢印の方向に右端の@印で示された音節の終
端までの節点にかけての有向グラフであり、@印間の節
点の各枝には音節名と音節の評価値とが付与されてい
る。また、各音節グラフA〜Dには音響処理部4bの認
識結果の曖昧さを、例えば、発声ブロックAの「え」と
「ん」や発声ブロックBの「しき」と「き」等のように
含む。音節の始端から終端までの任意の経路によって音
声入力に対する音節列が形成されており、音節グラフ
A、B、Dは各々2つの音節列を含んでいる。
【0023】音響処理部4bは音響辞書及び音節ネット
ワーク部4aを用いて、発声ブロックA〜D毎に、図4
に示す音節グラフA〜Dを音節グラフ部4cに出力す
る。音節グラフ部4cは音響処理部4bからの音節グラ
フA〜Dを一時的に記憶するバッファで、言語処理部4
fの要求に応じて音節グラフA〜Dを出力する。
【0024】次に、言語処理部4fの動作を図5乃至図
7により説明する。図5は図4に示す音節グラフを文字
列として認識した認識ブロックに関する説明図であり、
認識ブロックA〜Dは各々発声ブロックA〜Dに対応し
ている。又、各認識ブロックA〜Dは、発声ブロックA
〜Dの音節グラフの音節列を文字列に認識した複数の候
補文字列から構成される。例えば図5に示すように認識
ブロックAは、{「音声の」、「おんせえの」、「温泉
の」、「おん泉の」、「おんせんの」、「音栓の」、
「おん栓の」}の7つの候補文字列により構成される。
尚、{}で区切ったものは認識ブロックを示し、「」内
の文字列が候補文字列を示している。図6は図3に示す
辞書部4dの詳細を示す説明図であり、4gは漢字又は
かな文字又は漢字かな交じり文字等の文字列を記憶した
表記部、4hは表記4gに記憶された文字列に対応して
音節を記憶した音節列部、4iは表記4gに記憶された
文字列に対応して品詞を記憶した品詞部である。図7は
図3に示す文法部4eの詳細を示す説明図であり、4j
は文法規則を記憶した文法規則部、4kは文法規則部4
jに記憶した文法規則を適用した場合の文法上の確かさ
の評価値を示すスコア部である。
【0025】言語処理部4fは音節グラフ部4cからの
各発声ブロックA〜Dについて、音節の始端から終端ま
での任意の経路について文脈自由文法に基づき、形態素
解析及び構文解釈を行う。この実施の形態1に示す文法
部4eの文法規則は、句標識として「文」となるもの
が、文法的に正しい「文」として解釈するように規定さ
れている。従って図7に示すように、「体言」及び「連
体句」及び「連用句」などの句標識を有する文節の前後
をポーズで挟んだものが文法的な「文」であり、この文
法部4eの文法規則では、複数の文節の連続も文法的な
「文」とするが、文節数が1増えるとスコアを−1と
し、1発声ブロックが複数文節として解析された候補は
1発声ブロックが1文節として解析された候補に比べ文
法上の確かさの評価値を下げるようにしている。
【0026】言語処理部4fは、辞書部4dに記憶され
た辞書及び文法部4eに記憶された文法規則等に照らし
て音節の経路を探索し、文法的に正しい候補文字列を含
む認識ブロックA〜Dと候補文字列各々の認識結果の信
憑性を示す評価値とをフィルタ部5に出力する。例え
ば、図5に示すように発声ブロックAの認識ブロックA
の{「音声の」、「おんせえの」、「温泉の」、「おん
泉の」、「おんせんの」」、「音栓の」、「おん栓
の」}と、発声ブロックBの認識ブロックBの{「認識
に」、「人気に」}と、発声ブロックCの認識ブロック
Cの{「関する」}と、発声ブロックDの認識ブロック
Dの{「記事」、「支持」}と、音節グラフを候補文字
列として認識した場合の、それら候補文字列各々の認識
結果の信憑性を示す評価値とをフィルタ部5に出力す
る。
【0027】次に、フィルタ部5は音声認識部4からの
候補文字列を含む認識ブロックA〜Dを受け、まず、認
識ブロック毎に文字列頻度記憶部3に記憶された文字列
と自立語としての表記が一致しない候補文字列を削除す
るフィルタ処理を行う。ここで、以下説明の都合上、フ
ィルタ処理前の認識ブロックを第1の認識ブロックと称
し、フィルタ処理後の認識ブロックを第2の認識ブロッ
クと称する。例えば、第1の認識ブロックに相当する認
識ブロックAについて、具体的に説明すると、認識ブロ
ックA内には{「音声の」、「おんせえの」、「温泉
の」、「おん泉の」、「おんせんの」、「音栓の」、
「おん栓の」}の候補文字列がある。ここで、それらの
評価値が言語処理部4fにより、例えば、各々順に(−
10.45、−10.45、−12.10、−12.1
0、−12.10、−15.20、−15.20)とさ
れ音声認識部4から出力されたとする。仮に、データベ
ース記憶部40に記憶されたデータ記事中には「音
声」、「おん泉」、「温泉」、「音栓」という4種類の
表記があり、文字列頻度記憶部3にはそれら4種類の文
字列が記憶されているとすると、上述のフィルタ処理後
である第2の認識ブロックに相当する認識ブロックAの
候補文字列は{「音声の」、「おん泉の」、「温泉
の」、「音栓の」」}となる。また、各々の評価値も候
補文字列の削除に伴い削除され順に(−10.45、−
12.10、−12.10、−15.20)となる。
尚、残された候補文字列の中の「おん泉の」と「温泉
の」は、発音が同じで評価値が同一であり、かつ、表記
が異なる類似な候補文字列である。
【0028】次に、フィルタ部5は、上述のフィルタ処
理の後に、第2の認識ブロック内の候補文字列に「おん
泉の」、「温泉の」のように、発音が同一で、評価値が
同一又は所定の閾値の範囲内で、表記が異なる類似な候
補文字列が複数ある場合、これら類似な候補文字列の評
価値の補正を行う。この補正は、フィルタ部5が文字列
頻度記憶部3に記憶された補正対象の候補文字列と自立
語としての表記が一致する文字列の出現回数と、文字列
頻度記憶部3に記憶された補正対象の候補文字列と発音
が同じ文字列全ての出現回数とを文字列頻度記憶部4か
ら求め、さらに、前者を後者で正規化した値(以下分岐
確率と称す)を求め、さらにこの分岐確率の対数値に小
さな係数をかけた補正値を、補正対象の候補文字列の評
価値に加えることで行われる。
【0029】例えば、上述の「おん泉の」、「温泉の」
について説明すると、検索対象とするデータ記事中では
「おん泉の」という表記が30回、「温泉の」という表
記が、270回出現し、各々が文字列頻度記憶部3に記
憶されていた場合には、「おん泉の」の分岐確率が30
/300で0.1であり、対数値では−2.30とな
る。また、「温泉の」の分岐確率が270/300で
0.9であり対数値では−0.11となる。ここで係数
を0.001とすると、「おん泉の」の補正値は−2.
30×0.001で−0.0023、「温泉の」の補正
値は−0.11×0.001で−0.0011となる。
これらを各々の元の評価値に各々加えると、認識ブロッ
クAの{「音声の」、「温泉の」、「おん泉の」、「音
栓の」}の評価値は補正により(−10.45、−1
2.1011、−12.1023、−15.20)とな
る。これにより対象のデータ記事中での出現回数の多い
「温泉の」が「おん泉の」よりも評価値が上となる。ま
た、頻度を表す分岐確率の対数値に小さな係数の0.0
01をかけて、「おん泉の」と「温泉の」とが評価値の
低い他の候補である「音栓の」と順位が入れ替わるのを
防止している。フィルタ部5は上述のフィルタ処理、評
価値の補正をした後、第2の認識ブロックに相当する認
識ブロックA〜Dを評価値と共に文字列選択部6に出力
する。
【0030】次に、文字列選択部6、データベース検索
部7、表示部49の動作を図1、図2、図8により説明
する。図8は図1に示す表示部49の表示状態を示す説
明図である。図8において、49aは認識ブロック毎の
候補文字列及び検索結果を表示する画面、49bは候補
文字列を確定させるための確定ボタンである。文字列選
択部6は、まずフィルタ部5からの第2の認識ブロック
に相当する認識ブロックA〜Dを認識ブロック毎に評価
値の高い順に上から候補文字列を表示するように表示部
49に出力する。表示部49では図8に示すように、認
識ブロック毎に評価値の高い順に上から候補文字列(但
し図8では検索語と記載している。)を表示する。尚、
図8では認識ブロックを3つ示しているが、認識ブロッ
クの数が多く一度に表示しきれない場合は、認識ブロッ
クをスクロール表示できるようにしておけばよい。
【0031】また、文字列選択部6は利用者から文字列
入力部46により候補文字列の何れかを指定されると、
指定された候補文字列を選択し、選択された候補文字列
を表示部49に出力し、候補文字列の表示を変える。図
8では選択された候補文字列の表示色を反転させた場合
を示している。また、文字列選択部6は利用者から文字
列入力部46により確定ボタン49bを指定されると候
補文字列の選択を確定し、選択された全ての候補文字列
をデータベース検索部7に出力する。
【0032】尚、ここでは説明の都合上、認識ブロック
A〜Dから順に「温泉の」、「人気に」、「関する」、
「記事」が文字列選択部6に選択され、データベース検
索部7に出力されたとする。
【0033】データベース検索部7は文字列選択部6か
らの出力を受けて、候補文字列がデータベース検索部7
内に記憶された「〜関する記事」や「〜は?」や「〜に
ついての記事」や「〜のニュース」や「〜関する情報」
等々の文型に適合するか否かを判断する。そして、デー
タベース検索部7は候補文字列が文型に適合する場合に
は、文型中の「〜」の不特定部分に適合する候補文字列
と表記が同一の索引文字列を図2に示す索引文字列部1
aから求め、求めた索引文字列に対応して論理アドレス
部1bに記憶されているデータ記事の論理アドレスによ
り、データベース記憶部40を検索し索引文字列を含む
データ記事又は関連事項を出力する。
【0034】データベース検索部7は、例えば候補文字
列の「関する」、「記事」が文型の「〜関する記事」に
適合するので、文型の「〜」に適合する「温泉の」、
「人気に」と表記が同一の索引文字列を索引文字列部1
aから求め、求めた索引文字列に対応する論理アドレス
によりデータベース記憶部40を検索する。また、デー
タベース検索部7は、文型と候補文字列とが適合しない
場合、入力した全ての候補文字列に対して表記が同一の
索引文字列を索引文字列部1aから求め、同様にデータ
ベース記憶部40を検索する。そして、データベース検
索部7は、検索結果の該当件数が極めて多い場合は記事
の件数だけを、また該当件数が中程度であれば記事の見
出し部分を、また該当件数が小数であればデータ記事全
体を表示部49に出力する。
【0035】上述のように、この実施の形態1に示す音
声情報検索装置8によれば、フィルタ部5が、音声認識
部4から出力される認識ブロック(フィルタ処理前の第
1の認識ブロックに相当)から文字列頻度記憶部3に記
憶された文字列と表記の一致しない候補文字列を削除す
るフィルタ処理を行うので、表示部49には、フィルタ
処理後の第2の認識ブロックが出力され、検索対象のデ
ータ記事中に存在する文字列と表記が一致する候補文字
列のみが表示されることになり、利用者は候補文字列を
効率的に選択することができる。
【0036】さらにフィルタ部5はフィルタ処理の後、
第2の認識ブロック内の候補文字列のうち、発音が同一
で、評価値が同一又は所定の閾値の範囲内で、表記が異
なる類似な候補文字列が複数ある場合、それら類似な候
補文字列と表記が一致する文字列のデータ記事中での出
現頻度に応じて、類似な候補文字列各々の評価値を補正
するので、表示部49にはデータ記事中での出現頻度に
応じた順位で類似な候補文字列が表示されることにな
り、利用者による候補文字列選択の負担を軽減すること
ができる。また、データベース検索部7は、索引文字列
に対応して記憶されたデータ記事の論理アドレスにより
データベース記憶部40を検索するので、データ検索が
容易となる。
【0037】尚、この実施の形態1による音声情報検索
装置7は、利用者が文字列入力部46により確定ボタン
を指定し、文字列選択部6が候補文字列を確定した後
に、データベース検索部7がデータベース記憶部40を
検索するように構成したが、利用者が文字列入力部46
により確定ボタンを指定するまでは、文字列選択部6が
選択された候補文字列及びこの選択された候補文字列の
認識ブロックを除く未選択の認識ブロックの候補文字列
のうち評価値が最上位の候補文字列を自動的にデータベ
ース検索部7に出力するようにし、データベース検索部
7がその出力によりデータベース記憶部40を検索し、
検索結果としてデータ記事の件数を表示部49に出力さ
せるようにしてもよい。このようにすれば、順次候補文
字列を選択することにより検索の絞り込みの状況を把握
することができる。
【0038】実施の形態2.この発明の音声情報検索装
置の他の実施の形態について説明する。図9は、実施の
形態2による音声情報検索装置12を示す全体構成図で
ある。図9において、図1と同一又は相当部分は同一符
号を付し説明を省略する。9は後述する文字列間の関連
性を示す関連値を記憶した関連度記憶部、10は音声認
識部4からの候補文字列からなる認識ブロックと候補文
字列の評価値とを受け、認識ブロック毎に候補文字列を
その評価値に応じた順位で表示部49に表示させ、ま
た、文字列入力部46からの指示により候補文字列を選
択し、その選択した候補文字列と他の認識ブロックの候
補文字列との関連値を関連度記憶部9より求め、他の認
識ブロックの候補文字列の評価値を補正し、また、文字
列入力部46からの指示によりデータベース記憶部40
を検索するための候補文字列を出力する文字列選択部、
11は文字列選択部10からの出力を受けデータベース
記憶部40を検索し検索結果を表示部49に出力するデ
ータベース検索部、12は音声情報検索装置であり、上
述の符号9〜11を付した構成及びデータベース記憶部
40と音声入力部42と文字列入力部46と表示部49
と音声認識部4とを含んでいる。
【0039】次に、動作を図9により説明する。利用者
が音声で検索のための文字列を、例えば、/温泉の/人
気に/関する/記事/と音声入力部42に入力すると、
音声認識部4は音声入力部42からの音声入力を受け、
上述の実施の形態1に説明した音声認識部4の動作と同
様に動作し、図3に示す音響処理部4bが入力音声を音
節列として、図4に示す発声ブロックA〜D毎の音節グ
ラフA〜Dを図3に示す音節グラフ部4cに出力し、言
語処理部4fは音節グラフ部4cからの音節グラフA〜
D各々を文字列として認識して、図5に示す、認識ブロ
ックAの{「音声の」、「おんせえの」、「温泉の」、
「おん泉の」、「おんせんの」、「音栓の」、「おん栓
の」}と、認識ブロックBの{「認識に」、「人気
に」}と、認識ブロックCの{「関する」}と、認識ブ
ロックDの{「記事」、「支持」}とを、音節列の候補
文字列として認識した場合の、その候補文字列の信憑性
を示す評価値と共に文字列選択部10に出力する。
【0040】次に、文字列選択部10は、音声認識部4
からの認識ブロックと評価値とを受け、認識ブロック毎
に候補文字列を評価値の高い順に上から表示するように
して認識ブロックを表示部49に出力する。次に、文字
列選択部10は、利用者から文字列入力部46により、
1つの認識ブロックの候補文字列を指定されると、指定
された候補文字列を選択し、この候補文字列の評価値を
補正し、選択した候補文字列を最も上位の候補として表
示部49に表示させる。
【0041】さらに、文字列選択部10の詳細動作を説
明する。図10は関連度記憶部9の詳細説明図である。
図中、9aは、例えば、類語辞典等から文字列の表わす
概念を代表するような複数の代表文字列を抽出して記憶
した表記部、9bは、代表文字列が表わす概念に類似す
る内容を示す複数の類似文字列を上述の類語辞典等より
抽出し、この類似文字列に類似の近さを示す符号を付
し、類似文字列と符号とにより構成した概念コードを、
代表文字列と対応させて記憶した第1の概念コード部で
ある。例えば、表記部9aの代表文字列「音声」に対し
て類似文字列「声」に符号「324」を付した概念コー
ド「声:324」、類似文字列「音韻」に符号「83
1」を付した概念コード「音韻:831」等を第1の概
念コード部9bに記憶している。この実施の形態2で
は、代表文字列、類似文字列及び類似の近さを示す符号
を「大野普著:角川類語新辞典」より抽出した。9cは
類似部であり上述の表記部9aと第1の概念コード部9
bとを含む。9dは、第1の概念コード部9bに記憶し
た概念コードを全て記憶した第2の概念コード部であ
る。9eは、所定のデータ記事中に、任意の概念コード
の類似文字列とほぼ連続して現れる他の概念コードの類
似文字列(以下関連類似文字列と称す)がある場合、こ
の関連類似文字列と上述の符号とにより構成される概念
コードを記憶した関連概念コード部である。9fは、複
数の所定のデータ記事中に第2の概念コード部9dに記
憶された概念コードの類似文字列と関連概念コード部9
eに記憶された概念コードの関連類似文字列とがほぼ連
続して現れる回数を全データ記事数で正規化した値であ
る共起確率を求め、この共起確率の対数値を関連値とし
て記憶する関連値部である。この関連値は、各々対応す
る第2の概念コード9dに記憶した概念コードと関連概
念コード部9eに記憶した概念コードとの関連性、又
は、類似文字列と関連類似文字列間の関連性を示すもの
である。9gは関連部であり上述の第2概念コード部9
dと関連概念コード部9eと関連値部9fとを含む。
【0042】文字列選択部10は、文字列入力部46の
指示により認識ブロックから選択した候補文字列と表記
が一致する代表文字列(以下指定代表文字列と称す)
が、図10に示す類似部9cの表記部9aに記憶されて
いるか否かを関連度記憶部9に問い合わせる。表記部9
aに指定代表文字列が記憶されている場合、文字列選択
部10は、指定された候補文字列を含む認識ブロックの
前又は後の認識ブロックに含まれる未選択の候補文字列
と表記が一致する代表文字列(以下関連代表文字列と称
す)が類似部9cの表記部9aに記憶されているか否か
を関連度記憶部9に問い合わせる。関連代表文字列が表
記部9aに記憶されている場合、文字列選択部10は、
指定代表文字列と関連代表文字列との関連値を関連度記
憶部9に問い合わせる。
【0043】関連度記憶部9は、文字列選択部10の問
い合わせに応じて、指定代表文字列、関連代表文字列を
記憶しているか否かの応答、関連値の回答を行う。ここ
で、関連度記憶部9は、指定代表文字列と関連代表文字
列との関連値に関しては、関連部9gの第2の概念コー
ド部9dに記憶された指定代表文字列に対応する類似文
字列と、関連概念コード部9eに記憶された関連代表文
字列に対応する関連類似文字列との関連値が関連値部9
fに記憶されている場合、その関連値を指定代表文字列
と関連代表文字列との関連値として、文字列選択部10
に出力する。
【0044】例えば、利用者から文字列入力部46によ
り図5に示す認識ブロックAの「温泉の」が指定された
とすると、文字列選択部10は、「温泉の」に対する指
定代表文字列が類似部9cの表記部9aに記憶されてい
るか否かを関連度記憶部9に問い合わせる。図10に示
すように、表記部9aには「温泉の」と自立語としての
表記が一致する「温泉」が記憶されているので、関連度
記憶部9はその旨を回答する。文字列選択部10はこの
回答を受け、図5に示す認識ブロックBの候補文字列と
表記が一致する代表文字列が表記部9aに記憶されてい
るか否かを関連度記憶部9に問い合わせる。図10に示
すように表記部9aには認識ブロックBの「認識に」と
自立語としての表記が一致する「認識」が記憶され、認
識ブロックBの「人気に」と自立語としての表記が一致
する「人気」が記憶されているので、関連度記憶部9は
その旨を回答する。
【0045】文字列選択部10は、さらに、関連度記憶
部9に対して図5に示す認識ブロックAの「温泉の」に
対する指定代表文字列の「温泉」と、図5に示す認識ブ
ロックBの「認識に」、「人気に」に対応する関連代表
文字列「認識」、「人気」との間の関連値を問い合わせ
る。関連度記憶部9は、指定代表文字列、関連代表文字
列に対応する概念コードを第1の概念コード部9bより
求める。関連度記憶部9は求めた指定代表文字列の概念
コードを、第2の概念コード部9dに記憶された概念コ
ードと照合し、照合した概念コードに対応して、関連代
表文字列に対応する概念コードが関連概念コード部9e
に記憶されているかを調べる。関連度記憶部9は関連代
表文字列に対応する概念コードが関連概念コード部9e
に記憶されていれば、それら概念コード間の関連値、即
ち、それら概念コードに含まれる類似文字列と関連類似
文字列間の関連値を関連値部9fより求め、この関連値
を指定代表文字列と関連代表文字列との関連値として文
字列選択部10に出力する。図10に示すように、第1
の概念コード部9bには「温泉」に対する概念コード
「泉:037」、「認識」に対する概念コード「認識:
413」、「人気」に対する概念コード「評判:75
4」が記憶されている。また、関連部9gには、第2の
概念コード部9dの概念コード「泉:037」に対し
て、関連概念コード部9eに「評判:754」が記憶さ
れ、関連値部9fに関連値−8.5が記憶されている。
関連度記憶部9は、この関連値−8.5を「温泉」と
「人気」間の関連値として文字列選択部10に出力す
る。尚、関連度記憶部9は概念コード「泉:037」と
概念コード「認識:413」との関連値はないので「温
泉」と「認識」との関連値は出力しない。
【0046】次に、文字列選択部10は、関連度記憶部
9からの関連値と、後述の式(1)により、選択された
候補文字列の認識ブロックの前又は後の認識ブロックの
候補文字列の信憑性を示す評価値の補正を行う。ある認
識ブロックMのn番目の候補文字列を選択した場合の認
識ブロックMの前又は後の認識ブロックの候補文字列の
評価値は次式により補正される。 補正値=Σi,jL〔K(M,n),K(i,j)〕+S(i,j)・・(1) 但し、K(M,n)は指定文字列の概念コード、K
(i,j)は関連代表文字列の概念コード、L〔K
(M,n),K(i,j)〕はK(M,n)とK(i,
j)との関連値、S(i,j)は認識ブロックMの前又
は後の認識ブロックの候補文字列の評価値、i≠M、j
≠nである。尚、この関連値を関連度記憶部9から得ら
れなかった場合は、関連値を−∞とする。
【0047】例えば、上述の音声認識部4が、認識ブロ
ックBの各候補文字列の{「認識に」、「人気に」}の
評価値を各々(−10.45、−12.14)と出力し
た場合の評価値の補正について述べる。文字列選択部1
0は認識ブロックBの候補文字列「認識に」に対して、
指定代表文字列「温泉」と関連代表文字列「認識」との
関連値の回答がないので、式(1)中の「認識に」の関
連値を−∞とし、その評価値を−∞+(−10.45)
=−∞と補正する。又、文字列選択部10は候補文字列
の「人気に」に対して、指定代表文字列「温泉」と関連
代表文字列「人気」との関連値の−8.5を用いて、そ
の評価値を−8.5+(−12.14)=−20.64
と補正し、補正した評価値の順位に応じて表示されるよ
うに表示部49に出力する。これにより、補正前は、
「認識に」の評価値が−10.45、「人気に」の評価
値が−12.14であり、「認識に」が上位の候補とし
て表示部9に表示されていたが、補正後は、「認識に」
の評価値−∞に対し、「人気に」の評価値が−20.6
4と高くなり、選択された「温泉の」に関連性の高い候
補文字列である「人気に」が上位の候補として表示部4
9に表示される。
【0048】次に、文字列選択部10は、利用者から文
字列入力部46により、図8に示す確定ボタン49bを
指定されることにより候補文字列の選択を確定すると、
選択された全ての候補文字列をデータベース検索部11
に出力する。データベース検索部11は、図1に示すデ
ータベース検索部7と同様の文型を記憶しており、その
文型に対して、文字列選択部10からの候補文字列が適
合するか否か判断する。そして、文型に候補文字列が適
合する場合、実施の形態1に示した「〜関する記事」等
の文型中の「〜」の不特定部分に適合する候補文字列に
よりデータベース記憶部40を検索し候補文字列と同一
表記の文字列を含むデータ記事又は関連事項を出力す
る。また、データベース検索部11は、文型と候補文字
列とが適合しない場合、入力した全ての候補文字列によ
り同様にデータベース記憶部40を検索する。そして、
データベース検索部11は、検索結果の該当件数が極め
て多い場合は記事の件数だけを、また該当件数が中程度
であれば記事の見出し部分を、また該当件数が小数であ
ればデータ記事全体を表示部49に出力する。表示部4
9はデータベース検索部11の出力を表示する。
【0049】尚、この実施の形態2においても、上述の
実施の形態1で示した索引部1を設けて、索引文字列の
データの論理アドレスによりデータベース記憶部40を
検索してもよい。また、認識ブロックは1文節からなる
場合について説明したが、認識ブロックの候補が複数文
節であってもよい。
【0050】また、この実施の形態2では、関連値は特
に分野を限定せずに多数のデータ記事から求めたが、関
連値を分野毎に分類したデータ記事から求めてもよい。
即ち、例えば、関連値を求めるデータ記事を自然、社
会、文化、芸術等々の分野に分類して求めたり、関連値
を求めるデータ記事を新聞記事、特許、学術論文等々の
分野毎に分類して求める。又、データベース記憶部40
に記憶するデータ記事が新聞記事のみの場合は、経済
面、社会面や芸能・スポーツ欄等々に分類して、この分
類毎に関連値を求めるものである。以下に、関連値を分
野毎に求める場合についての動作を説明する。但し、関
連度記憶部9と文字列選択部10の動作は上述の通りで
あるので、要点のみ詳細に説明する。
【0051】利用者が/劇団の/公演に/と音声入力し
たとすると、音声認識部4が上述のとおり動作し、例え
ば、音声入力の/劇団の/により、認識ブロック{「劇
団の」}と各候補文字列の評価値とを出力する。又、音
声入力の/公演に/により、認識ブロック{「講演
に」、「公演に」、「公園に」、「後援に」、「好演
に」、「後円に」}と各候補文字列の評価値とを出力す
る。これらは文字列選択部10を介して表示部49に評
価値の順に表示される。利用者から文字列入力部46に
より、前の認識ブロックの「劇団の」が指定された場
合、文字列選択部10は、「劇団の」の指定代表文字列
が表記部9aに記憶されているか否かを関連度記憶部9
に問い合わせ、記憶されていた場合、後の認識ブロック
{「講演に」、「公演に」、「公園に」、「後援に」、
「好演に」、「後円に」}の関連代表文字列が表記部9
aに記憶されているか否かを関連度記憶部9に問い合わ
せる。表記部9aに指定代表文字列、関連代表文字列が
記憶されていた場合、文字列選択部10は、指定代表文
字列と関連代表文字列の関連値を関連度記憶部9に問い
合わせる。
【0052】ここで、関連度記憶部9の関連値部9fに
記憶された関連値が、例えば、芸術、の分野に分類され
たデータ記事から求められていた場合、そのデータ記事
中には、比較的に芸術の分野と関連する「公演に」、
「好演に」等々に概念的に類似な文字列は、その他の比
較的に自然の分野と関連する「公園に」、又は比較的に
文化、政治の分野と関連する「講演に」、「後援に」等
に概念的に類似な文字列よりも、データ記事中で「劇団
に」と概念的に類似な文字列と略連続して出現する頻度
が高くなっているものと考えられる。関連値は上述した
ように、概念的に類似な文字列が略連続して出現する頻
度から求めているので、関連値部9fには「公演に」、
「好演に」等々に概念的に類似な文字列と、「劇団に」
と概念的に類似な文字列との間では高い関連値が記憶さ
れているものと考えられる。したがって、「公演に」、
「好演に」等々は「劇団に」との間に高い関連値が得ら
れると考えられる。
【0053】即ち、文字列選択部10は、関連度記憶部
9からの関連値と、上述の式(1)とにより、後の認識
ブロックの{「講演に」、「公演に」、「公園に」、
「後援に」、「好演に」、「後円に」}の評価値を補正
して、「公演に」、「好演に」が上位の候補として表示
されるように表示部49に出力する。これにより利用者
の候補文字列選択の負担をより軽減できる。
【0054】上述のように、この実施の形態2による音
声情報検索装置12によれば、利用者によって1つの認
識ブロックの候補文字列を指定されると、文字列選択部
10が、選択された候補文字列を含む認識ブロックの前
又は後の認識ブロックの未選択の候補文字列の評価値
を、関連度記憶部9の関連値部9fに記憶された関連値
に応じて補正し、選択した候補文字列と関連性の高い候
補文字列が上位として表示されるようにするので、利用
者が多数の認識ブロックから候補文字列を指定する際の
負担を軽減することができる。また、関連値として用い
た概念コード間の共起確率は多くの文書の統計的処理に
よって求めているので、文字列間の関連性を構成する際
に人間による意味的な分析や解析を用いなくても済むと
言う利点がある。
【0055】また、関連値を分野毎に求めることによ
り、任意の分野を対象とする場合に比べ、選択した候補
文字列との関連性がより高い候補文字列を上位の候補と
して表示できるので、利用者の希望に沿う結果が得られ
る可能性が高くなり、より利用者の候補文字列選択の際
の負担を軽減できる。
【0056】実施の形態3.この発明の音声情報検索装
置の他の実施の形態について説明する。図11は、実施
の形態3による音声情報検索装置を示す全体構成図であ
る。図11において、図1又は図9と同一又は相当部分
は同一符号を付し説明を省略する。13は音声認識部4
からの候補文字列からなる認識ブロックと候補文字列の
評価値とを受け、認識ブロック毎に候補文字列をその評
価値に応じた順位で表示部49に表示させ、また、文字
列入力部46からの指示により候補文字列を選択し、そ
の選択した候補文字列と他の認識ブロックの候補文字列
との関連値を関連度記憶部9より求め、他の認識ブロッ
クの候補文字列の評価値を補正し、また、文字列入力部
46からの指示によりデータベース記憶部40を検索す
るための候補文字列を出力する文字列選択部、14は音
声情報検索装置であり、上述の文字列選択部13とデー
タベース記憶部40と音声入力部42と文字列入力部4
6と表示部49と音声認識部4と関連度記憶部9とデー
タベース検索部11とを含む。
【0057】次に、動作を図11により説明する。例え
ば、利用者が/温泉の/と音声入力部42に音声入力す
ると、音声認識部4が上述の実施の形態2で示した音声
認識部4の動作と同様に動作し、図5に示す認識ブロッ
クAの{「音声の」、「おんせいの」、「温泉の」、
「おん泉の」、「おんせんの」、「音栓の」、「おん栓
の」}を認識結果の信憑性を示す評価値と共に文字列選
択部13に出力する。
【0058】文字列選択部13は音声認識部4からの認
識ブロックAと評価値とを受け、候補文字列を評価値の
高い順に表示部49に表示させる。又、文字列選択部1
3は、利用者から文字列入力部46により、例えば、
「温泉の」を指定された場合、この「温泉の」を最も上
位の候補として表示部49に表示させ、「温泉の」と表
記が一致する代表文字列(以下指定代表文字列と称す)
が関連度記憶部9の表記部9aに記憶されているか否か
を関連度記憶部9に問い合わせる。関連度記憶部9は、
図10に示すように表記部9aに自立語として一致する
「温泉」が記憶されているので、記憶されている旨を回
答する。文字列選択部13は、その回答を記憶する。
【0059】次に、利用者が/人気に/と音声入力部4
2に音声入力すると、音声認識部4が上述のように動作
し、図5に示す認識ブロックBの{「人気に」、「認識
に」}と、例えば評価値として各々(−12.14、−
10.45)を文字列選択部13に出力する。文字列選
択部13は、音声認識部4からの認識ブロックBの候補
文字列をその評価値に応じて表示部49に表示させる前
に、「温泉の」と「認識に」、「温泉の」と「人気に」
等々の各々の関連性により「認識に」、「人気に」の評
価値の補正を行う。文字列選択部13は、先の音声入力
の/温泉の/に対応する指定代表文字列である「温泉」
が表記部9aに記憶されている旨の回答受けているの
で、次の音声入力による「人気に」、「認識に」と表記
が一致する代表文字列(以下関連代表文字列と称す)が
表記部9aに記憶されているか否かを関連度記憶部9に
問い合わせる。関連度記憶部9は、文字列選択部13の
問い合わせに応じて、関連代表文字列を記憶しているか
否かの応答を文字列選択部13に対して行う。
【0060】文字列選択部13は、関連代表文字列が表
記部9aに記憶されている旨の回答を受けた場合、指定
代表文字列と関連代表文字列との関連値を関連度記憶部
9に問い合わせる。関連度記憶部9は、上述の実施の形
態2で示した動作と同様に動作し、図10に示す第2の
概念コード部9dに記憶した概念コードの類似文字列と
関連概念コード部9eに記憶した概念コードの関連類似
文字列との関連値を関連値部9fより求め、この関連値
を指定代表文字列と関連代表文字列との関連値として文
字列選択部13に出力する。文字列選択部13は、関連
度記憶部9からの関連値と上述の実施の形態2で示した
式(1)により、上述の実施の形態2で示したと同様に
「人気に」、の評価値を(−20.64)、「認識に」
の評価値を(−∞)と補正して、「人気に」を上位の候
補として表示部49に表示させる。これにより、「温泉
の」と関連性の高い、「人気に」が表示部49に上位の
候補として表示されるので、利用者の候補文字列の選択
の負担を軽減できる。
【0061】次に、例えば、利用者が文字列入力部46
により「人気に」を指定し、文字列選択部13が「人気
に」を選択すると、文字列選択部13が「人気に」の指
定代表文字列が関連度記憶部9に記憶されている旨を記
憶し、利用者からの次の音声入力の際には、文字列選択
部13と関連度記憶部9とが上述のように動作し、自動
的に「人気に」と関連性の高い候補文字列が上位の候補
として表示部49に表示される。
【0062】上述のように、この実施の形態3の音声情
報検索装置14によれば、音声入力毎に以前に選択した
候補文字列と関連性の高い候補文字列が上位の候補とし
て表示されるので、利用者の候補文字列選択の際の負担
が軽減される。
【0063】実施の形態4.この発明の音声情報検索装
置の他の実施の形態について説明する。図12は、この
実施の形態4による音声情報検索装置を示す全体構成図
である。図12において、図1と同一又は相当部分は同
一符号を付し説明を省略する。15はデータベース記憶
部40に記憶された複数のデータ記事に含まれる文字列
を、複数のデータ記事がデータベース記憶部40の何れ
に記憶されているか示す論理アドレスとともに、データ
ベース記憶部40から抽出し、この抽出した文字列と論
理アドレスとを付与した索引文字列とを記憶し、かつ後
述する発音記号付与部からの音節列に該当する論理アド
レスを付して索引音節列を記憶した索引部、16は、予
め索引部15の索引文字列の文字列を発音記号としての
音節列に変換し、この音節列を索引部15に記憶させた
発音記号付与部、17は入力された音声を音節列とし、
この音節列に対する複数の候補文字列を出力する音声認
識部、18は音声情報検索装置であり、上述の符号15
〜17を付した構成と、データベース記憶部40と音声
入力部42と表示部49とデータベース検索部7とを含
む。尚、この実施の形態4において、発音記号としての
音節列は、かな文字として表記する。
【0064】図13は図12に示す索引部15の索引文
字列と音節列と論理アドレスとの関係を示す説明図であ
り、15aは索引文字列を記憶した索引文字列部、15
bは発音記号付与部16からのかな文字列を索引文字列
部15aの索引文字列に対応させて記憶した音節列部、
15cは索引文字列に付与された論理アドレス部であ
る。
【0065】図14は図12に示す音声認識部17の詳
細説明図である。図12において図3と同一又は相当部
分は同一符号を付し説明を省略する。17aは音節グラ
フ部4cの音節グラフの音節列に対応するかな文字列を
記憶された辞書部、17bは辞書部17aと文法部4e
とを用い、図4に示すような音節グラフの音節列に対応
するかな文字列を出力する言語処理部である。
【0066】次に、動作を図12乃至図14により説明
する。利用者が、例えば/音声の/認識に/と音声入力
部42に音声入力すると、この入力された音声は、図1
4に示す音声認識部17の音響処理部4bにより音響処
理され、各々発声ブロック毎に、音節グラフとして音節
グラフ部4cに記憶される。言語処理部17bは、辞書
部17a及び文法部4eを用いて文法的に正しくなるよ
うに音節グラフをかな文字列として認識し、複数の候補
音節列からなる認識ブロックをデータベース検索部7に
出力する。例えば、音声認識部17により、/音声の/
は、認識ブロック{「おんせえの」、「おんせんの」}
としてデータベース検索部7に出力され、/認識に/
は、認識ブロック{「にんしきに」、「にんきに」}と
してデータベース検索部7に出力される。尚、これら認
識ブロックの候補音節列は、発音記号としての音節列を
かな文字列として表記してあるので、同音意義語や表記
のゆれ等の問題は生じない。
【0067】データベース検索部7は、各認識ブロック
から候補音節列を1づつ抽出し音声入力順に組み合わせ
る。この場合「おんせえの」と「にんしきに」、「おん
せえの」と「にんきに」、「おんせんの」と「にんしき
に」、「おんせんの」と「にんきに」の4通りの組合わ
せが得られる。次に、データベース検索部7は、全ての
組合わせについて、各候補音節列の自立語相当部分と表
記が一致するかな文字列を、図13に示す音節列部15
bから求め、この求めたかな文字列に対応する索引文字
列を索引文字列部17aから求め、求めた索引文字列に
付与されているデータ記事の論理アドレスにより、デー
タベース記憶部40を検索し、検索結果を表示部49に
出力する。
【0068】上述のように、この実施の形態4に示す音
声情報検索装置18でによれば、発音記号としての音節
列をかな文字列として表記し、このかな文字列を手掛か
りとしてデータベース記憶部40を検索しているので、
データ記事中に同音意義語や表記のゆれがあっても、デ
ータベース記憶部40の検索が可能である。また、デー
タベース検索部7は、索引文字列に付加されたデータ記
事の論理アドレスリストによりデータベース記憶部40
を検索するので、データ検索が容易となる。
【0069】尚、この実施の形態4では、発音記号とし
て音節列を用いたが、音素や音韻記号を用いてもよいこ
とは言うまでもない。
【0070】実施の形態5.この発明の音声情報検索装
置の他の実施の形態について説明する。図15は、この
実施の形態5による音声情報検索装置を示す全体構成図
である。図15において図11又は図12と同一又は相
当するものは同一符号を付し説明を省略する。
【0071】19はデータベース記憶部40に記憶され
ているデータ記事に含まれる文字列全てを記憶し、文字
列各々をかな文字列に変換し、文字列とかな文字列を対
応させて記憶した記憶部である。20は音声情報検索装
置であり、上述の記憶部19とデータベース記憶部40
と音声入力部42と表示部49とデータベース検索部1
1と音声認識部17とを含む。
【0072】次に、動作を図15により説明する。利用
者が、例えば、/音声の/認識に/と音声入力部42に
音声入力すると、この入力された音声は、図14に示す
音声認識部17の音響処理部4bにより音響処理され、
各々音節グラフとして音節グラフ部4cに記憶される。
言語処理部17bは、辞書部17a及び文法部4eを用
いて文法的に正しくなるように音節グラフをかな文字列
として認識し複数の候補音節列からなる認識ブロックを
データベース検索部11に出力する。例えば、音声認識
部17により、/音声の/は、上述の実施の形態4と同
様に認識ブロックの{「おんせえの」、「おんせん
の」}としてデータベース検索部11に出力され、/認
識に/は、認識ブロックの{「にんしきに」、「にんき
に」}としてデータベース検索部11に出力される。
尚、これら認識ブロックの候補音節列は発音記号として
の音節列をかな文字列として表記してあるので、同音意
義語や表記のゆれ等の問題は生じない。
【0073】データベース検索部11は、各認識ブロッ
クから候補音節列を1づつ抽出し音声入力順に組み合わ
せる。この場合、「おんせえの」と「にんしきに」、
「おんせえの」と「にんきに」、「おんせんの」と「に
んしきに」、「おんせんの」と「にんきに」の4通りの
組合わせが得られる。次に、データベース検索部11
は、全ての組合わせについて、各候補音節列の自立語相
当部分と表記が一致するかな文字列に対応する文字列を
記憶部19から求め、求めた文字列により、データベー
ス記憶部40を検索し、検索結果を表示部49に出力す
る。
【0074】上述のように、この実施の形態5に示す音
声情報検索装置20によれば、発音記号としての音節列
をかな文字列として表記し、このかな文字列を手掛かり
にデータベース記憶部40を検索しているため、データ
記事中に同音意義語や表記のゆれがあっても、データベ
ース記憶部40の検索が可能である。
【0075】実施の形態6.この発明の音声情報検索装
置の他の実施の形態について説明する。図16は、この
実施の形態6による音声情報検索装置を示す全体構成図
である。図16において図1と同一又は相当部分は同一
符号を付し説明を省略する。21は入力された音声を音
節列とし、この音節列に対する複数の候補文字列を出力
する音声認識部、22は音声情報検索装置であり、上述
の音声認識部21とデータベース記憶部40と音声入力
部42と文字列入力部46と索引部1と文字列頻度抽出
部2と文字列頻度記憶部3とフィルタ部5と文字列選択
部6とデータベース検索部7と表示部49とを含む。
【0076】図17は図16に示す音声認識部21の詳
細説明図である。図17において、図3と同一又は相当
部分は同一符号を付し説明を省略する。21aは図4に
示すような音節グラフの音節に対応する文字列を記憶し
た辞書部であり、図6に示す辞書部4dと同等の内容を
記憶した第1の辞書部と後述する第2の辞書部とを含
む。21fは文法規則を記憶した文法部、21iは、辞
書部21aと文法部21fを用いて発声ブロツク毎の音
節グラフの音節列に対応して第1の候補文字列と第2の
候補文字列からなる認識ブロックを出力する言語処理部
である。また、図18は図17に示す辞書部21aに記
憶された第2の辞書部を示す説明図である。図18にお
いて、21bは英字を1文字毎、数字を1字毎及び片仮
名文字を記憶した表記部、21cは表記部21bに記憶
した文字の発音記号としての音節列を記憶した音節列
部、21dは表記部21bに記憶した文字に対応して品
詞を記憶した品詞部、21eは辞書部2aの第2の辞書
部であり、上述の符号21b〜21dを付した構成を含
む。図19は図17に示す文法部21fに記憶された文
法規則を示す説明図である。図19において、21gは
文法規則を記憶した文法規則部、21hはその文法規則
を適用した場合に文字列の文法上の確からしさ補正する
ための補正値を記憶したスコア部である。
【0077】次に、動作を図16乃至図19により説明
する。例えば、利用者がデータ記事中に「オンセエ」と
片仮名文字で記載されているデータ記事を検索したい場
合、利用者が、/オンセエ/と音声入力部42に音声入
力すると、図17に示す音声認識部21の音響処理部4
bは音響辞書及び音節ネットワーク部4aを用いて図4
に示す音節グラフを出力する。
【0078】言語処理部21iは、音節グラフを受け、
この音節グラフを辞書部21aに含まれた、図6に示す
辞書部4dと同等の内容を記憶した第1の辞書部と第2
の辞書部2eに記憶された上述の内容及び文法部21f
に記憶された文法規則等に照らして音節の経路を探索し
複数の候補文字列と各々の認識結果の信憑性を示す評価
値とをフィルタ部5に出力する。例えば、言語処理部2
1iは辞書部21aの第1の辞書部と文法部21hによ
り{「音声」、「おんせえ」、「温泉」、「おん泉」、
「おんせん」、「音栓」、「おん栓」}等を第1の候補
文字列とし、図18に示す第2の辞書部2eの表記部2
1bに記憶された、英字、数字、片仮名文字等を組合わ
せた第2の候補文字列を生成し、この第2の候補文字列
と上述の第1の候補文字列とからなる認識ブロックをフ
ィルタ部5に出力する。例えば、言語処理部21iは、
片仮名文字を組み合わせた第2の候補文字列である「オ
ンセエ」、「オンセン」等と上述の第1の候補文字列と
からなる認識ブロックを第1、第2の候補文字列各々の
認識結果の信憑性を示す評価値と共にフィルタ部5に出
力する。尚、言語処理部21iは、新たに生成した第2
の候補文字列の「オンセエ」、「オンセン」等は特殊な
文字列として扱い、この文字列を名詞とする場合は、図
19に示すスコア部21hに記憶した補正値により、文
字列の文法上の確からしさを補正する。このため、第2
の候補文字列の「オンセエ」及び「オンセン」等は、品
詞とした場合に、上述の第1の候補文字列に比べ評価値
が低くなる。
【0079】次に、フィルタ部5は、音声認識部21か
らの認識ブロックと評価値について上述の実施の形態1
で述べたフィルタ処理及び必要によって類似な候補文字
列の評価値の補正を行った後、第1の候補文字列と第2
の候補文字列とからなる認識ブロックと評価値とを文字
列選択部6に出力する。フィルタ部5と文字列頻度記憶
部3の動作は上述の実施の形態1で述べたものと同等で
あるので詳細な説明は省略するが、例えば、ここでデー
タベース記憶部40に記憶されたデータ記事中に「オン
セエ」という文字列が頻繁に出現しているならば、文字
列頻度記憶部3には「オンセエ」の出現回数が多く記憶
されていることになるので、フィルタ部5は「オンセ
エ」の評価値を高く補正することになる。文字列選択部
6はフィルタ部5からの認識ブロックに含まれる第1の
候補文字列と第2の候補文字列とを評価値の高い順に表
示部49に表示させる。また、文字列選択部6は、例え
ば、利用者から文字列入力部46により「オンセエ」を
指定されると、「オンセエ」を選択し、この「オンセ
エ」を検索用の候補文字列としてデータベース検索部7
に出力する。データベース検索部7は「オンセエ」と表
記が一致する索引文字列を実施の形態1と同様に索引部
1の図2に示す索引文字列部1aより求め、求めた索引
文字列に付与されているデータ記事の論理アドレスによ
りデータベース記憶部40を検索し、検索結果を表示部
49に出力する。
【0080】上述のように、この実施の形態6に示す音
声情報検索装置22によれば、音声認識部21の言語処
理部21iが辞書部21aの第2の辞書部21eに記憶
された英字、数字、片仮名文字等を組み合わせて、音声
入力に対応する第2の候補文字列を出力するので、音声
入力に対応する第1の候補文字列が辞書部21aに記憶
されていない場合でも、データベース記憶部40の検索
が可能である。
【0081】尚、上述の説明では、言語処理部21iが
片仮名文字を組み合わせた場合について説明したが、例
えば、辞書部21aに第1の候補文字列として記憶され
ていない/UAW/、/G7/等を利用者が音声入力し
た場合、音声認識部21の言語処理部21iは、辞書部
21aの第2の辞書部21eに記憶された上述の内容及
び文法部21fに記憶された文法規則等に照らして音節
の経路を探索し、音声入力の/UAW/に対しては、例
えば、英字を組み合わせた「UAW」、又は片仮名文字
を組み合わせた「ユーエーダブリュー」等の第2の候補
文字列を生成し、この第2の候補文字列からなる認識ブ
ロックを第2の候補文字列各々の評価値と共にフィルタ
部5に出力する。又、言語処理部21iは音声入力の/
G7/に対しては、例えば、英字と数字を組み合わせた
「G7」等の第2の候補文字列を生成して、この第2の
候補文字列からなる認識ブロックを第2の候補文字列各
々の評価値と共にフィルタ部5に出力する。尚、第2の
辞書部21eにひらがなを加え、英字、数字、片仮名文
字、ひらがな等により第2の候補文字列を生成するよう
にしてもよい。
【0082】
【発明の効果】この発明の音声情報検索装置によれば、
データベース部のデータに含まれる文字列をデータがデ
ータベース部の何れに記憶されているかを示す索引を付
与した索引文字列を記憶した索引部と、音声認識部の出
力を受け第1の認識ブロックから索引文字列と表記が一
致しない候補文字列を削除した第2の認識ブロックと、
第2の認識ブロックの候補文字列の評価値とを出力する
フィルタ部とを設け、この出力を受けた表示部が第2の
認識ブロックの候補文字列を評価値に応じた順位で表示
するので、利用者の索引文字列の選択の負担を軽減する
ことができる。また、データベース検索部は、所要の索
引文字列と関連するデータをデータベース部から検索す
るので検索が容易となる。
【0083】さらに、次の発明の音声情報検索装置によ
れば、索引文字列の索引を除いた文字列がデータ中に出
現する回数を索引文字列と対応させて記憶した文字列頻
度記憶部を設け、フィルタ部は第2の認識ブロックの内
に同音異表記の異表記候補文字列がある場合には、異表
記候補文字列毎に文字列が一致する索引文字列の出現回
数を文字列頻度記憶部より求め、出現回数に応じて第2
の認識ブロックの異表記候補文字列の評価値を補正する
ので、異表記候補文字列をデータ中の出現回数に応じて
表示するので、より利用者の索引文字列の選択の負担を
軽減することができる。
【0084】また、次の発明の音声情報検索装置によれ
ば、所定の記事に含まれる複数の代表文字列及びこの複
数の代表文字列に類似する複数の類似文字列及び所定の
記事又は他の記事中に類似文字列にほぼ続いて現れる関
連類似文字列と当該類似文字列との関連性を示す関連値
を記憶した関連度記憶部と、文節に区切られた音声を入
力して文字列として認識して出力した少なくとも1つの
候補文字列を含む認識ブロックと上記候補文字列の信憑
性を示す評価値とを出力する音声認識部と、入力部から
の指示に応じて一方の認識ブロック内のある候補文字列
を特定候補文字列として指定すると、関連度記憶部に問
い合わせ、特定候補文字列と表記が一致する類似文字列
と他方の認識ブロック内の未特定の候補文字列と表記が
一致する関連類似文字列との間の関連値に応じて、未特
定の候補文字列の評価値を補正し、この補正した評価値
に応じた順位で他方の認識ブロック内の未特定の候補文
字列を表示部に表示させる文字列選択部とを設けたの
で、利用者が1つの認識ブロックの候補文字列を指定す
ることにより、表示部に他の認識ブロックの未特定候補
文字列を指定した候補文字列との関連性に応じた順位で
表示させることができ、利用者の検索文字列の選択の負
担を軽減することができる。
【0085】さらに、次の発明の音声情報検索装置によ
れば、他の記事を分野毎に分類し、関連度記憶部は分野
毎の記事について関連値を記憶したので、利用者が指定
した候補文字列とより関連性の高い他の認識ブロックの
未特定の候補文字列を上位として表示することができ、
さらに利用者の検索文字列の選択の負担を軽減すること
ができる。
【0086】また、次の発明の音声情報検索装置によれ
ば、データベース部のデータに含まれる文字列をデータ
がデータベース部の何れに記憶されているかを示す索引
を付与した索引文字列とこの索引文字列を音節列に変換
した索引音節列とを記憶した索引部と、音声を入力して
音節列として認識し候補音節列を出力する音声認識部
と、候補音節列と一致する索引音節列に対応する索引文
字列に関連するデータをデータベース部から検索するデ
ータベース検索部とを設けたので、同音異表記文字列や
表記のゆれによらず、容易にデータベース部を検索でき
る。
【0087】また、次の発明の音声情報検索装置によれ
ば、データベース部のデータに含まれる文字列を音節列
に変換し索引音節列として記憶した記憶部と、音声を入
力して音節列として認識し候補音節列を出力する音声認
識部と、音声認識部の出力を受け候補音節列と一致する
索引音節列を記憶部から求めて、求めた索引音節列に対
応する文字列を含むデータをデータベース部から検索す
るデータベース検索部とを設けたので、同音異表記文字
列や表記のゆれによらずデータベース部を検索できる。
【0088】また、次の発明の音声情報検索装置によれ
ば、データベース部のデータに含まれる文字列をデータ
がデータベース部の何れに記憶されているかを示す索引
を付与した索引文字列を記憶した索引部と、音声を入力
して音節列に変換して候補音節列を出力する音響処理部
と、第1の辞書部から候補音節列と一致する音節列に対
応する文字列を第1の候補文字列として選択し、第2の
辞書部の音節を組み合わせて候補音節列と一致させ、こ
の一致した音節に対応する文字の組み合わせを第2の候
補文字列として生成し、第1の候補文字列と第2の候補
文字列とを第1の候補文字列と第2の候補文字列との信
憑性を示す評価値と共に出力する言語処理部と、利用者
の指示に応じて第1の候補文字列又は第2の候補文字列
から所要の索引文字列を選択する文字列選択部と、所要
の索引文字列に関連するデータをデータベース部から検
索するデータベース検索部とを設けたので、第1の辞書
部に音声に該当する文字列が記憶されていない場合で
も、第2の辞書部の文字を組み合わせて生成した候補文
字列によりデータベース部を検索することができる。
【図面の簡単な説明】
【図1】 この発明の実施の形態1の音声情報検索装置
8を示す構成図である。
【図2】 索引部1の索引文字列1aと論理アドレス1
bとの関係を示す説明図である。
【図3】 音声認識部4の詳細説明図である。
【図4】 音節グラフの説明図である。
【図5】 音節グラフに対応した認識ブロックを示す説
明図、
【図6】 辞書部4dの一例を示す説明図である。
【図7】 文法部4eの一例を示す説明図である。
【図8】 表示部49の表示状態を示す説明図である。
【図9】 この発明の実施の形態2の音声情報検索装置
12を示す構成図である。
【図10】 関連度記憶部9の詳細説明図である。
【図11】 この発明の実施の形態3の音声情報検索装
置14を示す構成図である。
【図12】 この発明の実施の形態4の音声情報検索装
置18を示す構成図である。
【図13】 索引部15の索引文字列部15aと音節列
部15bと論理アドレス15cとの関係を示す説明図で
ある。
【図14】 音声認識部17の詳細説明図である。
【図15】 この発明の実施の形態5の音声情報検索装
置20を示す構成図である。
【図16】 この発明の実施の形態6の音声情報検索装
置22を示す構成図である。
【図17】 音声認識部21の詳細説明図である。
【図18】 第2の辞書部21eに記憶された内容を示
す説明図である。
【図19】 文法部21fに記憶されたの文法規則を示
す説明図である。
【図20】 従来の音声情報検索装置50を示す構成図
である。
【符号の説明】
1 索引部、2 文字列頻度抽出部、3 文字列頻度記
憶部、4 音声認識部、5 フィルタ部、6 文字列選
択部、7 データベース検索部、8 音声情報検索装
置、9 関連度記憶部、10 文字列選択部、12 音
声情報検索装置、13 文字列選択部、14 音声情報
検索装置、15 索引部、17 音声認識部、18 音
声情報検索装置、19 記憶部、20 音声情報検索装
置、21音声認識部、22 音声情報検索装置

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 複数のデータを記憶したデータベース部
    と、上記データに含まれる文字列を上記データが上記デ
    ータベース部の何れに記憶されているかを示す索引を付
    与し索引文字列として抽出し記憶する索引部と、文節に
    区切られた音声を入力して文字列として認識して出力し
    た少なくとも1つの候補文字列を有する第1の認識ブロ
    ックと上記候補文字列の信憑性を示す評価値とを出力す
    る音声認識部と、上記音声認識部の出力を受け上記第1
    の認識ブロックから上記索引文字列と表記が一致しない
    候補文字列を削除した第2の認識ブロックと上記第2の
    認識ブロックの候補文字列の上記評価値とを出力するフ
    ィルタ部と、上記フィルタ部の出力を受け上記第2の認
    識ブロックの候補文字列を上記評価値に応じた順位で表
    示する表示部と、入力部からの指示により上記表示部に
    表示された上記候補文字列から所要の索引文字列を選択
    する文字列選択部と、上記所定の索引文字列と関連する
    データを上記データベース部から検索するデータベース
    検索部とを備えたことを特徴とする音声情報検索装置。
  2. 【請求項2】 索引文字列の索引を除いた文字列がデー
    タ中に出現する回数を上記索引文字列と対応させて記憶
    した文字列頻度記憶部を設け、フィルタ部は第2の認識
    ブロック内に同音異表記の異表記候補文字列がある場合
    には、上記異表記候補文字列毎に文字列が一致する上記
    索引文字列の出現回数を上記文字列頻度記憶部より求
    め、上記出現回数に応じて上記第2の認識ブロックの上
    記異表記候補文字列の評価値を補正することを特徴とす
    る請求項1に記載の音声情報検索装置。
  3. 【請求項3】 複数のデータを記憶したデータベース部
    と、所定の記事に含まれる複数の代表文字列及びこの複
    数の代表文字列に類似する複数の類似文字列とを記憶
    し、上記所定の記事又は他の記事中に上記類似文字列に
    ほぼ続いて現れる関連類似文字列と当該類似文字列との
    関連性を示す関連値を記憶する関連度記憶部と、文節に
    区切られた音声を入力して文字列として認識して出力し
    た少なくとも1つの候補文字列を含む認識ブロックと上
    記候補文字列の信憑性を示す評価値とを出力する音声認
    識部と、上記音声認識部の出力を複数受け、入力部から
    の指示に応じて一方の認識ブロック内のある候補文字列
    を特定候補文字列として指定すると、上記関連度記憶部
    に問い合わせ、上記特定候補文字列と表記が一致する上
    記類似文字列と他方の認識ブロック内の未特定の候補文
    字列と表記が一致する上記関連類似文字列との間の上記
    関連値に応じて、上記未特定の候補文字列の評価値を補
    正し、この補正した評価値に応じた順位で上記他方の認
    識ブロック内の未特定の候補文字列を表示部に表示さ
    せ、上記入力部からの指示に応じて上記他方の認識ブロ
    ックから所要の検索文字列を選択する文字列選択部と、
    上記所要の検索文字列を含むデータを上記データベース
    部から検索するデータベース検索部とを備えたことを特
    徴とする音声情報検索装置。
  4. 【請求項4】 他の記事を分野毎に分類し、関連度記憶
    部は上記分野毎の記事について関連値を記憶したことを
    特徴とする請求項3に記載の音声情報検索装置。
  5. 【請求項5】 複数のデータを記憶したデータベース部
    と、上記データに含まれる文字列を上記データが上記デ
    ータベース部の何れに記憶されているかを示す索引を付
    与し索引文字列として抽出し記憶し、かつ上記索引文字
    列を音節列に変換した索引音節列を記憶する索引部と、
    文節に区切られた音声を入力して音節列として認識し候
    補音節列を出力する音声認識部と、上記候補音節列と一
    致する上記索引音節列に対応する上記索引文字列に関連
    するデータを上記データベースから検索するデータベー
    ス検索部とを備えたことを特徴とする音声情報検索装
    置。
  6. 【請求項6】 複数のデータを記憶したデータベース部
    と、上記データに含まれる文字列を音節列に変換し索引
    音節列として記憶する記憶部と、文節に区切られた音声
    を入力して音節列として認識し候補音節列を出力する音
    声認識部と、上記音声認識部の出力を受け上記候補音節
    列と一致する上記索引音節列を上記記憶部から求めて、
    求めた索引音節列に対応する上記文字列を含むデータを
    上記データベース部から検索するデータベース検索部と
    を備えたことを特徴とする音声情報検索装置。
  7. 【請求項7】 複数のデータを記憶したデータベース部
    と、上記データに含まれる文字列を上記データが上記デ
    ータベース部の何れに記憶されているかを示す索引を付
    与し索引文字列として抽出し記憶する索引部と、文節に
    区切られて入力された音声を音節列に変換して候補音節
    列を出力する音響処理部と、複数の文字列とこの複数の
    文字列を音節列として記憶する第1の辞書部と複数の文
    字とこの複数の文字を音節として記憶する第2の辞書部
    とを有する辞書部と、上記音響処理部の出力を受け上記
    第1の辞書部から上記候補音節列と一致する音節列に対
    応する文字列を第1の候補文字列として選択し、上記第
    2の辞書部の音節を組み合わせて上記候補音節列と一致
    させ、この一致した音節に対応する文字の組み合わせを
    第2の候補文字列として生成し、上記第1の候補文字列
    と上記第2の候補文字列とを出力すると共に、上記第1
    の候補文字列と上記第2の候補文字列との信憑性を示す
    評価値とを出力する言語処理部と、上記第1の候補文字
    列と上記第2の候補文字列とを上記評価値に応じた順位
    で表示する表示部と、入力部からの指示に応じて上記表
    示部に表示された上記第1の候補文字列又は上記第2の
    候補文字列から所要の索引文字列を選択する文字列選択
    部と、この選択された索引文字列に関連するデータを上
    記データベース部から検索するデータベース検索部とを
    備えたことを特徴とする音声情報検索装置。
JP20377996A 1996-08-01 1996-08-01 音声情報検索装置 Expired - Fee Related JP3758241B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP20377996A JP3758241B2 (ja) 1996-08-01 1996-08-01 音声情報検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP20377996A JP3758241B2 (ja) 1996-08-01 1996-08-01 音声情報検索装置

Publications (2)

Publication Number Publication Date
JPH1049187A true JPH1049187A (ja) 1998-02-20
JP3758241B2 JP3758241B2 (ja) 2006-03-22

Family

ID=16479646

Family Applications (1)

Application Number Title Priority Date Filing Date
JP20377996A Expired - Fee Related JP3758241B2 (ja) 1996-08-01 1996-08-01 音声情報検索装置

Country Status (1)

Country Link
JP (1) JP3758241B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6622122B1 (en) 1999-03-25 2003-09-16 Matsushita Electric Industrial Co., Ltd. Document retrieving apparatus and document retrieving method
JP2006209022A (ja) * 2005-01-31 2006-08-10 Toshiba Corp 情報検索システム、方法及びプログラム
JP2016505893A (ja) * 2012-12-31 2016-02-25 バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド 音声入力を実現する方法および装置
JP2017026808A (ja) * 2015-07-22 2017-02-02 日本電信電話株式会社 音声認識装置、音声認識方法、プログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6622122B1 (en) 1999-03-25 2003-09-16 Matsushita Electric Industrial Co., Ltd. Document retrieving apparatus and document retrieving method
JP2006209022A (ja) * 2005-01-31 2006-08-10 Toshiba Corp 情報検索システム、方法及びプログラム
JP2016505893A (ja) * 2012-12-31 2016-02-25 バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド 音声入力を実現する方法および装置
JP2017026808A (ja) * 2015-07-22 2017-02-02 日本電信電話株式会社 音声認識装置、音声認識方法、プログラム

Also Published As

Publication number Publication date
JP3758241B2 (ja) 2006-03-22

Similar Documents

Publication Publication Date Title
US8117026B2 (en) String matching method and system using phonetic symbols and computer-readable recording medium storing computer program for executing the string matching method
KR100769033B1 (ko) 스피치 합성 방법
JP3481497B2 (ja) 綴り言葉に対する複数発音を生成し評価する判断ツリーを利用する方法及び装置
WO2018097091A1 (ja) モデル作成装置、テキスト検索装置、モデル作成方法、テキスト検索方法、データ構造、及びプログラム
Van Berkel et al. Triphone Analysis: A Combined Method for the Correction of Orthographical and Typographical Errors.
EP0917129A2 (en) Method and apparatus for adapting a speech recognizer to the pronunciation of an non native speaker
WO2008107305A2 (en) Search-based word segmentation method and device for language without word boundary tag
US20070016420A1 (en) Dictionary lookup for mobile devices using spelling recognition
JP4738847B2 (ja) データ検索装置および方法
CN1359514A (zh) 多模式数据输入设备
JP2002149643A (ja) 日本語の表意文字の読み方を予測する方法
CN116685966A (zh) 调整查询生成模式
WO2006122361A1 (en) A personal learning system
US10614065B2 (en) Controlling search execution time for voice input facility searching
JP3758241B2 (ja) 音声情報検索装置
JPH0778183A (ja) デ−タベ−ス検索システム
US6757647B1 (en) Method for encoding regular expressions in a lexigon
KR101982490B1 (ko) 문자 데이터 변환에 기초한 키워드 검색 방법 및 그 장치
JP3531222B2 (ja) 類似文字列検索装置
KR20210020294A (ko) 단어 또는 문장 단위 음성 인식 방법 및 장치
JPH08339376A (ja) 外国語検索装置及び情報検索システム
JPH11250063A (ja) 検索装置及び検索方法
JPH07325837A (ja) 抽象単語による通信文検索装置及び抽象単語による通信文検索方法
KR100960490B1 (ko) 동의어를 이용한 검색 서비스 제공 방법 및 시스템
JPH0916575A (ja) 発音辞書装置

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20040715

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050422

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050712

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050909

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051011

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051125

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20051213

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20051226

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100113

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees