JP2000259645A - 音声処理装置及び音声データ検索装置 - Google Patents
音声処理装置及び音声データ検索装置Info
- Publication number
- JP2000259645A JP2000259645A JP11058295A JP5829599A JP2000259645A JP 2000259645 A JP2000259645 A JP 2000259645A JP 11058295 A JP11058295 A JP 11058295A JP 5829599 A JP5829599 A JP 5829599A JP 2000259645 A JP2000259645 A JP 2000259645A
- Authority
- JP
- Japan
- Prior art keywords
- likelihood
- speech
- word
- query
- words
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
の出現尤度を的確に計算して、出現尤度に基づいて音声
データの検索を正確且つ確実に行なう。 【解決手段】 音声データ検索装置は、複数の音声デー
タからなる音声データベースから音素や音節・単語等の
出現尤度を計算して保管しておく出現尤度保管部と、検
索要求の入力を受けるクエリ入力部と、クエリを音素や
音節・単語等の列に変換するクエリ変換部と、前記変換
されたクエリを保管するクエリ保管部と、前記クエリ保
管部のクエリと前記出現尤度保管部の出現尤度を照合し
て両者の一致度を計算する照合部を備えている。音声認
識結果を有向グラフ型のデータ構造で表現することによ
って、多くの認識結果候補を保持して検索誤りの可能性
を低減することができる。また、検索対象となる音声デ
ータの音声認識結果を音素や音節などの単語以下の単位
で保持することによって、音声入力されたクエリを音素
や音節に展開して、検索対象の音素や音節と照合するこ
とで、クエリに未登録語が含まれている場合でも適切な
検索処理を行うことができる。
Description
からなる音声データベースに対する検索を正確且つ確実
に行なうための音声処理装置及び音声データ検索装置に
係り、特に、音声データを音素や音節などの単語以下の
単位で扱うことで正確且つ確実な音声データの検索を行
なう音声処理装置及び音声データ検索装置に関する。更
に詳しくは、本発明は、音声データに含まれる音素や音
節・単語などの出現尤度を的確に計算して、出現尤度に
基づいて音声データの検索を正確且つ確実に行なう音声
処理装置及び音声データ検索装置に関する。
能で且つ強力な演算能力を持つ汎用コンピュータ・シス
テムが、各種研究機関や企業内のオフィス、一般家庭へ
と広汎に普及してきている。また、コンピュータの適用
分野も拡大し、コンピュータ・データのみならず、画像
(静止画と動画の双方を含む)や音声など、様々のデー
タも電子化されコンピュータ上で扱われるようになって
きた。
クタ入力やマウスを介した指示座標入力に代わって、音
声によるコンピュータ入力を実現する音声入力や音声認
識に関する技術の開発や関連製品の発表が盛んになされ
ている。また、膨大サイズの音声データを扱うことに伴
ない、複数の音声データからなる音声データベースの中
から所望の音声データを検索する「音声データ検索」に
対する要望も高まってきている。
開示された「音声検索装置」では、音声信号を記録した
記録媒体の中から、所定の音声キーワードに基づいて所
望の音声信号部分を検索する技術が提案されている。同
公報の実施例では、音声キーワード、音声データの両者
とも、音声認識されて一旦テキスト化された後、キーワ
ードとデータが一致する部分を検出することによって検
索を行う音声検索装置について記述している。
示された「音声情報取得装置及び音声情報取得方法」で
は、ニュース音声や既存の音声データを音声認識し、キ
ーワードや分野特有の言い回し(例えば「7時のニュー
スです」や、「スポーツ情報です」など)を検出して音
声データに付加することによって、検索に用いる方法が
提案されている。
る音声データを、音声認識装置を用いて一度テキスト・
データへ書き起こし、そのテキスト・データに対して検
索処理を行う方法を採用している。しかしながら、この
検索処理方法には、以下のような問題がある。すなわ
ち、 (1)音声認識の結果であるテキストに認識誤りが含ま
れている場合、正しい検索結果が得られない。 (2)音声認識装置に登録されていない単語(すなわち
未登録語)は、書き起こしたテキスト・データには登場
しない。このため、未登録語を検索キーにして検索を行
っても、検索結果が得られない。
てなされたものであり、音声を認識して音素や音節・単
語等を単位とする有向グラフ型のデータ構造を作成し、
このデータ構造を基にして、音声の中に含まれる音素や
音節・単語等の列の出現尤度を計算しておくことによっ
て、内容に基づいた音声データの検索を正確且つ確実に
行えるようにするものである。
の音声データからなる音声データベースに対する検索を
正確且つ確実に行なうことができる、優れた音声処理装
置及び音声データ検索装置を提供することにある。
や音節などの単語以下の単位で扱うことで正確且つ確実
な音声データの検索を行なうことができる、優れた音声
処理装置及び音声データ検索装置を提供することにあ
る。
れる音素や音節・単語などの出現尤度を的確に計算し
て、出現尤度に基づいて音声データの検索を正確且つ確
実に行なうことができる、優れた音声処理装置及び音声
データ検索装置を提供することにある。
題を参酌してなされたものであり、本発明に係る音声処
理装置は、音声を認識して音素や音節・単語等を単位と
する有向グラフ型のデータ構造を作成し、このデータ構
造を基にして、音声の中に含まれる音素や音節・単語等
の列の出現尤度を計算する。
構造から得た音素や音節・単語等の列の分布とそのスコ
アを基にして計算される。
等の列に対する音響的尤度、言語的尤度、あるいはそれ
らの組み合わせを基にして算出される。スコアは、ある
いは音素や音節・単語等の列を含む上記グラフ上の経路
の数を基にして算出してもよい。
は、上記の出現尤度計算方法を用いて、複数の音声デー
タからなる音声データベースから音素や音節・単語等の
出現尤度を計算して保管しておく出現尤度保管部と、検
索要求の入力を受けるクエリ入力部と、クエリを音素や
音節・単語等の列に変換するクエリ変換部と、前記変換
されたクエリを保管するクエリ保管部と、前記クエリ保
管部のクエリと前記出現尤度保管部の出現尤度を照合し
て両者の一致度を計算する照合部と、前記照合部の結果
を提示する検索結果提示部を備えることを特徴とする。
では、音声認識の結果を有向グラフ型のデータ構造で表
現するようにしている。有向グラフ型のデータ構造を用
いることによって、書き起こしテキストを用いた場合よ
りもはるかに多くの認識結果候補を保持することがで
き、且つ、音声認識装置の認識誤りから生じる検索誤り
の可能性を低減することができる。また、検索対象とな
る音声データの音声認識結果を音素や音節などの単語以
下の単位で保持することによって、音声入力されたクエ
リを音素や音節に展開して、検索対象の音素や音節と照
合することができる。これによって、クエリに未登録語
が含まれている場合でも適切な検索処理を行うことがで
きる。
後述する本発明の実施例や添付する図面に基づくより詳
細な説明によって明らかになるであろう。
の実施例を詳解する。
ータ検索装置10のシステム構成を模式的に示してい
る。同図に示すように、音声データ検索装置10は、音
声認識部11と、音声データベース12と、出現尤度計
算部13と、出現尤度保管部14と、クエリ入力部15
と、クエリ変換部16と、クエリ保管部17と、照合部
18と、検索結果提示部19と、ユーザ・インターフェ
ースとしてのキーボード及びディスプレイ20を備えて
いる。以下、各ブロックについて説明する。
中の音声データ・ファイルを音声認識して、単語を単位
とする有向グラフ型のデータ構造(以下、「単語グラ
フ」と呼ぶ)を作成する。有向グラフは、ノード(節)
の集合と、二つのノードを結ぶアーク(枝)の集合とし
て定義され、各アークは向きを有している。
は単語名とその単語の言語的尤度が対応している。ま
た、本実施例では、各アークの単語の言語的尤度は、大
量のテキスト・データを基に推定した単語モノグラム・
モデルを用いて、その出現確率の対数をとることによっ
て規定される。言語的尤度は負の値をとり、数値が大き
い方がより尤もらしいということになる。
に、本実施例で用いた単語モノグラムよりもより制約力
が強い、単語バイグラムや単語トライグラムを用いるこ
とも可能である。
基に、音声に登場する各単語の出現尤度を音声データ・
ファイル毎に計算し、出現尤度保管部14に保管する。
などのユーザ・インターフェース20を介して入力した
クエリ(日本語のフレーズ)を受け取る。本実施例で
は、キーボード入力された日本語フレーズを対象にする
が、それ以外の入力形態、例えば、マイクロフォンで入
力された日本語音声を音声認識して得られた日本語フレ
ーズをクエリとすることもできる。
るクエリを形態素解析して単語を抽出し、それらを要素
としたクエリ単語集合を作成する。クエリ保管部17
は、クエリ変換部16で作成したクエリ単語集合を保管
する。
れたのクエリ単語集合と、出現尤度保管部14に格納さ
れた単語の出現尤度との照合を行ない、音声データベー
ス12に格納されている各音声データ・ファイルに対し
て、クエリ単語集合との照合スコアを計算する。
上に、検索結果としての音声データ・ファイル名を照合
スコア順に一覧表示する。
10の動作について説明する。
索装置10が実行する処理手順をフローチャート形式で
示している。以下、このフローチャートの各ステップに
ついて説明する。
ーズを、キーボードなどのユーザ・インターフェース2
0を介して入力する。クエリ変換部16では、その日本
語フレーズを形態素解析して単語に分割し、それらの単
語のうち、検索のキーワードとして有効と考えられる自
立語を抽出する(ステップS11)。自立語は、名詞や
動詞などからなる。
エリ単語集合をクエリ保管部17に保管する(ステップ
S12)。
ァイルについて予め計算してある各単語の出現尤度とク
エリ単語集合とを照合することによって、音声データ・
ファイル毎の照合スコアを算出する。そして、照合結果
を検索結果提示部に渡す(ステップS13)。
ァイル毎の照合スコアを照合部18から受け取り、音声
データ・ファイルの名前を照合スコアが大きい順にディ
スプレイ20上に一覧表示する(ステップS14)。
語の出現尤度を音声データ・ファイル毎に予め計算して
おく必要がある。以下では、この出現尤度の計算処理処
理について説明する。図 3には、出現尤度を計算する
処理手順をフローチャートの形式で示している。
ス12の中から音声データ・ファイルを1つ取り出す
(ステップS21)。音声データベース12には、数多
くの音声データ・ファイルが所定形式(フォーマット)
に従って格納されている。音声データ・ファイルのファ
イル形式の一例はWAV形式であり、拡張子”.wa
v”を持つ。
声データ・ファイルを音声認識して、単語グラフに変換
する(ステップS22)。単語グラフの各アークには、
前述のように、単語名とその単語の言語的尤度が対応し
ている。
と出現尤度フィールドを持つ単語出現尤度表を、各音声
データ・ファイル毎に1つ用意する。
フ中の1つのアークに注目し、単語名を読み、上述の単
語出現尤度表への登録処理を行なう(ステップS2
3)。すなわち、読み出した単語が単語出現尤度表のエ
ントリとして存在しない場合は、単語出現尤度表の新た
なエントリを作成して、該エントリの単語名フィールド
にその単語名を書き込み、また、出現尤度フィールドに
以下の[数1]に示す式によって計算した数値を書き込
む。
エントリとして存在する場合は、その単語エントリの出
現尤度を、以下の[数2]に示す式を用いて更新する。
中の全てのアークについて調べたか否かをチェックす
る。未処理のアークが残っている場合には、ステップS
23に復帰して、上述と同様の処理を繰り返し行う。
ース12中の全ての音声データ・ファイルに調べたか否
かをチェックする。未処理の音声データ・ファイルが残
っている場合には、ステップS21に復帰して、上述と
同様の処理を繰り返し行う。
される単語出現尤度表を示している。単語出現尤度表
は、音声データベース12に格納される各音声データ・
ファイル毎に作成され、出現尤度格納部14に格納され
る。
した処理手順に従って単語の言語的尤度を基に計算する
こともできるが、単語を構成する各音節や音素の音響的
尤度を加味することも無論可能である。また、以下の
(1)〜(7)に示す処理手順に従って、アークを含む
経路の数に基づいて単語出現尤度を計算することも可能
である。すなわち、
ス12の中から、音声データ・ファイルを1つ取り出
す。
データ・ファイルを音声認識して、単語グラフに変換す
る。単語グラフの各アークには、単語名とそのアークを
通る経路の数が記述してある。
ールドと出現尤度フィールドを持つ単語出現尤度表を作
成する。単語出現尤度表は、各音声データ・ファイル毎
に1つ用意される。
中の1つのアークに注目し、単語名を読む。
エントリとして存在しない場合は、単語出現尤度表の新
たなエントリを作成して、該エントリの単語名フィール
ドにその単語名を書き込むとともに、該エントリの出現
尤度フィールドに以下の[数3]に示す式によって計算
した数値を書き込む。
ントリとして存在する場合は、その単語エントリの出現
尤度を以下の[数4]に示す式を用いて更新する。
て、上記処理(4)及び(5)を繰り返し行う。
いる全ての音声データ・ファイルについて、上記処理
(1)〜(6)を繰り返し行う。
るための2通り方法を述べたが、無論、これらの方法や
出現尤度を計算する他の方法を組み合わせて用いること
も可能である。例えば、これらの処理を行ってから、さ
らにTF.IDF(termfrequency, i
nverse document frequenc
y)法などを用いて、検索に対する有効性を加味した形
態で出現尤度表の出現尤度を修正することも可能であ
る。すなわち、出現頻度表Ti中の単語wjの出現尤度を
S(Ti,wj)とし、TF.IDF法を適用した出現尤
度をS’(Ti,wj)とすると、以下の[数5]に示す
式によって出現尤度を修正することができる。
て、ステップS13ではクエリ単語集合と出現尤度表と
の照合処理を行なう。図5には、N個の単語からなるク
エリ単語集合と音声データベース12中の各音声データ
・ファイルに対応した単語の出現尤度表を照合する処理
手順をフローチャートの形式で示している。以下では、
図5を参照しながら、照合処理について詳解する。
ス12に格納された数多くの音声データ・ファイルの各
々に対応する単語出現尤度表が蓄積されている。まず、
ステップS31では、出現尤度保管部14に保管されて
いる単語出現尤度表のうちから1つを取り出す。
クエリ単語集合に含まれるN個の単語のうちから単語を
1つだけ取り出す(ステップS32)。
語名フィールドから検索する。出現尤度表中の該当する
エントリの出現尤度をその単語の検索スコアとする。ま
た、該当するエントリがない場合は、検索スコアを0と
する(ステップS33)。
全ての単語について処理を終えたか否かをチェックす
る。未処理の単語が残っていればステップS32に復帰
して、残りの単語についてステップS32及びS33を
繰り返し行なう。そして、各単語の検索スコアを加算し
たものを、その単語出現尤度表に対応する音声データ・
ファイルの照合スコアとする(ステップS35)。
管部14に格納されている全ての単語出現尤度表につい
て処理を終えたか否かをチェックする。未処理の単語出
現尤度表があれば、ステップS31に復帰して、残りの
単語出現尤度表に対してステップS31〜S35の処理
を繰り返し行なう。そして、各音声データ・ファイル毎
の照合スコアを算出して保持しておく。
フとして単語出現尤度を計算したが、音声認識結果を音
節グラフとして音節連鎖出現尤度を計算し、音節に展開
したクエリと照合することによって音声データ・ファイ
ルを検索する、という変形例も考えることができる。
声データベース12中の音声データ・ファイルを音声認
識して、音節を単位とする有向グラフ型のデータ構造
(以下、音節グラフと呼ぶ)を作成する。音節グラフで
は、アークには音節名とその音節の音響的尤度が対応し
ている。各アークの音節の音響的尤度は、HMMなどを
用いて求められた音節の出現確率の対数をとることによ
って規定される。
基にして、音声に登場する音節連鎖(例えば音節の3連
鎖)の出現尤度を音声データ・ファイル毎に計算すれば
よい。
計算する処理手順をフローチャートの形式で示してい
る。以下、このフローチャートの各ステップについて説
明する。
ス12の中から音声データ・ファイルを1つ取り出す
(ステップS41)。
声データ・ファイルを音声認識して、音節グラフに変換
する(ステップS42)。
して、そのアークから辿ることができる音節の3連鎖を
抽出する(ステップS43)。
節連鎖の名前とその出現尤度を、対応する音声データ・
ファイルの音声連鎖出現頻度表に登録する(ステップS
44)。
ついて調べたか否かをチェックする。未処理の音節3連
鎖が残っている場合には、ステップS44に復帰して、
上述と同様の処理を繰り返し行う。
中の全てのアークについて調べたか否かをチェックす
る。未処理のアークが残っている場合には、ステップS
43に復帰して、上述と同様の処理を繰り返し行う。
ース12中の全ての音声データ・ファイルに調べたか否
かをチェックする。未処理の音声データ・ファイルが残
っている場合には、ステップS41に復帰して、上述と
同様の処理を繰り返し行う。
される単語出現尤度表を示している。単語出現尤度表
は、音声データベース12に格納される各音声データ・
ファイル毎に作成され、出現尤度保管部14に格納され
る。
語を音節に展開したものの集合(図9を参照のこと)が
保管される。
れたクエリと、出現尤度保管部14に保管された音声デ
ータ・ファイル毎の音節連鎖の出現尤度を照合処理し
て、音声データベース12中の各音声データ・ファイル
に対して、クエリ単語集合との照合スコアを計算する。
手順をフローチャートの形式で示している。以下、この
フローチャートの各ステップについて説明する。
を1つ取り出す(ステップS51)。
エリ単語集合から単語を1つ取り出して、その単語を構
成する音節の3連鎖を全て抽出する(ステップS5
2)。
取り出す(ステップS53)。
するエントリを出現尤度表の中で検索する。該当するエ
ントリを発見できたら、その出現尤度を読み出し、これ
を音節3連鎖の検索スコアとする(ステップS54)。
全ての音節3連鎖について調べたか否かをチェックす
る。未処理の音節3連鎖が残っていれば、ステップS5
3に復帰して、上述と同様の処理を繰り返し行なう。
終えたならば、求めた全ての検索スコアの平均を計算
し、その平均値を単語についての検索スコアとする(ス
テップS56)。
集合中の全ての単語について処理を終えたか否かをチェ
ックする。未処理の単語が残っている場合には、ステッ
プS52に復帰して、上述と同様の処理を繰り返し行な
う。
理を終えたならば、全ての単語の検索スコアを加算す
る。そして、求められた合計値を、その音節連鎖出現尤
度に対応する音声データについての照合スコアとする
(ステップS58)。
管部14に格納されている音節連鎖出現尤度表を全て調
べたか否かをチェックする。未処理の音節連鎖出現尤度
表が残っていれば、ステップS51に復帰して、上述と
同様の処理を繰り返し行なう。
ら、本発明について詳解してきた。しかしながら、本発
明の要旨を逸脱しない範囲で当業者が該実施例の修正や
代用を成し得ることは自明である。すなわち、例示とい
う形態で本発明を開示してきたのであり、限定的に解釈
されるべきではない。本発明の要旨を判断するために
は、冒頭に記載した特許請求の範囲の欄を参酌すべきで
ある。
複数の音声データからなる音声データベースに対する検
索を正確且つ確実に行なうことができる、優れた音声処
理装置及び音声データ検索装置を提供することができ
る。
や音節などの単語以下の単位で扱うことで正確且つ確実
な音声データの検索を行なうことができる、優れた音声
処理装置及び音声データ検索装置を提供することができ
る。
れる音素や音節・単語などの出現尤度を的確に計算し
て、出現頻度に基づいて音声データの検索を正確且つ確
実に行なうことができる、優れた音声処理装置及び音声
データ検索装置を提供することができる。
では、音声認識の結果を有向グラフ型のデータ構造を用
いて表現することによって、書き起こしテキストを用い
る場合よりもはるかに多くの認識結果候補を保持するこ
とができ、さらには、音声認識装置の認識誤りから生じ
る検索誤りの可能性を低減することができる。また、検
索対象となる音声データの音声認識結果を音素や音節な
どの単語以下の単位で保持することによって、音声入力
されたクエリを音素や音節に展開して、検索対象の音素
や音節と照合することで、クエリに未登録語が含まれて
いる場合でも適切な検索処理を行うことができる。
模式的に示した図である。
順を示したフローチャートである。
される出現尤度計算の処理手順を示したフローチャート
である。
である。
される照合処理の手順を示したフローチャートである。
される出現尤度計算処理の手順を示したフローチャート
である。
度表である。
される照合処理の手順を示したフローチャートである。
たフローチャートである。
音声データベース、13…出現尤度計算部、14…出現
尤度保管部、15…クエリ入力部、16…クエリ変換
部、17…クエリ保管部、18…照合部、19…検索結
果提示部、20…ユーザ・インターフェース。
Claims (5)
- 【請求項1】音声を認識して音素や音節・単語等を単位
とする有向グラフ型のデータ構造を作成し、このデータ
構造を基に、音声の中に含まれる音素や音節・単語等の
列の出現尤度を計算することを特徴とする音声処理装
置。 - 【請求項2】上記データ構造から得た音素や音節・単語
等の列の分布とそのスコアを基に出現尤度を計算するこ
とを特徴とする請求項1に記載の音声処理装置。 - 【請求項3】音素や音節・単語等の列に対する音響的尤
度、言語的尤度、あるいはそれらの組み合わせを基にし
てスコアを算出することを特徴とする請求項2に記載の
音声処理装置。 - 【請求項4】音素や音節・単語等の列を含む上記グラフ
上の経路の数を基にスコアを算出することを特徴とする
請求項2に記載の音声処理装置。 - 【請求項5】検索要求の入力を受けるクエリ入力部と、
クエリを音素や音節・単語等の列に変換するクエリ変換
部と、前記クエリ変換部による変換後のクエリを保管す
るクエリ保管部と、請求項1、2、3、又は4のいずれ
かに記載の音声処理装置を用いて複数の音声データから
なる音声データベースから計算された音素や音節・単語
等の出現尤度を保管する出現尤度保管部と、前記クエリ
保管部のクエリと前記出現尤度保管部の出現尤度を照合
して両者の一致度を計算する照合部と、前記照合部の結
果を提示する検索結果提示部とを具備することを特徴と
する音声データ検索装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP11058295A JP2000259645A (ja) | 1999-03-05 | 1999-03-05 | 音声処理装置及び音声データ検索装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP11058295A JP2000259645A (ja) | 1999-03-05 | 1999-03-05 | 音声処理装置及び音声データ検索装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2000259645A true JP2000259645A (ja) | 2000-09-22 |
Family
ID=13080241
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP11058295A Pending JP2000259645A (ja) | 1999-03-05 | 1999-03-05 | 音声処理装置及び音声データ検索装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2000259645A (ja) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005257954A (ja) * | 2004-03-10 | 2005-09-22 | Nec Corp | 音声検索装置、音声検索方法および音声検索プログラム |
WO2005122144A1 (ja) * | 2004-06-10 | 2005-12-22 | Matsushita Electric Industrial Co., Ltd. | 音声認識装置、音声認識方法、及びプログラム |
JP2006031278A (ja) * | 2004-07-14 | 2006-02-02 | Nec Corp | 音声検索システムおよび方法ならびにプログラム |
JP2006040150A (ja) * | 2004-07-29 | 2006-02-09 | Mitsubishi Electric Corp | 音声データ検索装置 |
JP2006243673A (ja) * | 2005-03-07 | 2006-09-14 | Canon Inc | データ検索装置および方法 |
JP2008532099A (ja) * | 2005-02-25 | 2008-08-14 | ミツビシ・エレクトリック・リサーチ・ラボラトリーズ・インコーポレイテッド | データベースに格納されている文書の索引付け及び検索のためにコンピュータにより実施される方法並びに文書の索引付け及び検索のためのシステム |
JP2008262279A (ja) * | 2007-04-10 | 2008-10-30 | Mitsubishi Electric Corp | 音声検索装置 |
JP2011023007A (ja) * | 2009-07-17 | 2011-02-03 | Nhn Corp | 統計データに基づくユーザクエリ校正システムおよび方法 |
JP5386692B2 (ja) * | 2007-08-31 | 2014-01-15 | 独立行政法人情報通信研究機構 | 対話型学習装置 |
US8731926B2 (en) | 2010-03-04 | 2014-05-20 | Fujitsu Limited | Spoken term detection apparatus, method, program, and storage medium |
-
1999
- 1999-03-05 JP JP11058295A patent/JP2000259645A/ja active Pending
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005257954A (ja) * | 2004-03-10 | 2005-09-22 | Nec Corp | 音声検索装置、音声検索方法および音声検索プログラム |
US7813928B2 (en) | 2004-06-10 | 2010-10-12 | Panasonic Corporation | Speech recognition device, speech recognition method, and program |
WO2005122144A1 (ja) * | 2004-06-10 | 2005-12-22 | Matsushita Electric Industrial Co., Ltd. | 音声認識装置、音声認識方法、及びプログラム |
JP2006031278A (ja) * | 2004-07-14 | 2006-02-02 | Nec Corp | 音声検索システムおよび方法ならびにプログラム |
JP4595415B2 (ja) * | 2004-07-14 | 2010-12-08 | 日本電気株式会社 | 音声検索システムおよび方法ならびにプログラム |
JP2006040150A (ja) * | 2004-07-29 | 2006-02-09 | Mitsubishi Electric Corp | 音声データ検索装置 |
JP4511274B2 (ja) * | 2004-07-29 | 2010-07-28 | 三菱電機株式会社 | 音声データ検索装置 |
JP2008532099A (ja) * | 2005-02-25 | 2008-08-14 | ミツビシ・エレクトリック・リサーチ・ラボラトリーズ・インコーポレイテッド | データベースに格納されている文書の索引付け及び検索のためにコンピュータにより実施される方法並びに文書の索引付け及び検索のためのシステム |
JP2006243673A (ja) * | 2005-03-07 | 2006-09-14 | Canon Inc | データ検索装置および方法 |
JP2008262279A (ja) * | 2007-04-10 | 2008-10-30 | Mitsubishi Electric Corp | 音声検索装置 |
JP5386692B2 (ja) * | 2007-08-31 | 2014-01-15 | 独立行政法人情報通信研究機構 | 対話型学習装置 |
US8868410B2 (en) | 2007-08-31 | 2014-10-21 | National Institute Of Information And Communications Technology | Non-dialogue-based and dialogue-based learning apparatus by substituting for uttered words undefined in a dictionary with word-graphs comprising of words defined in the dictionary |
JP2011023007A (ja) * | 2009-07-17 | 2011-02-03 | Nhn Corp | 統計データに基づくユーザクエリ校正システムおよび方法 |
US8731926B2 (en) | 2010-03-04 | 2014-05-20 | Fujitsu Limited | Spoken term detection apparatus, method, program, and storage medium |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Chelba et al. | Retrieval and browsing of spoken content | |
US6618726B1 (en) | Voice activated web browser | |
US7856350B2 (en) | Reranking QA answers using language modeling | |
US7567902B2 (en) | Generating speech recognition grammars from a large corpus of data | |
JP3488174B2 (ja) | 内容情報と話者情報を使用して音声情報を検索するための方法および装置 | |
US7092870B1 (en) | System and method for managing a textual archive using semantic units | |
US7580835B2 (en) | Question-answering method, system, and program for answering question input by speech | |
US9361879B2 (en) | Word spotting false alarm phrases | |
JP5257071B2 (ja) | 類似度計算装置及び情報検索装置 | |
WO2003010754A1 (fr) | Systeme de recherche a entree vocale | |
WO2017127296A1 (en) | Analyzing textual data | |
JPH03224055A (ja) | 同時通訳向き音声認識システムおよびその音声認識方法 | |
JP2004005600A (ja) | データベースに格納された文書をインデックス付け及び検索する方法及びシステム | |
WO2008107305A2 (en) | Search-based word segmentation method and device for language without word boundary tag | |
JP2004133880A (ja) | インデックス付き文書のデータベースとで使用される音声認識器のための動的語彙を構成する方法 | |
JP4738847B2 (ja) | データ検索装置および方法 | |
JP2000259645A (ja) | 音声処理装置及び音声データ検索装置 | |
JP5897718B2 (ja) | 音声検索装置、計算機読み取り可能な記憶媒体、及び音声検索方法 | |
JP4089861B2 (ja) | 音声認識文章入力装置 | |
JP2004258531A (ja) | 認識誤り訂正方法、装置、およびプログラム | |
Palmer et al. | Information extraction from broadcast news speech data | |
JP4653598B2 (ja) | 構文・意味解析装置、音声認識装置、及び構文・意味解析プログラム | |
JP3309174B2 (ja) | 文字認識方法及び装置 | |
JP2003308094A (ja) | 音声認識における認識誤り箇所の訂正方法 | |
JPH117447A (ja) | 話題抽出方法及びこれに用いる話題抽出モデルとその作成方法、話題抽出プログラム記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Year of fee payment: 11 Free format text: PAYMENT UNTIL: 20090515 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100515 Year of fee payment: 12 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Year of fee payment: 13 Free format text: PAYMENT UNTIL: 20110515 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Year of fee payment: 13 Free format text: PAYMENT UNTIL: 20110515 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Year of fee payment: 14 Free format text: PAYMENT UNTIL: 20120515 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120515 Year of fee payment: 14 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130515 Year of fee payment: 15 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140515 Year of fee payment: 16 |