JPH06175698A - 音声検索装置 - Google Patents

音声検索装置

Info

Publication number
JPH06175698A
JPH06175698A JP4351958A JP35195892A JPH06175698A JP H06175698 A JPH06175698 A JP H06175698A JP 4351958 A JP4351958 A JP 4351958A JP 35195892 A JP35195892 A JP 35195892A JP H06175698 A JPH06175698 A JP H06175698A
Authority
JP
Japan
Prior art keywords
voice
keyword
user
database
voice data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4351958A
Other languages
English (en)
Inventor
Tetsuya Muroi
哲也 室井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP4351958A priority Critical patent/JPH06175698A/ja
Publication of JPH06175698A publication Critical patent/JPH06175698A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 キーボード等の特別な検索用の入力装置を必
要とせず、かつ、音声データベースの利用者が検索した
いキーワードで音声データベースの内容を正しく検索可
能である。 【構成】 音声データベース1中から所定の音声デ−タ
を検索しようとする場合、利用者は、キーワードを発声
する。利用者が発声したキーワードの音声デ−タは、第
2の音声入力部4,特徴抽出部2から照合部5に送られ
る。また、このときに、音声データベース1内の音声デ
−タが第1の音声入力部3,特徴抽出部2を介して順次
に照合部5に送られる。これにより、照合部5では、音
声データベース1の音声デ−タの中から利用者が発声し
たキーワードに対応するものを検出し、利用者が意図し
た音声デ−タ(音声信号)を音声データベース1中から
検索する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声データベースの内
容を検索する音声検索装置に関する。
【0002】
【従来の技術】従来、音声データベースの内容を検索す
るのに、例えば特開平4−176244号に開示されて
いるような装置が知られている。この装置では、音声信
号に固有の特徴である抑揚情報(ピッチ情報)を利用
し、音声データベース内の音声デ−タ中から抑揚情報
(ピッチ情報)を用いてキーワード(キーワード音声)
を抽出し、利用者はこのキーワード音声を聞くことで、
音声データ全体を聞く必要があるか否かを判断すること
が可能となっている。
【0003】
【発明が解決しようとする課題】このような構成の音声
検索装置では、音声データベースの音声データ中から抑
揚情報(ピッチ情報)を用いてキーワードを抽出し、こ
れを利用者に聞かせるようになっているので、利用者
は、キーワードをデータ端末のキーボード等から別途に
テキスト情報として入力する必要がなく、利用者にとっ
て操作性良く検索処理を行なうことができる。
【0004】しかしながら、音声データベースの音声デ
ータ中の抑揚情報(ピッチ情報)は、あくまで話し手
(音声データベースの入力者,作成者)の情報であるた
めに、聞き手(音声データベースの利用者)が興味をも
つ言葉に対して強調される抑揚が付いているとは限ら
ず、従って、検索を正しく行なうことができない場合が
あった。また、音声データベースが音声合成装置によっ
て生成されたものである場合には、合成音声は通常の場
合、意味ではなく文法的な観点から抑揚が付けられてい
るため、抑揚情報を用いて検索を正しく行なうことは難
しいという問題があった。
【0005】本発明は、音声データベースの内容を検索
する際に、キーボード等の特別な検索用の入力装置を必
要とせず、かつ、音声データベースの利用者が検索した
いキーワードで音声データベースの内容を正しく検索す
ることの可能な音声検索装置を提供することを目的とし
ている。
【0006】
【課題を解決するための手段および作用】上記目的を達
成するために、請求項1記載の発明は、検索対象となる
音声データが格納されている音声データベースと、利用
者が発声した音声を入力する音声入力手段と、利用者が
キーワードを発声し、音声入力手段から利用者により発
声されたキーワードの音声データが入力されたときに、
該キーワードの音声データを照合辞書として前記音声デ
ータベース内の音声データとの照合を行なって音声デー
タベースを検索する照合手段とを有している。これによ
り、音声データベースの内容を検索する際に、特別な検
索用の入力装置を必要とせず、かつ、音声データベース
の利用者が検索したいキーワードで音声データベースの
内容を正しく検索を行なうことができる。
【0007】また、請求項2記載の発明は、利用者より
発声されたキーワードの音声データが前記音声入力手段
から入力するときに、該キーワードの音声データを格納
するキーワード格納手段がさらに設けられており、照合
手段は、キーワード格納手段に格納されているキーワー
ドを照合辞書として音声データベース内の音声データと
の照合を行なって音声データベースを検索するようにな
っている。これにより、音声データベースのキーワード
による検索をバッチ処理で行なうことができ、例えば、
利用者が音声検索装置を使い始める前に既に照合を終わ
らせて、利用者が必要とする音声デ−タだけを抜き出し
て提示することや、あるいは利用者が必要とする音声デ
−タだけを別の音声デ−タ蓄積装置に格納したりするこ
とが可能となる。
【0008】また、請求項3記載の発明は、音声データ
ベースと、利用者が発声した音声を入力する音声入力手
段と、利用者がキーワードを発声し、音声入力手段から
利用者により発声されたキーワードの音声データが入力
されたときに、該キーワードの音声データに基づき音声
データベ−スを検索する照合手段とを有し、音声デ−タ
ベ−スには、音声デ−タを格納する音声デ−タ格納手段
と、音声データ格納手段に格納されている音声データに
付与された音声のキーワードを格納する第1のキーワー
ド格納手段とが設けられており、照合手段は、音声入力
手段から入力されたキーワードと第1のキーワード格納
手段に格納されているキーワードとの照合を行なって音
声データベースを検索するようになっている。これによ
り、音声デ−タベ−ス内の音声データ全体と照合する場
合に比べて、照合処理を高速に行なうことができて、利
用者が必要とする音声データを迅速に提示することが可
能になる。
【0009】また、請求項4記載の発明は、利用者より
発声されたキーワードの音声データが音声入力手段から
入力するときに、該キーワードの音声データを格納する
第2のキーワード格納手段がさらに設けられており、照
合手段は、第2のキーワード格納手段に格納されている
キーワードと、音声データベースの第1のキーワード格
納手段に格納されているキーワードとの照合を行なって
音声データベースを検索するようになっている。これに
より、音声データベース1のキーワードによる検索をバ
ッチ処理で行なうことができ、例えば、利用者が音声検
索装置を使い始める前に既に照合を終わらせて、利用者
が必要とする音声デ−タ(音声信号)だけを抜き出して
提示することや、あるいは利用者が必要とする音声デ−
タ(音声信号)だけを別の音声デ−タ蓄積装置(図示せ
ず)に格納したりすることが可能となる。
【0010】
【実施例】以下、本発明の実施例を図面に基づいて説明
する。図1は本発明に係る音声検索装置の第1の実施例
のブロック図である。図1を参照すると、この第1の実
施例の音声検索装置は、留守番電話や音声メールなどの
音声デ−タが例えば音声信号のままの状態で記録され蓄
積されている音声データベース1と、音声データ(音声
信号)を特徴ベクトルの時系列に変換する特徴抽出部2
と、音声データベース1に蓄積されている音声デ−タ
(音声信号)を特徴抽出部2に送出するためのSCSI
ケーブルなどの第1の音声入力部3と、音声データベー
ス1の利用者の発声した音声が入力するときに、該利用
者の音声データ(音声信号)を特徴抽出部2に与えるマ
イクロフォンなどの第2の音声入力部4と、音声データ
ベース1の利用者が検索したいキーワードを発声し、該
キーワードの音声デ−タが第2の音声入力部4から特徴
抽出部2に送られて特徴ベクトルの時系列に変換された
ときに、音声データベース1から第1の音声入力部3を
介して特徴抽出部2に送られて特徴抽出のなされた音声
データベース1の音声デ−タの特徴ベクトルの時系列と
利用者が発声したキーワードの音声デ−タの特徴ベクト
ルの時系列とを照合する照合部5とを備えている。
【0011】なお、この例では、音声データベース1内
の音声デ−タと利用者が発声したキーワードの音声デ−
タとは、同じ特徴抽出部2を用いて特徴抽出がなされる
ようになっており、特徴抽出部2としては、例えば15
個のバンドパスフィルタ群を用いて15次元の特徴ベク
トルに変換するものを用いることができる。
【0012】また、照合部5は、例えば、利用者が発声
したキーワードをいわゆる単語辞書とみなし、音声デー
タベース1の音声デ−タの特徴ベクトルの時系列からキ
ーワードのスポッティングを行なうようになっている。
ここで、ワードスポッティングの手法としては様々な手
法が知られており、例えば、次式に示すダイナミックプ
ログラミングのアルゴリズムを用いてスポッティングを
行なうこともできる。
【0013】
【数1】
【0014】なお、上式において、iは音声データベー
ス1内の音声デ−タのフレーム番号、jはキーワードの
フレーム番号、d(i,j)は音声データベース内の音
声データの第iフレームの特徴ベクトルとキーワードの
第jフレームの特徴ベクトルとの局所距離、D(i,
j)は照合の先頭からの累積距離を表わしている。ワー
ドスポッティングの手法として、上記数1が用いられて
いる場合、照合部5は、累積距離D(i,J)(Jはキ
ーワードの最終フレーム番号)が予め定められた閾値T
Hよりも小さいとき、このキーワードが音声データベー
ス1中の第iフレームを終端として検出され、音声デー
タベース1内の音声データ中にキーワードが存在すると
判定するようになっている。
【0015】次にこのような構成の第1の実施例の音声
検索装置の動作について説明する。音声データベース1
中には、一般に、この利用者とは異なる入力者,作成者
によって所定の音声デ−タ(音声信号)が記録され蓄積
されている。このような音声データベース1中から所定
の音声デ−タ(音声信号)を検索しようとする場合、利
用者は、キーワードを発声する。利用者が発声したキー
ワードの音声デ−タ(音声信号)は、第2の音声入力部
4から特徴抽出部2に送られ、そこで特徴ベクトルの時
系列に変換されて照合部5に送られる。また、このとき
に、音声データベース1内の音声デ−タが第1の音声入
力部3を介して順次に特徴抽出部2に送られ、そこで特
徴ベクトルの時系列に変換されて照合部5に送られる。
これにより、照合部5では、音声データベース1の音声
デ−タの中から利用者が発声したキーワードに対応する
ものを例えばスポッティングにより検出し、これによ
り、利用者が意図した音声デ−タ(音声信号)を音声デ
ータベース1中から検索することができる。
【0016】このように、この第1の実施例の音声検索
装置によれば、音声データベース1の検索を行なうの
に、キーワードをキーボード等の特別な入力装置からテ
キスト情報として入力する必要がないので、音声検索装
置を小型のものにすることができるとともに、利用者
は、単に自己の音声でキーワードを発声するだけで良
い。また、文字情報を介在することなく、音声データベ
ース1を検索しているため、「大語彙」と「大語い」の
ような表記のゆれの問題を完全に避けることができる。
また、「フィルタ」と「フィルター」,「コンピュー
タ」と「コンピューター」のように表記だけでなく、発
声にもゆれがある場合でも、照合部5において非線形マ
ッチングを行なうことで、正しく検索することができ
る。
【0017】さらに、この音声検索装置では、利用者自
らがキーワードを音声入力できるので、音声データベー
ス1がこの利用者と異なる入力者,作成者によって作成
されたか、あるいは音声合成装置によって作成されてい
ることによって、この利用者が興味をもつ言葉(キーワ
ード)に対して強調される抑揚が付いていない場合に
も、検索もれ等を生じさせずに、正しくかつ効率良く検
索を行なうことができる。
【0018】図2は本発明に係る音声検索装置の第2の
実施例のブロック図である。図2を参照すると、この第
2の実施例の音声検索装置では、第1の実施例の音声検
索装置において利用者が発声したキーワードの音声デ−
タ(音声信号)の特徴抽出結果,すなわち特徴ベクトル
の時系列を格納するためのキーワード格納部6が、特徴
抽出部2と照合部5との間にさらに設けられている。
【0019】次に、このような構成の第2の実施例の音
声検索装置の動作について説明する。前述した第1の実
施例の音声検索装置では、利用者は、キーワードをその
都度発声し入力する必要があったが、この第2の実施例
の音声検索装置では、利用者は、実際の検索動作を開始
させるに先立って、必要なキーワードをまとめて順次に
発声し、これらのキ−ワ−ドの音声デ−タの特徴ベクト
ルの時系列を予めキーワード格納部6に格納しておくこ
とができる。検索したいいくつかのキーワードの特徴ベ
クトルの時系列が予めキーワード格納部6に格納された
後、実際の検索動作を開始させることができる。実際の
検索動作では、照合部5は、キーワード格納部6に格納
されたキーワードを照合辞書として、音声データベース
1の音声データの中からキーワード格納部6内の各キー
ワードに対応するものを例えばワードスポッティングに
より順次に検出し、利用者が意図した音声デ−タ(音声
信号)を音声データベース1から検索することができ
る。
【0020】このように、この第2の実施例では、音声
データベース1のキーワードによる検索をバッチ処理で
行なうことができ、例えば、利用者が音声検索装置を使
い始める前に既に照合を終わらせて、利用者が必要とす
る音声デ−タ(音声信号)だけを抜き出して提示するこ
とや、あるいは利用者が必要とする音声デ−タ(音声信
号)だけを別の音声デ−タ蓄積装置(図示せず)に格納
したりすることが可能となる。
【0021】図3は本発明に係る音声検索装置の第3の
実施例のブロック図である。図3を参照すると、この第
3の実施例の音声検索装置は、音声データベース10と
して、音声データを例えば音声信号のままの状態で格納
するテープレコーダなどのような音声データ格納部11
と、音声データ格納部11に格納されている音声データ
に付与されたキーワードの特徴ベクトルの時系列を格納
するキーワード格納部12とを有しており、また、利用
者の発声した音声を入力するマイクロフォンなどの音声
入力部13と、音声入力部13から入力された利用者の
音声デ−タを特徴ベクトルの時系列に変換する特徴抽出
部14と、利用者がキーワードを発声し、該キーワード
の音声デ−タが音声入力部13から特徴抽出部14に送
られて特徴ベクトルの時系列に変換されたときに、利用
者の発声したキ−ワ−ドの特徴ベクトルの時系列とキー
ワード格納部12に格納されているキーワードの特徴ベ
クトルの時系列とを照合する照合部15とを備えてい
る。
【0022】ここで、照合部15は、第1の実施例の照
合部5と同様のスポッティング型の認識を行なうように
なっても良いし、あるいは、両端点固定の照合を行なう
ようになっていても良く、照合したときのスコア(一致
度)が予め定められている閾値THよりも大きい場合
に、キーワードが一致したと判定するようになってい
る。
【0023】次に、このような構成の第3の実施例の音
声検索装置の動作について説明する。この第3の実施例
の音声検索装置では、音声データベース1において、音
声データ格納部11に留守番電話や電子メールなどの音
声データが格納されているとともに、さらにキーワード
格納部12に音声データ格納部11内の音声データに対
するキーワードが予め格納されている。この場合、利用
者がキーワードを発声すると、照合部15では、利用者
が発声したキーワードを音声データベース1のキーワー
ド格納部12に格納されているキーワードと照合する。
この照合の結果、一致したキーワードが検出されたと
き、このキーワードに対応した音声データ格納部11内
の音声デ−タ(音声信号)を抽出することができる。
【0024】このように、この第3の実施例では、利用
者が発声したキーワードを音声データ格納部11内の音
声データ全体と照合するのではなく、キーワード格納部
12に格納されているキーワードと照合するので、音声
デ−タベ−ス内の音声データ全体と照合する場合に比べ
て、照合処理を高速に行なうことができて、利用者が必
要とする音声データを迅速に提示することが可能にな
る。
【0025】なお、上述の例では、キーワード格納部1
2には、キーワードが特徴抽出のなされた形で格納され
ているとしたが、キーワードを音声データ格納部11内
の音声データと同様、音声信号の形でキーワード格納部
12に格納しておくことも可能である。この場合には、
キーワード格納部12に格納されているキーワードの音
声デ−タ(音声信号)は、照合時に、特徴抽出部14で
特徴ベクトルの時系列に変換された上で照合処理がなさ
れる。
【0026】図4は本発明に係る音声検索装置の第4の
実施例のブロック図である。図4を参照すると、この第
4の実施例の音声検索装置では、第3の実施例の音声検
索装置において、利用者が発声したキーワードの音声デ
−タ(音声信号)の特徴抽出結果,すなわち特徴ベクト
ルの時系列を格納するためのキーワード格納部16が、
特徴抽出部14と照合部15との間にさらに設けられて
いる。
【0027】このような構成では、第2の実施例の音声
検索装置と同様に、利用者は、キーワードをその都度発
声し入力する必要があったが、この第4の実施例の音声
検索装置では、利用者は、実際の検索動作を開始させる
に先立って、必要なキーワードを発声し、これらの特徴
ベクトルの時系列を予め第2のキーワード格納部16に
格納しておくことができる。利用者が検索したいキーワ
ードの特徴ベクトルの時系列を予め第2のキーワード格
納部16に格納した後、実際の検索動作では、照合部1
5は、キーワード格納部16に格納されたキーワードを
照合辞書として、音声データベース10の第1のキーワ
ード格納部12に格納されているキーワードとの照合を
行なって、スコアが予め定められた閾値THより大きい
場合に、キーワードが一致したと判定する。キーワード
が一致したときには、第1のキーワード格納部12のそ
のキーワードに対応した音声データを音声データベース
10の音声データ格納部11から取り出す。これによ
り、利用者が意図した音声デ−タ(音声信号)を抽出す
ることができる。
【0028】このように、この第4の実施例では、第2
の実施例と同様、音声データベース10のキーワードに
よる検索をバッチ処理で行なうことができ、例えば、利
用者が音声検索装置を使い始める前に既に照合を終わら
せて、利用者が必要とする音声デ−タ(音声信号)だけ
を抜き出して提示することや、あるいは利用者が必要と
する音声デ−タ(音声信号)だけを別の音声信号蓄積装
置に格納したりすることが可能となる。
【0029】なお、上述の第2,第4の実施例では、利
用者が発声したキーワードの音声デ−タ(音声信号)に
対し特徴抽出を行なって、キーワードを特徴ベクトルの
時系列としてキーワード格納部6または16に格納して
いるが、キーワード格納部6または16を特徴抽出部2
または14よりも前に設け、特徴抽出の前(具体的には
A/D変換直後)の段階でキーワードをキーワード格納
部6または16に音声信号のままの状態で格納するよう
にしても良い。この場合には、照合を行なう度に同じ特
徴抽出を行なうため処理速度は劣化するが、D/A変換
を行なうだけで、キーワードとして何を登録してあるか
を耳で聞いて確認することができる。
【0030】また、上述の第1,第2の実施例では、音
声データベースの音声データ(音声信号)と利用者が発
声したキーワードの音声データ(音声信号)とを同じ特
徴抽出部を用いて特徴抽出を行なうとして説明したが、
それぞれ別個の特徴抽出部を設け、それぞれ異なる処理
を施すこともできる。例えば、照合速度の向上のために
フレーム周期を変更したり、あるいは利用者が発声した
キーワードの音声デ−タ(音声信号)については、N状
態(N<0)の継続時間制御型状態遷移モデル(電子情
報通信学会論文誌Vol.J72−D−II,No.11 p
p.1769−1777)を作るようにしても良い。
【0031】
【発明の効果】以上に説明したように、請求項1記載の
発明によれば、利用者の発声した音声を入力する音声入
力手段が設けられており、利用者がキーワードを発声
し、上記音声入力手段から利用者により発声されたキー
ワードの音声データが入力されたときに、該キーワード
の音声データを照合辞書として音声データベース内の音
声データとの照合を行なって音声データベースを検索す
るようになっているので、音声データベースの内容を検
索する際に、特別な検索用の入力装置を必要とせず、か
つ、音声データベースの利用者が検索したいキーワード
で音声データベースの内容を正しく検索を行なうことが
できる。
【0032】また、請求項2記載の発明によれば、利用
者より発声されたキーワードの音声データを格納するキ
ーワード格納手段がさらに設けられており、上記照合手
段は、キーワード格納手段に格納されているキーワード
を照合辞書として音声データベース内の音声データとの
照合を行なって音声データベースを検索するようになっ
ているので、音声データベース1のキーワードによる検
索をバッチ処理で行なうことができ、例えば、利用者が
音声検索装置を使い始める前に既に照合を終わらせて、
利用者が必要とする音声デ−タ(音声信号)だけを抜き
出して提示することや、あるいは利用者が必要とする音
声デ−タ(音声信号)だけを別の音声デ−タ蓄積装置
(図示せず)に格納したりすることが可能となる。
【0033】また、請求項3記載の発明によれば、音声
データベースが、音声デ−タを格納する音声データ格納
手段と、音声データ格納手段に格納されている音声デー
タに付与された音声のキーワードを格納する第1のキー
ワード格納手段とを有し、照合手段は、音声入力手段か
ら入力されたキーワードと上記第1のキーワード格納手
段に格納されているキーワードとの照合を行なって音声
データベースを検索するようになっているので、音声デ
−タベ−ス内の音声データ全体と照合する場合に比べ
て、照合処理を高速に行なうことができて、利用者が必
要とする音声データを迅速に提示することが可能にな
る。
【0034】また、請求項4記載の発明によれば、利用
者より発声されたキーワードの音声データを格納する第
2のキーワード格納手段がさらに設けられており、照合
手段は、第2のキーワード格納手段に格納されているキ
ーワードと音声データベースの第1のキーワード格納手
段に格納されいるキーワードとの照合を行なって音声デ
ータベースを検索するようになっているので、音声デー
タベース1のキーワードによる検索をバッチ処理で行な
うことができ、例えば、利用者が音声検索装置を使い始
める前に既に照合を終わらせて、利用者が必要とする音
声デ−タ(音声信号)だけを抜き出して提示すること
や、あるいは利用者が必要とする音声デ−タ(音声信
号)だけを別の音声デ−タ蓄積装置(図示せず)に格納
したりすることが可能となる。
【図面の簡単な説明】
【図1】本発明に係る音声検索装置の第1の実施例のブ
ロック図である。
【図2】本発明に係る音声検索装置の第2の実施例のブ
ロック図である。
【図3】本発明に係る音声検索装置の第3の実施例のブ
ロック図である。
【図4】本発明に係る音声検索装置の第4の実施例のブ
ロック図である。
【符号の説明】
1,10 音声データベース 2,14 特徴抽出部 3 第1の音声入力部 4 第2の音声入力部 5 照合部 6 キーワード格納部 11 音声データ格納部 12 キーワード格納部(第1のキーワード
格納部) 13 音声入力部 15 照合部 16 第2のキーワード格納部

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 検索対象となる音声データが格納されて
    いる音声データベースと、利用者が発声した音声を入力
    する音声入力手段と、利用者がキーワードを発声し、前
    記音声入力手段から利用者により発声されたキーワード
    の音声データが入力されたときに、該キーワードの音声
    データを照合辞書として前記音声データベース内の音声
    データとの照合を行なって音声データベースを検索する
    照合手段とを有していることを特徴とする音声検索装
    置。
  2. 【請求項2】 請求項1記載の音声検索装置において、
    利用者より発声されたキーワードの音声データが前記音
    声入力手段から入力するときに、該キーワードの音声デ
    ータを格納するキーワード格納手段がさらに設けられて
    おり、前記照合手段は、前記キーワード格納手段に格納
    されているキーワードを照合辞書として前記音声データ
    ベース内の音声データとの照合を行なって音声データベ
    ースを検索するようになっていることを特徴とする音声
    検索装置。
  3. 【請求項3】 音声データベースと、利用者が発声した
    音声を入力する音声入力手段と、利用者がキーワードを
    発声し、前記音声入力手段から利用者により発声された
    キーワードの音声データが入力されたときに、該キーワ
    ードの音声データに基づき前記音声データベ−スを検索
    する照合手段とを有し、前記音声デ−タベ−スには、音
    声デ−タを格納する音声デ−タ格納手段と、音声データ
    格納手段に格納されている音声データに付与された音声
    のキーワードを格納する第1のキーワード格納手段とが
    設けられており、前記照合手段は、前記音声入力手段か
    ら入力されたキーワードと前記第1のキーワード格納手
    段に格納されているキーワードとの照合を行なって音声
    データベースを検索するようになっていることを特徴と
    する音声検索装置。
  4. 【請求項4】 請求項3記載の音声検索装置において、
    利用者より発声されたキーワードの音声データが前記音
    声入力手段から入力するときに、該キーワードの音声デ
    ータを格納する第2のキーワード格納手段がさらに設け
    られており、前記照合手段は、前記第2のキーワード格
    納手段に格納されているキーワードと、前記音声データ
    ベースの前記第1のキーワード格納手段に格納されてい
    るキーワードとの照合を行なって音声データベースを検
    索するようになっていることを特徴とする音声検索装
    置。
JP4351958A 1992-12-09 1992-12-09 音声検索装置 Pending JPH06175698A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4351958A JPH06175698A (ja) 1992-12-09 1992-12-09 音声検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4351958A JPH06175698A (ja) 1992-12-09 1992-12-09 音声検索装置

Publications (1)

Publication Number Publication Date
JPH06175698A true JPH06175698A (ja) 1994-06-24

Family

ID=18420796

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4351958A Pending JPH06175698A (ja) 1992-12-09 1992-12-09 音声検索装置

Country Status (1)

Country Link
JP (1) JPH06175698A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002091493A (ja) * 2000-09-11 2002-03-27 Sony Corp 音声信号の再生装置
JP2008107641A (ja) * 2006-10-26 2008-05-08 Yamaha Corp 音声データ検索装置
JP2010204269A (ja) * 2009-03-02 2010-09-16 Casio Computer Co Ltd 音声検索装置、音声検索方法及び音声検索プログラム
JP2011053563A (ja) * 2009-09-03 2011-03-17 Neikusu:Kk 音声データ内の音声キーワード照合システム、その方法及び音声データ内の音声キーワード照合プログラム
US8731926B2 (en) 2010-03-04 2014-05-20 Fujitsu Limited Spoken term detection apparatus, method, program, and storage medium

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002091493A (ja) * 2000-09-11 2002-03-27 Sony Corp 音声信号の再生装置
JP2008107641A (ja) * 2006-10-26 2008-05-08 Yamaha Corp 音声データ検索装置
JP2010204269A (ja) * 2009-03-02 2010-09-16 Casio Computer Co Ltd 音声検索装置、音声検索方法及び音声検索プログラム
JP2011053563A (ja) * 2009-09-03 2011-03-17 Neikusu:Kk 音声データ内の音声キーワード照合システム、その方法及び音声データ内の音声キーワード照合プログラム
US8731926B2 (en) 2010-03-04 2014-05-20 Fujitsu Limited Spoken term detection apparatus, method, program, and storage medium

Similar Documents

Publication Publication Date Title
US10074363B2 (en) Method and apparatus for keyword speech recognition
US6601027B1 (en) Position manipulation in speech recognition
US5983177A (en) Method and apparatus for obtaining transcriptions from multiple training utterances
EP1548705B1 (en) System and method for latency reduction for automatic speech recognition using partial multi-pass results
US6961705B2 (en) Information processing apparatus, information processing method, and storage medium
US6424943B1 (en) Non-interactive enrollment in speech recognition
US9418152B2 (en) System and method for flexible speech to text search mechanism
US8380505B2 (en) System for recognizing speech for searching a database
JP3848319B2 (ja) 情報処理方法及び情報処理装置
US20150073792A1 (en) Method and system for automatically detecting morphemes in a task classification system using lattices
JP5142769B2 (ja) 音声データ検索システム及び音声データの検索方法
US20050033575A1 (en) Operating method for an automated language recognizer intended for the speaker-independent language recognition of words in different languages and automated language recognizer
US5937383A (en) Apparatus and methods for speech recognition including individual or speaker class dependent decoding history caches for fast word acceptance or rejection
US20100324900A1 (en) Searching in Audio Speech
JPH07507880A (ja) 複合ワードを有する言語のための音声認識装置
WO2002035519A1 (en) Speech recognition using word-in-phrase command
JP4987682B2 (ja) 音声チャットシステム、情報処理装置、音声認識方法およびプログラム
US20020082841A1 (en) Method and device for processing of speech information
US20070016420A1 (en) Dictionary lookup for mobile devices using spelling recognition
JPH06175698A (ja) 音声検索装置
US5970454A (en) Synthesizing speech by converting phonemes to digital waveforms
JPH11231895A (ja) 音声認識方法及びその装置
JPH10173769A (ja) 音声メッセージ検索装置
JP3021252B2 (ja) データ検索方法及びデータ検索装置
CA2597826C (en) Method, software and device for uniquely identifying a desired contact in a contacts database based on a single utterance