JPH05224696A - 音声情報検索再生装置 - Google Patents

音声情報検索再生装置

Info

Publication number
JPH05224696A
JPH05224696A JP4024065A JP2406592A JPH05224696A JP H05224696 A JPH05224696 A JP H05224696A JP 4024065 A JP4024065 A JP 4024065A JP 2406592 A JP2406592 A JP 2406592A JP H05224696 A JPH05224696 A JP H05224696A
Authority
JP
Japan
Prior art keywords
reproduction
voice
information
keyword
file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP4024065A
Other languages
English (en)
Other versions
JP3358163B2 (ja
Inventor
Yasuhisa Kato
泰久 加藤
Katsumi Hosoya
克美 細谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP02406592A priority Critical patent/JP3358163B2/ja
Publication of JPH05224696A publication Critical patent/JPH05224696A/ja
Application granted granted Critical
Publication of JP3358163B2 publication Critical patent/JP3358163B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 多くの音声情報の中から希望の情報を迅速に
聴取音声情報検索再生装置を提供する 【構成】 音声ファイル蓄積部1に蓄積される原音声フ
ァイルから特定のキーワードの位置情報を抽出するワー
ド・スポッティング部3を具備し、キーワードの位置情
報と聴取者の指示とに基づいてスキップ/バック再生を
行なう再生位置ポインタの計算を行なう再生位置制御部
51を具備し、再生位置ポインタと音声ファイルから音
声を再生する再生制御部54を具備する音声情報検索再
生装置、および音声情報検索再生装置に更に音声ファイ
ルに対してワード・スポッティングを行なうに先だって
一定時間の無音部分を区切りとしてこれを幾つかのファ
イルに分割する有音/無音検出部を具備せしめた音声情
報検索再生装置。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、音声情報検索再生装
置に関し、特に、蓄積された音声情報を情報聴取希望者
の操作に基づいて検索再生する音声情報を高速に検索再
生する音声情報検索再生装置に関する。
【0002】
【従来の技術】音声情報を高速に検索再生するのに、従
来、種々の技術が採用されているが、これらについて簡
単に説明する。 1. メニューの階層化技術について。 図1に示されるごとく、音声ファイルを階層化し、ガイ
ダンスを聴取者に聞かせて(あるいは印刷物によるメニ
ューを聴取者に提示して)メニューを選択させる方式で
ある。
【0003】図1は3階層の場合の例を示す。聴取者は
大項目、中項目、小項目の順に選んで、音声ファイル1
から順に聞いて希望する音声情報を得る。 2. 再生速度制御技術について。 入力された音声情報はディジタル信号に変換され、音声
ファイルとして蓄えられている。この蓄えられた音声フ
ァイルを再生する速度を制御する技術である。この技術
として種々のものが提案されている。
【0004】(a)再生時のディジタル信号をアナログ
信号に変換する時の基準信号(以下、サンプリング周波
数、と称す)を大きくする技術。 この技術は最も簡単に再生速度を変えることができ、録
音時の2倍のサンプリング周波数で再生すれば、録音速
度の2倍の速度で再生することができる。 (b)長さ数十mm秒程の基準音声ファイル片(以下、フ
レーム、と称す)を適宜に間引く技術。
【0005】この技術はフレームを適宜に間引くもので
あるから、周波数を変えずに再生速度を速くすることが
できる。 (c)隣合うフレームを重みづけをした上で足し合わせ
る技術。 フレーム間のつなぎ目を連続的にするために重みづけを
した上で足し合わせるものである(1989年電子情報
通信学会技術研究報告(EA89−94)「音声速度変
換処理方式の一検討:三崎、鈴木」参照)。
【0006】(d)スキップ再生技術。 この技術は、聴取者の指示により音声ファイル中を一定
時間スキップしたり、次の音声ファイルの先頭にスキッ
プするものであり、伝言ダイヤルおよびオーディオテッ
クス・システムにおいて採用されている。 ここで、上述の1.のメニューの階層化技術によりメニ
ューの階層化をする場合は、階層数は3階層が限度であ
ることが報告されている(1990年電子通信情報学会
秋期全国大会「検索型音声情報提供サービスのメニュー
構成の検討:細谷、多田、原口」参照)。それ故に、こ
のメニューの階層化技術により検索時間を大幅に短縮さ
せることは困難である。
【0007】上述の2. の(a)〜(c)の技術は物理
的に聴取できる再生速度には限界があり、実時間の2〜
3倍程度までしか再生速度を上げることはできない。
2. の(d)のスキップ再生技術は、音声ファイルに対
して一定時間先送り或は後戻り、次の或は前の音声ファ
イルの先頭にスキップする技術であるが、希望する内容
を検索するためには一通り全ての音声ファイルを聞く必
要があり、大幅な検索時間の短縮は不可能なものであ
る。
【0008】
【発明が解決しようとする課題】この発明は、多くの音
声情報の中から希望の情報を迅速に聴取する上述された
通りの欠点を解決した音声情報検索再生装置を提供する
ものである。
【0009】
【課題を解決するための手段】蓄積された音声情報であ
る音声ファイルを蓄積する音声ファイル蓄積部1を具備
し、音声ファイルと予め与えられた単語、句その他の音
声断片に対応する音声情報であるキーワードとを照合す
ることにより音声ファイル中におけるキーワードが含ま
れる位置の時間情報であるキーワード位置情報を出力す
るワード・スポッティング部3を具備し、音声ファイル
の再生中現在の再生位置を記憶する再生位置ポインタ記
憶部52を具備し、外部から入力される先送り指示信号
および後戻り指示信号を検出してこれとキーワード位置
情報とにより再生位置ポインタ記憶部52の内容を更新
する再生位置制御部51を具備し、先送り指示信号或は
後戻り指示信号を検出した場合に以後の再生位置を先送
り或は後戻りさせる構成を具備する音声情報検索再生装
置、を提供し、更に請求項1に記載される音声情報検索
再生装置において、音声ファイル中の予め与えられた長
さを超える無音部を検出する有音/無音検出部2を具備
し、無音部の位置を区切りとして音声ファイルを分割す
る構成を具備し、分割された音声ファイル部分を各別に
ワードスポッティング部3に供給してキーワード位置情
報を抽出する構成を具備する音声情報検索再生装置を提
供する。
【0010】
【実施例】この発明の実施例を図2を参照して説明す
る。図2はこの発明の第1の実施例を説明する図であ
り、1は再生されるべき音声ファイルが多数蓄積されて
いる音声ファイル蓄積部である。2は音声ファイル中の
予め決められた長さ以上の無音部を検出する有音/無音
検出部である。3はワード・スポッティング部である。
ここで、ワード・スポッティングとは、現在対象とされ
ている単語を含む音声について、単語標準パターンとの
照合を連続的に行なうことによりキーワードの検出及び
認識を行なう技術である(1988年電子情報通信学会
技術研究報告(SP88−18)「ワードスポッティン
グ手法を用いた不特定話者・少数語向け音声認識装置:
平岡、二矢田、木村」参照)。音声情報の検索を希望す
る聴取者は、ワード・スポッティング部3に検索のキー
となるキーワードを予め設定しておく。ワード・スポッ
ティング部3は、音声ファイル中から、設定されたキー
ワードがどこに含まれているかのキーワード位置情報を
取り出す。4はキーワード位置蓄積部であり、ワード・
スポッティング部3により取り出されたキーワード位置
情報を蓄積しておくものである。5は再生制御部であ
る。ここで、音声情報の検索を希望する聴取者が再生制
御部5に希望する指示を送ることにより、この指示とキ
ーワード位置蓄積部4に蓄積されているキーワード位置
情報とに基づいて音声ファイルの再生位置ポインタを計
算し、希望する音声を再生聴取するのであるが、これを
以下において詳述する。
【0011】図4を参照するに、聴取者は操作入力部5
3に希望する指示、例えば前或は後にスキップし或はバ
ックする旨の指示をする。ワード・スポッティング部3
により得られたキーワード位置情報と操作入力部53を
介して送り出される指示情報とに基づいて再生位置制御
部51は音声ファイルの再生位置ポインタを計算し、こ
れを再生位置ポインタ記憶部52に記憶する。音声再生
部54は再生位置ポインタにより指示される音声ファイ
ルの音声再生をすることができる。
【0012】ここで、聴取者が再生制御部5に指示を送
るには次の2通りの仕方が考えられる。 リアルタイム指示。 これは、聴取者が音声情報を聞いている最中に前或は後
にスキップ/バックしたい場合、ボタンを押すなどの操
作を行ない、再生制御部に指示を送る。
【0013】事前指示。 これは、聴取者が音声ファイルを再生する前に指示をし
ておき、当該キーワード部分の再生が終了すると自動的
に次のキーワード部分にスキップする。両者何れの指示
の仕方の場合においても、スキップ/バックの処理は以
下のように行なわれる。
【0014】再生している音声ファイルの中のキーワー
ド位置を、 {t1 ,t2 ,t3 ,…}(t1 <t2 <t3 <…) とし、現在の再生位置がTであったとする。スキップ指
示の場合は、 ti ≦T<ti+1 となるiを求め、現在の再生位置Tを、 T←ti+1 −d と更新する。またバック指示の場合は、 ti <T≦ti+1 となるiを求め、現在の再生位置Tを、 T←ti −d と更新する。ただし、dは予め与えられた時間であり、
これによりスキップ/バックしたキーワードよりdだけ
少し前の時点から再生が再開されることとなる。
【0015】上述の処理は現在の再生位置に最も近いキ
ーワード位置までスキップ/バック処理であるが、2つ
以上前或は後のキーワード位置までスキップ/バックす
ること、iを直接指定してi番目のキーワード位置へ再
生ポインタを更新することも同様の処理により容易に実
施することができる。キーワード位置情報を作成する時
期は以下の通りである。
【0016】音声ファイル作成時に同時に作成する。こ
の場合、すぐに再生が可能なので音声情報の登録が再生
に比べて少ない場合に適している。音声ファイルの作成
後、再生する迄の間に作成する。この場合、バッチ処理
が可能であり、時間の制約がなく、ワード・スポッティ
ング部の使用効率が高くなる。その反面、音声ファイル
作成後すぐに再生することはできない。
【0017】図3はこの発明の第2の実施例を示す図で
ある。この実施例は第1の実施例とは異なって、キーワ
ード位置情報を蓄積するキーワード位置蓄積部4を具備
してはいない。キーワード位置情報は、再生時に一時的
に作成されるだけである。この場合、同時に複数のファ
イルを再生する時に処理の高速化、並列化が要求され
て、同一ファイルを何度も再生する時に無駄が多い。し
かし、キーワード情報蓄積部4を具備しない分だけ装置
の構成を簡素化することができる。
【0018】有音/無音検出部2についてであるが、こ
れを具備することにより音声ファイル中の予め決められ
た長さを越える無音部を検出し、その位置を区切りとし
て音声ファイルを分割してワード・スポッティング部に
送ることが可能となる。これにより、分割をしない場合
と比較して、ワード・スポッティング部3における処理
が軽減され、ワード・スポッティング部3の処理速度、
記憶容量の制限が緩和される。
【0019】
【発明の効果】以上の通りであって、この発明は、音声
情報の検索再生をするに際して、蓄積された音声情報を
分析し、予め設定されたキーワードの位置情報を得るこ
とで、単なるスキップ/バック再生とは異なり、音声情
報の内容に対して検索が可能となる。更に、有音/無音
検出部を採用することによりワード・スポッティング部
における処理が軽減され、ワード・スポッティング部の
処理速度、記憶容量の制限が緩和されるに到る。
【図面の簡単な説明】
【図1】従来例におけるメニューによる階層化の一例を
示す図。
【図2】この発明の一実施例を示すブロック図。
【図3】この発明の他の実施例を示すブロック図。
【図4】再生制御部のブロック図。
【図5】有音/無音検出部の動作を説明する図。
【符号の説明】
1 音声ファイル蓄積部 2 有音/無音検出部 3 ワードスポッティング部 4 キーワード情報蓄積部 5 再生制御部 51 再生位置制御部 52 再生位置ポインタ記憶部 53 操作入力部

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 蓄積された音声情報である音声ファイル
    を蓄積する音声ファイル蓄積部1を具備し、音声ファイ
    ルと予め与えられた単語、句その他の音声断片に対応す
    る音声情報であるキーワードとを照合することにより音
    声ファイル中におけるキーワードが含まれる位置の時間
    情報であるキーワード位置情報を出力するワード・スポ
    ッティング部を具備し、音声ファイルの再生中現在の再
    生位置を記憶する再生位置ポインタ記憶部を具備し、外
    部から入力される先送り指示信号および後戻り指示信号
    を検出してこれとキーワード位置情報とにより再生位置
    ポインタ記憶部の内容を更新する再生位置制御部を具備
    し、先送り指示信号或は後戻り指示信号を検出した場合
    に以後の再生位置を先送り或は後戻りさせる構成を具備
    することを特徴とする音声情報検索再生装置。
  2. 【請求項2】 請求項1に記載される音声情報検索再生
    装置において、音声ファイル中の予め与えられた長さを
    超える無音部を検出する有音/無音検出部を具備し、無
    音部の位置を区切りとして音声ファイルを分割する構成
    を具備し、分割された音声ファイル部分を各別にワード
    スポッティング部に供給してキーワード位置情報を抽出
    する構成を具備することを特徴とする音声情報検索再生
    装置。
JP02406592A 1992-02-10 1992-02-10 音声情報検索再生装置 Expired - Fee Related JP3358163B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP02406592A JP3358163B2 (ja) 1992-02-10 1992-02-10 音声情報検索再生装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP02406592A JP3358163B2 (ja) 1992-02-10 1992-02-10 音声情報検索再生装置

Publications (2)

Publication Number Publication Date
JPH05224696A true JPH05224696A (ja) 1993-09-03
JP3358163B2 JP3358163B2 (ja) 2002-12-16

Family

ID=12128046

Family Applications (1)

Application Number Title Priority Date Filing Date
JP02406592A Expired - Fee Related JP3358163B2 (ja) 1992-02-10 1992-02-10 音声情報検索再生装置

Country Status (1)

Country Link
JP (1) JP3358163B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002091493A (ja) * 2000-09-11 2002-03-27 Sony Corp 音声信号の再生装置
JP2007334968A (ja) * 2006-06-13 2007-12-27 Pioneer Electronic Corp 音声切換装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002091493A (ja) * 2000-09-11 2002-03-27 Sony Corp 音声信号の再生装置
JP2007334968A (ja) * 2006-06-13 2007-12-27 Pioneer Electronic Corp 音声切換装置

Also Published As

Publication number Publication date
JP3358163B2 (ja) 2002-12-16

Similar Documents

Publication Publication Date Title
US6535848B1 (en) Method and apparatus for transcribing multiple files into a single document
JP3873131B2 (ja) 電話メッセージの転記のために使用される編集システム及び方法
WO2007132690A1 (ja) 音声データ要約再生装置、音声データ要約再生方法および音声データ要約再生用プログラム
JP2007519047A (ja) 会話の話題を決定して関連するコンテンツを取得して提示する方法及びシステム
WO2008001500A1 (fr) Système de génération de contenus audio, système d'échange d'informations, programme, procédé de génération de contenus audio et procédé d'échange d'informations
JPH09185879A (ja) レコーディング・インデクシング方法
JPH08212228A (ja) 要約文作成装置および要約音声作成装置
Roy NewsComm--a hand-held device for interactive access to structured audio
JP2003255979A (ja) データ編集方法、データ編集装置、データ編集プログラム
JP2001511991A (ja) マルチメディア・レコードのためのラベル・インターバル・データの格納および取得の方法及び装置
US20010046096A1 (en) Redactable recording apparatus
JP3437617B2 (ja) 時系列データ記録再生装置
JP3881620B2 (ja) 話速可変装置及び話速変換方法
JPH06161704A (ja) 音声インタフェース・ビルダ・システム
JP3896760B2 (ja) 対話記録編集装置、方法及び記憶媒体
Hirschberg et al. Finding information in audio: A new paradigm for audio browsing and retrieval
JP3358163B2 (ja) 音声情報検索再生装置
US20060084047A1 (en) System and method of segmented language learning
JP2000206987A (ja) 音声認識装置
JPS58102378A (ja) 情報検索装置
JPH1125112A (ja) 対話音声処理方法及び装置、記録媒体
US7092884B2 (en) Method of nonvisual enrollment for speech recognition
JPH05265695A (ja) ユーザインタフェース手段を有する装置
JP4353084B2 (ja) 映像再生方法及び装置及びプログラム
JPH08235209A (ja) マルチメディア情報処理装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees