JPH06202691A - 音声情報再生速度制御方法 - Google Patents

音声情報再生速度制御方法

Info

Publication number
JPH06202691A
JPH06202691A JP5001059A JP105993A JPH06202691A JP H06202691 A JPH06202691 A JP H06202691A JP 5001059 A JP5001059 A JP 5001059A JP 105993 A JP105993 A JP 105993A JP H06202691 A JPH06202691 A JP H06202691A
Authority
JP
Japan
Prior art keywords
phrase
voice
phrases
length
control method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5001059A
Other languages
English (en)
Inventor
Yasuhisa Kato
泰久 加藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP5001059A priority Critical patent/JPH06202691A/ja
Publication of JPH06202691A publication Critical patent/JPH06202691A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 音声情報を短時間で再生し、利用者が短時間
で内容を理解できるようにする。 【構成】 音声ファイルのポーズを検出する有音/無音
検出部20と、分割されたフレーズの長さを検出するフ
レーズ長検出部30と、フレーズを再構成するフレーズ
構成部40と、再生速度を指定する速度指示部60と、
速度指示部60からの情報をもとにフレーズを適宜間引
いて再生する再生制御部50を備え、各フレーズの長さ
を平滑化して再構成した後、間引き処理を行なって音声
情報を再生する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声情報の速度を変え
て再生する方法に関し、特に利用者ができるだけ短時間
で内容を理解できるようにする音声情報再生速度制御方
法に関する。
【0002】
【従来の技術】通常のテープレコーダ等の早送りでは、
再生音の周波数が高くなり、内容を理解するためには大
変聴きにくい。これを改善するために、図2に示すよう
に、音声を数十ミリ秒毎のフレームに分割し、フレーム
を単位として音声の間引きを行なうことにより、原音と
同等の周波数のままで再生速度を高くする方法が提案さ
れた。図2では、再生速度を2倍にする場合、および3
倍にする場合についての例を示している。2倍の場合に
は、原音をフレームに分割して一つおきのフレームを順
次再生する。3倍の場合には、原音フレームに分割して
二つおきのフレームを順次再生する。しかし、この方法
では、間引きを行なった後のフレームの接続部分での不
連続によるクリック音が生じる。これを改善する方法と
して、図3に示すように、隣接するフレームに重み付け
をして音声信号を足し合わせる方法が提案されている。
さらに、フレームの加算部分が滑らかになるように相関
点を計算して接合点を前後にずらす方法が提案されてい
る。なお、この種の方法に関するものとしては、例え
ば、次の(1)〜(3)の文献が挙げられる。 (1)デビッド マラ.タイム−ドメイン アルゴリス
ム フォー ハーモニック バンドワイズ リダクショ
ン アンド タイム スケーリング オブ スピーチ
シグナル.アイ イー イー イー トランザクション
オン アコースティクス,スピーチ,アンド シグナ
ル フロセシング,ボリウム. エイ エス エス ピ
ー−27,ナンバー2,ピー ピー.121−133,
1979.(David Malah.Time-domain algorithms for
harmonic bandwidth reduction andtime scaling of sp
eech signals.IEEE Transaction on Acoustics,Speech,
andSignal Processing,Vol.ASSP-27,No.2,pp.121-133,1
979.) (2)三崎正之,鈴木良二,直野博之.音声速度変換処
理方式の一検討.電子情報通信学会技術研究報告 応用
音響,Vol.EA89-94,pp.17-24,1989. (3)鈴木良二,三崎正之.高品質音声速度変換方式の
DSPによる実現.電子情報通信学会技術研究報告 音
声,Vol.SP90-34,pp.1-8,1990. これらの方法では、フレームの長さを数十ミリ程度の予
め定められた値に設定して分割している。これらを利用
すると、高速再生時でも歪が小さく内容を理解しやすく
なるが、再生速度は2〜3倍程度が限界となり、これ以
上の速度では、内容を理解するのが困難になる。また、
例えば、特開昭61−200600号公報に記載されて
いるように、フレーズ(複数に分割された音声情報の一
つ)の最初の部分だけ再生する方法も提案されている。
しかし、フレーズの最初だけ再生するのでは音声情報が
理解しにくい場合が多い。
【0003】
【発明が解決しようとする課題】上記従来技術では、再
生速度に限界があり、それ以上速度をあげると、内容を
理解するのが困難になる。また、フレーズの最初だけ再
生する方法では内容が理解しにくい場合がある。本発明
の目的は、このような問題点を改善し、音声情報を短時
間で再生でき、利用者が短時間で内容を理解可能な音声
情報再生速度制御方法を提供することにある。
【0004】
【課題を解決するための手段】上記目的を達成するた
め、本発明の音声情報再生速度制御方法は、音声ファイ
ル(音声情報)の無音部分(ポーズ)を検出する有音/
無音検出部と、フレーズ(複数に分割された音声ファイ
ルの一つ)を再構成するフレーズ構成部と、再生速度を
指定する速度指示部、速度指示部からの情報をもとにフ
レーズを適宜間引いて再生する再生制御部を備え、各フ
レーズの長さを平滑化して再構成した後、間引き処理を
行なうことに特徴がある。なお、以下、音声情報は「音
声ファイル」、その中の無音部分は「ポーズ」、複数に
分割された音声ファイルの一つは「フレーズ」と呼ぶ。
【0005】
【作用】本発明においては、音声ファイルをポーズをも
とにフレーズに分割し、フレーズの長さを平滑化した上
でフレーズを間引いて再生することにより、再生速度を
高速にした時でも音声情報の聴取が可能となり、フレー
ズの長さを平滑化しない場合に比べて、より指定した再
生速度に近い速度での再生が可能である。
【0006】
【実施例】以下、本発明の一実施例を図面により説明す
る。 (第1の実施例)図4は、本発明の第1の実施例におけ
る音声情報再生システムの機能構成図である。図4にお
いて、10は音声蓄積部、20は有音/無音検出部、3
0はフレーズ長検出部、40はフレーズ構成部、50は
再生制御部、60は速度指示部である。ここで、図1に
より処理の概略を説明する。本実施例では、音声蓄積部
10に蓄えられた音声ファイルの中のポーズを有音/無
音検出部20で抽出し、フレーズに分割する(ステップ
101)。分割されたフレーズの長さをフレーズ長検出
部30で調べる(ステップ102)。フレーズ構成部4
0では、長すぎるフレーズは分割が行なわれるまで、有
音/無音検出部20に戻す(ステップ104)。また、
短すぎるフレーズを隣のフレーズとまとめて一つのフレ
ーズに再構成する(ステップ103)。このようにして
フレーズを再構成し(ステップ105)、そのフレーズ
と、速度指示部60で指定された値により、再生制御部
50において適切な間引き方法を選択して(ステップ1
06)、音声として出力する。
【0007】次に、具体的な例をあげて処理の流れを説
明する。本実施例では、図2に示した音声情報の再生速
度が2倍の場合を示す。図5において、100は音声蓄
積部に蓄積された音声情報、110、120、130は
分割されたフレーズ、140は出力される音声である。
まず、有音/無音検出部20は、平均パワー等を用いて
音声ファイルの中のポーズがTpause秒以上の位置を検
出する。そのポーズの位置を基にフレーズ長検出部30
ではポーズで区切られた各フレーズの時間長を計算す
る。次に、フレーズ構成部40で、各フレーズの時間長
を基にフレーズを再構成する。ここで、フレーズの再構
成の例を説明する。フレーズの最小時間長をTmin秒、
最大時間長をTmax秒、再構成前のn番目のフレーズを
n、Fnの時間長をtnとする。但し、フレーズの再構
成はn=1,2,3,…の順に行なう。 Tmin<tn<Tmax ならば、Fnはそのまま。 tn<Tmin min{tn-1,tn+1}+tn≦Tmax ならば、FnはFn-1またはFn+1の時間長が短い方と結
合させて、一つのフレーズにする。 tn>Tmax ならば、Fnを Tpause=Tpause×α 0<α<1 とし、再度、有音/無音検出部20に送り、Fnを二つ
以上のフレーズに分割する。但し、ポーズが検出できな
かったらαの値をさらに小さくして有音/無音検出部2
0に送り、分割されるまでこれを繰り返す。なお、上記
以外はフレーズは変更しない。次に、再生制御部50で
は、速度指示部60からの再生速度の値をもとに再生す
るフレーズと間引くフレーズを決定し、音声として出力
する。例えば、図6のように、フレーズ再構成後のフレ
ーズを1,2,3,…とすると、2倍は一つおきのフレ
ーズを、3倍は二つおきのフレーズを順次再生する。整
数倍でない場合は、例えば、2.5倍の時には、1,
2,6,7,…と再生することで実現できる。なお、間
引き処理を行なった後のフレーズ接続部分については、
従来技術と同様にして(例えば、隣接フレーズを重み付
けする方法、接合点を前後にずらす方法等により)不連
続を補正する。
【0008】(第2の実施例)図7は、本発明の第2の
実施例における音声情報再生システムの機能構成図、図
8は本発明の第2の実施例における音声情報再生速度制
御方法を示すフローチャートである。図7のフレーズ構
成部40では、対象のフレーズが最大時間長を超える場
合、再度有音/無音検出部20に送らず、図8のステッ
プ804のように、そのフレーズを適宜等分して再構成
する。これにより、処理時間の短縮をはかる。ここで、
等分の方法を説明する。n番目のフレーズFnの時間長
nが tn>Tmax とする。このとき、 Tmax×m<tn≦Tmax×(m+1) を満たす整数mが存在するので、Fnをm+1等分す
る。なお、その他の機能構成および処理手順は第1の実
施例と同様である。
【0009】
【発明の効果】本発明によれば、音声情報の再生に関し
て、音声情報に含まれるポーズを検出し、フレーズに分
割し、その長さを平滑化した上で、フレームを再構成す
る。そして、フレーズを適宜スキップして再生すること
で音声情報を短時間で再生でき、ボイスメールサービ
ス、オーディオテックサービス等の音声情報検索機能を
大幅に向上させることが可能となる。
【図面の簡単な説明】
【図1】本発明の第1の実施例における音声情報再生速
度制御方法を示すフローチャートである。
【図2】従来の音声情報再生速度制御方法の例を示す図
である。
【図3】従来の音声情報再生速度制御方法の例を示す図
である。
【図4】本発明の第1の実施例における音声情報再生シ
ステムの機能構成図である。
【図5】本発明の第1の実施例における音声情報再生処
理の概略を示す図である。
【図6】本発明の第1の実施例における再生制御部での
フレーズの選択方法を示す図である。
【図7】本発明の第2の実施例における音声情報再生シ
ステムの機能構成図である。
【図8】本発明の第2の実施例における音声情報再生速
度制御方法を示すフローチャートである。
【符号の説明】
10 音声蓄積部 20 有音/無音検出部 30 フレーズ長検出部 40 フレーズ構成部 50 再生制御部 60 速度指示部

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 音声ファイルの中のポーズを検出し、音
    声ファイルを該ポーズを区切りとして分割し、再生する
    装置の再生速度制御方法において、音声ファイルを複数
    のフレーズに分割し、予め設定されたフレーズ長の最大
    値および最小値と比べて、当該フレーズが最小値より小
    さい場合、隣接フレーズと結合して一つのフレーズと
    し、最小値より大きくなるまで隣接フレーズとの結合を
    繰り返し、当該フレーズが最大値より大きい場合には、
    最大値より小さくなるまでフレーズを分割することによ
    り、各フレーズの長さを平滑化して再構成し、再構成し
    たフレーズに対して間引き処理を行ない再生することを
    特徴とする音声情報再生速度制御方法。
JP5001059A 1993-01-07 1993-01-07 音声情報再生速度制御方法 Pending JPH06202691A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5001059A JPH06202691A (ja) 1993-01-07 1993-01-07 音声情報再生速度制御方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5001059A JPH06202691A (ja) 1993-01-07 1993-01-07 音声情報再生速度制御方法

Publications (1)

Publication Number Publication Date
JPH06202691A true JPH06202691A (ja) 1994-07-22

Family

ID=11490974

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5001059A Pending JPH06202691A (ja) 1993-01-07 1993-01-07 音声情報再生速度制御方法

Country Status (1)

Country Link
JP (1) JPH06202691A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1996013826A1 (fr) * 1994-10-28 1996-05-09 Nippon Steel Corporation Dispositif de decodage de donnees codees et systeme de decodage de donnees audio/video multiplexees faisant appel a ce dispositif
WO1998041976A1 (fr) * 1997-03-14 1998-09-24 Nippon Hoso Kyokai Procede et dispositif permettant de modifier la vitesse des sons vocaux
US5825853A (en) * 1995-09-07 1998-10-20 Hitachi, Ltd. Communication device

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1996013826A1 (fr) * 1994-10-28 1996-05-09 Nippon Steel Corporation Dispositif de decodage de donnees codees et systeme de decodage de donnees audio/video multiplexees faisant appel a ce dispositif
US5765136A (en) * 1994-10-28 1998-06-09 Nippon Steel Corporation Encoded data decoding apparatus adapted to be used for expanding compressed data and image audio multiplexed data decoding apparatus using the same
US5825853A (en) * 1995-09-07 1998-10-20 Hitachi, Ltd. Communication device
WO1998041976A1 (fr) * 1997-03-14 1998-09-24 Nippon Hoso Kyokai Procede et dispositif permettant de modifier la vitesse des sons vocaux
US6205420B1 (en) 1997-03-14 2001-03-20 Nippon Hoso Kyokai Method and device for instantly changing the speed of a speech

Similar Documents

Publication Publication Date Title
JP3017715B2 (ja) 音声再生装置
CA2253749C (en) Method and device for instantly changing the speed of speech
JP4098420B2 (ja) 音響データ・動画データの同期再構築方法及び装置
JP4523257B2 (ja) 音声データ処理方法、プログラム及び音声信号処理システム
JP2000511651A (ja) 記録されたオーディオ信号の非均一的時間スケール変更
TW201207847A (en) Apparatus and method for temporarily extending or compressing time sections of an audio signal
JP3576800B2 (ja) 音声分析方法、及びプログラム記録媒体
JPH06202691A (ja) 音声情報再生速度制御方法
JPH09198089A (ja) 再生速度変換装置
JPS5982608A (ja) 音声の再生速度制御方式
JP2009075280A (ja) コンテンツ再生装置
JPH08146985A (ja) 話速制御システム
JPH06202692A (ja) 音声再生速度制御システム
JP3081469B2 (ja) 話速変換装置
JP2000099097A (ja) 信号再生装置及び方法、音声信号再生装置、並びに、音声信号の速度変換方法
JP3357742B2 (ja) 話速変換装置
JP4212253B2 (ja) 話速変換装置
JP2867744B2 (ja) 音声再生装置
JP2001222300A (ja) 音声再生装置および記録媒体
JPH09146587A (ja) 話速変換装置
JPH08292796A (ja) 再生装置
JP3412209B2 (ja) 音響信号処理装置
JP3189597B2 (ja) 音声時間軸変換装置
JP2008145841A (ja) 再生装置、再生方法、信号処理装置、信号処理方法
JPH0854895A (ja) 再生装置