JP2006317768A - 話速変換装置、及びこの話速変換装置を制御する話速変換プログラム - Google Patents

話速変換装置、及びこの話速変換装置を制御する話速変換プログラム Download PDF

Info

Publication number
JP2006317768A
JP2006317768A JP2005141147A JP2005141147A JP2006317768A JP 2006317768 A JP2006317768 A JP 2006317768A JP 2005141147 A JP2005141147 A JP 2005141147A JP 2005141147 A JP2005141147 A JP 2005141147A JP 2006317768 A JP2006317768 A JP 2006317768A
Authority
JP
Japan
Prior art keywords
speech
speech speed
speed
data
partial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005141147A
Other languages
English (en)
Inventor
Yuichiro Aso
裕一郎 麻生
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2005141147A priority Critical patent/JP2006317768A/ja
Publication of JP2006317768A publication Critical patent/JP2006317768A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Telephone Function (AREA)

Abstract

【課題】 話速が途中で変化する音声データに対して、聞き取りやすい話速に変化させることのできる話速変換装置を提供する。
【解決手段】 話速変換装置は、変換する音声データを、所定量毎にバッファリングする(S201)。このバッファリングした所定量の音声データに対して、音節数をカウントする等により話速を測定し(S202)、この話速と、ユーザの設定した所望の話速とを比較して(S203)、バッファに格納された音声データの話速変換処理を行う(S204)。この音声データがまだ終了していなければ(S205のNo)、さらなる音声データのバッファリングを行うべく、S201の処理へ戻る。
【選択図】 図2

Description

本発明は、音声データの再生速度を変換するために用いられる話速変換装置と、この話速変換装置を制御する話速変換プログラムに関する。
テープレコーダ等のオーディオや映像機器において、再生時に早送りをすると、その速度に比例して再生音の周波数が高くなり、音声の聞き取りが困難となる。また、再生速度を遅くした場合にも、再生音の周波数が低くなって同様に聞き取りが困難となる。近年このような課題に対し、再生速度を変化させたとしても、音声の周波数を変化させずに、話し方をゆっくりとしたり、早口としたりするのみで自然に聞こえる話速変換手法が考えられている。
さらに、このような話速変換手法を使用し、ユーザの望む話速で話速変換を行うことが考えられている(例えば、特許文献1参照)。特許文献1では、再生音声の単位時間当たりの単語数を、ユーザの望む値とすることのできる装置が記載されている。
特開平11−007295号公報
しかしながら特許文献1は、音声データ全体の速度をユーザの設定した話速に変化させるものであり、音声データの途中で話速が変化する場合については考慮されていない。例えばお年寄りが複数のパーソナリティが出演するラジオ番組を所定の聞き取りやすい話速で聴きたいと思う場合や、複数の参加者が参加する会議を録音し、これを所定の話速で再生して議事録を作成するような場合には、通常其々の発言者によって話速が異なるため、音声データ全体に対して一律に話速を変化させるような手法は適当ではない。
また、特許文献1記載の手法は、予め音声データの単位時間当たりの再生速度がわかっているものについてしか考慮されていないが、通常の音声データは、単位時間当たりの再生速度や、その音声データに含まれる単語数等を知ることはできない。
そこで本発明は、話速が途中で変化する音声データに対して、聞き取りやすい話速に変化させることのできる話速変換装置を提供することを目的とする。
上記目的を達成するために、本発明の話速変換装置は、周波数の変化を抑制しつつ音声の再生速度を変換する機能を有する話速変換装置において、前記話速変換装置で話速を変換する音声データの一部である部分音声データを記憶する記憶手段と、前記記憶手段により記憶された前記部分音声データの話速を算出する話速算出手段と、前記話速算出手段により算出された前記部分音声データの話速、及び予め定められた所定の希望話速を比較する話速比較手段と、前記話速比較手段による比較結果に基づき、前記部分音声データの話速を前記希望話速に変換する話速変換手段とを備えることを特徴とする。
本発明の話速変換プログラムは、周波数の変化を抑制しつつ音声の再生速度を変換する機能を有する話速変換装置を制御する話速変換プログラムにおいて、前記話速変換プログラムで話速を変換する音声データの一部である部分音声データをバッファに格納する記憶機能と、前記バッファに格納された前記部分音声データの話速を算出する話速算出機能と、前記話速算出機能により算出された前記部分音声データの話速、及び予め定められた所定の希望話速を比較する話速比較機能と、前記話速比較機能による比較結果に基づき、前記部分音声データの話速を前記希望話速に変換する話速変換機能とを備えることを特徴とする。
本発明によれば、話速が途中で変化する音声データに対して、聞き取りやすい話速に変化させることのできる話速変換装置を提供することを目的とする。
以下、本発明の話速変換装置及び話速変換プログラムについて、図面を参照しながら説明する。
図1は、本発明の実施例に係る話速変換装置の構成を示す図である。話速変換装置1は、ラジオチューナ101と、記憶媒体102と、ラジオチューナ101から受信する音声データ若しくは記憶媒体102に格納された音声データの話速を変換する制御部103と、音声データを一時的に格納するバッファ104と、ユーザが好みの話速を設定する話速設定部105と、話速を変換した音声を出力するスピーカ106とを備える。
ラジオチューナ101は、放送局からラジオ放送を受信し、デジタル音声データを出力する機能を有する。記憶媒体102は、より具体的にはDVD(Digital Versatile Disk)やCD(Compact Disc)、HDD(Hard Disk Drive)等であり、音声データ102aを格納している。ラジオチューナ101及び記憶媒体102は、其々制御部103に対して、話速を変換する対象である音声データを出力する。以下の説明では、ラジオチューナ101から出力された音声データを制御部103で変換する場合を例に説明を行う。
制御部103は、ラジオチューナ101からの音声データの話速を変換する。制御部103は、ラジオチューナ101から所定量のデータをバッファ104に読み込んで話速を算出する話速算出部21と、話速算出部21で算出された話速とユーザの設定した話速とを比較する話速調節部22と、話速調節部22での比較結果に基づき、音声データの話速を変換する話速変換部23とを備える。
話速算出部21は、ラジオチューナ101から出力される音声データを所定時間毎にバッファ104に読み込み、このバッファ104に保存された音声データを解析してこの中に含まれる音節数を数える。
話速調節部22は、ユーザが話速設定部105で設定した話速に対応する音節数と、話速算出部21で算出した、バッファ104内に格納した音声データの音節数とを比較し、話速変換部23で話速を変換する際に必要な話速比率等の速度パラメータを決定する。話速変換部23は、話速調節部22で決定した速度パラメータに基づいて、バッファ104内の音声データの話速を変換し、変換後の音声データをスピーカ106から出力する。
話速設定部105は、ユーザが話速を設定するためのつまみやスライダである。ユーザは、例えば、サンプル音声を流しながら、このつまみやスライダを使用して、所望の話速を設定する。
次に、ラジオチューナ101から入力された音声データの話速変換処理の流れについて説明する。図2は、制御部103の処理の流れを示すフローチャートである。
まず、話速算出部21は、ラジオチューナ101から出力される音声データを、所定量バッファ104に格納する(S201)。このときバッファ104にバッファリングする時間は任意であるが、長期間バッファリングを行うと話速を変化させる際の応答性が悪くなるので、あまり長すぎない方が好ましい。
バッファ104に読み込んだ音声データが予め定められた所定量に達すれば、バッファ104に格納された音声データ内に含まれる音節数をカウントする(S202)。これにより、単位時間(即ちバッファ104でバッファリングを行う時間)に対する音節数がわかるので、これが話速に相当するものとみなす。
さらに、話速調節部22は、話速算出部21で算出された話速を、ユーザが話速設定部105で設定した話速と比較して、話速を変換する際に必要となる話速比率等の速度パラメータを決定する(S203)。話速変換部23は、話速調節部22で決定された速度パラメータに従って、バッファ104内に格納された音声データの話速を変更した後、これをスピーカ106から出力する(S204)。
さらに、話速算出部21は、ラジオチューナ101からまだ音声データが入力されているか否かを判断し(S205)、音声データがまだラジオチューナ101から入力されていれば(S205のNo)、S201の処理へ戻る。音声データの入力が終了していれば(S205のYes)、話速変換処理を終える。
以上説明したように、本実施例によれば、ラジオチューナ101から入力される、若しくは記憶媒体102に格納される音声データを、所定量毎に区切って読出し、この所定量の音声データに対する話速を算出して話速を変換する。これにより、たとえばラジオチューナ101から受信するラジオ番組が、話速の異なる複数人によるものである場合であっても、ラジオ番組全体を通して、ユーザにとって聞き取りやすい話速に変換することができる。
本実施例の話速変換装置1は、スピーカ106を有しているので、ユーザは音声を出力しながら話速設定部105で所望の話速を設定することができる。さらに、話速を変換後のデータを一度記憶媒体102に格納しなおすような場合と比して、記憶媒体の記憶容量を消費せずに済む。
本実施例では、ユーザが所望の話速を設定することができるので、其々のユーザが聞き取りやすい話速に設定することが可能となっている。
本実施例では、話速算出手段21は、バッファ104に格納された音声データを音節数という音声的特長により話速を算出している。これは、テキストデータに一度変換するような場合と比して処理が容易である。また現状では、テキストデータへの変換である音声認識はあまり精度が高くないので、このような音声的特徴のみに基づいた方が、認識精度が高くなる効果も見込める。また、他の音声的特長として、例えば音素等に基づいて話速を算出することも考えられる。
本実施例では、ラジオチューナ101からのラジオ放送を受信した音声データ若しくは記憶媒体102に予め格納された音声データを元に説明を行ったが、本実施形態に限定されるものではなく、例えばマイクロフォンからユーザが入力する音声データ等であることも考えられる。
また、他の実施形態として、入力された音声データをテキストデータに変換して話速を算出することが考えられる。この場合、話速変換装置1の構成は図1と同様な構成となるが、話速算出部21は、ラジオチューナ101から入力を受け、バッファ104に格納する音声データを順次テキストデータに変換する機能を有する。話速算出部21は、変換したテキストデータの例えば単語の個数を順次数えることにより、バッファ104に格納された音声データの話速を算出する。尚この場合、バッファ104でバッファリングするテキスト量が小さければ認識率が下がるため、バッファ104にバッファリングする時間は、ある程度長めの時間とすることが望ましい。尚言語的特長としては、単語数の他に、形態素数、文節数等を用いることも考えられる。
このような言語的特長に基づいて話速を算出する場合には、テキストの区切れに応じた話速を算出することとなるので、ユーザがより意味的に理解しやすい話速となる効果が見込める。また、ユーザは、話速設定部105において、1分間に何語の単語を話すスピードで、といった話速設定方法が可能となる。
本発明の実施例1に係る話速変換装置の構成を示す図。 本発明の実施例1に係る話速変換装置を制御する制御部の処理の流れを示す図。
符号の説明
1・・・話速変換装置
21・・・話速算出部
22・・・話速調節部
23・・・話速変換部
101・・・ラジオチューナ
102・・・記憶媒体
102a・・・音声データ
104・・・バッファ
105・・・話速設定部
106・・・スピーカ

Claims (8)

  1. 周波数の変化を抑制しつつ音声の再生速度を変換する機能を有する話速変換装置において、
    話速を変換する音声データの一部である部分音声データを記憶する記憶手段と、
    前記記憶手段により記憶された前記部分音声データの話速を算出する話速算出手段と、
    前記話速算出手段により算出された前記部分音声データの話速、及び予め定められた所定の希望話速を比較する話速比較手段と、
    前記話速比較手段による比較結果に基づき、前記部分音声データの話速を前記希望話速に変換する話速変換手段と
    を備えることを特徴とする話速変換装置。
  2. 請求項1記載の話速変換装置において、
    前記話速変換手段により話速が変換された前記音声データによる音声を出力する音声出力手段
    をさらに備えることを特徴とする話速変換装置。
  3. 請求項1記載の話速変換装置において、
    前記希望話速を設定する話速設定手段
    をさらに備えることを特徴とする話速変換装置。
  4. 前記話速算出手段は、前記部分音声データに含まれる音素数、音節数等の音声的特長に基づいて前記部分音声データの話速を算出すること
    を特徴とする請求項1記載の話速変換装置。
  5. 前記話速算出手段は、前記部分音声データを順次テキストデータに変換し、前記部分音声データに含まれる単語数、文節数等の言語的特長に基づいて話速を算出すること
    を特徴とする請求項1記載の話速変換装置。
  6. 周波数の変化を抑制しつつ音声の再生速度を変換する機能を有する話速変換装置を制御する話速変換プログラムにおいて、
    話速を変換する音声データの一部である部分音声データをバッファに格納する記憶機能と、
    前記バッファに格納された前記部分音声データの話速を算出する話速算出機能と、
    前記話速算出機能により算出された前記部分音声データの話速、及び予め定められた所定の希望話速を比較する話速比較機能と、
    前記話速比較機能による比較結果に基づき、前記部分音声データの話速を前記希望話速に変換する話速変換機能と
    を備えることを特徴とする話速変換プログラム。
  7. 前記話速算出機能は、前記部分音声データに含まれる音素数、音節数等の音声的特長に基づいて前記部分音声データの話速を算出すること
    を特徴とする請求項6記載の話速変換プログラム。
  8. 前記話速算出機能は、前記部分音声データを順次テキストデータに変換し、前記部分音声データに含まれる単語数、文節数等の言語的特徴に基づいて話速を算出すること
    を特徴とする請求項6記載の話速変換プログラム。
JP2005141147A 2005-05-13 2005-05-13 話速変換装置、及びこの話速変換装置を制御する話速変換プログラム Pending JP2006317768A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005141147A JP2006317768A (ja) 2005-05-13 2005-05-13 話速変換装置、及びこの話速変換装置を制御する話速変換プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005141147A JP2006317768A (ja) 2005-05-13 2005-05-13 話速変換装置、及びこの話速変換装置を制御する話速変換プログラム

Publications (1)

Publication Number Publication Date
JP2006317768A true JP2006317768A (ja) 2006-11-24

Family

ID=37538492

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005141147A Pending JP2006317768A (ja) 2005-05-13 2005-05-13 話速変換装置、及びこの話速変換装置を制御する話速変換プログラム

Country Status (1)

Country Link
JP (1) JP2006317768A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012146209A (ja) * 2011-01-13 2012-08-02 Nikon Corp 電子機器および電子機器の制御プログラム
JP2015172622A (ja) * 2014-03-11 2015-10-01 日本電気株式会社 音声出力装置および音声出力方法
JP2018173752A (ja) * 2017-03-31 2018-11-08 本田技研工業株式会社 会議システム、会議システム制御方法、およびプログラム
CN112599151A (zh) * 2020-12-07 2021-04-02 携程旅游信息技术(上海)有限公司 语速评估方法、系统、设备及存储介质

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012146209A (ja) * 2011-01-13 2012-08-02 Nikon Corp 電子機器および電子機器の制御プログラム
JP2015172622A (ja) * 2014-03-11 2015-10-01 日本電気株式会社 音声出力装置および音声出力方法
JP2018173752A (ja) * 2017-03-31 2018-11-08 本田技研工業株式会社 会議システム、会議システム制御方法、およびプログラム
US10741172B2 (en) 2017-03-31 2020-08-11 Honda Motor Co., Ltd. Conference system, conference system control method, and program
CN112599151A (zh) * 2020-12-07 2021-04-02 携程旅游信息技术(上海)有限公司 语速评估方法、系统、设备及存储介质

Similar Documents

Publication Publication Date Title
US8457322B2 (en) Information processing apparatus, information processing method, and program
EP1596389A2 (en) System and method for high-quality variable speed playback
US9336823B2 (en) Playing audio in trick-modes
CN101909191B (zh) 视频处理设备和视频处理方法
EP1483908B1 (en) Audio frequency scaling during video trick modes utilizing digital signal processing
JPH10260694A (ja) 話速変換装置、話速変換方法及び記録媒体
JP2006317768A (ja) 話速変換装置、及びこの話速変換装置を制御する話速変換プログラム
US20070192089A1 (en) Apparatus and method for reproducing audio data
JP2007114599A (ja) 外国語学習に用いる記憶媒体の録音再生方法及び記憶媒体並びにこの記憶媒体の再生装置
JP2009075280A (ja) コンテンツ再生装置
JP2007025039A (ja) 音声再生装置、音声録音再生装置、およびそれらの方法、記録媒体、集積回路
JP2006243128A (ja) 再生装置及び再生方法
JP3966814B2 (ja) 簡易再生方法とこの方法に利用可能な簡易再生装置、復号方法、復号装置
JP2005266571A (ja) 変速再生方法及び装置、並びにプログラム
CN115695902B (zh) 盲人无障碍电影音频处理方法、装置及存储介质
JPH0854895A (ja) 再生装置
JP4551734B2 (ja) 変速再生装置及び変速再生方法
JPH0883096A (ja) 音声時間軸変換装置
JP2007101772A (ja) 再生装置及び再生方法
JPH0764584A (ja) 音声情報の再生速度自動調整装置
JPH05303400A (ja) 音声再生装置と音声再生方法
JP2007101644A (ja) 音声再生装置
JP2005092021A (ja) 話速変換方法及び話速変換装置
JP2007184861A (ja) オーディオ再生装置
JPH08123483A (ja) 音声時間軸変換装置