JP2013148654A - 話速変換装置、そのプログラムおよびプログラムを記録した記録媒体 - Google Patents
話速変換装置、そのプログラムおよびプログラムを記録した記録媒体 Download PDFInfo
- Publication number
- JP2013148654A JP2013148654A JP2012008073A JP2012008073A JP2013148654A JP 2013148654 A JP2013148654 A JP 2013148654A JP 2012008073 A JP2012008073 A JP 2012008073A JP 2012008073 A JP2012008073 A JP 2012008073A JP 2013148654 A JP2013148654 A JP 2013148654A
- Authority
- JP
- Japan
- Prior art keywords
- section
- voice
- deletion
- speech
- audio content
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000006243 chemical reaction Methods 0.000 title claims abstract description 89
- 238000012217 deletion Methods 0.000 claims description 229
- 230000037430 deletion Effects 0.000 claims description 229
- 238000001514 detection method Methods 0.000 claims description 12
- 239000000284 extract Substances 0.000 claims description 10
- 238000000605 extraction Methods 0.000 description 39
- 238000000034 method Methods 0.000 description 25
- 230000008602 contraction Effects 0.000 description 23
- 238000004458 analytical method Methods 0.000 description 22
- 230000005236 sound signal Effects 0.000 description 12
- 238000009499 grossing Methods 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 5
- 238000007796 conventional method Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000005311 autocorrelation function Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000007429 general method Methods 0.000 description 2
- 238000004904 shortening Methods 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
Images
Landscapes
- Telephone Function (AREA)
Abstract
【解決手段】話速変換装置1は、音声コンテンツの時刻ごとの音響特徴量と、音声区間および非音声区間を時刻に対応付けて記憶する記憶手段20と、非音声区間の直前の音声区間において、当該音声区間の終了時刻から遡って、音響特徴量との変化が予め定めた基準よりも少ない区間を、音声コンテンツの削除区間として探索する削除区間探索手段30と、探索された複数の削除区間を除いた音声コンテンツの出力時間長が、元の音声コンテンツの時間長に対する指定された再生倍率の出力時間長となるように、削除区間を除いた音声コンテンツを伸縮させて出力する出力時間長調整手段40と、を備えることを特徴とする。
【選択図】図1
Description
この手法は、再生倍率に従って、音声波形を線形に伸縮させるものである。また、音声波形を伸縮させる際に、アナログ音声信号のように音程の変化を生じさせることなく、原音声の高さ(ピッチ)を保ちながら時間短縮を行う手法が、特許文献に開示されている(例えば、特許文献1参照)。
そこで、このような再生速度を上げても聞き取り易くする手法として、音声信号内の無音区間を一部削除して、その時間を音声の再生時間に割り当てる手法が提案されている(例えば、特許文献2参照)。
この手法は、音声信号をリングメモリに書き込み、読み出し時に1倍速の再生タイミングで音声信号を再生し、対応する映像信号をn倍速で再生する。このとき、この手法は、リングメモリの容量以内の音声信号については1倍速で再生するが、容量を超えた音声信号については削除している。
一方、人が目視で文章を読む場合、いわゆる斜め読みを行うことで、文章を3倍速で音声再生する場合よりも、さらに早く文章の内容を把握することができる。特に、視覚障害者からは、少なくとも斜め読みと同程度の速さで、音声コンテンツを高速に聞きたいという要望がある。
また、前記した特許文献3の手法では、リングバッファを超過する音声信号を無条件に削除してしまう。そのため、この手法では、重要な意味内容を持つ音声が音声信号から削除されてしまうことがあり、内容を把握することが困難であるという問題がある。
また、話速変換装置は、区間情報検出手段によって、音声コンテンツにおいて、音声区間および非音声区間を検出し、時刻に対応付けて当該音声区間および当該非音声区間を区間情報記憶手段に書き込む。
これによって、本発明の話速変換装置は、音声区間と非音声区間を削除した分だけ、他の音声を割り当てる時間的余裕を確保することができる。そして、本発明の話速変換装置は、同じ再生速度で音声コンテンツを再生する場合、従来の話速変換よりも音声をゆっくり再生することになり、利用者は聞き易くなる。
本発明によれば、音声コンテンツの音声区間の一部を削除することで、音声コンテンツを高速に再生することができる。これによって、利用者は、文章を斜め読みするかのように、音声コンテンツを部分的に高速に聞くことができる。また、本発明によれば、音声区間を削除した分だけ、他の音声を割り当てる時間的余裕を確保することができる。そのため、本発明は、同じ再生速度で音声コンテンツを再生する場合、従来の話速変換よりも音声をゆっくり再生することになり、利用者は聞き易くなる。
[話速変換装置の構成]
まず、図1を参照して、本発明の実施形態に係る話速変換装置1の構成について説明する。この話速変換装置1は、音声コンテンツ(音声信号)を1倍速再生よりも高速に再生する際に、無音等の非音声区間のみならず、音声区間を部分的に削除して、話速変換を行うものである。すなわち、話速変換装置1は、人が活字で表された文章を目視で斜め読みするかのように、音声コンテンツを部分再生するものである。
なお、話速変換装置1は、一連の発話のかたまりである、吸気で区切られた呼気段落の終了部分において、音響特徴量の変化が少なくなった箇所を削除することで、発話の意味内容の欠落を極力防止する。
ここでは、話速変換装置1は、音響分析手段10と、記憶手段20と、削除区間探索手段30と、出力時間長調整手段40と、を備えている。
ここでは、音響分析手段10は、パワー抽出手段11と、ピッチ抽出手段12と、音声区間検出手段13と、を備えている。
例えば、音声区間検出手段13は、パワー抽出手段11で抽出されたパワーが、予め定めた閾値よりも大きい場合に当該時間区間を音声区間と判別し、それ以外を非音声区間とする。なお、この閾値は、音声信号のレベルに応じて適応的に変化させてもよく、特開平10−301593号公報に記載された手法を用いることとしてもよい。
この記憶手段20に記憶される音響特徴情報および区間情報は、削除区間探索手段30によって参照され、音声コンテンツの削除区間を探索する際に用いられる。
この記憶手段20に記憶される音声コンテンツ、区間情報および削除区間情報は、出力時間長調整手段40によって参照され、部分的に削除した音声コンテンツの出力時間長を調整する際に用いられる。
この削除区間探索手段30は、削除条件により、非音声区間において、予め定めた時間長以上の区間を削除区間とする。また、削除区間探索手段30は、削除条件により、音声区間において、音声区間の終了時刻から遡って、音響特徴量の変化が予め定めた基準よりも少ない区間を、音声コンテンツの削除区間とする。この削除条件については、後で詳細に説明する。
この削除区間探索手段30は、削除すべき区間を示す削除区間情報を記憶手段20に書き込み、削除区間を探索し終わった旨を出力時間長調整手段40に通知する。
ここでは、削除区間探索手段30は、非音声区間探索手段31と、非音声区間部分削除手段32と、音声削除区間探索手段33と、音声区間部分削除手段34と、を備えている。
この非音声区間探索手段31は、区間情報として記憶されている開始時刻と終了時刻との差が、削除条件として予め定められた時間長よりも長い非音声区間を探索する。この予め定めた時間長は、呼気段落内の短い非音声区間を削除対象とすることを除外するための時間長であって、例えば、300msとする。
この非音声区間探索手段31は、探索した対象非音声区間の識別情報(シリアル番号)を、非音声区間部分削除手段32と、音声削除区間探索手段33とに出力する。
このように、非音声区間探索手段31で探索された対象非音声区間の直前の音声区間を探索対象とすることで、呼気段落の途中で音声が削除されてしまうことを防止することができる。
ここでは、音声削除区間探索手段33は、パワー参照探索手段331と、ピッチ参照探索手段332と、削除区間決定手段333と、を備えている。
このパワー参照探索手段331は、音声区間における削除区間の開始時刻(パワー参照削除開始時刻)を削除区間決定手段333に出力する。
なお、パワー参照探索手段331が探索する削除区間の例については、後でさらに具体的に説明する。
このピッチ参照探索手段332は、音声区間における削除区間の開始時刻(ピッチ参照削除開始時刻)を削除区間決定手段333に出力する。
なお、ピッチ参照探索手段332が探索する削除区間の例については、後でさらに具体的に説明する。
なお、ここでは、削除区間決定手段333は、パワーとピッチとの重み(比率)に応じて、削除区間を決定したが、パワー参照削除開始時刻またはピッチ参照削除開始時刻の早い方の時間区間を当該音声区間における削除区間としてもよいし、パワー参照削除開始時刻またはピッチ参照削除開始時刻の遅い方の時間区間を当該音声区間における削除区間としてもよい。
すなわち、音声区間部分削除手段34は、記憶手段20に記憶されている区間情報の対応する音声区間の終了時刻を、音声削除区間探索手段33で探索された削除区間の開始時刻の直前の時刻に設定し、新たな区間情報(削除区間情報)として記憶手段20に書き込む。
まず、図2を参照して、非音声区間において削除する区間について説明する。
図2に示すように、削除区間探索手段30は、区間長が予め定めた時間長以上の非音声区間(無音区間を含む)を対象非音声区間Seg1とし、予め定めた最低限残す時間長leaveS1だけを残して、残りの区間を削除区間とする。例えば、対象非音声区間Seg1の時間長は300ms以上とし、最低限残す時間長leaveS1は100msとする。
これによって、対象非音声区間Seg1の開始時刻t1sから、leaveS1の時間長分の非音声区間が削除されずに残されることになる。
次に、図3を参照して、音声区間において削除する区間について説明する。なお、部分的に削除する対象となる音声区間は、図2で説明した対象非音声区間Seg1の直前の音声区間(対象音声区間Seg2)である。この対象音声区間Seg2は、予め定めた最低限残す時間長leaveS2よりも長い区間とする。
まず、パワー参照探索手段331が、対象音声区間Seg2において、パワーを参照して、削除区間を探索する条件について説明する。なお、以下の条件を満たす場合であっても、最大削除時間長cutMax、最低限残す時間長leaveS2によって、探索時刻が制限を受けることは前記したとおりである。
例1として、パワー参照探索手段331は、対象非音声区間Seg1の開始時刻t1sにおけるパワー値(時刻t1sにおけるスムージング波形の瞬時値)をPWBASE、探索時点におけるパワー値(探索時刻におけるスムージング波形の瞬時値)をPWNOWとしたとき、以下の(2)式の条件を満たす間、探索を続ける。
パワー参照探索手段331は、この条件を満たさなくなった探索時刻を、探索最終時刻tstopとする。
この例1によれば、音声区間の終端部分のパワーと、非音声区間の先頭のパワーとを比較して、その差が小さいことを条件に、削除する区間を特定する。
例2として、パワー参照探索手段331は、対象非音声区間Seg1の開始時刻t1sにおけるパワー値(時刻t1sにおけるスムージング波形の瞬時値)をPWBASE、探索時点におけるパワー値(探索時刻におけるスムージング波形の瞬時値)をPWNOW、対象音声区間Seg2におけるパワー値の最大値をPWMAX、最小値をPWMINとしたとき、以下の(3)式の条件を満たす間、探索を続ける。
パワー参照探索手段331は、この条件を満たさなくなった探索時刻を、探索最終時刻tstopとする。
この例2によれば、音声区間の終端部分のパワーが、非音声区間の先頭のパワーと比較して、その差が小さいことを条件とする点においては、例1と同じである。しかし、その差が発話者によって異なることに鑑み、音声区間内のパワーに応じて閾値を変化させることとした。これによって、音声コンテンツにおいて発話者が変化する場合であっても、適宜最適な削除区間を特定することができる。
次に、ピッチ参照探索手段332が、対象音声区間Seg2において、ピッチを参照して、削除区間を探索する条件について説明する。
ピッチ参照探索手段332は、対象非音声区間Seg1の開始時刻t1sにおけるピッチ値(時刻t1sにおけるピッチ波形のスムージング周波数)をPTBASE、探索時点におけるピッチ値(探索時刻におけるピッチ波形のスムージング周波数)をPTNOWとしたとき、以下の(4)式の条件を満たす間、探索を続ける。
ピッチ参照探索手段332は、この条件を満たさなくなった探索時刻を、探索最終時刻tstopとする。
この例によれば、音声区間の終端部分のピッチが、非音声区間の先頭のピッチの所定倍数よりも小さいことを条件に、削除する区間を特定する。
なお、この条件を満たす場合であっても、最大削除時間長cutMax、最低限残す時間長leaveS2によって、探索時刻が制限を受けることは前記したとおりである。
図1に戻って、話速変換装置1の構成について説明を続ける。
なお、音声コンテンツを高速再生する場合、基本的には、伸縮率算出手段41は、音声区間を短くする方向に伸縮率を算出することになる。しかし、再生倍率が小さく、また、音声区間内の削除区間が長い場合、伸縮率算出手段41は、残った音声区間を伸ばす方向に伸縮率を算出する場合もあり得る。
また、出力時間長変更手段42は、削除区間が定められていない音声区間については、そのまま音声区間分の音声データを記憶手段20から読み出して、伸縮率算出手段41で算出された伸縮率で時間長を変更する。
また、出力時間長変更手段42は、削除区間が定められていない非音声区間については、非音声区間分の音声データ(非音声データ)を記憶手段20から読み出し、伸縮を行わずにそのまま出力する。
図4(a)は、話速変換前の音声コンテンツのデータを示し、音声区間と非音声区間とが含まれた状態を示している。なお、非音声区間は、所定時間長以上の削除の対象となる対象非音声区間とする。また、音声区間には、非音声区間の前に音響特徴量の変化が少ない区間Bが含まれていることとする。
すなわち、話速変換装置1は、音響分析手段10によって、音声コンテンツを音響分析することで、音声区間や非音声区間(無音区間を含む)の区間情報や、区間A,Bを特定ためのパワーやピッチ等の音響特徴情報を生成する。
すなわち、話速変換装置1は、出力時間長調整手段40によって、音声コンテンツから削除区間D1,D2を削除して、総時間長が、図4(a)の音声コンテンツに対して3倍速となるように、音声区間の出力時間長を調整する。ここでは、図4(a)の音声コンテンツの音声区間のうちで区間Aのみが、(c)の区間A1に変換されたことを示している。
以上、話速変換装置1の構成について説明したが、この話速変換装置1は、一般的なコンピュータを前記した各手段として機能させるプログラム(話速変換プログラム)により動作させることができる。また、このプログラムは、コンピュータで読み取り可能なCD−ROM等の記録媒体に記録して配布することもできる。
また、話速変換装置1は、従来と同じ再生速度で再生する場合であっても、再生音声に割り当てる時間が相対的に長いため、従来よりも聞き取り易い音声コンテンツに変換することができる。
次に、図5を参照(構成については適宜図1参照)して、話速変換装置1の動作について説明する。
まず、話速変換装置1は、音響分析手段10によって、入力された音声コンテンツについて、音響分析を行う(ステップS1)。すなわち、話速変換装置1は、音響分析手段10のパワー抽出手段11によって、音響特徴量の一つであるパワー(音の強さ、大きさ)を抽出し、ピッチ抽出手段12によって、ピッチ(音の高さ)を抽出する。さらに、話速変換装置1は、音響分析手段10の音声区間検出手段13によって、音声コンテンツから、音声を含んだ音声区間や、音声を含まない非音声区間(無音区間を含む)を検出する。これらの音響特徴量や区間情報は、記憶手段20に記憶される。また、入力された音声コンテンツも記憶手段20に記憶される。
そして、話速変換装置1は、区間情報において、対象非音声区間をすべて探索していない場合(ステップS6でNo)、ステップS2に戻って、次の対象非音声区間を探索する。
以上の動作によって、話速変換装置1は、音声区間においても音声データを削除することで、高速に再生可能な音声コンテンツを出力することができる。
例えば、ここでは、話速変換装置1が音響分析手段10を備える構成としたが、予め外部の分析装置において、音声コンテンツに対応したデータ(音響特徴情報、区間情報)が分析されているのであれば、そのデータのみを入力し、記憶手段20に記憶する形態でも構わない。
その場合、音声削除区間探索手段33は、記憶手段20に記憶されている音響特徴を順次スムージングし、時刻ごとの瞬時値を用いて削除区間を探索することとすればよい。
例えば、図6の話速変換装置1Bの構成として示すように、話速変換装置1(図1)の構成から、パワー抽出手段11、パワー参照探索手段331および削除区間決定手段333を省略して構成することで、音響特徴としてピッチのみを用いて話速変換を行うこととしてもよい。
10 音響分析主手段
11 パワー抽出手段(音響特徴量抽出手段)
12 ピッチ抽出手段(音響特徴量抽出手段)
13 音声区間検出手段(区間情報検出手段)
20 記憶手段
(音声コンテンツ記憶手段、音響特徴量記憶手段、区間情報記憶手段)
30 削除区間探索手段
31 非音声区間探索手段
32 非音声区間部分削除手段
33 音声削除区間探索手段
331 パワー参照探索手段
332 ピッチ参照探索手段
333 削除区間決定手段
34 音声区間部分削除手段
40 出力時間長調整手段
41 伸縮率算出手段
42 出力時間長変更手段
Claims (9)
- 音声コンテンツを部分的に削除し、指定された再生倍率で再生させる話速変換装置であって、
前記音声コンテンツを予め記憶する音声コンテンツ記憶手段と、
前記音声コンテンツの時刻ごとの音響特徴量を、当該時刻に対応付けて予め記憶する音響特徴量記憶手段と、
前記音声コンテンツの音声区間および非音声区間を前記音声コンテンツの時刻に対応付けて予め記憶する区間情報記憶手段と、
前記非音声区間の直前の音声区間において、当該音声区間の終了時刻から遡って、音響特徴量の変化が予め定めた基準よりも少ない区間を、前記音声コンテンツの削除区間として探索する削除区間探索手段と、
この削除区間探索手段で探索された複数の削除区間を除いた音声コンテンツの出力時間長が、元の音声コンテンツの時間長に対する前記指定された再生倍率の出力時間長となるように、前記削除区間を除いた音声コンテンツを伸縮させて出力する出力時間長調整手段と、
を備えることを特徴とする話速変換装置。 - 前記音声コンテンツから音響特徴量を抽出し、時刻に対応付けて前記音響特徴量記憶手段に書き込む音響特徴量抽出手段と、
前記音声コンテンツにおいて、音声区間および非音声区間を検出し、時刻に対応付けて当該音声区間および当該非音声区間を前記区間情報記憶手段に書き込む区間情報検出手段と、
をさらに備えることを特徴とする請求項1に記載の話速変換装置。 - 前記音響特徴量は、声の高さを示すピッチおよび声の大きさを示すパワーであって、
前記削除区間探索手段は、
前記音声区間の終了時刻から遡って、ピッチの変化が予め定めた基準よりも少ない区間を、前記削除区間として探索するピッチ参照探索手段と、
前記音声区間の終了時刻から遡って、パワーの変化が予め定めた基準よりも少ない区間を、前記削除区間として探索するパワー参照探索手段と、
前記ピッチ参照探索手段で探索された削除区間と前記パワー参照探索手段で探索された削除区間とから、予め定めたピッチおよびパワーの重みの比率に応じて、前記音声区間における削除区間を決定する削除区間決定手段と、
を備えることを特徴とする請求項1または請求項2に記載の話速変換装置。 - 前記音響特徴量は、声の高さを示すピッチであって、
前記削除区間探索手段は、
前記音声区間の終了時刻から遡って、ピッチの変化が予め定めた基準よりも少ない区間を、前記削除区間として探索するピッチ参照探索手段、
を備えることを特徴とする請求項1または請求項2に記載の話速変換装置。 - 前記音響特徴量は、声の大きさを示すパワーであって、
前記削除区間探索手段は、
前記音声区間の終了時刻から遡って、パワーの変化が予め定めた基準よりも少ない区間を、前記削除区間として探索するパワー参照探索手段、
を備えることを特徴とする請求項1または請求項2に記載の話速変換装置。 - 前記削除区間探索手段は、前記音声区間の終了時刻から遡って前記削除区間を探索する時刻が、当該音声区間の開始時刻から予め定めた時刻を越えず、かつ、探索する削除区間の時間長が予め定めた最大時間長を超えない範囲とすることを特徴とする請求項1または請求項2に記載の話速変換装置。
- 前記削除区間探索手段は、予め定めた時間長以上の非音声区間において、当該時間長より短い予め定めた時間長を残した他の区間を、さらに前記音声コンテンツの削除区間とすることを特徴とする請求項1または請求項2に記載の話速変換装置。
- 音声コンテンツを部分的に削除し、指定された再生倍率で再生させるために、前記音声コンテンツを記憶する音声コンテンツ記憶手段と、前記音声コンテンツの時刻ごとの音響特徴量を、当該時刻に対応付けて記憶する音響特徴量記憶手段と、前記音声コンテンツの音声区間および非音声区間を前記音声コンテンツの時刻に対応付けて記憶する区間情報記憶手段とを備えた話速変換装置のコンピュータを、
前記非音声区間の直前の音声区間において、当該音声区間の終了時刻から遡って、音響特徴量の変化が予め定めた基準よりも少ない区間を、前記音声コンテンツの削除区間として探索する削除区間探索手段、
この削除区間探索手段で探索された複数の削除区間を除いた音声コンテンツの出力時間長が、元の音声コンテンツの時間長に対する前記指定された再生倍率の出力時間長となるように、前記削除区間を除いた音声コンテンツを伸縮させて出力する出力時間長調整手段、
として機能させるための話速変換プログラム。 - 音声コンテンツを部分的に削除し、指定された再生倍率で再生させるために、前記音声コンテンツを記憶する音声コンテンツ記憶手段と、前記音声コンテンツの時刻ごとの音響特徴量を、当該時刻に対応付けて記憶する音響特徴量記憶手段と、前記音声コンテンツの音声区間および非音声区間を前記音声コンテンツの時刻に対応付けて記憶する区間情報記憶手段とを備えた話速変換装置のコンピュータを、
前記非音声区間の直前の音声区間において、当該音声区間の終了時刻から遡って、音響特徴量の変化が予め定めた基準よりも少ない区間を、前記音声コンテンツの削除区間として探索する削除区間探索手段、
この削除区間探索手段で探索された複数の削除区間を除いた音声コンテンツの出力時間長が、元の音声コンテンツの時間長に対する前記指定された再生倍率の出力時間長となるように、前記削除区間を除いた音声コンテンツを伸縮させて出力する出力時間長調整手段、
として機能させるための話速変換プログラムを記録したコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012008073A JP5863472B2 (ja) | 2012-01-18 | 2012-01-18 | 話速変換装置およびそのプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012008073A JP5863472B2 (ja) | 2012-01-18 | 2012-01-18 | 話速変換装置およびそのプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013148654A true JP2013148654A (ja) | 2013-08-01 |
JP5863472B2 JP5863472B2 (ja) | 2016-02-16 |
Family
ID=49046231
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012008073A Active JP5863472B2 (ja) | 2012-01-18 | 2012-01-18 | 話速変換装置およびそのプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5863472B2 (ja) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08292790A (ja) * | 1995-04-20 | 1996-11-05 | Sanyo Electric Co Ltd | ビデオテープレコーダ |
JP2000099099A (ja) * | 1998-09-22 | 2000-04-07 | Sharp Corp | データ再生装置 |
JP2000099097A (ja) * | 1998-09-24 | 2000-04-07 | Sony Corp | 信号再生装置及び方法、音声信号再生装置、並びに、音声信号の速度変換方法 |
JP2002258900A (ja) * | 2001-02-28 | 2002-09-11 | Toshiba Corp | 音声再生装置及び音声再生方法 |
WO2006077626A1 (ja) * | 2005-01-18 | 2006-07-27 | Fujitsu Limited | 話速変換方法及び話速変換装置 |
JP2010191415A (ja) * | 1999-08-24 | 2010-09-02 | Sony Corp | 音声再生方法および音声再生装置 |
-
2012
- 2012-01-18 JP JP2012008073A patent/JP5863472B2/ja active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08292790A (ja) * | 1995-04-20 | 1996-11-05 | Sanyo Electric Co Ltd | ビデオテープレコーダ |
JP2000099099A (ja) * | 1998-09-22 | 2000-04-07 | Sharp Corp | データ再生装置 |
JP2000099097A (ja) * | 1998-09-24 | 2000-04-07 | Sony Corp | 信号再生装置及び方法、音声信号再生装置、並びに、音声信号の速度変換方法 |
JP2010191415A (ja) * | 1999-08-24 | 2010-09-02 | Sony Corp | 音声再生方法および音声再生装置 |
JP2002258900A (ja) * | 2001-02-28 | 2002-09-11 | Toshiba Corp | 音声再生装置及び音声再生方法 |
WO2006077626A1 (ja) * | 2005-01-18 | 2006-07-27 | Fujitsu Limited | 話速変換方法及び話速変換装置 |
Also Published As
Publication number | Publication date |
---|---|
JP5863472B2 (ja) | 2016-02-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4558308B2 (ja) | 音声認識システム、データ処理装置、そのデータ処理方法及びプログラム | |
JP5593244B2 (ja) | 話速変換倍率決定装置、話速変換装置、プログラム、及び記録媒体 | |
US20100298959A1 (en) | Speech reproducing method, speech reproducing device, and computer program | |
WO2016063879A1 (ja) | 音声合成装置および方法 | |
JP2014240940A (ja) | 書き起こし支援装置、方法、及びプログラム | |
JP2017021125A (ja) | 音声対話装置 | |
JP5638479B2 (ja) | 書き起こし支援システムおよび書き起こし支援方法 | |
JP2013072903A (ja) | 合成辞書作成装置および合成辞書作成方法 | |
JP6747318B2 (ja) | 対話装置 | |
JP3881620B2 (ja) | 話速可変装置及び話速変換方法 | |
JP5223843B2 (ja) | 情報処理装置およびプログラム | |
JP5863472B2 (ja) | 話速変換装置およびそのプログラム | |
JP2009075280A (ja) | コンテンツ再生装置 | |
JP6526602B2 (ja) | 音声認識装置、その方法、及びプログラム | |
JP5412204B2 (ja) | 適応的な話速変換装置及びプログラム | |
JP4130927B2 (ja) | 音響再生装置 | |
JP6409163B2 (ja) | 音声処理装置、音声処理プログラムおよび音声処理方法 | |
JP6251219B2 (ja) | 合成辞書作成装置、合成辞書作成方法および合成辞書作成プログラム | |
JPH09138698A (ja) | 音声記録再生装置 | |
JP6062665B2 (ja) | 音声のピッチ周期を抽出する信号処理装置及びプログラム | |
JP4313724B2 (ja) | 音声再生速度調節方法、音声再生速度調節プログラム、およびこれを格納した記録媒体 | |
JP5956936B2 (ja) | 音声データ再生速度変換方法および音声データ再生速度変換装置 | |
JP2019032400A (ja) | 発話判定プログラム、発話判定方法、及び発話判定装置 | |
JP2006154531A (ja) | 音声速度変換装置、音声速度変換方法、および音声速度変換プログラム | |
JP2008145841A (ja) | 再生装置、再生方法、信号処理装置、信号処理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20140326 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140818 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150417 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150428 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150525 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20151124 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20151222 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5863472 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |