JP2005221811A5 - - Google Patents

Download PDF

Info

Publication number
JP2005221811A5
JP2005221811A5 JP2004030325A JP2004030325A JP2005221811A5 JP 2005221811 A5 JP2005221811 A5 JP 2005221811A5 JP 2004030325 A JP2004030325 A JP 2004030325A JP 2004030325 A JP2004030325 A JP 2004030325A JP 2005221811 A5 JP2005221811 A5 JP 2005221811A5
Authority
JP
Japan
Prior art keywords
circuit
audio signal
pointer
opt
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004030325A
Other languages
English (en)
Other versions
JP4442239B2 (ja
JP2005221811A (ja
Filing date
Publication date
Application filed filed Critical
Priority to JP2004030325A priority Critical patent/JP4442239B2/ja
Priority claimed from JP2004030325A external-priority patent/JP4442239B2/ja
Publication of JP2005221811A publication Critical patent/JP2005221811A/ja
Publication of JP2005221811A5 publication Critical patent/JP2005221811A5/ja
Application granted granted Critical
Publication of JP4442239B2 publication Critical patent/JP4442239B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Claims (6)

  1. 音声信号セグメントとその音声信号セグメントに一部の重複を許して後続する音声信号セグメントとの類似度を求める類似度計算回路と、前記類似度計算回路が出力する類似度から類似度の高い値を検出する判定回路と、前記判定回路が類似度の高い値を検出した時の2つの音声信号セグメントのシフト時間およびディレイ時間に関するパラメータを記憶するパラメータ記憶回路と、漸減する窓関数と漸増する窓関数とを出力する窓関数発生回路と、前記パラメータ記憶回路に記憶されているパラメータに基づいた一方の音声信号セグメントに対して前記窓関数発生回路が出力する一方の窓関数を乗じる第1の乗算回路と、前記パラメータ記憶回路に記憶されているパラメータに基づいた他方の音声信号セグメントに対して前記窓関数発生回路が出力する他方の窓関数を乗じる第2の乗算回路と、前記第1の乗算回路の出力と前記第2の乗算回路の出力とを加算する加算回路と、所望の時間軸変換比になるように前記加算回路の出力の前端に連続する音声信号と前記加算回路の出力の後端に連続する音声信号の両方もしくは一方と加算回路の出力と切り替えて出力するスイッチ回路とを備えていることを特徴とする音声速度変換装置。
  2. 音声信号が記録されている記憶回路と、前記記憶回路にアドレス値を出力するポインタ制御回路と、前記記憶回路が出力する音声信号の出力先を第1のバッファメモリ回路と第2のバッファメモリ回路と第2のスイッチ回路とから選択する第1のスイッチ回路と、前記第1のスイッチ回路から出力される音声信号セグメントを蓄える第1のバッファメモリ回路と、前記第1のバッファメモリ回路の内容に一部の重複を許して後続し前記第1のスイッチ回路から出力される音声信号セグメントを蓄える第2のバッファメモリ回路と、前記第1のバッファメモリ回路の内容と前記第2のバッファメモリ回路の内容との類似度を求める類似度計算回路と、前記類似度計算回路が出力する類似度から類似度の高い値を検出する判定回路と、前記判定回路が類似度の高い値を検出した時に前記ポインタ制御回路が出力したアドレス値をポインタ値計算回路が求めるために用いた2つの音声信号セグメントのシフト時間およびディレイ時間に関するパラメータを記憶するパラメータ記憶回路と、前記記憶回路に記録されている音声信号を再生する時の時間軸変換比を設定する速度設定回路と、前記速度設定回路に設定されている時間軸変換比に基づいて前記類似度計算回路が類似度を求めるべき2つの音声信号セグメントのアドレス値を計算し、または前記パラメータ記憶回路に記録されているパラメータに基づいて類似度の高い2つの音声信号セグメントおよびその前後に連続する音声信号のアドレス値を計算して前記ポインタ制御回路に出力するポインタ値計算回路と、漸増する窓関数と漸減する窓関数とを出力する窓関数発生回路と、前記パラメータ記憶回路に記憶されているパラメータに基づいて前記記憶回路から出力され前記第1のバッファメモリ回路に蓄えられている音声信号セグメントに対して前記窓関数発生回路が出力する一方の窓関数を乗じる第1の乗算回路と、前記パラメータ記憶回路に記憶されているパラメータに基づいて前記記憶回路から出力され前記第2のバッファメモリ回路に蓄えられている音声信号セグメントに対して前記窓関数発生回路が出力する他方の窓関数を乗じる第2の乗算回路と、前記第1の乗算回路の出力と前記第2の乗算回路の出力とを加算する加算回路と、前記加算回路の出力と前記第1のスイッチ回路の出力とを選択する第2のスイッチ回路と、前記第2のスイッチ回路の出力を蓄えて出力する出力バッファ回路と、前記類似度計算回路が類似度を計算する時もしくは前記加算回路が前記第1の乗算回路の出力と前記第2の乗算回路の出力とを加算する時には前記第1のスイッチ回路を第1のバッファメモリ回路側もしくは第2のバッファメモリ回路側に倒し、前記加算回路の出力を前記出力バッファ回路に出力する時には前記第2のスイッチ回路を加算回路側に倒し、それ以外の時には前記加算回路の出力の前後と連続する音声信号を前記記憶回路から前記出力バッファ回路に出力するように前記第1のスイッチ回路と前記第2のスイッチ回路とを制御する制御信号発生回路とを備えていることを特徴とする音声速度変換装置。
  3. 開始点を基準として時間軸変換比αと音声信号セグメント長Tsとシフト時間の初期値Tc_minにより決められる一定の範囲内で、シフト時間Tcとディレイ時間Tdを変えながら切り出した2つの音声信号セグメント間の類似度を計算し、類似度の高い時のディレイ時間Td_optとシフト時間Tc_optを探索するステップと、
    開始点から時間長Td_optの音声信号を入力してそのまま出力するステップと、
    Tc_optとTd_optをパラメータとして音声信号セグメントX1(1〜Ts)と音声信号セグメントX2(1〜Ts)を入力し、漸増する窓関数W1(1〜Ts)と漸減する窓関数W2(1〜Ts)を用いて、音声信号セグメントX1と音声信号セグメントX2とを重み付け加算して出力するステップと、
    時間軸変換比αと音声信号セグメント長Tsと類似度の高いシフト時間Tc_optに基づいてそのまま出力する音声信号の時間長Ttを計算し、重み付け加算した音声信号に後続する時間長(Tt−Td_opt)の音声信号を入力してそのまま出力するステップと、
    次の処理のために開始点を設定するステップと、
    終了でなければ最初のステップに戻るステップと
    を有することを特徴とする音声速度変換方法。
  4. 時間軸変換比αを読み込むステップと、
    第1のポインタと第1のポインタのTs後の第2のポインタを設定するステップと、
    時間軸変換比αと音声信号セグメント長Tsとシフト時間の初期値Tc_minに基づいて最大ディレイ時間Td_maxを計算するステップと、
    類似度を初期設定するステップと、
    シフト時間Tcを初期値Tc_minからディレイ時間Tdと音声信号セグメント長Tsと時間軸変換比αにより決まる最大シフト時間Tc_maxの範囲で変え、ディレイ時間Tdを0から最大ディレイ時間Td_maxの範囲で変え、第1のポインタと第2のポインタとシフト時間Tcとディレイ時間Tdをパラメータとして音声信号セグメントX1と音声信号セグメントX2の開始点を求め、それぞれの開始点から時間長Tsの音声信号セグメントX1と音声信号セグメントX2を入力し、X1とX2の類似度を計算し、類似度が高い時のディレイ時間Td_optとシフト時間Tc_optを探索するステップと、
    第1のポインタもしくは第2のポインタを開始点として時間長Td_optの音声信号を入力してそのまま出力するステップと、
    第1のポインタと第2のポインタとTc_optとTd_optをパラメータとして類似度の高い音声信号セグメントX1(1〜Ts)と音声信号セグメントX2(1〜Ts)を入力し、漸増する窓関数W1(1〜Ts)と漸減する窓関数W2(1〜Ts)を用いて、音声信号セグメントX1と音声信号セグメントX2とを重み付け加算して出力するステップと、
    時間軸変換比αと音声信号セグメント長Tsと類似度の高いシフト時間Tc_optに基づいて音声信号をそのまま出力する時間長Ttを計算し、第1のポインタもしくは第2のポインタとTc_optとTd_optとTsに基づいて開始点を求め、時間長(Tt−Td_opt)の音声信号を入力してそのまま出力するステップと、
    音声信号セグメント長Tsと音声信号をそのまま出力する時間長Ttと類似度が高い時のシフト時間Tc_optに基づいて、第1のポインタと第1のポインタのTs後の第2のポインタを設定するステップと、
    終了でなければ類似度を初期設定するステップに戻るステップと
    を有することを特徴とする音声速度変換方法。
  5. 時間軸変換比α(≧1.0)を読み込むステップと、
    第1のポインタにスタート点を設定するステップと、
    第2のポインタに第1のポインタ+Tsの値を設定するステップと、
    最大ディレイ時間Td_max=(Ts−α×Tc_min)/(α−1)を計算するステップと、
    類似度を初期設定するステップと、
    シフト時間Tcを初期値Tc_minから最大シフト時間Tc_max=(Ts+Td)/α−Tdの範囲で変え、ディレイ時間Tdを0から最大ディレイ時間Td_maxの範囲で変え、(第1のポインタ+Tc+Td)を開始点として時間長Tsの音声信号セグメントX1を入力し、(第2のポインタ+Td)を開始点として時間長Tsの音声信号セグメントX2を入力し、X1とX2の類似度を計算し、類似度が高い時のディレイ時間Td_optとシフト時間Tc_optを探索するステップと、
    第2のポインタを開始点として時間長Td_optの音声信号を入力してそのまま出力するステップと、
    (第1のポインタ+Tc_opt+Td_opt)を開始点として時間長Tsの音声信号セグメントX1(1〜Ts)を入力し、(第2のポインタ+Td_opt)を開始点として時間長Tsの音声信号セグメントX2(1〜Ts)を入力し、漸増する窓関数W1(1〜Ts)と漸減する窓関数W2(1〜Ts)を用い、W1(i)×X1(i)+W2(i)×X2(i)をi=1〜Tsの範囲で計算して出力するステップと、
    Tt=(Ts−α×Tc_opt)/(α−1)を計算し、(第1のポインタ+Tc_opt+Td_opt+Ts)を開始点として時間長(Tt−Td_opt)の音声信号を入力してそのまま出力するステップと、
    第2のポインタに第1のポインタ+Tc_opt+Ts+Ttを設定するステップと、
    第1のポインタに第2のポインタ−Tsを設定するステップと、
    終了でなければ類似度を初期設定するステップに戻るステップと
    を有することを特徴とする音声速度変換方法。
  6. 時間軸変換比α(≦1.0)を読み込むステップと、
    第1のポインタにスタート点を設定するステップと、
    第2のポインタに第1のポインタ+Tsの値を設定するステップと、
    最大ディレイ時間Td_max=((2×α−1)Ts−α×Tc_min)/(1−α)を計算するステップと、
    類似度を初期設定するステップと、
    シフト時間Tcを初期値Tc_minから最大シフト時間Tc_max=2×Ts+Td−(Ts+Td)/αの範囲で変え、ディレイ時間Tdを0から最大ディレイ時間Td_maxの範囲で変え、(第1のポインタ+Td)を開始点として時間長Tsの音声信号セグメントX1を入力し、(第2のポインタ−Tc+Td)を開始点として時間長Tsの音声信号セグメントX2を入力し、X1とX2の類似度を計算し、類似度が高い時のディレイ時間Td_optとシフト時間Tc_optを探索するステップと、
    第1のポインタを開始点として時間長Td_optの音声信号を入力してそのまま出力するステップと、
    (第1のポインタ+Td_opt)を開始点として時間長Tsの音声信号セグメントX1(1〜Ts)を入力し、(第2のポインタ−Tc_opt+Td_opt)を開始点として時間長Tsの音声信号セグメントX2(1〜Ts)を入力し、漸増する窓関数W1(1〜Ts)と漸減する窓関数W2(1〜Ts)を用い、W2(i)×X1(i)+W1(i)×X2(i)をi=1〜Tsの範囲で計算して出力するステップと、
    Tt=((2×α−1)Ts−α×Tc_opt)/(1−α)を計算し、(第2のポインタ−Tc_opt+Td_opt+Ts)を開始点として時間長(Tt−Td_opt)の音声信号を入力してそのまま出力するステップと、
    第1のポインタに第2のポインタ−Tc_opt+Ts+Ttを設定するステップと、
    第2のポインタに第1のポインタ+Tsを設定するステップと、
    終了でなければ類似度を初期設定するステップに戻るステップと
    を有することを特徴とする音声速度変換方法。
JP2004030325A 2004-02-06 2004-02-06 音声速度変換装置と音声速度変換方法 Expired - Fee Related JP4442239B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004030325A JP4442239B2 (ja) 2004-02-06 2004-02-06 音声速度変換装置と音声速度変換方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004030325A JP4442239B2 (ja) 2004-02-06 2004-02-06 音声速度変換装置と音声速度変換方法

Publications (3)

Publication Number Publication Date
JP2005221811A JP2005221811A (ja) 2005-08-18
JP2005221811A5 true JP2005221811A5 (ja) 2007-03-01
JP4442239B2 JP4442239B2 (ja) 2010-03-31

Family

ID=34997485

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004030325A Expired - Fee Related JP4442239B2 (ja) 2004-02-06 2004-02-06 音声速度変換装置と音声速度変換方法

Country Status (1)

Country Link
JP (1) JP4442239B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100717393B1 (ko) 2006-02-09 2007-05-11 삼성전자주식회사 음성 인식기의 음성 인식에 대한 신뢰도 측정 방법 및 그장치
JP4940888B2 (ja) * 2006-10-23 2012-05-30 ソニー株式会社 オーディオ信号伸張圧縮装置及び方法
EP2141696A1 (en) * 2008-07-03 2010-01-06 Deutsche Thomson OHG Method for time scaling of a sequence of input signal values
JP2010017216A (ja) * 2008-07-08 2010-01-28 Ge Medical Systems Global Technology Co Llc 音声データ処理装置,音声データ処理方法、および、イメージング装置
JP5405206B2 (ja) * 2009-06-24 2014-02-05 ジーイー・メディカル・システムズ・グローバル・テクノロジー・カンパニー・エルエルシー 音声データ処理装置、磁気共鳴イメージング装置、音声データ処理方法、およびプログラム

Similar Documents

Publication Publication Date Title
CN110194171B (zh) 驾驶需求扭矩的确定方法、装置、车辆及存储介质
JP2021517992A (ja) 音声認識方法、音声区切り方法並びにその装置及びコンピュータプログラム
EP3493198A1 (en) Method and device for determining delay of audio
JP2012155651A5 (ja)
JP2008134582A (ja) 音声処理方法および音声処理装置
JP5367932B2 (ja) オーディオ速度変換を可能にするシステムおよび方法
JP2005221811A5 (ja)
JP6284003B2 (ja) 音声強調装置及び方法
US8085953B2 (en) Audio-signal time-axis expansion/compression method and device
TWI223231B (en) Digital audio with parameters for real-time time scaling
JP4442239B2 (ja) 音声速度変換装置と音声速度変換方法
JP6071944B2 (ja) 話者速度変換システムおよびその方法ならびに速度変換装置
JPH1078791A (ja) ピッチ変換器
JP4877076B2 (ja) 共鳴音付加装置および共鳴音付加プログラム
JP2532731B2 (ja) 音声速度変換装置と音声速度変換方法
JP2001242900A (ja) 音の時間伸長装置、方法、および音の時間伸長プログラムを記録した記録媒体
JP4354038B2 (ja) デジタル信号レベル制御装置および制御方法
JPH06222794A (ja) 音声速度変換方法
JP6992612B2 (ja) 音声処理方法および音声処理装置
JP4236570B2 (ja) 波形再生装置および波形再生プログラム
JP2004178705A (ja) 圧縮データ記録装置及び圧縮データ記録方法
JP4385893B2 (ja) データ処理回路における係数補間回路
JP2769690B2 (ja) 遅延装置
JP2009290513A (ja) Firフィルタ係数算出装置、firフィルタ装置、および、firフィルタ係数算出プログラム
JP2005303831A (ja) データ受信装置、データ受信方法、データ送信装置、及びデータ送信方法