JP2007163915A - 音声速度変換装置、音声速度変換プログラム及びそのプログラムを記憶したコンピュータ読み取り可能な記録媒体 - Google Patents
音声速度変換装置、音声速度変換プログラム及びそのプログラムを記憶したコンピュータ読み取り可能な記録媒体 Download PDFInfo
- Publication number
- JP2007163915A JP2007163915A JP2005361352A JP2005361352A JP2007163915A JP 2007163915 A JP2007163915 A JP 2007163915A JP 2005361352 A JP2005361352 A JP 2005361352A JP 2005361352 A JP2005361352 A JP 2005361352A JP 2007163915 A JP2007163915 A JP 2007163915A
- Authority
- JP
- Japan
- Prior art keywords
- pitch period
- similarities
- sum
- signal
- speed conversion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Stereophonic System (AREA)
Abstract
【課題】従来は複数チャンネルの和信号からピッチ周期を得るため、チャンネル信号が逆位相の場合和信号はゼロになり正確なピッチ周期算出が困難、また、和信号又は差信号の何れかからピッチ周期を得るものは、得たピッチ周期が夫々のチャンネル信号のピッチ周期と異なる場合、速度変換後の音声信号の音質が低下する。
【解決手段】入力された複数チャンネル信号について処理区間毎に各チャンネルの波形類似度を算出し、類似度が算出された全てのチャンネルについての同一時刻における類似度の和を求め、類似度の和から最も類似性の強い位置をピッチ周期として抽出するピッチ周期抽出手段と、ピッチ周期抽出手段により抽出されたピッチ周期に基づいて入力信号における全チャンネルの速度変換を行なう速度変換処理手段を備える。
【選択図】図1
【解決手段】入力された複数チャンネル信号について処理区間毎に各チャンネルの波形類似度を算出し、類似度が算出された全てのチャンネルについての同一時刻における類似度の和を求め、類似度の和から最も類似性の強い位置をピッチ周期として抽出するピッチ周期抽出手段と、ピッチ周期抽出手段により抽出されたピッチ周期に基づいて入力信号における全チャンネルの速度変換を行なう速度変換処理手段を備える。
【選択図】図1
Description
この発明は、音声入力信号のピッチ周期を算出し、そのピッチ周期に基づいて、音声の速度変換処理を行なう音声速度変換装置並びに、音声速度変換プログラム及びそのプログラムを記憶したコンピュータ読み取り可能な記録媒体に関するものである。
複数チャンネルの入力信号に対する音声速度変換は、複数チャンネル信号の和信号に対してピッチ周期を算出し、そのピッチ周期に基づいて各チャンネルに対して速度変換処理を行なう技術、及び複数チャンネル信号の各チャンネルにおいて最大の自己相関を有するチャンネルの入力信号からピッチ周期を算出し、そのピッチ周期に基づいて全チャンネルに対して速度変換処理を行なう技術が特開2002−297200号公報の「話速変換装置」において開示されている。
しかし、上記の特開2002−297200号公報の「話速変換装置」では、入力信号の各チャンネル信号が相互に逆位相、またはそれに近い場合、和信号はゼロまたはそれに近い値になり、正確なピッチ周期を算出することが困難である。
また、各チャンネルにおいて最大の自己相関を有するチャンネルの入力信号からピッチ周期を算出する手法は、選択されたチャンネル以外の信号のピッチ周期が算出したピッチ周期と異なる場合、速度変換された音声信号の音質が低下する可能性があった。
また、各チャンネルにおいて最大の自己相関を有するチャンネルの入力信号からピッチ周期を算出する手法は、選択されたチャンネル以外の信号のピッチ周期が算出したピッチ周期と異なる場合、速度変換された音声信号の音質が低下する可能性があった。
これに対し、複数チャンネル信号の和信号及び差信号のうち、振幅の大きさに基づく規則で、何れかの信号を選択し、選択された信号に対してピッチ周期を算出し、その算出されたピッチ周期に基づいて各チャンネルに対して速度変換処理を行なう技術が特開2004−309893号公報の「音声信号処理装置及びその方法」において開示されている。
しかしながら、上記特開2004−309893号公報「音声信号処理装置及びその方法」では、和信号又は差信号の何れかからピッチ周期を得るため、得られたピッチ周期がそれぞれのチャンネル信号のピッチ周期と異なる場合、速度変換された音声信号の音質が低くなる可能性があった。
この発明は上記のような課題を解決するためになされたもので、複数チャンネル入力信号に対して適切なピッチ周期を求めることにより、高品質な速度変換音声を作成することを目的とする。
この発明に係る音声速度変換装置は、
入力された複数チャンネル信号から抽出したピッチ周期に基づいて入力音声信号の速度を変換する音声速度変換装置において、
上記複数チャンネル信号について処理区間毎に各チャンネルの波形類似度を算出し、類似度が算出された全てのチャンネル信号について同一時刻における類似度の和を求め、上記類似度の和から最も類似性の強い位置をピッチ周期として抽出するピッチ周期抽出手段と、
上記ピッチ周期抽出手段により抽出されたピッチ周期に基づいて上記入力信号における全チャンネルの速度変換を行なう速度変換処理手段を備える。
入力された複数チャンネル信号から抽出したピッチ周期に基づいて入力音声信号の速度を変換する音声速度変換装置において、
上記複数チャンネル信号について処理区間毎に各チャンネルの波形類似度を算出し、類似度が算出された全てのチャンネル信号について同一時刻における類似度の和を求め、上記類似度の和から最も類似性の強い位置をピッチ周期として抽出するピッチ周期抽出手段と、
上記ピッチ周期抽出手段により抽出されたピッチ周期に基づいて上記入力信号における全チャンネルの速度変換を行なう速度変換処理手段を備える。
また、この発明に係る音声速度変換プログラム及びそのプログラムを記憶したコンピュータ読み取り可能な記録媒体は、
コンピュータを
入力された複数の音声チャンネル信号について、その処理区間毎に各チャンネルの波形類似度を算出する類似度算出手段、
類似度が算出された全てのチャンネル信号について同一時刻における類似度の和を求める最大類似度和算出手段、
上記類似度の和から最も類似性の強い位置をピッチ周期として抽出するピッチ周期決定手段、
上記ピッチ周期抽出手段により抽出されたピッチ周期に基づいて上記入力信号における全チャンネルの速度変換を行なう速度変換処理手段として機能させる音声速度変換プログラム及びそのプログラムを記憶したコンピュータ読み取り可能な記録媒体である。
コンピュータを
入力された複数の音声チャンネル信号について、その処理区間毎に各チャンネルの波形類似度を算出する類似度算出手段、
類似度が算出された全てのチャンネル信号について同一時刻における類似度の和を求める最大類似度和算出手段、
上記類似度の和から最も類似性の強い位置をピッチ周期として抽出するピッチ周期決定手段、
上記ピッチ周期抽出手段により抽出されたピッチ周期に基づいて上記入力信号における全チャンネルの速度変換を行なう速度変換処理手段として機能させる音声速度変換プログラム及びそのプログラムを記憶したコンピュータ読み取り可能な記録媒体である。
この発明に係る音声速度変換装置または音声速度変換プログラム及びそのプログラムを記憶したコンピュータ読み取り可能な記録媒体は、
ピッチ周期の抽出は複数のチャンネルの各々について処理区間毎にそのチャンネルの波形類似度を算出し、
類似度が算出された複数のチャンネルの同一時刻における類似度の和を用いてピッチ周期を求めることにより、何れか一つのチャンネルの影響が強いためにおこる適切でないピッチ周期の抽出を防ぎ、各チャンネルに対して適切なピッチ周期を抽出することが出来る。そのため、速度変換した音声信号の音質向上が期待できる。
ピッチ周期の抽出は複数のチャンネルの各々について処理区間毎にそのチャンネルの波形類似度を算出し、
類似度が算出された複数のチャンネルの同一時刻における類似度の和を用いてピッチ周期を求めることにより、何れか一つのチャンネルの影響が強いためにおこる適切でないピッチ周期の抽出を防ぎ、各チャンネルに対して適切なピッチ周期を抽出することが出来る。そのため、速度変換した音声信号の音質向上が期待できる。
実施の形態1.
図1はこの発明の実施の形態1に関する音声速度変換装置の構成図である。
図1において、1は複数チャンネルの入力信号からピッチ周期を抽出するピッチ周期抽出部、2は入力信号の処理区間毎に各チャンネルの波形類似度を算出する類似度算出部、3は類似度算出部2により類似度が算出された全てのチャンネルについて同一位置における類似度の和を算出し、その最大値を検出する最大類似度和算出部、4は最大類似度和算出部3で検出された最大類似度和からピッチ周期を決定するピッチ周期決定部、5はピッチ周期決定部4で抽出されたピッチ周期に基づいて入力信号の全チャンネルの音声速度を変換する音声速度変換処理部である。
なお、ピッチ周期抽出部1は類似度算出部2と最大類似度和算出部3及びピッチ周期決定部4とで構成される。
図1はこの発明の実施の形態1に関する音声速度変換装置の構成図である。
図1において、1は複数チャンネルの入力信号からピッチ周期を抽出するピッチ周期抽出部、2は入力信号の処理区間毎に各チャンネルの波形類似度を算出する類似度算出部、3は類似度算出部2により類似度が算出された全てのチャンネルについて同一位置における類似度の和を算出し、その最大値を検出する最大類似度和算出部、4は最大類似度和算出部3で検出された最大類似度和からピッチ周期を決定するピッチ周期決定部、5はピッチ周期決定部4で抽出されたピッチ周期に基づいて入力信号の全チャンネルの音声速度を変換する音声速度変換処理部である。
なお、ピッチ周期抽出部1は類似度算出部2と最大類似度和算出部3及びピッチ周期決定部4とで構成される。
複数チャンネルの入力音声信号からピッチ周期を抽出し、そのピッチ周期を基に音声速度を変換する手法は多く存在するが、従来手法の場合、図2に示すように、入力音声信号における各チャンネル信号の和がゼロになってしまう場合、適切なピッチ周期を抽出できない。そこで、この発明では複数チャンネルの入力音声信号に対する適切なピッチ周期を求め、高品質な速度変換音声を作成する。以下、その方法について説明する。
この実施の形態において、類似度算出部2が算出する処理区間毎の波形類似度の評価関数として二乗誤差を使用するものとし、二乗誤差の小さい波形ほど類似性が強いものとする。
入力データを離散信号x(n)とすると、二乗誤差関数e(j)は以下の式で与えられるものとする。
入力データを離散信号x(n)とすると、二乗誤差関数e(j)は以下の式で与えられるものとする。
ここで、nは処理区間の先頭位置、mはピッチ周期探索区間の先頭位置で、n=0よりも時間的に少し遅れた位置、この実施の形態の場合は1msec遅れた位置である。Nは処理区間のサンプル数、Mはピッチ周期探索区間の終了位置を表しており、n+mからn+Mの位置まで二乗誤差を求めるものとする。このときの探索例を図4に示す。図に示すように、入力信号と処理区間波形Aとの二乗誤差e(j)をピッチ周期探索範囲内全てで算出する。
また、この実施の形態において、入力音声信号である複数チャンネル信号は2チャンネルのステレオ信号とする。この実施の形態における具体的なピッチ周期抽出の例として、図3に示すフローチャートを用いて説明する。
まずステップS101において、類似度算出部2は音声信号などの入力信号があるかどうか判定し、入力音声信号があれば、次のステップS102へ進む。入力音声信号がなければ、処理を終了する。
ステップS102において、類似度算出部2は速度変換処理を行なう処理開始位置nを更新し、次のステップS103へ進む。処理開始位置nは初期値をn=0とし、以降は音声速度変換処理を施した終了位置とする。例えば、図5に示すように、初期値n=0のピッチ周期と、このピッチ周期に続く次のピッチ周期との2つのピッチ周期を1つのピッチ周期に変換する音声速度変換処理を施すことで、次の処理開始位置はn=n_nextとなる。このように音声速度変換処理終了ごとに処理開始位置nを更新していく。
図5には音声速度変換処理は2つのピッチ周期を1つのピッチ周期に変換する処理について示しているが、音声速度を早くする場合、音声速度変換処理は4つのピッチ周期を3つのピッチ周期にする。即ち2つのピッチ周期を1つのピッチ周期に、他の2つのピッチ周期はそのまま出力する。または,3つピッチ周期を2つのピッチ周期にする。即ち2つのピッチ周期を1つのピッチ周期に、他の1つのピッチ周期はそのまま出力する方法もある。
また、音声速度を遅くする場合は上述とは逆の処理で1つのピッチ周期を2つのピッチ周期に、2つのピッチ周期を3つのピッチ周期に、3つのピッチ周期を4つのピッチ周期にする。
また、音声速度を遅くする場合は上述とは逆の処理で1つのピッチ周期を2つのピッチ周期に、2つのピッチ周期を3つのピッチ周期に、3つのピッチ周期を4つのピッチ周期にする。
ステップS103において、類似度算出部2はLチャンネルおよびRチャンネルそれぞれのピッチ周期探索範囲における処理区間波形との二乗誤差を算出し、次のステップへ進む。ここで、Lチャンネルの位置n+kにおける二乗誤差をeL(k)、Rチャンネルの位置n+kにおける二乗誤差をeR(k)とする。
ステップS104において、最大類似度和算出部3はLチャンネルとRチャンネルの同一時刻(位置)における二乗誤差の和を算出し、次のステップへ進む。位置n+kにおける二乗誤差の和E(k)は、
E(k) =eL(k) +eR(k)
となる。
E(k) =eL(k) +eR(k)
となる。
ステップS105において、ピッチ周期決定部4はステップS104で求めた二乗誤差の和E(k) を最小にするk、すなわち類似性が最も強くなるkをピッチ周期として抽出し、次のステップS106へ進む。
ステップS106において、音声速度変換処理部5はステップS105で抽出されたピッチ周期に基づいて入力信号の全チャンネルに対して音声速度変換処理を施し、次のステップへ進む。
ステップS107において、ステップS106の音声速度変換処理部5で得られた速度変換音声を出力し、ステップS101へ戻る。
上記のように、ピッチ周期決定部4がLチャンネルとRチャンネルの同一時刻における類似度の和を用いてピッチ周期を求めることにより、どちらか一方のチャンネルの影響が強いためにおこる適切でないピッチ周期の抽出を防ぎ、両チャンネルに対して適切なピッチ周期を抽出することが出来る。そのため、速度変換した音声信号の音質向上が期待できる。
この実施の形態を説明する上で、入力音声信号は2チャンネルのステレオ信号としたが、任意のチャンネル数を持つ入力信号に対し、この発明は適用することができる。
また、この実施の形態を説明する上で、波形類似度の評価関数として、二乗誤差関数を使用したが、任意の評価関数を使用することができる。例えば、誤差の絶対値の和や自己相関関数などを使用してもよい。
実施の形態2.
上記実施の形態1では、LチャンネルとRチャンネルの類似度を算出し、それらの和からピッチ周期を抽出する方法について述べた。しかし、LチャンネルとRチャンネルの合成信号をピッチ周期の抽出に用いることにより、両チャンネルの相関を考慮することとなり、より高い精度でのピッチ周期抽出が期待できる。
上記実施の形態1では、LチャンネルとRチャンネルの類似度を算出し、それらの和からピッチ周期を抽出する方法について述べた。しかし、LチャンネルとRチャンネルの合成信号をピッチ周期の抽出に用いることにより、両チャンネルの相関を考慮することとなり、より高い精度でのピッチ周期抽出が期待できる。
図6はこの発明の実施の形態2に関する音声速度変換装置の構成図である。
図6において、図1と同一符号は同一または相当部分を示すので説明を省略する。6は複数チャンネル信号のそれぞれのチャンネル信号に重み係数を乗じた後に和信号および/または差信号を作成する合成信号作成部、7は合成信号作成部6で作成されたそれぞれの合成信号について処理区間毎に求めた各チャンネルの波形類似度に重み係数を乗じた値を算出する重みつき類似度算出部である。
図6において、図1と同一符号は同一または相当部分を示すので説明を省略する。6は複数チャンネル信号のそれぞれのチャンネル信号に重み係数を乗じた後に和信号および/または差信号を作成する合成信号作成部、7は合成信号作成部6で作成されたそれぞれの合成信号について処理区間毎に求めた各チャンネルの波形類似度に重み係数を乗じた値を算出する重みつき類似度算出部である。
この実施の形態において、上記実施の形態1と同様に、入力音声信号である複数チャンネル信号は2チャンネルのステレオ信号とする。また、波形類似度の評価関数は二乗誤差関数とする。
さらに、この実施の形態では、合成信号作成時の重み係数は1、重みつき類似度算出時の重み係数も1とする。この実施の形態における具体的なピッチ周期抽出の例として、図7のフローチャートを使用して説明する。
まずステップS201において、合成信号作成部6は音声信号などの入力信号があるかどうか判定し、入力音声信号があれば、次のステップS202へ進む。入力音声信号がなければ、処理を終了する。
ステップS202において、合成信号作成部6は速度変換処理を行なう処理開始位置nを更新し、次のステップS203へ進む。処理開始位置nは初期値をn=0とし、以降は音声速度変換処理を施した終了位置とする。例えば、実施の形態1と同様、図5に示すように、初期値n=0のピッチ周期と、このピッチ周期に続く次のピッチ周期との2つのピッチ周期を1つのピッチ周期に変換する音声速度変換処理を施すことで、次の処理開始位置はn=n_nextとなる。このように音声速度変換処理終了ごとに処理開始位置nを更新していく。
ステップS203において、合成信号作成部6はLチャンネルとRチャンネルの和信号(この実施の形態では重み係数はともに1)であるL+R合成信号とLチャンネルとRチャンネルの差信号(この実施の形態では重み係数はともに1)であるL−R合成信号を作成する。
ステップS204において、重みつき類似度算出部7はL+R合成信号及びL−R合成信号それぞれのピッチ周期探索範囲における処理区間波形との二乗誤差を求め、その二乗誤差に重み係数を乗じた重みつき二乗誤差(この実施の形態では重み係数は1)を算出し、次のステップへ進む。ここで、L+R合成信号の位置n+kにおける重みつき二乗誤差をeL+R(k)、L−R合成信号の位置n+kにおける重みつき二乗誤差をeL−R(k) とする。
ステップS205において、最大類似度和算出部3はL+R合成信号及びL−R合成信号の同一位置における二乗誤差の和を算出し、次のステップへ進む。位置n+kにおける二乗誤差の和E(k) は、
E(k) =eL+R(k) +eL−R(k)
となる。
E(k) =eL+R(k) +eL−R(k)
となる。
ステップS206において、ピッチ周期決定部4はステップS205で最大類似度和算出部3により求めた二乗誤差の和E(k)を最小にするk、すなわち類似性が最も強くなるkをピッチ周期として抽出し、次のステップへ進む。
ステップS207において、音声速度変換処理部5はステップS206でピッチ周期決定部4により抽出されたピッチ周期に基づいて入力信号の全チャンネルに対して音声速度変換処理を施し、次のステップへ進む。
ステップS208において、ステップS207で音声速度変換処理部5により得られた速度変換音声を出力し、ステップS201へ戻る。
上記のように、L+R合成信号とL−R合成信号の同一時刻(位置)における二乗誤差の和を用いてピッチ周期を求めることにより、LチャンネルおよびRチャンネルの相関を考慮した形で両チャンネルに対して適切なピッチ周期を抽出することが出来る。このため、このように抽出されたピッチ周期に基づいて速度変換した音声信号の音質向上が期待できる。
この実施の形態を説明する上で、入力音声信号は2チャンネルのステレオ信号としたが、任意のチャンネル数を持つ入力音声信号に対し、この発明を適用することができる。また、合成信号作成部6は和信号及び差信号の合成信号を作成するものについて述べたが、和信号または差信号のみを合成作成するものであってもよい。例えば、合成信号作成部6は、入力音声信号が前後左右の4チャンネルの場合は、各チャンネル信号に重み係数を乗じた後、前方左右の和信号と後方左右の和信号のみ或いはこれらの差信号のみを合成し、重みつき類似度算出部7に出力しても良い。
また、2チャンネルのステレオ信号の場合でも重み係数を変更した信号、L、2L、R、2Rを生成し、これらの信号を2L+R、L+2Rの和信号のみ或いは2L−R、L−2Rの差信号のみを合成し、重みつき類似度算出部7に出力しても良い。
また、2チャンネルのステレオ信号の場合でも重み係数を変更した信号、L、2L、R、2Rを生成し、これらの信号を2L+R、L+2Rの和信号のみ或いは2L−R、L−2Rの差信号のみを合成し、重みつき類似度算出部7に出力しても良い。
また、この実施の形態を説明する上で、波形類似度の評価関数として、二乗誤差関数を使用したが、任意の評価関数を使用することができる。例えば、誤差の絶対値の和や自己相関関数などを使用してもよい。
さらに、この実施の形態を説明する上で、合成信号作成時の重み係数を1としたが、任意の重み係数を使用することが出来る。
また、重みつき類似度算出時の重み係数も1としたが、任意の重み係数を使用することが出来る。
また、重みつき類似度算出時の重み係数も1としたが、任意の重み係数を使用することが出来る。
実施の形態3.
以上述べた実施の形態において、上記全ての機能或いは一部の機能は、音声再生装置や聴覚補助装置或いは英語学習装置に組み込まれたコンピュータ等のソフトウェアとしてプログラム実行したり,CPU等の組み込みソフトウェアやファームウェアとしてプログラム実行することで達成できる。
以上述べた実施の形態において、上記全ての機能或いは一部の機能は、音声再生装置や聴覚補助装置或いは英語学習装置に組み込まれたコンピュータ等のソフトウェアとしてプログラム実行したり,CPU等の組み込みソフトウェアやファームウェアとしてプログラム実行することで達成できる。
また、前述した実施の形態の機能を実現するプログラムを記録した記録媒体をコンピュータに読み取らせ、実行することで実施することも出来る。プログラムを供給するための記録媒体としてはROM、CD-ROM、DVD-ROM、フロッピー(登録商標)ディスク、ハードディスク、メモリカード等を用いることができる。
この発明は、映像を伴うテレビ、レーザディスク、VTR、ハードディスクレコーダ等の音声の早聞き、又は遅聞きを行う音声再生装置、聴覚障害者や高齢者のために放送される音声をゆっくりした聞きやすい音声に変換する聴覚補助装置及び該装置を備えた電話機、通常速度の英語音声をゆっくりした聞きやすい音声に変換する英語学習装置、カラオケの速度(テンポ)変更装置に利用可能である。
1;ピッチ周期抽出部、2;類似度算出部、3;最大類似度和算出部、4;ピッチ周期決定部、5;音声速度変換処理部、6;合成信号作成部、7;重みつき類似度算出部。
Claims (6)
- 入力された複数チャンネル信号から抽出したピッチ周期に基づいて入力音声信号の速度を変換する音声速度変換装置において、
上記複数チャンネル信号について処理区間毎に各チャンネルの波形類似度を算出し、類似度が算出された全てのチャンネルの信号について同一時刻における類似度の和を求め、上記類似度の和から最も類似性の強い位置をピッチ周期として抽出するピッチ周期抽出手段と、
上記ピッチ周期抽出手段により抽出されたピッチ周期に基づいて上記入力信号における全チャンネルの速度変換を行なう速度変換処理手段を備えることを特徴とする音声速度変換装置。 - 入力された複数チャンネル信号から抽出したピッチ周期に基づいて入力信号の速度を変換する音声速度変換装置において、
上記複数チャンネル信号を用いて合成作成し、複数の合成信号を出力する合成信号作成手段と、
上記複数の合成信号それぞれについて処理区間毎に波形類似度を算出し、類似度が算出された全ての信号についての同一時刻における類似度の和を求め、最も類似性の強い位置をピッチ周期として抽出するピッチ周期抽出手段と、
上記ピッチ周期抽出手段により抽出されたピッチ周期に基づいて上記入力信号における全チャンネルの速度変換を行なう速度変換処理手段を備えることを特徴とする音声速度変換装置。 - 上記合成信号作成手段が、上記複数チャンネル信号のそれぞれのチャンネル信号に重み係数を乗じた後に和信号および/または差信号を作成することを特徴とする請求項2記載の音声速度変換装置。
- 上記ピッチ周期抽出手段が、類似度が算出された全ての信号についての同一時刻における類似度に対して所定の重み係数を乗じた後に、類似度の和を求め、最も類似性の強い位置をピッチ周期として抽出することを特徴とする請求項1から請求項3のうちの何れか1項記載の音声速度変換装置。
- コンピュータを
入力された複数の音声チャンネル信号について、その処理区間毎に各チャンネルの波形類似度を算出する類似度算出手段、
類似度が算出された全てのチャンネル信号について同一時刻における類似度の和を求める最大類似度和算出手段、
上記類似度の和から最も類似性の強い位置をピッチ周期として抽出するピッチ周期決定手段、
上記ピッチ周期抽出手段により抽出されたピッチ周期に基づいて上記入力信号における全チャンネルの速度変換を行なう速度変換処理手段として機能させるための音声速度変換プログラム。 - コンピュータを
入力された複数の音声チャンネル信号について、その処理区間毎に各チャンネルの波形類似度を算出する類似度算出手段、
類似度が算出された全てのチャンネル信号について同一時刻における類似度の和を求める最大類似度和算出手段、
上記類似度の和から最も類似性の強い位置をピッチ周期として抽出するピッチ周期決定手段、
上記ピッチ周期決定手段により抽出されたピッチ周期に基づいて上記入力信号における全チャンネルの速度変換を行なう速度変換処理手段として機能させるためのプログラムを記憶したコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005361352A JP2007163915A (ja) | 2005-12-15 | 2005-12-15 | 音声速度変換装置、音声速度変換プログラム及びそのプログラムを記憶したコンピュータ読み取り可能な記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005361352A JP2007163915A (ja) | 2005-12-15 | 2005-12-15 | 音声速度変換装置、音声速度変換プログラム及びそのプログラムを記憶したコンピュータ読み取り可能な記録媒体 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007163915A true JP2007163915A (ja) | 2007-06-28 |
Family
ID=38246853
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005361352A Pending JP2007163915A (ja) | 2005-12-15 | 2005-12-15 | 音声速度変換装置、音声速度変換プログラム及びそのプログラムを記憶したコンピュータ読み取り可能な記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2007163915A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008107413A (ja) * | 2006-10-23 | 2008-05-08 | Sony Corp | オーディオ信号伸張圧縮装置及び方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004309893A (ja) * | 2003-04-09 | 2004-11-04 | Kobe Steel Ltd | 音声信号処理装置及びその方法 |
JP2006293230A (ja) * | 2005-04-14 | 2006-10-26 | Toshiba Corp | 音響信号処理装置、音響信号処理プログラム及び音響信号処理方法 |
-
2005
- 2005-12-15 JP JP2005361352A patent/JP2007163915A/ja active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004309893A (ja) * | 2003-04-09 | 2004-11-04 | Kobe Steel Ltd | 音声信号処理装置及びその方法 |
JP2006293230A (ja) * | 2005-04-14 | 2006-10-26 | Toshiba Corp | 音響信号処理装置、音響信号処理プログラム及び音響信号処理方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008107413A (ja) * | 2006-10-23 | 2008-05-08 | Sony Corp | オーディオ信号伸張圧縮装置及び方法 |
US8635077B2 (en) | 2006-10-23 | 2014-01-21 | Sony Corporation | Apparatus and method for expanding/compressing audio signal |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5149968B2 (ja) | スピーチ信号処理を含むマルチチャンネル信号を生成するための装置および方法 | |
CN100356445C (zh) | 分离声源信号的方法和装置及用来检测间距的方法和装置 | |
US7970144B1 (en) | Extracting and modifying a panned source for enhancement and upmix of audio signals | |
KR101334366B1 (ko) | 오디오 배속 재생 방법 및 장치 | |
JP4594681B2 (ja) | 音声信号処理装置および音声信号処理方法 | |
JP2002078100A (ja) | ステレオ音響信号処理方法及び装置並びにステレオ音響信号処理プログラムを記録した記録媒体 | |
JPH0997091A (ja) | 予め記録された背景音楽のピッチ変化方法およびカラオケシステム | |
JP4550652B2 (ja) | 音響信号処理装置、音響信号処理プログラム及び音響信号処理方法 | |
JP6174856B2 (ja) | 雑音抑制装置、その制御方法、及びプログラム | |
JPWO2007034806A1 (ja) | 信号処理装置、信号処理方法、信号処理プログラムおよびコンピュータに読み取り可能な記録媒体 | |
JP4457221B2 (ja) | 音源分離方法およびそのシステム、並びに音声認識方法およびそのシステム | |
JP2005157363A (ja) | フォルマント帯域を利用したダイアログエンハンシング方法及び装置 | |
JP2008107413A (ja) | オーディオ信号伸張圧縮装置及び方法 | |
US20230254655A1 (en) | Signal processing apparatus and method, and program | |
JP2010020122A (ja) | ディジタル音響信号処理方法及び処理装置 | |
JP2007163915A (ja) | 音声速度変換装置、音声速度変換プログラム及びそのプログラムを記憶したコンピュータ読み取り可能な記録媒体 | |
JP2008048342A (ja) | 収音装置 | |
JP2004325127A (ja) | 音源検出方法、音源分離方法、およびこれらを実施する装置 | |
JP6313619B2 (ja) | 音声信号処理装置及びプログラム | |
JP2006066988A (ja) | 収音方法、収音装置、収音プログラム、およびこれを記録した記録媒体 | |
JP4348322B2 (ja) | 多チャネル信号符号化方法、多チャネル信号復号化方法、それらの方法を用いた装置、プログラム、および記録媒体 | |
JP5958378B2 (ja) | 音声信号処理装置、音声信号処理装置の制御方法およびプログラム | |
JP4249697B2 (ja) | 音源分離学習方法、装置、プログラム、音源分離方法、装置、プログラム、記録媒体 | |
JP2009282536A (ja) | 既知音響信号除去方法及び装置 | |
JP4495704B2 (ja) | 音像定位強調再生方法、及びその装置とそのプログラムと、その記憶媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080606 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100706 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100901 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20110111 |