JP2753716B2 - 音声変換装置 - Google Patents

音声変換装置

Info

Publication number
JP2753716B2
JP2753716B2 JP63293061A JP29306188A JP2753716B2 JP 2753716 B2 JP2753716 B2 JP 2753716B2 JP 63293061 A JP63293061 A JP 63293061A JP 29306188 A JP29306188 A JP 29306188A JP 2753716 B2 JP2753716 B2 JP 2753716B2
Authority
JP
Japan
Prior art keywords
signal
spectrum
fourier transform
frequency
converted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP63293061A
Other languages
English (en)
Other versions
JPH02137900A (ja
Inventor
匡伸 阿部
震一 田村
尚夫 桑原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
EI TEI AARU JIDO HONYAKU DENWA KENKYUSHO KK
Original Assignee
EI TEI AARU JIDO HONYAKU DENWA KENKYUSHO KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by EI TEI AARU JIDO HONYAKU DENWA KENKYUSHO KK filed Critical EI TEI AARU JIDO HONYAKU DENWA KENKYUSHO KK
Priority to JP63293061A priority Critical patent/JP2753716B2/ja
Publication of JPH02137900A publication Critical patent/JPH02137900A/ja
Application granted granted Critical
Publication of JP2753716B2 publication Critical patent/JP2753716B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】 [産業上の利用分野] この発明は、音声変換装置に関し、特に、ディジタル
変換された音声信号処理技術を利用した音声変換装置に
関する。
[従来の技術および発明が解決しようとする課題] 従来から短時間フーリエ分析を利用した音声分析で
は、LPC分析など、他の音声分析手法と比較して、高品
質に分析を行なうことができることが知られている。そ
のため、既にいくつかの短時間フーリエスペクトルを利
用した音声変換手法が提案されている。しかしながら、
これらの従来の手法の特徴は、いずれの手法において
も、非常に複雑な信号処理を必要とする位相スペクトル
の推定を必要としている。したがって、従来の手法を使
って音声変換処理を行なうと、処理系全体が複雑となる
という課題があった。
この発明は、上記のような課題を解決するためになさ
れたもので、簡単な位相制御処理により高品質にピッチ
周波数を変換することが可能な音声変換装置を得ること
を目的とする。
[課題を解決するための手段] 請求項1に係る音声変換装置は、ディジタル変換され
た第1の音声信号を受け、フーリエ変換によりスペクト
ル信号に変換するフーリエ変換手段と、前記フーリエ変
換手段からスペクトル信号を受け、スペクトル信号の中
から音源情報信号を選択的に出力する選択手段と、前記
選択手段から音源情報信号を受け、音源情報信号のピッ
チ周波数を変換し、周波数変換された信号を出力する周
波数変換手段と、前記フーリエ変換手段からスペクトル
信号に含まれるスペクトル包絡信号と前記周波数変換手
段から出力された信号とに応答してピッチ周波数が変換
されたスペクトル信号を出力するスペクトル変換手段
と、前記スペクトル変換手段からピッチ周波数が変換さ
れたスペクトル信号を分析フレーム毎に受け、これを逆
フーリエ変換により第2の音声信号に変換する逆フーリ
エ変換手段と、前記逆フーリエ変換手段から第2の音声
信号を受け、ピッチ周波数の変換倍率に応答して第2の
音声信号の位相を分析フレームのシフト幅によって制御
する位相制御手段とを含む。
請求項2に係る音声変換装置では、周波数変換手段
は、ピッチ周波数の変換倍率に応答して選択手段からの
音源情報信号を線形的に伸縮させる線形伸縮手段を含
む。
請求項3に係る音声変換装置は、さらに、位相制御手
段からの位相が制御された第2の音声信号の継続時間を
制御する時間制御手段を含む。
[作用] 請求項1に係る音声変換装置では、選択手段によって
得られた音源情報信号について、周波数変換手段により
ピッチ周波数が変換され、さらに、周波数変換された信
号について位相が制御される。したがって、音声のピッ
チ周波数を変化させるための音源情報信号が得られる。
また、スペクトル信号が周波数変換手段から出力された
音源情報信号に応答してピッチ周波数が変換されたスペ
クトル信号に変換される。この信号から、高品質な音声
信号を得ることができる。また、スペクトル信号が逆フ
ーリエ変換により第2の音声信号に変換され、さらに、
第2の音声信号の位相がピッチ周波数の変換倍率に応答
して分析フレームのシフト幅によって制御される。音声
信号の位相スペクトルを操作する必要がないので、ピッ
チ周波数を変換したときの位相制御が容易に行なえる。
請求項2に係る音声変換装置では、選択手段から出力
された音源情報信号がピッチ周波数の変換倍率に応答し
て線形的に伸縮される。したがって、高品質にピッチ周
波数が変換された音声を得るための音源信号が得られ
る。
請求項3に係る音声変換装置では、位相制御手段から
出力された第2の音声信号の継続時間が制御される。し
たがって、ピッチ周波数の変換および位相の制御に加え
て音声信号の継続時間をも制御できる。
[発明の実施例] 第2図は、この発明の一実施例を示す音声変換装置の
ハードウェアの構成を示すブロック図である。第2図を
参照して、A/D変換器1は音声信号を受け、ディジタル
変換された音声信号を音声変換装置に与える。音声変換
装置は、ディジタル変換された音声信号の演算処理を行
なう演算処理部2と、処理されたデータ信号および必要
なプログラムの記憶を行なうメモリ部3とを含む。変換
結果は演算処理部2から出力される。
第1図は、第2図に示された音声変換装置の演算処理
部2の一例を示すブロック図である。第1図を参照し
て、この演算処理部2は、ディジタル変換された音声信
号x(n)を受け、短時間フーリエ変換によりスペクト
ルX(mS,ω)を出力する短時間フーリエ変換部21と、
スペクトルX(mS,ω)の中から声道情報であるスペク
トル包絡V(mS,ω)の振幅を抽出するスペクトル包絡
抽出部22と、スペクトルX(mS,ω)およびスペクトル
包絡V(mS,ω)から音源情報である振幅(または残
差)スペクトルG(mS,ω)を演算する除算部23と、振
幅スペクトルG(mS,ω)を線形補間によりピッチ周波
数変換し周波数変換された振幅スペクトルG′(mS,
ω)を出力する周波数変換処理部24と、周波数変換され
た振幅スペクトルG′(mS,ω)およびスペクトル包絡
抽出部22から出力されたスペクトル包絡V(mS,ω)の
振幅から演算により周波数変換された音声スペクトル
X′(mS,ω)を出力する積算部25と、周波数変換され
た音声スペクトルX′(mS,ω)の逆離散的フーリエ変
換を行なう逆離散的フーリエ変換部26と、変換された音
声信号の位相を補正しピッチ周波数が変換された音声信
号x′(n)を出力する位相補正部27と、ピッチ周波数
が変換された音声信号x′(n)の継続時間を補正し継
続時間が補正された音声信号x″(n)を出力する継続
時間補正部28とを含む。
次に、各演算処理部における処理内容について説明す
る。
まず、短時間フーリエ変換部21において、ディジタル
音声信号x(n)が短時間フーリエ変換され、音声スペ
クトルX(mS,ω)が出力される。短時間フーリエ変換
は次の式(1)によって行なわれる。
ここで、w(n)は分析窓、Sは分析窓(フレーム)
のシフト幅のポイント数、mは分析窓の番号を示す。
次に、スペクトル包絡抽出部22では、スペクトル包絡
V(mS,ω)を抽出するため以下の処理が行なわれる。
すなわち、音声スペクトルX(mS,ω)について対数ス
ペクトル変換が行なわれ、その変換結果について逆離散
的フーリエ変換が行なわれる。その後、コムリフターに
よって声道情報に関するデータを抽出し、そのデータに
ついて離散的フーリエ変換を行ない、さらに、指数変換
を行なうことによってスペクトル包絡V(mS,ω)が抽
出される。
除算部23では、音声スペクトルX(mS,ω)をスペク
トル包絡の絶対値|V(mS,ω)|で除算することによ
り、残差スペクトルである振幅スペクトルG(mS,ω)
を得る。
ピッチ周波数による影響は振幅スペクトルG(mS,
ω)上に高調波成分として現われる。上記のような準同
系処理または線形予測分析法などを用いることによっ
て、高調波成分が除かれたなめらかなスペクトル包絡V
(mS,ω)が抽出される。
第3図は、第1図に示された周波数変換処理部24の構
成を示すブロック図である。また、第4A図および第4B図
は、第3図に示された周波数変換処理部24の各部におけ
る主な信号変換処理を説明するための信号波形図であ
る。第3図、第4A図、および第4B図を参照して、次に周
波数変換処理部24における処理について説明する。
周波数変換処理部24は、線形補間によるピッチ周波数
変換部41と、逆離散的フーリエ変換部42と、0値設定部
43と、離散的フーリエ変換部44と、置換部45とを含む。
ピッチ周波数変換部41では、残差信号の振幅スペクト
ルG(mS,ω)の実数部と虚数部をピッチ周波数の変換
倍率で線形的に伸縮させる。残差信号の振幅スペクトル
G(mS,ω)のピッチ周波数を高くする場合、高域のス
ペクトルを捨て去ることにより周波数帯域を一定に保
つ。一方、ピッチ周波数を低くする場合、振幅スペクト
ルG(mS,ω)の低域のスペクトルを折返して代用す
る。すなわち、第4B図に示すように、もとの音声信号の
振幅スペクトル51を圧縮して圧縮された振幅スペクトル
52を経た後、これをミラー反転させてコピーを行なう。
その後、所定の周波数帯域となるよう帯域を制御する。
上記のような線形補間により得られたピッチ周波数が変
換された振幅スペクトルをGm(mS,ω)で表わす。
この実施例では、第4A図に示すように、もとの音声信
号から音声波形61を256ポイントのハミング窓で切り出
し、波形62で示すように0詰めを行ない、波形61および
62、すなわち信号Xw(mS,n)についての512ポイントの
離散的フーリエ変換により音声スペクトルX(mS,ω)
を得た場合について示されている。
次に、逆離散的フーリエ変換部42において、振幅スペ
クトルGm(mS,ω)を逆離散的フーリエ変換し、一旦第4
A図に示すような音声信号xaに戻す。音声信号xaは、波
形63のように0詰めした部分が0値となっていない。そ
こで、0値設定部43により音声信号xaの0詰め対応部
分、すなわち波形63の部分に再び0値を設定する。その
後離散的フーリエ変換部44により離散的フーリエ変換を
行ない振幅スペクトルG′m(mS,ω)を得る。この振
幅スペクトルG′m(mS,ω)を変換のターゲットであ
る振幅スペクトルGm(mS,ω)により置換部45において
置換え、振幅スペクトルG′(mS,ω)を得る。この振
幅スペクトルG′(mS,ω)について、逆離散的フーリ
エ変換を行なうと、第4A図に示されるような音声波形xb
が得られる。この波形xbでは、0値設定対応部分64のパ
ワーが小さいので、高品質にピッチ周波数の変換が行な
われたことがわかる。
次に、積算部25では、周波数変換処理部24で得られた
振幅スペクトルG′(mS,ω)およびスペクトル包絡抽
出部22で得られたスペクトル包絡の絶対値|V(mS,ω)
|の積算を行なう。これにより、ピッチ周波数が変換さ
れた音声スペクトルX′(mS,ω)が得られる。
その後、逆離散的フーリエ変換部26において、音声ス
ペクトルX′(mS,ω)を逆離散的フーリエ変換し、音
声信号x′(mS,ω)を得る。
第5図は、逆離散的フーリエ変換部26から出力された
音声信号x′(mS,ω)の波形を示す波形図である。第
5図では、分析窓をかけて切り出されたものと音声信号
x(mS,n)の波形と、逆離散的フーリエ変換部26の出
力、すなわち、上記の処理によってピッチ周波数が上げ
られた音声信号x′(mS,ω)の波形とが示される。両
波形とも分析時のフレームシフト幅でずらして表示され
ている。この図からわかるように、もとの音声信号x
(mS,n)では各フレーム間での位相が揃っているのに対
し、ピッチ周波数が変換された音声信号x′(mS,n)で
は各フレーム間の位相が揃っていない。この位相のずれ
を補正するには、ピッチ周波数の変換倍率をkとし、も
との窓のシフト幅をSとして、次の式(2)および
(3)に示される演算を行なうことによって、位相補正
された音声信号x′(n)を得る。これにより得られた
音声信号x′(n)は、もとの音声信号x(mS,n)と同
様に位相の揃ったものとなっている。
第6図は、第1図に示された継続時間補正部28におけ
る処理を示すフロー図である。継続時間補正部28では、
ピッチ周波数変換された音声信号x′(n)の継続時間
が補正され、音声信号x″(n)が出力される。継続時
間補正部28における処理は、第6図にその概略が示され
ているが、これはD.W.Griffin他によって発表された文
献“Signal Estimation from Modified Short-Time Fou
riel Transform"(IEEE ASSP Vol.ASSP-32,No.2,1984)
に見られるものに基づいている。なお、サフィックスi
は処理が繰返して行なわれることを示す。
このように、上記の実施例では、短時間フーリエ分析
を用いてピッチ周波数の変換を行なっているので、高品
質に音声信号の変換を行なうことができる。また、ピッ
チ周波数を変換することによって必要となる位相の補正
を位相補正部27によって簡単に行なうことができる。さ
らに、周波数変換処理部24では、ピッチ周波数の変換を
行なった後、スペクトルの0詰め対応部に0の値を設定
することにより、高品質なピッチ周波数の変換を実現し
ている。また、継続時間補正部28により継続時間をも制
御でき、高品質な音声変換が実現された。
[発明の効果] 請求項1の発明では、周波数変換された信号の位相を
制御する位相制御手段を含むので、高品質にピッチ周波
数が変換された音声の音源信号を容易に得ることができ
る。また、スペクトル変換手段を含むので、高品質な音
声信号を得ることができる。また、スペクトル信号の逆
フーリエ変換により得られた音声信号の位相を分析フレ
ームのシフト幅の制御により行なえるので、音声信号の
位相スペクトルを操作することなく、位相補正を容易に
行なえる。
請求項2の発明では、周波数変換手段が線形伸縮手段
を含むので、高品質にピッチ周波数を変換することがで
きる。
請求項3の発明では、さらに音声信号の継続時間を制
御する手段を含むので、継続時間を所望の値に制御でき
る。
【図面の簡単な説明】
第1図は、第2図に示されるこの発明の一実施例を示す
音声変換装置の演算処理部の例を示すブロック図であ
る。第2図は、この発明の一実施例を示す音声変換装置
のハードウェアの構成を示すブロック図である。第3図
は、第1図に示された周波数変換処理部の構成を示すブ
ロック図である。第4A図および第4B図は、第3図に示さ
れた周波数変換処理部の各部における信号変換処理を説
明するための信号波形図である。第5図は、第1図に示
された逆離散的フーリエ変換部から出力された音声信号
の波形を示す波形図である。第6図は、第1図に示され
た継続時間補正部における処理を示すフロー図である。 図において、1はA/D変換器、2は演算処理部、3はメ
モリ部、21は短時間フーリエ変換部、22はスペクトル包
絡抽出部、23は除算部、24は周波数変換処理部、25は積
算部、26は逆離散的フーリエ変換部、27は位相補正部、
28は継続時間補正部である。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 桑原 尚夫 京都府相楽郡精華町大字乾谷小字三平谷 5番地 株式会社エイ・ティ・アール自 動翻訳電話研究所内 (56)参考文献 特開 昭62−135900(JP,A) 特開 昭58−168098(JP,A)

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】ディジタル変換された第1の音声信号を受
    け、フーリエ変換によりスペクトル信号に変換するフー
    リエ変換手段と、 前記フーリエ変換手段からスペクトル信号を受け、スペ
    クトル信号の中から音源情報信号を選択的に出力する選
    択手段と、 前記選択手段から音源情報信号を受け、音源情報信号の
    ピッチ周波数を変換し、周波数変換された信号を出力す
    る周波数変換手段と、 前記フーリエ変換手段からスペクトル信号に含まれるス
    ペクトル包絡信号と前記周波数変換手段から出力された
    信号とに応答してピッチ周波数が変換されたスペクトル
    信号を出力するスペクトル変換手段と、 前記スペクトル変換手段からピッチ周波数が変換された
    スペクトル信号を分析フレーム毎に受け、これを逆フー
    リエ変換により第2の音声信号に変換する逆フーリエ変
    換手段と、 前記逆フーリエ変換手段から第2の音声信号を受け、ピ
    ッチ周波数の変換倍率に応答して第2の音声信号の位相
    を分析フレームのシフト幅によって制御する位相制御手
    段とを含む、音声変換装置。
  2. 【請求項2】前記周波数変換手段は、前記選択手段から
    音源情報信号を受け、ピッチ周波数の変換倍率に応答し
    て音源情報信号を線形的に伸縮させる線形伸縮手段を含
    む、請求項1に記載の音声変換装置。
  3. 【請求項3】前記位相制御手段から位相が制御された第
    2の音声信号を受け、その第2の音声信号の継続時間を
    制御する時間制御手段を含む、請求項1または2に記載
    の音声変換装置。
JP63293061A 1988-11-18 1988-11-18 音声変換装置 Expired - Lifetime JP2753716B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63293061A JP2753716B2 (ja) 1988-11-18 1988-11-18 音声変換装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63293061A JP2753716B2 (ja) 1988-11-18 1988-11-18 音声変換装置

Publications (2)

Publication Number Publication Date
JPH02137900A JPH02137900A (ja) 1990-05-28
JP2753716B2 true JP2753716B2 (ja) 1998-05-20

Family

ID=17789958

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63293061A Expired - Lifetime JP2753716B2 (ja) 1988-11-18 1988-11-18 音声変換装置

Country Status (1)

Country Link
JP (1) JP2753716B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1696419A1 (en) 2005-02-28 2006-08-30 Casio Computer Co., Ltd. Sound effecter, fundamental tone extraction method, and computer program

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62135900A (ja) * 1985-12-10 1987-06-18 松下電器産業株式会社 規則音声合成方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1696419A1 (en) 2005-02-28 2006-08-30 Casio Computer Co., Ltd. Sound effecter, fundamental tone extraction method, and computer program
US7342168B2 (en) 2005-02-28 2008-03-11 Casio Computer Co., Ltd. Sound effecter, fundamental tone extraction method, and computer program

Also Published As

Publication number Publication date
JPH02137900A (ja) 1990-05-28

Similar Documents

Publication Publication Date Title
JP2763322B2 (ja) 音声処理方法
JP3266819B2 (ja) 周期信号変換方法、音変換方法および信号分析方法
JP4170217B2 (ja) ピッチ波形信号生成装置、ピッチ波形信号生成方法及びプログラム
JP4031813B2 (ja) オーディオ信号処理装置、オーディオ信号処理方法およびその方法をコンピュータに実行させるプログラム
US4486899A (en) System for extraction of pole parameter values
JP2009501958A (ja) オーディオ信号修正
JP3278863B2 (ja) 音声合成装置
JP3871657B2 (ja) 話速変換装置、方法、及びそのプログラム
JP2753716B2 (ja) 音声変換装置
JP2003044077A (ja) 音声特徴量抽出方法と装置及びプログラム
JP5830364B2 (ja) 韻律変換装置およびそのプログラム
JP2001117600A (ja) 音声信号処理装置および音声信号処理方法
JP3197975B2 (ja) ピッチ制御方法及び装置
JP2612867B2 (ja) 音声ピッチ変換方法
JP3035939B2 (ja) 音声分析合成装置
JPH05241598A (ja) 音声発声速度制御方法
JP2899533B2 (ja) 音質改善装置
JPH09510554A (ja) 言語合成
JP3302075B2 (ja) 合成パラメータ変換方法および装置
JP3929365B2 (ja) 音声信号処理方法、装置及び音声信号処理プログラム
JP3557124B2 (ja) 音声変形方法、その装置、及びプログラム記録媒体
JP3125936B2 (ja) 音声ピッチ変換装置
JP2002515608A (ja) 発声された表出のスペクトル的な音声特徴を求める方法および装置
JPH07219597A (ja) ピッチ変換装置
JP2000259164A (ja) 音声データ作成装置および声質変換方法