JP2000163097A - 音声変換装置、音声変換方法および音声変換プログラムを記録したコンピュータ読み取り可能な記録媒体 - Google Patents

音声変換装置、音声変換方法および音声変換プログラムを記録したコンピュータ読み取り可能な記録媒体

Info

Publication number
JP2000163097A
JP2000163097A JP10352186A JP35218698A JP2000163097A JP 2000163097 A JP2000163097 A JP 2000163097A JP 10352186 A JP10352186 A JP 10352186A JP 35218698 A JP35218698 A JP 35218698A JP 2000163097 A JP2000163097 A JP 2000163097A
Authority
JP
Japan
Prior art keywords
voice
conversion
speech
pitch
converting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10352186A
Other languages
English (en)
Inventor
Atsushi Yamane
淳 山根
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP10352186A priority Critical patent/JP2000163097A/ja
Publication of JP2000163097A publication Critical patent/JP2000163097A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

(57)【要約】 【課題】 6kbps〜16kbpsあたりのビットレ
ートにおいて良好な音声が得られると共に、その音声の
ピッチを自在に変更できるようにする。 【解決手段】 入力されたアナログ音声波形をA/D変
換部12によりディジタル音声信号に変換した後、音声
符号化部14がCELP符号化方式により符号化を行
い、この符号化処理中に抽出されるピッチ情報は、次段
のピッチ変換部16にも送られる。ピッチ変換部16で
は、装置利用者が所望のピッチ変換倍率を入力すると、
それに応じて入力されるピッチ情報が変換処理される。
音声復号化部18では、ピッチ変換部16で変換された
ピッチ情報と、音声符号化部14によって抽出・符号化
された情報とを用いて、CELP方式による復号化処理
が行われ、符号化されたディジタル音声信号が復号化さ
れる。D/A変換部20では、音声復号化部18で復号
化されたディジタル音声信号がアナログ音声信号に変換
される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声変換装置、音
声変換方法および記録媒体に関し、より詳しくは、音声
信号のピッチを変換することができる音声変換装置、音
声変換方法および音声変換プログラムを記録したコンピ
ュータ読み取り可能な記録媒体に関する。
【0002】
【従来の技術】従来より、ファクシミリ・モデムやデー
タモデムなどの付加機能として、留守番電話のための音
声符号化/復号化機能を備えたものが求められており、
この符号化/復号化のための低ビットレートの音声圧縮
符号化手法の開発が望まれていると共に、ピッチ変換を
自在に行うことのできる再生機構が求められていた。
【0003】現在の10kbps以下の低ビットレート
音声圧縮符号化方式の主流は、CELP(Code Excite
d Linear Prediction coding system )である。こ
のCELPは、線形予測に基づく音声のAR(Auto - R
egressive :自己回帰)モデルに基づくモデルベースの
圧縮符号化方式である。
【0004】CELP方式の符号化側では、音声をフレ
ームあるいはサブフレームと呼ばれる単位に分割し、そ
れぞれの単位について、そのスペクトル包絡を表わすL
PC(Linear Prediction Coefficients:線形予測)
係数、そのピッチ情報を表わすピッチラグ情報、音源情
報である雑音(源)情報、およびピッチラグ情報および
雑音源情報に対する利得情報に対応したパラメータを抽
出し、それぞれを符号化して、格納あるいは伝送する。
【0005】また、CELP方式の復号側では、符号化
された各情報を復元し、雑音源情報とピッチ情報と利得
情報とによって励振源信号を生成し、この励振源信号を
LPC係数で構成される線形予測合成フィルタに通し
て、合成音声を得るものである。
【0006】このため、CELP方式は、10kbps
の低ビットレートにおいて良好な音声が得られるととも
に、その符号化処理において高精度なピッチ情報を抽出
することができるという利点を有している。このCEL
P方式に関する参考文献としては、例えば、M.R.S
chroeder,and B.S.Atal,“Co
de−Excited Linear Predict
ion(CELP):High Quality Sp
eech at Very Low BitRate
s,”Proc.ICASSP,pp.937−940
(1985)などがある。
【0007】また、音声信号を蓄積して再生することが
できる音声変換装置などでは、音韻を変えることなく音
声ピッチを変換するようなピッチ変換機能が求められて
いる。
【0008】ところが、上記したようなCELPなどの
高能率符号化方式を用いた従来の音声変換装置にあって
は、ピッチ変換に対する考慮がなされていなかったた
め、復号化された音声を外部に接続したピッチ変換装置
などに通してピッチ変換する必要があるため、装置全体
が大型化すると共に、構成が複雑になるという問題点が
あった。
【0009】そこで、この問題点を解決するものとし
て、例えば特開平9−190196号公報に開示されて
いるように、ハーモニクス符号化方式を用いて入力され
たデータのハーモニクスの基本周波数と所定の帯域内に
おける個数を変換し、入力された各ハーモニクスにおけ
るスペクトルの大きさを表わすデータの個数を補間処理
して、ピッチを変更するものがあった。
【0010】また、例えば特開平10−149199号
公報に開示されているように、線形予測残差に基づいて
サイン波分析符号化を行う符号化方式を用いて、ハーモ
ニクスの本数を所定数とするデータ数変換を行って、ピ
ッチを変更するものがあった。
【0011】
【発明が解決しようとする課題】しかしながら、上記公
報例の場合は、外部にピッチ変換装置を接続することな
くピッチ変換を行うことができる反面、CELP符号化
方式を用いていないため、CELP符号化方式が得意と
するところの、6kbps〜16kbpsあたりのビッ
トレートにおいて良好な音声が得られないという問題点
があった。
【0012】本発明は、上記に鑑みてなされたものであ
って、6kbps〜16kbpsあたりのビットレート
において良好な音声が得られると共に、その音声のピッ
チを自在に変更できるようにすることを目的とする。
【0013】
【課題を解決するための手段】上記の目的を達成するた
めに、請求項1に記載の音声変換装置は、アナログ音声
波形をディジタル音声信号に変換するA/D変換手段
と、前記ディジタル音声信号をCELP符号化方式によ
り符号化する音声符号化手段と、前記音声符号化手段に
よる符号化処理中に抽出されたピッチ情報を利用者の入
力に基づいて変換するピッチ変換手段と、前記ピッチ変
換手段によって変換されたピッチ情報および前記音声符
号化手段によって抽出・符号化された情報を用いてディ
ジタル音声信号を復号化する音声復号化手段と、前記音
声復号化手段によって復号化されたディジタル音声信号
をアナログ音声信号に変換するD/A変換手段と、を備
えている。
【0014】これによれば、音声符号化手段によりディ
ジタル音声信号に符号化する際に、音声のピッチに相当
するパラメータを適応符号帳探索によって抽出・符号化
するCELP符号化方式を用いており、この抽出された
ピッチを利用者の入力に基づいてピッチ変換手段により
変換するようにしたため、他のスペクトルパラメータを
変換することなく、音声の高さを自在に変更することが
できる。
【0015】また、請求項2に記載の音声変換装置は、
請求項1に記載の音声変換装置において、前記音声符号
化手段によって抽出された音声スペクトルパラメータを
利用者の入力に応じて変換するスペクトル変換手段をさ
らに備えている。
【0016】これによれば、音声符号化手段で抽出され
た音声スペクトルパラメータを利用者の入力に応じて変
換するスペクトル変換手段をさらに備えているため、例
えば、男性音と女性音といった2者の音声を相互に変換
する処理などを行うことができる。
【0017】また、請求項3に記載の音声変換装置は、
アナログ音声波形をディジタル音声信号に変換するA/
D変換手段と、前記ディジタル音声信号をCELP符号
化方式により符号化する音声符号化手段と、前記音声符
号化手段において抽出・符号化されたパラメータを蓄積
する蓄積手段と、前記蓄積手段から読み出したピッチ情
報を利用者の入力に基づいて変換するピッチ変換手段
と、前記ピッチ変換手段によって変換されたピッチ情報
および前記蓄積手段から読み出された符号化情報を用い
てディジタル音声信号を復号化する音声復号化手段と、
前記音声復号化手段によって復号化されたディジタル音
声信号をアナログ音声信号に変換するD/A変換手段
と、を備えている。
【0018】これによれば、音声符号化手段によりディ
ジタル音声信号を符号化する際に、音声のピッチに相当
するパラメータを適応符号帳探索によって抽出・符号化
するCELP符号化方式を用いているとともに、この符
号化パラメータを蓄積手段によって蓄積することができ
るため、必ずしも音声入力と同時に音声変換する必要が
なく、蓄積されている符号化パラメータを蓄積手段から
適宜読み出してピッチ変換手段により利用者の入力に基
づいて変換することにより、他のスペクトルパラメータ
を変換せずに、音声の高さを自在に変更することができ
る。
【0019】また、請求項4に記載の音声変換装置は、
請求項3に記載の音声変換装置において、前記蓄積手段
から読み出された音声スペクトルパラメータを利用者の
入力に応じて変換するスペクトル変換手段をさらに備え
ている。
【0020】これによれば、音声符号化手段で抽出され
た音声スペクトルパラメータを蓄積手段に蓄積し、この
蓄積手段から読み出した音声スペクトルパラメータを利
用者の入力に応じて変換するスペクトル変換手段をさら
に備えているため、例えば、男性音と女性音といった2
者の音声を相互に変換する処理などを容易に行うことが
できる。
【0021】また、請求項5に記載の音声変換方法は、
アナログ音声波形をディジタル音声信号に変換するA/
D変換工程と、前記ディジタル音声信号をCELP符号
化方式により符号化する音声符号化工程と、前記音声符
号化工程における符号化処理中に抽出されたピッチ情報
を利用者の入力に基づいて変換するピッチ変換工程と、
前記ピッチ変換工程で変換されたピッチ情報および前記
音声符号化工程で抽出・符号化された情報を用いてディ
ジタル音声信号を復号化する音声復号化工程と、前記音
声復号化工程で復号化されたディジタル音声信号をアナ
ログ音声信号に変換するD/A変換工程と、を含んでい
る。
【0022】これによれば、音声符号化工程によりディ
ジタル音声信号に符号化する際に、音声のピッチに相当
するパラメータを適応符号帳探索によって抽出・符号化
するCELP符号化方式を用いており、この抽出された
ピッチをピッチ変換工程により利用者の入力に基づいて
変換するようにしたため、他のスペクトルパラメータを
変換せずに、音声の高さを自在に変更することができ
る。
【0023】また、請求項6に記載の音声変換方法は、
請求項5に記載の音声変換方法において、前記音声符号
化工程で抽出された音声スペクトルパラメータを利用者
の入力に応じて変換するスペクトル変換工程をさらに含
んでいる。
【0024】これによれば、音声符号化工程で抽出され
た音声スペクトルパラメータを利用者の入力に応じて変
換するスペクトル変換工程をさらに備えているため、例
えば、男性音と女性音といった2者の音声を相互に変換
する処理などを行うことができる。
【0025】また、請求項7に記載の音声変換方法は、
アナログ音声波形をディジタル音声信号に変換するA/
D変換工程と、前記ディジタル音声信号をCELP符号
化方式により符号化する音声符号化工程と、前記音声符
号化工程において抽出・符号化されたパラメータを蓄積
する蓄積工程と、前記蓄積工程で蓄積されたピッチ情報
を読み出して利用者の入力に基づいて変換するピッチ変
換工程と、前記ピッチ変換工程で変換されたピッチ情報
および前記蓄積工程で蓄積された符号化情報を用いてデ
ィジタル音声信号を復号化する音声復号化工程と、前記
音声復号化工程で復号化されたディジタル音声信号をア
ナログ音声信号に変換するD/A変換工程と、を含んで
いる。
【0026】これによれば、音声符号化工程によりディ
ジタル音声信号に符号化する際に、音声のピッチに相当
するパラメータを適応符号帳探索によって抽出・符号化
するCELP符号化方式を用いているとともに、この符
号化パラメータを蓄積する蓄積工程を持っているため、
必ずしも音声入力と同時に音声変換する必要がなく、蓄
積された符号化パラメータを蓄積工程で適宜読み出し
て、ピッチ変換工程で利用者の入力に基づいて変換する
ことにより、他のスペクトルパラメータを変換せずに、
音声の高さを自在に変更することができる。
【0027】また、請求項8に記載の音声変換方法は、
請求項7に記載の音声変換方法において、前記蓄積工程
で蓄積された音声スペクトルパラメータを読み出して利
用者の入力に応じて変換するスペクトル変換工程をさら
に含んでいる。
【0028】これによれば、音声符号化工程で抽出され
た音声スペクトルパラメータを蓄積工程で蓄積し、この
蓄積工程で読み出した音声スペクトルパラメータを利用
者の入力に応じてスペクトル変換工程により変換するた
め、例えば、男性音と女性音といった2者の音声を相互
に変換する処理などを容易に行うことができる。
【0029】また、請求項9に記載の音声変換プログラ
ムを記録したコンピュータ読み取り可能な記録媒体は、
アナログ音声波形をディジタル音声信号に変換するA/
D変換手順と、前記ディジタル音声信号をCELP符号
化方式により符号化する音声符号化手順と、前記音声符
号化手順において符号化処理中に抽出されたピッチ情報
を利用者の入力に基づいて変換するピッチ変換手順と、
前記ピッチ変換手順によって変換されたピッチ情報およ
び前記音声符号化手順によって抽出・符号化された情報
を用いてディジタル音声信号を復号化する音声復号化手
順と、前記音声復号化手順によって復号化されたディジ
タル音声信号をアナログ音声信号に変換するD/A変換
手順と、を含むものである。
【0030】これによれば、音声符号化手順によりディ
ジタル音声信号に符号化する際に、音声のピッチに相当
するパラメータを適応符号帳探索によって抽出・符号化
するCELP符号化手順を用いており、この抽出された
ピッチをピッチ変換手順により利用者の入力に基づいて
変換するため、他のスペクトルパラメータを変換するこ
となく、音声の高さを自在に変更することができる。
【0031】また、請求項10に記載の音声変換プログ
ラムを記録したコンピュータ読み取り可能な記録媒体
は、請求項9に記載の記録媒体において、前記音声符号
化手順によって抽出された音声スペクトルパラメータを
利用者の入力に応じて変換するスペクトル変換手順をさ
らに含むものである。
【0032】これによれば、音声符号化手順で抽出され
た音声スペクトルパラメータを利用者の入力に応じて変
換するスペクトル変換手順をさらに備えているため、例
えば、男性音と女性音といった2者の音声を相互に変換
する処理などを行うことができる。
【0033】また、請求項11に記載の音声変換プログ
ラムを記録したコンピュータ読み取り可能な記録媒体
は、アナログ音声波形をディジタル音声信号に変換する
A/D変換手順と、前記ディジタル音声信号をCELP
符号化方式により符号化する音声符号化手順と、前記音
声符号化手順で抽出・符号化されたパラメータを蓄積す
る蓄積手順と、前記蓄積手順で蓄積されたピッチ情報を
読み出して利用者の入力に基づいて変換するピッチ変換
手順と、前記ピッチ変換手順で変換されたピッチ情報お
よび前記蓄積手順で蓄積された符号化情報を用いてディ
ジタル音声信号を復号化する音声復号化手順と、前記音
声復号化手順で復号化されたディジタル音声信号をアナ
ログ音声信号に変換するD/A変換手順と、を含むもの
である。
【0034】これによれば、音声符号化手順によりディ
ジタル音声信号に符号化する際に、音声のピッチに相当
するパラメータを適応符号帳探索によって抽出・符号化
するCELP符号化方式を用いているとともに、この符
号化パラメータを蓄積する蓄積手順を持っているため、
必ずしも音声入力と同時に音声変換する必要がなく、蓄
積された符号化パラメータを蓄積手順で適宜読み出し
て、ピッチ変換手順で利用者の入力に基づいて変換する
ことにより、他のスペクトルパラメータを変換せずに、
音声の高さを自在に変更することができる。
【0035】また、請求項12に記載の音声変換プログ
ラムを記録したコンピュータ読み取り可能な記録媒体
は、請求項11に記載の記録媒体において、前記蓄積手
順で蓄積された音声スペクトルパラメータを読み出して
利用者の入力に応じて変換するスペクトル変換手順をさ
らに含むものである。
【0036】これによれば、音声符号化手順で抽出され
た音声スペクトルパラメータを蓄積手順に蓄積し、この
蓄積手順から読み出した音声スペクトルパラメータを利
用者の入力に応じてスペクトル変換手順により変換する
ため、例えば、男性音と女性音といった2者の音声を相
互に変換する処理などを容易に行うことができる。
【0037】
【発明の実施の形態】以下、本発明の音声変換装置、音
声変換方法および音声変換プログラムを記録したコンピ
ュータ読み取り可能な記録媒体の実施の形態について、
添付の図面を参照して詳細に説明する。
【0038】(実施の形態1)図1は、本実施の形態1
に係る音声変換装置の概略構成を説明するブロック図で
ある。実施の形態1の音声変換装置としては、アナログ
音声信号をディジタル音声信号に変換し、音声符号化、
データ圧縮、ベクトル量子化などを行い、留守番電話や
音声応答システム、あるいはボイスメールなどに用いら
れる音声圧縮符号化装置10を例とする。図1の音声圧
縮符号化装置10は、A/D変換手段としてのA/D変
換部12、音声符号化手段としての音声符号化部14、
ピッチ変換手段としてのピッチ変換部16、音声復号化
手段としての音声復号化部18、およびD/A変換手段
としてのD/A変換部20などを備えている。
【0039】A/D変換部12は、入力されたアナログ
音声波形をディジタル音声信号に変換するものであり、
例えば、A/DコンバータやPC用サウンドボードなど
が挙げられる。
【0040】音声符号化部14は、前段のA/D変換部
12から入力されるディジタル音声信号を後述するCE
LP符号化方式によって符号化するものである。また、
この符号化処理中に抽出されるピッチ情報は、次段のピ
ッチ変換部16にも送られる。
【0041】ピッチ変換部16は、装置の利用者が所望
のピッチ変換倍率を入力すると、それに応じて前段の音
声符号化部14で符号化処理中に抽出されたピッチ情報
を変換処理するものである。
【0042】音声復号化部18は、前記ピッチ変換部1
6によって変換されたピッチ情報と、前記音声符号化部
14によって抽出・符号化された情報とを用いて、ここ
ではCELP方式による復号化処理を行って、符号化さ
れたディジタル音声信号を復号化するものである。
【0043】D/A変換部20は、前記音声復号化部1
8において復号化されたディジタル音声信号をアナログ
音声信号に変換するものである。
【0044】次に、上記のCELP方式を用いた音声変
換処理手順について図2の流れ図を用いて説明する。C
ELP方式とは、線形予測に基づく音声のAR( Auto
- Regressive:自己回帰)モデルに基づいたモデルベー
スの圧縮符号化方式のことである。
【0045】まず、符号化側では、ディジタル音声信号
をフレームと呼ばれる単位に分割する(ステップS
1)。
【0046】そして、各フレームについて、そのスペク
トル包絡を表わすLPC( LinearPrediction Coeffic
ients:線形予測)係数を抽出する。このLPC係数の
抽出方法としては、ここではフレーム信号の自己相関関
数を計算してダービン(Durbin)の再帰解法を適用する
という一般的な手法を用いているが、必ずしもこれに限
定されない。さらに、LPC係数は、量子化され、符号
化される(ステップS2)。このLPC係数の量子化に
は、量子化効率の良いLSP(Line SpectrumPair:線
スペクトル対)パラメータが用いられることが多い。
【0047】また、各フレームに対して、そのピッチ的
な性質を符号化するために、適応符号帳探索が行われる
(ステップS3)。これは、処理フレーム以前の線形予
測残差信号列から、各ピッチに対する処理フレームの残
差信号列(適応符号ベクトル)を構成し、さらに各適応
符号ベクトルに対するLPCフィルタ出力を求め、ゲイ
ン・シェイプ(Gain - Sape )型のベクトル量子化によ
って最適な適応符号ベクトルLPCフィルタ出力、すな
わち、最適な適応符号ベクトルおよび最適なピッチを求
めるものである。このようにして、各ピッチに対して与
えられる符号が適応符号となる。
【0048】また、各フレーム信号から適応符号帳探索
によって求められた最適な適応符号ベクトルのLPCフ
ィルタ出力を差し引き、予め用意された雑音符号帳内の
各ベクトル(雑音符号ベクトル)に対してLPCフィル
タ出力を求め、適応符号帳探索と同様に最適な雑音符号
ベクトルを求める(ステップS4)。各雑音符号ベクト
ルに対して与えられる符号が雑音符号となる。
【0049】さらに、最適な適応符号ベクトルおよび最
適な雑音符号ベクトルのそれぞれに対応する利得情報が
利得符号帳を用いることによって量子化および符号化さ
れる(ステップS5)。最適な適応符号ベクトルおよび
最適な雑音符号ベクトルそれぞれの利得情報の符号化方
法としては、適応符号帳探索および雑音符号帳探索のそ
れぞれが終了した際に逐次行う場合と、両者の探索が終
了したと同時にベクトル量子化を行う場合とがある。
【0050】また、雑音符号帳検索の際に、SNR( S
ignal - Noise Ratio:信号体雑音比)を改善するため
に、各雑音符号ベクトルを最適な適応符号ベクトルに直
交化してから探索を行うようにすることもできる。
【0051】さらに、適応符号帳探索および雑音符号帳
探索および最適な適応符号ベクトルおよび最適な雑音符
号ベクトルに対する利得の量子化および符号化は、サブ
フレームと呼ばれる前記フレームをさらに分割した処理
単位に対して行うようにしても良い。
【0052】さらにまた、適応符号帳探索、雑音符号帳
探索、および利得の量子化・符号化においては、人間の
聴覚特性に基づいた重み付け処理を行うことにより、聴
覚的に最適な探索および量子化・符号化を行って、符号
化品質を向上させることができる。
【0053】一般にCELP方式は、音声の蓄積や伝送
に用いられ、そのような場合は、LPC(しばしばLS
P)量子化符号、適応符号、雑音符号、および利得符号
などの符号化パラメータは、蓄積あるいは伝送される。
【0054】復号時には、それぞれ符号化パラメータを
復号し(ステップS6,ステップS7)、雑音符号ベク
トルおよび適応符号ベクトルおよび利得情報から励振源
ベクトルを構成し、復号されたLPC係数によって構成
されるLPC合成フィルタによって復号ディジタル音声
信号を構成する(ステップS8)。
【0055】本実施の形態1によれば、CELP方式に
よる適応符号帳探索(ステップS3)において求めた最
適なピッチを利用者の入力(ここでは、ピッチ変換倍
率)に応じて変換した後(ステップS9)、そのピッチ
情報を復号化し(ステップS7)、LPCフィルタリン
グを行うことにより(ステップS8)、利用者が所望の
ピッチ、すなわち、所望の声の高さを持った音声に自在
に変換することができる。このように、CELP符号化
方式を採用したため、適応符号帳探索においてピッチを
抽出・符号化する際に、利用者によってあらかじめ設定
された倍率でピッチを変換し、変換後のピッチを用いて
雑音符号帳探索以後の処理を行うことによって、再生音
のピッチを自在に変更することが可能となる。
【0056】また、本実施の形態1の音声圧縮符号化装
置10は、蓄積目的で利用するものでないため、ピッチ
情報以外のパラメータについては、量子化前の値をその
まま用いることができるので、LPC係数など量子化後
のものを用いる場合と比較すると、高品質な再生音声を
得ることができる。
【0057】(実施の形態2)図3は、本実施の形態2
に係る音声変換装置の概略構成を説明するブロック図で
ある。図3の音声変換装置も上記実施の形態1と同様
に、留守番電話や音声応答システム、あるいはボイスメ
ールなどに用いられる音声圧縮符号化装置30である。
【0058】本実施の形態2における特徴的な構成は、
図3に示されるように、音声符号化部14でCELP方
式によって符号化した音声スペクトルパラメータを利用
者の入力に応じて変換するスペクトル変換手段としての
スペクトル変換部32を図1の音声符号化部14と音声
復号化部18との間に設けた点にある。なお、スペクト
ル変換部32以外の構成については、実施の形態1と同
様であるので説明を省略する。
【0059】すなわち、このスペクトル変換部32は、
例えば同一の文章を男女の発声者によって発声してもら
ったデータを予め取得しておき、同一の母音に対するL
SPなどの音声スペクトルパラメータの対応を学習して
男性音と女性音などの対応表を作成しておくことによ
り、この対応表に基づいて音声を所望の音質に変換でき
るようにしたものである。
【0060】このように、本実施の形態2によれば、音
声符号化部14で抽出された音声スペクトルパラメータ
を利用者の入力に応じてスペクトル変換部32で変換す
ることにより、男性音と女性音のように異なる音質から
成る2つの音声を相互変換する処理が可能となる。
【0061】なお、本実施の形態2では、男性音と女性
音の対応表を作成した例をあげたが、これ以外にも子供
の声と老人の声、あるいは、艶のある声とハスキーヴォ
イスなど、種々の対応表を作成しておくことにより、所
望の音声への変換が自由に選択できるようになるととも
に、これらを組み合わせた合成音声を作成することも可
能となる。
【0062】(実施の形態3)図4は、本実施の形態3
に係る音声変換装置の概略構成を説明するブロック図で
ある。図4の音声変換装置も上記実施の形態1および2
と同様に、留守番電話や音声応答システム、あるいはボ
イスメールなどに用いられる音声圧縮符号化装置40で
ある。
【0063】本実施の形態3の特徴的な構成は、図4に
示されるように、音声符号化部14で符号化された符号
化情報を一旦蓄積する蓄積手段としての蓄積部42が図
1の音声符号化部14と音声復号化部18との間に設け
られ、ピッチ変換部16に入力されるピッチ情報もこの
蓄積部42から供給されるようにした点にある。なお、
蓄積部42以外の構成については、実施の形態1と同様
であるので説明を省略する。
【0064】すなわち、この蓄積部42は、音声符号化
部14で符号化された符号化情報を一旦蓄積できること
から、アナログ音声信号の入力と同時に音声変換処理す
る必要が無くなり、蓄積部42に一度圧縮・蓄積された
符号化情報を適宜読み出すことによって、実施の形態1
と同様の音声変換処理が行えるようにしたものである。
【0065】このように、本実施の形態3によれば、音
声符号化部14によりディジタル音声信号を符号化する
際に、音声のピッチに相当するパラメータを適応符号帳
探索によって抽出・符号化するCELP符号化方式を用
いていると共に、この符号化パラメータを蓄積部42に
蓄積することができるため、他のスペクトルパラメータ
を変換することなく、音声の高さを自在に変更すること
ができる。
【0066】(実施の形態4)図5は、本実施の形態4
に係る音声変換装置の概略構成を説明するブロック図で
ある。図5の音声変換装置も上記実施の形態1〜3と同
様に、留守番電話や音声応答システム、あるいはボイス
メールなどに用いられる音声圧縮符号化装置50であ
る。
【0067】本実施の形態4の特徴的な構成は、図5に
示されるように、音声符号化部14でCELP方式によ
って符号化した音声スペクトルパラメータを利用者の入
力に応じて変換するスペクトル変換手段としてのスペク
トル変換部52を上記実施の形態3の図4の蓄積部42
と音声復号化部18との間に設けた点にある。なお、ス
ペクトル変換部32以外の構成については、上記実施の
形態1および3と同様であるので説明を省略する。
【0068】また、スペクトル変換部52の構成につい
ても、実施の形態2で説明したスペクトル変換部32と
同様であって、同一の文章を男女の発声者によって発声
してもらったデータを予め取得し、同一の母音に対する
LSPなどの音声スペクトルパラメータの対応を学習し
て男性音と女性音などの対応表を作成し、この対応表に
基づいて音声を所望の音質に変換するものである。
【0069】すなわち、本実施の形態4は、蓄積部42
が付加された実施の形態3の音声圧縮符号化装置に、上
記実施の形態2におけるスペクトル変換部32(実施の
形態4の図5では52)をさらに付加することにより、
音声符号化部14で抽出された音声スペクトルパラメー
タを蓄積部42に一度圧縮・蓄積し、この蓄積部42か
ら適宜音声スペクトルパラメータを読み出して、利用者
の入力に応じてスペクトル変換部52で変換できるよう
にしたものである。
【0070】このように、本実施の形態4によれば、音
声符号化部14によりディジタル音声信号を符号化する
際に、音声のピッチに相当するパラメータを適応符号帳
探索によって抽出・符号化するCELP符号化方式を用
いていると共に、この符号化パラメータを蓄積部42に
蓄積することができるため、他のスペクトルパラメータ
を変換せずに、音声の高さを自在に変更することができ
る。また、蓄積部42に蓄積された音声スペクトルパラ
メータを利用者の入力に応じてスペクトル変換部52で
変換することができるため、ここでは、男性音と女性音
のように異なる音質から成る2者の音声を相互変換する
処理が可能となる。
【0071】なお、本実施の形態4のスペクトル変換部
52は、実施の形態2の場合と同様に、男性音と女性音
の対応表を作成した例で説明したが、勿論これに限定さ
れるものではなく、種々の対応表を作成することによ
り、所望の音声に変換することができると共に、これら
を組み合わせて合成音声を作成することも可能である。
【0072】また、上記したように、図1〜図5を用い
て実施の形態1〜4で説明した音声変換処理に関する音
声変換プログラムを光ディスク、光磁気ディスク、磁気
テープなどの記録媒体に記録し、この記録媒体から読み
出された音声変換プログラムに基づいて、上記と同様の
音声変換処理を実行するようにしても良い。
【0073】
【発明の効果】以上説明したように、本発明の音声変換
装置(請求項1)によれば、音声符号化手段によりディ
ジタル音声信号に符号化する際に、音声のピッチに相当
するパラメータを適応符号帳探索によって抽出・符号化
するCELP符号化方式を用いており、この抽出された
ピッチを利用者の入力に基づいてピッチ変換手段により
変換するようにしたので、他のスペクトルパラメータを
変換することなく、音声の高さを自在に変更することが
できる。換言すれば、6kbps〜16kbpsあたり
のビットレートにおいて良好な音声が得られると共に、
その音声のピッチを自在に変更できるようにすることが
できる。
【0074】本発明の音声変換装置(請求項2)によれ
ば、請求項1に記載の音声変換装置において、音声符号
化手段で抽出された音声スペクトルパラメータを利用者
の入力に応じて変換するスペクトル変換手段をさらに備
えているので、男性音と女性音といったような2者の音
声を相互に変換する処理などを行うことができる。
【0075】本発明の音声変換装置(請求項3)によれ
ば、音声符号化手段によりディジタル音声信号を符号化
する際に、音声のピッチに相当するパラメータを適応符
号帳探索によって抽出・符号化するCELP符号化方式
を用いているとともに、この符号化パラメータを蓄積手
段によって蓄積することができるので、必ずしも音声入
力と同時に音声変換する必要がなく、蓄積されている符
号化パラメータを蓄積手段から適宜読み出してピッチ変
換手段により利用者の入力に基づいて変換することによ
り、他のスペクトルパラメータを変換せずに、音声の高
さを自在に変更することができる。
【0076】本発明の音声変換装置(請求項4)によれ
ば、請求項3に記載の音声変換装置において、音声符号
化手段で抽出された音声スペクトルパラメータを蓄積手
段に蓄積し、この蓄積手段から読み出した音声スペクト
ルパラメータを利用者の入力に応じて変換するスペクト
ル変換手段をさらに備えているので、男性音と女性音と
いった2者の音声を相互に変換する処理などを容易に行
うことができる。
【0077】本発明の音声変換方法(請求項5)によれ
ば、音声符号化工程によりディジタル音声信号に符号化
する際に、音声のピッチに相当するパラメータを適応符
号帳探索によって抽出・符号化するCELP符号化方式
を用いており、この抽出されたピッチをピッチ変換工程
により利用者の入力に基づいて変換するようにしたの
で、他のスペクトルパラメータを変換せずに、音声の高
さを自在に変更することができる。
【0078】本発明の音声変換方法(請求項6)によれ
ば、請求項5に記載の音声変換方法において、音声符号
化工程で抽出された音声スペクトルパラメータを利用者
の入力に応じて変換するスペクトル変換工程をさらに備
えているので、男性音と女性音といった2者の音声を相
互に変換する処理などを行うことができる。
【0079】本発明の音声変換方法(請求項7)によれ
ば、音声符号化工程によりディジタル音声信号に符号化
する際に、音声のピッチに相当するパラメータを適応符
号帳探索によって抽出・符号化するCELP符号化方式
を用いているとともに、この符号化パラメータを蓄積す
る蓄積工程を持っているので、必ずしも音声入力と同時
に音声変換する必要がなく、蓄積された符号化パラメー
タを蓄積工程で適宜読み出して、ピッチ変換工程で利用
者の入力に基づいて変換することにより、他のスペクト
ルパラメータを変換せずに、音声の高さを自在に変更す
ることができる。
【0080】本発明の音声変換方法(請求項8)によれ
ば、請求項7に記載の音声変換方法において、音声符号
化工程で抽出された音声スペクトルパラメータを蓄積工
程で蓄積し、この蓄積工程で読み出した音声スペクトル
パラメータを利用者の入力に応じてスペクトル変換工程
により変換するので、男性音と女性音といった2者の音
声を相互に変換する処理などを容易に行うことができ
る。
【0081】本発明の音声変換プログラムを記録したコ
ンピュータ読み取り可能な記録媒体(請求項9)によれ
ば、音声符号化手順によりディジタル音声信号に符号化
する際に、音声のピッチに相当するパラメータを適応符
号帳探索によって抽出・符号化するCELP符号化手順
を用いており、この抽出されたピッチをピッチ変換手順
により利用者の入力に基づいて変換するので、他のスペ
クトルパラメータを変換することなく、音声の高さを自
在に変更することができる。
【0082】本発明の音声変換プログラムを記録したコ
ンピュータ読み取り可能な記録媒体(請求項10)によ
れば、請求項9に記載の記録媒体において、音声符号化
手順で抽出された音声スペクトルパラメータを利用者の
入力に応じて変換するスペクトル変換手順をさらに備え
ているので、男性音と女性音といった2者の音声を相互
に変換する処理などを行うことができる。
【0083】本発明の音声変換プログラムを記録したコ
ンピュータ読み取り可能な記録媒体(請求項11)によ
れば、音声符号化手順によりディジタル音声信号に符号
化する際に、音声のピッチに相当するパラメータを適応
符号帳探索によって抽出・符号化するCELP符号化方
式を用いているとともに、この符号化パラメータを蓄積
する蓄積手順を持っているので、必ずしも音声入力と同
時に音声変換する必要がなく、蓄積された符号化パラメ
ータを蓄積手順で適宜読み出して、ピッチ変換手順で利
用者の入力に基づいて変換することにより、他のスペク
トルパラメータを変換せずに、音声の高さを自在に変更
することができる。
【0084】本発明の音声変換プログラムを記録したコ
ンピュータ読み取り可能な記録媒体(請求項12)によ
れば、請求項11に記載の記録媒体において、音声符号
化手順で抽出された音声スペクトルパラメータを蓄積手
順に蓄積し、この蓄積手順から読み出した音声スペクト
ルパラメータを利用者の入力に応じてスペクトル変換手
順により変換するので、男性音と女性音といった2者の
音声を相互に変換する処理などを容易に行うことができ
る。
【図面の簡単な説明】
【図1】本実施の形態1に係る音声変換装置の概略構成
を説明するブロック図である。
【図2】本実施の形態1においてCELP方式による音
声変換処理手順を説明する流れ図である。
【図3】本実施の形態2に係る音声変換装置の概略構成
を説明するブロック図である。
【図4】本実施の形態3に係る音声変換装置の概略構成
を説明するブロック図である。
【図5】本実施の形態4に係る音声変換装置の概略構成
を説明するブロック図である。
【符号の説明】
10 音声圧縮符号化装置(音声変換装置) 12 A/D変換部(A/D変換手段) 14 音声符号化部(音声符号化手段) 16 ピッチ変換部(ピッチ変換手段) 18 音声復号化部(音声復号化手段) 20 D/A変換部(D/A変換手段) 30 音声圧縮符号化装置(音声変換装置) 32 スペクトル変換部(スペクトル変換手段) 40 音声圧縮符号化装置(音声変換装置) 42 蓄積部(蓄積手段) 50 音声圧縮符号化装置(音声変換装置) 52 スペクトル変換部(スペクトル変換手段)

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】 アナログ音声波形をディジタル音声信号
    に変換するA/D変換手段と、 前記ディジタル音声信号をCELP符号化方式により符
    号化する音声符号化手段と、 前記音声符号化手段による符号化処理中に抽出されたピ
    ッチ情報を利用者の入力に基づいて変換するピッチ変換
    手段と、 前記ピッチ変換手段によって変換されたピッチ情報およ
    び前記音声符号化手段によって抽出・符号化された情報
    を用いてディジタル音声信号を復号化する音声復号化手
    段と、 前記音声復号化手段によって復号化されたディジタル音
    声信号をアナログ音声信号に変換するD/A変換手段
    と、 を備えていることを特徴とする音声変換装置。
  2. 【請求項2】 前記音声符号化手段によって抽出された
    音声スペクトルパラメータを利用者の入力に応じて変換
    するスペクトル変換手段をさらに備えていることを特徴
    とする請求項1に記載の音声変換装置。
  3. 【請求項3】 アナログ音声波形をディジタル音声信号
    に変換するA/D変換手段と、 前記ディジタル音声信号をCELP符号化方式により符
    号化する音声符号化手段と、 前記音声符号化手段において抽出・符号化されたパラメ
    ータを蓄積する蓄積手段と、 前記蓄積手段から読み出したピッチ情報を利用者の入力
    に基づいて変換するピッチ変換手段と、 前記ピッチ変換手段によって変換されたピッチ情報およ
    び前記蓄積手段から読み出された符号化情報を用いてデ
    ィジタル音声信号を復号化する音声復号化手段と、 前記音声復号化手段によって復号化されたディジタル音
    声信号をアナログ音声信号に変換するD/A変換手段
    と、 を備えていることを特徴とする音声変換装置。
  4. 【請求項4】 前記蓄積手段から読み出された音声スペ
    クトルパラメータを利用者の入力に応じて変換するスペ
    クトル変換手段をさらに備えていることを特徴とする請
    求項3に記載の音声変換装置。
  5. 【請求項5】 アナログ音声波形をディジタル音声信号
    に変換するA/D変換工程と、 前記ディジタル音声信号をCELP符号化方式により符
    号化する音声符号化工程と、 前記音声符号化工程における符号化処理中に抽出された
    ピッチ情報を利用者の入力に基づいて変換するピッチ変
    換工程と、 前記ピッチ変換工程で変換されたピッチ情報および前記
    音声符号化工程で抽出・符号化された情報を用いてディ
    ジタル音声信号を復号化する音声復号化工程と、 前記音声復号化工程で復号化されたディジタル音声信号
    をアナログ音声信号に変換するD/A変換工程と、 を含むことを特徴とする音声変換方法。
  6. 【請求項6】 前記音声符号化工程で抽出された音声ス
    ペクトルパラメータを利用者の入力に応じて変換するス
    ペクトル変換工程をさらに含んでいることを特徴とする
    請求項5に記載の音声変換方法。
  7. 【請求項7】 アナログ音声波形をディジタル音声信号
    に変換するA/D変換工程と、 前記ディジタル音声信号をCELP符号化方式により符
    号化する音声符号化工程と、 前記音声符号化工程において抽出・符号化されたパラメ
    ータを蓄積する蓄積工程と、 前記蓄積工程で蓄積されたピッチ情報を読み出して利用
    者の入力に基づいて変換するピッチ変換工程と、 前記ピッチ変換工程で変換されたピッチ情報および前記
    蓄積工程で蓄積された符号化情報を用いてディジタル音
    声信号を復号化する音声復号化工程と、 前記音声復号化工程で復号化されたディジタル音声信号
    をアナログ音声信号に変換するD/A変換工程と、 を含むことを特徴とする音声変換方法。
  8. 【請求項8】 前記蓄積工程で蓄積された音声スペクト
    ルパラメータを読み出して利用者の入力に応じて変換す
    るスペクトル変換工程をさらに含んでいることを特徴と
    する請求項7に記載の音声変換方法。
  9. 【請求項9】 アナログ音声波形をディジタル音声信号
    に変換するA/D変換手順と、 前記ディジタル音声信号をCELP符号化方式により符
    号化する音声符号化手順と、 前記音声符号化手順において符号化処理中に抽出された
    ピッチ情報を利用者の入力に基づいて変換するピッチ変
    換手順と、 前記ピッチ変換手順によって変換されたピッチ情報およ
    び前記音声符号化手順によって抽出・符号化された情報
    を用いてディジタル音声信号を復号化する音声復号化手
    順と、 前記音声復号化手順によって復号化されたディジタル音
    声信号をアナログ音声信号に変換するD/A変換手順
    と、 を含むことを特徴とする音声変換プログラムを記録した
    コンピュータ読み取り可能な記録媒体。
  10. 【請求項10】 前記音声符号化手順によって抽出され
    た音声スペクトルパラメータを利用者の入力に応じて変
    換するスペクトル変換手順をさらに含むことを特徴とす
    る請求項9に記載の音声変換プログラムを記録したコン
    ピュータ読み取り可能な記録媒体。
  11. 【請求項11】 アナログ音声波形をディジタル音声信
    号に変換するA/D変換手順と、 前記ディジタル音声信号をCELP符号化方式により符
    号化する音声符号化手順と、 前記音声符号化手順で抽出・符号化されたパラメータを
    蓄積する蓄積手順と、 前記蓄積手順で蓄積されたピッチ情報を読み出して利用
    者の入力に基づいて変換するピッチ変換手順と、 前記ピッチ変換手順で変換されたピッチ情報および前記
    蓄積手順で蓄積された符号化情報を用いてディジタル音
    声信号を復号化する音声復号化手順と、 前記音声復号化手順で復号化されたディジタル音声信号
    をアナログ音声信号に変換するD/A変換手順と、 を含むことを特徴とする音声変換プログラムを記録した
    コンピュータ読み取り可能な記録媒体。
  12. 【請求項12】 前記蓄積手順で蓄積された音声スペク
    トルパラメータを読み出して利用者の入力に応じて変換
    するスペクトル変換手順をさらに含むことを特徴とする
    請求項11に記載の音声変換プログラムを記録したコン
    ピュータ読み取り可能な記録媒体。
JP10352186A 1998-11-27 1998-11-27 音声変換装置、音声変換方法および音声変換プログラムを記録したコンピュータ読み取り可能な記録媒体 Pending JP2000163097A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10352186A JP2000163097A (ja) 1998-11-27 1998-11-27 音声変換装置、音声変換方法および音声変換プログラムを記録したコンピュータ読み取り可能な記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10352186A JP2000163097A (ja) 1998-11-27 1998-11-27 音声変換装置、音声変換方法および音声変換プログラムを記録したコンピュータ読み取り可能な記録媒体

Publications (1)

Publication Number Publication Date
JP2000163097A true JP2000163097A (ja) 2000-06-16

Family

ID=18422379

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10352186A Pending JP2000163097A (ja) 1998-11-27 1998-11-27 音声変換装置、音声変換方法および音声変換プログラムを記録したコンピュータ読み取り可能な記録媒体

Country Status (1)

Country Link
JP (1) JP2000163097A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002063610A1 (fr) * 2001-02-02 2002-08-15 Nec Corporation Dispositif et procede de conversion de sequences de codes vocaux
US7587312B2 (en) 2002-12-27 2009-09-08 Lg Electronics Inc. Method and apparatus for pitch modulation and gender identification of a voice signal

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002063610A1 (fr) * 2001-02-02 2002-08-15 Nec Corporation Dispositif et procede de conversion de sequences de codes vocaux
US7505899B2 (en) 2001-02-02 2009-03-17 Nec Corporation Speech code sequence converting device and method in which coding is performed by two types of speech coding systems
US7587312B2 (en) 2002-12-27 2009-09-08 Lg Electronics Inc. Method and apparatus for pitch modulation and gender identification of a voice signal

Similar Documents

Publication Publication Date Title
JP4132109B2 (ja) 音声信号の再生方法及び装置、並びに音声復号化方法及び装置、並びに音声合成方法及び装置
JP4550289B2 (ja) Celp符号変換
US11721349B2 (en) Methods, encoder and decoder for linear predictive encoding and decoding of sound signals upon transition between frames having different sampling rates
JP4121578B2 (ja) 音声分析方法、音声符号化方法および装置
JP3357795B2 (ja) 音声符号化方法および装置
JPH1055199A (ja) 音声符号化並びに復号化方法及びその装置
JP3582589B2 (ja) 音声符号化装置及び音声復号化装置
JP2002509294A (ja) 暗騒音条件下における音声符号化の方法
JP2000132193A (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
JP3050978B2 (ja) 音声符号化方法
JP2000163097A (ja) 音声変換装置、音声変換方法および音声変換プログラムを記録したコンピュータ読み取り可能な記録媒体
JP3878254B2 (ja) 音声圧縮符号化方法および音声圧縮符号化装置
JP4438280B2 (ja) トランスコーダ及び符号変換方法
JP3916934B2 (ja) 音響パラメータ符号化、復号化方法、装置及びプログラム、音響信号符号化、復号化方法、装置及びプログラム、音響信号送信装置、音響信号受信装置
JP2001051699A (ja) 無音声符号化を含む音声符号化・復号装置、復号化方法及びプログラムを記録した記録媒体
JP3232701B2 (ja) 音声符号化方法
JP2001318698A (ja) 音声符号化装置及び音声復号化装置
JP2002073097A (ja) Celp型音声符号化装置とcelp型音声復号化装置及び音声符号化方法と音声復号化方法
JP4826580B2 (ja) 音声信号の再生方法及び装置
JPH09244695A (ja) 音声符号化装置及び復号化装置
JP3006790B2 (ja) 音声符号化復号化方法及びその装置
JP2853170B2 (ja) 音声符号化復号化方式
JP3232728B2 (ja) 音声符号化方法
JPH0786952A (ja) 音声の予測符号化方法
JPH09179593A (ja) 音声符号化装置