JPH0232397A - 音声信号処理装置 - Google Patents

音声信号処理装置

Info

Publication number
JPH0232397A
JPH0232397A JP63182051A JP18205188A JPH0232397A JP H0232397 A JPH0232397 A JP H0232397A JP 63182051 A JP63182051 A JP 63182051A JP 18205188 A JP18205188 A JP 18205188A JP H0232397 A JPH0232397 A JP H0232397A
Authority
JP
Japan
Prior art keywords
waveform
voiced
time axis
encoding
unvoiced
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63182051A
Other languages
English (en)
Inventor
Masaya Takahashi
真哉 高橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP63182051A priority Critical patent/JPH0232397A/ja
Publication of JPH0232397A publication Critical patent/JPH0232397A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 この発明は音声信号処理装置に関し、特に音声波形の時
間軸圧縮伸張を行なう音声時間軸圧縮符号化処理の改善
に関するものである。
〔従来の技術〕
従来、この種の装置として第2図に示すようなものがあ
った。
この図はIEEE、インターナシラナル コミュニケー
シヨン コンフエレンス、 1982 (ICC82)
(IEBE:International Comn+
unication Conference、 198
2(ICC82))での発表論文R,V、Cox et
 al、アンインプレメンテ−ジョン オブ タイム 
ドメイン ハーモニック スケーリング ウィズ アプ
リケーション トウ スピーチ コーディング(An 
Implea+entation of Time D
omain Harmonic Scaling wi
th Applicaiton to 5peech 
Coding)(ICC82,PP、4G、 1.1.
−4)のPIG、 1に示されたものと同様のもので、
図において1はマイクロホン、2は該マイクロホン1か
ら入力された音声を離散データ系列(以後入力音声波形
3と呼ぶ)に変換するA/D変換器、6は該入力音声波
形3を分析してそのピッチ周期を求めるピッチ周期抽出
手段、19は該ピッチ周期信号8に基づいて上記入力音
声波形3を時間軸上で圧縮して圧縮波形20を出力する
時間軸圧縮手段、21は該圧縮波形20をパルス符号化
する符号化手段、10は上記ピンチ周期信号8を符号化
するピンチ符号化手段、11は上記符号化された圧縮波
形20.及びピッチ周期信号8を多重化し伝送路12に
出力するマルチプレクサであり、上記の各部から送信部
が構成されている。
また、13は上記多重化された信号を分離するデマルチ
プレクサ、22は上記符号化された圧縮波形20を復号
化して復号後圧検波形23を出力する復号化手段、15
は上記符号化されたピンチ周期信号8を復号化するピッ
チ復号化手段、24は復号化されたピンチ周期信号8に
基づいて上記復号後圧検波形23を時間軸上で伸張して
伸張波形25を出力する時間軸伸張手段、17は該伸張
波形25をアナログ信号に変換するD/A変換器、18
は該アナログ信号により駆動されるスピーカであり、こ
れらの部分により受信部が構成されている。
次に動作について説明する。
まず、上記送信部の動作について説明する。
マイクロホン1から入力された音声はA/D変換器2で
離散データ系列(入力音声波形3)に変換される。ピッ
チ周期抽出手段6は例えば入力音声波形3を自己相関分
析することで、入力音声波形3のピッチ周期信号8を求
める0時間軸圧縮手段19はピッチ周期抽出手段6で抽
出されたピッチ周期信号8に基づき、連続する2つのピ
ッチ区間毎に入力音声波形3を時間軸上で〃に圧縮し、
圧縮波形20を求める。
ここで、時間軸圧縮手段19で行われる時間軸圧縮の詳
細を第3図に示す、第3図(a)においてAは連続する
2ピッチ区間の入力音声波形S (n)であり、第3図
中)のBは該波形S (n)を時間軸上で2に圧縮した
圧縮波形S c (n)である、今、入力音声波形S 
(n)のピッチ周期を’rpとすると、圧縮波形S c
 (n)はこの連続する2ピッチ区間の両区間の波形の
’R4tel性を利用することで、次の(1)。
(2)式によって求めれらる。
5c(n)−(1−Wc(n))・5(n)+Na(n
)・S(n+Tp) ・・・(1)Wc(n)−(n−
!/i)/Tp           ・・・(2)n
=1.2.・・・Tp ここで、+11. (21式のW c (n)は入力音
声波形5(n)にかける窓関数であり、第3図は入力音
声波形S (n)に窓関数Wc(n)をかけ圧縮波形S
 c (n)を求める手順を示している。
今、第2図の時間軸圧縮手段19で上記方法により求ま
った圧縮波形20は符号化手段21で例えば1サンプル
毎に8ビツトの非線形パルス符号化され、またピッチ周
期信号8もピッチ符号化手段10で線形に符号化される
。マルチプレクサ11は符号化手段21で符号化された
圧縮波形情報と、ピッチ符号化手段10で符号化された
ピッチ周期情報を多重化し、伝送路12に出力する。
次に受信部の動作について説明する。
伝送路12を伝搬した符号化された圧縮波形情報とピッ
チ周期情報とはデマルチプレクサ13で分離される。圧
縮波形情報は復号化手段22でもって符号化手段21に
対応した復号処理により復号化され、復号後圧検波形2
3となる。同様にピンチ周期情報もピッチ復号化手段1
5で復号化される。
時間軸伸張手段24はピッチ復号化手段15で復号化さ
れたピッチ周期信号8に基づき、このピッチ周期を単位
として復号後圧検波形23を時間軸上で2倍に伸張し、
伸張波形25を求める。
ここで、時間軸伸張手段24で行われる時間軸伸張の詳
細を第4図に示す、第4図(a)においてCは連続する
3ピッチ区間(r−1,r、r+1番目)の復号後圧検
波形Ω(n)であり、第4図中)のDは復号後圧検波形
Ω(n)のr番目のピンチ区間を2倍に伸張した伸張波
形Ω(n)である、今、復号後圧検波形Ω(n)におい
てr番目のピッチ区間の先頭地点をn−1とすると、伸
張波形Ω(n)は次の(3)、 (41式によって求め
る。
’?(n)−(1−We(n))・!Q(n)+We(
n)−U(n−Tp)=(3)We(n)−(n−!4
)/2Tp           ・・・(4)n・1
,2.・・・2Tp (3)、 +41式のWe(n)は復号後圧検波形U(
n)にかける窓関数である。第4図は復号後圧検波形Ω
(n)に窓関数We(n)をかけ伸張波形Ω(n)を求
める手順を示している。
第2図の時間軸伸張手段24で上記の方法により求まっ
た伸張波形25はD/A変換器17でアナログ信号に変
換されてスピーカ18から出力される。
〔発明が解決しようとする課題〕
従来の音声時間軸圧縮符号化装置は以上のように構成さ
れており、送信部の時間軸圧縮手段と受信部の時間軸伸
張手段は音声波形の連続する2ピッチ周期区間を両区間
の波形の類似性を利用して時間軸上で圧縮伸張するので
、音声波形があるピッチ間隔で強い周期性を持つ母音等
の有声音については良好に時間軸圧縮伸張が成されるが
、音声波形が周期性を持たない摩擦性子音のような無声
音については時間軸圧縮伸張によりその波形の形状が破
壊されるので、再生音声品質が悪いという問題点があっ
た。
この発明は上記のような問題点を解消するためになされ
たもので、有声音声だけでなく、無声音声をも品質よく
再生することができる音声信号処理装置を得ることを目
的とする。
〔課題を解決するための手段〕
この発明に係る音声信号処理装置は、送信部には、ある
短時間内の入力音声波形が有声音か無声音かを判定する
有声/無声判定手段と、この有声/無声の判定結果が有
声である場合のみ上記入力音声波形を時間軸上で圧縮す
る時間軸圧縮手段と、該時間軸圧縮手段から出力される
音声波形を、上記有声/無声判定の結果に応じて符号化
ビット割り当て数を変化させて符号化する符号化手段と
を備え、受信部には、上記符号化手段で符号化された音
声波形を、上記符号化ビット割り当て数に基づいて復号
化する復号化手段と、この復号化手段で復号化された音
声波形を、その有声/無声判定結果が有声である場合の
み時間軸上で伸張する時間軸伸張手段とを備えたもので
ある。
〔作用〕
この発明においては、送信部では、ある短時間内の入力
音声波形のを声/無声を判定し、上記入力音声波形が有
声であるときのみこの入力音声波形を時間軸上で圧縮し
、さらに上記入力音声波形が有声のときと無声のときで
符号化ビット割り当て数を変化させて圧縮及び非圧縮音
声波形を符号化し、受信部では、上記符号化ビット割り
当て数に従って、符号化された音声波形を復号化し、さ
らに上記入力音声波形が音声のときのみこの復号化され
た音声波形を時間軸上で伸張するようにしたから、周期
性の無い無声音声の波形を破壊することな(、しかも一
定の符号化ビット率を保って音声時間軸圧縮符号化を行
なうことができる。
〔実施例〕
以下、本発明の一実施例を図について説明する。
第1図はこの発明の一実施例による音声信号処理装置を
示す構成図であり、第1図において、1〜3.6.8.
10〜13.15.17.18は第2図における従来装
置と同一のものであり、説明を省略する。5は入力音声
信号が有声か無声かを判断する有声/無声判定手段、7
はその判断結果、4は該有声/無声判定結果7が有声で
ある場合のみ入力音声信号を時間軸上で圧縮する時間軸
圧縮手段、9は上記音声信号波形を、これが有声か無声
かに応じてそれぞれ所定のビット割り当て数でもって符
号化する符号化手段であり、これらの手段4,5.9は
送信部の構成要素となっている。
また、14は符号化された入力音声信号をその符号化の
際のビット割り当て数に応じて復号化する復号化手段、
16は復号化された入力音声信号が有声である場合のみ
これを時間軸上で伸張する時間軸伸張手段であり、これ
ら手段14.16は受信部の一部を構成している。
次に動作について説明する。
まず、送信部について説明する。
このような装置では、有声/無声判定手段5はある短時
間内の入力音声波形3の有声/無声の判定をし、例えば
エネルギーとパワースペクトルの傾斜度を計算し、その
値を一定の閾値判定することで、上記入力音声波形が有
声音であるか無声音であるかを判定し、1ビツト情報の
有声/無声判る場合、第2図における時間軸圧縮手段1
9と全(同様の方法で上記入力音声波形3を時間軸上で
Aに圧縮するが、この有声/無声判定結果7が無声であ
る場合、上記入力音声波形3の時間軸圧縮は行わない。
符号化手段9は有声/無声判定手段5で有声と判定され
、時間軸圧縮手段4で時間軸上でAに圧縮された音声波
形について例えば1サンプル毎に8ビツトの非線形パル
ス符号化する。また符号化手段9は有声/無声判定手段
5で無声と判定され、時間軸圧縮手段4では時間軸圧縮
されなかった音声波形については、有声と判定されてA
時間軸圧縮された音声波形に対する符号化ビット割り当
て数の半分のビット(この実施例では4ビツト)を1サ
ンプル毎に割り当てて非線形パルス符号化する。これに
より一定時間内で符号化手段9から出力される符号ビッ
ト数は入力音声波形が有声であるか無声であるかにかか
わらず一定となる。
また、無声音声波形は一般的に有声音声波形よりそのダ
イナミックレンジが小さく、無声音声波形に対するサン
プル毎の符号化ビット割り当て数を有声音声波形に対す
る符号化ビット割り当て数のAにしても、量子化歪の増
加を少ない。
そして符号化手段9で符号化された音声波形情報と、有
声/無声判定結果7と、ピッチ符号化手段で符号化され
たピッチ周期情報とはマルチプレクサ11で多重化され
伝送路12に伝搬される。
次に受信部について説明する。
デマルチプレクサ13は上記伝送路12より上記多重化
信号を受け、上記音声波形情報と、有声/無声判定結果
7と、上記ピッチ周期情報とを各々分離する。復号化手
段14は有声/無声判定結果7が有声のとき上記音声波
形情報を1サンプル当たり8ビツトの非線形パルス符号
化情報とみなして復号化し、有声/無声判定結果7が無
声のとき上記音声波形情報を1サンプル当たり4ビツト
(有声のときの半分)の非線形パルス符号化情報とみな
して復号化する0時間軸伸張手段16は復号化手段14
で復号された音声波形を、有声/無声判定結果7が有声
のときは第2図中の時間軸伸張手段24と全く同様の方
法で時間軸上で2倍に伸張し、有声/無声判定結果7が
無声のときはその時間軸上での伸張を行わない。
このように本実施例では、送、信部においては、ある短
時間内の入力音声波形の有声/無声を判定し、上記入力
音声波形が有声のときのみ上記入力音声波形を時間軸上
で圧縮し、さらに上記入力音声波形が有声のときと無声
のときで符号化ビット割り当て数を変化させて音声波形
を符号化するようにするとともに、受信部においては、
上記符号化の際のビット割り当て数に応じて、符号化さ
れた音声波形を復号化し、上記入力音声波形が有声のと
きのみこの復号化された音声波形を時間軸上で伸張する
ようにしたので、周期性の無い無声音声の波形を破壊す
ることなく、しかも一定の符号化ビット率を保って音声
時間軸圧縮符号化を行なうことができる。
なお、上記実施例では符号化手段9を非線形パルス符号
化を行なうものとしたが、これは音声をその線形予測係
数と予測残差信号に分離して符号化を行なういかなる方
式のものとしても良く、この場合は予測残差信号に与え
る符号化ビット量を有声/無声判定結果に従って変化さ
せる必要がある。
〔発明の効果〕
以上のようにこの発明に係る音声信号処理装置によれば
、入力音声波形が有声と判定されたときはこの入力音声
波形のピンチ周期を利用してこの入力音声波形を時間軸
上で圧縮し、入力音声波形が無声と判定されたときは時
間軸上での圧縮は行わず、また時間軸圧縮された有声音
に対する符号化ビット量と、時間軸圧縮されなかった無
声音に対する符号化ビット量とを変化させて一定時間で
の符号化ビット量が入力音声波形の有声/無声に関わら
ず一定となるようにしたので、周期性の無い無声音声の
波形を破壊することなく、しかも−定の符号ルビブト率
を保って音声時間軸圧縮符号化を行なうことができる効
果がある。
【図面の簡単な説明】
第1図はこの発明の一実施例による音声信号処〜 理装置を示す全体構成図、第2図は従来の音声時間軸圧
縮符号化装置を示す全体構成図、第3図は従来の音声時
間軸圧縮符号化装置の時間軸圧縮処理を示す説明図、第
4図は従来の音声時間軸圧縮符号化装置の時間軸伸張処
理を示す説明図である。 図において、1はマイクロホン、2はA/D変換器、3
は入力音声波形、4は時間軸圧縮手段、5は有声/無声
判定手段、6はピンチ周期抽出手段、7は有声/無声判
定結果、8はピッチ周期信号、9は符号化手段、10は
ピッチ符号化手段、11はマルチプレクサ、12は伝送
路、13はデマルチプレクサ、14は復号化手段、15
はピッチ復号化手段、16は時間軸伸張手段、17はD
/A変換器、18はスピーカである。 なお、図中同一符号は同−又は相当部分を示す。 代理人    早  瀬  憲  − 第2図

Claims (1)

    【特許請求の範囲】
  1. (1)入力音声波形を時間軸上で圧縮し、符号化して送
    信する送信部と、この圧縮符号化された音声波形を受信
    して復号化し、時間軸上で伸張する受信部とから成る音
    声信号処理装置において、上記送信部は、 ある短時間内の入力音声波形が有声音であるか無声音で
    あるかを判定する有声/無声判定手段と、上記入力音声
    波形を、該判定結果が有声である場合は該波形のピッチ
    周期を利用して時間軸上で圧縮して、該判定結果が無声
    である場合は時間軸上で圧縮しないで出力する時間軸圧
    縮手段と、上記有声/無声判定の結果に応じて符号化ビ
    ット割り当て数を変化させて、上記時間軸圧縮手段の出
    力音声波形を符号化する符号化手段とを備えたものであ
    り、 上記受信部は、 上記符号化された音声波形を、その符号化の際のビット
    割り当て数に基づいて復号化する復号化手段と、 上記復号化された入力音声波形を、上記有声/無声の判
    定結果が有声である場合は時間軸上で伸張し、該結果が
    無声である場合は伸張しない時間軸伸張手段とを備えた
    ものであることを特徴とする音声信号処理装置。
JP63182051A 1988-07-21 1988-07-21 音声信号処理装置 Pending JPH0232397A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63182051A JPH0232397A (ja) 1988-07-21 1988-07-21 音声信号処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63182051A JPH0232397A (ja) 1988-07-21 1988-07-21 音声信号処理装置

Publications (1)

Publication Number Publication Date
JPH0232397A true JPH0232397A (ja) 1990-02-02

Family

ID=16111478

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63182051A Pending JPH0232397A (ja) 1988-07-21 1988-07-21 音声信号処理装置

Country Status (1)

Country Link
JP (1) JPH0232397A (ja)

Similar Documents

Publication Publication Date Title
JP4899359B2 (ja) 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
JPH0782359B2 (ja) 音声符号化装置、音声復号化装置及び音声符号化・復号化装置
WO2003010752A1 (en) Speech bandwidth extension apparatus and speech bandwidth extension method
JP2011059714A (ja) 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
US5706392A (en) Perceptual speech coder and method
WO2001065542A1 (fr) Dispositif de codage/decodage de la voix et procede associe
JPH09330097A (ja) 音声再生装置
JPH0232397A (ja) 音声信号処理装置
JP2797348B2 (ja) 音声符号化・復号化装置
JP2900987B2 (ja) 無音圧縮音声符号化復号化装置
JP3496618B2 (ja) 複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法
JPS60107933A (ja) Adpcm符号化装置
JPH11145846A (ja) 信号圧縮伸張装置及び方法
JP3063087B2 (ja) 音声符号化復号化装置及び音声符号化装置ならびに音声復号化装置
JP3006790B2 (ja) 音声符号化復号化方法及びその装置
JPH0784597A (ja) 音声符号化装置および音声復号化装置
JP3166797B2 (ja) 音声符号化法及び音声復号化法並びに音声符復号化装置
JPS6028700A (ja) 音声分析合成装置
JP2853126B2 (ja) マルチパルス符号化装置
KR19990023449A (ko) 음성 압축/신장 방법 및 시스템
JPS62189833A (ja) 音声符号化復号化装置
JPS60102699A (ja) 音声分析合成装置
JPH0627997A (ja) 音声符号化/復号化装置
KR960003626B1 (ko) 변환 부호화된 오디오 신호의 난청자용 복호화 방법
JP2002076904A (ja) 符号化されたオーディオ信号の復号化方法、及び符号化されたオーディオ信号の復号化装置