JPH08154080A - 音声信号処理方法及び音声信号処理装置 - Google Patents

音声信号処理方法及び音声信号処理装置

Info

Publication number
JPH08154080A
JPH08154080A JP6315884A JP31588494A JPH08154080A JP H08154080 A JPH08154080 A JP H08154080A JP 6315884 A JP6315884 A JP 6315884A JP 31588494 A JP31588494 A JP 31588494A JP H08154080 A JPH08154080 A JP H08154080A
Authority
JP
Japan
Prior art keywords
voice
section
silent
voiced
voice signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6315884A
Other languages
English (en)
Inventor
Hiroyasu Ide
博康 井手
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Casio Computer Co Ltd
Original Assignee
Casio Computer Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Casio Computer Co Ltd filed Critical Casio Computer Co Ltd
Priority to JP6315884A priority Critical patent/JPH08154080A/ja
Publication of JPH08154080A publication Critical patent/JPH08154080A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【目的】 音声信号を一定区間毎に有音か無音かを正確
に判断して信号処理を行うことができる音声信号処理方
法及び音声信号処理装置を提供することを目的とする。 【構成】 分析区間切出部21で切出された分析区間毎
の音声信号を有音/無音判断部22で有音か無音かを判
断した後、さらに、無音と判断された分析区間のうち、
その1つ前の分析区間が有音である場合にのみ、当該無
音区間を有音区間として処理し、それ以外は上記判断の
ままとする。有音区間波形は、波形符号化部23によっ
て圧縮符号化され、また、無音区間波形は、無音フラグ
生成部24によって無音フラグが生成されて音声信号の
圧縮処理が行われる。伝送路符号化部25では、圧縮符
号と無音フラグとを所定のデータフォーマット形式とし
て、伝送路に送出するための符号化を行って、伝送路に
送出する。このため、復号化されたときの音声が自然に
聞こえる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声信号の有音音声区
間と無音音声区間における音声信号処理方法及び音声信
号処理装置に関する。
【0002】
【従来の技術】近時における高度情報化社会の発達に伴
い、大容量の各種情報を高速に伝送する通信媒体に対す
る需要がますます増加している。
【0003】そこで、最近では、通常のアナログ方式の
電話に代わって、デジタル方式による通信が盛んに行わ
れるようになっている。そして、これらの多くは、デジ
タル圧縮技術を用いて音声信号を圧縮して通信を行って
いる。これは、音声信号を圧縮処理することにより、通
信の帯域を狭くすることができるため、通信回線を多く
とったり、また、テレビ電話装置やテレビ会議システム
などのように音声以外のデータを送ることを可能にする
ためである。
【0004】そこで、デジタル音声を高能率で圧縮する
方法としては、一般的にCELP(Code Excited Linea
r Predivtion)、VSELP(Vector Sum Excited Lin
earPrediction)あるいはAD−PCM(Adaptire Diff
rential Pulse Code modulation)などの方式が用いら
れている。
【0005】このようなデジタル音声の圧縮方法は、例
えば、図5の従来例の音声信号の符号化/復号化処理を
説明する図に示すように、まず、図5(a)において、
圧縮する音声信号波形をある一定区間(本明細書中で
は、分析区間と称する)毎に分割する。
【0006】そして、その分割された分析区間毎の音声
信号が有音か無音かを判断する。この有音/無音の判断
方法としては、ノイズや背景音の影響を取り除く意味か
ら、例えば、分析区間のエネルギー(2乗和)、あるい
は分析区間中の音声信号レベルの最大値が所定のスレッ
シュホールドレベル以下であるか否かで判断している。
このため、ある分析区間が無音と判断されるのは、完全
に無音状態の場合だけでなく、レベルの低い音声波形が
出ている場合も含まれ、ここでは、分析区間,が無
音区間とされる。
【0007】次に、図5(b)に示すように、有音の分
析区間(,,,)は、これらを符号化して圧縮
符号とする圧縮処理が行われる。また、無音と判断され
た分析区間は、通常の圧縮処理ではなく、当該分析区間
(,)中の音声全てが無音であるという特別な無音
符号を割り当てて符号化する。これにより、音声信号の
圧縮効率が上がって平均の伝送レートを下げることがで
きる。このようにして、圧縮処理された音声信号は、図
示しない一般アナログ公衆回線を介して相手方に伝送さ
れる。
【0008】一方、相手方は、その圧縮された音声信号
を受信した場合に、これを復号化して伸張する復号化部
を持っており、圧縮符号は有音音声区間の音声信号波形
とし、また、無音符号は無音音声区間の波形とすること
により、図5(c)に示すような音声信号波形が復元さ
れる。
【0009】
【発明が解決しようとする課題】しかしながら、このよ
うな従来の音声信号処理方法によれば、図5(a)に示
す音声信号波形を各分析区間毎に有音/無音を判断する
場合、分析区間の,,,は、有音音声区間と判
断し、分析区間の,を無音音声区間と判断してい
る。このため、図5(b)に示すように、分析区間,
が無音符号として符号化されていることから、これが
復号化すると、図5(c)に示すように、分析区間,
には無音状態の音声信号波形が復元されることにな
る。
【0010】これは、図5(a)の分析区間では、分
析区間から減衰してきた音声信号波形が低レベルで残
っており、また、分析区間では、分析区間の立ち上
がり時の低レベルの音声信号波形が出ているが、上記し
たように有音/無音の判断方法では、実際の音声圧縮回
路等から出るノイズを「0」にすることが事実上不可能
であり、その上、音声を取り込む場合は、周囲の小さな
雑音によって完全に無音となり難いことから、上記した
スレッシュホールドレベルをある程度大きくしなければ
ならない。このため、低レベルの音声信号波形は、スレ
ッシュホールドレベル以下と判断されて、無音と判断さ
れる。
【0011】このように、図5(c)における分析区間
,では、上記したように無音状態として復元される
ため、図中に示すような「消された音声波形部分」が生
じることになり、実際の音声として聞くと、音声が減衰
してきた場合の最後の部分、あるいは、最初の立ち上が
り時の音声部分が無音化されることにより、不自然に聞
こえてしまうという問題があった。
【0012】本発明は、このような課題に鑑みてなされ
たものであり、音声信号を一定区間毎に有音音声区間と
無音音声区間とに分けて処理する際に、有音音声区間と
無音音声区間とを正確に判断して信号を処理することが
できる音声信号処理方法及び音声信号処理装置を提供す
ることを目的とする。
【0013】
【課題を解決するための手段】請求項1記載の音声信号
処理方法は、音声信号を一定区間毎に分割し、該分割さ
れた各区間毎の音声信号が有音か無音かを判断し、該無
音と判断された無音音声区間の前又は後の区間が有音か
無音かによって、当該無音音声区間の処理を変更するこ
とにより、上記目的を達成する。
【0014】請求項2記載の音声信号処理方法は、音声
信号を一定区間毎に分割し、該分割された各区間毎の音
声信号が有音か無音かを判断し、該無音と判断された無
音音声区間の前後の音声区間の少なくとも一方が有音で
あるとき、該無音音声区間を有音音声区間に変更するこ
とにより、上記目的を達成する。請求項3記載の音声信
号処理方法は、音声信号を一定区間毎に分割し、該分割
された各区間毎の音声信号が有音か無音かを判断し、該
無音と判断された無音音声区間の1つ前の区間が有音音
声区間である場合に、当該無音音声区間を有音音声区間
として処理し、前記有音音声区間を圧縮符号に変換する
とともに、前記無音音声区間を無音符号に変換して音声
信号を圧縮処理することにより、上記目的を達成する。
【0015】請求項4の音声信号処理装置は、入力され
る音声信号を一定区間毎に分割する音声信号分割手段
と、該分割された各区間の音声信号が有音か無音かを判
断する有音/無音判断手段と、該有音/無音判断手段で
無音音声区間と判断された区間の直前の区間が有音であ
る場合に、当該無音音声区間を有音音声区間に変換する
有音/無音区間変換手段と、前記有音音声区間を符号化
して圧縮する圧縮符号化手段と、前記無音音声区間を符
号化して圧縮する無音符号化手段と、を備えたことによ
り、上記目的を達成する。
【0016】請求項5記載の音声信号処理装置は、前記
有音/無音判断手段によって各区間の音声信号が有音か
無音かを判断した結果を記憶する有音/無音判断結果記
憶手段をさらに備えるようにしてもよい。
【0017】
【作用】請求項1記載の音声信号処理方法では、音声信
号を一定区間毎に分割し、その分割された各区間毎の音
声信号が有音か無音かを判断し、その無音と判断された
無音音声区間の前又は後の区間が有音か無音かによっ
て、当該無音音声区間の処理を変更するようにする。
【0018】従って、音声信号の一定区間が無音音声区
間と判断されても、その前又は後の区間が有音音声区間
の場合、立ち上がりや立ち下がり時における低レベルの
音声信号が含まれている可能性があるため、前又は後の
区間の状況に応じて当該無音音声区間を有音音声区間と
するなど、無音音声区間の処理を変えることにより、無
音音声区間の判断をより一層正確に行うことができる。
【0019】請求項1記載の音声信号処理方法では、音
声信号を一定区間毎に分割し、その分割された各区間毎
の音声信号が有音か無音かを判断し、その無音と判断さ
れた無音音声区間の前後の少なくとも一方が有音である
とき、その無音音声区間を有音音声区間に変更する。
【0020】従って、音声信号の一定区間が無音音声区
間と判断されても、その前後の少なくとも一方の区間が
有音音声区間の場合、立ち上がりや立ち下がり時におけ
る低レベルの音声信号が含まれている可能性があるた
め、前後の区間の状況に応じて当該無音音声区間を有音
音声区間とし、無音音声区間の判断をより一層正確に行
うことができる。
【0021】請求項3記載の音声信号処理方法では、所
定の音声信号を一定区間毎に分割し、その分割された各
区間毎の音声信号が有音か無音かを判断し、その無音と
判断された無音音声区間の1つ前の区間が有音音声区間
である場合にのみ、当該無音音声区間を有音音声区間と
して処理し、前記有音音声区間を圧縮符号に変換すると
ともに、前記無音音声区間を無音符号に変換して音声信
号を圧縮処理する。
【0022】従って、音声信号の一定区間が無音音声区
間と判断されたとしても、その無音音声区間の1つ前の
区間が有音音声区間である場合、(例えば、会話等の音
声信号などでは)減衰した低レベルの音声波形が残って
いる可能性があるが、これを無音音声区間として信号成
分を除去すると、不自然な音声になるため、当該無音音
声区間を有音音声区間として処理して、自然な音声とす
る。
【0023】請求項4記載の音声信号処理装置では、音
声信号分割手段により入力される音声信号を一定区間毎
に分割し、有音/無音判断手段でその分割された各区間
の音声信号が有音か無音かを判断し、有音/無音区間変
換手段では無音音声区間と判断された区間の直前の区間
が有音である場合に、当該無音音声区間を有音音声区間
に変換して、有音音声区間を圧縮符号化手段で符号化し
て圧縮するとともに、無音音声区間を無音符号化手段で
符号化して圧縮する。
【0024】従って、音声信号の無音音声区間の1つ前
の区間が有音音声区間である場合は、減衰した低レベル
の音声波形が残っている可能性があることから、当該無
音音声区間を有音音声区間として処理することにより、
低レベルの音声信号成分が残って、自然な音声が得られ
る。
【0025】請求項5記載の音声信号処理装置では、有
音/無音判断手段によって各区間の音声信号が有音か無
音かを判断した結果を記憶する有音/無音判断結果記憶
手段を備えている。
【0026】従って、前記有音/無音区間変換手段で無
音音声区間を有音音声区間に変換しても、その次の分析
区間が無音音声区間であった場合に、以前の無音とされ
た判断結果が記憶されているため、その判断結果に基づ
いて正確な圧縮処理を行うことができる。
【0027】
【実施例】以下、図1〜図5を参照して実施例を説明す
る。
【0028】図1〜図5は、本発明を適用した音声信号
処理装置の一実施例を示す図であり、具体的には、テレ
ビ電話装置などの音声信号を圧縮/伸張処理して伝送を
行う音声圧縮伸張回路などに適用することができる。
【0029】まず、構成を説明する。
【0030】図1は、本実施例の音声信号処理装置1の
構成ブロック図である。図1において、音声信号処理装
置は、符号化部2と復号化部3とに分けられる。
【0031】符号化部2は、分析区間切出部21、有音
/無音判断部22、波形符号化部23、無音フラグ生成
部24、伝送路符号化部25などを備えている。
【0032】分析区間切出部21は、音声信号波形を一
定区間毎に切出して、各区間毎の音声信号に分割し、1
つの区間を分析区間と称する。
【0033】有音/無音判断部22は、分析区間切出部
21によって切出された各分析区間が有音か無音かを判
断するものである。例えば、本実施例では、分析区間に
おける音声信号レベルの最大値が所定のスレッシュホー
ルドレベル以下であるか否かで判断する。
【0034】波形符号化部23は、有音/無音判断部2
2で有音音声区間と判断された音声波形をAD−PCM
(Adaptire Diffrential Pulse Code modulation)やC
ELP(Code Excited Linear Predivtion)、あるいは
VSELP(Vector Sum Excited Linear Prediction)
などの方式により圧縮符号化し、その圧縮符号化された
符号化波形を出力する。
【0035】無音フラグ生成部24は、有音/無音判断
部22から当該分析区間中の音声信号が無音と判断され
て無音音声区間波形が入力されると、当該分析区間中が
無音であることを意味する無音フラグを作成して、これ
を出力する。
【0036】伝送路符号化部25は、上記した波形符号
化部23から入力される符号化波形と、無音フラグ生成
部24から入力される無音フラグとを1つのデータフォ
ーマット形式にして、伝送路に送出するための符号化が
行われる。
【0037】また、復号化部3は、伝送路復号化部3
1、波形復号化部32、無音音声区間波形生成部33な
どを備えている。
【0038】伝送路復号化部31は、伝送路から入力さ
れる伝送路符号を復号化し、符号化波形と無音フラグと
を抽出する。
【0039】波形復号化部32は、伝送路復号化部31
から入力されるAD−PCM、CELPあるいはVSE
LPなどにより圧縮符号化された符号化波形に対して復
号化処理を施して、有音音声区間における音声波形を復
元する。
【0040】無音音声区間波形生成部33は、伝送路復
号化部31から入力される無音フラグに基づいて、所定
の分析区間が無音である無音波形を生成して、これを出
力する。この無音波形は、信号値が全て「0」の波形で
あってもよく、また、所定のエネルギーを持ったノイズ
波形であってもよい。
【0041】このように、上記音声信号処理装置1は、
入力音声波形を圧縮処理して伝送路へ送出するととも
に、伝送路から入力される圧縮された音声信号を伸張し
て元の音声信号波形に戻すことができるので、少ないデ
ータ量で効率良く音声信号を伝送することができる。
【0042】次に、図2は、本発明の特徴的な構成部分
である図1の有音/無音判断部22の構成を示すブロッ
ク図であり、分析区間有音/無音判断部41と、有音/
無音区間変換部42と、判断結果保持部42aとを備え
ている。
【0043】分析区間有音/無音判断部41は、分析区
間切出部21によって切出された各分析区間毎の音声信
号に基づいて、各分析区間における音声信号が有音か無
音かを判断するものである。そして、分析区間における
音声信号レベルの最大値が所定のスレッシュホールドレ
ベル以下の場合は、無音音声区間と判断され、所定のス
レッシュホールドレベル以上の場合は、有音音声区間と
判断される。この分析区間有音/無音判断部41におけ
る有音/無音の判断は、従来と同様である。
【0044】有音/無音区間変換部42は、上記分析区
間有音/無音判断部41で無音と判断された分析区間が
ある場合、その1つ前の分析区間の有音/無音の判断結
果を見て、1つ前の分析区間が有音音声区間のときは、
当該無音音声区間を有音音声区間として処理するよう無
音音声区間を有音音声区間に変換し、波形符号化部23
へ有音空間波形を出力する。これは、1つ前の分析区間
が有音の場合は、減衰した音声波形が残っている可能性
があるからである。また、無音音声区間の1つ前の区間
が無音音声区間の場合は、当該無音音声区間に減衰した
波形が残っている可能性がないため、そのまま無音音声
区間として処理して、無音区間波形を無音フラグ生成部
24へ出力する。
【0045】また、上記以外に、有音/無音区間変換部
42は、1つ前の分析区間ばかりでなく、無音と判断さ
れた分析区間の1つ後の区間が有音か無音かを見て、有
音音声区間の場合は、当該無音音声区間を有音音声区間
として変換処理するように構成してもよい。これは、1
つ後の分析区間が有音の場合は、音声波形の立ち上がり
時における微弱なレベルの音声波形が出ている可能性が
あるからである。この場合も、無音音声区間の1つ後の
区間が無音音声区間の場合は、そのまま無音音声区間と
して処理され、無音区間波形を無音フラグ生成部24へ
出力する。
【0046】判断結果保持部42aは、分析区間有音/
無音判断部41における各区間の有音/無音の判断結果
を保持するものである。これは、上記有音/無音区間変
換部42で無音音声区間を有音音声区間に変換して、そ
の次の分析区間が無音音声区間である場合、その1つ前
の区間を参照する際に、変換後の有音音声区間ではな
く、判断結果保持部42aに保持されている変換前の判
断結果を見て、当該無音音声区間を変換するか否かを決
めるものである。また、無音と判断された分析区間の1
つ後の区間が有音か無音かを見て判断する場合は、上記
判断結果を少し先の分析区間まで保持しておき、1つ後
の判断結果を判断結果保持部42aから読み出して処理
するようにする。
【0047】本実施例の音声信号処理装置1は、上記の
ように構成されており、以下、その動作を説明する。
【0048】まず、テレビ電話装置を使って音声信号を
相手通話者に伝送する場合、テレビ電話装置の受話器か
ら入力される音声信号は、図示しないNCU部を介して
音声処理を行う音声処理部内のCODEC部でアナログ
音声データをA/D変換して順次RAMに一時記憶させ
る。
【0049】そして、音声信号の圧縮伸張処理を行う図
1の音声信号処理装置1では、前記RAMに一時記憶さ
れたデジタル音声データを、図1に示す分析区間切出部
21で分析区間毎に分割する。
【0050】図3は、本実施例の音声信号の符号化/復
号化処理を説明する図であり、図4は、本実施例に係る
分析区間の有音/無音を判断するフローチャートであ
る。
【0051】図3(a)には、入力される音声波形を
〜までの分析区間に分割した状態を示している。
【0052】そして、図2に示す有音/無音判断部22
では、分析区間切出部21によって切出された各分析区
間が有音か無音かを判断する(ステップS100)。詳
しくは、図2に示すように、分析区間有音/無音判断部
41において、各分析区間毎の音声信号レベルの最大値
が所定のスレッシュホールドレベルよりも下の場合は、
無音音声区間と判断され、所定のスレッシュホールドレ
ベルよりも上の場合は、有音音声区間と判断される。そ
して、有音音声区間と判断された有音区間波形は、次段
の波形符号化部23へ出力される。
【0053】また、無音音声区間と判断された場合は、
その無音音声区間の音声信号波形が有音/無音区間変換
部42に入力され、ここで当該無音音声区間の1つ前の
分析区間が有音か無音かを判断する(ステップS10
1)。
【0054】ここで、有音音声区間である場合は、当該
無音音声区間を有音音声区間として、図2の分析区間有
音/無音判断部41から出力される有音音声波形ととも
に、波形符号化部23に出力され、有音処理される(ス
テップS103)。
【0055】ここで、従来例の図5(a)を参照する
と、会話等の末尾の音声信号レベルが減衰して信号レベ
ルが小さくなり、分析区間における信号レベルがスレ
ッシュホールドレベル以下となると、図5(c)示すよ
うに、無音音声区間と判断されて音声波形が消され、音
声が不自然に聞こえることがある。しかし、本実施例で
は、上記のように処理することにより、図3(b)に示
すように、減衰した音声レベルがスレッシュホールドレ
ベル以下であっても、1つ前の分析区間が有音であっ
て、その音声信号成分が減衰したと考えられるため、こ
の微弱レベルの音声信号を生かすように有音音声区間し
て処理し、圧縮符号化するようにする。このため、相手
方で音声信号を伸張して元の信号を復元した場合、微弱
レベルの音声波形部分も復元されて、自然な音声として
聞くことができる。
【0056】また、1つ前の分析区間が無音の場合は、
減衰した音声信号成分が残っている可能性がないため、
そのまま無音処理が行われる(ステップS102)。こ
の無音処理は、図1に示すように、次段の無音フラグ生
成部24で当該分析区間中が無音であることを意味する
無音フラグを作成して、伝送路符号化部25へ出力され
る。
【0057】そして、伝送路符号化部25では、波形符
号化部23からの符号化波形と、無音フラグ生成部24
からの無音フラグとに基づいて所定のデータフォーマッ
トに変換されて、伝送路符号として図示しない伝送路へ
送出される。
【0058】他方、相手方から伝送路を経て送られてき
た伝送路符号は、図1に示す伝送路復号化部31で復号
化して、符号化波形と無音フラグとを抽出する。符号化
波形は、波形復号化部32において、ここではCELP
により圧縮符号化された符号化波形に対して復号化処理
を施し、図3(c)に示す分析区間,,,の音
声波形は勿論のこと、分析区間の音声波形も復元され
る。
【0059】このように、本実施例の音声信号処理装置
では、1つ前の分析区間が有音か無音かによって、当該
無音音声区間の処理を変えるようにしたため、スレッシ
ュホールドレベルを下げる必要がなくなり、通常の微弱
なノイズ等は除去しつつ、必要な音声信号の欠けを防止
して、圧縮/伸張処理することができるので、自然な音
声として伝送することができるようになった。
【0060】また、図3(a)の分析区間に示すよう
に、入力音声波形の立ち上がり時に微弱なレベルの音声
信号波形が出ていることがある。このような場合、従来
と同様に音声信号の圧縮処理が行われて伝送されると、
図5(c)示されるように、微弱レベルの信号成分が消
えてしまう。
【0061】そこで、本実施例の音声信号処理装置1で
は、有音/無音判断部22で各分析区間毎の有音/無音
を判断する際に、まず、分析区間有音/無音判断部41
において図3(a)の分析区間が無音音声区間と判断
される。しかし、有音/無音区間変換部42では、当該
分析区間の1つ後の分析区間が有音音声区間か無音
音声区間かを見て、有音音声区間であれば分析区間を
無音音声区間から有音音声区間に変換し、上記実施例と
同様に圧縮処理する。上記処理動作で、当該分析区間
の1つ後の分析区間が有音音声区間か無音音声区間か
を見る場合は、既に分析区間有音/無音判断部41で判
断された判断結果を判断結果保持部42aに保持してお
き、その保持データに基づいて判断する必要がある。
【0062】このように処理することにより、図3
(a)の分析区間に出ている微弱なレベルの音声信号
波形が有音音声区間として処理されて圧縮符号化される
ため、相手方で復号化されて元の音声信号が復元された
場合に、図3(c)の分析区間に示すように、同様に
復元することが可能となり、自然な音声として聞くこと
ができるようになった。
【0063】以上述べたように、音声信号を一定の分析
区間毎に分割して圧縮処理する際に、立ち上がり時や立
ち下がり時における低レベルの音声信号が1つの分析区
間にかかると、無音音声区間として扱われ、圧縮/伸張
の過程において信号成分が欠けることがある。しかしな
がら、本実施例の音声信号処理装置によれば、無音音声
区間と判断された分析区間を中心に、1つ前、あるいは
1つ後ろの分析区間が有音音声区間か無音音声区間かに
よって、当該無音音声区間の処理を有音音声区間に変更
して圧縮処理するようにしたため、音声信号が圧縮/伸
張処理の過程で欠落することがなくなり、自然な音声を
再現することができるとともに、高効率の圧縮比率が得
られることから、音声信号を少ないデータ量で伝送する
ことができる。
【0064】特に、本発明は、電話等の音声通信などの
場合、同時に話すことがほとんどなく、総通話時間から
見れば、片側通話者の音声信号のさらに半分以上が無音
であり、また、通常に会話している場合でも音声がたて
続けに現れることはなく、無音音声区間が多く含まれて
いると考えられるため、上記圧縮処理を行った場合の効
率は非常に高く、その効果は顕著である。特に、CEL
P系の圧縮処理は、かなりの高能率符号化を行うことが
できる。
【0065】なお、上記実施例において、有音/無音判
断部22で有音か無音かを判断する際に、分析区間にお
ける音声信号のエネルギーや音声信号レベルの最大値が
所定のスレッシュホールドレベル以下であるか否かで判
断している場合を例に上げたが、これに限定されるもの
ではなく、各分析区間毎に有音/無音を判断する全ての
信号処理方法に適用することが可能である。
【0066】また、音声データの圧縮方式としては、本
実施例におけるCELPアルゴリズムに限らず、例え
ば、AD−PCM(Adaptire Diffrential Pulse Code
modulation)方式、VSELP(Vector Sum Excited L
inear Prediction)方式等であっても構わない。
【0067】
【発明の効果】請求項1記載の音声信号処理方法によれ
ば、音声信号を一定区間毎に分割し、その分割された各
区間毎の音声信号が有音か無音かを判断し、その無音と
判断された無音音声区間の前又は後の区間が有音か無音
かによって、当該無音音声区間の処理を変更するように
する。このため、音声信号の一定区間が無音音声区間と
判断されても、その前又は後の区間が有音音声区間の場
合、立ち上がりや立ち下がり時における低レベルの音声
信号が含まれている可能性があるため、前又は後の区間
の状況に応じて当該無音音声区間を有音音声区間とする
など、無音音声区間の処理を変えることにより、無音音
声区間の判断をより一層正確に行うことができる。
【0068】請求項1記載の音声信号処理方法によれ
ば、音声信号を一定区間毎に分割し、その分割された各
区間毎の音声信号が有音か無音かを判断し、その無音と
判断された無音音声区間の前後の少なくとも一方が有音
であるとき、その無音音声区間を有音音声区間に変更す
る。このため、音声信号の一定区間が無音音声区間と判
断されても、その前後の少なくとも一方の区間が有音音
声区間の場合、立ち上がりや立ち下がり時における低レ
ベルの音声信号が含まれている可能性があるため、前後
の区間の状況に応じて当該無音音声区間を有音音声区間
とし、無音音声区間の判断をより一層正確に行うことが
できる。
【0069】請求項3記載の音声信号処理方法によれ
ば、所定の音声信号を一定区間毎に分割し、その分割さ
れた各区間毎の音声信号が有音か無音かを判断し、その
無音と判断された無音音声区間の1つ前の区間が有音音
声区間である場合にのみ、当該無音音声区間を有音音声
区間として処理し、前記有音音声区間を圧縮符号に変換
するとともに、前記無音音声区間を無音符号に変換して
音声信号を圧縮処理する。このため、音声信号の一定区
間が無音音声区間と判断されたとしても、その無音音声
区間の1つ前の区間が有音音声区間である場合、減衰し
た低レベルの音声波形が残っている可能性があるが、こ
れを無音音声区間として信号成分を除去すると、不自然
な音声になるため、当該無音音声区間を有音音声区間と
して処理して、自然な音声とする。
【0070】請求項4記載の音声信号処理装置によれ
ば、音声信号分割手段により入力される音声信号を一定
区間毎に分割し、有音/無音判断手段でその分割された
各区間の音声信号が有音か無音かを判断し、有音/無音
区間変換手段では無音音声区間と判断された区間の直前
の区間が有音である場合に、当該無音音声区間を有音音
声区間に変換して、有音音声区間を圧縮符号化手段で符
号化して圧縮するとともに、無音音声区間を無音符号化
手段で符号化して圧縮する。このため、音声信号の無音
音声区間の1つ前の区間が有音音声区間である場合は、
減衰した低レベルの音声波形が残っている可能性がある
ことから、当該無音音声区間を有音音声区間として処理
することにより、低レベルの音声信号成分が残って、自
然な音声が得られる。
【0071】請求項5記載の音声信号処理装置によれ
ば、有音/無音判断手段によって各区間の音声信号が有
音か無音かを判断した結果を記憶する有音/無音判断結
果記憶手段を備えているので、有音/無音区間変換手段
で無音音声区間を有音音声区間に変換しても、その次の
分析区間が無音音声区間であった場合に、以前の無音と
された判断結果が記憶されているため、その判断結果に
基づいて正確な圧縮処理を行うことができる。
【図面の簡単な説明】
【図1】本実施例に係る音声信号処理装置の構成を示す
ブロック図。
【図2】図1の有音/無音判断部の構成を示すブロック
図。
【図3】本実施例に係る音声信号の符号化/復号化処理
を説明する図。
【図4】本実施例に係る分析区間の有音/無音を判断す
るフローチャート。
【図5】従来例の音声信号の符号化/復号化処理を説明
する図。
【符号の説明】
1 音声信号処理装置 2 符号化部 21 分析区間切出部 22 有音/無音判断部 23 波形符号化部 24 無音フラグ生成部 25 伝送路符号化部 3 復号化部 31 伝送路復号化部 32 波形復号化部 33 無音区間波形生成部 41 分析区間有音/無音判断部 42 有音/無音区間変換部 42a 判断結果保持部

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】音声信号を一定区間毎に分割し、 該分割された各区間毎の音声信号が有音か無音かを判断
    し、 該無音と判断された無音音声区間の前又は後の区間が有
    音か無音かによって、当該無音音声区間の処理を変更す
    ることを特徴とする音声信号処理方法。
  2. 【請求項2】音声信号を一定区間毎に分割し、 該分割された各区間毎の音声信号が有音か無音かを判断
    し、 該無音と判断された無音音声区間の前後の音声区間の少
    なくとも一方が有音であるとき、 該無音音声区間を有音音声区間に変更することを特徴と
    する音声信号処理方法。
  3. 【請求項3】音声信号を一定区間毎に分割し、 該分割された各区間毎の音声信号が有音か無音かを判断
    し、 該無音と判断された無音音声区間の1つ前の区間が有音
    音声区間である場合に、当該無音音声区間を有音音声区
    間として処理し、 前記有音音声区間を圧縮符号に変換するとともに、前記
    無音音声区間を無音符号に変換して音声信号を圧縮処理
    することを特徴とする音声信号処理方法。
  4. 【請求項4】入力される音声信号を一定区間毎に分割す
    る音声信号分割手段と、 該分割された各区間の音声信号が有音か無音かを判断す
    る有音/無音判断手段と、 該有音/無音判断手段で無音音声区間と判断された区間
    の直前の区間が有音である場合に、当該無音音声区間を
    有音音声区間に変換する有音/無音区間変換手段と、 前記有音音声区間を符号化して圧縮する圧縮符号化手段
    と、 前記無音音声区間を符号化して圧縮する無音符号化手段
    と、 を備えたことを特徴とする音声信号処理装置。
  5. 【請求項5】前記音声信号処理装置は、 前記有音/無音判断手段によって各区間の音声信号が有
    音か無音かを判断した結果を記憶する有音/無音判断結
    果記憶手段をさらに備えたことを特徴とする請求項4記
    載の音声信号処理装置。
JP6315884A 1994-11-25 1994-11-25 音声信号処理方法及び音声信号処理装置 Pending JPH08154080A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6315884A JPH08154080A (ja) 1994-11-25 1994-11-25 音声信号処理方法及び音声信号処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6315884A JPH08154080A (ja) 1994-11-25 1994-11-25 音声信号処理方法及び音声信号処理装置

Publications (1)

Publication Number Publication Date
JPH08154080A true JPH08154080A (ja) 1996-06-11

Family

ID=18070767

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6315884A Pending JPH08154080A (ja) 1994-11-25 1994-11-25 音声信号処理方法及び音声信号処理装置

Country Status (1)

Country Link
JP (1) JPH08154080A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110853622A (zh) * 2019-10-22 2020-02-28 深圳市本牛科技有限责任公司 语音断句方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110853622A (zh) * 2019-10-22 2020-02-28 深圳市本牛科技有限责任公司 语音断句方法及系统
CN110853622B (zh) * 2019-10-22 2024-01-12 深圳市本牛科技有限责任公司 语音断句方法及系统

Similar Documents

Publication Publication Date Title
US7627471B2 (en) Providing translations encoded within embedded digital information
JPH09506983A (ja) 音声圧縮方法及び装置
JPH11126098A (ja) 音声合成方法及び装置、並びに帯域幅拡張方法及び装置
US8340959B2 (en) Method and apparatus for transmitting wideband speech signals
JPH09204199A (ja) 非活性音声の効率的符号化のための方法および装置
JP2010503325A (ja) パケットベースのエコー除去および抑制
EP1554717B1 (en) Preprocessing of digital audio data for mobile audio codecs
JPWO2008114432A1 (ja) データ埋め込み装置、データ抽出装置、及び音声通信システム
JPH0636158B2 (ja) 音声分析合成方法及び装置
US6029127A (en) Method and apparatus for compressing audio signals
JP2000209663A (ja) 音声チャネル上で非音声情報を送信する方法
JP2001242896A (ja) 音声符号化/復号装置およびその方法
JPH1049199A (ja) 無音圧縮音声符号化復号化装置
EP1159738B1 (en) Speech synthesizer based on variable rate speech coding
JPH08154080A (ja) 音声信号処理方法及び音声信号処理装置
Ding Wideband audio over narrowband low-resolution media
JP2900987B2 (ja) 無音圧縮音声符号化復号化装置
JP3954288B2 (ja) 音声符号化信号変換装置
JP3279288B2 (ja) デジタル移動通信方式
JPH07334197A (ja) 音声符号化装置
JP2001265390A (ja) 複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法
JP2002099299A (ja) 無音圧縮音声符号化復号化装置
KR100592926B1 (ko) 이동통신 단말기용 디지털 오디오신호의 전처리 방법
JPH0983673A (ja) 音声通信システム、音声通信方法および送受信装置
JPH11145846A (ja) 信号圧縮伸張装置及び方法