JPH10240285A - 音声判別装置 - Google Patents

音声判別装置

Info

Publication number
JPH10240285A
JPH10240285A JP9046708A JP4670897A JPH10240285A JP H10240285 A JPH10240285 A JP H10240285A JP 9046708 A JP9046708 A JP 9046708A JP 4670897 A JP4670897 A JP 4670897A JP H10240285 A JPH10240285 A JP H10240285A
Authority
JP
Japan
Prior art keywords
frame
speech
preliminary
result
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP9046708A
Other languages
English (en)
Inventor
秀享 ▲高▼橋
Hideyuki Takahashi
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Olympus Corp
Original Assignee
Olympus Optical Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Olympus Optical Co Ltd filed Critical Olympus Optical Co Ltd
Priority to JP9046708A priority Critical patent/JPH10240285A/ja
Publication of JPH10240285A publication Critical patent/JPH10240285A/ja
Withdrawn legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 音声判別ミスによる過度な判別結果の切り換
えを防止することができる簡単な構成の音声判別装置を
提供する。 【解決手段】 符号化対象フレームのエネルギーEp お
よび後続フレームのエネルギーEf を計算するフレーム
エネルギー計算部12と、上記エネルギーEp,Ef と
所定のしきい値とを比較することにより上記符号化対象
フレームおよび後続フレームが音声/非音声の何れであ
るかを各予備判別結果dp ,df として出力する予備判
定部13,14と、先行フレームにおける音声判別結果
dprevと上記予備判別結果dp ,df とに基づいて、d
prev=df ≠dp である場合にはdp の逆の結果を、そ
れ以外の場合にはdp を、当該符号化対象フレームの最
終的な音声判別結果dとして決定する決定部15とを備
えた音声判別装置。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声判別装置、よ
り詳しくは、ディジタル化した入力信号を音声信号と非
音声信号とに判別する音声判別装置に関する。
【0002】
【従来の技術】従来より、音声のデータ圧縮をより高能
率化する技術手段として、高能率な音声符号化と非音声
圧縮機能とを組み合わせるものが知られている。
【0003】こうした従来技術としては、例えば特開平
6−12100号公報に、入力アナログ信号をサンプリ
ングしてディジタル化し、音声検出回路により音声状態
か背景雑音等の非音声状態かを検出してその検出結果を
メモリに格納するとともに、音声状態であるときにのみ
該音声データを記録媒体に記録し、再生時においては上
記メモリの検出結果を参照して、音声状態のときにのみ
記録媒体から音声データを読み出して疑似雑音を重畳し
て再生し、非音声状態のときには無音または疑似雑音再
生を行うことにより、より小さなデータ量で効率的な再
生を図るものが記載されている。
【0004】このような技術においては、背景雑音が混
入するような実際的な環境においても、入力信号が音声
信号または非音声信号の何れであるかを精度良く判別す
る音声判別装置が必要とされる。
【0005】例えば、人間が耳で聞いた音の音声/非音
声を判別する際には、その音の大きさ(エネルギー)を
判断材料の一つとして用いているが、これだけではな
く、その音に含まれる様々な特徴を抽出して、高度な知
識に基づいて総合的に判断しているものと考えられる。
【0006】しかし、音声判別装置においては、より安
価に装置を提供するという観点から、入力信号のエネル
ギーと所定のしきい値との大小を比較して、その入力信
号のエネルギーが上記しきい値よりも大きい場合には音
声、そうでない場合には非音声であるとする判別手段が
一般的に用いられている。
【0007】こうした音声判別装置においては、背景雑
音は判別ミスを招く要因となるが、この背景雑音が混入
するような実際的な環境においても精度の良い判別を行
うために、本出願人は、上記しきい値を背景雑音の大き
さに適応して設定する技術を開発している。
【0008】すなわち、本出願人の開発した音声判別装
置は、フレーム分割された入力信号のレベルが現在設定
されているしきい値よりも大きい場合にはそのしきい値
を所定の割合で増加させ、一方、小さい場合には該しき
い値を減少させるものであって、さらに、現在のしきい
値が音声状態判別処理の開始時から所定時間内における
入力信号のレベルの最小値よりも小さい場合には、上記
しきい値の増加割合を通常時の増加割合よりも大きい所
定の割合に設定するものである。
【0009】
【発明が解決しようとする課題】しかしながら、上述し
たようなしきい値を適応的に変化させる音声判別装置に
おいても、背景雑音のレベルが大きくなると、入力信号
が音声信号と非音声信号の何れであるかを正確に判別す
ることが困難になるために、判別ミスが頻繁に発生する
ようになり、場合によっては、判別ミスに起因して数フ
レームの間に音声モードと非音声モードとの切り替えが
頻繁に行われてしまうことがある。そして、このような
状況において再生される再生音は、不自然で、非常に聞
き苦しいものとなってしまう。
【0010】本発明は上記事情に鑑みてなされたもので
あり、音声判別ミスによる過度な判別結果の切り換えを
防止することができる簡単な構成の音声判別装置を提供
することを目的としている。
【0011】
【課題を解決するための手段】上記の目的を達成するた
めに、第1の発明による音声判別装置は、ディジタル化
した入力信号を一定の長さに分割したフレームを単位と
して、符号化対象フレームにおける入力信号を音声信号
と非音声信号とに判別する音声判別装置であって、連続
する3個の符号化対象フレームの内の少なくとも連続す
る2個のフレームが同一の判別結果となるように制御す
る制御手段を備えたものである。
【0012】また、第2の発明による音声判別装置は、
ディジタル化した入力信号を一定の長さに分割したフレ
ームを単位として、符号化対象フレームにおける入力信
号を音声信号と非音声信号とに判別する音声判別装置で
あって、符号化対象フレームにおける入力信号と当該符
号化対象フレームの後続フレームにおける入力信号の各
々について予備的に音声信号と非音声信号とに判別する
予備判別手段と、上記符号化対象フレームの先行フレー
ムにおける音声判別結果と当該符号化対象フレームにお
ける予備判別結果と上記後続フレームにおける予備判別
結果とに基づいて当該符号化対象フレームの最終的な音
声判別結果を決定する決定手段とを備えたものである。
【0013】さらに、第3の発明による音声判別装置
は、上記第2の発明による音声判別装置において、上記
決定手段が、当該符号化対象フレームにおける予備判別
結果が上記先行フレームにおける音声判別結果と異なり
かつ上記後続フレームにおける予備判別結果と異なると
きは当該符号化対象フレームにおける予備判別結果を逆
の結果に補正して最終的な音声判別結果として決定し、
それ以外のときは当該符号化対象フレームにおける予備
判別結果をそのまま最終的な音声判別結果として決定す
るものである。
【0014】従って、第1の発明による音声判別装置
は、ディジタル化した入力信号を一定の長さに分割した
フレームを単位として、符号化対象フレームにおける入
力信号を音声信号と非音声信号とに判別し、このとき、
制御手段が連続する3個の符号化対象フレームの内の少
なくとも連続する2個のフレームが同一の判別結果とな
るように制御する。
【0015】また、第2の発明による音声判別装置は、
ディジタル化した入力信号を一定の長さに分割したフレ
ームを単位として、符号化対象フレームにおける入力信
号を音声信号と非音声信号とに判別し、このとき、予備
判別手段が符号化対象フレームにおける入力信号と当該
符号化対象フレームの後続フレームにおける入力信号の
各々について予備的に音声信号と非音声信号とに判別
し、決定手段が上記符号化対象フレームの先行フレーム
における音声判別結果と当該符号化対象フレームにおけ
る予備判別結果と上記後続フレームにおける予備判別結
果とに基づいて当該符号化対象フレームの最終的な音声
判別結果を決定する。
【0016】さらに、第3の発明による音声判別装置
は、上記決定手段が、当該符号化対象フレームにおける
予備判別結果が上記先行フレームにおける音声判別結果
と異なりかつ上記後続フレームにおける予備判別結果と
異なるときは当該符号化対象フレームにおける予備判別
結果を逆の結果に補正して最終的な音声判別結果として
決定し、それ以外のときは当該符号化対象フレームにお
ける予備判別結果をそのまま最終的な音声判別結果とし
て決定する。
【0017】
【発明の実施の形態】以下、図面を参照して本発明の実
施の形態を説明する。図1から図4は本発明の一実施形
態を示したものであり、図1は音声判別装置が適用され
る音声符号化装置の構成を示すブロック図、図2は上記
音声符号化装置において信号を符号化対象フレームおよ
び後続フレームに分割する例を示す波形図である。
【0018】この音声符号化装置は、図1に示すよう
に、例えば8kHz(すなわち、1サンプル当たり1/
8ms)でサンプリングされた信号を入力する入力端子
1と、この入力端子1から入力した信号を、図2に示す
ように、一定の長さのフレーム間隔(例えば20ms、
すなわち160サンプル)に分割して、符号化対象フレ
ームの信号およびこの符号化対象フレームの後続フレー
ムの信号を格納するバッファメモリ2と、このバッファ
メモリ2からフレーム単位で送出された符号化対象フレ
ームの信号および後続フレームの信号を入力して、後述
するような手段により当該符号化対象フレームの信号が
音声信号または非音声信号の何れであるかを判別する音
声判別装置たる音声/非音声判別部3と、この音声/非
音声判別部3の判別結果に基づいて当該符号化対象フレ
ームの信号の出力先を切り換える符号化切換スイッチ4
と、この符号化切換スイッチ4の出力端子の一方に接続
されていて、上記判別結果が音声信号であると判別され
たときに選択されて音声符号化を行う音声符号化部5
と、上記符号化切換スイッチ4の出力端子の他方に接続
されていて、上記判別結果が非音声信号であると判別さ
れたときに選択されて非音声符号化を行う非音声符号化
部6と、上記音声符号化部5により符号化された結果が
出力される第1の出力端子7と、上記非音声符号化部6
により符号化された結果が出力される第2の出力端子8
とを有して構成されている。
【0019】図3は上記音声/非音声判別部3の構成を
示すブロック図である。この音声/非音声判別部3は、
上記バッファメモリ2から出力された符号化対象フレー
ムの信号およびその後続フレームの信号を入力端子11
を介して入力し、符号化対象フレームのフレームエネル
ギーEp および後続フレームのフレームエネルギーEf
を計算するフレームエネルギー計算部12と、このフレ
ームエネルギー計算部12により計算された符号化対象
フレームのフレームエネルギーEp に基づいて該符号化
対象フレームの信号が音声信号または非音声信号の何れ
であるかを予備的に判別する予備判別手段たる符号化対
象フレーム予備判定部13と、上記フレームエネルギー
計算部12により計算された後続フレームのフレームエ
ネルギーEf に基づいて該後続フレームの信号が音声信
号または非音声信号の何れであるかを予備的に判別する
予備判別手段たる後続フレーム予備判定部14と、上記
符号化対象フレーム予備判定部13による予備判別結果
dp と上記後続フレーム予備判定部14による予備判別
結果df 、および該符号化対象フレームの先行フレーム
の音声判別結果dprevに基づいて、当該符号化対象フレ
ームの信号が音声信号または非音声信号の何れであるか
を判別し、その最終的な音声判別結果dを出力端子16
を介して上記符号化切換スイッチ4へ出力する制御手段
であり決定手段たる決定部15とを有して構成されてい
る。
【0020】次に、上述したような音声/非音声判別部
3の動作について、図3を参照して説明する。
【0021】上記入力端子11を介して供給されたバッ
ファメモリ2からの信号に基づいて、フレームエネルギ
ー計算部12は、符号化対象フレームのフレームエネル
ギーEp およびその後続フレームのフレームエネルギー
Ef を、次のような数式1および数式2により計算す
る。
【数1】
【数2】 ここに、s(n)はサンプルnにおける入力信号、Nは
フレーム長を示している。
【0022】こうして計算されたフレームエネルギーE
p ,Ef は、各々符号化対象フレーム予備判定部13、
後続フレーム予備判定部14に送出される。
【0023】これら符号化対象フレーム予備判定部13
と後続フレーム予備判定部14は、上記フレームエネル
ギーEp ,Ef と所定のしきい値とをそれぞれ比較し
て、該フレームエネルギーEp ,Ef がそのしきい値よ
りも大きい場合には音声信号であると判別し、小さい場
合には非音声信号であると判別して、その予備判別結果
dp ,df をそれぞれ決定部15に送出する。
【0024】このときに、上記フレームエネルギーが現
在のしきい値よりも大きい場合にはそのしきい値を所定
の割合で増加させ、一方、小さい場合にはそのしきい値
を減少させるようにするとともに、現在のしきい値が音
声状態判別処理の開始時から所定時間内におけるフレー
ムエネルギーの最小値よりも小さい場合には、上記しき
い値の増加割合を通常時の増加割合よりも大きい所定の
割合に設定するようにしており、速い応答性で適応的に
しきい値を変化させるようになっている。
【0025】上記決定部15は、先行フレームにおける
当該決定部15の出力である音声判別結果dprevと、当
該符号化対象フレームにおける予備判別結果dp と、後
続フレームにおける予備判別結果df とに基づいて、当
該符号化対象フレームの最終的な音声判別結果dを、次
のような数式3により決定して出力端子16に送出す
る。
【数3】 ここに、上記3種類の判別結果dprev,dp ,df は2
値として与えられ、音声を1、非音声を0としている。
また、記号「!」は論理否定、記号「^」は排他的論理
和、記号「&」は論理積をそれぞれ示している。
【0026】上記数式3の意味するところは、具体的に
説明すれば次のようになる。
【0027】右辺の上側が得られる場合の条件について
考えると、論理積「&」の演算結果が1となるのは、 dprev^dp =1 かつ dp ^df =1 であるときのみである。さらに、dprev^dp =1が満
たされる解は、 (dprev,dp )=(0,1),(1,0) のみであり、同様に、dp ^df =1が満たされる解
は、 (dp ,df )=(0,1),(1,0) のみであるから、結局dprev,dp ,df の組み合わせ
として取り得るのは、 (dprev,dp ,df )=(0,1,0),(1,0,
1) のときである。
【0028】この条件のときにdp が否定されるわけで
あるから、つまり、符号化対象フレームの予備判別結果
dp が、先行フレームの音声判別結果dprevおよび後続
フレームの予備判別結果df の何れとも異なる場合に
は、最終的な音声判別結果dは、符号化対象フレームの
予備判別結果dp の逆の値となるように決定されるとい
うことを意味している。
【0029】また、その他の場合には、符号化対象フレ
ームの予備判別結果dp をそのまま最終的な音声判別結
果dとして用いることになる。
【0030】なお、dprev,dp ,df として可能な組
み合わせは全部で2×2×2=8通りあるが、決定部1
5による上述のような論理判断の結果、上記2通りが否
定されるために、可能なものとして生き残るのは、 (dprev,dp ,df )=(0,0,0),(0,0,
1),(0,1,1),(1,0,0),(1,1,
0),(1,1,1) の6通りである。
【0031】この結果を見れば判るように、符号化対象
フレームとその先行および後続フレームの内、少なくと
も連続する2個のフレームが同一の判別結果となるよう
に決定されることが判る。
【0032】上述したような数式3に基づいて行う音声
/非音声判別の決定処理は、具体的には、図4に示すよ
うになる。すなわち、符号化対象フレームの予備判別結
果dp と先行フレームの音声判別結果dprevを比較して
(ステップS1)、これらが等しい場合には、最終的な
音声判別結果dとして予備判別結果dp をそのまま用い
る(ステップS2)。
【0033】また、上記ステップS1において、符号化
対象フレームの予備判別結果dp と先行フレームの音声
判別結果dprevが異なる場合には、符号化対象フレーム
の予備判別結果dp と後続フレームの予備判別結果df
を比較して(ステップS3)、これらが等しい場合に
は、最終的な音声判別結果dとして予備判別結果dp を
そのまま用いる(ステップS4)。
【0034】一方、上記ステップS3において、符号化
対象フレームの予備判別結果dp と後続フレームの予備
判別結果df が異なる場合には、最終的な音声判別結果
dとして先行フレームの音声判別結果dprev、つまり予
備判別結果dp とは逆の結果を用いる(ステップS
5)。
【0035】このような決定処理によって、1フレーム
だけがその先行フレームおよび後続フレームの判別結果
と反対の結果に判別されるのを防止することができる。
【0036】なお、本実施形態においては、音声区間に
おける符号化は、公知のマルチパルス方式やCELP
(Code Exited Linear Predictive)方式などの適当な
方式を使うことにより達成することができる。
【0037】このような実施形態の音声判別装置が適用
された音声符号化装置によれば、簡単な構成で、音声判
別ミスによる過度な判別結果の切り換えを防止すること
ができ、適切な音声符号化を行うことができる。
【0038】なお、本発明は上述した各実施形態に限定
されるものではなく、発明の主旨を逸脱しない範囲内に
おいて種々の変形や応用が可能であることは勿論であ
る。
【0039】
【発明の効果】以上説明したように、請求項1、請求項
2、または請求項3による本発明の音声判別装置によれ
ば、簡単な構成で、音声判別ミスによる過度な判別結果
の切り換えを防止することができる。
【図面の簡単な説明】
【図1】本発明の一実施形態の音声符号化装置の構成を
示すブロック図。
【図2】上記実施形態の音声符号化装置において、信号
を符号化対象フレームおよび後続フレームに分割する例
を示す波形図。
【図3】上記実施形態の音声符号化装置における音声/
非音声判別部の構成を示すブロック図。
【図4】上記実施形態の音声/非音声判別部による符号
化対象フレームの判別処理を示すフローチャート。
【符号の説明】
2…バッファメモリ 3…音声/非音声判別部(音声判別装置) 12…フレームエネルギー計算部 13…符号化対象フレーム予備判定部(予備判別手段) 14…後続フレーム予備判定部(予備判別手段) 15…決定部(制御手段,決定手段) d…符号化対象フレームの最終的な音声判別結果 dp …符号化対象フレームの予備判別結果 df …後続フレームの予備判別結果 dprev…先行フレームの音声判別結果 Ep …符号化対象フレームのフレームエネルギー Ef …後続フレームのフレームエネルギー

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 ディジタル化した入力信号を一定の長さ
    に分割したフレームを単位として、符号化対象フレーム
    における入力信号を音声信号と非音声信号とに判別する
    音声判別装置であって、 連続する3個の符号化対象フレームの内の少なくとも連
    続する2個のフレームが同一の判別結果となるように制
    御する制御手段を具備したことを特徴とする音声判別装
    置。
  2. 【請求項2】 ディジタル化した入力信号を一定の長さ
    に分割したフレームを単位として、符号化対象フレーム
    における入力信号を音声信号と非音声信号とに判別する
    音声判別装置であって、 符号化対象フレームにおける入力信号と、当該符号化対
    象フレームの後続フレームにおける入力信号の各々につ
    いて、予備的に音声信号と非音声信号とに判別する予備
    判別手段と、 上記符号化対象フレームの先行フレームにおける音声判
    別結果と、当該符号化対象フレームにおける予備判別結
    果と、上記後続フレームにおける予備判別結果とに基づ
    いて、当該符号化対象フレームの最終的な音声判別結果
    を決定する決定手段と、 を具備したことを特徴とする音声判別装置。
  3. 【請求項3】 上記決定手段は、当該符号化対象フレー
    ムにおける予備判別結果が、上記先行フレームにおける
    音声判別結果と異なり、かつ上記後続フレームにおける
    予備判別結果と異なるときは、当該符号化対象フレーム
    における予備判別結果を逆の結果に補正して最終的な音
    声判別結果として決定し、それ以外のときは当該符号化
    対象フレームにおける予備判別結果をそのまま最終的な
    音声判別結果として決定するものであることを特徴とす
    る請求項2に記載の音声判別装置。
JP9046708A 1997-02-28 1997-02-28 音声判別装置 Withdrawn JPH10240285A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9046708A JPH10240285A (ja) 1997-02-28 1997-02-28 音声判別装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9046708A JPH10240285A (ja) 1997-02-28 1997-02-28 音声判別装置

Publications (1)

Publication Number Publication Date
JPH10240285A true JPH10240285A (ja) 1998-09-11

Family

ID=12754869

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9046708A Withdrawn JPH10240285A (ja) 1997-02-28 1997-02-28 音声判別装置

Country Status (1)

Country Link
JP (1) JPH10240285A (ja)

Similar Documents

Publication Publication Date Title
JP4146489B2 (ja) 音声パケット再生方法、音声パケット再生装置、音声パケット再生プログラム、記録媒体
JP4630876B2 (ja) 話速変換方法及び話速変換装置
EP0736858B1 (en) Mobile communication equipment
JP2835483B2 (ja) 音声判別装置と音響再生装置
JPH02288520A (ja) 背景音再生機能付き音声符号復号方式
JPS62274941A (ja) 音声符号化方式
JP2000172283A (ja) 有音検出方式及び方法
JP2728122B2 (ja) 無音圧縮音声符号化復号化装置
JPH07334191A (ja) パケット音声復号方法
JPH10240285A (ja) 音声判別装置
US6240383B1 (en) Celp speech coding and decoding system for creating comfort noise dependent on the spectral envelope of the speech signal
JPH0612095A (ja) 音声復号化方法
JPH11175096A (ja) 音声信号処理装置
JP2900987B2 (ja) 無音圧縮音声符号化復号化装置
JPH0728486A (ja) 音声圧縮装置
JP3187953B2 (ja) 無線通信装置
JPH1022936A (ja) 補間装置
JP3593183B2 (ja) 音声復号装置
JP3055608B2 (ja) 音声符号化方法および装置
JP2001265390A (ja) 複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法
JPH0530137A (ja) 音声パケツト伝送装置
JPH0832526A (ja) 音声検出器
JP2885225B2 (ja) 音声符号化復号化装置
JPH0637734A (ja) 音声伝送方式
JP2000134222A (ja) 雑音挿入システム

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20040511