JP2656586B2 - 音声検出方法及びその装置 - Google Patents

音声検出方法及びその装置

Info

Publication number
JP2656586B2
JP2656586B2 JP63300479A JP30047988A JP2656586B2 JP 2656586 B2 JP2656586 B2 JP 2656586B2 JP 63300479 A JP63300479 A JP 63300479A JP 30047988 A JP30047988 A JP 30047988A JP 2656586 B2 JP2656586 B2 JP 2656586B2
Authority
JP
Japan
Prior art keywords
frame
voice
detection
sub
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP63300479A
Other languages
English (en)
Other versions
JPH02148099A (ja
Inventor
隆二郎 村松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP63300479A priority Critical patent/JP2656586B2/ja
Publication of JPH02148099A publication Critical patent/JPH02148099A/ja
Application granted granted Critical
Publication of JP2656586B2 publication Critical patent/JP2656586B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Time-Division Multiplex Systems (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、情報通信システムのデイジタル・スピーチ
・インタポレーシヨン(Digital Speech Interpocatio
n,以下、DSIと称す)において、特にフレーム処理を行
なう高能率音声符号化装置に好適な音声検出方式に関す
る。
〔従来の技術〕
従来、音声検出器については、NTCレコード10、6−
1(1976年)(National Telecommunications Conferen
ce Record 10.6−1、Dec.1976)において論じられてい
る。
すなわち、従来の音声検出器では、入力音声を低域通
過フイルタに通してエンベロープ成分を抽出するかまた
は入力音声よりパワーを直接演算により求めるかした
後、固定閾値と比較して有音無音の識別を連続的に行な
つて来た。
そして、この音声検出出力を用いて、無音区間を抑圧
して、回線の有効活用をはかるDSIシステム等の制御を
行なつて来た。
〔発明が解決しようとする課題〕
一般的に、フレーム単位(通常、フレーム周期は20m
s)に音声を切り出してまとめて情報圧縮を行なう高能
率符号化方式により、音声情報を伝達するDSIシステム
においては、音声検出出力も、フレーム周期毎に出力さ
れ、該当フレームが有音フレームであるか、無音フレー
ムであるかの識別に利用される。
しかしながら、このようなDSIシステムにおいて、従
来技術である音声検出方式を適用した場合、特定フレー
ム内に存在する入力音声のエンベロープまたはパワーに
より有音無音の識別を行なうため、フレームの後半で無
音から有音に立ち上がる音声や、フレームの前半で有音
から無音に変化する音声の場合該当フレームは、無音フ
レームとして識別され易くなる。そして、このような現
象はシステムを通して通話した場合、それぞれ語頭切
れ、語尾切れにつながり、正しく会話内容が伝わらない
という不具合を生ずる。また、前述の不具合を回避する
ため単に検出閾値を下げたのでは、微弱な雑音を有音と
識別し易くなり、システムの回線利用効果の低下につな
がる。
〔課題を解決するための手段〕
本発明は、フレーム毎に音声の有無を識別する音声検
出方式において、 上記各フレームを複数のサブフレームに分割し、上記
サブフレーム毎の音声情報を検出する第1のステツプ
と; 上記音声情報の検出結果に重み付けを行ない、1フレ
ームにわたつて総和を求める第2のステツプと; 上記重み付けを行なつた出力結果に基づき、音声の有
無を判別する第3のステツプと; からなることを特徴とする。
〔作 用〕
本発明の音声検出器によれば、無音から有音へ変化時
には、乗じられる重みがフレームの後半になるほど大き
いために、音声が入力し始める時点がフレームの前半に
ある場合と、フレームの後半にある場合とで、フレーム
単位の音声情報の値は、従来技術に比べて差が小さくど
ちらも有音と判定され易くなる。また、有音から無音へ
の変化時には、乗じられる重みがフレームの後半になる
ほど小さいために、音声がなくなる時点がフレームの前
半にある場合と、フレームの後半にある場合とで、フレ
ーム単位の音声情報の値は、やはり従来技術と比べて差
が小さくどちらも有音と判定され易くなる。これによ
り、従来の技術で問題となつていた語頭切れや語尾切れ
を少なくすることができる。なお、微少雑音に対して
は、サブフレーム毎の検出閾値が雑音レベルを下まわら
ない様に設定しておくことにより、誤つて有音と識別す
ることを防止することができる。
〔実施例〕
以下、本発明の実施例を図面を参照して詳細に説明す
る。
第3図は、長距離電話伝送において、回線の有効活用
をはかるDSIシステムの構成図である。
同図において、20及び70は、構内交換機(以下、PBX
と称す)、11〜1n及び81〜8nは、それぞれPBX20,PBX70
の内線電話端末、5及び6はデイジタル回線、1は、PB
X20の内線電話端末10〜1nからの音声データが有音か無
音かを検出し、有音である音声データのみ多重化してデ
イジタル回線5へ送信するDSI送信装置、2は、デイジ
タル回線5からの多重化された音声信号を受信して、分
配制御を行ない、PBX70の内線電話端末80〜8nへ出力さ
せるDSI受信装置、3は、PBX70の内線電話端末80〜8nか
らの音声データが有音か無音かを検出し、有音である音
声データのみを多重化してデイジタル回線6に送信する
DSI送信装置、4は、デイジタル回線6からの多重化さ
れたデータを受信して、分配制御を行ないPBX20の内端
電話端末10〜1nへ出力させるDSI受信装置である。
まず、内線電話端末11〜1nより内線電話端末81〜8nへ
の音声データの伝送に関して、本システムのDSI送信装
置1の動作を第4図を参照し説明する。
内線電話端末11〜1nより入力した音声はPBX20を通つ
た後、DSI送信装置1に入力される。DSI送信装置1に入
力された音声は、高能率音声符号器31〜3nにより20msフ
レーム単位で情報圧縮されると同時に、音声検出器41〜
4nによつて音声の有無を20ms毎に検出される。音声検出
器41〜4nからの音声検出出力は割当制御部51に入力さ
れ、音声信号接続部50を制御すると共に、割当信号発生
部52へ情報を伝達する。音声信号接続部50では、n本の
高能率音声符号器31〜3nからの出力のうち有音部の音声
符号化データ出力のみを多重化し回線多重部53へ送出す
る。回線多重部53は、更に上記有音部の音声符号化デー
タと割当信号を多重化した多重化データをデイジタル回
線5へ出力する。
次に、本システムのDSI受信装置2の動作について第
5図を参照し説明する。
まず、デイジタル回線5からの多重化データは、多重
分離部54によつて上記音声符号化データと上記割当信号
とに分離され、音声符号化データを音声信号接続部55
へ、割当信号を割当信号受信部56へそれぞれ入力する。
次に、分配制御部57は、割当信号受信部56からの出力を
もとに音声信号接続部55の制御を行い、音声信号接続部
55は、音声符号化データの分配制御を行なう。そして、
分配制御された音声符号化データは、音声復号器61〜6n
によつて音声データに変換され、PBX70を介して内線電
話端末81〜8nへ出力される。
また、同様にしてPBX70の内線電話端末81〜8nにより
入力した音声は、DSI送信装置3で多重化され、DSI受信
装置4によつて再生されて、PBX20の内線電話端末11〜1
nへ出力される。
次に、DSI送信装置1及び3の音声検出器(第4図,41
〜4n)の動作を第1図,第2図により説明する。
第1図において、音声入力4101は高域通過フイルタに
より直流成分が除去された後、4ms長のサブフレーム毎
に動作するサブフレーム内パワー構算部4103及び4105と
サブフレーム内ゼロクロス数計数部4107に入力される。
音声入力は8KHzでサンプリングされているためサブフ
レーム内パワー演算部4103及び4105では次式(1)によ
りパワーを算出する。
次に、サブフレーム内パワー演算部4103及び4105で
は、各々高レベル検出閾値4104、低レベル検出閾値4106
との比較が次の様に行なわれる。
検出閾値をThjで表せば、 Psk≧ThjのときDjk=1 Psk<ThjのときDjk=0 (j=1,2) によりパワー検出を行なう。
また、同時にサブフレーム内ゼロクロス数計数部4107
によつて連続する2サンプルのフイルタ出力の極性ビツ
トが異符号となる数、すなわちゼロクロス数の計数を次
の演算(2)によつてサブフレーム毎に行なわれる。
ここで である。
そして、ゼロクロス数検出閾値4108との比較が同様に
次の様に行なわれる。
Zsk≧Th3のときD3k=1 Zsk<Th3のときD3k=0 次に、サブフレーム内パワー演算部4103,4105及びサ
ブフレーム内ゼロクロス数計数部4107の出力D1k,D2k
びD3kは、それぞれ増加関数重み付け総和部4109,4111,4
113に入力され、次の演算(3)が行なわれる。
また、減少関数重み付け総和部4112では、次の演算
(4)が行なわれる。
なお、上述した増加関数重み付け演算の様子を第6図
に示し、また減少関数重み付け演算の様子を第7図に示
す。
以上により求められたD1,D2,D3,D4は、フレーム単位
の重み付け総和であり、整数値となる。また、これらを
再び固定閾値4114〜4117と、フレーム毎の検出部4118,4
120,4121,4122において次の様に比較する。
Dj≧FTHjのときLj=1 Dj<FTHjのときLj=0 (j=1,2,3,4) ここで、FTHjは固定閾値4114〜4117の閾値を表わして
いる。
また、これらとは別にフレーム内パワー演算部4110に
よつて、フレーム内パワーを次式(5)により求める。
次にフレーム間パワー増分検出器4119にて、下記判定
を行なう。
これは、現フレームのパワーが前フレームのパワーの
2倍以上かどうかを判定するものである。
上述の動作によつて得られたL1〜L5をもとに、論理判
定部4123は、有音、無音の判定を行なう。
以下、論理判定部4123の動作を、第2図に従い説明す
る。
論理判定部4123は、まず、検出部4118の出力L1が“1"
(step1)かまたは、検出部4122の出力L3が“1"(step
2)の場合には、有音と判定し、有音フラグに“1"をセ
ツトし(step9)、ハング・オーバー・タイマをセツト
して(step10)、有音フラグの出力を行なう(step1
1)。また、検出部4120の出力L2およびパワー増分検出
器の出力L5が同時に“1"の場合も(step3,step4)、同
様に有音と判定して、有音フラグを“1"にセツトし(st
ep9)、ハング・オーバー・タイマをセツトして(step1
0)、有音フラグの出力(“1")を音声検出出力4124へ
行なう(step11)。
次に、検出部4121の出力L4が“0"となつた場合には
(step5)、論理判定部4123の中にあるハング・オーバ
ー・タイマを起動し(step6,step7)、タイマー設定時
間経過後有音フラグを“0"にセツトして(step8)、有
音フラグの出力(“0")を音声検出出力4124へ行なう
(step11)。
〔発明の効果〕
本発明によれば、以下に記載される効果が得られる。
(1) 音声開始時には、フレーム後半のサブフレーム
の音声検出結果に大きな重みをかけることにより語頭切
れの少ない音声検出が行なえる。
(2) 音声終了時には、フレームの前半のサブフレー
ムの音声検出結果に大きな重みをかけることにより語尾
切れの少ない音声検出が行なえる。
【図面の簡単な説明】
第1図は、音声検出器のブロツク構成図、第2図は、論
理判定部の論理判定フローチヤート図、第3図は、DSI
システム構成図、第4図は、DSI送信装置のブロツク構
成図、第5図は、DSI受信装置のブロツク構成図、第6
図は、フレームの後半で立ち上がる音声を、有音と判定
する様子を示す図、第7図は、フレームの前半で立ち下
がる音声を、有音と判定する様子を示す図である。 1,3……DSI送信装置、2,4……DSI受信装置、20,70……
構内交換機、11〜1n,81〜8n……内線電話端末、41……
音声検出器。

Claims (5)

    (57)【特許請求の範囲】
  1. 【請求項1】フレーム毎に音声の有無を識別する音声検
    出方式において、 上記各フレームを複数のサブフレームに分割し、上記サ
    ブフレーム毎の音声情報を検出する第1のステツプと; 上記音声情報の検出結果に重み付けを行ない、1フレー
    ムにわたつて総和を求める第2のステツプと; 上記重み付けを行なつた出力結果に基づき、音声の有無
    を判別する第3のステツプと; からなる音声検出方法。
  2. 【請求項2】各フレームの前半部分のサブフレームよ
    り、各フレームの後半部分のサブフレームに重み付けを
    行なつて、語頭切れをなくすようになしたことを特徴と
    する請求項1記載の音声検出方法。
  3. 【請求項3】各フレームの後半部分のサブフレームによ
    り、各フレームの前半部分のサブフレームに重み付けを
    行なつて、語尾切れをなくすようになしたことを特徴と
    する請求項1記載の音声検出方法。
  4. 【請求項4】フレーム毎に音声の有無を識別する音声検
    出方式において、 上記各フレームを複数のサブフレームに分割し、上記サ
    ブフレーム毎の音声情報を検出する第1のステツプと; 上記各フレームの前半部分のサブフレームの音声情報の
    検出結果より、上記各フレームの後半部分のサブフレー
    ムの音声情報の検出結果に重み付けを行い、1フレーム
    にわたつて総和を求める第2のステツプと; 上記各フレームの後半部分のサブフレームの音声情報の
    検出結果より、上記各フレームの前半部分のサブフレー
    ムの音声情報の検出結果に重み付けを行い、1フレーム
    にわたつて総和を求める第3のステツプと; を備え、上記第2のステツプによつて音声の検出出力が
    得られない時に、上記第3のステツプで音声の検出を行
    なうようになしたことを特徴とする音声検出方法。
  5. 【請求項5】フレーム毎に音声の有無を識別する音声検
    出方式において、 上記各フレームを複数のサブフレームに分割し、上記サ
    ブフレーム毎の音声情報を検出する音声情報検出手段
    と; 上記音声情報検出手段の検出結果に重み付けを行ない、
    1フレームにわたつて総和を求める重み付け総和手段
    と; 上記重み付け総和手段からの出力結果に基づき、音声の
    有無を判別する判別手段と; を備えたことを特徴とする音声検出装置。
JP63300479A 1988-11-30 1988-11-30 音声検出方法及びその装置 Expired - Lifetime JP2656586B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63300479A JP2656586B2 (ja) 1988-11-30 1988-11-30 音声検出方法及びその装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63300479A JP2656586B2 (ja) 1988-11-30 1988-11-30 音声検出方法及びその装置

Publications (2)

Publication Number Publication Date
JPH02148099A JPH02148099A (ja) 1990-06-06
JP2656586B2 true JP2656586B2 (ja) 1997-09-24

Family

ID=17885296

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63300479A Expired - Lifetime JP2656586B2 (ja) 1988-11-30 1988-11-30 音声検出方法及びその装置

Country Status (1)

Country Link
JP (1) JP2656586B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000079516A1 (fr) * 1999-06-23 2000-12-28 Nec Corporation Dispositif et procede de determination de trames voisees/non voisees

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4883718B2 (ja) * 2008-03-31 2012-02-22 公益財団法人鉄道総合技術研究所 鉄バクテリア・バイオフィルムの発生抑止方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000079516A1 (fr) * 1999-06-23 2000-12-28 Nec Corporation Dispositif et procede de determination de trames voisees/non voisees

Also Published As

Publication number Publication date
JPH02148099A (ja) 1990-06-06

Similar Documents

Publication Publication Date Title
JPH0226901B2 (ja)
JPH07113840B2 (ja) 音声検出器
JPH0243384B2 (ja)
EP0663741A3 (en) Adaptive digital audio encoding system
JP2656586B2 (ja) 音声検出方法及びその装置
US6865529B2 (en) Method of estimating the pitch of a speech signal using an average distance between peaks, use of the method, and a device adapted therefor
US5189669A (en) Cell transfer apparatus and method using a variable rate codec
JPH0236628A (ja) 音声信号の送信方式及び送受信方式
CN1322410A (zh) 一种修改tdma系统中信道脉冲响应的方法
JP2003218932A (ja) エラー隠蔽装置及び方法
JP3368443B2 (ja) 音声符号化伝送システム及び受信装置
JPH052159B2 (ja)
JPWO2003067792A1 (ja) ディジタル回線伝送装置
US3349180A (en) Extrapolation of vocoder control signals
JPS6315559A (ja) 電子会議システム
JPH10282994A (ja) 音声検出方法及びその装置
JP3036022B2 (ja) Adpcm符号化方式
JPH05136746A (ja) 音声信号伝送方式
JPH05323996A (ja) 有音無音判定法
JPH0637734A (ja) 音声伝送方式
JPH0697905A (ja) インチャネルシグナリング伝送装置
JP3231699B2 (ja) 音声検出器と音声検出方法および高能率端局装置
JPS6310621B2 (ja)
JPS628646A (ja) デイジタル電話機の無音区間圧縮通信方式
JPH07212320A (ja) 音声帯域信号パケット化装置