JPH0573085A - 無音検出装置および符号化装置 - Google Patents

無音検出装置および符号化装置

Info

Publication number
JPH0573085A
JPH0573085A JP3233137A JP23313791A JPH0573085A JP H0573085 A JPH0573085 A JP H0573085A JP 3233137 A JP3233137 A JP 3233137A JP 23313791 A JP23313791 A JP 23313791A JP H0573085 A JPH0573085 A JP H0573085A
Authority
JP
Japan
Prior art keywords
voice data
silence
input voice
pitch period
period
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP3233137A
Other languages
English (en)
Inventor
Naomi Nishiyama
直美 西山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP3233137A priority Critical patent/JPH0573085A/ja
Publication of JPH0573085A publication Critical patent/JPH0573085A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

(57)【要約】 【目的】 本発明は、音声データ圧縮伝送を行う伝送装
置において、音声データの無音区間を検出する無音検出
装置に関し、無音区間と有音区間との境界点のタイミン
グの如何にかかわらず所定の通話品質を確保できること
を目的とする。 【構成】 入力音声データで示される音声のレベルを所
定の周期毎に監視し、その監視結果に応じて入力音声デ
ータの無音区間を示す無音情報を出力する無音検出手段
11を備えた無音検出装置において、入力音声データの
最大ピッチ周期Pの2倍の周期毎にデータ長Pの連続入
力音声データについて自己相関関数値の最大点を求め、
その最大点の位置に応じて入力音声データのピッチ周期
を得るピッチ周期抽出手段13と、最大ピッチ周期Pの
2倍の周期における入力音声データに同期して、監視の
周期として入力音声データのピッチ周期を与えるタイミ
ング制御手段15とを備えて構成される。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声データを時間軸上
で圧縮して伝送する伝送装置において、音声データの無
音区間を検出する無音検出装置に関する。
【0002】
【従来の技術】複数の音声データを多重化して伝送する
伝送装置では、伝送路の伝送効率を高めるために、通話
中の音声データの大半を占める無音区間(休止区間)を
逐次検出して有音区間(会話区間)にある他の音声デー
タに伝送路を開放する音声データ圧縮伝送方式が採用さ
れる。
【0003】図5は、伝送装置の構成例を示す図であ
る。図において、音声データは無音検出装置61に与え
られ、その出力はピッチ周期抽出部62および符号器6
3を介して伝送路に接続される。
【0004】このような構成の伝送装置では、無音検出
装置61は入力された音声データで示される音声のレベ
ルが所定の閾値未満である状態が一定時間以上継続する
と無音区間であると判定し、かつその判定結果(以下、
「無音情報」という。)と上述した音声データとをピッ
チ周期抽出部62に与える。ピッチ周期抽出部62で
は、例えば、特願平2−153868号に示す方法により音声
データのピッチ周期を検出し、かつそのピッチ周期、上
述した無音情報および音声データを符号器63に与え
る。符号器63は、このようなピーチ周期に基づき音声
データをサンプリングし、かつ無音区間については無音
情報を符号化対象とし、有音区間については音声のピッ
チ周期毎の周期性に基づき、例えば、2〜3周期分の情
報を符号化対象としてこれらを1周期分の情報に圧縮す
る符号化処理を行う。
【0005】また、伝送路を介して対向する伝送装置で
は、上述した無音区間に相当する復号出力として所定の
雑音信号を挿入することにより再生された音声が全く無
音となることを防止する。
【0006】
【発明が解決しようとする課題】ところで、このような
無音検出装置61では、符号器63が音声データに非同
期に行う符号化処理の周期(以下、「単位時間」とい
う。)毎に無音区間であるか否かの判定を行うために、
単位時間の途中に無音区間と有音区間との境界点が発生
する場合があった。このような場合には、符号器63は
その境界点を含む音声データを必ずしも忠実に符号化で
きず、例えば、伝送路を介して対向する伝送装置側で
は、有音区間の先頭部分に含まれる子音が欠落して受信
されたり、送話者の音声を聴取する通話相手に通話音声
の切断感を与える場合があった。
【0007】本発明は、無音区間と有音区間との境界点
の発生タイミングの如何にかかわらず所定の通話品質を
確保することができる無音検出装置を提供することを目
的とする。
【0008】
【課題を解決するための手段】図1は、請求項1に記載
の発明の原理ブロック図である。本発明は、入力音声デ
ータで示される音声のレベルを所定の周期毎に監視し、
その監視結果に応じて入力音声データの無音区間を示す
無音情報を出力する無音検出手段11を備えた無音検出
装置において、入力音声データの最大ピッチ周期Pの2
倍の周期毎にデータ長Pの連続入力音声データについて
自己相関関数値の最大点を求め、その最大点の位置に応
じて入力音声データのピッチ周期を得るピッチ周期抽出
手段13と、最大ピッチ周期Pの2倍の周期における入
力音声データに同期して、監視の周期として入力音声デ
ータのピッチ周期を与えるタイミング制御手段15とを
備えたことを特徴とする。
【0009】図2は、請求項2に記載の発明の原理ブロ
ック図である。本発明は、入力音声データの無音区間を
時間軸上で圧縮する処理が施された音声データと、無音
区間を示す無音情報とを符号化する符号化手段21を備
えた符号化装置において、入力音声データに応じて無音
情報を与える請求項1に記載の無音検出装置23と、無
音検出装置23のピッチ周期抽出手段13によって得ら
れたピッチ周期毎に、無音情報に対応した無音区間につ
いて入力音声データに圧縮の処理を施して符号化手段2
1に与える時間軸圧縮手段25とを備えたことを特徴と
する。
【0010】
【作用】請求項1に記載の発明では、ピッチ周期抽出手
段13がピッチ周期を得る演算の対象とした最大ピッチ
周期Pの2倍の周期における音声データに同期して、タ
イミング制御手段15が、上述した演算により得られた
入力音声のピッチ周期を無音区間の監視周期として無音
検出手段11に与える。
【0011】すなわち、無音検出手段11は入力音声デ
ータのピッチ周期に同期してその音声データの無音区間
を判定できるので、従来例に比べて無音区間の検出周期
の途中に上述した有音区間と無音区間との境界点が生じ
る確率が低減される。
【0012】請求項2に記載の発明では、時間軸圧縮手
段25が、請求項1に記載の無音検出装置23のピッチ
周期抽出手段13によって得られたピッチ周期毎に、無
音検出装置23から出力される無音情報に対応した入力
音声データの無音区間を時間軸上で圧縮する処理を行
う。
【0013】すなわち、入力音声データの統計的性質が
短時間で変化し、かつ非定常的であっても、無音区間の
検出処理とその無音区間を時間軸上で圧縮する処理が上
述したピッチ周期毎に同期して行われるので、符号化手
段21はこれらの処理タイミングが非同期である場合に
比べて無音区間に隣接する有音区間を安定に符号化する
ことができる。
【0014】
【実施例】以下、図面に基づいて本発明の実施例を詳細
に説明する。図3は、請求項1に記載の発明に対応した
実施例を示す図である。
【0015】図において、音声データは、ピッチ周期抽
出部31、無音検出部32および符号器33の一方の入
力に与えられる。ピッチ周期抽出部31の出力はタイマ
34を介して無音検出部32に与えられ、その出力は符
号器33の他方の入力に与えられる。
【0016】ピッチ周期抽出部31では、音声データ
が、デュアルポートメモリ35のデータ入力とアドレス
カウンタ36の一方の入力とに与えられる。アドレスカ
ウンタ36の出力は、デュアルポートメモリ35の書き
込みアドレス入力とP検出回路37の一方の入力とに接
続される。P検出回路37の出力は、デュアルポートメ
モリ35の読み出しアドレス入力に接続される。デュア
ルポートメモリ35のデータ出力は相関関数計算回路3
8に接続され、その第一の出力はアドレスカウンタ36
の他方の入力に接続される。相関関数計算回路38の第
二の出力はデュアルポートメモリ35の読み出しアドレ
ス入力に接続され、相関関数計算回路38の第三の出力
はP検出回路37の他方の入力に接続される。相関関数
計算回路38の双方向端子は、相関最大値検出回路39
を介してタイマ34に接続される。
【0017】無音検出部32では、音声データがデュア
ルポートメモリ40のデータ入力およびアドレスカウン
タ41に与えられ、アドレスカウンタ41の出力はデュ
アルポートメモリ40の書き込みアドレス入力に接続さ
れる。デュアルポートメモリ40のデータ出力は無音検
出回路42を介して符号器33の他方の入力に接続さ
れ、デュアルポートメモリ40の読み出しアドレス入力
および無音検出回路42の制御端子にはタイマ34の出
力が接続される。
【0018】なお、本実施例と図1に示すブロック図と
の対応関係については、無音検出部32は無音検出手段
11に対応し、ピッチ周期抽出部31はピッチ周期抽出
手段13に対応し、タイマ34はタイミング制御手段1
5に対応する。
【0019】以下、図3を参照して本実施例の動作を説
明する。音声データは、一定周期でサンプリングされて
ピッチ周期抽出部31、無音検出部32および符号器3
3に与えられる。アドレスカウンタ36は、音声データ
のピッチ周期の算出開始時に相関関数計算回路38によ
って初期設定され、かつ音声データが与えられる度にカ
ウントアップしてデュアルポートメモリ35に書き込み
アドレスを与える。デュアルポートメモリ35は、この
ような書き込みアドレスで示される領域に音声データを
保持する。
【0020】P検出回路37は、上述した書き込みアド
レスのカウント値が音声データの最大ピッチ周期Pに等
しくなったことを検出すると、デュアルポートメモリ3
5に相関関数計算回路38が相関値を算出する起点とす
べき音声データの格納領域(以下、このような格納領域
に保持された連続するP個の音声データ値を「基準値」
という。)のアドレスを与える。相関関数計算回路38
は、デュアルポートメモリ35に演算の対象となる音声
データの格納領域を示す読み出しアドレスを適宜与えて
その音声データを読み出し、アドレスカウンタ36が初
期設定された後に最初に取り込まれた音声データから順
次1個ずつずれた連続するP個の音声データ(以下、
「比較値」という。)と基準値との相関値を算出する。
【0021】相関最大値検出回路39は、このようにし
て算出された相関値を相関関数計算回路38と確認をと
りながら順次取り込んでその最大値を求める。相関関数
計算回路38は、このような一連の相関関数値の算出を
完了すると、デュアルポートメモリ35に相関関数の次
の算出起点となる音声データの格納領域を示すアドレス
をP検出回路37を介して与え、かつ再び相関関数の算
出処理を開始する。
【0022】相関最大値検出回路39は、このようにし
て算出された相関(音声データに対応する音声信号の波
形相関)の値が最大となる比較値の波形位置を共分散法
による評価関数を用いて検出し、その検出位置と基準値
との間の時間差から音声ピッチ周期Dを求める。ピッチ
周期抽出部31は、このような処理を所定の周期(=2
P)毎に反復する。
【0023】無音検出部32では、アドレスカウンタ4
1は上述した音声データが与えられる度にカウントアッ
プしてデュアルポートメモリ40に書き込みアドレスを
与え、デュアルポートメモリ40はその書き込みアドレ
スで示される領域に音声データを保持する。一方、タイ
マ34は、ピッチ周期抽出部31から音声ピッチ周期D
が与えられるタイミングに同期して一定周期の連続した
D個の読み出しアドレスをデュアルポートメモリ40に
与え、デュアルポートメモリ40はその読み出しアドレ
スに応じて連続するD個の音声データを出力する。
【0024】無音検出回路42は、このようにして与え
られるD個の音声データに基づきピッチ周期幅Dの期間
における音声データについて無音区間であるか否かの判
定を行い、かつその判定結果を符号器33に与える。
【0025】このように本実施例によれば、音声データ
で示される音声が無音区間か否かの判定が音声ピッチ周
期に同期して行われるので、無音検出の単位時間の途中
で無音区間と有音区間との境界点が発生する確率が低減
して通話相手に与える通話音声の切断感が軽減される。
【0026】なお、本実施例では、音声ピッチ周期を求
める方法として音声の波形相関を逐次求める方法を用い
たが、本発明は、このような方法に限定されず、例え
ば、所定の周期で実時間に音声ピッチ周期を算出できる
ならば、どのような方法を用いてもよい。
【0027】また、本実施例では、符号器33に採用さ
れる符号化方式については、特に限定せず、伝送すべき
音声データと伝送路との整合をとることができるなら
ば、どのような方式を採用してもよい。
【0028】図4は、請求項2に記載の発明に対応した
実施例を示す図である。図において、図3に示すものと
機能および構成が同じものについては、同じ参照番号を
付与して示し、ここではその説明を省略する。
【0029】本実施例と図3に示す実施例との相違点
は、音声データの無音区間を時間軸上で圧縮する時間軸
圧縮部51と、これに直列に接続されて時間軸圧伸符号
化法による符号化処理を行う符号器52とが符号器33
に代わって配置され、かつ時間軸圧縮部51にピッチ周
期抽出部31によって求められたピッチ周期が与えられ
た点にある。
【0030】なお、本実施例と図2に示すブロック図と
の対応関係については、符号器52は符号化手段21に
対応し、ピッチ周期抽出部31、タイマ34および無音
抽出部32は無音検出装置23に対応し、時間軸圧縮部
51は時間軸圧縮手段25に対応する。
【0031】このような符号化装置では、時間軸圧縮部
51は、ピッチ周期抽出部31によって求められたピッ
チ周期毎に、無音検出部32から与えられる無音情報に
対応した音声データの無音区間を時間軸上で圧縮する。
符号器52は、このようにして時間軸上で圧縮された有
音区間の音声データと、無音検出部32から与えられる
無音情報とを時間軸圧伸符号化法により符号化して伝送
路に送出する。
【0032】このように本実施例によれば、音声データ
に対して無音区間の検出処理とその無音区間を時間軸上
で圧縮する処理とが音声データのピッチ周期毎に同期し
て行われるので、これらの処理が非同期に行われる場合
に比べて無音区間に隣接する有音区間の音声データの符
号化が安定に行われ、かつ通話相手に与える通話音声の
切断感が軽減される。
【0033】
【発明の効果】以上説明したように請求項1に記載の発
明では、入力音声データのピッチ周期に同期してその音
声データの無音区間と有音区間との判別が行われるの
で、従来例のように無音区間の検出を行う周期内に上述
した有音区間と無音区間との境界点が発生する確率が低
減される。また、請求項2に記載の発明では、無音区間
を時間軸上で圧縮する処理とその無音区間を検出する処
理とが入力音声データのピッチ周期毎に同期して行われ
るので、無音区間に隣接する有音区間の音声データが安
定に符号化される。
【0034】すなわち、無音区間の検出や上述した圧縮
の処理過程において生じる音声データの欠落が軽減され
るので、音声データ圧縮伝送の伝送品質が高められる。
【図面の簡単な説明】
【図1】請求項1に記載の発明の原理ブロック図であ
る。
【図2】請求項2に記載の発明の原理ブロック図であ
る。
【図3】請求項1に記載の発明に対応した実施例を示す
図である。
【図4】請求項2に記載の発明に対応した実施例を示す
図である。
【図5】伝送装置の構成例を示すである。
【符号の説明】
11 無音検出手段 13 ピッチ周期抽出手段 15 タイミング制御手段 21 符号化手段 23 無音検出装置 25 時間軸圧縮手段 31,62 ピッチ周期抽出部 32,61 無音検出部 33,52,63 符号器 34 タイマ 35,40 デュアルポートメモリ 36,41 アドレスカウンタ 37 P検出回路 38 相関関数計算回路 39 相関最大値検出回路 42 無音検出回路 51 時間軸圧縮部

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 入力音声データで示される音声のレベル
    を所定の周期毎に監視し、その監視結果に応じて前記入
    力音声データの無音区間を示す無音情報を出力する無音
    検出手段(11)を備えた無音検出装置において、 前記入力音声データの最大ピッチ周期Pの2倍の周期毎
    にデータ長Pの連続入力音声データについて自己相関関
    数値の最大点を求め、その最大点の位置に応じて前記入
    力音声データのピッチ周期を得るピッチ周期抽出手段
    (13)と、 前記最大ピッチ周期Pの2倍の周期における入力音声デ
    ータに同期して、前記監視の周期として前記入力音声デ
    ータのピッチ周期を与えるタイミング制御手段(15)
    とを備えたことを特徴とする無音検出装置。
  2. 【請求項2】 入力音声データの無音区間を時間軸上で
    圧縮する処理が施された音声データと、前記無音区間を
    示す無音情報とを符号化する符号化手段(21)を備え
    た符号化装置において、 前記入力音声データに応じて前記無音情報を与える請求
    項1に記載の無音検出装置(23)と、 前記無音検出装置(23)のピッチ周期抽出手段(1
    3)によって得られたピッチ周期毎に、前記無音情報に
    対応した無音区間について前記入力音声データに前記圧
    縮の処理を施して前記符号化手段(21)に与える時間
    軸圧縮手段(25)とを備えたことを特徴とする符号化
    装置。
JP3233137A 1991-09-12 1991-09-12 無音検出装置および符号化装置 Withdrawn JPH0573085A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3233137A JPH0573085A (ja) 1991-09-12 1991-09-12 無音検出装置および符号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3233137A JPH0573085A (ja) 1991-09-12 1991-09-12 無音検出装置および符号化装置

Publications (1)

Publication Number Publication Date
JPH0573085A true JPH0573085A (ja) 1993-03-26

Family

ID=16950313

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3233137A Withdrawn JPH0573085A (ja) 1991-09-12 1991-09-12 無音検出装置および符号化装置

Country Status (1)

Country Link
JP (1) JPH0573085A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5873058A (en) * 1996-03-29 1999-02-16 Mitsubishi Denki Kabushiki Kaisha Voice coding-and-transmission system with silent period elimination
US8634547B2 (en) 2009-05-13 2014-01-21 Oki Electric Industry Co., Ltd. Echo canceller operative in response to fluctuation on echo path

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5873058A (en) * 1996-03-29 1999-02-16 Mitsubishi Denki Kabushiki Kaisha Voice coding-and-transmission system with silent period elimination
US8634547B2 (en) 2009-05-13 2014-01-21 Oki Electric Industry Co., Ltd. Echo canceller operative in response to fluctuation on echo path

Similar Documents

Publication Publication Date Title
US5809472A (en) Digital audio data transmission system based on the information content of an audio signal
JPS63204300A (ja) 符号化伝送装置
JPH0573085A (ja) 無音検出装置および符号化装置
JP2861889B2 (ja) 音声パケット伝送システム
JPH0728486A (ja) 音声圧縮装置
JP3227929B2 (ja) 音声符号化装置およびその符号化信号の復号化装置
JP3343002B2 (ja) 音声帯域情報伝送装置
JP2002252644A (ja) 音声パケット通信装置及び音声パケット通信方法
JP3226068B2 (ja) データ伝送装置
US6134519A (en) Voice encoder for generating natural background noise
JPH03133233A (ja) 音声パケット化装置
KR20050066477A (ko) VoIP 시스템을 위한 프레임 손실 은닉 방법 및 장치
Rheem et al. A nonuniform sampling method of speech signal and its application to speech coding
JP2555443B2 (ja) 音声パケット通信装置
JPH02181552A (ja) 高能率符号パケット伝送方式
JPH0530137A (ja) 音声パケツト伝送装置
KR20000056529A (ko) 전송율을 이용한 음성 구간 검출 방법
JPH0697905A (ja) インチャネルシグナリング伝送装置
JPS62285538A (ja) ボコーダ方式の音声符号化回路及び復号回路
JPH02120900A (ja) 音声符号化装置
JP3134509B2 (ja) 音声符号化・復号化装置
JPH05316055A (ja) 音声圧縮復号化装置
JPH01248200A (ja) 音声復号化装置
JP2000244949A (ja) Dtmf信号伝送装置
JPS58113992A (ja) 音声信号圧縮方式

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 19981203