JPS6127598A - 音声信号の有音・無音判定方法 - Google Patents

音声信号の有音・無音判定方法

Info

Publication number
JPS6127598A
JPS6127598A JP14987184A JP14987184A JPS6127598A JP S6127598 A JPS6127598 A JP S6127598A JP 14987184 A JP14987184 A JP 14987184A JP 14987184 A JP14987184 A JP 14987184A JP S6127598 A JPS6127598 A JP S6127598A
Authority
JP
Japan
Prior art keywords
silent
sound
voice
interval
audio signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP14987184A
Other languages
English (en)
Inventor
栗林 順子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP14987184A priority Critical patent/JPS6127598A/ja
Publication of JPS6127598A publication Critical patent/JPS6127598A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Input Circuits Of Receivers And Coupling Of Receivers And Audio Equipment (AREA)
  • Interconnected Communication Systems, Intercoms, And Interphones (AREA)
  • Electrophonic Musical Instruments (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は効率的に音声信号を圧縮するための音声信号有
音・無音判定方法に関するものである。
(従来の技術) 一般の音声信号には句読点や間をとることによる無音や
、促音(「っ」のようにつまる音)発生による無音など
があるために、約10〜20%の無音区間が存在してい
る。音声信号の情報圧縮の手法の一つにこの無音区間を
あるコードで代表し圧縮する方法がある。
従来、この無音区間の検出は、音声信号を短い区間(通
常数〜数10m5ec)にくぎってこの区間でのPCM
データの平均振幅とスレッシェホールドレベルの比較と
いう方法で行なわれていたう式(1)はこのような無音
区間の検出に用いる有音・無音の判定式で、式(2)は
平均振幅計算式である。
有音・無音の判定式 %式% ここで平均振幅は次の式で示される。
DN:ある時刻NでのPCMデータ F:フレーム長(1フレームのサンプリングポイント数
) (発明が解決しようとする問題点) しかし、このような無音区間の判定方法では振幅が平均
的に小さい子音部は無音と判定され易く、子音の欠落が
たびたび発生する。このような子音部の欠落を防止する
ために、スレッシ瓢ホールドレベルを下げると、子音部
は有音と判定される。
一方、微小振幅の低域部分で、ビット量低域のため子音
を無音と判定されても聴覚上問題のない部分も多く存在
するが、このような部分でも有音と判定されてしまい、
ビット量が増大するという欠点があった。
本発明の目的は、無音区間を正確に判定できる音声信号
の有音・無音判定方法を提供することにある。
(問題点を解決するための手段) 本発明によれば、隣シ合ったサンプリング間のデータの
差分値(DPCMPCMデータ均振幅で有音・無音の判
定をある区間毎に行うことによシ、効率的な音声楡号の
無音区間圧縮を可能にする音声信号の有音・無音判定方
法を得る。
(実施例) 音声の周波数スペクトルを求めると、周波数スペクトル
は一定でなく、第1図に示すように300〜500Hz
  をピークとしであるカーブを描いて減衰している。
特に、800Hz以上は高い周波数はどその成分は小さ
くなり、周波数が2倍になると約6dBの傾き(6dB
/ oct)でその音圧の振幅特性が小さくなる傾向に
ある。
このため、PCMの平均振幅で有音・無音を判定する従
来の方法では、子音のスペクトル成分が高域に集中して
いるため、平均振幅が小さく無音と判定され易いという
欠点があった。
したがって子音欠落を防ぐために、高域を強調(プリエ
ンファシス)する平均1次逆フィルターを用いる。
この逆フィルターは次式で表わされる。
DN’=DN−μDN−s          ・・・
・・・(3)DN = ある時刻NでのPCM値 IM−1: DNよシ1つ前のPCM値D’り   :
  プリエンファシスされたDPCM値μ  :係数 またこのフィルター構成は第2図のように信号を遅延回
路2で遅延し乗算器3で所定定数μを乗じた後遅延しな
い信号と加算器1で加算するものとなり、μ=1とした
時のプリエンファシスの周波数特性を第3図に示す。
PCMデータに対し、第3図の6dB10ctの傾きを
もつプリエンファシスをかけると、高域が強調されるこ
とにより、子音部分の平均振幅が増大し無音と判定され
るのを防ぐことができる。
また、振幅が小さく高域部分の少ない有声部分は、逆に
減衰するため、平均振幅が小さくなシ無音と判定され、
一種のバイパスフィルターを通した事と同様の効果があ
シ、情報圧縮を高める方向に作用する。
本発明では、有音・無音の判定に用いる平均振幅の計算
を次の(4)式で行う。
DN     :PCMデータ DN−DN−1: DPCMPCM データF :フレーム長 □ (1フレームのサンプリング ポイント数) 有音・無音の判定は従来通りフレーム毎に、平均振幅と
スレッシュホールドレベルの比較により行なう。式(4
)を用いて有音拳無音の判定を行なう効果としては、隣
り合ったサンプリング間のデータの差分値をとることに
より、低域を減衰高域を強調することになり、子音部の
平均振幅が増大し、子音の欠落を防ぐことができる、比
較的振幅が小さく高域成分の少ない有声部を無音区間と
するため、無音区間圧縮率の改善をはかることができる
などがあげられる。
尚、振幅の小さい低域部分を無音と判定させる処理は人
間の音声においては、自然性・明瞭性の点とも問題がな
い。
(発明の効果) 以上、説明したように、本発明の音声信号有音・無音判
定方法を用いることによシ、子音部が強調され、振幅の
小さい低域部分を無音区間として処理するため、子音の
欠落を防ぐことができ、無音区間圧縮率の改善をはかる
ことができるなど、効率的な無音区間圧縮が可能になる
【図面の簡単な説明】
第1図は音声の周波数スペクトルのグラフである。  
                        区
第2図はソフトウェアによるプリエンファシス 、7で
ある。 1・・・・・・加算器、2・・・・・・遅延回路、3・
・・・・・乗算器。 隼灼炙妨音圧しヤノし レベ゛ル

Claims (1)

    【特許請求の範囲】
  1. デジィタル化された音声信号処理の無音区間圧縮におい
    て、ある区間の有音・無音を判定する際に、その区間に
    おける隣り合ったサンプリングデータ(以下PCMデー
    タという)の差分値の平均振幅があるしきい値より大き
    い場合はその区間を有音、小さい場合は無音と判定する
    ことを特徴とする音声信号有音・無音判定方法。
JP14987184A 1984-07-19 1984-07-19 音声信号の有音・無音判定方法 Pending JPS6127598A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP14987184A JPS6127598A (ja) 1984-07-19 1984-07-19 音声信号の有音・無音判定方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP14987184A JPS6127598A (ja) 1984-07-19 1984-07-19 音声信号の有音・無音判定方法

Publications (1)

Publication Number Publication Date
JPS6127598A true JPS6127598A (ja) 1986-02-07

Family

ID=15484471

Family Applications (1)

Application Number Title Priority Date Filing Date
JP14987184A Pending JPS6127598A (ja) 1984-07-19 1984-07-19 音声信号の有音・無音判定方法

Country Status (1)

Country Link
JP (1) JPS6127598A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5954800A (ja) * 1982-09-22 1984-03-29 Hitachi Ltd 水平分割形ケ−シング
JPS6459394A (en) * 1987-08-31 1989-03-07 Ricoh Kk Digital voice extractor
US7698135B2 (en) 2000-06-02 2010-04-13 Nec Corporation Voice detecting method and apparatus using a long-time average of the time variation of speech features, and medium thereof

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS50114904A (ja) * 1974-02-16 1975-09-09
JPS5831396A (ja) * 1981-08-19 1983-02-24 株式会社東芝 音声ピツチ検出装置
JPS58132799A (ja) * 1982-02-03 1983-08-08 富士通株式会社 音声検出回路

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS50114904A (ja) * 1974-02-16 1975-09-09
JPS5831396A (ja) * 1981-08-19 1983-02-24 株式会社東芝 音声ピツチ検出装置
JPS58132799A (ja) * 1982-02-03 1983-08-08 富士通株式会社 音声検出回路

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5954800A (ja) * 1982-09-22 1984-03-29 Hitachi Ltd 水平分割形ケ−シング
JPH0133678B2 (ja) * 1982-09-22 1989-07-14 Hitachi Ltd
JPS6459394A (en) * 1987-08-31 1989-03-07 Ricoh Kk Digital voice extractor
US7698135B2 (en) 2000-06-02 2010-04-13 Nec Corporation Voice detecting method and apparatus using a long-time average of the time variation of speech features, and medium thereof

Similar Documents

Publication Publication Date Title
TWI505263B (zh) 錄音資料之適應性動態範圍增加技術
US7848531B1 (en) Method and apparatus for audio loudness and dynamics matching
US6826525B2 (en) Method and device for detecting a transient in a discrete-time audio signal
TWI489774B (zh) 緩級與速級音訊峰值限制技術
KR100717058B1 (ko) 고주파 성분 복원 방법 및 그 장치
JP4740609B2 (ja) 有声音および無声音の検出装置、並びにその方法
US4935963A (en) Method and apparatus for processing speech signals
JP2792853B2 (ja) オーディオ信号の伝送方法及び装置
US20050147262A1 (en) Method for decreasing the dynamic range of a signal and electronic circuit
EP2828853B1 (en) Method and system for bias corrected speech level determination
US10083705B2 (en) Discrimination and attenuation of pre echoes in a digital audio signal
JPS6127598A (ja) 音声信号の有音・無音判定方法
US5870704A (en) Frequency-domain spectral envelope estimation for monophonic and polyphonic signals
JP2992324B2 (ja) 音声区間検出方法
CN113192524B (zh) 音频信号处理方法及装置
US20230269546A1 (en) Method for eliminating acoustic reverberation in an audio signal, and hearing instrument
JPH0318720B2 (ja)
KR102721794B1 (ko) 신호 처리 프로세서 및 신호 처리 프로세서의 제어 방법
JPH0114599B2 (ja)
JP3089690B2 (ja) ディジタルデータの高能率符号化方法
JPH0198000A (ja) 音声信号を処理するための方法と装置
WO2021091504A1 (en) Signal energy calculation with a new method and a speech signal encoder obtained by means of this method
Mu et al. A virtual bass system with improved overflow control
JPS5925238B2 (ja) 音声分析合成方式の音声区間判定方法
TW202226225A (zh) 以零點交越檢測改進語音活動檢測之設備及方法