JPS6127598A - 音声信号の有音・無音判定方法 - Google Patents
音声信号の有音・無音判定方法Info
- Publication number
- JPS6127598A JPS6127598A JP14987184A JP14987184A JPS6127598A JP S6127598 A JPS6127598 A JP S6127598A JP 14987184 A JP14987184 A JP 14987184A JP 14987184 A JP14987184 A JP 14987184A JP S6127598 A JPS6127598 A JP S6127598A
- Authority
- JP
- Japan
- Prior art keywords
- silent
- sound
- voice
- interval
- audio signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Input Circuits Of Receivers And Coupling Of Receivers And Audio Equipment (AREA)
- Interconnected Communication Systems, Intercoms, And Interphones (AREA)
- Electrophonic Musical Instruments (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
(産業上の利用分野)
本発明は効率的に音声信号を圧縮するための音声信号有
音・無音判定方法に関するものである。
音・無音判定方法に関するものである。
(従来の技術)
一般の音声信号には句読点や間をとることによる無音や
、促音(「っ」のようにつまる音)発生による無音など
があるために、約10〜20%の無音区間が存在してい
る。音声信号の情報圧縮の手法の一つにこの無音区間を
あるコードで代表し圧縮する方法がある。
、促音(「っ」のようにつまる音)発生による無音など
があるために、約10〜20%の無音区間が存在してい
る。音声信号の情報圧縮の手法の一つにこの無音区間を
あるコードで代表し圧縮する方法がある。
従来、この無音区間の検出は、音声信号を短い区間(通
常数〜数10m5ec)にくぎってこの区間でのPCM
データの平均振幅とスレッシェホールドレベルの比較と
いう方法で行なわれていたう式(1)はこのような無音
区間の検出に用いる有音・無音の判定式で、式(2)は
平均振幅計算式である。
常数〜数10m5ec)にくぎってこの区間でのPCM
データの平均振幅とスレッシェホールドレベルの比較と
いう方法で行なわれていたう式(1)はこのような無音
区間の検出に用いる有音・無音の判定式で、式(2)は
平均振幅計算式である。
有音・無音の判定式
%式%
ここで平均振幅は次の式で示される。
DN:ある時刻NでのPCMデータ
F:フレーム長(1フレームのサンプリングポイント数
) (発明が解決しようとする問題点) しかし、このような無音区間の判定方法では振幅が平均
的に小さい子音部は無音と判定され易く、子音の欠落が
たびたび発生する。このような子音部の欠落を防止する
ために、スレッシ瓢ホールドレベルを下げると、子音部
は有音と判定される。
) (発明が解決しようとする問題点) しかし、このような無音区間の判定方法では振幅が平均
的に小さい子音部は無音と判定され易く、子音の欠落が
たびたび発生する。このような子音部の欠落を防止する
ために、スレッシ瓢ホールドレベルを下げると、子音部
は有音と判定される。
一方、微小振幅の低域部分で、ビット量低域のため子音
を無音と判定されても聴覚上問題のない部分も多く存在
するが、このような部分でも有音と判定されてしまい、
ビット量が増大するという欠点があった。
を無音と判定されても聴覚上問題のない部分も多く存在
するが、このような部分でも有音と判定されてしまい、
ビット量が増大するという欠点があった。
本発明の目的は、無音区間を正確に判定できる音声信号
の有音・無音判定方法を提供することにある。
の有音・無音判定方法を提供することにある。
(問題点を解決するための手段)
本発明によれば、隣シ合ったサンプリング間のデータの
差分値(DPCMPCMデータ均振幅で有音・無音の判
定をある区間毎に行うことによシ、効率的な音声楡号の
無音区間圧縮を可能にする音声信号の有音・無音判定方
法を得る。
差分値(DPCMPCMデータ均振幅で有音・無音の判
定をある区間毎に行うことによシ、効率的な音声楡号の
無音区間圧縮を可能にする音声信号の有音・無音判定方
法を得る。
(実施例)
音声の周波数スペクトルを求めると、周波数スペクトル
は一定でなく、第1図に示すように300〜500Hz
をピークとしであるカーブを描いて減衰している。
は一定でなく、第1図に示すように300〜500Hz
をピークとしであるカーブを描いて減衰している。
特に、800Hz以上は高い周波数はどその成分は小さ
くなり、周波数が2倍になると約6dBの傾き(6dB
/ oct)でその音圧の振幅特性が小さくなる傾向に
ある。
くなり、周波数が2倍になると約6dBの傾き(6dB
/ oct)でその音圧の振幅特性が小さくなる傾向に
ある。
このため、PCMの平均振幅で有音・無音を判定する従
来の方法では、子音のスペクトル成分が高域に集中して
いるため、平均振幅が小さく無音と判定され易いという
欠点があった。
来の方法では、子音のスペクトル成分が高域に集中して
いるため、平均振幅が小さく無音と判定され易いという
欠点があった。
したがって子音欠落を防ぐために、高域を強調(プリエ
ンファシス)する平均1次逆フィルターを用いる。
ンファシス)する平均1次逆フィルターを用いる。
この逆フィルターは次式で表わされる。
DN’=DN−μDN−s ・・・
・・・(3)DN = ある時刻NでのPCM値 IM−1: DNよシ1つ前のPCM値D’り :
プリエンファシスされたDPCM値μ :係数 またこのフィルター構成は第2図のように信号を遅延回
路2で遅延し乗算器3で所定定数μを乗じた後遅延しな
い信号と加算器1で加算するものとなり、μ=1とした
時のプリエンファシスの周波数特性を第3図に示す。
・・・(3)DN = ある時刻NでのPCM値 IM−1: DNよシ1つ前のPCM値D’り :
プリエンファシスされたDPCM値μ :係数 またこのフィルター構成は第2図のように信号を遅延回
路2で遅延し乗算器3で所定定数μを乗じた後遅延しな
い信号と加算器1で加算するものとなり、μ=1とした
時のプリエンファシスの周波数特性を第3図に示す。
PCMデータに対し、第3図の6dB10ctの傾きを
もつプリエンファシスをかけると、高域が強調されるこ
とにより、子音部分の平均振幅が増大し無音と判定され
るのを防ぐことができる。
もつプリエンファシスをかけると、高域が強調されるこ
とにより、子音部分の平均振幅が増大し無音と判定され
るのを防ぐことができる。
また、振幅が小さく高域部分の少ない有声部分は、逆に
減衰するため、平均振幅が小さくなシ無音と判定され、
一種のバイパスフィルターを通した事と同様の効果があ
シ、情報圧縮を高める方向に作用する。
減衰するため、平均振幅が小さくなシ無音と判定され、
一種のバイパスフィルターを通した事と同様の効果があ
シ、情報圧縮を高める方向に作用する。
本発明では、有音・無音の判定に用いる平均振幅の計算
を次の(4)式で行う。
を次の(4)式で行う。
DN :PCMデータ
DN−DN−1: DPCMPCM
データF :フレーム長
□ (1フレームのサンプリング
ポイント数)
有音・無音の判定は従来通りフレーム毎に、平均振幅と
スレッシュホールドレベルの比較により行なう。式(4
)を用いて有音拳無音の判定を行なう効果としては、隣
り合ったサンプリング間のデータの差分値をとることに
より、低域を減衰高域を強調することになり、子音部の
平均振幅が増大し、子音の欠落を防ぐことができる、比
較的振幅が小さく高域成分の少ない有声部を無音区間と
するため、無音区間圧縮率の改善をはかることができる
などがあげられる。
スレッシュホールドレベルの比較により行なう。式(4
)を用いて有音拳無音の判定を行なう効果としては、隣
り合ったサンプリング間のデータの差分値をとることに
より、低域を減衰高域を強調することになり、子音部の
平均振幅が増大し、子音の欠落を防ぐことができる、比
較的振幅が小さく高域成分の少ない有声部を無音区間と
するため、無音区間圧縮率の改善をはかることができる
などがあげられる。
尚、振幅の小さい低域部分を無音と判定させる処理は人
間の音声においては、自然性・明瞭性の点とも問題がな
い。
間の音声においては、自然性・明瞭性の点とも問題がな
い。
(発明の効果)
以上、説明したように、本発明の音声信号有音・無音判
定方法を用いることによシ、子音部が強調され、振幅の
小さい低域部分を無音区間として処理するため、子音の
欠落を防ぐことができ、無音区間圧縮率の改善をはかる
ことができるなど、効率的な無音区間圧縮が可能になる
。
定方法を用いることによシ、子音部が強調され、振幅の
小さい低域部分を無音区間として処理するため、子音の
欠落を防ぐことができ、無音区間圧縮率の改善をはかる
ことができるなど、効率的な無音区間圧縮が可能になる
。
第1図は音声の周波数スペクトルのグラフである。
区
第2図はソフトウェアによるプリエンファシス 、7で
ある。 1・・・・・・加算器、2・・・・・・遅延回路、3・
・・・・・乗算器。 隼灼炙妨音圧しヤノし レベ゛ル
区
第2図はソフトウェアによるプリエンファシス 、7で
ある。 1・・・・・・加算器、2・・・・・・遅延回路、3・
・・・・・乗算器。 隼灼炙妨音圧しヤノし レベ゛ル
Claims (1)
- デジィタル化された音声信号処理の無音区間圧縮におい
て、ある区間の有音・無音を判定する際に、その区間に
おける隣り合ったサンプリングデータ(以下PCMデー
タという)の差分値の平均振幅があるしきい値より大き
い場合はその区間を有音、小さい場合は無音と判定する
ことを特徴とする音声信号有音・無音判定方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP14987184A JPS6127598A (ja) | 1984-07-19 | 1984-07-19 | 音声信号の有音・無音判定方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP14987184A JPS6127598A (ja) | 1984-07-19 | 1984-07-19 | 音声信号の有音・無音判定方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS6127598A true JPS6127598A (ja) | 1986-02-07 |
Family
ID=15484471
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP14987184A Pending JPS6127598A (ja) | 1984-07-19 | 1984-07-19 | 音声信号の有音・無音判定方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS6127598A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5954800A (ja) * | 1982-09-22 | 1984-03-29 | Hitachi Ltd | 水平分割形ケ−シング |
JPS6459394A (en) * | 1987-08-31 | 1989-03-07 | Ricoh Kk | Digital voice extractor |
US7698135B2 (en) | 2000-06-02 | 2010-04-13 | Nec Corporation | Voice detecting method and apparatus using a long-time average of the time variation of speech features, and medium thereof |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS50114904A (ja) * | 1974-02-16 | 1975-09-09 | ||
JPS5831396A (ja) * | 1981-08-19 | 1983-02-24 | 株式会社東芝 | 音声ピツチ検出装置 |
JPS58132799A (ja) * | 1982-02-03 | 1983-08-08 | 富士通株式会社 | 音声検出回路 |
-
1984
- 1984-07-19 JP JP14987184A patent/JPS6127598A/ja active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS50114904A (ja) * | 1974-02-16 | 1975-09-09 | ||
JPS5831396A (ja) * | 1981-08-19 | 1983-02-24 | 株式会社東芝 | 音声ピツチ検出装置 |
JPS58132799A (ja) * | 1982-02-03 | 1983-08-08 | 富士通株式会社 | 音声検出回路 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5954800A (ja) * | 1982-09-22 | 1984-03-29 | Hitachi Ltd | 水平分割形ケ−シング |
JPH0133678B2 (ja) * | 1982-09-22 | 1989-07-14 | Hitachi Ltd | |
JPS6459394A (en) * | 1987-08-31 | 1989-03-07 | Ricoh Kk | Digital voice extractor |
US7698135B2 (en) | 2000-06-02 | 2010-04-13 | Nec Corporation | Voice detecting method and apparatus using a long-time average of the time variation of speech features, and medium thereof |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI505263B (zh) | 錄音資料之適應性動態範圍增加技術 | |
US7848531B1 (en) | Method and apparatus for audio loudness and dynamics matching | |
US6826525B2 (en) | Method and device for detecting a transient in a discrete-time audio signal | |
TWI489774B (zh) | 緩級與速級音訊峰值限制技術 | |
KR100717058B1 (ko) | 고주파 성분 복원 방법 및 그 장치 | |
JP4740609B2 (ja) | 有声音および無声音の検出装置、並びにその方法 | |
US4935963A (en) | Method and apparatus for processing speech signals | |
JP2792853B2 (ja) | オーディオ信号の伝送方法及び装置 | |
US20050147262A1 (en) | Method for decreasing the dynamic range of a signal and electronic circuit | |
EP2828853B1 (en) | Method and system for bias corrected speech level determination | |
US10083705B2 (en) | Discrimination and attenuation of pre echoes in a digital audio signal | |
JPS6127598A (ja) | 音声信号の有音・無音判定方法 | |
US5870704A (en) | Frequency-domain spectral envelope estimation for monophonic and polyphonic signals | |
JP2992324B2 (ja) | 音声区間検出方法 | |
CN113192524B (zh) | 音频信号处理方法及装置 | |
US20230269546A1 (en) | Method for eliminating acoustic reverberation in an audio signal, and hearing instrument | |
JPH0318720B2 (ja) | ||
KR102721794B1 (ko) | 신호 처리 프로세서 및 신호 처리 프로세서의 제어 방법 | |
JPH0114599B2 (ja) | ||
JP3089690B2 (ja) | ディジタルデータの高能率符号化方法 | |
JPH0198000A (ja) | 音声信号を処理するための方法と装置 | |
WO2021091504A1 (en) | Signal energy calculation with a new method and a speech signal encoder obtained by means of this method | |
Mu et al. | A virtual bass system with improved overflow control | |
JPS5925238B2 (ja) | 音声分析合成方式の音声区間判定方法 | |
TW202226225A (zh) | 以零點交越檢測改進語音活動檢測之設備及方法 |