JPH0774709A - 音声信号送受信装置 - Google Patents

音声信号送受信装置

Info

Publication number
JPH0774709A
JPH0774709A JP4072994A JP4072994A JPH0774709A JP H0774709 A JPH0774709 A JP H0774709A JP 4072994 A JP4072994 A JP 4072994A JP 4072994 A JP4072994 A JP 4072994A JP H0774709 A JPH0774709 A JP H0774709A
Authority
JP
Japan
Prior art keywords
noise
voice
noise level
frame
level
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP4072994A
Other languages
English (en)
Other versions
JP3685812B2 (ja
Inventor
Keiichi Katayanagi
恵一 片柳
Kentaro Odaka
健太郎 小高
Masayuki Nishiguchi
正之 西口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=26380249&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=JPH0774709(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP04072994A priority Critical patent/JP3685812B2/ja
Publication of JPH0774709A publication Critical patent/JPH0774709A/ja
Priority to US08/695,522 priority patent/US5732390A/en
Application granted granted Critical
Publication of JP3685812B2 publication Critical patent/JP3685812B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L25/84Detection of presence or absence of voice signals for discriminating voice from noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Noise Elimination (AREA)

Abstract

(57)【要約】 【構成】 VSELPエンコーダ3は、ディジタル信号
処理により高能率符号化された音声信号を符号化する。
雑音区間検出回路4は、上記VSELPエンコーダ3で
得られる分析パラメータを用いて背景雑音区間を検出す
る。雑音レベル検出回路5は、上記雑音区間検出回路4
で検出された雑音区間の雑音レベルを検出するので、信
頼度の高い背景雑音レベルを検出でき、マイクロコンピ
ュータ6は、上記雑音レベル検出回路5で検出された上
記背景雑音レベルに応じて受話音量を制御する。 【効果】 受話音量の制御が容易に行え、明瞭度の高い
受話音を供給できる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声信号送受信装置に
関し、特に、ディジタル信号処理により音声信号を高能
率で圧縮する音声信号送受信装置に関する。
【0002】
【従来の技術】近年、低ビットレート、すなわち、4.8
〜9.6 Kbpsでの音声符号化方法には、ベクトル和励起リ
ニア予測(VSELP:Vector Sum Excited Linear Pr
ediction) 等のコード励起リニア予測(CELP:Code
Excited Linear Prediction)が提唱されている。
【0003】このVSELPについての技術内容は、モ
トローラ・インコーポレーテッドによる特表平2−50
2135号公報の「改良されたベクトル励起源を有する
ディジタル音声コーダ」及び「VECTOR SUM EXCITED LIN
EAR PREDICITION (VSELP) :SPEECH CODING AT 8 KBPS
:Ira A.Gerson and Jasiuk:Paper presented at theI
nt.Conf.on Acoustics, Speech and Signal Processing
-April 1990 」に記載されている。
【0004】上記VSELPを用い音声を高能率で圧縮
するディジタル信号処理による音声符号化装置として
は、VSELPエンコーダがある。このVSELPエン
コーダは、入力された音声信号から音声のフレームパワ
ー、反射係数及び線形予測係数、ピッチ周波数、コード
ブック、ピッチ及びコードブックのゲイン等のパラメー
タを分析し、この分析パラメータを用いて、音声を符号
化している。このような音声を高能率で圧縮するディジ
タル信号処理による音声符号化装置である上記VSEL
Pエンコーダは、携帯用電話装置に適用されている。
【0005】この携帯用電話装置は、室外で使用する事
が多いので、周囲の背景雑音により、しばしば通話が聞
きずらくなることがある。これは、雑音によるマスキン
グ効果によって受話者の最少可聴値が上昇し、受話音声
の明瞭度や了解度が劣化するためである。これに対し
て、送話側では雑音の抑圧又は話者の声量のアップ、受
話側では再生音量のアップ、又全体として話者と電話器
の密接な音響カップリング等が必要になる。このため、
携帯用電話装置には回りの環境に応じて受話音量を手動
で切り換えるスイッチがある。
【0006】
【発明が解決しようとする課題】ところで、上述したよ
うに携帯用電話装置を使用する際、回りの環境に応じて
受話音量を手動で切り換えるのは面倒である。この受話
音量の切り換えを自動で行えるようになれば便利であ
る。
【0007】この受話音量の切り換えを自動で行おうと
する場合、回りの雑音レベルを正確に検出できるか否か
が問題となってくる。通話中に入力音声用(送話用)の
マイクロフォンから混入する雑音には様々なものがある
がこれらの雑音(以下背景雑音という)と音声の区間を
分離するのはかなり難しかった。
【0008】これに対し、信号に含まれている基本周期
やピッチ等を検出したり、信号波形のゼロクロスの頻度
を見たり、周波数成分の分布をみること等を併用するこ
とで、背景雑音区間と音声区間とを区別することが考え
られてきた。これらの手法は、簡便である反面、誤検出
がしばしばあった。又、精度を向上するためのアルゴリ
ズムも提案されているが、かなりの演算量を要する。例
えば長時間の平均的な線形予測符号化(LPC)係数を
用いて、入力信号に逆フィルタリングを施し、その残差
レベルをモニタする方法なども提案されているが演算量
が多くなってしまっていた。
【0009】本発明は、上記実情に鑑みてなされたもの
であり、少ない演算量ながら高精度、高信頼度で背景雑
音を検出し、該検出背景雑音に応じて再生音量である受
話音量をコントロールして明瞭度の高い受話音を聞かせ
る音声信号送受信装置の提供を目的とする。
【0010】
【課題を解決するための手段】本発明に係る音声信号送
受信装置は、上記課題を解決するために、ディジタル信
号処理により音声信号を高能率で圧縮する音声信号送信
用符号化回路を有する音声信号送受信装置において、上
記音声信号送信用符号化回路で得られる分析パラメータ
を用いて雑音区間を検出する雑音区間検出手段と、上記
雑音区間検出手段で検出された雑音区間の雑音レベルを
検出する雑音レベル検出手段と、上記雑音レベル検出手
段で検出された雑音レベルに応じて受話音量を制御する
制御手段とを有することを特徴としている。
【0011】ここで、上記雑音区間検出手段は、入力音
声信号の1フレームにつき上記分析パラメータとして1
次の線形予測符号化係数を用い、該1次の線形予測符号
化係数が所定のしきい値よりも小さいときには該1フレ
ームを雑音区間としてもよい。
【0012】また、上記雑音区間検出手段は、入力音声
信号の1フレームにつき上記分析パラメータとしてピッ
チ成分の強弱を示すピッチゲインを用い、該ピッチゲイ
ンが所定の範囲内にあるときに該1フレームを雑音区間
としてもよい。
【0013】また、上記雑音区間検出手段は、入力音声
信号の1フレームにつき上記分析パラメータとしてピッ
チ成分の強弱を示すピッチゲインを用い、該ピッチゲイ
ンが0であるときに該1フレームを雑音区間としてもよ
い。
【0014】また、上記雑音区間検出手段は、上記分析
パラメータとしてフレームパワーを用い、入力音声信号
の1フレームの該フレームパワーが所定のしきい値より
も小さいときに該1フレームを雑音区間としてもよい。
【0015】また、上記雑音区間検出手段は、現在のフ
レームと過去のフレームでのフレームパワーの変化量が
所定のしきい値を越えたときには、現在のフレームを雑
音区間としていても、該現在のフレームを音声区間とす
る。
【0016】また、上記雑音区間検出手段は、複数連続
フレームの上記分析パラメータの値を考慮して、雑音区
間の検出を行ってもよい。
【0017】また、上記雑音レベル検出手段は、上記雑
音区間検出手段で検出された雑音区間の雑音レベル出力
に対してフィルタ処理を施すのが好ましい。
【0018】また、上記雑音レベル検出手段が雑音レベ
ル出力に対して施すフィルタ処理は、最小値フィルタ処
理であってもよいし、メディアンフィルタリング或いは
平滑化フィルタ処理でもよい。
【0019】また、本発明に係る音声信号送受信装置
は、上記課題を解決するために、送信部及び受信部を備
える音声信号送受信装置において、上記送信部に送話音
声入力が無いときに送話用マイクロフォンに入力される
音声レベルを雑音レベルとして検出する雑音レベル検出
手段と、上記雑音レベル検出手段で検出された雑音レベ
ルに応じて受話音量を制御する制御手段とを有すること
を特徴とする。
【0020】ここで、上記雑音レベル検出手段は、上記
送信部の上記送話用マイクロフォンに送信通話用電源オ
ン直後に入力される音声レベルを検出する。
【0021】また、上記雑音レベル検出手段は、上記送
信部の着信信号の待機状態において、所定期間毎に上記
送信用マイクロフォンに入力される音声レベルを検出し
てもよい。
【0022】また、上記雑音レベル検出手段は、上記受
信部の音声レベルが所定値以上のときに、上記送話用マ
イクロフォンに入力される音声レベルを検出してもよ
い。
【0023】
【作用】本発明に係る音声信号送受信装置は、雑音区間
検出手段が音声信号送信用符号化回路で得られる分析パ
ラメータを用いて雑音区間を検出するので、少ない演算
量ながら高精度、高信頼度の下に雑音区間を検出でき、
雑音レベル検出手段がその雑音区間の雑音レベルを検出
し、制御部がその雑音レベルに応じて再生音声の音量を
制御するので、明瞭度の高い受話音を供給できる。
【0024】また、本発明に係る音声信号送受信装置
は、雑音レベル検出手段が送信部に送話音声入力がない
ときに、送話用マイクロフォンに入力される音声レベル
を雑音レベルとして検出し、制御手段が該検出された雑
音レベルに応じて受話音量を制御するので、背景雑音の
影響に左右されない明瞭度の高い受話音を供給できる。
【0025】
【実施例】以下、本発明に係る音声信号送受信装置の好
ましい実施例について、図面を参照しながら説明する。
図1は、本発明の実施例となる携帯電話装置の概略構成
を示すブロック回路図である。
【0026】この実施例は、図1に示すように、ディジ
タル信号処理により音声信号を高能率で圧縮するベクト
ル和励起リニア予測(VSELP:Vector Sum Excited
Linear Prediction) エンコーダ3と、このVSELP
エンコーダ3で得られる分析パラメータを用いて背景雑
音(以下適宜に雑音という)区間を検出する雑音区間検
出回路4と、この雑音区間検出回路4で検出された雑音
区間の雑音レベルを検出する雑音レベル検出回路5と、
この雑音レベル検出回路5で検出された雑音レベルに応
じて受話音量を制御するマイクロコンピュータ6とを有
して構成されている。
【0027】上記VSELPエンコーダ3を用いた音声
符号化方法としては、アナリシスバイシンセス(Analys
is by synthesis )によるコードブックサーチにより、
低ビットレートによる高品質音声伝送を実現している。
また、VSELPを用いた音声符号化方法を適用した音
声符号化装置(音声コーダ)においては、入力音声信号
の特性を形成するピッチ等をコードブックに記憶された
コードベクトルを選択することで励起させて音声を符号
化している。この符号化の際に用いるピッチ周波数等の
パラメータには、フレームパワー、反射係数及び線形予
測係数、コードブック、ピッチ及びコードブックのゲイ
ン等がある。
【0028】本実施例は、これらの分析パラメータの
内、フレームパワーR0 、ピッチ成分の強弱を示すピッ
チゲインP0 、1次の線形予測符号化係数α1 及びピッ
チ周波数に関するラグLAG を背景雑音検出に利用する。
例えばフレームパワーR0 を利用するのは、音声レベル
と雑音レベルが同じになることはほとんどないためであ
り、ピッチゲインP0 を利用するのは、周囲雑音がほぼ
ランダムであるとすれば、この周囲雑音はピッチをほと
んど持たないと考えられるためである。
【0029】また、1次の線形予測符号化係数α1 を用
いるのは、このα1 が大か小かで、周波数の高域成分が
強いかあるいは低域成分が強いかを判定できるからであ
る。通常、背景雑音は、周波数の高域成分に集中してお
り、上記1次の線形予測符号化係数α1 から背景雑音を
検出できる。この1次の線形予測符号化係数α1 は、直
接型の高次のFIRフィルタを2次のFIRフィルタの
カスケードに分解したときのZ-1の項の係数の和であ
る。したがって、零点が0<θ<π/2の範囲にある
時、1次の線形予測符号化係数α1 は大きくなる。よっ
て、このα1 が所定のしきい値より大きいときは、低域
にエネルギーの集中した信号ということになり、所定の
しきい値より小さいときは、高域にエネルギーの集中し
た信号ということになる。
【0030】ここで、θと周波数との関係について説明
しておく。サンプリング周波数をfとすると、0〜f/
2の周波数がディジタルフィルタ等のディジタルシステ
ムにおいて、0〜πに相当する。例えば、サンプリング
周波数fを8KHzとすると、(0〜4KHz)は(0〜
π)に相当し、よって、π/2=2KHzとなる。したが
って、θが小さいほど周波数成分が低域になる。また、
θが小さくなれば、α1 は大きくなるので、α1 と所定
のしきい値との関係を調べることで低域成分が強いのか
高域成分が強いのかが分かる。
【0031】次に、上記雑音区間検出回路4は、上記V
SELPエンコーダ3から上記分析パラメータすなわち
フレームパワーR0 、ピッチ成分の強弱を示すピッチゲ
インP0 、1次の線形予測符号化係数α1 及びピッチ周
波数に関するラグLAG を受け取り、雑音区間を検出す
る。これは、携帯電話装置が小型化されていく現在、デ
ィジタル信号処理(DSP)装置やメモリの大きさが制
限されており、演算量を増やすのを避けるためにも有効
である。
【0032】上記雑音レベル検出回路5は、上記雑音区
間検出回路4で検出された雑音区間の音声レベルすなわ
ち送話用音声レベルを検出する。ここで、検出される送
話用音声レベルは、上記雑音区間検出回路4の上記分析
パラメータを用いた判定により最終的に雑音区間とされ
たフレームのフレームパワーR0 の値としてもよい。但
し、検出ミスの可能性があるので、このフレームパワー
0 を後述するように例えば5タップの最小値フィルタ
等に入力する。
【0033】上記マイクロコンピュータ6は、上記雑音
区間検出回路4での雑音区間検出と上記雑音レベル検出
回路5での雑音レベル検出のタイミングを制御すると共
に、該雑音レベルに応じて再生音声の音量を制御する。
【0034】このような本実施例は、以下に説明するよ
うに全体的に構成されている。すなわち、送話用マイク
ロフォン1で電気信号とされた入力音声信号は、アナロ
グ/ディジタル(A/D)変換器2によりディジタル信
号とされて、VSELPエンコーダ3に供給される。こ
のVSELPエンコーダ3は、ディジタル信号とされた
入力信号を分析し、情報圧縮をし、符号化を行う。この
際、入力音声信号のフレームパワー、反射係数及び線形
予測係数、ピッチ周波数、コードブック、ピッチ及びコ
ードブックのゲイン等の分析パラメータを用いている。
【0035】上記VSELPエンコーダ3で情報圧縮、
符号化が施されたデータは、ベースバンド信号処理回路
7に供給され、同期信号の付加、フレーミング、誤り訂
正符号等を付加される。そして、ベースバンド信号処理
回路7からの出力データは、RF送受信回路8に供給さ
れ、必要な周波数に変調されてアンテナ9から送信され
る。
【0036】ここで、上記VSELPエンコーダ3が用
いた分析パラメータの内、上述したようにフレームパワ
ーR0 、ピッチ成分の強弱を示すピッチゲインP0 、1
次の線形予測符号化係数α1 及びピッチ周波数に関する
ラグLAG は、上記雑音区間検出回路4に供給される。こ
の雑音区間検出回路4は、上記フレームパワーR0 、ピ
ッチ成分の強弱を示すピッチゲインP0 、1次の線形予
測符号化係数α1 及びピッチ周波数に関するラグLAG を
用いて、雑音区間の検出を行う。この雑音区間検出回路
4で最終的に雑音区間であるとされたフレームに関する
情報(フラグ情報)は、上記雑音レベル検出回路5に供
給される。
【0037】上記雑音レベル検出回路5には、上記A/
D変換器2からのディジタル入力信号も供給されてお
り、上記フラグ情報に応じて雑音区間の信号レベルを検
出する。この場合の信号レベルは、上述したようにフレ
ームパワーR0 としてもよい。
【0038】上記雑音レベル検出回路5で検出された雑
音レベルデータは、制御部であるマイクロコンピュータ
6に供給される。このマイクロコンピュータ6には、後
述するように受信側レベル検出回路11からの情報も供
給されており、これらの情報を下に後述するように可変
利得アンプ13の利得を可変することにより受話音量を
制御する。
【0039】この受話音量とは、本実施例の携帯電話装
置に送信されてきた通話相手からの信号を再生するとき
の音量である。この通話相手からの信号は、アンテナ9
により受信され、RF送受信回路8に供給される。
【0040】このRF送受信回路8によりベースバンド
に復調された相手側からの入力音声信号は、ベースバン
ド信号処理回路7に供給され、所定の信号処理が施され
る。このベースバンド信号処理回路7からの信号は、V
SELPデコーダ10に供給される。このVSELPデ
コーダ10は、この情報を元に音声信号をデコードす
る。デコードされた音声信号は、ディジタル/アナログ
(D/A)変換器12に供給され、アナログ音声信号に
変換される。
【0041】上記VSELPデコーダ10からのデコー
ドされた音声信号は、受信側レベル検出回路11にも供
給される。この受信側レベル検出回路11は、受信側音
声のレベルの検出を行い、現在受話音声(相手側からの
入力音声信号)があるか否かを判定する。この受信側レ
ベル検出回路11からの検出情報は、上記マイクロコン
ピュータ6に供給される。
【0042】上記D/A変換器12からのアナログ音声
信号は、可変利得アンプ13に供給される。この可変利
得アンプ13の利得は、上述したように上記マイクロコ
ンピュータ6により可変されているので、スピーカ14
から発せられる再生音量(受話音量)は、雑音(背景雑
音)に応じて、マイクロコンピュータ6により制御され
る。
【0043】なお、このマイクロコンピュータ6には、
表示装置15、電源回路16及びキーボード17が接続
されている。表示装置15は、この本実施例である携帯
電話装置が使用可能であるか、キーボード17で使用者
が押圧したキースイッチが何であるか等を表示する。
【0044】次に、本実施例を構成する上記雑音レベル
検出回路5での雑音レベルの検出について以下に説明す
る。先ず、雑音レベルを検出する区間は、上記雑音区間
検出回路4で検出された雑音区間であることが条件とな
る。この雑音区間を検出するタイミングは、上述したよ
うに上記マイクロコンピュータ6で制御される。この雑
音区間の検出は、上記雑音レベル検出回路5での雑音レ
ベルの検出を補助するためのものである。すなわち該当
するフレームが有声音である音声かあるいは雑音である
かを判定し、雑音であるという判定であれば雑音レベル
の検出が可能となる。当然のことながら、より精度の高
い雑音レベルの検出は、雑音のみが存在する時に行うの
が良いのは明らかである。したがって、本実施例では、
送話音声入力が無いときに送話用マイクロフォン1に入
力される音声レベルを送話用音声レベル検出手段でもあ
る雑音レベル検出回路5に検出させている。
【0045】先ず、雑音レベルの初期値として例えば使
用者が設定した音量レベルに対して−20dBを設定す
る。この初期設定値に対して後述するように検出された
雑音レベルが大きいと判断された時には、受信部での再
生音量レベルを上昇させる。
【0046】雑音レベルは、フレーム毎の入力音声が背
景雑音区間であれば、上述したように検出しやすい。こ
のため、本実施例では、送信部の送信通話用電源がオン
とされた直後、送信部の着信信号の待機状態及び通話中
であって受信部の音声レベルが所定値以上のときに入力
される音声を背景雑音とし、この間のフレームの雑音レ
ベルを検出している。
【0047】ここで、送信部の送信通話電源がオンとさ
れることは、使用者が本実施例の携帯電話装置の使用を
開始する意思表示である。このとき、本実施例は、通
常、内部の各回路の自己診断を行い、次に、使用者がア
ンテナ9を張ると基地局との接続を確認した上でスタン
バイ状態に入る。これらの一連の動作を経て初めて使用
者からの入力(入力音声)を受けるので、使用者がこの
間に音声を発することはない。したがって、この一連の
動作の最中に上記送話用マイクロフォン1を使用して音
声レベルを検出すれば、検出された音声レベルは周囲の
ノイズレベルすなわち背景雑音レベルである。なお、同
様に、通話開始直前で使用者が発振操作をした最中又は
直後も背景雑音レベルの検出が可能である。
【0048】また、送信部の着信信号の待機状態とは、
受話部の電源をオンにして、相手側からの通話信号の着
信を待ち受けている状態である。この状態のときには、
当然のことながら通話中ではないので、使用者の送話音
声が無いと考えられる。そこで、この待ち受け状態に、
送話用マイクロフォン1を用いて周囲の音量レベルを測
定すれば、背景雑音レベルを検出できる。なお、この測
定は、適当な間隔で行い平均化してもよい。
【0049】以上により、送信部の送信通話電源がオン
とされた直後及び送信部の着信信号の待機状態で背景雑
音レベルが推定でき、それに応じた音声処理によって通
話がスタートできるが、その後の背景雑音レベルの変化
に対しては、通話中もダイナミックに追従することが好
ましい。そこで、本実施例では、通話中での受信部の音
声レベルに応じても背景雑音レベルの検出を行ってい
る。
【0050】この通話中での受信部の音声レベルに応じ
た雑音レベルの検出は、上述したように受話側のVSE
LPエンコーダ3で用いられる分析パラメータにより雑
音区間を検出してから行うのが好ましい。
【0051】例えば、フレームパワーR0 をモニタしそ
のレベルがある基準のレベル以上であるときや、相手が
話しているときを利用して雑音レベルを検出すること等
により、より確実に雑音の検出ができるので、相手が話
しているときの再生音量をリアルタイムで制御でき、よ
り快適な通話品質が実現できる。
【0052】このように本実施例では、送信部の送信通
話用電源がオンとされた直後、送信部の着信信号の待機
状態及び通話中であって送信部の音声がないときに、上
記マイクロコンピュータ6が上記雑音区間検出回路4及
び上記雑音レベル検出回路5の検出タイミングを制御し
ている。
【0053】次に、上記雑音区間検出回路4での雑音区
間検出動作について、図2及び図3に示すフローチャー
トを参照しながら説明する。
【0054】先ず、図2のフローチャートが開始される
とステップS1では、上記VSELPエンコーダ3から
フレームパワーR0 、ピッチ成分の強弱を示すピッチゲ
インP0 、1次の線形予測符号化係数α1 及びピッチ周
波数に関するラグLAG を受け取る。
【0055】本実施例においては、上記ステップS1で
供給された各分析パラメータを用いた以下の各ステップ
での判別を基本的に3フレームで行うことにした。これ
は、1フレームだけで背景雑音の判別を行うと誤りが多
くなるためである。そして、3フレームに渡り各パラメ
ータの範囲を見ながら、雑音区間を判別したら、ノイズ
フラグを“1”とし、そうでなければ“0”にセットす
る。3フレームの内訳は、現在のフレームと1、2フレ
ーム前までのフレームである。
【0056】このような連続した3フレームを通しての
分析パラメータによる判別を以下の各ステップで行う。
【0057】先ず、ステップS2では、入力音声のフレ
ームパワーR0 が3フレーム連続して所定のしきい値R
0th より小さいか否かを判別する。ここで、YES(R
0 が3フレーム連続してR0th より小さい)と判別する
とステップS3に進み、NO(R0 が3フレーム連続し
てR0th 以上である)と判別するとステップS9に進
む。この所定のしきい値R0th は、それ以上のレベルを
ノイズではなく、音声と見なす値である。すなわち、こ
のステップS2は、信号レベルのチェックである。
【0058】ステップS3では、入力音声の1次の線形
予測符号化(LPC)係数α1 が3フレーム連続して所
定のしきい値αthより小さいか否かを判別する。ここで
YES(α1 が3フレーム連続してαthより小さい)と
判別するとステップS4に進み、NO(α1 が3フレー
ム連続してαth以上である)と判別するとステップS9
に進む。この所定のしきい値αthは、雑音を分析したと
きにはほとんど表れることのない値になっている。すな
わち、このステップS3は、音声スペクトルの傾きのチ
ェックである。
【0059】ステップS4では、現在の入力音声のフレ
ームのフレームパワーR0 の値が“5”より小さいか否
かを判別する。ここで、YES(R0 が5より小さい)
と判別すると、ステップS5に進み、NO(R0 が5以
上である)と判別すると、ステップS6に進む。ここ
で、“5”をしきい値としたのは、フレームパワーR0
が“5”より大である場合のフレームは、有声音である
確率が高いためである。
【0060】ステップS5では、入力音声信号のピッチ
ゲインP0 の値が3フレーム連続して0.9より小さ
く、かつ現在のピッチゲインP0 が0.7より大きいか
否かを判別する。ここで、YES(ピッチゲインP0
値が3フレーム連続して0.9より小さく、かつ現在の
ピッチゲインP0 が0.7より大きい)と判別すると、
ステップ8に進み、NO(ピッチゲインP0 の値が3フ
レーム連続して0.9以上、また現在のピッチゲインP
0 が0.7以下である)と判別すると、ステップS9に
進む。上記ステップS3から上記ステップS5までは、
ピッチ成分の強弱のチェックである。
【0061】ステップS6では、上記ステップS4での
判別結果(NO:R0 が5以上である)を受けて、その
フレームパワーR0 が5以上20未満であるか否かを判
別する。ここでYES(R0 が5以上20未満である)
と判別するとステップS7に進み、NO(R0 が5以上
20未満でない)と判別するとステップS9に進む。
【0062】ステップS7では、入力音声信号のピッチ
ゲインP0 の値が3フレーム連続して0.85より小さ
く、かつ現在のピッチゲインP0 が0.65より大きい
か否かを判別する。ここで、YES(ピッチゲインP0
の値が3フレーム連続して0.85より小さく、かつ現
在のピッチゲインP0 が0.65より大きい)と判別す
ると、ステップ8に進み、NO(ピッチゲインP0 の値
が3フレーム連続して0.85以上、また現在のピッチ
ゲインP0 が0.65以下である)と判別すると、ステ
ップS9に進む。
【0063】ステップS8では、上記ステップS5又は
上記ステップS7でのYESの判別結果を受けて、ノイ
ズフラグを“1”とする。ノイズフラグを“1”とする
ことは、そのフレームを雑音とすることである。
【0064】ステップS9では、上記ステップS2、上
記ステップS3、上記ステップS5、上記ステップS6
及び上記ステップS7での判別がNOとされた場合に、
ノイズフラグを“0”とし、該当フレームを音声である
とする。
【0065】次に、図3のフローチャートに移る。ステ
ップS10では、入力音声信号のピッチラグLAG が0で
あるか否かの判別を行う。ここでYES(LAG が0であ
る)と判別すると、ピッチ周波数を表すLAG が0の場合
は、音声である確率はほとんどないので、そのフレーム
を雑音とする。すなわち、ステップS11に進みノイズ
フラグを“1”とする。ここでNO(LAG が0でない)
と判別するとステップS12に進む。
【0066】ステップS12では、フレームパワーR0
が2以下であるか否かを判別する。ここで、YES(R
0 が2以下である)と判別するとステップS13に進
み、NO(R0 が2より大きい)と判別するとステップ
S14に進む。このステップS12は、フレームパワー
0 がかなり小さいか否かを判別しており、YESと判
定すると次のステップS13でノイズフラグを“1”と
し、そのフレームを雑音としている。
【0067】ステップS13では、上記ステップS11
と同様にそのフレームを雑音とすべく、ノイズフラグを
“1”とする。
【0068】ステップS14では、現在のフレームのフ
レームパワーR0 から1つ前のフレームパワーR0 を減
算し、その絶対値が3を越えるか否かを判別する。現在
のフレームと1つ前のフレームでのフレームパワーR0
の変化が急に大きくなるときには、そのフレームを音声
フレームとするためである。すなわち、このステップS
14でYES(現在のフレームと1つ前のフレームのフ
レームパワーR0 の変化が急激に大きくなった)と判定
するとステップS16に進み、ノイズフラグを“0”と
し、そのフレームを音声フレームとする。また、ここ
で、NO(現在のフレームと1つ前のフレームのフレー
ムパワーR0 の変化が急激に大きくならない)と判別す
ると、ステップS15に進む。
【0069】ステップS15では、現在のフレームのフ
レームパワーR0 から2つ前のフレームパワーR0 を減
算し、その絶対値が3を越えるか否かを判別する。現在
のフレームと2つ前のフレームでのフレームパワーR0
の変化が急に大きくなるときには、そのフレームを音声
フレームとするためである。すなわち、このステップS
15でYES(現在のフレームと2つ前のフレームのフ
レームパワーR0 の変化が急激に大きくなった)と判定
するとステップS16に進み、ノイズフラグを“0”と
し、そのフレームを音声フレームとする。また、ここ
で、NO(現在のフレームと2つ前のフレームのフレー
ムパワーR0 の変化が急激に大きくならない)と判別す
ると、ステップS17に進む。
【0070】ステップS17では、最終的にノイズフラ
グを“0”又は“1”と決定し、そのフラグ情報を上記
雑音レベル検出回路5に供給する。
【0071】以上、図2及び図3に示したフローチャー
トによる雑音区間検出回路4での動作により得られたフ
ラグ情報に応じて上記雑音レベル検出回路5は、雑音区
間の音声レベルを検出する。
【0072】ところで、上記雑音区間検出回路4での雑
音区間検出では、完全に音声区間と雑音区間とを区別す
ることは出来ず、また、音声を誤って雑音として検出し
てしまうことが起こりえる。この検出誤りは、ほとんど
が音声の子音部で起きる。背景雑音が子音部と略々同じ
くらいのレベルで混入している場合は、誤検出しても報
告される雑音レベルが変わらないので問題ないが、そう
でない場合、特に雑音がほとんど混入していないような
場合では、レベルが場合によっては、20〜30dBも違
うため、かなり問題になってくる。そこで、本実施例で
は、誤検出した場合でもそのまま検出した雑音区間の雑
音レベルを用いるのではなく、平滑化などにより誤検出
の影響が少なくなるようにした。
【0073】このような平滑化等の手段により誤検出の
影響を少なくした雑音レベルの検出について、図4を参
照しながら説明する。
【0074】図4において、入力端子20には、上記A
/D変換器2からのディジタル入力信号が供給される。
また、入力端子21には、上記雑音区間検出回路4から
のフラグ情報がディジタルシグナルプロセッサ(DS
P)で構成される雑音レベル検出回路5の雑音レベル決
定部5aに入力されるように供給される。この雑音レベ
ル決定部5aには、入力端子22からのフレームパワー
0 も供給されている。すなわち、この雑音レベル決定
部5aは、雑音区間検出回路4からのフラグ情報又はフ
レームパワーR0 を基に入力音声信号の雑音レベルを決
定している。具体的には、図3に示したフローチャート
のステップS17において、最終的にノイズフラグが
“1”とされたときのフレームパワーR0 の値を背景雑
音レベルと見なしている。
【0075】このとき、検出ミスの可能性があるので、
このR0 の値を例えば5タップの最小値フィルタ5bに
入力する。このR0 は、背景雑音と認められた時のみ入
力する。この最小値フィルタ5bの出力は、マイクロコ
ンピュータ6等の制御用CPUに適当な周期(例えば1
00msec 毎)で入力する。ここで、最小値フィルタ5
bの出力が更新されていないときは、前の値を繰り返し
使用する。この最小値フィルタ5bは、後述するメディ
アンフィルタのようにタップ中の真ん中の値を出力する
ものではなく、最小値を出力する。同じタップ数の場
合、連続した4フレームまでの検出誤りに対応できる。
また、それ以上の誤りについても、最小値を報告レベル
とするため、影響をなるべく少なくできる。
【0076】上記マイクロコンピュータ6では、入力さ
れた信号レベルR0 の信頼度をより向上するために、該
信号レベルR0 を更に5タップのメディアンフィルタ6
aに入力させている。このメディアンフィルタ6aは、
検出誤りが続いてもレベルの報告を誤りにくいようにす
る。このフィルタリングは、フィルタのタップ中の値を
小さい順に並べ変え、その中の中間値を出力するもので
ある。5タップのメディアンフィルタは、連続した2フ
レームまでは検出誤りがおきても、報告レベルを間違え
ることはない。
【0077】上記メディアンフィルタ6aの出力信号
は、ボリューム位置調整部6bに供給される。このボリ
ューム位置調整部6bは、上記メディアンフィルタ6a
の出力信号を基に上記可変利得アンプ13の利得を可変
する。このようにして、上記マイコン6は、再生音量で
ある受話音量を制御する。具体的には、使用者の設定し
たボリューム位置を中心(基点)として、音量の増減を
コントロールするものである。また、使用者がボリュー
ムを調節した直前の雑音レベルを記憶しておき、そのレ
ベルと現在の背景雑音レベルの変化分に基づき出力音量
を増減してもよい。
【0078】なお、ここで、用いられるフィルタとして
は、検出した背景雑音レベルの平滑化を行う1次のロー
パスフィルタ等の平滑化フィルタでもよい。ローパスフ
ィルタの度合いによっては、検出を誤ってレベルが急に
変化しても追従が遅くなるためレベル差を小さくでき
る。
【0079】このようにすれば、雑音レベルを誤検出し
た場合でも、誤検出の影響を少なくできる。
【0080】ここで、検出された雑音レベルによる受話
音量制御の方法を説明しておく。受話音量をコントロー
ルする際、通常は、上述したように初期設定された音量
を背景雑音に応じて変化させる。もし、使用者が音量ボ
リュームを手動で変えた場合は、その音量を基に背景雑
音のレベルに応じて受話音量をコントロールするように
する。
【0081】具体的には、初期値として例えば図5に示
すように5段階(1〜5:小から大へ変化する)の雑音
レベルに応じた受話音量レベル(a、b、c、d、e)
が与えられていて、この値に基づいてコントロールされ
る。
【0082】例えば、使用者が手動調整できる音量ボリ
ュームつまみを上げた場合、音量レベルは上がる。例え
ば、検出した雑音レベルが3であった場合、音量ボリュ
ームつまみを上げる前は受話音量レベルはcであるが、
音量ボリュームつまみを上げた後の受話音量レベルはd
となる。
【0083】また例えば、使用者が手動調整できる音量
ボリュームつまみを下げた場合、音量レベルは下がる。
例えば、検出した雑音レベルが3であった場合、音量ボ
リュームつまみを下げる前は受話音量レベルはdである
が、音量ボリュームつまみを下げた後の受話音量レベル
はcとなる。
【0084】つまり、使用者が手動調整できる音量ボリ
ュームつまみを上下した場合、音量ボリュームつまみを
変更する直前の雑音レベルと受話音量の対応を覚えてお
き、使用者が音量ボリュームつまみを変えた時点で雑音
レベルと音量レベルの対応(マッピング)を変えること
で、ダイナミックに受話音量の基準値を変更する。この
ようにすることで、話者の意図した(変更した)音量
(音量ボリュームつまみにより手動調整された音量)を
基に雑音レベルに応じた受話音量のコントロールができ
る。
【0085】ここで、受話側のボリュームが内部的に2
dBステップで変化できるとした場合の受話音量制御の
アルゴリズムについて説明する。
【0086】上記受話側のボリュームについて、雑音レ
ベルに応じた自動音量調節の可変範囲を5段階とし、こ
れらの段階に対応するボリューム値を6dBのステップ
とする。各段階に対応して設定されるボリューム値がス
トアされている変数をlvl[0]〜lvl[4]とし、その値域を
0〜12とする。すなわち、変数の値の1が2dBに相
当すると考える。
【0087】変数の初期値は、例えば、lvl[0]=0、lv
l[1]=3、lvl[2]=6、lvl[3]=9、lvl[4]=12とし
て、不揮発性RAMに蓄えておく。これらの変数値は、
実際のボリュームレベルとして、+0dB、+6dB、
+12dB、+18dB、+24dBにそれぞれ相当す
る。また、LVnow を現在のボリューム値、LVafter を雑
音レベル読み取り後の変更すべきボリューム値とする。
上記各lvl[0]、lvl[1]、lvl[2]、lvl[3]、lvl[4]に対応
する雑音レベルは、例えばそれぞれ0〜5、6〜8、9
〜15、16〜45、46〜とする。この雑音レベル
は、上記図1の雑音レベル検出回路5により読み取られ
た雑音レベルの1/16に相当するものであり、マイク
ロフォンのゲインによって変動するものである。
【0088】ここで図6は、受話音量制御のアルゴリズ
ムを示すフローチャートである。この図6に示す受話音
量制御動作は、例えば100ms毎の割り込みに応じて
実行される。
【0089】先ず、最初のステップS21においては、
ユーザによるボリューム変更が有ったか否かの判別が行
われる。ここでYES、すなわちボリューム変更有りと
されたときには、ステップS22に進んで、ボリューム
アップの操作か否かが判別される。YESと判別された
場合、すなわちボリュームアップ操作が行われた場合に
は、ステップS23に進み、i=0〜4に対して、lvl
[i]=lvl[i]+3、すなわち6dBアップした後、リタ
ーン、すなわち割り込みから復帰する。ステップS22
でNOと判別された場合、すなわちボリュームダウン操
作が行われた場合には、ステップS24に進み、i=0
〜4に対して、lvl[i]=lvl[i]−3、すなわち6dBダ
ウンした後、リターンする。
【0090】上記ステップS21にてNO、すなわちユ
ーザによるボリューム変更無し、と判別されたときに
は、ステップS25に進み、上記雑音レベル検出回路5
により検出された雑音レベルを上記マイクロコンピュー
タ6が読み取って、1/16倍し、これを雑音レベルN
Lとした後、ステップS26に進む。
【0091】ステップS26では、上記雑音レベルNL
が5以下(NL≦5)のとき、上記変更すべきボリュー
ム値LVafter を上記lvl[0](LVafter =lvl[0])とし、
これ以外でNL≦8のときLVafter =lvl[1]とし、これ
ら以外でNL≦15のときLVafter =lvl[2]とし、これ
ら以外でNL≦45のときLVafter =lvl[3]とし、これ
ら以外のときLVafter =lvl[4]とする。ここで、雑音レ
ベルNLとの各比較値は、送話用マイクロフォンのゲイ
ンにより変動する。
【0092】次のステップS27においては、上記LVaf
ter が上限値UPlim 、例えばUPlim=12よりも大きい
(LVafter >UPlim )ときに、LVafter =UPlim に制限
している。また、次のステップS28においては、上記
LVafter が下限値DWNlim、例えばDWNlim=0よりも小さ
い(LVafter <DWNlim)ときに、LVafter =DWNlimに制
限している。
【0093】次のステップS29においては、上記現在
のボリューム値LVnow が上記変更すべきボリューム値LV
after よりも小さい(LVnow <LVafter )とき、LVnow
をボリューム変化の単位ステップVstepだけ増加させ
(LVnow =LVnow +Vstep)、LVnow がLVafter よりも
大きい(LVnow >LVafter )とき、LVnow をVstepだけ
減少させ(LVnow =LVnow −Vstep)ている。ここで、
単位ステップVstepは、上述したように1、すなわち2
dBに相当する。
【0094】次のステップS30においては、LVnow ≠
LVafter であるか否かを判別しており、NOすなわちLV
now =LVafter のときにはリターン、すなわち割り込み
から復帰する。YESすなわちLVnow ≠LVafter のとき
には、ボリューム値をLVnowの値にセットした後、リタ
ーンする。
【0095】このような受話音量制御動作により、ユー
ザによるボリューム調整と、雑音レベルに応じた自動音
量制御が有効に行われる。
【0096】次に、以上に述べた本実施例の有効性を確
かめるために、シミュレーションによって実際に背景雑
音検出を行った例を述べておく。通常、室内騒音の基準
としてHothスペクトルで表されているものが一般に
使われているが、室外で使用されることの多い携帯電話
装置にこのHothスペクトルを適用するのは難しい。
そこで、シミュレーションには実際に室外で録音してき
た雑音を使用した。この雑音は、2つの駅(これをA
駅、B駅とする)構内で録音した。そして、音声と雑音
をコンピュータ上でディジタル波形で加算した場合、雑
音を試聴室内で流しその状態で携帯電話装置を使ってマ
イクを通して話したときの音声を録音した場合、雑音の
ない音声の場合の3通りについて検討を行った。なお、
雑音の混入レベルは、70dBspl 程度の騒音環境を想定
した。
【0097】このシミュレーションとしては、固定少数
点によるシミュレーションを行い、検出の頻度や誤り及
び検出した雑音レベルなどについて調べた。
【0098】背景雑音を検出した例を図7乃至図10に
示す。これら図7乃至図10は、サンプルとしてA駅又
はB駅構内で録音した背景雑音を流しながら携帯電話装
置を使って話したときの音声と、検出した背景雑音の結
果である。
【0099】図7がA駅構内で録音した背景雑音を流し
ながら男声で「人間は豊かな自然を求めています」と話
したときの結果であり、図8がA駅構内で録音した背景
雑音を流しながら女声で「健康のため無理をしないで下
さい」と話したときの結果である。また、図9がB駅構
内で録音した背景雑音を流しながら男声で「人間は豊か
な自然を求めています」と話したときの結果であり、図
10がB駅構内で録音した背景雑音を流しながら女声で
「健康のため無理をしないで下さい」と話したときの結
果である。
【0100】それぞれの検出結果において、図中矩形部
分が背景雑音と思われる部分を検出した区間である。音
声部分と雑音部分を完全に分離することは出来ないが、
数10ms単位での検出が出来ており、また音声部分を誤
って検出してしまうことがほとんどない。子音部での背
景雑音検出誤りは、前述した平滑化等の手段を用いるこ
とで報告レベルの間違いを避けることができた。特に、
最小値フィルタリングを使うことによりほとんど検出誤
りによるレベル報告の間違いを避けることができた。
【0101】なお、このような雑音検出のシミュレーシ
ョンとしては、上記固定少数点によるシミュレーション
だけではなく、例えばワークステーション上で浮動少数
点によるシミュレーションを行ってもよく、得られる検
出結果はほとんど同じである。
【0102】以上より、本実施例の携帯電話装置は、V
SELPエンコーダで用いられている分析パラメータを
使用して雑音区間検出を行うので、少ない演算量ながら
高精度、高信頼度で背景雑音を検出でき、該背景雑音に
応じて再生音量をコントロールするので、明瞭度の高い
受話音を提供できる。
【0103】なお、本発明に係る音声信号送受信装置
は、上記実施例にのみ限定されるものではなく、例えば
雑音区間の検出には分析パラメータを1つだけ用いるこ
とも可能である。さらに、複数の連続したフレームを考
慮するのではなく、1フレームのみで検出することも可
能である。しかし、これらの場合、その精度は、上記本
実施例よりも落ちてしまうことは否めない。さらに、雑
音区間の検出の流れも上記フローチャートに示したもの
に限定されるものでないことはいうまでもない。
【0104】
【発明の効果】本発明に係る音声信号送受信装置は、雑
音区間検出手段が音声信号送信用符号化回路で得られる
分析パラメータを用いて雑音区間を検出するので、少な
い演算量ながら高精度、高信頼度の下に背景雑音を検出
でき、雑音レベル検出手段がその雑音区間の雑音レベル
を検出し、制御部がその雑音レベルに応じて受話音量を
制御するので、信頼度の高い検出となり、その検出され
た背景雑音のレベル情報に基づき受話音量の制御などが
容易にかつ確実に行え、明瞭度の高い受話音を供給でき
る。
【0105】また、本発明に係る音声信号送受信装置
は、雑音レベル検出手段が送信部に送話音声入力がない
ときに、送話用マイクロフォンに入力される音声レベル
を雑音レベルとして検出し、制御手段が該検出された音
声レベルに応じて受話音量を制御するので、背景雑音の
影響に左右されない明瞭度の高い受話音を供給できる。
【図面の簡単な説明】
【図1】本発明に係る音声送受信装置の実施例の回路構
成を説明するためのブロック回路図である。
【図2】図1に示した実施例の背景雑音検出回路の動作
を説明するためのフローチャートである。
【図3】図1に示した実施例の背景雑音検出回路の動作
を説明するためのフローチャートである。
【図4】背景雑音レベルを誤差の影響から防ぐための手
段を説明するための図である。
【図5】本実施例における検出された雑音レベルによる
受話音量制御の具体例を説明するための図である。
【図6】受話音量制御動作を説明するためのフローチャ
ートである。
【図7】固定少数点によるシミュレーションを行って得
られた背景雑音検出結果を示す図である。(A駅構内で
の雑音を流して男声で話した場合)
【図8】固定少数点によるシミュレーションを行って得
られた背景雑音検出結果を示す図である。(A駅構内で
の雑音を流して女声で話した場合)
【図9】固定少数点によるシミュレーションを行って得
られた背景雑音検出結果を示す図である。(B駅構内で
の雑音を流して男声で話した場合)
【図10】固定少数点によるシミュレーションを行って
得られた背景雑音検出結果を示す図である。(B駅構内
での雑音を流して女性で話した場合)
【符号の説明】
1 送話用マイクロフォン 2 アナログ/ディジタル(A/D)変換器 3 VSELPエンコーダ 4 雑音区間検出回路 5 雑音レベル検出回路 6 マイクロコンピュータ 7 ベースバンド信号処理回路 8 RF送受信回路 9 アンテナ 10 VSELPデコーダ 11 受信側レベル検出回路 12 ディジタル/アナログ(D/A)変換器 13 可変利得アンプ 14 スピーカ

Claims (13)

    【特許請求の範囲】
  1. 【請求項1】 ディジタル信号処理により音声信号を高
    能率で圧縮する音声信号送信用符号化回路を有する音声
    信号送受信装置において、 上記音声信号送信用符号化回路で得られる分析パラメー
    タを用いて雑音区間を検出する雑音区間検出手段と、 上記雑音区間検出手段で検出された雑音区間の雑音レベ
    ルを検出する雑音レベル検出手段と、 上記雑音レベル検出手段で検出された雑音レベルに応じ
    て受話音量を制御する制御手段とを有することを特徴と
    する音声信号送受信装置。
  2. 【請求項2】 上記雑音区間検出手段は、入力音声信号
    の1フレームにつき上記分析パラメータとして1次の線
    形予測符号化係数を用い、該1次の線形予測符号化係数
    が所定のしきい値よりも小さいときには該1フレームを
    雑音区間とすることを特徴とする請求項1記載の音声信
    号送受信装置。
  3. 【請求項3】 上記雑音区間検出手段は、入力音声信号
    の1フレームにつき分析パラメータとしてピッチ成分の
    強弱を示すピッチゲインを用い、該ピッチゲインが所定
    の範囲内にあるときに該1フレームを雑音区間とするこ
    とを特徴とする請求項1又は2記載の音声信号送受信装
    置。
  4. 【請求項4】 上記雑音区間検出手段は、入力信号の1
    フレームにつき分析パラメータとしてピッチ成分の強弱
    を示すピッチゲインを用い、該ピッチゲインが0である
    ときに該1フレームを雑音区間とすることを特徴とする
    請求項1、2又は3記載の音声信号送受信装置。
  5. 【請求項5】 上記雑音区間検出手段は、上記分析パラ
    メータとしてフレームパワーを用い、入力音声信号の1
    フレームの該フレームパワーが所定のしきい値よりも小
    さいときに該1フレームを雑音区間とすることを特徴と
    する請求項1、2、3又は4記載の音声信号送受信装
    置。
  6. 【請求項6】 上記雑音区間検出手段は、現在のフレー
    ムと過去のフレームでのフレームパワーの変化量が所定
    のしきい値を越えたときには、現在のフレームを雑音区
    間としていても、該現在のフレームを音声区間とするこ
    とを特徴とする請求項1、2、3、4又は5記載の音声
    信号送受信装置。
  7. 【請求項7】 上記雑音区間検出手段は、複数連続フレ
    ームの上記分析パラメータの値を考慮して、雑音区間の
    検出を行うことを特徴とする請求項2、3又は5記載の
    音声信号送受信装置。
  8. 【請求項8】 上記雑音レベル検出手段は、上記雑音区
    間検出手段で検出された雑音区間の雑音レベル出力に対
    してフィルタ処理を施すことを特徴とする請求項1記載
    の音声信号送受信装置。
  9. 【請求項9】 上記雑音レベル検出手段が雑音レベル出
    力に対して施すフィルタ処理は、最小値フィルタ処理で
    あることを特徴とする請求項8記載の音声信号送受信装
    置。
  10. 【請求項10】 送信部及び受信部を備える音声信号送
    受信装置において、 上記送信部に送話音声入力が無いときに送話用マイクロ
    フォンに入力される音声レベルを雑音レベルとして検出
    する雑音レベル検出手段と、 上記雑音レベル検出手段で検出された雑音レベルに応じ
    て受話音量を制御する制御手段とを有することを特徴と
    する音声信号送受信装置。
  11. 【請求項11】 上記雑音レベル検出手段は、上記送信
    部の上記送話用マイクロフォンに送信通話用電源オン直
    後に入力される音声レベルを検出することを特徴とする
    請求項10記載の音声信号送受信装置。
  12. 【請求項12】 上記雑音レベル検出手段は、上記送信
    部の着信信号の待機状態において、所定期間毎に上記送
    信用マイクロフォンに入力される音声レベルを検出する
    ことを特徴とする請求項10記載の音声信号送受信装
    置。
  13. 【請求項13】 上記雑音レベル検出手段は、上記受信
    部の音声レベルが所定値以上のときに、上記送話用マイ
    クロフォンに入力される音声レベルを検出することを特
    徴とする請求項10、11又は12記載の音声信号送受
    信装置。
JP04072994A 1993-06-29 1994-03-11 音声信号送受信装置 Expired - Lifetime JP3685812B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP04072994A JP3685812B2 (ja) 1993-06-29 1994-03-11 音声信号送受信装置
US08/695,522 US5732390A (en) 1993-06-29 1996-08-12 Speech signal transmitting and receiving apparatus with noise sensitive volume control

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP5-182138 1993-06-29
JP18213893 1993-06-29
JP04072994A JP3685812B2 (ja) 1993-06-29 1994-03-11 音声信号送受信装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2005080472A Division JP2005253097A (ja) 1993-06-29 2005-03-18 音声信号送受信装置

Publications (2)

Publication Number Publication Date
JPH0774709A true JPH0774709A (ja) 1995-03-17
JP3685812B2 JP3685812B2 (ja) 2005-08-24

Family

ID=26380249

Family Applications (1)

Application Number Title Priority Date Filing Date
JP04072994A Expired - Lifetime JP3685812B2 (ja) 1993-06-29 1994-03-11 音声信号送受信装置

Country Status (2)

Country Link
US (1) US5732390A (ja)
JP (1) JP3685812B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2768544A1 (fr) * 1997-09-18 1999-03-19 Matra Communication Procede de detection d'activite vocale
JP2009171610A (ja) * 2002-09-18 2009-07-30 Dolby Sweden Ab 実数値のフィルタバンクにおけるスペクトルエンベロープ調整によって生じたエイリアシングを低減するための方法
US10403295B2 (en) 2001-11-29 2019-09-03 Dolby International Ab Methods for improving high frequency reconstruction

Families Citing this family (188)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0776114A3 (fr) * 1995-11-22 1997-06-04 Laboratoires D'electronique Philips S.A.S. Appareil téléphonique avec volume réglable en fonction de bruit ambiant
JP3483695B2 (ja) * 1996-03-14 2004-01-06 株式会社リコー 音声通信装置
US6744882B1 (en) * 1996-07-23 2004-06-01 Qualcomm Inc. Method and apparatus for automatically adjusting speaker and microphone gains within a mobile telephone
JPH10247098A (ja) * 1997-03-04 1998-09-14 Mitsubishi Electric Corp 可変レート音声符号化方法、可変レート音声復号化方法
US6311155B1 (en) 2000-02-04 2001-10-30 Hearing Enhancement Company Llc Use of voice-to-remaining audio (VRA) in consumer applications
DE69942784D1 (de) * 1998-04-14 2010-10-28 Hearing Enhancement Co Llc Verfahren und Vorrichtung, die es einem End-Benutzer ermöglichen, Hörer-Präferenzen für Hörbehinderte und Nicht-Hörbehinderte einzustellen
US7415120B1 (en) 1998-04-14 2008-08-19 Akiba Electronics Institute Llc User adjustable volume control that accommodates hearing
US6826528B1 (en) 1998-09-09 2004-11-30 Sony Corporation Weighted frequency-channel background noise suppressor
AR024353A1 (es) 1999-06-15 2002-10-02 He Chunhong Audifono y equipo auxiliar interactivo con relacion de voz a audio remanente
US6442278B1 (en) 1999-06-15 2002-08-27 Hearing Enhancement Company, Llc Voice-to-remaining audio (VRA) interactive center channel downmix
JP2001016057A (ja) * 1999-07-01 2001-01-19 Matsushita Electric Ind Co Ltd 音響装置
WO2001029826A1 (en) * 1999-10-21 2001-04-26 Sony Electronics Inc. Method for implementing a noise suppressor in a speech recognition system
US6298247B1 (en) 1999-12-30 2001-10-02 Telefonaktiebolaget L.M. Ericsson (Publ) Method and apparatus for automatic volume control
US6351733B1 (en) 2000-03-02 2002-02-26 Hearing Enhancement Company, Llc Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process
US7266501B2 (en) * 2000-03-02 2007-09-04 Akiba Electronics Institute Llc Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
US20040096065A1 (en) * 2000-05-26 2004-05-20 Vaudrey Michael A. Voice-to-remaining audio (VRA) interactive center channel downmix
EP1271470A1 (en) * 2001-06-25 2003-01-02 Alcatel Method and device for determining the voice quality degradation of a signal
ITFI20010199A1 (it) 2001-10-22 2003-04-22 Riccardo Vieri Sistema e metodo per trasformare in voce comunicazioni testuali ed inviarle con una connessione internet a qualsiasi apparato telefonico
US7321559B2 (en) * 2002-06-28 2008-01-22 Lucent Technologies Inc System and method of noise reduction in receiving wireless transmission of packetized audio signals
DE10245555A1 (de) * 2002-09-30 2004-04-15 Siemens Audiologische Technik Gmbh Drahtloses Übertragungssystem für Hörgeräte
JP4282317B2 (ja) * 2002-12-05 2009-06-17 アルパイン株式会社 音声通信装置
DE602004002845T2 (de) * 2004-01-22 2007-06-06 Siemens S.P.A. Sprachaktivitätsdetektion unter Verwendung von komprimierten Sprachsignal-Parametern
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US7633076B2 (en) 2005-09-30 2009-12-15 Apple Inc. Automated response to and sensing of user activity in portable devices
US9100490B2 (en) 2006-01-03 2015-08-04 Vtech Telecommunications Limited System and method for adjusting hands-free phone
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US9053089B2 (en) 2007-10-02 2015-06-09 Apple Inc. Part-of-speech tagging using latent analogy
KR101437830B1 (ko) * 2007-11-13 2014-11-03 삼성전자주식회사 음성 구간 검출 방법 및 장치
US8620662B2 (en) 2007-11-20 2013-12-31 Apple Inc. Context-aware unit selection
US10002189B2 (en) 2007-12-20 2018-06-19 Apple Inc. Method and apparatus for searching using an active ontology
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8065143B2 (en) 2008-02-22 2011-11-22 Apple Inc. Providing text input using speech data and non-speech data
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US9575715B2 (en) * 2008-05-16 2017-02-21 Adobe Systems Incorporated Leveling audio signals
US8464150B2 (en) 2008-06-07 2013-06-11 Apple Inc. Automatic language identification for dynamic text processing
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
US8768702B2 (en) 2008-09-05 2014-07-01 Apple Inc. Multi-tiered voice feedback in an electronic device
US8898568B2 (en) 2008-09-09 2014-11-25 Apple Inc. Audio user interface
US8712776B2 (en) 2008-09-29 2014-04-29 Apple Inc. Systems and methods for selective text to speech synthesis
US8583418B2 (en) 2008-09-29 2013-11-12 Apple Inc. Systems and methods of detecting language and natural language strings for text to speech synthesis
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
JP5298769B2 (ja) * 2008-10-27 2013-09-25 ヤマハ株式会社 雑音推定装置、通話装置および雑音推定方法
WO2010067118A1 (en) 2008-12-11 2010-06-17 Novauris Technologies Limited Speech recognition involving a mobile device
US8862252B2 (en) 2009-01-30 2014-10-14 Apple Inc. Audio user interface for displayless electronic device
US8380507B2 (en) 2009-03-09 2013-02-19 Apple Inc. Systems and methods for determining the language to use for speech generated by a text to speech engine
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US10706373B2 (en) 2011-06-03 2020-07-07 Apple Inc. Performing actions associated with task items that represent tasks to perform
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US10540976B2 (en) * 2009-06-05 2020-01-21 Apple Inc. Contextual voice commands
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
US8682649B2 (en) 2009-11-12 2014-03-25 Apple Inc. Sentiment prediction from textual data
US8600743B2 (en) 2010-01-06 2013-12-03 Apple Inc. Noise profile determination for voice-related feature
US8381107B2 (en) 2010-01-13 2013-02-19 Apple Inc. Adaptive audio feedback system and method
US8311838B2 (en) 2010-01-13 2012-11-13 Apple Inc. Devices and methods for identifying a prompt corresponding to a voice input in a sequence of prompts
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
WO2011089450A2 (en) 2010-01-25 2011-07-28 Andrew Peter Nelson Jerram Apparatuses, methods and systems for a digital conversation management platform
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US8713021B2 (en) 2010-07-07 2014-04-29 Apple Inc. Unsupervised document clustering using latent semantic density analysis
US8719006B2 (en) 2010-08-27 2014-05-06 Apple Inc. Combined statistical and rule-based part-of-speech tagging for text-to-speech synthesis
US8719014B2 (en) 2010-09-27 2014-05-06 Apple Inc. Electronic device with text error correction based on voice recognition data
US10762293B2 (en) 2010-12-22 2020-09-01 Apple Inc. Using parts-of-speech tagging and named entity recognition for spelling correction
US10515147B2 (en) 2010-12-22 2019-12-24 Apple Inc. Using statistical language models for contextual lookup
US8781836B2 (en) 2011-02-22 2014-07-15 Apple Inc. Hearing assistance system for providing consistent human speech
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US9794678B2 (en) 2011-05-13 2017-10-17 Plantronics, Inc. Psycho-acoustic noise suppression
US10672399B2 (en) 2011-06-03 2020-06-02 Apple Inc. Switching between text data and audio data based on a mapping
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US8812294B2 (en) 2011-06-21 2014-08-19 Apple Inc. Translating phrases from one language into another using an order-based set of declarative rules
US8706472B2 (en) 2011-08-11 2014-04-22 Apple Inc. Method for disambiguating multiple readings in language conversion
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
US8762156B2 (en) 2011-09-28 2014-06-24 Apple Inc. Speech recognition repair using contextual information
KR101866774B1 (ko) 2011-12-22 2018-06-19 삼성전자주식회사 휴대용 단말기에서 음량을 조절하기 위한 장치 및 방법
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US9483461B2 (en) 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US8775442B2 (en) 2012-05-15 2014-07-08 Apple Inc. Semantic search using a single-source semantic model
US10417037B2 (en) 2012-05-15 2019-09-17 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US10019994B2 (en) 2012-06-08 2018-07-10 Apple Inc. Systems and methods for recognizing textual identifiers within a plurality of words
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
US9576574B2 (en) 2012-09-10 2017-02-21 Apple Inc. Context-sensitive handling of interruptions by intelligent digital assistant
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
US8935167B2 (en) 2012-09-25 2015-01-13 Apple Inc. Exemplar-based latent perceptual modeling for automatic speech recognition
BR112015018905B1 (pt) 2013-02-07 2022-02-22 Apple Inc Método de operação de recurso de ativação por voz, mídia de armazenamento legível por computador e dispositivo eletrônico
US9977779B2 (en) 2013-03-14 2018-05-22 Apple Inc. Automatic supplementation of word correction dictionaries
US9368114B2 (en) 2013-03-14 2016-06-14 Apple Inc. Context-sensitive handling of interruptions
US10652394B2 (en) 2013-03-14 2020-05-12 Apple Inc. System and method for processing voicemail
US10642574B2 (en) 2013-03-14 2020-05-05 Apple Inc. Device, method, and graphical user interface for outputting captions
US9733821B2 (en) 2013-03-14 2017-08-15 Apple Inc. Voice control to diagnose inadvertent activation of accessibility features
US10572476B2 (en) 2013-03-14 2020-02-25 Apple Inc. Refining a search based on schedule items
KR102014665B1 (ko) 2013-03-15 2019-08-26 애플 인크. 지능형 디지털 어시스턴트에 의한 사용자 트레이닝
US9922642B2 (en) 2013-03-15 2018-03-20 Apple Inc. Training an at least partial voice command system
WO2014144579A1 (en) 2013-03-15 2014-09-18 Apple Inc. System and method for updating an adaptive speech recognition model
KR102057795B1 (ko) 2013-03-15 2019-12-19 애플 인크. 콘텍스트-민감성 방해 처리
US10748529B1 (en) 2013-03-15 2020-08-18 Apple Inc. Voice activated device for use with a voice-based digital assistant
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
EP3937002A1 (en) 2013-06-09 2022-01-12 Apple Inc. Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant
EP3008964B1 (en) 2013-06-13 2019-09-25 Apple Inc. System and method for emergency calls initiated by voice command
DE112014003653B4 (de) 2013-08-06 2024-04-18 Apple Inc. Automatisch aktivierende intelligente Antworten auf der Grundlage von Aktivitäten von entfernt angeordneten Vorrichtungen
US10296160B2 (en) 2013-12-06 2019-05-21 Apple Inc. Method for extracting salient dialog usage from live data
US9620105B2 (en) 2014-05-15 2017-04-11 Apple Inc. Analyzing audio input for efficient speech and music recognition
US10592095B2 (en) 2014-05-23 2020-03-17 Apple Inc. Instantaneous speaking of content on touch devices
US9502031B2 (en) 2014-05-27 2016-11-22 Apple Inc. Method for supporting dynamic grammars in WFST-based ASR
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
TWI566107B (zh) 2014-05-30 2017-01-11 蘋果公司 用於處理多部分語音命令之方法、非暫時性電腦可讀儲存媒體及電子裝置
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
US10289433B2 (en) 2014-05-30 2019-05-14 Apple Inc. Domain specific language for encoding assistant dialog
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US9734193B2 (en) 2014-05-30 2017-08-15 Apple Inc. Determining domain salience ranking from ambiguous words in natural speech
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
PL3309784T3 (pl) * 2014-07-29 2020-02-28 Telefonaktiebolaget Lm Ericsson (Publ) Szacowanie szumu tła w sygnałach audio
US10446141B2 (en) 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
US9711141B2 (en) 2014-12-09 2017-07-18 Apple Inc. Disambiguating heteronyms in speech synthesis
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
CN105472497A (zh) * 2015-12-07 2016-04-06 京东方科技集团股份有限公司 耳机控制装置、耳机、可穿戴设备及耳机控制方法
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179588B1 (en) 2016-06-09 2019-02-22 Apple Inc. INTELLIGENT AUTOMATED ASSISTANT IN A HOME ENVIRONMENT
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
US10891946B2 (en) 2016-07-28 2021-01-12 Red Hat, Inc. Voice-controlled assistant volume control
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
US10644876B2 (en) 2017-01-20 2020-05-05 Enveil, Inc. Secure analytics using homomorphic encryption
US11196541B2 (en) 2017-01-20 2021-12-07 Enveil, Inc. Secure machine learning analytics using homomorphic encryption
US11777729B2 (en) 2017-01-20 2023-10-03 Enveil, Inc. Secure analytics using term generation and homomorphic encryption
US10873568B2 (en) 2017-01-20 2020-12-22 Enveil, Inc. Secure analytics using homomorphic and injective format-preserving encryption and an encrypted analytics matrix
WO2018136811A1 (en) 2017-01-20 2018-07-26 Enveil, Inc. Secure web browsing via homomorphic encryption
US11507683B2 (en) 2017-01-20 2022-11-22 Enveil, Inc. Query processing with adaptive risk decisioning
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
US10902133B2 (en) 2018-10-25 2021-01-26 Enveil, Inc. Computational operations in enclave computing environments
US10817262B2 (en) 2018-11-08 2020-10-27 Enveil, Inc. Reduced and pipelined hardware architecture for Montgomery Modular Multiplication
US11601258B2 (en) 2020-10-08 2023-03-07 Enveil, Inc. Selector derived encryption systems and methods

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4628529A (en) * 1985-07-01 1986-12-09 Motorola, Inc. Noise suppression system
US4817157A (en) * 1988-01-07 1989-03-28 Motorola, Inc. Digital speech coder having improved vector excitation source
US5111454A (en) * 1990-08-16 1992-05-05 Motorola, Inc. Digital cellular tdm system employing 6:1 packing of transcoded information
US5146504A (en) * 1990-12-07 1992-09-08 Motorola, Inc. Speech selective automatic gain control
US5432859A (en) * 1993-02-23 1995-07-11 Novatel Communications Ltd. Noise-reduction system

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2768544A1 (fr) * 1997-09-18 1999-03-19 Matra Communication Procede de detection d'activite vocale
WO1999014737A1 (fr) * 1997-09-18 1999-03-25 Matra Nortel Communications Procede de detection d'activite vocale
US10403295B2 (en) 2001-11-29 2019-09-03 Dolby International Ab Methods for improving high frequency reconstruction
US8498876B2 (en) 2002-09-18 2013-07-30 Dolby International Ab Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks
US9842600B2 (en) 2002-09-18 2017-12-12 Dolby International Ab Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks
US8108209B2 (en) 2002-09-18 2012-01-31 Coding Technologies Sweden Ab Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks
US8145475B2 (en) 2002-09-18 2012-03-27 Coding Technologies Sweden Ab Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks
US8346566B2 (en) 2002-09-18 2013-01-01 Dolby International Ab Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks
JP2009169435A (ja) * 2002-09-18 2009-07-30 Dolby Sweden Ab 実数値のフィルタバンクにおけるスペクトルエンベロープ調整によって生じたエイリアシングを低減するための方法
US8606587B2 (en) 2002-09-18 2013-12-10 Dolby International Ab Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks
JP2011010346A (ja) * 2002-09-18 2011-01-13 Dolby Internatl Ab 実数値のフィルタバンクにおけるスペクトルエンベロープ調整によって生じたエイリアシングを低減するための方法
US9990929B2 (en) 2002-09-18 2018-06-05 Dolby International Ab Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks
US10013991B2 (en) 2002-09-18 2018-07-03 Dolby International Ab Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks
US10115405B2 (en) 2002-09-18 2018-10-30 Dolby International Ab Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks
US10157623B2 (en) 2002-09-18 2018-12-18 Dolby International Ab Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks
JP2009171610A (ja) * 2002-09-18 2009-07-30 Dolby Sweden Ab 実数値のフィルタバンクにおけるスペクトルエンベロープ調整によって生じたエイリアシングを低減するための方法
US10418040B2 (en) 2002-09-18 2019-09-17 Dolby International Ab Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks
US10685661B2 (en) 2002-09-18 2020-06-16 Dolby International Ab Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks
US11423916B2 (en) 2002-09-18 2022-08-23 Dolby International Ab Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks

Also Published As

Publication number Publication date
JP3685812B2 (ja) 2005-08-24
US5732390A (en) 1998-03-24

Similar Documents

Publication Publication Date Title
JP3685812B2 (ja) 音声信号送受信装置
US5867815A (en) Method and device for controlling the levels of voiced speech, unvoiced speech, and noise for transmission and reproduction
US6138040A (en) Method for suppressing speaker activation in a portable communication device operated in a speakerphone mode
CA2203917C (en) Method and apparatus for suppressing noise in a communication system
US7680465B2 (en) Sound enhancement for audio devices based on user-specific audio processing parameters
KR100343776B1 (ko) 디지털 전화 단말기에서 주변소음에 따른 신호음 및/또는수신음 크기 조절장치 및 방법
JPH07193548A (ja) 雑音低減処理方法
EP0993670A1 (en) Method and apparatus for speech enhancement in a speech communication system
US20080312916A1 (en) Receiver Intelligibility Enhancement System
JP2005253097A (ja) 音声信号送受信装置
KR20190139872A (ko) 멀티-소스 환경에서의 비-고조파 음성 검출 및 대역폭 확장
US7386327B2 (en) Apparatus and method for controlling noise in a mobile communication terminal
EP1405424A1 (en) Narrowband speech signal transmission system with perceptual low-frequency enhancement
US7130794B2 (en) Received speech signal processing apparatus and received speech signal reproducing apparatus
JPH07240782A (ja) 送受話装置
JPWO2003103253A1 (ja) 送受話装置
JP3075067B2 (ja) デジタル移動無線装置
JPH0950298A (ja) 音声符号化装置及び音声復号化装置
US20070174054A1 (en) Communication apparatus with signal mode and voice mode
US6856961B2 (en) Speech coding system with input signal transformation
GB2343822A (en) Using LSP to alter frequency characteristics of speech
JP3896654B2 (ja) 音声信号区間検出方法及び装置
KR100619893B1 (ko) 휴대단말기의 개선된 저전송률 선형예측코딩 장치 및 방법
JP3201136B2 (ja) デジタル移動無線装置
JPH0713593A (ja) 音声処理システム

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040210

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040412

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040511

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040712

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20040802

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20040827

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050318

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050601

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080610

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090610

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090610

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100610

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100610

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110610

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110610

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120610

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120610

Year of fee payment: 7

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120610

Year of fee payment: 7

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120610

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130610

Year of fee payment: 8

EXPY Cancellation because of completion of term