JP4876378B2 - 音声処理装置、音声処理方法及び音声処理プログラム - Google Patents

音声処理装置、音声処理方法及び音声処理プログラム Download PDF

Info

Publication number
JP4876378B2
JP4876378B2 JP2004248540A JP2004248540A JP4876378B2 JP 4876378 B2 JP4876378 B2 JP 4876378B2 JP 2004248540 A JP2004248540 A JP 2004248540A JP 2004248540 A JP2004248540 A JP 2004248540A JP 4876378 B2 JP4876378 B2 JP 4876378B2
Authority
JP
Japan
Prior art keywords
noise
unit
processing
voice
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004248540A
Other languages
English (en)
Other versions
JP2006065067A (ja
Inventor
京 根本
知志 細川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2004248540A priority Critical patent/JP4876378B2/ja
Priority to DE602005012563T priority patent/DE602005012563D1/de
Priority to EP05018500A priority patent/EP1630792B1/en
Priority to CNB2005100930980A priority patent/CN100452172C/zh
Priority to US11/211,741 priority patent/US7693293B2/en
Publication of JP2006065067A publication Critical patent/JP2006065067A/ja
Application granted granted Critical
Publication of JP4876378B2 publication Critical patent/JP4876378B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Telephone Function (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Description

本発明は、機器の操作により発生する雑音を除去する音声処理装置、音声処理方法及び音声処理プログラムに関する。
音声を入力する各種機器では、利用者の周囲の環境に基づく雑音や機器自身が発生する雑音が目的とする音声に加わってしまう。このような雑音は定常的なものと非定常的なものに分けることができる。非定常的な雑音の例として携帯電話等の移動端末の操作上発生する雑音をあげる。携帯電話などでは、構造上、マイク等の音声入力部分とキーのように音を発してしまう機構を持つ部分とが近接することが避けられず、操作に伴い雑音が混入する。すなわち、キーを押下した場合に発生するキークリック雑音がマイクに入力され、それが雑音として音声に乗ってしまう。
このような雑音を抑圧する方法としては、収音した雑音を取り出してこの雑音と逆の位相を有する音波を発生させる方法や、周波数領域において低パワー部分を取り除く方法などが知られている。
これら現在行われている雑音除去方法では、雑音抑圧の方法や雑音を抑圧する音声処理上の段階に相違はあるものの、その処理には共通点がある。すなわち、これらの方法では、入力された音声を分析し、雑音を検出して雑音除去処理を行い、その後に符号化処理が行われる。音声の分析と雑音の検出・除去とは不可分の関係にある。
特許文献1では骨伝導マイクロホンの検出する音声から、パルス性の異音(歯当たり音)を除去する方法を開示している。この発明では、パルス性の雑音が検出されると、ゲイン調整回路及び遅れ回路を用いて雑音の除去を行っている。
特許文献2では、符号誤り率が大きく変動する伝送路において、電力パラメータを小音量に対応する値に置き換えることで音声の品質の劣化を防ぐことが行われている。
特許第3420831号公報(図7、(0020)〜(0022)段落) 特開昭60−173600号公報(第5−8頁)
しかしながら、雑音処理に要する時間は、データ処理における遅延となり、上記のような雑音の除去方法では、雑音除去処理に要する時間分の遅延が発生することになる。本発明は、上記問題点に鑑み、従来の方法よりも音声処理時間の遅延を短縮することを目的とする。
上記問題を解決する為に、本発明は、以下の特徴を有する。
<音声処理装置>
本発明にかかる音声処理装置は、
入力操作を行う入力部を備えた音声処理装置であって、
音声データをフレームに分割して音声フレームを出力する音声入力部と、
前記音声フレームを符号化する処理部と、
前記入力部による入力操作が原因で発生する雑音を検出する検出部と、
前記検出部で前記雑音を検出した場合に、前記処理部において符号化された音声フレームを予め符号化された無音フレームで置き換え、前記処理部において符号化された音声フレームから前記雑音を除去する出力部と、を有することを特徴とする。
<音声処理方法>
本発明にかかる音声処理方法は、
入力操作を行う入力部を有する音声処理装置で行う音声処理方法であって、
音声データをフレームに分割して音声フレームを出力する音声入力工程と、
前記音声フレームを符号化する符号化処理工程と、
前記入力部による入力操作が原因で発生する雑音を検出する検出工程と、
前記検出工程で前記雑音を検出した場合に、前記符号化処理工程において符号化された音声フレームを予め符号化された無音フレームで置き換え、前記符号化処理工程において符号化された音声フレームから前記雑音を除去する出力工程と、を有することを特徴とする。
<音声処理プログラム>
本発明にかかる音声処理プログラムは、
入力操作を行う入力部を有する音声処理装置のコンピュータに実行させる音声処理プログラムであって、
音声データをフレームに分割して音声フレームを出力する音声入力処理と、
前記音声フレームを符号化する符号化処理と、
前記入力部による入力操作が原因で発生する雑音を検出する検出処理と、
前記検出処理で前記雑音を検出した場合に、前記符号化処理において符号化された音声フレームを予め符号化された無音フレームで置き換え、前記符号化処理において符号化された音声フレームから前記雑音を除去する出力処理と、を、前記コンピュータに実行させることを特徴とする。
本発明によれば、音声処理時間の遅延を短縮することができる。
機器自体から発生する雑音の検出を音声符号化と並行して行い、またその雑音を除去する音声処理を以下のように実現した。
図1及び2を参照し、第1の実施例の構成を説明する。
音声入力部10は、入力された音声データを、任意時間単位に分割したフレームという単位で処理部20に送る(処理1及び2)。
処理部20は、音声入力部10から受けた音声フレームを符号化し、出力部40に送る(処理3及び4)。
キー検出部30は、入力部60からキー等の入力装置の操作を通知されると、雑音発生の動作と見なし、検出結果を出力部40に送る(処理5及び6)。
出力部40は、キー検出部30からの検出結果により、処理部20より受けた符号化データフレーム、もしくは出力部40にてあらかじめ符号化した無音フレームを選択し、選択したフレームを通信部50に送る(処理7)。
通信部50は無線基地局とのデータの送受信を行う。
入力部60は入力キーやボタンなどの入力装置であり、文字等の入力を行う。入力部60は電話番号入力や文字入力等の処理部(不図示)に接続されているが、キー検出部30にも接続されており、入力装置の操作が行われるとこれをキー検出部30に通知する。
この他に本発明の動作を記述したプログラムを保持するメモリを有していてもよい。
図2の処理1〜4及び7は雑音を含む音声データの符号化処理を表している。
<実施例の動作の説明>
以下、本実施例の動作について携帯端末を例にとって説明する。
携帯端末のキー(入力部60)を押すことによりキークリック音等の雑音が発生すると、図1においてこの雑音は音声入力部10から入力され、処理部20を経由して、出力部40で通信部50に送られるデータフレームとして準備される。キーを押下した後の各部での処理や各部間のデータ伝送(処理1、処理2、処理3、処理4)に要する時間を図2に示す。
キー検出部30では、キー押下等の雑音発生原因となる動作を電気的に検出し(処理5)、当該動作が発生したことを出力部40に通知する(処理6)。キー検出は、雑音発生後一定の遅れを持って検出されるが、キー検出の処理時間(処理5、処理6)はデータ処理遅延(処理1〜処理4)よりも一般的に短いため、データ処理と並列に処理することにより、雑音検出のための遅延時間を追加することなく検出結果を通知できる。
出力部40は、キー検出部30からの検出結果が「検出なし」の場合、処理部20から受け取ったフレームを通信部50に送る。検出結果が「検出あり」の場合、処理部20から受け取ったフレームを破棄し、無音フレームを通信部50に送る(処理7)。
本実施例によれば、雑音を検出する処理と通常の音声処理とが独立して行われるので、雑音検出の為の時間が不要である。また、キー押下によって発生する雑音を音声信号の中から検出する処理が不要である為、簡素な方法で出力音声が改善される。
図3を参照して、第2の実施例を説明する。本実施例では、雑音の検出方法を更に工夫している。図3においては、図1のキー検出部30が雑音検出部70に置き換えられている。
雑音検出部70は、キー検出でなく入力音声を利用した一般的な音声処理による雑音検出方法を行う(処理5´)。入力された音声データは処理部20と雑音検出部70に伝達され、雑音検出処理と音声符号化処理とが独立して行われる。これにより、従来の雑音検出方法を使用する場合においても、雑音検出処理と音声符号化処理を並行して行うことが可能であり、雑音検出処理の遅延が低減される。雑音検出処理に必要とされる時間は音声処理符号化処理と並行して処理する上で支障がない程度のものである。雑音の除去は第1の実施例と同じように、無フレームで置き換えることにより行われる。
本実施例によれば、雑音を検出する処理と音声データを符号化する処理とが独立して行われる為、雑音検出の為に余分な時間をとる必要がなく、処理時間の短縮が図れる。
図4を参照して、第3の実施例を説明する。本実施例では、図3の構成に雑音記憶部80を加えられている。
雑音記憶部80は入力部60で発生する様々なキークリック音をサンプルデータとして保持し、これを雑音検出部70に提供することで、雑音の検出を容易にする。雑音検出処理の際に雑音検出部70は雑音記憶部80に保持されたサンプルの雑音データを参照し、音声データから適合する雑音を検出する。雑音の除去処理は実施例1に同じである。
サンプルデータとしては、雑音検出部70で検出したものを蓄積してもよいし、予めキーを操作して採取したものを保持してもよい。
本実施例によれば、雑音検出処理の時間が短縮され、音声データの符号化処理の時間に合わせた並列処理が可能である。
図5を参照して第4の実施例を説明する。本実施例では、図4の構成に入力部60が加えられている。
入力部60はキー等が操作されたことを検出すると、これを雑音検出部70に通知する。雑音検出部70では、入力部60から通知があった場合であって、且つ雑音を検出した場合に、検出した雑音が入力部60の操作により発生したものであると判断し、雑音記憶部80にこの雑音データを送る。雑音記憶部80ではこのようにして採取された雑音データを蓄積する。
雑音記憶部80に蓄積された雑音データの利用法及び出力部40での雑音除去処理は実施例3と同様にして行われる。
本実施例によれば、非定常的な雑音が音声データに混入したことが通知され、また入力部60で発生する非定常的な雑音の形状を装置が学習することにより、非定常的な雑音の検出処理が容易になる。
第5の実施例では、図6に示すように、通信部50をデータ保存可能な記憶部90に置き換える。これにより、第1及び第2の実施例で示した音声処理を行う音声記録装置が実現される。
本発明は筐体に入力装置を有する携帯電話、無線機、音声記録装置等に応用することが可能である。
本発明における第1の実施例の構成を示す図である。 キー操作により発生する雑音を含む音声データの符号化処理及びキー操作の検出処理に要する時間を示す図である。 本発明における第2の実施例の構成を示す図である。 本発明における第3の実施例の構成を示す図である。 本発明における第4の実施例の構成を示す図である。 本発明における第5の実施例の構成を示す図である。
符号の説明
10 音声入力部
20 処理部
30 キー検出部
40 出力部
50 通信部
60 入力部
70 雑音検出部
80 雑音記憶部
90 記憶部

Claims (9)

  1. 入力操作を行う入力部を備えた音声処理装置であって、
    音声データをフレームに分割して音声フレームを出力する音声入力部と、
    前記音声フレームを符号化する処理部と、
    前記入力部による入力操作が原因で発生する雑音を検出する検出部と、
    前記検出部で前記雑音を検出した場合に、前記処理部において符号化された音声フレームを予め符号化された無音フレームで置き換え、前記処理部において符号化された音声フレームから前記雑音を除去する出力部と、を有することを特徴とする音声処理装置。
  2. 前記検出部は、前記入力部による入力操作が行われた場合に、前記雑音を検出したと見なすことを特徴とする請求項記載の音声処理装置。
  3. 前記検出部は、前記音声データから前記雑音を検出することを特徴とする請求項記載の音声処理装置。
  4. 前記検出部で検出した前記雑音を記憶する雑音記憶部を更に有することを特徴とする請求項1または3記載の音声処理装置。
  5. 前記検出部は、前記入力部による入力操作が行われ、且つ、前記音声データから前記雑音を検出した場合に、前記雑音を前記雑音記憶部に記憶することを特徴とする請求項記載の音声処理装置。
  6. 前記出力部で前記雑音を除去した音声フレームを送信する通信部を更に有することを特徴とする請求項1からの何れか1項に記載の音声処理装置。
  7. 前記出力部で前記雑音を除去した音声フレームを保存する記憶部を更に有することを特徴とする請求項1からの何れか1項に記載の音声処理装置。
  8. 入力操作を行う入力部を有する音声処理装置で行う音声処理方法であって、
    音声データをフレームに分割して音声フレームを出力する音声入力工程と、
    前記音声フレームを符号化する符号化処理工程と、
    前記入力部による入力操作が原因で発生する雑音を検出する検出工程と、
    前記検出工程で前記雑音を検出した場合に、前記符号化処理工程において符号化された音声フレームを予め符号化された無音フレームで置き換え、前記符号化処理工程において符号化された音声フレームから前記雑音を除去する出力工程と、を有することを特徴とする音声処理方法。
  9. 入力操作を行う入力部を有する音声処理装置のコンピュータに実行させる音声処理プログラムであって、
    音声データをフレームに分割して音声フレームを出力する音声入力処理と、
    前記音声フレームを符号化する符号化処理と、
    前記入力部による入力操作が原因で発生する雑音を検出する検出処理と、
    前記検出処理で前記雑音を検出した場合に、前記符号化処理において符号化された音声フレームを予め符号化された無音フレームで置き換え、前記符号化処理において符号化された音声フレームから前記雑音を除去する出力処理と、を、前記コンピュータに実行させることを特徴とする音声処理プログラム。
JP2004248540A 2004-08-27 2004-08-27 音声処理装置、音声処理方法及び音声処理プログラム Expired - Fee Related JP4876378B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2004248540A JP4876378B2 (ja) 2004-08-27 2004-08-27 音声処理装置、音声処理方法及び音声処理プログラム
DE602005012563T DE602005012563D1 (de) 2004-08-27 2005-08-25 Vorrichtung und Verfahren zur Verarbeitung eines Tonsignals
EP05018500A EP1630792B1 (en) 2004-08-27 2005-08-25 Sound processing device and method
CNB2005100930980A CN100452172C (zh) 2004-08-27 2005-08-25 声音处理设备和输入声音处理方法
US11/211,741 US7693293B2 (en) 2004-08-27 2005-08-26 Sound processing device and input sound processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004248540A JP4876378B2 (ja) 2004-08-27 2004-08-27 音声処理装置、音声処理方法及び音声処理プログラム

Publications (2)

Publication Number Publication Date
JP2006065067A JP2006065067A (ja) 2006-03-09
JP4876378B2 true JP4876378B2 (ja) 2012-02-15

Family

ID=35406250

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004248540A Expired - Fee Related JP4876378B2 (ja) 2004-08-27 2004-08-27 音声処理装置、音声処理方法及び音声処理プログラム

Country Status (5)

Country Link
US (1) US7693293B2 (ja)
EP (1) EP1630792B1 (ja)
JP (1) JP4876378B2 (ja)
CN (1) CN100452172C (ja)
DE (1) DE602005012563D1 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5182556B2 (ja) * 2005-10-26 2013-04-17 日本電気株式会社 電話端末および信号処理方法
US9966085B2 (en) * 2006-12-30 2018-05-08 Google Technology Holdings LLC Method and noise suppression circuit incorporating a plurality of noise suppression techniques
US8204238B2 (en) * 2007-06-08 2012-06-19 Sensory, Inc Systems and methods of sonic communication
US8190440B2 (en) * 2008-02-29 2012-05-29 Broadcom Corporation Sub-band codec with native voice activity detection
JP5294085B2 (ja) * 2009-11-06 2013-09-18 日本電気株式会社 情報処理装置、その付属装置、情報処理システム、その制御方法並びに制御プログラム
JP2011100029A (ja) 2009-11-06 2011-05-19 Nec Corp 信号処理方法、情報処理装置、及び信号処理プログラム
GB0919672D0 (en) 2009-11-10 2009-12-23 Skype Ltd Noise suppression
GB0919673D0 (en) * 2009-11-10 2009-12-23 Skype Ltd Gain control for an audio signal
US8411874B2 (en) 2010-06-30 2013-04-02 Google Inc. Removing noise from audio
CN103020000B (zh) * 2012-12-17 2015-05-20 张晶 计算器
US8867757B1 (en) * 2013-06-28 2014-10-21 Google Inc. Microphone under keyboard to assist in noise cancellation

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60173600A (ja) 1984-02-17 1985-09-06 日本電信電話株式会社 音声復号器
JPH06314162A (ja) * 1993-04-29 1994-11-08 Internatl Business Mach Corp <Ibm> マルチメディア・スタイラス
JP3420831B2 (ja) 1994-06-24 2003-06-30 セコム株式会社 骨伝導音声のノイズ除去装置
JPH08160994A (ja) * 1994-12-07 1996-06-21 Matsushita Electric Ind Co Ltd 雑音抑圧装置
JPH09149157A (ja) * 1995-11-24 1997-06-06 Casio Comput Co Ltd 通信端末装置
DE19736517A1 (de) * 1997-08-22 1999-02-25 Alsthom Cge Alcatel Verfahren zur Reduzierung von Störungen bei der Übertragung eines elektrischen Nachrichtensignals
US6578162B1 (en) * 1999-01-20 2003-06-10 Skyworks Solutions, Inc. Error recovery method and apparatus for ADPCM encoded speech
EP1109379A1 (de) * 1999-12-16 2001-06-20 Ascom AG Verfahren zur Optimierung eines Nutzsignals in einem Sprachendgerät sowie Sprachendgerät
JP2002006891A (ja) * 2000-06-23 2002-01-11 Uniden Corp 音声信号品質改善装置
JP2003018129A (ja) * 2001-07-04 2003-01-17 Toshiba Corp 音声通信装置とその符号化モジュール
JP4025093B2 (ja) * 2002-02-25 2007-12-19 富士通株式会社 音響回路
JP2003295899A (ja) * 2002-03-28 2003-10-15 Fujitsu Ltd 音声入力装置
JP2004198832A (ja) * 2002-12-19 2004-07-15 Nissan Motor Co Ltd 音声認識装置

Also Published As

Publication number Publication date
EP1630792A1 (en) 2006-03-01
EP1630792B1 (en) 2009-01-28
US7693293B2 (en) 2010-04-06
DE602005012563D1 (de) 2009-03-19
US20060050895A1 (en) 2006-03-09
JP2006065067A (ja) 2006-03-09
CN100452172C (zh) 2009-01-14
CN1741133A (zh) 2006-03-01

Similar Documents

Publication Publication Date Title
US8972251B2 (en) Generating a masking signal on an electronic device
US20060293885A1 (en) System and method for adaptive transmission of comfort noise parameters during discontinuous speech transmission
TWI466102B (zh) 用以使經編碼音訊資料之錯誤消隱的方法和裝置
US7693293B2 (en) Sound processing device and input sound processing method
US9294834B2 (en) Method and apparatus for reducing noise in voices of mobile terminal
JP4624992B2 (ja) 音声チャネルを介してデータを伝送するための方法及び装置
JP2008058667A (ja) 信号処理装置および方法、記録媒体、並びにプログラム
JP2011511962A (ja) コンテキスト・デスクリプタ伝送のためのシステム、方法、および装置
JPWO2006025313A1 (ja) 音声符号化装置、音声復号化装置、通信装置及び音声符号化方法
CN108574905B (zh) 发声装置、音讯传输系统及其音讯分析的方法
US10997984B2 (en) Sounding device, audio transmission system, and audio analysis method thereof
JP5255358B2 (ja) 音声伝送システム
JP2002300259A (ja) 音声通話装置の評価試験方法及びシステム
JPH1013239A (ja) 復号処理装置およびその復号処理方法
JP5326714B2 (ja) 帯域拡張装置、方法及びプログラム、並びに、量子化雑音学習装置、方法及びプログラム
JP5135001B2 (ja) 無線通信装置、無線通信方法および無線通信システム
US10056093B2 (en) Encoding device, decoding device, and communication system for extending voice band
JP4973376B2 (ja) 音声の基本周期を検出する装置およびその基本周期を用いて話速変換を行う装置
JP2003223194A (ja) 移動無線端末装置および誤り補償回路
JP6256342B2 (ja) Dtmf信号消去装置、dtmf信号消去方法、およびdtmf信号消去プログラム
JP3097451B2 (ja) コードブック検索装置
JP2018049124A (ja) 無線通信装置、無線通信システム、及びノイズ軽減方法
Tan et al. Robust speech recognition in ubiquitous networking and context-aware computing.
JP2007019846A (ja) 報知音生成装置及び着信報知装置
JP2011035594A (ja) データ受信装置、送受信装置、方法、及び、プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070710

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100810

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100927

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110405

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110512

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20110919

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111101

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111114

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141209

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees