JPWO2013136742A1 - 車載通話装置 - Google Patents

車載通話装置 Download PDF

Info

Publication number
JPWO2013136742A1
JPWO2013136742A1 JP2014504680A JP2014504680A JPWO2013136742A1 JP WO2013136742 A1 JPWO2013136742 A1 JP WO2013136742A1 JP 2014504680 A JP2014504680 A JP 2014504680A JP 2014504680 A JP2014504680 A JP 2014504680A JP WO2013136742 A1 JPWO2013136742 A1 JP WO2013136742A1
Authority
JP
Japan
Prior art keywords
band
energy ratio
band energy
noise
bit rate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
JP2014504680A
Other languages
English (en)
Inventor
南生也 持木
南生也 持木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Intellectual Property Management Co Ltd
Original Assignee
Panasonic Intellectual Property Management Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Intellectual Property Management Co Ltd filed Critical Panasonic Intellectual Property Management Co Ltd
Priority to JP2014504680A priority Critical patent/JPWO2013136742A1/ja
Publication of JPWO2013136742A1 publication Critical patent/JPWO2013136742A1/ja
Ceased legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/93Discriminating between voiced and unvoiced parts of speech signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/60Substation equipment, e.g. for use by subscribers including speech amplifiers
    • H04M1/6033Substation equipment, e.g. for use by subscribers including speech amplifiers for providing handsfree use or a loudspeaker mode in telephone sets
    • H04M1/6041Portable telephones adapted for handsfree use
    • H04M1/6075Portable telephones adapted for handsfree use adapted for handsfree use in a vehicle
    • H04M1/6083Portable telephones adapted for handsfree use adapted for handsfree use in a vehicle by interfacing with the vehicle audio system
    • H04M1/6091Portable telephones adapted for handsfree use adapted for handsfree use in a vehicle by interfacing with the vehicle audio system including a wireless interface
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Telephone Function (AREA)

Abstract

車載のような騒音環境下においても、音声分類判定が有声音を無声音と誤分類することを軽減することができる車載通話装置を提供する。車載通話装置100は、マイクロホン101に収音された音声信号に重畳された走行騒音を除去するためのノイズ除去フィルタ102やノイズ抑圧器103と、これらにより低下した帯域エネルギー比を補正する帯域エネルギー比補正器104と、通話回線を通して通話相手へ送るために、この帯域エネルギー比補正器104で補正された通話音声を圧縮するための可変ビットレート符号化器105を備える。これによって、この可変ビットレート符号化器105の音声分類器106が有声音を無声音と誤判定し、有声音が誤った無声音用低ビットレート符号化で圧縮されることが低減されるため、低平均ビットレートな通信においても、車載環境下の通話音声を高品質に通話相手へ提供できる。

Description

本発明は騒音環境下においても、少量の音声通信データで高品質な通話を提供できる通話装置に関するものである。
従来の通話装置として、予め音声圧縮方式毎に調整したデジタルイコライザーの周波数特性、ノイズ抑圧回路によるノイズ抑圧量、ボリューム調整部による音声調整データをメモリに格納し、音声圧縮方式毎に調整パラメータを切り替えることで音声圧縮方式の違いによる音声伝達能力の劣化を防ぐことができる通話装置が知られている(例えば特許文献1)。
また、従来の低平均ビットレート音声圧縮技術として、有声音は低帯域にエネルギーが集中し、一方でノイズの無声音は高帯域にエネルギーが集中するなどの音声特徴量から有声音や無声音などの音声分類を行い、音声分類結果に応じて音声圧縮レートを下げることができる低平均ビットレート音声圧縮技術が知られている(例えば特許文献2、非特許文献1参照)。
日本国特許第3762621号公報 日本国特許第4550360号公報
3GPP2、「Enhanced Variable Rate Codec、Speech Service Option 3 and 68 for Wideband Spread Spectrum Digital Systems」、3GPP2.C.S0014−B Version1.0、2006年5月
しかしながら、従来の通話装置で低平均ビットレート音声圧縮を用いると、車載のような低帯域にエネルギーが集中する騒音環境下において、ノイズ抑圧回路は騒音の低帯域だけでなく有声音の低帯域も同時に除去してしまうことにより帯域エネルギー比が低下するため、音声分類の判定に際して有声音が無声音と誤分類されて音質が劣化する問題があった。
本発明は、従来の問題を解決するためになされたもので、車載のような騒音環境下においても、音声分類の判定に際して有声音が無声音と誤分類されることを軽減することができる車載通話装置を提供する。
上記目的を達成するために本発明は、通話者の音声を収音する収音手段と、収音手段に入力される通話者の音声に重畳される走行騒音を除去するノイズ除去手段と、ノイズ除去手段が出力する音声信号の帯域エネルギー比を補正する帯域エネルギー比補正手段と、帯域エネルギー比補正手段で補正された通話音声を圧縮する可変ビットレート符号化手段とを備えたことを特徴とする。
本発明によれば、低帯域より高帯域のエネルギーが小さくなるように帯域比を補正することにより、低平均ビットレート音声圧縮のための音声分類が有声音を無声音として誤分類することを軽減することが可能であるため、低平均ビットレートの音声通信において、騒音環境下の通話性能を向上させる効果を奏する。
本発明の第1の実施の形態における車載通話装置の構成を示すブロック図 本発明の第1の実施の形態におけるノイズ除去フィルタの振幅特性図 本発明の第1の実施の形態におけるノイズ抑圧器の構成の一例を示すブロック図 本発明の第1の実施の形態における帯域エネルギー比補正器の構成の一例を示すブロック図 本発明の第2の実施の形態における車載通話装置の構成を示すブロック図 本発明の第3の実施の形態における帯域エネルギー比補正器の構成の一例を示すブロック図
(実施の形態1)
以下、本発明の実施の形態1における車載通話装置について図面を参照しながら説明する。図1は本発明の実施の形態1における車載通話装置のブロック図である。
図1において、車載通話装置100は、図示していない電話回線網から平均ビットレート制御信号を入力し、通話相手へ送る出力符号化音声信号を電話回線網へと出力するように構成されている。
車載通話装置100は、通話者の音声を収音するためのマイクロホン101と、低帯域に集中したエネルギーを有する走行騒音を除去するためのノイズ除去フィルタ102と、走行騒音が重畳された音声信号から非音声区間に基づいて推定した走行騒音を減算することで定常走行騒音を抑圧するためのノイズ抑圧器103と、ノイズ除去フィルタ102とノイズ抑圧器103によって失われた有声音の帯域比を補正するための帯域エネルギー比補正器104と、通話音声を少ないデータ量で通話相手へ送るための可変ビットレート符号化器105とで構成されている。ノイズ除去フィルタ102とノイズ抑圧器103は、双方の機能を有して、マイクロホン101に入力される通話者の音声に重畳される走行騒音を除去する一つのノイズ除去手段として構成されても良い。
可変ビットレート符号化器105は、有声音や無声音などの分類をするための音声分類器106と、音声分類器106によって分類された音声分類結果に応じて適切な符号化器を決定するビットレート制御器107と、ビットレート制御器107が符号化ビットレートを任意に制御するためのフルレート符号化器108と、1/2レート符号化器109と、有声音用1/4レート符号化器110と、無声音用1/4レート符号化器111と、1/8レート符号化器112とで構成されている。
マイクロホン101とノイズ除去フィルタ102との間、もしくはノイズ除去フィルタ102とノイズ抑圧器103との間に、アナログ信号をディジタル信号に変換するためのA/D変換器が設けられてもよい。
また、帯域エネルギー比補正器104と可変ビットレート符号化器105との間にBlueTooth(登録商標)に代表される近距離無線モジュールを設けて、帯域エネルギー比補正器104と可変ビットレート符号化器105の間の信号を無線で通信してもよい
以上のように構成された車載通話装置100について、以下にその処理動作を説明する。
まず、通話者の音声は、マイクロホン101に入力され、電話回線網を通じて通話相手に送られる。
車載環境においては、マイクロホン101には、通話者の音声だけでなく走行騒音も入力される。この走行騒音も電話回線を通じて通話相手に送られると、通話相手は通話者の音声を聞き取りづらくなってしまう。
そこで、この走行騒音を除去するために、ノイズ除去フィルタ102とノイズ抑圧器103が用いられる。ノイズ除去フィルタ102には、マイクロホン101によって収音された音声信号と走行騒音が入力される。
ノイズ除去フィルタ102は、低帯域に集中する走行騒音を常に一定量減衰させ、SN(Signal to Noise)比を改善した信号を出力とするように動作する。
ノイズ除去フィルタ102は、例えばIIR(Infinite Impulse Response)フィルタで構成することができる。
図2は、カットオフ周波数200Hzの高帯域通過フィルタを2次のIIRで設計した場合のノイズ除去フィルタ102の振幅特性図である。音声信号が存在せず、走行騒音のみが存在する50Hzのフィルタの出力振幅特性は24dB減衰することができているため、SN比を改善することができる。
一方、ノイズ除去フィルタ102は、阻止域と通過域を急峻に分ける振幅特性を構成することができないため、走行騒音だけでなく、音声信号が存在する100Hz以上から300Hz付近までの音声信号も減衰してしまう特性を持つ。
ノイズ除去フィルタ102によってSN比が改善した信号は、ノイズ抑圧器103に入力される。ノイズ抑圧器103では、入力信号から定常的な走行騒音成分を除去することで、さらにSN比を改善した信号を出力とするように動作をする。
ノイズ抑圧器103によってSN比がさらに改善した信号は、ノイズ除去フィルタ102やノイズ抑圧器103の処理で低帯域に集中するエネルギーを有する走行騒音を除去するのと同時に音声信号も除去された信号である。このため、ノイズ抑圧器103から出力される信号は有声音であるにも関わらず、低帯域よりも高帯域の方がエネルギーが大きくなってしまう。
このとき、低帯域よりも高帯域の方がエネルギーが大きいという無声音の特性を有声音が有することになる。そのため、低帯域よりも高帯域の方がエネルギーが大きい有声音が可変ビットレート符号化器105に入力されると、有声音は無声音用1/4レート符号化器111で圧縮され、通話品質が大きく劣化する。
有声音が無声音用1/4レート符号化器111で圧縮されることを防止するために、帯域エネルギー比補正器104が設けられている。帯域エネルギー比補正器104には、ノイズ抑圧器103の出力信号が入力される。
帯域エネルギー比補正器104に入力されたノイズ抑圧器103の出力信号は、低帯域よりも高帯域の方が小さくなるように補正されて出力される。
また、帯域エネルギー比補正器104には、ノイズ抑圧器103から出力されたSN比や可変ビットレート符号化器105から出力された符号化情報が入力される。
ノイズ抑圧器103から出力されたSN比や可変ビットレート符号化器105から出力された符号化情報は、帯域エネルギー比補正器104が帯域エネルギー比の補正を更新するために用いられる。
帯域エネルギー比補正器104から出力された信号は、可変ビットレート符号化器105に入力される。
可変ビットレート符号化器105は、フルレート符号化器108と、1/2レート符号化器109と、有声音用1/4レート符号化器110と、無声音用1/4レート符号化器111と、1/8レート符号化器112のいずれか一つを用いて帯域エネルギー比補正器104から出力された信号を圧縮する。
可変ビットレート符号化器105によって圧縮されて外部に出力される出力符号化音声は、電話回線網を通じて通話相手に送られる。
また、帯域エネルギー比補正器104から出力された信号は、音声分類器106に入力される。
音声分類器106は、帯域エネルギー比補正器104の出力信号に基づいて、有声音、無声音、無音などのいずれかの音声状態に分類し、音声分類結果をビットレート制御器107に出力する。具体的には、音声分類器106は、入力信号の周期性、ゼロ交差レート、低帯域と高帯域の帯域エネルギー比などの音声特徴量に基づいて音声状態の分類を決定する。
音声分類器106から出力された音声状態の分類結果は、ビットレート制御器107に入力される。また、電話回線網の混み具合に応じて電話回線網に送出されるデータ量を制御するために、電話回線網から平均ビットレート制御信号がビットレート制御器107に入力される。
ビットレート制御器107は、音声分類器106から入力された音声分類結果と電話回線網から送信された平均ビットレート制御信号とから、フルレート符号化器108と、1/2レート符号化器109と、有声音用1/4レート符号化器110と、無声音用1/4レート符号化器111と、1/8レート符号化器112のいずれか一つの符号化器を選択する。
また、ビットレート制御器107は、平均ビットレート制御信号に基づいて、無声音用1/4レート符号化器111を使用するかどうかを判定し、無声音用1/4レート符号化器111の使用有無を表す符号化情報を出力する。
次に、ノイズ抑圧器103の動作を説明する。図3は、ノイズ抑圧器103の一例を示すブロック図である。
図3において、300はノイズ抑圧器、301は入力信号のゲインを変える乗算器、302は入力信号に含まれる走行騒音のレベルを推定する走行騒音レベル推定器、303は
乗算器301の係数やSN比を更新するための係数更新器である。
次に、このように構成されたノイズ抑圧器300の動作を説明する。ノイズ抑圧器300に入力された入力信号は、乗算器301によってそれぞれゲインが変えられ、出力信号として出力される。
また、ノイズ抑圧器300に入力された入力信号は走行騒音レベル推定器302にも入力される。走行騒音レベル推定器302は、この入力信号に基づいて走行騒音レベルを推定する。具体的には、走行騒音レベル推定器302は、音声に走行騒音が重畳された入力信号に対して例えば最小値検出のような処理を行って走行騒音レベルを推定する。
このような処理を行うことにより、音声が存在しない時間区間での定常的な走行騒音レベルを検出することができる。
走行騒音レベル推定器302は、入力信号の音声区間以外の区間における走行騒音レベルの平均をとることで走行騒音レベルを推定しても良い。この場合にも、定常的な走行騒音レベルを検出することができる。
走行騒音レベル推定器302によって推定された走行騒音レベルは、係数更新器303の一方の入力となる。
係数更新器303のもう一方の入力は、ノイズ抑圧器300の入力信号である。係数更新器303は、乗算器301に設定する係数とSN比を更新する。
係数は、例えば以下のようにすれば算出することができる。入力信号の振幅値をX、走行騒音レベル推定器302で推定された走行騒音の振幅値をN、出力信号の振幅値Yのとき、Y=X−Nに設定される。このとき、入力信号の振幅値から走行騒音の振幅値を減算したものが出力信号の振幅値となるようにすることができる。
上式の両辺をXで割ると、Y/X=(X−N)/Xとなり、Y=H・Xのように表すことができる。ただし、Hは、H=(X−N)/Xである。
このHを乗算器301の係数として入力信号に乗算すれば、出力信号として走行騒音が減算された音声信号が得られる。ただし、これらの式は、振幅値として表したものであるので、音声出力信号の位相成分は、入力信号の位相成分と同じものを用いるものとする。
また、SN比は、例えば以下のようにすれば算出することができる。Y/Nに、Y=H・XとN=X−Yを代入する。このとき、Y/N=H・X/(X−Y)=H・X/(X−H・X)=H/(1−H)である。このH/(1−H)から算出されたSN比は、係数更新器303から出力される。
なお、以上の説明は、信号全体で1つの乗算を行うこととして説明したが、入力信号を複数の周波数バンドに分割し、各周波数バンドごとに走行騒音レベルを推定し、乗算処理を行うようにしても良い。
この場合には、より詳細な制御が可能になり、音声から走行騒音を抑圧する効果が向上するという効果を有する。
ここで、SN比が負の値の動作を説明する。SN比が負の値の場合、走行騒音に音声信号が埋もれてしまうために、走行騒音レベル推定器302は、音声信号を検出することが困難になってくる。
最悪ケースとして、走行騒音レベル推定器302が、音声信号を全く検出することが出来ない場合を想定すると、走行騒音レベル推定器302は、音声信号と走行騒音が混在する信号を走行騒音とみなしてしまう。
式で表すと、走行騒音の振幅値Nが、入力信号の振幅値Xと同じになることを意味している。X=Nという条件をH=(X−N)/Xに代入すると、乗算器301の係数Hは、0となるため、音声信号もノイズと共に除去してしまうことがわかる。
次に、帯域エネルギー比補正器104の動作を図4を用いて説明する。図4は、帯域エネルギー比補正器104の一例を示すブロック図である。
図4において、400は帯域エネルギー比補正器、401は帯域分割器、402は低域用増幅乗算器、403は高域用減衰乗算器、404は帯域合成器、405は帯域エネルギー比分析器、406は帯域エネルギー比補正更新器である。
このように構成された帯域エネルギー比補正器400の動作を説明する。帯域エネルギー比補正器400に入力された入力音声信号は、帯域分割器401で周波数が0Hzから2kHzの低帯域信号と周波数が2kHzから4kHzの高帯域信号に分割される。
なお、帯域分割器401は、入力音声信号が完全に復元される完全再構成可能な低帯域用と高帯域用のフィルタバンクとしてもよい。
また、後段処理の音声分類器106が帯域エネルギー比を分析するために使用する帯域分割器と同様の帯域分割器を使用してもよい。
このような構成とすることで、後段処理の音声分類器106が分析する帯域エネルギー分割と等価な分割を行えるため、帯域エネルギー比の補正精度を向上させる効果がある。
帯域分割器401から出力された低帯域信号と高帯域信号は、それぞれ低域用増幅乗算器402と高域用減衰乗算器403によってそれぞれゲインが補正され、入力信号の帯域比を改善する。
低域用増幅乗算器402と高域用減衰乗算器403によってゲインが補正された低帯域信号と高帯域信号は、帯域合成器404に入力される。帯域合成器404は、低帯域信号と高帯域信号を合成し、出力音声信号として出力する。例えば、帯域合成器404は、帯域分割器401が完全再構成可能なフィルタバンクである場合、単純に帯域合成器404に入力された低帯域信号と高帯域信号を足し合わせることで出力音声信号を合成する。
また、帯域分割器401で分割された低帯域信号と高帯域信号は、帯域エネルギー比分析器405に入力される。帯域エネルギー比分析器405では、帯域分割器401から入力された低帯域信号と高帯域信号に基づいて、帯域エネルギー比を算出して出力する。帯域エネルギー比は、10×log10(EL/EH)の計算式から算出できる。ELは低帯域のエネルギーであり、EHは高帯域のエネルギーである。
なお、帯域エネルギー比補正器104と可変ビットレート符号化器105の間をBluetooth(登録商標)で近距離無線通信を行う場合、Bluetooth(登録商標)の入出力間で振幅特性が減衰することがある。BT通信の入出力間の減衰振幅特性を帯域エネルギー比分析器405に入力される低帯域信号と高帯域信号に付加すれば、音声分類器106が帯域エネルギー比を算出するために使用する入力信号と等価になるため、帯
域エネルギー比の補正精度を向上させる効果がある。
帯域エネルギー比分析器405から出力された帯域エネルギー比は、帯域エネルギー比補正更新器406に入力される。
帯域エネルギー比補正更新器406は、帯域エネルギー比分析器405から入力された帯域エネルギー比が任意の閾値以上になるように、低域用増幅乗算器402の増幅の係数もしくは高域用減衰乗算器403の減衰の係数を更新する。具体的には、例えば、帯域エネルギー比が任意の閾値よりも3dB低い場合、帯域エネルギー比補正更新器406は、低域用増幅乗算器402への入力信号を3dB増幅するか、高域用減衰乗算器403への入力信号を3dB減衰するように係数を更新する。
帯域エネルギー比補正更新器406は、帯域エネルギー比補正器400に入力されたSN比が任意の閾値以上である場合、低域用増幅乗算器402と高域用減衰乗算器403の各係数を1に更新する。
帯域エネルギー比が補正されると、SN比が低い場合に有声音が無声音と誤判定することは軽減されるが、低帯域の走行騒音が増幅されたり高帯域の音声信号が抑圧されたりするために、SN比は劣化する。
SN比が高い場合には、音声分類器106は、有声音と無声音を判別する周期性の測度を精度良く算出することが可能である。この場合、有声音を無声音と誤判定することは少ないため、帯域エネルギー比補正を行わない方がSN比を維持でき、ひいては音質を良くすることができる。
以上より、SN比が任意の閾値以上である場合、帯域エネルギー比補正更新器406は、低域用増幅乗算器402と高域用減衰乗算器403の各係数を1とし、帯域エネルギー比の補正を行わない。
さらに、帯域エネルギー比補正更新器406は、入力される符号化情報から、無声音用1/4レート符号化器111の動作有無を判定し、低域用増幅乗算器402と高域用減衰乗算器403の各係数を1に更新する。
可変ビットレート符号化器105で無声音用1/4レート符号化器111が動作していなければ、帯域エネルギー比補正を行わない方が音質を良くすることができるため、帯域エネルギー比の補正を行わない。
なお、符号化情報は、無声音用1/4レート符号化器111の使用有無情報だけでなく、通信事業者やCDMA2000やUMTSなどの携帯電話無線方式など無声音用1/4レート符号化器111の使用有無を間接的に推測できる符号化情報でもよい。
以上のように本実施の形態によれば、可変ビットレート符号化器105が音声分類において有声音を無声音と誤判定し、有声音を誤った無声音用低ビットレート符号化で圧縮することが軽減されるため、低平均ビットレートな通信においても、車載環境下の通話音声を高品質に通話相手へ提供できる。
なお、本実施の形態において、ノイズ抑圧器300から出力されるSN比や可変ビットレート符号化器105が出力する符号化情報に応じて、帯域エネルギー比補正器400が帯域エネルギー比の補正を行うかどうか切り替える構成としたため、帯域エネルギー比補正器400は、帯域エネルギー比の補正が不要な時にはSN比を劣化させる帯域エネルギ
ー比の補正を行わないことができる。このため、マイクロホン101に入力される信号が高SN比の時や可変ビットレート符号化器105に高ビットレート符号化器を用いる時には、SN比を劣化させない効果が得られる。
(実施の形態2)
次に、本発明の第2の実施の形態の車載通話装置を図5を用いて説明する。図5において、車載通話装置500は、第1の実施の形態と同様に、図示していない電話回線網から平均ビットレート制御信号を入力し、通話相手へ送る出力符号化音声信号を電話回線網へと出力するように構成されている。
車載通話装置500は、通話者の音声を収音するためのマイクロホン501と、低帯域に集中したエネルギーを有する走行騒音を除去するためのノイズ除去フィルタ502と、走行騒音が重畳された音声信号から非音声区間より推定した走行騒音を減算することで定常走行騒音を抑圧するためのノイズ抑圧器503と、ノイズ除去フィルタ502とノイズ抑圧器503によって低下した有声音の帯域比を分析するための帯域分割器504と帯域エネルギー比分析器505、通話音声を少ないデータ量で通話相手へ送るための可変ビットレート符号化器506とで構成されている。
可変ビットレート符号化器506は、有声音や無声音などの分類をするための音声分類器507と、音声分類器507によって分類された音声分類結果に応じて適切な符号化器を決定するビットレート制御器508と、ビットレート制御器508が符号化ビットレートを任意に制御するためのフルレート符号化器509と、1/2レート符号化器510と、有声音用1/4レート符号化器511と、無声音用1/4レート符号化器512と、1/8レート符号化器513とで構成されている。
以上のように構成された車載通話装置について、図5を用いて説明する。
図5において、マイクロホン501、ノイズ除去フィルタ502、ノイズ抑圧器503、帯域分割器504、帯域エネルギー比分析器505、ビットレート制御器508、フルレート符号化器509、1/2レート符号化器510、有声音用1/4レート符号化器511、無声音用1/4レート符号化器512、1/8レート符号化器513の動作は、第1の実施の形態と同様である。
第1の実施の形態で、帯域エネルギー比補正器104は、ノイズ抑圧器103の出力音声信号の帯域エネルギー比を補正し、音声分類器106が有声音を無声音として誤判定することを軽減するように動作していた。
第2の実施の形態では、帯域エネルギー比の補正は行わずノイズ抑圧器503の出力は可変ビットレート符号化器506に入力され、音声分類器507は、帯域エネルギー比分析器505から出力される帯域エネルギー比を有声音と無声音を判別するための帯域エネルギー比の閾値として用いることで、音声分類器507が有声音を無声音として誤判定することを軽減するように動作する。
このような本発明の第2の実施の形態の車載通話装置によっても、可変ビットレート符号化器506が音声分類において有声音を無声音と誤判定し、有声音を誤った無声音用低ビットレート符号化で圧縮することが軽減されるため、低平均ビットレートな通信においても、車載環境下の通話音声を高品質に通話相手へ提供できる。
(実施の形態3)
次に、本発明の第3の実施の形態の車載通話装置を図6を用いて説明する。第3の実施の形態の車載通話装置は、第1の実施の形態の図1と同等の構成である。
第1の実施の形態とは帯域エネルギー比補正器600の動作のみ異なる。帯域エネルギー比補正器600の動作を図6を用いて説明する。図6は、帯域エネルギー比補正器600の一例を示すブロック図である。
図6において、600は帯域エネルギー比補正器、601は帯域分割器、602はピッチ周波数用増幅乗算器、603は高域用減衰乗算器、604は帯域合成器、605は帯域エネルギー比分析器、606は帯域エネルギー比補正更新器、607ピッチ抽出器である。
このように構成された帯域エネルギー比補正器600の動作を説明する。
帯域エネルギー比補正器600は、帯域エネルギー比補正器104に比べて、0Hzから2kHzの低帯域をさらに任意の複数の帯域に分割するために構成の拡張をしたものである。
帯域エネルギー比補正器600に入力された入力音声信号は、帯域分割器601で周波数が0Hzから2kHzを任意に分割された複数の低帯域信号と周波数が2kHzから4kHzの高帯域信号に分割される。
なお、帯域分割器601は、入力音声信号が完全に復元される完全再構成可能な任意の複数の低帯域用と高帯域用のフィルタバンクとしてもよい。
帯域分割器601から出力された複数の低帯域信号と高帯域信号は、それぞれピッチ周波数用増幅乗算器602と高域用減衰乗算器603によってそれぞれゲインが補正される。このため、入力信号の帯域比が改善される。
ピッチ周波数用増幅乗算器602は、低帯域用の帯域分割器の数と同等の乗算器から構成されている。
ピッチ周波数用増幅乗算器602と高域用減衰乗算器603によってゲインが補正された複数の低帯域信号と高帯域信号は、帯域合成器604に入力される。帯域合成器604は、複数の低帯域信号と高帯域信号を合成し、出力音声信号として出力する。例えば、帯域合成器604は、帯域分割器601が完全再構成可能なフィルタバンクである場合、単純に帯域合成器604に入力された低帯域信号と高帯域信号を足し合わせて出力音声信号を合成する。
また、帯域分割器601で分割された複数の低帯域信号と高帯域信号は、帯域エネルギー比分析器605に入力される。
帯域エネルギー比分析器605は、帯域分割器601から入力された複数の低帯域信号と高帯域信号に基づいて、帯域エネルギー比を算出して出力する。帯域エネルギー比分析器605から出力された帯域エネルギー比は、帯域エネルギー比補正更新器606に入力される。
帯域エネルギー比補正更新器606は、帯域エネルギー比分析器605から入力された帯域エネルギー比が任意の閾値以上になるように、ピッチ周波数用増幅乗算器602もしくは高域用減衰乗算器603の各係数を更新する。
次に、帯域エネルギー比補正更新器606によるピッチ周波数用増幅乗算器602の増幅の係数の更新方法について説明する。
まず、ピッチ抽出器607は、帯域エネルギー比補正器600に入力される入力音声信号から、ピッチ周波数を出力する。
ピッチ抽出器607から出力されたピッチ周波数は、帯域エネルギー比補正更新器606に入力される。
帯域エネルギー比補正更新器606がピッチ周波数用増幅乗算器602の増幅の係数を更新する場合、ピッチ抽出器607から出力されたピッチ周波数から任意の整数倍までの周波数に対応する帯域について係数を増幅させ、その他の該当しない帯域については係数を増幅しない。
以上のように本発明の第3の実施の形態によれば、可変ビットレート符号化器105の音声分類が有声音を無声音と誤判定し、有声音が誤った無声音用低ビットレート符号化で圧縮されることが低減されるため、低平均ビットレートな通信においても、車載環境下の通話音声を高品質に通話相手へ提供できる。
なお、第1の実施の形態の構成に本第3の実施の形態のピッチ抽出器607を追加することで、帯域エネルギー比補正器104は低帯域のピッチ周波数とそのピッチ周波数の任意の整数倍までの周波数のみについて帯域エネルギー比を補正できるため、走行騒音を強調することなく、低帯域の音声信号のみを増幅するとともに、必要性の低い帯域について帯域エネルギー比の補正によるSN比の劣化を軽減することができる。
本発明の車載通話装置は、マイクロホンに入力される信号のSN比が低い車載環境下等において、少量の音声通信データで高品質な通話を提供できるという効果を有し、車載通話装置として利用できる。
100、500 車載通話装置
101、501 マイクロホン
102、502 ノイズ除去フィルタ
103、503 ノイズ抑圧器
104 帯域エネルギー比補正器
105、506 可変ビットレート符号化器
106、507 音声分類器
107、508 ビットレート制御器
108、509 フルレート符号化器
109、510 1/2レート符号化器
110、511 有声音用1/4レート符号化器
111、512 無声音用1/4レート符号化器
112、513 1/8レート符号化器
300 ノイズ抑圧器
301 乗算器
302 走行騒音レベル推定器
303 係数更新器
400、600 帯域エネルギー比補正器
401、504、601 帯域分割器
402 低域用増幅乗算器
403、603 高域用減衰乗算器
404、604 帯域合成器
405、505、605 帯域エネルギー比分析器
406、606 帯域エネルギー比補正更新器
602 ピッチ周波数用増幅乗算器
607 ピッチ抽出器

Claims (5)

  1. 通話者の音声を収音する収音手段と、前記収音手段に入力される通話者の音声に重畳される走行騒音を除去するノイズ除去手段と、前記ノイズ除去手段が出力する音声信号の帯域エネルギー比を補正する帯域エネルギー比補正手段と、前記帯域エネルギー比補正手段で補正された通話音声を圧縮する可変ビットレート符号化手段とを備えたことを特徴とする車載通話装置。
  2. 前記帯域エネルギー比補正手段は、前記音声信号の帯域を分割する帯域分割器と、前記音声信号の帯域比を補正する乗算器と、前記音声信号の帯域エネルギー比を分割する帯域エネルギー比分析器と、前記帯域エネルギー比補正手段の係数を更新するための帯域エネルギー比補正更新器と、前記音声信号の帯域毎に補正された分割帯域信号を合成するための帯域合成器とを備えたことを特徴とする請求項1記載の車載通話装置。
  3. 前記帯域エネルギー比補正手段は、音声信号のピッチ周波数を抽出するためのピッチ抽出器をさらに備えたことを特徴とする請求項1記載の車載通話装置。
  4. 前記帯域エネルギー比補正更新器は、前記ノイズ除去手段が出力するSN比や前記可変ビットレート符号化手段から出力される符号化情報を取得する符号化情報取得手段を備えることにより、前記収音手段に入力される信号が高SN比の時または前記可変ビットレート符号化手段が高ビットレート符号化器を用いる時には、帯域エネルギー比を補正しないことを特徴とする請求項2もしくは請求項3記載の車載通話装置。
  5. 通話者の音声を収音する収音手段と、前記収音手段に入力される通話者の音声に重畳される走行騒音を除去するノイズ除去手段と、前記ノイズ除去手段が出力する音声信号の帯域エネルギー比を分析する帯域エネルギー比分析手段と、前記帯域エネルギー比分析手段が分析した帯域エネルギー比を、有声音か無声音か分類するための帯域エネルギー比の閾値として用いる可変ビットレート符号化手段とを備えたことを特徴とする車載通話装置。
JP2014504680A 2012-03-14 2013-03-08 車載通話装置 Ceased JPWO2013136742A1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014504680A JPWO2013136742A1 (ja) 2012-03-14 2013-03-08 車載通話装置

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2012057018 2012-03-14
JP2012057018 2012-03-14
JP2014504680A JPWO2013136742A1 (ja) 2012-03-14 2013-03-08 車載通話装置

Publications (1)

Publication Number Publication Date
JPWO2013136742A1 true JPWO2013136742A1 (ja) 2015-08-03

Family

ID=49160674

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014504680A Ceased JPWO2013136742A1 (ja) 2012-03-14 2013-03-08 車載通話装置

Country Status (3)

Country Link
US (1) US20150039300A1 (ja)
JP (1) JPWO2013136742A1 (ja)
WO (1) WO2013136742A1 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10237711B2 (en) 2014-05-30 2019-03-19 Apple Inc. Dynamic types for activity continuation between electronic devices
US10193987B2 (en) 2014-05-30 2019-01-29 Apple Inc. Activity continuation between electronic devices
US10187770B2 (en) 2014-05-30 2019-01-22 Apple Inc. Forwarding activity-related information from source electronic devices to companion electronic devices
JP2016045860A (ja) * 2014-08-26 2016-04-04 株式会社デンソー 車両用データ変換装置及び車両用データ出力方法
KR102372188B1 (ko) * 2015-05-28 2022-03-08 삼성전자주식회사 오디오 신호의 잡음을 제거하기 위한 방법 및 그 전자 장치
CN110807333B (zh) * 2019-10-30 2024-02-06 腾讯科技(深圳)有限公司 一种语义理解模型的语义处理方法、装置及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004515809A (ja) * 2000-12-08 2004-05-27 クゥアルコム・インコーポレイテッド ロバストな音声分類のための方法および装置
JP2007164169A (ja) * 2005-12-09 2007-06-28 Qnx Software Systems (Wavemakers) Inc 高周波数圧縮を通じてスピーチ了解度を改良するためのシステム
US20110286605A1 (en) * 2009-04-02 2011-11-24 Mitsubishi Electric Corporation Noise suppressor

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04230799A (ja) * 1990-05-28 1992-08-19 Matsushita Electric Ind Co Ltd 音声信号符号化装置
JP4216364B2 (ja) * 1997-08-29 2009-01-28 株式会社東芝 音声符号化/復号化方法および音声信号の成分分離方法
JP2001318694A (ja) * 2000-05-10 2001-11-16 Toshiba Corp 信号処理装置、信号処理方法および記録媒体
JP4583781B2 (ja) * 2003-06-12 2010-11-17 アルパイン株式会社 音声補正装置
FR2883656B1 (fr) * 2005-03-25 2008-09-19 Imra Europ Sas Soc Par Actions Traitement continu de la parole utilisant une fonction de transfert heterogene et adaptee
US8259840B2 (en) * 2005-10-24 2012-09-04 General Motors Llc Data communication via a voice channel of a wireless communication network using discontinuities
JP5071480B2 (ja) * 2007-08-24 2012-11-14 富士通株式会社 エコー抑制装置、エコー抑制システム、エコー抑制方法及びコンピュータプログラム
JP5292345B2 (ja) * 2010-03-25 2013-09-18 クラリオン株式会社 音質自動調整機能を備える音響再生装置、およびそれを組み込んだハンズフリー電話装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004515809A (ja) * 2000-12-08 2004-05-27 クゥアルコム・インコーポレイテッド ロバストな音声分類のための方法および装置
JP2007164169A (ja) * 2005-12-09 2007-06-28 Qnx Software Systems (Wavemakers) Inc 高周波数圧縮を通じてスピーチ了解度を改良するためのシステム
US20110286605A1 (en) * 2009-04-02 2011-11-24 Mitsubishi Electric Corporation Noise suppressor

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
古田訓 他: "スペクトル減算と振幅抑圧の相互制御に基づく雑音抑圧法の検討", 電子情報通信学会論文誌D-II, vol. Vol.J87-D-II,No.2, JPN6017013158, 1 February 2004 (2004-02-01), pages 464 - 474 *

Also Published As

Publication number Publication date
WO2013136742A1 (ja) 2013-09-19
US20150039300A1 (en) 2015-02-05

Similar Documents

Publication Publication Date Title
WO2013136742A1 (ja) 車載通話装置
US9467779B2 (en) Microphone partial occlusion detector
JP4913155B2 (ja) 音響エコーキャンセラ
US9100756B2 (en) Microphone occlusion detector
JP4836720B2 (ja) ノイズサプレス装置
JP4660578B2 (ja) 信号補正装置
US8218777B2 (en) Multipoint communication apparatus
US9343073B1 (en) Robust noise suppression system in adverse echo conditions
AU2009242464A1 (en) System and method for dynamic sound delivery
US20110293109A1 (en) Hands-Free Unit with Noise Tolerant Audio Sensor
KR20120094892A (ko) 손상된 오디오 신호의 복구
US20080249772A1 (en) Apparatus and method for enhancing speech intelligibility in a mobile terminal
CN1533665A (zh) 含有用于谐波计算的非线性回波抑制器的回波消除器
JP5111875B2 (ja) スピーチ信号のスペクトル帯域幅を拡張する方法およびそのシステム
JP5595605B2 (ja) 音声信号復元装置および音声信号復元方法
WO2014129233A1 (ja) 音声強調装置
JP2004086102A (ja) 音声処理装置及び移動通信端末装置
US9172791B1 (en) Noise estimation algorithm for non-stationary environments
CN110136734B (zh) 使用非线性增益平滑以降低音乐伪声的方法和音频噪声抑制器
WO2020203258A1 (ja) エコー抑圧装置、エコー抑圧方法及びエコー抑圧プログラム
US9111527B2 (en) Encoding device, decoding device, and methods therefor
JP2016024231A (ja) 集音・放音装置、妨害音抑圧装置及び妨害音抑圧プログラム
KR100890708B1 (ko) 잔류 잡음 제거 장치 및 방법
JP2016024454A (ja) 音声帯域拡張装置および音声帯域拡張方法
JP4479625B2 (ja) 騒音抑圧装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160226

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170417

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170615

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20171121

A045 Written measure of dismissal of application [lapsed due to lack of payment]

Free format text: JAPANESE INTERMEDIATE CODE: A045

Effective date: 20180326