JPWO2011080855A1 - 音声信号復元装置および音声信号復元方法 - Google Patents

音声信号復元装置および音声信号復元方法 Download PDF

Info

Publication number
JPWO2011080855A1
JPWO2011080855A1 JP2011547245A JP2011547245A JPWO2011080855A1 JP WO2011080855 A1 JPWO2011080855 A1 JP WO2011080855A1 JP 2011547245 A JP2011547245 A JP 2011547245A JP 2011547245 A JP2011547245 A JP 2011547245A JP WO2011080855 A1 JPWO2011080855 A1 JP WO2011080855A1
Authority
JP
Japan
Prior art keywords
audio signal
signal
distortion
band
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011547245A
Other languages
English (en)
Other versions
JP5535241B2 (ja
Inventor
訓 古田
訓 古田
田崎 裕久
裕久 田崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2011547245A priority Critical patent/JP5535241B2/ja
Publication of JPWO2011080855A1 publication Critical patent/JPWO2011080855A1/ja
Application granted granted Critical
Publication of JP5535241B2 publication Critical patent/JP5535241B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Telephone Function (AREA)

Abstract

合成フィルタ106が、音声信号符号帳105の中から広帯域の音韻信号と音源信号を組み合わせて複数の広帯域音声信号を合成し、歪評価部107がサンプリング変換部101から出力されるアップサンプリング済狭帯域音声信号との波形歪みが最も小さい広帯域音声信号を選択する。第1の帯域フィルタ103がその広帯域音声信号の狭帯域以外の周波数成分を抽出して、帯域合成部104がアップサンプリング済狭帯域音声信号に組み合わせる。

Description

この発明は、周波数帯域が狭帯域に制限されている音声信号から広帯域の音声信号を復元する、および、劣化または欠損した帯域の音声信号を復元する音声信号復元装置およびその方法に関するものである。
アナログ電話では、電話回線を通じて送られてくる音声信号の周波数帯域が、例えば300〜3400Hzと狭く帯域制限されている。このため、従来の電話回線の音質はあまり良好とは言えない。また、携帯電話などのデジタル音声通信では、ビットレートの厳しい制限によりアナログ回線と同様に帯域幅が制限されるため、この場合にも音質が良いとは言えない。
ところで、近年では、音声圧縮技術(音声符号化技術)の進展に伴い、低ビットレートで広帯域(例えば50〜7000Hz)の音声信号が無線伝送できるようになっている。しかしながら、送信側端末および受信側端末の双方が、対応する広帯域音声符号化・復号化方法をサポートする必要があるのと、双方の基地局においても広帯域符号化のためのネットワークを完備することが必要なことから、一部の業務通信システムにおいて実用化されているのみであり、公衆電話通信網で実施するには経済的に大きな負担となるばかりでなく、普及するまでに多くの時間を要する。
そのため、従来のアナログ電話回線通信およびデジタル音声通信の音質の問題は依然解決されていない。
そこで、上記の問題に対し、受信側で狭帯域信号から擬似的に広帯域信号を生成または復元する方法として、例えば特許文献1,2が開示されている。特許文献1に係る周波数帯域拡張装置では、狭帯域音声信号の自己相関係数を計算して音声の基本周期を抽出し、この基本周期に基づいて広帯域音声信号を得ている。また、特許文献2に係る広帯域音声信号復元装置では、狭帯域音声信号を、合成による分析法に基づく符号化方法により符号化し、その符号化の最終結果として得られた音源信号または音声信号に、ゼロ詰め処理(オーバサンプリング)を行って広帯域音声信号を得ている。
特許第3243174号(第3頁〜5頁、図1) 特許第3230790号(第3頁〜4頁、図1)
従来の音声信号復元装置は以上のように構成されているので、以下に述べる課題があった。
特許文献1に開示された周波数帯域拡張装置では、狭帯域音声信号の基本周期を抽出する必要がある。音声の基本周期を抽出する手法は各種開示されているものの、正確に音声信号の基本周期を抽出することは困難である。雑音環境下では更に困難である。
特許文献2に開示された広帯域音声信号復元装置では、音声信号の基本周期を抽出する必要がない利点はある。しかしながら、生成された広帯域音源信号は、狭帯域信号から分析および生成したものであるものの、ゼロ詰め処理(オーバサンプリング)により擬似的に生成していることから折返し歪み成分が混入しているため、広帯域音声信号(とりわけ高域信号)として最適ではなく、音質劣化するという課題がある。
この発明は、上記のような課題を解決するためになされたもので、高品質に音声信号の復元を行う音声信号復元装置および音声信号復元方法を提供することを目的とする。
この発明に係る音声信号復元装置は、音韻信号および音源信号を組み合わせて、複数の音声信号を生成する合成フィルタと、合成フィルタが生成する音声信号の周波数帯域の少なくとも一部の周波数帯域の周波数成分を持つ比較対象信号と合成フィルタが生成した複数の音声信号それぞれとの波形歪みを所定の歪み尺度を用いて評価して、当該評価結果に基づいて複数の音声信号のうちのいずれかを選択する歪評価部と、歪評価部が選択した音声信号を用いて復元音声信号を生成する復元音声信号生成部とを備えるものである。
この発明に係る音声信号復元方法は、音韻信号および音源信号を組み合わせて、複数の音声信号を生成する合成フィルタステップと、合成フィルタステップで生成する音声信号の周波数帯域の少なくとも一部の周波数帯域の周波数成分を持つ比較対象信号と合成フィルタステップで生成した複数の音声信号それぞれとの波形歪みを所定の歪み尺度を用いて評価して、当該評価結果に基づいて複数の音声信号のうちのいずれかを選択する歪評価ステップと、歪評価ステップで選択した音声信号を用いて復元音声信号を生成する復元音声信号生成ステップとを備えるものである。
この発明によれば、音韻信号および音源信号を組み合わせて複数の音声信号を生成し、比較対象信号との波形歪みを所定の歪み尺度を用いてそれぞれ評価して、当該評価結果に基づいていずれかの音声信号を選択して復元音声信号を生成するようにしたので、例えば帯域制限または雑音抑圧により任意の周波数帯域の周波数成分が欠落した比較対象信号を高品質に復元する音声信号復元装置および音声信号復元方法を提供することができる。
この発明の実施の形態1に係る音声信号復元装置100の構成を示すブロック図である。 この発明の実施の形態1に係る音声信号復元装置100が生成する音声信号を模式的に示すグラフである。 この発明の実施の形態2に係る音声信号復元装置100の構成を示すブロック図である。 この発明の実施の形態3に係る音声信号復元装置200の構成を示すブロック図である。 この発明の実施の形態3に係る音声信号復元装置200が生成する音声信号を模式的に示すグラフである。 この発明の実施の形態5に係る音声信号復元装置200の歪評価部107の歪み評価処理を模式的に示すグラフである。 図1に示す復元音声信号生成部110の変形例を示すブロック図である。 図7に示す復元音声信号生成部110が生成する音声信号を模式的に示すグラフである。
以下、この発明の実施の形態について図面を参照しながら詳細に説明する。
実施の形態1.
本実施の形態1では、音声通信、音声蓄積または音声認識システムが導入された、カーナビゲーション、携帯電話およびインターフォンなどの音声通信システム、ハンズフリー通話システム、TV会議システムならびに監視システムなどの音質改善や、音声認識システムの認識率の向上に供されるものであって、電話回線などの伝送路を経由するために周波数帯域が狭帯域に制限されている音声信号から、広帯域の音声信号を生成するための音声信号復元装置を例に説明する。
図1は本実施の形態1による音声信号復元装置100の全体構成を示したものである。
図1において、音声信号復元装置100はサンプリング変換部101と、音声信号生成部102と、復元音声信号生成部110とから構成されている。この音声信号生成部102は、音韻信号記憶部108および音源信号記憶部109を備える音韻・音源信号記憶部105と、合成フィルタ106と、歪評価部107とから構成されている。また、復元音声信号生成部110は、第1の帯域フィルタ103と、帯域合成部104とから構成されている。
図2は、この実施の形態1の構成で生成される音声信号を模式的に図示したものである。図2(a)はサンプリング変換部101に入力される狭帯域音声信号(比較対象信号)を表す。図2(b)はサンプリング変換部101が出力するアップサンプリング済狭帯域音声信号(サンプリング変換した比較対象信号)を表す。図2(c)は合成フィルタ106が生成した複数の広帯域音声信号(音声信号)のうちから歪評価部107が選択した、歪みが最小となる広帯域音声信号を表す。図2(d)は第1の帯域フィルタ103の出力である、広帯域音声信号から低域成分と高域成分が抽出された信号を表す。図2(e)は音声信号復元装置100の出力結果である、復元音声信号を表す。また、図2中の各矢印は処理の順序を表し、各グラフの縦軸はパワーを示し、横軸は周波数を示す。
以下、図1および図2に基づいてこの音声信号復元装置100の動作原理について説明する。
まず、不図示のマイクロホンなどを通じて取り込まれた音声および音楽などが、A/D(アナログ/デジタル)変換された後、所定のサンプリング周波数(例えば、8kHz)でサンプリングされると共にフレーム単位(例えば、10ms)に分割され、更に帯域制限(例えば、300〜3400Hz)された狭帯域音声信号として、本実施の形態1の音声信号復元装置100へ入力される。なお、本実施の形態1では、最終的に得る広帯域の復元音声信号の周波数帯域を50〜7000Hzとして説明する。
サンプリング変換部101は、入力された狭帯域音声信号を例えば16kHzにアップサンプリングを行い、低域通過フィルタを通して折り返し歪み信号を取り除いた後、アップサンプリング済狭帯域音声信号として出力する。
音声信号生成部102において、合成フィルタ106が、音韻信号記憶部108に格納している音韻信号と音源信号記憶部109に格納している音源信号を用いて複数の広帯域音声信号を生成し、歪評価部107がアップサンプリング済狭帯域音声信号との波形歪みを所定の歪み尺度に基づいて計算し、最も歪みが小さくなるような広帯域音声信号を選択して出力する。なお、この音声信号生成部102は、例えばCELP(Code−Excited Linear Prediction:符号励振線形予測)符号化方式における復号化方法と同様な構成にしてもよく、その場合には、音韻信号記憶部108に音韻符号を、音源信号記憶部109に音源符号を格納しておく。
音韻信号記憶部108は、音韻信号の他、音韻信号のパワーまたはゲインを併せ持った構成を取り、様々な広帯域音声信号の音韻形状(スペクトルパタン)を表現できるように、大量かつ多種多様の音韻信号をメモリなどの記憶手段に格納しており、後述する歪評価部107の指示に応じて音韻信号を合成フィルタ106へ出力する。これら音韻信号は、線形予測分析などの公知の手法を用いて、広帯域の音声信号(例えば、50〜7000Hzの帯域を持つ)から求めることができる。なお、スペクトルパタンについては、スペクトル信号そのもの、または、LSP(Line Spectrum Pair:線スペクトル対)パラメータおよびケプストラムなどの音響パラメータ形式で表現でき、合成フィルタ106のフィルタ係数に適用できるように適宜変換を行っておけばよい。さらに、得られた音韻信号は、メモリ量削減のためにスカラ量子化およびベクトル量子化など公知の手法で圧縮してもよい。
音源信号記憶部109は、音源信号の他、音源信号のパワーまたはゲインを併せ持った構成を取り、音韻信号記憶部108と同様に、様々な広帯域音声信号の音源信号形状(パルス列)を表現できるように、大量かつ多種多様の音源信号をメモリなどの記憶手段に格納しており、後述する歪評価部107の指示に応じて音源信号を合成フィルタ106へ出力する。これら音源信号は、広帯域の音声信号(例えば、50〜7000Hzの帯域を持つ)と前出の音韻信号とを用い、CELPの手法により学習し求めることができる。また、得られた音源信号は、メモリ量削減のためにスカラ量子化およびベクトル量子化など公知の手法で圧縮しても良いし、マルチパルス化およびACELP(Algebraic CELP:代数符号励振線形予測)方式のように所定のモデルにて音源信号を表現してもよい。また、VSELP(Vector Sum Excited Linear Prediction:ベクトル和励振線形予測)符号化方式のように、過去の音源信号から生成された適応音源符号帳を併せ持つ構造をとることも可能である。
なお、合成フィルタ106は、音韻信号のパワーまたはゲインと、音源信号のパワーまたはゲインをそれぞれ調整した上で合成してもよい。この構成の場合には、1つの音韻信号と1つの音源信号からでも複数の広帯域音声信号を生成できるので、音韻信号記憶部108および音源信号記憶部109のメモリ量削減が可能となる。
歪評価部107は、合成フィルタ106が出力する広帯域音声信号と、サンプリング変換部101が出力するアップサンプリング済狭帯域音声信号との波形歪みを評価する。このとき、歪みを評価する周波数帯域(所定の周波数帯域)は、狭帯域音声信号の範囲のみに限定することとし、この例では300〜3400Hzに限定する。狭帯域音声信号の周波数帯域の範囲で波形歪みの評価を行うには、例えば、広帯域音声信号とアップサンプリング済狭帯域音声信号の両者を、300〜3400Hzの帯域通過特性を持つFIR(Finite Impulse Response:有限インパルス応答特性)フィルタを用いてフィルタ処理を行ってから、次式に示すような平均波形歪みを用いたり、ユークリッド距離による評価法を用いたりすることができる。
Figure 2011080855
ここでs(n)およびu(n)は、それぞれFIRフィルタ処理済の広帯域音声信号、アップサンプリング済狭帯域音声信号、Nは音声信号波形のサンプル数(160サンプル、16kHzサンプリングの場合)である。なお、300Hz以下の低域部の復元を行わない場合には、上記のFIRフィルタを用いずに、広帯域音声信号を狭帯域音声信号の周波数(8kHz)にダウンサンプリングして、アップサンプリング前の狭帯域音声信号との歪み評価を行ってもよい。なお、歪評価部107は、上記ではFIRフィルタを用いてフィルタ処理を行っているが、適切に歪み評価を行うことができるのであれば、例えばIIR(Infinite Impulse Response:無限インパルス応答特性)フィルタを用いても良い。
歪評価部107はまた、時間軸上ではなく周波数軸上での歪評価を行ってもよく、例えば、広帯域音声信号とアップサンプリング済狭帯域音声信号の両者を、ゼロ詰め、窓掛けした後、256点のFFT(Fast Fourier Transform:高速フーリエ変換)を用いてスペクトル領域へ変換し、例えば、次式のようにパワースペクトル上での差分の総和を歪みとして評価することも可能である。この場合、時間軸上での評価とは異なり、帯域通過特性を持つフィルタ処理は必要ない。
Figure 2011080855
ここでS(f)およびU(f)は、それぞれ広帯域音声信号のパワースペクトル成分、アップサンプリング済狭帯域音声信号のパワースペクトル成分であり、FLおよびFHは、それぞれ300Hz、3400Hzに相当するスペクトル成分番号である。
歪評価部107は、逐次、音韻信号記憶部108および音源信号記憶部109からスペクトルパタンと音源信号の組を出力させる指示を出して合成フィルタ106に広帯域音声信号を生成させ、上式(1)または上式(2)により歪みを計算する。そして、歪みが最小となる広帯域音声信号を選択して、第1の帯域フィルタ103へ出力する。なお、歪評価部107は、CELP音声符号化方式で通常よく用いられる聴覚重み付け処理を、広帯域音声信号とアップサンプリング済狭帯域音声信号の両者に実施した上で、歪みを計算することも可能である。また、歪評価部107は、必ずしも歪みが最小となる広帯域音声信号を選択する必要はなく、歪みが例えば2番目に小さい広帯域音声信号を選択するようにしてもよい。あるいは、歪みの許容範囲を設定してその範囲内の歪みとなった広帯域音声信号を選択するようにして、これ以降の合成フィルタ106および歪評価部107の処理を行わず、処理回数の削減を図ってもよい。
第1の帯域フィルタ103は、広帯域音声信号から狭帯域音声信号の帯域以外の周波数成分を抽出し、帯域合成部104へ出力する。即ち、本実施の形態1では、300Hz以下の低域成分と、3400Hz以上の高域成分を抽出することとなる。低域成分および高域成分の抽出にはFIRフィルタ、IIRフィルタなどを用いればよい。音声信号の一般的な特性として、低域部の調波構造は高域部でも同様に出現することが多く、逆に、高域部で調波構造が観察されれば同様に低域部にも出現することが多い。このように、低域―高域間で相互相関が強いことから、第1の帯域フィルタ103で抽出された低域成分および高域成分を、狭帯域音声信号との歪みが最小となるように生成された広帯域音声信号から得ることにより、最適な復元音声信号を構成できる。
帯域合成部104は、第1の帯域フィルタ103が出力する広帯域音声信号のうちの低域成分および高域成分と、サンプリング変換部101が出力するアップサンプリング済狭帯域音声信号とを加算して広帯域音声信号を復元し、復元音声信号として出力する。
以上より、この実施の形態1によれば、狭帯域に帯域制限された狭帯域音声信号から、狭帯域を包含する広帯域音声信号に変換する音声信号復元装置100であって、狭帯域音声信号を、広帯域に合うようにサンプリング変換するサンプリング変換部101と、音韻・音源信号記憶部105が格納している広帯域の周波数成分を持つ音韻信号および音源信号を組み合わせて、広帯域音声信号を複数生成する合成フィルタ106と、サンプリング変換部101がサンプリング変換したアップサンプリング済狭帯域音声信号と合成フィルタ106が生成した複数の広帯域音声信号との波形歪みを所定の歪み尺度を用いてそれぞれ評価して、当該評価結果に基づいて歪みが最も小さくなる広帯域音声信号を選択する歪評価部107と、歪評価部107が選択した広帯域音声信号から狭帯域以外の周波数成分を抽出する第1の帯域フィルタ103と、第1の帯域フィルタ103の抽出した周波数成分にサンプリング変換部101がサンプリング変換したアップサンプリング済狭帯域音声信号を組み合わせる帯域合成部104とを備えるように構成した。このように、音声信号復元に用いる低域成分ならびに高域成分を、狭帯域音声信号の歪みが最小となるように生成された広帯域音声信号から得ているため、高品質な広帯域の音声信号を復元することができる。
また、この実施の形態1によれば、音声の基本周期を抽出する必要がなく、基本周期の抽出誤りによる品質劣化がないので、音声の基本周期の分析困難な雑音環境下でも、高品質な広帯域の音声信号を復元することができる。
また、この実施の形態1によれば、音源信号に劣化を及ぼすようなゼロ詰めや全波整流処理などの非線形処理を行わないので、高品質な広帯域の音声信号を復元することができる。
また、この実施の形態1によれば、音声信号復元に用いる低域成分ならびに高域成分は、狭帯域音声信号の歪みが最小となるように生成された広帯域音声信号から得ており、原理上、狭帯域音声信号と低域成分(または高域成分と狭帯域音声信号)は滑らかに接続可能であり、帯域合成時のパワー補正などの補間処理が必要なく、高品質な広帯域の音声信号を復元できる。
なお、上記実施の形態1に係る音声信号復元装置100は、歪評価部107における歪み評価結果が非常に小さい場合には、第1の帯域フィルタ103と帯域合成部104の処理を省略し、歪評価部107が出力する広帯域音声信号を、直接、復元音声信号として出力しても良い。
また、上記実施の形態1では、低域および高域の両方が欠落した狭帯域音声信号に対して、これら低域および高域の両方の周波数成分を復元する構成であったが、これに限定されるものではなく、低域、中域、高域のうち少なくとも1つの周波数帯域が欠落した狭帯域音声信号であっても復元可能であることは言うまでもない。このように、音声信号復元装置100は、合成フィルタ106が生成する広帯域音声信号の周波数帯域の少なくとも一部の周波数帯域を持つ狭帯域音声信号であれば、広帯域音声信号と同じ周波数帯域に復元できる。
実施の形態2.
上記実施の形態1の変形例として、狭帯域音声信号の分析結果を、広帯域音声信号を生成するための補助情報として用いることも可能である。図3は、本実施の形態2による音声信号復元装置100の全体構成を示したものであり、図1に示す音声信号復元装置100に新たに音声分析部111を追加した構成である。その他の構成要素に関しては、図1に対応する部分については同一符号を付与し、詳細な説明を省略する。
音声分析部111は、入力された狭帯域音声信号について、線形予測分析などの公知の手法により音響的特徴の分析を行い、狭帯域音声信号の音韻信号と音源信号の抽出を行って、それぞれ音韻信号記憶部108と音源信号記憶部109へ出力する。このとき、音韻信号としては、例えば補間特性の良いLSPパラメータが望ましいが、他のパラメータでも構わない。また、音源信号に関しては、音声分析部111が例えば分析結果である音韻信号をフィルタ係数に持つ逆フィルタを備え、狭帯域音声信号をフィルタ処理して得られた残差信号を音源信号とすることができる。
音韻・音源信号記憶部105では、音声分析部111から入力された狭帯域音声信号の音韻信号と音源信号を、音韻信号記憶部108と音源信号記憶部109の補助情報とする。音韻信号記憶部108では、補助情報の用法として、例えば、広帯域音声信号の音韻信号から300〜3400Hzの部分を除去し、除去した部分に狭帯域音声信号の音韻信号を当てはめることができる。狭帯域音声信号の音韻信号を当てはめることで、狭帯域音声信号に更に近似した広帯域音声信号の音韻信号を得ることが可能である。また、音韻信号記憶部108は、狭帯域音声信号の音韻信号と、広帯域音声信号との例えばスペクトル上での歪み評価を行って、歪みが少ない広帯域音声信号の音韻信号のみを合成フィルタ106に出力するという予備選択を行うことができる。音韻信号の予備選択を行うことで合成フィルタ106と歪評価部107の処理回数を削減できる。
音源信号記憶部109では、補助情報の用法として、音韻信号記憶部108と同様に例えば狭帯域音声信号の音源信号を広帯域音声信号に加えたり、予備選択の情報として用いたりすることができる。狭帯域音声信号の音源信号を加えることで、狭帯域音声信号に更に近似した広帯域音声信号の音源信号を得ることが可能である。また、音源信号の予備選択を行うことで合成フィルタ106と歪評価部107の処理回数を削減できる。
以上より、この実施の形態2によれば、音声信号復元装置100は、狭帯域に帯域制限された狭帯域音声信号について音響的分析を行って補助情報を生成する音声分析部111を備え、合成フィルタ106は、音声分析部111が生成した補助情報を用いて、音韻・音源信号記憶部105が格納している広帯域の周波数成分を持つ複数の音韻信号および複数の音源信号をそれぞれ組み合わせて、広帯域音声信号を複数生成するように構成した。このため、狭帯域音声信号の分析結果を補助情報として用いることで、狭帯域音声信号に更に近似した広帯域音声信号を得ることができ、更に高品質な広帯域の音声信号を復元できる。
また、この実施の形態2によれば、広帯域音声信号を生成する際、狭帯域音声信号の分析結果を補助情報に用いて音韻信号および音源信号を予備選択できるので、高品質を保ったままで処理量を削減することができる。
なお、本実施の形態2では、音声分析部111の処理が、サンプリング変換部101に入力される前に実施されているが、サンプリング変換部101の処理後であっても構わない。この場合には、アップサンプリング済狭帯域音声信号の音声分析を行うこととなる。
また、音声分析部111は、入力された狭帯域音声信号について、例えば音声信号と雑音信号の周波数分析を行い、音声信号スペクトルパワーと雑音信号スペクトルパワーの比(信号対雑音比、以下、SN比と称す)が高い周波数帯域を指定した補助情報を生成するようにしてもよい。この構成の場合、サンプリング変換部101は、狭帯域音声信号のうち、この補助情報で指定された周波数帯域(所定の周波数帯域)の周波数成分をサンプリング変換し、歪評価部107はアップサンプリング済狭帯域音声信号と複数の広帯域音声信号との歪み評価を、この補助情報で指定された周波数帯域の周波数成分同士で行う。さらに、第1の帯域フィルタ103が歪評価部107の選択した広帯域音声信号のうち、この補助情報で指定された周波数帯域以外の周波数成分を抽出して、帯域合成部104にてこの周波数帯域のアップサンプリング済狭帯域音声信号に合成する。このため、歪評価部107が狭帯域音声信号の全周波数帯域ではなく、補助情報で指定された周波数帯域のみで歪み評価することになり、処理量を削減することができる。
実施の形態3.
上記実施の形態2では、周波数帯域が狭帯域に制限されている音声信号から、広帯域の音声信号を生成するための音声信号復元装置100を説明したが、本実施の形態2ではこの音声信号復元装置100を変形して応用することで、雑音抑圧処理や音声圧縮処理などにより劣化または欠損した周波数帯域の音声信号を復元するための、音声信号復元装置200を構成する。図4は、本実施の形態3による音声信号復元装置200の全体構成を示したものであり、図1に示す音声信号復元装置100に新たに雑音抑圧部201および第2の帯域フィルタ202を追加した構成である。その他の構成要素に関しては、図1に対応する部分については同一符号を付与し、詳細な説明を省略する。
なお、本実施の形態3では、説明の簡略化のため、入力される雑音混入音声信号の周波数帯域を0〜4000Hzとし、混入している雑音に自動車走行騒音を想定し、0〜500Hzの帯域に雑音が混入しているとする。このとき、音声信号生成部102内部の音韻・音源信号記憶部105、合成フィルタ106および歪評価部107と、第1の帯域フィルタ103と、第2の帯域フィルタ202は、0〜4000Hzの周波数帯域に応じた動作を行ったり、音韻信号および音源信号を保持したりすることとなる。なお、実際のシステムに適用するに当たっては、これらの条件に限られないことはいうまでもない。
図5は、この実施の形態3の構成で生成される音声信号を模式的に図示したものである。図5(a)は雑音抑圧部201が出力する雑音抑圧済音声信号(比較対象信号)を表す。図5(b)は合成フィルタ106が生成した複数の広帯域音声信号(音声信号)のうちから歪評価部107が選択した、雑音抑圧済音声信号との歪みが最小となる広帯域音声信号を表す。図5(c)は第1の帯域フィルタ103の出力である、広帯域音声信号から低域成分が抽出された信号を表す。図5(d)は第2の帯域フィルタ202が出力する、雑音抑圧済音声信号の高域成分を表す。図5(e)は音声信号復元装置200の出力結果である、復元音声信号を表す。また、図5中の各矢印は処理の順序を表し、各グラフの縦軸はパワーを示し、横軸は周波数を示す。
以下、図4および図5に基づいてこの音声信号復元装置200の動作原理について説明する。
雑音抑圧部201は、雑音が混入した雑音混入音声信号を入力して、雑音抑圧した音声信号を歪評価部107および第2の帯域フィルタ202へ出力する。また、雑音抑圧部201は、後段の歪評価部107における歪み評価と第1の帯域フィルタ103とが用いるための、0〜500Hzの低域と500〜4000Hzの高域に分離する低域・広域分割周波数を指定した帯域情報信号を出力する。なお、帯域情報信号は本実施の形態3では500Hz固定としているが、例えば、入力される雑音混入音声信号の様態、例えば、音声信号と雑音信号の周波数分析を行い、雑音信号スペクトルパワーが音声信号スペクトルパワーを上回る周波数(スペクトル上でのSN比が0dBを交差する周波数)を帯域情報信号としても良い。また、その周波数は入力される雑音混入音声信号およびその雑音の様態に応じて時々刻々変化するので、例えば、10msのフレーム毎に変更しても良い。
ここで、雑音抑圧部201における雑音抑圧処理の手法としては、例えば「Steven F.Boll,“Suppression of acoustic noise in speech using spectral subtraction”,IEEE Trans.ASSP,Vol.ASSP−27,No.2,Apr.1979」に開示されているようなスペクトル減算に基づく手法、および「J.S.Lim and A.V.Oppenheim,“Enhancement and Bandwidth Compression of Noisy Speech”,Proc.of the IEEE,vol.67,pp.1586−1604,Dec.1979」に開示されているようなスペクトル成分毎のSN比に基づいて、スペクトル成分毎に減衰量を与えるスペクトル振幅抑圧の手法などの公知の方法の他、スペクトル減算とスペクトル振幅抑圧を組み合わせた手法(例えば、特許第3454190号)などを用いることが可能である。
上記実施の形態1と同様に、音声信号生成部102において、合成フィルタ106が、音韻信号記憶部108に格納している音韻信号と音源信号記憶部109に格納している音源信号を用いて複数の広帯域音声信号を生成し、歪評価部107が雑音抑圧された雑音抑圧済音声信号との波形歪みを所定の歪み尺度に基づいて評価し、任意の条件に合う波形歪みの広帯域音声信号を選択して出力する。
歪評価部107は、波形歪みを評価する際に歪みを評価する周波数帯域(所定の周波数帯域)として、帯域情報信号が指定する周波数より高い範囲に限定することとし、この例では500〜4000Hzに限定する。この範囲で波形歪みの評価を行うには、例えば、上記実施の形態1で用いたのと同様な手法を採る事ができる。歪評価部107は、逐次、音韻信号記憶部108および音源信号記憶部109からスペクトルパタンと音源信号の組を出力させる指示を出して合成フィルタ106に広帯域音声信号を複数生成させ、例えば波形歪みが最小となる広帯域音声信号を選択して、第1の帯域フィルタ103へ出力する。
第1の帯域フィルタ103は、歪評価部107で生成された広帯域音声信号から、帯域情報信号が示す低域・広域分割周波数以下の低域成分を抽出し、帯域合成部104へ出力する。第1の帯域フィルタ103による低域成分の抽出には、実施の形態1と同様にFIRフィルタ、IIRフィルタなどを用いればよい。音声信号の一般的な特性として、低域部の調波構造は高域部でも同様に出現することが多く、逆に、高域部で調波構造が観察されれば同様に低域部にも出現することが多い。このように、低域―高域間で相互相関が強いことから、第1の帯域フィルタ103で抽出された低域成分を、雑音抑圧済音声信号との歪みが最小となるように生成された広帯域音声信号から得ることにより、最適な復元音声信号を構成できるものと考える。
第2の帯域フィルタ202は、前述の第1の帯域フィルタ103と逆の動作を行う。即ち、雑音抑圧済音声信号から、帯域情報信号が示す低域・広域分割周波数以上の高域成分を抽出し、帯域合成部104へ出力する。第2の帯域フィルタ202による高域成分の抽出には、第1の帯域フィルタ103と同様にFIRフィルタ、IIRフィルタなどを用いればよい。
帯域合成部104は、第1の帯域フィルタ103が出力する、広帯域音声信号の低域成分と、第2の帯域フィルタ202が出力する、雑音抑圧済音声信号の高域成分とを加算して音声信号を復元し、復元音声信号として出力する。
この実施の形態3によれば、雑音混入音声信号を雑音抑圧部201にて雑音抑圧処理することにより劣化または欠損した雑音抑圧済音声信号を復元して、復元音声信号を生成する音声信号復元装置200であって、音韻・音源信号記憶部105が格納している音韻信号および音源信号を組み合わせて、広帯域音声信号を複数生成する合成フィルタ106と、雑音抑圧済音声信号と合成フィルタ106が生成した複数の広帯域音声信号との波形歪みを所定の歪み尺度を用いてそれぞれ評価して、当該評価結果に基づいて歪みが最も小さくなる広帯域音声信号を選択する歪評価部107と、歪評価部107が選択した広帯域音声信号から劣化または欠損した周波数帯域の周波数成分を抽出する第1の帯域フィルタ103と、雑音抑圧済音声信号から劣化または欠損した周波数帯域以外の周波数成分を抽出する第2の帯域フィルタ202と、第1の帯域フィルタ103の抽出した周波数成分と第2の帯域フィルタ202の抽出した周波数成分を組み合わせる帯域合成部104とを備えるように構成した。このように、音声信号復元に用いる低域成分を、雑音抑圧された音声信号との歪みが最小となるように生成された音声信号から得ているため、高品質な音声信号を復元することができる。
また、この実施の形態3によれば、音声の基本周期を抽出する必要がなく、基本周期の抽出誤りによる品質劣化がないので、音声の基本周期の分析困難な雑音環境下でも、高品質な音声信号を復元することができる。
また、この実施の形態3によれば、音声信号復元に用いる低域成分は、雑音抑圧された音声信号との歪みが最小となるように生成された音声信号から得ているので、原理上、雑音抑圧された音声信号の高域成分と生成された低域成分は滑らかに接続可能であり、帯域合成時のパワー補正などの補間処理が必要なく、高品質な音声信号を復元できる。
なお、上記実施の形態3に係る音声信号復元装置200は、歪評価部107における歪み評価結果が非常に小さい場合には、第1の帯域フィルタ103、第2の帯域フィルタ202、帯域合成部104の各処理を省略し、歪評価部107が出力する広帯域音声信号を、直接、復元音声信号として出力しても良い。
また、上記実施の形態3では、低域が劣化または欠損した雑音抑圧済信号に対して、低域の周波数成分を復元する構成であったが、これに限定されるものではなく、低域および高域の一方または両方が劣化または欠損した雑音抑圧済音声信号に対してこれらの帯域の周波数成分を復元する構成にしてもよいし、雑音抑圧部201の出力する帯域情報信号に応じて、例えば800〜1000Hzの中間的な帯域の周波数成分を復元する構成にしてもよい。中間的な帯域が劣化または欠損するような状況としては、例えば、自動車が高速で走行した時に発生するウインドノイズ(風切り音)などの局所帯域的な雑音が音声信号に混入した場合が考えられる。このように、実施の形態3でも上記実施の形態1,2と同様に、合成フィルタ106が生成する広帯域音声信号の周波数帯域の少なくとも一部の周波数帯域を持つ雑音抑圧済音声信号であれば、その雑音抑圧済音声信号の残りの周波数帯域の周波数成分を復元可能である。
実施の形態4.
上記実施の形態3の変形例として、上記実施の形態2と同様に、雑音抑圧された音声信号の分析結果を、広帯域音声信号を生成するための補助情報として用いることも可能である。具体的には、上記実施の形態3に係る音声信号復元装置200に、図3に示すような音声分析部111を追加して、この音声分析部111が、雑音抑圧部201から入力される雑音抑圧済音声信号について音響的特徴の分析を行い、雑音抑圧済音声信号の音韻信号と音源信号の抽出を行って、それぞれ音韻信号記憶部108と音源信号記憶部109へ出力する。
この実施の形態4によれば、音声信号復元装置200は、雑音抑圧済音声信号について音響的分析を行って補助情報を生成する音声分析部111を備え、合成フィルタ106は、音声分析部111が生成した補助情報を用いて、音韻・音源信号記憶部105が格納している音韻信号および音源信号を組み合わせて、広帯域音声信号を複数生成するように構成した。このため、雑音抑圧済音声信号の分析結果を補助情報として用いることで、雑音抑圧済音声信号に更に近似した広帯域音声信号を得ることができ、更に高品質な音声信号を復元できる。
また、この実施の形態4によれば、広帯域音声信号を生成する際、雑音抑圧済音声信号の分析結果を補助情報に用いて音韻信号および音源信号を予備選択できるので、高品質を保ったままで処理量を削減することができる。
実施の形態5.
上記実施の形態3では、帯域情報信号に基づいて音声信号を低域と高域に2分割し、歪み評価処理では高域部の歪みだけを評価していたが、例えば、一部の低域成分も重み付けを行った上で歪み評価の対象としたり、雑音信号の周波数特性に応じた重み付けを行って歪み評価を行ったりすることも可能である。なお、本実施の形態5に係る音声信号復元装置は、図4に示す音声信号復元装置200と図面上では同様の構成であるため、以下では図4を援用して説明する。
図6は、歪評価部107の歪み評価に用いる重み付け係数の一例であり、図6(a)は一部の低域成分も評価対象とする場合、図6(b)は雑音信号の周波数特性の逆特性を重み係数とする場合である。図6中の各グラフの縦軸は振幅と歪み評価重み値を示し、横軸は周波数を示す。なお、歪評価部107での歪み評価への重み係数反映方法としては、例えば、フィルタ係数に重み係数を畳み込んだり、パワースペクトル成分に重み係数を乗じたりする方法が考えられる。また、第1の帯域フィルタ103および第2の帯域フィルタ202の特性としては、上記実施の形態3で採ったのと同様に低域と高域で分離する特性としてもよいし、図6(a)の重み係数の周波数特性を表現するようなフィルタ特性としてもよい。
図6(a)のように低域を評価対象とするのは、低域成分は雑音抑圧されてはいるものの、まったく音声成分が失われている訳ではないからであり、この成分を評価に加えることで生成する広帯域音声信号の品質が向上する。また、図6(b)のように雑音の周波数特性の逆特性で歪み評価を行うことで、比較的SN比が高い高域に重み付けすることができるので、生成する広帯域音声信号の品質が向上する。
この実施の形態5によれば、歪評価部107は、周波数軸上の重み付けをした歪み尺度を用いて、波形歪みを評価するように構成した。このため、一部の低域成分に重み付けして歪み評価することで、生成する音声信号の品質が向上し、更に高品質な音声信号を復元することができる。
また、この実施の形態5によれば、雑音の周波数特性の逆特性で重み付けして歪み評価することで、生成する音声信号の品質が向上し、更に高品質な音声信号を復元することができる。
なお、上記実施の形態5では、雑音抑圧済音声信号の復元に歪み評価の重み付けを実施しているが、上記実施の形態1,2に係る音声信号復元装置100の、狭帯域音声信号から広帯域音声信号への復元に対しても同様に適用可能である。
また、上記実施の形態1〜5では、狭帯域音声信号の例として電話音声の場合について説明しているが、電話音声に限られるものではなく、MP3(MPEG Audio Layer−3)などの音響信号符号化技術にて高域がカットされた信号の高域生成処理にも適用可能である。また、広帯域音声信号の周波数帯域も50〜7000Hzに限られることはなく、50〜16000Hzなどの更に広い帯域で実施することも可能である。
また、上記実施の形態1〜5に示した復元音声信号生成部110では、帯域フィルタで音声信号から特定の周波数帯域を切り出し、帯域合成部で他の音声信号と組み合わせて復元音声信号を生成する構成であったが、これに限定されるものではなく、例えば、復元音声信号生成部110に入力される2種類の音声信号を重み付け加算して復元音声信号を生成する構成にしてもよい。この構成の復元音声信号生成部110を上記実施の形態1に係る音声信号復元装置100に適用した場合の一例を図7に示すと共に、図8に、復元音声信号を模式的に図示する。なお、図8中の各矢印は処理の順序を表し、各グラフの縦軸はパワーを示し、横軸は周波数を示す。
図7に示すように、復元音声信号生成部110は新たに2つの重み調整部301,302を備える。重み調整部301は、歪評価部107から出力された広帯域音声信号の重み(ゲイン)を例えば0.2に調整し(図8(a)に示す破線)、重み調整部302は、サンプリング変換部101から出力されたアップサンプリング済音声信号の重み(ゲイン)を例えば0.8に調整し(図8(b)に示す破線)、帯域合成部104で両音声信号を加算して(図8(c))、復元音声信号を生成する(図8(d))。
なお、図示は省略するが、図7の構成を音声信号復元装置200に適用してもよい。
重み調整部301,302は、周波数方向に一定の重みを用いる他、例えば高域になるに従って大きくなるような周波数特性を持つ重みを用いるなど、必要に応じた重みを用いればよい。また、重み調整部301と第1の帯域フィルタ103を両方備える構成にして、重み調整部301で重み調整した広帯域音声信号から第1の帯域フィルタ103が狭帯域音声信号に等しい周波数帯域を抽出してもよいし、反対に、第1の帯域フィルタ103が広帯域音声信号から狭帯域音声信号に等しい周波数帯域を抽出して重み調整部301で重み調整してもよい。同様に、重み調整部301と第2の帯域フィルタ202を両方備える構成にしてもよい。
以上のように、この発明に係る音声信号復元装置は、音韻信号および音源信号から合成した複数の広帯域音声信号より選択した広帯域音声信号と比較対象信号とから復元音声信号を生成するようにしたので、周波数帯域が狭帯域に制限されたことにより一部の周波数帯域が欠落したり、雑音抑圧または音声圧縮されたことにより一部の周波数帯域が劣化または欠損したりした比較対象信号を復元する場合に適している。なお、音声信号復元装置100,200をコンピュータで構成する場合には、サンプリング変換部101、音声信号生成部102、復元音声信号生成部110、音声分析部111、雑音抑圧部201の処理内容を記述しているプログラムをコンピュータのメモリに格納し、コンピュータのCPUがメモリに格納されているプログラムを実行するようにしてもよい。
この発明に係る音声信号復元装置および音声信号復元方法は、音韻信号および音源信号を組み合わせて複数の音声信号を生成し、比較対象信号との波形歪みを所定の歪み尺度を用いてそれぞれ評価して、当該評価結果に基づいていずれかの音声信号を選択して復元音声信号を生成するようにしたので、周波数帯域が狭帯域に制限されている音声信号から広帯域の音声信号を復元する、および、劣化または欠損した帯域の音声信号を復元する音声信号復元装置およびその方法に用いるのに適している。

Claims (8)

  1. 音韻信号および音源信号を組み合わせて、複数の音声信号を生成する合成フィルタと、
    前記合成フィルタが生成する音声信号の周波数帯域の少なくとも一部の周波数帯域の周波数成分を持つ比較対象信号と前記合成フィルタが生成した前記複数の音声信号それぞれとの波形歪みを所定の歪み尺度を用いて評価して、当該評価結果に基づいて前記複数の音声信号のうちのいずれかを選択する歪評価部と、
    前記歪評価部が選択した音声信号を用いて復元音声信号を生成する復元音声信号生成部とを備える音声信号復元装置。
  2. 復元音声信号生成部は、比較対象信号と歪評価部が選択した音声信号とを組み合わせる帯域合成部を有することを特徴とする請求項1記載の音声信号復元装置。
  3. 歪評価部は、比較対象信号と合成フィルタが生成した複数の音声信号それぞれとの、所定の周波数帯域の周波数成分の波形歪みを評価することを特徴とする請求項1記載の音声信号復元装置。
  4. 比較対象信号を所定の周波数帯域に対応するようにサンプリング変換するサンプリング変換部を備え、
    歪評価部は、前記サンプリング変換部がサンプリング変換した前記比較対象信号と合成フィルタが生成した複数の音声信号それぞれとの、前記所定の周波数帯域の周波数成分の波形歪みを評価することを特徴とする請求項3記載の音声信号復元装置。
  5. 音韻信号および音源信号を組み合わせて、複数の音声信号を生成する合成フィルタステップと、
    前記合成フィルタステップで生成する音声信号の周波数帯域の少なくとも一部の周波数帯域の周波数成分を持つ比較対象信号と前記合成フィルタステップで生成した前記複数の音声信号それぞれとの波形歪みを所定の歪み尺度を用いて評価して、当該評価結果に基づいて前記複数の音声信号のうちのいずれかを選択する歪評価ステップと、
    前記歪評価ステップで選択した音声信号を用いて復元音声信号を生成する復元音声信号生成ステップとを備える音声信号復元方法。
  6. 復元音声信号生成ステップは、比較対象信号と歪評価ステップで選択した音声信号とを組み合わせる帯域合成ステップを有することを特徴とする請求項5記載の音声信号復元方法。
  7. 歪評価ステップは、比較対象信号と合成フィルタステップで生成した複数の音声信号それぞれとの、所定の周波数帯域の周波数成分の波形歪みを評価することを特徴とする請求項5記載の音声信号復元方法。
  8. 比較対象信号を所定の周波数帯域に対応するようにサンプリング変換するサンプリング変換ステップを備え、
    歪評価ステップは、前記サンプリング変換ステップでサンプリング変換した前記比較対象信号と合成フィルタステップで生成した複数の音声信号それぞれとの、前記所定の周波数帯域の周波数成分の波形歪みを評価することを特徴とする請求項7記載の音声信号復元方法。
JP2011547245A 2009-12-28 2010-10-22 音声信号復元装置および音声信号復元方法 Active JP5535241B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011547245A JP5535241B2 (ja) 2009-12-28 2010-10-22 音声信号復元装置および音声信号復元方法

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2009297147 2009-12-28
JP2009297147 2009-12-28
PCT/JP2010/006264 WO2011080855A1 (ja) 2009-12-28 2010-10-22 音声信号復元装置および音声信号復元方法
JP2011547245A JP5535241B2 (ja) 2009-12-28 2010-10-22 音声信号復元装置および音声信号復元方法

Publications (2)

Publication Number Publication Date
JPWO2011080855A1 true JPWO2011080855A1 (ja) 2013-05-09
JP5535241B2 JP5535241B2 (ja) 2014-07-02

Family

ID=44226287

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011547245A Active JP5535241B2 (ja) 2009-12-28 2010-10-22 音声信号復元装置および音声信号復元方法

Country Status (5)

Country Link
US (1) US8706497B2 (ja)
JP (1) JP5535241B2 (ja)
CN (1) CN102652336B (ja)
DE (1) DE112010005020B4 (ja)
WO (1) WO2011080855A1 (ja)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9838784B2 (en) 2009-12-02 2017-12-05 Knowles Electronics, Llc Directional audio capture
US8798290B1 (en) 2010-04-21 2014-08-05 Audience, Inc. Systems and methods for adaptive signal equalization
JP5552988B2 (ja) * 2010-09-27 2014-07-16 富士通株式会社 音声帯域拡張装置および音声帯域拡張方法
PL2737479T3 (pl) * 2011-07-29 2017-07-31 Dts Llc Adaptacyjna poprawa zrozumiałości głosu
US9390718B2 (en) * 2011-12-27 2016-07-12 Mitsubishi Electric Corporation Audio signal restoration device and audio signal restoration method
JP6169849B2 (ja) * 2013-01-15 2017-07-26 本田技研工業株式会社 音響処理装置
US9711156B2 (en) * 2013-02-08 2017-07-18 Qualcomm Incorporated Systems and methods of performing filtering for gain determination
US9304010B2 (en) * 2013-02-28 2016-04-05 Nokia Technologies Oy Methods, apparatuses, and computer program products for providing broadband audio signals associated with navigation instructions
US9536540B2 (en) 2013-07-19 2017-01-03 Knowles Electronics, Llc Speech signal separation and synthesis based on auditory scene analysis and speech modeling
US9721584B2 (en) * 2014-07-14 2017-08-01 Intel IP Corporation Wind noise reduction for audio reception
DE112015004185T5 (de) 2014-09-12 2017-06-01 Knowles Electronics, Llc Systeme und Verfahren zur Wiederherstellung von Sprachkomponenten
WO2016092837A1 (ja) * 2014-12-10 2016-06-16 日本電気株式会社 音声処理装置、雑音抑圧装置、音声処理方法および記録媒体
DE112016000545B4 (de) 2015-01-30 2019-08-22 Knowles Electronics, Llc Kontextabhängiges schalten von mikrofonen
US9820042B1 (en) 2016-05-02 2017-11-14 Knowles Electronics, Llc Stereo separation and directional suppression with omni-directional microphones
US11507807B2 (en) * 2016-09-27 2022-11-22 Panasonic Intellectual Property Management Co., Ltd. Audio signal processing device, audio signal processing method, and control program
CN111201569B (zh) * 2017-10-25 2023-10-20 三星电子株式会社 电子装置及其控制方法
DE102018206335A1 (de) 2018-04-25 2019-10-31 Audi Ag Haupteinheit für ein Infotainmentsystem eines Fahrzeugs

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3099047B2 (ja) 1990-02-02 2000-10-16 株式会社 ボッシュ オートモーティブ システム ブラシレスモータの制御装置
JPH03243174A (ja) 1990-02-16 1991-10-30 Toyota Autom Loom Works Ltd アクチュエータ
JP3563772B2 (ja) * 1994-06-16 2004-09-08 キヤノン株式会社 音声合成方法及び装置並びに音声合成制御方法及び装置
JP3230790B2 (ja) 1994-09-02 2001-11-19 日本電信電話株式会社 広帯域音声信号復元方法
JP3189598B2 (ja) 1994-10-28 2001-07-16 松下電器産業株式会社 信号合成方法および信号合成装置
DE69619284T3 (de) * 1995-03-13 2006-04-27 Matsushita Electric Industrial Co., Ltd., Kadoma Vorrichtung zur Erweiterung der Sprachbandbreite
JP3189614B2 (ja) * 1995-03-13 2001-07-16 松下電器産業株式会社 音声帯域拡大装置
US6240384B1 (en) * 1995-12-04 2001-05-29 Kabushiki Kaisha Toshiba Speech synthesis method
JP3243174B2 (ja) 1996-03-21 2002-01-07 株式会社日立国際電気 狭帯域音声信号の周波数帯域拡張回路
US6081781A (en) * 1996-09-11 2000-06-27 Nippon Telegragh And Telephone Corporation Method and apparatus for speech synthesis and program recorded medium
JPH10124098A (ja) * 1996-10-23 1998-05-15 Kokusai Electric Co Ltd 音声処理装置
JPH10124089A (ja) * 1996-10-24 1998-05-15 Sony Corp 音声信号処理装置及び方法、並びに、音声帯域幅拡張装置及び方法
JP3454190B2 (ja) * 1999-06-09 2003-10-06 三菱電機株式会社 雑音抑圧装置および方法
US6587846B1 (en) * 1999-10-01 2003-07-01 Lamuth John E. Inductive inference affective language analyzer simulating artificial intelligence
JP4296714B2 (ja) * 2000-10-11 2009-07-15 ソニー株式会社 ロボット制御装置およびロボット制御方法、記録媒体、並びにプログラム
US7251601B2 (en) * 2001-03-26 2007-07-31 Kabushiki Kaisha Toshiba Speech synthesis method and speech synthesizer
WO2003019533A1 (fr) * 2001-08-24 2003-03-06 Kabushiki Kaisha Kenwood Dispositif et procede d'interpolation adaptive de composantes de frequence d'un signal
DE60215296T2 (de) * 2002-03-15 2007-04-05 Sony France S.A. Verfahren und Vorrichtung zum Sprachsyntheseprogramm, Aufzeichnungsmedium, Verfahren und Vorrichtung zur Erzeugung einer Zwangsinformation und Robotereinrichtung
DE10252070B4 (de) * 2002-11-08 2010-07-15 Palm, Inc. (n.d.Ges. d. Staates Delaware), Sunnyvale Kommunikationsendgerät mit parametrierter Bandbreitenerweiterung und Verfahren zur Bandbreitenerweiterung dafür
KR100463655B1 (ko) * 2002-11-15 2004-12-29 삼성전자주식회사 부가 정보 제공 기능이 있는 텍스트/음성 변환장치 및 방법
WO2004097792A1 (ja) * 2003-04-28 2004-11-11 Fujitsu Limited 音声合成システム
JP4661074B2 (ja) * 2004-04-07 2011-03-30 ソニー株式会社 情報処理システム、情報処理方法、並びにロボット装置
EP1840871B1 (en) * 2004-12-27 2017-07-12 P Softhouse Co. Ltd. Audio waveform processing device, method, and program
JP2007072264A (ja) * 2005-09-08 2007-03-22 Nippon Telegr & Teleph Corp <Ntt> 音声量子化方法、音声量子化装置、プログラム
FR2898443A1 (fr) * 2006-03-13 2007-09-14 France Telecom Procede de codage d'un signal audio source, dispositif de codage, procede et dispositif de decodage, signal, produits programme d'ordinateur correspondants
ATE446572T1 (de) 2006-08-22 2009-11-15 Harman Becker Automotive Sys Verfahren und system zur bereitstellung eines tonsignals mit erweiterter bandbreite
JP2008185805A (ja) * 2007-01-30 2008-08-14 Internatl Business Mach Corp <Ibm> 高品質の合成音声を生成する技術
JP4966048B2 (ja) * 2007-02-20 2012-07-04 株式会社東芝 声質変換装置及び音声合成装置
JP2009109805A (ja) * 2007-10-31 2009-05-21 Toshiba Corp 音声処理装置及びその方法

Also Published As

Publication number Publication date
DE112010005020B4 (de) 2018-12-13
DE112010005020T5 (de) 2012-10-18
US8706497B2 (en) 2014-04-22
CN102652336B (zh) 2015-02-18
US20120209611A1 (en) 2012-08-16
WO2011080855A1 (ja) 2011-07-07
JP5535241B2 (ja) 2014-07-02
CN102652336A (zh) 2012-08-29

Similar Documents

Publication Publication Date Title
JP5535241B2 (ja) 音声信号復元装置および音声信号復元方法
JP3881943B2 (ja) 音響符号化装置及び音響符号化方法
EP1638083B1 (en) Bandwidth extension of bandlimited audio signals
JP5127754B2 (ja) 信号処理装置
JP3881946B2 (ja) 音響符号化装置及び音響符号化方法
EP1686564B1 (en) Bandwidth extension of bandlimited acoustic signals
JP2009530685A (ja) Mdct係数を使用する音声後処理
JP4302978B2 (ja) 音声コーデックにおける擬似高帯域信号の推定システム
EP1970900A1 (en) Method and apparatus for providing a codebook for bandwidth extension of an acoustic signal
WO2003091989A1 (en) Coding device, decoding device, coding method, and decoding method
US9390718B2 (en) Audio signal restoration device and audio signal restoration method
JPH10124088A (ja) 音声帯域幅拡張装置及び方法
JP6073456B2 (ja) 音声強調装置
JP2000305599A (ja) 音声合成装置及び方法、電話装置並びにプログラム提供媒体
JP4622164B2 (ja) 音響信号符号化方法及び装置
US20050187762A1 (en) Speech decoder, speech decoding method, program and storage media
JP5148414B2 (ja) 信号帯域拡張装置
JP5443547B2 (ja) 信号処理装置
JP2009223210A (ja) 信号帯域拡張装置および信号帯域拡張方法
JP4287840B2 (ja) 符号化装置
JP6333043B2 (ja) 音声信号処理装置
JP3748080B2 (ja) 広帯域音声復元方法及び広帯域音声復元装置
JP2004078232A (ja) 広帯域音声復元装置及び広帯域音声復元方法及び音声伝送システム及び音声伝送方法
JP2004046238A (ja) 広帯域音声復元装置及び広帯域音声復元方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130716

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130912

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140325

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140422

R150 Certificate of patent or registration of utility model

Ref document number: 5535241

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250