JP6284003B2 - 音声強調装置及び方法 - Google Patents

音声強調装置及び方法 Download PDF

Info

Publication number
JP6284003B2
JP6284003B2 JP2014006951A JP2014006951A JP6284003B2 JP 6284003 B2 JP6284003 B2 JP 6284003B2 JP 2014006951 A JP2014006951 A JP 2014006951A JP 2014006951 A JP2014006951 A JP 2014006951A JP 6284003 B2 JP6284003 B2 JP 6284003B2
Authority
JP
Japan
Prior art keywords
circuit
signal
value
consonant
level
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014006951A
Other languages
English (en)
Other versions
JP2014209182A (ja
Inventor
良二 鈴木
良二 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Intellectual Property Management Co Ltd
Original Assignee
Panasonic Intellectual Property Management Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Intellectual Property Management Co Ltd filed Critical Panasonic Intellectual Property Management Co Ltd
Priority to JP2014006951A priority Critical patent/JP6284003B2/ja
Priority to US14/170,919 priority patent/US9245537B2/en
Publication of JP2014209182A publication Critical patent/JP2014209182A/ja
Application granted granted Critical
Publication of JP6284003B2 publication Critical patent/JP6284003B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/93Discriminating between voiced and unvoiced parts of speech signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)

Description

本開示は、音声信号の子音を強調して明瞭度を改善する音声強調装置及び方法に関する。
従来、入力される音声信号に対して子音を増幅することで明瞭度を改善する方法が提案されている(例えば、特許文献1参照)。しかしながら、この方法のように、子音を増幅しても、母音から子音へのマスキング量に関係する子音の信号レベルに対する母音の信号レベルは、発話者や言語や音韻によって大きく変わるため、一定の増幅率で子音を増幅しても、子音の信号レベルが小さい場合には音声の明瞭度を改善することは難しい。一方母音の時間伸張率に応じて子音の増幅率を変えることで、自然の発話による音声信号におけるエネルギーバランスに近似させ、明瞭化を図る方法が提案されている(例えば、特許文献2参照)。
特開2006−203683号公報 特開平10−145897号公報
しかしながら、特許文献2の方法では、信号レベルが小さい子音の場合には、母音の時間伸長率を上げない限り、子音に対する母音からのマスキングは十分に補償されないため、子音を十分に増幅させるために母音の時間長を大きく伸長させると、不自然な音声しか得られないという課題があった。さらに、特許文献1及び2の方法では、子音と母音の識別を行っているが、実環境で発声された音声から子音と母音を確実に識別することは困難であるため、正しく子音が増幅されない結果、音声の明瞭度を改善できないという課題があった。
本開示の目的は以上の課題を解決し、音声の明瞭度を改善することが可能な音声強調装置及び方法を提供することにある。
本開示に係る音声強調装置は、
所定のサンプリング周波数で入力される音声信号から、子音らしさを示す値を生成して出力する生成部と、
前記子音らしさを示す値に基づいて、前記音声信号内の子音部分と母音部分とを識別した子音・母音識別信号を生成し、前記音声信号及び前記子音・母音識別信号に基づいて、前記音声信号における母音部分の第1の信号レベルと子音部分の第2の信号レベルとを検出し、前記第2の信号レベルに対する前記第1の信号レベルの関係を示すレベル関係信号を出力する演算部と、
前記レベル関係信号に基づいて、前記第2の信号レベルが前記第1の信号レベルよりも小さいときに、“1”を超える利得係数であって、前記第2の信号レベルが前記第1の信号レベルに対して小さくなるにつれて当該利得係数が大きくなるように当該利得係数を決定する決定部と、
前記音声信号に前記利得係数を乗算して前記音声信号の子音部分を強調した音声信号を出力する乗算部とを備える。
これらの概括的かつ特定の態様は、システム、方法、コンピュータプログラム並びにシステム、方法及びコンピュータプログラムの任意の組み合わせにより実現してもよい。
本開示に係る音声強調装置及び音声強調方法によれば、子音の信号レベルが小さい場合でも音声の明瞭度を改善可能で、音声信号以外の音楽信号などが入力されたと推測される場合には処理を行わない音声強調装置及び方法を提供することができる。
本開示の第1の実施形態に係る音声強調装置100の構成を示すブロック図である。 図1の音声強調装置100の構成を示すブロック図である。 図2の相関除去フィルタ回路107の構成を示すブロック図である。 本開示の第2の実施形態に係る音声強調装置100Aの構成を示すブロック図である。 本開示の第3の実施形態に係る音声強調装置100Bの構成を示すブロック図である。 本開示の第3の実施形態の変形例に係る音声強調装置100Cの構成を示すブロック図である。 本開示の第4の実施形態に係る音声強調装置100Dの構成を示すブロック図である。 本開示の第5の実施形態に係る音声強調装置100Eの構成を示すブロック図である。 本開示の第6の実施形態に係る音声強調装置100Fの構成を示すブロック図である。 本開示の第7の実施形態に係る音声強調装置100Gの構成を示すブロック図である。 本開示の第8の実施形態に係る音声強調装置100Hの構成を示すブロック図である。 本開示の第9の実施形態に係る音声強調装置100Iの構成を示すブロック図である。 図8Dの関数値回路160の入力値xに対する出力値yの変化を示すグラフである。 本開示の第9の実施形態の変形例に係る、図8Dの関数値回路160の入力値xに対する出力値yの変化を示すグラフである。 本開示の第10の実施形態に係る音声強調装置100Jの構成を示すブロック図である。
以下、適宜図面を参照しながら、実施の形態を詳細に説明する。但し、必要以上に詳細な説明は省略する場合がある。例えば、既によく知られた事項の詳細説明や実質的に同一の構成に対する重複説明を省略する場合がある。これは、以下の説明が不必要に冗長になるのを避け、当業者の理解を容易にするためである。
なお、発明者は、当業者が本開示を十分に理解するために添付図面および以下の説明を提供するのであって、これらによって特許請求の範囲に記載の主題を限定することを意図するものではない。すなわち、本開示は下記の実施形態によって記載したが、この開示の一部をなす論述及び図面はこの発明を限定するものであると理解すべきではない。この開示から当業者には様々な代替実施形態及び運用技術が明らかとなろう。
第1の実施形態.
(音声強調装置100の構成)
図1は、本開示の第1の実施形態に係る音声強調装置100の構成を示すブロック図である。図1の音声強調装置100は、入力端子101と、生成部102と、演算部103と、決定部104と、乗算部105と、出力端子106とを備えて構成される。
図2は、図1の音声強調装置100の構成を示すブロック図である。図において、子音らしさを示す値を生成して出力する生成部102は、相関除去フィルタ回路107と、比較回路108と、第1の平滑化回路109とを備えて構成される。また、演算部103は、高速充電低速放電型の第1の積分回路である第1のピークホールド回路111と、高速充電低速放電型の第2の積分回路である第2のピークホールド回路112と、除算回路113と、子音/母音判定回路110とを備えて構成される。ここで、子音らしさを示す値を入力し、当該子音らしさを示す値に基づいて、音声信号内の子音部分と母音部分とを識別した子音・母音識別信号を生成し、音声信号及び子音・母音識別信号に基づいて、前記音声信号における母音部分の第1の信号レベルと子音部分の第2の信号レベルとを検出し、第2の信号レベルに対する第1の信号レベルの関係を示すレベル関係信号を出力する。
図2において、決定部104は、減算回路115と、第1の判定回路である判定回路116と、第1の乗算回路117と、加算回路119と、しきい値thを発生させるしきい値発生器114と、定数“1.0”を発生させる定数値発生器118とを備えて構成される。ここで、上述した第2の信号レベルに対する第1の信号レベルの関係を示すレベル関係信号に基づいて、第2の信号レベルが第1の信号レベルよりも小さいときに、“1”を超える利得係数であって、第2の信号レベルが第1の信号レベルに対して小さくなるにつれて当該利得係数が大きくなるように当該利得係数を決定する。なお、利得係数は、第2の信号レベルが第1の信号レベルよりも大きいときに“1”近傍の値となる。すなわち、子音の信号レベルが母音の信号レベルよりも小さい場合には、母音の信号レベルと同程度となるように子音の信号レベルのみを増幅させる。また、母音の信号レベルが子音の信号レベルよりも小さい場合には、子音の信号レベルを増幅させる必要がない音楽である可能性が高いので利得係数は1となるように設定される。
乗算部105は、第2の乗算回路120を備えて構成される。ここで、音声信号に利得係数を乗算して音声信号の子音部分を強調した音声信号を出力する。また、入力端子101は、音声信号fを入力するための端子である。入力端子101から入力された音声信号fは、相関除去フィルタ回路107、比較回路108、乗算部105、第1のピークホールド回路111及び第2のピークホールド回路112に出力される。音声信号fは、所定のサンプリング周波数でサンプリングすることによって生成された信号である。サンプリング周波数は、例えば、音楽CDであれば44.1kHzであり、電話回線であれば8kHzである。
相関除去フィルタ回路107は、入力端子101から音声信号fを入力し、当該音声信号fから自己相関を有する信号成分を除去し、周期性のない信号を抽出して、当該周期性のない信号をフィルタ出力信号fとして比較回路108に出力する。ここで、詳細後述する相関除去フィルタ回路107は、入力端子101から入力された音声信号fから自己相関を有する信号成分を除去するための格子型フィルタ回路である。相関除去フィルタ回路107は、周期性のある信号成分以外の、周期性のない信号(後述する「前向き予測誤差信号f」に対応する。)を抽出する。周期性のある信号成分は自己相関があり、この信号の例は母音のような信号である。また、周期性のない信号は自己相関がなく、この信号の例は子音のような信号である。
比較回路108は、入力端子101から入力された音声信号fの振幅と相関除去フィルタ回路107から入力されたフィルタ出力信号fの振幅とを比較し、当該比較結果を第1の平滑化回路109に出力する。ここで、比較回路108は、相関除去フィルタ回路107から出力されるフィルタ出力信号fの振幅が入力された音声信号fの振幅よりも大きいときには、入力された音声信号fは自己相関を有さず子音のような周期性のない信号であると判断して“1”の値を出力する。また、相関除去フィルタ回路107のフィルタ出力信号fの振幅が入力された音声信号fの振幅よりも小さいときには、入力された音声信号は自己相関を有する母音のような周期性のある信号であると判断して“0”の値を出力する。
第1の平滑化回路109は、比較回路108から出力される音声信号fに対する“0”と“1”の判断結果を積分して平滑し、または、比較回路108から出力される“1”の値の頻度を算出することにより子音らしさを示す値を算出し、当該子音らしさを示す値を子音/母音判定回路110及び乗算回路117に出力する。ここで、比較回路108から“1”の値が出力された頻度が高い場合には、子音らしさの確率が高く、子音らしさを示す値として“1”近傍の値を出力し、子音らしさの確率が低いほど、子音らしさを示す値として“0”近傍の値を出力する。
子音/母音判定回路110は、第1の平滑化回路109から入力された子音らしさを示す値と所定のしきい値とを比較し、入力された音声信号fが子音であるかもしくは子音でないかを示す子音・母音識別信号を生成し、当該子音・母音識別信号を第1のピークホールド回路111及び第2のピークホールド回路112に出力する。ここで、第1の平滑化回路109から出力された子音らしさを示す値が所定のしきい値よりも大きいときには入力された音声信号fが子音であったと判定して子音・母音識別信号として“1”の値を生成して出力し、第1の平滑化回路109から出力された子音らしさを示す値が所定のしきい値よりも小さいときには入力された音声信号fは子音以外と判定して子音・母音識別信号として“0”の値を生成して出力する。
第1のピークホールド回路111は、子音/母音判定回路110から子音・母音識別信号として“0”の値を入力すると、入力端子101から入力された音声信号fの信号レベルVを計測し、当該信号レベルVの値を除算回路113に出力する。ここで、第1のピークホールド回路111は、子音/母音判定回路が子音以外と判定した場合に信号レベルVを計測する。
第2のピークホールド回路112は、子音/母音判定回路110から子音・母音識別信号として“1”の値を入力すると、入力端子101から入力された音声信号fの信号レベルCを計測し、当該信号レベルCの値を除算回路113に出力する。ここで、第2のピークホールド回路112は、子音/母音判定回路が子音と判定した場合に信号レベルCを計測する。
除算回路113は、第1のピークホールド回路111から入力された音声信号fの子音以外の信号レベルVを、第2のピークホールド回路112から入力された音声信号fの子音の信号レベルCで除算してレベル比(V/C)を算出して当該レベル比(V/C)の値を減算回路115に出力する。ここで、音声信号fの第2の信号レベルCに対する音声信号fの第1の信号レベルVの関係を示すレベル関係信号は当該レベル比(V/C)として生成される。
続いて、図2の決定部104の各回路の動作について説明する。
減算回路115は、除算回路113から入力されたレベル比(V/C)の値からしきい値thを差し引き、当該減算結果を判定回路116に出力する。また、判定回路116は、減算回路115から減算結果を入力し、当該減算結果に基づき、当該減算結果の値が負の値の場合には当該減算結果の値を強制的に“0”の値に修正し、当該“0”の値を第1の乗算回路117に出力し、負の値以外の場合はレベル比(V/C)の値をそのまま第1の乗算回路117に出力する。
第1の乗算回路117は、第1の平滑化回路109から入力された子音らしさを示す値に判定回路116から入力された“0”の値もしくはレベル比(V/C)の値を乗算して、当該乗算結果の値を加算回路119に出力する。また、加算回路119は、第1の乗算回路117から入力された乗算結果の値に定数“1.0”を加算し、当該加算結果の値を利得係数として第2の乗算回路120に出力する。
以上説明したように、決定部104は、入力された音声信号fが子音以外の場合には“1”近傍の値を第2の乗算回路120に出力し、入力された音声信号fが子音の場合には“1”より大きい値を第2の乗算回路120に出力する。すなわち、利得係数は、音声信号fにおける母音部分の信号レベルが音声信号fにおける子音部分の信号レベルよりも小さい場合は“1”近傍の値となり、音声信号fにおける子音部分の信号レベルが音声信号fにおける母音部分の信号レベルよりも小さい場合は“1”よりも大きい値となる。
第2の乗算回路120は、入力端子101から入力された音声信号fに加算回路119から入力された利得係数を乗算して、当該乗算結果を出力端子106に出力する。ここで、入力された音声信号fが子音以外の場合には第2の乗算回路120の出力信号の信号レベルの変化は少なく、入力された音声信号fが子音の場合には第2の乗算回路120の出力信号の信号レベルの変化は大きくなる。すなわち、音声信号fの母音部分の信号レベルはほとんど変化しない一方で、音声信号fの子音部分の信号レベルは大幅に増幅される。
(相関除去フィルタ回路107の構成)
図3は、図2の相関除去フィルタ回路の構成を示すブロック図である。図3において、相関除去フィルタ回路107は、入力端子201と、前向きフィルタ減算回路220−1〜220−Nと、遅延回路230−1〜230−Nと、後向きフィルタ減算回路240−1〜240−Nと、前向きフィルタ係数乗算回路250−1〜250−Nと、後向きフィルタ係数乗算回路260−1〜260−Nと、出力端子207とを備えて構成される。ここで、Nは自然数であり、段数を示す。このような格子型フィルタ回路であって逐次適応型フィルタ回路である相関除去フィルタ回路107では、前向きフィルタと後ろ向きフィルタとによって、時間的に前後から音声信号のうち自己相関を有する信号成分を高速で収束させることができる。
入力端子201は、入力端子101から入力される音声信号fを前向きフィルタ減算回路220−1、遅延回路230−1及び後向きフィルタ係数乗算回路260−1に出力する。前向きフィルタ減算回路220−1〜220−Nは互いに縦続接続されて構成される。ここで、各前向きフィルタ減算回路220−1〜220−Nは、入力される信号を次式(1)に基づいて演算する。
Figure 0006284003
ここで、変数iは、各前向きフィルタ減算回路220−1〜220−Nの段数を示し、変数jは、各前向きフィルタ減算回路220−1〜220−Nに入力される信号の時刻を示している。なお、時刻を示す変数jは、音声信号fのサンプリング周波数の逆数である単位時間で進行する。単位時間は、音楽CDであれば1/44100(秒)であり、電話回線であれば1/8000(秒)である。また、式(1)において、ki,jはi段目の時刻jにおけるフィルタ係数であり、bi−1はi−1段目の後向き予測誤差信号である。
まず、1段目の前向きフィルタ減算回路220−1は、式(1)の変数iを1として音声信号fを演算することによって、前向き予測誤差信号fを生成する。前向きフィルタ減算回路220−1は、前向き予測誤差信号fを前向きフィルタ減算回路220−2、前向きフィルタ係数乗算回路250−1及び後向きフィルタ係数乗算回路260−1に出力する。
次に、2段目の前向きフィルタ減算回路220−2は、式(1)の変数iを2として前向き予測誤差信号fを演算することによって、前向き予測誤差信号fを生成する。前向きフィルタ減算回路220−2は、前向き予測誤差信号fを次段へと出力する。
以上の処理が(N−1)段目まで繰り返し行われた後、前向き予測誤差信号fN−1がN段目の前向きフィルタ減算回路220−Nに入力される。N段目の前向きフィルタ減算回路220−Nは、式(1)の変数iをNとして前向き予測誤差信号fN−1を演算することによって、前向き予測誤差信号fを生成する。本実施形態において、前向き予測誤差信号fの振幅は、音声信号fの自己相関が高いほど“0”に近づき、音声信号fの自己相関が低いほど大きく発散する。
ここで、音声信号のうち母音は自己相関が高く、音声信号のうち子音は自己相関が低い。従って、前向き予測誤差信号fの振幅は、音声信号fが母音である場合には小さくなり、音声信号fが子音である場合には大きくなる。このような前向き予測誤差信号fは、前向きフィルタ減算回路220−Nから出力端子207、前向きフィルタ係数乗算回路250−N及び後向きフィルタ係数乗算回路260−Nに出力される。本実施形態に係る出力端子207は、前向き予測誤差信号fをフィルタ出力信号fとして比較回路108に出力する。
遅延回路230−1〜230−N及び後向きフィルタ減算回路240−1〜240―Nは互い違いに縦続接続されて構成される。各遅延回路230−1〜230−Nは、入力される信号に対して単位時間の遅延処理を施す。まず、1段目の遅延回路230−1は、音声信号fに単位時間の遅延を施すことによって遅延信号bを生成する。2段目の遅延回路230−2は、後述する後向きフィルタ減算回路240−1によって生成される後向き予測誤差信号bに単位時間の遅延処理を施す。このような処理が繰り返し行われた後、N段目の遅延回路230−Nは、N−1段目の後向きフィルタ減算回路によって生成される後向き予測誤差信号bN−2に単位時間の遅延処理を施す。各遅延回路230−1〜230−Nは、遅延処理を施した信号を後向きフィルタ減算回路240−1〜240−N及び前向きフィルタ係数乗算回路250−1〜250−Nに出力する。
各後向きフィルタ減算回路240−1〜240−Nは、入力される信号を次式(2)に基づいて演算する。
Figure 0006284003
ここで、ki,jはi段目の時刻jにおけるフィルタ係数であり、fi−1はi−1段目の前向き予測誤差信号である。
まず、1段目の後向きフィルタ減算回路240−1は、式(2)の変数iを1として遅延信号bを演算することによって、後向き予測誤差信号bを生成する。後向きフィルタ減算回路240−1は、後向き予測誤差信号bを遅延回路230−2に出力する。次に、2段目の後向きフィルタ減算回路240−2は、遅延回路230−2によって単位時間の遅延処理を施された後向き予測誤差信号bを、式(2)の変数iを2として演算することによって、後向き予測誤差信号bを生成する。
以上の処理が(N−1)段目まで繰り返し行われた後、遅延回路230−Nによって単位時間の遅延処理を施された後向き予測誤差信号bN−1がN段目の後向きフィルタ減算回路240−Nに入力される。N段目の後向きフィルタ減算回路240−Nは、式(2)の変数iをNとして後向き予測誤差信号bN−1を演算することによって、後向き予測誤差信号bを生成する。
各前向きフィルタ係数乗算回路250−1〜250−Nは、遅延回路230−1〜230−Nから入力される信号にフィルタ係数ki,jを乗算して前向きフィルタ減算回路220−1〜220−Nに出力する。ここで、前向きフィルタ係数乗算回路250−1〜250−Nは、次式(3)に基づいて、フィルタ係数ki,jを単位時間毎に更新する。上述の通り、単位時間は、音楽CDであれば1/44100(秒)であり、電話回線であれば1/8000(秒)である。
Figure 0006284003
ここで、ki,jはi段目の時刻jにおけるフィルタ係数であり、αは相関除去フィルタ回路107における収束の速さを決める定数(ただし、0.0≦α≦2.0)である。
このように、各前向きフィルタ係数乗算回路250−1〜250−Nは、i段目の前向き予測誤差信号fをi−1段目の後向き予測誤差信号bi−1で除算した商に定数αを乗算した値をフィルタ係数ki,jに加算することで、i段目の時刻j+1でのフィルタ係数ki,j+1を求める。従って、フィルタ係数ki,jとフィルタ係数ki,j+1との差(すなわち、単位時間当たりの修正量)は、前向き予測誤差信号fが大きいほど大きくなる。このように、前向きフィルタ係数乗算回路250−1〜250−Nにおいてフィルタ係数ki,jの学習が単位時間毎に実行される。
第1の実施形態に係る音声強調装置100によれば、入力される音声信号内の子音部分の第2の信号レベルと母音部分の第1の信号レベルとの関係を示すレベル関係信号を生成し、当該レベル関係信号に基づいて、第2の信号レベルが第1の信号レベルに比較して小さくなるにつれて利得係数が大きくなるので、入力される音声信号の子音部分を強調した音声信号を出力することが可能となる。
また、第1の実施形態に係る音声強調装置100によれば、第1の平滑化回路109が相関除去フィルタ回路107から出力されるフィルタ出力信号fに基づいて子音らしさの確率が高いほど“1”近傍の値を出力し、子音らしさの確率が低いほど“0”近傍の値を出力し、加算回路119が第1の平滑化回路109から出力される子音らしさを示す値に“1”の値を加算し、当該加算結果の値を入力された音声信号fに乗算する。従って、子音と母音とを明確に識別することなく、実環境で発声された音声に対しても、母音のような周期性のある信号以外の、子音のような周期性のない信号レベルを高くすることができる。そのため、高音域の聴力が低下した人の聴力を補償し、もしくは母音によりマスキングされ易い子音の信号レベルを補償することによって、音声信号の明瞭度を改善することができる。
さらに、第1の実施形態に係る音声強調装置100によれば、第1の乗算回路117が、判定回路116が出力する子音以外の部分の信号レベルVと子音部分の信号レベルCとのレベル比(V/C)の値を、第1の平滑化回路109から出力される子音らしさを示す値に乗算する。従って、母音から子音へのマスキング量に応じた子音の信号レベルの振幅を補償できるようになり、また子音の信号レベルCが子音以外の部分の信号レベルVよりも十分に大きい場合には第1の乗算回路117の出力の値は“0”の値もしくは“0”近傍の値となるため、必要以上に子音の信号レベルを増幅する必要がなく、さらに入力された音声信号fが打楽器のような周期性のない信号が多く含まれる音楽の場合でも信号レベルがほぼ一定となるので、音楽性が損なわれることを回避することができる。
またさらに、第1の実施形態に係る音声強調装置100によれば、相関除去フィルタ回路107のフィルタ係数は、単位時間(すなわち、サンプリング周波数の逆数)ごとに更新する。従って、相関除去フィルタ回路107に入力された音声信号fが、母音のような周期性のある信号であるのか、あるいは子音のような周期性のない信号であるのかを極めて迅速に予測することができるので、音声信号fから精度良く子音を抽出することができる。
第2の実施形態.
次に、第2の実施形態に係る音声強調装置100Aについて、図面を参照しながら説明する。以下においては、第1の実施形態との相違点について主に説明する。
図4は、本開示の第2の実施形態に係る音声強調装置100Aの構成を示すブロック図である。図4において、演算部103Aは、図2の演算部103に比較して、除算回路113の後段に第2の平滑化回路121をさらに備えたことを特徴とする。
図4において、第2の平滑化回路121は、除算回路113が出力する子音以外の信号レベルVと、子音の信号レベルCとのレベル比(V/C)の値を入力し、当該レベル比(V/C)の値を平滑化処理し、平滑化された値を減算回路115に出力する。すなわち、信号レベルCに対する信号レベルVの関係を示すレベル関係信号を平滑化処理して決定部104に出力する。
本実施形態に係る音声強調装置100Aによれば、第1の実施形態と同様の作用効果を有する。また、本実施形態に係る音声強調装置100Aによれば、第1の実施形態に係る音声強調装置100に比較して、さらに第2の平滑化回路121を備えているので、除算回路113が出力するレベル比(V/C)が平滑化されるため、子音以外の信号レベルVと、子音の信号レベルCとが短時間に大きく変化しても、第2の平滑化回路121の出力は緩やかな変化となる。従って、第1の実施形態に係る音声強調装置100に比較して、入力端子101から入力される音声信号fの子音の種類や母音の種類が変わることに伴う信号レベルの変化によりレベル比(V/C)の値が大きく変化することがなくなるので、第2の乗算回路120で入力された音声信号fの子音部の増幅も滑らかになって聞き取りやすくなる。
第3の実施形態.
上述した実施形態によれば、入力された音声信号fのうちの子音の信号レベルの振幅を大きくすることによって、音声の明瞭度を向上させたが、本開示はこれに限られるものではない。例えば、入力された音声信号fのうちの雑音の振幅を小さくすることによっても音声の明瞭度を向上させることもできる。以下第3の実施形態について具体的に説明する。
図5Aは、本開示の第3の実施形態に係る音声強調装置100Bの構成を示すブロック図である。図5Aにおいて、音声強調装置100Bは、図2の音声強調装置100に比較して、決定部104の代わりに決定部104Aを備えたことを特徴とする。また、決定部104Aは、図2の決定部104に比較して、加算回路119の代わりに減算回路119Aを備えたことを特徴とする。
図5Aにおいて、減算回路119Aは、定数“1.0”から第1の乗算回路117から入力された乗算結果の値を減算し、当該減算結果を利得係数として第2の乗算回路120に出力する。ここで、減算結果が負の値の場合には“0”の値を出力し、正の値の場合には第1の乗算回路117から入力された値をそのまま出力する。
本実施形態に係る音声強調装置100Bによれば、第2の乗算回路120の出力信号において、母音のような周期性のある信号以外の雑音のような周期性のない信号の信号レベルの振幅を小さくすることができる。従って、音声信号fから雑音を取り除くことができるので、音声の明瞭度を改善することができる。
本実施形態に係る音声強調装置100Bによれば、第1の実施形態と同様の作用効果を有する。また、本実施形態に係る音声強調装置100Bによれば、音声信号fのうち打楽器音の振幅を小さくすることによって、音声の明瞭度を向上させることができる。
さらに、本実施形態に係る音声強調装置100Bによれば、音声信号fに打楽器音と弦楽器音とが混ざっている場合に、第2の乗算回路120の出力信号において、弦楽器音のような周期性のある信号以外の打楽器音のような周期性のない信号の信号レベルの振幅だけを抑制させることができる。
図5Bは、本開示の第3の実施形態の変形例に係る音声強調装置100Cの構成を示すブロック図である。図5Bにおいて、音声強調装置100Cは、図2の音声強調装置100に比較して、決定部104の代わりに決定部104Bを備えたことを特徴とする。また、決定部104Bは、図2の決定部104に比較して、減算回路119Aをさらに備え、例えばユーザにより、第1の乗算回路117からの乗算結果の値を、第1の実施形態に係る加算回路119を介して第2の乗算回路120に出力するか、もしくは、第3の実施形態に係る減算回路119Aを介して第2の乗算回路120に出力するかを選択的に切り替える第1の切替部である切替部200をさらに備えたことを特徴とする。この場合には、切替部200によって加算回路119に切り替えることによって、周期性のない打楽器音だけを強調させることが可能となる。すなわち、例えばユーザが子音部分を強調させたいときは切替部200を用いて加算回路119に切り替え、母音部分を強調させたいときは切替部200を用いて第2の減算回路である減算回路119Aに切り替える。
第4の実施形態.
図6は、本開示の第4の実施形態に係る音声強調装置100Dの構成を示すブロック図である。図6において、音声強調装置100Dは、図2の音声強調装置100に比較して、演算部103の代わりに演算部103Bを備えたことを特徴とする。また、図6の演算部103Bは、図2の演算部103に比較して、第1のピークホールド回路111において信号レベルVの計測を停止させる第1の判定部である判定回路129をさらに備え、当該判定回路129の前段にしきい値レベル128Rを有する比較器128をさらに備えたことを特徴とする。
図6において、比較器128は、入力された音声信号fの電圧レベルと所定のしきい値レベル128Rとを比較し、当該比較結果を判定回路129に出力する。また、判定回路129は、比較器128からの比較結果に基づいて、第1のピークホールド回路111を停止させる信号を生成し、当該信号を第1のピークホールド回路111に出力する。ここで、判定回路129は、音声信号fの電圧レベルがしきい値レベル128R以下の場合に、第1のピークホールド回路111を停止させる。
本実施形態に係る音声強調装置100Dによれば、第1の実施形態と同様の作用効果を有する。また、本実施形態に係る音声強調装置100Dによれば、第1の実施形態に係る音声強調装置100に比較すると、子音/母音判定回路110から子音・母音識別信号として“0”の値が出力される場合にさらに、入力された音声信号fの電圧レベルがしきい値レベル128R以下の場合には、第1のピークホールド回路111における計測を停止させるので、無音区間での信号レベル計測が回避されて演算量をさらに減少させる一方で母音の信号レベルを正しく求めることが可能となる。すなわち、音声信号fの電圧レベルが所定のしきい値128R以下であれば無音と判定して積分演算を停止させる。
なお、本実施形態では、判定回路129は、音声信号fの電圧レベルを用いて第1のピークホールド回路111を停止させる信号を生成したが、本開示はこれに限らず、音声信号fの電流レベルを用いても同様の効果を得ることができる。
第5の実施形態.
図7は、本開示の第5の実施形態に係る音声強調装置100Eの構成を示すブロック図である。図7において、音声強調装置100Eは、図2の音声強調装置100に比較して、演算部103の代わりに演算部103Cを備えたことを特徴とする。また、演算部103Cは、図2の演算部103に比較して、第1のピークホールド回路111において信号レベルVの計測を停止させる第2の判定部である判定回路131をさらに備えたことを特徴とする。
図7において、判定回路131は、比較回路108からの比較結果に基づいて、第1のピークホールド回路111を停止させる信号を生成し、当該信号を第1のピークホールド回路111に出力する。ここで、判定回路131は、入力された音声信号fの電圧レベルの振幅が相関除去フィルタ回路107のフィルタ出力信号fの電圧レベルの振幅に比べて例えば10倍程度大きく相関除去フィルタ回路107が収束していると推測される場合には、音声信号fの信号レベルVの計測を行い、それ以外の場合には音声信号fの信号レベルVの計測を停止させる。
本実施形態に係る音声強調装置100Eによれば、第1の実施形態と同様の作用効果を有する。また、本実施形態に係る音声強調装置100Eによれば、第1の実施形態に係る音声強調装置100に比較すると、子音/母音判定回路110から子音・母音識別信号として“0”の値が出力される場合にさらに、入力された音声信号fの振幅が相関除去フィルタ回路107のフィルタ出力信号fの振幅に比べて例えば10倍程度大きく相関除去フィルタ回路107が収束していると推測される場合には、信号レベルVの計測を行い、それ以外の場合には信号レベルVの計測を停止させることができるので、相関除去フィルタ回路107が収束しておらず母音ではなく無音である可能性が高い区間での信号レベル計測が回避され、演算量を減らしながら母音の信号レベルを正しく求めることができる。
なお、本実施形態では、音声信号fの電圧レベルを用いて第1のピークホールド回路111を停止させる信号を生成したが、本開示はこれに限らず、音声信号fの電流レベルを用いても同様の効果を得ることができる。
第6の実施形態.
図8Aは、本開示の第6の実施形態に係る音声強調装置100Fの構成を示すブロック図である。図8Aにおいて、音声強調装置100Fは、図2の音声強調装置100に比較して、演算部103の代わりに演算部103Dを備えたことを特徴とする。また、演算部103Dは、図2の演算部103に比較して、除算回路113を動作させる第3の判定部である判定回路140をさらに備えたことを特徴とする。
図8Aにおいて、判定回路140は、子音/母音判定回路110から入力された子音・母音識別信号に基づいて、除算回路113を動作させる信号を生成し、当該信号を除算回路113に出力する。ここで、除算回路113は、第1のピークホールド回路111が出力する子音以外の信号レベルVの値を第2のピークホールド回路112が出力する子音の信号レベルCの値で除算してレベル比(V/C)の値を出力する頻度を、子音から母音に変化した時や、逆に母音から子音に変化した時や、第1のピークホールド回路111または第2のピークホールド回路112がピークを検出した後に限定することが可能となる。例えば、第6の実施形態において、判定回路140は、子音から母音に変化した後もしくは母音から子音に変化した後の一定期間のみ除算回路113を動作させる第2の判定回路である。
本実施形態に係る音声強調装置100Fによれば、第1の実施形態と同様の作用効果を有する。また、本実施形態に係る音声強調装置100Fによれば、第1の実施形態に係る音声強調装置100に比較すると、除算回路113が、第1のピークホールド回路111が出力する子音以外の信号レベルVを第2のピークホールド回路112が出力する子音以外の信号レベルCで除算してレベル比(V/C)の値を出力する頻度を減らすことができるので、演算量をさらに減らすことが可能となる。
第7の実施形態.
図8Bは、本開示の第7の実施形態に係る音声強調装置100Gの構成を示すブロック図である。図8Bにおいて、音声強調装置100Gは、図2の音声強調装置100に比較して、演算部103の代わりに演算部103Eを備えたことを特徴とする。また、演算部103Eは、図2の演算部103に比較して、第1のピークホールド回路111と、第2のピークホールド回路112と、除算回路113とを動作させるタイマー回路150をさらに備えたことを特徴とする。
図8Bにおいて、タイマー回路150は、例えば数秒間などの所定の第1の時間を計測して、第1のピークホールド回路111及び第2のピークホールド回路112が当該所定の第1の時間内の音声信号fの信号レベルV及び信号レベルCの最大値を計測するように各第1のピークホールド回路111及び第2のピークホールド回路112を周期的に繰り返し動作させる。また、タイマー回路150は、所定の第1の時間が経過する毎に除算回路113を周期的に繰り返し動作させる。例えば、第7の実施形態において、タイマー回路150は例えば3秒間などの一定時間を計測し、第1のピークホールド回路111及び第2のピークホールド回路112は3秒間での最大値をそれぞれ検出し、除算回路113は3秒間が経過する毎に動作する。この構成によれば、除算回路113が動作する頻度を、タイマー回路150が第1の時間を計測し終わる時に限定することが可能となる。
本実施形態に係る音声強調装置100Gによれば、第1の実施形態と同様の作用効果を有する。また、本実施形態に係る音声強調装置100Gによれば、第1の実施形態に係る音声強調装置100に比較すると、除算回路113が、第1のピークホールド回路111が出力する子音以外の信号レベルVを第2のピークホールド回路112が出力する子音信号レベルCで除算してレベル比(V/C)の値を出力する頻度を減らすことができるので、演算量をさらに減らすことが可能となる。
第8の実施形態.
図8Cは、本開示の第8の実施形態に係る音声強調装置100Hの構成を示すブロック図である。図8Cにおいて、音声強調装置100Hは、図2の音声強調装置100に比較して、演算部103の代わりに演算部103Fを備えたことを特徴とする。また、演算部103Fは、図2の演算部103に比較して、後述する切替部157を動作させる低速充電高速放電型の第3の積分回路であるディップホールド回路155と、定数“0.0”を発生させる定数発生器156と、当該定数発生器156からの定数“0.0”の値を、減算回路115に出力するか、もしくは除算回路113からのレベル比(V/C)の値を減算回路115に出力するかを選択的に切り替える第2の切替部である切替部157をさらに備えたことを特徴とする。
図8Cにおいて、ディップホールド回路155は、入力端子101から入力された音声信号fの最低信号レベルを計測し、当該最低信号レベルが所定の第2のしきい値以上の場合は、当該定数発生器156からの定数“0.0”の値を減算回路115に出力し、当該最低信号レベルが所定の第2のしきい値未満の場合は、除算回路113からのレベル比(V/C)の値を減算回路115に出力するように切替部157を制御する。ここで、所定の第2のしきい値は、背景雑音や背景音楽の信号レベルが高くて子音を増幅することが困難である場合において、ディップホールド回路155が計測する最低信号レベルが超える値に設定する。すなわち、背景雑音や背景音楽の信号レベルが比較的高いときは切替部157を用いて定数発生器156に切り替え、背景雑音や背景音楽の信号レベルが比較的低いときは切替部157を用いて除算回路113に切り替える。
本実施形態に係る音声強調装置100Hによれば、第1の実施形態と同様の作用効果を有する。また、本実施形態に係る音声強調装置100Hによれば、第1の実施形態に係る音声強調装置100に比較すると、背景雑音や背景音楽の信号レベルが高い場合には、定数発生器156からの定数“0.0”を減算回路115に出力するので、入力端子101から入力された音声信号fが全く増幅されない。従って、背景雑音や背景音楽の信号レベルが高い場合に子音が増幅されることが回避されるので、出力端子106から出力される出力信号の品質を改善することが可能となる。
第9の実施形態.
第1の実施形態に係る第1の平滑回路109は、比較回路108の判定結果を積分して平滑し、または、比較回路108の判定結果において“1”の値を出力する頻度を算出することによって子音らしさを示す値を算出するが、子音をより強調させるために第1の平滑回路109からの出力値に対して所定の演算処理を実行することにより子音らしさを示す値を算出するようにしてもよい。
図8Dは、本開示の第9の実施形態に係る音声強調装置100Iの構成を示すブロック図である。図8Dにおいて、音声強調装置100Iは、図2の音声強調装置100に比較して、生成部102の代わりに生成部102Aを備えたことを特徴とする。また、生成部102Aは、図2の生成部102に比較して、第1の平滑化回路109からの平滑処理後の値に基づいて、子音らしさを示す値を生成して出力する関数値回路160をさらに備えたことを特徴とする。
図8Dにおいて、関数値回路160は、第1の平滑化回路109から平滑処理された値を入力し、平滑処理された値に対して所定の演算処理を行い、当該演算結果の値を子音らしさを示す値として子音/母音判定回路110及び第1の乗算回路117に出力する。
図9Aは、図8Dの関数値回路160の入力値xに対する出力値yの変化を示すグラフである。図9Aにおいて、関数値回路160は、第1の平滑化回路109からの入力値xに対して、出力値yを次式(4)により算出する。ここで、出力値yは子音らしさを示す値である。
Figure 0006284003
本実施形態に係る音声強調装置100Iによれば、第1の実施形態と同様の作用効果を有する。また、本実施形態に係る音声強調装置100Iによれば、第1の実施形態に係る音声強調装置100に比較して、入力された音声信号fが子音の場合には関数値回路160からの出力値yはより“1”に近い値となり、入力された音声信号fが子音以外の場合には関数値回路160からの出力値yはより“0”に近い値となるので、子音以外に比べて子音をより強調させることが可能となる。
なお、本実施形態では、上述した式(4)に示すような係数を用いたが、本開示はこれに限らず次式(5)を用いて同様の効果を得ることができる。
Figure 0006284003
ここで、aは1以上の実数であり、bは実数であり、xは関数値回路160に対する入力値であり、yは関数値回路160からの出力値である。なお、出力値yは子音らしさを示す値である。
また、上述した演算式以外の演算式を用いてもよい。
図9Bは、本開示の第9の実施形態の変形例に係る、図8Dの関数値回路160の入力値xに対する出力値yの変化を示すグラフである。図9Bにおいて、関数値回路160は、第1の平滑化回路109からの入力値xに対して、出力値yは次式(6)を用いて算出する。ここで、出力値yは子音らしさを示す値である。
Figure 0006284003
第9の実施形態の変形例に係る音声強調装置によれば、第1の実施形態と同様の作用効果を有する。また、本実施形態に係る音声強調装置によれば、第1の実施形態に係る音声強調装置100に比較して、入力された音声信号fが子音の場合には関数値回路160からの出力値yはより“1”に近い値となり、入力された音声信号fが子音以外の場合には関数値回路160からの出力値yはより“0”に近い値となるので、子音以外に比べて子音をより強調させることが可能となる。
なお、上述した第9の実施形態の変形例では、上述した式(6)に示すような係数を用いたが、本開示はこれに限らず次式(7)を用いて同様の効果を得ることができる。ここで、定数cは1.0未満であり、定数bは1.0以上である。
Figure 0006284003
ここで、xは関数値回路160に対する入力値であり、yは関数値回路160からの出力値である。なお、出力値yは子音らしさを示す値である。
第10の実施形態.
図10は、本開示の第10の実施形態に係る音声強調装置100Jの構成を示すブロック図である。図10において、音声強調装置100Jは、図2の音声強調装置100に比較して、演算部103の代わりに演算部103Gを備えたことを特徴とする。ここで、演算部103Gは、図2の演算部103に比較して、第1のピークホールド回路111の後段にしきい値レベル170Rを有する比較器170と、第2のピークホールド回路112の後段にしきい値レベル171Rを有する比較器171と、当該比較器170,171からの出力結果に基づいて除算回路113を停止させる第3の判定回路である判定回路158と、除算回路113から出力されるレベル比(V/C)の値を格納するメモリ172とをさらに備えたことを特徴とする。
図10において、比較器170は、第1のピークホールド回路111から出力された電圧レベルと所定のしきい値レベル170Rとを比較し、当該比較結果を判定回路158に出力する。また、比較器171は、第2のピークホールド回路112から出力された電圧レベルと所定のしきい値レベル171Rとを比較し、当該比較結果を判定回路158に出力する。
判定回路158は、比較器170からの比較結果及び比較器171からの比較結果に基づいて、除算回路113を停止させる信号を生成し、当該信号を除算回路113に出力し、除算回路113を停止させる。また、判定回路158は、比較器170からの比較結果及び比較器171からの比較結果に基づいて、メモリ172から除算回路113が停止する直近に格納されたレベル比(V/C)のデータを読み出して、当該読み出されたデータを減算回路115に出力し続ける。ここで、判定回路158は、第1のピークホールド回路111から出力された電圧レベルが所定のしきい値レベル170R以下の場合か、もしくは第2のピークホールド回路112から出力された電圧レベルが所定のしきい値レベル171R以下の場合に、除算回路113の動作を停止させ、除算回路113が停止する直近のレベル比(V/C)の値を第2の減算回路である減算回路115に出力し続ける第3の判定回路である。一方、第1のピークホールド回路111から出力された電圧レベルが所定のしきい値レベル170Rよりも高くかつ第2のピークホールド回路112から出力された電圧レベルが所定のしきい値レベル171Rよりも高い場合は、除算回路113は、第1のピークホールド回路111から入力された音声信号fの子音以外の信号レベルVを、第2のピークホールド回路112から入力された音声信号fの子音の信号レベルCで除算してレベル比(V/C)を算出して当該レベル比(V/C)の値を減算回路115に出力する。
本実施形態に係る音声強調装置100Jによれば、第1の実施形態と同様の作用効果を有する。また、本実施形態に係る音声強調装置100Jによれば、第1のピークホールド回路111もしくは第2のピークホールド回路112から出力された電圧レベルのうちのいずれかがそれぞれの所定のしきい値以下であれば除算回路113を停止させ、除算回路113が停止する直近のレベル比(V/C)の値を減算回路115に出力し続けさせることができる。従って、無音区間と推測される場合にはレベル比(V/C)の値を一定に保つことができるので、無音区間後の有音区間において、直ちにかつ適切に子音の信号レベルを増幅させることが可能となる。
変形例1.
上述した実施形態では、相関除去フィルタ回路107のフィルタ係数ki,j(iは1〜Nである。)は式(3)に基づいて単位時間毎に更新され続けるとしたが、本開示はこれに限られるものではない。例えば、比較回路108が前向き予測誤差信号fの振幅が音声信号fの振幅よりも大きいと判定した場合にはフィルタ係数ki,jを“0”に設定してもよい。すなわち、相関除去フィルタ回路107は、それぞれ所定のフィルタ係数を有する前向きフィルタ係数乗算回路及び後向きフィルタ係数乗算回路を含み、フィルタ出力信号が音声信号の振幅よりも大きいときに、フィルタ係数を“0”に設定する。この場合には、予測誤差信号fの振幅が音声信号fの振幅よりも大きいことは、相関除去フィルタ回路107によって音声信号fが予測されていないことを意味する。従って、この場合、相関除去フィルタ回路107を通過している音声信号fは子音である可能性が高い。そこで、フィルタ係数ki,jを“0”に設定することによって、無相関信号が格子型フィルタ回路に入力し続けることによるフィルタ係数ki,jの発散を防止して、相関除去フィルタ回路107を安定的に動作させることができる。
上述した変形例1に係る音声強調装置によれば、第1の実施形態と同様の作用効果を得ることができる。また、変形例1に係る音声強調装置によれば、第1の実施形態に係る音声強調装置100に比較して、相関除去フィルタ回路107をさらに安定して動作させることが可能となる。
変形例2.
上述した実施形態では、判定回路116は、減算回路115の出力が負の値の場合には“0”の値を出力し、それ以外の場合はレベル比(V/C)の値をそのまま出力しているが、本開示はこれに限られるものではない。減算回路115の出力の値が負の値の場合には“0”の値を出力し、それ以外の場合は定数の値を出力することによって、入力された音声信号fが子音の場合に第2の乗算回路120において入力された音声信号fに乗算される値も定数となるので、上述した実施形態に係る音声強調装置に比較して、子音の増幅利得が固定化されて聞き取りやすくすることが可能となる。
変形例3.
上述した実施形態に係る音声強調装置においては、相関除去フィルタ回路107として格子型フィルタ回路を用いたが、本開示はこれに限らず、例えばFIRフィルタ回路、IIRフィルタ回路などを用いてもよい。この場合においては、上述した実施形態に比較して、演算量をさらに削減することが可能となる。
変形例4.
上述した実施形態に係る音声強調装置においては、除算回路113でレベル比(V/C)を求めているが、本開示はこれに限らず、例えばレベル比(V/C)に上限値を設定してもよい。この構成によれば、上述した実施形態に比較して、過度な子音の増幅を防ぐことが可能となる。
なお、上述した定数値発生器118,156は、例えば記憶領域を有するシフトレジスタであってもよいし、もしくは定数値を発生させる、コンピュータにより実行可能なプログラム及びそのプログラムを記録したコンピュータにより読取可能な記録媒体であってもよい。
以上詳述したように、本開示に係る音声強調装置及び音声強調方法によれば、音声信号の明瞭度を改善することができるので、補聴器や語学学習機器のように聴取者の聴力を支援することが必要な用途に適用できる。
100,100A,100B,100D,100E,100F,100G,100H,100I,100J…音声強調装置、
101…入力端子、
102,102A…生成部、
103,103A,103B,103C,103D,103E,103F,103G…演算部、
104,104A,104B…決定部、105…乗算部、
106…出力端子、
107…相関除去フィルタ回路、
108…比較回路、
128,170,171…比較器、
109…第1の平滑化回路、
110…子音/母音判定回路、
111…第1のピークホールド回路、
112…第2のピークホールド回路、
113…除算回路、
114…しきい値発生器、
115,119A…減算回路、
116,129,131,140,158…判定回路、
117…第1の乗算回路、
118,156…定数発生器、
119…加算回路、
120…第2の乗算回路、
121…第2の平滑化回路、
122…第3の平滑化回路、
150…タイマー回路、
155…ディップホールド回路、
157,200…切替部、
160…関数値回路、172…メモリ、
201…入力端子、
207…出力端子、
220−1〜220−N…前向きフィルタ減算回路、
230−1〜230−N…遅延回路、
240−1〜240−N…後向きフィルタ減算回路、
250−1〜250−N…前向きフィルタ係数乗算回路、
260−1〜260−N…後向きフィルタ係数乗算回路。

Claims (19)

  1. 所定のサンプリング周波数で入力される音声信号から、子音らしさを示す値を生成して出力する生成部と、
    前記子音らしさを示す値に基づいて、前記音声信号内の子音部分と母音部分とを識別した子音・母音識別信号を生成し、前記音声信号及び前記子音・母音識別信号に基づいて、前記音声信号における母音部分の第1の信号レベルと子音部分の第2の信号レベルとを検出し、前記第2の信号レベルに対する前記第1の信号レベルの関係を示すレベル関係信号を出力する演算部と、
    前記レベル関係信号に基づいて、前記第2の信号レベルが前記第1の信号レベルよりも小さいときに、“1”を超える利得係数であって、前記第2の信号レベルが前記第1の信号レベルに対して小さくなるにつれて当該利得係数が大きくなるように当該利得係数を決定する決定部と、
    前記音声信号に前記利得係数を乗算して前記音声信号の子音部分を強調した音声信号を出力する乗算部とを備えた音声強調装置。
  2. 前記利得係数は、前記第2の信号レベルが前記第1の信号レベルよりも大きいときに“1”近傍の値である請求項1記載の音声強調装置。
  3. 前記生成部は、
    前記音声信号から自己相関を有する信号成分を除去し、周期性のない信号をフィルタ出力信号として出力する相関除去フィルタ回路と、
    前記周期性のない信号の振幅と、前記音声信号の振幅とを比較し、当該比較結果を出力する比較回路と、
    前記比較結果を平滑化処理して前記子音らしさを示す値を生成して出力する第1の平滑化回路とを備えた請求項1又は2記載の音声強調装置。
  4. 前記生成部は、
    前記音声信号から自己相関を有する信号成分を除去し、周期性のない信号をフィルタ出力信号として出力する相関除去フィルタ回路と、
    前記周期性のない信号の振幅と、前記音声信号の振幅とを比較し、当該比較結果を出力する比較回路と、
    前記比較結果を平滑化処理し、当該平滑化処理後の値を出力する第1の平滑化回路と、
    前記平滑化処理後の値に基づいて、前記子音らしさを示す値を生成して出力する関数値回路とを備え、
    前記関数値回路は、前記子音らしさを示す値を、
    Figure 0006284003
    により算出し、
    ここで、aは1以上の実数であり、bは実数であり、xは関数値回路に対する入力値であり、yは子音らしさを示す値である請求項1又は2記載の音声強調装置。
  5. 前記相関除去フィルタ回路は、逐次適応型フィルタ回路である請求項3又は4記載の音声強調装置。
  6. 前記相関除去フィルタ回路は、それぞれ所定のフィルタ係数を有する前向きフィルタ係数乗算回路及び後向きフィルタ係数乗算回路を含み、
    前記フィルタ出力信号が前記音声信号の振幅よりも大きいときに、前記フィルタ係数を0に設定する請求項3〜5のうちのいずれか1つに記載の音声強調装置。
  7. 前記演算部はさらに、前記レベル関係信号を平滑化処理して前記決定部に出力する第2の平滑化回路を備える請求項1〜6のうちのいずれか1つに記載の音声強調装置。
  8. 前記演算部は、
    前記子音らしさを示す値に基づいて、前記音声信号が子音もしくは子音以外であるかを示す子音・母音識別信号を生成して出力する子音/母音判定回路と、
    前記子音・母音識別信号に基づいて、前記第1の信号レベルを検出する第1の積分回路と、
    前記子音・母音識別信号に基づいて、前記第2の信号レベルを検出する第2の積分回路と、
    前記第1の信号レベルを前記第2の信号レベルで除算してレベル比を算出し、当該レベル比を前記レベル関係信号として出力する除算回路とを備えた請求項1〜7のうちのいずれか1つに記載の音声強調装置。
  9. 前記決定部は、
    前記除算回路から出力されるレベル比から所定のしきい値を減算し、当該減算結果の値を出力する第1の減算回路と、
    前記第1の減算回路から出力された減算結果の値が負の値となる場合には“0”の値を出力し、前記第1の減算回路の減算結果が負の値以外の場合には当該減算結果の値をそのまま出力する第1の判定回路と、
    前記子音らしさを示す値に前記第1の判定回路から入力された値を乗算し、当該乗算結果の値を出力する乗算回路と、
    前記乗算回路から入力された前記乗算結果の値に定数“1.0”を加算し、当該加算結果の値を前記利得係数として前記乗算部に出力する加算回路とを備えた請求項8記載の音声強調装置。
  10. 前記決定部は、
    前記除算回路から出力されるレベル比から所定のしきい値を減算し、当該減算結果の値を出力する第1の減算回路と、
    前記第1の減算回路から出力された減算結果の値が負の値となる場合には“0”の値を出力し、前記第1の減算回路の減算結果が負の値以外の場合には所定の定数を出力する第1の判定回路と、
    前記子音らしさを示す値に前記第1の判定回路から入力された値を乗算し、当該乗算結果の値を出力する乗算回路と、
    前記乗算回路から入力された前記乗算結果の値に定数“1.0”を加算し、当該加算結果の値を前記利得係数として前記乗算部に出力する加算回路とを備えた請求項8記載の音声強調装置。
  11. 前記決定部はさらに、
    前記乗算回路から出力される乗算結果の値を定数“1.0”の値から減算し、当該減算結果の値を前記利得係数として前記乗算部に出力する第2の減算回路と、
    前記乗算回路から出力される乗算結果の値を、前記加算回路を介して前記乗算部に出力するか、もしくは、前記第2の減算回路を介して前記乗算部に出力するかを選択的に切り替える第1の切替部とを備えた請求項9又は10記載の音声強調装置。
  12. 前記演算部はさらに、
    前記音声信号の最低信号レベルを計測する第3の積分回路と、
    前記最低信号レベルが所定の第2のしきい値以上の場合は、定数“0.0”の値を前記第1の減算回路に出力するか、もしくは、前記最低信号レベルが所定の第2のしきい値未満の場合は、前記除算回路から出力されるレベル比の値を前記第1の減算回路に出力するかを選択的に切り替える第2の切替部とを備えた請求項9〜11のうちのいずれか1つに記載の音声強調装置。
  13. 前記第1の積分回路は、第1のピークホールド回路であり、
    前記第2の積分回路は、第2のピークホールド回路である請求項8〜12のうちのいずれか1つに記載の音声強調装置。
  14. 前記演算部はさらに、
    前記入力される音声信号の信号レベルが所定のしきい値以下であれば無音と判定して前記第1の積分回路を停止させる第1の判定部を備えた請求項8〜13のうちのいずれか1つに記載の音声強調装置。
  15. 前記演算部はさらに、
    前記音声信号の信号レベルと前記フィルタ出力信号の信号レベルとの差が所定値よりも小さければ無音と判定して前記第1の積分回路を停止させる第2の判定部を備えた請求8〜14のうちのいずれか1つに記載の音声強調装置。
  16. 前記演算部はさらに、
    前記子音・母音識別信号に基づいて、子音から母音に変化した後もしくは母音から子音に変化した後の一定期間のみ前記除算回路を動作させる第2の判定回路を備えた請求項8〜15のうちのいずれか1つに記載の音声強調装置。
  17. 前記演算部はさらに、
    前記除算回路から出力されたレベル比の値を格納するメモリと、
    前記第1の積分回路もしくは前記第2の積分回路から出力された電圧レベルのうちのいずれかがそれぞれの所定のしきい値以下であれば無音と判定して前記除算回路を停止させ、前記メモリから前記除算回路が停止する直近に格納された前記レベル比の値を読み出して前記第2の減算回路に出力し続けさせる第3の判定回路とを備えた請求項8〜16のうちのいずれか1つに記載の音声強調装置。
  18. 前記演算部はさらに、
    所定の第1の時間を計測し、前記所定の第1の時間内の前記第1の信号レベル及び前記第2の信号レベルの最大値を計測するように前記第1の積分回路及び前記第2の積分回路を動作させ、前記所定の第1の時間が経過する毎に前記除算回路を動作させるタイマー回路を備えた請求項8〜17のうちのいずれか1つに記載の音声強調装置。
  19. 入力される音声信号をその子音部分を強調するための音声強調装置のための音声強調方法であって、
    前記音声強調方法は、
    所定のサンプリング周波数で入力される音声信号から、子音らしさを示す値を生成して出力することと、
    前記子音らしさを示す値に基づいて、前記音声信号内の子音部分と母音部分とを識別した子音・母音識別信号を生成し、前記音声信号及び前記子音・母音識別信号に基づいて、前記音声信号における母音部分の第1の信号レベルと子音部分の第2の信号レベルとを検出し、前記第2の信号レベルに対する前記第1の信号レベルの関係を示すレベル関係信号を出力することと、
    前記レベル関係信号に基づいて、前記第2の信号レベルが前記第1の信号レベルよりも小さいときに、“1”を超える利得係数であって、前記第2の信号レベルが前記第1の信号レベルに比較して小さくなるにつれて当該利得係数が大きくなるように当該利得係数を決定することと、
    前記音声信号に前記利得係数を乗算して前記音声信号の子音部分を強調した音声信号を出力することとを含む音声強調方法。
JP2014006951A 2013-03-27 2014-01-17 音声強調装置及び方法 Active JP6284003B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2014006951A JP6284003B2 (ja) 2013-03-27 2014-01-17 音声強調装置及び方法
US14/170,919 US9245537B2 (en) 2013-03-27 2014-02-03 Speech enhancement apparatus and method for emphasizing consonant portion to improve articulation of audio signal

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2013065866 2013-03-27
JP2013065866 2013-03-27
JP2014006951A JP6284003B2 (ja) 2013-03-27 2014-01-17 音声強調装置及び方法

Publications (2)

Publication Number Publication Date
JP2014209182A JP2014209182A (ja) 2014-11-06
JP6284003B2 true JP6284003B2 (ja) 2018-02-28

Family

ID=51621689

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014006951A Active JP6284003B2 (ja) 2013-03-27 2014-01-17 音声強調装置及び方法

Country Status (2)

Country Link
US (1) US9245537B2 (ja)
JP (1) JP6284003B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR3020711B1 (fr) * 2014-05-02 2016-05-13 3Db Methode de compression et compresseur de dynamique audio
KR101682796B1 (ko) * 2015-03-03 2016-12-05 서울과학기술대학교 산학협력단 소음 환경에서 음절 형태 기반 음소 가중 기법을 이용한 음성의 명료도 향상 방법 및 이를 기록한 기록매체
CN109688460B (zh) * 2018-12-24 2021-05-18 深圳创维-Rgb电子有限公司 一种数字电视画面的辅音输出方法、数字电视及存储介质
JPWO2020217605A1 (ja) 2019-04-23 2020-10-29

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05249994A (ja) * 1991-10-18 1993-09-28 Gijutsu Kenkyu Kumiai Iryo Fukushi Kiki Kenkyusho 音声強調装置
JPH075898A (ja) * 1992-04-28 1995-01-10 Technol Res Assoc Of Medical & Welfare Apparatus 音声信号処理装置と破裂性抽出装置
JPH07104788A (ja) * 1993-10-06 1995-04-21 Technol Res Assoc Of Medical & Welfare Apparatus 音声強調処理装置
JPH10145897A (ja) 1996-11-15 1998-05-29 Yamaha Corp 話速変換装置
JP4235128B2 (ja) * 2004-03-08 2009-03-11 アルパイン株式会社 入力音処理装置
US7457741B2 (en) 2004-03-30 2008-11-25 National Institute of Advnaced Industrial Science and Technology Device for transmitting speech information
JP4012970B2 (ja) 2004-03-31 2007-11-28 独立行政法人産業技術総合研究所 音声情報伝達装置
JP4150795B2 (ja) 2005-01-21 2008-09-17 国立大学法人徳島大学 聴覚補助装置、音声信号処理方法、音声処理プログラム及びコンピュータで読み取り可能な記録媒体並びに記録した機器
US20060206320A1 (en) * 2005-03-14 2006-09-14 Li Qi P Apparatus and method for noise reduction and speech enhancement with microphones and loudspeakers
JP4876245B2 (ja) * 2006-02-17 2012-02-15 国立大学法人九州大学 子音加工装置、音声情報伝達装置及び子音加工方法
JP4946293B2 (ja) * 2006-09-13 2012-06-06 富士通株式会社 音声強調装置、音声強調プログラムおよび音声強調方法
JP5148414B2 (ja) 2008-08-29 2013-02-20 株式会社東芝 信号帯域拡張装置
WO2010146711A1 (ja) * 2009-06-19 2010-12-23 富士通株式会社 音声信号処理装置及び音声信号処理方法

Also Published As

Publication number Publication date
US20140297273A1 (en) 2014-10-02
JP2014209182A (ja) 2014-11-06
US9245537B2 (en) 2016-01-26

Similar Documents

Publication Publication Date Title
US6038532A (en) Signal processing device for cancelling noise in a signal
JP4279357B2 (ja) 特に補聴器における雑音を低減する装置および方法
JP6284003B2 (ja) 音声強調装置及び方法
US20150255085A1 (en) Noise reduction device
CN105103230B (zh) 信号处理装置、信号处理方法、信号处理程序
US8259961B2 (en) Audio processing apparatus and program
Zhang et al. Fast nonstationary noise tracking based on log-spectral power mmse estimator and temporal recursive averaging
JP2017122908A (ja) 信号処理装置および信号処理方法
JP5815435B2 (ja) 音源位置判定装置、音源位置判定方法、プログラム
JP2019020678A (ja) ノイズ低減装置および音声認識装置
JP6182862B2 (ja) 信号処理装置、信号処理方法、及び信号処理プログラム
Khoubrouy et al. A method of howling detection in presence of speech signal
JP6930089B2 (ja) 音響処理方法および音響処理装置
JP2018072723A (ja) 音響処理方法および音響処理装置
JP7035924B2 (ja) チャネル選択装置、チャネル選択方法、およびプログラム
JP2018072368A (ja) 音響解析方法および音響解析装置
JP5975398B2 (ja) 音声強調装置
JP5157474B2 (ja) 音処理装置およびプログラム
JP2015031913A (ja) 音声処理装置、音声処理方法、及びプログラム
JP4242320B2 (ja) 音声認識方法、その装置およびプログラム、その記録媒体
Subramani et al. Noise-Robust DSP-Assisted Neural Pitch Estimation With Very Low Complexity
KR102167469B1 (ko) 피드백 처리 방법
US11877128B2 (en) Audio signal processing method, apparatus, and program
JP6559576B2 (ja) 雑音抑圧装置、雑音抑圧方法及びプログラム
JP5157475B2 (ja) 音処理装置およびプログラム

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20141001

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20141008

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20161216

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20171124

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20171219

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180118

R151 Written notification of patent or utility model registration

Ref document number: 6284003

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151