JP2021117359A - 音声明瞭化装置および音声明瞭化方法 - Google Patents

音声明瞭化装置および音声明瞭化方法 Download PDF

Info

Publication number
JP2021117359A
JP2021117359A JP2020010878A JP2020010878A JP2021117359A JP 2021117359 A JP2021117359 A JP 2021117359A JP 2020010878 A JP2020010878 A JP 2020010878A JP 2020010878 A JP2020010878 A JP 2020010878A JP 2021117359 A JP2021117359 A JP 2021117359A
Authority
JP
Japan
Prior art keywords
audio signal
voice
phase
formant
band filter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2020010878A
Other languages
English (en)
Inventor
正司 最上
Masaji Mogami
正司 最上
貢 ▲高▼松
貢 ▲高▼松
Mitsugu Takamatsu
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kotobuki Communication Instr Co Ltd
Kotobuki Communication Instrument Co Ltd
Original Assignee
Kotobuki Communication Instr Co Ltd
Kotobuki Communication Instrument Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kotobuki Communication Instr Co Ltd, Kotobuki Communication Instrument Co Ltd filed Critical Kotobuki Communication Instr Co Ltd
Priority to JP2020010878A priority Critical patent/JP2021117359A/ja
Publication of JP2021117359A publication Critical patent/JP2021117359A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】電話回線やインターネット回線を用いて音声通話する際に送話者側の処理のみで高齢者や難聴者に対して明瞭に音声を伝達できる新規な音声明瞭化装置および音声明瞭化方法の提供。【解決手段】コンデンサ型のマイクロホン220を備えたヘッドセット300とPC200との間に取り付けられる音声明瞭化装置100であって、送話音声信号から言語の識別に重要な周波数成分である第2〜第4程度のホルマント成分のみを抽出して元の送話音声信号に加えて出力する。これによって、聴力が衰えた高齢者や難聴者のように特に第2〜第4程度のホルマント成分が聴き取り難い対象者にとっては、全体の音量を上げなくともその送話音声の内容を明瞭に聴き取ることが可能となる。【選択図】図1

Description

本発明は、電話回線やインターネット回線などを介して音声通話する状況で適用される音声明瞭化装置および音声明瞭化方法に関する。
電話回線やインターネット回線などを用いた音声通話においては、受話者側の都合によって送話者からの音声が受話者側に正確に伝わらないというケースがしばしばみられる。例えば受話者が高齢であって聴覚が衰えていたり、難聴者などの場合は発話者の音声が聞き取り難く会話がスムーズに行えないことがある。このようなケースでは、発話者側が声を大きくしたりゆっくりと話したり、あるいは受話者側の電話器の機能を用いて受話音量を大きくするといった対策が取られる。
また、電話機自体に音声を聞き取りやすくするための音声処理機能を組み込んだものも提案されている。例えば以下の特許文献1では、電話機構成の中に周波数強調フィルタを組み込み、聞き取り難い周波数成分だけを周波数強調するようにした電話機が開示されている。また、聞き取り難さの原因が発話者側にもある場合には以下の特許文献2や3に示すように、発話者側の周囲環境雑音レベルをローパスフィルターで除去したり、発信者の体調不良や声の特質(滑舌の悪さなど)に基づく受信者側での聞き取り難さを抑制することを目的とした電話装置などが開示されている。
特開2001−285409号公報 特開2014−60601号公報 特開2009−124286号公報
ところで、難聴障害のうち内耳側の障害で起こる感音難聴が知られているが、この原因は聴覚器官である蝸牛という器官での高い周波数を聴覚信号に変換する機能低下で起こることから前記のように受話音量を大きくしたりゆっくり話してもらっても音声が正確に聞き取れないことがある。
一方、特許文献1乃至3のように聞き取り難い周波数成分だけを周波数強調したり、発話者側の周囲環境雑音レベルをローパスフィルターで取り出したりしたとしても感音難聴の場合は聞き取ることが難しい。また、これらの機能を享受するためには前記の機能を組み込んだ新しい電話器に買い換えなければならず、経済的負担も大きい。
そこで、本発明はこれらの課題を解決するために案出されたものであり、その主な目的は電話回線やインターネット回線などを用いて音声通話する際に聴覚が衰えた高齢者や難聴者に対して送話者側の処理のみで明瞭に音声を伝達できる新規な音声明瞭化装置および音声明瞭化方法を提供するものである。
人間の聴覚による言語の理解は、鼓膜で受けた音波を聴覚器官で電気信号に変換して脳へ伝達され、過去の経験から得た記憶に照合して言葉として判断されるものであるが、聴覚器官は非常に複雑であり、その働きについてはあまり解明されていない。
言語の発声メカニズムに関する研究によれば、声帯という器官から強さ、量などが調整された空気が母音として放出される。これを第1ホルマントといい、後に続く軌道、口腔の容積や形状、鼻腔、舌の振動・形状、上顎、下顎による弛緩容積などの調整による共鳴現象で第1ホルマントより高い周波数域にエネルギーの大きい周波数特性上のピークが複数現れ、これらをホルマントと呼んでいる。低い周波数側から高い周波数側に向かって順次現れるピークを第2ホルマント、第3ホルマント、第4ホルマント…、第nホルマントとされ、それらを合成したものがその個人独自の声色として発せられる。
一般に聴覚による音声信号の理解は、その声の流れの中で重量な周波数成分およびその大きさを検知し、それらを脳に伝達して実現されるのであるが、この流れに関する研究は、言語の分野では比較的進んでおり、第1ホルマントから第4ホルマントが特に重量な周波数成分とされている。
そこで、前記課題を解決するための第1の発明は、コンデンサ型のマイクロホンを備えた送受話器またはヘッドセットと電話機本体またはPCとの間に取り付けられる音声明瞭化装置であって、前記マイクロホンで収音された送話音声信号を分岐し、分岐した一方の送話音声信号から低次のホルマント以下の低周波数成分と高次のホルマントを超える高周波数成分とを除去する帯域濾波器と、前記分岐した他方の送話音声信号の位相を、前記帯域濾波器を通過した送話音声信号の位相と合うように補正する位相補正器と、前記帯域濾波器を通過した送話音声信号を前記位相補正器を通過した送話音声信号に加算合成して出力する加算合成器と、前記マイクロホンの印可電圧極性を整合させる極性整合器と、前記加算合成器による加算合成機能をオンオフするスイッチとを備えたことを特徴とする音声処理装置である。
このような構成によれば、もとの送話音声信号から言語の識別に重要な周波数成分、すなわち低次のホルマント以下の低周波数成分と高次のホルマントを超える高周波数成分を除いた第2〜第4程度のホルマント成分のみを抽出して元の送話音声信号に加えて出力できるため、聴力が衰えた高齢者や難聴者のように特に第2〜第4程度のホルマント成分が聴き取り難い対象者にとっては、全体の音量を上げなくともその送話音声の内容を明瞭に聴き取ることが可能となる。また、送話者特有の声色を損なわないため、受話者に対して違和感や不信感を与えることもない。また、極性整合器を備えてコンデンサ型のマイクロホンの印可電圧極性を整合させることができるため、既存のヘッドセットや電話機に後付けで適用可能となり、経済的負担も少ない。さらに、音声処理機能のスイッチを備えることにより、相手に合わせてその機能を任意に発動できる。
なお、本発明でいう「低次のホルマント以下の低周波数成分と高次のホルマントを超える高周波数成分とを除去した」周波数帯域としては、例えば言語の認識に重要な要素である第2から第4ホルマント、より望ましくは第2から第5ホルマントを含む周波数帯域をいう(以下、同じである)。
このように第2〜第5程度のホルマント成分は言語の識別に重要であり、本発明はこれを強調することで聞き取りやすくしたものである。そのメカニズムについて以下に説明する。図11は、音声の流れのなかでみられる周波数分析例を示したものである。前述したように人が言葉を発すると共鳴現象に伴い、ホルマントと称される数次の高調波が同時に放出される。これら数次の高調波のうち、主に母音に影響を与える基本波h1を第1ホルマントといい、次に周波数が高い高調波h2を第2ホルマント、その次に周波数が高い高調波h3を第3ホルマント、その次に周波数が高い高調波h4を第4ホルマントと称されており、以後順に周波数が高い高調波hnを第nホルマントと称されている。
そして、高次のホルマントになるほど低いレベルへと減衰するが、このうち第2〜第5程度のホルマント成分が特に言語理解に重要な要素となっていることが判明している。言語分野における研究によれば、聴覚は各ホルマントを敏感に検出し、また言葉を知覚する能力は幼児期に学習し、記憶しているといわれている。そのため、聴覚から得られた言語情報の一部が欠落していても過去に記憶蓄積された経験で欠落部分が補完され、一般的な日常会話であれば問題にはならないといわれている。
しかしながら、聞こえてきた音を言葉として認識するためには、聴覚が前記のホルマントを検出する必要があるが、もしこれらのホルマントのうち重要なホルマント成分が検出できないと言葉として認識できない。例えば、500Hz〜3kHzの帯域を削除すると言語を全く理解できないという実験結果も報告されている。
音を聴き取り難い難聴は、外耳、中耳の障害による伝音性難聴と、内耳、聴覚神経、脳の障害による感音性難聴と、これらの両方に起因する複合性難聴との3種類に大きく分類される。このうち、軽度の難聴である伝音性難聴の場合は、例えばテレビの音量を大きくしたり、対話者が耳元で話しかけるなどで対応できるが、感音性難聴の場合は、加齢と共に進行し、到来音を大きくしてもただ「ゴホン、ゴホン」という音として聞こえるだけで言葉の内容が理解できない。これは音量を上げても第2ホルマント〜第4ホルマントの中レベルのホルマントを検出する能力が低下してしまったためと考えられる。
また、聴覚には過大音が到達したときにその音の周波数近辺の他の小さな音は検出され難いか、またはある音が別の音に妨害されて聴き取り難いという性質がある。これをマスキング効果といい、過大音に対して脳の自己防衛作用が働くためといわれている。これらの代表例として、例えば大きな会場に設置される放送設備において天井部に埋め込まれたスピーカーから出る音声成分に含まれる低音域の音圧レベルが、天井板によるバッフル効果によって2〜3倍程度に上昇することがある。
この結果、そのスピーカーから出る音声成分のうち、第2ホルマント以上のホルマント成分がマスキングされてしまい放送内容が聴き取れないという事態がしばしば起こる。一方、高齢者の場合では音声検知能力が低下するため、言語の基本波である第1ホルマントの音量が上昇すると第2ホルマント以降のホルマントがマスキングされて言葉が聴き取れなくなってしまう。以上の考察から言語を正確に伝達するためには、第2ホルマント以上の高調波成分を増幅させてマスキングレベルを超えるようにすることでこれらの難聴の問題を解決できると考える。
図12は、音声の流れの中からサンプリングした言語認識の過程を説明した例を示したものである。横軸は周波数(Hz)、縦軸は音圧(dB)であり、V(ヴイ)という声に含まれるホルマント成分とそのレベルを示している。第1ホルマントh1は最も低い周波数成分(母音)を有しているが、その音圧は最も高いレベルとなっている。以後、第2ホルマントh2〜第nホルマントhnになるに従ってその音圧は徐々に低いレベルに推移している。
この図において、ラインMKは健聴者のマスキング範囲を示し、ラインMK’は難聴者のマスキング範囲を示している。図示するように健聴者のマスキングラインMKはすべてのホルマントより低いため、マスキング効果を受け難くV音声を明瞭に聴き取れるのに対し、難聴者のマスキングラインMK’は、第1ホルマントh1を除く他のホルマントよりも高いため、マスキング効果が著しくV音声を聴き取れることができないことが分かる。
図13は、感音性難聴におけるVの音声レベルを10dB増加した場合を示したものである。図においてh1+〜hn+はそれぞれ各ホルマントh1〜hnをそれぞれ10dB増加したレベルを示しているが、難聴者のマスキングラインMK’は単にそのまま上方向へ平行移動するだけであり、音量を上げただけでは言語の理解は不可能であることが分かる。
図14は、音声認識に重要な要素である、第1ホルマントh1以外のG領域のホルマント(第2ホルマントh2〜第nホルマントhn)を帯域濾波器(バンドパスフィルタ)で抽出し、振幅増幅させた各高調波成分信号ホルマントh2++〜hn++を主音声信号へ加算合成した状態を示したものである。図示するように、このような処理をすれば全てのホルマント成分が難聴者のマスキングラインMK’を上回る結果となって音声Vを理解できることが分かる。
なお、従来の補聴器や集音器は、離れた位置から発生される音声を集めることが主体となっているが、空中を伝播する途中で高次のホルマント成分は周囲の騒音や拡散、空気質量により減衰して言語理解度が著しく阻害されるため、一層複雑な音声処理が必要になると思われる。
本発明の音声明瞭化装置は、頭部に装着するヘッドセットや送受話器のように発声者の口元の近い距離のマイクロホンで収音された音声、すなわち空気などによる伝搬損失が少なく、言語理解に重要な要素となる高次のホルマント成分が減衰されていない状態のピュアな音声を主な対象とし、その音声から高次のホルマント成分を抽出増幅して元の音声に加算合成して出力すれば、聴覚が衰えた高齢者や難聴者であっても明瞭に音声の内容を聴き取ることが可能となるとの知見のもとに案出されたものである。
第2の発明は、第1の発明において、前記電話機本体またはPCから出力される受話音声信号を分岐し、分岐した一方の受話音声信号から低次のホルマント以下の低周波数成分と高次のホルマントを超える高周波数成分とを除去する帯域濾波器と、前記分岐した他方の受話音声信号の位相を、前記帯域濾波器を通過した受話音声信号の位相と合うように補正する位相補正器と、前記帯域濾波器を通過した受話音声信号を前記位相補正器を通過した受話音声信号に加算合成して前記送受話器またはヘッドセット出力する加算合成器と、前記電話機本体またはPCから出力される受話音声信号の印可電圧極性を整合させる極性整合器と、前記加算合成器による加算合成機能をオンオフするスイッチとを備えたことを特徴とする音声明瞭化装置である。
このような構成によれば、発話音声信号だけでなく、電話機本体またはPCから出力される受話音声信号からも言語の識別に重要な第2〜第4程度のホルマント成分のみを抽出して元の受話音声信号に加えて出力できるため、回線や機器の不調などにより相手方の発声が聞き取り難い場合には、第2切替器をオンにするだけでより明瞭に聞き取ることができる。
第3の発明は、第1の発明において、前記帯域濾波器は、分岐した一方の音声信号から400Hz未満の低次のホルマントを含む低周波数成分を除去する増幅機能を有するハイパスフィルターと、前記ハイパスフィルターを通過した音声信号から7kHzを超える高次のホルマントを含む高周波数成分を除去するローパスフィルターとからなることを特徴とする音声明瞭化装置である。このような構成によれば、言語の識別に重要な第2〜第5程度のホルマント成分を正確に取り出すことができる。
第4の発明は、コンデンサ型のマイクロホンを備えた送受話器またはヘッドセットから電話機本体またはPCに出力される送話音声信号を明瞭化する方法であって、前記マイクロホンで収音された送話音声信号を分岐し、分岐した一方の送話音声信号から低次のホルマント以下の低周波数成分と高次のホルマントを超える高周波数成分とを除去する増幅型帯域濾波ステップと、前記分岐した他方の送話音声信号の位相を、前記帯域濾波器を通過した送話音声信号の位相と合うように補正する位相補正ステップと、前記帯域濾波した送話音声信号を前記位相補正した送話音声信号に加算合成して出力する加算合成ステップと、前記マイクロホンの印可電圧極性を整合させる極性整合ステップと、前記加算合成ステップをオンオフするステップとを含むことを特徴とする音声処理方法である。このような方法によれば、第1の発明と同様な作用・効果を発揮できる。
本発明によれば、送話者からの送話音声信号から言語の識別に重要な第2〜第4程度のホルマント成分のみを抽出して元の送話音声信号に加えて出力するようにしたため、聴力が衰えた高齢者や難聴者のように特に第2〜第4程度のホルマント成分が聴き取り難い対象者にとっては、全体の音量を上げなくともその送話音声の内容を明瞭に聴き取ることが可能となる。また、送話者特有の声色を損なわないため、受話者に対して違和感や不信感を与えることもない。しかも、コンデンサ型のマイクロホンの印可電圧極性を整合させることができるため、既存の印可電圧極性が異なる殆どの電話機やPCにそのまま適用可能となり、経済的負担も少ない。さらに、スイッチを備えることにより、送話者側で相手に合わせてその機能を任意に発動することができる。
本発明に係る音声明瞭化装置100を取り付けた場合(A)と取り付けない場合(B)のインターネット通話(チャット)状況の例を示す概念図である。 本発明に係る音声明瞭化装置100の構成を示すブロック図である。 本発明に係る音声明瞭化装置100に組み込まれる明瞭器112の構成を示すブロック図である。 位相補正器の回路構成図である。 増幅器と帯域濾波器の周波数特性図である。 帯域濾波器による位相ずれ特性図である。 位相補正器が無い場合の位相差Tを示す図である。 位相差による周波数特性図である。 位相変換器の位相可変範囲を示す図である。 位相補正器がある場合の同位相加算を示す図である。 音声の流れのなかでみられる周波数分析例を示した図である。 音声の流れの中からサンプリングした言語認識の過程を説明した例を示した図である。 感音性難聴におけるVの音声レベルを10dB増加した例を示した図である。 第1ホルマントh1以外のG領域のホルマントを帯域濾波器で抽出し、振幅増幅させた各ホルマントの各高調波成分信号を主音声信号へ加算合成した状態を示した図である。 本発明に係る音声明瞭化装置100の他の実施の形態を示した図である。 本発明に係る音声明瞭化装置100の他の実施の形態を示した図である。
以下、本発明の実施の形態を添付図面を参照しながら説明する。図1(A)は、本発明に係る音声明瞭化装置100を取り付けたインターネット通話(チャット)状況の例を示し、同図(B)はそれを取り付けていない従来のインターネット通話状況の例を示したものである。図示するように、この音声明瞭化装置100は、インターネット回線Nに接続されたPC(パーソナルコンピュータ)200と、このPC200に有線ケーブルで接続されるヘッドセット300との間に着脱自在に取り付けて使用される形態となっている。
ヘッドセット300は、頭部に装着されるヘッドホンまたはイヤホン210にコンデンサ型のマイクロホン220を一体的に備えたものであり、図示しない有線ケーブルをPC200のピンジャック端子やUSB端子などのケーブル差込口(図示しない)に差し込んで使用できる汎用品からなっている。このヘッドセット300は、両手が空いた状態で使用できることからゲームやインターネット回線を介した会話(チャット)といった私的に利用できる他、ネットショッピングの受付係や企業や行政機関のコールセンターのような業務でも多用されている。そして、現状のコンデンサ型のマイクロホン220の殆どは、駆動用直流電圧を印加することで動作するようになっているが、メーカーや機種ごとにケーブルコネクターでの接続結線が異なっている。
音声明瞭化装置100は、図2に示すように持ち運び可能な筐体10A内に、極性整合器110と、増幅器111と、明瞭器112と、回路分離器113と、調整器114と、極性切替器115とを順に内蔵すると共に、ヘッドセット300の端子を差し込む差込口10Bと、PC200のピンジャック端子やUSB端子などのマイクロホン接続口へ差し込んで接続するケーブル10Cとを備えた構造となっている。
極性整合器110は、前記のようにメーカーや機種ごとに異なるコンデンサ型のマイクロホン220の印可電圧極性を整合させる機能を有しており、この極性整合器110を備えることでメーカーや機種に限定されることなく、あらゆるコンデンサ型のマイクロホン220を備えたヘッドセット300に適用可能となる。増幅器111は、マイクロホン220から入力される送話音声信号を増幅するものであり、あらかじめ設定した音量以上の送話音声に対し、増幅度が一定に保たれて歪みなどが発声しないように制御している。次の明瞭器112については後に詳述する。
回路分離器113は、PC200のマイクロホン差込口に対して交流的結合を行うための変圧器であり、バイアス用直流電圧が存在するPC200のマイクロホン差込口に対して直接接続を可能としている。調整器114はPC200へ入力する送話音声信号の強度を最適値に設定するものであり、また、極性切替器115は既存のPC200との信号位相を合わせるためにその極性を初期設定する機能を発揮する。
明瞭器112は、図3に示すように位相補正器120と、帯域濾波器130と、スイッチ140と、加算合成器150とから構成されている。位相補正器120は、図4に示すように入力端子15、入力接地端子16、出力端子17、出力接地端子18、演算増幅器19、コンデンサC、抵抗R、R1、R2とからなる回路構成を有しており、主音声経路L1に分岐した一方の送話音声信号を後述するように周波数特性は平坦のまま0〜−180度の範囲で任意に位相遅延制御するようになっている。
帯域濾波器130は、さらに増幅機能を有するハイパスフィルター131とローパスフィルター132とから構成されており、ハイパスフィルター131によって他方の副音声経路L2に分岐した送話音声信号のなかから第1ホルマントh1以下の低周波成分を除去し、ローパスフィルター132によってハイパスフィルター131を通過した音声信号から高次のホルマントを超える高周波数成分を除去して第2ホルマント〜第5ホルマントの周波数成分を抽出するようになっている。
スイッチ140は、この帯域濾波器130へ分岐した副音声経路L2側の流れを制御(オンオフ)するものであり、例えば図1に示すように筐体10Aの表面に取り付けられた露出スイッチなどから構成されていて送話者が任意に操作できるようになっている。加算合成器150は、これら分岐した2つの送話音声信号を任意の割合で合成して出力するようになっている。
以下、このような構成をした音声明瞭化装置100の作用を説明する。図1(A)に示すようにまず送話者の口元で発せられた音声は殆ど減衰することなく直接マイクロホン220で集音されて電気信号(送話信号)に変換されて本発明装置100に入力される。本発明装置100に入力された送話音声信号は、図2に示すように増幅器111で数倍に増幅された後、明瞭器112に入力され、図3に示すようにその内部で分岐してその一方が主音声経路L1を通過して位相補正器120に送られて後述するようにその位相のみが補正処理される。
他方、副音声経路L2側に送られた送話音声信号は、帯域濾波器130で第2ホルマント〜第5ホルマントの周波数成分が抽出される。すなわち、この帯域濾波器130のハイパスフィルター131を通過することによって第1ホルマントおよび有害な低周波成分、例えばマイクロホン220に吹き付けられる息などで生ずる風切り音が抑圧された後、ローパスフィルター132を通過することによって各部の増幅素子自体の発する耳障りな高周波雑音を抑圧して図5の曲線naで示す一種の広帯域濾波器特性を持たせ改善効果の向上を図っている。
ハイパスフィルター131は、明瞭度合いを任意に設定するため5倍程度の増幅器としての機能を併せ持ち、ローパスフィルター132は増幅度1で、さらに言語の認識に対する貢献度の低い超高次のホルマントを含む広域周波数成分を除去することで信号対雑音比性能の特性を改善している。この帯域濾波器130の出力点zの周波数特性を図5の曲線bpで示す。本実施の形態では、この帯域濾波器130の周波数特性は様々な検証テストで設定された400Hz~7kHzの約4オクターブであり、低域、高域ともおよそ−12dB/oct程度で各々遮断している。
この帯域濾波器130を出た音声信号は、スイッチ140を通過して加算合成器150で主音声経路L1側の送話音声信号に加算合成される。加算合成された送話音声信号は、調整器114で適宜その出力が調整された後、ケーブル10Cを介してその出力端子からPC200へ出力される。
ここで、この帯域濾波器130においては図3のx点からの入力信号が図6に示すように音声帯域内で最大90度程度の位相差(遅れ)Tをもってz点に出力されるという本質的な特性がある。このため、このz点に出力された送話音声信号を、主音声経路L1を通過する送話音声信号にそのまま加算合成器150で合成すると、図7に示すように送話音声信号電圧をVx、帯域濾波器130の出力電圧をVzとすると、Vzは位相遅れのため、−Vzと考えられることでVx+(−Vz)=Vkとなり、2信号の電圧差が加算合成器150の出力となる。
この結果、図8に示すようにある周波数域に周波数特性上dなる「深い谷」特性という不感帯を生じてしまい、言語理解上特に重要な第2ホルマントおよび第3ホルマント金パンの音量が極端に小さくなるなどの明瞭度の改善に大きな障害となる不都合が発生する。図8は2音声信号の位相を考慮した場合の加算合成器150における信号の相殺現象を示したものである。
明瞭器112は、このような不感帯を解消するために主音声経路L1上に位相補正器120を設け、図10に示すように高次のホルマント抽出のための帯域濾波器130(131、132)で生ずる位相遅れに相当する位相遅延を加えて補正し、補正した音声信号に帯域濾波器130(131、132)を通過した音声信号を加算合成することで不感帯の発生を回避している。
従って、主音声経路L1側に設けられた位相補正器120は、本発明の音声明瞭化装置100を実現する上で重要な役割を担っている。すなわち、図9に示すようにこの位相補正器120を構成する回路では、角周波数はω=1/CRで決定され、0〜−180度の範囲で任意に位相遅延制御が達成できる。ちなみにC及びR値を任意に選択することで利得を一定にしたまま低い周波数帯であっても位相遅れを限りなく0度に近づけることができるという優れた特質があり、その位相特性を図9に示す。
図4において入力端子15から入力された音声信号は演算増幅器19の反転端子(−)に印加されるため、出力端子17には入力された信号とは逆相の反転信号が現れる。一方、同時に入力端子15にはコンデンサCが演算増幅器19の非反転端子(+)へ接続されているが、コンデンサCは周波数よりそのインピーダンスが変化する素子でそのインピーダンスZは1/ωCであることから周波数に反比例し、周波数が高くなるほど内部抵抗(インピーダンス)が低くなるという特性がある。
そのため、高い周波数ほど非反転入力端子への入力信号が増加し、演算増幅器19内部では両方の信号を演算し、非反転側の信号が大きければ出力端子17の信号の位相遅延幅を小さくし、周波数が低くなればインピーダンスが大きくなるため、非反転入力端子への入力信号が小さくなり、出力端子17には大きな遅延幅を持った信号が出力されるのであるが、希望周波数での位相遅延度合いは、抵抗R、コンデンサCの定数で自由に設定が可能になる。なお、この位相補正器120の増幅度はr2/r1で決定され、目的に応じて任意に設定可能であり、常に一定に保つことができる。そして、図14のG範囲にある言語理解に重要な高次ホルマント成分が加算合成器150で印加され、マスキングラインMK’を超えるように調整された後、回路分離器113、調整器114、極性切替器(後段)115を介してPC200に出力されることになる。
このように本発明の音声明瞭化装置100は、送話者からの送話音声信号から言語の識別に重要な第2〜第4程度のホルマント成分のみを抽出して元の送話音声信号に加えて出力するようにしたため、聴力が衰えた高齢者や難聴者のように特に第2〜第4程度のホルマント成分が聴き取り難い対象者にとっては、全体の音量を上げなくともその送話音声の内容を明瞭に聴き取ることが可能となる。また、元の送話音声信号に第2〜第4程度のホルマント成分を加えて送信することにより、送話者特有の声色を損なわないため、受話者に対して違和感や不信感を与えることもない。
しかも、極性整合器110によってコンデンサ型のマイクロホン220の印可電圧極性を整合させることができるため、既存の印可電圧極性が異なる殆どの電話機やPCにそのまま適用可能となり、経済的負担も少ない。また、本発明装置100をネットショッピングの受付係や企業や行政機関のコールセンター側の通話機器にのみ取り付けるだけで良いため、高齢者や難聴者側の通話機器はそのまま利用可能となって経済的負担が全くない。
さらに、筐体10Aにスイッチ140を備えることにより、相手に合わせてその機能を任意に発動することができる。すなわち、ネットショップの場面においてヘッドセット300を装着したオペレーター(送話者)の話が相手側にうまく伝わらないと感じたときは、そのオペレーターが筐体10Aにスイッチ140をオンにすることで音声明瞭化機能が発揮されるため、スムーズな通話を行うことができる。一方、この音声明瞭化は、第2〜第4程度のホルマント成分を強調する処理が行われるため、健聴者にとってはやや違和感を感じることがある。そのため、相手が健聴者の場合は、オペレーターがスイッチ140をオフにしておけば音声明瞭化処理が行われなくなってオペレーターの肉声がそのまま相手側に伝わるため、自然でスムーズな通話が可能となる。
前述した実施の形態では主に送話音声信号が流れるラインに明瞭器112などを備えて送話音声信号を最適に処理することで相手側が難聴者であっても送話者の音声を明瞭に聞き取れるようにしたが、図15に示すように送話音声信号が流れるラインOBだけでなく受話音声信号が流れるラインIBにも同様に明瞭器112などを備えるようにしても良い。
このようにすれば、発話音声信号だけでなく、PC200から出力される受話音声信号からも言語の識別に重要な第2〜第4程度のホルマント成分のみを抽出して元の受話音声信号に加えて出力できるため、回線や機器の不調などにより相手方の発声が聞き取り難い場合には、オペレーター側で受話音声信号ラインIB側のスイッチ140をオンにするだけでより明瞭に聞き取ることができる。
また、本実施の形態では、PC200とこのPC200に有線ケーブルで接続されるヘッドセット300との間に本発明装置100を取り付けて用いる例で示したが、図16に示すように電話機本体400と送受話器500との間に取り付ければ電話回線による通話の場合も同様に送話者の音声を相手側に明瞭に伝えることが可能となる。
100…音声明瞭化装置
10A…筐体
10B…差込口
10C…ケーブル
110…極性整合器
111…増幅器
112…明瞭器
113…回路分離器
114…調整器
115…極性切替器
120…位相補正器
130…帯域濾波器
131…ハイパスフィルター
132…ローパスフィルター
140…スイッチ
150…加算合成器
210…ヘッドホンまたはイヤホン
220…マイクロホン
300…ヘッドセット
400…電話機本体
500…送受話器

Claims (4)

  1. コンデンサ型のマイクロホンを備えた送受話器またはヘッドセットと電話機本体またはPCとの間に取り付けられる音声明瞭化装置であって、
    前記マイクロホンで収音された送話音声信号を分岐し、分岐した一方の送話音声信号から低次のホルマント以下の低周波数成分と高次のホルマントを超える高周波数成分とを除去する帯域濾波器と、
    前記分岐した他方の送話音声信号の位相を、前記帯域濾波器を通過した送話音声信号の位相と合うように補正する位相補正器と、
    前記帯域濾波器を通過した送話音声信号を前記位相補正器を通過した送話音声信号に加算合成して出力する加算合成器と、
    前記マイクロホンの印可電圧極性を整合させる極性整合器と、
    前記加算合成器による加算合成機能をオンオフするスイッチとを備えたことを特徴とする音声処理装置。
  2. 請求項1に記載の音声明瞭化装置において、
    前記電話機本体またはPCから出力される受話音声信号を分岐し、分岐した一方の受話音声信号から低次のホルマント以下の低周波数成分と高次のホルマントを超える高周波数成分とを除去する帯域濾波器と、
    前記分岐した他方の受話音声信号の位相を、前記帯域濾波器を通過した受話音声信号の位相と合うように補正する位相補正器と、
    前記帯域濾波器を通過した受話音声信号を前記位相補正器を通過した受話音声信号に加算合成して前記送受話器またはヘッドセットに出力する加算合成器と、
    前記電話機本体またはPCから出力される受話音声信号の印可電圧極性を整合させる極性整合器と、
    前記加算合成器による加算合成機能をオンオフするスイッチとを備えたことを特徴とする音声明瞭化装置。
  3. 請求項1に記載の音声明瞭化装置において、
    前記帯域濾波器は、分岐した一方の音声信号から400Hz未満の低次のホルマントを含む低周波数成分を除去するハイパスフィルターと、
    前記ハイパスフィルターを通過した音声信号から7kHzを超える高次のホルマントを含む高周波数成分を除去するローパスフィルターとからなることを特徴とする音声明瞭化装置。
  4. コンデンサ型のマイクロホンを備えた送受話器またはヘッドセットから電話機本体またはPCに出力される送話音声信号を明瞭化する方法であって、
    前記マイクロホンで収音された送話音声信号を分岐し、分岐した一方の送話音声信号から低次のホルマント以下の低周波数成分と高次のホルマントを超える高周波数成分とを除去する帯域濾波ステップと、
    前記分岐した他方の送話音声信号の位相のみを補正し、前記増幅機能を有する帯域濾波器を通過した送話音声信号の位相と合うようにする位相補正ステップと、
    前記帯域濾波した送話音声信号を前記位相補正した送話音声信号に加算合成して出力する加算合成ステップと、
    前記マイクロホンの印可電圧極性を整合させる極性整合ステップと、
    前記加算合成ステップをオンオフするステップとを含むことを特徴とする音声処理方法。
JP2020010878A 2020-01-27 2020-01-27 音声明瞭化装置および音声明瞭化方法 Pending JP2021117359A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020010878A JP2021117359A (ja) 2020-01-27 2020-01-27 音声明瞭化装置および音声明瞭化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020010878A JP2021117359A (ja) 2020-01-27 2020-01-27 音声明瞭化装置および音声明瞭化方法

Publications (1)

Publication Number Publication Date
JP2021117359A true JP2021117359A (ja) 2021-08-10

Family

ID=77174732

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020010878A Pending JP2021117359A (ja) 2020-01-27 2020-01-27 音声明瞭化装置および音声明瞭化方法

Country Status (1)

Country Link
JP (1) JP2021117359A (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004289614A (ja) * 2003-03-24 2004-10-14 Fujitsu Ltd 音声強調装置
JP2006325168A (ja) * 2005-05-19 2006-11-30 Nakayo Telecommun Inc 有極性マイクロホン対応の音声入力処理装置及び無極性マイクロホン
JP2009124286A (ja) * 2007-11-13 2009-06-04 Sony Ericsson Mobilecommunications Japan Inc 音声信号処理装置及び音声信号処理方法、通信端末
JP2016110050A (ja) * 2014-01-17 2016-06-20 寿通信機株式会社 音声処理装置及び音声明瞭化装置並びに音声処理方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004289614A (ja) * 2003-03-24 2004-10-14 Fujitsu Ltd 音声強調装置
JP2006325168A (ja) * 2005-05-19 2006-11-30 Nakayo Telecommun Inc 有極性マイクロホン対応の音声入力処理装置及び無極性マイクロホン
JP2009124286A (ja) * 2007-11-13 2009-06-04 Sony Ericsson Mobilecommunications Japan Inc 音声信号処理装置及び音声信号処理方法、通信端末
JP2016110050A (ja) * 2014-01-17 2016-06-20 寿通信機株式会社 音声処理装置及び音声明瞭化装置並びに音声処理方法

Similar Documents

Publication Publication Date Title
CN103959813B (zh) 耳孔可佩戴式声音收集设备,信号处理设备和声音收集方法
US5737719A (en) Method and apparatus for enhancement of telephonic speech signals
Stone et al. Tolerable hearing aid delays. III. Effects on speech production and perception of across-frequency variation in delay
US10803857B2 (en) System and method for relative enhancement of vocal utterances in an acoustically cluttered environment
US20040199380A1 (en) Signal processing circuit and method for increasing speech intelligibility
US7340231B2 (en) Method of programming a communication device and a programmable communication device
WO2006030752A1 (ja) 音響処理装置
JP6548938B2 (ja) 音声処理装置及び音声処理方法
US9654855B2 (en) Self-voice occlusion mitigation in headsets
JP2002125298A (ja) マイク装置およびイヤホンマイク装置
Liebich et al. Active occlusion cancellation with hear-through equalization for headphones
EP1104222B1 (en) Hearing aid
JP6315046B2 (ja) 耳孔装着型収音装置、信号処理装置、収音方法
JPH0968997A (ja) 音声処理方法及び装置
JP2000278786A (ja) マイクロホン装置
JP2021117359A (ja) 音声明瞭化装置および音声明瞭化方法
JP5046233B2 (ja) 音声強調処理装置
KR100778143B1 (ko) 후두 임피던스 신호를 이용하는 넥마이크를 구비한 골도헤드셋
CN113259824A (zh) 一种实时多通道数字助听器降噪方法和系统
JP2002062886A (ja) 感度調整機能を有する音声受信装置
KR200497417Y1 (ko) 의사소통 보조장치
JP4079478B2 (ja) 音声信号の処理回路および処理方法
JP3596580B2 (ja) 音声信号の処理回路
US20230396939A1 (en) Method of suppressing undesired noise in a hearing aid
US20050091060A1 (en) Hearing aid for increasing voice recognition through voice frequency downshift and/or voice substitution

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221122

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20230227

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230227

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230404

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230602

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230822

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20240305