JP5249431B2 - 信号経路を分離する方法及び電気喉頭を使用して音声を改良するための使用方法 - Google Patents

信号経路を分離する方法及び電気喉頭を使用して音声を改良するための使用方法 Download PDF

Info

Publication number
JP5249431B2
JP5249431B2 JP2011548504A JP2011548504A JP5249431B2 JP 5249431 B2 JP5249431 B2 JP 5249431B2 JP 2011548504 A JP2011548504 A JP 2011548504A JP 2011548504 A JP2011548504 A JP 2011548504A JP 5249431 B2 JP5249431 B2 JP 5249431B2
Authority
JP
Japan
Prior art keywords
signal
frequency
audio signal
inverse
filter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2011548504A
Other languages
English (en)
Other versions
JP2012517031A (ja
JP2012517031A5 (ja
Inventor
マルティン ハグミュラー
ゲアノート クビン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Heimomed Heinze & Co Kg GmbH
Original Assignee
Heimomed Heinze & Co Kg GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Heimomed Heinze & Co Kg GmbH filed Critical Heimomed Heinze & Co Kg GmbH
Publication of JP2012517031A publication Critical patent/JP2012517031A/ja
Publication of JP2012517031A5 publication Critical patent/JP2012517031A5/ja
Application granted granted Critical
Publication of JP5249431B2 publication Critical patent/JP5249431B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Telephone Function (AREA)
  • Prostheses (AREA)

Description

発明の詳細な説明
本発明は、音声信号が適当な手段によってデジタル化される電気喉頭(EL)話者の音声品質を向上させる方法に関する。本明細書において、適当な手段とは、例えば、関連づけられたアナログ/デジタル変換器を備えたマイクロホン、電話又は電子機器を用いた他の方法を意味するものと理解される。
ELは、例えば、喉頭を外科的に切除された患者の人工置換音声を形成する装置である。ELは顎の下側に当てられ;特定の周波数を有する可聴周波数信号発生器が顎の下側の柔らかい部分の上で口腔内の空気を振動させる。次いで、これらの振動は調音器官によって変調され、このようにして話すことが可能になる。しかしながら、可聴周波数信号発生器は通常一つの周波数でのみ作動するので、音声は、「ロボット声」のように、単調で不自然に聞こえる。
更に不利なことには、音の部分だけが口腔内で調音されるので、ELの振動が音声の認識を妨げるか又は消してしまうことさえある。デバイスから直接に生じるか又は首の変化部位(Uebergangsstelle)で生じる音の部分が、調音された部分の上に重ねられ、そして、その了解度(Verstaendlichkeit)を低下させる。このことは、首の部位に放射線治療を受け、その結果として組織構造が硬くなった話者の場合に特に当てはまる。従って、干渉信号、すなわち、直接音、及びELの変調されていない振動に対立するものとしての有効な信号、すなわち、調音された振動を増幅させるための種々の方法が開発されてきた。
従って、これらの方法は、発せられた音に直接に聞き手がさらされないがその代わりに電子的手段が用いられる状況(例えば、電話で話す場合に、録音において又は一般にマイクロホン及びアンプを介して話す場合)に主として用いられる。
US6,359,988B1によれば、EL音声信号はケプストラム(Cepstrum)分析に付されそして正常の話者の音声が重ねられ、それによってELを用いて話す者のピッチ変化をより自然に聞こえるようにすることができ;同時に、それによって発せられた直接音の部分も信号において抑制される。この解決法の不利な点は、とりわけ、EL話者の各口述に対し健常な話者の同じ口述(すなわち、ELを用いない音声)が同期的に要求されるが、このことは実際には実現できそうにないことである。
別の解決法がUS6,975,984B2に開示されており、そこでは電話におけるEL音声信号を改良するための解決法が記載されている。この場合に、音声信号はデジタル信号プロセッサによって処理されるので、ELのハム基本ノイズ(brummende Grundgeraeusch)が認識され、そして、音声信号から取り除かれる。この目的のため、音声信号は有声成分と無声成分とに分割され、そして、別々に処理される。有声部分はブロック単位でフーリエ変換され、周波数フィルタ処理され(基本周波数及び高調波は再利用される)、逆変換され(ruecktransformiert)、そして、次に元の信号全体からサブトラクトされる。残るのは、元の信号の無声成分である。これとは別に、ローパスフィルタを通して有声成分をフィルタ処理し、音声休止が認識されるとフィルタ処理によりそれを完全に除去し、そしてその後に無声部分を重ねることも提案されている。
文献「Enhancement of Electrolaryngeal Speech by Adaptive Filtering」, Carol Y. Espy-Wilsonet al. (JSLHR, 41: 1253-1264, 1998) には、EL話者の音声品質の改善方法が記載されている。この場合にELの基本ノイズは、適応フィルタ処理によって、EL基本ノイズにより歪ませられた音声信号(及び音声に調音されたEL基本ノイズ)に適応され;更なる工程において信号は相互にサブトラクトされる。残るのは、エラー信号を最小にする目的でフィルタパラメータをチェックしそして適応させるために用いられるエラー信号である。この方法におけるエラー信号は、EL基本ノイズを含まない音声信号である。ここでは、音声信号中の干渉信号はEL基本ノイズと関連づけられるが、目的の音声信号は他の信号から独立しているので、事実上は干渉基本ノイズ(stoerende Grundgeraeusch)と音声信号とは異なるソースに由来するということを前提としている。
文献「Enhancement of Electrolarynx Speech Based on Auditory Masking」, Hanjun Liu et al. (IEEE Transactions on Biomedical Engineering, 53(5): 865-874, 2006) には、とりわけ周囲ノイズに関連した、EL話者の信号を改善するためのサブトラクションアルゴリズムが記載されている。
固定されたサブトラクションパラメータを含む他の方法とは対照的に、このアルゴリズムでは、サブトラクションパラメータが聴覚マスキングに基づいて周波数範囲に適応される。これに関連して、音声とバックグランドノイズとは相関性がないので、信号からの周波数範囲においてバックグランドノイズを評価してサブトラクトすることができると仮定されている。
これらの解決法の共通の特徴は、音声と干渉信号(すなわち、周囲ノイズだけでなくELの基本ノイズも)とが統計的に独立していて相関性がないというモデルに基づいて、方法が用いられていることである。
この仮定のために、前記方法の実施はとても複雑な方法で行われる。(適応性の)ノッチフィルタを用いて直接音を抑制しようとする試みが行なわれる場合、それによって音声信号の質も低下して、ささやきのように聞こえる;音声信号と干渉ノイズとは同じ高調波上にある。
US2005/0004604A1は、サウンドジェネレータ及びマイクロホンがユーザーの口の前に直接設置され、前記サウンドジェネレータが低い音量レベルの音を発し、そして、更なる処理のために信号がマイクロホンを通してピックアップされるという喉頭解決法(Larynx-Loesung)を開示している。更なる処理では、基本的にコムフィルタを用いて信号をフィルタ処理して、信号の高調波を低減及び/又は除去する。しかしながら、この場合に、音声信号の質がひどく損なわれる。
WO2006/099670A1には、呼吸経路のモニタリング用装置が開示されており、そこでは、被験者の呼吸経路中にはっきり聞き取れる周波数範囲の音を導入し、そして、反射及び処理された音から呼吸経路の状態を測定する。従って、例えば、呼吸経路の閉塞を検出することが可能である。発明の変形によれば、FFT(高速フーリエ変換)によって一定の閾値を超えているか否かをチェックし、そこから測定された信号の処理についての結論を得ることができる。
本発明の目的は、従来技術の上記欠点を克服し、そして、電子デバイス(例えば、マイクロホン)を用いたときのELユーザーの音声品質を向上させることである。
本発明によるとこの目的は、以下の工程:
a)時間領域から離散周波数領域へ単一チャネル音声信号を転送(Ueberfuehren)することによって前記単一チャネル音声信号を一連の周波数チャネルに分割する工程;
b)各周波数チャネルにおいてハイパスフィルタ又はノッチフィルタを用いてELの変調周波数をフィルタ処理して除去(Herausfiltern)する工程;
c)周波数領域から時間領域にフィルタ処理音声信号を逆変換し、そして、それを単一チャネル出力信号に結合する工程;
を含む導入部に記載されるタイプの方法によって達成される。
本発明は、ELの使用の改良されたモデルを用いるものであって、前記モデルによると、音声信号に調音されたEL基本ノイズだけでなく音声信号の認識(Wahrnehmung)に干渉するELの調音されていない部分も共通のソース、すなわち、ELに由来する。変調範囲のELの調音されていない干渉基本ノイズは時不変信号として識別することができるので、適当な手順によって容易にそれをフィルタ処理して除去することができる。従って、このことは、信号源からの分離ではなく、伝播経路からの分離を含む(話者の調音器官を通る伝播経路、話者の首における使用位置から聞き手の耳への直接の伝播経路、あるいはマイクロホン又は録音手段への伝播経路)。
デジタル化された単一チャネル信号を周波数領域に変換し、そして、前記単一チャネル信号を一連の周波数チャネルに分割する多数の可能な方法は当業者に知られている。各周波数チャネルにおいて、ELの変調周波数はその値に用いられる適当なフィルタ、例えば、ノッチフィルタ又はハイパスフィルタによって抑制され、そして、それによって調音された信号部分の質が改善される。
従来技術からの同様な方法は、調音された部分だけでなく調音されていない部分も異なるソースから来るとみなし、そして、このモデルに対応するアプローチ(例えば、バンドパスフィルタによるフィルタ処理)を選択するが、これでは音声信号も減衰させてしまう。
従って、本発明の方法は、ELユーザーの音声の了解度を改善し、そして、その信号をより許容することができるもの及び「人間的」にすることを目的としている。この目的は、電子的手段(例えば、電話)を介してコミュニケーションする際の、ELからの直接音を低減及び除去することである。
本発明の方法の実現は、例えば、ソフトウェアプラグインによって、固定された有線での解決法(fest verdrahtete Loesung)として又はアナログ回線としても達成することができる。
信号を周波数領域に変換しそして逆変換する多くの公知の方法の中で、有利には、本発明の方法の工程a)における変換をフーリエ変換によって行い、そして、工程c)における逆変換を逆フーリエ変換によって行う。短い間隔(例えば、10msec毎にリフレッシュ(Auffrischung)でブロック単位(例えば、20msecのブロック)に変換を行う。一連の周波数チャネルへの信号の分割は、信号を周波数領域に変換するときに実施する。
本発明の変形態様によれば、工程a)の音声信号の転換及び工程c)の逆変換を対応するフィルタバンクを用いて行う。
信号圧縮を工程b)のフィルタ処理の前に行い、そして、復元を工程b)の後で行う場合には、本発明の方法の結果を更に改善することができる。圧縮のために、高振幅において、小さな振幅の変化が考慮されないような程度まで後者の変化がドミナントになることを防ぐことができる。このように、圧縮のために、フィルタに対して相対変化がより可視的になる。
本発明の方法の更なる実施では、負信号成分の調整(Gleichrichtung)を工程c)の逆変換の前に行う。
図面に示された限定的でない態様によって、以下に本発明をより詳細に記載する。
図1は、ELの使用及び生ずる信号経路の単純化した表現を模式的に示す。
図2は、本発明の方法を用いた状態の単純化した表現を模式的に示す。
図3は、本発明の方法の機能的ブロック図を模式的に示す。
EL1の信号の種々の伝達経路を図1に示す。EL1は話者2の首に配置される。EL1によって発生された音は、一方では第一の話者2の通常の音声経路(口及び鼻)5を通して伝播され、そして、その音声経路において音声に調音される;この第一の信号3は明らかに変化しやすくそして時変(zeit-variant)である。聞き手の耳4は、この時変信号3の他に、EL1の直接音の形態の第二の信号6(図1に一点鎖線で示す)も受けるが、この信号は広範囲に定常的であるので時不変(zeitlich invariant)であると考えられる。全信号の第二の部分6(すなわち、EL1の基本ノイズ)は、聞き手4により干渉信号として認識され、そして、話者2の音声の了解度を低下させる。このように、EL1による元の刺激は2つの異なる経路を介して伝えられる。
もちろん、本発明は、電子デバイスを用いる場合のEL話者の音声品質の改良に関するので、聞き手による代わりに、例えば、マイクロホンによって信号が受信されるであろう。しかしながら、最初の状態を説明するために、理解のためこの一般的モデルを選択した。
図2は、本発明の方法を用いて干渉性の第二の信号6(図1参照)を抑制する状態の単純化した表現を示す。本発明の方法は伝播経路の分離ではなく、信号源の分離を含まないことが容易に理解できる。
信号源7からの源信号x(w)は2つの異なる信号経路を介して伝播される。第一の信号経路において、出力信号は時変フィルタH(w,t)によって変調されて時変信号x(w)H(w,t)を形成する。第二の信号経路において、出力信号は時不変フィルタF(w)によってのみ信号x(w)F(w)に変えられる。
次いで、2つの経路の信号は、レシーバ8(例えば、聞き手の耳、マイクロホン等)において、測定に利用することができる信号S(w,t)に合計される。このように、信号は次式の通りに各成分の合計からなる。
S(w,t)=x(w)H(w,t)+x(w)F(w)
今や、時不変信号経路からの信号部分及び時変信号経路からの信号部分は分離することができ、経時的に変化する全ての信号部分又は時不変である全ての信号部分のいずれかが減衰される。従って、例えば、時変部分S1(w,t)〜x(w)H(w,t)だけが結果として得られる。
調音されない信号部分x(w)F(w)(すなわち、ELの基本ノイズ)は、ELを用いた音声に使用される場合に、時変音声信号x(w)H(w,t)の上に重ねられ、そして、音声信号の了解度の損失を生じさせる。音声了解度は、時不変信号部分から時変信号部分を分離することによって改善される。
図3は、本発明の方法において見込まれる変換を示す。ここで、ELを用いた話者からの任意のデジタル音声信号9は入力位置に存在していることができる。第一の工程10において、音声信号9は短時間フーリエ変換を用いてブロック単位で周波数領域に変換され、そして、一連の周波数チャネルに分割される。ここで、当業者は、時間領域から周波数領域に信号を変換する種々の確立された方法から選択することができ;フーリエ変換のほかに、例えば、離散コサイン変換も用いられるが、本発明によって使用するための前提条件は変換が可逆であるということである。信号は特定のリフレッシュ率(例えば、10msec)で、例えば、20msec長さのブロックに分割され、ブロックはそれぞれの場合に一連の周波数チャネル11に広げられる。従って、最初は単一チャネルであった音声信号9は、経時的に変わる複数の周波数領域に分割される。周波数信号は複合的であるが、その先の過程においては絶対値だけが変更されるのであって、相15は変わらないままである。
工程10において、フィルタバンクを用いることもでき、その場合にはフィルタバンクの後に信号のサンプリング率が低減される。この点について、サンプリング率の低減はフーリエ変換を用いる場合のブロック形成と対応する。
その先の機能ブロック12において、例えば、ハイパスフィルタ又はノッチフィルタを用いて各周波数チャネル11をフィルタ処理する。このフィルタ処理は一定の周波数をフィルタ処理によって除去することができるようにし、ナローバンド干渉は音響技術によりノッチフィルタを用いたフィルタ処理によって除去される。ELは一定の周波数、例えば、100Hzで振動するので、話者の調音器官によって変化しない干渉信号が、周波数範囲において変調周波数0Hzで100Hzチャネルの振幅を発生させ、すなわち、EL信号の振幅は変わらない。干渉信号は、それが完全に時不変であるという事実を特徴とする。ノッチフィルタ又はハイパスフィルタを用いてELの基本ノイズをフィルタ処理する。この点について、ELの変調周波数はハイパスフィルタに対する制限周波数(Grenzfrequenz)として働き;従って、正にELの変調周波数においてロックするようにノッチフィルタを選択する。
もちろん、実際の実施においては、反射、屈折、周囲ノイズ及びELの構造的必然性があるために完全な時不変は達成できない。しかしながら、フィルタも一つの周波数だけに限定されることはなく、特定の周波数範囲、この場合には変調周波数範囲をカバーするので、本発明の方法の機能が保証される。
最終の機能ブロック13において、信号は、例えば、逆フーリエ変換によって時間領域に逆変換され、そして周波数チャネル11はoverlap-addによって一つのチャネルに再結合される。このoverlap-add法は、デジタル信号処理からの、当業者に公知の方法である。結果として単一チャネル出力信号14が得られ、この場合、ELの干渉信号はフィルタ処理によって除去されるか又は少なくとも減衰されている。その後、出力信号を更に処理することができる。
工程10においてフィルタバンクを用いる場合、工程12のフィルタ処理後の信号のサンプリング率は再び高められ、そして、前記のようにその後更に処理される。
原則として、これらの手順は本発明の最も重要な部分のみを表すものであり;ブロック12におけるフィルタ処理の前に信号を圧縮し、そしてフィルタ処理後に復元を行うことができる。同様に、許されていない負値が処理において生ずることがあるので、時間領域への逆変換の前に調整を行うのが有利であることがある。
本発明は、例えば、電話で話すときに追加のデバイスとして用いることができる。従来のアナログ電話の場合には、デバイスは簡単にイヤホンに統合される。統合されたデジタル信号プロセッサを備えた電話の場合には、ソフトウェアプラグインを用いて本発明を統合することができる。また、固定された有線での解決の範囲内で、例えば、アナログ回線においても本発明を実現することができる。また、ハードウェアによる解決手段の枠組みの範囲内において、例えば、アナログ回においても本発明を実現することができる。
ELを用いる場合にも本発明の方法を用いることができ、その場合、2つ又は3つ以上の周波数の間で前後に切り替えを行なって音声をよりリアルな音にすることができる。基本信号が分割される周波数帯域内に周波数の切り替えがあると仮定すると、このことは離散周波数ジャンプ(diskrete Frequenzspruenge)だけでなく基本周波数の連続的変化の両方に対して当てはまる。
次に、変調周波数フィルタの幅は、如何に速く周波数が変わることが許されるかを決定する。極めて遅速で連続的な変化である場合に、周波数は機能的抑制(funktionierender Unterdrueckung)を伴って周波数帯域の全範囲にわたり変化することがあるので、決定的因子は変化の大きさではなく変化の速度である。ELのスイッチをオン・オフする場合、急速な変化に相当するが、ノッチフィルタがどの程度広いか又はハイパスフィルタの基本周波数がどこに存在するかに応じて、わずか数ミリ秒後に抑制状態に入る。
しかしながら、この点について、基本周波数の変化が大き過ぎるものであってはならない。本発明の機能を確実にするために、信号が分割される周波数チャネルが、例えば、その範囲が広げられていること、あるいは、ハイパスフィルタによるフィルタ処理がある程度より高い周波数に設定されていることが必要であろう。

Claims (5)

  1. デジタル化された音声信号を用いて電気喉頭(EL)話者の音声品質を向上させる方法であって、以下の工程:
    a)時間領域から離散周波数領域へ単一チャネル音声信号を転送することによって、前記単一チャネル音声信号を一連の周波数チャネルに分割する工程;
    b)各周波数チャネルにおいてハイパスフィルタ又はノッチフィルタを用いてELの変調周波数をフィルタ処理して除去する工程;及び
    c)フィルタ処理音声信号を周波数領域から時間領域に逆変換し、そして、それを単一チャネル出力信号に結合する工程;
    を特徴とする、前記方法。
  2. 工程a)の音声信号の転送をフーリエ変換によって行い、そして、工程c)の逆変換を逆フーリエ変換によって行うことを特徴とする、請求項1に記載の方法。
  3. 工程a)の音声信号の転送及び工程c)の逆変換を対応するフィルタバンクを用いて行うことを特徴とする、請求項1に記載の方法。
  4. 信号圧縮を工程b)のフィルタ処理の前に行い、そして、復元を工程b)の後に行うことを特徴とする、請求項1〜3のいずれか一項に記載の方法。
  5. 負信号成分の調整を工程c)の逆変換の前に行うことを特徴とする、請求項1〜4のいずれか一項に記載の方法。
JP2011548504A 2009-02-04 2010-02-01 信号経路を分離する方法及び電気喉頭を使用して音声を改良するための使用方法 Expired - Fee Related JP5249431B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
ATA193/2009 2009-02-04
AT0019309A AT507844B1 (de) 2009-02-04 2009-02-04 Methode zur trennung von signalpfaden und anwendung auf die verbesserung von sprache mit elektro-larynx
PCT/AT2010/000032 WO2010088709A1 (de) 2009-02-04 2010-02-01 Methode zur trennung von signalpfaden und anwendung auf die verbesserung von sprache mit elektro-larynx

Publications (3)

Publication Number Publication Date
JP2012517031A JP2012517031A (ja) 2012-07-26
JP2012517031A5 JP2012517031A5 (ja) 2013-04-11
JP5249431B2 true JP5249431B2 (ja) 2013-07-31

Family

ID=42272699

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011548504A Expired - Fee Related JP5249431B2 (ja) 2009-02-04 2010-02-01 信号経路を分離する方法及び電気喉頭を使用して音声を改良するための使用方法

Country Status (10)

Country Link
US (1) US20120004906A1 (ja)
EP (1) EP2394271B1 (ja)
JP (1) JP5249431B2 (ja)
CN (1) CN102341853B (ja)
AT (1) AT507844B1 (ja)
CA (1) CA2749617C (ja)
DK (1) DK2394271T3 (ja)
ES (1) ES2628521T3 (ja)
PT (1) PT2394271T (ja)
WO (1) WO2010088709A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105310806B (zh) * 2014-08-01 2017-08-25 北京航空航天大学 具有语音转换功能的电子人工喉系统及其语音转换方法
JP7291896B2 (ja) * 2019-09-24 2023-06-16 パナソニックIpマネジメント株式会社 レシピ出力方法、レシピ出力システム

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3746789A (en) * 1971-10-20 1973-07-17 E Alcivar Tissue conduction microphone utilized to activate a voice operated switch
US3872250A (en) * 1973-02-28 1975-03-18 David C Coulter Method and system for speech compression
US4139732A (en) * 1975-01-24 1979-02-13 Larynogograph Limited Apparatus for speech pattern derivation
US4343969A (en) * 1978-10-02 1982-08-10 Trans-Data Associates Apparatus and method for articulatory speech recognition
JPH03228097A (ja) * 1989-12-22 1991-10-09 Bridgestone Corp 振動制御装置
US5171930A (en) * 1990-09-26 1992-12-15 Synchro Voice Inc. Electroglottograph-driven controller for a MIDI-compatible electronic music synthesizer device
JPH08265891A (ja) * 1993-01-28 1996-10-11 Tatsu Ifukube 電気人工喉頭
JP3451022B2 (ja) * 1998-09-17 2003-09-29 松下電器産業株式会社 拡声音の明瞭度改善方法及び装置
US20050004604A1 (en) * 1999-03-23 2005-01-06 Jerry Liebler Artificial larynx using coherent processing to remove stimulus artifacts
US6359988B1 (en) 1999-09-03 2002-03-19 Trustees Of Boston University Process for introduce realistic pitch variation in artificial larynx speech
JP2001086583A (ja) * 1999-09-09 2001-03-30 Sentan Kagaku Gijutsu Incubation Center:Kk 代用原音発生器とその制御方法
US6975984B2 (en) 2000-02-08 2005-12-13 Speech Technology And Applied Research Corporation Electrolaryngeal speech enhancement for telephony
US7708697B2 (en) 2000-04-20 2010-05-04 Pulmosonix Pty Ltd Method and apparatus for determining conditions of biological tissues
US7191134B2 (en) * 2002-03-25 2007-03-13 Nunally Patrick O'neal Audio psychological stress indicator alteration method and apparatus
CA2399159A1 (en) * 2002-08-16 2004-02-16 Dspfactory Ltd. Convergence improvement for oversampled subband adaptive filters
JP2007501957A (ja) * 2003-08-11 2007-02-01 ファクルテ ポリテクニーク デ モン 共振周波数を推定するための方法
US20050281412A1 (en) * 2004-06-16 2005-12-22 Hillman Robert E Voice prosthesis with neural interface
JP4568826B2 (ja) * 2005-09-08 2010-10-27 株式会社国際電気通信基礎技術研究所 声門閉鎖区間検出装置および声門閉鎖区間検出プログラム
CN100576320C (zh) * 2007-03-27 2009-12-30 西安交通大学 一种自动电子喉的电子喉语音增强系统与控制方法
JP4327241B2 (ja) * 2007-10-01 2009-09-09 パナソニック株式会社 音声強調装置および音声強調方法

Also Published As

Publication number Publication date
JP2012517031A (ja) 2012-07-26
US20120004906A1 (en) 2012-01-05
AT507844A1 (de) 2010-08-15
CN102341853A (zh) 2012-02-01
CN102341853B (zh) 2014-06-04
EP2394271B1 (de) 2017-03-22
ES2628521T3 (es) 2017-08-03
DK2394271T3 (en) 2017-07-10
PT2394271T (pt) 2017-04-26
EP2394271A1 (de) 2011-12-14
AT507844B1 (de) 2010-11-15
CA2749617C (en) 2016-11-01
CA2749617A1 (en) 2010-08-12
WO2010088709A1 (de) 2010-08-12

Similar Documents

Publication Publication Date Title
JP6017825B2 (ja) 特に「ハンズフリー」電話システム向けの近接音声信号を雑音除去するための手段を有するマイクロホンとイヤホンの組合せ型のオーディオ・ヘッドセット
AU771444B2 (en) Noise reduction apparatus and method
RU2595636C2 (ru) Система и способ для генерации аудиосигнала
US20110026724A1 (en) Active noise reduction method using perceptual masking
US8538052B2 (en) Generation of probe noise in a feedback cancellation system
JP2015219527A (ja) フィードバックマイクロフォン信号の飽和の影響を防止するanc雑音能動制御オーディオヘッドセット
CN111833896A (zh) 融合反馈信号的语音增强方法、系统、装置和存储介质
CN111432318B (zh) 包括直接声音补偿的听力装置
KR20110008333A (ko) 음성 활동 감지(vad) 장치 및 잡음 억제 시스템을 함께 이용하기 위한 방법
US10204637B2 (en) Noise reduction methodology for wearable devices employing multitude of sensors
CN112616105A (zh) 用于发射掩蔽信号的可穿戴电子装置
CN110931027A (zh) 音频处理方法、装置、电子设备及计算机可读存储介质
CN103827967A (zh) 语音信号复原装置以及语音信号复原方法
Pandey et al. Enhancement of alaryngeal speech using spectral subtraction
JP2007251354A (ja) マイクロホン、音声生成方法
JP5249431B2 (ja) 信号経路を分離する方法及び電気喉頭を使用して音声を改良するための使用方法
JP2011205598A (ja) マイクロホン装置
RU2589298C1 (ru) Способ повышения разборчивости и информативности звуковых сигналов в шумовой обстановке
WO2020208926A1 (ja) 信号処理装置、信号処理方法及びプログラム
JPH07146700A (ja) ピッチ強調方法および装置ならびに聴力補償装置
JP2001249676A (ja) 雑音が付加された周期波形の基本周期あるいは基本周波数の抽出方法
KR102184649B1 (ko) 치과 치료용 소리 제어 시스템 및 방법
WO2024127986A1 (ja) 音声処理システム、音声処理方法、及びプログラム
WO2022231977A1 (en) Recovery of voice audio quality using a deep learning model
Kabir et al. Enhancement of alaryngeal speech utilizing spectral subtraction and minimum statistics

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120821

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20121121

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20121129

A524 Written submission of copy of amendment under article 19 pct

Free format text: JAPANESE INTERMEDIATE CODE: A524

Effective date: 20130221

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130319

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130411

R150 Certificate of patent or registration of utility model

Ref document number: 5249431

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160419

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees