JP5901971B2

JP5901971B2 - 強化エンベロープ符号化音、音声処理装置およびシステム

Info

Publication number: JP5901971B2
Application number: JP2011546539A
Authority: JP
Inventors: ヴァンダリ，アンドリュー，イー; ホーセル，リチャード，ヤー，エムヴァン
Original assignee: Hearworks Pty Ltd
Current assignee: Hearworks Pty Ltd
Priority date: 2009-02-03
Filing date: 2010-02-03
Publication date: 2016-04-13
Anticipated expiration: 2030-02-03
Also published as: WO2010088722A1; EP2394443B1; US20110286618A1; CN102318371A; EP2394443A1; AU2010210292A1; CN102318371B; US9084893B2; JP2012517124A; EP3975587A1; EP2394443A4

Description

（関連出願の相互参照）
本出願は、２００９年２月３日に出願されたオーストラリア仮特許出願第２００９９００３６５号からの優先権を主張し、その出願内容が参照により本明細書に組み込まれる。

本発明は、音声信号から抽出された信号を処理するシステムおよび方法に関し、詳細には、人工内耳および、ボコーダに基づく音声処理または符号化を必要とする他のシステムなど、補聴器内で刺激を生成するために音声信号から抽出された信号を処理するシステムおよび方法に関する。

人工内耳は、重度難聴の個人に聴覚を提供するのに臨床的に有効であることが判明している。かかる装置は、通常、その個人の蝸牛内に装着された埋め込み型電極の配列を備え、それらは、脳により音声として認識される残存聴覚神経要素に対して電気刺激に直接適用する。個人の聴覚伝導路に適用される電気刺激は、様様な音声処理方式に従った音声処理装置によって処理される音響信号から抽出される。

伝統的に、最も初期の音声処理方式は、レシピエントがオープンセットでのある程度の語音弁別を得ることを可能にする方法で、音響信号を処理することに重点を置いてきた。従って、現行の音声処理方式は、レシピエントが、読唇に頼ることなく、静かな環境で会話音声を理解できるようになることに成功している。しかし、正常聴力と人工内耳聴力との比較研究で、声のピッチは、人工内耳のユーザーによって完全には知覚されていないことが示されている。さらに、音楽においてメロディーの基礎を形成するピッチ情報も、人工内耳のユーザーによって完全には認識されていないことが示されている。

声のピッチ情報は、発話知覚において重要な役割を果たし得る。声のピッチ情報は、話者によって行われている発話が質問か意見かを聞き手が判別するのに役立つ抑揚、および話者によってなされ得る単語の強調など、発話の言語特性に対して重要な手がかりを提供できる。声のピッチ情報はまた、話者を識別したり、その話者の感情状態を判別したりするのに役立つほか、同時に発話している話者を聞き手が分離するのに役立つ周辺言語的特性に対しても、重要な手がかりを提供できる。

最も重要なことであるが、声のピッチ情報は、同一の音韻区分内における基本有声音周波数の変化が語彙的意味の変化をもたらす音調言語（標準中国語および広東語など）の認識には、極めて重要であることが実証されている。

人工内耳などの補聴器の刺激に使用する音声信号を処理するために、様々な音声処理方式が開発されている。「マルチピーク方式」と呼ばれるかかる一方式は、フォルマントおよび基本有声音周波数（Ｆ０）など、発話の態様の符号化に特に重点を置いている。この方式に対して、声のピッチ情報は、主に電気刺激率によって符号化されてきた。しかし、この方式の結果では、ピッチが知覚され得ることが示されているが、性能は、現実世界の状況において、特に雑音の存在下で、急速に悪化する。電気刺激信号のエンベロープにおいて、有声音周波数に等しいかまたはそれに関連する周波数で、振幅変調による声のピッチ情報の符号化する（約３００Ｈｚまでの有声音周波数に対して）他の方式が提案されてきた。これらの方式には、最大スペクトル音声処理装置（ＳＭＳＰ）法（これについては、１９９１年、ＭｃＤｅｒｍｏｔｔ＆Ｖａｎｄａｌｉによる、オーストラリア特許第６５７９５９号および米国特許第５５９７３８０号に詳しく記載）、およびスペクトルピーク（ＳＰＥＡＫ）法として知られている本方式のより最近の実施（１９９４年、Ｓｋｉｎｎｅｒほか；１９９５年、Ｗｈｉｔｆｏｒｄほか）、およびＡｄｖａｎｃｅｄＣｏｍｂｉｎａｔｉｏｎａｌＥｎｃｏｄｅｒ（ＡＣＥ）法（２０００年、Ｖａｎｄａｌｉほか；２００２年、Ｓｋｉｎｎｅｒほか）が含まれる。しかし、これらの方式によるピッチ知覚の調査研究で、ピッチに対する手がかり（ｃｕｅ）の特徴および精度は、いくつかの信号について、および現実世界の環境で不足している可能性があり、さらに雑音下では性能が急速に悪化することが示されている。

声のピッチおよび／または音程の符号化を改善するために、現行の音声符号化法に対するいくつかの修正が提案されてきた。これらには、２００５年にＶａｎｄａｌｉほかによる記述の米国特許出願公開第２００６００８００８７号、Ｖａｎｄａｌｉ，Ａ．ＥおよびｖａｎＨｏｅｓｅｌ，Ｒ．Ｊによる「Ｍｏｄｕｌａｔｉｏｎｄｅｐｔｈｅｎｈａｎｃｅｍｅｎｔｆｏｒｔｏｎｅｐｅｒｃｅｐｔｉｏｎ」という名称の米国特許第７５６１７０９号、およびＶａｎｄａｌｉ，Ａ．Ｅ、ｖａｎＨｏｅｓｅｌ、およびＳｅｌｉｇｍａｎ，Ｐ．Ｍによる「Ｐｉｔｃｈｐｅｒｃｅｐｔｉｏｎｉｎａｎａｕｄｉｔｏｒｙｐｒｏｓｔｈｅｓｉｓ」という名称の米国特許出願ＵＳ２００６／００８００８７号の米国一部継続出願で開示されている、ＭｏｄｕｌａｔｉｏｎＤｅｐｔｈＥｎｈａｎｃｅｍｅｎｔ（ＭＤＥ）法およびＭｕｌｔｉ−ｃｈａｎｎｅｌＥｎｖｅｌｏｐｅＭｏｄｕｌａｔｉｏｎ（ＭＥＭ）法がある。さらに、ＭｃＤｅｒｍｏｔｔおよびＭｃＫａｙは、人工内耳システムにおけるピッチの符号化を改善するための装置を提案した（ＭｃＤｅｒｍｏｔｔ，Ｈ．およびＭｃＫａｙ，Ｃ．による「ＣｏｃｈｌｅａｒＩｍｐｌａｎｔＳｏｕｎｄＰｒｏｃｅｓｓｉｎｇＭｅｔｈｏｄａｎｄＳｙｓｔｅｍ」という名称の米国特許出願ＵＳ２００５／０１０７８４３号）。これらの文書の各々は、参照により本明細書に組み込まれる。

前述した声のピッチおよび／または音程の符号化、特に補聴器の刺激に使用するための、改善の試みにもかかわらず、様々な範囲の聴覚環境におけるかかる知覚の改善がまだ必要とされている。従って、本発明は、人工内耳システムにおける声のピッチおよび／または音程情報を効率的な方法で符号化する、競合する雑音および／または干渉信号の影響に対して強固な完全システムを作成することにより、この必要性に対処する。

前述した従来の提案または製品の参照および説明は、当技術分野における公知の一般知識の言明または承認を意図するものでも、また、そのように解釈されるものではない。特に、次の従来技術の説明は、当業者によって公知または周知の事項に関係しないが、本発明の進歩性において、関連する従来技術の提言が一部にすぎないことを理解するのに役立つ。

第１態様において、本発明は、聴覚人工器官で利用する音声信号を処理するための方法であって、
前記音声信号を電気信号に変換するステップと、
前記電気信号を複数の周波数チャネル信号に加工し、各チャネル信号が、少なくとも１組のチャネル出力を定義するための振幅エンベロープを有するステップと、
前記電気信号の基本周波数に関連する情報を取得するステップと、
前記電気信号の調波特質に関連する情報を取得するステップと、
少なくとも１組の変更されたチャネル出力を生成するために、前記電気信号の基本周波数および調波特質に関連する情報に従って、少なくとも１組のチャネル出力を変調するステップと、
聴覚人工器官の対応する電極による電気刺激、および前記電気刺激の振幅のために、少なくとも１つまたは複数のチャネルを定義するため、少なくとも１組の変更されたチャネル出力から、１つまたは複数のチャネルを選択するステップとを含む。

一実施形態において、前記音声信号を電気信号に変換するステップは、音声信号を検出して、電気信号に変換するマイクロホンの使用を含む。その電気信号は、標本化信号を生成するために、さらに増幅され、その後、その電気信号をアナログデジタル変換器に通すことにより標本化され得る。

他の実施形態では、電気信号を複数の周波数チャネル信号に加工するステップは、電気信号を帯域通過フィルターの第１バンクに通すことを含む。各周波数チャネル信号は、その後、１組の対応するチャネルエンベロープ信号を１組の第１チャネル出力として生成するため、エンベロープ検出器に通され得る。

その１組の第１チャネル出力の各チャネルエンベロープ信号は、低速チャネルエンベロープ信号を１組の第２チャネル出力として抽出するため、チャネルエンベロープトラッカー（ｔｒａｃｋｅｒ）により時間内で平滑化され得る。チャネルエンベロープトラッカーは、各チャネルエンベロープ信号内の約７０Ｈｚを上回る周波数成分を平準化するための、一種の低域通過フィルターとして動作し得る。

電気信号を複数の周波数チャネル信号に加工するステップは、さらに、電気信号を帯域通過フィルターの第２バンクに通すことを含み得る。帯域通過フィルターの第２バンクは、帯域通過フィルターの第１バンクと実質的に同一の中心周波数を持ち得、そして、各フィルターは、複数の広帯域幅チャネル信号を生成するため、電気周波数に関連して決定される最大基本周波数の少なくとも２つの基本周波数調波を通すように、十分な広さを持ち得る。広帯域幅チャネル信号の各々は、結果として得られる複数の広帯域幅チャネルエンベロープ信号を１組の第３チャネル出力として抽出するため、エンベロープ検出器に通され得る。

他の実施形態では、電気信号の基本周波数に関連する情報を取得するステップは、電気信号を基本周波数推定器に通すことを含む。基本周波数推定器は、約２ＫＨｚの周波数までの電気信号に存在する任意の正弦波周波数成分の周波数および電力の推定値を提供するために、電気信号を処理する位相ボコーダＦＦＴフィルターバンクであり得る。基本周波数推定器は、電気信号で検出される最も優勢な調波の基本周波数を決定し得、その最も優勢な基本周波数の推定を表す信号を生成し得る。基本周波数推定器は、さらに、約２ｋＨｚまでの周波数で、その最も優勢な基本周波数に関連する電力の、電気信号に存在する全信号電力に対する比を表す信号を生成し得る。

他の実施形態では、電気信号の調波特質に関連する情報を取得するステップは、最も優勢な基本周波数に関連する電力の、電気信号内に存在する全信号電力に対する比率を表す信号を、周期確率推定器に渡すことを含む。周期確率推定器は、最も優勢な基本周波数に関連する電力の、電気信号内に存在する全信号電力に対する比率を表す信号を圧縮制限および平準化することにより、入力信号（２ｋＨｚまで）の周期確率値を抽出し得る。

他の実施形態では、電気信号の調波特質に関連する情報を取得するステップは、電気信号に存在する任意の正弦波周波数成分の周波数および電力を、周期確率推定器に渡すことを含む。周期確率推定器は、任意の周波数チャネル内の信号が、電気信号の推定された最も優勢な基本周波数に関連する確率を推定し得、かつ、各チャネルに対して、チャネル周期確率信号を生成し得る。

さらに他の実施形態では、少なくとも１組の変更されたチャネル出力を生成するために、電気信号の基本周波数および調波特質に関する情報に従って、少なくとも１組のチャネル出力を変調するステップは、チャネル変調器によって実行される。チャネル変調器は、１組の第２チャネル出力を受信し得、そして、基本周波数推定器によって提供されるとおり、電気信号の推定された最も優勢な基本周波数と実質的に等しい周期変調関数によってその信号を変調し得る。第２チャネル出力の変調された組は、第２チャネル出力のスケーリングおよび変調された組を生成するために、周期確率推定器によって決定されたチャネル周期推定信号によってスケーリングされ得る。

チャネル変調器はさらに、１組の第１チャネル出力を受信し得、そして、第１チャネル出力のスケーリングされた組を生成するために、各チャネルに対して決定されたチャネル非周期推定信号（すなわち、１−チャネル周期確率）によって、各第１チャネル出力をスケーリングし得る。第１チャネル出力のスケーリングされた組は、特に入力信号周期推定値が、その入力信号が周期的であることを示している場合は、第１チャネル出力のスケーリングおよび減衰された組を生成するため、チャネル変調器によってさらに減衰され得る。

一実施形態では、第２チャネル出力のスケーリングおよび変調された組は、その後、第４チャネル出力の変更された組を生成するため、第１チャネル出力のスケーリングおよび減衰された組と混合され得る。他の実施形態では、第２チャネル出力のスケーリングおよび変調された組は、１組の復元チャネルエンベロープ信号を生成するため、第１チャネル出力のスケーリングされた組と混合される。

さらに他の実施形態では、チャネル出力の少なくとも１つの変更された組から１つまたは複数のチャネルを選択するステップは、最大スペクトル振幅を有する第４チャネル出力の変更された組からのチャネル選択を含む。最大スペクトル振幅を有するチャネルの選択は、選択されたチャネルのスペクトル範囲を拡大し、選択された最大チャネル内により広範囲に渡る拡散を取り込むために、フレーム間に渡り、少なくとも部分的に多重化され得る。最大スペクトル振幅を有する選択されたチャネルの振幅は、１組の復元チャネルエンベロープ信号の振幅から復元され得る。

第２態様に従って、聴覚人工器官内での使用のために音声信号を処理する方法が提供されており、この方法は、
前記音声信号を電気信号に変換するステップと、
前記電気信号を複数の周波数チャネル信号に加工し、各周波数チャネル信号が、少なくとも１組のチャネル出力を定義するための振幅エンベロープを有するステップと、
前記電気信号が調波および／または非調波信号を含むか否かを判断するステップと、
調波信号を含む電気信号の一部に対して、１つまたは複数の変調チャネルエンベロープ信号を生成するため、調波信号の基本周波数と等しい周波数の周期関数によって、チャネル出力の低速変動エンベロープを変調するステップと、
非調波信号を含む電気信号の一部に対して、１つまたは複数の非変調チャネルエンベロープ信号を生成するステップと、
各チャネルに対して、各チャネル用に混合チャネル刺激信号を生成するため、所定の混合比に従って、変調チャネルエンベロープ信号および非変調チャネルエンベロープ信号を混合するステップと、
混合チャネル刺激信号に従って、電気刺激用に少なくとも１つまたは複数のチャネルを定義するために１つまたは複数のチャネルを選択し、聴覚人工器官の対応する電極に刺激を適用するステップとを含む。

本発明の本態様の実施形態では、所定の混合比は、周波数チャネル信号が、電気信号内の最も優勢な基本周波数に関連する度合いから導出される。周波数チャネル信号と、電気信号内の最も優勢な基本周波数との間に強固な関係がある場合は、高い混合比であり得る。また、周波数チャネル信号と、電気信号内の最も優勢な基本周波数との間の関係が弱い場合は、低い混合比であり得る。

本発明の第３態様に従って、本発明は、聴覚人工器官内での使用のために声信号を処理するシステムを提供し、そのシステムは、
音声信号を電気信号に変換するための変換器と、
前記電気信号を複数の周波数チャネル信号に加工し、各チャネル信号が、少なくとも１組のチャネル出力を定義するための振幅エンベロープを有する第１処理装置と、
前記電気信号の基本周波数に関連する情報を取得するための第２処理装置と、
前記電気信号の調波特質に関連する情報を取得するための第３処理装置と、
少なくとも１組の変更されたチャネル出力を生成するために、電気信号の基本周波数および調波特質に関連する情報に従い、第１処理装置から受信した少なくとも１組のチャネル出力を変調するための変調器と、
前記電気信号の振幅と共に、電気刺激用に少なくとも１つまたは複数のチャネルを定義するため、少なくとも１組の変更されたチャネル出力から１つまたは複数のチャネルを選択し、それに従って刺激信号を生成するためのセレクターと、
前記聴覚人工器官での適用のために前記刺激信号を伝達するための送信機とを備える。

本発明の第３態様の実施形態に従って、変換器は、音声信号を検出して、電気信号に変換するように構成されたマイクロホンを備える。変換器はさらに、電気信号を増幅するための増幅器、および標本化信号を生成するためのアナログデジタル変換器を備え得る。

第１処理装置は、電気信号を複数の周波数チャネル信号に加工するための帯域通過フィルターの第１バンクを備え得る。第１処理装置はさらに、エンベロープ検出器を備え得る。エンベロープ検出器は、１組の対応するチャネルエンベロープ信号を１組の第１チャネル出力として生成するため、各チャネル信号がさらにエンベロープ検出器に通されるように構成され得る。第１処理装置はさらに、チャネルエンベロープトラッカーを備え得る。チャネルエンベロープトラッカーは、低速チャネルエンベロープ信号を第２チャネル出力として抽出するため、１組の第１チャネル出力の各チャネルエンベロープ信号を受信するよう構成され得る。

第１処理装置はさらに、帯域通過フィルターの第２バンクを備え得る。帯域通過フィルターの第２バンクは、帯域通過フィルターの第１バンクと実質的に同一の中心周波数を有し得、そして、複数の広帯域幅チャネル信号を生成するため、電気周波数に関連して決定される最大基本周波数の少なくとも２つの基本周波数調波を通すように、十分な広さを持ち得る。第１処理装置はまた、結果として得られる複数の広帯域幅チャネルエンベロープ信号を１組の第３チャネル出力として抽出するため、広帯域幅チャネル信号の各々が第２エンベロープ検出器に通され得るよう、第２エンベロープ検出器も備え得る。

第２処理装置は、基本周波数推定器を備え得る。基本周波数推定器は、約２ｋＨｚの周波数までの電気信号に存在する任意の正弦波周波数成分の周波数および電力の推定値を提供するためにその電気信号を処理する、位相ボコーダＦＦＴフィルターバンクであり得る。基本周波数推定器は、約２ｋＨｚの周波数までの電気信号で検出される最も優勢な調波信号の基本周波数を決定し、そして、その最も優勢な基本周波数の推定を表す信号を生成し得る。基本周波数推定器はさらに、その最も優勢な基本周波数に関連する電力の、約２ｋＨｚの周波数までの電気信号に存在する全信号電力に対する比を表す信号を生成し得る。

第３処理装置は、最も優勢な基本周波数に関連する電力の、電気信号内に存在する全信号電力に対する比を表す信号を少なくとも受信する周期確率推定器を備え得る。周期確率推定器は、最も優勢な基本周波数に関連する電力の、電気信号内に存在する全信号電力に対する比を表す信号を圧縮制限および平準化することにより、入力信号の周期確率値を抽出し得る。電気信号に存在する任意の正弦波周波数成分の周波数および電力を表す信号、および１組の第３チャネル出力は、周期確率推定器によって受信され得る。周期確率推定器はさらに、任意の周波数チャネル内の信号が、電気信号の推定された最も優勢な基本周波数に関連する確率を推定し、そして、基本周波数推定器から決定された電気信号内に存在する任意の正弦波周波数成分の周波数および電力、ならびに帯域通過フィルターの第２バンクによって決定された１組の第３チャネル出力を使用して、各チャネルに対し、チャネル周期確率信号を生成し得る。

変調器は、１組の第２チャネル出力を受信して、基本周波数推定器によって提供されるとおり、電気信号の推定された最も優勢な基本周波数と実質的に等しい周期変調関数によって１組の第２チャネル出力を変調するチャネル変調器であり得る。第２チャネル出力の変調された組は、第２チャネル出力のスケーリングおよび変調された組を生成するため、各チャネルに対して、周期確率推定器によって決定されたチャネル周期推定信号によってスケーリングされ得る。チャネル変調器はさらに、１組の第１チャネル出力を受信して、第１チャネル出力のスケーリングされた組を生成するために、１−各チャネルに対して決定されたチャネル周期確率信号によって、各第１チャネル出力をスケーリングし得る。第１チャネル出力のスケーリングされた組は、特にその入力信号が周期的であることを入力信号周期確率値が示している場合、第１チャネル出力のスケーリングおよび減衰された組を生成するため、チャネル変調器によってさらに減衰され得る。第２チャネル出力のスケーリングおよび変調された組は、各チャネルに対して第４チャネル出力の変更された組を生成するため、第１チャネル出力のスケーリングおよび減衰された組と混合され得る。第２チャネル出力のスケーリングおよび変調された組は、１組の復元チャネルエンベロープ信号を生成するため、第１チャネル出力のスケーリングされた組と混合され得る。

セレクターは、最大スペクトル振幅を有する出力に基づき、少なくとも１組の変更されたチャネル出力から１つまたは複数のチャネルを選択する最大値セレクターであり得る。最大値セレクターは、選択されるチャネル数を増やすため、最大スペクトル振幅を有するチャネルの選択が、フレーム間に渡って少なくとも一部は多重化されるように、マルチプレクサをさらに備え得る。

送信機は、埋め込み型刺激装置に伝達するための刺激信号を符号化する符号器を備え得る。送信機は、ＲＦ信号の形式で符号化された刺激信号を伝達するように構成されるＲＦ送信機をさらに備え得る。

ここでは、本発明の好ましい特徴について、特に添付の図を参照しながら説明する。しかし、図に例示され、また、図を参照して説明されている機能は、本発明の範囲を限定するものとして解釈されないことを理解されたい。

従来型の音声処理システムを示す単純なブロック図である。本発明の一実施形態に従った音声処理システムの様々なコンポーネントを示す概略図である。本発明のシステムに従った帯域通過フィルターおよびエンベロープトラッカーの様々なコンポーネントの一実施形態を示す概略図である。図３のエンベロープトラッカーの様々なコンポーネントの一実施形態を示す概略図である。本発明のシステムに従ったＦ０推定器の様々なコンポーネントの一実施形態を示す概略図である。図５のＦ０推定器のＦＦＴ位相ボコーダの様々なコンポーネントの一実施形態を示す概略図である。入力音声信号の基本周波数に関連する値を生成するために、図５のＦ０推定器によって開始されるプロセスの一実施形態を示す流れ図である。本発明のシステムに従った周期確率推定器の様々なコンポーネントの一実施形態を示す概略図である。システムによって受信された入力信号が調波（または周期的）である確率を推定するために、図８の周期確率推定器によって開始されるプロセスの一実施形態を示す流れ図である。２ｋＨｚ以下の中心周波数を有する各チャネルについてチャネル周期確率を推定するために、図８の周期確率推定器によって開始されるプロセスの一実施形態を示す追加の流れ図である。２ｋＨｚを超える中心周波数を有する各チャネルについてチャネル周期確率を推定するために、図８の周期確率推定器によって開始されるプロセスの一実施形態を示す追加の流れ図である。本発明のシステムに従ったチャネル変調器の様々なコンポーネントの一実施形態を示す概略図である。刺激装置に対して刺激チャネルおよび刺激強度を決定するために、最大値セレクターによって開始されるプロセスの一実施形態を示す流れ図である。標準的なＣＩ処理方式および本発明の処理方式に関するエレクトロドグラム（ｅｌｅｃｔｒｏｄｏｇｒａｍ）を示す。標準的なＣＩ処理方式および本発明の処理方式に関するエレクトロドグラム（ｅｌｅｃｔｒｏｄｏｇｒａｍ）を示す。

本発明について、人工内耳などの埋め込み型聴覚人工器官での使用への応用に関連して、以下で説明する。しかし、本発明はまた、別のボコーダを基礎とする音声処理システムにも応用可能であり、その場合もなお本発明の精神の範囲内あることが理解されるであろう。

図１を参照すると、従来型の人工内耳システムで使用される従来型の音声処理システム２０の簡略化したブロック図が示されている。従来型の人工内耳システムは、通常、音声を検出し、その音声を、埋め込み型刺激装置に伝達される信号に変換するための音声処理システム２０を使用する外部スピーチプロセッサを備える。埋め込み型刺激装置は、その後、検出された音声を再現するために、受信した信号を、埋め込みレシピエントの聴覚路に直接適用され得る電気刺激パルスに変換する。

様々な音声処理システム２０が提案され、人工内耳システムで採用されているが、成功の度合いは様々である。採用された様々なタイプのシステムまたは方式には、ＡｄｖａｎｃｅｄＣｏｍｂｉｎａｔｉｏｎＥｎｃｏｄｅｒｓ（ＡＣＥ）法、ＣｏｎｔｉｎｕｏｕｓＩｎｔｅｒｌｅａｖｅｄＳａｍｐｌｉｎｇ（ＣＩＳ）法、およびスペクトルピーク（ＳＰＥＡＫ）法がある。

一般に、各システムまたは方式２０は、音声を検出および受信して、対応する電気信号を生成するために、マイクロホン２１を使用する。電気信号は、その後、通常、その信号がいくつかの事前増幅を受けるプリプロセッサに通され、さらに必要な場合は、アナログデジタル変換器に通された後、デジタル信号に変換される。

前処理された信号は、その後、通常は、帯域通過フィルターのバンク２３によって、いくつかの周波数チャネルに分けられる。チャネル数は、採用した特定の方式２０によって異なる可能性があり、そして、各チャネル内の信号のエンベロープが通常は推定される。マイクロプロセッサまたはデジタル信号プロセッサ２４は、通常、最大チャネル振幅（または、ＣＩＳ刺激方式の場合は、全てのチャネル）を選択し、その選択された振幅が、その後、通常は、刺激電流レベルに変換される。刺激電流レベルは、通常、選択された周波数チャネルに対応する各電極に対して、可聴値と最大快適度との間にマッピングされる。その際、埋め込み型刺激装置の電極は、蝸牛のトノトピーの特質に合致する方法で、周波数チャネルに割り当てられる。刺激電流レベルは、通常、符号器２５へ送信され、そこで、検出された音声信号内のスペクトルキューが通常、電極の位置によって符号化され、時間的エンベロープキューが、刺激信号のエンベロープ内の振幅変動によって符号化される。符号化された信号は、その後、送信機２６に送信され、そこで、通常はＲＦ信号の形式で、埋め込み型刺激装置２７に送信される。

前述したシステム２０は、レシピエントに対する高レベルの発話知覚の実現に有効であったが、システム２０は通常、音声から抽出された限られたスペクトルおよび時間的情報を供給し、これは、人工内耳のレシピエントにおいて、通常、満足のいく音楽および音程の知覚には不十分である。

この欠陥に対処するため、図２に示すように、本発明の音声処理システム１５が提案される。前述のとおり、本発明の音声処理システム１５は、前述したような従来型の音声処理システムの基本原理のいくつかを組み込む。

これに関し、音声処理システム１５は、音響入力音声信号を電気信号に変換するマイクロホン１を含む。結果として得られた電気信号は、次に、プリアンプ２によって増幅され、８ｋＨｚのアンチエイリアシング（ａｎｔｉ−ａｌｉａｓｉｎｇ）低域通過フィルターに続き、１６ビットのアナログデジタル変換器３を用いて、１６ｋＨｚの速度で標本化される。標本化（広帯域）信号３０は、その後、フィルターバンク４に渡される。

フィルターバンク４は、信号３０を複数の間隔周波数チャネル（通常Ｎ_ｃｈ＝２０）に加工する帯域通過フィルター４３のバンクを備える。フィルターバンク４は、各間隔周波数チャネル内の信号のエンベロープを推定するための複数のエンベロープ推定器または検出器４４を含む。最大値セレクター８は、電気刺激信号生成のためにさらに処理される最大振幅を有する周波数チャネルに基づいて、周波数チャネルのサブセットを任意で選択するために提供される。マッピングエンコーダ９は、前述したように、個々の人工内耳ユーザーの周波数から電極および入力強度から電気刺激へのレベルマッピング要件に従って、最大値セレクター８によって選択されたエンベロープ信号を電気刺激信号に変換するために提供される。ＲＦ送信機１０は、電気刺激信号を埋め込み型人工内耳受信機／刺激装置１１に送信するために提供される。

しかし、前述のシステム２０とは異なり、本発明のシステム１５は、音声信号における声のピッチおよび音程の知覚の支援用である。このため、システム１５は、標本化（広帯域）信号３０を受信して、リアルタイムで、信号の最も優勢な基本周波数（Ｆ０）およびＦ０信号対全信号電力の比を推定するＦ０推定器５も含む。周期確率推定器（ＰＰＥ）６も、各周波数チャネル内の信号が推定されたＦ０周波数に関連する度合いを決定するために提供される。これを実現するため、ＰＰＦ６は、各周波数チャネル内の信号が推定Ｆ０周波数の整数倍である周波数成分または一部を含むかどうか、および／または推定Ｆ０周波数と等しいそのエンベロープ内の周期性を含むかどうかを判別することができる。チャネル変調器７も、推定Ｆ０周波数と等しい周波数を有する周期関数によって、各チャネル信号の低周波エンベロープを適応的に変調する方法として提供される。後述するように、本発明のシステム１５は、非変調の（元の）チャネルエンベロープ信号を、チャネル変調器７からの変調チャネル信号と適応的に組み合わせる（混合する）方法も提供し、そこでは、これらの信号を混合するために使用される利得率が、チャネル信号が推定Ｆ０に関連する度合いによって決定される。

後述でさらに明らかになるように、好ましい実施形態では、本発明のシステム１５で提供される追加の機能性は、主に３つの処理段階で実施されるが、標準的な処理段階の一部に対するいくつかの小規模の修正も必要となる。

図３を参照すると、フィルターバンク４がより詳細に示されている。フィルターバンク４は、標本化信号３０を複数のチャネル信号にフィルタリングするチャネル信号を構築するために、ＦＦＴ二値ベクトルの複素加算が使用される帯域通過フィルター４３の第１バンク（重複加算プロセスおよび１２８ポイントＦＦＴを使用して実施）を採用する。チャネル信号は、その後、チャネルエンベロープ信号４０（ＣｈａｎＭａｇ）として参照される１組の第１チャネル出力を生成するため、エンベロープ検出器４４の第１バンク（二乗の実数値および虚数値の合計の平方根が計算される複素チャネル信号の求積法調整によって実施）を通過する。チャネルエンベロープ信号４０は、本明細書で低速変動チャネルエンベロープ信号４１（ＣｈａｎＥｎｖ）として参照される１組の第２チャネル出力を生成するため、チャネルエンベロープトラッカー４７によって時間内に平滑化される。

エンベロープトラッカー４７は、図４により詳細に示されている。エンベロープトラッカー４７は、エンベロープ信号のピーク水準を追跡して、約７０Ｈｚ（１４５５Ｈｚ／２０標本）を超える変調を除去するように構成される。これは、チャネルエンベロープ信号４０の各々を受信して、各信号の振幅を追跡するエンベロープトラッカー４７によって実現される。エンベロープトラッカーは、チャネルエンベロープ信号４０ＣｈａｎＭａｇ内の全ピーク水準を追跡するよう、瞬時のアッタクタイム４７４を有する。ピーク４７５を検出すると、エンベロープトラッカーは、約７０Ｈｚを超える（またはＦ０周波数を超える）エンベロープ周波数成分を平滑化するように、ステップ４７９で定義されるとおり２０標本まで（〜１３．７５ｍｓ）の期間（または推定Ｆ０期間５１よりも若干長い期間）、ピーク水準を維持する（または、超低速リリースタイム０．０２Ｈｚの１次ＬＰＦを使用する）。ホールドタイム中により大きな信号に遭遇すると、ホールドタイムがリセットされ、そうでない場合は、ホールドタイムが満了すると、約７０Ｈｚ（または推定Ｆ０周波数）を下回るエンベロープ成分が追跡されるように、高速リリースタイム４７７（３００ＨｚＬＰＦ）が適用される。エンベロープトラッカーは、信号経路に１３．７５ｍｓの追加の処理遅延を導入することに注意されたい。

再度図３を参照すると、広帯域幅チャネルエンベロープ信号ＷｉｄｅＢａｎｄｗｉｄｔｈＣｈａｎＭａｇ４２を決定するため、フィルターバンク４は、帯域通過フィルター４５の第２バンクを用いて、標本化信号３０をフィルタリングするためにも使用される（チャネルエンベロープ信号の抽出に使用された同一の重複加算１２８ポイントＦＦＴを使用しても実施される）。これらの信号は、チャネル信号が推定Ｆ０に関連する確率を決定するために、周期確率推定器（ＰＰＥ）によっても使用される。帯域通過フィルター４５の第２バンクは、帯域通過フィルター４３の第１バンクと並列しており、ＭａｘＦ（約２ｋＨｚ）を超えるチャネル周波数に対してのみ使用される。それらは、チャネルエンベロープ信号４０および４１を抽出するために使用される帯域通過フィルター４３の元のバンクと同一の中心周波数を有し、システムによって分析されるため、最大Ｆ０周波数の少なくとも２つのＦ０調波を通すのに十分に広い最小帯域幅（すなわち、約３３０Ｈｚの最大Ｆ０に対して少なくとも約６６０Ｈｚの幅）を有する。第２の組のエンベロープ推定器４６は、１組の第３チャネル出力を抽出するために使用され、本明細書では、広帯域幅チャネルエンベロープ信号４２（ＷｉｄｅＢａｎｄｗｉｄｔｈＣｈａｎＭａｇ）として参照される。このため、複合倍音に対して、これらのチャネルは、その音の基本周波数に関連するそれらのエンベロープ内で振幅変調を伝えるであろう。

フィルターバンク分析レート（またはＦＦＴ窓の重複）は、所望の電気刺激率に応じて、約１ｍｓ〜０．５ｍｓの間のレート（または８７．５％〜９３．７５％の窓の重複）に調整可能である。通常、０．６８７３ｍｓのレート（すなわち、１６０００Ｈｚ／１１標本＝１４５５Ｈｚ）が採用され、これは、約３５０ＨｚまでのＦ０周波数の標本化に十分な高さである。

以前に示唆したように、Ｆ０推定器５は、入力音声信号３０内に存在する（もしあれば）最も優勢な調波信号に関連する基本周波数５０（Ｆ０Ｆｒｅｑ）のリアルタイムの推定値を抽出するために使用される。それはまた、調波信号対全信号電力の比（またはその代わりに、Ｆ０信号対雑音＋信号電力の比５３（Ｆ０ＳＮＳＲ）として記述される）の推定値も提供する。これを実現するために、Ｆ０推定器５は、いくつかの処理段階を組み込む。第１段階は、入力信号内の成分の電力および周波数の推定に使用される。第２段階では、所与の（候補）Ｆ０に関連する信号内に存在する（または整合する）電力量を決定するため、一連の調波篩（ここで、各篩は所与のＦ０の調波を通す）が使用される。１つの半音で区切られるＦ０周波数の範囲が検査されて、最大量の電力を通す候補Ｆ０が見つけられる。第３段階では、最大の整合電力を有する候補Ｆ０に対して、より細かい周波数分解能を持つ調波篩の第２バンクが適用される。第４段階は、Ｆ０オクターブエラーの削減に使用される。静穏な状態および雑音下でオクターブエラーを最小限にするため、重み関数を最高の候補Ｆ０の整合電力に適用する。最大の重み付き整合電力を有する候補Ｆ０が、Ｆ０推定器の現在のタイムフレームに対するＦ０推定値として選択される。最終段階は、いくつかの連続するタイムフレームを通して取得されたものから最高のＦ０推定値を選択することにより、雑音下での誤ったＦ０推定エラーを削減するために使用される。各段階の詳細な説明については、後述する。

図５〜図７を参照すると、Ｆ０推定器５の第１段階が示されている。本段階は、入力信号３０に存在する正弦波成分（または部分）の周波数または電力の推定値を提供するため、高速フーリエ変換（ＦＦＴ）位相ボコーダ５６を利用する。

図６に、ＦＦＴ位相ボコーダ５６が機能する方法が詳細に示されている。ステップ５６１で、人工内耳のレシピエントによって装着されているマイクロホンから通常受信される標本化信号３０は、ステップ５６２で８ｋＨｚのレートまでダウンサンプリングする（２の倍数による時間内のデシメーション）前に、低域通過アンチエイリアス処理フィルター（２．２ｋＨｚのカットオフ周波数を持つ４次無限インパルス応答（ＨＲ）バターワースフィルター）を用いて、最初に低域通過フィルター処理される。ステップ５６２では、ダウンサンプリングされた信号の最近の３２ｍｓ（すなわち、２５６標本）が、次に、ハニング窓（周波数領域で３１．２５Ｈｚの−３ｄＢの帯域幅を提供する）を使用して、窓をかけられる。その後、ステップ５６５で、「スタックおよび追加（ｓｔａｃｋｉｎｇａｎｄａｄｄｉｎｇ）」技法が実行されるが、その技法は、周波数領域内で２の倍数でのデシメーションにより、標本数を１２８まで削減する（ステップ５６６で）のに使用される。

ステップ５６７で、これらの標本は、−（ｋ×ｔ）標本（ここで、ｔは分析フレーム番号（ｔ＝０，１，２，．．．）、ｋ＝分析フレームレート−１１標本（これは分析周波数−８０００Ｈｚ／１１−７２７Ｈｚを提供する）とする）、およびＮ−１２８標本によって時間内にローテーションされる。そのローテーションは、あとに続く位相ボコーダ処理のため、連続するＦＦＴフレーム間のゼロ相対位相シフトを維持するために実行される。ステップ５６８では、１２８ポイントＦＦＴが、その後、入力信号の複合周波数スペクトルの推定値を取得するために適用され、この場合、ＦＦＴビンｂ＝１〜３２で、６２．５〜２０００Ｈｚの範囲で中心周波数を有する、６２．５Ｈｚ間隔の周波数帯域を表す。

ステップ５６９で、位相ボコーダは次に、ＦＦＴビン１〜３２内の信号成分のビン電力値５７０およびビン周波数値を推定するために使用される。ビン電力値は、二乗の実数および虚数のＦＦＴ値の合計から抽出されるが、ビン周波数値は、連続するＦＦＴフレーム間の位相差から推定される。これは、各ＦＦＴビン内の実数項および虚数項からの位相（Ｐｈ）の計算（ここで、Ｐｈ−逆正接（虚数／実数））、および、ビン周波数を計算するための連続するＦＦＴフレーム間の位相差（ｄＰｈ）を使用して行われる（ここで、ビン周波数ｂ×Ｆｓ／Ｎ＋ｄＰｈ［ｂ］×Ｆｓ／（ｋ×２π）、およびｂ＝ＦＦＴビン数、ｋ＝解析ホップ＝１１標本、Ｆｓ＝８０００Ｈｚ、およびＮ＝１２８標本とする）。計算された位相差は、ビン周波数を計算する前に、「アンラップ」されることに注意する。ビン電力およびビン周波数は、次に、ステップ５７２で、ＦＦＴビンｂ＝１〜３２に対して、平均ビン電力５７（ＡｖＢｉｎＰｏｗｅｒ［ｂ］またはｐ_ｂ）および平均ビン周波数５９（ＡｖＢｉｎＦｒｅｑ［ｂ］またはｆ_ｂ）の値を生成するため、４つのＦＦＴフレームに渡って算術的に平均化される。４つの連続するフレームに渡るビン電力およびビン周波数の平均化を通して、平均項は５．５ｍｓ（１８２Ｈｚ）毎に生成される。各ビンに対する平均ビン電力は、ＡｖＢｉｎＰｏｗｅｒ（Ｐ１＋Ｐ２＋Ｐ３＋Ｐ４）×０．２５（ここで、Ｐ１〜Ｐ４は、４つの連続するＦＦＴフレームに対するＦＦＴビン電力とする）を使用して計算される。各ビンに対する平均ビン周波数は、ＡｖＢｉｎＦｒｅｑ−（Ｆ１×Ｐ１＋Ｆ２×Ｐ２＋Ｆ３×Ｐ３＋Ｆ４×Ｐ４）／（Ｐ１＋Ｐ２＋Ｐ３＋Ｐ４）（ここで、Ｆ１〜Ｆ４は、４つの連続するＦＦＴフレームに対するＦＦＴビン周波数とする）を使用して計算される。ビン電力およびビン周波数は、４つの連続するＦＦＴフレームに渡って平均化され（ＦＦＴフレームレート＝８０００Ｈｚ／１１標本＝７２７Ｈｚ）、Ｆ０推定器内の残りの処理が、７２７／４＝１８２Ｈｚのレートで進められる。平均ビン周波数の許容可能な上限値は、ＭａｘＦ−（３２＋０．５）ＦＦＴビン×６２．５Ｈｚ（ビン幅）−２．０３１ｋＨｚである。この制限を越える周波数の平均ビン電力が、ゼロに設定される。

平均ビン電力５７の値は、ステップ５６５で、２５６ポイントのハニング窓で窓をかけられて、周波数を２でデシメーションされた処理済み信号５６６の複合スペクトル振幅特性における過度のリップルを計上するため、任意で変更され得る。周波数デシメーションプロセスは、周波数デシメーションが生じなければ通常あったであろうＦＦＴビン中央周波数の中心を外れた周波数成分に、より大きな減衰を効果的に導入する。このため、ステップ５７３で、システムの複合振幅特性は、その窓の逆の振幅特性を（そのビンの中心周波数から＋／−半分のビン幅内のビン周波数に対して）、それらの平均ビン周波数に基づき、平気ビン電力に適用する。

マイクロホン１から取得した入力信号に対して、平均ビン電力５７は、ステップ５７４で、０〜２ｋＨｚの周波数範囲に渡り、関数によって、マイクロホンのスペクトル振幅特性の逆に比例して、均一化される。その関数は、６２Ｈｚ〜２ｋＨｚまでの−４ｄＢ／オクターブ特性を有する。システムに直接入力された（すなわち、マイクロホンを回避して）入力信号に対しては、平均ビン電力の均一化が回避される。

再度図５を参照すると、平均ビン電力５７および平均ビン周波数５９が抽出されると、これらはその後、Ｆ０推定プロセス５８を実行するために、Ｆ０推定器の第２段階で使用される。

Ｆ０推定プロセスについては、図７に関連して、さらに詳述する。先ず、候補Ｆ０周波数に調波的に関連した、２ｋＨｚを下回る標本化入力信号３０が決定される。これは、約８２Ｈｚから始まって、半音ずつ約３２９Ｈｚまで（またはそれ以上、例えば、システムパラメータに応じて５２３Ｈｚまで）、または西洋音階で音符Ｅ２〜Ｅ４に相当する５．９４％（すなわち、８２、８７、９３、９８、１０４、１１０、．．．３１１、３２９Ｈｚ）まで増加する、候補Ｆ０周波数に対して行われる。各候補Ｆ０周波数に対して、それらの平均ビン周波数５９が、次の式による候補Ｆ０周波数の倍数に中心を置く一連の矩形調波篩（すなわち理想的なＢＰＦ）の範囲に入る場合、ステップ５８２で、平均ビン電力５７の合計により、合計または整合電力が決定される。

（Ｔ＝１〜２８およびｎ＝１，２，３．．．とする）
式中、Ｔは候補Ｆ０のテンプレート番号、Ｃ_Ｆ０は候補Ｆ０周波数−８２×２^Ｔ／１２、Ｆｒ［Ｔ］はＭａｘＦの最大調波周波数までのＣ_Ｆ０の全整数倍あたりの１／−０．５半音に渡る篩周波数の範囲であり、Ｆ_{ｏｆｆｓｅｔ}＝２Ｈｚは、隣接する候補Ｆ０の篩間に少量の重複を提供するために使用される。

その後、ステップ５８２で、次の方程式を用いて、各候補Ｆ０周波数について整合電力が計算される。

ステップ５８２で、各候補Ｆ０について、平均ビン電力を合計するまえに、追加の規則が任意で採用され得る。各候補Ｆ０に対して、合計される周波数の範囲に含まれる最大平均ビン電力値が先ず、決定される。この値は、平均ビン電力値の合計用に閾値を設定するために使用される。その閾値は通常、「静穏な状況」に対しては、０．００１×最大平均ビン電力、「雑音下の状況」に対しては、０．０１×最大平均ビン電力に設定される。この閾値を下回る平均ビン電力は、ステップ５８２で合計されない。「静穏な状況」および「雑音下の状況」はそれぞれ、信号対雑音比（ＳＮＲ）が＋６ｄＢより大きいか、＋６ｄＢより小さいかによって、おおまかに線引きされる。本実施では、「静穏な状況」または「雑音下の状況」パラメータの選択は、ユーザーによって行われる。将来の実施では、ＳＮＲの推定に基づいて、適応的にパラメータ選択を制御できるであろう。

第３段階では、理想的な条件下で、最大整合電力を有する候補Ｆ０が、Ｆ０の推定値を抽出するために使用され得る。しかし、雑音の影響に対してより頑強なＦ０推定値を決定するため、前述の第２段階で合計した調波から抽出された平均Ｆ０周波数の倍数に中心を置く、より狭い篩を使用する第２調波篩プロセスを採用する。また、処理要件を削減するため、残りの３〜５の処理段階は、ステップ５８６から抽出された最大整合電力５８７の３ｄＢ電力（すなわち、０．５）内の整合電力を有する候補Ｆ０、およびその整合電力を提供するために、少なくとも２つの平均ビン電力値（または調波）が合計された候補Ｆ０に対してのみ実行される。

平均Ｆ０周波数５８９（ＡｖｅｒａｇｅＦ０）は、ステップ５８８で、候補Ｆ０用に合計された周波数の範囲に含まれるビン周波数ｆ_ｂの重み付き電力平均から計算され、その後、次の方程式のように、同一組のビンに対する平均ビン電力の合計で除算される。

調波篩の第２バンクは、機能においてガウス型であり、ステップ５９０で、重み付き整合電力５９１を抽出するために実施される。重み付き整合電力は、所与の候補Ｆ０に対して、成分周波数ｆ_ｂが、平均Ｆ０周波数のその最も近い整数倍にどの程度近いかに比例するガウス関数Ｇによって合計される各周波数成分の電力をスケーリングすることにより計算される。ガウス型篩は、ＡｖｅｒａｇｅＦ０の倍数の調波に置かれた平均中央周波数、および、以下の方程式で与えられるとおり、ｋ_Ｇの倍数に等しい標準偏差を有する（式中、ｈは調波数、またはビン周波数ｆ_ｂに最も近いＡｖｅｒａｇｅＦ０の最も近い整数倍数である）。標準偏差ｋｇは、ガウス型篩の帯域幅を設定するために使用される。ｋ_Ｇ＝０．０２×Ｃ_Ｆ０を設定すると、調波数ｆ_ｂ／ｈで除算されたビン周波数がＡｖｅｒａｇｅＦ０から約１／−２．４％（または〜１／−０．４半音）離れている場合、Ｇを〜０．５（すなわち、半分の電力）に確定する。

式中、ｈは、次の方程式で与えられる平均Ｆ０に関して、ｆ_ｂのための調波数である。

低い候補Ｆ０に対して、ｋ_Ｇが高く設定されすぎた場合、高次の調波篩は、著しく重複し得る。また、雑音下の状況では、高次の幅広篩は大量の雑音電力を合計し得る。このため、前述の方程式では、ガウス型篩の標準偏差は、次の方程式で定義されるとおり（ここでは、制限帯域幅ＢＷ_Ｍａｘを６０Ｈｚに設定）、ｋ_Ｇがある最大値ｋ_ＧＭａｘ（ｈ）を超えないように制限された。

調波篩５９０の第２バンクによって通される電力５９１の量（以後、ステップ５８４で抽出された整合電力に取って代わる）は、次の方程式（ここでは、ＡＶＦ０_ｒ（Ｔ）は、ＡｖｅｒａｇｅＦ０の全整数倍あたりの１２半音に渡るガウス型篩の周波数範囲である）のとおり、ガウス型篩によって重み付きビン電力を合計することにより決定される。

静穏な状況では、整合電力は、完全に信号電力（Ｓｐ）から成るが、雑音下の状況では、整合電力は、信号電力および雑音電力（Ｎｐ）の一部の両方を含む。このため、整合電力から、篩内の雑音電力の推定値を減算することにより、信号電力のより良好な推定値を導出するために、任意の処理段階を採用し得る。入力信号が単音の複合調波信号および２ｋＨｚの周波数範囲に渡って均一に分布する雑音から成るという想定を根幹として、Ｆ０信号に対応する候補Ｆ０に対し、整合帯域幅内の雑音電力（Ｎｐ）が、全電力から整合電力を減算して、整合帯域幅の全帯域幅に対する比で積算したものに等しい、すなわち、Ｎｐ＝（Ｔｐ−Ｍｐ）×Ｋ_ＢＷ×Ｍ_ＢＷ／Ｔ_ＢＷ（ここで、全帯域幅Ｔ_ＢＷ−ＭａｘＦ−６０Ｈｚ、全電力５８５（Ｔｐ）は、全帯域幅５８３内のビン周波数を持つビン電力の合計から導出される）であり、整合帯域幅は、次の方程式（ここでは、各ガウス型篩のために−３ｄＢ（０．５）の電力帯域幅が想定される）のとおり、各ガウス型篩の帯域幅を合計することにより計算された。

次に、整合電力が信号電力および整合帯域幅内の雑音電力の両方を含む（すなわち、Ｍｐ＝Ｓｐ＋Ｎｐ）ことから考えると、信号電力（Ｓｐ）５９３は、ステップ５９２で、前述の方程式の移項により導出されて、次の方程式を提供する。

定数Ｋ_ＢＷは、通常、信号および雑音は、周波数範囲に渡って均一に分布していないという事実を補うために使用される。Ｋ_ＢＷを用いた実験で、０．５という値は、異なる信号、雑音の種類、およびＳＮＲに対する雑音電力推定値間に、良好な妥協を提供することが分かった。

処理の第４段階は、オクターブエラーを最小限にすることを含む。調波篩を基礎とした推定器に対して、Ｆ０の調波がＦ０の約数の偶数調波（すなわち、Ｆ０の下位オクターブ）に一致するために、オクターブエラーが生じる。このため、本実施では、信号Ｆ０に対応する候補Ｆ０および、その結果としてＦ０の下位オクターブ（下位オクターブエラー）が生じるＦ０エラーを導く全ての下位オクターブに対して、同等の信号電力（または、ステップ５９２が回避された場合は、同等の整合電力）が抽出される。この問題は、上位候補Ｆ０の信号電力（または整合電力）に対して少量の正の重み付けを適用することにより防ぐ。しかし、正の重み付けが多すぎると、Ｆ０の奇数調波のエネルギー量が偶数調波に比べて低い場合に、上位オクターブＦ０が推定されるエラーを引き起こし得る。このため、下位オクターブおよび上位オクターブの両方のタイプのエラーを最小限にするために、重み関数を注意深く選択する必要がある。さらに厄介なことには、重み関数の選択は、信号対雑音比によって決まる。雑音が混入するにつれ、下位候補Ｆ０は（より多くの調波篩を有するために）、上位候補Ｆ０よりも多くの雑音を合計し、従って、下位オクターブＦ０エラーを防ぐため、上位候補Ｆ０に対してより大きな正の重みが必要となる。

本実施では、正の重み付けが上位候補Ｆ０に適用される。重み関数は、各候補Ｆ０に対して合計される全調波篩の結合された帯域幅における差異を相殺する。それは、次の方程式で提供されるとおり、整合帯域幅Ｍ_ＢＷ（すなわち、合計された全調波篩の帯域幅）の電力Ｋ_Ｗ乗に反比例し、式中、定数Ｋ_Ｗは、正の重み付けの程度を調整するために使用される。

重み付き信号電力５９６は、ステップ５９５でＷＳｐ［Ｔ］＝Ｓｐ［Ｔ］×Ｗ［Ｔ］から抽出される（または、ステップ５９２が回避される場合、重み付き整合電力はＷＭｐ［Ｔ］＝Ｍｐ［Ｔ］×Ｗ［Ｔ］から抽出され得る）。音声信号の範囲および静穏な状況で提示されるＦ０を使用した実験を通して、Ｋ_Ｗ＝０．０２〜０．１に対して最良のＦ０推定確度が決定された。しかし、雑音が信号に追加された場合、低い候補Ｆ０によって合計される雑音電力の増加を相殺するため、Ｋ_Ｗ＝０．０２〜０．３４の上位値が必要とされた。高〜中程度のＳＮＲ（すなわち、約１〜６ｄＢを超える）に対して、「静穏な状況」処理パラメータが使用され（すなわち、Ｋ_Ｗ＝０．０８）、低いＳＮＲに対しては、「雑音下の状況」処理パラメータが使用される（すなわち、Ｋ_Ｗ＝０．３）。Ｋ_Ｗの適応調整のためのアルゴリズムも検査された。最大の重み付き電力に対する信号対全電力比ＳＴＲの推定値が、ステップ５９４で、ＳＴＲ＝Ｓ_Ｐ／Ｔ_Ｐ（またはその代わりにＳＴＲ＝Ｍ_Ｐ／Ｔ_Ｐ）を使用して計算される。ＳＴＲ値は、高いＳＮＲに対応する１．０から、０ｄＢ以下のＳＮＲに対応する０．５以下までに及ぶ。適応アルゴリズムは、次の方程式を使用して、１．０〜０．５５に及ぶＳＴＲ値に対し、０．０２〜０．３４の値の間で、Ｋ_Ｗを直線的に適応させた：Ｋ_Ｗ＝（０．０２．．．０．３４）×（ＳＴＲ−０．５５）／（１．０−０．５５）＋０．３。０．５５未満のＳＴＲ値に対し、Ｋ_Ｗは０．３４に制限された。

最大の重み付き信号電力５９８を持つ候補Ｆ０（または、最大の重み付き整合信号）は、ステップ５９７で決定され、その平均Ｆ０は、Ｆ０推定器の現在のフレームに対するＦ０推定値として使用される。

ステップ５９７では、オクターブエラーを削減するための任意の方法を採用することができ、この方法では、現在のＦ０推定値を以前のＦ０推定器フレーム５３からのものと比較し、その２つのＦ０周波数が整数比または整数に近い比によって関連している場合は、いくつかのヒステリシスを適用する（例えば、以前のＦ０推定値＝１１０Ｈｚ、および現在のＦ０推定値＝３２６Ｈｚで周波数が２．９６倍高い場合は、ヒステリシスを適用する）。これは、実際は、Ｆ０周波数よりはむしろ、Ｆ０テンプレート番号（Ｔ）を使用して実行され、１／−１テンプレートの許容範囲を認めることに注意する。１２、１９，２４、２８、および３０のテンプレート番号差（すなわち、それぞれ、×２、×３、×４、×５、および×６）に対して、整数の周波数比が存在する。テンプレートが調波的に関連し、現在の重み付き信号電力×ヒステリシス閾値が以前の重み付き信号電力を下回る場合は、以前のＦ０推定値が保持され（すなわち、それが現在のＦ０推定値を置き換える）、そこでは、ヒステリシス閾値が通常、「静穏な状況」では０．９８、または「雑音下の情報」では０．９である。

段階５では、雑音下の状況で、重み付き信号電力（または重み付き整合電力）内の擬似関数が推定エラーを取り込み、それ故、いくつかの連続したＦ０推定器フレームから最良のＦ０推定値を選択する最終処理段階（すなわち、不足分を補うプロセスと同様）が含まれる。ステップ５９９では、最大の重み付き信号電力（または重み付き整合電力）を持つ候補Ｆ０に対するパラメータがＦ０フレームバッファに入れられる。また、ステップ６００で、重み付き信号電力対全電力比６０１ＷＳＴＲ＝ＷＳ_Ｐ／Ｔ_Ｐ（またはその代わりにＷＳＴＲ＝ＷＭ_Ｐ／Ｔ_Ｐ）の推定値を提供するため、最大の重み付き信号電力（または重み付き整合電力）が、全電力５８５で正規化される。ステップ６０２で、最大のＷＳＴＲを持つＦ０フレームバッファ内のエントリが、連続したフレームに渡って最良のＦ０推定値を選択するために使用される。「静穏な状況」での最良のＦ０推定値を選択するための連続したフレーム数は４前後（これは〜２０ｍｓの時間範囲に及ぶ）であるが、「雑音下の状況」での最良の結果は、例えば、最大で１２フレーム（すなわち、６０ｍｓ）までの、多数のフレームを使用して取得されたことが分かった。最良のＦ０推定値を持つフレームが決定されると、その平均Ｆ０が、Ｆ０推定器によりＦ０Ｆｒｅｑ５０として出力される。標本単位（８０００／１１＝１４５５Ｈｚの標本化レートを使用）内のＦ０期間５１（Ｆ０Ｐｅｒｉｏｄ）およびその候補Ｆ０テンプレート番号Ｔ５２（Ｆ０ＴｅｍｐｌａｔｅＮｕｍ）も出力される。さらに、「重みのない」信号対全電力比Ｆ０ＳＮＳＲ＝Ｓ_Ｐ／Ｔ_Ｐ（または、その代わりにＦ０ＳＮＳＲ＝Ｍ_Ｐ／Ｔ_Ｐ）の推定値が、Ｆ０推定器５３によって出力される。この値は、本発明の後の段階で、Ｆ０推定強度の評価基準、または信号が（０〜２ｋＨｚの範囲で）調波である確率として使用される。最後に、最良のＦ０推定器フレームに対するＦＦＴビン電力５４（Ｆ０ＢｉｎＰｏｗｅｒ［ｂ］）および周波数５５（Ｆ０ＢｉｎＦｒｅｑ［ｂ］）の値が、周期確率推定器の段階で使用するために出力される。

図８〜図１１を参照すると、周期確率推定器（ＰＰＥ）６が詳細に示されている。ＰＰＥ６のコンポーネント６３は、入力信号３０が２以上の調波的に関連した正弦波成分（または部分）から成る、すなわち、それが（純音を除いて）「周期的」である確率を推定するために使用される。ＰＰＥは、Ｆ０推定器５から抽出されたＦ０ＳＮＳＲ値５３（すなわち、調波信号対全信号電力の比）から抽出された入力信号周期推定値６０（ＰｅｒＰｒｏｂ）を生成する。

図９を参照すると、Ｆ０ＳＮＳＲ値５３は、まず、圧縮制限関数６３０を用いて、信号を周期（調波）＝１．０または非周期＝０．０として分類するために適切な範囲に変換される。最大Ｆ０ＳＮＳＲ値は、入力が全て圧縮された複合調波信号の場合については１．０であり、入力がいかなる周期性も含まない場合については０．０に近くなる。非線形の圧縮制限関数６３０（以下の方程式内のシグモイド関数で記述されるとおり、式中、ａは変曲点であり、ｂはその関数の５％〜９５％幅を設定する）は、信号を「周期的」または「非周期的」として分類に適切な範囲にＦ０ＳＮＳＲ値を変換するために使用される。

「静穏な状況」に対して、シグモイド関数は、変曲点ａ＝０．６５および幅ｂ＝０．４を有する。「雑音下の状況」に対しては、その関数は、変曲点ａ＝０．５７５および幅ｂ＝０．３５を有する。変換されたＦ０ＳＮＳＲ値は、その後、出力周期確率値６０（ＰｅｒＰｒｏｂ）内のいかなる擬似変動も取り除くために、１次３０ＨｚＬＰＦを用いて、低域通過フィルターを通される。

周期確率推定器６は、任意の周波数チャネル内の信号が、推定されたＦ０周波数に関連する（すなわち、推定Ｆ０周波数の整数倍であるか、かつ／または推定Ｆ０周波数に等しいそのエンベロープ内に周期性を含む周波数成分、または部分を含む）確率を推定するためにも使用される。これは、２つの方法を用いて実行される。第１の方法６４は、低周波数チャネル（通常、０〜２ｋＨｚの範囲）に対して使用される。第２の方法６５は、高周波数チャネル（通常、２ｋＨｚを上回る）に対して使用される。

ＰＰＥ６の方法６４がこれを実現する方法を図１０に示す。Ｆ０推定器によって分析されるＦ０の範囲（通常０〜２ｋＨｚ）に含まれる周波数チャネルに対し、チャネル内の全信号電力で除算された推定Ｆ０に関連するＢＰＦチャネル内の信号電力の関数を用いて、チャネル信号が、推定Ｆ０の整数倍である正弦波成分または部分を含む確率が決定される。この比、すなわち、チャネル電力対全電力Ｆ０ＳＮＳＲ_ｃｈは、チャネルｎ＝１〜１１、通常はＮ_ｃｈ＝２０チャネルフィルターバンクに対して、次の方程式のように推定される。

各ＢＰＦチャネル内のＦ０信号電力および全電力は、現在のＦ０推定値に対応するＦ０推定器から取得されたビン電力（Ｆ０ＢｉｎＰｏｗｅｒ［ｂ］）および周波数（Ｆ０ＢｉｎＦｒｅｑ［ｂ］）から抽出される。示された周波数範囲Ｆ_ｃｈ（ＢＰＦの−６０ｄＢ電力帯域幅のように）に及ぶ各ＢＰＦチャネルに対して、そのチャネル内の信号電力は、まず、それらの周波数が推定Ｆ０の調波にどの程度厳密に整合しているかに従って、範囲Ｆ_ｃｈ内の全ビン電力に重みを付けることにより推定される。重み付け係数は、Ｆ０推定器の第３段階（ここで、Ｋ_Ｇ＝Ｆ０ＦｒｅｑおよびＢＷ_Ｍａｘ＝３０Ｈｚ）に関連して前述したガウス型関数から抽出される。この結果、全ての調波およびＦ０に対して、３０Ｈｚ幅のガウス型フィルターとなる。（低次調波用のガウス型フィルター幅を削減し、それによりチャネル周期（調波）確率の精度をより向上させるため、Ｋ_Ｇは、０．１×Ｆ０Ｆｒｅｑまで削減可能であることに留意されたい）。次に、重み付きビン電力は、ステップ６４１で、前述の方程式における分子のように、チャネル内のＦ０信号電力の推定値を提供するため、各ビン周波数に対するＢＰＦチャネルＰ_ｃｈ（ｆ）の電力レスポンスによってスケーリングされて合計される。

ＢＰＦチャネル内の全電力は、前述の方程式の分母に示されるように、各ビン周波数でのチャネルの電力レスポンスによってスケーリングされたビン電力の合計から抽出される。ステップ６４３では、チャネルＦ０ＳＮＳＲ_ｃｈが、０〜２ｋＨｚの信号電力対全電力比Ｆ０ＳＮＳＲ（これは、全体の信号が推定Ｆ０に調波的に関連する確率を反映する）によって正規化（すなわち、乗算）される。結果として得られる値は、チャネル信号が推定Ｆ０に関連する周波数成分を含み、Ｆ０ＳＮＳＲが高い場合の約１から、チャネル信号が推定Ｆ０に関連せず、Ｆ０ＳＮＳＲが低い場合の約０までの範囲に及ぶ。チャネル周期確率値は、その後、ステップ６４４で、次の方程式のようなシグモイド関数を用いて、スケーリングされたＦ０ＳＮＳＲ_ｃｈ値を変換することにより決定され、式中、ａ＝０．５が変曲点を設定し、ｂ＝０．５がシグモイド関数の−５％〜９．５％幅に設定する。この関数は、０．７５以上のスケーリングされたＦ０ＳＮＳＲ_ｃｈ値に対して、１に近いチャネル周期確率を返し、０．２５以下のスケーリングされたＦ０ＳＮＳＲ_ｃｈ値に対しては０を、０．７５と０．２５の間のスケーリングされたＦ０ＳＮＳＲ_ｃｈ値に対しては、１と０との間の値を返す。

チャネル信号レベルが低い場合、チャネル周期確率値を低減するために、従って、後にチャネル変調段階で適用されるＦ０変調の深さを低減するため、追加の調整が行われる。これは、低強度のチャネル信号によって生じた音量の減少を最小限にするために行われる。これを実現するため、チャネル周期確率は、低速変動チャネルエンベロープ信号ＣｈａｎＥｎｖが、チャネルの４０ｄＢ入力ダイナミックレンジの下位１６ｄＢ内にある場合、ステップ６４５で減衰される。減衰量は、最小チャネルレベルに関する１６ｄＢに等しいＣｈａｎＥｎｖに対する１．０から、最小チャネルレベルに等しいＣｈａｎＥｎｖに対する０．２５まで、直線的に減少する。最終段階４６４として、チャネル周期確率値は、擬似変動を平滑化するため、３０Ｈｚの１次ＬＰＦを用いてフィルタリングされる。

図１１を参照すると、Ｆ０推定器によって分析された周波数範囲（通常は＞２ｋＨｚ）を超える周波数チャネルに対して、ＰＰＥ６の方法６５で、チャネルエンベロープ信号の期間が、推定Ｆ０周波数の期間に等しい（または近い）かどうかを判断することにより、チャネル周期確率が推定される。これは、ステップ６５０で、フィルターバンク４から取得した広帯域幅チャネルエンベロープ信号４２（ＷｉｄｅｂａｎｄｗｉｄｔｈＣｈａｎＭａｇ）を高域通過フィルターで処理し、その履歴をバッファ６５１内に約２８ｍｓ（４０標本）の持続期間で保持することにより実現される。

各チャネルに対して、バッファ内容の最近の２０標本（〜１４ｍｓ）が、ステップ６５２で、ゼロの時間的推移、およびＦ０推定器５から取得した推定Ｆ０期間５１を用いて、自動的に相互に関連付けられる。期間／時間推移された自動相関値６５４のゼロ時間推移された自動相関値６５３に対する比が、ステップ６５５で、次の方程式を用いて決定され、通常、ｎ＝１２〜Ｎ_ｃｈに対し、式中、ＨＰＦは、高域通過フィルター関数、およびＡＣＦ（ｆ，ｌ）は、時間差（ｌａｇ）ｌに対するｆの自動相関関数である。

１．０に近い自動相関比に対して、高チャネル電力対全電力比が推定されるが、０．５以下の値に対しては、低チャネル電力対全電力比が推定される。ステップ６５６で、この結果が、Ｆ０ＳＮＳＲ値によって、正規化（すなわち、乗算）される。ステップ６５７では、結果は、ステップ６４４で前述した方程式のように、非線形圧縮制限（または、シグモイド）関数を用いて変換され、式中、シグモイド関数は、変曲点ａ＝０．３５、および幅ｂ＝０．５を持つ。ステップ６５８で、チャネル信号４１の低速変動エンベロープが低い（ステップ６４５で前述されている同一の手順のように）場合にチャネル周期確率値を低減するため、次にスケーリング関数が使用される。最後に、ステップ６５９で、各チャネル（通常、＞２ｋＨｚ）に対するチャネル周期確率６１（ＣｈＰｅｒＰｒｏｂ）を抽出するため、１次３０ＨｚＬＰＦを用いて、チャネル周期確率値が低域通過フィルター処理される。

図２に示すように、ＰＰＥ６は、Ｆ０変調を各周波数チャネル４１の低速変動エンベロープ信号（ＣｈａｎＥｎｖ）に適用し、これらの信号を非変調チャネルエンベロープ信号と結合または混合するために使用されるチャネル変調器７に対して、周期確率６０（ＰｅｒＰｒｏｂ）およびチャネル周期確率６１（ＣｈＰｅｒＰｒｏｂ）を提供する。

図１２を参照すると、変更されたチャネルエンベロープ信号７０（ＭｏｄｉｆｉｅｄＣｈａｎＭａｇ）を提供するため、各チャネルの低速変動エンベロープ信号（ＣｈａｎＥｎｖ）４が、推定Ｆ０周波数５０に等しい周波数の変調関数７７（Ｍ）によって変調され、その後、チャネルエンベロープ信号４０（ＣｈａｎＭａｇ）と混合される。これら２つの信号に対する混合比は、各チャネル周期確率６１（ＣｈＰｅｒＰｒｏｂ）から抽出されるが、ここで、高確率は、Ｆ０の変調対非変調信号の比に混合され、低確率は、これらの信号の低い比に混合される。一般に、高いチャネル周期確率６１を持つチャネルは、１．０に近い変調対非変調の混合比を受信するであろう。一方、低いチャネル周期確率を持つチャネルは、０に近い変調対非変調の混合比を受信するであろう。これは、チャネル周期確率６１（ＣｈＰｅｒＰｒｏｂ）で乗算された低速変動エンベロープ信号４（ＣｈａｎＥｎｖ）を変調するためにＦ０変調関数Ｍが使用されるステップで実現される。その際、各周波数チャネルで変調された低速変動エンベロープ信号が、チャネル周期確率によってスケーリングされる。変調されていないチャネルエンベロープ信号４０（ＣｈａｎＥｎｖ）は、ＮｏｎＰｅｒＧａｉｎ７５で乗算されたチャネル非周期確率（すなわち、１−ＣｈＰｅｒＰｒｏｂ）によってスケーリングされて、次の方程式のように、Ｆ０変調チャネル信号と混合される。

（チャネルｎ＝１〜Ｎ_ｃｈとする）

変更されたチャネルエンベロープ信号７９（ＭｏｄｉｆｉｅｄＣｈａｎＭａｇ）はその後、最大値選択段階に渡されて、処理が継続する。

さらに、各周波数チャネルに対して、変調低速変動エンベロープ信号が、１−チャネル周期確率６１で乗算された復元利得７６（ＲｅｓｔｏｒｅＧａｉｎ）によってスケーリングされた各周波数チャネル４０（ＣｈａｎＭａｇ）と混合される。結果は、次の方程式のように、復元チャネルエンベロープ信号７１（ＲｅｓｔｏｒｅＣｈａｎＭａｇ）として出力される。

（チャネルｎ＝１〜Ｎ_ｃｈとする）

非周期利得７５（ＮｏｎＰｅｒＧａｉｎ）および復元利得７６（ＲｅｓｔｏｒｅＧａｉｎ）の値は、変更および復元チャネルエンベロープ信号内において、特に、低チャネル周期確率を有するチャネルに対して、非周期成分のレベルを制御するために使用される。これらの値は、ステップ７３で、入力信号周期確率６０（ＰｅｒＰｒｏｂ）を用いて決定される。通常、ＲｅｓｔｏｒｅＧａｉｎ＝０．８（すなわち、−２ｄＢ）である。「静穏な状況」に対して、ＮｏｎＰｅｒＧａｉｎ＝ＰｅｒＰｒｏｂ×０．５＋（１−ＰｅｒＰｒｏｂ）×ＲｅｓｔｏｒｅＧａｉｎであり、一方、「雑音下の状況」に対しては、ＮｏｎＰｅｒＧａｉｎ＝ＰｅｒＰｒｏｂ×０．１＋（１−ＰｅｒＰｒｏｂ）×ＲｅｓｔｏｒｅＧａｉｎである。これらの値は、０．０〜０．１の間で変動し、従って、特に、入力信号周期確率値（ＰｅｒＰｒｏｂ）が高い（すなわち、周期的な）場合、変更および復元チャネルエンベロープ信号における非周期成分を実際に減衰させる。

ステップ７４で決定されたＦ０変調関数７７（Ｍ）は、符号化された刺激エンベロープが非変調、Ｆ０率、パルス列の刺激エンベロープに近づくように、低デューティサイクルを使用する。この関数は、電気パルス列によって引き起こされた音のピッチが、変調期間よりもむしろパルス間の最長１次間隔の関数によって管理されるために、選択された。変調関数は、瞬時のアタックタイムおよび指数関数的減衰を持つ狭パルスから成り、１２８標本から成る単一サイクル（期間）として保存される。変調関数の深さおよびその指数関数的減衰率を調整するための制御が提供される。デフォルト設定で、変調の深さＭＤ（臨床の現在のユニットではピーク／トラフの刺激レベルとして定義される）は、０．５の対象者の電気ＤＲに調整されるが、それは、各チャネルで４０ｄＢＤＲと仮定すると、２０ｄＢの音響等価の深さに変換する。また、指数関数的減衰関数は、変調期間の第１四半期内でそのピーク値の１０％まで下がる。変調関数は、Ｆ０間隔×１２８標本をシステムの刺激率（１４５５Ｈｚ）で除算した値で標本化される。しかし、刺激率は、Ｆ０の非整数倍であり得るため、標本化出力に振幅の唸りが生じ得る。これを回避するため、各Ｆ０サイクルの初めで、サイクルの第１標本が変調関数の第１標本（すなわち、ピークのパルスレベル）に必ず一致するように、変調関数の標本化が再設定される。各Ｆ０サイクルの開始は、所望のＦ０変調フェーズの正確な進行中の記録を保持することにより決定される。

再度図２を参照すると、チャネル変調器で生成された変更チャネルエンベロープ信号７０（ＭｏｄｉｆｉｅｄＣｈａｎＭａｇ）および復元チャネルエンベロープ信号７１（ＲｅｓｔｏｒｅＣｈａｎＭａｇ）は、最大値セレクター８に送信される。最大値セレクター８は、特に雑音下の状況で、本発明と通常のＣＩシステムとの間での刺激用に選択されたチャネルにおける相違が最小限になるよう、Ｆ０の調波を含むチャネルの選択を改善するために、任意の処理を組み込む。最大値（すなわち、最大のスペクトル振幅を持つチャネル）は、前述のとおり、低速変動チャネルエンベロープ信号４１（ＣｈａｎＥｎｖ）の変調から抽出された変更チャネル振幅値７０（ＭｏｄｉｆｉｅｄＣｈａｎＭａｇ）から選択される。これは、従来型ＣＩシステムと対照をなし、ここでは、最大値が、低速変動チャネルエンベロープ信号より大きな時間的変動（すなわち、上位のエンベロープ周波数）を持つチャネルエンベロープ信号４０（ＣｈａｎＭａｇ）から直接選択される。本発明の最大値セレクター８によって処理される低速変動エンベロープ信号において時間的変動が低いことは、スペクトル振幅における変動がそのうち少なくなり、それ故、最大値として選択されたチャネルにおける変動がより低い結果となり得ることを意味する。これを補うため、本発明では、最大値の選択が、選択された最大値のスペクトル範囲を拡大し、それにより、選択された最大チャネルにより大きな拡散をもたらすため、フレーム全体で一部多重化される任意の方式を組み込む。

さらに、最大値セレクター８は、「非周期」のチャネル信号が減衰される（例えば、ＮｏｎＰｅｒＧａｉｎパラメータを用いて）変更チャネル振幅値７０（ＭｏｄｉｆｉｅｄＣｈａｎＭａｇ）から選択するため、減衰された非周期チャネル信号の振幅が、復元チャネル振幅値７１（ＲｅｓｔｏｒｅＣｈａｎＭａｇ）を用いた最大値選択処理の後に復元され得るように、処理が提供される。

図１３を参照すると、最大値セレクター８は、最大値選択（すなわち、任意の１タイムフレーム内で最大のエンベロープ値を有する周波数チャネルの選択）の３つの段階を組み込む。ステップ８２に示す第１段階は、通常、現行のＣＩシステムで行われるのと同様の方法で、変更チャネルエンベロープ信号７０（ＭｏｄｉｆｉｅｄＣｈａｎＭａｇ）から最大値を選択する。しかし、ＮｕｍＭａｘｉｍａ（１４５５Ｈｚのレートに対して、通常１０）個までの最大値を選択するよりむしろ、最大値の選択をフレーム全体で多重化し、それによって、選択された最大値のスペクトル範囲を拡大し得るように、選択された最大値の数がＮｕｍＭＵＸＭａｘｉｍａ（通常は２）によって減らされる。例えば、ＮｕｍＭａｘｉｍａ＝１０およびＮｕｍＭＵＸＭａｘｉｍａ＝２の場合、第１段階で８個までの最大値が選択されて、第２段階でもう２つの最大値が選択できるようにしておく。

ステップ８３に示す第２段階では、任意の１段階で、偶数または奇数の周波数チャネルのいずれか一方からだけＮｕｍＭＵＸＭａｘｉｍａが選択される。偶数または奇数のチャネル番号からの選択は、フレーム間で交互に行われる。このプロセスは、ＮｕｍＭＵＸＭａｘｉｍａにより２つの連続したフレームに渡って最大値として選択され得るチャネルの範囲を拡大する（例えば、１０から１２へ）。

ステップ８４に示す第３および最終段階では、ＮｕｍＭａｘｉｍａ個より少ない最大値が実際に選択されている場合（多数のチャネルエンベロープ信号が、刺激の閾値より低い場合は、通常、最大値としての選択から除外されるために、これが生じることに留意されたい）、残りの最大値は、復元チャネルエンベロープ信号７１（ＲｅｓｔｏｒｅＣｈａｎＭａｇ）から選択される。

最後に、ステップ８６で、電極８１（ＳｔｉｍｕｌｕｓＣｈ）の次の刺激用にチャネル番号を定義するために、選択された最大値チャネル番号が使用される。刺激強度８０（ＳｔｉｍｕｌｕｓＭａｇ）は、選択されたチャネル振幅値８５、または選択された各最大チャネルに対応する復元チャネルエンベロープ信号７１（ＲｅｓｔｏｒｅＣｈａｎＭａｇ）のいずれかから、任意で抽出される。復元チャネルエンベロープ信号から刺激強度を抽出すると、低周期確率を持つチャネル信号内の非周期成分の振幅が、それらが最大値として選択された後、それらの通常のレベル（または、一般には、ＲｅｓｔｏｒｅＧａｉｎ＝０．８に対して、−２ｄＢのそれらのレベル）に復元できるようになる。最大値を選択する前に（すなわち、ステップ７８で）それらを減衰する目的は、それらが、周期成分を含むチャネルに優先して最大値として選択される確率を減らすことである。

再度、図２を参照すると、マッピングエンコーダ９は、選択された各刺激チャネル８１（ＳｔｉｍｕｌｕｓＣｈ）に対する音刺激レベル８０（ＳｔｉｍｕｌｕｓＭａｇ）を受信し、この情報を、それぞれ個々のＣＩレシピエントの電気的閾値に基づき、選択された各電極に対する電流レベル値、および従来の方法に従った快適なレベルの刺激に変換する。刺激データはその後、無線周波数（ＲＦ）パケットに符号化され、ＲＦ送信機１０によって、符号化された刺激データストリームに基づいて蝸牛電極を作動させる（刺激する）埋め込み型蝸牛刺激装置１１に送信される。

本発明のシステムは、人工内耳システムでの声のピッチおよび／または音程情報を効率的な方法で符号化し、競合する雑音および／または干渉信号の影響に対して強固な、完全なシステムの提供に向けたものであることを理解されるであろう。これは、複合調波入力信号、非調波入力信号、ならびに非調波および調波信号の両方の様々な組み合わせと、多岐に渡る様々な聴取状況に、様々なプロセスを適用することにより実現される。

その際、本発明のシステムは、各周波数チャネル内で電気刺激信号の低周波数（または低速変動）を、入力音内に存在する最も優勢な基本周波数（Ｆ０）に等しい周波数の周期関数によって変調することにより、複合調波入力信号（すなわち、基本周波数の２つ以上の調波（または部分）を含む信号で、例えば、会話の有声母音や調性楽器で演奏された楽音）を含む状況に応じる。

本発明のシステムは、非調波入力信号（例えば、会話の無声子音や打楽器で演奏された音）を含む状況に対しては、かかる状況を識別し、従来型のＣＩ音声処理方式と一致する方法で（すなわち、各周波数チャネル内の非変調エンベロープ信号から）、各チャネル内の電気刺激信号を抽出することによって応じる。

本発明のシステムは、現実世界の数多くの聴取状況に対して、すなわち、入力音が、周波数スペクトルに渡って分布する調波と非調波信号の時間的に変化する組み合わせを含む場合に、それらの要求を満足するのに特に優れている。本発明でかかる状況が検出されると、システムは動的に、チャネル信号が入力音内で最も優勢なＦ０に関連する（すなわち、Ｆ０の整数倍に等しい周波数成分を含む）度合いに基づき、各周波数チャネル内のＦ０変調信号と非変調信号を一緒に結合（混合）する。調波（または周期）確率は、各チャネル信号生成のためのＦ０変調対非変調利得の比を制御するために使用される各周波数チャネルに対して、決定される。

図１４ａおよび図１４ｂを参照すると、エレクトロドグラム（ｅｌｅｃｔｒｏｄｏｇｒａｍ）として知られる電気刺激の出力パターンが、本発明の機能性を実証するために提供されており、これは、音響信号のエレクトロドグラムと同様であるが、時間の関数として各電極（チャネル）に対し、刺激強度を（ログ電流レベルとして）プロットする。

図１４ａは、ＡｄｖａｎｃｅｄＣｏｍｂｉｎａｔｉｏｎＥｎｃｏｄｅｒ（ＡＣＥ）法として知られている、現行のＣＩ音声処理方式のエレクトロドグラムを示し、他方、図１４ｂは、本発明の音声処理方式のエレクトロドグラムを示す。これらのエレクトロドグラムの記録において、各方式によって処理された発話トークンは、約１１８ＨｚのＦ０周波数を有する男性話者によって話された単語「ｃｈｏｉｃｅ」である。

Ｂとして識別され、複合調波入力信号を表す有声母音に対して、図１４ｂの刺激エンベロープは、その話者のＦ０に等しい周波数の周期関数によって変調されていることが理解されるであろう。そのため、図１４ａの刺激エンベロープとはかなり異なり、そこでは、変調が全く、またはほとんど生じていない。

これは、ＡおよびＣとして識別され、非調和入力信号を表す無声子音と対照をなし、それにより、図１４ａおよび図１４ｂの刺激信号は、実質的に同一である。

本発明のプロセスおよびシステムは、現実の状況、すなわち、調和および非調和成分の両方を同時に含み得る状況で、音声をより効率的に処理できることが理解されるであろう。有声母音や、調性楽器で演奏された楽音の場合のように、Ｆ０の調波を２つ以上含む信号などの純粋な複合調波信号などの調和音声信号に対して、各チャネル内の低速変動エンベロープの刺激信号は、Ｆ０に等しい周波数の周期関数によって変動される。無声子音または打楽器の音などの非調波信号に対して、各チャネル内の電気刺激信号は、従来型の方法を用いて基本的に抽出され、それ故、狭帯域／雑音エンベロープ信号から成る。このため、音声信号の調波および非調波成分の両方を含む聴取環境では、各チャネル信号に対して、Ｆ０変調および非変調エンベロープ信号の混合物が符号化される。これらの信号の混合比は、チャネル信号が音声内の最も優勢なＦ０に関連する度合いによって決定され、それによって、強固な関係はＦ０変調対非変調信号の高い混合比となり、そして、弱い関係は低い比となる。

従って、本発明の音声処理システムが、競合する雑音および／または干渉信号の影響に効率的な方法で対処しながら、システムのユーザーに対して改善された声のピッチおよび音程の知覚を提供するために、毎日の状況で遭遇する様々な聴取状況を考慮に入れて、音声信号を検出して処理できることを理解されるであろう。

本明細書および請求項の範囲を通して、「ｃｏｍｐｒｉｓｅ（含む、備える）」という単語およびその派生語は、明示的に逆の定めをしたか、または文脈上他の意味に解すべき場合を除き、排他的な意味よりもむしろ包含的な意味を有することを意図する。すなわち、「ｃｏｍｐｒｉｓｅ（含む、備える）」という単語およびその派生語は、明示的に逆の定めをしたか、または文脈上他の意味に解すべき場合を除き、それが直接参照する列挙した要素、ステップ、または機能だけでなく、具体的に列挙されていない他の要素、ステップまたは機能も含むことを示すことになる。

当業者は、本発明の精神および範囲から逸脱することなく、本明細書で説明されている発明の方法に対して、多数の修正および変形を行い得ることを理解されるであろう。

Claims

聴覚人工器官で使用するために音声信号を処理するための方法であって、
前記音声信号を電気信号に変換するステップと、
前記音声信号を複数の周波数チャネルに加工し、各周波数チャネル信号が、少なくとも１組のチャネル出力を定義するための振幅エンベロープ信号を有するステップと、
前記電気信号の基本周波数に関連する情報を取得するステップと、
前記電気信号の前記基本周波数の整数倍に対応する調波特質に関連する情報を取得し、前記チャネル出力が周期性を有する確率を表すチャネル周期確率を前記調波特質に関連する情報に基づいて周波数チャネル毎に推定するステップであって、前記チャネル周期確率は、前記チャネル出力が前記基本周波数と関連する度合いによって決定される、ステップと、
少なくとも１組の変更チャネル出力を生成するために、前記基本周波数および前記電気信号の前記調波特質に関連する前記情報に従い、前記基本周波数に依存した周期関数によって少なくとも１組のチャネル出力の低周波エンベロープ信号を適応的に変調するステップと、
前記チャネル周期確率に応じた混合比率に従って、前記変調されたチャネル出力の低周波エンベロープ信号と前記振幅エンベロープ信号とを周波数チャネル毎に混合するステップと、
前記聴覚人工器官の対応する電極による電気刺激用に、少なくとも１つまたは複数のチャネルを定義するため、前記少なくとも１組の変更チャネル出力から１つまたは複数のチャネルを選択するステップと
を含む方法。
前記音声信号を電気信号に変換する前記ステップが、前記音声信号を検出して電気信号に変換するマイクロホンの使用を含む、請求項１に記載の方法。
前記音声信号を電気信号に変換する前記ステップが、前記電気信号に前記変換された前記音声信号を標本化した標本化信号を生成する動作を含み、その際、前記電気信号は、アナログデジタル変換器に通すことにより、前記電気信号が増幅されて標本化される、請求項２に記載の方法。
前記電気信号を複数の周波数チャネル信号に加工する前記ステップが、前記電気信号を帯域通過フィルターの第１バンクに通すことを含む、請求項１に記載の方法。
１組の対応する各チャネルエンベロープ信号を１組の第１チャネル出力として生成するために、各チャネル信号がさらにエンベロープ検出器を通される、請求項４に記載の方法。
低速チャネルエンベロープ信号を１組の第２チャネル出力として抽出するために、前記１組の第１チャネル出力の各チャネルエンベロープ信号が、チャネルエンベロープトラッカーによって時間内で平滑化される、請求項５に記載の方法。
前記電気信号を複数の周波数チャネル信号に加工する前記ステップが、前記電気信号を帯域通過フィルターの第２バンクに通すことを含む、請求項４乃至請求項６の中のいずれか一項に記載された方法。
複数の広帯域幅チャネル信号を生成するために、前記電気信号に関連して決定された最大基本周波数の少なくとも２つの基本周波数調波を通すように、帯域通過フィルターの前記第２バンクが、実質的に帯域通過フィルターの前記第１バンクと同一の中心周波数を有する、請求項７に記載の方法。
結果として得られる複数の広帯域幅チャネルエンベロープ信号を１組の第３チャネル出力として抽出するために、前記広帯域幅チャネル信号の各々が、エンベロープ検出器に通される、請求項８に記載の方法。
前記電気信号の前記基本周波数に関連する情報を取得する前記ステップが、前記電気信号を基本周波数推定器に通すことを含む、請求項９に記載された方法。
前記基本周波数推定器が、約２ｋＨｚの周波数までの前記電気信号に存在する任意の正弦波周波数成分の前記周波数および電力の推定値を提供するために、前記電気信号を処理する位相ボコーダＦＦＴフィルターバンクである、請求項１０に記載の方法。
前記基本周波数推定器が、約２ｋＨｚの周波数までの電気信号内で検出される最も優勢な調波信号の前記基本周波数を決定し、かつ前記最も優勢な調波信号の前記基本周波数の推定値を表す信号を生成する、請求項１１に記載の方法。
前記基本周波数推定器が、約２ｋＨｚの周波数までの電気信号内に存在する、前記最も優勢な調波信号の前記基本周波数に関連する前記電力の、全信号電力に対する比を表す信号をさらに生成する、請求項１２に記載の方法。
前記電気信号の前記調波特質に関連する情報を取得する前記ステップが、前記電気信号内に存在する、前記最も優勢な調波信号の前記基本周波数に関連する前記電力の、前記全信号電力に対する比を表す前記信号を、少なくとも周期確率推定器に渡すことを含む、請求項１３に記載された方法。
前記周期確率推定器が、前記電気信号内に存在する、前記最も優勢な調波信号の前記基本周波数に関連する前記電力の、前記全信号電力に対する比を表す前記信号を、圧縮制限および平滑化することにより、入力信号の周期確率値を抽出する、請求項１４に記載の方法。
前記電気信号の前記調波特質に関連する情報を取得する前記ステップが、前記電気信号内に存在する、任意の正弦波周波数成分の前記周波数および電力を表す前記信号、および前記１組の第３チャネル出力を、前記周期確率推定器に渡すことをさらに含む、請求項１５に記載された方法。
前記周期確率推定器が、任意の周波数チャネル内の前記信号が前記電気信号の推定された前記最も優勢な調波信号の前記基本周波数に関連する前記確率を推定して、前記基本周波数推定器から決定された前記電気信号内に存在する任意の正弦波周波数成分の前記周波数および電力、ならびに前記帯域通過フィルターの前記第２バンクによって決定された前記１組の第３チャネル出力を用いて、各チャネルに対してチャネル周期確率信号を生成する、請求項１６に記載の方法。
少なくとも１組の変更チャネル出力を生成するように、前記基本周波数および前記電気信号の前記調波特質に関連する前記情報に従って、少なくとも１組のチャネル出力を変調する前記ステップが、チャネル変調器によって実行される、請求項１７に記載された方法。
前記チャネル変調器が、前記１組の第２チャネル出力を受信して、前記基本周波数推定器によって提供されるとおり、前記電気信号の推定された前記最も優勢な調波信号の前記基本周波数と実質的に等しい周期変調関数によって、前記１組の第２チャネル出力を変調する、請求項１８に記載の方法。
第２チャネル出力のスケーリングおよび変調された組を生成するため、各チャネルに対して、第２チャネル出力の前記変調された組が、前記周期確率推定器によって決定された前記チャネル周期確率信号によってスケーリングされる、請求項１９に記載の方法。
第１チャネル出力のスケーリングされた組を生成するため、前記チャネル変調器が、前記１組の第１チャネル出力をさらに受信して、１−各チャネルに対して決定された前記チャネル周期確率信号によって、各第１チャネル出力をスケーリングする、請求項２０に記載の方法。
第１チャネル出力のスケーリングおよび減衰された組を生成するために、第１チャネル出力の前記スケーリングされた組が、特に前記入力信号の周期確率値が、前記入力信号が周期的であることを示している場合、さらに、前記チャネル変調器によって減衰される、請求項２１に記載の方法。
各チャネルに対して、第４チャネル出力の変更された組を生成するために、第２チャネル出力の前記スケーリングおよび変調された組が、第１チャネル出力の前記スケーリングおよび減衰された組と混合される、請求項２０乃至請求項２２の中のいずれか一項に記載された方法。
１組の復元チャネルエンベロープ信号を生成するために、第２チャネル出力の前記スケーリングおよび変調された組が、第１チャネル出力の前記スケーリングされた組と混合される、請求項２０または請求項２１に記載された方法。
チャネル出力の前記少なくとも１つの変更された組から１つまたは複数のチャネルを選択する前記ステップが、最大スペクトル振幅を有する第４チャネル出力の前記変更された組からチャネルを選択することを含む、請求項１乃至請求項２４の中のいずれか一項に記載された方法。
選択されたチャネルの数を増加させるために、前記最大スペクトル振幅を有する前記チャネルの前記選択が、全フレームに渡って、少なくとも一部が多重化される、請求項２５に記載の方法。
前記最大スペクトル振幅を有する選択されたチャネルの前記振幅が、前記１組の復元チャネルエンベロープ信号の前記振幅から復元される、請求項２６に記載の方法。
聴覚人工器官で使用するために音声信号を処理する方法であって、
前記音声信号を電気信号に変換するステップと、
前記電気信号を複数の周波数チャネル信号に加工するステップであって、各周波数チャネル信号が、少なくとも１組のチャネル出力を定義するための振幅エンベロープを有する、ステップと、
前記電気信号が、調波および／または非調波信号を含むかどうかを判断するステップと、
調波信号を含む前記電気信号の部分に対して、１つまたは複数の変調チャネルエンベロープ信号を生成するために、前記調波信号の基本周波数に等しい周波数の周期関数により、前記チャネル出力の低速変動エンベロープを、前記調波信号の前記基本周波数に従って適応的に変調するステップと、
非調波信号を含む前記電気信号の部分に対して、１つまたは複数の非変調チャネルエンベロープ信号を生成するステップと、
各チャネルに対して、各チャネルに対する混合チャネル刺激信号を生成するための所定の混合比に従い、前記変調チャネルエンベロープ信号と、前記非変調チャネルエンベロープ信号を混合するステップであって、前記混合比は、各チャネル出力が周期性を有する確率を表し、前記チャネル出力が前記基本周波数と関連する度合いに応じて周波数チャネル毎に決定される、ステップと、
前記混合チャネル刺激信号に従って、電気刺激に対して少なくとも１つまたは複数のチャネルを定義するため１つまたは複数のチャネルを選択して、前記聴覚人工器官の対応する電極に刺激を適用するステップと、
を含む方法。
前記所定の混合比が、前記周波数チャネル信号が前記電気信号内の最も優勢な調波信号の前記基本周波数に関連する度合いから抽出される、請求項２８に記載の方法。
前記周波数チャネル信号と前記電気信号内の前記最も優勢な調波信号の前記基本周波数との間に弱い関連がある場合は、低い混合比である、請求項２９に記載の方法。
聴覚人工器官で使用するために音声信号を処理するためのシステムであって、
音声信号を電気信号に変換する変換器と、
前記音声信号を複数の周波数チャネルに加工し、各周波数チャネル信号が、少なくとも１組のチャネル出力を定義するための振幅エンベロープ信号を有する第１処理装置と、
前記電気信号の基本周波数に関連する情報を取得するための第２処理装置と、
前記電気信号の前記基本周波数の整数倍に対応する調波特質に関連する情報を取得し、前記チャネル出力が周期性を有する確率を表すチャネル周期確率を前記調波特質に関連する情報に基づいて周波数チャネル毎に推定するための第３処理装置であって、前記チャネル周期確率は、前記チャネル出力が前記基本周波数と関連する度合いによって決定される、第３処理装置と、
チャネル出力の少なくとも１つの変更された組を生成するために、前記電気信号の前記基本周波数および前記調波特質に関連する前記情報に従い、前記基本周波数に依存した周期関数によって前記第１処理装置から受信した少なくとも１組のチャネル出力の低周波エンベロープ信号を適応的に変調するための変調器と、
前記チャネル周期確率に応じた混合比率に従って、前記変調されたチャネル出力の低周波エンベロープ信号と前記振幅エンベロープ信号とを周波数チャネル毎に混合する手段と、
電気刺激用に少なくとも１つまたは複数のチャネルを前記電気刺激の振幅と共に定義するため、チャネル出力の前記少なくとも１つの変更された組から１つまたは複数のチャネルを選択し、それに従って刺激信号を生成するためのセレクターと、
前記聴覚人工器官による利用のために、前記刺激信号を送信するための送信機と、
を備えるシステム。
前記変換器が、前記音声信号を検出して電気信号に変換するように構成されたマイクロホンを含む、請求項３１に記載のシステム。
前記変換器が、前記電気信号を増幅するための増幅器および、標本化信号を生成するためのアナログデジタル変換器をさらに含む、請求項３２に記載のシステム。
前記第１処理装置が、前記電気信号を複数の周波数チャネル信号に加工するための、帯域通過フィルターの第１バンクを含む、請求項３１に記載のシステム。
前記第１処理装置がさらにエンベロープ検出器を含んで、１組の対応する各チャネルエンベロープ信号を１組の第１チャネル出力として生成するために、各チャネル信号がさらに前記エンベロープ検出器を通される、請求項３４に記載のシステム。
前記第１処理装置が、低速チャネルエンベロープ信号を１組の第２チャネル出力として抽出するために、前記１組の第１チャネル出力の各チャネルエンベロープ信号を受信するチャネルエンベロープトラッカーをさらに含む、請求項３５に記載のシステム。
前記第１処理装置が、帯域通過フィルターの第２バンクをさらに含む、請求項３４乃至請求項３６の中のいずれか一項に記載されたシステム。
帯域通過フィルターの前記第２バンクが、帯域通過フィルターの前記第１バンクと実質的に同一の中心周波数を有し、複数の広帯域幅チャネル信号を生成するために、前記電気信号に関連して決定された最大基本周波数の少なくとも２つの基本周波数調波が通るように十分に広い、請求項３７に記載のシステム。
前記広帯域幅チャネル信号の各々が、結果として得られる複数の広帯域幅チャネルエンベロープ信号を１組の第３チャネル出力として抽出するために、エンベロープ検出器に通される、請求項３８に記載のシステム。
前記第２処理装置が、基本周波数推定器を含む、請求項３９に記載のシステム。
前記基本周波数推定器が、約２ｋＨｚの周波数までの前記電気信号に存在する任意の正弦波周波数成分の前記周波数および電力の推定値を提供するために、前記電気信号を処理する位相ボコーダＦＦＴフィルターバンクである、請求項４０に記載のシステム。
前記基本周波数推定器が、約２ｋＨｚの周波数までの電気信号内で検出される最も優勢な調波信号の前記基本周波数を決定し、かつ前記最も優勢な調波信号の前記基本周波数の前記推定値を表す信号を生成する、請求項４１に記載のシステム。
前記基本周波数推定器が、約２ｋＨｚの周波数までの電気信号内に存在する、前記最も優勢な調波信号の前記基本周波数に関連する前記電力の、全信号電力に対する比を表す信号をさらに生成する、請求項４２に記載のシステム。
前記第３処理装置が、前記最も優勢な調波信号の前記基本周波数に関連する前記電力の、前記電気信号内に存在する前記全信号電力に対する比を表す前記信号を少なくとも受信する、周期確率推定器を含む、請求項４３に記載されたシステム。
前記周期確率推定器が、前記電気信号内に存在する、前記最も優勢な調波信号の前記基本周波数に関連する前記電力の、前記全信号電力に対する前記比を表す前記信号を、圧縮制限および平滑化することにより、入力信号の周期確率値を抽出する、請求項４４に記載のシステム。
前記電気信号内に存在する、任意の正弦波周波数成分の前記周波数および電力を表す信号、および前記１組の第３チャネル出力が、前記周期確率推定器によって受信される、請求項４５に記載のシステム。
前記周期確率推定器がさらに、任意の周波数チャネル内の前記信号が前記電気信号の推定された前記最も優勢な調波信号の前記基本周波数に関連する前記確率を推定して、前記基本周波数推定器から決定された前記電気信号内に存在する任意の正弦波周波数成分の前記周波数および電力、ならびに前記帯域通過フィルターの前記第２バンクによって決定された前記１組の第３チャネル出力を用いて、各チャネルに対してチャネル周期確率信号を生成する、請求項４５に記載のシステム。
前記変調器が、前記１組の第２チャネル出力を受信して、前記基本周波数推定器によって提供されるとおり、前記電気信号の推定された前記最も優勢な調波信号の前記基本周波数と実質的に等しい周期変調関数により、前記１組の第２チャネル出力を変調するチャネル変調器である、請求項４７に記載されたシステム。
第２チャネル出力の前記変調された組が、第２チャネル出力のスケーリングおよび変調された組を生成するため、各チャネルに対して、前記周期確率推定器によって決定された前記チャネル周期確率信号によってスケーリングされる、請求項４８に記載のシステム。
前記チャネル変調器が、第１チャネル出力のスケーリングされた組を生成するため、前記１組の第１チャネル出力をさらに受信して、１−各チャネルに対して決定された前記チャネル周期確率信号によって、各第１チャネル出力をスケーリングする、請求項４９に記載のシステム。
第１チャネル出力の前記スケーリングされた組が、第１チャネル出力のスケーリングおよび減衰された組を生成するために、特に前記入力信号の周期確率値が、前記入力信号が周期的であることを示している場合、前記チャネル変調器によってさらに減衰される、請求項５０に記載のシステム。
第２チャネル出力の前記スケーリングおよび変調された組が、各チャネルに対して、第４チャネル出力の変更された組を生成するために、第１チャネル出力の前記スケーリングおよび減衰された組と混合される、請求項４９乃至請求項５１の中のいずれか一項に記載されたシステム。
第２チャネル出力の前記スケーリングおよび変調された組が、１組の復元チャネルエンベロープ信号を生成するために、第１チャネル出力の前記スケーリングされた組と混合される、請求項４９または５０に記載のシステム。
前記セレクターが、最大スペクトル振幅を有する前記出力に基づき、チャネル出力の前記少なくとも１つの変更された組から１つまたは複数のチャネルを選択する、最大値セレクターである、請求項３１乃至請求項５３の中のいずれか一項に記載されたシステム。
前記最大値セレクターが、選択されたチャネルの数を増加させるために、前記最大スペクトル振幅を有する前記チャネルの前記選択が、フレーム間に渡って少なくとも一部が多重化される、マルチプレクサをさらに含む、請求項５４に記載のシステム。
前記送信機が、埋め込み型刺激装置への伝達のために、前記刺激信号を符号化する符号器を含む、請求項３１乃至請求項５５の中のいずれか一項に記載されたシステム。
前記送信機が、前記符号化刺激信号をＲＦ信号の形式で送信するように構成されるＲＦ送信機を含む、請求項５６に記載のシステム。