JP2007519035A

JP2007519035A - 脳の活動から発話を生成するためのシステムおよび方法

Info

Publication number: JP2007519035A
Application number: JP2006544024A
Authority: JP
Inventors: ケネディー、フィリップ
Original assignee: ニューラルシグナルズ、インク．
Priority date: 2003-12-08
Filing date: 2004-12-08
Publication date: 2007-07-12
Also published as: EP1695339A2; US20050144005A1; WO2005057548A3; WO2005057548A2; US7275035B2; CA2548711A1; EP1695339A4

Abstract

【解決手段】被験者による発話の生成を補助する方法において、少なくとも１つの第１の神経インパルスは、前記被験者の脳の第１の予め選択された位置から感知される。第１の予め選択された音声は、前記第１の神経インパルスに関連付けられる。前記第１の予め選択された音声は、可聴フォーマットで生成される。前記被験者による発話の生成を補助する装置において、少なくとも１つのセンサーは、前記被験者の脳の神経インパルスを感知し、前記神経インパルスを表す信号を生成する。電子音声生成装置は、前記信号の生成に応答して音素を生成する。音声システムは、前記音声生成装置から受信された信号に基づいて前記音素に対応する可聴音を生成する。
【選択図】図４

Description

本出願は、２００３年１２月８日付けで提出された米国特許仮出願第６０／５２７，９４３号の利益を主張するものであって、その全文はこの参照により本明細書に組み込まれる。

本発明は、米国国立衛生研究所（ＮａｔｉｏｎａｌＩｎｓｔｉｔｕｔｅｓｏｆＨｅａｌｔｈ）が授与した助成金第１Ｒ４３ＤＣ００７０５０−０１号に基づき、米国政府の支援の下で行われたものである。米国政府は、本発明の特定の権利を有する場合がある。

本発明は、医療システムに関するものであって、より具体的には、神経インパルスに基づく発話および他の音声を生成するためのシステムに関するものである。

閉じ込め症候群は、被験者が発話を生成するために必要な筋肉の運動制御を殆ど、あるいは全くできない状態である。このような被験者は、目の動きによってコミュニケーションを行う場合がある。１つのコミュニケーション方法において、前記被験者の目の動きはコンピュータ画面に表示された文字表と相関し、前記被験者は、伝達したいと思う言葉を形成する文字を見ることによって、言葉を表現する。その結果を音声生成装置に入力すると、この装置は、前記被験者によって表現された言葉に対応する音声を生成する。あるいは、運動神経インパルスなどの目の動き以外の入力方法が、コミュニケーションを容易にするのに使用される場合もある。このようなシステムにおいては、前記入力方法によって、コンピュータ画面上の文字またはアイコン上を動くカーソルを制御することが可能であり、前記カーソルが十分な時間の間１文字上で停止すると、前記文字が文字列に追加され、最終的に１つの言葉が形成される。

このようなシステムは、簡単な言葉の生成にさえ相当な時間を要する点と、必要な文字および前記表にある文字の場所を決定するために前記被験者が多くの精神的努力を要する点において制限がある。

発話生成に関連する脳の部位は、「ブローカ野」と呼ばれる。一般に、人が発話すると、ニューロンの放電によって、ブローカ野にあるニューロンに電気スパイクが形成される。これらの放電を局所的軸索から感知することが可能であり、前記局所的軸索における前記放電は「活動電位」と呼ばれる。１つの位置においていくつかの異なる活動電位が感知可能であり、それぞれの異なる活動電位は、異なる精神作用に対応している可能性がある。

現在、脳内のニューロン放電または活動電位を測定して、それらを直接的に、たとえば言葉を形成する最も基本的な音声である音素のような音声に変換するシステムはない。ブローカ野中の活動電位から直接的に音素を生成することにより、発話をほぼリアルタイムに生成する結果となる。被験者が自然な形で発話を生成することが可能になれば、前記被験者と外界とのコミュニケーションが大きく促進することになる。

したがって、リアルタイムの自然な精神プロセスを採用して音声を生成するための発話生成システムと方法が必要である。

前述の先行技術の欠点は、１様態において、被験者の発話を補助する方法である本発明によって克服されるものであり、前記方法において、少なくとも最初の１つの神経インパルスは、前記被験者の脳内の第１の予め選択された位置から感知される。第１の予め選択された音声は、前記第１の神経インパルスに関連付けられる。前記第１の予め選択された音声は、可聴フォーマットで生成される。

別の様態において、本発明は、被験者が音声を生成するのを補助する方法であり、前記方法において、複数の神経インパルスが被験者の脳内の複数の位置から感知される。予め選択された音声は、予め定められた神経インパルスのパターンと関連付けられる。前記予め選択された音声は、可聴フォーマットで生成される。

別の様態において、本発明は、被験者とのコミュニケーションを可能にする方法であり、前記方法において予め定められた知的訓練を前記被験者が実行する間に、前記被験者の脳の機能的ＭＲＩスキャンを行うことによって、前記被験者の脳において、前記被験者による前記知的訓練の実行中に神経活動が生じる第１の位置を決定するものである。１つの電極をが前記被験者の脳の前記第１の位置に埋め込まれる。前記被験者は、予め定められた音素を表現する欲求を、前記被験者の脳の前記第１の位置で生成される活動電位に関連付けるよう訓練される。前記活動電位は、前記電極で感知される。前記活動電位の感知に応答して、前記予め定められた音素に対応する可聴音が生成される。

さらに別の様態において、本発明は、被験者が脳の電気的活動に基づき発話を生成するのを補助するための装置である。少なくとも１つのセンサーが、前記被験者の脳の神経インパルスを感知し、その神経インパルスを表す信号を生成する。電子音声生成装置が、前記信号の生成に応答して音素を生成する。音声システムは、前記音声生成装置から受信された信号に基づいて前記音素に対応する可聴音を生成する。

本発明のこれらの様態およびその他の様態は、以下の図と伴に開示する本発明の好適な実施形態についての以下の説明によって明らかになる。当業者であれば周知のように、本開示の新規概念の精神と要旨の範囲から逸脱することなく本発明の様々な変形形態および修正を実行することが可能である。

ここで、本発明の好適な実施形態について詳細に説明する。図を参照し、同類の番号は全ての図において同類の部分を指すものである。本明細書および特許請求の範囲全体の説明に使用されているように、以下の用語は、特に明記しない限り、本明細書にて明確に関連付けられる意味において用いられる。"ａ"、"ａｎ"、"ｔｈｅ"は複数のものを指す場合も含み、"ｉｎ"は"ｉｎ"および"ｏｎ"の意味を含む。

本発明は、ヒトの脳神経活動を記録するシステムおよび方法のためのものであって、前記活動を用いて音声生成装置を駆動するものである。このような装置は、スペリング装置上でアイコンまたは文字を選択するというような発話生成の仲介手段を必要としない。代わりに、個々の皮質神経信号からの活動は、ＦＤＡ（米国食品医薬品局）認可の神経親和性電極（若しくは他の適したタイプの電極）を介して感知され、増幅され、経皮的に送信されて、スパイクをソートするソフトウェアを用いて処理される。これらの処理済み神経信号のパルス出力によって、音声生成装置は駆動される。

通常、被験者が知的訓練を実行する間に、機能的ＭＲＩを使用して前記被験者の脳をマップし、前記脳の局所活動の領域を決定する。少なくとも１つの電極を、局所活動が生じる脳の領域に埋め込み、神経インパルス（ニューロン放電または活動電位など）を前記電極において感知する。前記被験者は、音素のような特定の音声を発音することを想像し、それに対する応答として神経インパルスを生成するよう訓練される。訓練後に前記被験者が特定の神経インパルスを生成すると、それを前記電極が感知し、コンピュータにより制御された音声生成装置に伝達する。前記コンピュータは、前記神経インパルスを特定の音声（１つの音素など）と関連付け、前記音声を可聴音として生成する。

図１が示すように、適切な電極タイプの１つには、ＮｅｕｒａｌＳｉｇｎａｌｓ，Ｉｎｃ．（ジョージア州アトランタ）から入手可能な神経親和性電極１０がある。このような神経親和性電極１０は、金製記録ワイヤ１４を含む、中が空洞のガラス製円錐体１２を具備し、前記ワイヤにより、栄養素の影響を受けて、神経細胞２から前記ガラス製円錐体１２内に成長する軸索４からの記録が可能になる。前記記録ワイヤ１４間の電位変化が増幅器１６に入力されると、その変化に対応する出力１８が生成される。神経親和性電極の１例は、米国特許第４，８５２，５７３号明細書に開示されており、前記特許の全文は参照により本明細書に組み込まれる。前記電極を前記被験者の脳に埋め込み、経皮的に埋め込まれたトランスミッタを介して前記コンピュータへ送信することができる。そのようなシステムについては、「ＤｅｔｅｃｔｉｎｇＮｅｕｒａｌＳｉｇｎａｌｓａｎｄＵｓｉｎｇＳａｍｅｔｏＤｒｉｖｅＥｘｔｅｒｎａｌＦｕｎｃｔｉｏｎｓ（神経信号の検出および神経信号を用いて行う外部機能の駆動）」と題する２００３年９月３０日付けで提出された米国特許出願第１０／６７５，７０３号明細書の中で説明されており、その全文は参照により本明細書に組み込まれる。

本発明に、その他の電極を使用することも可能である。たとえば、ＢｉｏｎｉｃＴｅｃｈｎｏｌｏｇｉｅｓの「Ｕｔａｈ」アレイ（１０ｘ１０ピン）は、非常に優れた記録特性を有するものであるが、安定性にやや欠け、記録を数年以上続けることができない恐れがある。当業者であれば周知のように、その他の電極（有線および無線）および神経信号スキャン装置を本発明に使用することも同様に可能である。

前記システムは、活動電位、局所電場電位（いくつかの活動電位が集合したもの）、あるいはニューロンスパイクやニューロン放電のようなその他のタイプの神経インパルスを感知することが可能である。

このタイプの埋め込み式神経親和性電極からの記録により、長期間にわたり、強い信号対ノイズ比を示す活動電位が生成されてきた。前記神経親和性電極により、麻痺状態にある被験者および発話不能の（閉じ込め症候群）被験者がコンピュータを制御し、コンピュータにより生成された発話を使ってコミュニケーションすることが可能になった。前記神経電極には、増幅信号を経皮的にＦＭ送信する（すなわち、無線）、ＦＤＡ認可（および生物学的に適合性のある）記録システムを利用することが可能である。さらに、前記神経親和性電極への電力を空隙誘導コイルによって供給できるため、電池の必要がない。先行実施例においては、前記神経親和性電極システムは、閉じ込め症候群被験者に埋め込まれ、それによってスイッチまたはコンピュータカーソルが制御が提供されたため、前記被験者は（データ入力によって生成される合成発話を伴う場合もそうでない場合も含めた）コミュニケーション、インターネットアクセス、環境制御等を行うことができるようになった。前記システムの安定性は、前記電極の空洞のガラス先端を通って成長し前記円錐体の各端の外側の神経網に接続する有髄軸索となる軸索の成長によってもたらされる。これらの接続により、脳の物質内に前記電極先端が保持される。

図２が示すように、前記被験者の脳２０の機能的ＭＲＩスキャンは、予め定められた知的訓練を前記被験者が行ったときに生じるいくつかの活動領域を明らかにする。このような知的訓練には、たとえば、前記被験者に特定の音素若しくはその他の音声を発声する試みを含めることができる。

図３で示すように、軸索からのインパルスは活動電位３０を生成する。異なる線パターンは、異なる活動電位３０を示す。単一の電極はいくつかの異なる活動電位を感知することができ、各活動電位は異なる精神的作業に対応するものである。

典型的な装置を図４で示す。この装置において、前記被験者１１０には、いくつかの電極１１２が埋め込まれている。前記電極１１２は、コンピュータ１３０に連結されているレシーバ１３４に無線信号を介して神経インパルスを送信する。前記レシーバ１３４は、たとえば、ＰＣＭＣＩＡカードを通して前記コンピュータ１３０に連結されている。前記コンピュータ１３０は、神経インパルスの受信、どのタイプの神経インパルスが受信されたかの決定、受信された特定の神経インパルスに対応する音声の検索、音声生成装置およびスピーカ１３２若しくは他の音声生成装置を含む音声システムを通しての前記音声の生成を実行するようプログラムされている。

前記システムは、特定の活動電位を検出して音素を生成するか、あるいは活動電位のパターンを音素に関連付けることができる。たとえば、１つの電極あるいはいくつかの異なる電極からの活動電位の特定の組み合わせを、特定の音素とペアに組み合わせることができる。

発話生成の１実施形態において、図５で示すように、前記被験者は音素を想像することによって１若しくはそれ以上の活動電位２０２を生成する。前記活動電位（若しくは他の神経信号）はデジタル化され、前記コンピュータ２０４に入力される。前記コンピュータは特定の活動電位２０６を検出し、前記活動電位を対応する音素２０８に一致させる。前記被験者は、音素を発声することを想像し、前記コンピュータからその発声結果を聞くというフィードバック過程を通して、音素一式２１０を生成するよう訓練される。何度か繰り返すうちに、前記被験者は、生成される特定の活動電位をそれらに対応する音素に一致させる。次に、前記被験者は、異なる音素を連続的に生成することによって言葉２１２を生成するよう訓練される。この時点で、前記被験者は、聞き取り可能な言葉２１４を生成することによって他者とコミュニケーションすることが可能となる。

この実施形態においては、各神経パルスは単一の音素を生成するようにリンクされる。したがって、ブローカ野からの単一パルスの発火は単一の音素の音声を生成し、連続発火パターンは、言葉を形成する音声の組み合わせを生成することになる。

本発明は、仲介データ入力若しくはインターフェイスを必要とせずに、脳活動から直接発話を生成することを可能にするものである。１実施形態においては、機能的ＭＲＩを使用して、発話する被験者と閉じ込め症候群の被験者におけるヒトの発話領域の位置を特定する。次に、少なくとも２つの神経親和性電極を前記被験者の脳に埋め込む。いくつかの強力な神経信号が感知されて音素生成器に出力される。前記被験者は、理解可能な言葉となるまでこれらの音素を制御するよう訓練される。それに従って、理解可能な発話を作り出すようになるまでの学習曲線を作成することが可能である。また、本発明は、複数の電極を前記被験者に埋め込む工程と、前記被験者が多様な音素および、より数多くの音素を制御して、より数多くの言葉を生成するよう訓練を受ける間に音素ライブラリを拡大する工程も含む。

本システムは、音素を生成するだけでなく、神経インパルスと、たとえば特定の周波数や音符のような他の音とのペアを生成することもできる。

実験的な１適用例において、被験者からのデータは、発話のような複雑なデータを生成のための十分なデータ帯域（すなわち、データチャネル数）を提供する、複数の活動電位が利用可能であることを示している。前記データは、ＰｌｅｘｏｎＩｎｃ．（テキサス州ダラス）から入手可能なＯｆｆＬｉｎｅＳｏｒｔｅｒという、信号分離用の一式のツールを使って分析した。前記分析においては、主に等高線マッピングを使用した。アナログデータをデジタル化し、波形分析前および波形分析後の必要条件に従って１．２ミリ秒または４．８ミリ秒の範囲の時間ビンで活動電位を分離した。次に、分離された各活動電位を、ピーク−トラフ振幅、ピーク振幅または谷振幅、スライス１およびスライス２（選択時点における波形の高さ）、タイムスタンプ（３Ｄモードにおいて特に有用）を含むパラメータの選択に従って、２Ｄまたは３Ｄの空間における点として表した。活動電位を分離した後、ＮｅｕｒｏＥｘｐｌｏｒｅｒ（ＮＥＸ）プログラム上で分析用．ｎｅｘファイルが作成された。あるいは、その他のデータファイルをソートするためにパラメータファイル（．ｔｐｌ）が作成される。使用されるデータファイルは、Ｐｌｅｘｏｎデジタル化データ（．ｄｄｔ）およびＤａｔａＷａｖｅで取得したデータ（．ｕｆｆ）である。前記ＮＥＸプログラムは、時間と周波数の双方のドメインでの分析を可能にする。前記時間ドメインにおいては、通常、速度ヒストグラム、インタースパイク・インターバル・ヒストグラム、ペリイベント・ヒストグラム、ラスター、交差相関曲線が構築される。前記周波数ドメインにおいては、パワースペクトル密度が構築される。これら全ての分析は、大型のデータセットを扱うことができる。

実験的な１実施形態において、全てのＭＲＩ実験を３Ｔ全身スキャナ（ＰｈｉｌｉｐｓＩｎｔｅｒａ）で行った。血液酸素化レベル依存（Ｂｌｏｏｄｏｘｙｇｅｎａｔｉｏｎｌｅｖｅｌｄｅｐｅｎｄｅｎｔ：ＢＯＬＤ）画像を、Ｔ２^＊強調グラディエント・エコー・プラナー・イメージング（ｅｃｈｏｐｌａｎａｒｉｍａｇｉｎｇ：ＥＰＩ）法を用いて、ＴＲ／ＴＥ／角度＝３０００ｍｓ／４０ｍｓ／９０o、視野（ＦＯＶ）２４０(２４０ｍｍ、ピクセルマトリックス９６(９６で収集し、１２８ｘ１２８に再構成した。高分解能Ｔ１強調スピンエコーでの解剖学的画像を、ＥＰＩと同一のスライス位置で、ＴＲ／ＴＥ／角度＝５００ｍｓ／２０ｍｓ／９０o、ＦＯＶ２４０(２４０ｍｍ、ピクセルマトリックス２５６(２５６で収集した。Ｔ１強調画像およびＥＰＩの双方のために、４ｍｍ厚、０ギャップで、ＡＣ−ＰＣ線にほぼ平行な２８の斜方軸位断が、脳全体を覆うために選択された。さらに、活動が生じた脳領域の視覚化と位置づけを向上し、手術計画の補助とするために、脳の表面と容積のレンダリングをする高分解能３Ｄ、Ｔ１強調グラディエント・エコー・イメージングを、等方性ボクセルサイズ（１ｍｍ）を用いて収集した。

機能的画像を処理し、ＳＰＭ９９プログラム（ＷｅｌｃｏｍｅＤｅｐａｒｔｍｅｎｔｏｆＣｏｇｎｉｔｉｖｅＮｅｕｒｏｌｏｇｙ製、英国、ロンドン）に実装された統計パラメータ・マッピング・アルゴリズムを用いて分析した。形状保存変換処理を用いて、ＥＰＩ画像を連続画像の最初の画像に再整合し、モーションアーチファクトを補正した。高分解能のＴ１およびＥＰＩテンプレート画像は、同時登録した。汎用線形モデルを各ボクセルの経時的起動の解析に適用し、統計マップを得た。次に、前記統計マップを定義済み閾値で抽出し、前記Ｔ１強調解剖学的画像に重ね合わせた。機能的マップとＴ１強調画像の両方を、ＮＥ埋め込み手術の参照として使った。この作業はテスト済みであり、ブローカ野において活発な活性が認められた。

１実施形態において、以下の電極埋め込み術を採用した。手術の直前に、頭皮に基準マーカーを配置して解剖学的ＭＲＩを行う。全身麻酔を投与し、頭部を固定した後、３Ｄフレームレス定位脳手術システムを用いてターゲットの位置を決定し、最終的な頭皮切開位置を決定する。皮膚に標準的殺菌を施した後、前記頭皮を切開し、開頭術を行う。脳硬膜を開いて脳を露出し、前記フレームレス定位脳手術システムを再び用いて最終的な脳回上ターゲットの位置を決定する。埋め込み位置は、ｆＭＲＩ（機能的ＭＲＩ）データを参照して特定する。栄養素を充填した神経親和性電極（ＮＥ）を、脳軟膜を切開した大脳皮質に接近させ、顕微鏡下で大脳皮質表面の５〜６ｍｍ下へ、脳回の平面に対し４５度の角度で誘導する。前記ＮＥの外側（若しくは上部）の端部を、前記表面の下へ押し下げた後、開頭術による開口部全体にゲルフォーム材の層が形成されるようにゲルフォーム材で覆う。これを、ＮＥコネクタが前記電子部品に接続された後に、アクリルセメントで覆う。全てをアクリルセメントで覆い、傷口を層状に閉じる。通常、ドレインは使用されない。

開頭術によってできた頭蓋骨の開口部に前記電極を埋め込んで固定した後（下記を参照）、前記電子モジュールを頭蓋骨上に埋め込み、前記電極に接続する。前記電子モジュールは、２若しくは３の増幅器（約１，０００ｘ増幅率）と、ＦＭトランスミッタと、キャリブレーションシステムとを具備する。整流器と調整器を有する電力誘導コイルによってこれらに＋／−５ボルトの電力が供給される。この電力供給によって、電池の埋め込みの必要がなくなり、前記被験者が生涯使用可能な埋め込みが可能となる。前記装置は、表面実装式構成要素を用いて構築され、機械的保護のために頑丈なシラスティック（Ｓｉｌａｓｔｉｃ）被膜を被覆したＥｌｖａｘＰｏｌｙｍｅｒ（ＤｕＰｏｎｔＮｅｍｏｕｒｓ）の絶縁材で覆われている。前記システムは、頭蓋骨の形に成形される。

前記切開が完全に治癒した後（通常、約３週間）、記録を開始する。前記電力誘導コイルを、前記頭皮の内部コイルの上に接近させ、ほぼ１ＭＨｚの送信周波数に設定する。受信アンテナを前記頭皮の近くに配置し、ＷｉｎＲａｄｉｏシステム（ＷｉｎＲａｄｉｏＩｎｃ．から入手可能）を使って前記周波数を調整する。前記信号は、増幅率が約１０倍または２０倍で、活動電位に対するフィルタ設定が５００Ｈｚ〜５，０００Ｈｚである増幅器へ送信される。前記データは、オフライン分析のためにＤＤＳテープレコーダ（ＣｙｇｎｕｓＩｎｃ．製）にアーカイブされる。

オフラインデータ分析は、ＰｌｅｘｏｎＩｎｃ．（テキサス州ダラス）のＯｆｆ−ＬｉｎｅＳｏｒｔｅｒを用いて行う。これらの分析結果により、どの活動電位が独立して発火するかに関する情報が提供される。前記分析結果を、オンライン・スパイク・ソート・プログラムに用に選択することが可能である。

ＰｌｅｘｏｎＯｎｌｉｎｅＳｐｉｋｅＳｏｒｔプログラムからの出力を、ラップトップ・コンピュータのＰＣＭＣＩＡカードに入力する。前記出力は、まず、前記Ｐｌｅｘｏｎコンピュータへ経由し、ＰｌｅｘｏｎＩｎｃのＳｐｉｋｅＳｏｒｔＰｒｏｇｒａｍを用いて行う信号分離を含むオンライン処理が行われる。前記パルス出力は、前記ＰＣＭＣＩＡへ送信され、パルスを受信するＭＣソフトウェアに入力される。前記ソフトウェアは、一度に５０ｍｓの信号をチェックする。この期間中にスパイクが検出されると、その音素のサウンドバイトが起動される。各サウンドバイトの持続期間は約２５０ｍｓとなる。前記サウンドバイトの再生の前に１若しくはそれ以上のスパイクが検出された場合は、「延長」音をシミュレートするために前記サウンドバイトが直ちに繰り返される。繰返し再生される間にスパイクが検出されない場合、前記出力は、前記サウンドバイトの再生の完了後に停止する。このように、音声は、スパイクが検出され続ける限り再生される。このようにして、各音素の持続期間と再生は、前記スパイクのタイミングによって決定される。前記ＰｌｅｘｏｎＳｐｉｋｅＳｏｒｔｅｒからの各スパイクは、前記ＰＣＭＣＩＡカードの異なるチャネルに送信されるものであって、英語の各音素に対して１つのチャネルがあるのが理想的である。

最初の３音素に対して最も一致する活動電位を相関関係によって位置付け、次に、前記ＳｐｉｋｅＳｏｒｔプログラムを用いて最も一致する活動電位のみを選択する。前記活動電位は、前記被験者への音声フィードバックと伴に前記ラップトップの音素生成器へ出力され、これにより、学習に不可欠な聴覚フィードバックのループが完了する。まず、１つの活動電位のみの出力が可能となり、この活動電位が発火される度にその音素が生成される。前記被験者は、メトロノームまたは他の装置の拍子のような、律動的な１ヘルツの速度で前記発火を制御することを学習する。前記被験者が速度１ヘルツでの制御を約１０％の許容誤差で行えるようになったら、たとえば「ｏ」や「ｕ」の音声に一致するような、その他の活動電位を発火するよう前記被験者を訓練する。前記被験者がこれらの個々の作業を学習した後、３つの音声全てを再び前記被験者にフィードバックして、聴覚ループを完了する。前記被験者が「発話」することを学習する速度は、前記被験者の学習意欲、良好に一致した活動電位の選択、ソートされたスパイクの「明瞭さ」といったいくつかの因子に依存する。

英語には４４の音素があるが、理解可能な発話の生成に、必ずしも全てが必要なわけではない。より多くの神経親和性電極を、経時的に前記被験者に埋め込んでいくことによって、より多くの音素を生成することが可能である。

上述の実施形態は、あくまでも例証を目的とするものである。本発明から逸脱することなく、本明細書に開示された特定の実施形態から、数多くの変形実施形態を作成することが可能であるものと容易に理解される。したがって、本発明の範囲は、下記の特許請求の範囲によって定められるものであって、上述の具体的な実施形態に限定されるものではない。

図１は、神経親和性電極の概略図である。図２は、脳の概略図である。図３は、いくつかの活動電位に関して、電極電位対時間を示すグラフである。図４は本発明に従った装置の概略図である。図５は本発明に従った方法のフロー図である。

Claims

被験者による音声の生成を補助する方法であって、
ａ．少なくとも１つの第１の神経インパルスを、前記被験者の脳の第１の予め選択された位置から感知する工程と、
ｂ．第１の予め選択された音声を、前記第１の神経インパルスに関連付ける工程と、
ｃ．前記第１の予め選択された音声を、可聴フォーマットで生成する工程と
を有する方法。
請求項１記載の方法において、前記第１の予め選択された音声は、第１の音素に対応するものである。
請求項１記載の方法において、前記第１の予め選択された音声は、第１の周波数の符号に対応するものである。
請求項１記載の方法において、前記第１の神経インパルスは、第１の活動電位を有するものである。
請求項４記載の方法において、この方法は、さらに、
前記被験者の脳の前記第１の予め選択された位置において検出された第２の活動電位を検出する工程を有するものである。
請求項５記載の方法において、この方法は、さらに、
ａ．前記第１の予め選択された音声とは異なる第２の予め選択された音声を前記第２の活動電位と関連付ける工程と、
ｂ．前記第２の予め選択された音声を、可聴フォーマットで生成する工程と
を有するものである。
請求項６記載の方法において、前記第２の予め選択された音声は、前記第１の音素とは異なる第２の音素に対応するものである。
請求項１記載の方法において、前記第１の神経インパルスは、局所電場電位を有するものである。
請求項１記載の方法において、この方法は、さらに、
前記被験者の脳の前記予め選択された位置へ神経電極を埋め込む工程を有するものであって、前記感知する工程は、前記神経電極における神経インパルスを感知する工程を有するものである。
請求項９記載の方法において、前記神経電極を埋め込む工程は、神経親和性電極（ｎｅｕｒｏｔｒｏｐｈｉｃｅｌｅｃｔｒｏｄｅ）を埋め込む工程を有するものである。
請求項２記載の方法であって、この方法は、さらに、
ａ．少なくとも１つの第２の神経インパルスを、前記被験者の脳の前記第１の予め選択された位置とは異なる第２の予め選択された位置から感知する工程と、
ｂ．前記第１の予め選択された音素とは異なる第２の予め選択された音素を、前記第２の神経インパルスと関連付ける工程と、
ｃ．前記第２の予め選択された音素に対応する可聴音を生成する工程と
を有するものである。
請求項１１記載の方法において、前記第２の神経インパルスは、局所電場電位を有するものである。
請求項１１記載の方法において、前記第２の神経インパルスは、活動電位を有するものである。
請求項１記載の方法において、この方法は、さらに、
ａ．前記被験者が知的訓練を実行する間に、前記被験者の脳の機能的ＭＲＩスキャンを行うことによって、前記知的訓練中の脳における活動領域の少なくとも１つを決定する工程と、
ｂ．前記脳の活動領域に電極を取着し、神経インパルスを感知する工程と
を有するものである。
請求項１記載の方法において、前記感知する工程は、前記被験者の脳の前記第１の予め選択された位置において、予め選択された、複数の異なる活動電位一式を感知する工程を有するものである。
被験者による発話の生成を補助する方法であって、
ａ．前記被験者の脳の複数の位置からの複数の神経インパルスを感知する工程と、
ｂ．予め選択された音声を、予め定められた神経インパルスのパターンと関連付ける工程と、
ｃ．前記予め選択された音声を、可聴フォーマットで生成する工程と
を有する方法。
請求項１６記載の方法において、前記神経インパルスは、活動電位を有するものである。
請求項１６記載の方法において、前記神経インパルスは、局所電場電位を有するものである。
請求項１６記載の方法において、前記予め選択された音声は、音素を有するものである。
請求項１６記載の方法において、前記予め選択された音声は、周波数を有するものである。
被験者とのコミュニケーションを可能にする方法であって、
ａ．前記被験者が予め定められた知的訓練を実行する間に、前記被験者の脳の機能的ＭＲＩスキャンを行うことによって、前記被験者が前記知的訓練を実行中に、神経活動が生じる前記被験者の脳の第１の位置を決定する工程と、
ｂ．前記被験者の脳の前記第１の位置に電極を埋め込む工程と、
ｃ．予め定められた音素を表現する欲求を、前記被験者の脳の前記第１の位置で生成される活動電位に関連付けるよう、前記被験者を訓練する工程と、
ｄ．前記電極において前記活動電位を感知する工程と、
ｅ．前記活動電位を感知する工程に応答して、前記予め定められた音素に対応する可聴音を生成する工程と
を有する方法。
請求項２１記載の方法において、この方法は、さらに、
ａ．前記被験者が前記知的訓練の一部を実行する間に、神経活動が生じる前記被験者の脳の前記第２の位置の少なくとも１つを決定する工程と、
ｂ．前記被験者の脳の前記第２の位置に第２の電極を埋め込む工程と、
ｃ．第２の予め定められた音素を表現する欲求を、前記被験者の脳の前記第２の位置で生成される第２の活動電位に関連付けるよう、前記被験者を訓練する工程と、
ｄ．前記第２の活動電位を感知する工程と、
ｅ．前記第２の活動電位を感知する工程に応答して、前記第２の予め定められた音素に対応する第２の可聴音を生成する工程と
を有するものである。
請求項２１記載の方法において、この方法は、さらに、
ａ．第２の予め定められた音素を表現する欲求を、前記被験者の脳の前記第１の位置で生成される第２の活動電位に関連付けるよう、前記被験者を訓練する工程と、
ｂ．前記第２の活動電位を感知する工程と、
ｃ．前記第２の活動電位を感知する工程に応答して、前記第２の予め定められた音素に対応する第２の可聴音を生成する工程と
を有するものである。
脳の電気的活動に基づき、被験者による発話の生成を補助するための装置であって、
ａ．前記被験者の脳の神経インパルスを感知し、前記神経インパルスを表す信号を生成する少なくとも１つのセンサーと、
ｂ．前記信号の生成に応答して、音素を生成する電子音声生成装置と、
ｃ．前記音声生成装置から受信された信号に基づいて前記音素に対応する可聴音を生成する音声システムと
を有する装置。
請求項２４記載の装置において、前記神経インパルスは、局所電場電位を有するものである。
請求項２４記載の装置において、前記神経インパルスは、ニューロン放電を有するものである。
請求項２４記載の装置において、前記神経インパルスは、活動電位を有するものである。
請求項２７記載の装置において、前記センサーは、前記被験者の脳における複数の活動電位を感知することが可能であり、且つ、対応する複数の信号を生成することが可能であって、各信号は前記複数の活動電位のうちの異なる１つ表すものであって、前記電子音声生成装置は、前記複数の信号の各信号に応答して異なる音素を生成し、それにより前記音声システムは、連続した複数の異なる音素に対応する可聴音を生成することが可能となるものである。
請求項２４記載の装置において、前記センサーは、埋め込み電極を有するものである。
請求項２９記載の装置において、前記埋め込み電極は、神経親和性電極を有するものである。
請求項２４記載の装置において、前記電子音声生成装置は、前記センサーによって感知される活動電位を検出するようプログラムされたコンピュータを有するものである。
請求項３１記載の装置において、前記コンピュータは、さらに、１つの活動電位を特定の音素に関連付けるようプログラムされるものである。
請求項３２記載の装置において、前記コンピュータは、さらに、前記特定の音素に対応する可聴音を生成するようプログラムされるものである。