JP2016535305A

JP2016535305A - 自閉症における言語処理向上のための装置

Info

Publication number: JP2016535305A
Application number: JP2016534814A
Authority: JP
Inventors: ロバーツティモシー; エンビックデイビッド
Original assignee: Childrens Hospital of Philadelphia CHOP
Current assignee: Childrens Hospital of Philadelphia CHOP
Priority date: 2013-08-13
Filing date: 2014-08-13
Publication date: 2016-11-10
Anticipated expiration: 2034-08-13
Also published as: EP3033140B1; US20160210872A1; EP3033140A4; WO2015023751A1; JP6673828B2; EP3033140A1; US10825353B2

Abstract

自閉症スペクトラム障害（ＡＳＤ）の個体における言語処理を向上させるための音脈の聴覚的操作のための方法及び装置を提供する。音脈は受信され、そして客体を知覚的に表象する音響的刺激を含む。所定の音響的詳細特性について音響操作パラメーターが選択される。その所定の音響的詳細特性は前記ＡＳＤ個体と関連し、且つ、前記ＡＳＤ個体の測定された言語処理能力に基づく。音脈は、選択された音響操作パラメーターに基づいて改変されて、前記刺激の語彙性を保持しつつ所定の音響的詳細特性を減少させ、それにより前記刺激がそれぞれ前記客体を知覚的に表象する２つ以上の音響的に異なる刺激を含むときであってもその減少した音響的詳細特性によって前記ＡＳＤ個体による前記客体の知覚が向上する。その改変された音脈は少なくとも１つのラウドスピーカーによって前記ＡＳＤ個体に出力される。

Description

関連出願の相互参照
本願は、参照により本明細書に全体が援用される２０１３年８月１３日に提出された「自閉症スペクトラム障害と関連の言語障害における言語処理の向上のための装置（ＤＥＶＩＣＥＦＯＲＥＮＨＡＮＣＥＭＥＮＴＯＦＬＡＮＧＵＡＧＥＰＲＯＣＥＳＳＩＮＧＩＮＡＵＴＩＳＭＳＰＥＣＴＲＵＭＤＩＳＯＲＤＥＲＳＡＮＤＲＥＬＡＴＥＤＬＡＮＧＵＡＧＥＩＭＰＡＩＲＭＥＮＴＳ）」という表題の米国特許仮出願番号第６１／８６５２９３号に対する優先権を主張するものである。

連邦政府による資金提供を受けた研究の記載
本発明は米国国立衛生研究所によって授与された助成金番号Ｒ０１ＨＤ０７３２５８の国庫補助により行われた。米国政府は本発明に一定の権利を有する。

本発明の分野
本発明は言語処理に関する。より具体的には、本発明は、音脈における音響的詳細（ａｃｏｕｓｔｉｃｄｅｔａｉｌ）の減少に基づく言語障害関連疾患を有する個人に対する言語処理向上用の装置と方法に関する。

自閉症スペクトラム障害（ＡＳＤ）は児童のうちに発見され、成人まで続く一連の発達障害を指す。ＡＳＤの特徴的な症状は、社会的統合／相互関係が難しいことに加えて言語とコミュニケーションにおける欠陥、及び多動性を含む。ＡＳＤの有病率（例えば、１１０人のうち約１人が少なくとも１つのスペクトラム障害を有する）。ＡＳＤの児童の大多数が大いに言葉の問題を有する（例えば、約４０％がどのような言語行動も有しない）。

自閉症スペクトラム（及び中枢性聴覚処理遅延（ＣＡＰＤ）などのおそらく関連する神経精神障害）の児童には音響的には異なっているが概念的には同一である刺激から知覚的客体を「抽象化する」又は形成することが困難である児童もいる。例として、異なる話者によって言われた同一の言葉を符号化するときの困難が挙げられる。この抽象化における困難は、抽象的語彙表象を活性化する速度とその成功を含む、言葉（語彙）を処理し、表象する系に関してＡＳＤの個体に関係する。

本発明は自閉症スペクトラム障害（ＡＳＤ）個体における言語処理を向上させるための音脈の聴覚的操作方法に関する。客体を知覚的に表象する音響的刺激を含むその音脈は処理機によって受信される。所定の音響的詳細特性について音響操作パラメーターが選択される。その所定の音響的詳細特性は前記ＡＳＤ個体と関連し、且つ、前記ＡＳＤ個体の測定された言語処理能力に基づく。前記処理機は選択された音響操作パラメーターに基づいて前記音脈を改変する。前記音脈に対するその改変によって前記刺激の語彙性を保持しつつ所定の音響的詳細特性が減少し、それにより前記刺激がそれぞれ前記客体を知覚的に表象する２つ以上の音響的に異なる刺激を含むときであってもその減少した音響的詳細特性によって前記ＡＳＤ個体による前記客体の知覚が向上する。その改変された音脈は少なくとも１つのラウドスピーカーによって前記ＡＳＤ個体に出力される。

本発明は自閉症スペクトラム障害（ＡＳＤ）個体における言語処理を向上させるための音脈の聴覚的操作用の装置にも関する。その装置は音声入力インターフェース、持続性有形記憶装置、音響的詳細操作ユニット及び少なくとも１つのラウドスピーカーを含む。その音声入力インターフェースは客体を知覚的に表象する音響的刺激を含む前記音脈を受信するように構成されている。その記憶装置は所定の音響的詳細特性についての音響操作パラメーターを保存するように構成されている。その所定の音響的詳細特性は前記ＡＳＤ個体と関連し、且つ、前記ＡＳＤ個体の測定された言語処理能力に基づく。その音響的詳細操作ユニットは、前記所定の音響的詳細特性についての保存された音響操作パラメーターの中から一つの音響操作パラメーターを選択し、且つ、前記の選択された音響操作パラメーターに基づいて前記音脈を改変するように構成されている。前記音脈に対するその改変によって前記刺激の語彙性を保持しつつ所定の音響的詳細特性が減少し、それにより前記刺激がそれぞれ前記客体を知覚的に表象する２つ以上の音響的に異なる刺激を含むときであってもその減少した音響的詳細特性によって前記ＡＳＤ個体による前記客体の知覚が向上する。その少なくとも１つのラウドスピーカーは前記ＡＳＤ個体にその改変された音脈を出力するように構成されている。

添付図面と併せて読むと後続の詳細な説明から本発明を理解することができる。常識的に考えて、図面の様々な特徴／要素が実寸で描かれていない場合があり得ることを強調する。逆に、明確にするためにそれらの様々な特徴／要素の寸法を任意の割合で拡大又は縮小している場合があり得る。また、図面中で同様の特徴／要素を表すために共通の数値参照符号が使用されている。次の図が図面に含まれる。

本発明の一実施形態に従う言語処理向上のための例となる聴覚的操作装置の機能的ブロックダイアグラムを示す図である。

本発明の一実施形態に従う聴覚的操作装置の校正のための例となる方法のフローチャートを示す図である。

本発明の一実施形態に従う言語処理向上のための聴覚的操作の例となる方法のフローチャートダイアグラムを示す図である。

本発明の別の実施形態に従う言語処理向上のための聴覚的操作の例となる方法のフローチャートダイアグラムを示す図である。

本発明の一実施形態に従う「ｃａｔ」という言葉の例となるユニークネスポイントを示すスペクトログラムを示す図である。

本発明の一実施形態に従う時間の関数としての「ｃａｔ」という言葉の例となる活性化のグラフを示す図である。

上で考察したように、ＡＳＤの個体は音響的には異なっているが概念的には同一である刺激から知覚的客体を抽象化することが困難である。この困難は言語機能の基本的構成要素の障害、すなわち、同一の「客体」の重複的表象の作成が原因であり得、無関係の音響的詳細への過剰な注目によって特色づけられる。

そのような欠陥の証拠を、知覚的客体の周辺への反応の「集中」の欠如、音響的な（しかし言語的ではない）差異に対する増加した感受性、及び（わずかな音響的な差異を処理する過剰な努力に続く）聴覚入力処理の全体的な遅延を示す（例えば、時空的な脳機能の描写を可能にする一種の機能性脳波マッピングである脳磁気図記録（ＭＥＧ）によって記録された）電気生理学的反応内に見ることができる。プライミング効果（電気生理学的と行動的の両方）も知覚的客体形成を不可能にする「無関係の」詳細への注目の強化を表す。

一般に、語られた言葉は過剰な音情報、すなわち、意図された「客体」又は意味を「復号」するために必要とされるものよりも多くの情報を含むことがあり得る。時にはその余計な詳細が高次の区別（例えば、男性の話者だろうか、又は女性の話者だろうか。彼らは起こっているだろうか。）に役立ち、時にはその余計な詳細は単に（話者ごとに、又は日によっても）変動するだけである。通常の発達によってそのような「わずかな」音響的差異又は音の違いへの耐性ができ、異なる「音」イベントの同一の「言葉」への集束が可能になる。音詳細への過度の依存、又は集中不全、又はそれらの両方によってＡＳＤの脳は意味の抽象化にとって基本的に無関係である音の違いに我慢できないことがある。

「関係性」は見る（聴く）人次第であり得るが、一般的に「無関係」という概念は客体の認識、表象及び究極的には意味を中継又は伝達するために必要ではない要素として本明細書において言及されることが理解され得る。

全ての音は、言葉のような言語音さえも音響的な特徴又は詳細を含んでいる。これらにはピッチ（周波数成分）、ハーモニクス、音の豊さ等が含まれる。これらは物理的なものであり、直接的に測定可能である（又は、例えば、コンピューターによって合成可能である）。会話の中ではそれらは話者（男性：低ピッチ、女性：高ピッチ）、音調（怒っている／悲しんでいる）又は切迫感（過渡応答の速度等）を反映している可能性があり、又はそれらは単なる発声器の変動の結果である可能性がある。問題なのは、異なる話者が異なる音調又は異なる切迫感（又は単に異なる機会に）「ｃａｔ」などの同一の「言葉」を声に出すことができ、それぞれの発声が軽度から中程度の「音響的な差異」を有することである。しかしながら、「通常の耳／脳」にとっては全てが単一の「客体」、すなわち、ｃａｔとして知覚される。音響的差異が知覚された客体を異なる意味が付随する例えば「ｃａｔ」から「ｃａｐ」へ転換するのに充分である特殊な事例において言語的な差異が具現化する可能性がある。ＡＳＤの脳は音響的な差異を超えて適切に「集束する」ことに失敗する場合があり得、したがって異なるバージョンの「ｃａｔ」を複数の異なる客体として聞く（したがって、本質的に適切な表象又は意味に到達することにとって無関係である「音響的な差異」に過剰な重み又は有意性を与えるため、迅速に、又は正確に意図された意味に到達しないことがあり得る）。

（例えば、「ｂｌｉｋ」のような言葉ではないものと対照的に）言葉に対する典型的な電気生理学的反応はスペクトル経時的特徴（具体的には言葉の認識からほんの一瞬の後での５〜１５Ｈｚ帯における振動パワーの減少）と関連する。ＡＳＤにおける反応は遅延化又は減衰することがある。これはＭＥＧを使用してスキャン及び検出され得る。

通常通り発達している（ＴＤ）個体における語彙処理は抽象的要素と挿話的要素の両方を含む。言葉（例えば、ｃａｔ）を聞くときは毎回その言葉は物理的に異なる特性、すなわち、個々の話者の声、話者の性別、韻律と音量の差などを有し、そのことが全ての語られた言葉をユニークなイベントにする。ＴＤの脳はこれらの異なる音響的客体（ＣＡＴ₁〜ＣＡＴ_n）の全てから「ｃａｔ」という単一の語彙表象を抽象化することができる。ＴＤの脳は、無関係の音声上の詳細を取り除き、語彙表象の基礎として機能する音韻的表象

について作業することによりこれを行う。同時にＴＤの脳は言葉の幾つかの挿話的特性に対しても敏感である可能性があり、それによって聴いた言葉の個々の例の幾つかの態様（例えば、話者、又は発話速度、又は発音学についての情報）を想起して表象することもあり、それらの態様が言語処理においていくらか影響を及ぼす。ｃａｔを聴いたときにこの語彙項目の語彙意味論的特性（及び他の特性、例えば、統語論的特性）が活性化されるので抽象的要素の方が言語的表象と言葉の処理にとって重要である傾向がある。抽象化について一般的な問題を有し、且つ、低レベルの詳細に対して過剰な注意を有する集団であるＡＳＤについては言語システムの結果として語彙処理の挿話的態様が抽象的システムの優位に立ち、又は抽象的システムを相殺する。

聴覚的に提示された言葉の認識は脳において多数の異なる計算を伴う。これら計算は、音響信号を音韻的表象（音の言語的表象）へ変換すること、聞き手の脳において漸次得られる音表象を言葉と一致させること（例えば、ｃａｔの最初の２分節である

を聞いた後に脳はｃａｔ、ｃａｐ、ｃａｂ等を部分的に活性化させている）、及び充分な量の言葉の音がわかり、それによって行うことができるようになったところで活性化された候補の中から勝者として１つを選択することを含む。例えば、ｃａｔの最後の分節である［t］を聞いた後で聞き手の脳の中で言葉ｃａｔが完全に活性化される。語彙アクセスのこの観点は、ＡＳＤの脳についての我々の研究において役割を果たす３つの重要な考えを含む。語彙アクセスは語彙検索／活性化（ｌｅｘサーチ）の開始点、脳が標的言葉を特定する認識ポイント（ｒｅｃｏｇポイント）及びその言葉が一つに特定可能になるその言葉の音響信号におけるユニークネスポイント、例えば、ｃａｔの最後の［t］を含む。

図４Ａ及び４Ｂは言葉「ｃａｔ」に対する上に記載される語彙アクセスを示している。図４Ａは言葉「ｃａｔ」を含む音声信号の例となるスペクトログラムであり、図４Ｂは時間の関数としての言葉「ｃａｔ」の例となる語彙アクセスのグラフである。図４Ａは図４Ｂに示されている語彙脳活性と時間的に関連している。図４Ａ及び４Ｂに示されているように、ｃａｔのユニークネスポイントは最後の子音［t］によって決定される。（図４Ｂにおける）語彙システムはユニークネスポイントが処理された後になって初めてその処理された言葉を閾値の上に引き上げることができる。

図４Ｂは経時的な脳における語彙アクセス機構の活性化の上昇（ｙ軸上で図式化）を示している。入ってくる音声信号が聴覚処理の増加のきっかけとなる。音響信号が音韻的表象に変換されるとｌｅｘサーチに割り当てられている活性化が増加し、その音響信号が音声として認識された直後に活性化の増加が始まる（領域１）。漸次処理される入力信号と適合する多数の候補語彙項目が語彙検索によって挙げられる（領域２）。言葉のユニークネスポイントに到達すると、語彙システムは閾値、すなわち、認識ポイントの上に優勝候補であるｃａｔの活性化を引き上げる（領域３）。そして言葉ｃａｔが完全に活性化される。

ＡＳＤの脳は初期聴覚反応が遅れ、その結果として聴覚処理の開始が遅くなる。したがって、ｌｅｘサーチ要素が遅れる、及び／又は堅固でなくなる。ＡＳＤの脳が適切な音声上の詳細を抽象化／具体化できないことで同一の音韻列として認識されるべき同一の音韻列の異なる音声表象を認識することもできなくなる。直接の結果は、ｌｅｘサーチの候補を挙げ、ＴＤ個体の速度と精度を有する単一の言葉の閾値（認識ポイント）に到達することが不可能であることである。

例えば反復によってプライミング効果（上に記載したように、行動とＭＥＧ記録の定量的特徴の両方について）が観察され得る。例えば、「ｃａｔ」の後の「ｃａｔ」はより速く処理され、且つ、「ｔｒｕｃｋ」の後の「ｃａｔ」と比べて抑えられた電気生理学的反応を有する。「ｄｏｇ」の後の「ｃａｔ」がそれらの関連性のために少し中道的な立場にあることは特筆すべきことであり、これを「意味的プライミング」と呼ぶ。しかしながら、「ｃａｔ」という表象が「無関係の」「音響的詳細」に対する過剰な注目のために異なる客体として知覚される場合、ＡＳＤではプライミング効果が失われることがあり得る。実際に、プライミング効果の減衰の程度は実に知覚的クラスタリング欠陥、及び究極的には言語障害の程度の指標となる可能性がある。

無関係の音響的詳細は、言葉（及びその表象又は意味）の理解を通常は損なうはずであるが、「木を見て（聴いて）森を見る（聴く）ことができない」ＡＳＤの脳では別々に分類する原因になる可能性がある「音響的な差異」として一般的に定義され得る。単純な例はピッチである（話者を反映するが、意味を変えることがない）。

本発明の態様は、音響的には異なっているが概念的には同一である刺激からの知覚的客体形成を改善するための音脈の（例えば、補聴器型の装置などによる）音響操作に関する。例となる方法と装置は自閉症スペクトラム障害（ＡＳＤ）個体における言語処理を向上させるための音脈の聴覚的操作に関する。音脈には客体を知覚的に表象する音響的刺激が含まれる。音響操作パラメーターは所定の音響的詳細特性について選択され得る。その所定の音響的詳細特性は前記ＡＳＤ個体と関連し、且つ、前記ＡＳＤ個体の測定された言語処理能力に基づく。音響的詳細操作ユニットは選択された音響操作パラメーターに基づいて前記音脈を改変することができる。前記音脈に対するその改変によって前記刺激の語彙性を保持しつつ所定の音響的詳細特性が減少し、それにより前記刺激がそれぞれ前記客体を知覚的に表象する２つ以上の音響的に異なる刺激を含むときであってもその減少した音響的詳細特性によって前記ＡＳＤ個体による前記客体の知覚が向上する。その改変された音脈は少なくとも１つのラウドスピーカーによって前記ＡＳＤ個体に出力され得る。

図１を参照すると、装置１００として概ね表される例となる聴覚的操作装置の機能的ブロックダイアグラムが示されている。装置１００は音脈１３２の所定の音響的詳細特性を減少させることによって音脈１３２を操作し得る。（音響的詳細が減少した）その改変された音声信号１３４は、音響的には異なっているが概念的には同一である刺激からの知覚的客体形成を改善することによってＡＳＤの個体の言語処理を向上させ得る。減少させるべきそれらの所定の音響的詳細特性（本明細書において所定の特性とも呼ばれる）は装置１００の使用者の言語処理能力と関連し得る。その所定の特性（及び概して装置１００）はその使用者の言語処理能力に基づいて校正され得る（図２については下でさらに説明される）。

装置１００はマイクロフォン１０２、音声入力インターフェース１０４、音響的詳細操作ユニット１０６、増幅器１０８、ラウドスピーカー１１０、コントローラー１１２、記憶装置１１４、使用者インターフェース１１６及び電力供給部１１８を含み得る。マイクロフォン１０２、音声入力インターフェース１０４、音響的詳細操作ユニット１０６、増幅器１０８、ラウドスピーカー１１０、コントローラー１１２、記憶装置１１４、ユーザーインターフェース１１６及び電力供給部１１８はデータ及び制御バス（示されず）を介して接続され得る。電力供給部１１８は装置１００の構成要素への電力供給が可能であるあらゆる適切な電力供給部（電池など）を含み得る。示されていないが、装置１００は遠隔装置との有線通信又は無線通信のためのデータコミュニケーションインターフェースを含み得る。示されていないが、装置１００は例えばグローバルネットワーク（すなわち、インターネット）を介して遠隔地に接続され得る。

幾つかの例では、装置１００は、限定されないが耳掛け（ＢＴＥ）式装置、耳穴（ＩＴＥ）式装置、外耳道挿入式（ＩＴＣ）装置をはじめとする聴覚装置として、又はウェアラブル聴覚装置として構成され得る。ラウドスピーカー１１０は使用者の耳の中に配置されるように（例えばイヤホン形状で）構成され得る。幾つかの例では、装置１００は片耳用の装置であり、１つのラウドスピーカー１１０（及び１つの対応する増幅器１０８）を含む。他の例では、装置１００は両耳用の装置であり、２つのラウドスピーカー１１０（及び２つの対応する増幅器１０８）を含む。幾つかの例では、装置１００は１つのハウジングユニット内に構成され得る構成要素（マイクロフォン１０２、音声入力インターフェース１０４、音響的詳細操作ユニット１０６、増幅器１０８、コントローラー１１２、記憶装置１１４、ユーザーインターフェース１１６及び電力供給部１１８など）を含み得る。そのハウジングユニットはその使用者の体のどの部分にも（例えば、その使用者のベルトに、ポケットの中に、その使用者の首の周りにペンダントとして、その使用者の手首上のリストバンド上に、等）着用され得る。ラウドスピーカー１１０は、その使用者の耳の中に（例えば、外耳道の入り口に、又は外耳道内に）配置されるイヤホンの形状で形成され、ハウジングユニットに接続され得る。

マイクロフォン１０２は周囲の音響的環境、例えば、マイクロフォン１０２の近くにいる個体から入力音響信号１２８を受信するように構成されている。マイクロフォン１０２はその入力音響信号１２８を（電子的）音声信号１２９に変換することができるあらゆる適切な変換器を含み得る。

幾つかの例では、音声入力インターフェース１０４は、電話（携帯電話を含む）、コンピューター、テレビ、音声再生装置、画像再生装置（音声再生能を有する）又は遠隔音声信号１３０を提供することができるあらゆる装置のような遠隔装置から遠隔音声信号１３０（電気信号）を受信するように構成されている。その遠隔装置（示されず）は音声入力インターフェース１０４に有線接続又は無線接続され得る。音声入力インターフェース１０４は（マイクロフォン１０２からの）音声信号１２９をデジタル信号に変換するためのアナログ・デジタル変換器（ＡＤＣ）も含み得る。一般に、音声入力インターフェースは音声信号１２９及び／又は遠隔音声信号１３０を受信し、これらの信号を音脈１３２に変換する。音声入力インターフェース１０４は、音声信号１２９（及び／又は音声信号１３０）を受信及び／又は改変して音響的詳細操作ユニット１０６による処理に適切な形式の音脈１３２を形成するためのあらゆるハードウェア構成要素及び／又はソフトウェア構成要素を含み得る。

音響的詳細操作ユニット１０６は音脈１３２を受信し、且つ、改変された音声信号１３４を提供するように構成されている。改変音声信号１３４は使用者の言語処理能力に基づいて音脈１３２の１つ以上の所定の音響的詳細特性を減少させるように音響的詳細操作ユニット１０６の１つ以上の構成要素によって音響的に操作され得る。音響的詳細操作ユニット１０６は詳細除去フィルタ１２０、ノイズ発生機１２２、音声認識機１２４及び音声合成機１２６のうちの１つ以上を含み得る。幾つかの例では、音響的詳細操作ユニット１０６は１つの構成要素（詳細除去フィルタ１２０又はノイズ発生機１２２など）を含み得る。他の例では、音響的詳細操作ユニット１０６は音声認識機１２４と音声合成機１２６だけを含み得る。音響的詳細操作ユニット１０６に含まれるべき構成要素は使用者が装置１００を校正するときに選択され得る（図２については下でさらに説明される）。音響的詳細操作ユニット１０６は音脈１３２を操作して所定の音響的詳細特性を減少させるためのあらゆる適切なソフトウェア構成要素及び／又はハードウェア構成要素を含み得る。その所定の音響的詳細特性は詳細除去フィルタ１２０、ノイズ発生機１２２、音声認識機１２４及び／又は音声合成機１２６について選択される（及び記憶装置１１４に保存されている）パラメーターと関係し得る。音脈１３２の改変は概してその減少した刺激の語彙性を保持しつつ所定の音響的詳細特性を減少させる（すなわち、その改変された刺激がそれでもなお言葉のように聞こえる）。

詳細除去フィルタ１２０は、音脈１３２を受信し、「本質的でない」詳細の全て（又は適切な部分）が除去されるように音脈１３２をフィルタにかける、又は整えるように構成され得る。詳細除去フィルタ１２０に由来するフィルタにかけられた信号は改変音声信号１３４を形成し得る。詳細除去フィルタ１２０は所定のフィルタ特性を有するフィルタ（例えば、ローパスフィルタ、バンドパスフィルタ、ハイパスフィルタ等）を含み得る。例えば、ヒトの会話のスペクトルエネルギーの大部分は１００Ｈｚ〜１ｋＨｚの範囲内にある。したがって、例となる実施形態では２０Ｈｚ〜２０ｋＨｚの範囲の周波数を通過させるバンドパスフィルタを使用してよい。

「本質的でない」という言葉は、発せられた音（言葉）が表象する「客体」を特定する目的にとって適切ではない（及び、実にＡＳＤの気を散らす可能性がある）詳細（例えば、音調、周波数ダイナミクス等）に関する。例となるフィルタリングアプローチは、音響の「立ち上り」（発声開始）又は音調を伝える可能性があるが特異な表象を鮮明にすることを阻むはずである高周波数の歯擦音などを除去し得る。そのようなアプローチは会話の核心を維持しつつ発話をフィルタにかけるローパスフィルタに類似している。

装置１００のフィルタパラメーター（カットオフ周波数、中央周波数、フィルタタイプなど）を使用者毎に調節してよい。したがって、フィルタパラメーターを使用者に合わせて調節するために使用する前に校正を装置１００に対して行ってよい。加えて、その校正は治療介入の定量的指標も提供し得る。フィルタパラメーターと前記定量的指標を経時的にさらに調節してよい（例えば、順調な進捗を示しているときにその指標を減少させてよい）。

別の例として、詳細除去フィルタ１２０は第１抽出速度を有する音脈１３２を受信し、且つ、（フィルタ１２０の）第２抽出速度が（音脈１３２の）第１抽出速度未満であるように所定の第２抽出速度を有する音脈１３２を二段抽出するように構成され得る。その所定の第２抽出速度は所定の音響的詳細特性を減少させるために選択されるものであり得、所定の音響的詳細特性は使用者に合わせて校正され得る。詳細除去フィルタ１２０に由来するその二段抽出された信号は改変音声信号１３４を形成し得る。

ノイズ発生機１２２は音脈１３２を受信し、且つ、所定のノイズ特性を有するノイズを音脈１３２に適用する（すなわち付加する）ように構成され得る。聴取者が中核的聴覚入力信号にだけ集中するように、その所定のノイズ特性は音脈１３２の音響的詳細を飽和させるように選択され得る。ノイズ発生機１２２に由来するノイズが付加された信号は改変音声信号１３４を形成し得る。

例えば、ホワイトノイズ（すなわち、均一な広域パワースペクトル密度を有するノイズ）又はカラードノイズ（例えば、低周波数の強調を有し、周波数に対して反比例するパワースペクトル密度を有するピンクノイズ）を音脈１３２に付加してよい。例えば、擬似ランダムノイズ発生機によってホワイトノイズに似せることができる。ノイズは一般的に感度（一般的に「明瞭性」と考えられる）を減少させるが、そのノイズが音脈１３２の本質的でない特徴を隠し、会話の核心を理解させる（所望の集束を強いる）ことになり得る。

その所定のノイズ特性はスペクトル分布（ホワイトノイズ又はピンクノイズなど）及び／又はそのスペクトル分布の各成分の振幅を含み得る。その所定のノイズ特性は個体の聴覚（聴覚学／聴力検査）、脳の反応に従って、又は理論的個人化を介してその個体に合わせて調節され得る。詳細除去フィルタ１２０の所定のフィルタパラメーターと同様に、所定のノイズ特性も経時的にモニター及び／又は調節され得る。

音声認識機１２４は音脈１３２を受信し、且つ、音脈１３２に音声認識処理を適用して音脈１３２の文字列表示を形成するように構成され得る。音声合成機１２６は認識された（音声認識機１２４由来の）会話を受信し、且つ、その認識された会話を音声合成処理によって単一の会話構成音声に変換するように構成され得る。音声認識機１２４及び音声合成機１２６のそれぞれによる音声認識処理と音声合成処理はリアルタイムで行われ得る。音声合成機１２６により作製されたその会話構成音声は個体に合わせて調節された（すなわち、校正された）所定の音声特性を有し得る。したがって、数人の異なる話者に由来する聴覚入力信号が（音声認識によって）同一の知覚的客体と認識され、（それらの話者の音響的な特性と無関係に同一の所定の音声特性を有する）単一の会話構成音声に変換され得る。音声合成機１２６に由来するその会話構成音声は改変音声信号１３４を形成し得る。

音声認識機１２４はあらゆる適切な（例えば、自動口述システムによって用いられる）音声認識技術を使用して複数の声（すなわち、異なる個体に由来する声）を認識し、それぞれの声の核心を文字列に抽象化することができる。例となる音声認識技術には、隠れマルコフモデル（ＨＭＭ）及びニューラルネットワークをはじめとする音響モデリング技術及び／又は言語モデリング技術が含まれるが、これらに限定されない。音声合成機１２６は（音声認識機１２４に由来する）文字列を読み取り、ヒトの会話を（しかし、所定の音声特性に従って常に同じピッチ、音調などで）再現し得る。したがって、音声合成機１２６は特定の言葉に付随する音響的詳細にばらつきを導入しない。したがって、マイクロフォン１０２によって捕捉された、又は遠隔装置から受信された変わりやすい単語音に応答してラウドスピーカー１１０によって再現可能な単語音が発せられ得る。

詳細除去フィルタ１２０のフィルタパラメーターと同様に、音声合成機１２６の所定の音声特性は個々の使用者に合わせて校正され得る。治療介入の定量的指標が校正時に決定され得る。前記フィルタパラメーターと同様に、所定の音声特性と定量的指標も経時的にモニター／調節してよい（例えば、順調な進捗を示しているときにその指標を減少させてよい）。

幾つかの例では、詳細除去フィルタ１２０とノイズ発生機１２２のそれぞれによる詳細除去フィルタリングとノイズ発声の両方が音脈１３２に適用され得る。幾つかの例では、（音声合成機１２６に由来する）会話合成信号が追加の音響的詳細除去のために詳細除去フィルタ１２０及び／又はノイズ発生機１２２に印加され得る。音響的詳細操作ユニット１０６の構成要素の選択はその使用者の言語処理能力に合わせて調節され得る。

増幅器１０８は音響的詳細操作ユニット１０６から改変音声信号１３４を受信し、且つ、増幅して増幅信号１３６を形成するように構成され得る。増幅器１０８は、記憶装置１１４に保存されている所定のゲイン、及び／又はユーザーインターフェース１１６を介して受け付けた使用者設定（音量調節など）に基づいて改変音声信号１３４を増幅するためのあらゆるハードウェア構成要素及び／又はソフトウェア構成要素を含み得る。両耳用装置について、例えば聴力（すなわち、聴覚）検査に基づいてそれぞれの耳について所定のゲインで各増幅器１０８を校正してよい。したがって、使用者が片方の耳で聴力喪失を有する場合、又は各耳で異なる聴力を有する場合、各増幅器１０８の所定のゲインは異なっていてよい。幾つかの例では、増幅器１０８は異なる周波数における聴力喪失を補うために（ある周波数帯の）異なる周波数における異なるゲインを適用してもよい。（両耳用装置の）増幅器１０８によって適用される周波数依存的ゲインはその使用者のそれぞれの耳の聴力に応じて同一でも異なっていてもよい。幾つかの例では、増幅器１０８（又は音響的詳細操作ユニット１０６）はデジタル信号１３４をアナログ信号１３６に変換するためのデジタル・アナログ変換器（ＤＡＣ）を含み得る。

ラウドスピーカー１１０は音響的詳細操作ユニット１０６由来の改変信号１３４及び／又は増幅器１０８由来の増幅信号１３６を受信することが可能である。ラウドスピーカー１１０は、使用者の耳に出力音響信号１３８が提供されるように改変信号１３４（又は増幅信号１３６）を出力音響信号１３８に変換することが可能であるあらゆる適切な変換器を含み得る。

音脈１３２の（マイクロフォン１０２を介した、又は直接的に音声入力インターフェース１０４を介した）捕捉を制御するために、音脈１３２の聴覚的操作を制御するために、及び／又は改変された音脈１３４の（増幅器１０８とラウドスピーカー１１０を介した）出力を制御するためにコントローラー１１２がマイクロフォン１０２、音声入力インターフェース１０４、音響的詳細操作ユニット１０６、増幅器１０８、ラウドスピーカー１１０、記憶装置１１４、ユーザーインターフェース１１６及び電力供給部１１８のうちの１つ以上に接続され得る。コントローラー１１２は例えば従来のデジタル信号プロセッサ、論理回路又はマイクロプロセッサを含み得る。音響的詳細操作ユニット１０６の１つ以上の機能がコントローラー１１２によって実行され得ることが理解される。音響的詳細操作ユニット１０６、音声入力インターフェース１０４、及び増幅器１０８の機能のうちの１つ以上がソフトウェアに実装されてよく、コントローラー１１２によって実行されてよいことが本明細書内の説明から当業者によって理解される。

記憶装置１１４は音声入力インターフェース１０４、詳細除去フィルタ１２０、ノイズ発生機１２２、音声認識機１２４及び音声合成機１２６のうちの少なくとも１つのパラメーター（すなわち、使用者の所定の音響的詳細特性）を保存するように構成され得る。記憶装置１１４は音声入力インターフェース１０４と増幅器１０８のうちの少なくとも一方のパラメーターを保存してもよい。記憶装置１１４は装置１００の校正のために１つ以上の所定の音刺激を保存してもよい（使用者の所定の音響的詳細特性を含む）。記憶装置１１４は装置１００のあらゆる使用者設定（音量調節など）を保存してもよい。記憶装置１１４はメモリー、磁気ディスク、データベース、又は基本的にデータ保存可能なあらゆる持続性で有形のローカル装置又はリモート装置であり得る。

ユーザーインターフェース１１６は音脈１３２の捕捉、改変音声信号１３４の出力、記憶装置の指示、装置１００の校正、及び／又は量の表示のためのあらゆる適切なインターフェースを含み得る。ユーザーインターフェース１１６は音声入力インターフェース１０４、音響的詳細操作ユニット１０６及び増幅器１０８のうちの１つ以上に関連するパラメーターを提供することが可能であるあらゆる適切なユーザーインターフェースを含み得る。ユーザーインターフェース１１６は情報を入力するためのキーパッド又はタッチパッドなどの入力装置をさらに含み得る。ユーザーインターフェース１１６は使用者に情報を提示するための表示装置をさらに含み得る。

本明細書中の説明から当業者はマイクロフォン１０２、音声入力インターフェース１０４、音響的詳細操作ユニット１０６、増幅器１０８、ラウドスピーカー１１０、コントローラー１１２、記憶装置１１４、ユーザーインターフェース１１６及び電力供給部１１８の適切な実施形態を理解し得る。

図２を次に参照すると、聴覚的操作装置の校正のための例となる方法のフローチャートが示されている。その例となる方法は、装置１００の使用者と関連する装置２００のパラメーターを使用者の言語処理能力に基づいて校正するために用いられ得る。ステップ２００において、装置１００のパラメーターの校正のために使用者が装置１００に接続される（図１）。ステップ２０２において、校正中に脳の反応（脳磁気データなど）を取得するために使用者がＭＥＧ獲得装置などの脳波マッピング獲得装置に接続される。

ステップ２０４において、使用者の言語処理能力を決定するために１つ以上の音刺激を選択する。

ステップ２０６において、装置１００のラウドスピーカー１１０（図１）を介してそれらの音刺激を使用者に与える。ステップ２０８において、与えられた音刺激（ステップ２０６）と同時に（脳波マッピング獲得装置を介して）脳反応データを取得する。ステップ２１０において、脳反応データを分析して使用者の言語処理能力を決定する。

ステップ２１２において、減少させるべき音響的詳細特性を決定し、装置１００のパラメーターを（前記の決定された特性に基づいて、（ステップ２１０において決定された）使用者の処理能力に基づいて）選択する。それらのパラメーターは音刺激の所定の音響的詳細特性を減少させるために詳細除去フィルタ１２０、ノイズ発生機１２２、音声認識機１２４及び／又は音声合成機１２６について選択される。それらの選択されたパラメーターはフィルタリング、ノイズの付加、及び／又は所定の音声特性を有する単一の会話構成音声の使用による入力音声の聴覚的操作のために使用され得る。

ステップ２１４において、使用者の言語処理能力を向上させるため、それらの選択されたパラメーター（ステップ２１２）を（ステップ２０４において選択された）音刺激に適用してその音刺激を操作する。ステップ２１６において、その操作された音刺激（ステップ２１４）についてステップ２０６〜２１４を繰り返し、使用者の言語処理能力の所定の改善が測定されるまで装置１００のパラメーターを調節する。例えば、語彙アクセス中のユニークネスポイントと認識ポイント。早い時期に生じるユニークネスポイント及び／又は認識ポイント（図４Ｂを参照のこと）は、その操作によって個体の言語処理が改善されることを表し得る。ステップ２１８において、ステップ２１６において決定されたパラメーターを用いて装置１００をプログラムする。

選択的ステップ２２０において、使用者に聴力検査を実施してよい。選択的ステップ２２２において、ステップ２２０の聴力検査の結果に基づいて装置１００をさらにプログラムしてよい。例えば、増幅器１０８の１つ以上のゲインパラメーターを聴力検査の結果に基づいて選択してよい。別の例では、装置１００の校正は理論的個人化に基づいてもよい。

図３Ａ及び３Ｂは音響的詳細操作ユニット１０６（図１）を介した言語処理の向上のための聴覚的操作の例となる方法を示す。特に、図３Ａは詳細減少フィルタリング及び／又はノイズ付加による音脈１３２の例となる聴覚的操作（図１）のフローチャートダイアグラムであり、図３Ｂは音声認識と会話合成による音脈１３２の例となる聴覚的操作のフローチャートダイアグラムである。

図３Ａを参照すると、ステップ３００において音脈１３２が音響的詳細操作ユニット１０６によって受信される。ステップ３０２において、聴覚減少方法が例えばコントローラー１１２を介して選択される。例えば、コントローラー１１２によってフィルタ１２０による詳細除去フィルタリング及び／又はノイズ発生機１２２によるノイズ付加フィルタリングを選択することができる。ステップ３０４において、例えば、記憶装置１１４に保存されているフィルタ／ノイズパラメーターを使用してコントローラー１１２を介して詳細除去フィルタ１２０及び／又はノイズ発生機１２２についてパラメーターを選択する。

ステップ３０６において、詳細除去フィルタ１２０とノイズ発生機１２２のそれぞれによって詳細除去フィルタリング及び／又はノイズ付加を音脈１３２に適用する。ステップ３０８において、（フィルタリング及び／又はノイズ付加後の）改変信号１３４を音響的詳細操作ユニット１０６から出力する。図３Ａに示されていないが、改変信号１３４はアナログ信号に変換されてもよく、及び／又はラウドスピーカー１１０によって音響信号１３８を出力するために変換される前に増幅器１０８によって増幅されてよい。

図３Ｂを参照すると、ステップ３１０において音脈１３２が音響的詳細操作ユニット１０６によって受信される。ステップ３１２において、音声認識機１２４を介して音脈１３２に音声認識を適用する。ステップ３１４において、音声合成機１２６を介してその認識結果（ステップ３１２）に会話合成を適用する。音声合成機１２６は所定の音声特性を有する会話構成音声を選択し得る。例えば、記憶装置１１４に保存されている所定の音声特性を使用してコントローラー１１２によって所定の音声特性を選択してよい。

選択的ステップ３１６において、詳細除去フィルタリング及び／又はノイズの付加を（ステップ３１４において合成された）会話構成音声に適用するためにステップ３０２〜３０６が適用され得る。ステップ３１８において、（ステップ３１４における会話合成後、又は選択的ステップ３１６におけるフィルタリング／ノイズ付加後の）改変信号１３４を音響的詳細操作ユニット１０６から出力する。図３Ａと同様に、改変信号１３４はアナログ信号に変換されてもよく、及び／又はラウドスピーカー１１０によって音響信号を出力するために変換される前に増幅器１０８によって増幅されてよい。

無関係の音響的詳細を排除するために本発明に従う聴覚的操作を用いてよく、それによって抽象性がより強い（例えば、言葉などの）表象がリアルタイムでより迅速にアクセスされ得るようになる。そうして例となる装置１００は音響的に提示された言葉から無関係の詳細を減少させる（又は実質的に排除する）ことができる。これによってＡＳＤの脳が上昇した速度と精度で言葉を特定することを支援することができ、そのＡＳＤの個体のより堅固な語彙表象を導き、言語とコミュニケーションに対して全体的に正の効果を有する。そのようなアプローチは、本明細書に記載されるような類似の電気生理学的評価及び行動的評価（例えば、ＭＥＧクラスタリング、ミスマッチフィールド及び聴覚処理待ち時間、並びに反復プライミングの行動アッセイ）によって評価され得る。刺激の音響操作によって類型化と抽象化を改善することにより、言葉の認識をＡＳＤの脳にとってより簡単にすることで使用者の語彙システムを改善することができる。これら処理利益は語彙アクセスを超えて言語のより抽象的な部分（形態的に複雑な言葉の脱構築、統語論的処理及び意味論など）にまで及び得る。

本発明はＡＳＤを有する個体における言語処理を向上させるための装置と方法に関して説明されてきたが、１つ以上のステップ及び／又は要素をマイクロプロセッサ／汎用コンピューター（示されず）と使用するためのソフトウェアに実装してよいことが考えられている。この実施形態では上に記載された様々な要素及び／又はステップの機能のうちの１つ以上がコンピューターを制御するソフトウェアに実装され得る。そのソフトウェアはコンピューターによる実行のために持続性有形コンピューター可読媒体（非限定的な例として、磁気ディスク、光ディスク、フラッシュメモリー、ハードドライブなど）内で具現化され得る。

本発明は特定の実施形態を参照して本明細書において例示され、説明されているが、本発明がそれらの示された詳細に限定されることは意図されていない。むしろ特許請求の範囲とそれらの等価の範囲内で、且つ、本発明から逸脱することなく様々な変更をそれらの詳細に行うことができる。

Claims

自閉症スペクトラム障害（ＡＳＤ）個体における言語処理を向上させるための音脈の聴覚的操作の方法であって、
客体を知覚的に表象する音響的刺激を含む前記音脈を処理機によって受信すること、
前記ＡＳＤ個体と関連し、且つ、前記ＡＳＤ個体の測定された言語処理能力に基づく所定の音響的詳細特性について音響操作パラメーターを選択すること、
前記刺激の語彙性を保持しつつ前記所定の音響的詳細特性を減少させることにより前記刺激がそれぞれ前記客体を知覚的に表象する２つ以上の音響的に異なる刺激を含むときであっても前記の減少した音響的詳細特性によって前記ＡＳＤ個体による前記客体の知覚が向上するように前記の選択された音響操作パラメーターに基づいて前記音脈を前記処理機によって改変すること、及び
少なくとも１つのラウドスピーカーによって前記ＡＳＤ個体に前記の改変された音脈を出力すること
を含む前記方法。
前記ＡＳＤ個体の近位にあるマイクロフォンによって前記音脈を捕捉することをさらに含む請求項１に記載の方法。
前記処理機に接続される遠隔装置であって、電話、コンピューター、テレビ、及び音声再生能を有する再生装置のうちの少なくとも１つを含む前記遠隔装置から前記音脈を受信することをさらに含む請求項１に記載の方法。
前記音脈を改変するステップが前記所定の音響的詳細特性を減少させるために前記の選択された音響操作パラメーターに基づく所定のフィルタ特性を有するフィルタを前記音脈に適用することを含む、請求項１に記載の方法。
前記所定のフィルタ特性がローパスフィルタ、バンドパスフィルタ及びハイパスフィルタのうちの少なくとも１つを含む、請求項４に記載の方法。
前記音脈を改変するステップが前記所定の音響的詳細特性を減少させるために前記の選択された音響操作パラメーターに基づく所定の抽出速度で前記音脈を二段抽出することを含む、請求項１に記載の方法。
前記音脈を改変するステップが前記所定の音響的詳細特性を減少させるために前記の選択された音響操作パラメーターに基づく所定のノイズ特性を有するノイズを前記音脈に付加することを含む、請求項１に記載の方法。
前記音脈を改変するステップが
前記音脈に対して音声認識を行って前記音脈の文字列表示を形成すること、及び
前記の選択された音響操作パラメーターに基づく所定の音声特性を有する会話構成音声に前記音脈の前記文字列表示を音声合成処理によって変換すること
を含む、請求項１に記載の方法。
前記音脈を受信する前に
前記少なくとも１つのラウドスピーカーを介して前記ＡＳＤ個体に少なくとも１つの所定の刺激を与えること、
前記の与えられた少なくとも１つの所定の刺激と同期する前記ＡＳＤ個体からの１つ以上の脳の反応を取得すること、
前記の取得された１つ以上の脳の反応に基づいて前記ＡＳＤ個体の言語処理能力を決定すること、及び
前記の決定された言語処理能力に基づいて減少させるべき前記所定の音響的詳細特性を決定すること
を含む請求項１に記載の方法。
前記１つ以上の脳の反応が脳磁気図記録（ＭＥＧ）獲得装置から取得される、請求項９に記載の方法。
前記所定の音響的詳細特性が前記刺激のピッチ、ハーモニクス、音調、過渡音、歯擦音又は周波数ダイナミクスのうちの少なくとも１つを含む、請求項１に記載の方法。
自閉症スペクトラム障害（ＡＳＤ）個体における言語処理を向上させるための音脈の聴覚的操作用の装置であって、
客体を知覚的に表象する音響的刺激を含む前記音脈を受信するように構成されている音声入力インターフェース、
前記ＡＳＤ個体と関連し、且つ、前記ＡＳＤ個体の測定された言語処理能力に基づく所定の音響的詳細特性についての音響操作パラメーターを保存するように構成されている持続性有形記憶装置、
音響的詳細操作ユニットであって、
前記所定の音響的詳細特性についての前記保存された音響操作パラメーターの中から一つの音響操作パラメーターを選択し、且つ、
前記刺激の語彙性を保持しつつ前記所定の音響的詳細特性を減少させることにより前記刺激がそれぞれ前記客体を知覚的に表象する２つ以上の音響的に異なる刺激を含むときであっても前記の減少した音響的詳細特性によって前記ＡＳＤ個体による前記客体の知覚が向上するように前記の選択された音響操作パラメーターに基づいて前記音脈を改変する
ように構成されている前記音響的詳細操作ユニット、及び
前記ＡＳＤ個体に前記の改変された音脈を出力するように構成されている少なくとも１つのラウドスピーカー
を備える前記装置。
前記音響的詳細操作ユニットが、前記の選択された音響操作パラメーターに基づく所定のフィルタ特性によって前記音脈をフィルタリングするように構成されているフィルタを備える、請求項１２に記載の装置。
前記音響的詳細操作ユニットが、前記の選択された音響操作パラメーターに基づく所定の抽出速度で前記音脈を二段抽出するように構成されているフィルタを備える、請求項１２に記載の装置。
前記音響的詳細操作ユニットが、前記の選択された音響操作パラメーターに基づく所定のノイズ特性を有するノイズを前記音脈に付加するように構成されているノイズ発生機を備える、請求項１２に記載の装置。
前記音響的詳細操作ユニットが
前記音脈を文字列表示に変換するように構成されている音声認識機、及び
前記の選択された音響操作パラメーターに基づく所定の音声特性を有する会話構成音声に前記文字列表示を変換するように構成されている音声合成機
を備える、請求項１２に記載の装置。
前記所定の音響的詳細特性が前記刺激のピッチ、ハーモニクス、音調、過渡音、歯擦音又は周波数ダイナミクスのうちの少なくとも１つを含む、請求項１２に記載の装置。
前記音声入力インターフェースに接続されるマイクロフォンであって、前記音脈を捕捉するように構成されている前記マイクロフォンをさらに備える請求項１２に記載の装置。
前記音声入力インターフェースが電話、コンピューター、テレビ、及び音声再生能を有する再生装置のうちの少なくとも１つを含む遠隔装置から前記音脈を受信するように構成されている、請求項１２に記載の装置。
前記少なくとも１つのラウドスピーカーを介して前記ＡＳＤ個体に与えられる少なくとも１つの所定の刺激、及び前記の与えられた少なくとも１つの所定の刺激と同期して取得された前記ＡＳＤ個体の１つ以上の測定された脳の反応に基づいて校正されるように構成されている請求項１２に記載の装置。