JPH02232783A - 脳波トポグラフィによる音節認識装置 - Google Patents

脳波トポグラフィによる音節認識装置

Info

Publication number
JPH02232783A
JPH02232783A JP1052872A JP5287289A JPH02232783A JP H02232783 A JPH02232783 A JP H02232783A JP 1052872 A JP1052872 A JP 1052872A JP 5287289 A JP5287289 A JP 5287289A JP H02232783 A JPH02232783 A JP H02232783A
Authority
JP
Japan
Prior art keywords
syllable
topography
pattern
electroencephalogram
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP1052872A
Other languages
English (en)
Other versions
JP2515875B2 (ja
Inventor
Akira Hiraiwa
明 平岩
Katsunori Shimohara
勝憲 下原
Tadashi Uchiyama
匡 内山
Yukio Tokunaga
徳永 幸生
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP1052872A priority Critical patent/JP2515875B2/ja
Publication of JPH02232783A publication Critical patent/JPH02232783A/ja
Application granted granted Critical
Publication of JP2515875B2 publication Critical patent/JP2515875B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) この発明は、発生した音節もしくは発生しようとイメー
ジした音節を、発生直前もしくは発生しようとイメージ
した時の脳波トポグラフィパターンから神経回路網によ
って認識して呈示する脳波トポグラフィによる音節認識
装置に関するものである。
〔従来の技術〕
脳波トポグラフィは、第9図に示すように、国際t8i
配置法(10−20法)で単極導出した12〜16(図
では12)チャンネルの脳波から、補間関数を用いて電
極間の電位を推定するものであり、この結果をもとに一
定電位幅での段階付けを行い、カラーやドットパターン
で2次元等電位分布図を作成するものである。
なお、第9図で、■〜@は測定点を示し、●印は前記測
定点■〜@のデータに基いて補間する点であり、Hは頭
部を示す。
人や動物が運動を始めるにあたって、脳の中に運動の準
備状態が作られるであろうことはKornh−berら
(1964)が運動準備電位を記録したころから想定さ
れていた.これは、人が手や足を動かす動作をするとき
、頭皮上に電極を置き、運動開始時点を基準として信号
を加算して得られるものである(塚原仲晃、脳の情報処
理、1864年、piso参照).音声を発するという
動作も随意運動であり、同じく運動準備電位が記録でき
る。
アメリカ、ミズーリ大学メディカルセンターのドナルド
・ヨークと、シカゴ大学のトム・ジエンセンは、198
5年脳波と言語の相関関数を被験者に単語を発声させる
形で調査した結果、単語を発音する直前、同じ発音の単
語に対しては同じ脳波バダーン(この場合は被験者の頭
皮上で電極により記録した発声直前の準備電位のパター
ン)が現れたことを確認し、15の英単語に対しては2
0人の間に波形の一致が確認され脳波辞書が作られた. また、その後のジェンセンの研究では、英語圏の被験者
とイラン南部の地方語圏の被験者に同じ英単語を発声さ
せて同様な実験をしたところ、使用する言語の相違にか
かわらず単語を発声する直前の脳波パターン(準位電位
パターン)はまったく同じであった.したがって、発声
においては発音する音節レベルに対して、脳の中枢プロ
グラムは人種に関わらない共通した処理が行われている
ものと考えられる(金子U−、最近脳科学1988年1
0月2179〜180参照). (発明が解決しようとする課題) しかし、実験的に示された発音する音節に対する時系列
脳波パターンを認識するにあたっては、従来はStep
wisa discrfinant analysis
(SWDA)やPrincipal componen
t analysis(PCA)等の学習機能のない時
間軸波形に対する解析手段に限定されており、空間的な
広がりが意味を持つトポグラフィパターンの判別は困難
であった。また、被験者に発生した運動準備電位の脳波
トポグラフィパターンから被験者が頭でイメージした音
節を認識させるにあたって、神経回路網によクて認識さ
せるという従来の技術は存在しない. 神経回路網は、第10図にユニットを示すように、生物
の神経素子の働きを模した多入力多出力の人工的神経ユ
ニットを多数結合することにより、信号処理,情報処理
の機能を実現する電気回路網の総称である。近年、神経
回路網にあるパターンを分類させてみて間違った場合に
は、結合の重みを修正するということを繰り返すことに
よって最終的に全てのパターンを正しく識別できるよう
にする誤り訂正型の教師あり学習の方法(バックブロバ
ケーション学習法)が公知の技術として各種提案されて
いる(D.E.Rumelhart,J.L.MoCl
g−11and and the PDP Resea
rch Group,Paralleldistrib
uted  processing.Vol.i&2,
MIT  Press.1986、および麻生英紀、ニ
ューラルネットワーク情報処理、産業図書、1988参
照)。
この発明の目的は、脳波トポグラフィによる音節認識に
あたって、神経回路網の学習性と雑音に強い処理機構を
導入し、発声した音声信号そのものの認識がいらない、
あるいは音声の発生を必要としない脳波トポグラフィに
よる音声認識装置を提供することにある。
(課題を解決するための手段) この発明にかかる脳波トポグラフィによる音節認識装置
は、多数の電極とそれら電極からのデータをもとに脳波
を検出する脳波検出手段と、脳波検出手段において検出
された脳波を2次元のトポグラフィパターンに変換する
脳波処理手段と、2次元トポグラフィパターンを入力と
してそのパターンに対応する音節データを出力する認識
手段と、音節データの呈示手段と、学習用音節データを
もとに認識手段に対して教師データを生成する音声デー
タ教示部と、前記各部の制御を行う制御郎とから構成さ
れている。
さらに認識手段を複数のユニットとそれらユニットを結
ぶ重み付きのリンクからなる神経回路網で構成したもの
である. 〔作用〕 この発明においては、人がある音節を発声したとき、そ
の直前もしくはある音節の発声をイメージしたとき、そ
の直前に生じる脳波トポグラフィパターンを神経回路網
に複数回教師あり学習させ、神経回路網の学習後は、脳
波トポグラフィパターンに対して対応する音節を自動的
に認識,呈示する. (実施例〕 第1図はこの発明の一実施例を説明する図、第2図はこ
の発明の処理の流れ図である。
第1図において、1は多数の電極、2は脳波計、3は脳
波トポグラフィパターン作成装置、4は2次元トポグラ
フィパターンを入力としてそのパターンに対応する音節
データを出力する認識手段としての神経回路網、5は教
示データを生成する音節データ教示部、6は音節呈示部
、7は全体を制御する制御部、8は音声検出装置、9は
脳波トポグラフィパターンの神経回路網4への入力前処
理装置である。また、aは前記多数の電極1により検出
された検出信号、bは脳波信号、c1は脳波トポグラフ
ィパターン信号、c2は前処理された脳波トポグラフィ
信号、dは音節データ教師信号、eは音節データ呈示信
号、f,g,h,i,kは制御信号、jは音声トリガ信
号である。
第2図はこの発明における処理の流れ図である。この図
において、Aは音節発声時の準備電位トポグラフィパタ
ーンと対応する音節データの学習モード、B−1は音節
発声時の準備電位のトポグラフィパターン認識による音
節のU識モード、B−2は音節発声イメージ時の準備電
位のトポグラフィパターン認識による音節の認識モード
である。
第3図は脳波トポグラフィパターンの神経回路l!44
への入力の概要を示す図で、(ア)は人力層、(イ)は
隠れ層、(ウ)は出力層、(工)は5×5の数値マトリ
クスデータである。
第4図(a).(b)は音節発声時の時系列準備電位パ
ターンの一例を示し、第5図(a)〜(f)は音節発声
直前の準備電位トポグラフィーパターンの一例を示す図
で、10階調の濃淡で示したもので、濃度の大きい部分
が濃度の薄い部分より準備電位の大きいことを示してい
る.第6図は神経回路網4への入力にあたり前処理され
た脳波トポグラフィパターンの数値マトリクスで、2次
元トポグラフィパターンである。第7図は神経回路網4
の構成w4要であり、第3図と同じく(ア)は入力層、
(イ)は隠れ層、(ウ)は出力層であり、点線はユニッ
ト間の重み付けの更新を示している。
以下、第1図,第2図に基づき神経回路綱4の学習モー
ドAと、ある発声した音節を発声直前の準位電位トポグ
ラフィから神経回路網4によって認識する認識モードB
−1、ある音節を発声しようとイメージしたときの準位
電位トポグラフィから神経回路綱4によフて音節を認識
する認識モードB−2の3つに大別してこの発明の動作
の説明を行う. はじめに神経回路m4の学習千ードAから説明する。ま
ず、適宜の人にある音節を発声させる。
この発声の最中に第1図の多数の電極1によって検出さ
れた検出信号aは、脳波計2によって時系列の脳波信号
bとして検出され、脳波トポグラフィパターン作成装置
3に送られる.ここで、音声検出装置8により発声の瞬
間はトリガされ、l〜リガ信号を基準に発声前後の脳波
を加算して背景脳波を消去する。ここで、発声から信号
の加算までの一連の操作がN回繰り返しされると、N回
加算された多チャンネル時系列準備電位パターンができ
あがる(ここでNは数十回未満である)。いま、音節“
あ”と“げ“を発声したときのこの多チャンネル時系列
準備電位パターンの典型的な一例を第4図(a).(b
)に示す.この時系列パターンは本例では発声前準備電
位のpeak to peakが最大なときのみのピー
ク時トボグラフイパターンc1としてトポグラフィパタ
ーン作成装置3によって、前処理装置9に出力される。
いま、音節“あ“と“げ”を発声したときのピーク時ト
ポグラフィパターンを第5図(a)〜(C)と(d)〜
(f)に示す。前処理装置9に人力されたパターンは、
脳波トポグラフィ数値マトリクスとして神経回路網4に
人力される。この数値マトリクスの一例を第6図に示す
.同時にこのイメージした音節が何であるかは音節デー
タ教示部5から神経回路網4に音節データ教示信号dと
して教示される。学習を継続する場合は以上の動作を同
じ音節あるいは異なる音節に対して複数回繰り返す。学
習を終了する場合は以上で学習モード終了とする。
次に神経回路網4の認識モードB−1について説明する
.認識モードB−1とは、人が実際にある音節を発声し
たときの準備電位,トポグラフィパターン(第6図)か
ら神経回路IA4によって発声音節を認識するモードで
ある。まず、学習モードAと同じ人に対して既に神経回
路網4が学習済みの音節のうちのどれか1つを1回ない
し複数回としてN回連続して発声してもらう。この発声
中に第9図の多数の電極1によって検出されたイM号8
は脳波計2によって時系列脳波信号bとして検出され、
音声検出装置8による発声時のトリガ信号を基準にして
発声前後の信号脳波が加算され、この発声から加算まで
の操作をN回縁り返す。加算が繰り返された時系列準備
電位は、脳波トポグラフィに変換されて、入力前処理装
置9により処理されて、脳波トポグラフィ信号C2とな
ってから神経回路網4へ入力される。神経回路網4は入
力された脳波トポグラフィパターンを数値マトリクスと
して認識して、既に学習した脳波トポグラフィパターン
に基づき対応する音節を出力eとして音節呈示部6へ送
信する.認識モードB−1による方法を.音節”あ“と
“げ″の発声時に適用し、学習済みの神経回路1i4に
対して未学習のそれぞれの音節に対するトボグラフイパ
ターンを認識させた一例を第8図に示す.ここで、横軸
は各音節に対するトポグラフィパターンの種類、縦軸は
神軽回路網4の出力ユニットの各パターンに対する発火
率である。いま、発火率の高低でのみ識別を行うとすれ
ば、10パターン中10パターンに対して認識が可能な
ることが示されている.なお、神経回路w44は3層の
パックブロバゲーションで人力層(ア)が25ユニット
、隠れ層(イ)が10ユニット、出力層(ウ)が2ユニ
ットで各層間は全結合である.概略を第7図に示す。
次に認識モードB−2について述べる.認識モードB−
2とは、人がある音節を発声しようとイメージしたとき
の準備電位トポグラフィパターンから神経回路網4によ
って発声しようとした音節を認識するモードである.脳
波信号の取り込みを開始してから、被験者は神経回路H
4に学習モードAにおいてすでに被験者自身が学習させ
た音節を発声し、それをN回繰り返す。これにより、多
チャンネル時系列準備電位パターンがシーケンシャルに
記憶される.この時系列データに対して、種々の音節に
対してそれぞれ認識モードB−1において加算された多
チャンネル時系列準備電位パターンの代表的な任意のパ
ターンの1つを、テンプレートとして認識モードB−2
において適応相関平均法によって複数回の音節発声イメ
ージに対する準備電位パターンを、基準となるトリガ信
号なしで時間軸を揃えた上で加算して、多チャンネルの
時系列準備電位パターンが形成される。このパターンは
前処理装置9に入力されてu72モードB−1時と以下
同様に処理さわる。
この実施例では、脳波トポグラフィパターンをある音節
発声の準備段階におけるある発声時と発声時から1秒前
の間のpeak to peakを認識した例を示した
.すなわち、ここでは準備電位娠幅がpeak to 
paakで最大になるときのトポグラフィパターンによ
って対応する音節を認識したが、時間軸によ7て離散化
した多数の連続した数値マトリクスを、神経回路網4に
入力して神経回路網4を学習させて、かつ認識も連続し
た数値マトリクスを対象として行うことも同様に可能で
ある。また、第6図に示す数値マトリクスは、第5図に
アナログ的に示す準備電位トポグラフィパターンをディ
ジタル的に表現したもので、2次元トポグラフィパター
ンであることは明白である。
(発明の効果〕 以十説明したようにこの発明は、人が音節を発声もしく
は発声をイメージし・たときの脳波トポグラフィパター
ンを神経回路網によって学習し、学習後に神経回路網に
よって脳波トボグラフイパターンからその人が発声もし
くはイメージしている音節を認識して自動的に呈示する
ので、パターンの特徴の自動抽出、類似パターンの高識
別化、高耐性を実現することができ、ある音節の発声を
イメージしたときの脳波トボグラフイから音節を識別す
るモードにおいては、脳波トボグラフイパターンから従
来不可能であったモの人がイメージしている音節の自!
I]認識を音節を実際には発声しなくても認識を行える
という利点がある.この発明の応用分野としては、従来
のキーボード,タッチベン,マウスにかわる入力の動作
を必要としない入力装置としての利用、音声認識入力に
代わる周囲雑音に影響されない入力装置としての応用等
が考えられ、具体的には雑音環境下で、かつ手等の動作
部位を使えない状況における入力手段、ろう唖者の意志
伝達手段としての福祉分野への応用、体の保持手段がな
い無重量の空間内で動作を必要とする入力デバイスが使
えず、かつ雑音で音声認識が使えないような宇宙ステー
ション内作業時の入力装置、航空機パイロットの操縦装
賀の入力手段としての応用等が考えられる。
【図面の簡単な説明】
第1図はこの発明の脳波トポグラフィパターンによる音
節認識装置のブロック図、第2図はこの発明における処
理の流れ図、第3図は脳波トポグラフィパターンの神経
回路網への入力の概要の説明図、第4図は音節発声時の
時系列準備電位パターンの一例を示す図、第5図は音節
発声直前の準備電位トポグラフィパターンの一例を示す
図、第6図は脳波トポグラフィパターンの数値マトリク
スの一例を示す図、第7図は神経回路網の概要を示す構
成図、第8図は学習済みの神経回路網に未学習の脳波ト
ポグラフィパターンを入力したときの神経回路網出力ユ
ニットの発火Vの一例を示す図、第9図は国際電極配置
法による脳波測定の電極配置図、第10図は神経素子の
概要を示す構成図である。 第3図 第 図 (a) (E)) ゛あ′の発pl}i8 1T′の金声時 第 図 “あ゛の発11時 {ア゛め完一時 第 図 層 第 1丁\の9:犬 手

Claims (2)

    【特許請求の範囲】
  1. (1)多数の電極とそれら電極からのデータをもとに脳
    波を検出する脳波検出手段と、前記脳波検出手段におい
    て検出された脳波を2次元トポグラフィパターンに変換
    する脳波処理手段と、前記2次元トポグラフィパターン
    を入力としてそのパターンに対応する音節データを出力
    する認識手段と、音節データの呈示手段と、学習用音節
    データをもとに前記認識手段に対して教師データを生成
    する音節データ教示部と、前記各部の制御を行う制御部
    とから構成されたことを特徴とする脳波トポグラフィに
    よる音節認識装置。
  2. (2)多数の電極とそれら電極からのデータをもとに脳
    波を検出する脳波検出手段と、前記脳波検出手段におい
    て検出された脳波を2次元のトポグラフィパターンに変
    換する脳波処理手段と、前記2次元トポグラフィパター
    ンを入力としてそのパターンに対応する音節データを出
    力する認識手段と、音節データの呈示手段と、学習用音
    節データをもとに前記認識手段に対して教師データを生
    成する音節データ教示部と、前記各部の制御を行う制御
    部とから構成され、さらに前記認識手段を複数のユニッ
    トとそれらユニットを結ぶ重み付きのリンクからなる神
    経回路網で構成したことを特徴とする脳波トポグラフィ
    による音節認識装置。
JP1052872A 1989-03-07 1989-03-07 脳波トポグラフィによる音節認識装置 Expired - Fee Related JP2515875B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1052872A JP2515875B2 (ja) 1989-03-07 1989-03-07 脳波トポグラフィによる音節認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1052872A JP2515875B2 (ja) 1989-03-07 1989-03-07 脳波トポグラフィによる音節認識装置

Publications (2)

Publication Number Publication Date
JPH02232783A true JPH02232783A (ja) 1990-09-14
JP2515875B2 JP2515875B2 (ja) 1996-07-10

Family

ID=12926971

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1052872A Expired - Fee Related JP2515875B2 (ja) 1989-03-07 1989-03-07 脳波トポグラフィによる音節認識装置

Country Status (1)

Country Link
JP (1) JP2515875B2 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0833616A (ja) * 1994-07-22 1996-02-06 Nec Corp 生体内部状態伝達装置およびその方法
US5785653A (en) * 1994-07-22 1998-07-28 Nec Corporation System and method for predicting internal condition of live body
EP1695339A2 (en) * 2003-12-08 2006-08-30 Neural Signals, Inc. System and method for speech generation from brain activity
JP2012146116A (ja) * 2011-01-12 2012-08-02 Kyushu Institute Of Technology スピーチ内容を識別する装置及び方法
JP2012183292A (ja) * 2011-03-03 2012-09-27 Seoul National Univ R&Db Foundation 準備電位基盤の脳とコンピューター間のインターフェース装置および方法
JP2020191021A (ja) * 2019-05-23 2020-11-26 恒雄 新田 音声想起認識装置、装着具、音声想起認識方法及びプログラム

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006285224A (ja) * 2005-03-09 2006-10-19 Advanced Telecommunication Research Institute International 発声機能支援装置

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0833616A (ja) * 1994-07-22 1996-02-06 Nec Corp 生体内部状態伝達装置およびその方法
US5785653A (en) * 1994-07-22 1998-07-28 Nec Corporation System and method for predicting internal condition of live body
EP1695339A2 (en) * 2003-12-08 2006-08-30 Neural Signals, Inc. System and method for speech generation from brain activity
EP1695339A4 (en) * 2003-12-08 2007-07-18 Neural Signals Inc SYSTEM AND METHOD FOR GENERATING SPEECH FROM BRAIN ACTIVITY
JP2012146116A (ja) * 2011-01-12 2012-08-02 Kyushu Institute Of Technology スピーチ内容を識別する装置及び方法
JP2012183292A (ja) * 2011-03-03 2012-09-27 Seoul National Univ R&Db Foundation 準備電位基盤の脳とコンピューター間のインターフェース装置および方法
JP2020191021A (ja) * 2019-05-23 2020-11-26 恒雄 新田 音声想起認識装置、装着具、音声想起認識方法及びプログラム
WO2020235680A1 (ja) * 2019-05-23 2020-11-26 Nitta Tsuneo 音声想起認識装置、装着具、音声想起認識方法及びプログラム
CN113873944A (zh) * 2019-05-23 2021-12-31 新田恒雄 语音联想识别装置、佩戴用具、语音联想识别方法及程序

Also Published As

Publication number Publication date
JP2515875B2 (ja) 1996-07-10

Similar Documents

Publication Publication Date Title
Elman et al. Learning the hidden structure of speech
US20070055523A1 (en) Pronunciation training system
CN112766173B (zh) 一种基于ai深度学习的多模态情感分析方法及其系统
Kello et al. A neural network model of the articulatory-acoustic forward mapping trained on recordings of articulatory parameters
Lopez-Larraz et al. Syllable-based speech recognition using EMG
Fels Glove-talkII: mapping hand gestures to speech using neural networks-an approach to building adaptive interfaces.
CN117389441B (zh) 基于视觉追随辅助的书写想象汉字轨迹确定方法及系统
Wu et al. Neural network vowel-recognition jointly using voice features and mouth shape image
Sharan et al. Voice command recognition using biologically inspired time-frequency representation and convolutional neural networks
JPH02232783A (ja) 脳波トポグラフィによる音節認識装置
Westerman et al. Modelling the development of mirror neurons for auditory-motor integration
Ye et al. Attention bidirectional LSTM networks based mime speech recognition using sEMG data
Wand Advancing electromyographic continuous speech recognition: Signal preprocessing and modeling
US20230162719A1 (en) System And Method For Measuring Human Intention
Zhou et al. Improved phoneme-based myoelectric speech recognition
Patel et al. Teachable interfaces for individuals with dysarthric speech and severe physical disabilities
Zhang et al. Feature selection of mime speech recognition using surface electromyography data
Krishna et al. Continuous Silent Speech Recognition using EEG
Hornstein et al. A unified approach to speech production and recognition based on articulatory motor representations
Sharma et al. Human-Computer Interaction with Special Emphasis on Converting Brain Signals to Speech
Losik et al. Anthropological Information About a Message Variability
JPH07118015B2 (ja) 頭皮電位分布パターン認識型音節入力装置
Arjunan et al. Recognition of human voice utterances from facial surface EMG without using audio signals
Breidegard et al. Speech development by imitation
Takara et al. Speech analysis-synthesis system using genetic algorithm and Fujisaki model and its application to coarticulation

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees