JP2006120136A - 言語処理装置、言語処理方法、言語処理プログラムおよびそれを記録したコンピュータ読み取り可能な記録媒体 - Google Patents

言語処理装置、言語処理方法、言語処理プログラムおよびそれを記録したコンピュータ読み取り可能な記録媒体 Download PDF

Info

Publication number
JP2006120136A
JP2006120136A JP2005280906A JP2005280906A JP2006120136A JP 2006120136 A JP2006120136 A JP 2006120136A JP 2005280906 A JP2005280906 A JP 2005280906A JP 2005280906 A JP2005280906 A JP 2005280906A JP 2006120136 A JP2006120136 A JP 2006120136A
Authority
JP
Japan
Prior art keywords
vocabulary
hormone
information
presented
language
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005280906A
Other languages
English (en)
Inventor
Hiromi Kawaguchi
博巳 川口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyoto University
Original Assignee
Kyoto University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyoto University filed Critical Kyoto University
Priority to JP2005280906A priority Critical patent/JP2006120136A/ja
Publication of JP2006120136A publication Critical patent/JP2006120136A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】 人間の言語機能をシミュレートして語彙を選択する。
【解決手段】 言語処理装置100は、語彙と該語彙にあらかじめ付与されたホルモン名とを対応付けて登録した語彙テーブルを語彙テーブル格納部162から取得するシミュレーション用データ取得部161と、予測対象者が他者と行うコミュニケーションから、予測対象者が提示した語彙と他者が提示した語彙とをそれぞれ切り出す語彙切出部150と、予測対象者が提示した語彙に付与されたホルモン名の出現回数と他者が提示した語彙に付与されたホルモン名の出現回数とを語彙テーブルを参照してホルモン名ごとに算出し、ホルモン名ごとの出現回数の差に基づいて、出現回数をさらに増加させるべきホルモン名を決定し、該決定したホルモン名が付与された語彙を語彙テーブルより抽出するホルモン法実行部163とを備える。
【選択図】 図32

Description

本発明は、人間の言語機能をシミュレートする言語処理装置、言語処理方法、言語処理プログラムおよびそれを記録したコンピュータ読み取り可能な記録媒体に関するものである。
画像処理分野では観測事象をフーリエドメインで評価・解析する。神経生理学的には特定のパターンや縞模様に強く反応する脳の部位が知られている。コンピュータの仮想空間では視野に映った画像を表現するためにオブジェクトが用いられている。音響分野では声紋分析の例に見られる諸技術や一次元・三次元変換手法が実用化されている。抽象概念を取り扱う分野ではニューラルネット、ファジィなどが実用化されている。音声から言語への変換や画像から文字への変換、言語間の変換技術は自動翻訳や郵便番号認識など既に実用段階にある。「感情」を模擬する分野は特にロボット(ヒューマノイド)、ゲーム、おもちゃで発達しつつある。
また、薬学・臨床医学の成果として、脳内ホルモンとその作用が明らかとなっている。50種類ほどあり20種類ほどが作用を理解されている。代表例としてドーパミン、セロトニン、ノルアドレナリン、γアミノ酪酸(GABA)、オピオイドなどが良く知られている。
大脳基底核に局在し運動機能に働く脳内ホルモン、ドーパミンはA9黒質緻密部やA10腹側被蓋野にあるドーパミンニューロン中にあり褒賞系を司ることが知られている。活動の動機付けや学習強化因子である。このカテコールアミン類には交感神経節ノルエピネフリン、副腎皮質エピネフリンなどがある。ドーパミンは短期記憶領域の海馬に働きPapez回路で感情の変化を起こし大脳の長期記憶に働きかける。ドーパミンの過剰を抑える役割としてγアミノ酪酸(GABA)が働く、しかし前頭葉にはGABAは働かずドーパミンは吸収され続ける。人が知的好奇心に強く動かされる所以である。
A1〜A7は神経、末梢神経、交感神経系で、A6は大脳、小脳、脊髄にいたる。ノルアドレナリンは怒りのホルモンである。生きるための意欲の源となる。脳幹の青班核で作られアドレナリン動作性神経系にて大脳辺縁系、視床下部、小脳に至る。アドレナリン動作性神経系はA10ともリンクしている。ノルアドレナリンは怒りであるが、アドレナリンは恐怖のホルモンである。驚愕刺激によってノルアドレナリンが出てストレスとなる。この結果、闘争するか逃避するかの行動がなされストレスは解消される。
長期間回避できないストレスに曝されるとノルアドレナリンは供給され続けるが、そのうちノルアドレナリンの産生より消費の方が多くなり濃度が低下していく。このような状況ではノルアドレナリンの受容体の感度が上昇していく。この結果些細な刺激でも攻撃や逃避行動をとるようになる。
さらに長期間ストレスに曝されると脳内麻薬オピオイドが分泌される。オピオイドは無痛覚状態を作り出す。これは完全降伏状態で、もはやストレス原因を避けなくなる。静かに捕食者に食べられる状態を作り出す。マラソン時のランナーズハイとして知られている。「最後の残酷な救い」と言われている。交換神経系のGABA神経系から分泌される。エンケファリン、βエンドルフィンなどが知られている。
無痛覚状態をリセットするにはナロキソン、クロニジンが働くが、オピオイドの禁断症状が現れる。
セロトニンは脳幹に産生され抑止的に働き、落ち着き、安定感を現出させる。過剰な興奮や衝動を押さえる。抑うつ状態を改善する。セロトニンの分泌量が少ないと殺人、自殺などに走り、多いとテンカンになりやすい。
工学的に見ると自立神経系のうち、交換神経はアクセルで、副交換神経はブレーキである。
何らかのストレスを跳ね除けると「幸福感」に浸れる。従ってストレスが無ければ幸福にはなれない。
上記のような技術分野を含め、言語学、心理学、IT技術、電子技術、教育学等広い分野の諸技術が本発明の背景技術となる。
正高信男著、「0歳児がことばを獲得するとき」、中公新書、2000年8月30日 Speech Application Language Tags(SALT) 1.0 Specification July 2002
従来技術を用いた場合次のような課題が残存する。音声会話や文字を用いるコミュニケーションを考える。
(例1) 面接者が「はい」と答えた場合を考察する。面接者が「肯定した」、「質問した」、「ただ返事をした」、「意図的には否定しているがお世辞として同意した」、「何も考えず呼び声のようにただ返事した」など多義にわたる。この「はい」は多用される簡単なフレーズではあるが感情を付与したデータベースを用いて感情を決定すると正解率は低下する。これはデータベースに「心」が無いために生ずる。心があれば「はい」の感情を的確に表現できる。
(例2) 駅のホームの音声案内は近年大部分が機械化されている。この装置は自然言語のフレーズを独立に記録しデータベースとし、このデータベースを適時組み合わせて編集された会話とし発音される。平常時の案内文言を発音する方法で事故などの列車遅延情報を発音させれば、聞く人々には違和感をもった声として響く。これはその場の状況を反映した人間の声になっていないためである。心があれば状況を反映した感情を的確に表現しうる人間の声になる。
(例3) ワードプロセッサーには漢字変換機能が付いている。近年のそれはニューラルネットなどのソフトウェアにガイドされ変換的中率は向上している。しかし、ニューラルネットによるガイドは前件の出現頻度や前文にて用いられるフレーズや語彙を用いた推論である。このため長文の背後に流れる書き手の気持ちを反映してはいない。この長文を人間が記述もしくは朗読すると、感情と心の流れが陽に現れる。この瞬間ごとの解釈を漢字変換に重畳すると変換的中率はさらに向上する。
(例4) 患者に安堵感などを与えるために介護用の人形などが市販されている。適当な音声の応答をプログラム化した装置も見かけられる。老人などのハンディーキャップを持った人々には好評である。しかしこの技術を長い時間幅で観察すると、繰り返しが見うけられる。長期間ベッドサイドに置いておくと、この反復のために飽きられる。さらに時間が経つと忌避感に見まわれる。実在の人間であれば反復することはあっても、機械的な反復にはならず飽きることが少ない。この人形に心を導入すると、音声反復は自然なリズムを持つようになり、人の表現に近づけられる。さらに言葉遊びに的を絞った「漫才ロボット」などへの展開がある。
(例5) 心の病を持った人を外見で判断するのは困難を極める。心身症、多重人格、痴呆の初期症状、薬物依存症患者、自殺殺人願望など多くの者は、一般人と同じ生活空間で日常生活を送っている。これらの人々は多くの場合自覚症状を持たない。そのため、症状がかなり顕在化した後に、高度な技術を持つ専門医の長期間のカウンセリングを受ける結果となる。しかし当の専門医は同時に人間であり、カウンセリングの結果「反作用」として患者から精神のひずみを受けてしまう。このためカウンセラーとなった専門医は反作用から自らの精神を回復させるために、別の専門医のカウンセリングを定期的に受ける必要がある。患者一人に対して複数の専門医が長期間ケア−にかかる実態から、多大な経済的負担を社会全体で受け持つ構造になっている。これらの医療行為ための一部分でも機械化できれば、専門医の能力はより深い分野に特化して用いることができる。患者と継続的に会話を交わし、心の動きを数量化し記録できる装置が実現できれば、医療行為ための一助になる。
(例6) 前例に近いが、現在用いられているいわゆる「うそ発見器」は、手のひらの発汗を電機抵抗で測定するだけの簡単な装置である。従って、この原理を熟知する人にはあまり有効的な装置ではない。しかし長期間さりげない会話を機械と交わすことにより、披検者の心の状態を数値化し記録できれば、うそ発見器に比べ、より精度の高い装置として利用できる。
現在、未だ「心」は全容が理解されるに至らないため、不足部分を推測したうえで統合的に「心」を表現することができていない。したがって、不足部分を研究し最適化する過程で未解決領域の問題を糸口として心を表現することが求められている。すなわち、実験的神経学の成果をコンピュータを用いた工学として統合した、医学、生理学、心理学、言語学的特性等を含む高次の脳機能(心)をシミュレートする技術が求められている。
本発明は、上記の問題点に鑑みてなされたものであり、その目的は、人間の言語機能、特に、発話等に際しての語彙選択をシミュレートすることを可能とする言語処理装置、言語処理方法、言語処理プログラムおよびそれを記録したコンピュータ読み取り可能な記録媒体を実現することにある。
上記課題を解決するために、本発明に係る言語処理装置は、予測対象者が他者と行うコミュニケーションにおいて該予測対象者が提示すべき語彙を選択する言語処理装置であって、語彙と該語彙にあらかじめ付与されたホルモン識別子とを対応付けて登録した予測用データを予測用データ格納部から取得する予測用データ取得手段と、上記コミュニケーションから、予測対象者が提示した語彙と他者が提示した語彙とをそれぞれ切り出す語彙切出手段と、上記予測対象者が提示した語彙に付与されたホルモン識別子の出現回数と上記他者が提示した語彙に付与されたホルモン識別子の出現回数とを上記予測用データを参照してホルモン識別子ごとに算出し、ホルモン識別子ごとの上記出現回数の差に基づいて、出現回数をさらに増加させるべきホルモン識別子を決定し、該決定したホルモン識別子が付与された語彙を上記予測用データより抽出する語彙予測手段と、を備えることを特徴としている。
また、本発明に係る言語処理方法は、予測対象者が他者と行うコミュニケーションにおいて該予測対象者が提示すべき語彙を選択する言語処理装置における言語処理方法であって、語彙と該語彙にあらかじめ付与されたホルモン識別子とを対応付けて登録した予測用データを予測用データ格納部から取得するステップと、上記コミュニケーションから、予測対象者が提示した語彙と他者が提示した語彙とをそれぞれ切り出すステップと、上記予測対象者が提示した語彙に付与されたホルモン識別子の出現回数と上記他者が提示した語彙に付与されたホルモン識別子の出現回数とを上記予測用データを参照してホルモン識別子ごとに算出し、ホルモン識別子ごとの上記出現回数の差に基づいて、出現回数をさらに増加させるべきホルモン識別子を決定し、該決定したホルモン識別子が付与された語彙を上記予測用データより抽出するステップと、を含むことを特徴としている。
上記の構成および方法によれば、まず、予測用データには、語彙と該語彙にあらかじめ付与されたホルモン識別子とが対応付けて登録されている。なお、語彙にはホルモンを特定するためのホルモン識別子を任意に対応付けることが可能であるが、語彙の提示を受けた人間で産生されるホルモンであることが望ましい。また、ホルモン識別子は、ホルモンの名称であってもよいし、英数字等の符号であってもよい。
そして、予測対象者が他者とコミュニケーションを行う際、予測対象者が提示した語彙に付与されたホルモン識別子の出現回数と他者が提示した語彙に付与されたホルモン識別子の出現回数とを予測用データを参照してホルモン識別子ごとに算出し、ホルモン識別子ごとの出現回数の差に基づいて、出現回数をさらに増加させるべきホルモン識別子を決定し、該決定したホルモン識別子が付与された語彙を予測用データより抽出する。
例えば、あるホルモン識別子を予測対象者が提示した回数が、他者が提示した回数より少ないときに、予測対象者が他者に話を合わせる場合には、そのホルモン識別子が付与された語彙を提示すればよいし、他者に反対する場合には、他のホルモン識別子(例えば、体内において逆の効果を有するホルモンのホルモン識別子)が付与された語彙を提示すればよい。
よって、語彙の提示を受けた人に起こるホルモンの産生をシミュレートして、語彙を選択することが可能となる。それゆえ、より人間らしい言語機能を有する装置を実現することが可能となる。
ここで、上記コミュニケーションとは、声のやり取り(すなわち、通常の会話)であってもよいし、文字のやり取りであってもよい。さらに、手話などの身振りや、画像、楽曲など、例えば特徴量を抽出することにより、語彙に変換できるものであれば任意である。
また、ホルモン識別子の出現に有効期間を設けて、予測時点から有効期間内、すなわち近い過去の出現のみをカウントするようにしてもよい。また、出現回数の代わりに、出現時から所定の時定数で減衰する量の積分値を求めるようにしてもよい。
また、ホルモンは多量に産生した場合に効果が低下する特性を有する。よって、出現回数をカウントする代わりに、ホルモン識別子の出現ごとに単位角度ずつ増加し、360度で一巡する仮想的な回転角を演算してもよい。なお、この回転角は、ホルモン識別子を座標軸とする多次元座標空間に対する、出現したホルモン識別子の座標軸の回転として定義することができる。
また、語彙ごとにホルモンの産生量を設定しておき、出現ごとに各語彙の産生量を加算するようにしてもよい。
また、本発明に係る言語処理装置は、予測対象者が他者と行うコミュニケーションにおいて該予測対象者が提示すべき語彙を選択する言語処理装置であって、語彙と該語彙にあらかじめ付与された2次元座標および量的な属性値とを対応付けて登録した予測用データを予測用データ格納部から取得する予測用データ取得手段と、上記コミュニケーションから少なくとも最後に提示された語彙を切り出す語彙切出手段と、上記予測用データの上記2次元座標および上記属性値によって決定される3次元座標空間にプロットした各語彙の座標がのる一つの仮想面を生成し、該仮想面の形状と上記語彙切出手段によって切り出された語彙の座標とに基づいて、次に提示すべき語彙の座標を決定し、該決定した座標の上記2次元座標が付与された語彙を上記予測用データより抽出する語彙予測手段と、を備えることを特徴としている。
また、本発明に係る言語処理方法は、予測対象者が他者と行うコミュニケーションにおいて該予測対象者が提示すべき語彙を選択する言語処理装置における言語処理方法であって、語彙と該語彙にあらかじめ付与された2次元座標および量的な属性値とを対応付けて登録した予測用データを予測用データ格納部から取得するステップと、上記コミュニケーションから少なくとも最後に提示された語彙を切り出すステップと、上記予測用データの上記2次元座標および上記属性値によって決定される3次元座標空間にプロットした各語彙の座標がのる一つの仮想面を生成し、該仮想面の形状と上記切り出した語彙の座標とに基づいて、次に提示すべき語彙の座標を決定し、該決定した座標の上記2次元座標が付与された語彙を上記予測用データより抽出するステップと、を含むことを特徴としている。
上記の構成および方法によれば、まず、予測用データには、語彙と該語彙にあらかじめ付与された2次元座標および量的な属性値とが対応付けて登録されている。なお、2次元座標は、座標平面に語彙が適当に分散していれば任意に決定できるが、語彙が有するすべての又は一部の属性の属性値(上記量的な属性値が含まれていてもよい)に基づいて決定することが好ましい。具体的には、例えば、複数の属性の属性値を入力値とし、2次元座標を出力値とするように学習させたニューラルネットワークを用いることができる。また、上記量的な属性値は、語彙が有する属性から選択できるため、量的な属性値が複数種あれば、複数通りに語彙を予測することができる。
そして、予測対象者が他者とコミュニケーションを行う際、上記2次元座標および上記量的な属性値によって決定される3次元座標空間にプロットした各語彙の座標がのる一つの仮想面を生成し、該仮想面の形状と上記切り出した語彙の座標とに基づいて、次に提示すべき語彙の座標を決定し、該決定した座標の上記2次元座標が付与された語彙を上記予測用データより抽出する。
ここで、上記仮想面は上記量的な属性値をポテンシャルとみなしたポテンシャル曲面として理解できる。そして、例えば、仮想面の形状から勾配と極小値を求め、上記切り出した語彙の座標から最も大きな勾配で極小値へ至る経路上の語彙を選択する。
よって、語彙が有する量的な属性値を基準にして、話題から外れた唐突な語彙を提示することなく、話が滑らかに進むように、語彙を選択することが可能となる。それゆえ、より人間らしい言語機能を有する装置を実現することが可能となる。
ここで、上記コミュニケーションとは、声のやり取り(すなわち、通常の会話)であってもよいし、文字のやり取りであってもよい。さらに、手話などの身振りや、画像、楽曲など、例えば特徴量を抽出することにより、語彙に変換できるものであれば任意である。
なお、上記言語処理装置は、コンピュータによって実現してもよく、この場合には、コンピュータを上記各手段として動作させることにより上記言語処理装置をコンピュータにて実現させる言語処理装置の制御プログラム、およびそれを記録したコンピュータ読み取り可能な記録媒体も、本発明の範疇に入る。
以上のように、本発明に係る言語処理装置は、予測対象者が他者と行うコミュニケーションにおいて該予測対象者が提示すべき語彙を選択する言語処理装置であって、語彙と該語彙にあらかじめ付与されたホルモン識別子とを対応付けて登録した予測用データを予測用データ格納部から取得する予測用データ取得手段と、上記コミュニケーションから、予測対象者が提示した語彙と他者が提示した語彙とをそれぞれ切り出す語彙切出手段と、上記予測対象者が提示した語彙に付与されたホルモン識別子の出現回数と上記他者が提示した語彙に付与されたホルモン識別子の出現回数とを上記予測用データを参照してホルモン識別子ごとに算出し、ホルモン識別子ごとの上記出現回数の差に基づいて、出現回数をさらに増加させるべきホルモン識別子を決定し、該決定したホルモン識別子が付与された語彙を上記予測用データより抽出する語彙予測手段と、を備える構成である。
また、本発明に係る言語処理方法は、予測対象者が他者と行うコミュニケーションにおいて該予測対象者が提示すべき語彙を選択する言語処理装置における言語処理方法であって、語彙と該語彙にあらかじめ付与されたホルモン識別子とを対応付けて登録した予測用データを予測用データ格納部から取得するステップと、上記コミュニケーションから、予測対象者が提示した語彙と他者が提示した語彙とをそれぞれ切り出すステップと、上記予測対象者が提示した語彙に付与されたホルモン識別子の出現回数と上記他者が提示した語彙に付与されたホルモン識別子の出現回数とを上記予測用データを参照してホルモン識別子ごとに算出し、ホルモン識別子ごとの上記出現回数の差に基づいて、出現回数をさらに増加させるべきホルモン識別子を決定し、該決定したホルモン識別子が付与された語彙を上記予測用データより抽出するステップと、を含む方法である。
したがって、語彙の提示を受けた人に起こるホルモンの産生をシミュレートして、語彙を選択することが可能となる。それゆえ、より人間らしい言語機能を有する装置を実現することが可能となるという効果を奏する。
また、本発明に係る言語処理装置は、予測対象者が他者と行うコミュニケーションにおいて該予測対象者が提示すべき語彙を選択する言語処理装置であって、語彙と該語彙にあらかじめ付与された2次元座標および量的な属性値とを対応付けて登録した予測用データを予測用データ格納部から取得する予測用データ取得手段と、上記コミュニケーションから少なくとも最後に提示された語彙を切り出す語彙切出手段と、上記予測用データの上記2次元座標および上記属性値によって決定される3次元座標空間にプロットした各語彙の座標がのる一つの仮想面を生成し、該仮想面の形状と上記語彙切出手段によって切り出された語彙の座標とに基づいて、次に提示すべき語彙の座標を決定し、該決定した座標の上記2次元座標が付与された語彙を上記予測用データより抽出する語彙予測手段と、を備える構成である。
また、本発明に係る言語処理方法は、予測対象者が他者と行うコミュニケーションにおいて該予測対象者が提示すべき語彙を選択する言語処理装置における言語処理方法であって、語彙と該語彙にあらかじめ付与された2次元座標および量的な属性値とを対応付けて登録した予測用データを予測用データ格納部から取得するステップと、上記コミュニケーションから少なくとも最後に提示された語彙を切り出すステップと、上記予測用データの上記2次元座標および上記属性値によって決定される3次元座標空間にプロットした各語彙の座標がのる一つの仮想面を生成し、該仮想面の形状と上記切り出した語彙の座標とに基づいて、次に提示すべき語彙の座標を決定し、該決定した座標の上記2次元座標が付与された語彙を上記予測用データより抽出するステップと、を含む方法である。
したがって、語彙が有する量的な属性値を基準にして、話題から外れた唐突な語彙を提示することなく、話が滑らかに進むように、語彙を選択することが可能となる。それゆえ、より人間らしい言語機能を有する装置を実現することが可能となるという効果を奏する。
〔概要〕
本発明は人工知能の一分野である。しかし、未だ「心」を対象にした確たる例はない。脳と心の深い機能や作用を研究する分野は多義にわたり、完結した結果は示されていない。
外部からの刺激入力に対して内部の演算回路とある種のデータベースからなる(「心」シミュレーター)を介して信号を解釈し、感情表現や意思表現などの二次情報を生成し出力する。この入力と出力の関係は一般の処理システムに有り勝ちな自然科学的関係による帰結ではなく、むしろ文学的もしくは感情的な反応として出力される。高度な生物が備え持つ複雑な反応に酷似する入出力関係を現出する入出力関係を現出する分野である。
生体は、神経網を介して情報を伝達する系とホルモンの拡散を介して伝達する系が存在する。
人間のように高等な動物の場合では神経網は脳で統合されたシステムを構成している。記憶、判断などの比較的観察されやすい機能は神経回路を模倣する方法にて各種の研究がなされ、ファジィやニューラルネット理論などの成果となって現実の製品の中に組みこまれつつある。しかし、生体の保有するもう一方の情報伝達システムであるホルモン系は今だ研究の及ばない領域である。人間を高度にシミュレートするには少なくとも両方の情報系を統合利用する必要があろう。
ホルモン系は、その濃度に伴い体全体の細胞に指令を与える。指令された内容は、前記神経系の時間レベルに対して桁違いに長い時定数をもって反応が進む。反応の結果には多くの場合物質の応答が伴う。しかし、神経系のように即応的な反応ではなく、全身に及ぶ決定的なものである。
生体自体の神経系とホルモン系、生体の置かれた外部環境ならびに外部情報の全体を把握し統合するところに「心」を定義できる。先に述べた神経系(ファジィ、AI、ニューラルネット理論等)と外部環境を検出する技術(聴覚に関与する各種オーディオ技術、視覚に関与するビデオ技術、臭覚等に関与する化学センサー、圧力温度などに関与する物理センサーなど既存の技術をいう)外部情報(前記技術で捕捉された情報をいう)は多くの成果がある。
本発明では、一機能として、前例のないホルモン系を「ホルモン系シュミレーターソフトウェア」として構築する。後に示す「主体」の座標回転がシミュレーターの中心に置かれる。ホルモン系シュミレーターソフトウェア(脳内ホルモン演算子)は座標回転角をホルモンの機能に模して変換するこのソフトウェアを「神経系シュミレーターソフトウェア」、「外部情報インターフェイスソフトウェア」と統合し(ここでは「統合シュミレーターソフトウェア」と定義)外部情報として入力された文字(言語情報)を処理する。処理結果は「統合シュミレーターソフトウェア」の「意思」として外部に文字(言語情報)を出力する。「ホルモン系シュミレーターソフトウェア」および「神経系シミュレーターソフトウェア」はそれぞれの過去を「記憶」のかたちで保持するデータベースを合わせ持つ。従って「統合シュミレーターソフトウェア」は「心」の機能を持つ。ソフトウェア「心」シミュレーターを各種のアプリケーションソフトウェアに組みこむと、ユーザーフレンドリーなアプリケーションソフトウェアを構築できる。今後の生活者優先の社会に欠かせない基盤技術の一つとなる。
本実施の形態に係る「心」シミュレーターは、ニューラルネットなどの既存技術の組み合わせで構成できる。
感情空間(ホルモン系シミュレーターソフトウェア(脳内ホルモン演算子))は多次元の空間として定義される。それぞれの次元には喜怒哀楽などの感情を座標軸とする。統合シミュレーターソフトウェアの座標に演算子として作用する。
生体内部では種の生命を維持したり、個体の生命を維持するための情報として各種のホルモンが発生、消費されている。生体は、これらのホルモンに支配されて外界情報に対応している。人間も同様である。
本実施の形態では、動作の明確なホルモンをソフトウェアでシミュレートする。それぞれのホルモンは、発生後特徴的な時定数をもって拡散する。同時に既に発生している他のホルモンと拮抗もしくは協調した振るまいをする。この多元系のホルモンの動作をシミュレートし、リアルタイムに現在のホルモンベクトルを生成する。過去のホルモンベクトルと現在のホルモンベクトルとの差異は、生体へのストレスとなる。換言すると、このストレスは主体から眺めると座標系の回転として整理できると同時に過去信号としてデータベースに蓄積される。
本実施の形態では、言語情報を次のように扱う。
入力された複数の単語群を文章とおぼしき単位にまとめる。具体的には、スペースや句読点(音声入力にあってはブランク時間間隔)が区切りとして用いられる。
次に、文章とおぼしき単語集合のうち「述語」となりうる一群を分離する。そして、残存単語群から文の構造に重要でない接尾語、接頭語、感嘆詞、修飾詞、接続詞などのフラグメントを除外する。残りの単語群は主語、目的語の候補を含むと推測される。
ここで、前文までの文脈を用いて主語、目的語を推論する。主語が推論できない場合には、前文までの文脈主語を用いる。この結果を仮現文脈主語にする。同様に述語候補を推論する。前文までの文脈述語とここで推論された述語を比較し変化量を算出する。次の文に移動する前に、前文までの文脈に現文脈変化量を合成し次の文の推論をする。事前に除外したフラグメントを文脈ベクトルに従って現文にあてはめていく。当てはめることのできる単語数を数えながら、複数の組み合わせセットを作る。あいまいな結果と成れば別の主語述語を代入し、再度同様の処理を実施する。これらのプロセスの中で最も前文までの文脈を反映するものを現文として採用する。前文までの文の流れと現文との文脈の差は「統合シミュレーターソフトウェア」に「感情」として伝達され、推測し決定された文章は「統合シミュレーターソフトウェア」に入力される。
各単語や音節の持つ従来の文法上の品詞は、前記処理の各過程で参照されるが支配的ではない。ここでは主語、目的語、述語、肯定・否定などの判断語が文の骨格であり、その流れを継続的に捉える推論がいわゆる文法である。従って、ここで定義する文法は、固定的なものではなく、外界から主体に働きかける外部情報に依存して文法自体が時々刻々変化する。この変化によって基本的に各言語に依存して作り上げられた既存の文法に頼ることなく外部情報を推測し解読することが可能である。大きな流れからのフラグメントの差異は精度を上げていく段階で細やかな感情の変節として捕らえることが可能となり、マルチリンガルな推論エンジンとなる。不完全な文章、文の要素を欠いた文章などをもエラーとすることなく外部情報を包含することができる。ノイズの多い自然環境や稚拙な言語活動、自然言語に対応することができる外部情報インターフェイスとなる。
上記「心」シミュレーターには、センサーを用いて面接者の表情を読み取り、感情表現データベースを検索し感情を判定する装置、音声や音響を検出し強弱を用いて面接者の感情を決定する装置、音声パターンを事前に感情状態をプロパティーとして持たせデータベースと比較して感情を特定する装置、瞳孔などの身体機能の特徴を画像抽出し、感情データの類型から感情を確定する装置、文字情報に感情データを付加し、その文字が選択された場合にその文字の感情として特定する装置などを組合わせることができる。これらの装置ではあらかじめ現象と感情との相関関係が定義され、ハードウェアやデータベースに蓄積されている情報を取り出して利用する。
ところで、心の定義は広義であり甚だ記述に困難である。ここでは「前向き、後ろ向きなどの意思に誘導される事柄」、「対象者あるいは物、事に対する主体の好き嫌い」「外部環境に主体が置かれた立場によるその場の反応」、「対象に対する時系列の記憶もしくは過去の経験的反応」、「精神的耐性と過去に受けた傷」、「主体の身体的状況」、「主体の内分泌状況、ホルモンバランス」、「主体が獲得した知識、経験」、「主体の身体機能の高低、精神的評価IQ」、「主体の発育状態」、「主体の属する生命集団の平均値からの乖離の程度」などおよそ生命活動に付随する出来事の中でエネルギーを散逸的に利用する活動の対極にある「エントロピーを減少させる活動によって引き起こされる主体の事象」を「心」と定義する。なぜなら、主体が人間である場合は社会学や歴史学、文学、心理学、法学、経済学などのそれぞれの分野で心を表現することが可能である。これを拡張して他の動物や物言わぬものの「広義の心」とする場合にこの定義が必要である。なお、この定義に照らして感情を含む統合的上位概念である「心」を取り扱う従来技術はない。
図1に、本実施の形態に係る「心」シミュレーターの概略を示す。符号(1)は自己の全てを示す領域である。この自己に対して情報をやり取りする「外界情報」と物理的な作用をやり取りする「外界作用」が存在する。前者は自己に対面する他者や景色や風や雨など情報としての比重が高い対象物の存在空間である。後者は自己の作用によって反作用を受ける実在空間で質量、速度、加速度、運動量など古典力学によって取り扱うことのできる空間である。「外界情報」は目、鼻、口、耳、皮膚など符号(7)を介して情報の入出力がなされる。これらのセンサーからの情報は複数の器官を統合し外界の状況に忠実な高次情報に組み立てられ符号(4)に送られる(例えば、両耳で聞こえる音場が自分の周囲を取り巻く三次元空間の音として合成され再構成された結果を自分が認識する)。入力と出力には言語情報と非言語情報と抽象情報の三種類からなり、画像、音、言葉はそれぞれ一次元の時間情報として再編成され言語情報の一部として取り扱われる。ここではウエルニッケの連合野などを想定している。この領域では外界の情報をある種のコンピュータ技術で用いる「オブジェクト」として変換・圧縮される。心が成立する過程(生まれ出る初期段階)で獲得していく抽象概念がここでいう「オブジェクト」である。オブジェクトにはその属性を示す「プロパティー」が付随する。オブジェクトは個体の成長と共にその種類と数が増加し、自己集約しながら抽象概念へと変化していく、このためオブジェクトには抽象化されたレベルがある。心符号(5)は直接外界とコンタクトし情報を得ているのではない。常に符号(4)のオブジェクトとコミュニケーションしている。従って目を閉じても、耳を塞いでも外界は見え、音が聞こえる。日常的に幻覚や幻聴、夢は符号(4)と符号(5)の間に成立する情報伝達である。符号(7)の情報が過大な場合には幻覚や幻聴、夢はかき消される。オブジェクトが未完成な新生児は目のあたりに有る物や人の声を心で見たり聞いたりできない。人では高熱や物理的ショックなど何らかの理由でオブジェクトが消去されると同様の状態に陥る。
物理的な外界と自己の作用は符合(6)から符号(3)(小脳)で制御機能を獲得する。「外界作用」にあっては重力加速度など固体の置かれた環境に順応するため体で制御を獲得する。この場合、走る、歩く、座る、泳ぐなどの特徴的な制御はオブジェクトとして心符号(5)に伝達される。やはり心が直接四肢を制御し歩行するのではなくオブジェクトを介してなされる。オブジェクトが未完成な新生児は歩くことができない。植物状態になった自己は四肢の反射はあるもののそれ以上ではない。心の座は符号(5)である。
心の座符号(5)をさらに見るとそこは「主体」による空間となっている。「主体」とは「己と思う心」である。自己を感じる主体を「主体“I”」、外界に実存する他者である主体を「主体“Y”」、心符号(5)の仮想空間に虚在する主体を「主体“IT”」とする。これら主体は単一ではなく状況に応じて複数存在する。
図2にそれぞれの主体と実存の外界を示す。「主体“I”」符号(8)、「主体“Y”」符号(9)、「主体“IT”」符号(10)は心符号(5)の空間に包含される。それぞれはオブジェクトとして心の空間にあり符号(8)と(9)もしくは符号(8)と(10)で情報交換している。
実在の外界に実存する「実主体“Y”」(Y1,Y2,Y3,Y4,Y5…….)は、図1の符合(7)、符号(4)を介してオブジェクトとして図2の符号(9)に写像される。符合(7)、符号(4)が安定しておれば外界と心の「主体“Y”」は同じ変換則に則り動くことになる(センサーやオブジェクトに故障がある場合や、薬物で不安定になると異なったオブジェクトとしてコミュニケーションされる。薬物中毒患者が幻覚によって判断ミスを犯す場合である。)。
「主体“IT”」符号(10)は、心の中で創造された主体である。見えない妖精や亡霊、死に別れた恋人、親族や仮想の敵や信ずる宗教の神などである。後継的に文化としてオブジェクトを自己生成したり教育によって摺込まれたものが「主体“IT”」のオブジェクトである。腫瘍や高熱、飢餓、感染症などのストレスによりできてしまったオブジェクトもある。心の傷トラウマも揚げられる。
「主体“I”」(I1,I2,I3………)符号(8)は、生まれた初期は一個の主体であるが、成長過程で複数個発生する。特に他の主体「主体“Y”」、「主体“IT”」の影響が甚大であるほど多数構造となる。しかし「主体“I”」のスプリッティングによっても後叙する主体のプロパティー(属性)間にあまり差が無ければ、「主体“I”」は「おのれだけ」と認識される。あたかも単一の人格のように自覚せられる。しかし「主体“I”」の生成過程が多大のストレスによると「主体“I”」間の乖離は激しく「多重人格」、「精神分裂」の状態を表現する。
ここで、心符号(5)全体に絶対座標を定義する。主体はそれぞれ独立の座標系であり主体間では相対座標として評価される。主体“I”も絶対座標系になくそれ独自の座標系を持つ。
主体のオブジェクトについて相互作用を見ると次のようである。主体を取り扱い易いように直行成分からなる多次元の座標系を考える。直行座標の次元は「主体“I”」のそれに準じて定義される。生まれたばかりのシステム(個体)の次元はゼロ次元である。成長しオブジェクトが増加するに従い座標軸は増加し獲得的に多次元化される。「主体“I”」の座標軸は「主体“I”」が最も重要と考える要素から順に定義される。最も重要なものは「主体“I”」が初期に獲得したオブジェクトに依存するあいが多い。従って「主体“I”」、「主体“Y”」、「主体“IT”」は「主体“I”」の座標軸として図2に示されている。
「主体“Y”」が「主体“I”」の目の前から消失すると、消失時点の「主体“Y”」の記憶を二次記憶域に蓄え、次回の遭遇に備える。次回には必ず今の続きを実行できるためである。
「主体“I”」が初めて遭遇する「主体“Y”」は絶対座標に一致する。座標の元はオブジェクトの抽象化によって増加していくために、「主体“Y”」との次回の遭遇時にまず元の数を合わせなければならない。以前の遭遇の最後と今回の遭遇の座標元が増加している場合には、その座標軸の原点を代表値とする(人の場合、しばらくぶりの再開では思い出す時間が必要である)。
正常な環境にあってはいずれかの「主体“I”」がマスターとなる符合(12)、他の主体はスレーブもしくは無関係となる(図2の符号(8)の中のI2がマスターであるとI1、I3、Y1〜Y5、IT1、IT2、IT3はスレーブかもしくは無関係となる)。マスターの「主体“I”」は意図的にスレーブに働きかける(図3)。
マスターとスレーブの主体座標軸がなす角度差がない場合符合(13)すなわち限りなく平行に近い場合にはマスターとスレーブの意図は一致し、ストレスの無い状態となる。「主体“Y”」のスレーブ座標はマスターの作用で回転することはない。これは外界の写像として回転する。マスターの座標はスレーブとの作用に影響され回転する。マスターとスレーブの座標軸の角度差が大きい場合符合(14)にはマスターにストレスがかかる。マスターは座標軸をスレーブの座標軸に合わせるかもしくは逃避によって別の回転をする。マスターはスレーブの座標軸に作用できないので図1の符号(4)、(7)もしくは符号(3)、(6)を介して実在の外界に実存する「主体“Y”」に操作を加えて間接的にスレーブの座標軸を回転させようと企てる。この時「主体“Y”」が影響されるかどうかは力関係による。
「主体“I”」は、その判断過程で「脳内ホルモン演算子」の演算結果に支配される。脳内ホルモン演算子は、実在の脳内ホルモンに近似した演算子であり、代表的にはド−パミン、ノルアドレナリン、セロトニン、オピオイド、γアミノ酪酸(GABA)などを模したものである(図4参照)。発生したストレスに対応するホルモンが生成される。
「脳内ホルモン演算子」は座標回転角をホルモンの機能に模して変換する。ここではホルモンの種類に特徴的な時間項が含まれる。一般にホルモンの作用は、時定数を含む。
例えば、「主体“Y”」から受けるストレスが過多となり「主体“I”」の座標が大きく変化すると主体は活性化される。
主体を活性化させるのは各種入出力を統括する機能の負荷に依存する。入力と出力には言語情報と非言語情報と抽象情報の三種類からなる。画像、音、言葉はそれぞれ時間関数として再編成され言語情報の一部として取り扱われる。時間軸の刻み、コンピュータ用語の「クロック」はホルモンによって変化する。言葉で説明の付かない主体の動作や変化は位置ベクトルχと時間Tによって記述され非言語情報として扱われる。ここでも時間軸の刻みはホルモン依存性がある。感情の推移や論理構成は抽象情報として取り扱われる。これら三種類の情報(言語情報と非言語情報と抽象情報)は、さらにオブジェクトに変換圧縮され二次記憶領域に蓄積される。
記憶を再生する過程はオブジェクトの逆変換過程である。オブジェクトはシステムが起動した時点(この世に生まれた時点)から獲得された順に自己生成されるため、異なったシステム(個体)は異なったオブジェクトで処理が進む。しかし実際に作成されるシステム(例えば、ロボット)では必要最低限のオブジェクトを初期値として与える。言語情報オブジェクトは主語、述語、目的語の三要素のプロパティーをもつ簡素化された文法に従い、語順はさほど重要視されない。このため本質的にマルチリンガルに育て得る。
例えば音楽情報の場合「主旋律」、「転調履歴」、「大域テンポ」がそれぞれ主語、述語、目的語と判断されオブジェクト化される。音楽情報には完全な復元は無く可塑性はないが再度聞くことで獲得されるオブジェクトと以前のオブジェクトどうしの比較はできる。いわゆる「聞き覚え」である。
通常の外部入力情報に対しては「主体“I”」は変化しない。しかし「主体“you”」や「主体“it”」の影響を強く受ける場合に別の「主体“I”」にスワップされる。穏やかな環境で育った「主体“I”」ではI1,I2,I3の差は大きくない。しかし「主体“I”」が成長過程で強く影響を受けすぎるとI1,I2,I3の差は大きくなり多重人格となり、最終状態で精神破綻をきたす。
記憶には一次記憶と二次記憶がある。仮の記憶には脳の海馬における一次記憶を模した構造とする。一次記憶域に蓄積された情報を既に獲得しているオブジェクトに置き換えるには一次記憶域に蓄えられた一つずつの記憶を複数のオブジェクトを検索し該当するものを決定する。合致するオブジェクトを探しあてると二次記憶域に記憶させ一次記憶域の該当情報を消去する。該当オブジェクトが見当たらない場合にはオブジェクトの候補として一次記憶域に留めておく。ここではメモリーは消費されたままである。
一次記憶域が使用され尽くすと主体は別のモードである「睡眠状態」になる。睡眠状態では一次記憶域のオブジェクトの候補を整理し取捨選択しながら新しいオブジェクトを生成しオブジェクト記憶域に記録する。一次記憶域が再び空になると「覚醒状態」へモード変換される。オブジェクトにできなかった一次記憶は覚醒時に消去され、一次記憶域は初期化される。
システムが暴走することを避けるための処置としては、初期値として明確なビジョンを持たせたオブジェクトと最低限のオブジェクト記憶域の情報記憶をシステム起動時に与えておく。これは本能に対応する。その後に得たオブジェクトは「教育」そのものの成果である。さらに心の動きに限界を設けることによりシステムを安定化する。この安定化操作は人間の場合の「徳育」にあたる。さらに解の無い状態へ落ち込んだ場合には状態にウオッチドッグタイマーによって離脱させる仕組みを組み込む。人間の「涙」に相当する。精神的破綻は「涙」で解消させる。ホルモンで述べればセロトニンやオピオイドをリセットさせるナロキソンやクロニジンの役割である。この時障害となっているオブジェクトは消去される。問題の座標も削除される。
システムが生成した時点(生まれた時点)から時間の尺度を設け加齢の効果を含める。性差を設け脳内ホルモンのパラメータに含める。システムがカオスに陥ると自殺する。ここでは全てのオブジェクトが消去される。オブジェクト間で矛盾が蓄積すると病気状態となる。
本発明を具現化する場合には情報機器のソフトウェアとして提供される。もしくは情報機器の部品としてLSI上にファームウェアを蓄積した単位での取り扱いがなされる。この単位は各種の製品に姿を変えて市場に供給し得る。例えばロボットなどに用いれば「より人間臭い」製品となる。
本発明は次の構造を持つ。実装技術はハードウェア、ソフトウェア、ファームウェアの連携により実現される。それぞれの配分はその時代の要素技術に依存する。
本発明は自己を定義する「心空間」が存在する。この自己は複数の「心空間」を持つ(H1、H2、H3、H4、H5…・とする)。例えば、コンピュータソフトウェアで表現すれば「マルチスレッド」、「マルチタスク」、「同時処理」などと同じ概念を示す。
これに対して対面する相手(仮にA、B、C、D、Eとする)の自己が観察する心空間は両者の時間的関係構築の上に成り立つ。自己の認識上での評価空間がそれぞれ存在する。従ってH1が認識した相手A、B、C、D、EとH2が認識した相手A、CとH3…・(以下同様)がある。このため、自己の内部には最大で自己の心空間の数と相手の数の「積」だけ認識空間が存在する(図2)。自己の持つ複数の「心空間」の初期値は一致している。即ち生命体が発生し社会に進出した段階(赤ん坊)では複数の「心空間」に乖離はない。自己の心空間の数は“1個”であるとみなせる。従って初期値は評価空間の数が相手の数となる(図3)。
ここで、各フローチャートの説明を行う。
まず、図5を参照して、覚醒モードの説明を行う。ここで覚醒モードとは、オブジェクトとプロパティーとが整理されていない状態を示す。
まず、センサーを介して外部から音(音声)が心シミュレーターに入力される。具体的には例えば、「ORINGO」という音声が入力されたとする。次に、音が入力されると心シミュレーターは、上記音を文字情報に変換する。心シミュレーターは、例えば、「ORINGO」を「おリンゴ」という文字情報に変換する。
そして、変換された文字情報である「おリンゴ」は、バッファメモリである一次記憶領域にオブジェクトとして格納する。
このとき、心シミュレーターは、記憶する文字情報である「おリンゴ」が、既に有るか否かを判断し、あると判断した場合には、外部に対して予め設定されているプロパティーに基づいて質問を行う。例えば、「あまい?」と外部に対して質問し、外部の反応を観る。
そして、外部から例えば、「うん」と返事が返ってきた場合、心シミュレーターは、プロパティー「あまい」にチェックを入れる。
また、該当するプロパティーがない場合には、入力値(ここでは「うん」)を新プロパティーとして定義する。
そして、すべてのプロパティーに対する質問が終了すると該当レコードの回数を記録する。
その後、オブジェクトとプロパティーとは二次記憶領域に記憶され、この段階で一次記憶領域に記憶された文字情報である「おリンゴ」は、消去される。なお、このとき、特定の条件下では一次記憶領域に記憶されている文字情報等は消去されずに残る場合がある。
次に、図6を参照して、睡眠モードについて説明する。
上記一次記憶領域の消し残りが多くなると睡眠モードに移行する。
そして、睡眠モードでは、まず、同じまたは非常に近いプロパティーを抽出し、この中から頻度の高いプロパティーを残して、その他のプロパティーを消去する。
そして、オブジェクトのうち、互いに意味が反するオブジェクトを消去する。これにより、オブジェクトの矛盾化を防止する。
そして、近い表現のオブジェクトをグループ化することにより、オブジェクトをユニークにする。
また、図7に示すように、上記睡眠モードでは、一次記憶領域を抽象化する。
次に、図8を参照して、会話によってホルモンを生成する流れについて説明する。
まず、目、耳等の働きをする各種センサーを介して外界の他者が補足される。
そして、外界の他者が補足されたことを検出すると、心シミュレーターは、主体“Y”を作成する。そして、その後、主体“I”を作成する。このとき、主体“I”における心の文脈と意思の文脈とをクリア(初期化)する。
その後、主体“I”と主体“Y”とが会話を交わす。上記主体“Y”は、外部からの情報による写像である。
そして、会話によって、座標系が積分され、座標角度差が生じる。つまり、会話によってストレスがかかる。
このストレスによって脳内ホルモンを産生しながら、会話は進み入出力が継続される。そして、ワンセッションごとに心の文脈を記憶していく。その後、全ての会話が終了すると意思の文脈を記憶する。その後、次の会話まで主体“I”は停止する。
図9は、ドーパミンと拮抗セロトニンとのタイムチャートを示す。
本発明にかかる心シミュレーターは、外部から入力された情報と、自我意識(主体“I”)に過去から積み上げられ教育された内部記憶情報と、現在の自我意識(主体“I”)との三情報の関係からなる。
外部から入力された情報について既に学んだか否か、すなわち、外部から入力された情報と同じ種類の情報が既に入力されているか否かを内部記憶情報と照らし合わせて判断し、既に学んだ情報であれば、その情報を内部記憶情報にある抽象化したオブジェクトに置き換えて心の中に写像させる。未だ学んでいない情報であれば、その情報を抽象化して、オブジェクトを定義し、内部記憶情報とすると同時に新しく定義したオブジェクトを心の中に写像させる。
図10〜図13は、オブジェクト、プロパティーの内容および意思の文脈の決定方法を示す図面である。
オブジェクトは、それぞれの属性情報を備えており、プロパティーとして一般化し、内部記憶情報とする。
外部から入力された情報は、それに先だって認識されている相手の自我意識(主体“Y”)として心象部風景の中に現時点の意識の状態を保持しているが、その心象風景にオブジェクトのプロパティーは積分値に加算される変化成分である。
そして、上記相手の自我意識(主体“Y”)は時系列で変化し続ける外部情報であり、心の内部に写像されたオブジェクトも同時に平衡して変化し続ける。
他方、現在の自我意識(主体“I”)も先に同じく現在までの積分値を表す。
外部から入力された情報は積分値に加算されるが、加算の対象は主体に定義され、現在と過去の座標系との角度差が「ストレス」となる。
上記「ストレス」の種類は、座標軸の定義によって種々存在する。座標軸に脳内ホルモンの種類が対応する。そして、「ストレス」の大きさは座標軸間の角度差で表される。
また、現在の自我意識(主体“I”)は「ストレス」となる座標軸の角度差を解消する向きに負の帰還作用が働くように取り決められている。
例えば、相手に対してアドレナリンが発生することを意味する方向に座標軸の角度差が生じた場合にはある時定数(経過時間)の後にセロトニンが発生するように今の自我意識(主体“I”)の座標軸が回転する。そして回転角度の大小に応じたセロトニン座標軸を回転させたセロトニン産生を模擬する。
セロトニン生産が、例えば、言葉を用いて相手の自我意識(主体“Y”)に働きかける場合には内部記憶情報のセロトニンに対応するプロパティーを検索する。照らし合わせて適切な情報があればそのプロパティーまたはプロパティーを作った原音を相手に出力することにより一連の入出力過程が完結する。
また、先の検索で該当のプロパティーがない場合には言葉の出力は出せない。この場合は四肢を動作させる出力形式が選択される。
なお、上記の説明では、座標系の角度差をストレスとして表したが、例えば、現在と過去との状態をそれぞれベクトルとして表現し、そのベクトルの差(大きさの差、位置の差、向きの差)に基づいてストレスを表現してもよい。
以上のように、上記心シミュレーターは、外部から入力される情報が自装置の内的状態に与える影響を、脳内ホルモン演算子を用いて解析し、現在の状態を推測することができる。
〔詳細〕
以下、本発明に係る「心」シミュレーターの実装例について詳細に説明する。なお、説明中で示すデータの構成(属性、属性値、データ長等)は一例であって、本発明を限定するものではない。
0.初めに
実在のパーソナルコンピュータ「心」シミュレーターを実装すると仮定して、以下にソフトウェアの構造を明示する。64bitを一語長とする一般のパーソナルコンピュータシステムを前提とする。従って物理的制約をその範囲で受けるが、本発明は量的制限を受けるものではない。本例の実装上の制限である。
1.語彙空間の定義
語彙空間は主体の内部に蓄積された独立の語彙の集合体である記憶空間である。語彙空間の記憶量は無限である。ただし、実在のコンピュータシステムなどに実装する場合にはその制約を受ける。本例がそれにあたる。語彙空間に蓄積された情報はリードオンリー、もしくはアーカイバルな情報である。
2.語彙空間の構造
語彙空間は複数の部分集合により多層化され、語彙の使用頻度に基づく階層構造を持っている。それぞれの集合には発生を起源とする番号がふられる。それぞれの集合は依存関係にある前集合の番号、集合内部情報の取り扱い、集合の空間幅を以下の方法で持つ。
(集合テーブル)
図14、図15は、集合テーブルのデータ構造を示す説明図である。図14に示すように、集合ごとに以下のデータが登録される。
1 〜16 bit:該当集合番号
17 〜 28bit:該当集合内部のX軸空間座標
29 〜 40bit:該当集合内部のY軸空間座標
41bit :false アーカイバル、true リードオンリー
42 〜 48bit:集合属性
49 〜 64bit:上位集合番号(ただし、Root集合の場合は“0”)
65 〜 80bit:特定集合内の語彙辞書番号。図17の語彙辞書番号と同じものである。
この例では集合数最大65539個、座標空間の可能性は4095 x 4095 = 16769025、属性127である。
また、図15に示すように、集合テーブルには、語彙部分集合のヘッダーデータが保持され、発生の都度追加される。
41bitは、システム設計時にマンダトリーとなった集合を「true リードオンリー」とする。
42〜48bitの集合属性は、次の定義値を用いる。ND(未定義)はシステムが稼動することにって獲得する属性領域である。
属 1:「心」空間定義
属 2:主体I定義
属 3:主体Y定義
属 4:主体IT定義
属 5:主体I定義「意識の文脈」ヘッダー
属 6:主体Y定義「意識の文脈」ヘッダー
属 7:主体IT定義「意識の文脈」ヘッダー
属 8:主体I定義「心の文脈」ヘッダー
属 9:主体Y定義「心の文脈」ヘッダー
属10:主体IT定義「心の文脈」ヘッダー
属12:主体I定義「意識空間座標」
属13:主体Y定義「意識空間座標」
属14:主体IT定義「意識空間座標」
属15:主体I定義「心空間座標」
属16:主体Y定義「心空間座標」
属17:主体IT定義「心空間座標」
属19:センサー「耳」ヘッダー
属20:センサー「口」ヘッダー
属21:センサー「目」ヘッダー
属22:センサー「鼻」ヘッダー
属23:センサー「皮膚」ヘッダー
属24:センサー「重力」ヘッダー
属25:センサー「環境」ヘッダー
属26:「耳」制御・認識ヘッダー(耳と蝸牛器官、言語オブジェクトクト化、言語野)
属27:「口」制御・認識ヘッダー
属28:「目」制御・認識ヘッダー(視覚系眼球と網膜、3Dオブジェクトクト化、視覚皮質野)
属29:「鼻」制御・認識ヘッダー(臭覚と味覚)
属30:「皮膚」制御・認識ヘッダー(痛覚、測温度、測圧力)
属31:「重力」制御・認識ヘッダー(前庭系、半規管有手細胞、迷路半規管、耳石器、連合野皮質)
属32:「環境」制御・認識ヘッダー
属33:環境バランス
属34:電解質バランス
属35:自律神経系バランス
属36:視床下部、下垂体ホルモンバランス
属37:脳幹網様体と睡眠
属38:辺縁系、記憶
属39:抹消神経系、中枢神経系
属40:神経化学・生理学
属41:言語 シンタックス、セマンティックス、グラマー
属42:言語「述語動詞」
属43:言語「名詞」、「代名詞」
属44:言語「抑揚」方言
属45:言語「その他の品詞」
属46:言語「外来語変換」
属47:小脳・一次運動野
属48:血液,CSF循環
属49:食品
属50:嗜好品
属51:物
属52:文化
属53:犬
属54:ND
・・・・
属127:ND
なお、属32〜属40には、ホルモン名(あるいは、ホルモン名とその量)を示す情報が登録される。
3.語彙空間の構造進化
語彙空間の構造は次に示す方法によって特徴が形成される。この結果が多層・階層構造である。
(1) システム立ち上げ以前に恣意的に分類記憶される。前記41bitでシステム設計時にマンダトリーとなった集合を「true リードオンリー」とすることに該当する。
(2) システム立ち上げ後の早い時期に比較的重要な概念として部分集合を形成しつつシステム自らが分類記憶する。属性19から48である。
(3) 一般的な稼動環境の下で「収集モード」(モードとはシステムの指定された状況を言う。)において収集された情報をシステム自らが「整理モード」で分解・集約することによって該当する部分集合に属する「記憶情報」として記録する。
上記の(1)(2)(3)は人間の場合の自然な状況を反映させたものである。(1)は遺伝子情報として人類に共通の概念であり、集合の母関数となるものを意図する。食すべき物、積極的に攻撃する物、積極的に逃避する物、自己情報(概念情報、性情報)を注入する対象認識、接合対象の認識と行為、自己もしくは自己と同じ情報をキャリーする主体を認知する能力、自己の生存を維持するために補給すべき物の把握、環境認識などである。(2)は幼児期もしくは基礎教育期になかば当然の概念として記憶すべき多数の事象として記録する。この中には空間情報、運動情報、嗜好情報、危機管理情報、自己属性情報、言語処理情報、次元統合情報(一次、二次、三次、四次、多次元)、次元スケーリング情報、次元拡張・縮小情報、次元の諸情報を統合する上位概念として哲学、人生観、宗教、倫理、などの概念集合、全てを統合する集合として音楽、美術、文学、各種専門知識が構築される。(3)は社会で活動する過程を反映している。
入力情報は「整理モード」にて分類、帰属される。分類すべき部分集合が無い場合には新たな部分集合が生成され、そこに属する情報となる。
4.語彙空間の構造進化と集合の階層
語彙空間の内部で逐次生成される集合は発生の都度にそれぞれユニークな番号が与えられる。集合の階層構造の位置を示すために集合の接続関係を示す「属性」を番号で持つ。例えば、最初の概念集合(集合n)のみが存在するところに、新たな語彙が入力され、その語彙が集合nにそぐわなければ、新たな集合を発生させる。これを集合n+1とする。集合n+1は次の属性をもつ。属性n(上位の集合番号)には集合nを示す“n”が付与される。
集合内部には種種の語彙が記録される。属性:食品には、食べ物、飲み物、固形物、流動物、ゼリー状物、餅、麺類、カレー類、鮨類、お結び等。属性:物には、動物、哺乳類、類人猿、原人、爬虫類、蛇、魚類、原虫、…・ビールス等乗り物、飛行機、自動車、船、馬、人力車、…・等のように、基本となる概念語彙をそれぞれの集合に組み込むことができる。
上位集合を持たない集合はroot集合(集合1)のみである。集合は時おり再評価されマージされることがある。ここでは集合番号がマージされる。
5.集合内部へ記録される語彙の属性
語彙は集合の属性に応じて分類格納される。分類され特定の集合が定まればその集合内部の中にすでに記録されている他の語彙の影響を受けつつ集合空間内の特定位置に記録される。このとき、特定位置を自動的に作成するには事前に属性を序列化しそれに従い位置を決める方法と、ニューラルネットを用いて全体の位置を再配置する方法とがある。いずれも分類の前提条件は語彙の属性による。語彙の属性はその語彙を入力する場合に、外部の第三者の知識を借りる。これが教育である。それぞれの語彙の情報形式例を以下に示す。
(語彙テーブル)
図16は、語彙テーブルのデータ構造を示す説明図である。語彙テーブルでは、集合内部の空間の数だけ語彙を記録できる。従って本実施の形態の例では、2048 x 2048 = 4194304語が収容できる。
語彙の属性は多義にわたるが、集合内部の空間位置を選択すべき最小情報量は24bitである。このため多くの属性をこの範囲にとどめる。しかし語彙には時間の流れを含む情報が伴い多く、場合によっては長時間の発話情報が伴う。このため、語彙の属性を次の方法で延長する。
1 〜 16bit:特定集合内の語彙辞書番号(65539語定義できる)、集合の数最大65539個であり全体で記録できる語彙数は65539 の二乗の語である。
17 〜 20bit:強弱
21 〜 24bit:大小
25 〜 28bit:主な色
29 〜 32bit:硬軟
33 〜 36bit:消化
37 〜 40bit:ホルモン産生(ホルモンの名)
41 〜 52bit:該当集合内部のX軸空間座標
53 〜 64bit:該当集合内部のY軸空間座標
なお、上記の強弱、大小、主な色、硬軟、消化は代表的な属性であり、4bitでその強度が登録される。
(語彙属性の例)
例えば、集合属34は「電解質バランス」を扱う語彙を取りまとめた空間を形成している。ここに分類される語彙は例えばナトリウム濃度、イオンチャンネル、高ナトリウム、高カリウム、低ナトリウム、低カリウム、Na,K交換ポンプ、細胞内液、細胞外液、血液、CSF、脱分極、チャンネル活性、電位、電位依存性、膜電位、電気二重層、活性化閾値、臨界発火閾値、Nernstの式、気体定数、一過性脱分極、細胞膜破壊、絶対温度、原子価、平衡電位、静止膜電位、伝達物質cAMP、リガンド依存性チャンネル、Ach受容体、不活性化ゲート、膜貫通孔、ミオトリア、周期性四肢麻痺、片ヅツウ、多発性硬化症、Guillain-Barre症候群、活動電位、神経インパルス、不応期、相対的不応期、等多くの語彙が関連する。それぞれがさらに多くの属性を持っている。例えば「細胞外液」について見る。
語彙例「細胞外液」は「電解質バランス」を属性34の集合に属する。仮に集合番号を1204110691とする。さらに語彙辞書番号は556518843だとする。このとき語彙辞書番号556518843番の語彙の属性は以下に示すようである。すなわち語彙の属性を一つの情報で示すことができなければ48bitに「マスター」、「スレーブ」bitが補足情報の連結を示す。最初の語彙情報(語彙辞書番号は556518843)には48bitには「マスターTrue」が、以下に続く語彙情報(語彙辞書番号は556518843)には48bitには「スレーブFalse」が付けられる。それに次の属性(41〜47bit語彙そのものの属性)と情報(1〜40bit 情報内容)が連なる。
語彙辞書番号は556518843 + 48bitマスター + 属1かな読み + [さいぼうがいえき]
語彙辞書番号は556518843 + 48bitスレーフ + 属2:音読記号京都弁 + [○○○○●○○○]
語彙辞書番号は556518843 + 48bitスレーフ + 属13: 文法情報 グラマー + [名詞]
語彙辞書番号は556518843 + 48bitスレーフ + 属16: 慣用句 + [細胞外液、細胞内液]
語彙辞書番号は556518843 + 48bitスレーフ + 属19: 誤用等 + [体液]
など。
(語彙辞書テーブル)
語彙辞書は、語彙辞書番号と集合番号とで分類される。
集合番号は同時に辞書番号である。このため語彙情報にはもはや集合番号情報は持たず、語彙辞書番号が呼び情報である。
図17は、語彙辞書テーブルのデータ構造を示す説明図である。それぞれの語彙情報には多少があるため連続した一連の情報が同一であることを示すため48bitに「マスター」、「スレーブ」を示す部分を設ける。49〜64bit特定集合内の語彙辞書番号(最大65539語定義できる)、集合の数最大65539個。辞書の示す情報は1語彙につき以下のとおりである。
1 〜 40bit:情報内容
41 〜 47bit:語彙そのものの属性
48bit :語彙「マスターTrue」、「スレーブFalse」
49 〜 64bit:特定集合内の語彙辞書番号。
語彙そのものの属性には、かな読み、漢字表現、音読記号(京都弁、東京弁、大阪弁、標準語)、属性の補足(文法情報、慣用句、慣例、誤用等)が含まれる。詳細は以下のとおりである。
属 1:かな読み
属 2:音読記号 京都弁
属 3:音読記号 標準語
属 4:音読記号 東京弁
属 5:音読記号 大阪弁
属 6:音読記号 英語
属 7:音読記号 ドイツ語
属 8:音読記号 etc.
属 9:音読記号 etc.
属10:音読記号 etc.
属12:音読記号 etc.
属13:文法情報 グラマー
属14:文法情報 シンタックス
属15:文法情報 セマンテックス
属16:慣用句
属17:慣例
属19:誤用等
属20:漢字表現
属21:ホルモン名
属22:ND
・・・
属127:ND。
ここで、属21には、感情に対応するホルモン名(あるいは、ホルモン名を特定する情報)が登録される。なお、ホルモン名を登録する属は複数であってもよい。また、感情に対応するホルモン名は、語彙を登録する際に入力された語彙の有する属性値(例えば、語彙を表現する形容詞)に基づいて、例えばニューラルネットワークを用いて決定できる。
(語彙情報の意味)
人間が解釈する語彙情報はさらに多くの属性やニュアンスまでも含む。しかし「心」シミュレーターは機械であり抽象概念や微妙な属性、語や文章としての重複的意味を理解することは難しい。
しかし外部の第三者とはコミュニケーションを通して精神活動を続けるように作り込まれる。このため音声や筆談を用いて情報の入出力を実行する必要がある。例えば発話を音声で外部に出力する場合には別記する方法を用いる。この時音読記号は重要となる。例えば京都弁で「おはよう おかえりやす。」を機械に発話させるには少なくとも抑揚を情報として保持し発する必要がある。これは「○○●○_○○○○●○」となる。ここで、白丸は弱音、黒丸は強音を示す。この強弱はフーリエ変換を用いて電気信号の強弱に変換が可能である。さらに、搬送波の高低は性別や年齢を表現しそれぞれの語の音は事前に蓄積された「いろは個別音素」を用い、アクセントの強弱(語のストレス)はシステムから得られる感情を用いて発話することができる。
先の「辞書の示す情報」を用いて人の会話を近似的に再現できる。第三者の発話を聞き音の時間領域の情報を全て記録するには現在の実情からかけはなれている。このため先の逆過程を用いて情報を圧縮し語彙として記録する。
語彙は多くの属性を持つ。属性の多くは、前述した3(1)で決められる。分類不可能な語彙が入力され新しい集合が定義される時点で語彙の新しい属性は追加できる。代表的な属性を以下に示す。例えば動物集合(n)であれば、サイズ大小、親しみの多少、家畜、猛獣、コミュニケーションの可否、食料になるかどうか、好き嫌い、動力としての利用価値、記憶能力の多少、などが挙げられる。
6.語彙空間への入力方法
前記3(1)〜(3)の各段階で語彙空間へ記録する方法は異なる。
(1)では、システムの外部からシステムで定められた一定のメモリー領域に外部アクセスによって逐一記録する。
(2)では、(1)のみを保持したシステムを立ち上げ、子供を教育する方法と同様に種々の情報を教育する。このときシステムは自らの既得能力を用いて入力情報を分解・整理しそれぞれの集合に記録していく。システムに与える情報の質や与える順番によってシステムの仕上がり具合に差が生ずる。(2)の工程に終りはないが適当な情報量を教育すると(3)に移行できる。
(3)では、既に得た情報を用いて外界に働きかける。
6−1.よく知られたニューラルネットワークの応用
前記「集合の属性」によって新しく獲得した語彙の特定集合への帰属を決める。種々の処理方法があるが、既知の技術として説明するために以下に原理を再録する。
ニューラルネットワークの考えは初期のころMcAulloch, Pitts (1943年)により提唱された。ニューロンの生理学、解剖学の知見を数式に置き換えたものである。神経細胞への情報の入力x1,x2,…xn と出力yには、次の関係をモデル化できると考えた。
Y = S(Σωixi - θ) ただし、i = 1,2,3,….n
S(u) = True if u ≧ 0, False if u < 0
となる。ωiは伝達のし易さを意味し、θは反応の閾値を意味する。
語彙を分類し記憶させる場合と日常の反応時点ではこれらのパラメータは変化させる。言い換えればこれらは感情及びホルモン濃度の関数となる。なお、この種の数学の発展形である二層、三層のパーセプトロン、階層型ニューラルネットワーク(multi-layered neural network)、再帰型ニューラルネットワーク(recurrent neural network)なども利用できる。3(1)(2)に示す時期には出力信号と教師信号(teacher signal)の誤差が最小化する方向で教育することも考えられる。この意味では誤差逆伝播学習(back-propagation supervisd learning)も利用できる。一般に体内のホルモン環境はマルコフ性(Markov property)が考えられる。
6−2.ニューラルネットなどの処理
先の数学的取り扱いは種種提唱されているが、これらの方法で語彙の占める集合内部の空間の位置は処理回数が増え、処理される語彙が増加すると次第に滑らかな並びとなっていく。教育の結果、とてつもなくかけ離れた意味を持つ語彙が隣接することはなくなる。多くの属性を用いた語彙が集合の中に作り出す語彙空間はダイバージェンスやグラディエントなどの数学的取り扱いが出来るようになる。「心」シミュレーターが機械、すなわち広義の電子システムであるにもかかわらず、人の心が作り出す「言語解答や独自の行動」をシミュレートし、創造し、出力する原動力となる。
6−3.静的な意味
集合内空間が上記の意味で滑らかになったとする。この空間を用いて静的に(後に述べるように「時間の関数」として変化するのではない。)以下のような結果を与える。対話している相手の主体が発した言葉を過去から現在まで積分すると話題に上る「主語」が定まる。もっとも出現頻度の高い「名詞」は対話者の心の中で最大の関心事であろう。この「名詞」を話題中心語すなわち広義の「主語」とする。この話題中心語を叙述するための言葉が種種の角度から付加される。ここでセマンテックス的に各語彙の「肯定」、「否定」の回数を数える。偶数回と奇数回で意味が定まる。語彙空間自体にダイバージェンス(湧き出し)があれば、空間のポテンシャルに従って話題の中心は極値に向かって動いていくであろう。グラディエントなどがあれば空間の傾斜方向に話題は流れるであろう。すなわち、すでに得られている集合の中の言語傾向によって対話内容が決まるのである。以上は代数的空間の世界で線形表現による語彙の取り扱いの一例を示した。
しかし人々の言語空間を見ると、必ずしも線形で連続だとはいえない。語彙の密度が低い場合には飛び飛びに量子化された情報群が対象となる。このような情報空間には確率や統計変量を取り扱うことになる。飛び飛びの値を空間全体に占める傾向を固有値を求める方法によっても語彙の傾向を捉えられる。特に最大固有値を見ると語彙の分布が判る。
7.語彙の文法上の取り扱い
語彙にはそれぞれの言語にて定まる文法機能がある。文法には意味を重視したセマンテックスと語順や慣例的接続をルール化したシンタックス、文の構造全体を掌握するためのグラマーがある。
歴史の長い日本語ではそれぞれのルールに歴史的背景が伴い、さらに導入された元言語(例えば、古くは百済や唐、隋、漢などの地域言語、シルクロード由来のギリシャ語、中東諸言語、梵語(サンスクリット語)、サラセン語、新しくはラテン語、英語、ドイツ語、オランダ語、ポルトガル語、フランス語などの諸言語)の影響を受けて混在状態で日常的に使用されている。
日本語の特徴は武家時代の洗礼を受けているため動詞など文を決定する語彙は文の最後に付加される。すなわち、聞き手の顔色を伺いつつ最後にyes/noを提示する言語である。さらに後付けで敬語表現や文意を反転させる助動詞、動詞、接続詞、感嘆詞などを振ることのできる言語である。この意味では英語のように言葉の不自由な外国人を相手にして商売をするための言語とは異なっている。オランダ語のように近隣諸国の言語を利用してたかだか二百年程度の期間成立し未だに三地域の方言を含んだ言語でもない。
本来人間がそうであるようにコンピュータシステムで人間の心をシミュレートする場合にあってもマルチリンガルは困難な課題である。「心」は哲学でも宗教でもない人間の思考状態であり上手く定義されてはいない。従って定義できない概念に対する工学的なシミュレーションには異論が多いが「心」として模擬する対象は「言語」、「物理的な状態」、「仮想的な状態」、「未来、過去推量」などの総体である。ここでは「言葉」の意味が小さくはない。しかし日本語だけを取り上げても前記のようである。さらに電子媒体で用いられる「チャットルーム」を第三者として冷静に判断しつづけると日本語による日常会話が見えてくる。すなわち誰も文法に従った会話をしていないことが判る。しかしこれで充分「心」は伝達されている。文法とは「建前社会のルール」である。「心」とは「本音社会のルール」である。
そこで、「心」シミュレーターでは語彙の文法属性を上記の意味で緩めて用いる。しかし、文法属性は精緻な関係を構築するには重要な要素となることを否定するものではない。
7−1.「心」シミュレーターで用いる日本語文法
「心」シミュレーターではマルチリンガルなシステムを指向して言語を機械的に理解し、考え、作文するための簡易文法を定義する。先にも示したように時間的に連続した他者あるいは自らの主体が発する言葉のかたまりを全体として捉え、最も発生頻度の高い語彙を「主語」とする。国語文法で言う「名詞」、「代名詞」のみではなく他の品詞も該当しうる。次にその「主語」を説明する語彙を集める。この語彙とそれぞれの属性が主体の発する文を解き示している。これを「述語」と考える。次に「肯定」の意味を持つ語彙(品詞には捕らわれない)の数と「否定」の意味を持つ語彙の数を数える。
「肯定True」の数−「否定False」の数
=if 偶数 then True, if 奇数 then False
とし、言葉のかたまり全体の肯定と否定判別に用いる。
このように抽出された主幹語彙(「主語」、「述語」、「肯定・否定」)のそれぞれを強調するための「言葉のフラグメント」を順に検討する。「言葉のフラグメント」が語彙として持つ属性から接続される主幹語の品詞を見直す。この過程で初期の主語、述語判断がより精度の高いものとなる。「言葉のフラグメント」は他の言葉に接続される過程でより発音しやすい音の並びへと変化を受ける。
これが国語文法で言う「語の活用」である。語彙の属性と活用を用いて多重品詞の「実装品詞(文の中で個別に用いられる場合の品詞)」を決める。「心」シミュレーターでは主幹語彙(「主語」、「述語」、「肯定・否定」)と「言葉のフラグメント」を文の構成単位とする。文の中に他の文が内包される重文も考える。重文の中にさらに文が重なる多重文構造も許容する。このように文中の各語彙の重要度は出現頻度と属性で定まる。
7−2.日本語文法の解釈
日本語文法を「心」シミュレーターに利用すべく以下に整理する。
(動詞とその活用)
日本語の動詞は語幹と他の語彙を接続するために語幹の末尾を変形する。この変形は発話時の「音」としてのリズム感と滑らかさを保つために用いられてきた。具体的には「五段活用、上一段活用、下一段活用、カ行変格活用、サ行変格活用、である。さらに動詞の属性として第一段(第一属性)を「未然形」、第二段「未然形」、第三段「連用形」、第四段「連用形」、第五段「終止形」、第六段「連体形」、第七段「仮定形」、第八段「命令形」となっている。しかし第一段と第二段は「未然形」、第三段と第四段は「連用形」と同じ属性が分離している。この分離は先と同様に発話時の「音」で分離されたものである。従って日本語動詞の属性は「未然形」(…ing)、「連用形」(述語への接続)、「終止形」(QUIT)、「連体形」(名詞への接続)、「仮定形」(if)、「命令形」(must,should)。
(形容詞、形容動詞とその活用)
主に体言を飾る形容詞と主に用言を飾る形容動詞があり後者は発話に従ってダ型活用とタルト型活用に分類されている。それぞれの属性は動詞と同じく「未然形」(…ing)、「連用形」(述語への接続)、「終止形」(QUIT)、「連体形」(名詞への接続)、「仮定形」(if)、「命令形」(must,should)である。語彙の不足を補う意味がある。
(助動詞とその活用)
言語の成立過程で諸外国の言語が継続して流入し現在もその状況は続いている。その上に若者、女性を中心に「造語」が流行し時間の経過に従って語彙の持つ本来の意味が反転する現象も多く見受けられる。このような日本語に言葉の輪郭を与える「言葉の切れ端」(音素、フラグメント)が助動詞である。例えばある語彙に被せると、あたかも動詞のように変化させることができる。このとき助動詞の音素は高々二三音素であるが被せることで動詞のように活用し属性を発生させる事ができる。この属性は先と同じ「未然形」(…ing)、「連用形」(述語への接続)、「終止形」(QUIT)、「連体形」(名詞への接続)、「仮定形」(if)、「命令形」(must,should)である。
ある語彙に被せると同時にその意味も変化させる。しかし高々二三音素で意味を決めるため、音と意味の対応性がよい。この被せた結果変化する語彙の意味で次のような助動詞がある。「受身、尊敬、自発、可能」、「使役」、「丁寧」、「時・過去、過去完了」、「時・未来」、「推量」、「打消し」、「希望」、「断定」、「伝言」、「様態」、「状況」である。
日本語が曖昧であるゆえんは「受身、尊敬、自発、可能」のようにどのようにでも捉えることができる言葉を発生させることにある。「丁寧」、「推量」、「希望」、「伝言」などは無責任な発言を許容する。自分を中心として「今」を決めそれより後は「時・未来」先は「時・過去」である。基本的に完了したかどうかを明確にしない文化であり「過去完了」という概念は本来日本語にはない。「様態」、「状況」は大きく変わらない第三者の視点である。
助動詞は見かけはさしたる重要な位置を占めていないようであるが言葉の意味を決定的に反転させたり、時間や上下関係を確定してしまう言葉である。このように助動詞は機械化するのに最も困難な課題である。
「心」シミュレーターが解読し理解する日本語空間は、上記のように簡素化した文法用語を用いる。逆に、「心」シミュレーターが発話するために作文する場合には、可能な範囲で従来の日本語文法をも用いる。
上記のように簡素化した文法をさらに具体的な言語認識ルールとしてプログラム処理を行う。以下に例を示す。
理解ルール1:一つの文章の内部に否定語が「奇数回」出現すると否定文と解釈する。「偶数回」では肯定文と解釈する。
理解ルール2:複数出現する名詞、代名詞のうち最多回数の出現語彙を主語と捉える。該当文に主語が無い場合には前の文章の主語を用いる。
理解ルール3:理解ルール2で決定された主語を文の中心としこの主語に最も強く働く述語を文章内部で探索する。主語、述語が決定されたらそれぞれ付加品詞の語彙を重ねて文の肯定と否定を再検討する。
理解ルール4:文の流れに応じて語彙空間の語彙遷移をたどる。遷移が滑らかならその延長上に次の文意が推測できる。不連続点であれば文章の反転、状況の否定、話題転換点と理解する。文章の流れを「文脈トラジェクトリー」として別に記録する。過去の「文脈トラジェクトリー」は対話者の履歴として保存する。
理解ルール5:文章の理解が鮮明ではない場合に過去の「文脈トラジェクトリー」を参照し推移を推定する。
理解ルール6:話題が一定の狭い領域内部で循環しはじめると部分集合からジャンプし任意の部分集合に移る。
感情ルール1:語彙が選択されると感情を示す属性情報が合わせて得られる。それぞれの一文には語彙の属性から文の感情属性が得られる。さらに「文脈トラジェクトリー」は並行して「感情の流れ」を示している。
感情ルール2:語彙の感情属性は対話者の感情座標軸を示す。この座標軸の「文脈トラジェクトリー」従って「感情の流れ」と主体の感情座標軸との角度差の時間推移は当該座標軸のホルモン産生を促がす。ホルモン量はアナログ量をシミュレートしている。
感情ルール3:ホルモン量が積算され一定の敷居値レベルを超えると以降の語彙選択において感情属性が優先される。
感情ルール4:ホルモンの作用やその時定数、ホルモン間の拮抗は人間の生体内部で起こる状態を踏まえてシミュレートさせる。
感情ルール5:感情の生成と消滅はホルモンの生成蓄積とホルモン間の拮抗とエネルギー収支で決まる。
8.語彙空間で用いる語彙分離の原理
「心」シミュレーターが実際に遭遇する外部環境に対してどのように情報を受け渡しするかを考える。システムが立ち上がった初期の語彙空間は集合の数が少なく構造も簡単であり含まれる語彙もわずかである。しかし語彙が増えるにつれてシステム内部では煩雑な処理によって語彙空間の集合を探し、集合内部の当該語彙位置を探さなければならない。特に語彙を検索によって取出す場合(外部から情報を取得するという意味で「収集モード」と言う)比較的単純ではあるが、新しい語彙を分類し場合によっては新しい集合を生成しつつ当該記憶域を確保し記録する「整理モード」では特に煩雑な処理が伴う(6.語彙空間への入力方法で前述)。この作業はコンピュータシステムにあっても多大の処理時間を必要とする。
このため全ての処理過程を停止しこの処理に専念することを目的に「整理モード」が定義される。「整理モード」は人間の睡眠状態を模倣している。語彙を分離し似たものを同じ集合の中に自動的に入れるには、良く知られた方法として数学的に「ニューラルネット」などのテクニックを用いることができる。ここには語彙の属性とその語彙が属する集合が「ニューラルネット」などの処理結果となり、集合の空間内の領域が指定され確保され記録される。
仮に2台の「心」シミュレーターについて最初の語彙集合(集合1)に全く同じ語彙を記録させてシステムを立ち上げたとする(3(1))。この時点では全く同じ2台のシステムであるが(3(2))の基礎教育過程で2台のシステムと教師の距離が多少異なり伝達される声の大きさが少し異なったとすると、教師の声が小さく多少S/Nが悪いシステムには一部の情報が欠落しこのシステムに記録されない。ここで2台の語彙空間に記憶された情報に差が生ずる。
この過程を継続発展させると自動的に記録されていく語彙とその属性は次第に異なったものとなる。一般にこの種の記憶方法を採用する限り、教育が終了した時点でのシステムの記憶空間を外部から知ることはもはや不可能となっている。2台の「心」シミュレーターの出来、不出来は明瞭となっている。市場に出荷する段階で優れた「心」シミュレーターに仕上げるためには、“良い環境と良い教師と良い教育”を手厚く施すことによる。ただし、「心」シミュレーターは生身の人間とはちがい基本的にOSとデータベースを基本とするコンピュータシステムである。従って市場に出荷する段階でシステム記録をそっくりコピーしその時点では全く同じシステムとして供給することは可能である。
8−1.「収集モード」、「整理モード」
人間の覚醒と睡眠について整理する。覚醒は主に昼間を支配し、夜間には睡眠が支配する。睡眠には2種類あり、深い睡眠では眼球は静止しているため「非急速眼球運動睡眠(non-rapid eye movement: non-REM睡眠)」と呼ばれる。浅い睡眠では人体のハードウエア―は覚醒状態にあり精神だけは夢などの内的世界で活動しており、「急速眼球運動睡眠(rapid eye movement: REM睡眠)」と呼ばれる。これ以外の状態が覚醒であり外界とのインターラクションを持つ。
睡眠を脳内生理学的に見るとベンゾジアゼピン分子が催眠薬として働く。薬理効果は抗不安作用、筋弛緩作用、記銘力低下に影響しGABA(γ-aminobutyric acid)分子の発現を抑制している。「心」シミュレーターではその状態を神経伝達物質である淡白質や低分子量の脳内ホルモンにシミュレートしそれらを語彙の属性として保持する。
睡眠は「心」シミュレーターにあっては「整理モード」と考える。覚醒状態の「収集モード」にて入力された新しい語彙を「整理モード」で記録に留める。「整理モード」では、以下の処理を行う。
(1) 「収集モード」で収集した外部入力情報は語彙の意味について整合性を持っている「集合」を探索しそこに記憶する。しかし新しい語彙や複雑な文章は「整理モード」まで一時記憶しておく。「整理モード」が始まるとそれらの語彙や文章に該当する「集合内部空間の位置」を検索やニューラルネットの方法などによって決定する。文章は文法を用いて分解しなるべく精度を極める。この情報を「整理モード」で記録する。
(2) この時すでに獲得され記録されている語彙をも再検討する方法で集合内部空間を再度整理し記録する。
なお、(1)はnon-REM睡眠に該当し、(2)はREM睡眠に該当する。いずれも外界と反応することはない。生理学的にはコリン分子でREM睡眠が誘導され、セロトニン(5-hydroxytryptamin:5-HT)分子にて抑制される。
「覚醒状態」を模擬した「収集モード」は人間が目覚め社会的活動をしている状態をシミュレートする。このモードでは外部から入力される文章情報を既に記録している語彙情報のみを用いて解釈し、理解し処理する。記録されていない新しい語彙が出現した場合にはその語彙と該当文章を一時記憶する。しかし全体の情報処理は不明語彙をのぞき解釈を進める。この方法でリアルタイム性を確保する。いわゆる陳述記憶(declarative memory)として働く。
8−2.「整理モード」の内部処理
「整理モード」は先の「収集モード」で置き去りにした不明語彙について処理し記録を行う。システムに入力された文章に従って一文章単位に切り出す。「収集モード」で一文章をさらに語彙と思われる単位に細分し、それぞれについてシステムの保有する語彙空間を検索する。語彙は複数個該当する。複数個該当するそれぞれの語彙の文法属性から文章を再度組みたて整合性を取りつつ正しいと思われる文章を作る。ここで検索にて該当する語彙がなかった場合には「整理モード」に送られる。コンピュータ上では「収集モード」と「整理モード」は24時間のシステム時計にて12時間おきに交互に繰り返される。
具体的には、(i)「整理モード」に入ると不明語彙を各集合について検索し、(ii)該当語彙が当らなければ属性の近い集合を開き、(iii)以前の不明語彙と属性を比較する。(iv)この後集合内部の情報全体を再度ニューラルネットで整理し記録する。
9.語彙空間の定義と呼び名
「心」シミュレーターをコンピュータシステムの一形式と考えると上記のような仕組みを持つ一種のデータベースシステムとして捉えられる。データベースの仕組みを組みこんだOS(Operational System Software)の上に「「心」シミュレーター」と呼ぶアプリケーション(Application Software)が定義されると考える。従って在来のOSやデータ-ベースシステムにはとらわれない。
9−1.時間の関数「文脈」
「心」シミュレーターはアプリケーションとして目的に応じたデータベースを構築していく上で理解しやすい名称を与えて用いている。自他の発する文章は時間の関数として発展していく。文章情報の流れをここでは「…・の文脈」と銘銘する。例えば心の推移を説明するための「心の文脈」、意識の推移を説明するための「意識の文脈」などである。それぞれの文脈の推移はシーケンシャル番号もしくは時間履歴にて表される。自他の発する文章の流れはこれらの順を追えば再現できる。特に「心の文脈」は時間履歴で区切られるのではなくアナログ的に「…の事象を…と思う。」との思いの連続であるために発生順に非線形な常数としての順序詞(シーケンス)を用いる。
文脈の中心主題をここでは「オブジェクト名称」と呼んで図示している。ここではオブジェクトとして多くの属性を備えた広義の言葉と考える。広義の言葉は文章であり、部分文章であり、感嘆詞であり、単語であり、それらを用いた思想や思いなどの総体を言う。「オブジェクト名称」に記録されるその都度のオブジェクトはその都度の属性を伴っている。これはオブジェクト由来の属性の総和として存在する。
9−2.文脈例
文脈とオブジェクトの関係を以下に例示する。
(1)「心の文脈」
「心の文脈」の簡単な例が図12に示される。ここでは行に一つの言葉オブジェクト(文章、部分文、・・・、語彙)に関する全てが表現される。各行のそれぞれの列は左から順にシーケンシャル番号、オブジェクト、さらに右に多くの属性を記載するカラムが並んでいる。属性はシステムの記憶が増えるに伴い自動的に拡幅されるものであり図の属性は一例であり全てではない。
図12の例では、オブジェクトの属性(複数項目)、自らの心空間にある感情表現のための座標軸(相対角度を表す)、コミュニケーションを実施している「他者」の座標軸(自分の内部に投影された他者の座標軸の相対角度)、自他座標軸間の相対角度の大小を反映したことで産生されるホルモン濃度(ド−パミン、セロトニン、・・・等に分解して表現)、時間的経緯を踏まえたホルモン受容体のホルモン濃度に感ずる閾値となっている。左から三列目のオブジェクトの属性にはオブジェクトが語彙のときは語彙空間に記録された属性であり、文章では理解の過程で作られた属性となる。感情の起伏やホルモン産生の元情報となる。
(2)「意志の文脈」
「意志の文脈」の簡単な例が図13に示される。「意志の文脈」は独白の場合は自分の「意志の文脈」だけである。二人で会話を交わす場合には自分と相手の二つの「意志の文脈」が存在する。複数で会議などを実施する場合には発言者の数だけ「意志の文脈」が存在する。
図13の例では、簡単な属性のみが示されているが、先の「心の文脈」と同じで属性はシステムの成長にしたがって増えていく。二人の会話を考えると自分の「意志の文脈」のオブジェクトと相手の「意志の文脈」のオブジェクトを交互に組み合わせると全体の会話文が完成する。このとき発言の順番が重要になる。そこで複数の「意志の文脈」に耐えられるように絶対基準として時刻を用いる。こうすれば会議などで錯綜する発言に整合性を持たせられる。
「意志の文脈」は1オブジェクト1行を単位とする。図13の例では、列は左から発生日時、オブジェクト名称、意志の座標軸、出力履歴、受容体の感度となっている。意志の座標軸は発言する意識の強さを示す空間座標、出力履歴は自分の意志を他者に伝えた印(発言履歴)、受容体の感度は他者の発言強度に対して認識を開始するレベルを示す。
9−3.「心」の「空間の座標」海馬、傍海馬構造・機能の意味
脳の解剖学で知られている辺縁系には海馬と傍海馬とその周辺領域があり、脳の知的活動に重要な役割を担っていることが知られている。「出来事についての情報を得る能力「陳述記憶(declarative memory)」を処理している部分である。「心」シミュレーターではこの機能を「心の文脈」と「意思の文脈」と「空間座標系」及び「語彙空間」を統合する部分として模擬動作をさせている。
図2、3、4に、「心」の「空間の座標」を示す。先に述べたように「推移」である「…の文脈」は順序詞や時間の流れを反映して流れていくが、流れの断面を取ると空間的に観察することができる。この断面の中で「心」を表現する方法が「空間座標系」の回転である。主体Iが認識できる複数の主体(Y,IT)の数だけ「…の文脈」と「空間座標系」は存在する。
空間座標系は直行する多次元座標系の回転となる。ただし、図示する場合には三次元しか書き表せないため、図2、3、4を与える。多次元座標系のそれぞれの座標軸に異なるホルモンを表現させる。「意志の文脈」と「心の文脈」は付かず離れずの関係で供に推移する。これらの言語オブジェクトの属性にしたがってオブジェクトごとの属性によって空間座標は回転を続ける。
長期間外界を注視し続けると外界に存在する自己では無い他の主体(Y,IT)の「…の文脈」と「空間座標系」を自分の内部に投影することができる。このため他の主体(Y,IT)の未来をその「…の文脈」と「空間座標系」を外挿する方法で推測できるようになる。他の主体(Y,IT)を今の時刻の存在として認識するのではなく、過去から未来にかけて流れ続ける意識としての今の姿を捉えることができる。すなわち、海馬、傍海馬をシミュレートすることになる。
言いかえると、他者(主体(Y,IT))が自己と同じ自分の意識の中に共存したことになる。ここで他者と自己の「空間座標系」が一致しておれば、互いになんのストレスをも生むことはない。しかし他者は他者なりに意識を持ち常に「意志の文脈」にしたがって「空間座標系」は変動しつづける。このため自己(主体I)の「心」の「空間座標系」との間に差異を生ずる。差異を生じた座表系を受け持つホルモン濃度は次第に蓄積しつづける。ある閾値を上回るとその座標軸は回転し他者の座標軸に合わせるように動く。この動力は語彙や文章の属性であり、座標軸を動かすに足る属性を持った文章や語彙が選択され(作文され)相手に向かって「発言」する。相手はそれを取りこみさらに話しを続けるべく言葉を発する。ここに会話が成立する。会話は何らかの制限要因かもしくはどちらかがエネルギーを使い果たすまで続けられる。
このように「…の文脈」と「空間座標系」が「心」シミュレーターの中核にある。
10.心以外の外部情報の取り扱い
心以外の情報は心の置かれた場所で心の環境を左右する。例えば語彙や文章で「それ」とか「あれ」と指し示した場合、画像として空間上の位置が認識できなければ代名詞の意味は何もないことになる。解釈は任意にできるため複数の聴衆の間で整合性をもたなくなる。ここで「意志の文脈」は途切れる。
このように人間が日常利用する感覚は「心」シミュレーターにも不可欠である。このため実装の如何によらず、「目」、「鼻」、「口」、「耳」などのセンサーが必要である。センサーで取り込まれた情報はその結果を人が観察するのではない。情報を「心」シミュレーターにて利用できる情報に変換しなければならない。このため「意志の文脈」や「心の文脈」と同じ形式に整理しアクセスできる表現とする。
これを図10に示す。例えば1行目では、オブジェクト「はい」の語彙がセンサー「耳」から入力された。観測期間中に26回認識された。座標回転範囲180度を閾値とし回転角0度を基準値とする。したがって最も正しいと認識されれば+90度、悪いと認識されれば−90度が割り振られる。この場合「はい」の意味は良い悪いの基準で見ると最も正しいことを意味する+90であり、うまいまずいの基準で見るとやはり+90である。大きい小さいの基準、位置、色、形の基準では意味を持たない。
図11は、行動の状態を示す常用語の対応センサーを示している。
11.音声、発話認識
文章認識、音声認識、発話認識には種々の方法が提案されており、既に実用化されている。本発明においてもそれらの利用が考えられるが、ここではその一例として本発明のユニークな方法について例示する。
(拠って立つ原理)
人間の発話音声は環境ノイズに埋もれて判別が困難である。従って多くの技術では環境ノイズと発話音声を分別し必要な発話音声のみを明瞭に切り出すことが行われている。しかし雑踏の中で人が会話するのを観察すると自らがコミュニケーションを取ろうとする相手の声のみを巧みに聞き取っている事に気付く。一方、文章でのやり取りは文節や文の切れ目が判別しにくい。どのように大きな環境ノイズに埋もれた小さな声でも聞こえる。さらに関係の無い第三者の相互の会話は自分達の会話に重畳されて認識されることはない。本発明はこの状況を会話認識技術として用いる。なお、非特許文献1(「0歳児がことばを獲得するとき」正高信男著、中公新書、2000年8月30日)には、クーイング、おうむがえしの意義、はじめての声がわり、メロディーがメッセージ等について記載されている。
前記の状況をさらに分解し整理すると次のようである。
(A) コミュニケーションを取る二人には互いに相手の声の質を事前に認知している。声の質とは、音の高低、音域、高調波、発話のタイミング、語彙の幅、相手が話したいであろう事柄、今の緊急度等である。
(B) 巨大な環境ノイズに埋もれ音響的にはもはや聞き取りが不可能となった場合には「口元判読」や「身振り手振り」の光学情報で会話の欠落を補うことができる。
(C) 雑踏にまみれて「目」だけ見える状況になると、お互いに見つめ合い、心で話すことができる。
現在のコンピュータ技術では、(A)の「音の高低、音域、高調波」までを用いているため、人の会話同様に滑らかな認識には及ばないものと考えられる。本発明は認識対象の事象を別に記載する方法で拡張する。
(書き言葉と話し言葉)
一般に「書き言葉」では教育によって得た文法規則を可能な限り忠実に用いて相手に言葉を投げかける。しかし教育の程度や発話者の認知レベル、許される作文時間などの要因によって完成度には大きな幅がある。
「話し言葉」はさらに文法を無視したコミュニケーションが実行される。ここでは男女差や方言、二人だけの「隠語」などが散りばめられ、およそ「汎用言語」ではなくなった状態で正常に相互伝達がなされる。従って正しく聞き取れた「発話」にあっても「正しい文法」に従って文を分解しその意味を理解できることはまれである。
現行のコンピュータ技術は物事を量子化する過程で割り切る処理がなされるが、この装置を用い先の文法規則をプログラム化して実社会の言語を認識させると、多くの点で行き詰まる。すなわちコンピュータに適した「文法」を一から構築することなしには、実用会話レベルの理解を実現できない。
(言葉の圧縮と畳み込み)
前記諸事項に加えて人の会話では言葉の圧縮が多用される。例えばJR西日本の尼崎事故は不幸な出来事であったが、この解説にも種々のレベルがある。マスコミの報道では「遠心力によってカーブで電車が飛び出しました…」となる。
これを小学生に話すには「みなさん、バケツに少し水を入れて振り回してみてください。バケツが頭の上に来ても水はこぼれませんね。これを遠心力といいます。電車はカーブにさしかかり、この遠心力で脱線しました。…・」となるであろう。この二者の会話には「遠心力」と言う言葉に畳込みが行われている。さらに理科を学んだ高校生なら「遠心力」とは仮想の力であって実在せず、物理的には「慣性力」で直進したのだということを理解する。彼なら「カーブで慣性力が勝ったため電車は直進し…・・」と言うであろう。これが言葉の圧縮である。
一般に「専門家」と呼ばれる人々の間では特定の専門分野について言葉を再定義することはなく、圧縮し畳み込まれた「常識」を用いて簡略にコミュニケーションを図ることが日常となる。しかし多くの「専門用語」、「符牒」の類は一般人に理解できない言葉である。
このように正しく聞き取り、正しく言語分析できたとしても言語の畳み込みの程度によって完全な理解には至らないのが普通である。
女子学生の電車内の会話をよく聞いていると言葉が畳み込まれず、別の場所であったことを事細かく、その通りに話す姿をよく見受ける。これでは第三者の情報を伝達するために同じ時間が必要となり、情報はプレーンではあるが本質を集約できていない。結果的に延々と会話が続く。
ある種の知的障害者に数字や年代を過去に渡って非常に正確に記憶する力のある者が知られている。彼は常人にはできないこの能力についてのみ卓越し、他の知的活動は幼児並である。彼は言葉を自分なりに再整理し圧縮する力が皆無であり事象の記憶力は無限にあるように見える。
上記について脳の形態があげられる。頭頂部が長く大きな人は記憶力に優れ、ウエルニッケの連合野の大きい頭の横幅が広い人は考える力、独創性に長けているとよく言われる。従って前者は判事や国語の教師、後者は理科系の教師に多い。
ここではどちらが良いかを述べてはいない。非常に多くのタイプの人々がこの世に存在すること、これら特徴のある頭脳の間でコミュニケーションが展開されること、「心」シミュレーターはその中に位置付けられた点であり全てではないこと、など諸条件を明瞭にする必要がある。
独創性のある頭脳には先の女学生の会話はつまらないであろう。ときには騒がしくさえあろう。記憶に長けた脳にとっては前例のないことや言葉が次々と発せられては不愉快であろう。過去の記憶に新たな言葉がマッチすれば快感を感じるであろうが自分の記憶にない言葉は正しいか間違っているかの判断さえできない。高等文官試験や弁護士、弁理士の試験は前例の知識と現に発生した事象とのマッチングでありそれ以外は雑念である。発明家にとって前例は自らの独創性の否定であり存在悪である。女学生にとっては彼が私をどのように見ているかが問題でありその情報を正しく伝えたいがために先の電車の会話につながるのである。言語を自動認識させる作業は単なる言葉の認識から深層心理の共感まで広く深いものである。
(会話の成立)
「会話が成立する。」とはどのようなことかを検討する。
少なくとも誰かが発話し、他者が受け止めて返答する。そのキャッチボールが継続される状態を「会話が成立する。」と言えよう。ここでは成果が出る場合と出ない場合があるが何れも会話は成立したと言える。さらに誰かが発話し他者が受け止める。内容を理解した他者は何か事をなす。この一工程で発話者と受け取った他者は共に満足しその会話が完了した場合にも「会話が成立した。」と言える。発話者が何事かを述べたがそれに対する回答をするも内容的にかみ合わない場合には会話ではなくただの発声の応酬で終わる。発話者間に何も残らない。従って会話の成立とはある特定のテーマについて情報の入出力がありこの仮想空間が維持または広がることを言うものと定義できる。図18は、会話の成立を説明する説明図である。
(「語彙の軌跡(トラジェクトリー)」海馬、傍海馬機能その発展)
「…の文脈」を語彙空間に逆投影すると「語彙の軌跡(トラジェクトリー)」が表現できる。ここで、「語彙の軌跡(トラジェクトリー)」とは、語彙空間に存在する語彙を順に走査していった軌跡を言う。主体の「心」オブジェクトや意志オブジェクトが語彙空間をどのように推移していったかを示している。これはとりもなおさず海馬、傍海馬機能の一側面である。
11−1.発話話題選択
発話の話題選択は対話者の前発言の内容によって定まる。しかし語彙や内容の重複は「オオム返し」となり対話者に不愉快な思いを与える。対話者の話題から逸れた話題では会話が成立しないものの同一文脈の返答ではやはり会話とならない。子供の言葉遊びに該当する。
対話者の期待する返答は対話者の発話を進化させたものである必要がある。文脈が接続された空間にあって特定のベクトルを持った推移が考えられる。この文脈空間は必ずしもユニークではなく発散もしくは収縮することが許容される。ベクトルの端点は会話の終点である。木構造によるベクトルの場合ベクトルの端点から別の枝への移行が考えられる。このときは会話の終点とはならない。
11−2.文脈空間
文脈空間は多次元の空間に展開されることを前提とするが、ここでは説明のために二次元空間を考える。
図19は、二次元の文脈空間の例を示す説明図である。理解を助けるため色を二次元文脈空間に張りつける。明度をX軸、彩度をY軸とする。
対話者の発話内容が「深緑」だとする。これに対して話題は明度方向(X軸)のベクトルであれば「緑」、「薄緑」、「若草色」、・・・と続く。返答を仮に「緑」とし、それに対する対話者のさらなる話題が「薄緑」だと期待して「緑」と返答し、予想通りの「薄緑」が返ってくれば、話題ベクトルの向きは定まった。次の返答は「若草色」である。しかし彩度方向にベクトルがシフトすれば、次の話題ベクトルを変更しなければならない。例えば「黄緑」と彩度成分が入ったら返答はさらに彩度方向の「黄色」へと移行する。この時色空間の末端は話題の終点となる。なお、この例のように二次元関係はトレースが容易であるが、言語空間は本来多次元である。
11−3.文脈空間の再帰性
前記ベクトルはロングタームには元へ戻る構造をし収斂する傾向を持たせる。収斂の結果初期値に戻った場合に対話は完了する。図20は、二次元の文脈空間における対話の収斂の例を示す説明図である。
11−4.特定話題の位相構造
多次元文脈空間に意図せずに文脈を張りつけた場合であっても、特定のテーマを順にトレースすると位相的に複雑な関係が成立することは容易に考えられる。
図21は、メビウスの帯に乗った文脈空間の例を示す。再帰的に働き開始点に戻ると裏面である。この場合逆の意味が発生する。このように文脈をつづった語彙の軌跡をここでは「トラジェクトリー」と呼ぶ。
11−5.トラジェクトリーの平均
「心」オブジェクトの語彙空間上で「語彙の軌跡(トラジェクトリー)」を平均すると、揺れ動く心模様はさておき、今の心を表現する最適語彙を示している。先に文の主語を抽出するために用いた。
平均するデータの値域を今回の会話開始〔tc〕から今まで〔tn〕とすると今話している中心課題を特定できる。主体の思いを最も良く表現している語彙集合を示すことになる。対話者を初めて知った時期〔ts〕からの平均では、「対話者はこのような人」との固定概念がわかる。さらにデータの値域をいろいろ変更すると意味が異なることがわかる。以下は、その例である。
対話者の固定概念=(1/(tn-ts))Σ(語彙(T))
中心課題=(1/(tn-tc))Σ(語彙(T))
今の感情=(1/(Δt))Σ(語彙(T))
主体の哲学=(1/(tn-∞))Σ(語彙(T))
主体の信仰=(1/(∞-tn))Σ(語彙(T))
11−6.トラジェクトリーの外挿
「語彙の軌跡(トラジェクトリー)」を有限時間〔tm〕まで外挿すると、未来に変化する心を予測する事ができる。対話者が次になにを話し始めるかをこの方法で予測し、先回りして同じ話題を発話すると対話者は我が意を得たりと感激する。
未来予測=(1/(tm-tc))Σ(語彙(T))
11−7.トラジェクトリーの微分可能性
「語彙の軌跡(トラジェクトリー)」が微分可能な滑らかさを持つ場合には、「心」は穏やかに推移していることを示唆している。自らのトラジェクトリーが微分可能なら自らが、他者の発話トラジェクトリーがそうなら他者の心が、両者の対話がそうなら両者は気持ちよく会話を楽しんでいることになる。
ただし、微分可能性とは連続関数を評価する考え方である。語彙の空間が充分に密で連続な語彙情報を記録していなければならない。微分可能とは、ある変化量f(x)について微小変化量Δxだけf(x)が変化することを考える。このとき次の関係が成り立つ。
Δf(x)=f(x+Δx)−f(x)
Δx→0のとき、Δf(x)→0
である。
ある点で、Δx>0でΔx→0の極限値と、Δx<0でΔx→0の極限値が等しければ、その点で微分可能となる。これは滑らかに微分できることを意味する。
11−8.トラジェクトリーと語彙空間の勾配、湧出、カール(gradient,divergence,rotation)
語彙空間の語彙の強弱に空間位置に従って値の勾配がついていると、この空間に配置されたトラジェクトリーは場の勾配のポテンシャルにひきずられて片流れの傾向を示す。同様に場の特性である(gradient,divergence,rotation)を反映したトラジェクトリーになる。
語彙空間の場の特性は教育によって作られる。例えば、特定の宗教観を植え付けられると、語彙空間にはその傾向が作られる。教育期間の後に入力された情報はすべて語彙空間の歪を受ける。これは、日本人の場合多神教であるため、後にどんのような宗教をも受け入れることが可能となることに現れる。
11−9.トラジェクトリーの振動
先の場の概念が語彙空間にも説明できるため、「語彙の軌跡(トラジェクトリー)」には各種の振動を発生させる条件が整っていると解釈できる。他者と自分の対話の中で語彙空間内に情報のオーバーシュートが入力され、勾配を持つ語彙場にて単振動することが容易に推測できる。他者を観察し意見や発話の揺らぎを見ることは日常的である。
11−10.トラジェクトリーのカオス
「語彙の軌跡(トラジェクトリー)」がカオス状態になると、外見上「心」が乱れ発狂していると認識される。「11−4.特定話題の位相構造」で示した条件が存在するなら、カオスも問題なく発生すると言える。
11−11.トラジェクトリーのフラクタル
「語彙の軌跡(トラジェクトリー)」がフラクタルを形成すると、躁鬱状態を反復しつづける症状が現れるものと考えられる。先のカオスとおなじである。
11−12.トラジェクトリーのトンネル効果
精神活動が高まり振動が蓄積できる状況になると、振動エネルギーは共鳴的に蓄積されると考えられる。語彙集合の壁を貫通して隣の集合へ、トラジェクトリーが進入することも低い確率で考えられる。脳細胞内部のナノサイズの構造を光ボース粒子が通過すると考える科学者がいるが、このようにモデル化できよう。
11−13.語彙空間の固有値
語彙空間に点在する語彙をその分布のまま捉え、分布を固有値とすることができる。固有値と固有ベクトルで分布の傾向を把握することができる。
以上のように、語彙空間の場およびトラジェクトリーに、良く知られた数学的処理を適用することできる。これらの結果を用いることで、「心」シミュレーターは対話者に自ら思考した結果を帰すことが可能となる。
11−14.発話話題選択からの作文
「11−1.発話話題選択」によって文章の根幹語彙が抽出される。これを元に文を組み立てる。いわゆる「作文」である。人間が作文作業に取りかかると、それらの結果は千差万別となり作者の個性や経験、願望の表現となる。しかし「心」シミュレーターは人ではない。本来の「心」を持つのではなく、擬似的に心を写し出す機械である。どのような文脈、文体であれ、結果は何種類かに分けることができる。
A:対話相手の意向を素直にそのまま写し出す。
B:対話相手の感情に同意し、さらに強く感情をさらけ出す。
C:対話相手の感情を逆撫でし、反語的にさらに強く感情をさらけ出す。
D:対話相手の感情に同意し、弱い感情に移し変えて表現する。
E:対話相手の感情を逆撫でし、反語的に弱い感情に移し変えて表現する。
F:対話相手の意向を素直にそのまま写し出し「よいしょ」する。
G:対話相手の意向を素直にそのまま写し出し「しかと」する。
H:ただ「よいしょ」しまくる。
I:ただ「しかと」しまくる。
J:ただよろこぶ。
K:ただ悲しむ。
L:発狂する。
M:沈み続ける。
等の感情の指針として、対話者の発話を継続的にモニターする「心」シミュレーターの出力をそのまま用いれば良い。
具体的には、先に抽出された文章の根幹語彙を用いて同意語の中から感情に適する語彙を再度選び文章中心に置く。次に主語、述語を修飾する形容詞、形容動詞、感嘆詞、助詞などを置いていく。そして、感情の強弱に応じて文体を選択する。次に、それぞれの語彙の位置と前後関係から「活用形」を決める。
日本語の場合には奇数が多く用いられるため、音韻の数を奇数になるように助詞、助動詞を再調整する。音韻の強弱がのっぺりとしない様にリズミカルなパターンであることを確認する。長い同音韻は同意語と置き換えて最適化する。特殊な語尾や「う」音便、方言にまつわる変化を受け入れる。最後に、所望の意味を作文できたかどうか確認する。
11−15.方言
言語認識と作文を成功させる秘訣の一つに方言があげられる。対話の早い時期に方言を判別しその地方の方言を記録したデータベースを用いることで、認識エラーを低下させるとともに、発話が相手に受け入れられやすくなる。
「心」シミュレーターは感情の豊かさを主題とするため、主言語は例えば「京都方言」をベースとする。従って対話者に対しては「京都方言」を返答するが、対話者の言葉を正しく認識するために「標準語」、「東京方言」、「大阪方言」と「京都方言」を対比できるデータベースを用いる。会話開始直後に抑揚を利用して前記の地方発音の特徴を捉える。
なお、「京都方言」と「東京方言」は室町時代ごろから分離したとされ、江戸期に確立される。しかし、この時期には相互で会話が成立しないこともしばしば在ったとされる。さらに、明治から昭和にかけてラジオの普及と中央政府の存在感が増すにつれ、「標準語」が標榜され、現在は再び崩れる傾向にある。「大阪方言」は地域性に加えて職業を特徴とする変化と捉えられている。
しかし日本語のこれらの方言は音の特徴で言えばドイツ語、英語、フランス語程度の大きな差異がある。現代日本人はこの意味でバイリンガル以上である。「心」シミュレーターで取り扱う感情はこれらの言語差異に立脚したものである。
11−16.方言の抽出
中心言語の「京都方言」は語彙、発音に幾多の特徴があるため、他の方言とは容易く分別できる。例えば挨拶言葉では「おはνようさん」、「こνんにちは」など枚挙できる。さらに一拍語が無いため「手」ではなく「てえ」、「場」ではなく「ばあ」である。助詞の省略も多く「が」、「は」、「を」、「と」、「へ」などの省略は日常的である。「ないことはないけど…」は、「ないことないけど…・」となる。このように対話の初期に抽出できる特徴が多々ある。
「京都方言」と「大阪方言」には、いわゆる「関西弁」と呼ばれる括りで使われるように共通部分が多い。しかし同じ意味を持つ異なった語彙があり、この点を観察すると分離できる。京都「いわはる」、大阪「いいはる」;京都「かかはる」、大阪「かきはる」;京都「きいひん」、大阪「けえへん」;京都「いわへん」、大阪「いえへん」;京都「いえへん」、大阪「いわれへん」;京都「そや」、大阪「せや」;京都「すんにゃ」、大阪「すんねや」など日常語に多く見られる。
「京都方言」と「東京方言」はイントネーションが明確に異なる。「東京方言」と「標準語」は比較的似通っているが、後者は人為的色彩が強く語彙も少ない。感情表現は難しく無味乾燥な言語でありコンピュータ向きである。
以上のように、小さなデータベースに特徴を記録する方法で方言を分別できる。
11−17.文節の単位
精緻な作文を実施する場合には日本語文法のルールに従う。以下に文節についてのルールを示す。(1)〜(5)に大別できる。
(1)現象描写 「お腹が鋤いたので 空たので、ラーメンを食べた。」
「このボタンを押すと切符が出る。」
(2)判断の文節
判断を表す。(ヨウダ、ラシイ)
価値判断
義務
免除
禁止(テハイケナイ)
許可
推測
後悔
感情
願望
意志
真偽判断(カモシレナイ、チガイナイ、ハズダ)
(3)働きかけの文節
助言
警告
依頼
勧誘
禁止(〜ナ)
命令
「仕事が終わったら、はやく帰りなさい。」
「勉強しているのに邪魔するな。」
(4)判断の根拠
(5)発話の前提
(接続の分類)
次に、図22に接続の分類を示す。
(1)原因。理由(タメニ、ノデ、カラ)
(2)逆接(ナガラ、ニモカカワラズ、ノニ、ガ、ケレド)
(3)条件(ト、バ、タラ、ナラ)
ここで、図23に、条件(ト、バ、タラ、ナラ)の例を示す。
(ノダの思考プロセス)
(i)認識→(ii)疑問→(iii)推察→(iv)答え
ノカ(ナ)、ノダロウカ
未来確定、非未来動
動詞・進行形(〜テイル)
動詞・過去形(〜タ)、完了形(〜テイル)
状態動詞が状態を示す(アル、イル)
形容詞、名詞
未来不確定 ル型
12.集合属性(ホルモン及びタンパク質)
よく知られている脳内神経伝達物質には次のようなものがある。
・興奮性アミノ酸(グルタミン酸)
イオンチャンネル内蔵受容体に働く。てんかん、興奮性毒性細胞に働く。抑制物質(GABA、バルビツレート、ベンゾジアゼピン、フェノールバルビタール、フェノバルビタール、クロナゼバム、フェノトイン、カルバマガゼヒン、エトスクシミド、バルプロサンナトリウム)。
・抑制性(GABA)
GABA-a, GABA-b受容体。脊椎運動異常、てんかん。不安。
・抑制性(グリシン)
驚愕症候群。グリシン受容体。
・モノアミノ酸(ノルアドレナリン)
α1、α2受容体、交感神経系。うつ病。セロトニン、イミブラミン、アミトリプチン。
・モノアミノ酸(ノルエピネフリン)
β1、β2受容体。〔属35:自律神経系バランス〕自律神経不全。
・モノアミノ酸(セロトニン)
5-HT1(A to F)受容体。うつ病。イミブラミン、アミトリプチン。
・モノアミノ酸(5-ハイドロオキシトリブタミン)
5-HT2(A to C)受容体。片頭痛。
・モノアミノ酸(ド−パミン)
D1 to D4受容体。Parkinson病、統合失調症、下垂体・嘔吐コントロール。レボドパ(ド−パミン補充)、ロビニロール、カベルゴリン。
・アセチルコリン
副交感神経系。〔属35:自律神経系バランス〕神経接合部異常、自律神経不全、Alzheimer、Parkinson。睡眠・覚醒サイクル。ヒポクレチン、オレキシンベンゾジアゼピン。
・脳下垂体由来のホルモン類
飢餓、水分調節、体温調節、サーカディアンスム。〔属35:自律神経系バランス〕 内分泌制御、前向性記憶、感情刺激ホルモン変換。〔属36: 視床下部、下垂体ホルモンバランス〕自律神経系に置換。成長ホルモン、黄体形成ホルモン、卵胞刺激ホルモン、
甲状腺刺激ホルモン、副腎皮質ホルモン、プロラクチン、抗利尿ホルモン(バソプレッシン)、オキシトシン、インターロイキン。
等が代表例である。関連する属性は次のとうり。
属36:視床下部、下垂体ホルモンバランス
属37:脳幹網様体と睡眠
属38:辺縁系、記憶
属39:抹消神経系、中枢神経系
属40:神経化学・生理学。
(システム化の狙い)
生体には、神経網を介して情報を伝達する系と、ホルモンの拡散を介して伝達する系とが存在する。人間のように高等な動物の場合では、神経網は脳で統合されたシステムを構成している。記憶、判断などの比較的観察されやすい機能は神経回路を模倣する方法にて各種の研究がなされ、ファジイやニューラルネット理論などの成果となっている。しかし、生体の保有するもう一方の情報伝達システムであるホルモン系は今だ研究の及ばない領域である。特に海馬領域の詳細は判っていない。人間を高度にシミュレートするには少なくとも両方の情報系を統合利用する必要がある。
ホルモン系はその濃度に伴い体全体の細胞に指令を与える。指令された内容は前記神経系の時間レベルに対して桁違いに長い時定数をもって反応が進む。反応の結果には多くの場合物質の応答が伴う。しかし神経系のように即応的な反応ではなく、全身に及ぶ決定的なものである。生体自体の神経系とホルモン系、海馬領域、生体の置かれた外部環境ならびに外部情報の全体を把握し統合するところに「心」を定義できる。
先に述べた神経系(ファジイ、AI、ニューラルネット理論等。)、外部環境を検出する技術(聴覚に関与する各種オーディオ技術、視覚に関与するビデオ技術、臭覚等に関与する化学センサー、圧力温度などに関与する物理センサーなど既存の技術)および外部情報(前記技術で捕捉された情報)には多くの成果がある。
本発明は、前例のないホルモン系を「ホルモン系シミュレーターソフトウエア」として構築する。このソフトウエアを「神経系シミュレーターソフトウエア」、「外部情報インターフェイスソフトウエア」と統合し「心」シミュレーターと定義する。外部情報として入力された文字(言語情報)を処理する。処理結果は「心」シミュレーターの「意思」として外部に文字(言語情報)を出力する。「ホルモン系シミュレーターソフトウエア」および「神経系シミュレーターソフトウエア」はそれぞれの過去を「記憶」のかたちで保持するデータベースを合わせ持つ。従って「統合シミュレーターソフトウエア」は「心」の機能を持つ。
(ホルモン系の意味)
生体内部では種の生命を維持したり、固体の生命を維持するための情報として各種のホルモンが発生、消費されている。生体はこれらのホルモンに支配されて外界情報に対応している。人間も同様である。ここでは動作の明確なホルモンをソフトウエアでシミュレートする。それぞれのホルモンは発生後特徴的な時定数をもって拡散する。同時に既に発生している他のホルモンと拮抗もしくは協調した振るまいをする。この多元系のホルモンの動作をシミュレートしリアルタイムに現在のホルモンベクトルを生成する。過去のホルモンベクトルと現在のホルモンベクトルの差異は生体へのストレスとなる。
13.方言の取り扱いと発声
日本語を歴史的に観察すると「標準語」より「京ことば」のほうがより深く情緒的であることがわかる。「京ことば」には平安時代から引き継がれた言葉が今も使用されている。このため「心シミュレーター」を実験する基盤言語を「京ことば」とした。他の東京方言、大阪方言、標準語などは基盤言語に並行するデータベースに入力し引き出す方法を用いた。
13−1.言語認識および発話装置例
コンピュータネットワーク環境で用いる言語情報について、そのポーダリティーを高める努力がなされている。民生機器を製品目標として作られつつある言語情報にSALT(Speech Application Language Tags(SALT) 1.0 Specification July 2002)がある。
「心」シミュレーターの応用例としてシミュレーター本体と発話装置、聴覚装置をネットワークで接続する。このためシミュレーターで発生させた感情は概念、時間情報、強度情報を属性とするオブジェクトとして転送し先のSALTとともに発話装置に入力し、実時間領域の音声へと置き返られオーディオ信号として発話する。
他方聴覚装置へは本体から対象が発話すると推測される比較的少数の言語を事前に伝送し、聴覚装置に入力する。外界の音響情報(環境ノイズ、発話音などの混ざった音響)を特定の時間窓にて切り出す。先に伝送された事前の言語をこの音響情報から引き、剰余の音響情報の最も小さい値を得る言語を発話者の発生と仮に推定する。
ここで仮の情報と生の音響情報を聴覚装置からシミュレーター本体へネットワークを介して伝送する。シミュレーター本体のフロントエンドでは順次送られる仮の発話を時間座標に沿って配列する。ある程度配列された仮の発話語は文法のデータベースに照らし合わせ前後の語彙の正当性を検証する。文法に従って語彙を逆引きし、語彙の確かさを確認する。不確かな語彙は伝送されている生データと再度照合し、より確かな語彙を残して文章を完成させる。
(新しく定義する接続言語)
「心」シミュレーターと感情付与型発話送信機、感情付与型発話認識受信機を接続するために「感情付ネットワーク伝送言語」を定義し用いる。感情付与型発話送信機、感情付与型発話認識受信機は「口」、「耳」の機能を代替する。
感情付ネットワーク伝送言語はSALT(Speech Application Language Tags 1.0 Specification) forum http://www.saltforum.org/ に準拠し、その形式を踏襲して日本語方言文法、方言抑揚、性別、年齢、基本波周波数、拍数、感情、AD変換後の生データを取り扱う機能を有する。ネットワーク言語(XMLなど)と同様の言語形式を用いる。
例えば、
<「心」:感情>
<script> …………………………
……………………………</script>
</「心」:感情>
SALTを用いた「AD変換後の生データ」の取り扱い。
listen.Stop、
listen.Cancel(),
listen.onereco,
listen.oneerror
などを用いる。
ELEMENTは定義書に従い、
<!DOCTYPE>,
<html>,
<head>,
<body>,
<title>,
<div>,
<a>,
<from>,
<input>,
<select>,
<option>,
<textarea>
など多数定義されている。
ネットワーク上では上記の量子化されたオブジェクト言語がやり取りされ、アナログ信号そのものは伝送されない。
13−2.独り善がりの認識装置
前記「11.音声、発話認識」で記載した内容を実装するための設計根拠を示す。
生物(特に人間)は四六時中話し続けることはない。生命体としての生活リズムを地球の自転に合わせて作り活動する。ここでも地球時間を基本単位とし3分の1(8時間)は生体の環境を整える期間、3分の1は外界に作用する期間、3分の1は内部情報や精神環境を整える期間と定義する。
装置の内部で見れば、第1の期間はエネルギーを取り込み充電する期間、第2の期間は外部情報を取り込み、反応結果を外部環境へ放出する期間、第3の期間は外部から入力された情報の整理と記憶、内部で生成した情報の整理と記憶をするための期間である。外から装置を眺めると、第1の期間は睡眠期間、第2の期間は活動期間、第3の期間は一人遊びの期間と見える。
13−3.外部とのコミュニケーション
先に定義した中期において外部とのコミュニケーションを実施できる。それ以外の期間には外界情報を受け付ける機能は働かない。
図24は、コミュニケーションの開始の二つのモードを示す説明図である。コミュニケーションの開始には二つのモードが存在する。外部刺激によるコミュニケーションの開始、内部刺激によるコミュニケーションの開始である。
(1)外部刺激によるコミュニケーションの開始
・強い光の明滅
・強い外界騒音
・自己の名称を呼びかけられた場合
・何らかの言葉を受け取った場合。
(2)内部刺激によるコミュニケーションの開始
・内部時計のアラームによる
・前日の情報整理期間にペンディングとなった事項による
・ランダム信号による起動。
13−4.コミュニケーションの継続期間
装置のコミュニケーションの継続期間は、一般に事前の準備があり緊張して継続できる会議などの例からコミュニケーションの1単位は最長で80分とする。さらに独白期間は最長で10分、質疑応答を入れて15分とする。また、相手とのコミュニケーションで相手の独白を許す場合には自己の発言期間は3分、言葉のやり取りを継続する場合には30秒を単位とする。また、挨拶や掛け声は10秒以内とする。
13−5.コミュニケーションの終了
コミュニケーションの終了には次の場合がある。
(1)外部要因による終了
・先方の発話がこちらの発話を期待しない内容で終了し3分間経過した場合
・こちらの解答に対して3分間以内に返答が無い場合。
(2)内部要因による終了
・先方の発話をシンタックスとして理解できない場合
・先方の発話文が長期的に自己撞着している場合
・返答すべき主語が判断できない場合。
(3)コミュニケーションウオッチドッグタイマー
図25は、本装置のコミュニケーションウオッチドッグタイマーによる制御を示すフローチャートである。
13−6.独り善がりの認識法
「音声、発話認識の原理」による「独り善がり」の認識法について説明する。
前記で明示したように人間のコミュニケーションは不確かな言語の羅列である。文法などは当てにできない。これを人間は器用に使いこなしている。ここでの認識技術はあいまいに尽きる。しかしあいまいな認識結果を長文に接続する過程でたびたび類推し精度を上げていくのである。ここで採用する「独り善がり」とは、以下に例示する手法である。
会話の発端にて:会話のはじめは大部分挨拶ではじまる。
・こんにちは
・おはよう
・こんばんは
・元気ですか
・もうかりまっか
・おす!
など、さほど多くない定型的な言い回しで始まる。これらの挨拶語をシンセサイザーで合成しアナログ音として多数記録する。このアナログ定型語をここでは「独り善がりの語彙」とする。
一方対話する相手は何らかの挨拶語を発生するはずである。しかし環境ノイズに埋もれての発話であり小さな声の場合明瞭に聞き取れない。この音をマイクで収録しシステムに取り込む。この外部音から事前に準備した「独り善がりの語彙」を順に引き算し最も変化の大きい「独り善がりの語彙」をここでの対話者が発した言葉であると仮定する。仮に事前に準備された語彙の中に発話者の真の語彙がない場合があるが、この場合でも初期に選んだ語彙のどれかに該当していると「独り善がり」するところがこの方法の特徴である。
選ばれた語彙はこの程度の確かさしかない。しかしこの方法で順に言語を仮定していく度に、文章の特徴が明らかとなっていき、文法で言う「品詞」がおぼろげに現れてくる。この仮想的な品詞を逆引きし、元の語彙を訂正しつづけることによって、次第に正しい言葉へと成熟させることができる。発話者が正しい言葉を使用していない場合にも正しい言葉として捉えられる可能性がある。
これが独り善がりの認識法の骨子である。当然発話者の言葉と異なる認識もありうるが、人間の場合にも「聞き違え」、「空耳」などエラーは起こる。人間は聞き違えを避けるために相槌を打ちながら、取り込んだ認識を返すことによって、正しいかどうかを確認しつつ会話を進める。コンピュータシステムであっても確認しつつ会話を続けるのが問題ではないはずである。
図26は、上記シンセサイザーのハードウェア構成例を示すブロック図である。
図27は、「独り善がりの画像処理」による画像認識の例を示す説明図である。
最上段のVa1、Va2、Va3は、ハードウエアに写し出された画像を例示したものである。。Va1からVa3に時間が推移している。撮像位置が時間によって推移している。Va1では四角形に見える。Va2では四角形が少し左にふれ、右側面が見える。Va3では撮像位置は四角形から離れ、Va1のときから45度ずれた面を写し出す。
中段のVb1、Vb2、Vb3は、特徴を抽出しようとする対象のイメージを示す。
最下段のVc1、Vc2、Vc3は、三次元画像オブジェクトを、中段のVb1、Vb2、Vb3に適合させる過程を示す。Vc1では二次元の「正方形」を独り善がりで「円柱オブジェクト」と適合させる。Vc2では正方形の側面が見えたため「立方体オブジェクト」に訂正する。Vc3ではVc2が正しいとする。
図28は、接続詞、助詞などの方言比較「標準語と京言葉」の例を示す説明図である。
図29は、初期記憶しておく短い掛け声の例を示す図である。
図30は、語彙の属性:語彙の属性のうちルールに係わる情報を整理した表の例を示す図である。ルールにはシンタックス、セマンテクス、グラマー、と慣例的なルールがあり、どの語彙にもそれらが考えられる。
図31は、図30に示した語彙の属性に展開した「連体詞」の例を示す図である。
14.「心」シミュレーターの機能上の特徴
本発明の「心」シミュレーターは、大脳・小脳の機能に相当する記憶機能、ウエルニッケの連合野の機能に相当する入力機能、海馬の機能に相当する心・意思のシナリオ、思考エンジン、脳幹機能、黒質・赤核、下垂体、視床下部の機能に相当する感情表現機能、視覚、聴覚、体性感覚に相当するセンサー機能、視覚機能、身体制御(運動制御)機能を備えている。それぞれの特徴の詳細は以下のとおりである。
〔A〕記憶装置(大脳・小脳)
上記「心」シミュレーターは、下記の構成を有する記憶装置(データベース)を備える。
(1)属性を持つ集合とその中に属性を持つ語彙を格納する。それぞれの集合および語彙は発生の都度それぞれにユニークな番号を与えられる。
(2)属性を持つ最初の集合は元集合(root)と称し、集合番号“0”を持つ。
(3)集合の属性には必ず上位集合を示すものが一つ存在する。
(4)それぞれの集合は上位集合を示す番号を用いて「木構造」を構成できる。
(5)ある語彙をこの集合の内部に記録格納するには、次の2つのルールのどちらかを採用する。ルール1:事前に属性との関連付けを行い、それに従って記録格納する。ルール2:それぞれの属性にニューラルネットワークの手法を適用し、ニューラルネットワークの出力が示す空間内部の集合とその内部の位置に記録格納する。
(6)集合内部に記録格納された語彙は新たな語彙が格納されると同時に再度ニューラルネットワークを用いて評価され、再び適当な位置へ記録格納される。
(7)記録格納された語彙はそれぞれの属性にて定められる「非消去・読み出し記録」と「消去可能・読み書き記録」に設定される。
(8)上記の(1)〜(7)に従って記録格納された集合および語彙空間には、次の辞書空間が併設される。それぞれの辞書内容は新たな語彙が出現するために新規に定義される。定義された辞書内容は語彙番号で検索・照合でき、情報を保持する枠組みは可変構造を持つ。
(9)辞書内容は、「方言」、「文法特性」、「抑揚」等、多義にわたる。
(10)集合、集合属性、語彙属性は、新規に語彙が入力される過程で新たに定義され拡幅される自由度を持っている。
(11)集合は、その使用頻度と属性内容を用いてマージされる可能性を含んでいる。
上記の構成により、大脳、小脳に見立てた当該機能は、「心」シミュレーターにおける語彙のデータベースの作用を持ち、長期記憶として記録できるメモリー効果を持つ。語彙を分解した結果、集合と集合内部の位置、属性が整理されて格納される。
〔B〕入力機能(ウエルニッケの連合野)
上記「心」シミュレーターは、記憶装置に対して下記のように情報の書き込み、読み出しを行う。
(1)外部情報を記憶装置(データベース)に記録された語彙情報を検索し参照しつつ入力処理を行う「収集モード」と、検索できなかった新しい語彙情報を分解整理し集合空間に新しい語彙として記録しつつ入力処理を行う「整理モード」とを有する。
(2)「整理モード」で記録する予定の新しい不明の語彙に関する数々の情報を「収集モード」の間に外部に対して質問し一時記憶しておく。これらの情報は、新しく記録する時に属性としたり、辞書内容として記録する。
(3)一日を24時間とし、この間を二等分し、「収集モード」と「整理モード」とする。この時刻管理を行う時計を内蔵することが望ましい。
(4)情報の書き込みには次の3通りの方法がある。
(i)集合空間、それぞれの属性、辞書内容をすべて外部で決定し、記憶装置に書き込む。
(ii)上記(i)にて記録された情報をニューラルネットワークの入力とし、外部から入力される情報を処理し、新たな語彙は「整理モード」にて記録する。ここで入力する外部情報は厳選された教科書に基づいて与えられる。
(iii)一般社会に投入し、雑多な情報から新たな情報を吸収しつつ記録を増やす方法で書き込む。
上記の構成により、ウエルニッケノ連合野を模擬した当該機能は、「心」シミュレーターにおいて、センサー情報と言語情報、体勢感覚などの情報を複合的に判断する。「心」シミュレーションでは各種オブジェクトを探索、決定し、各語彙の記憶を検索しその属性を引き出す。検索できなかった語彙を保留にする作用がある。思考の元を作り出す作用がある。
〔C〕心・意思のシナリオ、思考エンジン(海馬)
上記「心」シミュレーターは、外部から入力される情報に対して語彙空間の語彙番号をトレースする方法でシナリオを追いかける機能を有する。ここでは、時間の関数であるシナリオを「心の文脈」、「意思の文脈」と呼び、処理する。
(1)語彙空間は前記(i)(ii)(iii)の期間を通して増強され続けるが、多くの語彙によって量子化された語彙空間は次第に線形連続な空間に近づく。
(2)線形連続な空間としての語彙空間には「場」としての発散、勾配、湧き出しなどの特徴が次第に備わる。
(3)上記(2)の特徴を備えた語彙空間上のシナリオは数学的表記が可能となる。代数的各種演算、振動、カオス、フラクタル、ラプラス変換、フーリエ変換などを用いて語彙空間を解析することで、、心の情景を表現できるようになる。
(4)上記(3)の解析結果を外部へフィードバックする。
(5)外界の情報に代えて、内部の情報をも外界情報と同様に取り扱うこともできる。
上記の構成により、「心」シミュレーターの中核機能と位置付けられ当該機能は、意思の文脈、心の文脈を一時記憶し語彙空間を管理運営し、語彙の属性を取得する作用を持つ。語彙の属性空間を数学的に処理し「心」シミュレーターの発話意志を作る作用をする。語のルール類を用いて発話すべき文を組み立てる作用を持つ。語彙の属性から感情空間の座標軸を操作する作用を持つ。今の感情を元に発話すべき語彙を検索する。全体の文脈と今作文した文のそれぞれの属性を用いて発話文の感情、ストレス、間、方言による抑揚(フーリエ変換データ)を統合する。
〔D〕感情表現(脳幹機能、黒質・赤核、下垂体、視床下部)
上記「心」シミュレーターでは、先の時間の関数「シナリオ」をある時間で切断すると、切断面に感情を表現した空間が現れる。この空間に多変量からなる直交座標系を定義する。それぞれの座標軸には語彙の属性である「ホルモン、神経伝達物質」の濃度を対応させる。他者が発する文章内部の語彙は語彙空間を検索され、その語彙の属性を抽出し、その中の属性「ホルモン、神経伝達物質」によって、他者の座標軸を回転させる。自らの座標軸と他者の座標軸との乖離は、当該「ホルモン、神経伝達物質」の蓄積となる。蓄積された乖離は自他の対話を活性化する力となる。乖離が語彙で解消されるためには、解消する向きの属性(「ホルモン、神経伝達物質」)を持つ言葉を発することで行う。
上記の構成により、感情を表現するためのホルモン受容体を統合するA10などの神経繊維と神経細胞群を統括する機能であり、前向きの「意志」を作り出す。当該機能は、「心」シミュレーターにおいて空間座標系を操作することで、「心」シミュレーターに意欲を導入し、機械がみづから作動するためのトリガー信号を発生する機能を持つ。
〔E〕センサー(聴覚)
上記「心」シミュレーターは、視覚、聴覚など思い込みによる該当オブジェクトを事前に推定する。聴覚に関しては、
(1)会話の流れ(シナリオ)から次に相手が発話するであろう語彙(できれば複数)、事前に選択しておく。選択された語彙の属性の抑揚と音素を準備し、聞いた音声と準備した音声のマッチングをとり、最も近い音声を相手の発話音として認識する。
(2)性を確認し、不適合な語彙をさらに精査する。
(3)以前に解釈した前文との矛盾点を見極め、今回の新たな文を再度精査する。
(4)「心」シミュレーターと聴覚センサーおよび発話装置は、ネットワークを介して接続される。「心」シミュレーターと聴覚センサーおよび発話装置は、ネットワークプロトコルSALT(Speech Application Language Tags)を用い、さらに抽象化した感情表現をXML様式を用いて伝達する。
(5)発話装置は上記(4)の言語情報を分解し、基本搬送波、音素、抑揚(フーリエ変換)、語のストレス(強弱とアクセント)、発話間隔、発声間隔をそれぞれ別個の発信機で発生させ、合成しアナログ信号として音波に変換して放出する。
聴覚はディジタル信号をそのままアナログ信号に、あるいはその逆過程として構成できるが、「心」シミュレーターでは、他者の話を聴く前に相手の発話内容を予測しておき、発話の瞬間に予測とマッチングを取り最適語彙を探す方法で認識する。このため聴覚センサーは高度なセンサーシステムを構成し語彙を独り善がりに認識する。この欠点としては「空耳」がありうる。一方雑音に埋もれたS/N比が1以下の本来認識しえない音も認識できる効果がある。
〔F〕センサー(視覚)
上記「心」シミュレーターは、画像センサーに移りこんだイメージに対して、事前に推定した3Dオブジェクトを適合させ、スケーリングの結果最も近いと思われる画像をイメージ像とする。
(1)3Dオブジェクト(立方体、球体、四面体など)の基本図をオブジェクトに持つ。
(2)画像センサーに移りこんだイメージに対して、啓上の最大のものから順番に前記オブジェクトで差をとり、差イメージを次のイメージとして判断する方法を繰り返す。
(3)差イメージの残りが画面の例えば5%を下回れば、オブジェクトの切り出しを終了する。
(4)3Dオブジェクトのそれぞれの面を得る角度を求める。
(5)3Dオブジェクトのそれぞれの背景位置を決める。
(6)以上の情報を「心」シミュレーターに伝送する。
人体では大脳に付属した器官として考えられるが、「心」シミュレーターでは光学入力センサーがネットワークケーブルを通して伝達される構成のハードウエアを考える。このため視覚情報は三次元オブジェクトに当てはめ、画像信号はオブジェクト情報を伝える方法で作用する。そこで、上記の構成によれば、センサーを独立装置として他の技術、既存の技術と組み合わせることが可能となる。
〔G〕身体制御(運動制御)
思い込みによる倒立振り子制御を行う。
上記の構成によれば、「心」シミュレーターでは、各種の運動パターン、例えば「歩く」、「走る」、「座る」、「寝る」、「踊る」などを時系列の一連の動作集合とし、それをオブジェクトとする方法で運動制御を行う。よって、上記〔C〕の海馬機能で考えた文脈の出力として順次送り出される運動制御オブジェクトに従って、それぞれの動作を独立に達成させることができるため、文脈と運動制御とを切り離すことが可能となる。
本発明の一実施例について図32から図36に基づいて説明すれば、以下のとおりである。本実施例では、上述した「心」シミュレーターを、ロボット等に搭載される、人間と対話する際の語彙選択を行う言語処理装置に適用した例について説明する。なお、本実施例では、説明の都合上、各テーブルが簡単化されている。
図32は、本実施例に係る言語処理装置100の構成の概略を示す機能ブロック図である。言語処理装置100は、予測対象者が他者と行うコミュニケーションにおいて該予測対象者が提示すべき語彙を選択する装置である。
本実施例では、2つのシミュレーション方法によって語彙を予測する。一つは語彙が有するホルモンの属性値に基づく方法、もう一つは語彙を集合の2次元座標にマッピングして、語彙が有する属性の属性値をその語彙のポテンシャルとみなし、ポテンシャル曲面を数学的に解析した結果に基づいて、語彙を予測する方法である。ここでは、前者をホルモン法、後者をポテンシャル法と呼ぶことにする。
本実施例では、2つのシミュレーション結果から選択する構成を説明するが、何れか一方のみを行う場合には、他方の構成が不要となることは言うまでもない。すなわち、ホルモン法を行わない場合、ホルモンの決定を行う必要がない。反対に、ポテンシャル法を行わない場合、座標の決定を行う必要がない。
図32に示すように、上記言語処理装置100は、語彙入力部110、語彙登録部120、語彙辞書テーブル格納部131、集合テーブル格納部132、対話入力部140、語彙切出部150、シミュレーション部160、語彙出力部170を備えて構成されている。
なお、図32では、シミュレーションのための語彙を登録する語彙登録系の機能と、シミュレーションを行って語彙を予測するシミュレーション系の機能とを同じ装置に搭載した構成を示したが、別個の装置に設けてもよい。また、語彙辞書テーブル格納部131および集合テーブル格納部132を装置内に含む構成を示したが、ネットワーク等を介して読み書き可能であれば、外部の記憶装置に設けてもよい。
語彙入力部110および語彙登録部120は、シミュレーションによって語彙を選択するためのデータを登録するための機能ブロック(語彙登録系)である。
上記語彙入力部110は、ユーザや外部装置から登録すべき語彙およびその属性値を取得する。なお、ユーザが語彙登録する場合、語彙入力部110は語彙検索部112にその語彙が登録されているか否かを問い合わせ、登録されていなければ、その語彙の属性値をユーザに入力させるための質問を提示してもよい。
上記語彙登録部120は、語彙辞書テーブル登録部121と、集合テーブル登録部123とを備える。
上記語彙辞書テーブル登録部121は、語彙入力部110から入力された語彙を、その属性値に基づいて、語彙辞書テーブル格納部131の語彙辞書テーブルに登録する。そして、属性値からホルモン名を決定するために、例えばニューラルネットワークを利用したホルモン決定部122を備えている。
ここで、ホルモン名は、ホルモンを特定するための識別子であり、名称のほか、英数字等の符号であってもよい。また、語彙に対応付けるホルモン名は、当該語彙の提示を受けた人間で産生されるホルモンであることが望ましい。
上記集合テーブル登録部123は、語彙入力部110から入力された語彙を、その属性値に基づいて、集合テーブル格納部132の集合テーブルに登録する。そして、属性値から集合内部の空間座標を決定するために、例えばニューラルネットワークを利用した座標決定部124を備えている。
ここで、上記座標は例えば2次元座標である。座標は、例えば、複数の属性の属性値を入力値とし、2次元座標を出力値とするように学習させたニューラルネットワークを用いて決定することができる。
対話入力部140、語彙切出部150、シミュレーション部160、語彙出力部170は、登録されたデータに基づいて、シミュレーションによって語彙を選択するための機能ブロック(シミュレーション系)である。
上記対話入力部140は、コミュニケーションから入力されたデータをテキストデータに変換する。ここで、本実施例では、コミュニケーションとは、声のやり取り(すなわち、通常の会話)であってもよいし、文字のやり取りであってもよい。さらに、手話などの身振りや、画像、楽曲など、例えば特徴量を抽出することにより、語彙に変換できるものであれば任意である。そして、対話入力部140は、入力されたデータ形式に応じて、テキストデータへ変換する機能を有する。
上記語彙切出部(語彙切出手段)150は、予測対象者が他者と行うコミュニケーションから、予測対象者が提示した語彙と他者が提示した語彙とをそれぞれ切り出す。なお、ポテンシャル法のためには、語彙切出部150は、コミュニケーションから少なくとも最後に提示された語彙を切り出す。
上記シミュレーション部160は、ホルモン法およびポテンシャル法によってそれぞれ予測語彙候補を決定し、どちらかを予測語彙として選択する機能を有する。そのため、シミュレーション部160は、シミュレーション用データ取得部(予測用データ取得手段)161、語彙テーブル格納部162、ホルモン法実行部163、ポテンシャル法実行部164、語彙選択部165を備えている。
上記シミュレーション部160は、語彙切出部150から語彙を取得すると、その語彙が属する集合を語彙テーブルから取得して、時系列に沿って、話者毎に管理する(図36)。これが「意思の文脈」である。
上記シミュレーション用データ取得部161は、語彙辞書テーブル格納部131の語彙辞書テーブルおよび集合テーブル格納部132の集合テーブルを参照して、シミュレーション用のデータである語彙テーブル(予測用データ)を作成する。語彙テーブルの作成は、シミュレーションを行うごとに作成してもよいし、語彙辞書テーブルおよび集合テーブルの作成時に同時に作成して、語彙テーブル格納部162に格納しておいてもよい。そして、上記シミュレーション用データ取得部161は、シミュレーションを行う際、語彙テーブルを語彙テーブル格納部(予測用データ格納部)162から取得する。
ここで、語彙テーブルには、ホルモン法のために、語彙と該語彙にあらかじめ付与されたホルモン名(ホルモン識別子)とが対応付けて登録されている。また、語彙テーブルには、ポテンシャル法のために、語彙と該語彙にあらかじめ付与された2次元座標(x,y)および量的な属性値(本実施例では「強弱(1−5)」)とが対応付けて登録されている。
上記ホルモン法実行部(語彙予測手段)163は、予測対象者が提示した語彙に付与されたホルモン名の出現回数と他者が提示した語彙に付与されたホルモン名の出現回数とを語彙テーブルを参照してホルモン名ごとに算出し、ホルモン名ごとの出現回数の差に基づいて、出現回数をさらに増加させるべきホルモン名を決定し、該決定したホルモン名が付与された語彙を語彙テーブルより抽出する。なお、出現回数をさらに増加させるべきホルモン名が複数ある場合には、出現回数の差が最大のものを選択してもよいし、あらかじめ設定された決定基準(例えば、優先順位)に従って、ホルモン名を1つあるいは複数選択してもよい。
なお、ホルモン名の出現に有効期間を設けて、予測時点から有効期間内、すなわち近い過去の出現のみをカウントするようにしてもよい。また、出現回数の代わりに、出現時から所定の時定数で減衰する量の積分値を求めるようにしてもよい。
また、ホルモンは多量に産生した場合に効果が低下する特性を有する。よって、出現回数をカウントする代わりに、ホルモン名の出現ごとに単位角度ずつ増加し、360度で一巡する仮想的な回転角を演算してもよい。また、語彙ごとにホルモンの産生量を設定しておき、出現時にホルモンの産生量を加算する際、各語彙の産生量を加算するようにしてもよい。
上記ポテンシャル法実行部(語彙予測手段)164は、予測用データの2次元座標および量的な属性値によって決定される3次元座標空間にプロットした各語彙の座標がのる一つのポテンシャル曲面(仮想面)を生成し、該ポテンシャル曲面の形状と語彙切出部150によって切り出された語彙の座標とに基づいて、次に提示すべき語彙の座標を決定し、該決定した座標の2次元座標が付与された語彙を語彙テーブルより抽出する。
例えば、ポテンシャル法実行部164は、ポテンシャル曲面の形状から勾配と極小値を求め、上記切り出した語彙の座標から最も大きな勾配で極小値へ至る経路上の語彙を選択する。
語彙選択部165は、ホルモン法実行部163のシミュレーション結果である予測語彙候補と、ポテンシャル法実行部164のシミュレーション結果である予測語彙候補との何れかを、所定のルールに基づいて、あるいは、ランダムに、選択して、予測語彙を決定する。
上記語彙出力部170は、語彙選択部165で選択された予測語彙を、上記対話入力部140から入力されたデータ形式で出力する。なお、音声等への変換装置が外部にある場合には、予測語彙をテキストデータのまま出力してもよい。
なお、本実施例では、1回に1つの語彙を提示する例を説明するが、1回に複数の語彙を提示するように拡張してもよい。1回に複数の語彙を提示すると、1回の発話で複数のホルモンを産生させたり、一つのホルモンでも多量に産生させることができるため、特にホルモン法の場合には効果的である。
つづいて、本実施例で使用するテーブルについて説明する。
図33は、語彙辞書テーブル格納部131に格納される語彙辞書テーブルの一例を示す説明図である。
図33に示すように、語彙辞書テーブルには、語彙辞書番号、語彙、強弱(1-5)、ホルモン名(産生量)が、対応付けられて登録されている。なお、図33は、図17に示した語彙辞書テーブルを簡略化したものである。
語彙辞書テーブルには、語彙入力部110から入力された、語彙、属性値が登録される。語彙辞書番号は、自動生成してもよい。ここで、「強弱(1-5)」は、語彙が有する量的な属性の例であるり、1〜5の5段階の値が付与されるものとする。この例では、強さに応じて、弱い犬には“1”、強い犬には“5”が付与されている。ホルモンα、βはホルモン名であり、()内の数字は、その語彙の1回の出現による産生量である。なお、本実施例では、1つの語彙に1つのホルモン名を対応付けた例を示したが、複数のホルモン名を対応付けてもよい。
この例では、例えば、語彙「チン」は、語彙辞書番号が「101」であり、属性「強弱」の属性値が「1」であり、出現時には「ホルモンβ」を「4」単位加算することを示している。
図34は、集合テーブル格納部132に格納される集合テーブルの一例を示す説明図である。
図34に示すように、集合テーブルには、集合番号、集合内部の空間座標(x,y)、集合属性、語彙辞書番号が、対応付けられて登録されている。このように、集合テーブルは、語彙毎に1レコードが登録されている。なお、図33は、図14、15に示した集合テーブルを簡略化したものである。
ここで、図34(a)は、後に集合「犬」に登録される語彙「チン」が登録された状態を示している。この時点では、集合「犬」に属する語彙が少ないため、集合「動物」から集合「犬」が派生していない。
図34(b)は、語彙「チン」に続いて、「シェパード(語彙辞書番号=102)」、「ゴールデンレッドリバー(語彙辞書番号=103)」、「ドーベルマン(語彙辞書番号=104)」が語彙登録されたため、集合の見直しが発生した結果、集合「動物」から独立した集合「犬」が派生した状態を示している。このとき、集合内部の空間座標が、集合「動物」のものから、集合「犬」のものに再付与されている。
図35は、語彙テーブル格納部162に格納される語彙テーブルの一例を示す説明図である。
図35に示すように、語彙テーブルには、語彙辞書番号、語彙、強弱(1-5)、ホルモン名(産生量)、集合内部の空間座標が、対応付けられて登録されている。このように、集合テーブルは、語彙毎に1レコードが登録されている。なお、図35は、図16に示した語彙テーブルを簡略化したものである。
ここで、各フィールドの意味は、上記2つのテーブルと同じである。ただし、ホルモン名(産生量)の下段の()内に、ホルモンの読み替えが記載されている。すなわち、チンの「ホルモンβ(4)/(ホルモンα(−2))」は、語彙の出現時に産生するのは「ホルモンβが4単位」であるが、「ホルモンαが−2単位」発生すると読み替え可能であることを示している。この表記によって、正逆対になって機能するホルモンの出現を、統一的にカウント(回転)することができる。
図36は、対話から切り出した意思の文脈の一例を示す説明図である。図36は、時刻t1にシミュレーターが「チン」を提示し、これに対して、時刻t2に対話相手がが「シェパード」を提示した状態を示している。なお、時刻t3の「ドーベルマン」は、言語処理装置100による予測を示している。
(ホルモン法)
ホルモン法実行部163の動作例を説明する。
図36の時刻t2の時点では、シミュレーターは時刻t1の「チン」によって「ホルモンβ(4)/(ホルモンα(−2))」となっている。また、対話相手は時刻t2の「シェパード」によって「ホルモンα(4)」となっている。すなわち、ホルモンαの産生量は、シミュレーターが対話相手より「6」少ない状態にある。
そこで、ホルモン法実行部163は、シミュレーターが対話相手に話を合わせる場合には、ホルモンαの産生量を増加させるため、「シェパード」か「ドーベルマン」を選択する。これに対して、シミュレーターが対話相手に反対する場合には、ホルモンαの産生量を減少させるため、「チン」か「ゴールデンレッドリバー」を選択する。
なお、ホルモンの産生量が語彙毎に設定されてない場合、つまり、出現回数のみをカウントする場合、上記の例において、ホルモンαの産生量を増加させるための「シェパード」と「ドーベルマン」、ホルモンαの産生量を減少させるための「チン」と「ゴールデンレッドリバー」には違いはない。
以上より、ホルモン法によれば、語彙の提示を受けた人に起こるホルモンの産生をシミュレートして、語彙を選択することが可能となる。それゆえ、より人間らしい言語機能を有する装置を実現することが可能となる。
(ポテンシャル法)
ポテンシャル法実行部164の動作例を説明する。
図36の時刻t1の時点で、ポテンシャル法実行部164は、集合「犬」の語彙が登場したため、集合「犬」の語彙テーブルを語彙テーブル格納部162から読み出して、ポテンシャル曲面を生成する。なお、ポテンシャル曲面では、ポテンシャルの高さを、属性値が小さいものほど高くする。つまり、図35の例では、「1」が最大値で、「5」が最小値を示すことになる。
そして、図36の時刻t2の時点では、最後の語彙が「シェパード」であり、そのポテンシャルは属性値「強弱」が示す「4」である。ここで、語彙の座標から最も大きな勾配で極小値へ至る経路上の語彙を選択する場合、属性値「強弱」がより大きい「4」「ドーベルマン」を選択することになる。なお、ポテンシャル曲面の解析方法は、勾配や極小に限定されず、他の数学的手法を用いてもよい。
以上により、ポテンシャル法によれば、語彙が有する量的な属性値を基準にして、話題から外れた唐突な語彙を提示することなく、話が滑らかに進むように、語彙を選択することが可能となる。それゆえ、より人間らしい言語機能を有する装置を実現することが可能となる。
なお、シミュレーション部160は、ホルモン法実行部163およびポテンシャル法実行部164で適切な予測語彙候補が得られなかった場合、すなわち、シミュレーションに失敗した場合、語彙として何も出力しないことを意味する「沈黙」を出力してもよい。また、コミュニケーションで話題となっている集合とは異なる他の集合から語彙を選択してもよい。なお、他の集合の選択、および他の集合中の語彙の選択は、あらかじめルールが定められていてもよいし、ランダムでもよい。
最後に、言語処理装置100の各ブロックは、ハードウェアロジックによって構成してもよいし、次のようにCPUを用いてソフトウェアによって実現してもよい。
すなわち、言語処理装置100は、各機能を実現する制御プログラムの命令を実行するCPU(central processing unit)、上記プログラムを格納したROM(read only memory)、上記プログラムを展開するRAM(random access memory)、上記プログラムおよび各種データを格納するメモリ等の記憶装置(記録媒体)などを備えている。そして、本発明の目的は、上述した機能を実現するソフトウェアである言語処理装置100の制御プログラムのプログラムコード(実行形式プログラム、中間コードプログラム、ソースプログラム)をコンピュータで読み取り可能に記録した記録媒体を、上記言語処理装置100に供給し、そのコンピュータ(またはCPUやMPU)が記録媒体に記録されているプログラムコードを読み出し実行することによっても、達成可能である。
上記記録媒体としては、例えば、磁気テープやカセットテープ等のテープ系、フロッピー(登録商標)ディスク/ハードディスク等の磁気ディスクやCD−ROM/MO/MD/DVD/CD−R等の光ディスクを含むディスク系、ICカード(メモリカードを含む)/光カード等のカード系、あるいはマスクROM/EPROM/EEPROM/フラッシュROM等の半導体メモリ系などを用いることができる。
また、言語処理装置100を通信ネットワークと接続可能に構成し、上記プログラムコードを通信ネットワークを介して供給してもよい。この通信ネットワークとしては、特に限定されず、例えば、インターネット、イントラネット、エキストラネット、LAN、ISDN、VAN、CATV通信網、仮想専用網(virtual private network)、電話回線網、移動体通信網、衛星通信網等が利用可能である。また、通信ネットワークを構成する伝送媒体としては、特に限定されず、例えば、IEEE1394、USB、電力線搬送、ケーブルTV回線、電話線、ADSL回線等の有線でも、IrDAやリモコンのような赤外線、Bluetooth(登録商標)、802.11無線、HDR、携帯電話網、衛星回線、地上波デジタル網等の無線でも利用可能である。なお、本発明は、上記プログラムコードが電子的な伝送で具現化された、搬送波に埋め込まれたコンピュータデータ信号の形態でも実現され得る。
本発明は上述した実施形態(および、実施例)に限定されるものではなく、請求項に示した範囲で種々の変更が可能である。すなわち、請求項に示した範囲で適宜変更した技術的手段を組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。
本発明に係る心シミュレーターは、医学分野に応用すれば「多重人格、同一性乖離症、精神発達過程」などの評価システムとして発展させ得る。例えば、患者介護システムの部品、家庭電化製品のヒューマンインターフェイスとしてあらゆる装置への組み込みが可能である。
また、上記心シミュレーターは、文字情報を自動的に読み上げる装置の部品として内蔵させれば、より自然な抑揚を備えた発生音による文字情報の読み上げができる。駅やホールなど多くの人が集う場所における場内アナウンスなどに状況を反映させた自然言語に近い読み上げを行う技術の基盤となる。エンターティメント分野の応用としては「漫才ロボット」や各種のシミュレーションゲームのコアー技術としても利用できる。
また、上記心シミュレーターは、文字情報のみで他者とコミュニケーションを図る場合、インターネット、本、新聞などみずから操作し継続してコミュニケーションを図りつつ本発明を同時にモニターさせると相手の意図を補助的に評価できる。例えばインターネットでのコミュニケーションでは多くの第三者と重複して会話を交わす(チャットする)ことがある。このような場合に個別の話者をモニターさせることができる。
また、上記心シミュレーターは、文学的な文章を長期間継続して創作する業務では、途中の休閑時間をはさんでの作業となる。ここでモニターを同時使用すると話の流れに途切れを生ずることを防げる。
本発明の実施形態を示すものであり、心シミュレーターの要部構成を示すブロック図である。 心空間と外部との関係を示す図面である。 心の状態を示す図面である。 ストレスとホルモンとの関係を示す図面である。 覚醒モード中の処理を示すフローチャートである。 睡眠モード中の処理を示すフローチャートである。 睡眠モード中の処理を示すフローチャートである。 会話によってホルモンを生成する流れを示すフローチャートである。 ドーパミンと拮抗セロトニンとのタイムチャートである。 外部情報とオブジェクトとの関係を示す図面である。 外部情報とオブジェクトとの関係を示す図面である。 オブジェクトとホルモン濃度との関係を示す図面である。 意思の文脈を示す図面である。 集合テーブルの1つの集合のデータ構造を示す説明図である。 集合テーブルのデータ構造を示す説明図である。 語彙テーブルのデータ構造を示す説明図である。 語彙辞書テーブルのデータ構造を示す説明図である。 会話の成立を説明する説明図である。 二次元の文脈空間の例を示す説明図である。 二次元の文脈空間における対話の収斂の例を示す説明図である。 メビウスの帯に乗った文脈空間の例を示す説明図である。 接続の分類を示す説明図である。 条件(ト、バ、タラ、ナラ)の例を示す説明図である。 コミュニケーションの開始の二つのモードを示す説明図である。 コミュニケーションウオッチドッグタイマーによる制御を示すフローチャートである。 シンセサイザー「口」のハードウェア構成を示すブロック図である。 「独り善がりの画像処理」による画像認識の例を示す説明図である。 接続詞、助詞などの方言比較「標準語と京言葉」の例を示す説明図である。 初期記憶しておく短い掛け声の例を示す図である。 語彙の属性:語彙の属性のうちルールに係わる情報を整理した表の例を示す図である。 図30に示した語彙の属性に展開した「連体詞」の例を示す図である。 本発明の一実施例に係る言語処理装置の構成の概略を示す機能ブロック図である。 上記実施例で使用する語彙辞書テーブルの一例を示す説明図である。 上記実施例で使用する集合テーブルの一例を示す説明図である。 上記実施例で使用する語彙テーブルの一例を示す説明図である。 上記実施例において対話から切り出した意思の文脈の一例を示す説明図である。
符号の説明
1 自我を示す自己認識の範囲としての手段を可能とする領域
2 脳領域、「心」シミュレーターの座位としての手段を提供する領域
3 体勢制御と運動オブジェクトを生成する領域
100 言語処理装置
150 語彙切出部(語彙切出手段)
162 語彙テーブル格納部(予測用データ格納部)
161 シミュレーション用データ取得部(予測用データ取得手段)
163 ホルモン法実行部(語彙予測手段)
164 ポテンシャル法実行部(語彙予測手段)

Claims (6)

  1. 予測対象者が他者と行うコミュニケーションにおいて該予測対象者が提示すべき語彙を選択する言語処理装置であって、
    語彙と該語彙にあらかじめ付与されたホルモン識別子とを対応付けて登録した予測用データを予測用データ格納部から取得する予測用データ取得手段と、
    上記コミュニケーションから、予測対象者が提示した語彙と他者が提示した語彙とをそれぞれ切り出す語彙切出手段と、
    上記予測対象者が提示した語彙に付与されたホルモン識別子の出現回数と上記他者が提示した語彙に付与されたホルモン識別子の出現回数とを上記予測用データを参照してホルモン識別子ごとに算出し、ホルモン識別子ごとの上記出現回数の差に基づいて、出現回数をさらに増加させるべきホルモン識別子を決定し、該決定したホルモン識別子が付与された語彙を上記予測用データより抽出する語彙予測手段と、を備えることを特徴とする言語処理装置。
  2. 予測対象者が他者と行うコミュニケーションにおいて該予測対象者が提示すべき語彙を選択する言語処理装置における言語処理方法であって、
    語彙と該語彙にあらかじめ付与されたホルモン識別子とを対応付けて登録した予測用データを予測用データ格納部から取得するステップと、
    上記コミュニケーションから、予測対象者が提示した語彙と他者が提示した語彙とをそれぞれ切り出すステップと、
    上記予測対象者が提示した語彙に付与されたホルモン識別子の出現回数と上記他者が提示した語彙に付与されたホルモン識別子の出現回数とを上記予測用データを参照してホルモン識別子ごとに算出し、ホルモン識別子ごとの上記出現回数の差に基づいて、出現回数をさらに増加させるべきホルモン識別子を決定し、該決定したホルモン識別子が付与された語彙を上記予測用データより抽出するステップと、を含むことを特徴とする言語処理方法。
  3. 予測対象者が他者と行うコミュニケーションにおいて該予測対象者が提示すべき語彙を選択する言語処理装置であって、
    語彙と該語彙にあらかじめ付与された2次元座標および量的な属性値とを対応付けて登録した予測用データを予測用データ格納部から取得する予測用データ取得手段と、
    上記コミュニケーションから少なくとも最後に提示された語彙を切り出す語彙切出手段と、
    上記予測用データの上記2次元座標および上記属性値によって決定される3次元座標空間にプロットした各語彙の座標がのる一つの仮想面を生成し、該仮想面の形状と上記語彙切出手段によって切り出された語彙の座標とに基づいて、次に提示すべき語彙の座標を決定し、該決定した座標の上記2次元座標が付与された語彙を上記予測用データより抽出する語彙予測手段と、を備えることを特徴とする言語処理装置。
  4. 予測対象者が他者と行うコミュニケーションにおいて該予測対象者が提示すべき語彙を選択する言語処理装置における言語処理方法であって、
    語彙と該語彙にあらかじめ付与された2次元座標および量的な属性値とを対応付けて登録した予測用データを予測用データ格納部から取得するステップと、
    上記コミュニケーションから少なくとも最後に提示された語彙を切り出すステップと、
    上記予測用データの上記2次元座標および上記属性値によって決定される3次元座標空間にプロットした各語彙の座標がのる一つの仮想面を生成し、該仮想面の形状と上記切り出した語彙の座標とに基づいて、次に提示すべき語彙の座標を決定し、該決定した座標の上記2次元座標が付与された語彙を上記予測用データより抽出するステップと、を含むことを特徴とする言語処理方法。
  5. 請求項1または3に記載の言語処理装置を動作させる言語処理プログラムであって、コンピュータを上記の各手段として機能させるための言語処理プログラム。
  6. 請求項5に記載の言語処理プログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2005280906A 2004-09-27 2005-09-27 言語処理装置、言語処理方法、言語処理プログラムおよびそれを記録したコンピュータ読み取り可能な記録媒体 Pending JP2006120136A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005280906A JP2006120136A (ja) 2004-09-27 2005-09-27 言語処理装置、言語処理方法、言語処理プログラムおよびそれを記録したコンピュータ読み取り可能な記録媒体

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2004279542 2004-09-27
JP2005280906A JP2006120136A (ja) 2004-09-27 2005-09-27 言語処理装置、言語処理方法、言語処理プログラムおよびそれを記録したコンピュータ読み取り可能な記録媒体

Publications (1)

Publication Number Publication Date
JP2006120136A true JP2006120136A (ja) 2006-05-11

Family

ID=36537924

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005280906A Pending JP2006120136A (ja) 2004-09-27 2005-09-27 言語処理装置、言語処理方法、言語処理プログラムおよびそれを記録したコンピュータ読み取り可能な記録媒体

Country Status (1)

Country Link
JP (1) JP2006120136A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018526697A (ja) * 2015-07-27 2018-09-13 グーグル エルエルシー 再帰型ニューラルネットワークを使用する健康イベントの分析
US10402721B2 (en) 2015-07-27 2019-09-03 Google Llc Identifying predictive health events in temporal sequences using recurrent neural network
KR20200087889A (ko) * 2018-12-28 2020-07-22 강원대학교산학협력단 음성 인식 장치 및 방법
US10726327B2 (en) 2015-07-27 2020-07-28 Google Llc Predicting likelihoods of conditions being satisfied using recurrent neural networks
CN112633012A (zh) * 2020-12-31 2021-04-09 浙大城市学院 一种基于实体类型匹配的未登录词替换方法
JP2022070003A (ja) * 2020-10-26 2022-05-12 トヨタ自動車株式会社 表示システム

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018526697A (ja) * 2015-07-27 2018-09-13 グーグル エルエルシー 再帰型ニューラルネットワークを使用する健康イベントの分析
US10402721B2 (en) 2015-07-27 2019-09-03 Google Llc Identifying predictive health events in temporal sequences using recurrent neural network
US10726327B2 (en) 2015-07-27 2020-07-28 Google Llc Predicting likelihoods of conditions being satisfied using recurrent neural networks
US11790216B2 (en) 2015-07-27 2023-10-17 Google Llc Predicting likelihoods of conditions being satisfied using recurrent neural networks
KR20200087889A (ko) * 2018-12-28 2020-07-22 강원대학교산학협력단 음성 인식 장치 및 방법
KR102199825B1 (ko) 2018-12-28 2021-01-08 강원대학교산학협력단 음성 인식 장치 및 방법
JP2022070003A (ja) * 2020-10-26 2022-05-12 トヨタ自動車株式会社 表示システム
CN114475825A (zh) * 2020-10-26 2022-05-13 丰田自动车株式会社 显示系统
US11687308B2 (en) 2020-10-26 2023-06-27 Toyota Jidosha Kabushiki Kaisha Display system
JP7310779B2 (ja) 2020-10-26 2023-07-19 トヨタ自動車株式会社 表示システム
CN112633012A (zh) * 2020-12-31 2021-04-09 浙大城市学院 一种基于实体类型匹配的未登录词替换方法
CN112633012B (zh) * 2020-12-31 2024-02-02 浙大城市学院 一种基于实体类型匹配的未登录词替换方法

Similar Documents

Publication Publication Date Title
Alm Affect in* text and speech
Osgood et al. Psycholinguistics: a survey of theory and research problems.
Picard A ective Computing
Slama-Cazacu Introduction to psycholinguistics
Tilford Sensing World, Sensing Wisdom: The Cognitive Foundation of Biblical Metaphors
Bergen et al. Simulated action in an embodied construction grammar
Jackendoff The representational structures of the language faculty and their interactions
Wollock The Noblest Animate Motion: Speech, physiology and medicine in pre-Cartesian linguistic thought
Horváth Interpreter Behaviour
JP2006120136A (ja) 言語処理装置、言語処理方法、言語処理プログラムおよびそれを記録したコンピュータ読み取り可能な記録媒体
Hubal et al. Lessons learned in modeling schizophrenic and depressed responsive virtual humans for training
Russell et al. Analyzing narratives in psychotherapy: A formal framework and empirical analyses
Budwig How far does a construction grammar approach to argument structure take us in understanding children's language development?
Morgenstern Children's multimodal language development from an interactional, usage‐based, and cognitive perspective
McCarty Text and Genre in Reconstruction: Effects of Digitalization on Ideas, Behaviours, Products and Institutions
Bennett et al. Language and cortical function: Conceptual developments
CN101112322A (zh) 一种婴幼儿语言发育评估系统及方法
Dijkstra et al. The New Psychology of Language: From Body to Mental Model and Back
Tervoort Bilingual interference
Danesi The concept of model in Thomas A. Sebeok’s semiotics
Creaghe Symbolic Play and Language Acquisition: The Dynamics of Infant-Caretaker Communication during Symbolic Play
Usenkova Evidentiality in the Samoyedic languages: A study of the auditive forms
Esenova Pragmalinguistic studies in linguistics
Hobbs The origin and evolution of language: A plausible, strong-AI account
Blumstein When words betray us: Language, the brain, and aphasia