JP2002287973A

JP2002287973A - 確信度入力およびエキスパートシステムの構築

Info

Publication number: JP2002287973A
Application number: JP2001090709A
Authority: JP
Inventors: Makoto Ouchi; 真大内
Original assignee: Seiko Epson Corp
Current assignee: Seiko Epson Corp
Priority date: 2001-03-27
Filing date: 2001-03-27
Publication date: 2002-10-04
Anticipated expiration: 2021-03-27
Also published as: JP3770099B2

Abstract

(57)【要約】【課題】知識ベースなどにおける命題の確信度を簡易
に入力可能とする。【解決手段】エキスパートシステムにおける知識ベー
スを構築する際や、知識ベースへの問い合わせを行なう
際、入力した命題（文）を解析して、文に使われた単語
について予め付与された確信度を用いて、文全体の確信
度を演算する。単語には、「だいたい」の場合、確信度
０．６といったように数値を与えておき、複数の単語が
使われている場合には、単語毎に指定された演算方法
（例えばＣｏｍｂ法、乗算法、平均値法など）を用いて
演算する。また、知識ベースに問い合わせる場合には、
質問に対してユーザが音声で応答するものとし、その音
声の語調の強さや特定の音韻を延ばしたか否かなどの情
報から確信度をもとめるものとしても良い

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、命題に対する入力
者の確信度を入力する技術とこの確信度の入力を用いて
エキスパートシステムを構築する技術に関する。

【０００２】

【従来の技術】従来から、専門家の知識などをデータベ
ース化して、誰でもこれを利用できるようにしようとす
るエキスパートシステムの構築が試みられてきた。当初
こうしたエキスパートシステムは、回答が「ＹＥＳ」か
「ＮＯ」になるような単純なルールの組合わせとして表
現されていたが、人間の知識とこれに伴う判断には、曖
昧さが伴うことが理解されるに従い、これをコンピュー
タ上でも表現できるようにしようとする取り組みがなさ
れてきた。つまり、「××ならば、○○である」という
単純な命題に対して、「××ならば、多分○○である」
というような曖昧さを許容したルールによるエキスパー
トシステムの構築が試みられてきたのである。

【０００３】こうしたシステムでは、命題の確からしさ
を表わすのに、確信度を数値化してルールに添付した
り、数値表現される条件（例：「今日は２８度Ｃ」）に
対して、判断（例：「今日は暑い」）をメンバーシップ
関数として定義する、という対応がとられていた。前者
にあっては、確からしさ（以下、確信度という）は、
「０〜１．０」あるいは「−１．０〜１．０」といった
数値で表現される。例えば、「今日は天気が良い」とい
う命題に対して、確信度＝［０．６］というように数値
を入力して、各命題の確信度を定義するのである。

【０００４】後者、即ちメンバーシップ関数を用いた方
法は、ファジィ理論において取られた手法であり、変数
ｘに対して、命題が成り立つ可能性ｙを、図１１に示す
ような関数により与えるものである。例えば、気温Ｔが
２８度Ｃであれば、図１１に示したメンバーシップ関数
を用いることにより、確信度０．８が得られることにな
る。

【０００５】

【発明が解決しようとする課題】しかしながら、こうし
た確信度の数値化やメンバーシップ関数の設定は、人間
の知識を用いたエキスパートシステムにおいては必ずし
もうまく機能しない、という問題があった。一つには、
膨大な数のルール（命題）を入力する際、その確信度を
いちいち数値で入れる手間が大変であり、大部分のルー
ルは確信度０．５に設定しておき、特定の命題だけ、評
価して数値を与えるといった対応がされやす、という問
題があった。この場合には、当然システムの精度、信頼
性は低下してしまう。もとより、全ての命題に確信度を
数値入力することも可能ではあるが、確信度を数値化す
る入力者の性格などから、全体的に確信度を高く設定し
てしまう人や、低く設定してしまう人があり、システム
の全体として見たとき、判断のばらつきか大きくなっ
て、信頼性は必ずしも高くならないという問題があっ
た。

【０００６】また、メンバーシップ関数は、条件を数値
化しやすい場合（例えば、「体温が○○度なら」など）
にはある程度役に立つが、数値化できない条件（例え
ば、「体がだるかったら」など）は、メンバーシップ関
数を定義することができず、これらの条件を組み合わせ
て、有意な判断を上手く取り出すことができない。しか
も、人間の生活全般を考えると、むしろ数値化できない
多数の条件を組み合わせて判断していることが多く、こ
れを数値化することは困難であった。この点でも、従来
のエキスパートシステムの実用化には、大きな課題が存
在した。

【０００７】本発明は、こうした問題を解決し、確信度
の入力を容易にし、これを用いたエキスパートシステム
の構築を実用的なレベルにすると共に、システムの判断
の信頼性を高めることを目的とする。

【０００８】

【課題を解決するための手段およびその作用・効果】上
記課題の少なくとも一部を解決する本発明のデータの処
理方法は、命題に対する入力者の確信度を入力する確信
度入力装置であって、前記命題に関する入力者の入力を
受け付ける入力受付手段と、該受け付けた入力に備わっ
た特徴を解析する特徴解析手段と、該解析した特徴か
ら、予め記憶されたデータに基づいて、前記命題に関す
る確信度を抽出する確信度抽出手段とを備えたことを要
旨としている。

【０００９】かかる確信度入力装置に対応した方法の発
明は、命題に対する入力者の確信度を入力する確信度入
力方法であって、前記命題に関する入力者の入力を受け
付け、該受け付けた入力に備わった特徴を解析し、該解
析した特徴から、予め記憶されたデータに基づいて、前
記命題に関する確信度を抽出することを要旨としてい
る。

【００１０】かかる確信度の入力に関する発明によれ
ば、命題に関する入力（命題自身もしくは命題に対する
答えなど）を受け付ける際、この入力に備わった特徴を
解析して、予め記憶したデータに基づいて、入力した命
題に関する確信度を抽出する。従って、入力者に、確信
度を数値で入力したり、メンバーシップ関数を定義する
といった対応を求めることがなく、確信度を、個人差な
く入力することができる。しかも、確信度の入力に余分
な手間を要しない。

【００１１】ここで、命題に関する入力には、様々な手
法が考えられるが、例えば、自然言語からなる文を入力
するものとしても良い。自然言語からなる文を受け付け
た場合には、この文を構成する単語を、例えば形態素解
析などにより取り出し、この文に含まれる所定の単語を
利用して確信度を計算することができる。単語に基づく
確信度の計算は、例えば確信度を表わす単語について、
確信度を推定する数値を予め記憶しておき、取り出され
た単語に関して、この数値を読み出し、これにより確信
度を計算するようにすることができる。確信度を表わす
単語とは、例えば「多分」「おおよそ」「きっと」「す
ごく」などの程度を表わす副詞や連用詞のみならず、
「良い」「悪い」「すばらしい」「やる気のない」とい
った形容詞や連体詞など、更には「だろう」「と思う」
「かな。」などの助詞、助動詞、述語動詞、などを想定
することができる。これらを、総称して、命題を表わす
叙述表現に対する関係表現とか枠組み表現と呼ぶことが
できる。

【００１２】こうした関係表現は、どのような言語にも
存在するが、例えば日本語を例に採ると、通常の日本語
文法の枠組みでは、伝聞、推量といった簡略な分類しか
与えられていない。これらの表現は、文法という規範に
よる扱いにはなじまず、むしろ網羅的な分類により取り
扱うほかと言える。日本語を例にとれば、こうした網羅
的な収集、分類は、既に首藤等によって、「日本語文構
造のわく組を与える表現」（首藤公昭、楢原斗志子、福
岡大学総合研究所報第６３号、昭和５８年３月）など
に、集成されている。そこで、こうした網羅的な分類に
基づいて、各表現に確信度を与えたデータベース、例え
ば辞書を用意しておけば、形態素解析などを利用して自
然語からなる文から単語を抽出し、この単語により辞書
を参照して、確信度を求めることは容易である。なお、
英語など、単語が文において独立している言語では、形
態素解析などを行なわなくても、簡単なフィルタ処理に
より単語を取り出すことができる。また、日本語でも、
分かち書きされた文であれば、単語を取り出すことは容
易である。

【００１３】こうして単語毎に予め記憶した確信度を用
いて、命題全体に対する確信度を計算するには、確信度
を表わす数値と演算方法とを、単語毎に記憶し、確信度
の計算において、記憶された数値と演算方法とを用いて
前記文が表現している確信度を演算すればよい。もとよ
り、数値を記憶する単語を予め特定の単語（例えば確信
度を一般に高める単語や、確信度を一般に下げる単語、
など）に限っておけば、演算方法を一つに限定すること
も可能である。

【００１４】単語毎に付与された確信度を表わす数値と
して、値０ないし１の範囲の数値とし、演算方法とし
て、少なくともＣｏｍｂ法、乗算法、平均値法のうちの
一つを含むものとすることができる。特に、数値を記憶
した単語の範囲を広げ、単語毎に演算方法も併せて指定
すれば、確信度の計算に柔軟性を持たせ、自然言語を用
いて表現された命題の確信度の演算を、精度良く行なう
ことができる。

【００１５】なお、通常確信度を付与される単語は上記
の関係表現に関する単語なので、命題を示す文が、確信
度を記憶していない単語のみから構成されている場合も
当然あり得る。こうした場合、即ち、文に、確信度を表
わす数値を記憶した単語が含まれていない場合には、文
の確信度を、予め定めた所定値に設定することも、確信
度の入力を容易にする点で有用である。

【００１６】演算方法におけるＣｏｍｂ法とは、例えば
二つの単語に確信度ａ，ｂ（０≦ａ，ｂ≦１）が与えら
れているとき、この二つがそのまま現われる文の確信度
Ｃは、Ｃ＝ａ＋ｂ−ａ＊ｂとして求める方法である。乗算法とは、例えば二つの単
語に確信度ａ，ｂが与えられているとき、この二つがそ
のまま現われる文の確信度Ｃは、Ｃ＝ａ＊ｂとして求める方法である。平均値法とは、例えば二つの
単語に確信度ａ，ｂが与えられているとき、この二つが
そのまま現われる文の確信度Ｃを、Ｃ＝（ａ＋ｂ）／２として求める方法（いわゆる「相加的平均」）である。
もとより演算方法は、これらの方法に限られる訳ではな
く、単語における確信度の表現に着目し、例えば相加的
平均以外に相乗的平均（Ｃ＝√（ａ＊ｂ））を求める方
法や、修飾−被修飾の関係にある単語間では、重み付け
計数を考慮して平均値を求める方法なども採用可能であ
る。

【００１７】この他、命題に関する入力として、入力者
の音声を入力するものとし、この音声に備わっている特
徴に基づいて、確信度を計算することも考えられる。確
信を持っている事項と確信の持てない事項とを話すと
き、その音声には、一定の違いが見られることが知られ
ているからである。音声の特徴としては、音声の強さ、
長さ、基本周波数、アクセントなどを考えることができ
る。このうち少なくとも一つについて解析するものとす
ればよい。もとより、複合的に解析しても良い。通常、
人間は、確信を持っている事項については、強く、長
く、明確なアクセントで発音することが知られている。
これは、多数の入力者の音声を処理すれば、明らかにな
る、いわばヒューリスティクな法則である。従って、一
人の入力者について処理する場合には、確信度が分かっ
ている命題についての音声入力を予め行なって、その音
声上との特徴と確信度との関係を較正しておくことが、
より望ましい。音声の基本周波数は、発言者が嘘を付い
たり、確信のもてないことを無理に確信があるように発
言する場合、緊張から、音声の基本周波数が上昇するこ
とが知られている。そこで、入力作業を通して、入力者
の音声の基本周波数を解析し、これにより確信度を抽出
するものとすることもできる。もとより、これらの情報
は、音声認識により取り出した単語について記憶された
確信度を補正するのに用いるといったことも可能であ
る。

【００１８】音声に基づく確信度の抽出は、具体的に
は、音声の強さ、長さ、基本周波数、アクセントが、音
声が強いほど、音声が長く継続するほど、周波数が低い
ほど、アクセントが強調されるほど、確信度が高いもの
として行なうことができる。

【００１９】本発明は、上記の確信度入力の手法を適用
したエキスパートシステムの構築方法として捉えること
ができる。即ち、本発明のエキスパートシステム構築方
法は、複数の命題を、該命題に対する入力者の確信度と
共に蓄積して、エキスパートシステムを構築する方法で
あって、前記命題に関する入力者の入力を受け付け、該
受け付けた入力に備わった特徴を解析し、該解析した特
徴から、予め記憶されたデータに基づいて、前記命題に
関する確信度を抽出し、前記命題と前記抽出した確信度
とを、データベースとして記憶し、該データベースに記
憶された各命題に構造を与えてエキスパートシステムを
構築することを要旨としている。

【００２０】かかるエキスパートステムの構築方法によ
れば、命題に関する入力を行なうだけで、その命題に関
する確信度を抽出し、命題とその確信度とをデータベー
スにとして記憶し、更にこのデータベースに記憶した各
命題に構造を与えて、エキスパートシステムとして構築
することができる。従って、信頼性の高いエキスパート
システムの構築を容易に行なうことができる。

【００２１】なお、これらの発明は、いずれもコンピュ
ータ上で実行されて上記の機能を実現するプログラムの
発明、こうしたプログラムを記録した記録媒体としての
発明として、それぞれ把握することができる。また確信
度入力装置やエキスパートシステムは、コンピュータ上
でプログラムが実行されることで、上記の入力の受け付
け、特徴の解析、確信度の抽出などを実現するものであ
っても良いし、ディスクリートな回路構成より実現する
ものであっても良い。また、プログラムは、Ｃ言語やパ
スカル、フォートラン、コボル、ＢＡＳＩＣ、等の周知
のプログラム言語が採用可能であり、オブジェクト指向
のプログラム言語、あるいはＪａｖａＳｃｒｉｐｔ等の
言語などを利用することも可能である。記録媒体として
は、フレキシブルディスク，ＣＤ−ＲＯＭ，ＤＶＤ−Ｒ
ＯＭ，半導体メモリ（ＲＯＭ，ＰＲＯＭ，ＥＥＰＲＯ
Ｍ，フラッシュメモリ等）など、種々の記録媒体を用い
ることができる。もとより、インターネットなどのネッ
トワーク上に置かれたサーバにこれらのプログラムを記
憶しておき、クライアントのコンピュータにダウンロー
ドして利用することも可能である。

【００２２】

【発明の実施の形態】以下、本発明の実施の形態とその
実施例とについて説明する。（１）第１の実施の形態：図１は、本発明の実施の形態
を示すブロック図である。この実施の形態では、命題
は、キーボードなどの文入力部Ｍ１を介して入力され
る。入力された文は、いわゆる自然言語による文であ
り、これを形態素解析部Ｍ２により、文を構成する単語
ｔ１，ｔ２・・・を取り出す処理を行なう。なお、キー
ボードなど文入力部Ｍ１が、仮名漢字変換を伴って文を
入力するものである場合には、文入力部Ｍ１と形態素解
析部Ｍ２とを一体に構成し、仮名漢字変化を伴う入力時
に、単語の抽出を行なってしまうようにすることが簡便
である。形態素解析により取り出された単語は、字句解
析部Ｍ３に送られ、ここで確信度の解析が行なわれる。
字句解析部Ｍ３は、予め単語毎の確信度を用意したデー
タベース（以下、確信度辞書という）ＤＤＢを参照し、
文を構成していた単語の確信度ｄ（ｔ）および確信度集
計方法（以下、単に演算方法という）を取り出す処理を
行なう。こうして取り出された単語毎の確信度および演
算方法は、確信度集計部Ｍ４に出力され、ここで各単語
毎に与えられた演算方法に基づく確信度の演算を行な
う。

【００２３】確信度の計算は、次のように行なう。ここ
では、「天気はちょっと崩れるらしい」という文を例と
して説明する。この文から、「天気」「ちょっと」「崩
れる」「らしい」という４つの単語が取り出されたと
き、確信度辞書ＤＤＢを参照すると、「天気」「崩れ
る」については、確信度が与えられておらず、「ちょっ
と」については確信度０．４、「らしい」については、
確信度０．５が与えられていたとする。また、「ちょっ
と」についての演算方法として平均値法が、らしいにつ
いては乗算法が、与えられているとする。この場合、
「天気は崩れる」という命題についての確信度ｘ２は、
文中で後ろに置かれた単語の演算方法を用いるものと
し、ｘ２＝０．４＊０．５＝０．２となる。

【００２４】なお、入力した文が「天気は崩れるらし
い」のように、確信度を有する単語が一つの場合は、除
算法においてはｂ＝１として、その単語の確信度が、命
題全体の確信度ｘ１として計算される。また、「天気は
ちょっと崩れるらしいと聞いた」のように、確信度が与
えられた単語が３つ以上見つかった場合には、これを順
番に計算すればよい。上記の文で「聞いた」が確信度
０．５、演算方法が乗算法であれば、ｘ３＝ｘ２＊０．５＝０．１となる。こうして計算した全体の確信度は、データベー
ス構築部Ｍ５により集められ、命題データベースＳＤＢ
に、命題自身と共に記憶される。こうして、エキスパー
トシステムの基礎となる命題データベースＳＤＢが用意
される。

【００２５】（２）第２の実施の形態：本発明の第２の
実施の形態は、図２に示すように、第１の実施の形態の
構成要素との比較により説明すると、文入力部Ｍ１に代
えて音声入力部Ｍ１１が、形態素解析部Ｍ２に代えて音
声分析部Ｍ１２が、字句解析部Ｍ３に代えて音声解析部
Ｍ１３が、それぞれ設けられている。その余の構成は、
第１の実施の形態とほぼ同一である。ここで、音声入力
部Ｍ１１は、音声の認識までは行なっておらず、音の強
さと長さを取り込むマイクやアンプからなる回路であ
る。また音声分析部Ｍ２は、音声の強さを５段階に、長
さを３段階に分けて認識する回路である。音声解析部Ｍ
１３は、認識した音声の強さＶと長さＬとから、確信度
辞書ＤＤＢを参照して、命題に関する入力者の確信度を
求める回路である。このとき、単語は音声認識により入
力しても良いし、第１の実施の形態と同様、キーボード
等から入力するものとしても良い。単語毎に、音声の強
さＶや長さＬから確信度ｘが得られたなら、これを集計
してデータベースとして蓄積する点は、第１の実施の形
態と同様である。

【００２６】かかる構成によっても、命題についての入
力者の入力に基づいて、そこに存在する特徴（この実施
の形態では、音声の強さと長さ）により確信度を抽出す
ることができ、データベースにこれを蓄積していくとが
できる。

【００２７】上述した両実施の形態ともデータベースへ
の確信度と命題の記憶までしか含んでいないが、一旦こ
れらの情報がデータベースとして蓄積されれば、このデ
ータベースに蓄積された各命題に構造を与えることによ
り、これをエキスパートシステムとして構築することは
容易である。

【００２８】以上説明した本発明の実施の形態を一層明
らかにするために、以下実施例について詳しく説明す
る。（３）実施例における装置構成：次に、本発明の実施例
について説明する。図３は、本発明の第１実施例である
確信度入力を行なう。図３に示した例では、本発明の確
信度入力を具現化するプログラムが、インターネットの
ようなネットワーク１０に接続されたデータベースサー
バ２０にインストールされている例を示している。デー
タベースサーバ２０は、それ自身スタンドアロンのコン
ピュータとして使用可能であるが、以下で説明するよう
に、サーバとして他のクライアントから利用することが
可能である。すなわち、ネットワーク１０に接続された
多数のコンピュータ３０，４０の利用者が、各人の知識
をルール（命題）として取り出し、これをネットワーク
１０を介してデータベースサーバ２０に入力すること
で、短期間に大規模なエキスパートシステムを、データ
ベースサーバ２０に構築しようとするものである。入力
部分については、データベースサーバ２０，コンピュー
タ３０，４０共に同じなので、以下、データベースサー
バ２０を例として説明を行なう。なお、エキスパートシ
ステムができあがれば、コンピュータ３０，４０からの
問い合わせをネットワーク１０を介して受けたデータベ
ースサーバ２０が、内部に構築されたエキスパートシス
テムを用いて推論を行ない、その推論果を、ネットワー
ク１０を介して、クライアントであるコンピュータ３０
などに返すといった形態で利用される。エキスパートシ
ステムとしては、どのようなものでも適用可能である
が、以下の説明では、病気の診断用エキスパートシステ
ムを例として説明する。

【００２９】データベースサーバ２０の内部構成を図３
に基づいて説明する。データベースサーバ２０は、モデ
ムやルータ１８を介してネットワーク１０とのデータの
やり取りを制御するネットワークインタフェース（ＮＴ
−Ｉ／Ｆ）２１、処理を行なうＣＰＵ２２、処理プログ
ラムや固定的なデータを記憶するＲＯＭ２３、ワークエ
リアとしてのＲＡＭ２４、時間を管理するタイマ２５、
モニタ２９への表示を司る表示回路２６、テキストデー
タをデータベースとして蓄積しているハードディスク
（ＨＤ）２７、キーボード１１，マウス１２，マイク１
３とのインタフェースを司る入力インタフェース（Ｉ／
Ｆ）２８等を備える。なお、ハードディスク２７は、固
定式のものとして記載したが、着脱式のものでも良い
し、着脱式の記憶装置（例えばＣＤ−ＲＯＭ、ＣＤ−
Ｒ、ＣＤ−ＲＷ、ＤＶＤ−ＲＯＭ、ＤＶＤ−ＲＡＭ、フ
レキシブルディスクなど）を併用することも可能であ
る。また、この実施例では、データベースサーバ２０の
処理プログラムは、ＲＯＭ２３内に記憶されているもの
としたが、ハードディスク２７に記憶しておき、起動時
にＲＡＭ２４上に展開して実行するものとしても良い。
あるいは、上述した着脱式の記録媒体から読み込むもの
としても良い。更には、ネットワーク１０を介して、他
のサーバから読み込んで実行するものとしても良い。

【００３０】ハードディスク２７には、仮名漢字変換辞
書ＤＩＣが記憶されている。この仮名漢字変換辞書は、
キーボード１１から入力されたかな文字列を解析して、
仮名漢字文字列に変換する際に参照されるものである。
この辞書ＤＩＣには、単語の読み、表記、文法情報の他
に、図４に例示するように、単語の一部については、確
信度のデータＣＮＦおよび確信度の集計方法を示す演算
方法が記憶されている。もとよりこれらのデータは、全
ての単語について付与されている訳ではなく、確信度に
影響を与える可能性のある単語についてのみ付与されて
いる。

【００３１】図３に示したデータベースサーバ２０で
は、ハードディスク２７にデータベースが構築される。
このデータベースＤＢは、基本的にはテキストデータか
らなる命題の集合として構築される。この命題は、キー
ボード１１から入力した文として入力される。なお、こ
のデータベースＤＢを構築する際、キーボードから入力
された文をそのまま登録しても良いが、一定の標準化を
行なって登録しても良い。標準化を行なうことにより、
文の作成者が異なる場合などに生じやすい用語のばらつ
きや表記のばらつきなどを統一することができ、データ
ベースＤＢを用いてエキスパートシステムを検索する際
のルール（構造）を簡略化することができる。

【００３２】この文の標準化について簡略に説明する。
データベースサーバ２０は、後述する文をハードディス
ク２７に登録する際、図５に示すように、まず文を形態
素解析し、文が、文法情報を備えた単語から成り立つも
のとして把握する。その後、これらの単語から構成され
た文に対して、次の４つのレベルの標準化を行なう。（Ａ）文字の標準化処理（予め定めた文字に置き換える
文字の標準化）、文字レベルの表記のゆれであり、カタ
カナ語尾の長音の有無、カタカナ全角／半角といった全
く概念に変化のない表記のゆれを統一するのである。（Ｂ）表記の統一処理（表記のゆれを予め定めた表記に
統一する処理）、単語レベルの表記のゆれであり、ほと
んど意味の異ならない複数漢字表記などを統一するので
ある。（Ｃ）自立語処理（自立語を、予め定めた置き換えの基
準に従って、他の自立語に置き換える処理）、自立語の
表記のゆれであり、わずかに意味の異なることがある単
語間の入れ替えを行なって、使用する自立語を統一する
のである。

【００３３】なお、これらの標準化の他に、（Ｄ）付属
語処理（文節レベルの表記のゆれの処理）も考えられる
が、付属語処理の標準語は、文末表現の統一など、確信
度の影響を与える要素を調整することがある。そこで、
本実施例では、付属語の標準化処理は行なっていない。

【００３４】上記の標準化の処理は、通常は、ハードデ
ィスク２７内に備えられた標準化辞書を参照することに
より行なわれる。標準化辞書には、上記の標準化処理に
対応した辞書が含まれており、形態素解析を行なった
後、各単語について辞書を参照し、各単語について複数
の表記、複数の単語が登録されていれば、これを予め定
めた一つの表記、一つの単語に置き換えるのである。

【００３５】次に、本実施例において、確信度の入力を
行なう際の処理について説明する。図６は、確信度の入
力を行なう際の処理プログラムを示すフローチャートで
ある。図示するように、このプログラムは、命題（文）
の入力の際に実施されるものである。この処理が起動さ
れると、まずキーボード１１から文を入力する処理を行
なう（ステップＳ１００、１０５）。入力は文単位で、
即ち句点が入力されるまでを単位として行なわれる。文
が入力されると、文の標準化処理を行なう（ステップＳ
１１０）。標準化処理は上述したか、用語を統一するた
めの処理である。例えば、「熱がある」「ねつがある」
「ネツがある」などを一つの標準的な表記「熱がある」
に統一するといった処理である。この後、入力した文が
命題としふさわしいか否かのチェックを行なう（ステッ
プＳ１２０）。

【００３６】ここで入力している文は、最終的にエキス
パートシステムを構築し、病名の診断などに用いられ
る。従って、こうした目的から見て命題として無意味な
文（例えば、「病気はやだな。」「病い時は病気だ」）
や、命題として矛盾した文（例えば、「熱が高くて平熱
だ」）などは、この段階で排除される。

【００３７】入力した文が、命題として適切であると判
断した場合には（ステップＳ１２０）、次に、入力文を
形態素解析する処理を行なう（ステップＳ１３０）。形
態素解析を用いれば、文を構成する単語を容易に切り出
すことができる。こうした形態素解析は、例えば最小コ
スト法といった仮名漢字変換の技術として確立した技術
を用いることができる。図７は、入力した文ｎが「結核
だとだいたい微熱が出たりする。」である場合を示す。
この文ｎを形態素解析すると、図示するように、「結
核」「だと」「だいたい」「微熱」「が」「出」「たり
する」といった単語を取り出すことができる。

【００３８】次に、これらの単語について、辞書ＤＩＣ
を参照して、確信度のデータＣＮＦと演算方法を読み出
す処理を行なう（ステップＳ１４０）。なお、本実施例
では、確信度のデータは、仮名漢字変換用の辞書ＤＩＣ
に記憶したが、確信度ＣＮＦと演算方法だけを与えるよ
うに別の辞書として用意しても良い。図４に示した例で
は、「だいたい」について確信度「０．６」、演算方法
としてＣｏｍｂ法が、「たりする」について確信度
「０．８」、演算方法として乗算法が、それぞれ見い出
された。こうした確信度の数値は、例えば「わずかに」
「やや」「より」「だいたい」「普通」「多分」「かな
り」「非常に」「極めて」といった程度を表わす語につ
いて、それぞれ「わずかに（０．１）」「やや（０．
２）」「より（０．３）」「だいたい（０．４）」「普
通（０．５）」「多分（０．６）」「かなり（０．
７）」「非常に（０．８）」「極めて（０．９）」のよ
うに、何段階かに分けて登録されている。なお、この例
では、０．１刻みにしたが、０．１５など、１／２０刻
みや１／１００刻みで値を与えても良い。また、単語毎
に使用する演算方法として、最適のものが指定されてい
る。一般に確信度を上げる種類の単語（例えば「一層」
「非常に」など）についてはＣｏｍｂ法が、確信度を著
しく下げる種類の単語（例えば「聞いた」「らしい」な
ど）については乗算法が、また確信度に対して他の語と
の関連が小さい種類の単語（例えば「平均的には」「通
常は」など）については平均値法が、それぞれ指定され
る傾向にある。

【００３９】次に、得られた確信度を用いて、文ｎの全
体の確信度を演算する処理を行なう（ステップＳ１５
０）。この実施例では、確信度の計算は、単語「たりす
る」について指定された演算方法、つまり乗算法を用い
ることになる。この手法の詳細は、既に説明したので繰
り返さないが、この例では、文ｎの全体の確信度ｘｎ
は、ｘｎ＝０．６＊０．８＝０．４８となった。なお、文中に現われた単語がいずれも確信度
を持っていないようはな場合には、その文の確信度は
０．５に設定される。例えば「天気は崩れる。」といっ
た命題文の場合には、確信度を調整するような単語は存
在しないので、文全体の確信度は、値０．５とされるの
である。次に、この文全体の確信度ｘｎを文ｎと組にし
て、ハードディスク２７に記憶する処理を行なう（ステ
ップＳ１６０）。以上で、本実施例における確信度の入
力処理を完了する。

【００４０】確信度の演算方法について、補足する。辞
書ＤＩＣに、次のように単語毎の確信度と演算方法が登
録されているものとする。単語確信度演算方法ちょっと０．４Ｃｏｍｂ法らしい０．５乗算法聞いた０．５乗算法かなりと０．８Ｃｏｍｂ法激しく０．９Ｃｏｍｂ法

【００４１】この場合、次の各文の確信度は、以下のよ
うに演算される。例文１：「天気は崩れる。」確信度０．５（文中に、確信度を有する単語がないか
らである）。例文２：「天気はちょっと崩れるらしい。」確信度ｘ２＝０．４＊０．５＝０．２例文３：「天気はちょっと崩れるらしいと聞いた。」確信度ｘ３＝（０．４＊０．５）＊０．５＝０．１例文４：「天気はかなり激しく崩れる。」確信度ｘ２′＝０．８＋０．９−０．８＊０．９＝０．
９８例文５：「天気はかなり激しく崩れるらしい。」確信度ｘ３′＝０．９８＊０．５＝０．４９５

【００４２】以上説明した本実施例の確信度入力方法に
よれば、キーボード１１から入力した文に含まれる単語
について予め辞書ＤＩＣに用意した確信度と演算方法と
を求め、これに基づいて文全体の確信度を与えることが
できる。従って、入力者は、命題（文）毎にいちいち確
信度を数値入力したり、メンバーシップ関数を定義する
といった煩わしい処理を行なう必要がない。また、文の
確信度を、通常使用している自然な日本語文を介して設
定できるので、数値を入力に伴う個人差などが生じにく
いという利点も得られる。更に、確信度を単語毎に与え
るだけでなく、確信度を集計する演算方法も単語毎に与
えているので、確信度の決定をきめ細かく行なうことが
できる。また、本実施例では、入力文について標準化の
処理を行なっているので、入力者により命題である文が
微妙に異なると言うことがない。

【００４３】（４）エキスパートシステムの構築：以上
説明した手法により、命題と確信度とが、ハードディス
ク２７内にデータベースとして蓄積された。そこで、次
に、これをエキスパートシステムとして構成する手法に
ついて説明する。図８は、実現しようとするエキスパー
トシステムの概略構成図ある。図示するように、このエ
キスパートシステムは、知識ベースＡＢ、推論機構Ａ
Ｎ、知識獲得支援モジュールＡＳ、推論過程説明モジュ
ールＡＥ、ユーザインタフェースＵＩなどから構成され
ている。上述した第１の実施例において命題と確信度を
入力した処理は、知識獲得支援モジュールＡＳに相当
し、その結果、得られた命題と確信度が、知識ベースＡ
Ｂに格納される。本実施例では、基本的にプロダクショ
ンシステムを用いており、知識ベースＡＢは、「鼻水が
出ていれば風邪かも知れない。」「咳と微熱が続けば、
結核の疑いがある。」といった「○○ならば、××であ
る」というタイプの知識として、知識ベースＡＢは構成
されている。

【００４４】推論機構ＡＮは、こうして蓄積された知識
ベースを用いて推論を行なうものである。推論は、ユー
ザインターフェースＵＩを介して入力された条件を用い
て、前向きまたは後ろ向きの推論を適宜使い分けしつ
つ、行なわれる。ユーザインタフェースは、後述する第
２実施例において説明するように、推論機構ＡＮから出
した質問に、ユーザが回答するものを受け付け、これを
推論機構ＡＮに渡す。例えば、「質問：どんな症状です
か？」「答え：鼻水が出て熱があります。」「質問：鼻
水が出ているのですか？」「答え：はい。」「質問：熱
があるのですね？」「答え：すごーく高いのです。」と
いったやり取りを介して、ユーザインタフェースＵＩ
は、推論機構ＡＮに、推論の基礎となる命題「鼻水か出
ている」「熱がある」とそれぞれについてのユーザの確
信度を渡す。

【００４５】推論機構ＡＮは、これらの命題および確信
度を用いて推論を行ない、結論を推論過程説明モジュー
ルＡＥに出力する。推論過程説明モジュールＡＥは、推
論の結果を、ユーザインタフェースＵＩを介して、使用
者に提示する。例えば、上記の質問と回答から、熱が高
いという命題の確信度は高いと判断し、「あなたは、風
邪症状ですが、インフルエンザの可能性があります。」
といった推論結果と、「鼻水が出ていて、熱がかなりあ
るからです」といった推論過程の説明を、例えばディス
プレイ上に表示するのである。

【００４６】（４）第２実施例：次に、本発明の第２実
施例について説明する。第２実施例は、第１実施例の処
理により蓄積されたデータベースを、上述した手法でエ
キスパートシステムにおける知識ベースＡＢとして構築
したケースにおいて、ユーザインタフェースＵＩが、ユ
ーザの回答を推論機構ＡＮに渡す部分に適用されたもの
である。即ち、第２実施例の確信度入力は、上述した第
１実施例と基本的には同じハードウェア構成を用い、推
論機構ＡＮが、「質問：熱はありますか？」に対して、
ユーザが答えた回答の確信度を入力するものである。第
２実施例では、ユーザの音声を用いて、確信度の入力を
行なう。

【００４７】図９は、第２実施例における処理の概要を
示すフローチャートである。この処理ルーチンは、エキ
スパートシステムが既にできあがっており、ユーザが、
エキスパートシステムを利用する際に起動される。この
ルーチンが起動されると、まずモニタ２９に「症状を入
力して下さい」という表示を行なう（ステップＳ２０
０）。ユーザは、この表示を見て、キーボード１１を用
いて「熱があります」といった症状を入力する（ステッ
プＳ２１０）。ユーザの入力を受け取ると、この文を解
析し、推論機構ＡＮは、推論の条件が十分なものになる
まで（ステップＳ２２０）、質問を繰り返す（ステップ
Ｓ２３０）。例えば、「どのくらい熱いのですか？」と
いう質問を出力する。これに対してユーザは、キーボー
ド１１から「すごく熱い」というように答えても良い
が、本実施例では、マイク１３を用いて、回答を入力す
るように促される（ステップＳ２４０）。そこで、ユー
ザがマイク１３に向かって、「あつい」とか「あつー
い」と返事をすると、これを入力し（ステップＳ２５
０）、ユーザの発音に備わった特徴について解析する
（ステップＳ２６０）。

【００４８】ここで、音声の解析は、次の２点について
行なわれる。一つは音声の強さであり、もう一つは音声
の長さである。音声の強さは、簡便には、マイク１３か
ら入力した音声の絶対値により認識することができる
が、音声の絶対値はマイクと話者との距離や角度により
変化しやすい。そこで、本実施例では、子音の部分と母
音の部分との音声の強弱比を検出して音声の強さを判定
している。いわゆる語気の強い言葉は、母音の部分に対
する子音の部分の音が強いからである。母音の部分の検
出は、音声に含まれるフォルマント構造を認識すること
により検出することができる。音声に含まれるフォルマ
ント構造を認識するためには、音声をフーリエ変換し、
特定の周波数領域にピークが存在するかどうかを判定す
ればよい。こうして特定された母音部分の音の強さ（波
高値の絶対値）と、この前後に存在する子音の部分（通
常フーリエ変換により、含まれる周波数帯域が高い領域
として認識できる）の音の強さとの比を採ることによ
り、子音の部分の強調を認識することができる。

【００４９】一方、音声の長さは、次のように検出して
いる。例えば「あつい」と「あつーい」を比べると、
「つ」の継続期間が長いほど、話し手が確信を持ってい
る、あるいは強調したいと考えていることが分かる。そ
こで、こうした音節が所定時間を超えて継続している部
分があるかないかを検出するのである。一般に日本語の
場合、継続できるのは母音の部分に限られるので、マイ
ク１３から入力した音声をフーリエ変換し、フォルマン
ト構造を見い出して母音の区間を特定し、この区間が通
常の話し手の話のピッチから見て、２倍以上に及ぶ部分
があれば、これを強調とみなすのである。

【００５０】次に、解析した音声の特徴に基づいて、確
信度を与える処理を行なう（ステップＳ２７０）。この
場合、音声の強さと強調されている母音の長さを入力と
するテーブルやマップを用意し、これを用いて、確信度
を与えればよい。図１０に、音声の強さと特定の母音の
長さに基づいて、確信度を与えるテーブルの一例を示
す。ユーザインタフェースＵＩは、与えられた確信度ｘ
を、推論機構ＡＮに渡す。推論機構ＡＮは、入力された
命題（「熱があります」）と、これについての確信度ｘ
とを組にして受け取り、知識ベースＡＢを参照して、推
論を進める。推論が結論を導くことができる程度に進む
まで、上記処理を繰り返す。

【００５１】推論機構ＡＮが推論を完了したと判断する
と（ステップＳ２２０）、この推論を結果をモニタ２９
に表示し（ステップＳ２８０）、必要に応じて、推論の
過程の説明を加え（ステップＳ２９０，Ｓ２９５）、本
ルーチンを終了する。

【００５２】以上説明した第２実施例によれば、使用者
は、入力した命題に対する確信度をいちいち数値で入力
する必要がなく、質問に対して、口頭でかつ普通の日本
語で答えるだけで、確信度を入力することができる。従
って、確信度の入力に煩瑣な作業を要求されることもな
く、かつ数値入力における個人差や数値で入力するため
についつい高い確信度を入れてしまう、といった弊害を
生じることがない。エキスパートシステムは、「熱があ
ります」といった単純な命題だけでなく、この命題に対
する入力者の確信度も併せて入力することができるの
で、推論機構ＡＮを精密に運用して、精度の高い判断結
果を示すことができる。

【００５３】なお、上記実施例では、命題は、キーボー
ド１１からの文の入力を基本としたが、音声認識を利用
して命題を入力するようにしても差し支えない。更に、
モニタ２９上にいくつかの選択肢を表示し、マウス１２
を用いて選択することで入力するようにしても良い。例
えば「熱があります」という入力に対して、「熱が高
い」を異なる大きさの文字でいくつかボタン状に表示
し、いずれかを入力者に選択させることで、確信度を受
け付けるようにしても良い。あるいは文字の色を変え
て、赤い文字を選択した場合には、確信度が高いといっ
た関連づけを行なうことも可能である。いずれの手法に
せよ、入力者の行なった入力に備わった特徴を解析して
確信度を抽出することに変わりはない。上記の第２実施
例において、確信度の判断を、音声の強弱や長短に代え
て、あるいはこれらと共に、アクセントの強弱、基本周
波数の高低などにより判断するものとしても良い。

【００５４】以上、本発明の実施例といくつかの変形例
について説明したが、本発明は上記実施例や変形例に何
ら限定されるものではなく、その要旨を逸脱しない範囲
内において、種々の態様により具現化されることは勿論
である。例えば、上記実施例ではデータベースを構築し
てエキスパートシステムを作るものとしたが、単に確信
度を入力し、コンピュータと人間の対話に味付けをする
という利用にとどめても良い。人間との会話ができるコ
ンピュータやロボットにおいて、対話相手である人間の
発言を理解することは極めて重要な事項であり、意味論
的な解析に加えて、話者の確信度を評価して応答を変え
ることは、自然なマンマシンインタフェースを実現する
上で、極めて効果的である。また、電話の自動応答シス
テムなどに適用し、お客様サービスなどの電話番号に電
話してくるユーザの声から、クレームの緊急度を判断し
て、オペレータに接続する構成、１１０番などの緊急電
話番号に掛けてきた人の要件の緊急性などの判断に用い
た構成（結果的にいたずら電話などは自動応答で対処で
きる）、など種々なる態様で実施することができる。

【図面の簡単な説明】

【図１】本発明の第１の実施の態様を示すブロック図で
ある。

【図２】本発明の第２の実施の態様を示すブロック図で
ある。

【図３】本発明の実施例のハードウェア構成を示す説明
図である。

【図４】仮名漢字変換辞書ＤＩＣの登録内容を説明する
説明図である。

【図５】標準化の処理の概要を示す説明図である。

【図６】第１実施例における確信度入力処理ルーチンを
示すフローチャートである。

【図７】確信度入力の一例を示す説明図である。

【図８】実施例におけるエキスパートシステムの概略構
成を示す説明図である。

【図９】第２実施例における確信度入力処理ルーチンを
示すフローチャートである。

【図１０】音声の特徴と確信度との関係を例示する説明
図である。

【図１１】メンバーシップ関数の一例を示す説明図であ
る。

【符号の説明】

１０…ネットワーク１１…キーボード１２…マウス１３…マイク１８…ルータ２０…データベースサーバ２２…ＣＰＵ２３…ＲＯＭ２４…ＲＡＭ２５…タイマ２６…表示回路２７…ハードディスク２９…モニタ３０，４０…コンピュータＡＢ…知識ベースＡＥ…推論過程説明モジュールＡＮ…推論機構ＡＳ…知識獲得支援モジュール

Claims

【特許請求の範囲】

【請求項１】命題に対する入力者の確信度を入力する
確信度入力装置であって、前記命題に関する入力者の入力を受け付ける入力受付手
段と、該受け付けた入力に備わった特徴を解析する特徴解析手
段と、該解析した特徴から、予め記憶されたデータに基づい
て、前記命題に関する確信度を抽出する確信度抽出手段
とを備えた確信度入力装置。
【請求項２】請求項１記載の確信度入力装置であっ
て、前記入力受付手段は、前記命題に関する入力として、自
然言語からなる文を入力する手段であり、前記特徴解析手段は、該受け付けた文を構成する単語を
取り出す手段であり、前記確信度抽出手段は、所定の単語についての確信度を
推定する数値を予め記憶しており、前記取り出された単
語に関して、該数値を読み出し、確信度を計算する確信
度演算手段を備えた確信度入力装置。
【請求項３】請求項２記載の確信度入力装置であっ
て、前記確信度演算手段は、確信度を表わす数値と演算方法とを、単語毎に記憶し、前記確信度の計算において、前記記憶された数値と演算
方法とを用いて前記文が表現している確信度を演算する
手段である確信度入力装置。
【請求項４】請求項３記載の確信度入力装置であっ
て、前記単語毎に付与された確信度を表わす数値は、値０な
いし１の範囲の数値であり、前記演算方法は、少なくともＣｏｍｂ法、乗算法、平均
値法のうちの一つを含む確信度入力装置。
【請求項５】請求項２記載の確信度入力装置であっ
て、前記確信度演算手段は、前記文に、前記数値を記憶した
単語が含まれていない場合には、前記文の確信度を、予
め定めた所定値に設定する確信度入力装置。
【請求項６】請求項１記載の確信度入力装置であっ
て、前記入力受付手段は、前記命題自体を自然文により受け
付ける手段である確信度入力装置。
【請求項７】請求項１記載の確信度入力装置であっ
て、前記入力受付手段は、前記命題に対する入力者の回答を
自然文により受け付ける手段である確信度入力装置。
【請求項８】請求項１記載の確信度入力装置であっ
て、前記入力受付手段は、前記命題に関する入力として、入
力者の音声を入力する手段であり、前記特徴解析手段は、該受け付けた音声に備わっている
特徴を取り出す手段であり、前記確信度抽出手段は、前記取り出した音声の特徴に基
づいて、確信度を計算する手段である確信度入力装置。
【請求項９】請求項８記載の確信度入力装置であっ
て、前記特徴解析手段は、音声の特徴として、音声の強さ、
長さ、基本周波数、アクセントのうち少なくとも一つを
解析する手段を備えた確信度入力装置。
【請求項１０】請求項９記載の確信度入力装置であっ
て、前記確信度抽出手段は、前記音声の強さ、長さ、アクセ
ントのうちの少なくとも一つが、音声が強いほど、音声
が長く継続するほど、基本周波数が高いほど、アクセン
トが強調されるほど、前記確信度を高く計算する手段で
ある確信度入力装置。
【請求項１１】請求項８記載の確信度入力装置であっ
て、前記入力受付手段は、前記命題自体を音声により受け付
ける手段である確信度入力装置。
【請求項１２】請求項８記載の確信度入力装置であっ
て、前記入力受付手段は、前記命題に対する入力者の回答を
音声により受け付ける手段である確信度入力装置。
【請求項１３】命題に対する入力者の確信度を入力す
る確信度入力方法であって、前記命題に関する入力者の入力を受け付け、該受け付けた入力に備わった特徴を解析し、該解析した特徴から、予め記憶されたデータに基づい
て、前記命題に関する確信度を抽出する確信度入力方
法。
【請求項１４】請求項１３記載の確信度入力方法であ
って、前記命題に関する入力として、自然言語からなる文を入
力し、前記入力に備わった特徴の解析として、該受け付けた文
を構成する単語を取り出し、前記確信度の抽出は、前記取り出した単語について、予
め記憶した確信度を推定する数値を読み出し、該数値に
より、確信度の計算を行なう確信度入力方法。
【請求項１５】請求項１３記載の確信度入力方法であ
って、前記命題に関する入力として、入力者の音声を入力し、前記入力に備わった特徴の解析として、該受け付けた音
声に備わっている特徴を取り出し、前記確信度の抽出は、前記取り出した音声の特徴に基づ
いて、確信度の計算を行なう確信度入力方法。
【請求項１６】複数の命題を、該命題に対する入力者
の確信度と共に蓄積して、エキスパートシステムを構築
する方法であって、前記命題に関する入力者の入力を受け付け、該受け付けた入力に備わった特徴を解析し、該解析した特徴から、予め記憶されたデータに基づい
て、前記命題に関する確信度を抽出し、前記命題と前記抽出した確信度とを、データベースとし
て記憶し、該データベースに記憶された各命題に構造を与えてエキ
スパートシステムを構築するエキスパートシステムの構
築方法。