JP2002287973A - 確信度入力およびエキスパートシステムの構築 - Google Patents
確信度入力およびエキスパートシステムの構築Info
- Publication number
- JP2002287973A JP2002287973A JP2001090709A JP2001090709A JP2002287973A JP 2002287973 A JP2002287973 A JP 2002287973A JP 2001090709 A JP2001090709 A JP 2001090709A JP 2001090709 A JP2001090709 A JP 2001090709A JP 2002287973 A JP2002287973 A JP 2002287973A
- Authority
- JP
- Japan
- Prior art keywords
- input
- certainty factor
- proposition
- certainty
- sentence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Abstract
に入力可能とする。 【解決手段】 エキスパートシステムにおける知識ベー
スを構築する際や、知識ベースへの問い合わせを行なう
際、入力した命題(文)を解析して、文に使われた単語
について予め付与された確信度を用いて、文全体の確信
度を演算する。単語には、「だいたい」の場合、確信度
0.6といったように数値を与えておき、複数の単語が
使われている場合には、単語毎に指定された演算方法
(例えばComb法、乗算法、平均値法など)を用いて
演算する。また、知識ベースに問い合わせる場合には、
質問に対してユーザが音声で応答するものとし、その音
声の語調の強さや特定の音韻を延ばしたか否かなどの情
報から確信度をもとめるものとしても良い
Description
者の確信度を入力する技術とこの確信度の入力を用いて
エキスパートシステムを構築する技術に関する。
ース化して、誰でもこれを利用できるようにしようとす
るエキスパートシステムの構築が試みられてきた。当初
こうしたエキスパートシステムは、回答が「YES」か
「NO」になるような単純なルールの組合わせとして表
現されていたが、人間の知識とこれに伴う判断には、曖
昧さが伴うことが理解されるに従い、これをコンピュー
タ上でも表現できるようにしようとする取り組みがなさ
れてきた。つまり、「××ならば、○○である」という
単純な命題に対して、「××ならば、多分○○である」
というような曖昧さを許容したルールによるエキスパー
トシステムの構築が試みられてきたのである。
を表わすのに、確信度を数値化してルールに添付した
り、数値表現される条件(例:「今日は28度C」)に
対して、判断(例:「今日は暑い」)をメンバーシップ
関数として定義する、という対応がとられていた。前者
にあっては、確からしさ(以下、確信度という)は、
「0〜1.0」あるいは「−1.0〜1.0」といった
数値で表現される。例えば、「今日は天気が良い」とい
う命題に対して、確信度=[0.6]というように数値
を入力して、各命題の確信度を定義するのである。
法は、ファジィ理論において取られた手法であり、変数
xに対して、命題が成り立つ可能性yを、図11に示す
ような関数により与えるものである。例えば、気温Tが
28度Cであれば、図11に示したメンバーシップ関数
を用いることにより、確信度0.8が得られることにな
る。
た確信度の数値化やメンバーシップ関数の設定は、人間
の知識を用いたエキスパートシステムにおいては必ずし
もうまく機能しない、という問題があった。一つには、
膨大な数のルール(命題)を入力する際、その確信度を
いちいち数値で入れる手間が大変であり、大部分のルー
ルは確信度0.5に設定しておき、特定の命題だけ、評
価して数値を与えるといった対応がされやす、という問
題があった。この場合には、当然システムの精度、信頼
性は低下してしまう。もとより、全ての命題に確信度を
数値入力することも可能ではあるが、確信度を数値化す
る入力者の性格などから、全体的に確信度を高く設定し
てしまう人や、低く設定してしまう人があり、システム
の全体として見たとき、判断のばらつきか大きくなっ
て、信頼性は必ずしも高くならないという問題があっ
た。
化しやすい場合(例えば、「体温が○○度なら」など)
にはある程度役に立つが、数値化できない条件(例え
ば、「体がだるかったら」など)は、メンバーシップ関
数を定義することができず、これらの条件を組み合わせ
て、有意な判断を上手く取り出すことができない。しか
も、人間の生活全般を考えると、むしろ数値化できない
多数の条件を組み合わせて判断していることが多く、こ
れを数値化することは困難であった。この点でも、従来
のエキスパートシステムの実用化には、大きな課題が存
在した。
の入力を容易にし、これを用いたエキスパートシステム
の構築を実用的なレベルにすると共に、システムの判断
の信頼性を高めることを目的とする。
記課題の少なくとも一部を解決する本発明のデータの処
理方法は、命題に対する入力者の確信度を入力する確信
度入力装置であって、前記命題に関する入力者の入力を
受け付ける入力受付手段と、該受け付けた入力に備わっ
た特徴を解析する特徴解析手段と、該解析した特徴か
ら、予め記憶されたデータに基づいて、前記命題に関す
る確信度を抽出する確信度抽出手段とを備えたことを要
旨としている。
明は、命題に対する入力者の確信度を入力する確信度入
力方法であって、前記命題に関する入力者の入力を受け
付け、該受け付けた入力に備わった特徴を解析し、該解
析した特徴から、予め記憶されたデータに基づいて、前
記命題に関する確信度を抽出することを要旨としてい
る。
ば、命題に関する入力(命題自身もしくは命題に対する
答えなど)を受け付ける際、この入力に備わった特徴を
解析して、予め記憶したデータに基づいて、入力した命
題に関する確信度を抽出する。従って、入力者に、確信
度を数値で入力したり、メンバーシップ関数を定義する
といった対応を求めることがなく、確信度を、個人差な
く入力することができる。しかも、確信度の入力に余分
な手間を要しない。
法が考えられるが、例えば、自然言語からなる文を入力
するものとしても良い。自然言語からなる文を受け付け
た場合には、この文を構成する単語を、例えば形態素解
析などにより取り出し、この文に含まれる所定の単語を
利用して確信度を計算することができる。単語に基づく
確信度の計算は、例えば確信度を表わす単語について、
確信度を推定する数値を予め記憶しておき、取り出され
た単語に関して、この数値を読み出し、これにより確信
度を計算するようにすることができる。確信度を表わす
単語とは、例えば「多分」「おおよそ」「きっと」「す
ごく」などの程度を表わす副詞や連用詞のみならず、
「良い」「悪い」「すばらしい」「やる気のない」とい
った形容詞や連体詞など、更には「だろう」「と思う」
「かな。」などの助詞、助動詞、述語動詞、などを想定
することができる。これらを、総称して、命題を表わす
叙述表現に対する関係表現とか枠組み表現と呼ぶことが
できる。
存在するが、例えば日本語を例に採ると、通常の日本語
文法の枠組みでは、伝聞、推量といった簡略な分類しか
与えられていない。これらの表現は、文法という規範に
よる扱いにはなじまず、むしろ網羅的な分類により取り
扱うほかと言える。日本語を例にとれば、こうした網羅
的な収集、分類は、既に首藤等によって、「日本語文構
造のわく組を与える表現」(首藤公昭、楢原斗志子、福
岡大学総合研究所報第63号、昭和58年3月)など
に、集成されている。そこで、こうした網羅的な分類に
基づいて、各表現に確信度を与えたデータベース、例え
ば辞書を用意しておけば、形態素解析などを利用して自
然語からなる文から単語を抽出し、この単語により辞書
を参照して、確信度を求めることは容易である。なお、
英語など、単語が文において独立している言語では、形
態素解析などを行なわなくても、簡単なフィルタ処理に
より単語を取り出すことができる。また、日本語でも、
分かち書きされた文であれば、単語を取り出すことは容
易である。
いて、命題全体に対する確信度を計算するには、確信度
を表わす数値と演算方法とを、単語毎に記憶し、確信度
の計算において、記憶された数値と演算方法とを用いて
前記文が表現している確信度を演算すればよい。もとよ
り、数値を記憶する単語を予め特定の単語(例えば確信
度を一般に高める単語や、確信度を一般に下げる単語、
など)に限っておけば、演算方法を一つに限定すること
も可能である。
して、値0ないし1の範囲の数値とし、演算方法とし
て、少なくともComb法、乗算法、平均値法のうちの
一つを含むものとすることができる。特に、数値を記憶
した単語の範囲を広げ、単語毎に演算方法も併せて指定
すれば、確信度の計算に柔軟性を持たせ、自然言語を用
いて表現された命題の確信度の演算を、精度良く行なう
ことができる。
の関係表現に関する単語なので、命題を示す文が、確信
度を記憶していない単語のみから構成されている場合も
当然あり得る。こうした場合、即ち、文に、確信度を表
わす数値を記憶した単語が含まれていない場合には、文
の確信度を、予め定めた所定値に設定することも、確信
度の入力を容易にする点で有用である。
二つの単語に確信度a,b(0≦a,b≦1)が与えら
れているとき、この二つがそのまま現われる文の確信度
Cは、 C=a+b−a*b として求める方法である。乗算法とは、例えば二つの単
語に確信度a,bが与えられているとき、この二つがそ
のまま現われる文の確信度Cは、 C=a*b として求める方法である。平均値法とは、例えば二つの
単語に確信度a,bが与えられているとき、この二つが
そのまま現われる文の確信度Cを、 C=(a+b)/2 として求める方法(いわゆる「相加的平均」)である。
もとより演算方法は、これらの方法に限られる訳ではな
く、単語における確信度の表現に着目し、例えば相加的
平均以外に相乗的平均(C=√(a*b))を求める方
法や、修飾−被修飾の関係にある単語間では、重み付け
計数を考慮して平均値を求める方法なども採用可能であ
る。
の音声を入力するものとし、この音声に備わっている特
徴に基づいて、確信度を計算することも考えられる。確
信を持っている事項と確信の持てない事項とを話すと
き、その音声には、一定の違いが見られることが知られ
ているからである。音声の特徴としては、音声の強さ、
長さ、基本周波数、アクセントなどを考えることができ
る。このうち少なくとも一つについて解析するものとす
ればよい。もとより、複合的に解析しても良い。通常、
人間は、確信を持っている事項については、強く、長
く、明確なアクセントで発音することが知られている。
これは、多数の入力者の音声を処理すれば、明らかにな
る、いわばヒューリスティクな法則である。従って、一
人の入力者について処理する場合には、確信度が分かっ
ている命題についての音声入力を予め行なって、その音
声上との特徴と確信度との関係を較正しておくことが、
より望ましい。音声の基本周波数は、発言者が嘘を付い
たり、確信のもてないことを無理に確信があるように発
言する場合、緊張から、音声の基本周波数が上昇するこ
とが知られている。そこで、入力作業を通して、入力者
の音声の基本周波数を解析し、これにより確信度を抽出
するものとすることもできる。もとより、これらの情報
は、音声認識により取り出した単語について記憶された
確信度を補正するのに用いるといったことも可能であ
る。
は、音声の強さ、長さ、基本周波数、アクセントが、音
声が強いほど、音声が長く継続するほど、周波数が低い
ほど、アクセントが強調されるほど、確信度が高いもの
として行なうことができる。
したエキスパートシステムの構築方法として捉えること
ができる。即ち、本発明のエキスパートシステム構築方
法は、複数の命題を、該命題に対する入力者の確信度と
共に蓄積して、エキスパートシステムを構築する方法で
あって、前記命題に関する入力者の入力を受け付け、該
受け付けた入力に備わった特徴を解析し、該解析した特
徴から、予め記憶されたデータに基づいて、前記命題に
関する確信度を抽出し、前記命題と前記抽出した確信度
とを、データベースとして記憶し、該データベースに記
憶された各命題に構造を与えてエキスパートシステムを
構築することを要旨としている。
れば、命題に関する入力を行なうだけで、その命題に関
する確信度を抽出し、命題とその確信度とをデータベー
スにとして記憶し、更にこのデータベースに記憶した各
命題に構造を与えて、エキスパートシステムとして構築
することができる。従って、信頼性の高いエキスパート
システムの構築を容易に行なうことができる。
ータ上で実行されて上記の機能を実現するプログラムの
発明、こうしたプログラムを記録した記録媒体としての
発明として、それぞれ把握することができる。また確信
度入力装置やエキスパートシステムは、コンピュータ上
でプログラムが実行されることで、上記の入力の受け付
け、特徴の解析、確信度の抽出などを実現するものであ
っても良いし、ディスクリートな回路構成より実現する
ものであっても良い。また、プログラムは、C言語やパ
スカル、フォートラン、コボル、BASIC、等の周知
のプログラム言語が採用可能であり、オブジェクト指向
のプログラム言語、あるいはJavaScript等の
言語などを利用することも可能である。記録媒体として
は、フレキシブルディスク,CD−ROM,DVD−R
OM,半導体メモリ(ROM,PROM,EEPRO
M,フラッシュメモリ等)など、種々の記録媒体を用い
ることができる。もとより、インターネットなどのネッ
トワーク上に置かれたサーバにこれらのプログラムを記
憶しておき、クライアントのコンピュータにダウンロー
ドして利用することも可能である。
実施例とについて説明する。 (1)第1の実施の形態:図1は、本発明の実施の形態
を示すブロック図である。この実施の形態では、命題
は、キーボードなどの文入力部M1を介して入力され
る。入力された文は、いわゆる自然言語による文であ
り、これを形態素解析部M2により、文を構成する単語
t1,t2・・・を取り出す処理を行なう。なお、キー
ボードなど文入力部M1が、仮名漢字変換を伴って文を
入力するものである場合には、文入力部M1と形態素解
析部M2とを一体に構成し、仮名漢字変化を伴う入力時
に、単語の抽出を行なってしまうようにすることが簡便
である。形態素解析により取り出された単語は、字句解
析部M3に送られ、ここで確信度の解析が行なわれる。
字句解析部M3は、予め単語毎の確信度を用意したデー
タベース(以下、確信度辞書という)DDBを参照し、
文を構成していた単語の確信度d(t)および確信度集
計方法(以下、単に演算方法という)を取り出す処理を
行なう。こうして取り出された単語毎の確信度および演
算方法は、確信度集計部M4に出力され、ここで各単語
毎に与えられた演算方法に基づく確信度の演算を行な
う。
では、「天気はちょっと崩れるらしい」という文を例と
して説明する。この文から、「天気」「ちょっと」「崩
れる」「らしい」という4つの単語が取り出されたと
き、確信度辞書DDBを参照すると、「天気」「崩れ
る」については、確信度が与えられておらず、「ちょっ
と」については確信度0.4、「らしい」については、
確信度0.5が与えられていたとする。また、「ちょっ
と」についての演算方法として平均値法が、らしいにつ
いては乗算法が、与えられているとする。この場合、
「天気は崩れる」という命題についての確信度x2は、
文中で後ろに置かれた単語の演算方法を用いるものと
し、 x2=0.4*0.5=0.2 となる。
い」のように、確信度を有する単語が一つの場合は、除
算法においてはb=1として、その単語の確信度が、命
題全体の確信度x1として計算される。また、「天気は
ちょっと崩れるらしいと聞いた」のように、確信度が与
えられた単語が3つ以上見つかった場合には、これを順
番に計算すればよい。上記の文で「聞いた」が確信度
0.5、演算方法が乗算法であれば、 x3=x2*0.5 =0.1 となる。こうして計算した全体の確信度は、データベー
ス構築部M5により集められ、命題データベースSDB
に、命題自身と共に記憶される。こうして、エキスパー
トシステムの基礎となる命題データベースSDBが用意
される。
実施の形態は、図2に示すように、第1の実施の形態の
構成要素との比較により説明すると、文入力部M1に代
えて音声入力部M11が、形態素解析部M2に代えて音
声分析部M12が、字句解析部M3に代えて音声解析部
M13が、それぞれ設けられている。その余の構成は、
第1の実施の形態とほぼ同一である。ここで、音声入力
部M11は、音声の認識までは行なっておらず、音の強
さと長さを取り込むマイクやアンプからなる回路であ
る。また音声分析部M2は、音声の強さを5段階に、長
さを3段階に分けて認識する回路である。音声解析部M
13は、認識した音声の強さVと長さLとから、確信度
辞書DDBを参照して、命題に関する入力者の確信度を
求める回路である。このとき、単語は音声認識により入
力しても良いし、第1の実施の形態と同様、キーボード
等から入力するものとしても良い。単語毎に、音声の強
さVや長さLから確信度xが得られたなら、これを集計
してデータベースとして蓄積する点は、第1の実施の形
態と同様である。
力者の入力に基づいて、そこに存在する特徴(この実施
の形態では、音声の強さと長さ)により確信度を抽出す
ることができ、データベースにこれを蓄積していくとが
できる。
の確信度と命題の記憶までしか含んでいないが、一旦こ
れらの情報がデータベースとして蓄積されれば、このデ
ータベースに蓄積された各命題に構造を与えることによ
り、これをエキスパートシステムとして構築することは
容易である。
らかにするために、以下実施例について詳しく説明す
る。 (3)実施例における装置構成:次に、本発明の実施例
について説明する。図3は、本発明の第1実施例である
確信度入力を行なう。図3に示した例では、本発明の確
信度入力を具現化するプログラムが、インターネットの
ようなネットワーク10に接続されたデータベースサー
バ20にインストールされている例を示している。デー
タベースサーバ20は、それ自身スタンドアロンのコン
ピュータとして使用可能であるが、以下で説明するよう
に、サーバとして他のクライアントから利用することが
可能である。すなわち、ネットワーク10に接続された
多数のコンピュータ30,40の利用者が、各人の知識
をルール(命題)として取り出し、これをネットワーク
10を介してデータベースサーバ20に入力すること
で、短期間に大規模なエキスパートシステムを、データ
ベースサーバ20に構築しようとするものである。入力
部分については、データベースサーバ20,コンピュー
タ30,40共に同じなので、以下、データベースサー
バ20を例として説明を行なう。なお、エキスパートシ
ステムができあがれば、コンピュータ30,40からの
問い合わせをネットワーク10を介して受けたデータベ
ースサーバ20が、内部に構築されたエキスパートシス
テムを用いて推論を行ない、その推論果を、ネットワー
ク10を介して、クライアントであるコンピュータ30
などに返すといった形態で利用される。エキスパートシ
ステムとしては、どのようなものでも適用可能である
が、以下の説明では、病気の診断用エキスパートシステ
ムを例として説明する。
に基づいて説明する。データベースサーバ20は、モデ
ムやルータ18を介してネットワーク10とのデータの
やり取りを制御するネットワークインタフェース(NT
−I/F)21、処理を行なうCPU22、処理プログ
ラムや固定的なデータを記憶するROM23、ワークエ
リアとしてのRAM24、時間を管理するタイマ25、
モニタ29への表示を司る表示回路26、テキストデー
タをデータベースとして蓄積しているハードディスク
(HD)27、キーボード11,マウス12,マイク1
3とのインタフェースを司る入力インタフェース(I/
F)28等を備える。なお、ハードディスク27は、固
定式のものとして記載したが、着脱式のものでも良い
し、着脱式の記憶装置(例えばCD−ROM、CD−
R、CD−RW、DVD−ROM、DVD−RAM、フ
レキシブルディスクなど)を併用することも可能であ
る。また、この実施例では、データベースサーバ20の
処理プログラムは、ROM23内に記憶されているもの
としたが、ハードディスク27に記憶しておき、起動時
にRAM24上に展開して実行するものとしても良い。
あるいは、上述した着脱式の記録媒体から読み込むもの
としても良い。更には、ネットワーク10を介して、他
のサーバから読み込んで実行するものとしても良い。
書DICが記憶されている。この仮名漢字変換辞書は、
キーボード11から入力されたかな文字列を解析して、
仮名漢字文字列に変換する際に参照されるものである。
この辞書DICには、単語の読み、表記、文法情報の他
に、図4に例示するように、単語の一部については、確
信度のデータCNFおよび確信度の集計方法を示す演算
方法が記憶されている。もとよりこれらのデータは、全
ての単語について付与されている訳ではなく、確信度に
影響を与える可能性のある単語についてのみ付与されて
いる。
は、ハードディスク27にデータベースが構築される。
このデータベースDBは、基本的にはテキストデータか
らなる命題の集合として構築される。この命題は、キー
ボード11から入力した文として入力される。なお、こ
のデータベースDBを構築する際、キーボードから入力
された文をそのまま登録しても良いが、一定の標準化を
行なって登録しても良い。標準化を行なうことにより、
文の作成者が異なる場合などに生じやすい用語のばらつ
きや表記のばらつきなどを統一することができ、データ
ベースDBを用いてエキスパートシステムを検索する際
のルール(構造)を簡略化することができる。
データベースサーバ20は、後述する文をハードディス
ク27に登録する際、図5に示すように、まず文を形態
素解析し、文が、文法情報を備えた単語から成り立つも
のとして把握する。その後、これらの単語から構成され
た文に対して、次の4つのレベルの標準化を行なう。 (A)文字の標準化処理(予め定めた文字に置き換える
文字の標準化)、文字レベルの表記のゆれであり、カタ
カナ語尾の長音の有無、カタカナ全角/半角といった全
く概念に変化のない表記のゆれを統一するのである。 (B)表記の統一処理(表記のゆれを予め定めた表記に
統一する処理)、単語レベルの表記のゆれであり、ほと
んど意味の異ならない複数漢字表記などを統一するので
ある。 (C)自立語処理(自立語を、予め定めた置き換えの基
準に従って、他の自立語に置き換える処理)、自立語の
表記のゆれであり、わずかに意味の異なることがある単
語間の入れ替えを行なって、使用する自立語を統一する
のである。
語処理(文節レベルの表記のゆれの処理)も考えられる
が、付属語処理の標準語は、文末表現の統一など、確信
度の影響を与える要素を調整することがある。そこで、
本実施例では、付属語の標準化処理は行なっていない。
ィスク27内に備えられた標準化辞書を参照することに
より行なわれる。標準化辞書には、上記の標準化処理に
対応した辞書が含まれており、形態素解析を行なった
後、各単語について辞書を参照し、各単語について複数
の表記、複数の単語が登録されていれば、これを予め定
めた一つの表記、一つの単語に置き換えるのである。
行なう際の処理について説明する。図6は、確信度の入
力を行なう際の処理プログラムを示すフローチャートで
ある。図示するように、このプログラムは、命題(文)
の入力の際に実施されるものである。この処理が起動さ
れると、まずキーボード11から文を入力する処理を行
なう(ステップS100、105)。入力は文単位で、
即ち句点が入力されるまでを単位として行なわれる。文
が入力されると、文の標準化処理を行なう(ステップS
110)。標準化処理は上述したか、用語を統一するた
めの処理である。例えば、「熱がある」「ねつがある」
「ネツがある」などを一つの標準的な表記「熱がある」
に統一するといった処理である。この後、入力した文が
命題としふさわしいか否かのチェックを行なう(ステッ
プS120)。
パートシステムを構築し、病名の診断などに用いられ
る。従って、こうした目的から見て命題として無意味な
文(例えば、「病気はやだな。」「病い時は病気だ」)
や、命題として矛盾した文(例えば、「熱が高くて平熱
だ」)などは、この段階で排除される。
断した場合には(ステップS120)、次に、入力文を
形態素解析する処理を行なう(ステップS130)。形
態素解析を用いれば、文を構成する単語を容易に切り出
すことができる。こうした形態素解析は、例えば最小コ
スト法といった仮名漢字変換の技術として確立した技術
を用いることができる。図7は、入力した文nが「結核
だとだいたい微熱が出たりする。」である場合を示す。
この文nを形態素解析すると、図示するように、「結
核」「だと」「だいたい」「微熱」「が」「出」「たり
する」といった単語を取り出すことができる。
を参照して、確信度のデータCNFと演算方法を読み出
す処理を行なう(ステップS140)。なお、本実施例
では、確信度のデータは、仮名漢字変換用の辞書DIC
に記憶したが、確信度CNFと演算方法だけを与えるよ
うに別の辞書として用意しても良い。図4に示した例で
は、「だいたい」について確信度「0.6」、演算方法
としてComb法が、「たりする」について確信度
「0.8」、演算方法として乗算法が、それぞれ見い出
された。こうした確信度の数値は、例えば「わずかに」
「やや」「より」「だいたい」「普通」「多分」「かな
り」「非常に」「極めて」といった程度を表わす語につ
いて、それぞれ「わずかに(0.1)」「やや(0.
2)」「より(0.3)」「だいたい(0.4)」「普
通(0.5)」「多分(0.6)」「かなり(0.
7)」「非常に(0.8)」「極めて(0.9)」のよ
うに、何段階かに分けて登録されている。なお、この例
では、0.1刻みにしたが、0.15など、1/20刻
みや1/100刻みで値を与えても良い。また、単語毎
に使用する演算方法として、最適のものが指定されてい
る。一般に確信度を上げる種類の単語(例えば「一層」
「非常に」など)についてはComb法が、確信度を著
しく下げる種類の単語(例えば「聞いた」「らしい」な
ど)については乗算法が、また確信度に対して他の語と
の関連が小さい種類の単語(例えば「平均的には」「通
常は」など)については平均値法が、それぞれ指定され
る傾向にある。
体の確信度を演算する処理を行なう(ステップS15
0)。この実施例では、確信度の計算は、単語「たりす
る」について指定された演算方法、つまり乗算法を用い
ることになる。この手法の詳細は、既に説明したので繰
り返さないが、この例では、文nの全体の確信度xn
は、 xn=0.6*0.8=0.48 となった。なお、文中に現われた単語がいずれも確信度
を持っていないようはな場合には、その文の確信度は
0.5に設定される。例えば「天気は崩れる。」といっ
た命題文の場合には、確信度を調整するような単語は存
在しないので、文全体の確信度は、値0.5とされるの
である。次に、この文全体の確信度xnを文nと組にし
て、ハードディスク27に記憶する処理を行なう(ステ
ップS160)。以上で、本実施例における確信度の入
力処理を完了する。
書DICに、次のように単語毎の確信度と演算方法が登
録されているものとする。 単語 確信度 演算方法 ちょっと 0.4 Comb法 らしい 0.5 乗算法 聞いた 0.5 乗算法 かなりと 0.8 Comb法 激しく 0.9 Comb法
うに演算される。 例文1:「天気は崩れる。」 確信度 0.5(文中に、確信度を有する単語がないか
らである)。 例文2:「天気はちょっと崩れるらしい。」 確信度x2=0.4*0.5=0.2 例文3:「天気はちょっと崩れるらしいと聞いた。」 確信度x3=(0.4*0.5)*0.5=0.1 例文4:「天気はかなり激しく崩れる。」 確信度x2′=0.8+0.9−0.8*0.9=0.
98 例文5:「天気はかなり激しく崩れるらしい。」 確信度x3′=0.98*0.5=0.495
よれば、キーボード11から入力した文に含まれる単語
について予め辞書DICに用意した確信度と演算方法と
を求め、これに基づいて文全体の確信度を与えることが
できる。従って、入力者は、命題(文)毎にいちいち確
信度を数値入力したり、メンバーシップ関数を定義する
といった煩わしい処理を行なう必要がない。また、文の
確信度を、通常使用している自然な日本語文を介して設
定できるので、数値を入力に伴う個人差などが生じにく
いという利点も得られる。更に、確信度を単語毎に与え
るだけでなく、確信度を集計する演算方法も単語毎に与
えているので、確信度の決定をきめ細かく行なうことが
できる。また、本実施例では、入力文について標準化の
処理を行なっているので、入力者により命題である文が
微妙に異なると言うことがない。
説明した手法により、命題と確信度とが、ハードディス
ク27内にデータベースとして蓄積された。そこで、次
に、これをエキスパートシステムとして構成する手法に
ついて説明する。図8は、実現しようとするエキスパー
トシステムの概略構成図ある。図示するように、このエ
キスパートシステムは、知識ベースAB、推論機構A
N、知識獲得支援モジュールAS、推論過程説明モジュ
ールAE、ユーザインタフェースUIなどから構成され
ている。上述した第1の実施例において命題と確信度を
入力した処理は、知識獲得支援モジュールASに相当
し、その結果、得られた命題と確信度が、知識ベースA
Bに格納される。本実施例では、基本的にプロダクショ
ンシステムを用いており、知識ベースABは、「鼻水が
出ていれば風邪かも知れない。」「咳と微熱が続けば、
結核の疑いがある。」といった「○○ならば、××であ
る」というタイプの知識として、知識ベースABは構成
されている。
ベースを用いて推論を行なうものである。推論は、ユー
ザインターフェースUIを介して入力された条件を用い
て、前向きまたは後ろ向きの推論を適宜使い分けしつ
つ、行なわれる。ユーザインタフェースは、後述する第
2実施例において説明するように、推論機構ANから出
した質問に、ユーザが回答するものを受け付け、これを
推論機構ANに渡す。例えば、「質問:どんな症状です
か?」「答え:鼻水が出て熱があります。」「質問:鼻
水が出ているのですか?」「答え:はい。」「質問:熱
があるのですね?」「答え:すごーく高いのです。」と
いったやり取りを介して、ユーザインタフェースUI
は、推論機構ANに、推論の基礎となる命題「鼻水か出
ている」「熱がある」とそれぞれについてのユーザの確
信度を渡す。
度を用いて推論を行ない、結論を推論過程説明モジュー
ルAEに出力する。推論過程説明モジュールAEは、推
論の結果を、ユーザインタフェースUIを介して、使用
者に提示する。例えば、上記の質問と回答から、熱が高
いという命題の確信度は高いと判断し、「あなたは、風
邪症状ですが、インフルエンザの可能性があります。」
といった推論結果と、「鼻水が出ていて、熱がかなりあ
るからです」といった推論過程の説明を、例えばディス
プレイ上に表示するのである。
施例について説明する。第2実施例は、第1実施例の処
理により蓄積されたデータベースを、上述した手法でエ
キスパートシステムにおける知識ベースABとして構築
したケースにおいて、ユーザインタフェースUIが、ユ
ーザの回答を推論機構ANに渡す部分に適用されたもの
である。即ち、第2実施例の確信度入力は、上述した第
1実施例と基本的には同じハードウェア構成を用い、推
論機構ANが、「質問:熱はありますか?」に対して、
ユーザが答えた回答の確信度を入力するものである。第
2実施例では、ユーザの音声を用いて、確信度の入力を
行なう。
示すフローチャートである。この処理ルーチンは、エキ
スパートシステムが既にできあがっており、ユーザが、
エキスパートシステムを利用する際に起動される。この
ルーチンが起動されると、まずモニタ29に「症状を入
力して下さい」という表示を行なう(ステップS20
0)。ユーザは、この表示を見て、キーボード11を用
いて「熱があります」といった症状を入力する(ステッ
プS210)。ユーザの入力を受け取ると、この文を解
析し、推論機構ANは、推論の条件が十分なものになる
まで(ステップS220)、質問を繰り返す(ステップ
S230)。例えば、「どのくらい熱いのですか?」と
いう質問を出力する。これに対してユーザは、キーボー
ド11から「すごく熱い」というように答えても良い
が、本実施例では、マイク13を用いて、回答を入力す
るように促される(ステップS240)。そこで、ユー
ザがマイク13に向かって、「あつい」とか「あつー
い」と返事をすると、これを入力し(ステップS25
0)、ユーザの発音に備わった特徴について解析する
(ステップS260)。
行なわれる。一つは音声の強さであり、もう一つは音声
の長さである。音声の強さは、簡便には、マイク13か
ら入力した音声の絶対値により認識することができる
が、音声の絶対値はマイクと話者との距離や角度により
変化しやすい。そこで、本実施例では、子音の部分と母
音の部分との音声の強弱比を検出して音声の強さを判定
している。いわゆる語気の強い言葉は、母音の部分に対
する子音の部分の音が強いからである。母音の部分の検
出は、音声に含まれるフォルマント構造を認識すること
により検出することができる。音声に含まれるフォルマ
ント構造を認識するためには、音声をフーリエ変換し、
特定の周波数領域にピークが存在するかどうかを判定す
ればよい。こうして特定された母音部分の音の強さ(波
高値の絶対値)と、この前後に存在する子音の部分(通
常フーリエ変換により、含まれる周波数帯域が高い領域
として認識できる)の音の強さとの比を採ることによ
り、子音の部分の強調を認識することができる。
いる。例えば「あつい」と「あつーい」を比べると、
「つ」の継続期間が長いほど、話し手が確信を持ってい
る、あるいは強調したいと考えていることが分かる。そ
こで、こうした音節が所定時間を超えて継続している部
分があるかないかを検出するのである。一般に日本語の
場合、継続できるのは母音の部分に限られるので、マイ
ク13から入力した音声をフーリエ変換し、フォルマン
ト構造を見い出して母音の区間を特定し、この区間が通
常の話し手の話のピッチから見て、2倍以上に及ぶ部分
があれば、これを強調とみなすのである。
信度を与える処理を行なう(ステップS270)。この
場合、音声の強さと強調されている母音の長さを入力と
するテーブルやマップを用意し、これを用いて、確信度
を与えればよい。図10に、音声の強さと特定の母音の
長さに基づいて、確信度を与えるテーブルの一例を示
す。ユーザインタフェースUIは、与えられた確信度x
を、推論機構ANに渡す。推論機構ANは、入力された
命題(「熱があります」)と、これについての確信度x
とを組にして受け取り、知識ベースABを参照して、推
論を進める。推論が結論を導くことができる程度に進む
まで、上記処理を繰り返す。
と(ステップS220)、この推論を結果をモニタ29
に表示し(ステップS280)、必要に応じて、推論の
過程の説明を加え(ステップS290,S295)、本
ルーチンを終了する。
は、入力した命題に対する確信度をいちいち数値で入力
する必要がなく、質問に対して、口頭でかつ普通の日本
語で答えるだけで、確信度を入力することができる。従
って、確信度の入力に煩瑣な作業を要求されることもな
く、かつ数値入力における個人差や数値で入力するため
についつい高い確信度を入れてしまう、といった弊害を
生じることがない。エキスパートシステムは、「熱があ
ります」といった単純な命題だけでなく、この命題に対
する入力者の確信度も併せて入力することができるの
で、推論機構ANを精密に運用して、精度の高い判断結
果を示すことができる。
ド11からの文の入力を基本としたが、音声認識を利用
して命題を入力するようにしても差し支えない。更に、
モニタ29上にいくつかの選択肢を表示し、マウス12
を用いて選択することで入力するようにしても良い。例
えば「熱があります」という入力に対して、「熱が高
い」を異なる大きさの文字でいくつかボタン状に表示
し、いずれかを入力者に選択させることで、確信度を受
け付けるようにしても良い。あるいは文字の色を変え
て、赤い文字を選択した場合には、確信度が高いといっ
た関連づけを行なうことも可能である。いずれの手法に
せよ、入力者の行なった入力に備わった特徴を解析して
確信度を抽出することに変わりはない。上記の第2実施
例において、確信度の判断を、音声の強弱や長短に代え
て、あるいはこれらと共に、アクセントの強弱、基本周
波数の高低などにより判断するものとしても良い。
について説明したが、本発明は上記実施例や変形例に何
ら限定されるものではなく、その要旨を逸脱しない範囲
内において、種々の態様により具現化されることは勿論
である。例えば、上記実施例ではデータベースを構築し
てエキスパートシステムを作るものとしたが、単に確信
度を入力し、コンピュータと人間の対話に味付けをする
という利用にとどめても良い。人間との会話ができるコ
ンピュータやロボットにおいて、対話相手である人間の
発言を理解することは極めて重要な事項であり、意味論
的な解析に加えて、話者の確信度を評価して応答を変え
ることは、自然なマンマシンインタフェースを実現する
上で、極めて効果的である。また、電話の自動応答シス
テムなどに適用し、お客様サービスなどの電話番号に電
話してくるユーザの声から、クレームの緊急度を判断し
て、オペレータに接続する構成、110番などの緊急電
話番号に掛けてきた人の要件の緊急性などの判断に用い
た構成(結果的にいたずら電話などは自動応答で対処で
きる)、など種々なる態様で実施することができる。
ある。
ある。
図である。
説明図である。
示すフローチャートである。
成を示す説明図である。
示すフローチャートである。
図である。
る。
Claims (16)
- 【請求項1】 命題に対する入力者の確信度を入力する
確信度入力装置であって、 前記命題に関する入力者の入力を受け付ける入力受付手
段と、 該受け付けた入力に備わった特徴を解析する特徴解析手
段と、 該解析した特徴から、予め記憶されたデータに基づい
て、前記命題に関する確信度を抽出する確信度抽出手段
とを備えた確信度入力装置。 - 【請求項2】 請求項1記載の確信度入力装置であっ
て、 前記入力受付手段は、前記命題に関する入力として、自
然言語からなる文を入力する手段であり、 前記特徴解析手段は、該受け付けた文を構成する単語を
取り出す手段であり、 前記確信度抽出手段は、所定の単語についての確信度を
推定する数値を予め記憶しており、前記取り出された単
語に関して、該数値を読み出し、確信度を計算する確信
度演算手段を備えた確信度入力装置。 - 【請求項3】 請求項2記載の確信度入力装置であっ
て、 前記確信度演算手段は、 確信度を表わす数値と演算方法とを、単語毎に記憶し、 前記確信度の計算において、前記記憶された数値と演算
方法とを用いて前記文が表現している確信度を演算する
手段である確信度入力装置。 - 【請求項4】 請求項3記載の確信度入力装置であっ
て、 前記単語毎に付与された確信度を表わす数値は、値0な
いし1の範囲の数値であり、 前記演算方法は、少なくともComb法、乗算法、平均
値法のうちの一つを含む確信度入力装置。 - 【請求項5】 請求項2記載の確信度入力装置であっ
て、 前記確信度演算手段は、前記文に、前記数値を記憶した
単語が含まれていない場合には、前記文の確信度を、予
め定めた所定値に設定する確信度入力装置。 - 【請求項6】 請求項1記載の確信度入力装置であっ
て、 前記入力受付手段は、前記命題自体を自然文により受け
付ける手段である確信度入力装置。 - 【請求項7】 請求項1記載の確信度入力装置であっ
て、 前記入力受付手段は、前記命題に対する入力者の回答を
自然文により受け付ける手段である確信度入力装置。 - 【請求項8】 請求項1記載の確信度入力装置であっ
て、 前記入力受付手段は、前記命題に関する入力として、入
力者の音声を入力する手段であり、 前記特徴解析手段は、該受け付けた音声に備わっている
特徴を取り出す手段であり、 前記確信度抽出手段は、前記取り出した音声の特徴に基
づいて、確信度を計算する手段である確信度入力装置。 - 【請求項9】 請求項8記載の確信度入力装置であっ
て、 前記特徴解析手段は、音声の特徴として、音声の強さ、
長さ、基本周波数、アクセントのうち少なくとも一つを
解析する手段を備えた確信度入力装置。 - 【請求項10】 請求項9記載の確信度入力装置であっ
て、 前記確信度抽出手段は、前記音声の強さ、長さ、アクセ
ントのうちの少なくとも一つが、音声が強いほど、音声
が長く継続するほど、基本周波数が高いほど、アクセン
トが強調されるほど、前記確信度を高く計算する手段で
ある確信度入力装置。 - 【請求項11】 請求項8記載の確信度入力装置であっ
て、 前記入力受付手段は、前記命題自体を音声により受け付
ける手段である確信度入力装置。 - 【請求項12】 請求項8記載の確信度入力装置であっ
て、 前記入力受付手段は、前記命題に対する入力者の回答を
音声により受け付ける手段である確信度入力装置。 - 【請求項13】 命題に対する入力者の確信度を入力す
る確信度入力方法であって、 前記命題に関する入力者の入力を受け付け、 該受け付けた入力に備わった特徴を解析し、 該解析した特徴から、予め記憶されたデータに基づい
て、前記命題に関する確信度を抽出する確信度入力方
法。 - 【請求項14】 請求項13記載の確信度入力方法であ
って、 前記命題に関する入力として、自然言語からなる文を入
力し、 前記入力に備わった特徴の解析として、該受け付けた文
を構成する単語を取り出し、 前記確信度の抽出は、前記取り出した単語について、予
め記憶した確信度を推定する数値を読み出し、該数値に
より、確信度の計算を行なう確信度入力方法。 - 【請求項15】 請求項13記載の確信度入力方法であ
って、 前記命題に関する入力として、入力者の音声を入力し、 前記入力に備わった特徴の解析として、該受け付けた音
声に備わっている特徴を取り出し、 前記確信度の抽出は、前記取り出した音声の特徴に基づ
いて、確信度の計算を行なう確信度入力方法。 - 【請求項16】 複数の命題を、該命題に対する入力者
の確信度と共に蓄積して、エキスパートシステムを構築
する方法であって、 前記命題に関する入力者の入力を受け付け、 該受け付けた入力に備わった特徴を解析し、 該解析した特徴から、予め記憶されたデータに基づい
て、前記命題に関する確信度を抽出し、 前記命題と前記抽出した確信度とを、データベースとし
て記憶し、 該データベースに記憶された各命題に構造を与えてエキ
スパートシステムを構築するエキスパートシステムの構
築方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001090709A JP3770099B2 (ja) | 2001-03-27 | 2001-03-27 | エキスパート装置、推論方法、およびエキスパートシステムの構築方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001090709A JP3770099B2 (ja) | 2001-03-27 | 2001-03-27 | エキスパート装置、推論方法、およびエキスパートシステムの構築方法 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2002287973A true JP2002287973A (ja) | 2002-10-04 |
JP2002287973A5 JP2002287973A5 (ja) | 2004-10-28 |
JP3770099B2 JP3770099B2 (ja) | 2006-04-26 |
Family
ID=18945459
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001090709A Expired - Fee Related JP3770099B2 (ja) | 2001-03-27 | 2001-03-27 | エキスパート装置、推論方法、およびエキスパートシステムの構築方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3770099B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006267465A (ja) * | 2005-03-23 | 2006-10-05 | Tokyo Electric Power Co Inc:The | 発話状態評価装置、発話状態評価プログラム、プログラム格納媒体 |
KR20110057659A (ko) * | 2009-11-24 | 2011-06-01 | 삼성전자주식회사 | 대화 로봇을 이용한 일정 관리 시스템 및 그 방법 |
-
2001
- 2001-03-27 JP JP2001090709A patent/JP3770099B2/ja not_active Expired - Fee Related
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006267465A (ja) * | 2005-03-23 | 2006-10-05 | Tokyo Electric Power Co Inc:The | 発話状態評価装置、発話状態評価プログラム、プログラム格納媒体 |
KR20110057659A (ko) * | 2009-11-24 | 2011-06-01 | 삼성전자주식회사 | 대화 로봇을 이용한 일정 관리 시스템 및 그 방법 |
KR101960835B1 (ko) * | 2009-11-24 | 2019-03-21 | 삼성전자주식회사 | 대화 로봇을 이용한 일정 관리 시스템 및 그 방법 |
Also Published As
Publication number | Publication date |
---|---|
JP3770099B2 (ja) | 2006-04-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11037553B2 (en) | Learning-type interactive device | |
EP1669980B1 (en) | System and method for identifiying semantic intent from acoustic information | |
US7620548B2 (en) | Method and system for automatic detecting morphemes in a task classification system using lattices | |
TWI396184B (zh) | 一種語音辨認所有語言及用語音輸入單字的方法 | |
US8768700B1 (en) | Voice search engine interface for scoring search hypotheses | |
JP3716870B2 (ja) | 音声認識装置および音声認識方法 | |
CA2437620C (en) | Hierarchichal language models | |
US8793130B2 (en) | Confidence measure generation for speech related searching | |
JP4105841B2 (ja) | 音声認識方法、音声認識装置、コンピュータ・システムおよび記憶媒体 | |
US20140303978A1 (en) | Grammar fragment acquisition using syntactic and semantic clustering | |
US20200243075A1 (en) | Flexible-response dialogue system through analysis of semantic textual similarity | |
JP2005189363A (ja) | 質問応答システムおよびプログラム | |
CN108536668B (zh) | 唤醒词评估方法及装置、存储介质、电子设备 | |
JP5105943B2 (ja) | 発話評価装置及び発話評価プログラム | |
US7085720B1 (en) | Method for task classification using morphemes | |
JP6605105B1 (ja) | 文章記号挿入装置及びその方法 | |
JP4354299B2 (ja) | 事例検索プログラム、事例検索方法及び事例検索装置 | |
US20040006469A1 (en) | Apparatus and method for updating lexicon | |
US20230148275A1 (en) | Speech synthesis device and speech synthesis method | |
JP2002287973A (ja) | 確信度入力およびエキスパートシステムの構築 | |
JPH1097285A (ja) | 音声認識装置 | |
JP3088364B2 (ja) | 音声言語理解装置及び音声言語理解システム | |
KR102107445B1 (ko) | 선택적 음성 모델의 적용이 가능한 텍스트 음성 변환 장치 및 그 동작 방법 | |
JP5066668B2 (ja) | 音声認識装置、およびプログラム | |
CN113591441A (zh) | 语音编辑方法及装置、存储介质及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20051011 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20051212 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20060117 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20060130 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090217 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100217 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110217 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110217 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120217 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130217 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130217 Year of fee payment: 7 |
|
LAPS | Cancellation because of no payment of annual fees |