JP2021051567A

JP2021051567A - 情報処理方法および情報処理装置

Info

Publication number: JP2021051567A
Application number: JP2019174274A
Authority: JP
Inventors: 真岩山; Makoto Iwayama; 優浅野; Yu Asano
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 2019-09-25
Filing date: 2019-09-25
Publication date: 2021-04-01
Anticipated expiration: 2039-09-25
Also published as: US20210089722A1; JP7481100B2; US11507755B2

Abstract

【課題】自動的に精度よく言い換えの適否を判定する。【解決手段】入力装置、出力装置、処理装置および記憶装置からなり、推論部を備える情報処理装置である。推論部は、第１の質問文と第１の回答文の組を含む第１のテキストデータと、第２の質問文と第２の回答文の組を含む第２のテキストデータを入力する、第１の機能、第１のテキストデータの中の語ａを語ｂに置き換え可能とする第１の同義語関係が成立し、第２のテキストデータの中の語ａを語ｃに置き換え可能とする第２の同義語関係が成立している場合、第１の回答文と第２の回答文の類似度である第１の類似度と、第１の質問文と第２の質問文の類似度である第２の類似度から、語ｂと語ｃの類似度を計算する、第２の機能、を備え、計算において第１の類似度の寄与率と第２の類似度の寄与率が異なる。【選択図】図１

Description

本発明は、自然言語対話システム等に用いる知識データベース（ＤＢ）に関する。

近年、様々な言語での対応を求められる空港や駅での施設案内や、複雑なサービスを取り扱う銀行や自治体での窓口業務などの対人サービスにおいて、対話システムを用いて既存の職員の業務を支援することが試みられている。具体例としては、高度化するサービス業務を支援するため、ロボットや音声アシスタントなどの対話システムの実用化が進められている。

ユーザーからの多様な発話に回答できる対話システムを実現するためには、対話をするための知識ＤＢをあらかじめ用意しておく必要がある。これまで、知識ＤＢの生成は人手で行われていることが多く、そのコストが課題となっている。

例えば、ある店舗の営業時間を回答するために、「営業時間を教えて」という質問と「営業時間は午前10時から午後8時までです。」という回答の質問回答ペアが用意されているとする。しかし、対話システムのユーザーからは「販売時間を知りたい」、「開いている時間を聞きたい」というように様々な言い方で聞かれる可能性があり、これらに対応できる必要がある。

これまでの対話システムでは、既存の同義語や言い換えの辞書を使用したり、独自の辞書を作成したりすることで知識の整備を行っていた。案件毎にこのような辞書を整備していてはコストがかかるため、同義語や言い換えを効率的に増やす方法が求められている。

例えば、特許文献1では、大規模な言い換えのテキストデータを用意することなく対話することを可能とするために、ユーザーからの質問に対する回答を出力してユーザーと対話する情報処理装置であって、質問を受け付ける入力部と、対話において、入力部が受け付けた質問に対する回答の候補を候補データの中から選択して質問の言い換えの適否をユーザーに確認する確認処理を実行し、適否の結果に基づいて、候補を質問に対する言い換えとして登録する対話制御部と、を備えるものが開示されている。

特開２０１８−１９７９２４号公報

特許文献1では、質問の言い換えの適否をユーザーに確認する確認処理を実行し、適否の結果に基づいて、候補を質問に対する言い換えとして適切かどうかを判断する。しかし、ユーザーの負担はなるべく減らすことが望ましい。
そこで、自動的に精度よく言い換えの適否を判定する技術が求められる。

本発明の好ましい一側面は、入力装置、出力装置、処理装置および記憶装置からなり、推論部を備える情報処理装置で実行される情報処理方法である。推論部は、第１の質問文と第１の回答文の組を含む第１のテキストデータと、第２の質問文と第２の回答文の組を含む第２のテキストデータを入力する、第１のステップ、第１のテキストデータの中の語ａを語ｂに置き換え可能とする第１の同義語関係が成立し、第２のテキストデータの中の語ａを語ｃに置き換え可能とする第２の同義語関係が成立している場合、第１の回答文と第２の回答文の類似度である第１の類似度と、第１の質問文と第２の質問文の類似度である第２の類似度から、語ｂと語ｃの類似度を計算する、第２のステップ、を実行し、計算において第１の類似度の寄与率と第２の類似度の寄与率が異なる。

本発明の好ましい他の一側面は、入力装置、出力装置、処理装置および記憶装置からなり、推論部を備える情報処理装置である。推論部は、第１の質問文と第１の回答文の組を含む第１のテキストデータと、第２の質問文と第２の回答文の組を含む第２のテキストデータを入力する、第１の機能、第１のテキストデータの中の語ａを語ｂに置き換え可能とする第１の同義語関係が成立し、第２のテキストデータの中の語ａを語ｃに置き換え可能とする第２の同義語関係が成立している場合、第１の回答文と第２の回答文の類似度である第１の類似度と、第１の質問文と第２の質問文の類似度である第２の類似度から、語ｂと語ｃの類似度を計算する、第２の機能、を備え、計算において第１の類似度の寄与率と第２の類似度の寄与率が異なる。

自動的に精度よく言い換えの適否を判定することができる。

知識バンク１のハードウェア構成ブロック図。知識バンク１に格納される知識の階層構造を示す概念図。知識バンク１の利用例を示す概念図。対話データ３０１の例を示す表図。ドメイン辞書１５２の同義語リストの例を示す表図。案件辞書１５３の同義語リストの例を示す表図。評価のために入出力装置１３の表示装置に表示される入力画面図。ログデータ１５４に記録されるデータ形式の一例を示す表図。ログデータ１５４に記録されるデータ形式の一例を示す表図。ログデータ１５４に記録されるデータ形式の一例を示す表図。ログデータ１５４に記録されるデータ形式の一例を示す表図。共通部分の抽出による汎化処理の概念図。同義語候補の抽出シーケンスを示すフロー図。集計の概念を説明する表図。評価のために入出力装置１３の表示装置に表示される入力画面図。知識の拡張処理Ｓ１３００の全体フロー図。公共知識のドメイン辞書１５２の一例を示す表図。公共知識のドメイン辞書１５２の他の例を示す表図。対話データ1、対話データ2、対話データ1の同義語データ、対話データ2の同義語データの例を示す表図。質問文の類似度よりも回答文の類似度の方が同義語か否かの判断に相関があることを示す説明用の表図。質問文の類似度、回答文の類似度、同義語判定の関係を示す表図。適用処理の流れを示す流れ図。スコアS1の計算（Ｓ１９０６）の詳細な流れ図。適用処理Ｓ１９００の結果を入出力装置１３に表示して、ユーザーが評価をするための画面図。

以下実施の形態について、図面を用いて詳細に説明する。ただし、本発明は以下に示す実施の形態の記載内容に限定して解釈されるものではない。本発明の思想ないし趣旨から逸脱しない範囲で、その具体的構成を変更し得ることは当業者であれば容易に理解される。

以下に説明する発明の構成において、同一部分又は同様な機能を有する部分には同一の符号を異なる図面間で共通して用い、重複する説明は省略することがある。

同一あるいは同様な機能を有する要素が複数ある場合には、同一の符号に異なる添字を付して説明する場合がある。ただし、複数の要素を区別する必要がない場合には、添字を省略して説明する場合がある。

本明細書等における「第１」、「第２」、「第３」などの表記は、構成要素を識別するために付するものであり、必ずしも、数、順序、もしくはその内容を限定するものではない。また、構成要素の識別のための番号は文脈毎に用いられ、一つの文脈で用いた番号が、他の文脈で必ずしも同一の構成を示すとは限らない。また、ある番号で識別された構成要素が、他の番号で識別された構成要素の機能を兼ねることを妨げるものではない。

図面等において示す各構成の位置、大きさ、形状、範囲などは、発明の理解を容易にするため、実際の位置、大きさ、形状、範囲などを表していない場合がある。このため、本発明は、必ずしも、図面等に開示された位置、大きさ、形状、範囲などに限定されない。

以下の実施例において説明されているシステムの一例は、階層化された同義語辞書を含む知識ＤＢの機能を含む。任意の複数階層に階層化された同義語辞書は、例えば事業分野に依存しない汎用辞書、金融、交通、公共など特定の分野に適用される分野別辞書、特定の分野の内の個別のタスクに適用される案件辞書、などからなる。また、実施例において説明されているシステムの他の機能として、辞書を汎化あるいは拡張する機能があげられる。また、辞書の内容を適用する際に、文脈の分布や文章の内容を考慮して、辞書の内容を具体的な文章、例えば、質問と回答の組（「Ｑ＆Ａ」という）に適用する機能があげられる。これらの１または複数の機能を含むシステムを、本実施例では知識バンクと称することにする。

本実施例で、「汎化」「汎用化」とは、階層化された下位の辞書から上位の辞書を生成することをいう。「知識」とは「同義語辞書（の内容）」を指す。「適用」とは、知識バンクで抽出された同義語をある文脈に「適用」することをいう。例えば辞書に登録された同義語を実際のＱ＆Ａ等に「適用」するという意味である。「知識の拡張」あるいは「辞書の拡充」とは「同義語対を増やす」ことをいう。同義語対を増やすための処理を「推論」という。

＜１．知識バンクの全体構成＞
図１は、実施例の知識バンク１のハードウェア構成ブロック図である。実施例の知識バンク１は、例えばデータベースサーバのような情報処理装置で構成される。一般的な情報処理装置と同様、中央処理装置（ＣＰＵ）１１、データ通信部１２、入出力装置１３、制御部１４、記憶装置１５、入力処理部１６、出力処理部１７などを備える。

本実施例では計算や制御等の機能は、記憶装置１５に格納されたプログラム（図示せず）がＣＰＵ１１によって実行されることで、定められた処理を他のハードウェアと協働して実現される。ＣＰＵ１１が実行するプログラム、その機能、あるいはその機能を実現する手段を、「機能」、「手段」、「部」、「ユニット」、「モジュール」等と呼ぶ場合がある。本実施例では、これらを制御部１４として機能ブロックで示している。なお、本実施例中、ソフトウェアで構成した機能と同等の機能は、ＦＰＧＡ（Field Programmable Gate Array）、ＡＳＩＣ（Application Specific Integrated Circuit）などのハードウェアでも実現できる。

データ通信部１２は、ネットワーク２０を介して、外部の端末やＤＢと通信が可能である。入出力装置１３は、サーバのような情報処理装置が通常備える画像表示装置やキーボード、さらには、知識バンク１の外部とデータの送受信を可能とする入出力インターフェースを想定している。入出力される情報の処理は、入力処理部１６、出力処理部１７が行う。制御部１４は、機能として汎化部１４１、生成部１４２、推論部１４３を備える。汎化部１４１は、汎用化を行う機能を有する。生成部１４２は、同義語の適用に関する機能を有する。推論部１４３は、辞書の拡張を行う機能を有する。また、記憶装置１５は磁気ディスク装置のような不揮発性メモリや、半導体メモリのような揮発性メモリの、任意の組み合わせから構成されている。記憶装置１５が記憶しているＤＢとして、汎用辞書１５１、ドメイン辞書１５２、案件辞書１５３、ログデータ１５４がある。詳細な説明は後述する。

図１の構成では、知識バンク１はＤＢを含むデータベースサーバとして説明しているが、ＤＢの部分は外部に分離し、ネットワーク２０を介してデータのみを呼び出して処理する端末として構成してもよい。また、逆に制御部１４の任意の機能だけを独立させて情報処理装置として構成してもよい。図１に示した各要素は、有線または無線のネットワークを介してデータの送受信が可能であれば、全てを纏めて一体の装置にする必要はない。

＜２．ＤＢの全体構成＞
図２は、知識バンク１に格納される知識の階層構造を示す概念図である。具体的には、記憶装置１５に格納されている同義語辞書である。この例では３階層の階層であるが、階層はそれより多くても少なくてもよい。本実施例では汎用辞書１５１は事業分野に依存しない辞書、ドメイン辞書１５２は金融、公共などの同一分野に適用される分野別辞書、案件辞書１５３は同一分野の内の各タスク、例えば事業主体毎に適用される辞書としている。汎用辞書１５１は、分野に依存しないので、新しい分野の新規案件に適用するのに適している。また、ドメイン辞書１５２は、同一分野の新規案件に適用するのに適している。

案件辞書１５３には、同義語辞書の他、当該案件において使用される文章例、例えばＱ＆Ａのテキストデータを格納しておくものとする。下位辞書（例えば案件辞書１５３）のテキストデータは、上位辞書（例えばドメイン辞書１５２）でも利用できるものとする。テキストデータの格納方式は、例えば後述の図４のようなものである。典型的な例では、下位辞書である案件辞書１５３の同義語辞書やテキストのデータは、ユーザーによって生成、入力される。上位辞書である汎用辞書１５１やドメイン辞書１５２は、後の実施例で説明するように、汎化の手法により生成することができる。

本実施例の知識バンク１が格納するログデータ１５４は、知識バンクが所定の文章に適用するべき同義語を提案した場合等に、その内容が妥当かどうかをユーザーが判断した結果を記憶したものである。ログデータ１５４については、後に詳しく述べる。

＜３．知識バンクの利用例＞
図３は、知識バンク１の利用例の一例を示す概念図である。いま、Ａ庁、Ｂ銀行、Ｃ銀行の案件辞書１５３、公共と金融のドメイン辞書１５２、汎用辞書１５１から構成された知識バンクがあり、この知識バンクを用いてＤ銀行の対話データ３０１中の単語の同義語を抽出する例を考える。

Ｄ銀行の対話データ３０１は、例えばユーザーが準備したＱ＆Ａのテキストであり、入出力装置１３からテキストデータとして入力される。対話データ中の任意の単語は、生成部１４２によって知識バンクを検索することにより、同義語候補が生成される（Ｓ３０２）。

図４は対話データ３０１の例である。Ｄ銀行の対話ＩＤごとに、質問文と回答文のテキストのペアが準備されている。対話データ３０１の中で、同義語で展開を行う単語は記号＜＞で囲って表している。どの単語を展開するかはユーザーが選択してもよいし、公知の構文解析で自動的に名詞や動詞を抽出するようにしてもよい。

図５は、ドメイン辞書１５２の例であり金融ドメインの同義語のリストを格納している。ここでは、新しい案件であるＤ銀行の対話データ３０１の同義語を検索するため、金融のドメイン辞書１５２を検索する例としているが、他の案件辞書１５３や汎用辞書１５１から任意の複数を選択して検索してもよい。生成部１４２は、例えば対話データ３０１中の「エレベータ」を対象として、案件辞書１５３から「昇降機」「リフト」等を抽出し、同義語候補として入出力装置１３に表示する。

ここで、「見出し語」とは同義語の集合を表すIDのことをいう。例えば、{エレベータ, 昇降機, リフト}という同義語集合のIDを便宜上わかりやすく＜エレベータ＞としている。一つの見出し語に対して、同義語の集合が対応する。

図６は、案件辞書１５３の例であり、公共ドメインの下位辞書であるＡ庁の案件辞書１５３の内容を示す。本実施例では、案件辞書１５３は知識バンクの最下層の知識であり。案件辞書１５３の同義語関係等は、基本的にユーザーが作成して登録したり、入出力装置１３から入力したりするものとする。

汎用辞書１５１やその他の階層の辞書も、基本的にドメイン辞書１５２や案件辞書１５３の構成と同様である。ただし、同義語としてまとめられている同義語集合はそれぞれ異なる場合がある。

ユーザーは、同義語辞書を検索した結果抽出された同義語候補を入出力装置１３の表示装置で確認して、それが妥当かどうかを評価し、例えば正例（True）、負例（False）の分類で入力する（Ｓ３０３）。なお、先に述べたように、ユーザーが評価を行うための表示装置や入力装置は、ネットワーク２０で接続された遠隔地にある別の装置でもよい。この場合には、知識バンク１は、表示するための情報を入出力装置１３の入出力インターフェースから送出し、送信されてくるユーザーの入力を受信する。

図７は、評価のために入出力装置１３の表示装置に表示される入力画面の例である。ある辞書で登録されている同義語集合に含まれる同義語が、適用しようとしている文章（ここではＤ銀行の対話データ３０１）に鑑みて、同義語集合に含めることが適切かを評価している。後述するように、本実施例では各同義語辞書において、同義語が適切に適用できるかどうかをユーザーが評価した結果がカウントされ、ログデータ１５４として記録される。

図７で、画面左側には、金融ドメインの辞書の見出し語「エレベータ」に関する同義語集合｛エレベータ，昇降機，施設｝が表示されている。どの辞書に関する表示かは、辞書種類表示７０１に表示される。複数の同義語辞書を検索した場合には、例えばプルダウンメニューで辞書を切り替える。見出し語７０２は、スイッチ７０３，３０４で切り替えることができる。見出し語７０２に対応する同義語は、同義語リスト７０５で表示される。左のウィンドウの評価７０６にユーザーの評価「True/False」を入力する。

図７で、画面右側には、Ｄ銀行の対話データ３０１の中から、見出し語を含むテキストが表示されている。ここでは、「エレベータ」を含む質問文７０７と回答文７０８のペアが表示される。これらが、Ｄ銀行の対話データであることをドメイン表示７０９で表示する。スコア７１０、評価７１１は、後述する方法で計算したスコアSSであるが省略してもよい。評価７１１はこの例では用いない。図７では、２つのＱ＆Ａが示されているが１つあるいは３つ以上でもよい。

ここでユーザーは、Ｄ銀行の対話データを参照しつつ、同義語集合｛エレベータ，昇降機，施設｝の各要素を同義語集合に含めることが適切かどうかを判定する。図７の例では、「エレベータ」と「昇降機」は適切だが、「施設」を同義語集合に含めると、適切でない変換が行われるとユーザーが判定している。

評価結果は、同義語候補が抽出された辞書のＩＤ、および、適用した文章のテキストとともにログデータ１５４として知識バンクに記憶される。このようなユーザーによる評価は、知識バンクが新しい同義語集合を提案した際にも行うことができる。また、知識バンクが辞書に登録する同義語候補を提案した際にも同様に行うことができる。

なお、評価７０６は、ログデータのカウントに基づいてデフォルト値を表示してもよい。例えば、金融ドメインで所定以上「False」の評価のカウントが多い語は、評価７０６に「False」表示される。ユーザーは、デフォルト値を変更することができる。ユーザーが評価７０６のデフォルト値を変更した場合、あるいは変更しなかった場合も、ログデータのカウントに含めることができる。変更しなかった場合はデフォルトの評価を追認したものとしてデフォルトの評価を１インクリメントし、変更した場合はデフォルトの評価の逆を評価したものとしてデフォルトと逆の評価を１インクリメントすることができる。あるいはデフォルト値の変更については、カウントに含めなくてもよい。

以上のようにして、Ｄ銀行の対話データ３０１は、ユーザーによって「True」評価を受けた同義語を用いて、同義語展開をすることができる。また、その結果を用いて、Ｄ銀行用の新たな案件辞書１５３を生成し、知識バンク１に登録してもよい。

図８Ａは、ログデータ１５４に記録されるデータ形式の一例を示す表図である。例えば、評価された同義語集合が格納される辞書を特定する情報８０１、タイムスタンプ８０２、評価したユーザーＩＤ８０３、見出し語８０４、同義語８０５、質問文８０６と回答文８０７および、正例（True）、負例（False）の評価８０８が記録される。また、分類８０９は、評価がどのフェーズで行われたかを示す。評価フェーズとしては、汎化、拡張、適用の区分がある。タイムスタンプ８０２、ユーザーＩＤ８０３、分類８０９等はオプションでもよい。また、質問文８０６と回答文８０７は、適用フェーズでのオプション項目としてもよい。また、逆に他の項目、例えば、質問文８０６と回答文８０７のドメイン名を追加してもよい。

図８Ａの１番目〜６番目の行は、図７の入力例がログデータとされた例である。Ｄ銀行の対話データ３０１に適用される、見出し語「エレベータ」の同義語「エレベータ」と「昇降機」と「施設」について、評価が入力されている。ユーザーは、例えば表示される質問文と回答文を参照し、この文例において同義語を見出し語「エレベータ」の同義語集合に含めることが適切かどうかを判定する。よって、ログデータの構成としては、見出し語８０４と同義語８０５の組に対してTrueまたはFalseの評価８０８が与えられる。

このように本実施例では、ユーザーによる同義語の評価は、その同義語が、あるシチュエーションで、ある同義語集合に含まれるのが適切か否かを表している。また、ログデータは、見出し語と同義語のペアに対してTrue/Falseが記録される。

なお、図８Ａの例では、同義語「エレベータ」と「昇降機」については、図７右側の２つのＱ＆Ａに対して「True」、同義語「施設」については、図７右側の２つのＱ＆Ａに対して「False」の評価となっている。入力方法については、同義語とそれが適用されるテキストの組み合わせに対する評価ができれば、図７の方式に限る必要はない。

＜４．知識バンクの知識の汎化＞
上述のように、階層化された知識バンクにおいて、複数辞書、特に上位階層の辞書を検索することで、特定の案件辞書に限定されずに検索が可能となり、文書に適切な同義語集合を検索することができる。次に、どのようにして知識バンクの知識の汎化すなわち、上位辞書への同義語の登録を行うかを説明する。

図９は、共通部分の抽出による汎化処理の概念図である。いま、ある上位辞書Ｘ（例えば金融系ドメイン辞書１５２−１）への同義語の登録を考える。上位辞書Ｘの下位辞書ｙ（例えばＢ銀行案件辞書１５３−１、Ｃ銀行案件辞書１５３−２）の集合をＹとする。集合Ｙは、下位辞書ｙ１、ｙ２・・を含む。汎化部１４１は、下位辞書ｙ１、ｙ２・・で共通に同義語として登録されている語を、上位辞書Ｘで同義語として登録する。

例えば、「住宅」「マンション」「マイホーム」はＢ銀行の案件辞書１５３−１とＣ銀行の案件辞書１５３−２で共に同義語として登録されている。そこで、上位の金融系ドメイン辞書１５２−１でも同義語として登録する。また、「住宅」「マンション」は金融系ドメイン辞書１５２−１と公共系の案件辞書１５２−２で共に同義語として登録されている。そこで、上位の汎用辞書１５１でも同義語として登録する。

上記手法は下位辞書の共通部分を上位辞書とするので、同一案件、同一分野内であれば、同義関係が成り立ちやすい。ただし、共通部分を抽出する手法では、絞り込みしかされないため、本来であれば同義語であったような語が除去されてしまう。そこで本実施例では、多少の例外は許容して広めに同義語集合を作り、適用するかどうかはユーザーに評価させる仕組みを提案する。このとき、逆に広げすぎると、ノイズが増えてしまいユーザーの評価の手間が増えてしまう。そこで、以下の実施例では、カバー率とエラー率という尺度を導入している。

図１０は、汎化部１４１が実行する、カバー率とエラー率を考慮した同義語候補の抽出シーケンスを示すフロー図である。いま上位辞書Ｘ（例えばドメイン辞書１５２）に同義語を登録することを考える。このとき、上位辞書Ｘの下位辞書（例えば案件辞書１５３）の集合Ｙにおける、ユーザーによる同義語評価結果から、上位辞書Ｘに登録する同義語の集合を求める。この処理は、任意のタイミングで随時あるいは定期的に行うことができる。

入力データ１００１としては、以下を用いる。
１）上位辞書Ｘの下位辞書ｙの同義語データ
２）上位辞書Ｘの各下位辞書ｙの同義語候補に対するユーザーによる評価データ
３）上位辞書Ｘの下位辞書ｙの数Ｎ
４）任意に設定されるカバー率の下限値ＢＣ
５）任意に設定されるエラー率の上限値ＢＥ

１）下位辞書ｙの同義語データは、各辞書（例えば図６に示した案件辞書１５３）から得ることができる。２）ユーザーによる評価データは、ログデータ１５４から得ることができる。図７および図８で説明したように、辞書に登録された同義語を基にして提案された同義語候補は、ユーザーによって、汎化、拡張、適用それぞれのフェーズで正例（True）と負例（False）に分類評価されている。上記の２）で用いられるユーザーによる評価は、同じ同義語集合内の各同義語について、それが同義語集合に入るか入らないかを判定している。すなわち、見出し語と同義語の組に対してTrueまたはFalseの評価が行われている。図８で説明したように、この評価結果はログデータ１５４に記録されている。

処理Ｓ１００３では、正例とされた同義語対と負例とされた同義語対の数を辞書ごとに集計する。処理Ｓ１００３の詳細を、図１０右側の処理Ｓ１００３−１〜Ｓ１００３−４で説明する。

汎化部１４１は、下位辞書ｙの同義語データから単語ペア(w1,w2)を抽出する（Ｓ１００３−１）。そして、各単語ペア(w1,w2)についての共通の見出し語をxとしたとき、xとw1、xとw2の評価結果についてログデータ１５４を参照して評価データを抽出し（Ｓ１００３−２）、それが正例とされた数posと不例とされた数negを辞書ごとに集計する（Ｓ１００３−３）。

具体例で説明すると、図９の汎用辞書１５１の同義語候補を抽出しようとする場合、汎化部１４１は下位辞書である金融系ドメイン辞書１５２−１の見出し語＜エレベータ＞の同義語集合から単語ペア「エレベータ」と「施設」を抽出する（Ｓ１００３−１）。そして、見出し語＜エレベータ＞と「エレベータ」、見出し語＜エレベータ＞と「施設」の評価結果についてログデータ１５４を参照する（Ｓ１００３−２）。図８Ａの例では、＜エレベータ＞と「エレベータ」の評価結果はTrueが２カウントでありposがプラス２、＜エレベータ＞と「施設」の評価結果はFalseが２カウントでありnegがプラス２である。このような計数を辞書ごとに行う（Ｓ１００３−３）。

汎化処理の際に同義語対の正否判定を行う場合、ある同義語対が正しい（正例）と判定されるのは、その同義語対が同じ見出し語を持っていて、かつ、双方Trueとなっている場合になる。実際には、ログデータには複数のタイミングにおける複数の評価者の評価が含まれているので、同一の見出し語と同義語のペアに対して、異なる評価が与えられていることが想定される。そこで、以下に説明するように集計結果から多数決により辞書ごとの評価結果を決定する（Ｓ１００３−４）。

図１１は、集計の概念を説明する表図である。見出し語１１０１と同義語１１０２からなるペアについて、ドメイン１１０７と案件１１０６で指定される辞書における評価結果が集計されている。この例では、金融ドメインのＢ銀行辞書とＣ銀行辞書が対象になっている。集計は、図８に示したようなログデータに基づいて行うことができる。なお、ログデータに図８のように適用、汎化、拡張のフェーズの別がある場合には、例えば適用フェーズのデータだけ用いてもよい。あるいは、すべてのデータを用い、フェーズごとに異なる重みづけをしてもよい。

処理Ｓ１００３−１でシステムは見出し語に対応した単語ペア（同義語対）を自動で生成する。図１１では、見出し語＜住宅＞に対応する同義語集合｛住宅，工場，家｝が抽出されており、これらの同義語から同義語対を生成する。図１１に示すように、当該辞書において、処理Ｓ１００３−２でログデータを参照し、処理Ｓ１００３−３で各同義語について正例（True）回数１１０４と負例（False）の回数１１０５が集計される。正例（True）と負例（False）の多寡により、各辞書において当該同義語（候補）が同義語として適切と評価されやすかったか、不適切と評価されやすかったが、総合的な評価結果１１０３として判定される。総合的な評価結果は、単純に多寡で評価してもよいし、正例（True）と負例（False）に任意の重みづけをしてもよい。また他の方式を採用してもよい。

統計的に、正例のカウントが多い同義語は言い換えが適切である事例が多い同義語であり（すなわち汎用性大）、負例のカウントが多い同義語は言い換えが不適切である事例が多い同義語である（すなわち汎用性小）ということが言える。よって、負例のカウントと正例のカウントに基づいて、下位辞書に登録された同義語を上位辞書に登録する候補とするかどうかを決めることができる。

先に述べたように、ある同義語対が正しい（正例）と判定されるのは、その同義語対が同じ見出し語を持っていて、かつ、双方Trueとなっている場合に限る。したがって、図１１の例では、B銀行の辞書においては、「住宅」と「家」の同義語対が正例であり、「住宅」と「工場」、「家」と「工場」は負例となる。C銀行の辞書においては、「住宅」と「家」、「住宅」と「工場」、「家」と「工場」の全ての同義語対が正例と判定される。

以上のようにして各辞書で同義語対の正例・負例を判定し、汎化部１４１はログデータ１５４から以下の情報を得る。ｙ１、ｙ２は下位辞書を示し、(p1,p2)は正例として記録された単語ペア、(n1,n2)は負例として記録された単語ペアである。
正例: {y1:{(p1,p2), …}, y2:{…}, …} p1, p2は単語
負例: {y1:{(n1,n2), …}, y2:{…}, …} n1, n2は単語

各単語ペア(x1,x2)に対し、(x1,x2)が正例として多く現れる辞書数をカウントしPOSとする。同様に、(x1,x2)が負例として多く現れる辞書数をNEGとする（Ｓ１００３−４）。図１１の例で、Ｂ銀行辞書とＣ銀行辞書の２つを対象としているとすると、「住宅」と「家」の同義語対に対するPOS＝2,NEG＝0、「住宅」と「工場」の同義語対に対するPOS＝1,NEG＝1、「家」と「工場」の同義語対に対するPOS＝1,NEG＝1となる。

次に、以下の条件を満たす場合、単語ペア(x1,x2)を上位辞書Ｘでの同義対候補とする（Ｓ１００４）。
POS / Ｎ ≧ カバー率下限値
NEG / Ｎ ≦ エラー率上限値
（Ｎは集合Ｙに属する下位辞書ｙの数）
カバー率下限値とエラー率上限値は事前にユーザーが設定しておく。POS / ＮとNEG / Ｎが０〜１の値をとるとすれば、カバー率もエラー率も、０〜１の値をとる。カバー率１とは、すべての辞書で同義語が適切と評価された例が多かったことを意味する。エラー率１とは、すべての辞書で同義語が不適切と評価された例が多かったことを意味する。

同義語候補とされた単語ペア(x1,x2)は、例えば「番号」と「電話番号」が同義語で、「番号」と「電番」が同義語である場合に、「番号」と「電話番号」と「電番」を同義語集合にするマージ処理を行う（Ｓ１００５）。
同義語集合を得たら、同義語集合の適否を人間が評価する（Ｓ３０３）。評価結果は、ログデータ１５４として登録する。

図１２は、同義語集合の適否をユーザーが評価するために、入出力装置１３の表示装置に表示される入力画面の例である。下位辞書集合Ｙで登録されている同義語が、上位辞書Ｘの同義語集合として登録されるのに適切かを評価している。基本的な構成は図７と同じである。処理Ｓ１００５で抽出された、上位辞書Ｘでの同義語候補となる同義語集合に対して、同義語として成立するかを評価７０６に入力する。

図１２の例では、画面左側に見出し語「申請」に属する同義語集合「申請」「届出」「提出」が示され、画面右側に関連するドメインから抽出したテキストが表示される。この例では、金融のドメイン辞書の同義語集合を生成しようとしているので、参考のために、銀行の案件知識から得たＱ＆Ａのテキストを表示してもよい。

ユーザーは、これらのＱ＆Ａに対して、同義語候補が適切かどうかを評価７０６に入力する。

図８Ｂの１番目〜３番目の行は、図１２の入力例がログデータとされた例である。金融ドメインに属するＡ銀行とＢ銀行の対話データ３０１に適用される、見出し語「申請」の同義語候補「申請」と「届出」と「提出」について、評価が入力されている。なお、この例では、同義語「申請」と「届出」については、「True」、同義語「提出」については、「False」の評価となっている。入力方法については、同義語に対する評価ができれば、図１２の方式に限る必要はない。ユーザーの評価の結果として「申請」と「届出」を含む同義語集合１００６が得られ、これを上位辞書Ｘに登録する。

＜５．知識バンクの知識の拡張＞
知識バンクでの知識の拡張、すなわち同義語対を増やす処理について説明する。同義語関係を推定するにあたって、演繹推論を用いることができる。例えば、「番号」と「電話番号」が同義語で、「番号」と「電番」が同義語であると、「電話番号」と「電番」が同義語であるとする演繹推論が成り立つ。しかしながら、同義語として成立するかどうかは、使用される文脈とも関連する。例えば、「番号」と「個人番号」が同義語で、「番号」と「電話番号」が同義語であるからといって、すべての文脈で「電話番号」と「個人番号」が同義語として成立するとはいいがたい（上述の知識の汎化では、同義語の可能性が大きいもの同士でマージ処理を行っている）。

同義語が同一の意味で解釈できるかは、文脈に依存するため、特定の文脈における単語の同義語を増やす際には、その同義語が文脈に合致しているかどうかを考慮しなければならない。そこで、以下の実施例では、文脈の類似度を考慮した辞書の拡張について説明する。

この実施例では、（１）同義語が成立している文章の文脈、（２）同義語を適用しようとする文章の文脈、（３）同義語を適用しようとする文章の集合、の三つの要素を考慮する。（３）の例としては、例えば適用しようとしている同義語が、同義語を適用しようとするＱ＆Ａリストのうち、異なる回答を持つＱ＆Ａに用いられている場合には、異なる意味で用いられていると推測し、適用しないというものがある。

以下の実施例では、上記（１）について、適用の評価に文脈の「類似度」を用いる。文脈にＱ＆Ａを用いた場合には、類似度はＱとＡの類似度の組合せを考慮して評価する。例えば、質問文Ｑ１と回答文Ａ１からなるＱ＆Ａペアにおいて、aとbが同義語として定義されており、質問文Ｑ２と回答文Ａ２からなるＱ＆Ａペアにおいて、bとcが同義語として定義されている場合、aとcが同義語として定義できるかどうかをＱ１、Ｑ２、Ａ１、Ａ２を用いた類似度に基づいて決定する。類似度の組合せ方と類似度の評価は、例えば以下のようなものである。
Ｑ１とＱ２が類似度高、かつ、Ａ１とＡ２が類似度高：類似度高
Ｑ１とＱ２が類似度低、かつ、Ａ１とＡ２が類似度高：類似度中（高）
Ｑ１とＱ２が類似度高、かつ、Ａ１とＡ２が類似度低：類似度中（低）
Ｑ１とＱ２が類似度低、かつ、Ａ１とＡ２が類似度低：類似度低

本実施例では、登録済みの知識を基に新たな知識を出力する情報処理方法であって、新たな知識の推論部１４３を用いる。推論部では、対話における質問と回答のような種類の異なる文に対し、異なる寄与率を用いる。この例によれば、異なる種類のデータに対し、異なる寄与率を用いることで、高精度に知識を拡張することができる。

図１３は、知識バンク１の推論部１４３が行う、知識の拡張処理Ｓ１３００の全体フロー図である。この処理は、任意のタイミングで行うことができる。あるいは、定期的に行ってもよい。

まず、同義語候補を抽出する（Ｓ１３０１）。同義語候補の抽出において、推論部１４３は、記憶装置１５から、汎用辞書１５１、ドメイン辞書１５２および案件辞書１５３の少なくとも一部分を読み出す。データを用いる範囲は、例えば同じ事業のドメインなど任意に定めてよい。任意の知識において、aとbが同義語であり、aとcが同義語であると定義されている場合に、bとcを同義語候補の単語ペアとする。

図１４は、公共知識のドメイン辞書１５２の一例である。公共ドメインにおいて、図１４のような同義語が定義されている場合に、１行目で「家」と「住宅」が同義語と定義され、３行目で「家」と「住居」が同義語であると定義されている場合、「住宅」と「住居」を同義語候補の単語ペアとする。

図１５は、公共知識のドメイン辞書１５２の他の例である。図１４のように１行目の「家」の同義語が「住宅」と「住まい」のように複数ある場合は、「住宅」と「住居」、「住まい」と「住居」の２つが同義語候補の単語ペアとなる。

以上の例では、同じ辞書内で同義語候補を抽出している。ただし、複数の辞書をまたいで同義語候補を抽出してもよい。例えばＢ銀行案件辞書１５３−１で「口座」と「銀行口座」が同義語で、Ｃ銀行案件辞書１５３−２で「口座」と「預金口座」が同義語の場合、「銀行口座」と「預金口座」を同義語候補としてもよい。対象とする辞書の条件設定は、ユーザーが任意に行ってよい。

次に、ユーザーは同義語候補を同義語として登録するかどうかの閾値となる数値、あるいはその他のパラメータを設定する（Ｓ１３０２）。閾値の機能は後述する。次に、推論部１４３は同義語候補の単語ペアのスコアを算出する（Ｓ１３０３）。

ここでスコアは、同義語候補が同義語として適切かどうかを、適用が想定される文章の文脈を考慮して評価するものである。基本的な考えとしては、aとbの同義語関係が成立する文章と、aとcの同義語関係が成立する文章が類似していればbとcの同義語関係が成立するとする。文章の類似度を測定するために、文章をベクトル化して比較するする種々の手法が知られている。文章のベクトル化については、公知であるため詳細な説明は省略する。

文章の類似度を用いた評価方法では、あるＱ＆Ａに同義語候補bとcを適用した場合、その同義語候補のスコアSは以下のように示される。ただし、q1,a1は見出し語aに対してbの同義語関係が成立する質問文と回答文。q2,a2は見出し語aに対してcの同義語関係が成立する質問文と回答文である。simは類似度を示す関数である。
S ＝ 1/2*sim(q1, q2) ＋ 1/2*sim(a1, a2)
上記のスコアSの計算では、質問文と回答文を同じ重みに取り扱っている。しかしながら、発明者らの検討によると、スコアについて以下の２つの要素を考慮することがより望ましい。

（１）特に対話データでは、質問文の類似度よりも回答文の類似度の方が同義語か否かの判断に相関がある。したがって、類似度の評価では、質問文の類似度よりも回答文の類似度に重みをつけて評価することが望ましい。

（２）対話データでは、同一の対話データ内の別の回答文をもつ質問文として、同義語候補を置き換えた文に似た表現が存在する場合は、ペナルティ項として考慮する。すなわち、回答文が異なるということは、質問文は異なる意味であるはずである。それにもかかわらず、同義語候補を置き換えた場合に質問文が類似するということは、その置き換えは不適切であるということになる。

いま、対話データ1の質問文q1iと回答文a1iからなる質問文と回答文ペアがあり、q1iが見出し語＜e1＞を含んでいて、＜e1＞の同義語としてsyn11とsyn12が定義されているとする。また、対話データ1に含まれる質問文の集合{q11, …, q1i, …, q1n}をQ1とする。一方、対話データ2の質問文q2jと回答文a2jからなる質問文と回答文ペアがあり、q2jが見出し語＜e2＞を含んでいて、＜e2＞の同義語としてsyn11とsyn22が定義されているとする。また、対話データ2に含まれる質問文の集合{q21, …, q2j, …, q2m}をQ2とする。i, j, n, mは正の整数であり、1≦i≦n、1≦j≦mの関係にあるとする。

図１６は、対話データ1、対話データ2、対話データ1の同義語データ、対話データ2の同義語データの例を示す表図である。これらのデータは、同義語候補が抽出された辞書、例えば案件辞書１５３から得るが、対話データが含まれていることが必要である。例えば、対話データ1と対話データ1の同義語データは、Ｂ銀行の案件辞書１５３−１から取得する。対話データ2と対話データ2の同義語データは、Ｃ銀行の案件辞書１５３−２から取得する。

図１６の例では、対話データ1でsyn11とsyn12が同義語、対話データ2でsyn11とsyn22が同義語であることから、syn12とsyn22が処理Ｓ１３０１で同義語候補として抽出された例を示している。ここで同義語候補syn12とsyn22が同義語として定義できるか否かを判断するスコアSの計算に下の式を用いる。

S＝(1-K)*sim(q1, q2) ＋ K*sim(a1, a2)
− L*max{sim(q1, f1(q, syn11, syn22)); q∈Q1−{f2(q1i)}}
− L*max{sim(q2, f1(q, syn11, syn12)); q∈Q2−{f2(q2j)}}
右辺第１項と第２項で、q1,a1は対話データ１の質問文と回答文であって、aとbの同義語関係が成立する。q2,a2は対話データ２の質問文と回答文であって、aとcの同義語関係が成立する。simは類似度を示す関数である。同義語が複数のＱ＆Ａに出現する場合は、右辺第１項は平均をとる。例えば、対象データ1にq1iとq1kが含まれており、両方に見出し語＜e1＞が含まれている場合を考える。kは正の整数であり、1≦k＜iまたはi＜k≦nの関係にある。この時、右辺第1項は以下のようになる。第２項も同様である。
(1-K)*avg(sim(q1i, q2j) + sim(q1k, q2j))

第３項は下記のようになる。第４項も同様である。
L*max{sim(p, f1(q, syn11, syn22)); q∈Q1−{f2(q1i), f2(q1k)} ∧ p∈{q1i, q1k}}
Kは0≦K≦1を満たす正の数であり、ユーザーが処理Ｓ１３０２で設定する。Kは質問文と回答文の類似度をスコアSに反映させるに際して、重みづけを行うものである。これにより、文脈の部分毎に重みづけをすることが可能となる。上記（１）の知見を考慮すると、0.5＜Kとして回答文の類似度に重みをつけることが望ましい。以上の説明から明らかなように、右辺第１項＋第２項が大きいほど、syn12とsyn22が同義語として定義される可能性が大きい。

次に、右辺第３項および第４項は、上記（２）を考慮したものである。Lは0≦L≦1を満たす正の数でユーザーが処理Ｓ１３０２で設定する。f1(q, syn1, syn2)は質問文qのsyn1を同義語にもつ見出し語をsyn2に置換した文を出力する関数である。f2(q)はqの回答文を回答に持つ質問文の集合を出力する関数である。

上記定義によれば、右辺第３項のq∈Q1−{f2(q1)}は、Q1に含まれる質問文の内、q1の回答文を回答に持つ質問文以外の質問文（q1の回答文を回答に持たない質問文）である。そして、max{sim(q1, f1(q, syn11, syn12))は、q1の回答文を回答に持たない質問文を同義語で置換した文と、q1の類似度の最大値を判定する。回答が異なるので、これらの質問文は類似してはならない。よって、右辺第３項はペナルティ項として作用する。Lはペナルティ項の重みである。右辺第３項は、対話データ1について考慮したものであり、右辺第４項は、同様に対話データ2について考慮したものである。

最終的にスコアSをユーザーが処理Ｓ１３０２で設定した閾値と比較して、同義語候補syn12とsyn22を同義語として登録するかどうかを決定する。同義語と決定された場合には、対話データ1および対話データ2を取得した辞書、例えば案件辞書１５３において、これらを同義語集合に含め登録する。

図１７は、対話データでは、質問文の類似度よりも回答文の類似度の方が同義語か否かの判断に相関があることを示す例である。ここでは４つのドメイン辞書１５２から同義語候補を抽出している。ここでは「ナンバー」を介して下記の同義語候補があるが、同義語になるのは(1)と(6)のみである。
(1)「自動車登録番号」、「ナンバープレート」
(2)「自動車登録番号」、「マイナンバー」
(3)「自動車登録番号」、「個人番号」
(4)「ナンバープレート」、「マイナンバー」
(5)「ナンバープレート」、「個人番号」
(6)「マイナンバー」、「個人番号」

図１８は、図１７の例で質問文の類似度、回答文の類似度、同義語判定の関係を示す表である。回答文の類似度の方が質問文の類似度よりも重みを大きくしている。そのため、質問文の類似度のみが高いQ2-Q3の(4)や、Q2-Q4の(5)は、同義語にならないという判定になっている一方、回答文の類似度のみが高いQ1-Q2の(1)は同義語判定がされている。

質問文や回答文の類似度が近い場合には、図１８の表示とともに図１７のように質問文と回答文を並べて表示すると、ユーザーの評価が容易になる。また、質問文が類似し、回答文が非類似の割合が多い場合には、適切な同義語候補が含まれない可能性があるので、警告を発するなどしてユーザーの注意を喚起することが望ましい。

＜４．知識バンクの知識の汎化＞で説明したのと同様に、ここでも同義語候補はユーザーに評価される。汎化部１４１は計算したスコアSを用いて、例えば処理Ｓ１３０２で設定した閾値以上のスコアを持つものを、入出力装置１３でユーザーに表示する。その際にスコアを表示してソートしてもよい。

ユーザーが、(1)「自動車登録番号」、「ナンバープレート」、(6)「マイナンバー」、「個人番号」をTrueと評価した場合、図８Ｃの１行目〜８行目のように、当該語が用いられている辞書の種類とともに、True評価が記録される。

また、このとき、当該語が用いられている辞書には、新しい同義語対として見出し語＜自動車登録番号＞に「自動車登録番号」と「ナンバープレート」、見出し語＜マイナンバー＞に「マイナンバー」と「個人番号」を登録してもよい。このようにして同義語辞書の拡張が可能になる。

＜６．知識バンクの知識の適用＞
今までの説明では、知識バンクの知識を汎化、拡張して、同義語辞書を進化させる仕組みを解説した。次に、このように生成された知識バンクの知識を実際の文章に適用して、同義語の置き換えを行う処理を説明する。同義語が同一の意味を有するかは文脈に依存するため、ある同義語集合が特定の文脈における同義語として適切かどうかは、その同義語が文脈に合致しているかを確認しなければならず、大きなコストがかかっていた。知識バンクの特に上位の汎用的な辞書の同義語を適用する場合、人によるチェックを省いて常に適切な置き換えを可能とすることは難しい。

図１９は、本実施例の適用処理の流れを示す流れ図である。適用処理Ｓ１９００は、図３の生成処理Ｓ３０２の一部または全部に用いることができる。

生成部１４２への入力とするのは、同義語による置き換えをしようとする対話データ３０１例えば、Ｑ＆Ａリストである（図３ではＤ銀行の対話データ３０１）。Ｑ＆Ａリストの質問文の集合をQ、質問文をqとする。また、検索対象となるドメインdの辞書データ（図３では例えば金融のドメイン辞書１５２）すなわち同義語集合を入力する。生成部１４２の出力は、Ｑ＆Ａリストの各質問文qに対して、同義語集合WとそのスコアSSの対の集合である。Ｑ＆Ａリストの各質問文qに対してＳ１９０３〜Ｓ１９０８を実行する（Ｓ１９０２）。まず質問文qを固定長のベクトルVに変換する（Ｓ１９０３）。質問文qに含まれる各単語wに対してＳ１９０５〜Ｓ１９０８を実行する（Ｓ１９０４）。

wが含まれる同義語集合Wを検索により求める（Ｓ１９０５）。検索対象はdで定義されている辞書の同義語集合とする。複数の同義語集合Wがある場合は、各Wに対してＳ１９０６〜Ｓ１９０８を実行する。

生成部１４２はスコアS1を計算し（Ｓ１９０６）、スコアS2を計算し（Ｓ１９０７）、S1−KK*S2をスコアSSとする（Ｓ１９０８）。それぞれの詳細について、以下説明する。

スコアS1の計算（Ｓ１９０６）では、同義語集合Wの要素が出現する文の文脈分布WC＝(AVE, VAR)上での質問文ベクトルVの生成確率を計算しS1（0≦S1≦1）とする。

図２０は、スコアS1の計算（Ｓ１９０６）の詳細な流れ図である。入力は同義語集合２００１W＝{w1, w2, …}であり、出力は同義語集合Wの要素w1, w2, …が出現する文の文脈分布WC上の質問文ベクトルの生成確率である。

まず、Wのいずれかの語w1, w2, …が出現する質問の集合をＱ＆Ａリストから検索し、Q＝{q1, q2, …}とする（Ｓ２００２）。

次に、Qの各要素を固定長のベクトルに変換しQV＝{qv1, qv2, …}とする（Ｓ２００３）。ベクトル化の手法は、例えば、word2vecと呼ばれる単語埋め込み表現の学習手法を用いてqの各単語を固定長のベクトルに変換しそれらを平均する。または、doc2vecと呼ばれる文のベクトル化の手法を用いて直接qを固定長のベクトルに変換してもよい。

そして、QVの平均ベクトルAVEと共分散行列VARを計算し、文脈分布WC＝(AVE, VAR)とする（Ｓ２００４）。文脈分布WCにおける、質問文qの固定長のベクトルVの生成確率を求め、スコアS1とする（Ｓ２００５）。

スコアS1は、質問文qと、質問文q中にある語の同義語が用いられている文の関係を示す。同義語集合内の単語が使われている文脈(つまり文)の分布(平均と分散)から確率を計算するのが特徴になる。例えば、同義語集合内の単語が使われている文がいずれもほぼ同じであれば、質問文qもそれらと近くなるはずである。この場合、分散が小さいので、対象のqが平均と少し違うだけで生成確率S1が小さくなる。逆に、同義語集合内の単語が使われている文がお互いに似ていない場合は、どのような文であっても同義語展開できる可能性があるということになる。この場合は分散が大きくなるため、平均から多少はずれていても生成確率S1が大きくなる。

したがってS1が大きい場合、同義語集合Wは質問文qに適用することが適切な可能性が大であり、S1が小さい場合、同義語集合Wは質問文qに適用することが適切でない可能性が大であるといえる。以上のスコアS1の計算については、Ｑ＆Ａのうち質問文だけを処理してよい。

スコアS2の計算（Ｓ１９０７）では、質問文qを同義語集合W内の各同義語wで同義語展開(置換)した文をq’とする。そして、q’に最も類似する他の質問文(ただしqに対する回答文とは別の回答文を持つ)を検索し、その類似度をS2（0≦S2≦1）とする。ここで、
S2 ＝ max{sim(q’, q’’)}
ただし、q’はqをw∈Wで置換した文,q’’∈Q−{a2q(q2a(q))}
である。また、
q2a(x): xを質問文とする回答文を出力する関数
a2q(x): xを回答文とする質問文を出力する関数
である。すなわちq’’はqに対する回答と異なる回答を持つ質問文である。同義語集合W内の同義語wが複数ある場合は、q’も複数あるので、S2は類似度の最大値maxをとる。

スコアS2の意図は、質問文を同義語展開後に別の回答を持つ質問と類似してしまう危険性をスコアに反映したいということである。別の回答を持つ質問は、当然別の意味を持つ質問であるから、これらが類似してしまう言い換えを可能とする同義語集合は候補から削除すべきである。よって、スコアS2はペナルティ項として作用する。

最終的にS1 − KK*S2をSSとする（Ｓ１９０８）。ただしKKは0≦KK≦1である。ここで、KKはペナルティ項の重みであり、ユーザーが任意に設定してよい。最終的に、質問文qと同義語集合WとスコアSSを出力する。

なお、図１９の例では、スコアS1の計算とスコアS2の計算を順次行っているが、スコアS1が所定の閾値を超えない場合、スコアS2の計算以降を省略してその同義語集合Wを候補から削除してもよい。

図２１は、適用処理Ｓ１９００の結果を入出力装置１３に表示して、ユーザーが評価をするための画面の例である。Ｑ＆Ａリストの各質問文qに対して、同義語集合WとそのスコアSSを示している。

画面右側にＤ銀行のＱ＆Ａの質問文７０７と回答文７０８が表示されている。Ｄ銀行のドメインであることがドメイン表示７０９で表示される。評価される同義語集合Wは、画面左側の表示されており、この同義語集合が右側のＱ＆Ａに適切かどうかの参考のために、スコアSSがスコア７１０に提示されている。ユーザーはスコア７１０を参考に、最終的な評価を評価７１１に入力することができる。評価結果は、Ｄ銀行の知識の評価結果として、ログデータとして記録される。同義語集合がＱ＆Ａに適切であれば、その同義語集合（辞書）を用いて、テキストを同義語展開することができる。あるいは、適切と評価された同義語集合を集めて、新たな辞書を作成することもできる。

この場合、「申請」「届出」「提出」からなる同義語集合Wについて、図２１右側１行目の「＜申請＞に必要な書類は？」の質問文を含むＱ＆Ａには適用可、２行目の「＜申請＞できる場所は？」Ｑ＆Ａには適用不可の評価である。よって、それぞれのＱ＆Ａに対して同義語集合Wの要素がTrue、Falseで評価される。

また、True評価のＱ＆Ａに対して使用する、画面左側に提示された同義語集合を同時に修正することも可能である。図２１の例では、「届出」と「提出」はFalseと評価されて同義語集合から除外された。また、ユーザーは新たな同義語をその場で追加することもできる。図２１の例では、「申告」があらたに追加されている。

図８Ｄの１行目〜４行目は、適用におけるユーザーの評価結果をログデータに記録したものである。見出し語＜申請＞が適用可能なＱ＆Ａに対して、さらに見出し語の同義語集合の適用可能性が判定されている。また、追加された「申告」にはTrue評価がされる。また、評価７１１はＱ＆Ａと同義語集合Wの組に対して別途記録する。

なお、質問文の生成確率を示す上記のスコアS1に、＜４．知識バンクの知識の汎化＞で説明したカバー率とエラー率を反映させることもできる。例えば、カバー率とエラー率の２つを、何等かの方法で単一のスコアにする。例えば、単純に平均を計算して、
score ＝ (カバー率 + ( 1 − エラー率))/2
をそれぞれの同義語集合に付与しておく。スコアS1と上記のscoreを乗算して、S1 * scoreを新たな指標として、S1に代えて用いることができる。

知識バンク１、ＣＰＵ１１、データ通信部１２、入出力装置１３、入力処理部１６、出力処理部１７、汎化部１４１、生成部１４２、推論部１４３、汎用辞書１５１、ドメイン辞書１５２、案件辞書１５３、ログデータ１５４

Claims

入力装置、出力装置、処理装置および記憶装置からなり、推論部を備える情報処理装置で実行される情報処理方法であって、
前記推論部は、
第１の質問文と第１の回答文の組を含む第１のテキストデータと、第２の質問文と第２の回答文の組を含む第２のテキストデータを入力する、第１のステップ、
前記第１のテキストデータの中の語ａを語ｂに置き換え可能とする第１の同義語関係が成立し、前記第２のテキストデータの中の前記語ａを語ｃに置き換え可能とする第２の同義語関係が成立している場合、前記第１の回答文と前記第２の回答文の類似度である第１の類似度と、前記第１の質問文と前記第２の質問文の類似度である第２の類似度から、前記語ｂと前記語ｃの類似度を計算する、第２のステップ、
を実行し、
前記計算において前記第１の類似度の寄与率と前記第２の類似度の寄与率が異なる、
情報処理方法。
前記第１の類似度の寄与率を前記第２の類似度の寄与率より大きくする、
請求項１記載の情報処理方法。
前記第２のステップでは、
前記第１のテキストデータと前記第２のテキストデータをベクトル化して、前記第１の類似度と前記第２の類似度を計算する、
請求項１記載の情報処理方法。
第１のデータベースから、前記第１のテキストデータと前記第１の同義語関係を取得し、
第２のデータベースから、前記第２のテキストデータと前記第２の同義語関係を取得する、
請求項１記載の情報処理方法。
前記第１のデータベースから、前記第１のテキストデータ以外の第１の参考テキストデータを得、前記第１の参考テキストデータの質問文の前記語ａを、前記語ｃで置換した第１の置換質問文を生成する第３のステップ、
前記第１の参考テキストデータから、前記第１の質問文に最も類似する質問文であって、前記第１の回答文とは異なる回答文を持つ第１の置換質問文を検索する第４のステップ、
前記第１の質問文と前記第１の置換質問文の類似度を求め、第１のペナルティスコアとする第５のステップ、
を実行する、請求項４記載の情報処理方法。
前記第２のデータベースから、前記第２のテキストデータ以外の第２の参考テキストデータを得、前記第２の参考テキストデータの質問文の前記語ａを、前記語ｂで置換した第２の置換質問文を生成する第６のステップ、
前記第２の参考テキストデータから、前記第２の質問文に最も類似する質問文であって、前記第２の回答文とは異なる回答文を持つ第２の置換質問文を検索する第７のステップ、
前記第２の質問文と前記第２の置換質問文の類似度を求め、第２のペナルティスコアとする第８のステップ、
を実行する、請求項５記載の情報処理方法。
前記第１の類似度と前記第２の類似度をポジティブなパラメータ、前記第１のペナルティスコアと前記第２のペナルティスコアをネガティブなパラメータとして、前記語ｂと前記語ｃの類似度を評価するためのスコアを生成する、
請求項６記載の情報処理方法。
前記第１の類似度と前記第２の類似度を、ユーザーに対して表示する、
請求項１記載の情報処理方法。
入力装置、出力装置、処理装置および記憶装置からなり、推論部を備える情報処理装置であって、
前記推論部は、
第１の質問文と第１の回答文の組を含む第１のテキストデータと、第２の質問文と第２の回答文の組を含む第２のテキストデータを入力する、第１の機能、
前記第１のテキストデータの中の語ａを語ｂに置き換え可能とする第１の同義語関係が成立し、前記第２のテキストデータの中の前記語ａを語ｃに置き換え可能とする第２の同義語関係が成立している場合、前記第１の回答文と前記第２の回答文の類似度である第１の類似度と、前記第１の質問文と前記第２の質問文の類似度である第２の類似度から、前記語ｂと前記語ｃの類似度を計算する、第２の機能、
を備え、
前記計算において前記第１の類似度の寄与率と前記第２の類似度の寄与率が異なる、
情報処理装置。
前記第１の類似度の寄与率を前記第２の類似度の寄与率より大きくする、
請求項９記載の情報処理装置。
前記第２の機能では、
前記第１のテキストデータと前記第２のテキストデータをベクトル化して、前記第１の類似度と前記第２の類似度を計算する、
請求項９記載の情報処理装置。
第１のデータベースから、前記第１のテキストデータと前記第１の同義語関係を取得し、
第２のデータベースから、前記第２のテキストデータと前記第２の同義語関係を取得する、
請求項９記載の情報処理装置。
前記第１のデータベースから、前記第１のテキストデータ以外の第１の参考テキストデータを得、前記第１の参考テキストデータの質問文の前記語ａを、前記語ｃで置換した第１の置換質問文を生成する第３の機能、
前記第１の参考テキストデータから、前記第１の質問文に最も類似する質問文であって、前記第１の回答文とは異なる回答文を持つ第１の置換質問文を検索する第４の機能、
前記第１の質問文と前記第１の置換質問文の類似度を求め、第１のペナルティスコアとする第５の機能、
を備える、請求項１２記載の情報処理装置。
前記第２のデータベースから、前記第２のテキストデータ以外の第２の参考テキストデータを得、前記第２の参考テキストデータの質問文の前記語ａを、前記語ｂで置換した第２の置換質問文を生成する第６の機能、
前記第２の参考テキストデータから、前記第２の質問文に最も類似する質問文であって、前記第２の回答文とは異なる回答文を持つ第２の置換質問文を検索する第７の機能、
前記第２の質問文と前記第２の置換質問文の類似度を求め、第２のペナルティスコアとする第８の機能、
を備える、請求項１３記載の情報処理装置。
前記第１の類似度と前記第２の類似度をポジティブなパラメータ、前記第１のペナルティスコアと前記第２のペナルティスコアをネガティブなパラメータとして、前記語ｂと前記語ｃの類似度を評価するためのスコアを生成する、
請求項１４記載の情報処理装置。