JP2009059323A - 知識生成システム - Google Patents

知識生成システム Download PDF

Info

Publication number
JP2009059323A
JP2009059323A JP2007228570A JP2007228570A JP2009059323A JP 2009059323 A JP2009059323 A JP 2009059323A JP 2007228570 A JP2007228570 A JP 2007228570A JP 2007228570 A JP2007228570 A JP 2007228570A JP 2009059323 A JP2009059323 A JP 2009059323A
Authority
JP
Japan
Prior art keywords
event
events
similarity
causal
phrase
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007228570A
Other languages
English (en)
Inventor
Masaki Ida
政樹 伊田
Hoshiko Ito
星子 伊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Omron Corp
Original Assignee
Omron Corp
Omron Tateisi Electronics Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Omron Corp, Omron Tateisi Electronics Co filed Critical Omron Corp
Priority to JP2007228570A priority Critical patent/JP2009059323A/ja
Publication of JP2009059323A publication Critical patent/JP2009059323A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】未経験の問題を解決するための新たな知識を既存の知識から自動生成するための技術を提供する。
【解決手段】システムは、複数の事象を事象間の因果関係と共に予め記憶している因果関係DBと、入力された入力事象と因果関係DBに記憶されている事象との間の因果関係を類推する類推部2と、を備える。類推部2は、因果関係DBに記憶された複数の事象の中から、入力事象に類似する第1の事象、第1の事象と因果関係を有する第2の事象、及び、第2の事象に類似する第3の事象を順次検索する抽象化・検索部21と、第3の事象の中から、入力事象にドメインが類似する事象を選択し、選択された事象と入力事象との間に因果関係があるものとみなす写像・具体化部22と、を備える。
【選択図】図1

Description

本発明は、事象間の因果関係に関する知識を自動生成する技術に関する。
人間であれば、過去の経験や知識を応用して、未経験の問題に対する有効な解決策を見出したり、予測・診断により問題の発生や拡大を未然に防いだりすることができる。しかしながら、コンピュータによる問題解決手法で同様のことを実現するのは極めて難しい。たとえば、類似事例検索に基づいた問題解決システムでは、未経験の問題はデータベースに事例が存在しないため、適切な検索結果を得ることができない。また、エキスパートシステムの応用例である原因分析システムにおいても、問題を解決するための知識が存在しなければ原因を分析することができない。
とはいえ、未経験の問題が無くなるほどの十分な知識をシステムに揃えるのは非現実的である。もし人手で作成するとしたら、専門的知識をもつ熟練者が多大な時間と労力をかける必要があり高コストであるし、事例を蓄積するにしても、未経験の問題に遭遇しなくなるまで網羅的に収集するのはほとんど不可能だからである。また、事故とか故障といった重大な問題ほど発生頻度は低いため、事例の収集が難しいという事情もある。
なお、関連する先行技術としては、特許文献1〜3がある。特許文献1では、階層的な概念知識をもとに推論することで未知の現象に対応する手法が提案されている。しかしこの手法は、階層的な知識の作成自体が難しく、その実現方法やコストが課題となる。また特許文献2では、未知の入力があったときに、それまでとの差分を考慮して知識を適応学習する装置が開示されている。しかしこの装置は、逐次的に賢くはなるものの、未知の現象に対応できるわけではなく、初めての事例は解決できない。また特許文献3では、因果構造を適応化する機構を備えたシステムが提案されているが、このシステムは優先度の値を更新するだけなので、未知の現象に対応できるわけではない。
特開2005−157907号公報 特開平6−187318号公報 特開2001−117774号公報
本発明は上記実情に鑑みてなされたものであって、その目的とするところは、未経験の問題を解決するための新たな知識を既存の知識から自動生成するための技術を提供することにある。
上記目的を達成するために本発明は、以下の構成を採用する。
本発明に係る知識生成システムは、複数の事象を事象間の因果関係と共に予め記憶している記憶手段と、入力された入力事象と前記記憶手段に記憶されている事象との間の因果関係を類推する類推手段と、を備える。具体的には、前記類推手段は、前記記憶手段に記憶された複数の事象の中から、前記入力事象に類似する第1の事象、前記第1の事象と因果関係を有する第2の事象、及び、前記第2の事象に類似する第3の事象を順次検索し、前記第3の事象の中から、前記入力事象にドメインが類似する事象を選択し、前記選択された事象と前記入力事象との間に因果関係があるものとみなす。
ここで「事象」とは、因果関係の「因(原因)」または「果(結果)」となり得る現象の単位であり、それ単体で意味を成すひとまとまりの文もしくは語句の組み合わせである。2つの事象が類似するとは、2つの事象の意味が類似(同一を含む)することをいう。2つの事象のドメインが類似するとは、2つの事象の属する分野(問題領域)が類似(同一を含む)することをいう。
この構成によれば、既存の因果知識(事象の組み合わせとそれらの間の因果関係)を類推適用することで、入力事象に対する新たな因果知識を獲得することができる。よって、未経験の問題に対する原因分析や結果予測が可能となる。
ここで、前記類推手段は、各事象に含まれる語句と係受け関係を有する語句の傾向を表す情報に基づいて、2つの事象の類似度を評価するとよい。意味の類似する語句は、互いに置換可能であったり、同じような文脈で使われることが多いため、「係受け関係を有する語句の傾向」が類似する蓋然性が高い。よって、「係受け関係を有する語句の傾向」に着目することで、2つの事象の意味内容が類似するかどうかを精度よく判定可能である。
「係受け関係を有する語句の傾向を表す情報」として、「係受け関係を有する語句の種類及びその出現頻度」を用いることができる。このとき、システムが、所定の文書群から予め求められた、対象語句と係受け関係を有する語句の種類及びその出現頻度を、当該対象語句の意味情報として記憶している意味情報記憶手段を備えていることが好ましい。ある事象が与えられた場合に、その事象に含まれる語句を意味情報記憶手段に登録されている対象語句の中から検索するだけで、当該事象に関する意味情報を高速かつ簡単に取得することができる。そして、前記類推手段は、各事象に含まれる語句の意味情報を比較することによって、2つの事象の類似度を評価するとよい。
前記類推手段は、各事象に含まれる語句と共起する語句の傾向を表す情報に基づいて、2つの事象のドメインの類似度を評価するとよい。同一文書中に現れる(共起する)語句は同一又は非常に近いドメインに属する語句である可能性があり、共起頻度が高いほどその可能性は高くなる。よって、「共起する語句の傾向」に着目することで、2つの事象のドメインが類似するかどうかを精度よく判定可能である。
「共起する語句の傾向を表す情報」として、「同一文書内に共起する語句の種類及びその出現頻度」を用いることができる。このとき、システムが、所定の文書群から予め求められた、対象語句と同一文書内に共起する語句の種類及びその出現頻度を、当該対象語句のドメイン情報として記憶しているドメイン情報記憶手段を備えていることが好ましい。ある事象が与えられた場合に、その事象に含まれる語句をドメイン情報記憶手段に登録されている対象語句の中から検索するだけで、当該事象に関するドメイン情報を簡単かつ高速に取得することができる。前記類推手段は、各事象に含まれる語句のドメイン情報を比較することによって、2つの事象のドメインの類似度を評価するとよい。
ところで、上述した「類推」は、記憶手段に登録されている既存の因果知識が基礎となる。記憶手段に登録する因果知識は、コーパス(文書群)から自動で獲得されたものでもよいし、人手で作成されたものでもよいが、労力やコストを考慮すると前者のほうが好ましい。そこで、本発明は、コーパスから因果知識を獲得(学習)するための機能も提供する。
具体的には、本発明は、2つの事象の間の因果関係の強度を推定する推定手段を備える。推定手段は、前記2つの事象から語句を抽出し、前記抽出された語句の集合と、予め定められたN個の語句集合のそれぞれとの類似度を算出し、前記N個の語句集合との類似度に対する因果関係の強度分布を規定するモデルを用いて、前記算出された類似度に対応す
る因果関係の強度を算出し、前記算出された因果関係の強度に基づき、前記2つの事象の間の因果関係の有無を推定する。
この手法では、離散値である事象が類似度という連続量のパラメータに変換されるため、任意の事象間の因果関係の強度を算出可能となる。よって、文書中に因果が明示されていない事象の組み合わせや、モデル生成時に現れなかった事象の組み合わせであっても、因果関係の強度を推定でき、因果知識の獲得が可能となる。
システムが、教師データから前記モデルを生成するモデル生成手段をさらに備えることが好ましい。教師データは、因果関係を有する事象のペアを複数含むものである。前記モデル生成手段は、前記事象のペアから抽出された語句の集合と前記N個の語句集合のそれぞれとの類似度を算出して、その算出された類似度をN次元空間へマッピングし、前記複数の事象のペアに対応する複数の点がマッピングされたN次元空間において、前記点の密度分布を算出し、前記算出された密度分布を前記因果関係の強度分布とするとよい。密度分布(強度分布)には適当な確率分布をあてはめればよい。このような統計的学習によって、N個の語句集合との類似度に対する因果関係の強度を表すモデルを自動で生成することができる。
本発明は、上記手段の少なくとも一部を有する知識生成システムとして捉えてもよいし、上記処理の少なくとも一部を含む知識生成方法、または、かかる方法を実現するためのプログラムやそのプログラムを記録した記録媒体として捉えることもできる。なお、上記手段および処理の各々は可能な限り互いに組み合わせて本発明を構成することができる。
本発明によれば、未経験の問題を解決するための新たな因果知識を既存の因果知識から自動生成することができる。これにより、未経験の事象に対する原因推定や結果予測などの問題解決が可能になる。
本発明の実施形態に係る知識生成システムは、類推に基づいて類似事例から新たな因果知識を生成することで、未経験の問題の解決を可能とするシステムである。類推(Analogy)とは、「類似した状況においては類似した事実が成り立つ」という前提の下、いくつ
かの与えられた対象間の類似性を検出し、その類否を用いて、一方の対象で成立した事実や知識を、もう一方の対象に変換することにより、問題解決の手がかりを得たり、未知の事実などを予測したりすることである。
たとえば、「(原因)QFP部品でリード曲がり発生」→「(結果)ハンダのブリッジ不良発生」、という因果知識を有していたとする。QFP部品とSOP部品の足の形の類似性に着目し、QFP部品の知識をSOP部品に類推適用すれば、SOP部品でリード曲がりが発生したときにも(未知の事象)、ブリッジ不良が発生するおそれがある、という結果予測が可能になる。また、「雨の日に家庭用プリンタの調子が悪くなるのは紙やインクの湿気が原因である」という因果知識を、印刷プロセスの類似性に着目して、基板のハンダ印刷工程に類推適用することで、印刷不良の増加(未知の事象)は基板の湿気が原因の可能性がある、といった原因推定が可能となる。
<システム構成>
図1は、本発明の実施形態に係る知識生成システムの全体構成を示している。
知識生成システムは、その構成要素として、学習部1、類推部2、問題解決部3を備える。また、構成要素間のインタフェースとして、汎用知識DB(データベース)4、類推
知識DB5を備える。また、ユーザインタフェースとして、コーパス6、入力部7、表示部8を備えている。なお、知識生成システムは、ハードウエア的には、CPU、記憶装置(メモリ、ハードディスクなど)、入力装置、表示装置などを具備する汎用的なコンピュータにより構成可能である。図1に示される各々の機能は、CPUが記憶装置に格納されたプログラムを実行し、必要に応じて記憶装置、入力装置、表示装置などのハードウエア資源を利用することで、実現されるものである。
<学習部>
学習部1は、所定の文書群であるコーパス6から汎用知識を学習(獲得)する機能である。学習部1は、(1)因果学習部10、(2)事象類似モデル学習部11、(3)ドメイン類似モデル学習部12、(4)データ整備部13から構成される。学習部1による学習結果は汎用知識DB4に格納される。なお、汎用知識DB4には、因果関係DB40、事象類似モデル41、ドメイン類似モデル42、テキスト解析辞書43などが格納される。
(1)因果学習部
因果学習部10は、コーパス6から事象を抽出し、事象間の因果関係の有無を推定する機能である。コーパス6とは事例が記述された文書の集合体であり、たとえば、過去の不具合報告、顧客問い合わせ履歴、新聞記事データ、論文集などをコーパス6として利用可能である。
図2に示すように、因果学習部10は、コーパス6から処理対象とする文書を読み込み、テキスト解析辞書43を利用してテキスト解析(形態素解析および係受け解析)を実行する(S20)。テキスト解析辞書43には、コーパス6内に出現する専門用語や固有名詞などが予め登録されているものとする。
次に、因果学習部10は、テキスト解析の結果から「事象」を抽出する(S21)。ここでは、因果関係の「因(原因)」または「果(結果)」となり得る現象の単位を「事象」と定義する。因果学習部10は、格フレーム解析を行い、述語(動詞、形容詞、形容動詞、サ変名詞)と述語に係る語句の組を事象として抽出する。文書から複数の事象が抽出されると、それらの事象のリストが次の処理にわたされる。
因果学習部10は、抽出された複数の事象の間の因果強度を推定する(S22)。事象の全ての組み合わせについて因果強度が推定され、その結果が因果関係DB40に格納される(S23)。記憶容量の削減のため、因果強度が所定値よりも大きな組み合わせのみ(つまり、因果関係がありそうな事象の組み合わせのみ)を因果関係DB40に登録するとよい。
因果関係DB40は、たとえば、因の事象、果の事象、因果強度、因果属性の4つの情報で1つの因果知識を表す。因果強度とは事象間の因果関係の強さを0.0(因果関係なし)〜1.0(因果関係あり)のスカラー値で表現したものである。因果属性とは因果関係の分類(原因・前提条件)を指す。本実施形態では、因果関係DB40が、複数の事象を事象間の因果関係と共に予め記憶している記憶手段を構成している。
(因果強度推定処理)
図3は、因果学習部10による因果強度推定処理を示すブロック図である。文書中の因果関係は、接続詞等の識別語によって明示されている場合と明示されていない場合とがある。その両者に対応するため、因果学習部10は、推定対象となる事象のペアに対して、(A)識別語による因果関係抽出(101)と、(B)統計モデルによる因果強度推定(103)の両方を行い、それらの出力スコアから事象間の因果強度を決定する(104)
。たとえば、出力スコアの大きな方が事象間の因果強度の値として採用される。本実施形態では、因果学習部10のこの機能が、2つの事象の間の因果関係の強度を推定する推定手段を構成する。
(A)識別語による因果関係抽出
接続詞等の識別語により明示的に因果関係が示されている場合は、その前後の事象間に因果関係が存在することが分かる。たとえば、「雨が降ったので服が濡れた」という事例においては、識別語「ので」を鍵に事象「雨が降る」と事象「服が濡れる」の間に因果関係が存在することを推測できる。
識別語リスト100には、このような識別語が予め複数登録されている。因果学習部10はテキスト解析(S20)の結果と識別語リスト100とを参照して、2つの事象の間に因果関係があるか否か判定し、その結果を0(因果関係なし)/1(因果関係あり)で出力する。
(B)統計モデルによる因果強度推定
「雨が降り、服が濡れた」のように文書中に因果関係が明示されていない場合は、識別語を手がかりとする手法は利用できない。このような非明示の因果関係に対応する手法としては、隠れ変数モデルを用いた手法がある。学習により事象間の因果関係を隠れ変数を用いてモデル化するというものである。しかしこの手法は、各々の事象を離散値として扱っているために、モデル学習の際に出現しなかった事象の組み合わせに関しては因果知識を獲得できないという問題がある。たとえば、「雨が降ると服が濡れる」「雪が降ると服が濡れる」という2つの因果関係がわかっていても、未知事象「みぞれが降る」については因果を導出できないのである。このような問題を解決するために、未知事象を考慮する必要がなくなるまで教師データを収集するとか、「雨<みぞれ<雪」のように用語の大小・順序を考慮した階層辞書を作成して用語を網羅するといったアプローチも提案されてはいるものの、いずれのアプローチも非現実的である。
そこで本実施形態では、離散値である事象を連続量に変換したものをパラメータとする統計モデルを学習により作成し(106)、その統計モデル(102)を用いて事象間の因果関係の強度を推定する(103)。
(B1)統計モデルの作成
まず、因果の教師データ105と、N個の語句集合を用意する(Nは1以上の整数)。教師データ105は、モデル学習用のデータであり、因果関係を有していることが分かっている、多数の事象ペアから構成されている。N個の語句集合のそれぞれは、意味が類似するか、分野が類似する語句の集合体である。たとえば、辞書分類に基づいて、動物、植物、非生物、人名、行動、・・・のように意味分類されている。
因果学習部10は、教師データ105から因果関係を有する事象のペアを読み込み、その事象のペアから語句を抽出する。たとえば、「みぞれが降る」「服が濡れる」という事象のペアから、それぞれの述語である「降る」「濡れる」という語句が抽出される。
次に、因果学習部10は、抽出された「降る;濡れる」という語句集合と、N個の語句集合のそれぞれとの類似度を算出する。語句集合間の類似度は、ワードベクトル間のコサイン距離で求められる。
ワードベクトルとは、対象語句の文脈語の集合を頻度情報として数値化し、対象語句の意味を文脈語の種類とその出現頻度とで表現したベクトルである。概念ファジィ集合(Conceptual Fuzzy-Sets)のひとつの具体例である。図4は、「バス」という対象語句のワ
ードベクトルの一例を示している。「交通」、「時刻」、「駅」などの文脈語により「バス」という語句の概念が形成されていることが分かる。なお、語句集合のワードベクトルは、語句集合を構成する各語句のワードベクトルの成分を包含するベクトルとして定義できる。つまり、「降る;濡れる」という語句集合のワードベクトルは、語句「降る」の文脈語の情報と「濡れる」の文脈語の情報の両方を含むものである。同様に、事象(事象のペア)のワードベクトルは、事象(事象のペア)に含まれる1又は複数の語句のワードベクトルの成分を包含するベクトルと定義できる。
ワードベクトル間のコサイン距離は、下記式により計算できる。下記式において、a、bはそれぞれワードベクトルであり、ai、biはワードベクトルの成分である。コサイン距離cos(a,b)が小さいほど2つのワードベクトルの類似度は高い、といえる。なお、対象語句ごとに成分(文脈語)の種類や個数が異なり得るため、コサイン距離の算出にあたっては、2つのワードベクトルの成分の種類と個数を揃えておく。
Figure 2009059323
ところで、ワードベクトルを生成する際に、どのような文脈を考慮するかで、コサイン距離で表現される類似度の視点が変わる。文脈語として、対象語句と係受け関係を有する語句を選んだ場合は、対象語句(対象語句を含む語句集合、事象)間の意味内容の類似度を評価することができる。意味の類似する語句は、互いに置換可能であったり、同じような文脈で使われることが多いため、係受け関係を有する語句の傾向が類似する蓋然性が高いからである。一方、文脈語として、対象語句と共起する語句を選んだ場合は、対象語句(対象語句を含む語句集合、事象)間のドメインの類似度を評価できる。同一文書中に共起する語句は同一又は非常に近い問題領域に属している可能性が高いからである。前者を「係受けワードベクトル」、後者を「共起ワードベクトル」とよぶ。
統計モデルの作成には、係受けワードベクトルを用いることとする。これにより、意味分類されているN個の語句集合のそれぞれと事例(「降る;濡れる」)との意味内容の類似性を把握することが可能となる。
因果学習部10は、このようにして求めた類似度をN次元空間にマッピングする。図5に示すように、N次元空間の各軸は各語句集合との類似度を表している。なお、図5は、説明を簡単にするため、2つの語句集合(N=2)の場合を示しているが、実際の統計モデルではより多くの語句集合が用いられる。
教師データとして与えられた多数の事象ペアについて、類似度の算出及びN次元空間へのマッピングを繰り返す(図5参照)。意味の類似する事象ペアはN次元空間内の同じような位置にマッピングされるため、点の密度には偏りが現れてくる。それぞれの点は因果関係を有する事象ペアに対応するものであるから、点の密度分布は因果関係の存在の尤度(もしくは因果関係の強度)を表しているものとみなすことができる。因果学習部10は、N次元空間内の点の密度分布を混合ガウス分布でモデル化し、それを因果関係の強度分布とする。このとき、因果強度を0.0〜1.0で規格化しておくとよい。
このようにして作成された統計モデル102は、N個の語句集合との類似度に対する因果関係の強度分布を規定するものである。統計モデル102は汎用知識DBに登録され、次に述べる因果強度の算出処理に利用される。
(B2)因果強度の算出
因果強度の推定対象となる事象のペアが与えられると、因果学習部10は、モデル作成時の処理と同様、事象のペアから語句を抽出し、その抽出された語句の集合と上記N個の語句集合のそれぞれとの類似度を算出する。そして、図5の点Pに示すように、算出された類似度を統計モデル102にあてはめることで、因果関係の強度Qを算出する。これは、推定対象の事象ペアの間に因果関係があるならば、教師データのいずれかの事象ペアに意味が類似しており、強度分布(密度分布)の大きな位置にマッピングされるはずである、との予想に基づくものである。
この手法では、離散値である事象が類似度という連続量のパラメータに変換されるため、任意の事象間の因果関係の強度を算出可能となる。よって、文書中に因果が明示されていない事象の組み合わせや、モデル生成時に現れなかった事象の組み合わせであっても、因果関係の強度を推定でき、因果知識の獲得が可能となる。
(2)事象類似モデル学習部
事象類似モデル学習部11は、事象間の類似度を評価するために利用される係受けワードベクトルを作成し、事象類似モデル41として出力する機能である。
図6に示すように、事象類似モデル学習部11は、コーパス6から文書を読み込み、テキスト解析(S60)及び事象抽出(S61)を行う。これらの処理は図2のS20、S21と同様である。事象類似モデル学習部11は、各事象に含まれる述語を対象語句として選び、各対象語句に係る語句(自立語)の出現回数をカウントする(S62)。これらの処理をコーパス6内の全ての文書について繰り返すことにより(S63)、事象の述語になり得る対象語句の抽出と、各対象語句と係受け関係を有する文脈語の種類及びその出現頻度の学習とが行われる。そして、事象類似モデル学習部11は、S62で得られた対象語句と文脈語の出現頻度とから、各対象語句の係受けワードベクトルを作成する(S64)。
このようにして得られた係受けワードベクトルは、対象語句と係受け関係を有する語句の傾向を表す情報、あるいは、対象語句の意味内容を表す意味情報とよぶことができる。
なお、ここで得られた係受けワードベクトルを、上述した因果学習部10による統計モデルの作成や因果強度の算出に利用してもよい。その場合、因果学習部10は、語句集合を構成する各語句の係受けワードベクトルを事象類似モデル41から取得し、それらを合成することで、語句集合に対応する係受けワードベクトルを生成することになる。
(3)ドメイン類似モデル学習部
ドメイン類似モデル学習部12は、事象間のドメインの類似度を利用される共起ワードベクトルを作成し、ドメイン類似モデル42として出力する機能である。
図7に示すように、ドメイン類似モデル学習部12は、コーパス6から文書を読み込み、テキスト解析(S70)及び事象抽出(S71)を行う。これらの処理は図2のS20、S21と同様である。ドメイン類似モデル学習部12は、各事象に含まれる述語を対象語句として選び、同一文書内に共起する語句(述語を除く。)の出現回数をカウントする(S72)。これらの処理をコーパス6内の全ての文書について繰り返すことにより(S
73)、事象の述語になり得る対象語句の抽出と、各対象語句と共起する文脈語の種類及びその出現頻度の学習とが行われる。そして、ドメイン類似モデル学習部12は、S72で得られた対象語句と文脈語の出現頻度とから、各対象語句の共起ワードベクトルを作成する(S74)。
このようにして得られた共起ワードベクトルは、対象語句と共起する語句の傾向を表す情報、あるいは、対象語句のドメイン(分野、問題領域)を表すドメイン情報とよぶことができる。
(4)データ整備部
データ整備部13は、学習部1および類推部2におけるテキスト解析処理で利用されるテキスト解析辞書43を更新・整備する機能である。
図8に示すように、データ整備部13は、コーパス6に含まれるテキストから自動的に重要語を抽出し(S81)、所定フォーマットの追加辞書ファイル43Cを生成する。また、データ整備部13は、人手による辞書追加機能も有している(S80)。追加辞書ファイル43B、43Cは、元のテキスト解析辞書43Aと統合され(S82)、更新されたテキスト解析辞書43が汎用知識DB4に格納される。
前処理として、専門用語や固有名詞などをテキスト解析辞書43に登録し、コーパス6中からテキスト解析における未知語をなくしておくとよい。
<類推部、入力部>
入力部7は、解決すべき問題に関する情報をテキスト形式で入力するための現状入力UIを備えている。
類推部2は、解決すべき問題に含まれる事象(入力事象)と因果関係DB40に登録されている事象(既知事象)との間の因果関係を類推する機能である。類推部2は、(1)現状理解部20、(2)抽象化・検索部21、(3)写像・具体化部22から構成される。
(1)現状理解部
現状理解部20は、解決すべき問題として入力されたテキストから、事象と因果関係を抽出する機能である。抽出アルゴリズムは、因果学習部10のものと同様である。なお、因果関係が抽出できない場合は事象を抽出するだけでも構わない。
(2)抽象化・検索部
抽象化・検索部21は、因果関係DB40から、入力事象に類似した事象を因または果とする因果関係を検索し、入力事象を起点とする抽象化された因果構造(ネットワーク)を生成する機能である。
図9に示すように、まず抽象化・検索部21は、入力事象および果の事象を着目事象に設定する(S90)。現状理解部において果の事象が抽出できなかった場合には入力事象のみを着目事象に設定すればよい。
次に、抽象化・検索部21は、因果関係DB40に登録されている事象の中から、着目事象に類似する事象を検索する(S91)。類似度の評価には、事象類似モデル41が利用される。つまり、抽象化・検索部21は、着目事象と比較対象の事象のそれぞれから述語を抽出し、各述語を対象語句とする係受けワードベクトルを事象類似モデル41から取得し、それらのコサイン距離を算出することで類似度を得る。抽象化・検索部21は、類
似度の値が所定のしきい値より小さい場合に、2つの事象が類似していると判定する。S91で索出された事象は着目事象に追加される。なお、索出数が多すぎる場合は、しきい値を変更することで類似判定を厳しくしたり、類似度の小さなものから一定数だけ採用するようにすればよい。
次に、抽象化・検索部21は、着目事象を因とする果の事象を因果関係DB40の中から検索する(S92)。索出数が多すぎる場合は、因果強度の大きなものから一定数だけ採用するようにしてもよい。果の事象が索出された場合は(S93;YES)、その果の事象を着目事象に追加した後(S94)、S91に戻る。果の事象が索出されなかった場合は(S93;NO)、S100に進む。
また、抽象化・検索部21は、入力事象および因の事象を着目事象に設定し(S95)、S91〜S94と同様にして、因の方向にも因果構造を展開していく(S96〜S99)。
そして、両方向の因果構造を結合することで、入力事象を起点に展開された因果構造を得ることができる(S100)。
図10は、抽象化・検索部21で形成された因果構造の一例を示している。それぞれの円が事象を、矢印が因果を表している。破線は類似する事象のグループを表している。
入力テキストから入力事象A0と果の事象B0が得られたとする。事象A0の類似事象としてA1〜A3が追加され、事象B0の類似事象としてB1、B2が追加される。事象A0→B1、A1→B1、A3→B2のように、因果関係があることが因果関係DB40に既知ならば因果を接続する。続いて、事象A1〜A3の因の事象としてC0、D0、E0、F0が追加され、さらにそれらの類似事象としてC1、D1、F1が追加される。一方、事象B1、B2の果の事象としてG0、H0が追加され、それらの類似事象としてG1が追加される。さらにG1、H0の因の事象としてI0、I3が追加され、それらの類似事象としてI1、I2が追加される。
(3)写像・具体化部
展開された因果構造には、解決すべき問題とはまったく異なる問題領域の事象も多く含まれている。そこで、写像・具体化部22が入力事象にドメインが類似する事象のみを選択し、因果関係を再構築する。
図11に示すように、写像・具体化部22は、展開された因果構造において、類似事象のグループに順に着目する(S110)。グループ内の複数の事象の中で、入力事象にドメインが類似する事象を選択し、他の事象は削除する(S111)。ドメインの類似度の評価には、ドメイン類似モデル42が利用される。つまり、写像・具体化部22は、入力事象と比較対象の事象のそれぞれから述語を抽出し、各述語を対象語句とする共起ワードベクトルをドメイン類似モデル42から取得し、それらのコサイン距離を算出することで類似度を得る。図12は、図10の因果構造において各グループで最もドメインの近い事象のみを選択した例である。事象C1、D1、E0、F0、G1、H0、I2が選択されている。
ドメインによる絞り込みを全てのグループについて行った後(S112)、写像・具体化部22は、残された事象の間に因果関係があるものとみなし、因果の連鎖を再構築する(S113)。このとき、図12に示すように、グループ間の因果の方向や階層を変えないように、事象間を連結していく。
以上の処理により、解決すべき問題(事象A0、B0)に関わる新たな因果知識が自動生成される。ここで得られた因果知識は、類推知識DB5に格納される。
<問題解決部、表示部>
問題解決部3は、類推知識DB5の因果知識を用いて問題解決を行う機能である。たとえばベイジアン・ネットワークを利用した因果推論などを利用すればよい。因果推論の結果は、表示部8に出力される。
<具体例>
図13は、類推型問題解決の具体例を示している。
基板の表面実装プロセスにおいて、「ハンダがだれる」という不具合が発生したとする。本システムに「ハンダがだれる」という入力事象を与えると、それに類似する事象として「ペンキがだれる」「接着剤がはみ出す」「ケチャップがはみ出す」という3つの事象が検索される。そして、各類似事象と因果関係を有する事象(図13の例では原因事象)、さらに各原因事象に類似する事象、と順次検索される。
このようにして展開された因果構造の中には、「塗装面が傾いている」とか「ケチャップが多すぎる」のように、入力事象「ハンダがだれる」とはまったく無関係な事象も多く含まれている。これを入力事象のドメインに類似するものだけに絞り込むと、「粘度が低い」「下型が傾いている」「はんだ過多」「部品を持つ力が強すぎる」が選ばれ、入力事象「ハンダがだれる」の原因推定に有益な情報が得られる。
以上述べたように本実施形態のシステムによれば、既存の因果知識を類推適用することで、入力事象に対する新たな因果知識を獲得することができ、未経験の問題に対する原因分析や結果予測が可能となる。
本発明の実施形態に係る知識生成システムの全体構成を示す図である。 因果学習部の処理を示す図である。 因果学習部による因果強度推定処理を示す図である。 ワードベクトルの一例を示す図である。 因果強度推定処理に用いる統計モデルを示す図である。 事象類似モデル学習部の処理を示す図である。 ドメイン類似モデル学習部の処理を示す図である。 データ整備部の処理を示す図である。 抽象化・検索部の処理を示す図である。 展開された因果構造の一例を示す図である。 写像・具体化部の処理を示す図である。 写像・具体化された因果構造の一例を示す図である。 類推型問題解決の具体例を示す図である。
符号の説明
1 学習部
2 類推部
3 問題解決部
4 汎用知識DB
5 類推知識DB
6 コーパス
7 入力部
8 表示部
10 因果学習部
11 事象類似モデル学習部
12 ドメイン類似モデル学習部
13 データ整備部
20 現状理解部
21 抽象化・検索部
22 写像・具体化部
40 因果関係DB
41 事象類似モデル
42 ドメイン類似モデル
43 テキスト解析辞書
43A テキスト解析辞書
43B 追加辞書ファイル
43C 追加辞書ファイル

Claims (12)

  1. 複数の事象を事象間の因果関係と共に予め記憶している記憶手段と、
    入力された入力事象と前記記憶手段に記憶されている事象との間の因果関係を類推する類推手段と、を備え、
    前記類推手段は、
    前記記憶手段に記憶された複数の事象の中から、前記入力事象に類似する第1の事象、前記第1の事象と因果関係を有する第2の事象、及び、前記第2の事象に類似する第3の事象を順次検索し、
    前記第3の事象の中から、前記入力事象にドメインが類似する事象を選択し、
    前記選択された事象と前記入力事象との間に因果関係があるものとみなす
    ことを特徴とする知識生成システム。
  2. 前記類推手段は、各事象に含まれる語句と係受け関係を有する語句の傾向を表す情報に基づいて、2つの事象の類似度を評価する
    ことを特徴とする請求項1に記載の知識生成システム。
  3. 所定の文書群から予め求められた、対象語句と係受け関係を有する語句の種類及びその出現頻度を、当該対象語句の意味情報として記憶している意味情報記憶手段をさらに備え、
    前記類推手段は、各事象に含まれる語句の意味情報を比較することによって、2つの事象の類似度を評価する
    ことを特徴とする請求項1に記載の知識生成システム。
  4. 前記類推手段は、各事象に含まれる語句と共起する語句の傾向を表す情報に基づいて、2つの事象のドメインの類似度を評価する
    ことを特徴とする請求項1〜3のいずれかに記載の知識生成システム。
  5. 所定の文書群から予め求められた、対象語句と同一文書内に共起する語句の種類及びその出現頻度を、当該対象語句のドメイン情報として記憶しているドメイン情報記憶手段をさらに備え、
    前記類推手段は、各事象に含まれる語句のドメイン情報を比較することによって、2つの事象のドメインの類似度を評価する
    ことを特徴とする請求項1〜3のいずれかに記載の知識生成システム。
  6. 2つの事象の間の因果関係の強度を推定する推定手段をさらに備え、
    前記推定手段は、
    前記2つの事象から語句を抽出し、
    前記抽出された語句の集合と、予め定められたN個の語句集合のそれぞれとの類似度を算出し、
    前記N個の語句集合との類似度に対する因果関係の強度分布を規定するモデルを用いて、前記算出された類似度に対応する因果関係の強度を算出する
    ことを特徴とする請求項1〜5のいずれかに記載の知識生成システム。
  7. 教師データから前記モデルを生成するモデル生成手段をさらに備え、
    前記教師データは、因果関係を有する事象のペアを複数含んでおり、
    前記モデル生成手段は、
    前記事象のペアから抽出された語句の集合と前記N個の語句集合のそれぞれとの類似度を算出して、その算出された類似度をN次元空間へマッピングし、
    前記複数の事象のペアに対応する複数の点がマッピングされたN次元空間において、前
    記点の密度分布を算出し、
    前記算出された密度分布を前記因果関係の強度分布とする
    ことを特徴とする請求項6に記載の知識生成システム。
  8. 2つの事象の間の因果関係の強度を推定する推定手段を備え、
    前記推定手段は、
    前記2つの事象から語句を抽出し、
    前記抽出された語句の集合と、予め定められたN個の語句集合のそれぞれとの類似度を算出し、
    前記N個の語句集合との類似度に対する因果関係の強度分布を規定するモデルを用いて、前記算出された類似度に対応する因果関係の強度を算出する
    ことを特徴とする知識生成システム。
  9. 教師データから前記モデルを生成するモデル生成手段をさらに備え、
    前記教師データは、因果関係を有する事象のペアを複数含んでおり、
    前記モデル生成手段は、
    前記事象のペアから抽出された語句の集合と前記N個の語句集合のそれぞれとの類似度を算出して、その算出された類似度をN次元空間へマッピングし、
    前記複数の事象のペアに対応する複数の点がマッピングされたN次元空間において、前記点の密度分布を算出し、
    前記算出された密度分布を前記因果関係の強度分布とする
    ことを特徴とする請求項8に記載の知識生成システム。
  10. 複数の事象を事象間の因果関係と共に予め記憶している記憶手段を有するコンピュータが実行する知識生成方法であって、
    入力事象の入力を受け付ける工程と、
    前記入力事象と前記記憶手段に記憶されている事象との間の因果関係を類推する類推工程と、を備え、
    前記類推工程は、
    前記記憶手段に記憶された複数の事象の中から、前記入力事象に類似する第1の事象、前記第1の事象と因果関係を有する第2の事象、及び、前記第2の事象に類似する第3の事象を順次検索する工程と、
    前記第3の事象の中から、前記入力事象にドメインが類似する事象を選択する工程と、
    前記選択された事象と前記入力事象との間に因果関係があるものとみなす工程と
    を含むことを特徴とする知識生成方法。
  11. コンピュータが実行する知識生成方法であって、
    2つの事象の間の因果関係の強度を推定する推定工程を備え、
    前記推定工程は、
    前記2つの事象から語句を抽出する工程と、
    前記抽出された語句の集合と、予め定められたN個の語句集合のそれぞれとの類似度を算出する工程と、
    前記N個の語句集合との類似度に対する因果関係の強度分布を規定するモデルを用いて、前記算出された類似度に対応する因果関係の強度を算出する工程と、
    を含むことを特徴とする知識生成方法。
  12. 請求項10または11に記載された知識生成方法をコンピュータに実行させるためのプログラム。
JP2007228570A 2007-09-04 2007-09-04 知識生成システム Pending JP2009059323A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007228570A JP2009059323A (ja) 2007-09-04 2007-09-04 知識生成システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007228570A JP2009059323A (ja) 2007-09-04 2007-09-04 知識生成システム

Publications (1)

Publication Number Publication Date
JP2009059323A true JP2009059323A (ja) 2009-03-19

Family

ID=40554966

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007228570A Pending JP2009059323A (ja) 2007-09-04 2007-09-04 知識生成システム

Country Status (1)

Country Link
JP (1) JP2009059323A (ja)

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011215898A (ja) * 2010-03-31 2011-10-27 Meiji Univ 類推方法、類推システム及び類推プログラム
JP2011215897A (ja) * 2010-03-31 2011-10-27 Meiji Univ データベース、類推エンジン及び類推システム
JP2012043048A (ja) * 2010-08-16 2012-03-01 Kddi Corp 意味的に類似している事態対を二項関係に分類する二項関係分類プログラム、方法及び装置
JP2012243125A (ja) * 2011-05-20 2012-12-10 Nec Corp 因果単語対抽出装置、因果単語対抽出方法および因果単語対抽出用プログラム
WO2015093541A1 (ja) * 2013-12-20 2015-06-25 独立行政法人情報通信研究機構 シナリオ生成装置、及びそのためのコンピュータプログラム
JP2017037544A (ja) * 2015-08-12 2017-02-16 国立研究開発法人情報通信研究機構 未来シナリオ生成装置及び方法、並びにコンピュータプログラム
WO2017169403A1 (ja) * 2016-03-28 2017-10-05 Necソリューションイノベータ株式会社 事例検索装置、事例検索方法、及びコンピュータ読み取り可能な記録媒体
JP2018005402A (ja) * 2016-06-29 2018-01-11 日本電気株式会社 課題推定装置、課題推定方法及びプログラム
US10095685B2 (en) 2013-12-20 2018-10-09 National Institute Of Information And Communications Technology Phrase pair collecting apparatus and computer program therefor
JPWO2017159614A1 (ja) * 2016-03-14 2019-01-10 オムロン株式会社 学習サービス提供装置
US10430717B2 (en) 2013-12-20 2019-10-01 National Institute Of Information And Communications Technology Complex predicate template collecting apparatus and computer program therefor
WO2020080155A1 (ja) * 2018-10-18 2020-04-23 日本電信電話株式会社 技術名・サービス名生成装置とその方法
CN111967601A (zh) * 2020-06-30 2020-11-20 北京百度网讯科技有限公司 事件关系的生成方法、事件关系规则的生成方法和装置
CN111984765A (zh) * 2019-05-21 2020-11-24 南京大学 知识库问答过程关系检测方法及装置
US11068793B2 (en) 2016-09-20 2021-07-20 Yahoo Japan Corporation Causality analysis device, method, and non-transitory computer readable storage medium with determination of causal advantages and disadvantages to a user
JP2021108212A (ja) * 2019-06-18 2021-07-29 ヤフー株式会社 取得装置、取得方法、および取得プログラム
JP2021114234A (ja) * 2020-01-21 2021-08-05 株式会社東芝 情報処理装置、情報処理システム、および情報処理プログラム
WO2022264227A1 (ja) * 2021-06-14 2022-12-22 日本電信電話株式会社 情報処理システム、方法およびプログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000259625A (ja) * 1999-03-10 2000-09-22 Fujitsu Ltd 文書校正装置
JP2001273293A (ja) * 2000-03-23 2001-10-05 Nippon Telegr & Teleph Corp <Ntt> 単語推定方法及び装置及び単語推定プログラムを格納した記録媒体
JP2003216923A (ja) * 2002-11-29 2003-07-31 Fuji Heavy Ind Ltd 故障診断装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000259625A (ja) * 1999-03-10 2000-09-22 Fujitsu Ltd 文書校正装置
JP2001273293A (ja) * 2000-03-23 2001-10-05 Nippon Telegr & Teleph Corp <Ntt> 単語推定方法及び装置及び単語推定プログラムを格納した記録媒体
JP2003216923A (ja) * 2002-11-29 2003-07-31 Fuji Heavy Ind Ltd 故障診断装置

Non-Patent Citations (8)

* Cited by examiner, † Cited by third party
Title
CSNG199800224002; 松原 仁 外2名: '"アナロジー 1.アナロジー入門"' 情報処理 第34巻,第5号, 19930515, p.522-535, 社団法人情報処理学会 *
CSNG200401937059; 鷹野 孝典 外4名: '"時間的因果関係を扱う動的な文脈解釈を伴った意味的連想検索方式の実現"' 情報処理学会研究報告 第2003巻,第71号, 20030717, p.483-489, 社団法人情報処理学会 *
CSNJ200810076053; 伊田 政樹 外2名: '"類推に基づいた類似分野における知識生成システム"' FIT2007 第6回情報科学技術フォーラム 一般講演論文集 第2分冊 データベース 自然言語・音声 , 20070822, p.141-142, 社団法人情報処理学会,社団法人電子情報通信学会 *
CSNJ201010017272; 森本 憲悟 外5名: '"アナロジーを用いた仮説的設計知識の生成手法 概念ネットワークからのモデルの生成と利用"' 2005年度人工知能学会全国大会(第19回)論文集 [CD-ROM] , 20050617, p.1-4, 社団法人人工知能学会 *
JPN6012037666; 伊田 政樹 外2名: '"類推に基づいた類似分野における知識生成システム"' FIT2007 第6回情報科学技術フォーラム 一般講演論文集 第2分冊 データベース 自然言語・音声 , 20070822, p.141-142, 社団法人情報処理学会,社団法人電子情報通信学会 *
JPN6012037668; 松原 仁 外2名: '"アナロジー 1.アナロジー入門"' 情報処理 第34巻,第5号, 19930515, p.522-535, 社団法人情報処理学会 *
JPN6012037671; 森本 憲悟 外5名: '"アナロジーを用いた仮説的設計知識の生成手法 概念ネットワークからのモデルの生成と利用"' 2005年度人工知能学会全国大会(第19回)論文集 [CD-ROM] , 20050617, p.1-4, 社団法人人工知能学会 *
JPN6012037674; 鷹野 孝典 外4名: '"時間的因果関係を扱う動的な文脈解釈を伴った意味的連想検索方式の実現"' 情報処理学会研究報告 第2003巻,第71号, 20030717, p.483-489, 社団法人情報処理学会 *

Cited By (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011215898A (ja) * 2010-03-31 2011-10-27 Meiji Univ 類推方法、類推システム及び類推プログラム
JP2011215897A (ja) * 2010-03-31 2011-10-27 Meiji Univ データベース、類推エンジン及び類推システム
JP2012043048A (ja) * 2010-08-16 2012-03-01 Kddi Corp 意味的に類似している事態対を二項関係に分類する二項関係分類プログラム、方法及び装置
JP2012243125A (ja) * 2011-05-20 2012-12-10 Nec Corp 因果単語対抽出装置、因果単語対抽出方法および因果単語対抽出用プログラム
CN105830064A (zh) * 2013-12-20 2016-08-03 国立研究开发法人情报通信研究机构 情态生成装置以及用于其的计算机程序
JP2015121897A (ja) * 2013-12-20 2015-07-02 国立研究開発法人情報通信研究機構 シナリオ生成装置、及びそのためのコンピュータプログラム
WO2015093541A1 (ja) * 2013-12-20 2015-06-25 独立行政法人情報通信研究機構 シナリオ生成装置、及びそのためのコンピュータプログラム
US10437867B2 (en) 2013-12-20 2019-10-08 National Institute Of Information And Communications Technology Scenario generating apparatus and computer program therefor
US10430717B2 (en) 2013-12-20 2019-10-01 National Institute Of Information And Communications Technology Complex predicate template collecting apparatus and computer program therefor
US10095685B2 (en) 2013-12-20 2018-10-09 National Institute Of Information And Communications Technology Phrase pair collecting apparatus and computer program therefor
JP2017037544A (ja) * 2015-08-12 2017-02-16 国立研究開発法人情報通信研究機構 未来シナリオ生成装置及び方法、並びにコンピュータプログラム
WO2017026303A1 (ja) * 2015-08-12 2017-02-16 国立研究開発法人情報通信研究機構 未来シナリオ生成装置及び方法、並びにコンピュータプログラム
CN108027824A (zh) * 2015-08-12 2018-05-11 国立研究开发法人情报通信研究机构 未来脚本生成装置和方法、以及计算机程序
JPWO2017159614A1 (ja) * 2016-03-14 2019-01-10 オムロン株式会社 学習サービス提供装置
JPWO2017169403A1 (ja) * 2016-03-28 2019-01-31 Necソリューションイノベータ株式会社 事例検索装置、事例検索方法、及びプログラム
WO2017169403A1 (ja) * 2016-03-28 2017-10-05 Necソリューションイノベータ株式会社 事例検索装置、事例検索方法、及びコンピュータ読み取り可能な記録媒体
JP2018005402A (ja) * 2016-06-29 2018-01-11 日本電気株式会社 課題推定装置、課題推定方法及びプログラム
US11068793B2 (en) 2016-09-20 2021-07-20 Yahoo Japan Corporation Causality analysis device, method, and non-transitory computer readable storage medium with determination of causal advantages and disadvantages to a user
JP2020064484A (ja) * 2018-10-18 2020-04-23 日本電信電話株式会社 技術名・サービス名生成装置とその方法
WO2020080155A1 (ja) * 2018-10-18 2020-04-23 日本電信電話株式会社 技術名・サービス名生成装置とその方法
JP7041355B2 (ja) 2018-10-18 2022-03-24 日本電信電話株式会社 技術名・サービス名生成装置とその方法
CN111984765A (zh) * 2019-05-21 2020-11-24 南京大学 知识库问答过程关系检测方法及装置
CN111984765B (zh) * 2019-05-21 2023-10-24 南京大学 知识库问答过程关系检测方法及装置
JP2021108212A (ja) * 2019-06-18 2021-07-29 ヤフー株式会社 取得装置、取得方法、および取得プログラム
JP2021114234A (ja) * 2020-01-21 2021-08-05 株式会社東芝 情報処理装置、情報処理システム、および情報処理プログラム
JP7305566B2 (ja) 2020-01-21 2023-07-10 株式会社東芝 情報処理装置、情報処理システム、および情報処理プログラム
CN111967601A (zh) * 2020-06-30 2020-11-20 北京百度网讯科技有限公司 事件关系的生成方法、事件关系规则的生成方法和装置
CN111967601B (zh) * 2020-06-30 2024-02-20 北京百度网讯科技有限公司 事件关系的生成方法、事件关系规则的生成方法和装置
WO2022264227A1 (ja) * 2021-06-14 2022-12-22 日本電信電話株式会社 情報処理システム、方法およびプログラム

Similar Documents

Publication Publication Date Title
JP2009059323A (ja) 知識生成システム
WO2019080863A1 (zh) 文本情感分类方法、存储介质及计算机
CN110083836B (zh) 一种文本预测结果的关键证据抽取方法
JP6291443B2 (ja) 接続関係推定装置、方法、及びプログラム
Wong et al. Learning to adapt web information extraction knowledge and discovering new attributes via a bayesian approach
US11049043B2 (en) Model induction method for explainable A.I
Macskassy Improving learning in networked data by combining explicit and mined links
CN110188264A (zh) 一种用户数据交互方法及装置
CN111274790A (zh) 基于句法依存图的篇章级事件嵌入方法及装置
JP2009163303A (ja) 検索フィルタリング装置及び検索フィルタリングプログラム
CN115630640A (zh) 一种智能写作方法、装置、设备及介质
JP2007157058A (ja) 分類モデル学習装置、分類モデル学習方法、及び分類モデルを学習するためのプログラム
Zaghloul et al. Text classification: neural networks vs support vector machines
CN113343690A (zh) 一种文本可读性自动评估方法及装置
CN116992304A (zh) 基于人工智能的政策匹配分析系统及其方法
JP5973935B2 (ja) 閲覧行動予測装置、閲覧行動予測方法及びプログラム
CN107291686B (zh) 情感标识的辨识方法和情感标识的辨识系统
Feng et al. Web page segmentation and its application for web information crawling
JP3178406B2 (ja) 階層型文章分類装置およびプログラムを記録した機械読み取り可能な記録媒体
JP2010272004A (ja) 判別装置及び判別方法、並びにコンピューター・プログラム
CN113869034B (zh) 基于强化依赖图的方面情感分类方法
JP2020038514A (ja) 学習データ生成装置、学習データ生成方法、及びプログラム
Brust et al. Making every label count: Handling semantic imprecision by integrating domain knowledge
Annam et al. Entropy based informative content density approach for efficient web content extraction
JP2004326465A (ja) 文書分類用の学習装置、及びこれを用いた文書分類方法並びに文書分類装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100707

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120713

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120724

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20121120