JP6639038B2 - 知識処理装置およびプログラム - Google Patents
知識処理装置およびプログラム Download PDFInfo
- Publication number
- JP6639038B2 JP6639038B2 JP2015136087A JP2015136087A JP6639038B2 JP 6639038 B2 JP6639038 B2 JP 6639038B2 JP 2015136087 A JP2015136087 A JP 2015136087A JP 2015136087 A JP2015136087 A JP 2015136087A JP 6639038 B2 JP6639038 B2 JP 6639038B2
- Authority
- JP
- Japan
- Prior art keywords
- word
- inter
- relation
- storage unit
- format data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
非特許文献1に記載の技術では、文章のデータに所定の頻度以上で出現した単語対しか知識として獲得できない。また、非特許文献2に記載の技術では、単語集合を人手等によって予め作らなければならないという問題があった。また、非特許文献3に記載の技術では、表の意味を人手等によって与えなければならないという問題があった。
[実施形態]
図1は、本実施形態による知識処理装置の概略機能構成を示すブロック図である。図示するように、知識処理装置1は、入力部10と、文章形式データ解析部11(文形式データ解析部)と、文章形式データ記憶部12(文形式データ記憶部)と、関係抽出装置51と、表形式データ記憶部14と、文章形式データ検索部15(文形式データ検索部)と、表形式データ検索部16と、単語対記憶部17と、単語間関係記憶部18と、単語対入力部20と、を含んで構成される。
また、上記の関係抽出装置51は、表形式データ解析部13を含んで構成される。
これら各部は、情報を処理したり保存したりするものであり、主として電子回路(汎用的な機能を有するコンピューターを含む)を用いて実現される。また、文章形式データ記憶部12と、表形式データ記憶部14と、単語対記憶部17と、単語間関係記憶部18は、情報を記憶する手段として、例えばハードディスク装置や半導体メモリ等を内部に備えている。
また、上記の第2処理段階において、文章形式データ検索部15は、単語間関係記憶部18から読み出した単語間関係の関係表現を検索キーとして文章形式データ記憶部12を検索し、検索結果である構文木の部分木に対応する単語対およびその単語対の関係表現を得る。そして、文章形式データ検索部15は、当該単語対および当該単語対の関係表現からなる単語間関係を単語間関係記憶部18に書き込む。
文章形式データ記憶部12は、構文解析結果を表す括弧付の文字の列の形式により、この文章形式のデータを記憶する。
図4は、表形式データ解析部13が入力データから抽出した二次元の表の一般的な形を表した概略図である。図示する表は、I行J列(I,Jはそれぞれ2以上の整数)のサイズを有する。実際の表の各欄には単語等がエントリーしているが、同図では行番号および列番号からなる各欄の座標値を示している。つまり、表内の第i行第j列の欄に入っている単語を、(i,j)で表している。
変換規則1:第1行第j列(2≦j≦J)の単語を、XとYの関係表現とする;第i行第1列(2≦i≦I)の単語を単語Xとする;第i行第j列の単語を単語Yとする;単語間関係の頻度を0とする;第i行第1列の単語Xと第i行第j列の単語Yとの単語間関係の集合(2≦i≦I)を1つの単語間関係クラス(第j列に関するクラス)とする。
変換規則2:第i行第1列(2≦i≦I)の単語を、XとYの関係表現とする;第1行第j列(2≦j≦J)の単語を単語Xとする;第i行第j列の単語を単語Yとする;単語間関係の頻度を0とする;第1行第j列の単語Xと第i行第j列の単語Yとの単語間関係の集合(2≦j≦J)を1つの単語間関係クラス(第i行に関するクラス)とする。
上記の変換規則2は、表の第1列に関係表現を表す単語が含まれていることを想定した規則である。そして、第i行第1列の単語で表される関係表現に係る単語間関係の集合(2≦j≦J)を、1つの単語間関係クラスとしている。
また、上記の変換規則1は、表の第1行に関係表現を表す単語が含まれていることを想定したものであるが、表の第1行以外の行(つまり、第2行目以後)に関係表現を表す単語が含まれていることを想定した規則に置き換えても良い。あるいは、表の第1行に関係表現を表す単語が含まれていることを想定した規則に、表の第1行以外の行に関係表現を表す単語が含まれていることを想定した規則を付け加えても良い。
また、上記の変換規則2は、表の第1列に関係表現を表す単語が含まれていることを想定したものであるが、表の第1列以外の列(つまり、第2列目以後)に関係表現を表す単語が含まれていることを想定した規則に置き換えても良い。あるいは、表の第1列に関係表現を表す単語が含まれていることを想定した規則に、表の第1列以外の行に関係表現を表す単語が含まれていることを想定した規則を付け加えても良い。
(1)前記表形式データの第i行第j0列の要素である単語と第i行第j列の要素である単語とを単語対として抽出するとともに、第i0行第j列の要素である表現を当該単語対の関係を表す関係表現として抽出し(ただし、1≦i≦I,1≦i0≦I,i≠i0,1≦j≦J,1≦j0≦J,j≠j0)、または
(2)前記表形式データの第i0行第j列の要素である単語と第i行第j列の要素である単語とを単語対として抽出するとともに、第i行第j0列の要素である表現を当該単語対の関係を表す関係表現として抽出する(ただし、1≦i≦I,1≦i0≦I,i≠i0,1≦j≦J,1≦j0≦J,j≠j0)。
それに対して、
上記の(2)の場合においては、表形式データにおける列が、エンティティに対応する。そして、そのエンティティ自体を表す単語が、第i0行に格納されている。また、表形式データにおける第j0列が、関係表現を含んでいる行である。
一方、そのような場合に限らず、上述した一般的な表形式データを、表形式データ解析部13が解析するようにして良い。なおそのとき、i0やj0の値を特定した形で変形規則を定めるようにして良い。
例えば、「かぜ薬A錠の主成分はアセチルサリチル酸である。」という文は、単語「かぜ薬A錠」と、単語「アセチルサリチル酸」と、関係表現「主成分」という要素から成っている。このとき、単語「かぜ薬A錠」と単語「アセチルサリチル酸」とが単語対であり、その単語対の関係を表す関係表現が「主成分」という要素である。言い換えれば、単語「かぜ薬A錠」を変数Xで表し、単語「アセチルサリチル酸」を変数Yで表したとき、単語対XとYについて、「Xの主成分はYである」という単語間関係が存在する。
図4に示した表に前記の変換規則1を適用すると、下記のような単語間関係が得られる。
R2,2=((2,1),(2,2),Xの(1,2)はYである,0)
R3,2=((3,1),(3,2),Xの(1,2)はYである,0)
R4,2=((4,1),(4,2),Xの(1,2)はYである,0)
以下、続く。この第i行(2≦i≦I)についての一般的な記述をすると、
Ri,2=((i,1),(i,2),Xの(1,2)はYである,0)
図4に示した表に前記の変換規則2を適用すると、上述した変換規則1を適用した場合とは行と列とを転置させたのと同様の結果が得られる。
変換規則2を適用したとき、例えば、次の単語間関係が得られる。
R2,2=((1,2),(2,2),Xの(2,1)はYである,0)
R2,3=((1,3),(2,3),Xの(2,1)はYである,0)
R2,4=((1,4),(2,4),Xの(2,1)はYである,0)
以下、続く。この第j列(2≦j≦J)についての一般的な記述をすると、
R2,j=((1,j),(2,j),Xの(2,1)はYである,0)
ここに例示した関係R2,2,関係R2,3,関係R2,4,・・・,関係R2,Jは、ひとつの単語間関係クラスを成す(J−1)個の関係である。この単語間関係クラスを、W2,1とする。当該単語間関係クラスに属する各単語間関係は、いずれも「(2,1)」(表の中の第2行第1列の単語)という関係表現を有する点で共通である。
図5に示した表に変換規則1を適用すると、下記のような単語間関係が得られる。つまり、表のサイズは5行4列(I=5,J=4)であるので、3個(J−1個)の単語間関係クラスが得られ、各単語間関係クラスは4個(I−1個)の単語間関係を含んでいる。つまり、計12個の単語間関係が得られる。
R3,2=(かぜ薬B錠,β社,Xの製薬会社はYである,0)
R4,2=(カプセルかぜ薬C,γ社,Xの製薬会社はYである,0)
R5,2=(カプセルかぜ薬D,δ社,Xの製薬会社はYである,0)
R2,3=(かぜ薬A錠,風邪,Xの効能効果はYである,0)
R3,3=(かぜ薬B錠,風邪,Xの効能効果はYである,0)
R4,3=(カプセルかぜ薬C,風邪,Xの効能効果はYである,0)
R5,3=(カプセルかぜ薬D,風邪,Xの効能効果はYである,0)
R2,4=(かぜ薬A錠,アセチルサリチル酸,Xの主成分はYである,0)
R3,4=(かぜ薬B錠,イブプロフェン,Xの主成分はYである,0)
R4,4=(カプセルかぜ薬C,イブプロフェン,Xの主成分はYである,0)
R5,4=(カプセルかぜ薬D,アセトアミノフェン,Xの主成分はYである,0)
また、関係R2,3と、関係R3,3と、関係R4,3と、関係R5,3とは、1つの単語間関係クラスW1,3に含まれる。その単語間関係クラスW1,3は「効能効果」という関係表現に関するものである。
また、関係R2,4と、関係R3,4と、関係R4,4と、関係R5,4とは、1つの単語間関係クラスW1,4に含まれる。その単語間関係クラスW1,4は「主成分」という関係表現に関するものである。
次に、図5に示した表に変換規則2を適用すると、下記のような単語間関係が得られる。つまり、表のサイズは5行4列(I=5,J=4)であるので、4個(I−1個)の単語間関係クラスが得られ、各単語間関係クラスは3個(J−1個)の単語間関係を含んでいる。つまり、計12個の単語間関係が得られる。
R2,3=(効能効果,風邪,Xのかぜ薬A錠はYである,0)
R2,4=(主成分,アセチルサリチル酸,Xのかぜ薬A錠はYである,0)
R3,2=(製薬会社,β社,Xのかぜ薬B錠はYである,0)
R3,3=(効能効果,風邪,Xのかぜ薬B錠はYである,0)
R3,4=(主成分,イブプロフェン,Xのかぜ薬B錠はYである,0)
R4,2=(製薬会社,γ社,Xのカプセル風邪薬CはYである,0)
R4,3=(効能効果,風邪,Xのカプセル風邪薬CはYである,0)
R4,4=(主成分,イブプロフェン,Xのカプセル風邪薬CはYである,0)
R5,2=(製薬会社,δ社,Xのカプセル風邪薬DはYである,0)
R5,3=(効能効果,風邪,Xのカプセル風邪薬DはYである,0)
R5,4=(主成分,アセトアミノフェン,Xのカプセル風邪薬DはYである,0)
また、関係R3,2と、関係R3,3と、関係R3,4とは、1つの単語間関係クラスW3,1に含まれる。その単語間関係クラスW3,1は「かぜ薬B錠」という関係表現に関するものである。
また、関係R4,2と、関係R4,3と、関係R4,4とは、1つの単語間関係クラスW4,1に含まれる。その単語間関係クラスW4,1は「カプセル風邪薬C」という関係表現に関するものである。
また、関係R5,2と、関係R5,3と、関係R5,4とは、1つの単語間関係クラスW5,1に含まれる。その単語間関係クラスW5,1は「カプセル風邪薬D」という関係表現に関するものである。
なお、出現頻度の閾値は、データサイズにも依存するものであるため、予め実験を行うことなどによって適宜定める。
なお、ここでも、出現頻度の閾値は、前述の方法と同様、あらかじめ適宜定めておく。
次に、前述の処理手順に従った処理の例を説明する。なお、以下の説明において言及するステップ番号は、図7に示したステップ番号である。
文1:ネギは風邪によく効く
文2:ネギは軽い風邪に効く
文章形式データ解析部11は、これらの文について構文解析処理を行う。各文の構文解析処理の結果である構文木は、次の通りである。なお、ここでは、括弧を用いて構文構造の木を表現している。
文1:((ネギ は)((風邪 に)((よく)(効く))))
文2:((ネギ は)(((軽い)(風邪 に))(効く)))
そして、文章形式データ解析部11は、これら文1および文2を含む、構文解析済の文章形式データを、文章形式データ記憶部12に書き込む。なお、この段階で、文1と文2以外の文も、文章形式データ記憶部12に書き込まれる。
表現1a:((ネギ は)((風邪 に)(効く))),頻度:10回
表現1b:((ネギ は)((風邪 に)((効果 が)(ある)))),頻度:4回
なお、本処理例のステップS2で示した文1および文2は、いずれも、上記の表現1aの部分木を含むものである。
文1:((ネギ は)((風邪 に)((よく)(効く))))
文2:((ネギ は)(((軽い)(風邪 に))(効く)))
表現2a:((たまご酒 は)((風邪 に)(効く))),頻度:8回
表現2b:((かぜ薬A錠 は)((風邪 に)(効く))),頻度:4回
表現2c:((かぜ薬B錠 は)((風邪 に)(効く))),頻度:1回
表現2d:((カプセル風邪薬C は)((風邪 に)(効く))),頻度:2回
これらの表現2a〜2bは、いずれも、「XはYに効く」という関係表現にマッチしている。
単語間関係3b:(かぜ薬A錠,風邪,Xの効能効果はYである,0)
単語間関係3c:(かぜ薬B錠,風邪,Xの効能効果はYである,0)
単語間関係3d:(カプセル風邪薬C,風邪,Xの効能効果はYである,0)
なお、これらの単語間関係3b,3c,3dが属する単語間関係クラスが前記のW1,3(図5の表に前述の表−単語間関係変換規則1を適用して得られたクラス)であるという情報も、表形式データ記憶部14から同時に読み出される。
単語間関係4b:(かぜ薬A錠,風邪,Xの効能効果はYである,0)∈W1,3
単語間関係4c:(かぜ薬B錠,風邪,Xの効能効果はYである,0)∈W1,3
単語間関係4d:(カプセル風邪薬C,風邪,Xの効能効果はYである,0)∈W1,3
単語間関係4e:(カプセル風邪薬D,風邪,Xの効能効果はYである,0)∈W1,3
つまり、表形式データ記憶部14から獲得する知識に関しては、表形式データ検索部16は、その個々の単語間関係の出現頻度ではなく、単語間関係クラスの文章形式データ記憶部12における出現頻度が閾値以上であるか否かによる判定を行う。
出力1:(ネギ,風邪,XはYに効く,10)
出力2:(たまご酒,風邪,XはYに効く,8)
出力3:(かぜ薬A錠,風邪,Xの効能効果はYである,0)
出力4:(かぜ薬B錠,風邪,Xの効能効果はYである,0)
出力5:(カプセル風邪薬C,風邪,Xの効能効果はYである,0)
出力6:(カプセル風邪薬D,風邪,Xの効能効果はYである,0)
[変形例1]
本変形例による知識処理装置の機能構成は、図1に示したブロック図と同様である。本変形例による表形式データ解析部13は、入力データ内に含まれる2次元の表形式のデータを抽出するだけでなく、3次元またはそれ以上の次元数の配列形式のデータから表形式のデータを抽出する機能を有している。
1≦i1≦I1
1≦i2≦I2
1≦i3≦I3
である。
また、表形式データ解析部13は、入力部10から供給される入力データから、複数の配列形式データを抽出し、その各々の配列形式データから2次元の表を抽出して、単語間関係の候補を得ても良い。このとき入力データ内に含まれる各配列の次元数は、同じであっても良く、また互いに異なっていても良い。
変形例2では、知識処理装置1は、文章形式データ解析部11を備えていない。代わりに、文章形式データ記憶部12には、文章形式データの構文解析結果の情報(構文木のデータ)を予め書き込んでおくようにする。このような構成でも、文章形式データ検索部15は、前述の通り、文章形式データ記憶部12を検索し、所望の結果を出力することができる。
変形例3では、知識処理装置1は、表形式データ解析部13を備えていない。代わりに、表形式データ記憶部14には、表形式データの解析結果の情報(単語間関係の候補のデータ)を予め書き込んでおくようにする。このような構成でも、表形式データ検索部16は、前述の通り、表形式データ記憶部14を検索し、所望の結果を出力することができる。
変形例4では、文章形式データ検索部15は、検索結果に基づいて単語間関係を抽出する際に、出現頻度が閾値以上であるか否かの判定を行わない(第1処理段階と第2処理段階のいずれか一方において、または両方の処理段階において)。本変形例のこのような構成は、言い換えれば、出現頻度に関する閾値を0に設定する場合と同様のものである。文章形式データ検索部15が検索結果に基づいて単語間関係を抽出する際に、出現頻度が閾値以上であるかどうかの判定を行わないようにした場合、入力されるデータに依存して知識獲得の精度が劣る結果となる場合もあるが、本質的な処理の内容は変わらない。
変形例5では、表形式データ検索部16は、検索結果に基づいて単語間関係を抽出する際に、前述の、出現頻度が閾値以上であるか否かの判定を行わない。本変形例のこのような構成は、言い換えれば、出現頻度に関する閾値を0に設定する場合と同様のものである。表形式データ検索部16が検索結果に基づいて単語間関係を抽出する際に、出現頻度が閾値以上であるかどうかの判定を行わないようにした場合、入力されるデータに依存して知識獲得の精度が劣る結果となる場合もあるが、本質的な処理の内容は変わらない。
変形例6は、図1に示した構成のうち、入力部10と、表形式データ解析部13と、表形式データ記憶部14と、表形式データ検索部16と、単語間関係記憶部18と、のみを備える。入力部10と、表形式データ解析部13と、表形式データ記憶部14とは、上記実施形態において説明した通りに動作する。そして、本変形例の表形式データ検索部16には、検索語として、外部から単語対を与えるようにする。表形式データ検索部16は、検索語として与えられた単語対を用いて、表形式データ記憶部14を検索する。そして、この検索処理自体は、上記実施形態で説明した通りである。そして、表形式データ検索部16は、検索語である単語対に対応する検索結果として単語間関係クラスを得て、その単語間関係クラスに属する単語間関係を、単語間関係記憶部18に書き込む。つまり、この変形例では、与えられた単語対に対して、複数の単語間関係(単語対と、その関係表現)を取得することができる。
変形例7では、図1に示した構成のうち、関係抽出装置51のみが独立した装置として存在する。このような構成により、表形式データから、単語対とその関係表現とを抽出することができる。
変形例8は、表形式データが階層構造の見出しを含む場合にも対応する。
図9は、階層構造の見出しを含む表形式データの概略を示した概略図である。同図(a)は、表形式データの第1行目に見出し(関係表現)を含むデータの例を示す。また、同図(b)は、表形式データの第1列目に見出し(関係表現)を含むデータの例を示す。同図(a)において、表形式データの左側に付している「R」で始まる番号は、各行を参照するためのインデックスである。また、同図(b)において、表形式データの上側に付している「C」で始まる番号は、各桁(列)を参照するためのインデックスである。
同図(a)に示す表形式データにおいて、R1,R2,R3の行には見出しの情報が含まれている。この見出しの情報は階層構成を成しており、R3の行に含まれているものが同構造における最下層の見出しの情報である。また、R1,R2の行に含まれているものは、より上位の見出しの情報である。相対的に、より上位の見出しの情報は、より下位の複数の見出しの情報を包含する。
また、同図(b)に示す表形式データにおいて、C1,C2,C3の列には見出しの情報が含まれている。この見出しの情報は階層構成を成しており、C3の列に含まれているものが同構造における最下層の見出しの情報である。また、C1,C2の列に含まれているものは、より上位の見出しの情報である。相対的に、より上位の見出しの情報は、より下位の複数の見出しの情報を包含する。
同図(a)では、階層構造における上位の見出し情報を有する行が2行(R1,R2)である場合の例を示したが、そのような行の数は1行であってもよく、3行以上であっても良い。また、同図(b)では、階層構造における上位の見出し情報を有する列が2列(C1,C2)である場合の例を示したが、そのような列の数は1列であってもよく、3列以上であっても良い。
10 入力部
11 文章形式データ解析部(文形式データ解析部)
12 文章形式データ記憶部(文形式データ記憶部)
13 表形式データ解析部
14 表形式データ記憶部
15 文章形式データ検索部(文形式データ検索部)
16 表形式データ検索部
17 単語対記憶部
18 単語間関係記憶部
20 単語対入力部
51 関係抽出装置
Claims (5)
- I行J列(ただし、I,Jはそれぞれ2以上の整数)の表形式データから、(1)前記表形式データの第i行第j 0 列の要素である単語と第i行第j列の要素である単語とを単語対として抽出するとともに、第i 0 行第j列の要素である表現を当該単語対の関係を表す関係表現として抽出し(ただし、1≦i≦I,1≦i 0 ≦I,i≠i 0 ,1≦j≦J,1≦j 0 ≦J,j≠j 0 )、または、(2)前記表形式データの第i 0 行第j列の要素である単語と第i行第j列の要素である単語とを単語対として抽出するとともに、第i行第j 0 列の要素である表現を当該単語対の関係を表す関係表現として抽出する(ただし、1≦i≦I,1≦i 0 ≦I,i≠i 0 ,1≦j≦J,1≦j 0 ≦J,j≠j 0 )表形式データ解析部と、
文を構文解析した結果である構文木の情報を記憶する文形式データ記憶部と、
前記表形式データ解析部が前記表形式データから抽出した単語対および前記単語対の関係を表す関係表現の組み合わせを単語間関係の候補として記憶するとともに、共通の前記関係表現を有する前記単語間関係の候補を同一の単語間関係クラスの候補として記憶する表形式データ記憶部と、
単語対を記憶する単語対記憶部と、
単語対および前記単語対の関係を表す関係表現を単語間関係として記憶する単語間関係記憶部と、
前記単語対記憶部から読み出した単語対、または前記単語間関係記憶部から読み出した前記単語間関係の関係表現を検索キーとして、前記文形式データ記憶部を検索し、検索結果として得られる単語対および前記単語対の関係表現からなる単語間関係を前記単語間関係記憶部に書き込む文形式データ検索部と、
前記文形式データ検索部による検索結果である前記単語対を検索キーとして前記表形式データ記憶部を検索し、検索結果である前記単語間関係クラスに属する前記単語間関係を、前記単語間関係記憶部に書き込む表形式データ検索部と、
を具備し、
前記表形式データ解析部は、予め定めた変換規則を適用することによって前記表形式データから前記単語対および当該単語対の関係を表す前記関係表現を抽出し、抽出した前記単語対および前記関係表現の組み合わせを単語間関係の候補として前記表形式データ記憶部に書き込み、且つ、同一の前記表形式データから抽出され共通の前記関係表現を有する前記単語間関係の候補を同一の単語間関係クラスの候補として前記表形式データ記憶部に書き込むものであり、
前記変換規則は、前記表形式データから、1行における2つの列に属する単語を単語対として抽出するとともに、当該単語対を成す単語のうちの一方の単語が属する列の他の特定行に属する単語を当該単語対に関する関係表現として抽出するもの、または、1列における2つの行に属する単語を単語対として抽出するとともに、当該単語対を成す単語のうちの一方の単語が属する行の他の特定列に属する単語を当該単語対に関する関係表現として抽出するものである、
ことを特徴とする知識処理装置。 - 前記文形式データ検索部と前記表形式データ検索部とを制御する制御部、
をさらに具備し、
前記文形式データ検索部は、第1処理段階において、前記単語対記憶部から読み出した単語対を検索キーとして前記文形式データ記憶部を検索し、検索結果である前記構文木の部分木に対応する単語対および前記単語対の関係表現を得て、当該単語対および当該単語対の関係表現からなる単語間関係を前記単語間関係記憶部に書き込むとともに、第2処理段階において、前記単語間関係記憶部から読み出した前記単語間関係の関係表現を検索キーとして前記文形式データ記憶部を検索し、検索結果である前記構文木の部分木に対応する単語対および前記単語対の関係表現を得て、当該単語対および当該単語対の関係表現からなる単語間関係を前記単語間関係記憶部に書き込むものであり、
前記表形式データ検索部は、前記文形式データ検索部による前記第2処理段階での検索結果である前記単語対を検索キーとして前記表形式データ記憶部を検索し、検索結果である前記単語間関係クラスに属する前記単語間関係を、前記単語間関係記憶部に書き込むものであり、
前記制御部は、所定の終了条件を満たすまで、前記文形式データ検索部による処理と前記表形式データ検索部による処理とを交互に繰り返すよう制御する、
ことを特徴とする請求項1に記載の知識処理装置。 - 文を取得するとともに前記文の構文解析処理を行い、構文解析処理の結果である構文木を前記文形式データ記憶部に書き込む文形式データ解析部、
をさらに具備することを特徴とする請求項1または2のいずれかに記載の知識処理装置。 - 前記文形式データ検索部は、前記第1処理段階における検索結果として所定の閾値以上の出現頻度の前記部分木のみを抽出して当該部分木に対応する単語間関係を前記単語間関係記憶部に書き込むとともに、前記第2処理段階における検索結果として所定の閾値以上の出現頻度の前記部分木のみを抽出して当該部分木に対応する単語間関係を前記単語間関係記憶部に書き込み、
前記表形式データ検索部は、検索結果である前記単語間関係クラスに属する前記単語間関係の前記文形式データ検索部による前記第2処理段階の検索結果における出現頻度が所定の閾値以上の場合にのみ当該単語間関係クラスに属する前記単語間関係を前記単語間関係記憶部に書き込む、
ことを特徴とする請求項2に記載の知識処理装置。 - コンピューターを、請求項1から4までのいずれか一項に記載の知識処理装置として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015136087A JP6639038B2 (ja) | 2015-07-07 | 2015-07-07 | 知識処理装置およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015136087A JP6639038B2 (ja) | 2015-07-07 | 2015-07-07 | 知識処理装置およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017021412A JP2017021412A (ja) | 2017-01-26 |
JP6639038B2 true JP6639038B2 (ja) | 2020-02-05 |
Family
ID=57889726
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015136087A Expired - Fee Related JP6639038B2 (ja) | 2015-07-07 | 2015-07-07 | 知識処理装置およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6639038B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11152125B2 (en) | 2019-06-06 | 2021-10-19 | International Business Machines Corporation | Automatic validation and enrichment of semantic relations between medical entities for drug discovery |
-
2015
- 2015-07-07 JP JP2015136087A patent/JP6639038B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2017021412A (ja) | 2017-01-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10372739B2 (en) | Corpus search systems and methods | |
US9594747B2 (en) | Generation of a semantic model from textual listings | |
US8583420B2 (en) | Method for the extraction of relation patterns from articles | |
US20160155058A1 (en) | Non-factoid question-answering system and method | |
Miner et al. | An approach to mathematical search through query formulation and data normalization | |
CN111190900B (zh) | 一种云计算模式下json数据可视化优化方法 | |
TWI656450B (zh) | 從中文語料庫提取知識的方法和系統 | |
US20150006528A1 (en) | Hierarchical data structure of documents | |
JP2011100403A (ja) | 情報処理装置、情報抽出方法、プログラム及び情報処理システム | |
US20090024616A1 (en) | Content retrieving device and retrieving method | |
Jain et al. | Context sensitive text summarization using k means clustering algorithm | |
JP2015088064A (ja) | テキスト要約装置、方法、及びプログラム | |
Nguyen et al. | Impact analysis of document digitization on event extraction | |
Wei et al. | DF-Miner: Domain-specific facet mining by leveraging the hyperlink structure of Wikipedia | |
JP2008021270A (ja) | データ変換装置および方法、データベース管理装置および方法、ならびにデータベース検索システムおよび方法 | |
JP6639038B2 (ja) | 知識処理装置およびプログラム | |
JP2008197952A (ja) | テキストセグメンテーション方法,その装置,そのプログラムおよびコンピュータ読み取り可能な記録媒体 | |
US20130238607A1 (en) | Seed set expansion | |
Vashisht et al. | Enhanced lexicon E-SLIDE framework for efficient sentiment analysis | |
JP2009199280A (ja) | 部分構文木プロファイルを用いた類似性検索システム | |
JP2008129662A (ja) | 情報抽出装置、情報抽出方法、情報抽出プログラム | |
Milić-Frayling | Text processing and information retrieval | |
Ray et al. | Reflecting Design Considerations: An End-to-End Case Study on Preparing Cricket Data Available on Net Analysis Ready. | |
JP7116940B2 (ja) | オープンデータを効率的に構造化し補正する方法及びプログラム | |
JP5696555B2 (ja) | プログラム及び情報処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180528 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20181026 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190322 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190416 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190613 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20191126 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20191223 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6639038 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |