JP2016212461A - Conception processing apparatus and program - Google Patents
Conception processing apparatus and program Download PDFInfo
- Publication number
- JP2016212461A JP2016212461A JP2015092331A JP2015092331A JP2016212461A JP 2016212461 A JP2016212461 A JP 2016212461A JP 2015092331 A JP2015092331 A JP 2015092331A JP 2015092331 A JP2015092331 A JP 2015092331A JP 2016212461 A JP2016212461 A JP 2016212461A
- Authority
- JP
- Japan
- Prior art keywords
- concept
- path
- weight
- concepts
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012545 processing Methods 0.000 title claims abstract description 89
- 238000004364 calculation method Methods 0.000 claims abstract description 118
- 201000010099 disease Diseases 0.000 description 100
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 100
- 238000000034 method Methods 0.000 description 66
- 206010020772 Hypertension Diseases 0.000 description 31
- 238000010586 diagram Methods 0.000 description 23
- 206010012601 diabetes mellitus Diseases 0.000 description 19
- 206010022000 influenza Diseases 0.000 description 18
- 230000006870 function Effects 0.000 description 9
- 206010037660 Pyrexia Diseases 0.000 description 7
- 230000007704 transition Effects 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 3
- 206010028980 Neoplasm Diseases 0.000 description 2
- 201000011510 cancer Diseases 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 208000015181 infectious disease Diseases 0.000 description 2
- 239000004615 ingredient Substances 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 208000035473 Communicable disease Diseases 0.000 description 1
- 206010020751 Hypersensitivity Diseases 0.000 description 1
- 206010061218 Inflammation Diseases 0.000 description 1
- 208000026935 allergic disease Diseases 0.000 description 1
- 230000007815 allergy Effects 0.000 description 1
- 238000010411 cooking Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000004054 inflammatory process Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本発明は、概念を処理するための概念処理装置およびプログラムに関する。本発明は、特に、概念間の関連度を求めるための概念処理装置およびプログラムに関する。 The present invention relates to a concept processing apparatus and program for processing a concept. In particular, the present invention relates to a concept processing apparatus and program for obtaining the degree of association between concepts.
情報検索処理や、自然言語を用いた知識処理などにおいて、概念間の関係を利用することにより、より高度な処理を行えるようにすることが期待されている。また、概念間の関係を、人手に依らずに効率よく収集できるようにすることが期待されている。 In information retrieval processing and knowledge processing using natural language, it is expected that more advanced processing can be performed by utilizing the relationship between concepts. In addition, it is expected that relationships between concepts can be collected efficiently without human intervention.
概念間の関係を表す情報としては、概念間の関係名や、概念間の関連の強さを表す数値などが考えられる。この中でも、概念間の関連の強さを、精度よく且つ効率よく収集することができれば、上で述べた情報検索処理や知識処理などの高度化への貢献を期待できる。 As information representing the relationship between concepts, a relationship name between concepts, a numerical value representing the strength of the relationship between concepts, and the like can be considered. Among these, if the strength of association between concepts can be collected accurately and efficiently, it can be expected to contribute to the advancement of information retrieval processing and knowledge processing described above.
非特許文献1には、係り受けの大規模な確率的クラスタリングの結果を用いて、大規模な類似語リストを生成する技術が述べられている。この技術は、大規模な言語資源の分析を前提としている。そして、この技術は、意味的に似た語は似た文脈で出現するという分布仮説に基づいて、ある語の周辺に出現する語や係り受け関係にある語で文脈を定義し、その語との共起頻度などを分析する。
Non-Patent
非特許文献2では、大量の文章を解析し、同一の文で共通して現れる頻度を求めることにより、単語間の関連度を計算したデータベースが公開されている旨が記載されている。共起スコアとしては、共起頻度、Dice係数、ディスカウンティング相互情報量の3種類が用いられている。
Non-Patent
非特許文献1による方法では、例えば「パエリヤ」と「あさり」という概念対のように、料理と材料の関係にある対に対して高い関連度を設定することができない。このため、非特許文献1の手法をそのまま、概念マップにおける関連度に適用しても、良い性能は得られない。
In the method according to Non-Patent
また、非特許文献2による方法は、例えば料理と材料のような概念対の関係には効果的であるが、例えば「サッカー」と「野球」という概念対のように、似たような使い方をされる対でありながら、同じ文脈で使われることの少ない単語対には、高い値を与えることができない。よって、やはり概念マップにおける関連度としてこの手法をそのまま適用することは難しい。
In addition, the method according to Non-Patent
また、非特許文献1による手法も、非特許文献2による手法も、大規模な言語資源を分析しなければならない。
In addition, both the method according to Non-Patent
本発明は、これらの課題認識に基づいて行なわれたものであり、概念マップに基づいて、概念間の関連の強さを表す指標(関連度)を求めることのできる、概念処理装置およびプログラムを提供しようとするものである。 The present invention has been made on the basis of recognition of these problems, and provides a concept processing device and program capable of obtaining an index (degree of association) representing the strength of association between concepts based on a concept map. It is something to be offered.
上記の課題を解決するため、本発明の一態様による概念処理装置は、概念間の関係の有無を表す概念マップデータを読み込み、ある概念と他の概念との間の関係を表すリンクの数が少ないほど当該概念について大きな値となるような前記概念の重みの値を算出する概念重み算出部と、前記概念マップデータにおいて、ある概念と他の概念との間を前記リンクで連結させてなるパスについて、当該パス上に含まれる概念についての前記概念の重みの値に応じた当該パスの重みの値を算出するパス重み算出部と、ある概念と他の概念との間を結ぶパスについての前記パスの重みの値に応じた、当該概念と当該他の概念との間の関連度を算出する関連度算出部と、を具備することを特徴とする。 In order to solve the above problems, a concept processing apparatus according to an aspect of the present invention reads concept map data representing the presence or absence of a relationship between concepts, and the number of links representing a relationship between a concept and another concept is A concept weight calculation unit that calculates a weight value of the concept that becomes a larger value for the concept, and a path formed by connecting a concept and another concept with the link in the concept map data. The path weight calculation unit for calculating the weight value of the path according to the weight value of the concept for the concept included in the path, and the path for connecting a concept and another concept A degree-of-association calculating unit that calculates the degree of association between the concept and the other concept according to a path weight value.
また、本発明の一態様は、上記の概念処理装置において、前記パス重み算出部は、前記パス上に含まれる各々の概念についての前記概念の重みの値の調和平均または相乗平均を取ることによって当該パスの重みの値を算出する、ことを特徴とする。 According to another aspect of the present invention, in the above concept processing device, the path weight calculation unit takes a harmonic average or a geometric average of the concept weight values for each concept included on the path. The path weight value is calculated.
また、本発明の一態様は、上記の概念処理装置において、前記概念重み算出部は、前記概念から前記他の概念との間の前記リンクの数の逆数の対数を計算することにより前記概念の重みの値を算出する、ことを特徴とする。 Further, according to one aspect of the present invention, in the concept processing device, the concept weight calculation unit calculates a logarithm of the inverse of the number of links between the concept and the other concept. The weight value is calculated.
また、本発明の一態様は、上記の概念処理装置において、前記関連度算出部は、前記ある概念と前記他の概念との間を前記リンクで連結させてなるパスが複数存在する場合に、それら複数のパスの数に、それら複数のパスの重みの値のうちの最大の前記パスの重みの値を乗じることによって、当該概念と当該他の概念との間の関連度を算出するか、またはそれら複数のパスの重みの総和を関連度として算出する、ことを特徴とする。 Further, according to one aspect of the present invention, in the above concept processing device, when the relevance calculation unit includes a plurality of paths in which the certain concept and the other concept are connected by the link, By multiplying the number of the plurality of paths by the value of the maximum weight of the plurality of path weights to calculate the degree of association between the concept and the other concept, Alternatively, the sum of the weights of the plurality of paths is calculated as the degree of association.
また、本発明の一態様は、上記の概念処理装置において、概念間の類似度を表す類似度データを取得する類似度取得部を具備し、前記パス重み算出部は、前記パスについて、当該パス上に含まれるリンクが結ぶ概念の対に関する類似度を前記類似度データから取得し、取得した前記類似度にも応じて前記パスの重みの値を算出する、ことを特徴とする。 According to another aspect of the present invention, the above concept processing device includes a similarity acquisition unit that acquires similarity data representing a similarity between concepts, and the path weight calculation unit includes the path for the path. The degree of similarity of the concept pair connected by the link included above is acquired from the similarity data, and the path weight value is calculated in accordance with the acquired degree of similarity.
また、本発明の一態様は、コンピューターを、上記のいずれかに記載の概念処理装置として機能させるためのプログラムである。 One embodiment of the present invention is a program for causing a computer to function as the conceptual processing device described above.
本発明によれば、概念マップに基づいて概念間の関連度を求めることができる。 According to the present invention, the degree of association between concepts can be obtained based on the concept map.
次に、本発明の実施形態について、図面を参照しながら説明する。
[第1実施形態]
図1は、第1実施形態による概念処理装置の概略機能構成を示すブロック図である。図示するように、概念処理装置1は、概念重み算出部12と、パス重み算出部14と、関連度算出部16と、パラメーター設定部18と、概念マップ記憶部20と、作業記憶部22と、関連度記憶部30と、を含んで構成される。これらの各部は、例えば電子回路(コンピューターを含む)を用いて実現される。また、概念マップ記憶部20と作業記憶部22と関連度記憶部30とは、情報を記憶するための手段として例えば磁気ハードディスク装置や半導体メモリー等を用いて実現される。
Next, embodiments of the present invention will be described with reference to the drawings.
[First Embodiment]
FIG. 1 is a block diagram showing a schematic functional configuration of the conceptual processing device according to the first embodiment. As illustrated, the
概念重み算出部12は、概念間の関係の有無を表す概念マップデータを概念マップ記憶部20から読み込み、ある概念と他の概念との間の関係を表すリンクの数が少ないほど当該概念について大きな値となるような前記概念の重みの値を算出する。
また、概念重み算出部12は、特に、前記概念から前記他の概念との間の前記リンクの数の逆数の対数を計算することにより前記概念の重みの値を算出する。
The concept
In addition, the concept
パス重み算出部14は、前記概念マップデータにおいて、ある概念と他の概念との間を前記リンクで連結させてなるパスについて、当該パス上に含まれる概念についての前記概念の重みの値に応じたパスの重みの値を算出する。
また、パス重み算出部14は、特に、前記パス上に含まれる各々の概念についての前記概念の重みの値の調和平均や相乗平均を取ることによって当該パスの重みの値を算出する。
また、パス重み算出部14は、特に具体的な手順として、計算対象の概念から開始して、前記概念マップデータを探索する探索処理を行いながら、前記計算対象の概念と、前記探索処理において到達する概念との間のパスについて前記パスの重みの値を算出し、当該パスについて算出された前記パスの重みの値が、前記計算対象の概念と当該到達した概念との間を連結させる他のパスについて既に算出していたパスの重みの値よりも大きい場合に、前記算出されたパスの重みの値を、前記計算対象の概念と当該到達した概念との間の最大重みのパスについての重みの値として記憶手段に書き込む。
In the concept map data, the path
In addition, the path
In addition, the path
関連度算出部16は、ある概念と他の概念との間を結ぶパスについての前記パスの重みの値に応じた、当該概念と当該他の概念との間の関連度を算出する。
また、関連度算出部16は、特に、前記ある概念と前記他の概念との間を前記リンクで連結させてなるパスが複数存在する場合に、それら複数のパスの数に、それら複数のパスの重みの値のうちの最大の前記パスの重みの値を乗じることによって、当該概念と当該他の概念との間の関連度を算出する。
The degree-of-
In addition, the
パラメーター設定部18は、作業記憶部22内に記憶されるパラメーターを設定する。具体的には、パラメーター設定部18は、後述するパラメーターMAX_Distanceの値を、適宜、設定する。
The
概念マップ記憶部20は、概念間の関係の有無を表す概念マップデータを記憶する。なお、概念マップデータの詳細については、後述する。
The concept
作業記憶部22(ワークメモリー。以下において単に「メモリー」と呼ぶ場合もある。)は、記憶手段であり、処理中の作業用の情報を記憶する領域を持っている。また、作業記憶部22は、処理用のパラメーターを記憶しておく領域を持っている。
The work storage unit 22 (work memory, which may be simply referred to as “memory” below) is a storage unit and has an area for storing information for work being processed. The
関連度記憶部30は、関連度算出部16によって算出された概念間の関連度を記憶する。関連度記憶部30が記憶している関連度のデータは、適宜、他の装置等から参照可能となっている。
The association
次に、概念マップ記憶部20が記憶する概念マップのデータについて説明する。概念マップは、ある概念と他の概念との間に関係があるか否かを表すデータである。概念マップを表す一つの形態は、ノードとリンクで構成されるグラフである。個々の概念は、このグラフにおけるノードに対応する。また、概念間の関係は、グラフにおけるリンクに対応する。ある概念と他の概念との間においては、関係が有るか無いかのいずれかである。概念間に関係がある場合には、それらの概念の間には、リンクが存在する。概念間に関係がない場合には、それらの概念の間には、リンクが存在しない。なお、概念と概念の間の有無を表す情報を含んでいれば、概念マップのデータの形態はここに説明したもの以外でも良い。なお、ここで使用する概念マップのデータとして、既に構築されている概念マップをそのまま用いても良いし、また新たに概念マップを構築しても良い。概念マップを構築する方法の一例は、膨大な量の言語資源に出現する概念を分析することである。ここで用いる言語資源は、たとえばインターネットを介して収集可能なウェブのテキストである。また、出現する概念の分析方法は、例えば、所定の構文における複数の概念の出現を分析したり、同一文脈において出現する複数の概念を分析したりすることである。また、ウェブサイトからダウンロードできるデータが、複数の概念間の関係を直接表している場合には、そこで得られる関係を直接用いるようにしても良い。例えば、Wikipedia(URL https://ja.wikipedia.org/)などといった事典サイトは、概念間の関係をダウンロード可能な携帯で提供している。概念マップの実例については、次に説明する。
Next, the concept map data stored in the concept
図2は、概念マップ記憶部20が保持する概念マップの例を示す概略図である。実際の概念マップは非常に大規模なデータであり、その概念マップに含まれる概念の数は、数十万、数百万、あるいはそれ以上である。しかし、同図では、説明を簡単にするために、7個の概念からなる概念マップを例示している。図示するように、概念マップは、無向グラフで表される。そして、グラフの各ノードが1つの概念に対応する。また、グラフの各リンクは、概念間に直接の関係があることを表している。図示している概念マップに含まれている概念は、「病気」、「高血圧」、「成人病」、「糖尿病」、「風邪」、「発熱」、「インフルエンザ」の7個である。また、図示している概念マップに含まれるリンクを、そのリンクが結ぶ概念の対で表すと、「病気−高血圧」、「病気−成人病」、「病気−糖尿病」、「高血圧−成人病」、「糖尿病−成人病」、「病気−風邪」、「病気−インフルエンザ」、「風邪−発熱」、「インフルエンザ−発熱」の9個である。
FIG. 2 is a schematic diagram illustrating an example of a concept map held by the concept
概念マップ記憶部20は、処理しやすいデータ形式で、概念マップの情報を保持する。概念マップ記憶部20は、一例としては、ノードの識別子とそのノードが表す概念とを対応付ける表データと、リンクの識別子とそのリンクが結ぶ2個のノードの識別子の対とを対応付ける表データとして、概念マップの情報を保持する。なお、この例に限らず、一般にグラフを表現するために用いられるデータ形式を適用するようにしても良い。
The concept
次に、概念処理装置1が計算する概念間の関連度について説明する。
本実施形態において、概念間の関連度は、概念マップにおけるそれらの概念間のつながり方に応じて算出される。概念処理装置1による処理において、概念は既に述べたようにグラフ上のノードに対応している。また、概念間はリンクで結ばれている場合と結ばれていない場合とがある。1本のリンクは、隣接する概念同士をつなぐものであり、且つそれら隣接する概念同士のみをつなぐものである。ある概念から他のある概念に、概念マップ上を辿って到達できるとき、それら概念は互いに連結の状態にある。概念間が連結の状態にあることの条件は、その一方の概念から他方の概念に、1本以上のリンクを辿って到達できることである。そのときに辿るルートを、ここではパスと呼ぶ。パスは、1本または複数本のリンクによって成る。リンクが複数本の場合、パスは、それらのリンクを直列に連結させてなるものである。ある概念と他の概念が連結の状態にあるとき、それら両概念をつなぐパスは1本とは限らない。複数の異なるパスを通って、辿りつくこともできる場合もある。なお、1本のパスは、同じ概念を2度以上通らない。つまり、パスが途中で閉路を形成したり、後戻りしたりすることはない。本実施形態では、概念の重みに基づいて、その概念を含むパスの重みが算出される。また、パスの重みに基づいて、概念間の関連度が算出される。概念間の関連度は、また、当該概念間をつなぐパスの本数によっても決まる。
Next, the degree of association between concepts calculated by the
In the present embodiment, the degree of association between concepts is calculated according to how the concepts are connected in the concept map. In the processing by the
まず、概念処理装置1は、概念マップに含まれる各概念の重みを計算する。概念の重みは、関連度を計算する上でのその概念の重要性を表す数値である。概念の重みは、その概念から他の概念につながるリンクの本数に応じて算出される。そのリンクの数が少ないほど、その概念の重みの値は大きい。これは、ある概念からつながるリンクの本数が少ないほうがその概念は貴重な概念であるという前提による。より具体的には、概念の重みは、その概念からつながる他の概念へのリンクの本数の逆数の対数によって算出される。ただし、概念の重みの値を正規化するためには、概念マップ上の全概念数を上記のリンク本数で除した数値の対数を、その概念の重みとする。対数の底は、適宜定めて良い。
First, the
次に、概念処理装置1は、パスの重みを計算する。前述の定義にしたがうと、パス上には、複数の概念が存在する。パスの両端もまたそれぞれ概念である。パスの重みは、そのパスが含む各々の概念の重みによって算出される。より具体的には、パスの重みは、そのパスが含む各々の概念の重みの何らかの平均によって算出される。ここで、何らかの平均とは、例えば、単純な相加平均や、調和平均や、相乗平均などである。より具体的には、概念処理装置1は、各々の概念の重みの調和平均の値を、そのパスの重みの値として算出する。これは、実際の概念マップを用いた実験により、調和平均を用いることで最も好適なパスの重みが算出できることがわかったことによる。
Next, the
次に、概念処理装置1は、パスの重みの値に基づき、概念間の関連度を算出する。本実施形態による概念間の関連度は、その概念間のパスの重みのうちの、最大の重みの値と、当該概念間に存在するパスの本数との積として算出される。
Next, the
なお、現実的な計算量で概念間の関連度を算出するための手順については、後で説明する。その手順においては、妥当な計算量で概念マップを探索するために、探索する距離(=1本のパスに含まれる直列なリンクの数)に上限を設ける。この上限の値はパラメーターとして設定することができる。なお、この手順を用いた場合の概念間の関連度は、有向的である。即ち、概念Aから概念Bへの関連度の値と、逆の概念Bから概念Aへの関連度の値とは、異なる場合がある。 A procedure for calculating the degree of association between concepts with a realistic calculation amount will be described later. In the procedure, in order to search the concept map with a reasonable amount of calculation, an upper limit is set on the search distance (= the number of serial links included in one path). This upper limit value can be set as a parameter. Note that the degree of association between concepts when using this procedure is directed. That is, the relevance value from concept A to concept B may be different from the relevance value from concept B to concept A.
整理すると、次の通りである。
このように概念処理装置1が算出する概念間の関連度は、当該概念間に存在するパスの本数に応じて求められる。つまり、パスの本数が多いほど、関連度の値は大きい。これは、様々なパスでつながっている概念同士は、互いに関連が高いという想定に整合する。
また、概念処理装置1が算出する概念間の関連度は、パスの重み(の最大値)に応じて求められる。つまり、パスの重みの最大値が大きいほど、関連度の値は大きい。これは、重要性の高いパスによってつながっている概念同士は、互いに関連が高いという想定に整合する。
また、概念処理装置1が算出するパスの重みは、そのパスが含む概念の重みに応じて求められる。概念の重みが大きいほど、パスの重みは大きい。パスの重みとして、概念の重みの調和平均を用いることが好ましいが、概念の重みの相乗平均を用いても良い。
The following is a summary.
Thus, the degree of association between concepts calculated by the
Further, the degree of association between concepts calculated by the
In addition, the path weight calculated by the
ここで、概念重み算出部12によって計算される概念の重みについて、説明する。
図3は、概念の重みを説明するための概略図であり、概念マップの一部分を示している。同図において、「A」、「C」、「D」、「E」というラベルが付けられた丸印は、それぞれ概念に相当するノードである。また、ノードから伸びる線は、ノード間のリンクであり、概念と概念との間の直接の関係を表している。同図では、概念マップの一部分のみを示しているが、実際の概念マップは同図に示す範囲外にも伸びている。
Here, the concept weight calculated by the
FIG. 3 is a schematic diagram for explaining the weight of the concept, and shows a part of the concept map. In the figure, circles labeled “A”, “C”, “D”, and “E” are nodes corresponding to concepts. A line extending from the node is a link between the nodes and represents a direct relationship between the concepts. In the figure, only a part of the concept map is shown, but the actual concept map extends beyond the range shown in the figure.
同図では、概念マップの一部分のみを示しているが、この概念マップ全体のノード数(概念数)をNとする。Nは正整数であり、例えば、N=10000である。概念の重みを説明するために、一例として、同図に示す「C」でラベル付けされたノードに着目する。このノード「C」からは、ノード「A」、「D」、「E」への直接のリンクがつながっている。なお、このノード「C」からは、これらノード「A」、「D」、「E」以外のノードへの直接のリンクはつながっていない。つまり、このノード「C」から直接つながる他のノードへのリンクの数は3である。 Although only a part of the concept map is shown in the figure, the number of nodes (concept number) of the entire concept map is N. N is a positive integer, for example, N = 10000. In order to explain the weight of the concept, as an example, attention is paid to a node labeled “C” shown in FIG. From this node “C”, direct links to nodes “A”, “D”, and “E” are connected. Note that a direct link from the node “C” to a node other than the nodes “A”, “D”, and “E” is not connected. That is, the number of links from the node “C” to other nodes directly connected is three.
本実施形態における概念の重みは、次の式によって計算される。
概念の重み=log(N/n)
ここで、Nは、上記の通り、概念マップ全体に含まれる全概念数である。また、nは、当該概念に直接つながる概念の数である。なお、対数の底は適宜定めればよいが、ここでは底を10とする。図示した例において、ノード「C」に直接つながる他のノードの数は3(n=3)であり、概念マップに含まれる全ノード数は10000(N=10000)である。よって、上の式により、ノード「C」に相当する概念の重みは、次のように計算される。
ノード「C」の概念の重み=log10(10000/3)=3.52
ただし、小数点第3位を四捨五入して丸めている。
The concept weight in this embodiment is calculated by the following equation.
Concept weight = log (N / n)
Here, N is the total number of concepts included in the entire concept map as described above. N is the number of concepts directly connected to the concept. The base of the logarithm may be determined as appropriate, but here the base is 10. In the illustrated example, the number of other nodes directly connected to the node “C” is 3 (n = 3), and the total number of nodes included in the concept map is 10,000 (N = 10000). Therefore, the weight of the concept corresponding to the node “C” is calculated as follows using the above formula.
Conceptual weight of node “C” = log 10 (10000/3) = 3.52
However, the third decimal place is rounded off.
図4は、概念の重みを保持するためのデータの構成を示す概略図である。このデータは、作業記憶部22の所定の領域内に設けられる。図示するデータは、表形式のデータであり、ノードID、概念(ノードに対応した概念)、つながる概念、重みの各項目を有している。この表の1行が、1つの概念、即ち1つのノードに対応する。ノードIDは、概念マップ内のノードをユニークに識別するIDである。図示する例では、ノードIDとして整数値を用いている。概念の項目には、その概念を表す言葉が格納される。つながる概念の項目には、当該概念から直接のリンクによって連結されている概念のノードIDのリストが格納される。重みの項目には、当該概念について計算された重みの値が格納される。
FIG. 4 is a schematic diagram showing a configuration of data for holding concept weights. This data is provided in a predetermined area of the
同図では、表全体のうちの一部の値を示している。そのノードIDは、98から102までの範囲である。また、それら各ノードの概念は、A,B,C,D,Eである。ここで概念C(ノードIDは100)に着目すると、その概念Cからつながる概念のノードIDは、98,101,102の3個である。つまり、概念Cは、概念AとDとEとに、直接のリンクでつながっている(図3に例示した通り)。また、概念Cの重みとして、3.52という値が格納されている。 In the figure, some values of the entire table are shown. The node ID ranges from 98 to 102. The concept of each node is A, B, C, D, E. When attention is paid to the concept C (node ID is 100), there are three concept node IDs connected to the concept C: 98, 101, and 102. That is, the concept C is connected to the concepts A, D, and E by a direct link (as illustrated in FIG. 3). Further, the value 3.52 is stored as the weight of the concept C.
ここで、パス重み算出部14によって計算されるパスの重みについて、説明する。
図5は、パスの重みを説明するための概略図であり、概念マップの一部分を示している。同図において、「1」、「2」、「3」、「4」、「5」というラベルが付けられた丸印は、それぞれ概念に相当するノードである。また、ノードから伸びる線は、ノード間のリンクであり、概念と概念との間の直接の関係を表している。同図では、概念マップの一部分のみを示しているが、実際の概念マップは同図に示す範囲外にも伸びている。
Here, the path weight calculated by the path
FIG. 5 is a schematic diagram for explaining path weights, and shows a part of the concept map. In the figure, the circles labeled “1”, “2”, “3”, “4”, “5” are nodes corresponding to concepts, respectively. A line extending from the node is a link between the nodes and represents a direct relationship between the concepts. In the figure, only a part of the concept map is shown, but the actual concept map extends beyond the range shown in the figure.
パスとは、ある概念からある概念までのルートである。例えば同図において、ノード「1」からノード「5」までのパスは、少なくとも2つある。その第1のパスは、ノードの列として「1−2−3−5」と表される。また第2のパスは、同様にノードの列として「1−2−4−5」と表される。このように、両端のノードを含んで、パス上のノードを列として並べることにより、パスを表すことができる。そして、本実施形態では、パスの重みを、そのパス上の各ノード(両端のノードを含む)の重みの調和平均として定義する。 A path is a route from one concept to another. For example, in the figure, there are at least two paths from the node “1” to the node “5”. The first path is represented as “1-2-3-5” as a column of nodes. Similarly, the second path is represented as “1-2-4-5” as a node column. In this way, a path can be represented by arranging nodes on the path as a column including nodes at both ends. In this embodiment, the path weight is defined as a harmonic average of the weights of each node (including nodes at both ends) on the path.
一般に、M個の数値w1,w2,・・・,wMの調和平均は、次の式で表される。即ち、M/(1/w1+1/w2+・・・+1/wM)である。 In general, the harmonic average of M numerical values w 1 , w 2 ,..., W M is expressed by the following equation. That is, M / (1 / w 1 + 1 / w 2 +... + 1 / w M ).
したがって、ノード「1」から「5」までの重み(つまり、概念の重み)が計算済であり、そのそれぞれをwn1,wn2,・・・,wnMとしたとき、上記の第1のパスの重みと、第2のパスの重みは、それぞれ、次の式で表される。
(第1のパスの重み)=4/(1/wn1+1/wn2+1/wn3+1/wn5)
(第2のパスの重み)=4/(1/wn1+1/wn2+1/wn4+1/wn5)
Therefore, when the weights from the nodes “1” to “5” (that is, the concept weights) have been calculated, and each of them is denoted by w n1 , w n2 ,..., W nM , The weight of the path and the weight of the second path are each expressed by the following equations.
(Weight of the first path) = 4 / (1 / w n1 + 1 / w n2 + 1 / w n3 + 1 / w n5 )
(Weight of the second path) = 4 / (1 / w n1 + 1 / w n2 + 1 / w n4 + 1 / w n5 )
図6は、作業記憶部22が保持するデータの構成の一部を示す概略図である。同図に示すデータは、主に、パス重み算出部14が概念マップ記憶部20を参照しながら概念マップを探索する際に、一時的に記憶すべき情報を格納するための手段である。同図に含まれる各データ項目の意味は、次の通りである。
FIG. 6 is a schematic diagram illustrating a part of the data configuration held by the
データ項目「計算対象の概念」は、概念マップの中でその時点で1個選ばれている概念であり、関連度を計算する対象となっている概念である。例えば、計算対象の概念が図2に示した概念マップにおける「病気」であるとき、概念処理装置1は、この概念「病気」から他の各概念への関連度を計算する。なお、計算対象の概念を、以下において便宜上、「概念A」と呼ぶことがある。
データ項目「起点概念の配列」は、計算対象の概念から所定の距離(変数Dによって保持される値の距離)のパスを探索するときに起点となる概念を要素として持つ配列である。
データ項目「辿った概念数」は、その時点での計算対象の概念からの距離を保持するデータであり、上記の変数Dに対応するものである。
The data item “concept of calculation target” is a concept selected at that time in the concept map, and is a concept for which the degree of association is calculated. For example, when the concept to be calculated is “disease” in the concept map shown in FIG. 2, the
The data item “starting point concept array” is an array having, as elements, a concept that becomes a starting point when searching for a path of a predetermined distance (a distance of a value held by the variable D) from the concept to be calculated.
The data item “number of concepts traced” is data that holds the distance from the concept to be calculated at that time, and corresponds to the variable D described above.
データ項目「起点の概念」は、その時点で起点として選択されている概念である。データ項目「起点の概念」には、上記の起点概念の配列の中から選択された1つの概念が格納される。なお、起点の概念を、以下において便宜上、「概念C」と呼ぶことがある。
データ項目「隣接概念の配列」は、上記の起点の概念に隣接する概念を要素として持つ配列である。ここで、概念が「隣接する」とは、ある概念と他の1つの概念とが、単一のリンクを隔ててつながっていることを意味する。例えば、図2で示した概念マップの例において、概念「病気」と概念「高血圧」とは互いに隣接する概念である。また、概念「発熱」と概念「風邪」とは互いに隣接する概念である。また、概念「糖尿病」と概念「風邪」とは、リンクによって直接つながっている関係にないため、これら両者は互いに隣接する概念ではない。なお、隣接概念(つまり、隣接概念の配列の一要素)を、以下において便宜上、「概念B」と呼ぶことがある。
The data item “concept of origin” is a concept selected as the origin at that time. In the data item “concept of starting point”, one concept selected from the array of starting point concepts is stored. The concept of the starting point may be referred to as “concept C” for convenience in the following.
The data item “arrangement of adjacent concepts” is an array having, as elements, concepts adjacent to the concept of the starting point. Here, the concept “adjacent” means that one concept and another concept are connected via a single link. For example, in the example of the concept map shown in FIG. 2, the concept “disease” and the concept “hypertension” are adjacent to each other. The concept “fever” and the concept “cold” are concepts adjacent to each other. Further, since the concept “diabetes” and the concept “cold” are not directly connected by a link, they are not adjacent to each other. Note that the adjacent concept (that is, one element of the array of adjacent concepts) may be referred to as “concept B” for convenience in the following.
なお、図6に示した各データ領域の使用例については、後で、処理実例として説明する。 A usage example of each data area shown in FIG. 6 will be described later as a processing example.
図7は、作業記憶部22が保持するデータの構成の一部を示す概略図である。同図に示すデータは、主に、パス重み算出部14が概念マップ記憶部20を参照しながら概念マップを探索する際に、各概念の関連度を算出するための数値等を記憶するものである。具体的には、パス重み算出部14は、後で説明する処理手順により、計算対象の概念(概念A)と各概念との間のパス(特に、複数のパスがある場合には、重みが最大となるパス)についての、情報を順次更新していく。なお、このデータは表形式のデータであり、この表の各行が、1つの概念に対応する。同図に含まれる各データ項目の意味は、次の通りである。
FIG. 7 is a schematic diagram illustrating a part of the data configuration held by the
データ項目「概念」は、その概念を表す言葉のデータを格納する。例えば、図2で示した概念マップの例において、「高血圧」や「成人病」などといった言葉であって、その概念をユニークに特定する情報を、このデータ項目は格納する。また、パス重み算出部14の処理手順に関連付けて言うと、このデータ項目によって表される概念は、前記の「概念B」に当たるものである。
The data item “concept” stores data of words representing the concept. For example, in the example of the concept map shown in FIG. 2, this data item stores information that uniquely identifies the concept, such as “hypertension” or “adult disease”. Further, in terms of the processing procedure of the path
データ項目「MAX_Weight」は、計算対象の概念(概念A)から当該概念(概念B)までのパスの重みのうちの、最大の重みの値を保持する。一般的に、概念Aと概念Bとの間が、所定の距離(MAX_Distance)内において連結されているとき、両概念相互間のパス(辿り得るルート)の数は1以上である。パス重み算出部14は、これらのパスのうち、既に計算されたパスの重みの中の最大の値によってデータ項目「MAX_Weight」を更新する。
データ項目「MAX_Path」は、上記の「MAX_Weight」に対応するパスの情報を格納する。つまり、データ項目「MAX_Path」は、概念Aと概念Bとの間のパスのうち、既に計算された重みが最大であるパスの情報を保持するためのものである。具体的には、データ項目「MAX_Path」は、そのパス上に含まれる概念(パスの両端の概念を含む)の列を、そのパスの情報として保持する。このような、パス上に含まれる概念の列の情報は、概念マップ上におけるパスをユニークに特定する。
The data item “MAX_Weight” holds the value of the maximum weight among the weights of the path from the concept to be calculated (concept A) to the concept (concept B). In general, when the concept A and the concept B are connected within a predetermined distance (MAX_Distance), the number of paths (routes that can be traced) between the two concepts is one or more. The path
The data item “MAX_Path” stores information on a path corresponding to the above “MAX_Weight”. That is, the data item “MAX_Path” is for holding information on the path having the maximum weight already calculated among the paths between the concept A and the concept B. Specifically, the data item “MAX_Path” holds a column of concepts (including concepts at both ends of the path) included in the path as information on the path. Such information on the concept column included in the path uniquely identifies the path on the concept map.
データ項目「NUM_Path」は、概念Aから概念Bまでのパスの数を格納するものである。なお、パス重み算出部14が概念マップを探索するとき、このNUM_Pathの値は、次のように計算される。つまり、D=n(ただし、0≦n<MAX_Distance−1)のときの、概念Aから概念Bまでのパスの数をNUM_PathD=n(A,B)とする。また、D=nのときの、概念Aから概念Cまでのパスの数をNUM_PathD=n(A,C)とする。ここで、NUM_PathD=n(A,B)には、概念Cを通るパスの数は含まれていない。そして、D=n+1において概念Cから概念Bへの直接のリンクによるパスを探索したとき(つまり、このD=n+1において概念Cを経由して概念Aから概念Bに至るパスが探索された)、次の式が成り立つ。
The data item “NUM_Path” stores the number of paths from concept A to concept B. Note that when the path
NUM_PathD=n+1(A,B)=(NUM_PathD=n(A,B))+(NUM_PathD=n(A,C)) NUM_Path D = n + 1 (A, B) = (NUM_Path D = n (A, B)) + (NUM_Path D = n (A, C))
次に、概念処理装置1による処理の手順について説明する。
図8および図9は、概念処理装置1による処理の手順を示すフローチャートである。これら両図は、フローチャートの結合子によって互いに結合されている。以下、このフローチャートに沿って、手順を説明する。
Next, a procedure of processing by the
FIG. 8 and FIG. 9 are flowcharts showing a procedure of processing by the
まずステップS10(図8)において、パラメーター設定部18は、最大距離(MAX_Distance)をパラメーターの値として付与する。具体的には、パラメーター設定部18は、MAX_Distanceの設定値を、作業記憶部22内の所定の領域に書き込む。付与されるMAX_Distanceの値は正整数である。このMAX_Distanceの値は、概念マップにおいて、概念から概念へとたどるときの最大距離を規定する。例えば、ある概念とある概念とが直接のリンクによって結ばれているとき、そのルートによる当該概念間の距離は1である。また、ある概念とある概念とが、途中に1個だけの中間概念を介してリンクによって間接的に結ばれているとき、そのルートによる当該概念間の距離は2である。つまり、ある概念とある概念とが1つまたは複数の中間概念を介してリンクによって間接的に結ばれているとき、そのルートをたどるときのリンク数が、当該概念間の距離である。
First, in step S10 (FIG. 8), the
次にステップS20において、概念重み算出部12は、概念マップに含まれる各概念について、その概念と直接のリンクによって結ばれている概念を列挙した、概念のリストを作成する。概念重み算出部12は、その概念のリストを、図4に示した表の中の、つながる概念の欄に書き込む。また、概念重み算出部12は、そのつながる概念のリストに基づいて、各概念の重みを計算する。計算方法は、既に述べたようにlog(N/n)の数式による。概念重み算出部12は、各概念について計算した値を、図4に示した表の中の重みの欄に書き込む。
Next, in step S20, the concept
次のステップS30から、S90およびS100までの処理は、パス重み算出部14が概念マップを辿りながら、パスの重みを算出し、更新していく処理である。
The processes from the next step S30 to S90 and S100 are processes in which the path
ステップS30において、パス重み算出部14は、計算対象となる概念(概念Aと呼ぶ)を起点概念の配列に格納する。つまり、計算対象となる概念が、起点概念の初期値である。また、パス重み算出部14は、辿る距離をカウントするための変数であるDの値を0に初期化する。この変数Dは、概念マップにおいて、概念から概念へとたどるときの、その時点でのパスの長さ(パスに含まれるリンク数)の値を記憶する。この変数Dのあたいと、上述したパラメーターであるMAX_Distanceの値との関係によって、概念処理装置1は、概念マップの探索の終了条件を判断する。
In step S30, the path
次にステップS40において、パス重み算出部14は、起点概念の配列からひとつ選んだ概念を、起点の概念(概念Cと呼ぶ)とする。パス重み算出部14は、メモリー内の起点の概念を格納する領域に、その選ばれた概念を書き込む。そして、パス重み算出部14は、その起点の概念(概念C)から直接のリンクでつながる先の概念のすべてを、隣接概念の配列に書き込む。このとき、パス重み算出部14は、概念マップ記憶部20を参照して概念Cにつながる概念を得ても良く、また既に作成した図4のデータを参照することによって概念Cにつながる概念を得ても良い。
In step S40, the path
次にステップS50において、パス重み算出部14は、隣接概念の配列の中の各概念(概念Bと呼ぶ)について、概念Aから概念Cを経由して概念Bまでのパスの重みを算出する。そして、そのパスについて計算された重みが、既に計算済の概念Aから概念Bまでのパスの重み(MAX_Weight(A,B)として計算済の重みの値)よりも大きい場合には、そのMAX_Weight(A,B)を更新するとともに、そのパスの情報をMAX_Path(A,B)の値として記録する。そのパスとは、MAX_Path(A,C)に既に記録されているパスを延長して概念Bまで伸ばしたものである。言い換えれば、そのパスとは、MAX_Path(A,C)に既に記録されているパスに概念Bを連結したものである。
なお、MAX_Weight(A,B)として計算済の値がまだなかった場合には、今回計算された値を、パスの重み値MAX_Weight(A,B)として記憶するようにする。また、その重みに対応するパスを、MAX_Path(A,B)として記憶するようにする。
Next, in step S50, the path
If there is no value already calculated as MAX_Weight (A, B), the value calculated this time is stored as the path weight value MAX_Weight (A, B). The path corresponding to the weight is stored as MAX_Path (A, B).
なお、上のステップS50の処理において、隣接概念の配列から取り出した概念(概念B)が、計算対象の概念(概念A)自身である場合には、パス重み算出部14は、そのパスの重みを計算したり、そのパスをMAX_Pathとして記録したりしない。
When the concept (concept B) extracted from the adjacent concept array is the calculation target concept (concept A) itself in the process of step S50 above, the path
次にステップS60において、上のステップS50で処理対象とした概念Bの各々について、概念Aから概念Bへのパス数を更新する。つまり、それまでのNUM_Path(A,B)の値にNUM_Path(A,C)の値を加え、その加算の結果を新たなNUM_Path(A,B)の値とする。これは、概念Aから概念Cを経由して概念Bに至るパスが新たに探索されたことに対応する。 Next, in step S60, the number of paths from concept A to concept B is updated for each concept B processed in step S50 above. That is, the value of NUM_Path (A, C) is added to the value of NUM_Path (A, B) so far, and the result of the addition is set as a new value of NUM_Path (A, B). This corresponds to a new search for a path from concept A to concept B via concept C.
次にステップS70において、パス重み算出部14は、起点概念の配列の中に未計算の概念が残っているか否かを判断する。起点概念の配列の中に未計算の概念が残っている場合(ステップS70:YES)には、パス重み算出部14は、次の起点概念についての計算を行うためにステップS40に戻る。起点概念の配列の中に未計算の概念が残っていない場合(ステップS70:NO)には、パス重み算出部14は、次のステップS80に進む。
Next, in step S70, the path
図9に移り、ステップS80において、パス重み算出部14は、距離をカウントするための変数であるDの値をインクリメントする。
Moving to FIG. 9, in step S80, the path
そして、ステップS90において、パス重み算出部14は、変数Dの値がパラメーター値MAX_Distanceに達したか否かを判断する。具体的には、D<MAX_Distanceの不等式を満たすか否かを判断する。D<MAX_Distanceであるとき、即ち、探索しているパスの距離がまだ設定された最大値MAX_Distanceに達していないとき(ステップS90:YES)は、ステップS100に移り、パス重み算出部14による処理を続ける。つまりこの場合、パス重み算出部14は、ステップS80でインクリメントされた新たなDの値についてパスを探索してパスの重みを算出する処理を続ける。一方、D<MAX_Distanceではないとき、即ち、探索しているパスの距離が設定された最大値MAX_Distanceに達したとき(ステップS90:NO)は、ステップS110の関連度算出部16による処理に移る。
In step S90, the path
そして、ステップS100に移った場合、同ステップにおいて、パス重み算出部14は、ステップS50とS60で処理した各概念(概念B)を、起点概念の配列(図6を参照)に書き込む。そして、次にステップS40(図8)に制御を戻し、処理を繰り返す。
When the process proceeds to step S100, the path
そして、ステップS110に移った場合、同ステップにおいて、関連度算出部16は、ここまでの処理で計算されたパスの重み、およびパスの数に基づいて、概念間の関連度を計算する。具体的には、関連度算出部16は、元の計算対象の概念(概念A)からパラメーターMAX_Distanceに設定された範囲内で辿り着くルートが2個以上ある概念(概念B)について、次に示す式による関連度を計算する。即ち;
(1)概念Aから概念Bへの関連度は、概念Aから概念BへのMAX_Weightの値に、概念Aから概念Bへのパスの数NUM_Pathの値を乗じたものとする。つまり、概念Aから概念Bへの関連度は、MAX_Weight(A,B)×NUM_Path(A,B)とする。
(2)ただし、上記(1)で算出される関連度を、次のように正規化する。つまり、正規化後の概念Aから概念Bへの関連度は、上記(1)の式で計算された概念Aから概念Bへの関連度を、概念Aから各概念への関連度の総和で除したものとする。つまり、この正規化後の関連度は、{MAX_Weight(A,B)×NUM_Path(A,B)}/(概念Aから概念マップ上の各概念への関連度の総和)である。このように正規化することにより、概念マップのサイズに依存しない値を算出することができる。
When the process proceeds to step S110, in the same step, the
(1) The degree of association from concept A to concept B is obtained by multiplying the value of MAX_Weight from concept A to concept B by the value of the number of paths NUM_Path from concept A to concept B. That is, the degree of association from concept A to concept B is MAX_Weight (A, B) × NUM_Path (A, B).
(2) However, the relevance calculated in the above (1) is normalized as follows. That is, the degree of association from concept A to concept B after normalization is the degree of association from concept A to concept B calculated by the equation (1) above, with the sum of the degrees of association from concept A to each concept. Shall be divided. That is, the degree of association after normalization is {MAX_Weight (A, B) × NUM_Path (A, B)} / (total sum of degrees of association from concept A to each concept on the concept map). By normalizing in this way, a value independent of the size of the concept map can be calculated.
なお、上記のステップS110の処理において元の計算対象の概念(概念A)からパラメーターMAX_Distanceに設定された範囲内で辿り着くルートが2個以上ある概念(概念B)に限定して関連度を計算した理由は、次の通りである。即ち、概念Aから概念Bへ辿り着くルートが1個しかないような概念Bは、概念Aとの関連度は充分に小さく、関連がないものと見なしてしまって差し支えないためである。 It should be noted that the degree of relevance is calculated by limiting to the concept (concept B) that has two or more routes that can be reached within the range set in the parameter MAX_Distance from the original calculation target concept (concept A) in the process of step S110 above. The reason for this is as follows. That is, the concept B that has only one route from the concept A to the concept B has a sufficiently small degree of association with the concept A and can be regarded as having no relation.
次に、ステップS120において、概念処理装置1は、計算対象の概念であって且つ未計算の概念があるか否かを判定する。未計算の概念がある場合(ステップS120:YES)には、次の計算対象の概念についての処理に移るために、ステップS30(図8)に戻る。未計算の概念がある場合(ステップS120:NO)には、このフローチャート全体の処理を終了する。
Next, in step S120, the
[処理の実例]
次に、処理の実例について説明する。なお、以下の説明の中で、図11,図12,図13,図14に言及する。これらの図面は、下で述べる処理実例の過程におけるメモリー(作業記憶部22)の状態を示す概略図である。図11は、図6で説明した記憶領域が保持する値の推移を示すものである。また、図12,図13,図14は、図7で説明した記憶領域が保持する値の推移を示すものである。
[Example of processing]
Next, an example of processing will be described. In the following description, reference is made to FIG. 11, FIG. 12, FIG. 13, and FIG. These drawings are schematic views showing the state of the memory (work storage unit 22) in the course of the processing examples described below. FIG. 11 shows transition of values held in the storage area described with reference to FIG. 12, 13, and 14 show transitions of values held in the storage area described with reference to FIG. 7.
本例の処理が対象とする概念マップは、図2に示したものである。同図に示す概念マップの例には、「病気」、「高血圧」、「糖尿病」、「成人病」、「風邪」、「インフルエンザ」、「発熱」という7つの概念が含まれる。これらの概念の各々は、概念マップのグラフにおけるノードに対応する。そして、ノード間を結ぶリンクが、概念間の関係に対応している。同図に例示するグラフには、病気−高血圧、病気−成人病、病気−糖尿病、病気−風邪、病気−インフルエンザ、成人病−高血圧、成人病−糖尿病、風邪−発熱、インフルエンザ−発熱というリンクが含まれている。 The concept map targeted by the processing of this example is the one shown in FIG. The example of the concept map shown in the figure includes seven concepts of “disease”, “hypertension”, “diabetes”, “adult disease”, “cold”, “influenza”, and “fever”. Each of these concepts corresponds to a node in the concept map graph. And the link which connects between nodes respond | corresponds to the relationship between concepts. In the graph illustrated in the figure, there are links of disease-high blood pressure, disease-adult disease, disease-diabetes, disease-cold, disease-flu, adult disease-hypertension, adult disease-diabetes, cold-fever, influenza-fever. include.
以下に処理手順にしたがって、処理例を説明する。なお、以下の処理例の説明において言及するステップ番号は、図8および図9のフローチャートで示した手順におけるステップ番号である。
ステップS10:まず、概念処理装置1のパラメーター設定部18は、パラメーターMAX_Distanceの値を、本処理例では、2に設定する。
A processing example will be described below according to the processing procedure. Note that the step numbers mentioned in the following description of the processing examples are the step numbers in the procedure shown in the flowcharts of FIGS.
Step S10: First, the
ステップS20:次に、概念重み算出部12は、概念マップに含まれる各概念について、直接つながっている概念を列挙したリストを作成するとともに、重みを計算する。
Step S20: Next, the concept
図10は、このステップS20で作成された、各概念に関する情報を保持するテーブルの実例を示す概略図である。図示するように、このテーブルは表形式の構造を有しており、その各行が概念マップに含まれる概念(ノード)に対応する。そして、各桁は、データ項目(属性)に対応しており、ノードID、概念(ノード)、つながる概念(ノード)、重みの各桁が存在する。 FIG. 10 is a schematic diagram illustrating an example of a table that holds information about each concept created in step S20. As shown in the figure, this table has a tabular structure, and each row corresponds to a concept (node) included in the concept map. Each digit corresponds to a data item (attribute), and there are each digit of node ID, concept (node), connected concept (node), and weight.
ノードIDは、各概念に対して便宜的に付与された識別情報である。図示する例では、1から7までの数値がノードIDとして付与されている。
概念(ノード)は、その概念を表す言葉である。本例では、「病気」、「成人病」などといった言葉がこの欄に格納されている。
つながる概念(ノード)は、当該概念から直接のリンクでつながっている先の概念(ノード)のリストである。例えば、ノード「病気」から直接のリンクでつながるノードは5個あり、それらは、「高血圧」、「成人病」、「糖尿病」、「風邪」、「インフルエンザ」である。概念「病気」についての、つながる概念の欄には、これら5個のリンク先の概念が列挙されたリストが格納されている。
重みは、当該概念(ノード)についての重みの値を格納する。この概念マップに現れる全概念数が7であるため、例えば、概念「病気」(直接つながる先の概念数が5)についての重みは、前述の定義log(N/n)により、log(7/5)、つまり0.15(小数点第3位を四捨五入して丸めている)である。また例えば、概念「高血圧」(直接つながる先の概念数が5)についての重みは、同様に、log(7/2)、つまり0.54である。他の概念についての重みも同様である。
The node ID is identification information given for convenience to each concept. In the illustrated example, numerical values from 1 to 7 are assigned as node IDs.
A concept (node) is a word representing the concept. In this example, words such as “disease” and “adult disease” are stored in this column.
The connected concept (node) is a list of previous concepts (nodes) connected by a direct link from the concept. For example, there are five nodes connected by a direct link from the node “disease”, which are “high blood pressure”, “adult disease”, “diabetes”, “cold”, “influenza”. In the connected concept column for the concept “disease”, a list in which these five linked concepts are listed is stored.
The weight stores the value of the weight for the concept (node). Since the total number of concepts appearing in this concept map is 7, for example, the weight for the concept “disease” (the number of concepts directly connected to is 5) is log (7 / 5), that is, 0.15 (rounded off to the third decimal place). Also, for example, the weight for the concept “high blood pressure” (the number of concepts directly connected is 5) is similarly log (7/2), that is, 0.54. The same applies to the weights for other concepts.
[D=0,起点の概念が「病気」]
ステップS30:次に、パス重み算出部14は、計算対象の概念を1個選び、その概念を、メモリー内の、計算対象の概念の領域に格納する。また、概念処理装置1は、起点からの距離として、辿った概念数の値を初期化する。即ち、メモリー内の辿った概念数の領域に、D=0という値を書き込む。また、概念処理装置1は、ここで選択された計算対象の概念のみを、メモリー内の起点概念の配列の要素として格納する。
ステップS40:次に、パス重み算出部14は、メモリー内の起点概念の配列からひとつ選んだ概念を、起点の概念とする。そして、概念処理装置1は、その選ばれた概念をメモリー内の起点の概念の領域に書き込む。現在、起点概念の配列に書き込まれている要素は「病気」のみであるため、概念処理装置1は、メモリー内の起点の概念の領域に「病気」を書き込む。さらに、概念処理装置1は、その起点の概念から直接つながる概念をすべて、隣接概念の配列に書き込む。具体的には、「病気」から直接つながる概念は、「高血圧」、「成人病」、「糖尿病」、「風邪」、「インフルエンザ」の5個であるので、概念処理装置1は、これら5個の概念を隣接概念の配列の領域に書き込む。
上記のステップS30およびS40の処理を終えた時点でのメモリー内の状態は、図11のaの行に示すとおりである。
[D = 0, concept of starting point is “disease”]
Step S30: Next, the path
Step S40: Next, the path
The state in the memory at the time when the processes of steps S30 and S40 are completed is as shown in the row a of FIG.
次に、パス重み算出部14は、隣接概念の配列に格納されている各概念について、下の通り、ステップS50とステップS60の処理を、順次行う。つまり、概念処理装置1は、図11の起点概念の配列に格納されている概念の各々を起点の概念として、計算対象の概念(現状況では、「病気」)と、隣接概念の配列に格納されている要素である概念との間の関連度を計算する。関連度は、現在辿っているパス上の各概念(パスの両端の概念を含む)の重みの調和平均として算出される。また、ここで計算した関連度が、既に計算されている関連度よりも大きい場合には作業記憶部22に記憶されている情報(図7に示したテーブル)を更新するが、現状況では関連度を計算する初回であるため、各概念についてパスの重み(各概念についてのMAX_Weight)を更新する。また、このパスの重みを更新する際には、あわせて、その関連度が算出されたときのパスを記録する(各概念についてのMAX_Pathを更新)。
Next, the path
(1)隣接概念の配列から、まず、概念Bとして「高血圧」を取り出す。
ステップS50:計算対象の概念「病気」と、隣接概念の配列に格納されている要素である概念(概念B)「高血圧」との間の関連度は、「病気」の重みである0.15(図10を参照。以下においても同様。)と、「高血圧」の重みである0.54との調和平均として求められる。そして、その値は0.23(小数点第3位を四捨五入して丸めている。以下においても同様。)である。また、この関連度に対応するパスは、病気−高血圧というパスである。つまり、概念「高血圧」に関しては、MAX_Weight=0.23であり、MAX_Path=「病気,高血圧」である。
ステップS60:ここで、パス数(NUM_Path)を更新する。D=0の場合のみ特殊であり、ここでは、NUM_Path(A,C)=NUM_Path(病気,病気)=1として計算する。つまり、概念「高血圧」に関して、NUM_Pathの値は1に更新される。
(1) First, “hypertension” is extracted as concept B from the array of adjacent concepts.
Step S50: The degree of association between the concept “disease” to be calculated and the concept (concept B) “hypertension” which is an element stored in the array of adjacent concepts is 0.15 which is the weight of “disease”. (Refer to FIG. 10, and the same applies to the following) and the harmonic average of 0.54 which is the weight of “high blood pressure”. The value is 0.23 (rounded off to the third decimal place. The same applies hereinafter). Further, the path corresponding to this degree of association is a path of disease-hypertension. That is, regarding the concept “high blood pressure”, MAX_Weight = 0.23 and MAX_Path = “disease, high blood pressure”.
Step S60: Here, the number of paths (NUM_Path) is updated. It is special only when D = 0, and here, NUM_Path (A, C) = NUM_Path (disease, illness) = 1 is calculated. That is, for the concept “hypertension”, the value of NUM_Path is updated to 1.
(2)隣接概念の配列から、次に概念Bとして「成人病」を取り出す。
ステップS50:計算対象の概念「病気」と、隣接概念の配列から選んだ概念Bである「成人病」との間の関連度は、「病気」の重みである0.15と、「成人病」の重みである0.37との調和平均として求められる。そして、その値は0.21である。また、この関連度に対応するパスは、病気−成人病というパスである。つまり、概念「成人病」に関しては、MAX_Weight=0.21であり、MAX_Path=「病気,成人病」である。
ステップS60:上記の「高血圧」の場合と同様に、D=0の場合のみ特殊であり、NUM_Path(A,C)=NUM_Path(病気,病気)=1として計算する。つまり、「成人病」についても、NUM_Pathの値は1に更新される。
(2) Next, “adult disease” is extracted as concept B from the sequence of adjacent concepts.
Step S50: The degree of association between the calculation target concept “disease” and “adult disease”, which is concept B selected from the array of adjacent concepts, is 0.15 which is the weight of “disease”, and “adult disease” As a harmonic average of 0.37, which is a weight of "." The value is 0.21. The path corresponding to this degree of association is a path of disease-adult disease. That is, regarding the concept “adult disease”, MAX_Weight = 0.21 and MAX_Path = “disease, adult disease”.
Step S60: As in the case of “hypertension”, only D = 0 is special, and NUM_Path (A, C) = NUM_Path (disease, illness) = 1 is calculated. That is, the value of NUM_Path is also updated to 1 for “adult disease”.
(3)隣接概念の配列から、次に概念Bとして「糖尿病」を取り出す。
ステップS50:計算対象の概念「病気」と、隣接概念の配列から選んだ概念Bである「糖尿病」との間の関連度は、「病気」の重みである0.15と、「糖尿病」の重みである0.54との調和平均として求められる。そして、その値は0.23である。また、この関連度に対応するパスは、病気−糖尿病というパスである。つまり、概念「糖尿病」に関しては、MAX_Weight=0.23であり、MAX_Path=「病気,糖尿病」である。
ステップS60:上記の「高血圧」の場合と同様に、D=0の場合のみ特殊であり、NUM_Path(A,C)=NUM_Path(病気,病気)=1として計算する。つまり、「糖尿病」についても、NUM_Pathの値は1に更新される。
(3) Next, “diabetes” is extracted as concept B from the array of adjacent concepts.
Step S50: The degree of association between the concept “disease” to be calculated and “diabetes”, which is the concept B selected from the array of adjacent concepts, is 0.15 which is the weight of “disease”, and “diabetes”. It is obtained as a harmonic average with a weight of 0.54. The value is 0.23. The path corresponding to the degree of association is a path of disease-diabetes. That is, for the concept “diabetes”, MAX_Weight = 0.23 and MAX_Path = “disease, diabetes”.
Step S60: As in the case of “hypertension”, only D = 0 is special, and NUM_Path (A, C) = NUM_Path (disease, illness) = 1 is calculated. That is, for “diabetes”, the value of NUM_Path is updated to 1.
(4)隣接概念の配列から、次に概念Bとして「風邪」を取り出す。
ステップS50:計算対象の概念「病気」と、隣接概念の配列から選んだ概念Bである「風邪」との間の関連度は、「病気」の重みである0.15と、「風邪」の重みである0.54との調和平均として求められる。そして、その値は0.23である。また、この関連度に対応するパスは、病気−風邪というパスである。つまり、「風邪」に関しては、MAX_Weight=0.23であり、MAX_Path=「病気,風邪」である。
ステップS60:上記の「高血圧」の場合と同様に、D=0の場合のみ特殊であり、NUM_Path(A,C)=NUM_Path(病気,病気)=1として計算する。つまり、「風邪」についても、NUM_Pathの値は1に更新される。
(4) Next, “cold” is extracted as concept B from the array of adjacent concepts.
Step S50: The degree of association between the concept “disease” to be calculated and “cold”, which is the concept B selected from the array of adjacent concepts, is 0.15 which is the weight of “disease” and “cold” It is obtained as a harmonic average with a weight of 0.54. The value is 0.23. Further, the path corresponding to this degree of association is a path of disease-cold. That is, regarding “cold”, MAX_Weight = 0.23 and MAX_Path = “disease, cold”.
Step S60: As in the case of “hypertension”, only D = 0 is special, and NUM_Path (A, C) = NUM_Path (disease, illness) = 1 is calculated. That is, the value of NUM_Path is also updated to 1 for “cold”.
(5)隣接概念の配列から、次に概念Bとして「インフルエンザ」を取り出す。
ステップS50:計算対象の概念「病気」と、隣接概念の配列から選んだ概念Bである「インフルエンザ」との間の関連度は、「病気」の重みである0.15と、「インフルエンザ」の重みである0.54との調和平均として求められる。そして、その値は0.23である。また、この関連度に対応するパスは、病気−インフルエンザというパスである。つまり、「インフルエンザ」に関しては、MAX_Weight=0.23であり、MAX_Path=「病気,インフルエンザ」である。
ステップS60:上記の「高血圧」の場合と同様に、D=0の場合のみ特殊であり、NUM_Path(A,C)=NUM_Path(病気,病気)=1として計算する。つまり、「インフルエンザ」についても、NUM_Pathの値は1に更新される。
(5) Next, “influenza” is extracted as concept B from the array of adjacent concepts.
Step S50: The degree of association between the calculation target concept “disease” and “influenza” that is the concept B selected from the array of adjacent concepts is 0.15 which is the weight of “disease”, and “influenza” It is obtained as a harmonic average with a weight of 0.54. The value is 0.23. A path corresponding to this degree of association is a path of disease-influenza. That is, regarding “influenza”, MAX_Weight = 0.23 and MAX_Path = “disease, influenza”.
Step S60: As in the case of “hypertension”, only D = 0 is special, and NUM_Path (A, C) = NUM_Path (disease, illness) = 1 is calculated. That is, the value of NUM_Path is also updated to 1 for “influenza”.
以上、D=0の段階として、計算対象の概念である「病気」と、辿っている概念(隣接概念の配列に格納されている要素であった各概念)との間の関連度が計算された。
図12は、この段階での各概念についての計算結果を格納するテーブル(図7に示したテーブル)の状態を示す概略図である。図示するように、1行目の「高血圧」、2行目の「成人病」、3行目の「糖尿病」、4行目の「風邪」、5行目の「インフルエンザ」のそれぞれについて、MAX_Weightと、MAX_Pathと、NUM_Pathの値が格納されている。
As described above, as D = 0, the degree of association between the “disease” that is the concept to be calculated and the concept being traced (each concept that was an element stored in the array of adjacent concepts) is calculated. It was.
FIG. 12 is a schematic diagram showing the state of a table (the table shown in FIG. 7) that stores calculation results for each concept at this stage. As shown in the figure, MAX_Weight for “high blood pressure” in the first row, “adult disease” in the second row, “diabetes” in the third row, “cold” in the fourth row, “flu” in the fifth row And MAX_Path and NUM_Path values are stored.
ステップS80:次に、Dがインクリメントされ、D=1となる。
ステップS90:MAX_Distance=2と設定されているため、D<MAX_Distanceの条件を満たす。よって、ステップS100に進む。
Step S80: Next, D is incremented and D = 1.
Step S90: Since MAX_Distance = 2 is set, the condition of D <MAX_Distance is satisfied. Therefore, the process proceeds to step S100.
ステップS100:パス重み算出部14は、ステップS50,S60,S70のループを繰り返した際に計算した各概念を起点概念の配列に格納する。つまり、図11のbに示すように、起点概念の配列に、「高血圧」、「成人病」、「糖尿病」、「風邪」、「インフルエンザ」の各要素を格納する。次に、ステップS40の処理に戻る。
Step S100: The path
ステップS40:パス重み算出部14は、起点概念の配列から、まず概念「高血圧」を選び、この「高血圧」を起点の概念(概念C)とする。そして、この概念Cからつながる先の概念(概念Cに隣接する概念)をすべて隣接概念の配列に格納する。具体的には、隣接概念の配列に、「成人病」、「病気」の各要素を格納する。このときが、図11のbに示す状態である。
Step S40: The path
隣接概念の配列内の「成人病」について、ステップS50,S60の処理を行う。
ステップS50:パス重み算出部14は、辿って来た「病気−高血圧−成人病」というパスについて重みを計算する。それは0.15(概念「病気」の重み)と0.54(概念「高血圧」の重み)と0.37(概念「成人病」の重み)の調和平均であり、その値は0.27である。
この0.27という値は、これまでに計算した「病気」から「成人病」までの重みである0.21(図12の第2行目を参照)よりも大きい(重い)ので、MAX_Weight(A,B)を更新する。また、合わせて、MAX_Pathを、この0.27という新たな重みに対応するパスで更新する。つまり、MAX_Weight=0.27とし、MAX_Path=「病気,高血圧,成人病」とする。
図13は、このときのテーブル(図7に示したテーブル)の状態を示す概略図である。図示するように、概念「成人病」について、MAX_WeightとMAX_Pathが更新されている。
Steps S50 and S60 are performed for “adult disease” in the adjacent concept array.
Step S50: The path
Since this value of 0.27 is larger (heavy) than 0.21 (refer to the second row in FIG. 12), which is a weight from “illness” to “adult disease” calculated so far, MAX_Weight ( A, B) are updated. In addition, MAX_Path is updated with a path corresponding to this new weight of 0.27. That is, MAX_Weight = 0.27 and MAX_Path = “disease, hypertension, adult disease”.
FIG. 13 is a schematic diagram showing the state of the table (the table shown in FIG. 7) at this time. As shown in the figure, MAX_Weight and MAX_Path are updated for the concept “adult disease”.
ステップS60:パス重み算出部14は、NUM_Pathの値(パス数)を更新し、NUM_Path=2とする。つまり、D=1におけるNUM_Path(病気→成人病)は、D=0におけるNUM_Path(病気→成人病)の値と、D=0におけるNUM_Path(病気→高血圧)の値とを足し算したものである。つまり、D=0におけるNUM_Path(A,B)に、D=0におけるNUM_Path(A,C)を加えている。
図14は、このときのテーブル(図7に示したテーブル)の状態を示す概略図である。図示するように、概念「成人病」について、NUM_Pathも更新されている。
Step S60: The path
FIG. 14 is a schematic diagram showing the state of the table (the table shown in FIG. 7) at this time. As shown in the figure, NUM_Path is also updated for the concept “adult disease”.
なお、概念「病気」は、計算対象の概念そのものであるので、「病気−高血圧−病気」というパスについては計算を行わない。 Since the concept “disease” is the concept of the calculation target itself, the calculation is not performed for the path “disease-hypertension-disease”.
以下、詳細な説明を省略するが、起点概念の配列に格納されている概念であって、重みの計算が未だ完了していない概念について、ステップS50,S60の計算手順を繰り返す。つまり、「成人病」、「糖尿病」、「風邪」、「インフルエンザ」の各概念について、ステップS50,S60の計算手順を繰り返す。この過程で、概念「病気」から上記各概念への、D=1の時点でのMAX_PathおよびNUM_Pathを求める。 Hereinafter, although detailed description is omitted, the calculation procedure of steps S50 and S60 is repeated for the concept stored in the starting concept array and the weight calculation is not yet completed. That is, the calculation procedure of steps S50 and S60 is repeated for each concept of “adult disease”, “diabetes”, “cold”, and “flu”. In this process, MAX_Path and NUM_Path at the time of D = 1 from the concept “disease” to each of the above concepts are obtained.
ステップS80:次に、Dがインクリメントされ、D=2となる。
ステップS90:MAX_Distance=2と設定されているため、D<MAX_Distanceの条件を満たさない。よって、ステップS110に進む。
Step S80: Next, D is incremented and D = 2.
Step S90: Since MAX_Distance = 2 is set, the condition of D <MAX_Distance is not satisfied. Therefore, the process proceeds to step S110.
ステップS110:関連度算出部16は、概念「病気」から各概念までの関連度を、MAX_Weight×NUM_Pathにより計算し、またその値を正規化する。但し、この計算をするのは、概念「病気」から辿り着くルートが2個以上ある概念に限る。
そして、概念処理装置1は、上記の乗算MAX_Weight×NUM_Pathによって計算された、概念「病気」と各概念との間の関連度(正規化済)を出力する。
これで、計算対象の概念「病気」についての処理を終えた。
なお、関連度算出部16は、算出した関連度の情報を、関連度記憶部30に書き込む。
Step S110: The
Then, the
This completes the processing of the concept “disease” to be calculated.
The
ステップS120:未計算の計算対象の概念(つまり、上記の「病気」以外の計算対象の概念)があるかどうかを判定する。ある場合には、ステップS30に移って処理を続ける。ない場合には、図8および図9示したフローチャート全体の処理を終了する。 Step S120: It is determined whether there is an uncalculated calculation target concept (that is, a calculation target concept other than the above-mentioned “disease”). If there is, the process moves to step S30 and continues. If not, the processing of the entire flowchart shown in FIGS. 8 and 9 is terminated.
なお、以上述べた方法によって算出される関連度は、有向なものである。言い換えれば、算出される関連度の値は概念から概念への向きに依存する。例えば、概念「病気」から概念「風邪」への関連度の値と、概念「風邪」から概念「病気」への関連度の値とは、異なる。 The relevance calculated by the method described above is directed. In other words, the calculated relevance value depends on the direction from concept to concept. For example, the value of the degree of association from the concept “disease” to the concept “cold” is different from the value of the degree of association from the concept “cold” to the concept “disease”.
以上、説明したように、第1実施形態の概念処理装置1によれば、概念マップのデータから、ある概念から他の概念への関連度を算出することができる。このとき、実際の文章例からなる言語資源等のデータを必要とせず、概念処理装置は、概念マップのデータのみから、上記の関連度を算出することができる。
また、第1実施形態の概念処理装置1によれば、現実的に妥当な限られた計算量で、上記の関連度を算出することができる。その要因の一つは、概念マップを探索する際の距離の上限(MAX_Distance)を設けていることである。
また、第1実施形態の概念処理装置1が算出する概念間の関連度は、現実の概念マップに適用したときに良好な値として計算される。これは、算出のための処理手順や計算方法を特に工夫したことによる。
As described above, according to the
Moreover, according to the
Further, the degree of association between concepts calculated by the
また、第1実施形態として記載した技術によると、広い概念(例えば、概念「日本のスポーツ」など)については、隣接する概念数が多いため、概念の重みが小さくなる。よって、このような広い概念が関わる関連度の値は小さくなる。また、狭すぎる概念(例えば、特定の放送局による特定の番組を表す「NHKサンデースポーツ」など)については、そのような概念が含まれるパスの総数が少なくなるため、そういう概念が関わる関連度の値は、やはり小さくなる。つまり、両極端な概念については、関連度を低くする作用を有する。つまり、ノイズに関しては低い関連度を算出することができる。つまり、概念におけるノイズの影響を軽減しながら、情報検索等の処理を行うことができるようになる。 Further, according to the technique described as the first embodiment, for a wide concept (for example, the concept “Japanese sports”, etc.), the number of concepts that are adjacent to each other is large, so the concept weight is reduced. Therefore, the relevance value related to such a broad concept becomes small. In addition, for concepts that are too narrow (for example, “NHK Sunday Sports” representing a specific program by a specific broadcasting station), the total number of paths that include such a concept is reduced. The value is still small. In other words, the two extreme concepts have the effect of reducing the degree of association. That is, a low relevance level can be calculated for noise. That is, processing such as information retrieval can be performed while reducing the influence of noise in the concept.
[第2実施形態]
次に、本発明の第2実施形態について説明する。なお、前述の実施形態と共通する事項については説明を省略する場合があり、本実施形態特有の事項を中心に説明する。
図15は、本実施形態による概念処理装置の概略機能構成を示すブロック図である。図示するように、概念処理装置2は、概念重み算出部112と、パス重み算出部114と、関連度算出部116と、パラメーター設定部18と、概念マップ記憶部20と、作業記憶部22と、関連度記憶部30と、類似度取得部140と、を含んで構成される。
本実施形態の特徴は、類似度取得部140を備えている点と、重みの計算方法および関連度の計算方法が第1実施形態と異なる点である。
[Second Embodiment]
Next, a second embodiment of the present invention will be described. Note that description of matters common to the above-described embodiment may be omitted, and description will be made focusing on matters specific to the present embodiment.
FIG. 15 is a block diagram showing a schematic functional configuration of the conceptual processing apparatus according to the present embodiment. As illustrated, the
The feature of the present embodiment is that the
本実施形態による概念処理装置2では、類似度取得部140が、外部から概念間の類似度を表す類似度データを取得する。そして、パス重み算出部114は、類似度取得部140が取得した類似度データを参照することによって概念間の類似度を用いながら、パスの重みを算出する。つまり、パス重み算出部114は、概念マップ記憶部20に記憶された概念マップを辿るパスの重みを求める際に、外部から与えられた類似度の値を、初期値として利用する。つまり、パス重み算出部114は、前記パスについて、当該パス上に含まれるリンクが結ぶ概念の対に関する類似度を前記類似度データから取得し、取得した前記類似度にも応じて前記パスの重みの値を算出する。
In the
図16は、類似度取得部140が取得する類似度データの構成を示す概略図である。図示するように類似度データは表形式のデータであり、項目として、概念1、概念2、類似度を有している。概念1と概念2は、それぞれ、概念マップ内に含まれる概念に対応する。そして、データ項目「類似度」は、概念1と概念2との間の類似度の値を保持する。なお、類似度データが情報として概念間の類似度の値を含むものであれば、データの形式等については図示したデータと異なるものであっても良い。
FIG. 16 is a schematic diagram illustrating a configuration of similarity data acquired by the
類似度の値は、外部から供給されるものであり、各種手法を用いることによって概念間の類似度を与えることができる。概念間の類似度の一例は、文脈類似度である。文脈類似度を求める方法自体は、既存技術である。文脈類似度を求めるためには、大量の文章からなる言語資源を取得し、言語資源に含まれる各文の構文解析を行い、語が出現する文脈についての統計的な分析を行う。ここで、語は、概念に対応する。また、ここで言う文脈とは、言語資源に含まれる文章において、ある概念(語)が出現するときのその概念の周りの概念(語)の統計的な特徴や、ある概念(語)が出現するときの構文における位置付け等である。周りの概念(語)の統計的な特徴は、一例として、周りの概念(語)に基づく単語ベクトルで表される。この単語ベクトルは、各要素が語に対応する多次元(例えば、数万ないしは数十万次元)のベクトルであり、各要素はその語がその文脈において出現しているか否かを表す。そして、似たような文脈において出現しやすい傾向にある概念(語)同士は、その傾向が強いほど文脈類似度が高い。これは、ある概念(語)はその周囲の概念や構文等の文脈によって特徴づけられる、という前提に基づく。 The similarity value is supplied from the outside, and the similarity between concepts can be given by using various methods. An example of similarity between concepts is context similarity. The method for obtaining the context similarity is an existing technology. In order to obtain the context similarity, a language resource consisting of a large amount of sentences is acquired, a syntax analysis of each sentence included in the language resource is performed, and a statistical analysis is performed on the context in which the word appears. Here, a word corresponds to a concept. In addition, the context here refers to the statistical characteristics of concepts (words) around a concept (word) when a concept (word) appears in a sentence included in a language resource, or the appearance of a concept (word). Such as positioning in the syntax. A statistical feature of surrounding concepts (words) is represented by a word vector based on the surrounding concepts (words) as an example. This word vector is a multi-dimensional vector (for example, tens of thousands or hundreds of thousands of dimensions) in which each element corresponds to a word, and each element represents whether or not the word appears in the context. The concepts (words) that tend to appear in similar contexts have higher context similarities as the tendency is stronger. This is based on the premise that a certain concept (word) is characterized by the surrounding concept or syntax.
本実施形態による重みの求め方は、次の通りである。
概念重み算出部112は、次の式により、概念の重みを算出する。
(概念の重み)=log(N/n)
ここで、nは当該概念から他の概念に直接つながるリンク数である。また、Nは概念マップ内に含まれる全概念数である。
The method for obtaining the weight according to the present embodiment is as follows.
The
(Concept weight) = log (N / n)
Here, n is the number of links directly connected from the concept to another concept. N is the total number of concepts included in the concept map.
そして、パス重み算出部114は、次の式(A1),(A2),(A3)のいずれかにより、隣接する概念AおよびBの間のパスの重みを算出する。
式(A1): (隣接する概念間のパスの重み)=sim(A,B)×(概念Aの重み+概念Bの重み)
式(A2): (隣接する概念間のパスの重み)=sim(A,B)×(概念Aの重み×概念Bの重み)
式(A3): (隣接する概念間のパスの重み)=sim(A,B)×min(概念Aの重み,概念Bの重み)
なお、パス重み算出部114は、上の式(A1),(A2),(A3)のいずれかを用いるが、これらいずれかのうち選択された式を一貫して用いる。つまり、概念間の関連度を算出するときに、途中で概念間のパスの重みの計算式を変更することはない。
Then, the path
Formula (A1): (weight of path between adjacent concepts) = sim (A, B) × (weight of concept A + weight of concept B)
Formula (A2): (weight of path between adjacent concepts) = sim (A, B) × (weight of concept A × weight of concept B)
Expression (A3): (weight of path between adjacent concepts) = sim (A, B) × min (weight of concept A, weight of concept B)
Note that the path
ここで、sim(A,B)は、概念Aと概念Bの間の類似度であり、前記の類似度取得部140が取得した類似度データで、その値を参照することができる。
また、min(概念Aの重み,概念Bの重み)は、引数の中の最小値を返す最小値関数を、各重みに適用したものである。つまり、min(概念Aの重み,概念Bの重み)は、概念Aの重みと概念Bの重みのいずれか小さいほうの値を返す。
Here, sim (A, B) is the similarity between the concept A and the concept B, and the value can be referred to by the similarity data acquired by the
Further, min (weight of concept A, weight of concept B) is obtained by applying a minimum value function that returns a minimum value among arguments to each weight. That is, min (concept A weight, concept B weight) returns the smaller one of the concept A weight and the concept B weight.
パス重み算出部114は、ある概念(A)から他の概念(B)への関連度を計算する際に、それら両概念が隣接している場合には、上記の式(A1),(A2),(A3)のいずれかで得られる値をそのまま、その重みとする。
When calculating the degree of association from one concept (A) to another concept (B), the path
また、ある概念(A)から、直接つながっていない(隣接していない)他の概念(B)への重みを計算する際には、パス重み算出部114は、次の計算を行う。即ち、それら両概念間をつなぐパスに含まれる各リンクについての重み(式(A1),(A2),(A3)のいずれか)の、調和平均(B1)または相乗平均(B2)を算出する。
例えば、距離が2の概念間の重みは、下の式(B1),(B2)のいずれかによって計算される。
Further, when calculating the weight from a certain concept (A) to another concept (B) that is not directly connected (not adjacent), the path
For example, the weight between concepts having a distance of 2 is calculated by either of the following formulas (B1) and (B2).
式(B1): (概念AからBへの重み)=(2×概念AからCへの重み×概念CからBへの重み)/(概念AからCへの重み+概念CからBへの重み)
式(B2): (概念AからBへの重み)=SQRT(概念AからCへの重み×概念CからBへの重み)
なお、パス重み算出部114は、上の式(B1),(B2)のいずれかを用いるが、これらいずれかのうち選択された式を一貫して用いる。つまり、概念間の関連度を算出するときに、途中でこの重みの計算式(調和平均か相乗平均のいずれか)を変更することはない。
Formula (B1): (weight from concept A to B) = (2 × weight from concept A to C × weight from concept C to B) / (weight from concept A to C + concept from concept C to B weight)
Formula (B2): (weight from concept A to B) = SQRT (weight from concept A to C × weight from concept C to B)
The path
ここで、概念AからCへは直接のリンクでつながっており、概念CからBへは直接のリンクでつながっている。つまり、概念AとBとの間の距離は2であり、概念Cを間に介している。
また、上の式(B2)におけるSQRT()は、引数の平方根を返す関数である。
概念Aから概念Bの距離が2より大きい場合にも、パス重み算出部114は、上記の式(B1)または(B2)をそれぞれ拡張して、調和平均または相乗平均により、パスの重みを算出する。
Here, concepts A to C are connected by a direct link, and concepts C to B are connected by a direct link. That is, the distance between the concepts A and B is 2, and the concept C is interposed therebetween.
Further, SQRT () in the above formula (B2) is a function that returns the square root of the argument.
Even when the distance from the concept A to the concept B is larger than 2, the path
関連度算出部116は、次の(C1)または(C2)のいずれかの方法により、概念AからBへの関連度を求める。
(C1)パス重み算出部114が算出した概念AからBへのパスの重みを、そのまま概念AからBへの関連度として出力する(関連度記憶部30に書き込む)。なお、概念AからBへのパスが複数存在するときには、次のいずれかの方法により、代表のパスを選択する。
(C1−1)最も短いパスを採用する。
(C1−2)重み(パスの重み)が最も大きいパスを採用する。
The degree-of-
(C1) The path weight from the concept A to B calculated by the path
(C1-1) The shortest path is adopted.
(C1-2) A path having the largest weight (path weight) is adopted.
(C2)概念AからBへのパスの重みのうちの最大の重み(パスの重み)と、概念AからBへのパスの数とを乗算し、その結果を概念AからBへの関連度として出力する(関連度記憶部30に書き込む)。なお、この(C2)の方法を採る場合には、第1実施形態におけるフローチャートで説明した処理手順(概念マップを探索するための手順)を利用することもできる。
なお、関連度算出部116は、上の(C1),(C2)のいずれかの方法を用いる((C1)の場合にはさらに(C1−1),(C1−2)のいずれかの方法を用いる)が、これらのうち選択された方法を一貫して用いる。つまり、概念間の関連度を算出するときに、途中でこの関連度の求め方を変更することはない。
(C2) Multiplying the maximum weight (path weight) of the path weights from concept A to B by the number of paths from concept A to B, and the result is the degree of association from concept A to B Is output (written in the association degree storage unit 30). When the method (C2) is adopted, the processing procedure (procedure for searching a concept map) described in the flowchart in the first embodiment can also be used.
The
第2実施形態の概念処理装置2によれば、外部から取得する概念間の類似度のデータを使って、また、概念の重みやパスの重みなど(あるいはその両方)に応じて、概念間の関連度を算出することができる。既に類似度のデータが外部から提供されている場合には、そのデータを良好に反映した関連度を得ることができる。
According to the
[第3実施形態]
次に、本発明の第3実施形態について説明する。なお、前述の実施形態と共通する事項については説明を省略する場合があり、本実施形態特有の事項を中心に説明する。
本実施形態による概念処理装置の機能構成を示すブロック図は、図1として示したブロック図と同様である。
第1実施形態の概念処理装置は、概念間のパスの重みの最大値(複数あるパスのうちの、重みが最大であるパスの重み)と、当該概念間のパスの数とを乗算することによって当該概念間の関連度を算出した。これに対して、本実施形態では、概念Aから概念Bに至るパスが複数存在する場合、それら各々のパスの重みの総和に基づいて関連度を求める。
[Third Embodiment]
Next, a third embodiment of the present invention will be described. Note that description of matters common to the above-described embodiment may be omitted, and description will be made focusing on matters specific to the present embodiment.
The block diagram showing the functional configuration of the conceptual processing apparatus according to this embodiment is the same as the block diagram shown in FIG.
The concept processing device of the first embodiment multiplies the maximum value of path weights between concepts (the weight of the path having the maximum weight among a plurality of paths) and the number of paths between the concepts. Was used to calculate the degree of association between the concepts. On the other hand, in this embodiment, when there are a plurality of paths from concept A to concept B, the relevance is obtained based on the sum of the weights of the paths.
具体的には、次の通りである。
本実施形態の、概念重み算出部12は、第1実施形態と同様の方法により、各概念の重みを計算する。
次に、パス重み算出部14は、概念Aと概念Bとの間のすべてのパスについて、それぞれパスの重みを計算する。ある一つのパスの重み自体は、第1実施形態と同様に、そのパスに含まれるすべての概念(両端の概念を含む)の重みの調和平均である。なお、ここで計算対象としている概念Aと概念Bとの間のパスは、途中で同じ概念を2度以上通らないようなパスである。つまり、パスの一部に閉路を含んだり、パスの途中での後戻りを含んだりしない。
なお、概念マップのサイズが有限である(概念マップに含まれる概念の数が有限である)とき、概念Aと概念Bとの間のパスの数は有限である。
また、ここで計算対象とする概念Aと概念Bとの間のパスに関して、その長さに制約を設けるようにしても良い。つまりこのとき、パラメーター設定部18によって設定されるパラメーターMAX_Distanceの値のリンク数で辿り着かないようなパスについては、計算から除外する。
Specifically, it is as follows.
The
Next, the path
Note that when the size of the concept map is finite (the number of concepts included in the concept map is finite), the number of paths between the concept A and the concept B is finite.
In addition, regarding the path between the concept A and the concept B to be calculated here, the length may be limited. That is, at this time, a path that cannot be reached by the number of links of the parameter MAX_Distance set by the
そして、関連度算出部16は、概念Aと概念Bとの間の各パスの重みの総和を求め、その総和を概念Aから概念Bへの関連度として出力する。具体的には、関連度算出部16は、算出された関連度を関連度記憶部30に書き込む。
Then, the
この第3の実施形態によれば、重みが最大であるパスによって概念Aと概念Bとの間のパスを代表させるのではなく、各パスが持つ重みを反映した関連度を求めることができる。なお、概念マップのサイズが大きい場合、長い距離を探索する処理のためには多くの計算量を要する場合もある。必要に応じて並列処理を導入することにより、より短い時間で多くの計算量を処理することもできる。 According to the third embodiment, the path between the concept A and the concept B is not represented by the path having the maximum weight, but the degree of association reflecting the weight of each path can be obtained. When the size of the concept map is large, a large amount of calculation may be required for the process of searching for a long distance. By introducing parallel processing as necessary, a large amount of calculation can be processed in a shorter time.
なお、上述した各実施形態における概念処理装置の機能の一部または全部をコンピューターとプログラムとで実現するようにしても良い。その場合、各機能を実現するためのプログラムをコンピューター読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピューターシステムに読み込ませ、実行することによって実現しても良い。なお、ここでいう「コンピューターシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピューター読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピューターシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピューター読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバーやクライアントとなるコンピューターシステム内部の揮発性メモリーのように、一定時間プログラムを保持しているものも含んでも良い。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピューターシステムにすでに記録されているプログラムとの組み合わせで実現できるものであっても良い。 In addition, you may make it implement | achieve part or all of the function of the conceptual processing apparatus in each embodiment mentioned above with a computer and a program. In that case, a program for realizing each function may be recorded on a computer-readable recording medium, and the program recorded on the recording medium may be read into a computer system and executed. Here, the “computer system” includes an OS and hardware such as peripheral devices. The “computer-readable recording medium” refers to a storage device such as a flexible disk, a magneto-optical disk, a portable medium such as a ROM and a CD-ROM, and a hard disk incorporated in a computer system. Furthermore, a “computer-readable recording medium” dynamically holds a program for a short time, like a communication line when transmitting a program via a network such as the Internet or a communication line such as a telephone line. In this case, a volatile memory inside a computer system serving as a server or a client in that case may be included and a program held for a certain period of time. The program may be a program for realizing a part of the above-described functions, or may be a program that can realize the above-described functions in combination with a program already recorded in a computer system.
以上、この発明の複数の実施形態について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。 As described above, a plurality of embodiments of the present invention have been described in detail with reference to the drawings. However, the specific configuration is not limited to this embodiment, and includes a design and the like within a scope not departing from the gist of the present invention. .
現実の概念マップ(図面に例示した簡略版のマップとは別のもの)を用いて、第1実施形態に記載した方法により、概念「病気」と他の概念との間の関連度を計算した。その結果、関連度の値における上位10位までの概念は、次の通りである。なお、ここでは、小数点第5位までの数値を求めている。 The degree of association between the concept “disease” and another concept was calculated by the method described in the first embodiment using an actual concept map (separate from the simplified map illustrated in the drawing). . As a result, the concepts up to the top 10 in the value of relevance are as follows. Here, numerical values up to the fifth decimal place are obtained.
1位 関連度:0.00358 概念:体
2位 関連度:0.00325 概念:炎症
3位 関連度:0.00314 概念:薬
4位 関連度:0.00309 概念:風邪
5位 関連度:0.00307 概念:身体
6位 関連度:0.00300 概念:感染症
7位 関連度:0.00296 概念:ガン
8位 関連度:0.00278 概念:感染
9位 関連度:0.00267 概念:アレルギー
10位 関連度:0.00258 概念:癌
1st place Relevance: 0.00358 Concept: body 2nd place Relevance: 0.00325 Concept: inflammation 3rd place Relevance: 0.00314 Concept: medicine 4th place Relevance: 0.00309 Concept: cold 5th place Relevance: 0 .00307 Concept: Body 6th Relevance: 0.00300 Concept: Infectious Disease 7th Relevance: 0.00296 Concept: Cancer 8th Relevance: 0.00278 Concept: Infection 9th Relevance: 0.00267 Concept: Allergy 10th place Relevance: 0.00258 Concept: Cancer
本発明は、概念と概念との間の関連度を利用した各種情報処理に利用可能である。一例としては、情報検索や、テレビ番組等のコンテンツを利用者に推薦するための番組推薦などといった分野に、本発明を利用可能である。 The present invention can be used for various types of information processing using the degree of association between concepts. As an example, the present invention can be used in fields such as information retrieval and program recommendation for recommending content such as television programs to users.
1,2 概念処理装置
12,112 概念重み算出部
14,114 パス重み算出部
16,116 関連度算出部
18 パラメーター設定部
20 概念マップ記憶部
22 作業記憶部
30 関連度記憶部
140 類似度取得部
1, 2
Claims (6)
前記概念マップデータにおいて、ある概念と他の概念との間を前記リンクで連結させてなるパスについて、当該パス上に含まれる概念についての前記概念の重みの値に応じた当該パスの重みの値を算出するパス重み算出部と、
ある概念と他の概念との間を結ぶパスについての前記パスの重みの値に応じた、当該概念と当該他の概念との間の関連度を算出する関連度算出部と、
を具備することを特徴とする概念処理装置。 Reads concept map data that indicates the presence or absence of relationships between concepts, and calculates the value of the concept weight so that the smaller the number of links that represent the relationship between one concept and the other, the greater the value for that concept A concept weight calculation unit for
In the concept map data, for a path formed by connecting a concept and another concept with the link, the weight value of the path corresponding to the weight value of the concept for the concept included on the path A path weight calculation unit for calculating
A degree-of-association calculating unit that calculates a degree of association between the concept and the other concept according to the value of the weight of the path for a path connecting a certain concept and another concept;
A conceptual processing apparatus comprising:
ことを特徴とする請求項1に記載の概念処理装置。 The path weight calculation unit calculates a value of the weight of the path by taking a harmonic average or a geometric average of the values of the weight of the concept for each concept included on the path;
The conceptual processing device according to claim 1, wherein:
ことを特徴とする請求項1または2のいずれかに記載の概念処理装置。 The concept weight calculation unit calculates a value of the concept weight by calculating a logarithm of the reciprocal of the number of links between the concept and the other concept.
The conceptual processing apparatus according to claim 1, wherein
ことを特徴とする請求項1から3までのいずれか一項に記載の概念処理装置。 When there are a plurality of paths formed by connecting the certain concept and the other concept by the link, the relevance calculation unit calculates the weight value of the plurality of paths as the number of the plurality of paths. By calculating the relevance between the concept and the other concept by multiplying the value of the maximum weight of the path among the above, or calculating the sum of the weights of the plurality of paths as the relevance,
The conceptual processing device according to claim 1, wherein the conceptual processing device is a device.
前記パス重み算出部は、前記パスについて、当該パス上に含まれるリンクが結ぶ概念の対に関する類似度を前記類似度データから取得し、取得した前記類似度にも応じて前記パスの重みの値を算出する、
ことを特徴とする請求項1から4までのいずれか一項に記載の概念処理装置。 A similarity acquisition unit that acquires similarity data representing the similarity between concepts,
The path weight calculation unit acquires, for the path, a degree of similarity related to a concept pair connected by a link included in the path from the similarity data, and the path weight value according to the acquired degree of similarity To calculate,
The conceptual processing device according to claim 1, wherein the conceptual processing device is a device.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015092331A JP6501398B2 (en) | 2015-04-28 | 2015-04-28 | Concept processing device and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015092331A JP6501398B2 (en) | 2015-04-28 | 2015-04-28 | Concept processing device and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016212461A true JP2016212461A (en) | 2016-12-15 |
JP6501398B2 JP6501398B2 (en) | 2019-04-17 |
Family
ID=57551794
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015092331A Active JP6501398B2 (en) | 2015-04-28 | 2015-04-28 | Concept processing device and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6501398B2 (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018159237A1 (en) * | 2017-02-28 | 2018-09-07 | 国立研究開発法人物質・材料研究機構 | Search method, search device, and search system |
JP2020087455A (en) * | 2018-11-28 | 2020-06-04 | 富士通株式会社 | Recommendation generation method and recommendation generation device |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006215936A (en) * | 2005-02-07 | 2006-08-17 | Hitachi Ltd | Search system and search method |
JP2010117764A (en) * | 2008-11-11 | 2010-05-27 | Nippon Telegr & Teleph Corp <Ntt> | Inter-word association degree determining device, inter-word association degree determination method, program, and recording medium |
JP2013242626A (en) * | 2012-05-18 | 2013-12-05 | Sony Corp | Information processing apparatus, information processing method, and program |
-
2015
- 2015-04-28 JP JP2015092331A patent/JP6501398B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006215936A (en) * | 2005-02-07 | 2006-08-17 | Hitachi Ltd | Search system and search method |
JP2010117764A (en) * | 2008-11-11 | 2010-05-27 | Nippon Telegr & Teleph Corp <Ntt> | Inter-word association degree determining device, inter-word association degree determination method, program, and recording medium |
JP2013242626A (en) * | 2012-05-18 | 2013-12-05 | Sony Corp | Information processing apparatus, information processing method, and program |
Non-Patent Citations (2)
Title |
---|
中田 正雄: "個人に特化したWeb検索システムの開発", 電子情報通信学会技術研究報告, vol. 104, no. 742, JPN6019005096, 11 March 2005 (2005-03-11), JP, pages 23 - 28, ISSN: 0003978837 * |
小池 麻子: "情報の価値化・知識化技術の実現へ向けて 3 テキストマイニングによる潜在的知識の発見支援", 情報処理, vol. 第48巻 第8号, JPN6019005097, 15 August 2007 (2007-08-15), JP, pages 824 - 829, ISSN: 0003978838 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018159237A1 (en) * | 2017-02-28 | 2018-09-07 | 国立研究開発法人物質・材料研究機構 | Search method, search device, and search system |
JPWO2018159237A1 (en) * | 2017-02-28 | 2019-12-19 | 国立研究開発法人物質・材料研究機構 | Search method, search device, and search system |
US11163829B2 (en) | 2017-02-28 | 2021-11-02 | National Institute For Materials Science | Search method, search device, and search system |
JP2020087455A (en) * | 2018-11-28 | 2020-06-04 | 富士通株式会社 | Recommendation generation method and recommendation generation device |
JP7367473B2 (en) | 2018-11-28 | 2023-10-24 | 富士通株式会社 | Recommendation generation method, device and program |
Also Published As
Publication number | Publication date |
---|---|
JP6501398B2 (en) | 2019-04-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10310812B2 (en) | Matrix ordering for cache efficiency in performing large sparse matrix operations | |
KR101793222B1 (en) | Updating a search index used to facilitate application searches | |
US11544578B2 (en) | Method, device and equipment for fusing different instances describing same entity | |
JP6163607B2 (en) | Method and apparatus for constructing event knowledge database | |
US20190102390A1 (en) | Semantic search engine and visualization platform | |
US9940410B2 (en) | Method of searching for relevant node, and computer therefor and computer program | |
US9336497B2 (en) | System and method for an expert question answer system from a dynamic corpus | |
WO2014126657A1 (en) | Latent semantic analysis for application in a question answer system | |
US20180144424A1 (en) | Method and system for content processing to query multiple healthcare-related knowledge graphs | |
JP2022046759A (en) | Retrieval method, device, electronic apparatus and storage medium | |
US8620941B2 (en) | Apparatus and method of searching and visualizing instance path | |
US20170308620A1 (en) | Making graph pattern queries bounded in big graphs | |
CN110275962B (en) | Method and apparatus for outputting information | |
US20160335267A1 (en) | Method and apparatus for natural language search for variables | |
US9092547B2 (en) | Transforming a graph to a tree in accordance with analyst guidance | |
JP6501398B2 (en) | Concept processing device and program | |
US8965910B2 (en) | Apparatus and method of searching for instance path based on ontology schema | |
EP2778971A1 (en) | Rule triggering for search rule engine | |
JP2019121060A (en) | Generation program, generation method and information processing apparatus | |
Antunes et al. | Context storage for m2m scenarios | |
WO2015166508A1 (en) | Correlation based instruments discovery | |
Kumar et al. | Efficient structuring of data in big data | |
Fogliaroni et al. | Qualitative spatial configuration search | |
Xu et al. | An upper-ontology-based approach for automatic construction of IOT ontology | |
US11468078B2 (en) | Hierarchical data searching using tensor searching, fuzzy searching, and Bayesian networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180226 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20181026 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190207 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190219 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190318 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6501398 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |