JP2016212461A - Conception processing apparatus and program - Google Patents

Conception processing apparatus and program Download PDF

Info

Publication number
JP2016212461A
JP2016212461A JP2015092331A JP2015092331A JP2016212461A JP 2016212461 A JP2016212461 A JP 2016212461A JP 2015092331 A JP2015092331 A JP 2015092331A JP 2015092331 A JP2015092331 A JP 2015092331A JP 2016212461 A JP2016212461 A JP 2016212461A
Authority
JP
Japan
Prior art keywords
concept
path
weight
concepts
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015092331A
Other languages
Japanese (ja)
Other versions
JP6501398B2 (en
Inventor
太郎 宮▲崎▼
Taro Miyazaki
太郎 宮▲崎▼
山田 一郎
Ichiro Yamada
一郎 山田
菊佳 望月
Kikuka Mochizuki
菊佳 望月
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Nippon Hoso Kyokai NHK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Hoso Kyokai NHK filed Critical Nippon Hoso Kyokai NHK
Priority to JP2015092331A priority Critical patent/JP6501398B2/en
Publication of JP2016212461A publication Critical patent/JP2016212461A/en
Application granted granted Critical
Publication of JP6501398B2 publication Critical patent/JP6501398B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a conception processing apparatus and a program which can obtain an index (the degree of association) showing strength of association between conceptions on the basis of a conception map.SOLUTION: A conception weight calculation part reads conception map data showing whether or not there is relation between conceptions and calculates a weight value of conception which becomes larger with respect to the conception with the smaller number of links showing relations between one conception and another. A path weight calculation part calculates a weight value of a path in accordance with the weight value of the conception with respect to conception included on the path with respect to paths connecting one conception with another by link in conception map data. A degree-of-association calculation part calculates the degree of association between one conception and another in accordance with the weight value of path with respect to a path connecting the conception with the other.SELECTED DRAWING: Figure 1

Description

本発明は、概念を処理するための概念処理装置およびプログラムに関する。本発明は、特に、概念間の関連度を求めるための概念処理装置およびプログラムに関する。   The present invention relates to a concept processing apparatus and program for processing a concept. In particular, the present invention relates to a concept processing apparatus and program for obtaining the degree of association between concepts.

情報検索処理や、自然言語を用いた知識処理などにおいて、概念間の関係を利用することにより、より高度な処理を行えるようにすることが期待されている。また、概念間の関係を、人手に依らずに効率よく収集できるようにすることが期待されている。   In information retrieval processing and knowledge processing using natural language, it is expected that more advanced processing can be performed by utilizing the relationship between concepts. In addition, it is expected that relationships between concepts can be collected efficiently without human intervention.

概念間の関係を表す情報としては、概念間の関係名や、概念間の関連の強さを表す数値などが考えられる。この中でも、概念間の関連の強さを、精度よく且つ効率よく収集することができれば、上で述べた情報検索処理や知識処理などの高度化への貢献を期待できる。   As information representing the relationship between concepts, a relationship name between concepts, a numerical value representing the strength of the relationship between concepts, and the like can be considered. Among these, if the strength of association between concepts can be collected accurately and efficiently, it can be expected to contribute to the advancement of information retrieval processing and knowledge processing described above.

非特許文献1には、係り受けの大規模な確率的クラスタリングの結果を用いて、大規模な類似語リストを生成する技術が述べられている。この技術は、大規模な言語資源の分析を前提としている。そして、この技術は、意味的に似た語は似た文脈で出現するという分布仮説に基づいて、ある語の周辺に出現する語や係り受け関係にある語で文脈を定義し、その語との共起頻度などを分析する。   Non-Patent Document 1 describes a technique for generating a large-scale similar word list using a result of large-scale stochastic clustering of dependency. This technology is based on the analysis of large-scale language resources. Based on the distribution hypothesis that semantically similar words appear in similar contexts, this technique defines contexts with words that appear around a word or words that have a dependency relationship. Analyzes the frequency of co-occurrence of

非特許文献2では、大量の文章を解析し、同一の文で共通して現れる頻度を求めることにより、単語間の関連度を計算したデータベースが公開されている旨が記載されている。共起スコアとしては、共起頻度、Dice係数、ディスカウンティング相互情報量の3種類が用いられている。   Non-Patent Document 2 describes that a database in which the degree of association between words is calculated by analyzing a large amount of sentences and calculating the frequency of common occurrences in the same sentence is disclosed. As the co-occurrence score, three types of co-occurrence frequency, Dice coefficient, and discounting mutual information amount are used.

風間淳一,Stijn De Saeger,鳥澤健太郎,村田真樹,「係り受けの確率的クラスタリングを用いた大規模類似語リストの作成」,言語処理学会,第15回年次大会 発表論文集,2009年3月,p.84−87,[online],[平成27年4月1日検索],インターネット<URL:http://www.anlp.jp/proceedings/annual_meeting/2009/pdf_dir/C1-6.pdf>Kazuma Kazama, Stijn De Saeger, Kentaro Torizawa, Maki Murata, “Creating a Large Similar Word List Using Dependent Stochastic Clustering”, Linguistic Processing Society, 15th Annual Conference, Proceedings, March 2009 , P. 84-87, [online], [April 1, 2015 search], Internet <URL: http://www.anlp.jp/proceedings/annual_meeting/2009/pdf_dir/C1-6.pdf> ALAGIN 言語資源・音声資源サイト,「(A−5)単語共起頻度データベース」,[online],[平成27年4月10日検索],インターネット<URL:https://alaginrc.nict.go.jp/resources/nict-resource/li-info/li-outline.html>ALAGIN Language Resource / Speech Resource Site, “(A-5) Word Co-occurrence Frequency Database”, [online], [April 10, 2015 search], Internet <URL: https: //alaginrc.nict.go. jp / resources / nict-resource / li-info / li-outline.html>

非特許文献1による方法では、例えば「パエリヤ」と「あさり」という概念対のように、料理と材料の関係にある対に対して高い関連度を設定することができない。このため、非特許文献1の手法をそのまま、概念マップにおける関連度に適用しても、良い性能は得られない。   In the method according to Non-Patent Document 1, for example, a high degree of association cannot be set for a pair having a relationship between a dish and an ingredient, such as a concept pair of “Paella” and “clam”. For this reason, even if the method of Non-Patent Document 1 is applied as it is to the degree of association in the concept map, good performance cannot be obtained.

また、非特許文献2による方法は、例えば料理と材料のような概念対の関係には効果的であるが、例えば「サッカー」と「野球」という概念対のように、似たような使い方をされる対でありながら、同じ文脈で使われることの少ない単語対には、高い値を与えることができない。よって、やはり概念マップにおける関連度としてこの手法をそのまま適用することは難しい。   In addition, the method according to Non-Patent Document 2 is effective for the relationship between concept pairs such as cooking and ingredients, but similar usage, for example, the concept pair of “soccer” and “baseball”. A high value cannot be given to a word pair that is a pair that is rarely used in the same context. Therefore, it is difficult to apply this method as it is as the degree of association in the concept map.

また、非特許文献1による手法も、非特許文献2による手法も、大規模な言語資源を分析しなければならない。   In addition, both the method according to Non-Patent Document 1 and the method according to Non-Patent Document 2 must analyze large-scale language resources.

本発明は、これらの課題認識に基づいて行なわれたものであり、概念マップに基づいて、概念間の関連の強さを表す指標(関連度)を求めることのできる、概念処理装置およびプログラムを提供しようとするものである。   The present invention has been made on the basis of recognition of these problems, and provides a concept processing device and program capable of obtaining an index (degree of association) representing the strength of association between concepts based on a concept map. It is something to be offered.

上記の課題を解決するため、本発明の一態様による概念処理装置は、概念間の関係の有無を表す概念マップデータを読み込み、ある概念と他の概念との間の関係を表すリンクの数が少ないほど当該概念について大きな値となるような前記概念の重みの値を算出する概念重み算出部と、前記概念マップデータにおいて、ある概念と他の概念との間を前記リンクで連結させてなるパスについて、当該パス上に含まれる概念についての前記概念の重みの値に応じた当該パスの重みの値を算出するパス重み算出部と、ある概念と他の概念との間を結ぶパスについての前記パスの重みの値に応じた、当該概念と当該他の概念との間の関連度を算出する関連度算出部と、を具備することを特徴とする。   In order to solve the above problems, a concept processing apparatus according to an aspect of the present invention reads concept map data representing the presence or absence of a relationship between concepts, and the number of links representing a relationship between a concept and another concept is A concept weight calculation unit that calculates a weight value of the concept that becomes a larger value for the concept, and a path formed by connecting a concept and another concept with the link in the concept map data. The path weight calculation unit for calculating the weight value of the path according to the weight value of the concept for the concept included in the path, and the path for connecting a concept and another concept A degree-of-association calculating unit that calculates the degree of association between the concept and the other concept according to a path weight value.

また、本発明の一態様は、上記の概念処理装置において、前記パス重み算出部は、前記パス上に含まれる各々の概念についての前記概念の重みの値の調和平均または相乗平均を取ることによって当該パスの重みの値を算出する、ことを特徴とする。   According to another aspect of the present invention, in the above concept processing device, the path weight calculation unit takes a harmonic average or a geometric average of the concept weight values for each concept included on the path. The path weight value is calculated.

また、本発明の一態様は、上記の概念処理装置において、前記概念重み算出部は、前記概念から前記他の概念との間の前記リンクの数の逆数の対数を計算することにより前記概念の重みの値を算出する、ことを特徴とする。   Further, according to one aspect of the present invention, in the concept processing device, the concept weight calculation unit calculates a logarithm of the inverse of the number of links between the concept and the other concept. The weight value is calculated.

また、本発明の一態様は、上記の概念処理装置において、前記関連度算出部は、前記ある概念と前記他の概念との間を前記リンクで連結させてなるパスが複数存在する場合に、それら複数のパスの数に、それら複数のパスの重みの値のうちの最大の前記パスの重みの値を乗じることによって、当該概念と当該他の概念との間の関連度を算出するか、またはそれら複数のパスの重みの総和を関連度として算出する、ことを特徴とする。   Further, according to one aspect of the present invention, in the above concept processing device, when the relevance calculation unit includes a plurality of paths in which the certain concept and the other concept are connected by the link, By multiplying the number of the plurality of paths by the value of the maximum weight of the plurality of path weights to calculate the degree of association between the concept and the other concept, Alternatively, the sum of the weights of the plurality of paths is calculated as the degree of association.

また、本発明の一態様は、上記の概念処理装置において、概念間の類似度を表す類似度データを取得する類似度取得部を具備し、前記パス重み算出部は、前記パスについて、当該パス上に含まれるリンクが結ぶ概念の対に関する類似度を前記類似度データから取得し、取得した前記類似度にも応じて前記パスの重みの値を算出する、ことを特徴とする。   According to another aspect of the present invention, the above concept processing device includes a similarity acquisition unit that acquires similarity data representing a similarity between concepts, and the path weight calculation unit includes the path for the path. The degree of similarity of the concept pair connected by the link included above is acquired from the similarity data, and the path weight value is calculated in accordance with the acquired degree of similarity.

また、本発明の一態様は、コンピューターを、上記のいずれかに記載の概念処理装置として機能させるためのプログラムである。   One embodiment of the present invention is a program for causing a computer to function as the conceptual processing device described above.

本発明によれば、概念マップに基づいて概念間の関連度を求めることができる。   According to the present invention, the degree of association between concepts can be obtained based on the concept map.

本発明の第1実施形態による概念処理装置の概略機能構成を示したブロック図である。It is the block diagram which showed schematic function structure of the conceptual processing apparatus by 1st Embodiment of this invention. 同実施形態による概念マップ記憶部が保持する概念マップの一例を示す概略図である。It is the schematic which shows an example of the concept map which the concept map memory | storage part by the same embodiment hold | maintains. 同実施形態において計算する概念の重みを説明するための概略図であり、概念マップの一部分を示している。It is the schematic for demonstrating the weight of the concept calculated in the embodiment, and has shown a part of concept map. 同実施形態による作業記憶部内の記憶領域に置かれ、概念の重み等を保持するためのデータの構成を示す概略図である。It is the schematic which shows the structure of the data for holding | maintaining the weight of a concept, etc. which are put in the storage area in the working storage part by the embodiment. 同実施形態において計算するパスの重みを説明するための概略図であり、概念マップの一部分を示している。It is the schematic for demonstrating the weight of the path | pass calculated in the same embodiment, and has shown a part of concept map. 同実施形態による作業記憶部内の記憶領域に置かれるデータであり、パス重み算出部が概念マップを探索する際に一時的に記憶すべき情報を格納する手段を示す概略図である。It is the schematic which shows the means which stores the information which should be memorize | stored temporarily when the path weight calculation part searches a concept map, and is data put in the storage area in the working storage part by the embodiment. 同実施形態による作業記憶部内の記憶領域に置かれるデータであり、パス重み算出部が概念マップを探索する際に、各概念へのパスに関連する情報を記憶する手段を示す概略図である。FIG. 5 is a schematic diagram showing means for storing information related to a path to each concept when the path weight calculation unit searches a concept map, which is data placed in a storage area in the work storage unit according to the embodiment. 同実施形態による概念処理装置の処理の手順を示すフローチャートの第1である。It is the 1st of the flowchart which shows the procedure of the process of the conceptual processing apparatus by the embodiment. 同実施形態による概念処理装置の処理の手順を示すフローチャートの第2である。It is 2nd of the flowchart which shows the procedure of the process of the conceptual processing apparatus by the embodiment. 同実施形態において用いるデータであり、図4に示した記憶領域が保持する値の一例を示す概略図である。FIG. 5 is a schematic diagram showing an example of values used in the embodiment and held in the storage area shown in FIG. 4. 同実施形態において用いるデータであり、図6に示した記憶領域が保持する値の推移の一例を示す概略図である。FIG. 7 is a schematic diagram illustrating an example of a transition of a value which is data used in the embodiment and held in the storage area illustrated in FIG. 6. 同実施形態において用いるデータであり、図7に示した記憶領域が保持する値の推移の一例(その1)を示す概略図である。FIG. 8 is a schematic diagram illustrating an example (part 1) of transition of values used in the embodiment and held in the storage area illustrated in FIG. 7. 同実施形態において用いるデータであり、図7に示した記憶領域が保持する値の推移の一例(その2)を示す概略図である。FIG. 8 is a schematic diagram illustrating an example (part 2) of a transition of values held in the storage area illustrated in FIG. 7, which is data used in the embodiment. 同実施形態において用いるデータであり、図7に示した記憶領域が保持する値の推移の一例(その3)を示す概略図である。FIG. 8 is a schematic diagram showing an example (part 3) of a transition of values held in the storage area shown in FIG. 7, which is data used in the embodiment. 本発明の第2実施形態による概念処理装置の概略機能構成を示すブロック図である。It is a block diagram which shows schematic function structure of the conceptual processing apparatus by 2nd Embodiment of this invention. 同実施形態における類似度取得部が外部から取得する、概念間の類似度を表す類似度データの構成を示す概略図である。It is the schematic which shows the structure of the similarity data showing the similarity between the concepts which the similarity acquisition part in the embodiment acquires from the outside.

次に、本発明の実施形態について、図面を参照しながら説明する。
[第1実施形態]
図1は、第1実施形態による概念処理装置の概略機能構成を示すブロック図である。図示するように、概念処理装置1は、概念重み算出部12と、パス重み算出部14と、関連度算出部16と、パラメーター設定部18と、概念マップ記憶部20と、作業記憶部22と、関連度記憶部30と、を含んで構成される。これらの各部は、例えば電子回路(コンピューターを含む)を用いて実現される。また、概念マップ記憶部20と作業記憶部22と関連度記憶部30とは、情報を記憶するための手段として例えば磁気ハードディスク装置や半導体メモリー等を用いて実現される。
Next, embodiments of the present invention will be described with reference to the drawings.
[First Embodiment]
FIG. 1 is a block diagram showing a schematic functional configuration of the conceptual processing device according to the first embodiment. As illustrated, the concept processing device 1 includes a concept weight calculation unit 12, a path weight calculation unit 14, a relevance calculation unit 16, a parameter setting unit 18, a concept map storage unit 20, and a work storage unit 22. And the relevance degree storage unit 30. Each of these units is realized using, for example, an electronic circuit (including a computer). The concept map storage unit 20, the work storage unit 22, and the relevance level storage unit 30 are realized by using, for example, a magnetic hard disk device or a semiconductor memory as means for storing information.

概念重み算出部12は、概念間の関係の有無を表す概念マップデータを概念マップ記憶部20から読み込み、ある概念と他の概念との間の関係を表すリンクの数が少ないほど当該概念について大きな値となるような前記概念の重みの値を算出する。
また、概念重み算出部12は、特に、前記概念から前記他の概念との間の前記リンクの数の逆数の対数を計算することにより前記概念の重みの値を算出する。
The concept weight calculation unit 12 reads concept map data indicating the presence or absence of a relationship between concepts from the concept map storage unit 20, and the smaller the number of links indicating the relationship between a certain concept and another concept, the larger the concept. The weight value of the concept that becomes a value is calculated.
In addition, the concept weight calculation unit 12 calculates the weight value of the concept by calculating the logarithm of the inverse of the number of links between the concept and the other concept.

パス重み算出部14は、前記概念マップデータにおいて、ある概念と他の概念との間を前記リンクで連結させてなるパスについて、当該パス上に含まれる概念についての前記概念の重みの値に応じたパスの重みの値を算出する。
また、パス重み算出部14は、特に、前記パス上に含まれる各々の概念についての前記概念の重みの値の調和平均や相乗平均を取ることによって当該パスの重みの値を算出する。
また、パス重み算出部14は、特に具体的な手順として、計算対象の概念から開始して、前記概念マップデータを探索する探索処理を行いながら、前記計算対象の概念と、前記探索処理において到達する概念との間のパスについて前記パスの重みの値を算出し、当該パスについて算出された前記パスの重みの値が、前記計算対象の概念と当該到達した概念との間を連結させる他のパスについて既に算出していたパスの重みの値よりも大きい場合に、前記算出されたパスの重みの値を、前記計算対象の概念と当該到達した概念との間の最大重みのパスについての重みの値として記憶手段に書き込む。
In the concept map data, the path weight calculation unit 14 determines, for a path formed by connecting a concept and another concept by the link, according to the concept weight value for the concept included in the path. The path weight value obtained is calculated.
In addition, the path weight calculation unit 14 calculates the weight value of the path by taking the harmonic average or the geometric mean of the concept weight values for each concept included in the path.
In addition, the path weight calculation unit 14 starts with the concept of the calculation target as a particularly specific procedure, and performs the search process for searching the concept map data while reaching the concept of the calculation target and the search process. The path weight value for the path between the concept and the path weight is calculated, and the path weight value calculated for the path is another link that connects the concept to be calculated and the reached concept. If the calculated path weight value is larger than the path weight value that has already been calculated for the path, the calculated path weight value is the weight for the maximum weight path between the concept to be calculated and the reached concept. Is written in the storage means as the value of.

関連度算出部16は、ある概念と他の概念との間を結ぶパスについての前記パスの重みの値に応じた、当該概念と当該他の概念との間の関連度を算出する。
また、関連度算出部16は、特に、前記ある概念と前記他の概念との間を前記リンクで連結させてなるパスが複数存在する場合に、それら複数のパスの数に、それら複数のパスの重みの値のうちの最大の前記パスの重みの値を乗じることによって、当該概念と当該他の概念との間の関連度を算出する。
The degree-of-association calculation unit 16 calculates the degree of association between the concept and the other concept according to the value of the path weight for a path connecting a certain concept and the other concept.
In addition, the relevance calculation unit 16 determines that the plurality of paths are included in the number of the plurality of paths, particularly when there are a plurality of paths formed by connecting the certain concept and the other concept by the link. The degree of association between the concept and the other concept is calculated by multiplying the maximum value of the path weights among the weight values of.

パラメーター設定部18は、作業記憶部22内に記憶されるパラメーターを設定する。具体的には、パラメーター設定部18は、後述するパラメーターMAX_Distanceの値を、適宜、設定する。   The parameter setting unit 18 sets parameters stored in the work storage unit 22. Specifically, the parameter setting unit 18 appropriately sets a value of a parameter MAX_Distance described later.

概念マップ記憶部20は、概念間の関係の有無を表す概念マップデータを記憶する。なお、概念マップデータの詳細については、後述する。   The concept map storage unit 20 stores concept map data indicating the presence or absence of a relationship between concepts. Details of the concept map data will be described later.

作業記憶部22(ワークメモリー。以下において単に「メモリー」と呼ぶ場合もある。)は、記憶手段であり、処理中の作業用の情報を記憶する領域を持っている。また、作業記憶部22は、処理用のパラメーターを記憶しておく領域を持っている。   The work storage unit 22 (work memory, which may be simply referred to as “memory” below) is a storage unit and has an area for storing information for work being processed. The work storage unit 22 has an area for storing parameters for processing.

関連度記憶部30は、関連度算出部16によって算出された概念間の関連度を記憶する。関連度記憶部30が記憶している関連度のデータは、適宜、他の装置等から参照可能となっている。   The association degree storage unit 30 stores the association degree between concepts calculated by the association degree calculation unit 16. The relevance data stored in the relevance storage unit 30 can be referred to from other devices as appropriate.

次に、概念マップ記憶部20が記憶する概念マップのデータについて説明する。概念マップは、ある概念と他の概念との間に関係があるか否かを表すデータである。概念マップを表す一つの形態は、ノードとリンクで構成されるグラフである。個々の概念は、このグラフにおけるノードに対応する。また、概念間の関係は、グラフにおけるリンクに対応する。ある概念と他の概念との間においては、関係が有るか無いかのいずれかである。概念間に関係がある場合には、それらの概念の間には、リンクが存在する。概念間に関係がない場合には、それらの概念の間には、リンクが存在しない。なお、概念と概念の間の有無を表す情報を含んでいれば、概念マップのデータの形態はここに説明したもの以外でも良い。なお、ここで使用する概念マップのデータとして、既に構築されている概念マップをそのまま用いても良いし、また新たに概念マップを構築しても良い。概念マップを構築する方法の一例は、膨大な量の言語資源に出現する概念を分析することである。ここで用いる言語資源は、たとえばインターネットを介して収集可能なウェブのテキストである。また、出現する概念の分析方法は、例えば、所定の構文における複数の概念の出現を分析したり、同一文脈において出現する複数の概念を分析したりすることである。また、ウェブサイトからダウンロードできるデータが、複数の概念間の関係を直接表している場合には、そこで得られる関係を直接用いるようにしても良い。例えば、Wikipedia(URL https://ja.wikipedia.org/)などといった事典サイトは、概念間の関係をダウンロード可能な携帯で提供している。概念マップの実例については、次に説明する。   Next, the concept map data stored in the concept map storage unit 20 will be described. The concept map is data representing whether or not there is a relationship between a concept and another concept. One form representing a concept map is a graph composed of nodes and links. Each concept corresponds to a node in this graph. The relationship between concepts corresponds to a link in the graph. There is either a relationship or not between one concept and another. Where there is a relationship between concepts, there is a link between those concepts. If there is no relationship between concepts, there is no link between those concepts. Note that the data format of the concept map may be other than that described here as long as it includes information indicating the presence or absence between concepts. It should be noted that as the concept map data used here, an already constructed concept map may be used as it is, or a new concept map may be constructed. One example of how to construct a concept map is to analyze concepts that appear in a vast amount of language resources. The language resource used here is, for example, web text that can be collected via the Internet. The concept analysis method that appears is, for example, analyzing the appearance of a plurality of concepts in a predetermined syntax, or analyzing a plurality of concepts that appear in the same context. In addition, when data that can be downloaded from a website directly represents a relationship between a plurality of concepts, the relationship obtained there may be directly used. For example, encyclopedia sites such as Wikipedia (URL https://en.wikipedia.org/) provide relationships between concepts on mobile phones that can be downloaded. An example of a concept map will be described next.

図2は、概念マップ記憶部20が保持する概念マップの例を示す概略図である。実際の概念マップは非常に大規模なデータであり、その概念マップに含まれる概念の数は、数十万、数百万、あるいはそれ以上である。しかし、同図では、説明を簡単にするために、7個の概念からなる概念マップを例示している。図示するように、概念マップは、無向グラフで表される。そして、グラフの各ノードが1つの概念に対応する。また、グラフの各リンクは、概念間に直接の関係があることを表している。図示している概念マップに含まれている概念は、「病気」、「高血圧」、「成人病」、「糖尿病」、「風邪」、「発熱」、「インフルエンザ」の7個である。また、図示している概念マップに含まれるリンクを、そのリンクが結ぶ概念の対で表すと、「病気−高血圧」、「病気−成人病」、「病気−糖尿病」、「高血圧−成人病」、「糖尿病−成人病」、「病気−風邪」、「病気−インフルエンザ」、「風邪−発熱」、「インフルエンザ−発熱」の9個である。   FIG. 2 is a schematic diagram illustrating an example of a concept map held by the concept map storage unit 20. An actual concept map is very large-scale data, and the number of concepts included in the concept map is hundreds of thousands, millions, or more. However, in the same figure, for simplicity of explanation, a concept map including seven concepts is illustrated. As shown in the figure, the concept map is represented by an undirected graph. Each node of the graph corresponds to one concept. Each link in the graph represents a direct relationship between concepts. There are seven concepts included in the illustrated concept map: “disease”, “hypertension”, “adult disease”, “diabetes”, “cold”, “fever”, and “influenza”. In addition, when the links included in the illustrated concept map are represented by pairs of concepts connected by the links, “disease-hypertension”, “disease-adult disease”, “disease-diabetes”, “hypertension-adult disease” , “Diabetes-adult disease”, “disease-cold”, “disease-influenza”, “cold-fever”, and “influenza-fever”.

概念マップ記憶部20は、処理しやすいデータ形式で、概念マップの情報を保持する。概念マップ記憶部20は、一例としては、ノードの識別子とそのノードが表す概念とを対応付ける表データと、リンクの識別子とそのリンクが結ぶ2個のノードの識別子の対とを対応付ける表データとして、概念マップの情報を保持する。なお、この例に限らず、一般にグラフを表現するために用いられるデータ形式を適用するようにしても良い。   The concept map storage unit 20 holds information on concept maps in a data format that is easy to process. As an example, the concept map storage unit 20 includes table data that associates a node identifier with the concept represented by the node, and table data that associates a link identifier and a pair of identifiers of two nodes connected by the link. Holds information about concept maps. Note that the present invention is not limited to this example, and a data format generally used for expressing a graph may be applied.

次に、概念処理装置1が計算する概念間の関連度について説明する。
本実施形態において、概念間の関連度は、概念マップにおけるそれらの概念間のつながり方に応じて算出される。概念処理装置1による処理において、概念は既に述べたようにグラフ上のノードに対応している。また、概念間はリンクで結ばれている場合と結ばれていない場合とがある。1本のリンクは、隣接する概念同士をつなぐものであり、且つそれら隣接する概念同士のみをつなぐものである。ある概念から他のある概念に、概念マップ上を辿って到達できるとき、それら概念は互いに連結の状態にある。概念間が連結の状態にあることの条件は、その一方の概念から他方の概念に、1本以上のリンクを辿って到達できることである。そのときに辿るルートを、ここではパスと呼ぶ。パスは、1本または複数本のリンクによって成る。リンクが複数本の場合、パスは、それらのリンクを直列に連結させてなるものである。ある概念と他の概念が連結の状態にあるとき、それら両概念をつなぐパスは1本とは限らない。複数の異なるパスを通って、辿りつくこともできる場合もある。なお、1本のパスは、同じ概念を2度以上通らない。つまり、パスが途中で閉路を形成したり、後戻りしたりすることはない。本実施形態では、概念の重みに基づいて、その概念を含むパスの重みが算出される。また、パスの重みに基づいて、概念間の関連度が算出される。概念間の関連度は、また、当該概念間をつなぐパスの本数によっても決まる。
Next, the degree of association between concepts calculated by the concept processing device 1 will be described.
In the present embodiment, the degree of association between concepts is calculated according to how the concepts are connected in the concept map. In the processing by the concept processing device 1, the concept corresponds to the node on the graph as described above. In addition, there are cases where concepts are connected by links and cases where concepts are not connected. One link connects adjacent concepts and connects only those adjacent concepts. When one concept can reach another concept on the concept map, the concepts are connected to each other. The condition that the concepts are in a connected state is that one concept can reach the other concept by following one or more links. The route followed at that time is called a path here. A path consists of one or more links. When there are a plurality of links, the path is formed by connecting these links in series. When one concept and another concept are connected, there is not always a single path connecting the two concepts. Sometimes it can be reached through several different paths. One pass does not pass the same concept more than once. That is, the path does not form a closed circuit or go back. In this embodiment, based on the concept weight, the weight of the path including the concept is calculated. Further, the degree of association between concepts is calculated based on the path weight. The degree of association between concepts is also determined by the number of paths connecting the concepts.

まず、概念処理装置1は、概念マップに含まれる各概念の重みを計算する。概念の重みは、関連度を計算する上でのその概念の重要性を表す数値である。概念の重みは、その概念から他の概念につながるリンクの本数に応じて算出される。そのリンクの数が少ないほど、その概念の重みの値は大きい。これは、ある概念からつながるリンクの本数が少ないほうがその概念は貴重な概念であるという前提による。より具体的には、概念の重みは、その概念からつながる他の概念へのリンクの本数の逆数の対数によって算出される。ただし、概念の重みの値を正規化するためには、概念マップ上の全概念数を上記のリンク本数で除した数値の対数を、その概念の重みとする。対数の底は、適宜定めて良い。   First, the concept processing device 1 calculates the weight of each concept included in the concept map. The concept weight is a numerical value representing the importance of the concept in calculating the degree of association. The concept weight is calculated according to the number of links from the concept to other concepts. The smaller the number of links, the greater the value of the concept weight. This is based on the premise that the concept is precious when the number of links connected from a concept is small. More specifically, the concept weight is calculated by the logarithm of the reciprocal of the number of links from the concept to other concepts connected. However, in order to normalize the value of the concept weight, the logarithm of the numerical value obtained by dividing the total number of concepts on the concept map by the number of links is used as the concept weight. The base of the logarithm may be determined as appropriate.

次に、概念処理装置1は、パスの重みを計算する。前述の定義にしたがうと、パス上には、複数の概念が存在する。パスの両端もまたそれぞれ概念である。パスの重みは、そのパスが含む各々の概念の重みによって算出される。より具体的には、パスの重みは、そのパスが含む各々の概念の重みの何らかの平均によって算出される。ここで、何らかの平均とは、例えば、単純な相加平均や、調和平均や、相乗平均などである。より具体的には、概念処理装置1は、各々の概念の重みの調和平均の値を、そのパスの重みの値として算出する。これは、実際の概念マップを用いた実験により、調和平均を用いることで最も好適なパスの重みが算出できることがわかったことによる。   Next, the conceptual processing device 1 calculates a path weight. According to the above definition, there are multiple concepts on the path. Both ends of the path are also concepts. The path weight is calculated by the weight of each concept included in the path. More specifically, the path weight is calculated by some average of the weights of the concepts included in the path. Here, the certain average is, for example, a simple arithmetic average, harmonic average, or geometric average. More specifically, the concept processing device 1 calculates the harmonic average value of the weights of each concept as the value of the weight of the path. This is because it has been found from experiments using an actual concept map that the most suitable path weight can be calculated by using the harmonic average.

次に、概念処理装置1は、パスの重みの値に基づき、概念間の関連度を算出する。本実施形態による概念間の関連度は、その概念間のパスの重みのうちの、最大の重みの値と、当該概念間に存在するパスの本数との積として算出される。   Next, the concept processing device 1 calculates the degree of association between concepts based on the path weight value. The degree of association between concepts according to the present embodiment is calculated as the product of the maximum weight value of the path weights between the concepts and the number of paths existing between the concepts.

なお、現実的な計算量で概念間の関連度を算出するための手順については、後で説明する。その手順においては、妥当な計算量で概念マップを探索するために、探索する距離(=1本のパスに含まれる直列なリンクの数)に上限を設ける。この上限の値はパラメーターとして設定することができる。なお、この手順を用いた場合の概念間の関連度は、有向的である。即ち、概念Aから概念Bへの関連度の値と、逆の概念Bから概念Aへの関連度の値とは、異なる場合がある。   A procedure for calculating the degree of association between concepts with a realistic calculation amount will be described later. In the procedure, in order to search the concept map with a reasonable amount of calculation, an upper limit is set on the search distance (= the number of serial links included in one path). This upper limit value can be set as a parameter. Note that the degree of association between concepts when using this procedure is directed. That is, the relevance value from concept A to concept B may be different from the relevance value from concept B to concept A.

整理すると、次の通りである。
このように概念処理装置1が算出する概念間の関連度は、当該概念間に存在するパスの本数に応じて求められる。つまり、パスの本数が多いほど、関連度の値は大きい。これは、様々なパスでつながっている概念同士は、互いに関連が高いという想定に整合する。
また、概念処理装置1が算出する概念間の関連度は、パスの重み(の最大値)に応じて求められる。つまり、パスの重みの最大値が大きいほど、関連度の値は大きい。これは、重要性の高いパスによってつながっている概念同士は、互いに関連が高いという想定に整合する。
また、概念処理装置1が算出するパスの重みは、そのパスが含む概念の重みに応じて求められる。概念の重みが大きいほど、パスの重みは大きい。パスの重みとして、概念の重みの調和平均を用いることが好ましいが、概念の重みの相乗平均を用いても良い。
The following is a summary.
Thus, the degree of association between concepts calculated by the concept processing device 1 is obtained according to the number of paths existing between the concepts. That is, the greater the number of paths, the greater the relevance value. This is consistent with the assumption that concepts connected by various paths are highly related to each other.
Further, the degree of association between concepts calculated by the concept processing device 1 is obtained in accordance with the path weight (its maximum value). That is, the greater the maximum value of the path weight, the greater the relevance value. This is consistent with the assumption that concepts connected by highly important paths are highly related to each other.
In addition, the path weight calculated by the concept processing device 1 is obtained according to the concept weight included in the path. The greater the concept weight, the greater the path weight. As a path weight, it is preferable to use a harmonic average of concept weights, but a geometric average of concept weights may be used.

ここで、概念重み算出部12によって計算される概念の重みについて、説明する。
図3は、概念の重みを説明するための概略図であり、概念マップの一部分を示している。同図において、「A」、「C」、「D」、「E」というラベルが付けられた丸印は、それぞれ概念に相当するノードである。また、ノードから伸びる線は、ノード間のリンクであり、概念と概念との間の直接の関係を表している。同図では、概念マップの一部分のみを示しているが、実際の概念マップは同図に示す範囲外にも伸びている。
Here, the concept weight calculated by the concept weight calculator 12 will be described.
FIG. 3 is a schematic diagram for explaining the weight of the concept, and shows a part of the concept map. In the figure, circles labeled “A”, “C”, “D”, and “E” are nodes corresponding to concepts. A line extending from the node is a link between the nodes and represents a direct relationship between the concepts. In the figure, only a part of the concept map is shown, but the actual concept map extends beyond the range shown in the figure.

同図では、概念マップの一部分のみを示しているが、この概念マップ全体のノード数(概念数)をNとする。Nは正整数であり、例えば、N=10000である。概念の重みを説明するために、一例として、同図に示す「C」でラベル付けされたノードに着目する。このノード「C」からは、ノード「A」、「D」、「E」への直接のリンクがつながっている。なお、このノード「C」からは、これらノード「A」、「D」、「E」以外のノードへの直接のリンクはつながっていない。つまり、このノード「C」から直接つながる他のノードへのリンクの数は3である。   Although only a part of the concept map is shown in the figure, the number of nodes (concept number) of the entire concept map is N. N is a positive integer, for example, N = 10000. In order to explain the weight of the concept, as an example, attention is paid to a node labeled “C” shown in FIG. From this node “C”, direct links to nodes “A”, “D”, and “E” are connected. Note that a direct link from the node “C” to a node other than the nodes “A”, “D”, and “E” is not connected. That is, the number of links from the node “C” to other nodes directly connected is three.

本実施形態における概念の重みは、次の式によって計算される。
概念の重み=log(N/n)
ここで、Nは、上記の通り、概念マップ全体に含まれる全概念数である。また、nは、当該概念に直接つながる概念の数である。なお、対数の底は適宜定めればよいが、ここでは底を10とする。図示した例において、ノード「C」に直接つながる他のノードの数は3(n=3)であり、概念マップに含まれる全ノード数は10000(N=10000)である。よって、上の式により、ノード「C」に相当する概念の重みは、次のように計算される。
ノード「C」の概念の重み=log10(10000/3)=3.52
ただし、小数点第3位を四捨五入して丸めている。
The concept weight in this embodiment is calculated by the following equation.
Concept weight = log (N / n)
Here, N is the total number of concepts included in the entire concept map as described above. N is the number of concepts directly connected to the concept. The base of the logarithm may be determined as appropriate, but here the base is 10. In the illustrated example, the number of other nodes directly connected to the node “C” is 3 (n = 3), and the total number of nodes included in the concept map is 10,000 (N = 10000). Therefore, the weight of the concept corresponding to the node “C” is calculated as follows using the above formula.
Conceptual weight of node “C” = log 10 (10000/3) = 3.52
However, the third decimal place is rounded off.

図4は、概念の重みを保持するためのデータの構成を示す概略図である。このデータは、作業記憶部22の所定の領域内に設けられる。図示するデータは、表形式のデータであり、ノードID、概念(ノードに対応した概念)、つながる概念、重みの各項目を有している。この表の1行が、1つの概念、即ち1つのノードに対応する。ノードIDは、概念マップ内のノードをユニークに識別するIDである。図示する例では、ノードIDとして整数値を用いている。概念の項目には、その概念を表す言葉が格納される。つながる概念の項目には、当該概念から直接のリンクによって連結されている概念のノードIDのリストが格納される。重みの項目には、当該概念について計算された重みの値が格納される。   FIG. 4 is a schematic diagram showing a configuration of data for holding concept weights. This data is provided in a predetermined area of the work storage unit 22. The illustrated data is tabular data and includes items of node ID, concept (concept corresponding to the node), connected concept, and weight. One row of this table corresponds to one concept, ie one node. The node ID is an ID that uniquely identifies a node in the concept map. In the illustrated example, an integer value is used as the node ID. In the concept item, a word representing the concept is stored. In the connected concept item, a list of node IDs of concepts connected by a direct link from the concept is stored. In the weight item, a weight value calculated for the concept is stored.

同図では、表全体のうちの一部の値を示している。そのノードIDは、98から102までの範囲である。また、それら各ノードの概念は、A,B,C,D,Eである。ここで概念C(ノードIDは100)に着目すると、その概念Cからつながる概念のノードIDは、98,101,102の3個である。つまり、概念Cは、概念AとDとEとに、直接のリンクでつながっている(図3に例示した通り)。また、概念Cの重みとして、3.52という値が格納されている。   In the figure, some values of the entire table are shown. The node ID ranges from 98 to 102. The concept of each node is A, B, C, D, E. When attention is paid to the concept C (node ID is 100), there are three concept node IDs connected to the concept C: 98, 101, and 102. That is, the concept C is connected to the concepts A, D, and E by a direct link (as illustrated in FIG. 3). Further, the value 3.52 is stored as the weight of the concept C.

ここで、パス重み算出部14によって計算されるパスの重みについて、説明する。
図5は、パスの重みを説明するための概略図であり、概念マップの一部分を示している。同図において、「1」、「2」、「3」、「4」、「5」というラベルが付けられた丸印は、それぞれ概念に相当するノードである。また、ノードから伸びる線は、ノード間のリンクであり、概念と概念との間の直接の関係を表している。同図では、概念マップの一部分のみを示しているが、実際の概念マップは同図に示す範囲外にも伸びている。
Here, the path weight calculated by the path weight calculation unit 14 will be described.
FIG. 5 is a schematic diagram for explaining path weights, and shows a part of the concept map. In the figure, the circles labeled “1”, “2”, “3”, “4”, “5” are nodes corresponding to concepts, respectively. A line extending from the node is a link between the nodes and represents a direct relationship between the concepts. In the figure, only a part of the concept map is shown, but the actual concept map extends beyond the range shown in the figure.

パスとは、ある概念からある概念までのルートである。例えば同図において、ノード「1」からノード「5」までのパスは、少なくとも2つある。その第1のパスは、ノードの列として「1−2−3−5」と表される。また第2のパスは、同様にノードの列として「1−2−4−5」と表される。このように、両端のノードを含んで、パス上のノードを列として並べることにより、パスを表すことができる。そして、本実施形態では、パスの重みを、そのパス上の各ノード(両端のノードを含む)の重みの調和平均として定義する。   A path is a route from one concept to another. For example, in the figure, there are at least two paths from the node “1” to the node “5”. The first path is represented as “1-2-3-5” as a column of nodes. Similarly, the second path is represented as “1-2-4-5” as a node column. In this way, a path can be represented by arranging nodes on the path as a column including nodes at both ends. In this embodiment, the path weight is defined as a harmonic average of the weights of each node (including nodes at both ends) on the path.

一般に、M個の数値w,w,・・・,wの調和平均は、次の式で表される。即ち、M/(1/w+1/w+・・・+1/w)である。 In general, the harmonic average of M numerical values w 1 , w 2 ,..., W M is expressed by the following equation. That is, M / (1 / w 1 + 1 / w 2 +... + 1 / w M ).

したがって、ノード「1」から「5」までの重み(つまり、概念の重み)が計算済であり、そのそれぞれをwn1,wn2,・・・,wnMとしたとき、上記の第1のパスの重みと、第2のパスの重みは、それぞれ、次の式で表される。
(第1のパスの重み)=4/(1/wn1+1/wn2+1/wn3+1/wn5
(第2のパスの重み)=4/(1/wn1+1/wn2+1/wn4+1/wn5
Therefore, when the weights from the nodes “1” to “5” (that is, the concept weights) have been calculated, and each of them is denoted by w n1 , w n2 ,..., W nM , The weight of the path and the weight of the second path are each expressed by the following equations.
(Weight of the first path) = 4 / (1 / w n1 + 1 / w n2 + 1 / w n3 + 1 / w n5 )
(Weight of the second path) = 4 / (1 / w n1 + 1 / w n2 + 1 / w n4 + 1 / w n5 )

図6は、作業記憶部22が保持するデータの構成の一部を示す概略図である。同図に示すデータは、主に、パス重み算出部14が概念マップ記憶部20を参照しながら概念マップを探索する際に、一時的に記憶すべき情報を格納するための手段である。同図に含まれる各データ項目の意味は、次の通りである。   FIG. 6 is a schematic diagram illustrating a part of the data configuration held by the work storage unit 22. The data shown in the figure is mainly means for storing information to be temporarily stored when the path weight calculation unit 14 searches for a concept map while referring to the concept map storage unit 20. The meaning of each data item included in the figure is as follows.

データ項目「計算対象の概念」は、概念マップの中でその時点で1個選ばれている概念であり、関連度を計算する対象となっている概念である。例えば、計算対象の概念が図2に示した概念マップにおける「病気」であるとき、概念処理装置1は、この概念「病気」から他の各概念への関連度を計算する。なお、計算対象の概念を、以下において便宜上、「概念A」と呼ぶことがある。
データ項目「起点概念の配列」は、計算対象の概念から所定の距離(変数Dによって保持される値の距離)のパスを探索するときに起点となる概念を要素として持つ配列である。
データ項目「辿った概念数」は、その時点での計算対象の概念からの距離を保持するデータであり、上記の変数Dに対応するものである。
The data item “concept of calculation target” is a concept selected at that time in the concept map, and is a concept for which the degree of association is calculated. For example, when the concept to be calculated is “disease” in the concept map shown in FIG. 2, the concept processing device 1 calculates the degree of association from this concept “disease” to each other concept. In addition, the concept of calculation object may be called "concept A" for convenience below.
The data item “starting point concept array” is an array having, as elements, a concept that becomes a starting point when searching for a path of a predetermined distance (a distance of a value held by the variable D) from the concept to be calculated.
The data item “number of concepts traced” is data that holds the distance from the concept to be calculated at that time, and corresponds to the variable D described above.

データ項目「起点の概念」は、その時点で起点として選択されている概念である。データ項目「起点の概念」には、上記の起点概念の配列の中から選択された1つの概念が格納される。なお、起点の概念を、以下において便宜上、「概念C」と呼ぶことがある。
データ項目「隣接概念の配列」は、上記の起点の概念に隣接する概念を要素として持つ配列である。ここで、概念が「隣接する」とは、ある概念と他の1つの概念とが、単一のリンクを隔ててつながっていることを意味する。例えば、図2で示した概念マップの例において、概念「病気」と概念「高血圧」とは互いに隣接する概念である。また、概念「発熱」と概念「風邪」とは互いに隣接する概念である。また、概念「糖尿病」と概念「風邪」とは、リンクによって直接つながっている関係にないため、これら両者は互いに隣接する概念ではない。なお、隣接概念(つまり、隣接概念の配列の一要素)を、以下において便宜上、「概念B」と呼ぶことがある。
The data item “concept of origin” is a concept selected as the origin at that time. In the data item “concept of starting point”, one concept selected from the array of starting point concepts is stored. The concept of the starting point may be referred to as “concept C” for convenience in the following.
The data item “arrangement of adjacent concepts” is an array having, as elements, concepts adjacent to the concept of the starting point. Here, the concept “adjacent” means that one concept and another concept are connected via a single link. For example, in the example of the concept map shown in FIG. 2, the concept “disease” and the concept “hypertension” are adjacent to each other. The concept “fever” and the concept “cold” are concepts adjacent to each other. Further, since the concept “diabetes” and the concept “cold” are not directly connected by a link, they are not adjacent to each other. Note that the adjacent concept (that is, one element of the array of adjacent concepts) may be referred to as “concept B” for convenience in the following.

なお、図6に示した各データ領域の使用例については、後で、処理実例として説明する。   A usage example of each data area shown in FIG. 6 will be described later as a processing example.

図7は、作業記憶部22が保持するデータの構成の一部を示す概略図である。同図に示すデータは、主に、パス重み算出部14が概念マップ記憶部20を参照しながら概念マップを探索する際に、各概念の関連度を算出するための数値等を記憶するものである。具体的には、パス重み算出部14は、後で説明する処理手順により、計算対象の概念(概念A)と各概念との間のパス(特に、複数のパスがある場合には、重みが最大となるパス)についての、情報を順次更新していく。なお、このデータは表形式のデータであり、この表の各行が、1つの概念に対応する。同図に含まれる各データ項目の意味は、次の通りである。   FIG. 7 is a schematic diagram illustrating a part of the data configuration held by the work storage unit 22. The data shown in the figure mainly stores numerical values for calculating the relevance of each concept when the path weight calculation unit 14 searches the concept map while referring to the concept map storage unit 20. is there. Specifically, the path weight calculation unit 14 uses a processing procedure described later to calculate a path between a concept to be calculated (concept A) and each concept (especially when there are a plurality of paths, the weight is calculated). The information about the maximum path is updated sequentially. This data is tabular data, and each row of this table corresponds to one concept. The meaning of each data item included in the figure is as follows.

データ項目「概念」は、その概念を表す言葉のデータを格納する。例えば、図2で示した概念マップの例において、「高血圧」や「成人病」などといった言葉であって、その概念をユニークに特定する情報を、このデータ項目は格納する。また、パス重み算出部14の処理手順に関連付けて言うと、このデータ項目によって表される概念は、前記の「概念B」に当たるものである。   The data item “concept” stores data of words representing the concept. For example, in the example of the concept map shown in FIG. 2, this data item stores information that uniquely identifies the concept, such as “hypertension” or “adult disease”. Further, in terms of the processing procedure of the path weight calculation unit 14, the concept represented by this data item corresponds to the “concept B”.

データ項目「MAX_Weight」は、計算対象の概念(概念A)から当該概念(概念B)までのパスの重みのうちの、最大の重みの値を保持する。一般的に、概念Aと概念Bとの間が、所定の距離(MAX_Distance)内において連結されているとき、両概念相互間のパス(辿り得るルート)の数は1以上である。パス重み算出部14は、これらのパスのうち、既に計算されたパスの重みの中の最大の値によってデータ項目「MAX_Weight」を更新する。
データ項目「MAX_Path」は、上記の「MAX_Weight」に対応するパスの情報を格納する。つまり、データ項目「MAX_Path」は、概念Aと概念Bとの間のパスのうち、既に計算された重みが最大であるパスの情報を保持するためのものである。具体的には、データ項目「MAX_Path」は、そのパス上に含まれる概念(パスの両端の概念を含む)の列を、そのパスの情報として保持する。このような、パス上に含まれる概念の列の情報は、概念マップ上におけるパスをユニークに特定する。
The data item “MAX_Weight” holds the value of the maximum weight among the weights of the path from the concept to be calculated (concept A) to the concept (concept B). In general, when the concept A and the concept B are connected within a predetermined distance (MAX_Distance), the number of paths (routes that can be traced) between the two concepts is one or more. The path weight calculation unit 14 updates the data item “MAX_Weight” with the maximum value among the already calculated path weights among these paths.
The data item “MAX_Path” stores information on a path corresponding to the above “MAX_Weight”. That is, the data item “MAX_Path” is for holding information on the path having the maximum weight already calculated among the paths between the concept A and the concept B. Specifically, the data item “MAX_Path” holds a column of concepts (including concepts at both ends of the path) included in the path as information on the path. Such information on the concept column included in the path uniquely identifies the path on the concept map.

データ項目「NUM_Path」は、概念Aから概念Bまでのパスの数を格納するものである。なお、パス重み算出部14が概念マップを探索するとき、このNUM_Pathの値は、次のように計算される。つまり、D=n(ただし、0≦n<MAX_Distance−1)のときの、概念Aから概念Bまでのパスの数をNUM_PathD=n(A,B)とする。また、D=nのときの、概念Aから概念Cまでのパスの数をNUM_PathD=n(A,C)とする。ここで、NUM_PathD=n(A,B)には、概念Cを通るパスの数は含まれていない。そして、D=n+1において概念Cから概念Bへの直接のリンクによるパスを探索したとき(つまり、このD=n+1において概念Cを経由して概念Aから概念Bに至るパスが探索された)、次の式が成り立つ。 The data item “NUM_Path” stores the number of paths from concept A to concept B. Note that when the path weight calculation unit 14 searches the concept map, the value of NUM_Path is calculated as follows. That is, the number of paths from concept A to concept B when D = n (where 0 ≦ n <MAX_Distance−1) is NUM_Path D = n (A, B). The number of paths from concept A to concept C when D = n is NUM_Path D = n (A, C). Here, NUM_Path D = n (A, B) does not include the number of paths passing through the concept C. When a path by a direct link from concept C to concept B is searched for at D = n + 1 (that is, a path from concept A to concept B is searched via concept C at D = n + 1). The following formula holds:

NUM_PathD=n+1(A,B)=(NUM_PathD=n(A,B))+(NUM_PathD=n(A,C)) NUM_Path D = n + 1 (A, B) = (NUM_Path D = n (A, B)) + (NUM_Path D = n (A, C))

次に、概念処理装置1による処理の手順について説明する。
図8および図9は、概念処理装置1による処理の手順を示すフローチャートである。これら両図は、フローチャートの結合子によって互いに結合されている。以下、このフローチャートに沿って、手順を説明する。
Next, a procedure of processing by the conceptual processing device 1 will be described.
FIG. 8 and FIG. 9 are flowcharts showing a procedure of processing by the conceptual processing device 1. These two figures are connected to each other by a connector of the flowchart. Hereinafter, the procedure will be described with reference to this flowchart.

まずステップS10(図8)において、パラメーター設定部18は、最大距離(MAX_Distance)をパラメーターの値として付与する。具体的には、パラメーター設定部18は、MAX_Distanceの設定値を、作業記憶部22内の所定の領域に書き込む。付与されるMAX_Distanceの値は正整数である。このMAX_Distanceの値は、概念マップにおいて、概念から概念へとたどるときの最大距離を規定する。例えば、ある概念とある概念とが直接のリンクによって結ばれているとき、そのルートによる当該概念間の距離は1である。また、ある概念とある概念とが、途中に1個だけの中間概念を介してリンクによって間接的に結ばれているとき、そのルートによる当該概念間の距離は2である。つまり、ある概念とある概念とが1つまたは複数の中間概念を介してリンクによって間接的に結ばれているとき、そのルートをたどるときのリンク数が、当該概念間の距離である。   First, in step S10 (FIG. 8), the parameter setting unit 18 assigns the maximum distance (MAX_Distance) as a parameter value. Specifically, the parameter setting unit 18 writes the MAX_Distance setting value in a predetermined area in the work storage unit 22. The value of MAX_Distance assigned is a positive integer. The value of MAX_Distance defines the maximum distance when the concept is followed from concept to concept in the concept map. For example, when a concept and a concept are connected by a direct link, the distance between the concepts by the route is 1. In addition, when a concept and a concept are indirectly connected by a link through only one intermediate concept in the middle, the distance between the concepts by the route is 2. That is, when a concept and a concept are indirectly connected by a link through one or more intermediate concepts, the number of links when following the route is the distance between the concepts.

次にステップS20において、概念重み算出部12は、概念マップに含まれる各概念について、その概念と直接のリンクによって結ばれている概念を列挙した、概念のリストを作成する。概念重み算出部12は、その概念のリストを、図4に示した表の中の、つながる概念の欄に書き込む。また、概念重み算出部12は、そのつながる概念のリストに基づいて、各概念の重みを計算する。計算方法は、既に述べたようにlog(N/n)の数式による。概念重み算出部12は、各概念について計算した値を、図4に示した表の中の重みの欄に書き込む。   Next, in step S20, the concept weight calculation unit 12 creates a concept list in which each concept included in the concept map is enumerated by the concepts linked by the direct link. The concept weight calculator 12 writes the concept list in the connected concept column in the table shown in FIG. The concept weight calculator 12 calculates the weight of each concept based on the connected concept list. The calculation method is based on the log (N / n) formula as described above. The concept weight calculation unit 12 writes the value calculated for each concept into the weight column in the table shown in FIG.

次のステップS30から、S90およびS100までの処理は、パス重み算出部14が概念マップを辿りながら、パスの重みを算出し、更新していく処理である。   The processes from the next step S30 to S90 and S100 are processes in which the path weight calculation unit 14 calculates and updates the path weight while following the concept map.

ステップS30において、パス重み算出部14は、計算対象となる概念(概念Aと呼ぶ)を起点概念の配列に格納する。つまり、計算対象となる概念が、起点概念の初期値である。また、パス重み算出部14は、辿る距離をカウントするための変数であるDの値を0に初期化する。この変数Dは、概念マップにおいて、概念から概念へとたどるときの、その時点でのパスの長さ(パスに含まれるリンク数)の値を記憶する。この変数Dのあたいと、上述したパラメーターであるMAX_Distanceの値との関係によって、概念処理装置1は、概念マップの探索の終了条件を判断する。   In step S30, the path weight calculation unit 14 stores the concept to be calculated (referred to as concept A) in the starting concept array. That is, the concept to be calculated is the initial value of the starting point concept. Further, the path weight calculation unit 14 initializes the value of D, which is a variable for counting the distance traveled, to 0. This variable D stores the value of the path length (number of links included in the path) at the time when the concept map is followed from concept to concept. The concept processing apparatus 1 determines a termination condition for searching the concept map based on the relationship between the variable D and the value of the above-described parameter MAX_Distance.

次にステップS40において、パス重み算出部14は、起点概念の配列からひとつ選んだ概念を、起点の概念(概念Cと呼ぶ)とする。パス重み算出部14は、メモリー内の起点の概念を格納する領域に、その選ばれた概念を書き込む。そして、パス重み算出部14は、その起点の概念(概念C)から直接のリンクでつながる先の概念のすべてを、隣接概念の配列に書き込む。このとき、パス重み算出部14は、概念マップ記憶部20を参照して概念Cにつながる概念を得ても良く、また既に作成した図4のデータを参照することによって概念Cにつながる概念を得ても良い。   In step S40, the path weight calculation unit 14 sets the concept selected from the starting point concept array as the starting point concept (referred to as concept C). The path weight calculation unit 14 writes the selected concept in an area for storing the concept of the starting point in the memory. Then, the path weight calculation unit 14 writes all of the previous concepts connected by a direct link from the concept of the starting point (concept C) to the array of adjacent concepts. At this time, the path weight calculation unit 14 may obtain a concept connected to the concept C with reference to the concept map storage unit 20 or obtain a concept connected to the concept C by referring to the data of FIG. 4 already created. May be.

次にステップS50において、パス重み算出部14は、隣接概念の配列の中の各概念(概念Bと呼ぶ)について、概念Aから概念Cを経由して概念Bまでのパスの重みを算出する。そして、そのパスについて計算された重みが、既に計算済の概念Aから概念Bまでのパスの重み(MAX_Weight(A,B)として計算済の重みの値)よりも大きい場合には、そのMAX_Weight(A,B)を更新するとともに、そのパスの情報をMAX_Path(A,B)の値として記録する。そのパスとは、MAX_Path(A,C)に既に記録されているパスを延長して概念Bまで伸ばしたものである。言い換えれば、そのパスとは、MAX_Path(A,C)に既に記録されているパスに概念Bを連結したものである。
なお、MAX_Weight(A,B)として計算済の値がまだなかった場合には、今回計算された値を、パスの重み値MAX_Weight(A,B)として記憶するようにする。また、その重みに対応するパスを、MAX_Path(A,B)として記憶するようにする。
Next, in step S50, the path weight calculation unit 14 calculates the weight of the path from concept A to concept B via concept C for each concept (referred to as concept B) in the array of adjacent concepts. When the weight calculated for the path is larger than the weight of the path from the concept A to the concept B that has already been calculated (the value of the weight calculated as MAX_Weight (A, B)), the MAX_Weight ( A, B) is updated, and the path information is recorded as the value of MAX_Path (A, B). The path is obtained by extending the path already recorded in MAX_Path (A, C) to concept B. In other words, the path is obtained by connecting the concept B to the path already recorded in MAX_Path (A, C).
If there is no value already calculated as MAX_Weight (A, B), the value calculated this time is stored as the path weight value MAX_Weight (A, B). The path corresponding to the weight is stored as MAX_Path (A, B).

なお、上のステップS50の処理において、隣接概念の配列から取り出した概念(概念B)が、計算対象の概念(概念A)自身である場合には、パス重み算出部14は、そのパスの重みを計算したり、そのパスをMAX_Pathとして記録したりしない。   When the concept (concept B) extracted from the adjacent concept array is the calculation target concept (concept A) itself in the process of step S50 above, the path weight calculation unit 14 determines the weight of the path. Do not calculate or record the path as MAX_Path.

次にステップS60において、上のステップS50で処理対象とした概念Bの各々について、概念Aから概念Bへのパス数を更新する。つまり、それまでのNUM_Path(A,B)の値にNUM_Path(A,C)の値を加え、その加算の結果を新たなNUM_Path(A,B)の値とする。これは、概念Aから概念Cを経由して概念Bに至るパスが新たに探索されたことに対応する。   Next, in step S60, the number of paths from concept A to concept B is updated for each concept B processed in step S50 above. That is, the value of NUM_Path (A, C) is added to the value of NUM_Path (A, B) so far, and the result of the addition is set as a new value of NUM_Path (A, B). This corresponds to a new search for a path from concept A to concept B via concept C.

次にステップS70において、パス重み算出部14は、起点概念の配列の中に未計算の概念が残っているか否かを判断する。起点概念の配列の中に未計算の概念が残っている場合(ステップS70:YES)には、パス重み算出部14は、次の起点概念についての計算を行うためにステップS40に戻る。起点概念の配列の中に未計算の概念が残っていない場合(ステップS70:NO)には、パス重み算出部14は、次のステップS80に進む。   Next, in step S70, the path weight calculation unit 14 determines whether or not an uncalculated concept remains in the starting concept array. If an uncalculated concept remains in the starting concept array (step S70: YES), the path weight calculation unit 14 returns to step S40 to perform calculation for the next starting concept. If no uncalculated concepts remain in the starting concept array (step S70: NO), the path weight calculation unit 14 proceeds to the next step S80.

図9に移り、ステップS80において、パス重み算出部14は、距離をカウントするための変数であるDの値をインクリメントする。   Moving to FIG. 9, in step S80, the path weight calculation unit 14 increments the value of D, which is a variable for counting the distance.

そして、ステップS90において、パス重み算出部14は、変数Dの値がパラメーター値MAX_Distanceに達したか否かを判断する。具体的には、D<MAX_Distanceの不等式を満たすか否かを判断する。D<MAX_Distanceであるとき、即ち、探索しているパスの距離がまだ設定された最大値MAX_Distanceに達していないとき(ステップS90:YES)は、ステップS100に移り、パス重み算出部14による処理を続ける。つまりこの場合、パス重み算出部14は、ステップS80でインクリメントされた新たなDの値についてパスを探索してパスの重みを算出する処理を続ける。一方、D<MAX_Distanceではないとき、即ち、探索しているパスの距離が設定された最大値MAX_Distanceに達したとき(ステップS90:NO)は、ステップS110の関連度算出部16による処理に移る。   In step S90, the path weight calculation unit 14 determines whether the value of the variable D has reached the parameter value MAX_Distance. Specifically, it is determined whether or not the inequality D <MAX_Distance is satisfied. When D <MAX_Distance, that is, when the distance of the searched path has not yet reached the set maximum value MAX_Distance (step S90: YES), the process proceeds to step S100 and the processing by the path weight calculation unit 14 is performed. to continue. That is, in this case, the path weight calculation unit 14 continues the process of searching for a path for the new value of D incremented in step S80 and calculating the path weight. On the other hand, when D <MAX_Distance is not satisfied, that is, when the distance of the searched path reaches the set maximum value MAX_Distance (step S90: NO), the process proceeds to processing by the relevance calculation unit 16 in step S110.

そして、ステップS100に移った場合、同ステップにおいて、パス重み算出部14は、ステップS50とS60で処理した各概念(概念B)を、起点概念の配列(図6を参照)に書き込む。そして、次にステップS40(図8)に制御を戻し、処理を繰り返す。   When the process proceeds to step S100, the path weight calculation unit 14 writes each concept (concept B) processed in steps S50 and S60 to the starting concept array (see FIG. 6). Then, control is returned to step S40 (FIG. 8), and the process is repeated.

そして、ステップS110に移った場合、同ステップにおいて、関連度算出部16は、ここまでの処理で計算されたパスの重み、およびパスの数に基づいて、概念間の関連度を計算する。具体的には、関連度算出部16は、元の計算対象の概念(概念A)からパラメーターMAX_Distanceに設定された範囲内で辿り着くルートが2個以上ある概念(概念B)について、次に示す式による関連度を計算する。即ち;
(1)概念Aから概念Bへの関連度は、概念Aから概念BへのMAX_Weightの値に、概念Aから概念Bへのパスの数NUM_Pathの値を乗じたものとする。つまり、概念Aから概念Bへの関連度は、MAX_Weight(A,B)×NUM_Path(A,B)とする。
(2)ただし、上記(1)で算出される関連度を、次のように正規化する。つまり、正規化後の概念Aから概念Bへの関連度は、上記(1)の式で計算された概念Aから概念Bへの関連度を、概念Aから各概念への関連度の総和で除したものとする。つまり、この正規化後の関連度は、{MAX_Weight(A,B)×NUM_Path(A,B)}/(概念Aから概念マップ上の各概念への関連度の総和)である。このように正規化することにより、概念マップのサイズに依存しない値を算出することができる。
When the process proceeds to step S110, in the same step, the relevance calculation unit 16 calculates the relevance between the concepts based on the path weight and the number of paths calculated in the processing so far. Specifically, the degree-of-relevance calculation unit 16 describes the concept (concept B) having two or more routes that can be reached within the range set in the parameter MAX_Distance from the original concept (concept A) to be calculated. Calculate relevance by formula. Ie;
(1) The degree of association from concept A to concept B is obtained by multiplying the value of MAX_Weight from concept A to concept B by the value of the number of paths NUM_Path from concept A to concept B. That is, the degree of association from concept A to concept B is MAX_Weight (A, B) × NUM_Path (A, B).
(2) However, the relevance calculated in the above (1) is normalized as follows. That is, the degree of association from concept A to concept B after normalization is the degree of association from concept A to concept B calculated by the equation (1) above, with the sum of the degrees of association from concept A to each concept. Shall be divided. That is, the degree of association after normalization is {MAX_Weight (A, B) × NUM_Path (A, B)} / (total sum of degrees of association from concept A to each concept on the concept map). By normalizing in this way, a value independent of the size of the concept map can be calculated.

なお、上記のステップS110の処理において元の計算対象の概念(概念A)からパラメーターMAX_Distanceに設定された範囲内で辿り着くルートが2個以上ある概念(概念B)に限定して関連度を計算した理由は、次の通りである。即ち、概念Aから概念Bへ辿り着くルートが1個しかないような概念Bは、概念Aとの関連度は充分に小さく、関連がないものと見なしてしまって差し支えないためである。   It should be noted that the degree of relevance is calculated by limiting to the concept (concept B) that has two or more routes that can be reached within the range set in the parameter MAX_Distance from the original calculation target concept (concept A) in the process of step S110 above. The reason for this is as follows. That is, the concept B that has only one route from the concept A to the concept B has a sufficiently small degree of association with the concept A and can be regarded as having no relation.

次に、ステップS120において、概念処理装置1は、計算対象の概念であって且つ未計算の概念があるか否かを判定する。未計算の概念がある場合(ステップS120:YES)には、次の計算対象の概念についての処理に移るために、ステップS30(図8)に戻る。未計算の概念がある場合(ステップS120:NO)には、このフローチャート全体の処理を終了する。   Next, in step S120, the concept processing device 1 determines whether or not there is a concept to be calculated and an uncalculated concept. If there is an uncalculated concept (step S120: YES), the process returns to step S30 (FIG. 8) in order to move to the process for the next concept to be calculated. If there is an uncalculated concept (step S120: NO), the process of the entire flowchart is terminated.

[処理の実例]
次に、処理の実例について説明する。なお、以下の説明の中で、図11,図12,図13,図14に言及する。これらの図面は、下で述べる処理実例の過程におけるメモリー(作業記憶部22)の状態を示す概略図である。図11は、図6で説明した記憶領域が保持する値の推移を示すものである。また、図12,図13,図14は、図7で説明した記憶領域が保持する値の推移を示すものである。
[Example of processing]
Next, an example of processing will be described. In the following description, reference is made to FIG. 11, FIG. 12, FIG. 13, and FIG. These drawings are schematic views showing the state of the memory (work storage unit 22) in the course of the processing examples described below. FIG. 11 shows transition of values held in the storage area described with reference to FIG. 12, 13, and 14 show transitions of values held in the storage area described with reference to FIG. 7.

本例の処理が対象とする概念マップは、図2に示したものである。同図に示す概念マップの例には、「病気」、「高血圧」、「糖尿病」、「成人病」、「風邪」、「インフルエンザ」、「発熱」という7つの概念が含まれる。これらの概念の各々は、概念マップのグラフにおけるノードに対応する。そして、ノード間を結ぶリンクが、概念間の関係に対応している。同図に例示するグラフには、病気−高血圧、病気−成人病、病気−糖尿病、病気−風邪、病気−インフルエンザ、成人病−高血圧、成人病−糖尿病、風邪−発熱、インフルエンザ−発熱というリンクが含まれている。   The concept map targeted by the processing of this example is the one shown in FIG. The example of the concept map shown in the figure includes seven concepts of “disease”, “hypertension”, “diabetes”, “adult disease”, “cold”, “influenza”, and “fever”. Each of these concepts corresponds to a node in the concept map graph. And the link which connects between nodes respond | corresponds to the relationship between concepts. In the graph illustrated in the figure, there are links of disease-high blood pressure, disease-adult disease, disease-diabetes, disease-cold, disease-flu, adult disease-hypertension, adult disease-diabetes, cold-fever, influenza-fever. include.

以下に処理手順にしたがって、処理例を説明する。なお、以下の処理例の説明において言及するステップ番号は、図8および図9のフローチャートで示した手順におけるステップ番号である。
ステップS10:まず、概念処理装置1のパラメーター設定部18は、パラメーターMAX_Distanceの値を、本処理例では、2に設定する。
A processing example will be described below according to the processing procedure. Note that the step numbers mentioned in the following description of the processing examples are the step numbers in the procedure shown in the flowcharts of FIGS.
Step S10: First, the parameter setting unit 18 of the conceptual processing device 1 sets the value of the parameter MAX_Distance to 2 in this processing example.

ステップS20:次に、概念重み算出部12は、概念マップに含まれる各概念について、直接つながっている概念を列挙したリストを作成するとともに、重みを計算する。   Step S20: Next, the concept weight calculation unit 12 creates a list that enumerates directly connected concepts for each concept included in the concept map, and calculates a weight.

図10は、このステップS20で作成された、各概念に関する情報を保持するテーブルの実例を示す概略図である。図示するように、このテーブルは表形式の構造を有しており、その各行が概念マップに含まれる概念(ノード)に対応する。そして、各桁は、データ項目(属性)に対応しており、ノードID、概念(ノード)、つながる概念(ノード)、重みの各桁が存在する。   FIG. 10 is a schematic diagram illustrating an example of a table that holds information about each concept created in step S20. As shown in the figure, this table has a tabular structure, and each row corresponds to a concept (node) included in the concept map. Each digit corresponds to a data item (attribute), and there are each digit of node ID, concept (node), connected concept (node), and weight.

ノードIDは、各概念に対して便宜的に付与された識別情報である。図示する例では、1から7までの数値がノードIDとして付与されている。
概念(ノード)は、その概念を表す言葉である。本例では、「病気」、「成人病」などといった言葉がこの欄に格納されている。
つながる概念(ノード)は、当該概念から直接のリンクでつながっている先の概念(ノード)のリストである。例えば、ノード「病気」から直接のリンクでつながるノードは5個あり、それらは、「高血圧」、「成人病」、「糖尿病」、「風邪」、「インフルエンザ」である。概念「病気」についての、つながる概念の欄には、これら5個のリンク先の概念が列挙されたリストが格納されている。
重みは、当該概念(ノード)についての重みの値を格納する。この概念マップに現れる全概念数が7であるため、例えば、概念「病気」(直接つながる先の概念数が5)についての重みは、前述の定義log(N/n)により、log(7/5)、つまり0.15(小数点第3位を四捨五入して丸めている)である。また例えば、概念「高血圧」(直接つながる先の概念数が5)についての重みは、同様に、log(7/2)、つまり0.54である。他の概念についての重みも同様である。
The node ID is identification information given for convenience to each concept. In the illustrated example, numerical values from 1 to 7 are assigned as node IDs.
A concept (node) is a word representing the concept. In this example, words such as “disease” and “adult disease” are stored in this column.
The connected concept (node) is a list of previous concepts (nodes) connected by a direct link from the concept. For example, there are five nodes connected by a direct link from the node “disease”, which are “high blood pressure”, “adult disease”, “diabetes”, “cold”, “influenza”. In the connected concept column for the concept “disease”, a list in which these five linked concepts are listed is stored.
The weight stores the value of the weight for the concept (node). Since the total number of concepts appearing in this concept map is 7, for example, the weight for the concept “disease” (the number of concepts directly connected to is 5) is log (7 / 5), that is, 0.15 (rounded off to the third decimal place). Also, for example, the weight for the concept “high blood pressure” (the number of concepts directly connected is 5) is similarly log (7/2), that is, 0.54. The same applies to the weights for other concepts.

[D=0,起点の概念が「病気」]
ステップS30:次に、パス重み算出部14は、計算対象の概念を1個選び、その概念を、メモリー内の、計算対象の概念の領域に格納する。また、概念処理装置1は、起点からの距離として、辿った概念数の値を初期化する。即ち、メモリー内の辿った概念数の領域に、D=0という値を書き込む。また、概念処理装置1は、ここで選択された計算対象の概念のみを、メモリー内の起点概念の配列の要素として格納する。
ステップS40:次に、パス重み算出部14は、メモリー内の起点概念の配列からひとつ選んだ概念を、起点の概念とする。そして、概念処理装置1は、その選ばれた概念をメモリー内の起点の概念の領域に書き込む。現在、起点概念の配列に書き込まれている要素は「病気」のみであるため、概念処理装置1は、メモリー内の起点の概念の領域に「病気」を書き込む。さらに、概念処理装置1は、その起点の概念から直接つながる概念をすべて、隣接概念の配列に書き込む。具体的には、「病気」から直接つながる概念は、「高血圧」、「成人病」、「糖尿病」、「風邪」、「インフルエンザ」の5個であるので、概念処理装置1は、これら5個の概念を隣接概念の配列の領域に書き込む。
上記のステップS30およびS40の処理を終えた時点でのメモリー内の状態は、図11のaの行に示すとおりである。
[D = 0, concept of starting point is “disease”]
Step S30: Next, the path weight calculation unit 14 selects one concept to be calculated, and stores the concept in the area of the concept to be calculated in the memory. The concept processing device 1 initializes the value of the number of concepts traced as the distance from the starting point. That is, the value D = 0 is written in the area of the number of concepts traced in the memory. Further, the concept processing apparatus 1 stores only the concept of the calculation target selected here as an element of the array of the starting concept in the memory.
Step S40: Next, the path weight calculation unit 14 sets the concept selected from the starting concept array in the memory as the starting concept. Then, the concept processing device 1 writes the selected concept in the concept area of the starting point in the memory. At present, only the “illness” element is written in the starting concept array, so the concept processing apparatus 1 writes “disease” in the starting concept area in the memory. Furthermore, the concept processing device 1 writes all the concepts directly connected from the concept of the starting point to the adjacent concept array. Specifically, there are five concepts that are directly connected to “disease”: “high blood pressure”, “adult disease”, “diabetes”, “cold”, and “influenza”. Is written in the area of the array of adjacent concepts.
The state in the memory at the time when the processes of steps S30 and S40 are completed is as shown in the row a of FIG.

次に、パス重み算出部14は、隣接概念の配列に格納されている各概念について、下の通り、ステップS50とステップS60の処理を、順次行う。つまり、概念処理装置1は、図11の起点概念の配列に格納されている概念の各々を起点の概念として、計算対象の概念(現状況では、「病気」)と、隣接概念の配列に格納されている要素である概念との間の関連度を計算する。関連度は、現在辿っているパス上の各概念(パスの両端の概念を含む)の重みの調和平均として算出される。また、ここで計算した関連度が、既に計算されている関連度よりも大きい場合には作業記憶部22に記憶されている情報(図7に示したテーブル)を更新するが、現状況では関連度を計算する初回であるため、各概念についてパスの重み(各概念についてのMAX_Weight)を更新する。また、このパスの重みを更新する際には、あわせて、その関連度が算出されたときのパスを記録する(各概念についてのMAX_Pathを更新)。   Next, the path weight calculation unit 14 sequentially performs the processes of step S50 and step S60 as follows for each concept stored in the array of adjacent concepts. That is, the concept processing apparatus 1 stores each concept stored in the starting concept array in FIG. 11 as the starting concept, and stores it in the concept to be calculated (in the current situation, “disease”) and the adjacent concept array. Calculate the relevance between concepts that are elements. The relevance is calculated as a harmonic average of the weights of the concepts (including the concepts at both ends of the path) on the currently traced path. Also, if the relevance calculated here is greater than the relevance already calculated, the information (table shown in FIG. 7) stored in the work storage unit 22 is updated. Since this is the first time for calculating the degree, the path weight (MAX_Weight for each concept) is updated for each concept. Further, when updating the weight of this path, the path when the degree of association is calculated is also recorded (MAX_Path for each concept is updated).

(1)隣接概念の配列から、まず、概念Bとして「高血圧」を取り出す。
ステップS50:計算対象の概念「病気」と、隣接概念の配列に格納されている要素である概念(概念B)「高血圧」との間の関連度は、「病気」の重みである0.15(図10を参照。以下においても同様。)と、「高血圧」の重みである0.54との調和平均として求められる。そして、その値は0.23(小数点第3位を四捨五入して丸めている。以下においても同様。)である。また、この関連度に対応するパスは、病気−高血圧というパスである。つまり、概念「高血圧」に関しては、MAX_Weight=0.23であり、MAX_Path=「病気,高血圧」である。
ステップS60:ここで、パス数(NUM_Path)を更新する。D=0の場合のみ特殊であり、ここでは、NUM_Path(A,C)=NUM_Path(病気,病気)=1として計算する。つまり、概念「高血圧」に関して、NUM_Pathの値は1に更新される。
(1) First, “hypertension” is extracted as concept B from the array of adjacent concepts.
Step S50: The degree of association between the concept “disease” to be calculated and the concept (concept B) “hypertension” which is an element stored in the array of adjacent concepts is 0.15 which is the weight of “disease”. (Refer to FIG. 10, and the same applies to the following) and the harmonic average of 0.54 which is the weight of “high blood pressure”. The value is 0.23 (rounded off to the third decimal place. The same applies hereinafter). Further, the path corresponding to this degree of association is a path of disease-hypertension. That is, regarding the concept “high blood pressure”, MAX_Weight = 0.23 and MAX_Path = “disease, high blood pressure”.
Step S60: Here, the number of paths (NUM_Path) is updated. It is special only when D = 0, and here, NUM_Path (A, C) = NUM_Path (disease, illness) = 1 is calculated. That is, for the concept “hypertension”, the value of NUM_Path is updated to 1.

(2)隣接概念の配列から、次に概念Bとして「成人病」を取り出す。
ステップS50:計算対象の概念「病気」と、隣接概念の配列から選んだ概念Bである「成人病」との間の関連度は、「病気」の重みである0.15と、「成人病」の重みである0.37との調和平均として求められる。そして、その値は0.21である。また、この関連度に対応するパスは、病気−成人病というパスである。つまり、概念「成人病」に関しては、MAX_Weight=0.21であり、MAX_Path=「病気,成人病」である。
ステップS60:上記の「高血圧」の場合と同様に、D=0の場合のみ特殊であり、NUM_Path(A,C)=NUM_Path(病気,病気)=1として計算する。つまり、「成人病」についても、NUM_Pathの値は1に更新される。
(2) Next, “adult disease” is extracted as concept B from the sequence of adjacent concepts.
Step S50: The degree of association between the calculation target concept “disease” and “adult disease”, which is concept B selected from the array of adjacent concepts, is 0.15 which is the weight of “disease”, and “adult disease” As a harmonic average of 0.37, which is a weight of "." The value is 0.21. The path corresponding to this degree of association is a path of disease-adult disease. That is, regarding the concept “adult disease”, MAX_Weight = 0.21 and MAX_Path = “disease, adult disease”.
Step S60: As in the case of “hypertension”, only D = 0 is special, and NUM_Path (A, C) = NUM_Path (disease, illness) = 1 is calculated. That is, the value of NUM_Path is also updated to 1 for “adult disease”.

(3)隣接概念の配列から、次に概念Bとして「糖尿病」を取り出す。
ステップS50:計算対象の概念「病気」と、隣接概念の配列から選んだ概念Bである「糖尿病」との間の関連度は、「病気」の重みである0.15と、「糖尿病」の重みである0.54との調和平均として求められる。そして、その値は0.23である。また、この関連度に対応するパスは、病気−糖尿病というパスである。つまり、概念「糖尿病」に関しては、MAX_Weight=0.23であり、MAX_Path=「病気,糖尿病」である。
ステップS60:上記の「高血圧」の場合と同様に、D=0の場合のみ特殊であり、NUM_Path(A,C)=NUM_Path(病気,病気)=1として計算する。つまり、「糖尿病」についても、NUM_Pathの値は1に更新される。
(3) Next, “diabetes” is extracted as concept B from the array of adjacent concepts.
Step S50: The degree of association between the concept “disease” to be calculated and “diabetes”, which is the concept B selected from the array of adjacent concepts, is 0.15 which is the weight of “disease”, and “diabetes”. It is obtained as a harmonic average with a weight of 0.54. The value is 0.23. The path corresponding to the degree of association is a path of disease-diabetes. That is, for the concept “diabetes”, MAX_Weight = 0.23 and MAX_Path = “disease, diabetes”.
Step S60: As in the case of “hypertension”, only D = 0 is special, and NUM_Path (A, C) = NUM_Path (disease, illness) = 1 is calculated. That is, for “diabetes”, the value of NUM_Path is updated to 1.

(4)隣接概念の配列から、次に概念Bとして「風邪」を取り出す。
ステップS50:計算対象の概念「病気」と、隣接概念の配列から選んだ概念Bである「風邪」との間の関連度は、「病気」の重みである0.15と、「風邪」の重みである0.54との調和平均として求められる。そして、その値は0.23である。また、この関連度に対応するパスは、病気−風邪というパスである。つまり、「風邪」に関しては、MAX_Weight=0.23であり、MAX_Path=「病気,風邪」である。
ステップS60:上記の「高血圧」の場合と同様に、D=0の場合のみ特殊であり、NUM_Path(A,C)=NUM_Path(病気,病気)=1として計算する。つまり、「風邪」についても、NUM_Pathの値は1に更新される。
(4) Next, “cold” is extracted as concept B from the array of adjacent concepts.
Step S50: The degree of association between the concept “disease” to be calculated and “cold”, which is the concept B selected from the array of adjacent concepts, is 0.15 which is the weight of “disease” and “cold” It is obtained as a harmonic average with a weight of 0.54. The value is 0.23. Further, the path corresponding to this degree of association is a path of disease-cold. That is, regarding “cold”, MAX_Weight = 0.23 and MAX_Path = “disease, cold”.
Step S60: As in the case of “hypertension”, only D = 0 is special, and NUM_Path (A, C) = NUM_Path (disease, illness) = 1 is calculated. That is, the value of NUM_Path is also updated to 1 for “cold”.

(5)隣接概念の配列から、次に概念Bとして「インフルエンザ」を取り出す。
ステップS50:計算対象の概念「病気」と、隣接概念の配列から選んだ概念Bである「インフルエンザ」との間の関連度は、「病気」の重みである0.15と、「インフルエンザ」の重みである0.54との調和平均として求められる。そして、その値は0.23である。また、この関連度に対応するパスは、病気−インフルエンザというパスである。つまり、「インフルエンザ」に関しては、MAX_Weight=0.23であり、MAX_Path=「病気,インフルエンザ」である。
ステップS60:上記の「高血圧」の場合と同様に、D=0の場合のみ特殊であり、NUM_Path(A,C)=NUM_Path(病気,病気)=1として計算する。つまり、「インフルエンザ」についても、NUM_Pathの値は1に更新される。
(5) Next, “influenza” is extracted as concept B from the array of adjacent concepts.
Step S50: The degree of association between the calculation target concept “disease” and “influenza” that is the concept B selected from the array of adjacent concepts is 0.15 which is the weight of “disease”, and “influenza” It is obtained as a harmonic average with a weight of 0.54. The value is 0.23. A path corresponding to this degree of association is a path of disease-influenza. That is, regarding “influenza”, MAX_Weight = 0.23 and MAX_Path = “disease, influenza”.
Step S60: As in the case of “hypertension”, only D = 0 is special, and NUM_Path (A, C) = NUM_Path (disease, illness) = 1 is calculated. That is, the value of NUM_Path is also updated to 1 for “influenza”.

以上、D=0の段階として、計算対象の概念である「病気」と、辿っている概念(隣接概念の配列に格納されている要素であった各概念)との間の関連度が計算された。
図12は、この段階での各概念についての計算結果を格納するテーブル(図7に示したテーブル)の状態を示す概略図である。図示するように、1行目の「高血圧」、2行目の「成人病」、3行目の「糖尿病」、4行目の「風邪」、5行目の「インフルエンザ」のそれぞれについて、MAX_Weightと、MAX_Pathと、NUM_Pathの値が格納されている。
As described above, as D = 0, the degree of association between the “disease” that is the concept to be calculated and the concept being traced (each concept that was an element stored in the array of adjacent concepts) is calculated. It was.
FIG. 12 is a schematic diagram showing the state of a table (the table shown in FIG. 7) that stores calculation results for each concept at this stage. As shown in the figure, MAX_Weight for “high blood pressure” in the first row, “adult disease” in the second row, “diabetes” in the third row, “cold” in the fourth row, “flu” in the fifth row And MAX_Path and NUM_Path values are stored.

ステップS80:次に、Dがインクリメントされ、D=1となる。
ステップS90:MAX_Distance=2と設定されているため、D<MAX_Distanceの条件を満たす。よって、ステップS100に進む。
Step S80: Next, D is incremented and D = 1.
Step S90: Since MAX_Distance = 2 is set, the condition of D <MAX_Distance is satisfied. Therefore, the process proceeds to step S100.

ステップS100:パス重み算出部14は、ステップS50,S60,S70のループを繰り返した際に計算した各概念を起点概念の配列に格納する。つまり、図11のbに示すように、起点概念の配列に、「高血圧」、「成人病」、「糖尿病」、「風邪」、「インフルエンザ」の各要素を格納する。次に、ステップS40の処理に戻る。   Step S100: The path weight calculation unit 14 stores each concept calculated when the loop of steps S50, S60, and S70 is repeated in an array of starting concepts. That is, as shown in FIG. 11 b, the elements of “high blood pressure”, “adult disease”, “diabetes”, “cold”, and “influenza” are stored in the starting point concept array. Next, the process returns to step S40.

ステップS40:パス重み算出部14は、起点概念の配列から、まず概念「高血圧」を選び、この「高血圧」を起点の概念(概念C)とする。そして、この概念Cからつながる先の概念(概念Cに隣接する概念)をすべて隣接概念の配列に格納する。具体的には、隣接概念の配列に、「成人病」、「病気」の各要素を格納する。このときが、図11のbに示す状態である。   Step S40: The path weight calculation unit 14 first selects the concept “high blood pressure” from the starting point concept array, and sets this “high blood pressure” as the starting point concept (concept C). Then, all the previous concepts connected to the concept C (concepts adjacent to the concept C) are stored in the adjacent concept array. Specifically, each element of “adult disease” and “disease” is stored in the array of adjacent concepts. This is the state shown in FIG.

隣接概念の配列内の「成人病」について、ステップS50,S60の処理を行う。
ステップS50:パス重み算出部14は、辿って来た「病気−高血圧−成人病」というパスについて重みを計算する。それは0.15(概念「病気」の重み)と0.54(概念「高血圧」の重み)と0.37(概念「成人病」の重み)の調和平均であり、その値は0.27である。
この0.27という値は、これまでに計算した「病気」から「成人病」までの重みである0.21(図12の第2行目を参照)よりも大きい(重い)ので、MAX_Weight(A,B)を更新する。また、合わせて、MAX_Pathを、この0.27という新たな重みに対応するパスで更新する。つまり、MAX_Weight=0.27とし、MAX_Path=「病気,高血圧,成人病」とする。
図13は、このときのテーブル(図7に示したテーブル)の状態を示す概略図である。図示するように、概念「成人病」について、MAX_WeightとMAX_Pathが更新されている。
Steps S50 and S60 are performed for “adult disease” in the adjacent concept array.
Step S50: The path weight calculation unit 14 calculates a weight for the path “disease-hypertension-adult disease” that has been followed. It is a harmonic average of 0.15 (weight of concept “disease”), 0.54 (weight of concept “hypertension”) and 0.37 (weight of concept “adult disease”), and its value is 0.27. is there.
Since this value of 0.27 is larger (heavy) than 0.21 (refer to the second row in FIG. 12), which is a weight from “illness” to “adult disease” calculated so far, MAX_Weight ( A, B) are updated. In addition, MAX_Path is updated with a path corresponding to this new weight of 0.27. That is, MAX_Weight = 0.27 and MAX_Path = “disease, hypertension, adult disease”.
FIG. 13 is a schematic diagram showing the state of the table (the table shown in FIG. 7) at this time. As shown in the figure, MAX_Weight and MAX_Path are updated for the concept “adult disease”.

ステップS60:パス重み算出部14は、NUM_Pathの値(パス数)を更新し、NUM_Path=2とする。つまり、D=1におけるNUM_Path(病気→成人病)は、D=0におけるNUM_Path(病気→成人病)の値と、D=0におけるNUM_Path(病気→高血圧)の値とを足し算したものである。つまり、D=0におけるNUM_Path(A,B)に、D=0におけるNUM_Path(A,C)を加えている。
図14は、このときのテーブル(図7に示したテーブル)の状態を示す概略図である。図示するように、概念「成人病」について、NUM_Pathも更新されている。
Step S60: The path weight calculation unit 14 updates the value of NUM_Path (number of paths) so that NUM_Path = 2. That is, NUM_Path (disease → adult disease) at D = 1 is the sum of the value of NUM_Path (disease → adult disease) at D = 0 and the value of NUM_Path (disease → hypertension) at D = 0. That is, NUM_Path (A, C) at D = 0 is added to NUM_Path (A, B) at D = 0.
FIG. 14 is a schematic diagram showing the state of the table (the table shown in FIG. 7) at this time. As shown in the figure, NUM_Path is also updated for the concept “adult disease”.

なお、概念「病気」は、計算対象の概念そのものであるので、「病気−高血圧−病気」というパスについては計算を行わない。   Since the concept “disease” is the concept of the calculation target itself, the calculation is not performed for the path “disease-hypertension-disease”.

以下、詳細な説明を省略するが、起点概念の配列に格納されている概念であって、重みの計算が未だ完了していない概念について、ステップS50,S60の計算手順を繰り返す。つまり、「成人病」、「糖尿病」、「風邪」、「インフルエンザ」の各概念について、ステップS50,S60の計算手順を繰り返す。この過程で、概念「病気」から上記各概念への、D=1の時点でのMAX_PathおよびNUM_Pathを求める。   Hereinafter, although detailed description is omitted, the calculation procedure of steps S50 and S60 is repeated for the concept stored in the starting concept array and the weight calculation is not yet completed. That is, the calculation procedure of steps S50 and S60 is repeated for each concept of “adult disease”, “diabetes”, “cold”, and “flu”. In this process, MAX_Path and NUM_Path at the time of D = 1 from the concept “disease” to each of the above concepts are obtained.

ステップS80:次に、Dがインクリメントされ、D=2となる。
ステップS90:MAX_Distance=2と設定されているため、D<MAX_Distanceの条件を満たさない。よって、ステップS110に進む。
Step S80: Next, D is incremented and D = 2.
Step S90: Since MAX_Distance = 2 is set, the condition of D <MAX_Distance is not satisfied. Therefore, the process proceeds to step S110.

ステップS110:関連度算出部16は、概念「病気」から各概念までの関連度を、MAX_Weight×NUM_Pathにより計算し、またその値を正規化する。但し、この計算をするのは、概念「病気」から辿り着くルートが2個以上ある概念に限る。
そして、概念処理装置1は、上記の乗算MAX_Weight×NUM_Pathによって計算された、概念「病気」と各概念との間の関連度(正規化済)を出力する。
これで、計算対象の概念「病気」についての処理を終えた。
なお、関連度算出部16は、算出した関連度の情報を、関連度記憶部30に書き込む。
Step S110: The relevance calculation unit 16 calculates the relevance from the concept “disease” to each concept by MAX_Weight × NUM_Path and normalizes the value. However, this calculation is limited to a concept having two or more routes from the concept “disease”.
Then, the concept processing device 1 outputs the degree of association (normalized) between the concept “disease” and each concept calculated by the above multiplication MAX_Weight × NUM_Path.
This completes the processing of the concept “disease” to be calculated.
The relevance calculation unit 16 writes the calculated relevance information into the relevance storage unit 30.

ステップS120:未計算の計算対象の概念(つまり、上記の「病気」以外の計算対象の概念)があるかどうかを判定する。ある場合には、ステップS30に移って処理を続ける。ない場合には、図8および図9示したフローチャート全体の処理を終了する。   Step S120: It is determined whether there is an uncalculated calculation target concept (that is, a calculation target concept other than the above-mentioned “disease”). If there is, the process moves to step S30 and continues. If not, the processing of the entire flowchart shown in FIGS. 8 and 9 is terminated.

なお、以上述べた方法によって算出される関連度は、有向なものである。言い換えれば、算出される関連度の値は概念から概念への向きに依存する。例えば、概念「病気」から概念「風邪」への関連度の値と、概念「風邪」から概念「病気」への関連度の値とは、異なる。   The relevance calculated by the method described above is directed. In other words, the calculated relevance value depends on the direction from concept to concept. For example, the value of the degree of association from the concept “disease” to the concept “cold” is different from the value of the degree of association from the concept “cold” to the concept “disease”.

以上、説明したように、第1実施形態の概念処理装置1によれば、概念マップのデータから、ある概念から他の概念への関連度を算出することができる。このとき、実際の文章例からなる言語資源等のデータを必要とせず、概念処理装置は、概念マップのデータのみから、上記の関連度を算出することができる。
また、第1実施形態の概念処理装置1によれば、現実的に妥当な限られた計算量で、上記の関連度を算出することができる。その要因の一つは、概念マップを探索する際の距離の上限(MAX_Distance)を設けていることである。
また、第1実施形態の概念処理装置1が算出する概念間の関連度は、現実の概念マップに適用したときに良好な値として計算される。これは、算出のための処理手順や計算方法を特に工夫したことによる。
As described above, according to the concept processing device 1 of the first embodiment, the degree of association from one concept to another concept can be calculated from the data of the concept map. At this time, the concept processing device can calculate the above-mentioned relevance from only the data of the concept map without requiring data such as language resources made up of actual sentence examples.
Moreover, according to the conceptual processing apparatus 1 of 1st Embodiment, said relevance degree can be calculated with the limited calculation amount realistically appropriate. One of the factors is that an upper limit (MAX_Distance) of the distance when searching the concept map is provided.
Further, the degree of association between concepts calculated by the concept processing device 1 of the first embodiment is calculated as a good value when applied to an actual concept map. This is because the processing procedure and calculation method for calculation are particularly devised.

また、第1実施形態として記載した技術によると、広い概念(例えば、概念「日本のスポーツ」など)については、隣接する概念数が多いため、概念の重みが小さくなる。よって、このような広い概念が関わる関連度の値は小さくなる。また、狭すぎる概念(例えば、特定の放送局による特定の番組を表す「NHKサンデースポーツ」など)については、そのような概念が含まれるパスの総数が少なくなるため、そういう概念が関わる関連度の値は、やはり小さくなる。つまり、両極端な概念については、関連度を低くする作用を有する。つまり、ノイズに関しては低い関連度を算出することができる。つまり、概念におけるノイズの影響を軽減しながら、情報検索等の処理を行うことができるようになる。   Further, according to the technique described as the first embodiment, for a wide concept (for example, the concept “Japanese sports”, etc.), the number of concepts that are adjacent to each other is large, so the concept weight is reduced. Therefore, the relevance value related to such a broad concept becomes small. In addition, for concepts that are too narrow (for example, “NHK Sunday Sports” representing a specific program by a specific broadcasting station), the total number of paths that include such a concept is reduced. The value is still small. In other words, the two extreme concepts have the effect of reducing the degree of association. That is, a low relevance level can be calculated for noise. That is, processing such as information retrieval can be performed while reducing the influence of noise in the concept.

[第2実施形態]
次に、本発明の第2実施形態について説明する。なお、前述の実施形態と共通する事項については説明を省略する場合があり、本実施形態特有の事項を中心に説明する。
図15は、本実施形態による概念処理装置の概略機能構成を示すブロック図である。図示するように、概念処理装置2は、概念重み算出部112と、パス重み算出部114と、関連度算出部116と、パラメーター設定部18と、概念マップ記憶部20と、作業記憶部22と、関連度記憶部30と、類似度取得部140と、を含んで構成される。
本実施形態の特徴は、類似度取得部140を備えている点と、重みの計算方法および関連度の計算方法が第1実施形態と異なる点である。
[Second Embodiment]
Next, a second embodiment of the present invention will be described. Note that description of matters common to the above-described embodiment may be omitted, and description will be made focusing on matters specific to the present embodiment.
FIG. 15 is a block diagram showing a schematic functional configuration of the conceptual processing apparatus according to the present embodiment. As illustrated, the concept processing device 2 includes a concept weight calculation unit 112, a path weight calculation unit 114, a relevance calculation unit 116, a parameter setting unit 18, a concept map storage unit 20, and a work storage unit 22. The relevance storage unit 30 and the similarity acquisition unit 140 are included.
The feature of the present embodiment is that the similarity acquisition unit 140 is provided, and the weight calculation method and the relevance calculation method are different from the first embodiment.

本実施形態による概念処理装置2では、類似度取得部140が、外部から概念間の類似度を表す類似度データを取得する。そして、パス重み算出部114は、類似度取得部140が取得した類似度データを参照することによって概念間の類似度を用いながら、パスの重みを算出する。つまり、パス重み算出部114は、概念マップ記憶部20に記憶された概念マップを辿るパスの重みを求める際に、外部から与えられた類似度の値を、初期値として利用する。つまり、パス重み算出部114は、前記パスについて、当該パス上に含まれるリンクが結ぶ概念の対に関する類似度を前記類似度データから取得し、取得した前記類似度にも応じて前記パスの重みの値を算出する。   In the concept processing device 2 according to the present embodiment, the similarity acquisition unit 140 acquires similarity data representing the similarity between concepts from the outside. Then, the path weight calculation unit 114 calculates the path weight while using the similarity between concepts by referring to the similarity data acquired by the similarity acquisition unit 140. That is, the path weight calculation unit 114 uses a similarity value given from the outside as an initial value when obtaining the weight of a path that traces the concept map stored in the concept map storage unit 20. In other words, the path weight calculation unit 114 acquires, for the path, a similarity degree regarding a concept pair connected by a link included in the path from the similarity data, and the path weight according to the acquired similarity degree. Is calculated.

図16は、類似度取得部140が取得する類似度データの構成を示す概略図である。図示するように類似度データは表形式のデータであり、項目として、概念1、概念2、類似度を有している。概念1と概念2は、それぞれ、概念マップ内に含まれる概念に対応する。そして、データ項目「類似度」は、概念1と概念2との間の類似度の値を保持する。なお、類似度データが情報として概念間の類似度の値を含むものであれば、データの形式等については図示したデータと異なるものであっても良い。   FIG. 16 is a schematic diagram illustrating a configuration of similarity data acquired by the similarity acquisition unit 140. As shown in the figure, the similarity data is tabular data, and has items of concept 1, concept 2, and similarity as items. Concept 1 and concept 2 correspond to the concepts included in the concept map, respectively. The data item “similarity” holds a value of similarity between concepts 1 and 2. As long as the similarity data includes the value of similarity between concepts as information, the data format and the like may be different from the illustrated data.

類似度の値は、外部から供給されるものであり、各種手法を用いることによって概念間の類似度を与えることができる。概念間の類似度の一例は、文脈類似度である。文脈類似度を求める方法自体は、既存技術である。文脈類似度を求めるためには、大量の文章からなる言語資源を取得し、言語資源に含まれる各文の構文解析を行い、語が出現する文脈についての統計的な分析を行う。ここで、語は、概念に対応する。また、ここで言う文脈とは、言語資源に含まれる文章において、ある概念(語)が出現するときのその概念の周りの概念(語)の統計的な特徴や、ある概念(語)が出現するときの構文における位置付け等である。周りの概念(語)の統計的な特徴は、一例として、周りの概念(語)に基づく単語ベクトルで表される。この単語ベクトルは、各要素が語に対応する多次元(例えば、数万ないしは数十万次元)のベクトルであり、各要素はその語がその文脈において出現しているか否かを表す。そして、似たような文脈において出現しやすい傾向にある概念(語)同士は、その傾向が強いほど文脈類似度が高い。これは、ある概念(語)はその周囲の概念や構文等の文脈によって特徴づけられる、という前提に基づく。   The similarity value is supplied from the outside, and the similarity between concepts can be given by using various methods. An example of similarity between concepts is context similarity. The method for obtaining the context similarity is an existing technology. In order to obtain the context similarity, a language resource consisting of a large amount of sentences is acquired, a syntax analysis of each sentence included in the language resource is performed, and a statistical analysis is performed on the context in which the word appears. Here, a word corresponds to a concept. In addition, the context here refers to the statistical characteristics of concepts (words) around a concept (word) when a concept (word) appears in a sentence included in a language resource, or the appearance of a concept (word). Such as positioning in the syntax. A statistical feature of surrounding concepts (words) is represented by a word vector based on the surrounding concepts (words) as an example. This word vector is a multi-dimensional vector (for example, tens of thousands or hundreds of thousands of dimensions) in which each element corresponds to a word, and each element represents whether or not the word appears in the context. The concepts (words) that tend to appear in similar contexts have higher context similarities as the tendency is stronger. This is based on the premise that a certain concept (word) is characterized by the surrounding concept or syntax.

本実施形態による重みの求め方は、次の通りである。
概念重み算出部112は、次の式により、概念の重みを算出する。
(概念の重み)=log(N/n)
ここで、nは当該概念から他の概念に直接つながるリンク数である。また、Nは概念マップ内に含まれる全概念数である。
The method for obtaining the weight according to the present embodiment is as follows.
The concept weight calculator 112 calculates the concept weight according to the following equation.
(Concept weight) = log (N / n)
Here, n is the number of links directly connected from the concept to another concept. N is the total number of concepts included in the concept map.

そして、パス重み算出部114は、次の式(A1),(A2),(A3)のいずれかにより、隣接する概念AおよびBの間のパスの重みを算出する。
式(A1): (隣接する概念間のパスの重み)=sim(A,B)×(概念Aの重み+概念Bの重み)
式(A2): (隣接する概念間のパスの重み)=sim(A,B)×(概念Aの重み×概念Bの重み)
式(A3): (隣接する概念間のパスの重み)=sim(A,B)×min(概念Aの重み,概念Bの重み)
なお、パス重み算出部114は、上の式(A1),(A2),(A3)のいずれかを用いるが、これらいずれかのうち選択された式を一貫して用いる。つまり、概念間の関連度を算出するときに、途中で概念間のパスの重みの計算式を変更することはない。
Then, the path weight calculation unit 114 calculates the weight of the path between the adjacent concepts A and B by any of the following formulas (A1), (A2), and (A3).
Formula (A1): (weight of path between adjacent concepts) = sim (A, B) × (weight of concept A + weight of concept B)
Formula (A2): (weight of path between adjacent concepts) = sim (A, B) × (weight of concept A × weight of concept B)
Expression (A3): (weight of path between adjacent concepts) = sim (A, B) × min (weight of concept A, weight of concept B)
Note that the path weight calculation unit 114 uses any one of the above formulas (A1), (A2), and (A3), and uses one of these formulas consistently. That is, when calculating the degree of association between concepts, the formula for calculating the path weight between concepts is not changed midway.

ここで、sim(A,B)は、概念Aと概念Bの間の類似度であり、前記の類似度取得部140が取得した類似度データで、その値を参照することができる。
また、min(概念Aの重み,概念Bの重み)は、引数の中の最小値を返す最小値関数を、各重みに適用したものである。つまり、min(概念Aの重み,概念Bの重み)は、概念Aの重みと概念Bの重みのいずれか小さいほうの値を返す。
Here, sim (A, B) is the similarity between the concept A and the concept B, and the value can be referred to by the similarity data acquired by the similarity acquisition unit 140.
Further, min (weight of concept A, weight of concept B) is obtained by applying a minimum value function that returns a minimum value among arguments to each weight. That is, min (concept A weight, concept B weight) returns the smaller one of the concept A weight and the concept B weight.

パス重み算出部114は、ある概念(A)から他の概念(B)への関連度を計算する際に、それら両概念が隣接している場合には、上記の式(A1),(A2),(A3)のいずれかで得られる値をそのまま、その重みとする。   When calculating the degree of association from one concept (A) to another concept (B), the path weight calculation unit 114 determines that the above formulas (A1) and (A2) ) Or (A3), the value obtained as it is is used as the weight.

また、ある概念(A)から、直接つながっていない(隣接していない)他の概念(B)への重みを計算する際には、パス重み算出部114は、次の計算を行う。即ち、それら両概念間をつなぐパスに含まれる各リンクについての重み(式(A1),(A2),(A3)のいずれか)の、調和平均(B1)または相乗平均(B2)を算出する。
例えば、距離が2の概念間の重みは、下の式(B1),(B2)のいずれかによって計算される。
Further, when calculating the weight from a certain concept (A) to another concept (B) that is not directly connected (not adjacent), the path weight calculation unit 114 performs the following calculation. That is, the harmonic average (B1) or geometric average (B2) of the weights (any one of the formulas (A1), (A2), and (A3)) for each link included in the path connecting these two concepts is calculated. .
For example, the weight between concepts having a distance of 2 is calculated by either of the following formulas (B1) and (B2).

式(B1): (概念AからBへの重み)=(2×概念AからCへの重み×概念CからBへの重み)/(概念AからCへの重み+概念CからBへの重み)
式(B2): (概念AからBへの重み)=SQRT(概念AからCへの重み×概念CからBへの重み)
なお、パス重み算出部114は、上の式(B1),(B2)のいずれかを用いるが、これらいずれかのうち選択された式を一貫して用いる。つまり、概念間の関連度を算出するときに、途中でこの重みの計算式(調和平均か相乗平均のいずれか)を変更することはない。
Formula (B1): (weight from concept A to B) = (2 × weight from concept A to C × weight from concept C to B) / (weight from concept A to C + concept from concept C to B weight)
Formula (B2): (weight from concept A to B) = SQRT (weight from concept A to C × weight from concept C to B)
The path weight calculation unit 114 uses any one of the above formulas (B1) and (B2), but uses one of these formulas consistently. That is, when calculating the degree of association between concepts, the weight calculation formula (either harmonic average or geometric average) is not changed midway.

ここで、概念AからCへは直接のリンクでつながっており、概念CからBへは直接のリンクでつながっている。つまり、概念AとBとの間の距離は2であり、概念Cを間に介している。
また、上の式(B2)におけるSQRT()は、引数の平方根を返す関数である。
概念Aから概念Bの距離が2より大きい場合にも、パス重み算出部114は、上記の式(B1)または(B2)をそれぞれ拡張して、調和平均または相乗平均により、パスの重みを算出する。
Here, concepts A to C are connected by a direct link, and concepts C to B are connected by a direct link. That is, the distance between the concepts A and B is 2, and the concept C is interposed therebetween.
Further, SQRT () in the above formula (B2) is a function that returns the square root of the argument.
Even when the distance from the concept A to the concept B is larger than 2, the path weight calculation unit 114 extends the above formula (B1) or (B2), and calculates the path weight by the harmonic mean or the geometric mean. To do.

関連度算出部116は、次の(C1)または(C2)のいずれかの方法により、概念AからBへの関連度を求める。
(C1)パス重み算出部114が算出した概念AからBへのパスの重みを、そのまま概念AからBへの関連度として出力する(関連度記憶部30に書き込む)。なお、概念AからBへのパスが複数存在するときには、次のいずれかの方法により、代表のパスを選択する。
(C1−1)最も短いパスを採用する。
(C1−2)重み(パスの重み)が最も大きいパスを採用する。
The degree-of-association calculation unit 116 obtains the degree of association from the concept A to B by either of the following methods (C1) or (C2).
(C1) The path weight from the concept A to B calculated by the path weight calculation unit 114 is output as it is as the degree of association from the concept A to B (written in the degree of association storage unit 30). When there are a plurality of paths from concept A to B, a representative path is selected by one of the following methods.
(C1-1) The shortest path is adopted.
(C1-2) A path having the largest weight (path weight) is adopted.

(C2)概念AからBへのパスの重みのうちの最大の重み(パスの重み)と、概念AからBへのパスの数とを乗算し、その結果を概念AからBへの関連度として出力する(関連度記憶部30に書き込む)。なお、この(C2)の方法を採る場合には、第1実施形態におけるフローチャートで説明した処理手順(概念マップを探索するための手順)を利用することもできる。
なお、関連度算出部116は、上の(C1),(C2)のいずれかの方法を用いる((C1)の場合にはさらに(C1−1),(C1−2)のいずれかの方法を用いる)が、これらのうち選択された方法を一貫して用いる。つまり、概念間の関連度を算出するときに、途中でこの関連度の求め方を変更することはない。
(C2) Multiplying the maximum weight (path weight) of the path weights from concept A to B by the number of paths from concept A to B, and the result is the degree of association from concept A to B Is output (written in the association degree storage unit 30). When the method (C2) is adopted, the processing procedure (procedure for searching a concept map) described in the flowchart in the first embodiment can also be used.
The relevance calculation unit 116 uses any one of the above methods (C1) and (C2) (in the case of (C1), any one of the methods (C1-1) and (C1-2). However, the selected method is used consistently. That is, when calculating the degree of association between concepts, the method for obtaining the degree of association is not changed midway.

第2実施形態の概念処理装置2によれば、外部から取得する概念間の類似度のデータを使って、また、概念の重みやパスの重みなど(あるいはその両方)に応じて、概念間の関連度を算出することができる。既に類似度のデータが外部から提供されている場合には、そのデータを良好に反映した関連度を得ることができる。   According to the concept processing device 2 of the second embodiment, data on the degree of similarity between concepts acquired from the outside is used, and between the concepts according to the concept weight, the path weight, or the like (or both). Relevance can be calculated. In the case where data of similarity is already provided from the outside, it is possible to obtain a degree of relevance that well reflects the data.

[第3実施形態]
次に、本発明の第3実施形態について説明する。なお、前述の実施形態と共通する事項については説明を省略する場合があり、本実施形態特有の事項を中心に説明する。
本実施形態による概念処理装置の機能構成を示すブロック図は、図1として示したブロック図と同様である。
第1実施形態の概念処理装置は、概念間のパスの重みの最大値(複数あるパスのうちの、重みが最大であるパスの重み)と、当該概念間のパスの数とを乗算することによって当該概念間の関連度を算出した。これに対して、本実施形態では、概念Aから概念Bに至るパスが複数存在する場合、それら各々のパスの重みの総和に基づいて関連度を求める。
[Third Embodiment]
Next, a third embodiment of the present invention will be described. Note that description of matters common to the above-described embodiment may be omitted, and description will be made focusing on matters specific to the present embodiment.
The block diagram showing the functional configuration of the conceptual processing apparatus according to this embodiment is the same as the block diagram shown in FIG.
The concept processing device of the first embodiment multiplies the maximum value of path weights between concepts (the weight of the path having the maximum weight among a plurality of paths) and the number of paths between the concepts. Was used to calculate the degree of association between the concepts. On the other hand, in this embodiment, when there are a plurality of paths from concept A to concept B, the relevance is obtained based on the sum of the weights of the paths.

具体的には、次の通りである。
本実施形態の、概念重み算出部12は、第1実施形態と同様の方法により、各概念の重みを計算する。
次に、パス重み算出部14は、概念Aと概念Bとの間のすべてのパスについて、それぞれパスの重みを計算する。ある一つのパスの重み自体は、第1実施形態と同様に、そのパスに含まれるすべての概念(両端の概念を含む)の重みの調和平均である。なお、ここで計算対象としている概念Aと概念Bとの間のパスは、途中で同じ概念を2度以上通らないようなパスである。つまり、パスの一部に閉路を含んだり、パスの途中での後戻りを含んだりしない。
なお、概念マップのサイズが有限である(概念マップに含まれる概念の数が有限である)とき、概念Aと概念Bとの間のパスの数は有限である。
また、ここで計算対象とする概念Aと概念Bとの間のパスに関して、その長さに制約を設けるようにしても良い。つまりこのとき、パラメーター設定部18によって設定されるパラメーターMAX_Distanceの値のリンク数で辿り着かないようなパスについては、計算から除外する。
Specifically, it is as follows.
The concept weight calculator 12 of this embodiment calculates the weight of each concept by the same method as in the first embodiment.
Next, the path weight calculation unit 14 calculates path weights for all paths between the concept A and the concept B, respectively. As with the first embodiment, the weight itself of a certain path is a harmonic average of the weights of all the concepts (including the concepts at both ends) included in the path. Note that the path between the concept A and the concept B, which is a calculation target here, is a path that does not pass the same concept more than once in the middle. That is, it does not include a closed circuit in a part of the path or a backtrack in the middle of the path.
Note that when the size of the concept map is finite (the number of concepts included in the concept map is finite), the number of paths between the concept A and the concept B is finite.
In addition, regarding the path between the concept A and the concept B to be calculated here, the length may be limited. That is, at this time, a path that cannot be reached by the number of links of the parameter MAX_Distance set by the parameter setting unit 18 is excluded from the calculation.

そして、関連度算出部16は、概念Aと概念Bとの間の各パスの重みの総和を求め、その総和を概念Aから概念Bへの関連度として出力する。具体的には、関連度算出部16は、算出された関連度を関連度記憶部30に書き込む。   Then, the relevance calculation unit 16 obtains the sum of the weights of the paths between the concept A and the concept B, and outputs the sum as the relevance from the concept A to the concept B. Specifically, the relevance level calculation unit 16 writes the calculated relevance level in the relevance level storage unit 30.

この第3の実施形態によれば、重みが最大であるパスによって概念Aと概念Bとの間のパスを代表させるのではなく、各パスが持つ重みを反映した関連度を求めることができる。なお、概念マップのサイズが大きい場合、長い距離を探索する処理のためには多くの計算量を要する場合もある。必要に応じて並列処理を導入することにより、より短い時間で多くの計算量を処理することもできる。   According to the third embodiment, the path between the concept A and the concept B is not represented by the path having the maximum weight, but the degree of association reflecting the weight of each path can be obtained. When the size of the concept map is large, a large amount of calculation may be required for the process of searching for a long distance. By introducing parallel processing as necessary, a large amount of calculation can be processed in a shorter time.

なお、上述した各実施形態における概念処理装置の機能の一部または全部をコンピューターとプログラムとで実現するようにしても良い。その場合、各機能を実現するためのプログラムをコンピューター読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピューターシステムに読み込ませ、実行することによって実現しても良い。なお、ここでいう「コンピューターシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピューター読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピューターシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピューター読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバーやクライアントとなるコンピューターシステム内部の揮発性メモリーのように、一定時間プログラムを保持しているものも含んでも良い。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピューターシステムにすでに記録されているプログラムとの組み合わせで実現できるものであっても良い。   In addition, you may make it implement | achieve part or all of the function of the conceptual processing apparatus in each embodiment mentioned above with a computer and a program. In that case, a program for realizing each function may be recorded on a computer-readable recording medium, and the program recorded on the recording medium may be read into a computer system and executed. Here, the “computer system” includes an OS and hardware such as peripheral devices. The “computer-readable recording medium” refers to a storage device such as a flexible disk, a magneto-optical disk, a portable medium such as a ROM and a CD-ROM, and a hard disk incorporated in a computer system. Furthermore, a “computer-readable recording medium” dynamically holds a program for a short time, like a communication line when transmitting a program via a network such as the Internet or a communication line such as a telephone line. In this case, a volatile memory inside a computer system serving as a server or a client in that case may be included and a program held for a certain period of time. The program may be a program for realizing a part of the above-described functions, or may be a program that can realize the above-described functions in combination with a program already recorded in a computer system.

以上、この発明の複数の実施形態について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。   As described above, a plurality of embodiments of the present invention have been described in detail with reference to the drawings. However, the specific configuration is not limited to this embodiment, and includes a design and the like within a scope not departing from the gist of the present invention. .

現実の概念マップ(図面に例示した簡略版のマップとは別のもの)を用いて、第1実施形態に記載した方法により、概念「病気」と他の概念との間の関連度を計算した。その結果、関連度の値における上位10位までの概念は、次の通りである。なお、ここでは、小数点第5位までの数値を求めている。   The degree of association between the concept “disease” and another concept was calculated by the method described in the first embodiment using an actual concept map (separate from the simplified map illustrated in the drawing). . As a result, the concepts up to the top 10 in the value of relevance are as follows. Here, numerical values up to the fifth decimal place are obtained.

1位 関連度:0.00358 概念:体
2位 関連度:0.00325 概念:炎症
3位 関連度:0.00314 概念:薬
4位 関連度:0.00309 概念:風邪
5位 関連度:0.00307 概念:身体
6位 関連度:0.00300 概念:感染症
7位 関連度:0.00296 概念:ガン
8位 関連度:0.00278 概念:感染
9位 関連度:0.00267 概念:アレルギー
10位 関連度:0.00258 概念:癌
1st place Relevance: 0.00358 Concept: body 2nd place Relevance: 0.00325 Concept: inflammation 3rd place Relevance: 0.00314 Concept: medicine 4th place Relevance: 0.00309 Concept: cold 5th place Relevance: 0 .00307 Concept: Body 6th Relevance: 0.00300 Concept: Infectious Disease 7th Relevance: 0.00296 Concept: Cancer 8th Relevance: 0.00278 Concept: Infection 9th Relevance: 0.00267 Concept: Allergy 10th place Relevance: 0.00258 Concept: Cancer

本発明は、概念と概念との間の関連度を利用した各種情報処理に利用可能である。一例としては、情報検索や、テレビ番組等のコンテンツを利用者に推薦するための番組推薦などといった分野に、本発明を利用可能である。   The present invention can be used for various types of information processing using the degree of association between concepts. As an example, the present invention can be used in fields such as information retrieval and program recommendation for recommending content such as television programs to users.

1,2 概念処理装置
12,112 概念重み算出部
14,114 パス重み算出部
16,116 関連度算出部
18 パラメーター設定部
20 概念マップ記憶部
22 作業記憶部
30 関連度記憶部
140 類似度取得部
1, 2 Concept processor 12, 112 Concept weight calculator 14, 114 Path weight calculator 16, 116 Relevance calculator 18 Parameter setting unit 20 Concept map storage unit 22 Work storage unit 30 Relevance storage unit 140 Similarity acquisition unit

Claims (6)

概念間の関係の有無を表す概念マップデータを読み込み、ある概念と他の概念との間の関係を表すリンクの数が少ないほど当該概念について大きな値となるような前記概念の重みの値を算出する概念重み算出部と、
前記概念マップデータにおいて、ある概念と他の概念との間を前記リンクで連結させてなるパスについて、当該パス上に含まれる概念についての前記概念の重みの値に応じた当該パスの重みの値を算出するパス重み算出部と、
ある概念と他の概念との間を結ぶパスについての前記パスの重みの値に応じた、当該概念と当該他の概念との間の関連度を算出する関連度算出部と、
を具備することを特徴とする概念処理装置。
Reads concept map data that indicates the presence or absence of relationships between concepts, and calculates the value of the concept weight so that the smaller the number of links that represent the relationship between one concept and the other, the greater the value for that concept A concept weight calculation unit for
In the concept map data, for a path formed by connecting a concept and another concept with the link, the weight value of the path corresponding to the weight value of the concept for the concept included on the path A path weight calculation unit for calculating
A degree-of-association calculating unit that calculates a degree of association between the concept and the other concept according to the value of the weight of the path for a path connecting a certain concept and another concept;
A conceptual processing apparatus comprising:
前記パス重み算出部は、前記パス上に含まれる各々の概念についての前記概念の重みの値の調和平均または相乗平均を取ることによって当該パスの重みの値を算出する、
ことを特徴とする請求項1に記載の概念処理装置。
The path weight calculation unit calculates a value of the weight of the path by taking a harmonic average or a geometric average of the values of the weight of the concept for each concept included on the path;
The conceptual processing device according to claim 1, wherein:
前記概念重み算出部は、前記概念から前記他の概念との間の前記リンクの数の逆数の対数を計算することにより前記概念の重みの値を算出する、
ことを特徴とする請求項1または2のいずれかに記載の概念処理装置。
The concept weight calculation unit calculates a value of the concept weight by calculating a logarithm of the reciprocal of the number of links between the concept and the other concept.
The conceptual processing apparatus according to claim 1, wherein
前記関連度算出部は、前記ある概念と前記他の概念との間を前記リンクで連結させてなるパスが複数存在する場合に、それら複数のパスの数に、それら複数のパスの重みの値のうちの最大の前記パスの重みの値を乗じることによって、当該概念と当該他の概念との間の関連度を算出するか、またはそれら複数のパスの重みの総和を関連度として算出する、
ことを特徴とする請求項1から3までのいずれか一項に記載の概念処理装置。
When there are a plurality of paths formed by connecting the certain concept and the other concept by the link, the relevance calculation unit calculates the weight value of the plurality of paths as the number of the plurality of paths. By calculating the relevance between the concept and the other concept by multiplying the value of the maximum weight of the path among the above, or calculating the sum of the weights of the plurality of paths as the relevance,
The conceptual processing device according to claim 1, wherein the conceptual processing device is a device.
概念間の類似度を表す類似度データを取得する類似度取得部を具備し、
前記パス重み算出部は、前記パスについて、当該パス上に含まれるリンクが結ぶ概念の対に関する類似度を前記類似度データから取得し、取得した前記類似度にも応じて前記パスの重みの値を算出する、
ことを特徴とする請求項1から4までのいずれか一項に記載の概念処理装置。
A similarity acquisition unit that acquires similarity data representing the similarity between concepts,
The path weight calculation unit acquires, for the path, a degree of similarity related to a concept pair connected by a link included in the path from the similarity data, and the path weight value according to the acquired degree of similarity To calculate,
The conceptual processing device according to claim 1, wherein the conceptual processing device is a device.
コンピューターを、請求項1から5までのいずれか一項に記載の概念処理装置として機能させるためのプログラム。   The program for functioning a computer as a conceptual processing apparatus as described in any one of Claim 1-5.
JP2015092331A 2015-04-28 2015-04-28 Concept processing device and program Active JP6501398B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015092331A JP6501398B2 (en) 2015-04-28 2015-04-28 Concept processing device and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015092331A JP6501398B2 (en) 2015-04-28 2015-04-28 Concept processing device and program

Publications (2)

Publication Number Publication Date
JP2016212461A true JP2016212461A (en) 2016-12-15
JP6501398B2 JP6501398B2 (en) 2019-04-17

Family

ID=57551794

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015092331A Active JP6501398B2 (en) 2015-04-28 2015-04-28 Concept processing device and program

Country Status (1)

Country Link
JP (1) JP6501398B2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018159237A1 (en) * 2017-02-28 2018-09-07 国立研究開発法人物質・材料研究機構 Search method, search device, and search system
JP2020087455A (en) * 2018-11-28 2020-06-04 富士通株式会社 Recommendation generation method and recommendation generation device

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006215936A (en) * 2005-02-07 2006-08-17 Hitachi Ltd Search system and search method
JP2010117764A (en) * 2008-11-11 2010-05-27 Nippon Telegr & Teleph Corp <Ntt> Inter-word association degree determining device, inter-word association degree determination method, program, and recording medium
JP2013242626A (en) * 2012-05-18 2013-12-05 Sony Corp Information processing apparatus, information processing method, and program

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006215936A (en) * 2005-02-07 2006-08-17 Hitachi Ltd Search system and search method
JP2010117764A (en) * 2008-11-11 2010-05-27 Nippon Telegr & Teleph Corp <Ntt> Inter-word association degree determining device, inter-word association degree determination method, program, and recording medium
JP2013242626A (en) * 2012-05-18 2013-12-05 Sony Corp Information processing apparatus, information processing method, and program

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
中田 正雄: "個人に特化したWeb検索システムの開発", 電子情報通信学会技術研究報告, vol. 104, no. 742, JPN6019005096, 11 March 2005 (2005-03-11), JP, pages 23 - 28, ISSN: 0003978837 *
小池 麻子: "情報の価値化・知識化技術の実現へ向けて 3 テキストマイニングによる潜在的知識の発見支援", 情報処理, vol. 第48巻 第8号, JPN6019005097, 15 August 2007 (2007-08-15), JP, pages 824 - 829, ISSN: 0003978838 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018159237A1 (en) * 2017-02-28 2018-09-07 国立研究開発法人物質・材料研究機構 Search method, search device, and search system
JPWO2018159237A1 (en) * 2017-02-28 2019-12-19 国立研究開発法人物質・材料研究機構 Search method, search device, and search system
US11163829B2 (en) 2017-02-28 2021-11-02 National Institute For Materials Science Search method, search device, and search system
JP2020087455A (en) * 2018-11-28 2020-06-04 富士通株式会社 Recommendation generation method and recommendation generation device
JP7367473B2 (en) 2018-11-28 2023-10-24 富士通株式会社 Recommendation generation method, device and program

Also Published As

Publication number Publication date
JP6501398B2 (en) 2019-04-17

Similar Documents

Publication Publication Date Title
US10310812B2 (en) Matrix ordering for cache efficiency in performing large sparse matrix operations
KR101793222B1 (en) Updating a search index used to facilitate application searches
US11544578B2 (en) Method, device and equipment for fusing different instances describing same entity
JP6163607B2 (en) Method and apparatus for constructing event knowledge database
US20190102390A1 (en) Semantic search engine and visualization platform
US9940410B2 (en) Method of searching for relevant node, and computer therefor and computer program
US9336497B2 (en) System and method for an expert question answer system from a dynamic corpus
WO2014126657A1 (en) Latent semantic analysis for application in a question answer system
US20180144424A1 (en) Method and system for content processing to query multiple healthcare-related knowledge graphs
JP2022046759A (en) Retrieval method, device, electronic apparatus and storage medium
US8620941B2 (en) Apparatus and method of searching and visualizing instance path
US20170308620A1 (en) Making graph pattern queries bounded in big graphs
CN110275962B (en) Method and apparatus for outputting information
US20160335267A1 (en) Method and apparatus for natural language search for variables
US9092547B2 (en) Transforming a graph to a tree in accordance with analyst guidance
JP6501398B2 (en) Concept processing device and program
US8965910B2 (en) Apparatus and method of searching for instance path based on ontology schema
EP2778971A1 (en) Rule triggering for search rule engine
JP2019121060A (en) Generation program, generation method and information processing apparatus
Antunes et al. Context storage for m2m scenarios
WO2015166508A1 (en) Correlation based instruments discovery
Kumar et al. Efficient structuring of data in big data
Fogliaroni et al. Qualitative spatial configuration search
Xu et al. An upper-ontology-based approach for automatic construction of IOT ontology
US11468078B2 (en) Hierarchical data searching using tensor searching, fuzzy searching, and Bayesian networks

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180226

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20181026

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190207

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190219

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190318

R150 Certificate of patent or registration of utility model

Ref document number: 6501398

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250