JP4607831B2 - Ontology approximation device, ontology approximation method, and ontology approximation program - Google Patents

Ontology approximation device, ontology approximation method, and ontology approximation program Download PDF

Info

Publication number
JP4607831B2
JP4607831B2 JP2006198414A JP2006198414A JP4607831B2 JP 4607831 B2 JP4607831 B2 JP 4607831B2 JP 2006198414 A JP2006198414 A JP 2006198414A JP 2006198414 A JP2006198414 A JP 2006198414A JP 4607831 B2 JP4607831 B2 JP 4607831B2
Authority
JP
Japan
Prior art keywords
class
ontology
interest
degree
instance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2006198414A
Other languages
Japanese (ja)
Other versions
JP2008027143A (en
Inventor
真 中辻
優 三好
祥広 大塚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2006198414A priority Critical patent/JP4607831B2/en
Publication of JP2008027143A publication Critical patent/JP2008027143A/en
Application granted granted Critical
Publication of JP4607831B2 publication Critical patent/JP4607831B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明はオントロジの近似度計測装置、オントロジの近似度計測方法およびオントロジの近似度計測プログラムに関し、特に、ブログエントリを参照しつつ、個人の興味情報が概念階層化されたパーソナルオントロジを自動的に生成した上で、パーソナルオントロジ間の近似度を効率よく計測する方法に適用して好適なものである。   The present invention relates to an ontology approximation measuring device, an ontology approximation measuring method, and an ontology approximation measuring program, and in particular, automatically refers to a personal ontology in which personal interest information is conceptually layered while referring to a blog entry. After being generated, it is suitable for application to a method for efficiently measuring the degree of approximation between personal ontology.

インターネット上などで情報検索を実施する場合、主としてキーワード入力による情報検索が行われている。このキーワード検索では、例えば、ビデオ録画装置の分野においては、録画内容がキーワードによって指定されるため、ユーザが適切なキーワードを思いつかないと、意図したビデオ内容を録画することができなかった。
また、gooなどの検索エンジンを利用した検索においても、ユーザが適切なキーワードを思いつかないと、意図した内容を検索することができないだけでなく、不要な検索結果が多数含まれることがあった。
When performing an information search on the Internet or the like, an information search is mainly performed by inputting a keyword. In this keyword search, for example, in the field of video recording devices, since the recording content is specified by a keyword, the intended video content could not be recorded unless the user came up with an appropriate keyword.
Further, even in a search using a search engine such as google, if the user does not come up with an appropriate keyword, the intended content cannot be searched, and many unnecessary search results may be included.

さらに、doblogなどのブログプロバイダにおいても、ユーザはキーワードベースで興味のある情報を検索し、検索結果にかかったブログサイトにアクセスするというレベルに留まっており、ユーザが興味のある未知のキーワードやコミュニティあるいはブログサイトを発見することができなかった。
この理由の一つとして、現在の検索方法はキーワード検索のみであり、クラス(概念)体系やクラスの持つ属性、すなわちクラス名やインスタンス(実体)を利用した精度の高い検索を実施できないことが挙げられる。キーワードはただの文字列であるが、オントロジの持つクラスは複数のインスタンスをメンバとして持つものであり、どのようなインスタンスをクラスの構成メンバとするかによって、各個人の嗜好をクラスに反映させることができる。また、クラス階層の取り方によっても、各個人の嗜好をクラスに反映させることができる。
ここで、従来のオントロジ間の近似度の計算方法では、非特許文献1に開示されているように、完全に分散された環境下で構築されたオントロジが対象とされる。このため、オントロジ間の近似度の計算の前処理として、オントロジの持つクラス間の対応関係の導出が行われる。
Furthermore, even in blog providers such as doblog, the user remains at the level of searching for information of interest on a keyword basis and accessing the blog site according to the search result, and the unknown keyword or community in which the user is interested. Or I couldn't find a blog site.
One reason for this is that the current search method is only keyword search, and a high-precision search using the class (concept) system and class attributes, that is, class names and instances (substances) cannot be performed. It is done. The keyword is just a character string, but the ontology class has multiple instances as members, and the individual preference is reflected in the class depending on what instance is a member of the class. Can do. Also, the preference of each individual can be reflected in the class depending on the class hierarchy.
Here, in the conventional method for calculating the degree of approximation between ontology, as disclosed in Non-Patent Document 1, an ontology constructed in a completely distributed environment is targeted. For this reason, as a pre-process for calculating the degree of approximation between ontology, a correspondence relationship between classes of ontology is derived.

図7は、従来の完全に分散された環境下で構築されたオントロジの構成例を示す図である。
図7において、オントロジOAには、“ロック”というクラスが存在している。そして、“ロック”というクラスには、“US”という子クラスが存在し、“US”という子クラスには、“インディーズ”という子クラスが存在し、“インディーズ”という子クラスには、“グランジ”という子クラスが存在している。そして、“グランジ”という子クラスには、“nirvana”、“Foo Fighters”および“super chunk”というインスタンスが存在しているものとする。
FIG. 7 is a diagram illustrating a configuration example of an ontology constructed in a conventional completely distributed environment.
In FIG. 7, the ontology OA has a class called “lock”. The class “Rock” has a child class “US”, the child class “US” has a child class “Indie”, and the child class “Indies” has a “Grunge” class. There is a child class. Further, it is assumed that instances “nirvana”, “Foo Fighters”, and “super chunk” exist in the child class “grunge”.

一方、オントロジOBには、“ロック”というクラスが存在している。そして、“ロック”というクラスには、“アメリカ”および“イギリス”という子クラスが存在し、“アメリカ”という子クラスには、“アメリカ”という子クラスには“indies”という子クラスが存在し、“indies”という子クラスには“nirvana”および“Stone temple pilots”というインスタンスが存在しているものとする。   On the other hand, the ontology OB has a class called “lock”. The class “Rock” has child classes “America” and “United Kingdom”, and the child class “America” has a child class “Indies” in the child class “America”. It is assumed that instances “nirvana” and “Stone temple pilots” exist in the child class “indies”.

さらに、“イギリス”という子クラスには、“オルタナティブ”という子クラスが存在し、“オルタナティブ”という子クラスには、“スコットランド”という子クラスが存在している。そして、“スコットランド”には、“teenage”というインスタンスが存在しているものとする。
そして、オントロジOA、OB間の近似度を計測する場合、これらのオントロジOA、OBにそれぞれ含まれるクラス間のマッピングを行う。ここで、オントロジOA、OBにそれぞれ含まれるクラス間のマッピングを行う場合、各オントロジOA、OBを構成するクラス間の全組み合わせに対して近似度を計測することができる。
Furthermore, the child class “UK” has a child class “Alternative”, and the child class “Alternative” has a child class “Scotland”. It is assumed that an instance of “tenage” exists in “Scotland”.
When the degree of approximation between the ontology OA and OB is measured, mapping between classes included in the ontology OA and OB is performed. Here, when mapping between classes included in the ontology OA and OB is performed, the degree of approximation can be measured for all combinations between classes constituting the ontology OA and OB.

すなわち、図8および図9に示すように、各オントロジOA、OBに含まれる全てのクラス間で総当りにて近似度をそれぞれ算出することにより、オントロジOA、OB間のマッピングを行うことができる。なお、近似度を計測方法としては、クラスの持つ名前属性や各種プロパティ、インスタンス集合などのクラス特性の近似度に基づいて計算することができる。   That is, as shown in FIG. 8 and FIG. 9, mapping between ontology OA and OB can be performed by calculating the approximation degree between all classes included in each ontology OA and OB. . As a method of measuring the degree of approximation, it can be calculated based on the degree of approximation of class characteristics such as name attributes, various properties, and instance sets possessed by a class.

図10は、図7のクラス間におけるマッピング結果の一例を示す図である。
図10において、オントロジOA、OB間のマッピングの結果、オントロジOAの“ロック”というクラスとオントロジOBの“ロック”というクラスとがマッピングされ、オントロジOAの“US”というクラスとオントロジOBの“アメリカ”というクラスとがマッピングされ、オントロジOAの“インディーズ”というクラスとオントロジOBの“indies”というクラスとがマッピングされ、オントロジOAの“グランジ”というクラスとオントロジOBの“indies”というクラスとがマッピングされたものとする。
FIG. 10 is a diagram illustrating an example of a mapping result between the classes of FIG.
In FIG. 10, as a result of mapping between ontology OA and OB, ontology OA “lock” class and ontology OB “lock” class are mapped, ontology OA “US” class and ontology OB “USA” ”Is mapped, ontology OA“ indie ”class is mapped to ontology OB“ indies ”class, ontology OA“ grunge ”class and ontology OB“ indies ”class is mapped It shall be assumed.

そして、オントロジOA、OBのクラス間におけるマッピングが行われると、近似度の高いクラスの隣接クラスからなるクラス集合間の近似度を計測する。なお、クラス集合間の近似度の計測方法としては、例えば、Jaccard係数を用いることができる。このJaccard係数では、クラス集合X、Y間の近似度は、(X∩Y)/(X∪Y)にて求めることができる。   When mapping between the classes of ontology OA and OB is performed, the degree of approximation between the class sets composed of the adjacent classes of the class having a high degree of approximation is measured. As a method for measuring the degree of approximation between class sets, for example, a Jaccard coefficient can be used. With this Jaccard coefficient, the degree of approximation between the class sets X and Y can be obtained by (X∩Y) / (X∪Y).

図11は、図7のオントロジ間における近似度計測結果の一例を示す図である。
図11において、図7のオントロジOA、OBのクラス間において、図10のマッピング結果が得られたものとする。この場合、オントロジOAにおいて、“ロック”というクラスおよび“US”というクラスからなるクラス集合G11、“ロック”というクラス、“US”というクラスおよび“インディーズ”というクラスからなるクラス集合G12、“インディーズ”というクラスおよび“グランジ”というクラスからなるクラス集合G13が得られる。
FIG. 11 is a diagram illustrating an example of the approximation degree measurement result between the ontology in FIG.
In FIG. 11, it is assumed that the mapping result of FIG. 10 is obtained between the classes of ontology OA and OB of FIG. In this case, in ontology OA, a class set G11 consisting of a class called "lock" and a class called "US", a class called "lock", a class set G12 consisting of a class called "US" and a class called "indie", "indie" And a class set G13 including the class “grunge” is obtained.

一方、オントロジOBにおいて、“ロック”というクラス、“アメリカ”というクラスおよび“イギリス”というクラスからなるクラス集合G21、“ロック”というクラス、“アメリカ”というクラスおよび“indies”というクラスからなるクラス集合G22、“アメリカ”というクラスおよび“indies”というクラスからなるクラス集合G23が得られる。   On the other hand, in ontology OB, a class set G21 consisting of a class "Rock", a class "America" and a class "UK", a class set "Class" "Rock", a class "America" and a class "Indies" G22, a class set G23 consisting of a class “America” and a class “indies” is obtained.

そして、クラス集合G11、G21間では、クラス集合G11の“ロック”というクラスとクラス集合G21の“ロック”というクラスとは対応関係にあるので、これらで1個のメンバとみなし、クラス集合G11の“US”というクラスとクラス集合G21の“アメリカ”というクラスとは対応関係にあるので、これらで1個のメンバとみなし、さらにクラス集合G21には“イギリス”というクラスが含まれるので、クラス集合G11、G21全体のメンバ数(G11∪G21)は3となる。   Between the class sets G11 and G21, the class “lock” in the class set G11 and the class “lock” in the class set G21 are in a correspondence relationship. Since the class “US” and the class “USA” in the class set G21 are in a corresponding relationship, they are regarded as one member, and the class set G21 includes a class “UK”. The total number of members G11 and G21 (G11∪G21) is 3.

一方、クラス集合G11の“ロック”というクラスとクラス集合G21の“ロック”というクラスとは対応関係にあり、クラス集合G11の“US”というクラスとクラス集合G21の“アメリカ”というクラスとは対応関係にあり、クラス集合G21の“イギリス”に対応するクラスはクラス集合G11にはないので、クラス集合G11、G21間に共通に含まれるメンバ数(G11∩G21)は2となる。この結果、クラス集合G11、G21間におけるJaccard係数は2/3となる。   On the other hand, the class “lock” in the class set G11 and the class “lock” in the class set G21 have a correspondence relationship, and the class “US” in the class set G11 and the class “America” in the class set G21 correspond to each other. Since there is no class corresponding to “UK” in the class set G21 in the class set G11, the number of members commonly included between the class sets G11 and G21 (G11∩G21) is two. As a result, the Jaccard coefficient between the class sets G11 and G21 is 2/3.

同様に、クラス集合G12、G22間におけるJaccard係数は2/4、クラス集合G13、G23間におけるJaccard係数は1/3となる。
そして、オントロジOA、OBのクラス集合間におけるJaccard係数がそれぞれ求まると、これらのクラス集合間におけるJaccard係数を足し合わせる。そして、Jaccard係数を足し合わせた結果をソースオントロジOAのクラス数にて除することで、オントロジOAからみたオントロジOBの近似度を計測することができる。例えば、図11では、ソースオントロジOAのクラス数は4なので、オントロジOAからみたオントロジOBの近似度は、(2/3+2/4+1/3)/4=3/8となる。
Similarly, the Jaccard coefficient between the class sets G12 and G22 is 2/4, and the Jaccard coefficient between the class sets G13 and G23 is 1/3.
When the Jaccard coefficients between the ontology OA and OB class sets are found, the Jaccard coefficients between these class sets are added together. Then, by dividing the result obtained by adding the Jaccard coefficients by the number of classes of the source ontology OA, the degree of approximation of the ontology OB viewed from the ontology OA can be measured. For example, in FIG. 11, since the number of classes of the source ontology OA is 4, the degree of approximation of the ontology OB viewed from the ontology OA is (2/3 + 2/4 + 1/3) / 4 = 3/8.

図12は、従来の複数のオントロジに対する近似度計測結果の比較例を示す図である。
図12において、オントロジOCでは、オントロジOBの“イギリス”というクラス以下の子クラスがないものとする。そして、オントロジOCでは、“ロック”というクラスおよび“アメリカ”というクラスからなるクラス集合G31、“ロック”というクラス、“アメリカ”というクラスおよび“indies”というクラスからなるクラス集合G32、“アメリカ”というクラスおよび“indies”というクラスからなるクラス集合G33が得られる。
FIG. 12 is a diagram illustrating a comparative example of the degree-of-approximation measurement results for a plurality of conventional ontology.
In FIG. 12, it is assumed that the ontology OC has no child class below the class “UK” of the ontology OB. In the ontology OC, a class set G31 composed of a class “Rock” and a class “America”, a class set G32 composed of a class “Lock”, a class “America” and a class “indies”, “America” A class set G33 including the class and the class “indies” is obtained.

この場合、クラス集合G11、G31間におけるJaccard係数は2/2、クラス集合G12、G32間におけるJaccard係数は2/4、クラス集合G13、G33間におけるJaccard係数は1/3となる。この結果、オントロジOAからみたオントロジOCの近似度は、(2/2+2/4+1/3)/4=11/24となる。
また、非特許文献2には、複数のオントロジを構成するクラス間のマッピングを半自動で実現する方法が開示されている。
In this case, the Jaccard coefficient between the class sets G11 and G31 is 2/2, the Jaccard coefficient between the class sets G12 and G32 is 2/4, and the Jaccard coefficient between the class sets G13 and G33 is 1/3. As a result, the degree of approximation of ontology OC viewed from ontology OA is (2/2 + 2/4 + 1/3) / 4 = 11/24.
Non-Patent Document 2 discloses a method for realizing semi-automatic mapping between classes constituting a plurality of ontology.

Maedche,A.and Staab,S.:Measuring Similarity between Ontologies,In Technical Report,E0448,University of Karlsruhe(2001)Maedche, A .; and Staab, S .; : Measuring Similarity between Ontologies, In Technical Report, E0448, University of Karlsruhe (2001) 中辻真、三好優、木村辰幸:“柔軟なシステム連携のための意味情報に基づくメッセージマッピング手法の提案と評価”,日本データベース学会 Letters,Vol.4,No.1,pp.37−40(2005)Makoto Nakajo, Yu Miyoshi, Yasuyuki Kimura: “Proposal and Evaluation of Message Mapping Method Based on Semantic Information for Flexible System Cooperation”, Database Society of Japan Letters, Vol. 4, no. 1, pp. 37-40 (2005)

しかしながら、非特許文献1に開示された方法では、オントロジ間の近似度を計算するためには、オントロジの持つクラス間の対応関係の判定(クラスマッピング)を行う必要があり、オントロジの持つクラスの数が増大すると、計算量が膨大になるという問題があった。
また、非特許文献2に開示された方法では、完全に分散された環境下で構築されたオントロジ間のクラス間の対応を計測するもので、クラスのマッピングを行ったからといって、オントロジ間の近似度が計算されるわけではないという問題があった。
However, in the method disclosed in Non-Patent Document 1, in order to calculate the degree of approximation between ontology, it is necessary to determine the correspondence (class mapping) between the classes possessed by the ontology. When the number increases, there is a problem that the calculation amount becomes enormous.
In addition, the method disclosed in Non-Patent Document 2 measures the correspondence between classes between ontology constructed in a completely distributed environment. There was a problem that the degree of approximation was not calculated.

さらに、従来のオントロジ間の近似度の計測方法では、あるアーチストを熱心に語っているユーザ同士であろうが、あるユーザはそのアーチストについて熱心に語っており、別のユーザはそのアーチストについて熱心に語っていない場合であろうが、そのアーチストについての興味の近さは同じであると計測されることから、ユーザの興味を十分に反映しながら、オントロジ間の近似度の計測することができないという問題があった。
そこで、本発明の目的は、計算量を抑制しつつ、ユーザの興味を十分に反映しながらオントロジ間の近似度を計算することが可能なオントロジの近似度計測装置、オントロジの近似度計測方法およびオントロジの近似度計測プログラムを提供することである。
Furthermore, in the conventional method for measuring the degree of approximation between ontologies, users who are eagerly talking about an artist, one user is eagerly talking about the artist, and another user is eagerly talking about the artist. Although it may not be the case, since the degree of interest in the artist is measured to be the same, the degree of approximation between ontology cannot be measured while sufficiently reflecting the user's interest. There was a problem.
Therefore, an object of the present invention is to provide an ontology approximation measuring device, an ontology approximation measuring method, and an ontology approximation measuring method capable of calculating an approximation between ontology while sufficiently reflecting a user's interest while suppressing a calculation amount. To provide an ontology approximation measurement program.

上述した課題を解決するために、請求項記載のオントロジの近似度計測装置ブログエントリを個人ごとに記憶する記憶手段と、前記ブログエントリに含まれる単語を、前記ブログエントリに対して形態素解析を適用することにより抽出する単語抽出手段と、予め設定された単語が概念階層化されてなる雛形オントロジを記憶する記憶手段と、前記雛形オントロジから前記単語抽出手段で抽出された単語を含むクラスまたはインスタンスを抽出する分類子適用手段と、前記抽出されたクラスまたはインスタンスおよびそれらの上位のクラスを含む階層構造を、個人の興味情報を表すパーソナルオントロジとして前記雛形オントロジから個人ごとに抽出するパーソナルオントロジ抽出手段と、前記ブログエントリに含まれる単語を含む前記雛形オントロジのクラスまたはインスタンスに対する、当該ブログエントリを持つ個人の興味度を計測する興味度計測手段と、前記興味度計測手段にて計測された前記興味度に基づいて、異なる前記パーソナルオントロジ間の近似度を計測する近似度計測手段と、を備え、前記興味度計測手段は、前記ブログエントリの個人ごとの集合をE、当該集合Eのうちの一のブログエントリに出現する単語を含む前記クラスおよびインスタンスの種類数をN(Ei)としたとき、前記一のブログエントリに含まれる単語を含む前記インスタンスに対する前記興味度を、

Figure 0004607831
から計測し、前記一のブログエントリに含まれる単語を含むクラスに対する前記興味度を、
Figure 0004607831
から計測し、前記近似度計測手段は、前記異なるパーソナルオントロジ間の近似度をSo(AB)としたとき、
Figure 0004607831
から計測することを特徴とする。
なお、S(T )式中のIt(Ci)は、
Figure 0004607831
である。I(Cj)は、前記異なるパーソナルオントロジが共に有する雛形オントロジの同一クラスである共通クラスCjに対する興味一致度であって、前記異なるパーソナルオントロジそれぞれにおける前記共通クラスCjに対する興味度のうち小さい方に設定される。N(Ci)は前記異なるパーソナルオントロジにおいて前記共通クラスCjに属するクラスの積集合、U(Ci)は前記共通クラスCjに属するクラスの和集合を表す。
また、S(T )式中のIt(Ci)は、
Figure 0004607831
である。I(Ii)は、前記異なるパーソナルオントロジが共に有する雛形オントロジの同一インスタンスである共通インスタンスIiに対する興味一致度であって、前記異なるパーソナルオントロジそれぞれにおける前記共通インスタンスIiに対する興味度のうち小さい方に設定される。また、I (Ci)は、一方のパーソナルオントロジにおける共通クラスCiに属するインスタンス集合、I (Ci)は、他方のパーソナルオントロジにおける共通クラスCiに属するインスタンス集合である。 To solve the problems described above, the similarity measuring device ontology according to claim 1, storage means for storing a blog entry for each individual, the words included in the blog entry, morphemes to the blog entry A word extraction means for extracting by applying analysis; a storage means for storing a template ontology in which preset words are hierarchized into a concept; and a class including words extracted from the template ontology by the word extraction means Or a classifier applying means for extracting an instance, and a personal ontology for extracting a hierarchical structure including the extracted class or instance and higher classes thereof from the template ontology for each individual as a personal ontology representing personal interest information. wherein comprising extraction means, a word included in the blog entry For the class or instance in the form ontology, the interest degree measuring means for measuring the individual degree of interest with the blog entry, based on the interest degree that is measured by the degree of interest measuring means, approximation between different said personal ontology An approximation degree measuring means for measuring the degree , wherein the interest degree measuring means is E, a set of individuals of the blog entry, and the class including words appearing in one blog entry of the set E, and When the number of types of instances is N (Ei), the degree of interest in the instances including the words included in the one blog entry is
Figure 0004607831
And the degree of interest in the class including the word included in the one blog entry,
Figure 0004607831
When the approximation degree between the different personal ontology is defined as So (AB),
Figure 0004607831
It is characterized by measuring from .
It (Ci) in the S (T 1 ) formula is
Figure 0004607831
It is. I (Cj) is the degree of interest coincidence with respect to the common class Cj that is the same class of the template ontology possessed by the different personal ontologies, and is set to the smaller of the degrees of interest with respect to the common class Cj in the different personal ontologies. Is done. N (Ci) represents a product set of classes belonging to the common class Cj in the different personal ontology, and U (Ci) represents a union of classes belonging to the common class Cj.
In addition, It (Ci) in the S (T 2 ) formula is
Figure 0004607831
It is. I (Ii) is the degree of interest in the common instance Ii that is the same instance of the template ontology that the different personal ontologies have together, and is set to the smaller of the interest in the common instance Ii in each of the different personal ontologies Is done. I A (Ci) is an instance set belonging to the common class Ci in one personal ontology, and I B (Ci) is an instance set belonging to the common class Ci in the other personal ontology.

また、請求項記載のオントロジの近似度計測方法個人のブログエントリに含まれる単語が概念階層化されてなるパーソナルオントロジ間の近似度を計測する近似度計測装置が実行するオントロジの近似度計測方法であって、記憶手段に個人ごとに記憶されたブログエントリに含まれる単語を、前記ブログエントリに対して形態素解析を適用することにより抽出するステップと、記憶手段に記憶され、予め設定された単語が概念階層化されてなる雛形オントロジから、前記ブログエントリから抽出された単語を含むクラスまたはインスタンスを抽出するステップと、前記抽出されたクラスまたはインスタンスおよびそれらの上位のクラスを含む階層構造を、個人の興味情報を表すパーソナルオントロジとして前記雛形オントロジから個人ごとに抽出するステップと、前記ブログエントリの個人ごとの集合をE、当該集合Eのうちの一のブログエントリに出現する単語を含む前記クラスおよびインスタンスの種類数をN(Ei)としたとき、前記一のブログエントリを持つ個人の、前記一のブログエントリに含まれる単語を含む前記インスタンスに対する興味度を、

Figure 0004607831
から計測し且つ前記一のブログエントリに含まれる単語を含むクラスに対する興味度を、
Figure 0004607831
から計測するステップと、計測された前記興味度に基づいて、異なるパーソナルオントロジ間の近似度So(AB)を
Figure 0004607831
から計測するステップと、を備えることを特徴とする。
なお、S(T )式中のIt(Ci)は、
Figure 0004607831
である。I(Cj)は、前記異なるパーソナルオントロジが共に有する雛形オントロジの同一クラスである共通クラスCjに対する興味一致度であって、前記異なるパーソナルオントロジそれぞれにおける前記共通クラスCjに対する興味度のうち小さい方に設定される。N(Ci)は前記異なるパーソナルオントロジにおいて前記共通クラスCjに属するクラスの積集合、U(Ci)は前記共通クラスCjに属するクラスの和集合を表す。
また、S(T )式中のIt(Ci)は、
Figure 0004607831
である。I(Ii)は、前記異なるパーソナルオントロジが共に有する雛形オントロジの同一インスタンスである共通インスタンスIiに対する興味一致度であって、前記異なるパーソナルオントロジそれぞれにおける前記共通インスタンスIiに対する興味度のうち小さい方に設定される。また、I (Ci)は、一方のパーソナルオントロジにおける共通クラスCiに属するインスタンス集合、I (Ci)は、他方のパーソナルオントロジにおける共通クラスCiに属するインスタンス集合である。 Also, similarity measurement method of the ontology of claim 2, wherein the degree of approximation ontology words contained in the personal blog entries to measure the degree of approximation between the personal ontology formed by the concept hierarchical similarity measuring device executes a measuring method, the words included in the blog entry that is stored for each individual in the storage means, and extracting by applying a morphological analysis on the blog entry, stored in the storage means, it is set in advance from model ontology word is formed by the concept hierarchical was, extracting class or instance including words extracted from the blog entry, a hierarchical structure that contains the class of the extracted class or instance and their upper , individuals from the template ontology as a personal ontology representing the interest information of individuals Doo in extracting, E a set for each individual of the blog entry, when the number of types of the class and instance containing the word appearing in one blog entry out of the set E was N (Ei), The degree of interest of the individual having the one blog entry with respect to the instance including the word included in the one blog entry is:
Figure 0004607831
And the degree of interest in the class including the word included in the one blog entry.
Figure 0004607831
A step of measuring the, on the basis of the degree of interest that is measured, the degree of approximation between different personal ontologies So the (AB)
Figure 0004607831
And a step of measuring from the above.
It (Ci) in the S (T 1 ) formula is
Figure 0004607831
It is. I (Cj) is the degree of interest coincidence with respect to the common class Cj that is the same class of the template ontology possessed by the different personal ontologies, and is set to the smaller of the degrees of interest with respect to the common class Cj in the different personal ontologies. Is done. N (Ci) represents a product set of classes belonging to the common class Cj in the different personal ontology, and U (Ci) represents a union of classes belonging to the common class Cj.
In addition, It (Ci) in the S (T 2 ) formula is
Figure 0004607831
It is. I (Ii) is the degree of interest in the common instance Ii that is the same instance of the template ontology that the different personal ontologies have together, and is set to the smaller of the interest in the common instance Ii in each of the different personal ontologies Is done. I A (Ci) is an instance set belonging to the common class Ci in one personal ontology, and I B (Ci) is an instance set belonging to the common class Ci in the other personal ontology.

また、請求項記載のオントロジの近似度計測プログラム記憶手段に個人ごとに記憶されたブログエントリに含まれる単語を、前記ブログエントリに対して形態素解析を適用することにより抽出するステップと、記憶手段に記憶され、予め設定された単語が概念階層化されてなる雛形オントロジから、前記ブログエントリから抽出された単語を含むクラスまたはインスタンスを抽出するステップと、前記抽出されたクラスまたはインスタンスおよびそれらの上位のクラスを含む階層構造を、個人の興味情報を表すパーソナルオントロジとして前記雛形オントロジから個人ごとに抽出するステップと、前記ブログエントリの個人ごとの集合をE、当該集合Eのうちの一のブログエントリに出現する単語を含む前記クラスおよびインスタンスの種類数をN(Ei)としたとき、前記一のブログエントリを持つ個人の、前記一のブログエントリに含まれる単語を含む前記インスタンスに対する興味度を、

Figure 0004607831
から計測し且つ前記一のブログエントリに含まれる単語を含むクラスに対する興味度を、
Figure 0004607831
から計測するステップと、計測された前記興味度に基づいて、異なるパーソナルオントロジ間の近似度So(AB)を
Figure 0004607831
から計測するステップとをコンピュータに実行させることを特徴とする。
なお、S(T )式中のIt(Ci)は、
Figure 0004607831
である。I(Cj)は、前記異なるパーソナルオントロジが共に有する雛形オントロジの同一クラスである共通クラスCjに対する興味一致度であって、前記異なるパーソナルオントロジそれぞれにおける前記共通クラスCjに対する興味度のうち小さい方に設定される。N(Ci)は前記異なるパーソナルオントロジにおいて前記共通クラスCjに属するクラスの積集合、U(Ci)は前記共通クラスCjに属するクラスの和集合を表す。
また、S(T )式中のIt(Ci)は、
Figure 0004607831
である。I(Ii)は、前記異なるパーソナルオントロジが共に有する雛形オントロジの同一インスタンスである共通インスタンスIiに対する興味一致度であって、前記異なるパーソナルオントロジそれぞれにおける前記共通インスタンスIiに対する興味度のうち小さい方に設定される。また、I (Ci)は、一方のパーソナルオントロジにおける共通クラスCiに属するインスタンス集合、I (Ci)は、他方のパーソナルオントロジにおける共通クラスCiに属するインスタンス集合である。 In addition, the ontology approximation degree measuring program according to claim 3 extracts a word included in a blog entry stored for each individual in a storage unit by applying morphological analysis to the blog entry ; Extracting a class or instance including a word extracted from the blog entry from a template ontology that is stored in a storage means and conceptually hierarchized words set in advance ; the extracted class or instance and the A step of extracting a hierarchical structure including higher classes from the template ontology as a personal ontology representing personal interest information for each individual, and E for each individual set of blog entries. The class and instance containing words that appear in the blog entry When the number of types was N (Ei), individuals with the one blog entry, the interest degree of the instance that contains the words included in the one blog entry,
Figure 0004607831
The degree of interest in the class that includes the word that is measured from and included in the one blog entry,
Figure 0004607831
A step of measuring the, on the basis of the degree of interest that is measured, the degree of approximation between different personal ontologies So the (AB)
Figure 0004607831
The steps of measuring from that characterized by causing a computer to execute the.
It (Ci) in the S (T 1 ) formula is
Figure 0004607831
It is. I (Cj) is the degree of interest coincidence with respect to the common class Cj that is the same class of the template ontology possessed by the different personal ontologies, and is set to the smaller of the degrees of interest with respect to the common class Cj in the different personal ontologies. Is done. N (Ci) represents a product set of classes belonging to the common class Cj in the different personal ontology, and U (Ci) represents a union of classes belonging to the common class Cj.
In addition, It (Ci) in the S (T 2 ) formula is
Figure 0004607831
It is. I (Ii) is the degree of interest in the common instance Ii that is the same instance of the template ontology that the different personal ontologies have together, and is set to the smaller of the interest in the common instance Ii in each of the different personal ontologies Is done. I A (Ci) is an instance set belonging to the common class Ci in one personal ontology, and I B (Ci) is an instance set belonging to the common class Ci in the other personal ontology.

以上説明したように、本発明によれば、個人の興味の強さを考慮しながら単なる文字列ではなく概念間の一致性に基づいて、自分の嗜好に適合した情報を精度よく検索することが可能となるとともに、自分の嗜好に適合した情報をインターネット上で広く流通させることが可能となり、個人の嗜好に適合したコミュニティを形成することができる。   As described above, according to the present invention, it is possible to accurately search for information suitable for one's preference based on consistency between concepts, not just a character string, taking into account the strength of personal interest. It becomes possible, and information suitable for one's preference can be widely distributed on the Internet, and a community suitable for individual preference can be formed.

以下、本発明の実施形態に係るオントロジの近似度計測装置およびその方法について図面を参照しながら説明する。
図1は、本発明の一実施形態に係るオントロジの近似度計測装置が適用されるシステムの概略構成を示すブロック図である。
図1において、端末2〜4およびサーバ5が通信網1を介して接続されている。なお、通信網1としては、例えば、IP通信を行う公衆通信網を用いることができ、インターネットであってもよい。また、企業間の専用通信網であっても、公衆通信網であってもよいが、高信頼性とセキュリティとを備えた専用通信を提供できるIP−VPN(Internet Protocol−Virtual Private Network)のような通信網であってもよい。
Hereinafter, an ontology approximation measuring apparatus and method according to an embodiment of the present invention will be described with reference to the drawings.
FIG. 1 is a block diagram showing a schematic configuration of a system to which an ontology approximation measuring apparatus according to an embodiment of the present invention is applied.
In FIG. 1, terminals 2 to 4 and a server 5 are connected via a communication network 1. As the communication network 1, for example, a public communication network that performs IP communication can be used, and the Internet may be used. Further, it may be a private communication network between companies or a public communication network, but it is like an IP-VPN (Internet Protocol-Virtual Private Network) that can provide dedicated communication with high reliability and security. A simple communication network may be used.

また、端末2〜4としては、ノート型パーソナルコンピュータあるいはデスクトップ型パーソナルコンピュータでもよく、携帯電話端末やPDA(Personal Data Assistant)などでもよい。また、サーバ5は、ブログプロバイダやISP(Information Service Provider)上に設置することができる。   Further, the terminals 2 to 4 may be a notebook personal computer or a desktop personal computer, and may be a mobile phone terminal or a PDA (Personal Data Assistant). The server 5 can be installed on a blog provider or ISP (Information Service Provider).

ここで、サーバ5には、端末2〜4にそれぞれ対応したブログサイト7〜9が設けられ、各ブログサイト7〜9には、ブログエントリ7a〜7n、8a〜8n、9a〜9nがそれぞれ保持されている。なお、ブログエントリ7a〜7n、8a〜8n、9a〜9nはブログにおける記事の最小単位を表し、日にちごとに設けることができる。また、サーバ5には雛形オントロジ6が保持され、雛形オントロジ6には、個人の興味情報が概念階層化されたパーソナルオントロジの雛形が設けられている。   Here, the server 5 is provided with blog sites 7 to 9 corresponding to the terminals 2 to 4 respectively, and the blog entries 7a to 7n, 8a to 8n, and 9a to 9n are held in the blog sites 7 to 9, respectively. Has been. The blog entries 7a to 7n, 8a to 8n, and 9a to 9n represent minimum units of articles in the blog, and can be provided for each day. The server 5 holds a template ontology 6, and the template ontology 6 is provided with a personal ontology template in which personal interest information is conceptually hierarchized.

なお、雛形オントロジ6は、ブログプロバイダ側で恣意的に作成することができる。例えば、ブログプロバイダが音楽に関するパーソナルオントロジを各端末2〜4のユーザに構築させたければ、音楽に関する雛形オントロジ6を構築すればよい。ここで、各端末2〜4のユーザの興味を細やかに表現するために、可能な限り細分化された網羅性の高い雛形オントロジ6を構築することが好ましい。また、雛形オントロジ6の実体は、オントロジ記述言語OWLなどのXML言語で記述されたテキストファイル等、クラス・インスタンスツリーをDB上で表現したものである。また、情報の整理の簡単化のため、インスタンスは最下位クラスにのみ分類してもよい。   The template ontology 6 can be arbitrarily created on the blog provider side. For example, if the blog provider wants the users of the terminals 2 to 4 to construct a personal ontology related to music, the template ontology 6 related to music may be constructed. Here, in order to express the interests of the users of the terminals 2 to 4 in detail, it is preferable to construct a template ontology 6 that is subdivided as much as possible and has high coverage. The entity of the template ontology 6 is a representation of a class / instance tree on the DB such as a text file described in an XML language such as the ontology description language OWL. In order to simplify the organization of information, instances may be classified only into the lowest class.

さらに、サーバ5には、ブログエントリ7a〜7n、8a〜8n、9a〜9nに対して形態素解析をそれぞれ適用することにより、ブログエントリ7a〜7n、8a〜8n、9a〜9nに頻出する単語を抽出する頻出単語抽出手段5a、ブログエントリ7a〜7n、8a〜8n、9a〜9nに頻出する単語を含むクラスまたはインスタンスを雛形オントロジ6から抽出する分類子適用手段5b、分類子適用手段5bにて抽出されたクラスまたはインスタンスおよびそれらの上位の全てのクラスをパーソナルオントロジとして雛形オントロジ6から抽出するパーソナルオントロジ抽出手段5c、分類子適用手段5bにて抽出されたクラスまたはインスタンスがブログエントリ7a〜7n、8a〜8n、9a〜9nに含まれる割合に基づいて、それらのクラスまたはインスタンスに対する興味度を計測する興味度計測手段5d、ならびに興味度計測手段5dにて計測された興味度に基づいて、パーソナルオントロジ間の近似度を計測する近似度計測手段5eが設けられている。   Furthermore, the server 5 applies words that appear frequently in the blog entries 7a to 7n, 8a to 8n, and 9a to 9n by applying morphological analysis to the blog entries 7a to 7n, 8a to 8n, and 9a to 9n, respectively. In the frequent word extraction means 5a to be extracted, the classifier application means 5b and the classifier application means 5b to extract from the template ontology 6 a class or instance including words that frequently appear in the blog entries 7a to 7n, 8a to 8n, and 9a to 9n. Personal ontology extraction means 5c for extracting the extracted class or instance and all higher classes thereof from the template ontology 6 as personal ontology 6, and the class or instance extracted by the classifier applying means 5b are blog entries 7a to 7n, Based on the percentages included in 8a-8n, 9a-9n, An interest degree measuring means 5d for measuring the degree of interest in these classes or instances, and an approximation degree measuring means 5e for measuring the degree of approximation between personal ontology based on the interest degree measured by the interest degree measuring means 5d are provided. It has been.

そして、頻出単語抽出手段5aは、ブログエントリ7a〜7n、8a〜8n、9a〜9nに対して形態素解析をそれぞれ適用する。そして、同一ユーザの持つ複数のブログエントリ7a〜7n、8a〜8n、9a〜9nで頻出する形態素を抽出する。
次に、分類子適用手段5bは、ブログエントリ7a〜7n、8a〜8n、9a〜9nで頻出する各形態素を雛形オントロジ6に適用し、雛形オントロジ6内のクラスまたはインスタンスに一致する文字列があるかどうかを調べる。そして、雛形オントロジ6内のクラスまたはインスタンスに一致する文字列がある場合、パーソナルオントロジ抽出手段5cは、雛形オントロジ6のルートクラスから、そのクラスまたはインスタンスまでの直接的な子孫クラスおよびインスタンスをパーソナルオントロジとして抽出する。
The frequent word extraction means 5a applies morphological analysis to the blog entries 7a to 7n, 8a to 8n, and 9a to 9n, respectively. Then, morphemes that frequently appear in a plurality of blog entries 7a to 7n, 8a to 8n, and 9a to 9n possessed by the same user are extracted.
Next, the classifier applying unit 5b applies each morpheme frequently appearing in the blog entries 7a to 7n, 8a to 8n, and 9a to 9n to the template ontology 6, and a character string that matches the class or instance in the template ontology 6 is applied. Find out if there is. When there is a character string that matches the class or instance in the template ontology 6, the personal ontology extracting means 5c determines the direct descendant classes and instances from the root class of the template ontology 6 to the class or instance. Extract as

また、興味度計測手段5dは、パーソナルオントロジ抽出手段5cにて抽出されたクラスまたはインスタンスがブログエントリ7a〜7n、8a〜8n、9a〜9nに含まれる割合に基づいて、それらのクラスまたはインスタンスに対する興味度を計測する。そして、近似度計測手段5eは、興味度計測手段5dにて計測された興味度とともに、パーソナルオントロジ抽出手段5cにて抽出されたパーソナルオントロジのトポロジをも考慮しながら、パーソナルオントロジ間の近似度を計測することができる。   Also, the interest level measuring means 5d determines the class or instance extracted by the personal ontology extracting means 5c based on the ratio of the blog entries 7a to 7n, 8a to 8n, and 9a to 9n. Measure interest. Then, the degree-of-approximation measuring means 5e calculates the degree of approximation between personal ontology while taking into consideration the topology of the personal ontology extracted by the personal ontology extracting means 5c together with the degree of interest measured by the interest degree measuring means 5d. It can be measured.

これにより、個人の興味の強さを考慮しながら単なる文字列ではなく概念間の一致性に基づいて、自分の嗜好に適合した情報を精度よく検索することが可能となるとともに、自分の嗜好に適合した情報をインターネット上で広く流通させることが可能となり、個人の嗜好に適合したコミュニティを形成することができる。
なお、雛形オントロジ6は、デスクワークにて人手で作成してサーバ5に保持させるようにしてもよいし、パーソナルオントロジ抽出手段5cにて抽出されたパーソナルオントロジを既存の雛形オントロジ6とマージすることにより作成してもよい。さらに、雛形オントロジ6から抽出されたパーソナルオントロジに対してユーザが興味のあるクラスまたはインスタンスを追加したり、ユーザが興味のないクラスまたはインスタンスを削除したりするようにしてもよい。
This makes it possible to accurately search for information that suits one's preference based on the consistency between concepts, not just a character string, taking into account the strength of personal interests. Suitable information can be widely distributed on the Internet, and a community adapted to personal tastes can be formed.
Note that the template ontology 6 may be manually created by desk work and stored in the server 5, or the personal ontology extracted by the personal ontology extracting means 5c may be merged with the existing template ontology 6. You may create it. Furthermore, a class or instance that the user is interested in may be added to the personal ontology extracted from the template ontology 6, or a class or instance that the user is not interested in may be deleted.

また、頻出単語抽出手段5a、分類子適用手段5b、パーソナルオントロジ抽出手段5c、興味度計測手段5dおよび近似度計測手段5eは、これらの手段で行われる処理を遂行させる命令が記述されたプログラムをコンピュータに実行させることにより実現することができる。
そして、このプログラムをCD−ROMなどの記憶媒体に記憶しておけば、サーバ5のコンピュータに記憶媒体を装着し、そのプログラムをコンピュータにインストールすることにより、頻出単語抽出手段5a、分類子適用手段5b、パーソナルオントロジ抽出手段5c、興味度計測手段5dおよび近似度計測手段5eで行われる処理を実現することができる。また、このプログラムを通信網1を介してダウンロードすることにより、このプログラムを容易に普及させることができる。
The frequent word extracting means 5a, classifier applying means 5b, personal ontology extracting means 5c, interest degree measuring means 5d, and approximation degree measuring means 5e are programs having instructions for executing the processing performed by these means. This can be realized by causing a computer to execute it.
If this program is stored in a storage medium such as a CD-ROM, the frequent word extraction means 5a and classifier application means are installed by installing the storage medium in the computer of the server 5 and installing the program in the computer. 5b, the processing performed by the personal ontology extracting means 5c, the interest degree measuring means 5d, and the approximation degree measuring means 5e can be realized. Moreover, by downloading this program via the communication network 1, this program can be easily spread.

また、頻出単語抽出手段5a、分類子適用手段5b、パーソナルオントロジ抽出手段5c、興味度計測手段5dおよび近似度計測手段5eで行われる処理を遂行させる命令が記述されたプログラムをコンピュータに実行させる場合、スタンドアロン型コンピュータで実行させるようにしてもよく、ネットワークに接続された複数のコンピュータに分散処理させるようにしてもよい。   In addition, when a computer executes a program in which an instruction for performing processing performed by the frequent word extraction unit 5a, the classifier application unit 5b, the personal ontology extraction unit 5c, the interest degree measurement unit 5d, and the approximation degree measurement unit 5e is described. It may be executed by a stand-alone computer, or may be distributed to a plurality of computers connected to a network.

図2は、本発明の一実施形態に係るパーソナルオントロジの生成方法を示す図である。
図2において、pingサーバなどを通じ、ユーザA、B、・・・、Xのエントリ集合をそれぞれ収集し、これらの収集した全てのブログエントリに対して形態素解析を行うことにより、インデックスを作成する(ステップS1)。
次に、pingサーバにて収集された全てのブログエントリを雛形オントロジOHに対して分類する(ステップS2)。ここで、ブログエントリの分類方法としては、雛形オントロジOHのあるクラスCの名前属性があるエントリ内の記述にあれば、そのエントリをクラスCに分類することができる。また、雛形オントロジOHのあるクラスCに所属するインスタンスI(∈C)の名前属性があるエントリ内の記述にあれば、そのエントリをクラスCに所属するインスタンスIに分類することができる。なお、同一のエントリが複数のクラスに分類されてもよい。
FIG. 2 is a diagram illustrating a method for generating a personal ontology according to an embodiment of the present invention.
In FIG. 2, an entry set of users A, B,..., X is collected through a ping server or the like, and an index is created by performing morphological analysis on all the collected blog entries ( Step S1).
Next, all the blog entries collected by the ping server are classified with respect to the template ontology OH (step S2). Here, as a method for classifying blog entries, if there is a description in an entry having a name attribute of class C i having a template ontology OH, the entry can be classified into class C i . Also, if the name attribute of the instance I i (∈C i ) belonging to the class C i having the template ontology OH is in the description in the entry, the entry is classified into the instance I i belonging to the class C i. Can do. Note that the same entry may be classified into a plurality of classes.

例えば、“Charlatans”という文字列がエントリ内の記述にある場合、そのエントリは、クラス“Madchester”のインスタンス“Charlatans”に分類することができる。
次に、雛形オントロジOHを形成する最下層クラスCの持つ各インスタンスに興味を持つユーザA、B、・・・、Xの数を計測する(ステップS3)。なお、クラスCのインスタンスに興味を持つユーザA、B、・・・、Xの数を計測する場合、同一のユーザが複数のエントリにおいてインスタンスIを記述している場合においても、ユーザ数は1と計測する。
For example, when a character string “Charlantans” is included in the description in the entry, the entry can be classified into an instance “Charlantans” of the class “Madchester”.
Next, the number of users A, B,..., X who are interested in each instance of the lowermost class C 1 forming the template ontology OH is measured (step S3). When the number of users A, B,..., X who are interested in instances of class C l is measured, the number of users even when the same user describes instance I l in a plurality of entries. Measures 1

次に、雛形オントロジOHを形成する最下層クラスCに興味を持つユーザA、B、・・・、Xの数を計測する。ここで、雛形オントロジOHを形成する最下層クラスCに興味を持つユーザA、B、・・・、Xの数は、最下層クラスCの配下の全てのインスタンスに興味を持つユーザ数と、最下層クラスC自体に興味を持つユーザ数との総和にて算出することができる。なお、同一のユーザが複数のインスタンスに興味を持っていたり、最下層クラスとその最下層クラスに所属するインスタンスに同時に興味を持っている場合においても、ユーザ数は1と計測する。このようにして、雛形オントロジOHを形成するクラスやインスタンスに興味を持つユーザA、B、・・・、Xの数をルートクラスまで再帰的に計測することで、そのドメインに興味を持つユーザA、B、・・・、Xの分布を算出することができる。 Next, the user A interested in lowermost class C l to form a stationery ontology OH, measured B, · · ·, the number of X. Here, the number of users A, B,..., X interested in the lowest class C 1 forming the template ontology OH is the number of users interested in all instances under the lowest class C 1. , it can be calculated by the sum of the number of users interested in the lowest layer class C l itself. Note that the number of users is measured as 1 even when the same user is interested in a plurality of instances or is interested in the lowermost class and instances belonging to the lowermost class at the same time. In this way, by recursively measuring the number of users A, B,..., X interested in the class or instance forming the template ontology OH up to the root class, the user A interested in the domain , B,..., X can be calculated.

次に、pingサーバにて収集された全てのブログエントリが雛形オントロジOHに対して分類されると、その分類結果をユーザIDごとに整理することにより、各ユーザA、B、・・・、Xごとの興味オントロジOA、・・・、OXを生成する(ステップS4)。
ここで、pingサーバにて収集された全てのブログエントリを雛形オントロジOHに対して分類する場合、オントロジの持つ同一クラスに所属するインスタンスは同一の性質を持つという特性と、クラス階層の近いクラス間の性質は近く、両者のインスタンス間の性質も近いという特性を用いることにより、分類の誤りを除去することができる。
Next, when all the blog entries collected by the ping server are classified with respect to the template ontology OH, the classification results are arranged for each user ID, whereby each user A, B,. Each interest ontology OA,..., OX is generated (step S4).
Here, when all the blog entries collected by the ping server are classified with respect to the template ontology OH, the instances that belong to the same class of the ontology have the same property, and between classes close to the class hierarchy The classification error can be eliminated by using the property that the properties of are close and the properties of both instances are also close.

図3は、本発明の一実施形態に係るパーソナルオントロジ間の近似度計測方法を示す図である。なお、以下の説明では、あるオントロジに対する別のオントロジとの間の近似度を計測する場合、前者をソースオントロジ、後者をターゲットオントロジと呼ぶ。
図3において、雛形オントロジOHの“a1”というクラスの直下には、“b1”、“b2”および“b3”というクラスが存在し、“b1”というクラスの直下には、“c1”および“c2”というクラスが存在し、“c1”というクラスの直下には、“d1”および“d2”というクラスが存在しているものとする。また、“b2”というクラスの直下には、“c3”および“c4”というクラスが存在し、“b3”というクラスの直下には、“c5”というクラスが存在しているものとする。
FIG. 3 is a diagram illustrating a method for measuring the degree of approximation between personal ontology according to an embodiment of the present invention. In the following description, when the degree of approximation between an ontology and another ontology is measured, the former is called a source ontology and the latter is called a target ontology.
In FIG. 3, classes “b1”, “b2”, and “b3” exist immediately below the class “a1” of the template ontology OH, and “c1” and “c1” immediately below the class “b1”. It is assumed that a class called “c2” exists and classes “d1” and “d2” exist immediately below the class called “c1”. Also, it is assumed that classes “c3” and “c4” exist immediately below the class “b2”, and a class “c5” exists immediately below the class “b3”.

また、“d1”というクラスには、“j”および“k”というインスタンスが存在し、“d2”というクラスには、“l”というインスタンスが存在し、“c2”というクラスには、“m”というインスタンスが存在し、“b2”というクラスには、“n”というインスタンスが存在し、“c3”というクラスには、“a”、“e”、“c”、“f”、“b”、“d”および“g”というインスタンスが存在し、“c4”というクラスには、“p”、“g”、“j”および“h”というインスタンスが存在しているものとする。   The class “d1” includes instances “j” and “k”, the class “d2” includes the instance “l”, and the class “c2” includes “m”. "B", the class "b2" has an instance "n", and the class "c3" has "a", "e", "c", "f", "b" ”,“ D ”, and“ g ”exist, and the class“ c4 ”includes instances“ p ”,“ g ”,“ j ”, and“ h ”.

そして、各ユーザのブログエントリに頻出する単語をそれぞれ抽出し、その単語を含むクラスまたはインスタンスおよびそれらの上位の全てのクラスを雛形オントロジOHからそれぞれ抽出することにより、パーソナルオントロジOA、OBが作成されたものとする。
ここで、パーソナルオントロジOAの“a1というクラスの直下には、“b1”および“b2”というクラスが存在し、“b1”というクラスの直下には、“c1”および“c2”というクラスが存在し、“c1”というクラスの直下には、“d1”というクラスが存在し、“b2”というクラスの直下には、“c3”および“c4”というクラスが存在しているものとする。また、“d1”というクラスには、“j”および“k”というインスタンスが存在し、“c2”というクラスには、“m”というインスタンスが存在し、“c3”というクラスには、“a”、“c”、“b”および“d”というインスタンスが存在し、“c4”というクラスには、“q”および“h”というインスタンスが存在しているものとする。
Then, the words that frequently appear in each user's blog entry are extracted, and the classes or instances including the words and all the classes above them are extracted from the template ontology OH, thereby creating personal ontologies OA and OB. Shall be.
Here, the classes “b1” and “b2” exist immediately below the class “a1” of the personal ontology OA, and the classes “c1” and “c2” exist immediately below the class “b1”. It is assumed that a class “d1” exists immediately below the class “c1”, and a class “c3” and “c4” exist immediately below the class “b2”. , The class “d1” includes instances “j” and “k”, the class “c2” includes the instance “m”, and the class “c3” includes “a”. , “C”, “b”, and “d” exist, and the class “c4” includes instances “q” and “h”.

また、パーソナルオントロジOBの“a1”というクラスの直下には、“b1”、“b2”および“b3”というクラスが存在し、“b1”というクラスの直下には、“c1”というクラスが存在し、“c1”というクラスの直下には、“d1”というクラスが存在し、“b2”というクラスの直下には、“c3”および“c4”というクラスが存在しているものとする。また、“d2”というクラスには、“l”というインスタンスが存在し、“b2”というクラスには、“n”というインスタンスが存在し、“c3”というクラスには、“a”、“c”、“e”および“f”というインスタンスが存在し、“c4”というクラスには、“p”および“j”というインスタンスが存在しているものとする。   Also, in the personal ontology OB, there are “b1”, “b2”, and “b3” classes directly under the “a1” class, and there is a “c1” class directly under the “b1” class. Assume that a class “d1” exists immediately below the class “c1”, and a class “c3” and “c4” exist immediately below the class “b2”. The class “d2” has an instance “l”, the class “b2” has an instance “n”, and the class “c3” has “a” and “c”. ”,“ E ”, and“ f ”exist, and“ c4 ”class includes“ p ”and“ j ”.

そして、雛形オントロジOHおよびパーソナルオントロジOA、OB間で末端クラスを除く共通クラスを分析し、共通クラスを親クラスとした親子クラスからなるトポロジを抽出する。なお、図2の例では、末端クラスは、“d1”、“d2”、“c3”および“c4”とする。この結果、雛形オントロジOHおよびパーソナルオントロジOA、OB間において、クラス“a1”を親クラスとした子クラス集合G1、クラス“b1”を親クラスとした子クラス集合G2、クラス“c1”を親クラスとした子クラス集合G3、クラス“b2”を親クラスとした子クラス集合G4、クラス“b3”を親クラスとした子クラス集合G5を抽出することができる。   Then, a common class excluding a terminal class is analyzed between the template ontology OH and the personal ontology OA and OB, and a topology composed of parent and child classes with the common class as a parent class is extracted. In the example of FIG. 2, the end classes are “d1”, “d2”, “c3”, and “c4”. As a result, a child class set G1 having the class “a1” as the parent class, a child class set G2 having the class “b1” as the parent class, and the class “c1” being the parent class between the template ontology OH and the personal ontologies OA and OB. Child class set G3, child class set G4 having class “b2” as a parent class, and child class set G5 having class “b3” as a parent class can be extracted.

なお、この共通クラスの分析は、同じクラスIDが雛形オントロジOHおよびパーソナルオントロジOA、OB間に存在するかということだけを確認すればよい。このため、クラスの名前属性やインスタンス集合プロパティなどの近似度を計測する必要がなくなり、クラス間の対応関係を正確に維持しつつ、計算量を減らすことができる。
次に、パーソナルオントロジOA、OB間で各トポロジを形成する子クラス集合X、Y間の近似度を深さ優先で計算する。ここで、雛形オントロジOHを構成するクラスの子クラスの集合をZとすると、子クラス集合X、Y間の近似度は、|X∩Y|/|Z|にて求めることができる。そして、各トポロジの子クラス集合間の近似度を足し合わせることにより、パーソナルオントロジOA、OB間でのトポロジの近似度Sを計測することができる。
The analysis of the common class only needs to confirm whether the same class ID exists between the template ontology OH and the personal ontology OA, OB. For this reason, it is not necessary to measure the degree of approximation of class name attributes, instance set properties, etc., and the amount of calculation can be reduced while maintaining the correspondence between classes accurately.
Next, the degree of approximation between the child class sets X and Y forming each topology between the personal ontology OA and OB is calculated with depth priority. Here, if the set of child classes of the classes constituting the template ontology OH is Z, the degree of approximation between the child class sets X and Y can be obtained by | X∩Y | / | Z |. By adding the approximation degree between the child class set for each topology, it is possible to measure the degree of approximation S T personal ontology OA, between OB topology.

例えば、子クラス集合G1において、雛形オントロジOHには“b1”、“b2”および“b3”という子クラスが含まれているので、子クラス集合G1における雛形オントロジOHの子クラス集合のメンバ数は3となる。また、子クラス集合G1において、パーソナルオントロジOAには“b1”および“b2”という子クラスが含まれ、パーソナルオントロジOBには“b1”、“b2”および“b3”という子クラスが含まれているので、パーソナルオントロジOA、OBに共通に含まれている子クラスは“b1”およびb2”だけとなり、子クラス集合G1におけるパーソナルオントロジOA、OBの子クラス集合の積集合のメンバ数は2となる。この結果、パーソナルオントロジOA、OBの子クラス集合G1間における近似度は2/3となる。   For example, in the child class set G1, since the template ontology OH includes child classes “b1”, “b2”, and “b3”, the number of members of the child class set of the template ontology OH in the child class set G1 is 3 In the child class set G1, the personal ontology OA includes child classes “b1” and “b2”, and the personal ontology OB includes child classes “b1”, “b2”, and “b3”. Therefore, the child classes commonly included in the personal ontologies OA and OB are only “b1” and b2 ”, and the number of members of the product set of the child class sets of the personal ontology OA and OB in the child class set G1 is 2. As a result, the degree of approximation between the child ontology sets G1 of the personal ontology OA and OB is 2/3.

同様に、パーソナルオントロジOA、OBの子クラス集合G2間における近似度は1/2、子クラス集合G3間における近似度は0/2、子クラス集合G4間における近似度は2/2となる。この結果、パーソナルオントロジOA、OB間でのトポロジの近似度Sは2/3+1/2+0/2+2/2となる。
なお、パーソナルオントロジOA、OB間でのトポロジの近似度の計算でも、雛形オントロジOHから割り振られたクラスIDを参照し、雛形オントロジOHの接続形態に沿ったものがパーソナルオントロジOA、OB間に存在するかということだけを確認すればよい。例えば、パーソナルオントロジOA、OBにおけるa1−b1−c1という接続形態は雛形オントロジOHの接続形態と同じであるかどうかは、“a1”、“b1”および“c1”というクラスがパーソナルオントロジOA、OBにて保持されているかどうかということを確認するだけで判断することができる。
Similarly, the degree of approximation between the personal ontology OA and OB between the child class sets G2 is 1/2, the degree of approximation between the child class sets G3 is 0/2, and the degree of approximation between the child class sets G4 is 2/2. As a result, personal ontology OA, similarity S T topology between OB becomes 2/3 + 1/2 + 0/2 + 2/2.
In the calculation of the approximate degree of topology between the personal ontology OA and OB, the class ID assigned from the template ontology OH is referred to, and the one along the connection form of the template ontology OH exists between the personal ontology OA and OB. You only have to confirm whether you want to do it. For example, whether the connection form a1-b1-c1 in the personal ontology OA, OB is the same as the connection form of the template ontology OH depends on whether the classes “a1”, “b1”, and “c1” are the personal ontology OA, OB. It can be determined simply by confirming whether or not it is held at.

このため、パーソナルオントロジOA、OB間のトポロジの一致度を確認するために、パーソナルオントロジOA、OBが持つクラスIDを調べるだけでよく、対応クラスを起点として、上下クラスにさらに対応クラスがあるかを調べる必要がなくなり、パーソナルオントロジOA、OB間でのトポロジの近似度の計算量を減らすことができる。   For this reason, in order to confirm the degree of coincidence of the topology between the personal ontology OA and OB, it is only necessary to check the class ID possessed by the personal ontology OA and OB. Therefore, it is possible to reduce the calculation amount of the degree of approximation of the topology between the personal ontology OA and OB.

次に、パーソナルオントロジOA、OBの共通クラス間の近似度を計算する。ここで、パーソナルオントロジOA、OBの共通クラス間の近似度を計算する場合、クラスに所属するインスタンス集合を用いることができる。すなわち、あるクラスC1において、ソースオントロジのインスタンス集合をx、ターゲットオントロジのインスタンス集合をy、雛形オントロジOHのインスタンス集合をzとすると、パーソナルオントロジOA、OBの共通クラス間の近似度は、|x∩y|/|z|にて求めることができる。そして、共通クラス間の近似度を足し合わせることにより、パーソナルオントロジOA、OBのクラス間の近似度Sを計測することができる。 Next, the degree of approximation between the common classes of the personal ontology OA and OB is calculated. Here, when calculating the degree of approximation between the common classes of the personal ontology OA and OB, an instance set belonging to the class can be used. That is, in a certain class C1, if the instance set of the source ontology is x, the instance set of the target ontology is y, and the instance set of the template ontology OH is z, the degree of approximation between the common classes of the personal ontology OA and OB is | x ∩y | / | z |. By adding the degree of approximation between the common class, it is possible to measure the degree of approximation S C between personal ontology OA, the OB classes.

例えば、パーソナルオントロジOA、OB間の共通クラス“b2”において、パーソナルオントロジOAの共通クラス“b2”におけるインスタンス集合G6には、インスタンス“n”が存在し、パーソナルオントロジOBの共通クラス“b2”におけるインスタンス集合G6には、インスタンス“n”が存在し、雛形オントロジOHの共通クラス“b2”にはインスタンス“n”が存在している。この結果、雛形オントロジOHの共通クラス“b2”のインスタンスのメンバ数は1、パーソナルオントロジOA、OBのインスタンス集合G6の積集合のメンバ数は1となり、“b2”という共通クラス間の近似度は1/1となる。   For example, in the common class “b2” between the personal ontologies OA and OB, the instance set G6 in the common class “b2” of the personal ontology OA includes the instance “n”, and the common class “b2” of the personal ontology OB. An instance “n” exists in the instance set G6, and an instance “n” exists in the common class “b2” of the template ontology OH. As a result, the number of members of the common class “b2” of the template ontology OH is 1, the number of members of the product set of the instance set G6 of the personal ontology OA and OB is 1, and the degree of approximation between the common classes “b2” is 1/1.

また、パーソナルオントロジOA、OB間の共通クラス“c2”において、パーソナルオントロジOAの共通クラス“c2”におけるインスタンス集合G7には、インスタンス“a”、“c”、“b”および“d”が存在し、パーソナルオントロジOBの共通クラス“c3”におけるインスタンス集合G7には、インスタンス“a”、“c”、“e”および“f”が存在し、雛形オントロジOHの共通クラス“c3”にはインスタンス“a”、“e”、“c”、“f”、“b”、“d”および“g”が存在している。   In the common class “c2” between the personal ontology OA and OB, the instance set G7 in the common class “c2” of the personal ontology OA includes instances “a”, “c”, “b”, and “d”. In the instance set G7 in the common class “c3” of the personal ontology OB, instances “a”, “c”, “e”, and “f” exist, and in the common class “c3” of the template ontology OH “A”, “e”, “c”, “f”, “b”, “d”, and “g” exist.

この結果、雛形オントロジOHの共通クラス“c3”のインスタンスのメンバ数は7、パーソナルオントロジOA、OBのインスタンス集合G7の積集合のメンバ数は2となり、“c3”という共通クラス間の近似度は2/7となる。
従って、パーソナルオントロジOA、OBのクラス間の近似度Sは1/1+2/7となる。
As a result, the number of members of the common class “c3” of the template ontology OH is 7, the number of members of the product set of the instance set G7 of the personal ontologies OA and OB is 2, and the degree of approximation between the common classes “c3” is 2/7.
Therefore, the degree of approximation S C between personal ontology OA, the OB class is 1/1 + 2/7.

なお、パーソナルオントロジOA、OBの共通クラス間の近似度の計算でも、雛形オントロジOHから割り振られたインスタンスIDがパーソナルオントロジOA、OB間に存在するかということだけを確認すればよい。このため、パーソナルオントロジOA、OBのクラス間の近似度を計算するために、インスタンスの名前の一致性などによるインスタンスの対応関係を予め確認する必要がなくなり、計算量を減らすことができる。   Note that even in the calculation of the degree of approximation between the common classes of the personal ontology OA and OB, it is only necessary to confirm whether the instance ID allocated from the template ontology OH exists between the personal ontology OA and OB. For this reason, in order to calculate the degree of approximation between the classes of the personal ontology OA and OB, it is not necessary to confirm in advance the correspondence between instances based on the consistency of the names of instances, and the amount of calculation can be reduced.

そして、パーソナルオントロジOA、OBにおけるトポロジの近似度Sおよびクラス間の近似度Sが求まると、トポロジとクラスに対する重要度に応じた評価関数f(X)を用いることにより、以下の式にてパーソナルオントロジOA、OB間の近似度S(AB)を与えることができる。
(AB)=S+f(S
これにより、雛形オントロジOHの持つクラス特性を継承させつつパーソナルオントロジOA、OBを構築することが可能となるとともに、インスタンス集合間の共起度をパーソナルオントロジOA、OB間の近似度の計測に直接用いることができ、計算量を抑制しつつ、個人の嗜好に適合したパーソナルオントロジOA、OBを適正に抽出することが可能となるとともに、パーソナルオントロジOA、OBが雛形オントロジOHの持つドメインの知識を保有しているかの相対的な尺度として利用することができ、そのドメインに対する知識を多く持つユーザを有効的に絞り込むことができる。
Then, the personal ontology OA, the similarity S C between the degree of approximation S T and class topology in OB is determined, by using an evaluation function f (X) corresponding to the importance for the topology and class, the following expression The degree of approximation S O (AB) between the personal ontology OA and OB can be given.
S O (AB) = S T + f (S C )
This makes it possible to construct personal ontology OA and OB while inheriting the class characteristics possessed by the template ontology OH, and directly measure the co-occurrence between instance sets to the degree of approximation between the personal ontology OA and OB. It is possible to appropriately extract personal ontologies OA and OB that suit individual tastes while reducing the amount of calculation, and at the same time, the domain ontology OH has knowledge of the domain that the personal ontology OA and OB have. It can be used as a relative measure of possession, and users who have a lot of knowledge about the domain can be effectively narrowed down.

また、パーソナルオントロジOA、OBにおけるトポロジの近似度Sを計測する場合、雛形オントロジのクラス集合のメンバ数を基準として、パーソナルオントロジOA、OB間のトポロジの近似度を計測することにより、パーソナルオントロジOA、OBのクラス集合のメンバ数が増大した場合においても、パーソナルオントロジOA、OB間のトポロジの近似度が小さくなることを防止することができ、クラスが豊富にあるという意味で知識量の多いパーソナルオントロジOA、OBとの近似度を大きくすることができる。
なお、図3の例では、ユーザの興味度を考慮することなく、パーソナルオントロジOA、OB間の近似度を計測する方法について説明したが、クラスまたはインスタンスに対する興味度を導入し、ユーザの興味度を考慮しながらパーソナルオントロジOA、OB間の近似度を計測することもできる。
The personal ontology OA, when measuring the degree of approximation S T topology in OB, based on the number of members of the class set stationery ontology, personal ontology OA, by measuring the degree of approximation topology between OB, personal ontology Even when the number of members of the class set of OA and OB increases, the degree of topology approximation between the personal ontology OA and OB can be prevented from decreasing, and the amount of knowledge is large in the sense that there are abundant classes. The degree of approximation with the personal ontology OA, OB can be increased.
In the example of FIG. 3, the method for measuring the degree of approximation between the personal ontology OA and OB without considering the user's interest level has been described. The degree of approximation between the personal ontology OA and OB can also be measured in consideration of the above.

ここで、クラスまたはインスタンスに対する興味度は、例えば、以下のように定義することができる。
(1)1エントリ当たりのユーザの興味度を1とする。
(2)あるエントリEに出現するユーザのクラスおよびインスタンスの種類をN(E)個とすると、そのエントリEにおけるユーザの各クラスおよびインスタンスの興味度は1/N(E)である。
(3)オントロジ内の各インスタンスIに対する興味度は、ユーザの全蓄積エントリ集合をEとすると、以下の式で与えられる。
Here, the degree of interest in a class or instance can be defined as follows, for example.
(1) The degree of interest of the user per entry is 1.
(2) If the types of user classes and instances appearing in an entry E i are N (E i ), the degree of interest of each class and instance of the user in the entry E i is 1 / N (E i ). is there.
(3) The degree of interest for each instance I i in the ontology is given by the following equation, where E is the total accumulated entry set of the user.

Figure 0004607831
Figure 0004607831

(4)オントロジ内の各クラスCに対する興味度は、ユーザの全蓄積エントリ集合をEとすると、以下の式で与えられる。 (4) The degree of interest for each class C i in the ontology is given by the following equation, where E is the total accumulated entry set of the user.

Figure 0004607831
Figure 0004607831

(5)インスタンスの興味度は、そのインスタンスが所属するクラスの興味度に引き継がれ、子クラスの興味度は、親クラスの興味度に引き継がれる。
図4は、本発明の一実施形態に係るクラスおよびインスタンスの興味度の一例を示す図である。
図4において、ユーザAの全蓄積エントリには、エントリE、Eが含まれているものとする。そして、ユーザAの興味オントロジOAには、“オルタナティブ”というクラスが存在し、“オルタナティブ”というクラスには、“Madchester”および“Shoegaze”という子クラスが存在しているものとする。また、オルタナティブ”というクラスには、“nirvana”というインスタンスが存在し、“Madchester”というクラスには、“New Order”および“Stone Roses”というインスタンスが存在し、“Shoegaze”というクラスには、“My Bloody Valentine”および“Ride”というインスタンスが存在しているものとする。
(5) The interest level of the instance is inherited by the interest level of the class to which the instance belongs, and the interest level of the child class is inherited by the interest level of the parent class.
FIG. 4 is a diagram illustrating an example of the degree of interest of classes and instances according to an embodiment of the present invention.
In FIG. 4, it is assumed that entries E 1 and E 2 are included in all the stored entries of user A. In the interest ontology OA of the user A, a class called “alternative” exists, and a class called “alternative” has child classes called “Madchester” and “Shoegaze”. The class “alternative” has an instance “nirvana”, the class “Madchester” has instances “New Order” and “Stone Roses”, and the class “Shoegaze” has “ Assume that instances of “My Bloody Valentine” and “Ride” exist.

そして、エントリEでは、“Stone Roses”、“My Bloody Valentine”、“nirvana”および“New Order”という4アーチストが出現し、エントリEでは、“My Bloody Valentine”という1アーチストが再度出現する上に、“Shoegaze”という1ジャンルと、“Ride”という1アーチストが出現している。 In entry E 1 , four artists “Stone Roses”, “My Bloody Valentine”, “nirvana”, and “New Order” appear, and in entry E 2 , one artist “My Bloody Valentine” appears again. Above, one genre “Shoegaze” and one artist “Ride” appear.

このため、“New Order”というインスタンスの興味度は1/4、“Stone Roses”というインスタンスの興味度は1/4、“My Bloody Valentine”というインスタンスの興味度は1/4+1/3=7/12、“Ride”というインスタンスの興味度は1/3、“nirvana”というインスタンスの興味度は1/4となる。   Therefore, the interest level of the instance “New Order” is 1/4, the interest level of the instance “Stone Roses” is 1/4, and the interest level of the instance “My Bloody Valentine” is 1/4 + 1/3 = 7 / 12. The interest level of the instance “Ride” is 1/3, and the interest level of the instance “nirvana” is 1/4.

また、“Madchester”というクラスの興味度は、そのクラスの配下の“New Order”および“Stone Roses”というインスタンスの興味度を足し合わせることで求めることができ、1/4+1/4=1/2となる。また、“Shoegaze”というクラスの興味度は、そのクラスの配下の“My Bloody Valentine”および“Ride”というインスタンスの興味度を足し合わせることで求めることができ、7/12+1/3=5/4となる。さらに、“オルタナティブ”というクラスの興味度は、そのクラスの配下の“nirvana”というインスタンス、“Madchester”および“Shoegaze”というクラスの興味度を足し合わせることで求めることができ、1/2+5/4+1/4=2となる。   Further, the interest level of the class “Madchester” can be obtained by adding the interest levels of the instances “New Order” and “Stone Roses” under the class, and 1/4 + 1/4 = 1/2. It becomes. In addition, the interest level of the class “Shoegaze” can be obtained by adding the interest levels of the instances “My Bloody Valentine” and “Ride” under the class, and 7/12 + 1/3 = 5/4 It becomes. Further, the interest level of the class “alternative” can be obtained by adding the interest levels of the instances “nirvana”, “Madchester” and “Shoegaze” subordinate to the class “1/2 + 5/4 + 1”. / 4 = 2.

これにより、“My Bloody Valentine”というにアーチストついては、2つのエントリE、Eに書き込みがなされているため、ユーザAの興味が強いということを認識することができる。また、“Shoegaze”というにジャンルついては、そのクラス名もエントリEに出現する上に、その配下のアーチストをエントリE、Eにおいて頻繁に語っているため、興味度を大きくすることができ、単純に配下にアーチストを多く持っていても、興味としては均等に扱われることを防止することができる。 As a result, it is possible to recognize that the user A's interest is strong because the artist “My Bloody Valentine” has been written in the two entries E 1 and E 2 . In addition, regarding the genre of “Shoegaze”, the class name also appears in entry E 2 and the subordinate artists are frequently spoken in entries E 1 and E 2 , so the degree of interest can be increased. Even if there are many artists under their control, it can be prevented that they are treated equally as interests.

図5は、本発明の一実施形態に係る興味度を考慮したパーソナルオントロジ間の近似度計測方法を示す図である。
図5において、ユーザAの興味オントロジOAの“a1というクラスの直下には、“b1”および“b2”というクラスが存在し、“b2”というクラスの直下には、“c3”および“c4”というクラスが存在しているものとする。また、“b1”というクラスには、“m”および“k”というインスタンスが存在し、“b2”というクラスには、“n”というインスタンスが存在し、“c3”というクラスには、“a”、“b”および“c”というインスタンスが存在し、“c4”というクラスには、“g”および“h”というインスタンスが存在しているものとする。
FIG. 5 is a diagram illustrating a method for measuring the degree of approximation between personal ontology considering the degree of interest according to an embodiment of the present invention.
In FIG. 5, there are “b1” and “b2” classes immediately below the “a1” class of the user A's interest ontology OA, and “c3” and “c4” immediately below the “b2” class. The class “b1” has instances “m” and “k”, and the class “b2” has an instance “n”. The class “c3” has instances “a”, “b”, and “c”, and the class “c4” has instances “g” and “h”. To do.

そして、オントロジOAにおいて、“c3”というクラスの興味度は1、“a”というインスタンスの興味度は2、“b”というインスタンスの興味度は5、“c”というインスタンスの興味度は4であるとすると、“c3”というクラスの配下の興味度は1+2+5+4=12となる。
また、オントロジOAにおいて、“c4”というクラスの興味度は0、“g”というインスタンスの興味度は2、“h”というインスタンスの興味度は1であるとすると、“c4”というクラスの配下の興味度は0+2+1=3となる。
In the ontology OA, the interest degree of the class “c3” is 1, the interest degree of the instance “a” is 2, the interest degree of the instance “b” is 5, and the interest degree of the instance “c” is 4. If there is, the degree of interest under the class “c3” is 1 + 2 + 5 + 4 = 12.
Also, in the ontology OA, if the interest level of the class “c4” is 0, the interest level of the instance “g” is 2, and the interest level of the instance “h” is 1, the subordinate of the class “c4” The degree of interest is 0 + 2 + 1 = 3.

また、オントロジOAにおいて、“b2”というクラスの興味度は1、“n”というインスタンスの興味度は2であるとすると、“b2”というクラスの配下の興味度は12+3+1+2=18となる。
また、オントロジOAにおいて、“b1”というクラスの興味度は0、“m”というインスタンスの興味度は3、“k”というインスタンスの興味度は2であるとすると、“b1”というクラスの配下の興味度は0+3+2=5となる。
In the ontology OA, if the interest level of the class “b2” is 1, and the interest degree of the instance “n” is 2, the interest degree under the class “b2” is 12 + 3 + 1 + 2 = 18.
Also, in the ontology OA, if the interest level of the class “b1” is 0, the interest degree of the instance “m” is 3, and the interest degree of the instance “k” is 2, the subordinate of the class “b1” The degree of interest is 0 + 3 + 2 = 5.

また、オントロジOAにおいて、“a1”というクラスの興味度は0であるとすると、“a1”というクラスの配下の興味度は5+18=23となる。
また、ユーザBの興味オントロジOBの“a1というクラスの直下には、“b1”、“b2”および“b3”というクラスが存在し、“b1”というクラスの直下には、“c1”というクラスが存在し“b2”というクラスの直下には、“c3”および“c4”というクラスが存在しているものとする。また、“c1”というクラスには、“l”というインスタンスが存在し、“b2”というクラスには、“n”というインスタンスが存在し、“b3”というクラスには、“d”というインスタンスが存在し、“c3”というクラスには、“a”、“c”および“e”というインスタンスが存在し、“c4”というクラスには、“p”および“i”というインスタンスが存在しているものとする。
In the ontology OA, if the interest level of the class “a1” is 0, the interest level under the class “a1” is 5 + 18 = 23.
In addition, classes “b1”, “b2”, and “b3” exist immediately below the class “a1” of the user B's interest ontology OB, and a class “c1” exists immediately below the class “b1”. And a class “c3” and a class “c4” exist immediately under the class “b2”, and an instance “l” exists in the class “c1”. The class “b2” has an instance “n”, the class “b3” has an instance “d”, the class “c3” has “a”, “c”, and It is assumed that an instance “e” exists, and a class “c4” includes instances “p” and “i”.

そして、オントロジOBにおいて、“c3”というクラスの興味度は0、“a”というインスタンスの興味度は3、“c”というインスタンスの興味度は3、“e”というインスタンスの興味度は3であるとすると、“c3”というクラスの配下の興味度は3+3+3=9となる。
また、オントロジOBにおいて、“c4”というクラスの興味度は1、“p”というインスタンスの興味度は3、“i”というインスタンスの興味度は2であるとすると、“c4”というクラスの配下の興味度は1+3+2=6となる。
In the ontology OB, the interest degree of the class “c3” is 0, the interest degree of the instance “a” is 3, the interest degree of the instance “c” is 3, and the interest degree of the instance “e” is 3. If there is, the degree of interest under the class “c3” is 3 + 3 + 3 = 9.
Also, in the ontology OB, if the interest level of the class “c4” is 1, the interest degree of the instance “p” is 3, and the interest degree of the instance “i” is 2, the subordinate of the class “c4” Is 1 + 3 + 2 = 6.

また、オントロジOBにおいて、“b3”というクラスの興味度は0、“d”というインスタンスの興味度は2であるとすると、“b3”というクラスの配下の興味度は0+2=2となる。
また、オントロジOBにおいて、“b2”というクラスの興味度は0、“n”というインスタンスの興味度は6であるとすると、“b2”というクラスの配下の興味度は6+9+6=21となる。
また、オントロジOBにおいて、“b1”というクラスの興味度は0であるとすると、“b1”というクラスの配下の興味度は0+3=3となる。
また、オントロジOBにおいて、“a1”というクラスの興味度は0であるとすると、“a1”というクラスの配下の興味度は3+21+2=26となる。
In the ontology OB, if the interest level of the class “b3” is 0 and the interest degree of the instance “d” is 2, the interest degree under the class “b3” is 0 + 2 = 2.
Also, in the ontology OB, if the interest level of the class “b2” is 0 and the interest degree of the instance “n” is 6, the subordinate interest level of the class “b2” is 6 + 9 + 6 = 21.
In the ontology OB, if the degree of interest of the class “b1” is 0, the degree of interest under the class “b1” is 0 + 3 = 3.
In the ontology OB, if the interest level of the class “a1” is 0, the interest level under the class “a1” is 3 + 21 + 2 = 26.

ここで、オントロジ間の興味一致度の計算に用いる用語を以下のように定義する。親クラスおよび子クラスからなるトポロジをT、クラスとインスタンスからなるトポロジをTとする。さらに、興味オントロジOA、OBの共通クラスをCと定義し、共通インスタンスをI∈Iと定義する。特に、トポロジTに所属するクラス集合をC(T)、トポロジTに所属するクラス集合をC(T)とする。また、共通クラスCに対する興味一致度をI(C)とし、共通インスタンスIに対する興味一致度をI(I)とし、共通クラスCの配下の興味一致度をI(C)とする。 Here, the terms used for calculating the degree of interest matching between ontology are defined as follows. Let T 1 be the topology consisting of the parent class and child class, and T 2 be the topology consisting of the class and instance. Further, a common class of interest ontology OA and OB is defined as C i, and a common instance is defined as I i ∈I. In particular, a class set belonging to topology T 1 is C (T 1 ), and a class set belonging to topology T 2 is C (T 2 ). Further, the interest coincidence for the common class C i is I (C i ), the interest coincidence for the common instance I i is I (I i ), and the interest coincidence under the common class C i is I t (C i). ).

(1)そして、興味オントロジOA、OBの共通クラスCを分析し、両トポロジT、Tを形成する共通クラスCが存在することに注意しながら、トポロジTを形成する共通クラスCとトポロジTを形成する共通クラスCとを抽出する。例えば、図5の例では、共通クラスa1、b1、b2はトポロジTを形成し、共通クラスb2、c3、c4はトポロジTを形成することができる。 (1) Then, the common class C i of the interest ontology OA, OB is analyzed, and the common class C i forming both topologies T 1 and T 2 exists, and the common class forming the topology T 1 is noted. C i and common class C i forming topology T 2 are extracted. For example, in the example of FIG. 5, the common class a1, b1, b2 forms a topology T 1, the common class b2, c3, c4 can form a topology T 2.

(2)共通クラスCが興味オントロジOA、OB間で共通インスタンスIを持つとすると、共通インスタンスIに対する興味一致度をI(I)は、興味オントロジOA、OBのインスタンスに対する興味度のうち小さい方とすることができる。例えば、図5の例では、共通クラスc3の配下の共通インスタンスaに対する興味一致度は2、共通クラスc3の配下の共通インスタンスcに対する興味一致度は3となる。 (2) common classes C i interested ontology OA, when to have a common instance I i between OB, the interest degree of coincidence with respect to a common instance I i I (I i) is interest degree of interest ontology OA, OB instance of Can be the smaller of the two. For example, in the example of FIG. 5, the interest coincidence with respect to the common instance a under the common class c3 is 2, and the interest coincidence with respect to the common instance c under the common class c3 is 3.

(3)興味オントロジOA、OBにおける共通クラスCに対する興味一致度I(C)は、興味オントロジOA、OBのクラスに対する興味度のうち小さい方とすることができる。例えば、図5の例では、共通クラスc3に対する興味一致度は0、共通クラスc4に対する興味一致度は1となる。
(4)共通クラスC∈C(T)の配下の興味一致度I(C)は、興味オントロジOA、OBにおけるクラスCの配下の子クラスの積集合をN(C)、和集合をU(C)とすると、以下の式で与えることができる。
(3) The interest coincidence I (C i ) for the common class C i in the interest ontologies OA and OB can be the smaller of the interest degrees for the classes of the interest ontologies OA and OB. For example, in the example of FIG. 5, the interest coincidence for the common class c3 is 0, and the interest coincidence for the common class c4 is 1.
(4) The interest coincidence I t (C i ) under the common class C i εC (T 1 ) is the product set of child classes under the class C i in the interest ontology OA and OB as N (C i ). When the union is U (C i ), it can be given by the following equation.

Figure 0004607831
Figure 0004607831

例えば、図5の例では、共通クラスb2の配下の興味一致度I(C)は、(9+3)/2=6となる。
そして、以下の式で示すように、トポロジTを形成する全ての共通クラスCについての興味一致度I(C)を足し合わせた値を、トポロジTを形成する共通クラス集合に対する興味一致度S(T)とすることができる。
For example, in the example of FIG. 5, the interest coincidence I t (C i ) under the common class b2 is (9 + 3) / 2 = 6.
Then, as shown by the following equation, all common classes C i value obtained by adding an interest matching score I t (C i) for forming a topology T 1, to a common class set forming a topology T 1 The degree of interest coincidence S (T 1 ) can be used.

Figure 0004607831
Figure 0004607831

(5)一方、共通クラスC∈C(T)の配下の興味一致度I(C)は、興味オントロジOAにおけるクラスCの配下のインスタンス集合をI(C)、興味オントロジOBにおけるクラスCの配下のインスタンス集合をI(C)とすると、以下の式で与えることができる。 (5) On the other hand, the interest coincidence I t (C i ) under the common class C i ∈ C (T 2 ) is defined as an instance set under the class C i in the interest ontology OA as I A (C i ), If the instance set under the class C i in the ontology OB is I B (C i ), it can be given by the following equation.

Figure 0004607831
Figure 0004607831

例えば、図5の例では、共通クラスc3の配下の興味一致度I(C)は、(2+0+3+0)/4=5/4となる。
そして、以下の式で示すように、トポロジTを形成する全ての共通クラスCについての興味一致度I(C)を足し合わせた値を、トポロジTを形成する共通クラス集合に対する興味一致度S(T)とすることができる。
For example, in the example of FIG. 5, the interest coincidence degree I t (C i ) under the common class c3 is (2 + 0 + 3 + 0) / 4 = 5/4.
Then, as shown by the following equation, all common classes C i value obtained by adding an interest matching score I t (C i) for forming a topology T 2, to a common class set forming a topology T 2 The degree of interest coincidence S (T 2 ) can be used.

Figure 0004607831
Figure 0004607831

(6)そして、トポロジT、Tに対する重要度に応じた評価関数をf(X)とすると、興味度を考慮した興味オントロジOA、OB間の近似度はS(AB)=S(T)+f(S(T))で与えることができる。
そして、図1の近似度計測手段5eは、パーソナルオントロジ抽出手段5cにて抽出されたパーソナルオントロジのトポロジだけでなく、ユーザの興味度を考慮しながら、パーソナルオントロジ間の近似度を計測することにより、個人の興味の強さを考慮しながら単なる文字列ではなく概念間の一致性に基づいて、自分の嗜好に適合した情報を精度よく検索することが可能となる。
(6) If the evaluation function corresponding to the importance for the topologies T 1 and T 2 is f (X), the degree of approximation between the interest ontology OA and OB considering the degree of interest is S O (AB) = S ( T 1 ) + f (S (T 2 )).
Then, the degree-of-approximation measuring means 5e in FIG. 1 measures the degree of approximation between personal ontology while considering not only the topology of the personal ontology extracted by the personal ontology extracting means 5c but also the degree of interest of the user. Thus, it is possible to accurately search for information suitable for one's preference based on consistency between concepts, not just a character string, taking into account the strength of personal interest.

図6は、本発明の一実施形態に係る興味オントロジの近似性を利用したコミュニティ形成方法を示す図である。
図6において、各ユーザA、BのブログエントリPA、PBを雛形オントロジに対してそれぞれ分類することにより、各ユーザA、Bの興味オントロジKA、KBがそれぞれ生成されたものとする(ステップS11)。そして、各ユーザA、Bの興味オントロジKA、KB間の近似度を計測し(ステップS12)、近似度の高い興味オントロジKA、KB間で共起するクラスやインスタンスを分析することで、トポロジが異なるにも関わらず興味を持つ可能性が高い情報を他のユーザのエントリを介して意外な情報としてユーザに推奨することができる(ステップS13)。
FIG. 6 is a diagram illustrating a community formation method using the approximation of interest ontology according to an embodiment of the present invention.
In FIG. 6, it is assumed that the blog entries PA and PB of the users A and B are classified with respect to the template ontology, thereby generating the interest ontologies KA and KB of the users A and B, respectively (step S11). . Then, the degree of approximation between the interest ontologies KA and KB of the users A and B is measured (step S12), and the topologies are analyzed by analyzing classes and instances that co-occur between the interest ontologies KA and KB having a high degree of approximation. Although it is different, information that is highly likely to be of interest can be recommended to the user as unexpected information through the entry of another user (step S13).

例えば、各ユーザA、Bの興味オントロジKA、KB間の近似度を計測することにより、“Madchester”などのクラスや“Happy Mondays”などのインスタンスに興味を持つユーザは、“Glasgow”というクラスや“Teenage Fanclub”というインスタンスにも興味を持つ可能性が高いことが判る。
また、このような興味オントロジKA、KBをブログに適用することで、単純なキーワード検索ではなく、興味オントロジKA、KB間の近似度に基づく意外なエントリ推薦によるコミュニティの形成を支援することができ、ユーザの興味を自然に広げることができる(ステップS14)。
For example, by measuring the degree of approximation between the interest ontologies KA and KB of each user A and B, a user who is interested in a class such as “Madchester” or an instance such as “Happy Mondays” can have a class “Glasgow” It can be seen that there is a high possibility of being interested in an instance of “Teenage Fanclub”.
Moreover, by applying such interest ontologies KA and KB to a blog, it is possible to support the formation of a community based on an unexpected entry recommendation based on the degree of approximation between the interest ontologies KA and KB rather than a simple keyword search. The user's interest can be naturally expanded (step S14).

本発明は、パーソナルオントロジを簡易に作成して自分の興味にマッチングする情報を速やかに入手することができ、情報通信システムが持つ情報源から自分の興味にマッチングする情報を自動的かつ効率的に活用することができる。   The present invention makes it possible to easily create a personal ontology and quickly obtain information that matches one's interest, and automatically and efficiently information that matches one's interest from an information source of an information communication system. Can be used.

本発明の一実施形態に係るオントロジの近似度計測装置が適用されるシステムの概略構成を示すブロック図である。1 is a block diagram showing a schematic configuration of a system to which an ontology approximation measuring device according to an embodiment of the present invention is applied. 本発明の一実施形態に係るパーソナルオントロジの生成方法を示す図である。It is a figure which shows the production | generation method of the personal ontology based on one Embodiment of this invention. 本発明の一実施形態に係るパーソナルオントロジ間の近似度計測方法を示す図である。It is a figure which shows the approximation measuring method between personal ontology concerning one Embodiment of this invention. 本発明の一実施形態に係るクラスおよびインスタンスの興味度の一例を示す図である。It is a figure which shows an example of the interest degree of the class and instance which concern on one Embodiment of this invention. 本発明の一実施形態に係る興味度を考慮したパーソナルオントロジ間の近似度計測方法を示す図である。It is a figure which shows the approximation measuring method between personal ontology which considered the degree of interest based on one Embodiment of this invention. 本発明の一実施形態に係る興味オントロジの近似性を利用したコミュニティ形成方法を示す図である。It is a figure which shows the community formation method using the approximation of the interest ontology which concerns on one Embodiment of this invention. 従来の完全に分散された環境下で構築されたオントロジの構成例を示す図である。It is a figure which shows the structural example of the ontology constructed | assembled in the conventional completely distributed environment. 図7のクラス間における総当り方式による近似度計測方法の一例を示す図である。It is a figure which shows an example of the approximation measuring method by the brute force method between the classes of FIG. 図7のクラス間における総当り方式による近似度計測方法の一例を示す図である。It is a figure which shows an example of the approximation measuring method by the brute force method between the classes of FIG. 図7のクラス間におけるマッピング結果の一例を示す図である。It is a figure which shows an example of the mapping result between the classes of FIG. 図7のオントロジ間における近似度計測結果の一例を示す図である。It is a figure which shows an example of the approximation degree measurement result between the ontology of FIG. 従来の複数のオントロジに対する近似度計測結果の比較例を示す図である。It is a figure which shows the comparative example of the approximation degree measurement result with respect to the conventional some ontology.

符号の説明Explanation of symbols

1 通信網
2〜4 端末
5 サーバ
5a 頻出単語抽出手段
5b 分類子適用手段
5c パーソナルオントロジ抽出手段
5d 興味度計測手段
5e 近似度計測手段
6 雛形オントロジ
7〜9 ブログサイト
7a〜7n、8a〜8n、9a〜9n ブログエントリ
DESCRIPTION OF SYMBOLS 1 Communication network 2-4 Terminal 5 Server 5a Frequent word extraction means 5b Classifier application means 5c Personal ontology extraction means 5d Interest measurement means 5e Approximation degree measurement means 6 Model ontology 7-9 Blog site 7a-7n, 8a-8n, 9a-9n Blog entry

Claims (3)

ブログエントリを個人ごとに記憶する記憶手段と、
前記ブログエントリに含まれる単語を、前記ブログエントリに対して形態素解析を適用することにより抽出する単語抽出手段と、
予め設定された単語が概念階層化されてなる雛形オントロジを記憶する記憶手段と、
前記雛形オントロジから前記単語抽出手段で抽出された単語を含むクラスまたはインスタンスを抽出する分類子適用手段と、
前記抽出されたクラスまたはインスタンスおよびそれらの上位のクラスを含む階層構造を、個人の興味情報を表すパーソナルオントロジとして前記雛形オントロジから個人ごとに抽出するパーソナルオントロジ抽出手段と、
前記ブログエントリに含まれる単語を含む前記雛形オントロジのクラスまたはインスタンスに対する、当該ブログエントリを持つ個人の興味度を計測する興味度計測手段と、
前記興味度計測手段にて計測された前記興味度に基づいて、異なる前記パーソナルオントロジ間の近似度を計測する近似度計測手段と、を備え、
前記興味度計測手段は、前記ブログエントリの個人ごとの集合をE、当該集合Eのうちの一のブログエントリに出現する単語を含む前記クラスおよびインスタンスの種類数をN(Ei)としたとき、前記一のブログエントリに含まれる単語を含む前記インスタンスに対する前記興味度を、
Figure 0004607831
から計測し、前記一のブログエントリに含まれる単語を含むクラスに対する前記興味度を、
Figure 0004607831
から計測し、
前記近似度計測手段は、前記異なるパーソナルオントロジ間の近似度をSo(AB)としたとき、
Figure 0004607831
から計測することを特徴とするオントロジの近似度計測装置。
なお、S(T )式中のIt(Ci)は、
Figure 0004607831
である。I(Cj)は、前記異なるパーソナルオントロジが共に有する雛形オントロジの同一クラスである共通クラスCjに対する興味一致度であって、前記異なるパーソナルオントロジそれぞれにおける前記共通クラスCjに対する興味度のうち小さい方に設定される。N(Ci)は前記異なるパーソナルオントロジにおいて前記共通クラスCjに属するクラスの積集合、U(Ci)は前記共通クラスCjに属するクラスの和集合を表す。
また、S(T )式中のIt(Ci)は、
Figure 0004607831
である。I(Ii)は、前記異なるパーソナルオントロジが共に有する雛形オントロジの同一インスタンスである共通インスタンスIiに対する興味一致度であって、前記異なるパーソナルオントロジそれぞれにおける前記共通インスタンスIiに対する興味度のうち小さい方に設定される。また、I (Ci)は、一方のパーソナルオントロジにおける共通クラスCiに属するインスタンス集合、I (Ci)は、他方のパーソナルオントロジにおける共通クラスCiに属するインスタンス集合である。
Storage means for storing blog entries for each person;
The words included in the blog entry, a word extracting means for extracting by applying a morphological analysis on the blog entry,
Storage means for storing a template ontology in which preset words are hierarchized in concept;
A classifier applying means for extracting a class or instance including words extracted by the word extraction means from the template ontology,
A personal ontology extracting means for extracting a hierarchical structure including the extracted classes or instances and higher classes thereof from the template ontology as a personal ontology representing personal interest information ;
An interest degree measuring means for measuring an interest degree of an individual having the blog entry for the class or instance of the template ontology including the word included in the blog entry ;
Based on the interest degree that is measured by the degree of interest measuring means, and a similarity measuring means for measuring the degree of approximation between said different personal ontology,
The degree-of-interest measurement means, when the set of individuals of the blog entry is E, and the number of types of classes and instances including words that appear in one blog entry of the set E is N (Ei), The degree of interest with respect to the instance including the word included in the one blog entry,
Figure 0004607831
And the degree of interest in the class including the word included in the one blog entry,
Figure 0004607831
Measured from
When the approximation degree between the different personal ontology is defined as So (AB),
Figure 0004607831
By measuring the similarity measuring device ontologies characterized by.
It (Ci) in the S (T 1 ) formula is
Figure 0004607831
It is. I (Cj) is the degree of interest coincidence with respect to the common class Cj that is the same class of the template ontology possessed by the different personal ontologies, and is set to the smaller of the degrees of interest with respect to the common class Cj in the different personal ontologies. Is done. N (Ci) represents a product set of classes belonging to the common class Cj in the different personal ontology, and U (Ci) represents a union of classes belonging to the common class Cj.
In addition, It (Ci) in the S (T 2 ) formula is
Figure 0004607831
It is. I (Ii) is the degree of interest in the common instance Ii that is the same instance of the template ontology that the different personal ontologies have together, and is set to the smaller of the interest in the common instance Ii in each of the different personal ontologies Is done. I A (Ci) is an instance set belonging to the common class Ci in one personal ontology, and I B (Ci) is an instance set belonging to the common class Ci in the other personal ontology.
個人のブログエントリに含まれる単語が概念階層化されてなるパーソナルオントロジ間の近似度を計測する近似度計測装置が実行するオントロジの近似度計測方法であって、
記憶手段に個人ごとに記憶されたブログエントリに含まれる単語を、前記ブログエントリに対して形態素解析を適用することにより抽出するステップと、
記憶手段に記憶され、予め設定された単語が概念階層化されてなる雛形オントロジから、前記ブログエントリから抽出された単語を含むクラスまたはインスタンスを抽出するステップと、
前記抽出されたクラスまたはインスタンスおよびそれらの上位のクラスを含む階層構造を、個人の興味情報を表すパーソナルオントロジとして前記雛形オントロジから個人ごとに抽出するステップと、
前記ブログエントリの個人ごとの集合をE、当該集合Eのうちの一のブログエントリに出現する単語を含む前記クラスおよびインスタンスの種類数をN(Ei)としたとき、前記一のブログエントリを持つ個人の、前記一のブログエントリに含まれる単語を含む前記インスタンスに対する興味度を、
Figure 0004607831
から計測し且つ前記一のブログエントリに含まれる単語を含むクラスに対する興味度を、
Figure 0004607831
から計測するステップと、
計測された前記興味度に基づいて、異なるパーソナルオントロジ間の近似度So(AB)を
Figure 0004607831
から計測するステップと、を備えることを特徴とするオントロジの近似度計測方法。
なお、S(T )式中のIt(Ci)は、
Figure 0004607831
である。I(Cj)は、前記異なるパーソナルオントロジが共に有する雛形オントロジの同一クラスである共通クラスCjに対する興味一致度であって、前記異なるパーソナルオントロジそれぞれにおける前記共通クラスCjに対する興味度のうち小さい方に設定される。N(Ci)は前記異なるパーソナルオントロジにおいて前記共通クラスCjに属するクラスの積集合、U(Ci)は前記共通クラスCjに属するクラスの和集合を表す。
また、S(T )式中のIt(Ci)は、
Figure 0004607831
である。I(Ii)は、前記異なるパーソナルオントロジが共に有する雛形オントロジの同一インスタンスである共通インスタンスIiに対する興味一致度であって、前記異なるパーソナルオントロジそれぞれにおける前記共通インスタンスIiに対する興味度のうち小さい方に設定される。また、I (Ci)は、一方のパーソナルオントロジにおける共通クラスCiに属するインスタンス集合、I (Ci)は、他方のパーソナルオントロジにおける共通クラスCiに属するインスタンス集合である。
An ontology approximation measurement method executed by an approximation measuring device that measures an approximation between personal ontology in which words included in a personal blog entry are conceptually hierarchized,
Extracting words included in the blog entry stored for each individual in the storage means by applying morphological analysis to the blog entry ;
Extracting a class or instance including a word extracted from the blog entry from a template ontology that is stored in a storage means and is configured by conceptually stratified words;
Extracting a hierarchical structure including the extracted class or instance and higher classes thereof from the template ontology as a personal ontology representing personal interest information for each individual ;
When the set of individuals of the blog entry is E and the number of types of classes and instances including words that appear in one blog entry of the set E is N (Ei), the blog entry has the one blog entry. The degree of interest of an individual in the instance containing the word contained in the one blog entry is:
Figure 0004607831
The degree of interest in the class that includes the word that is measured from and included in the one blog entry,
Figure 0004607831
Step to measure from ,
Based on the measured degree of interest, the degree of approximation So (AB) between different personal ontology is calculated.
Figure 0004607831
A method for measuring the degree of approximation of ontology, comprising the step of:
It (Ci) in the S (T 1 ) formula is
Figure 0004607831
It is. I (Cj) is the degree of interest coincidence with respect to the common class Cj that is the same class of the template ontology possessed by the different personal ontologies, and is set to the smaller of the degrees of interest with respect to the common class Cj in the different personal ontologies. Is done. N (Ci) represents a product set of classes belonging to the common class Cj in the different personal ontology, and U (Ci) represents a union of classes belonging to the common class Cj.
In addition, It (Ci) in the S (T 2 ) formula is
Figure 0004607831
It is. I (Ii) is the degree of interest in the common instance Ii that is the same instance of the template ontology that the different personal ontologies have together, and is set to the smaller of the interest in the common instance Ii in each of the different personal ontologies Is done. I A (Ci) is an instance set belonging to the common class Ci in one personal ontology, and I B (Ci) is an instance set belonging to the common class Ci in the other personal ontology.
記憶手段に個人ごとに記憶されたブログエントリに含まれる単語を、前記ブログエントリに対して形態素解析を適用することにより抽出するステップと、
記憶手段に記憶され、予め設定された単語が概念階層化されてなる雛形オントロジから、前記ブログエントリから抽出された単語を含むクラスまたはインスタンスを抽出するステップと、
前記抽出されたクラスまたはインスタンスおよびそれらの上位のクラスを含む階層構造
を、個人の興味情報を表すパーソナルオントロジとして前記雛形オントロジから個人ごとに抽出するステップと、
前記ブログエントリの個人ごとの集合をE、当該集合Eのうちの一のブログエントリに出現する単語を含む前記クラスおよびインスタンスの種類数をN(Ei)としたとき、前記一のブログエントリを持つ個人の、前記一のブログエントリに含まれる単語を含む前記インスタンスに対する興味度を、
Figure 0004607831
から計測し且つ前記一のブログエントリに含まれる単語を含むクラスに対する興味度を、
Figure 0004607831
から計測するステップと、
計測された前記興味度に基づいて、異なるパーソナルオントロジ間の近似度So(AB)を
Figure 0004607831
から計測するステップとをコンピュータに実行させることを特徴とするオントロジの近似度計測プログラム。
なお、S(T )式中のIt(Ci)は、
Figure 0004607831
である。I(Cj)は、前記異なるパーソナルオントロジが共に有する雛形オントロジの同一クラスである共通クラスCjに対する興味一致度であって、前記異なるパーソナルオントロジそれぞれにおける前記共通クラスCjに対する興味度のうち小さい方に設定される。N(Ci)は前記異なるパーソナルオントロジにおいて前記共通クラスCjに属するクラスの積集合、U(Ci)は前記共通クラスCjに属するクラスの和集合を表す。
また、S(T )式中のIt(Ci)は、
Figure 0004607831
である。I(Ii)は、前記異なるパーソナルオントロジが共に有する雛形オントロジの同一インスタンスである共通インスタンスIiに対する興味一致度であって、前記異なるパーソナルオントロジそれぞれにおける前記共通インスタンスIiに対する興味度のうち小さい方に設定される。また、I (Ci)は、一方のパーソナルオントロジにおける共通クラスCiに属するインスタンス集合、I (Ci)は、他方のパーソナルオントロジにおける共通クラスCiに属するインスタンス集合である。
Extracting words included in the blog entry stored for each individual in the storage means by applying morphological analysis to the blog entry ;
Extracting a class or instance including a word extracted from the blog entry from a template ontology that is stored in a storage means and is configured by conceptually stratified words;
Hierarchical structure including the extracted classes or instances and their higher classes
For each individual from the model ontology as a personal ontology representing personal interest information ;
When the set of individuals of the blog entry is E and the number of types of classes and instances including words that appear in one blog entry of the set E is N (Ei), the blog entry has the one blog entry. The degree of interest of an individual in the instance containing the word contained in the one blog entry is:
Figure 0004607831
The degree of interest in the class that includes the word that is measured from and included in the one blog entry,
Figure 0004607831
Step to measure from ,
Based on the measured degree of interest, the degree of approximation So (AB) between different personal ontology is calculated.
Figure 0004607831
Ontology similarity measurement program, characterized in that to execute the steps of measuring, to a computer from.
It (Ci) in the S (T 1 ) formula is
Figure 0004607831
It is. I (Cj) is the degree of interest coincidence with respect to the common class Cj that is the same class of the template ontology possessed by the different personal ontologies, and is set to the smaller of the degrees of interest with respect to the common class Cj in the different personal ontologies. Is done. N (Ci) represents a product set of classes belonging to the common class Cj in the different personal ontology, and U (Ci) represents a union of classes belonging to the common class Cj.
In addition, It (Ci) in the S (T 2 ) formula is
Figure 0004607831
It is. I (Ii) is the degree of interest in the common instance Ii that is the same instance of the template ontology that the different personal ontologies have together, and is set to the smaller of the interest in the common instance Ii in each of the different personal ontologies Is done. I A (Ci) is an instance set belonging to the common class Ci in one personal ontology, and I B (Ci) is an instance set belonging to the common class Ci in the other personal ontology.
JP2006198414A 2006-07-20 2006-07-20 Ontology approximation device, ontology approximation method, and ontology approximation program Active JP4607831B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006198414A JP4607831B2 (en) 2006-07-20 2006-07-20 Ontology approximation device, ontology approximation method, and ontology approximation program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006198414A JP4607831B2 (en) 2006-07-20 2006-07-20 Ontology approximation device, ontology approximation method, and ontology approximation program

Publications (2)

Publication Number Publication Date
JP2008027143A JP2008027143A (en) 2008-02-07
JP4607831B2 true JP4607831B2 (en) 2011-01-05

Family

ID=39117716

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006198414A Active JP4607831B2 (en) 2006-07-20 2006-07-20 Ontology approximation device, ontology approximation method, and ontology approximation program

Country Status (1)

Country Link
JP (1) JP4607831B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5182509B2 (en) * 2008-11-10 2013-04-17 日本電気株式会社 Information recommendation device, information recommendation method, and information recommendation program

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002073677A (en) * 2000-09-05 2002-03-12 Zenrin Co Ltd Device for collecting personal preference information on reader and information reading support device using the information collecting device

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002073677A (en) * 2000-09-05 2002-03-12 Zenrin Co Ltd Device for collecting personal preference information on reader and information reading support device using the information collecting device

Also Published As

Publication number Publication date
JP2008027143A (en) 2008-02-07

Similar Documents

Publication Publication Date Title
Kagdi et al. Assigning change requests to software developers
JP5401622B2 (en) System, method and computer program for consumer-defined information architecture
Thakkar et al. Graph-based algorithms for text summarization
CN102193994B (en) Method for searching Web services according to non-functional requirements of user
JP5320307B2 (en) Interest information recommendation device, interest information recommendation method, and interest information recommendation program
Forstall et al. Modeling the scholars: Detecting intertextuality through enhanced word-level n-gram matching
CN102254004A (en) Method and system for modeling Web in weblog excavation
US20130318066A1 (en) Indirect data searching on the internet
JPWO2009025193A1 (en) Information sharing system, information sharing method, and information sharing program
US9772995B2 (en) Finding an appropriate meaning of an entry in a text
Cordobés et al. Graph-based techniques for topic classification of tweets in Spanish
WO2014104942A1 (en) Finding an appropriate meaning of an entry in a text
Gao et al. Seco-lda: Mining service co-occurrence topics for composition recommendation
JP2009110508A (en) Method and system for calculating competitiveness metric between objects
Bajestan et al. DErivCELEX: Development and evaluation of a German derivational morphology lexicon based on CELEX
JP4728063B2 (en) Interest information generating apparatus, interest information generating method, and interest information generating program
JP4607830B2 (en) Interest information generating apparatus, interest information generating method, and interest information generating program
JP4607831B2 (en) Ontology approximation device, ontology approximation method, and ontology approximation program
JP4672578B2 (en) Interest information providing apparatus, interest information providing method, and interest information providing program
JP4580352B2 (en) Ontology approximation device, ontology approximation method, and ontology approximation program
Di Buccio et al. A curated and evolving linguistic linked dataset
Gao et al. Service recommendation from the evolution of composition patterns
JP4580351B2 (en) Interest information generating apparatus, interest information generating method, and interest information generating program
JP4745993B2 (en) Consciousness system construction device and consciousness system construction program
Stepanyan et al. Blogs as objects of preservation: Advancing the discussion on significant properties

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080213

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20090501

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20090501

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100407

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100420

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100621

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101005

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101007

R150 Certificate of patent or registration of utility model

Ref document number: 4607831

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131015

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350