JP2008027143A - Ontology approximation level measuring device, ontology approximation level measuring method and ontology approximation level measuring program - Google Patents

Ontology approximation level measuring device, ontology approximation level measuring method and ontology approximation level measuring program Download PDF

Info

Publication number
JP2008027143A
JP2008027143A JP2006198414A JP2006198414A JP2008027143A JP 2008027143 A JP2008027143 A JP 2008027143A JP 2006198414 A JP2006198414 A JP 2006198414A JP 2006198414 A JP2006198414 A JP 2006198414A JP 2008027143 A JP2008027143 A JP 2008027143A
Authority
JP
Japan
Prior art keywords
class
ontology
interest
degree
approximation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006198414A
Other languages
Japanese (ja)
Other versions
JP4607831B2 (en
Inventor
Makoto Nakatsuji
真 中辻
Masaru Miyoshi
優 三好
Yoshihiro Ootsuka
祥広 大塚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2006198414A priority Critical patent/JP4607831B2/en
Publication of JP2008027143A publication Critical patent/JP2008027143A/en
Application granted granted Critical
Publication of JP4607831B2 publication Critical patent/JP4607831B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To measure inter-ontology approximation level by sufficiently reflecting the interest of a user while suppressing calculation quantity. <P>SOLUTION: An interest level measuring means 5d measures an interest level in classes or instances extracted by a personal ontology extraction means 5c based on the rate of the content of those classes or instances in blog entries 7a to 7n, 8a to 8n and 9a to 9n, and an approximation level measuring means 5e measures inter-personal ontology approximation level under the consideration of the topology of a personal ontology extracted by the personal ontology extraction means 5c with the interest level measured by the interest level measuring means 5d. <P>COPYRIGHT: (C)2008,JPO&INPIT

Description

本発明はオントロジの近似度計測装置、オントロジの近似度計測方法およびオントロジの近似度計測プログラムに関し、特に、ブログエントリを参照しつつ、個人の興味情報が概念階層化されたパーソナルオントロジを自動的に生成した上で、パーソナルオントロジ間の近似度を効率よく計測する方法に適用して好適なものである。   The present invention relates to an ontology approximation measuring device, an ontology approximation measuring method, and an ontology approximation measuring program, and in particular, automatically refers to a personal ontology in which personal interest information is conceptually layered while referring to a blog entry. After being generated, it is suitable for application to a method for efficiently measuring the degree of approximation between personal ontology.

インターネット上などで情報検索を実施する場合、主としてキーワード入力による情報検索が行われている。このキーワード検索では、例えば、ビデオ録画装置の分野においては、録画内容がキーワードによって指定されるため、ユーザが適切なキーワードを思いつかないと、意図したビデオ内容を録画することができなかった。
また、gooなどの検索エンジンを利用した検索においても、ユーザが適切なキーワードを思いつかないと、意図した内容を検索することができないだけでなく、不要な検索結果が多数含まれることがあった。
When performing an information search on the Internet or the like, an information search is mainly performed by inputting a keyword. In this keyword search, for example, in the field of video recording devices, since the recording content is specified by a keyword, the intended video content could not be recorded unless the user came up with an appropriate keyword.
Further, even in a search using a search engine such as google, if the user does not come up with an appropriate keyword, the intended content cannot be searched, and many unnecessary search results may be included.

さらに、doblogなどのブログプロバイダにおいても、ユーザはキーワードベースで興味のある情報を検索し、検索結果にかかったブログサイトにアクセスするというレベルに留まっており、ユーザが興味のある未知のキーワードやコミュニティあるいはブログサイトを発見することができなかった。
この理由の一つとして、現在の検索方法はキーワード検索のみであり、クラス(概念)体系やクラスの持つ属性、すなわちクラス名やインスタンス(実体)を利用した精度の高い検索を実施できないことが挙げられる。キーワードはただの文字列であるが、オントロジの持つクラスは複数のインスタンスをメンバとして持つものであり、どのようなインスタンスをクラスの構成メンバとするかによって、各個人の嗜好をクラスに反映させることができる。また、クラス階層の取り方によっても、各個人の嗜好をクラスに反映させることができる。
ここで、従来のオントロジ間の近似度の計算方法では、非特許文献1に開示されているように、完全に分散された環境下で構築されたオントロジが対象とされる。このため、オントロジ間の近似度の計算の前処理として、オントロジの持つクラス間の対応関係の導出が行われる。
Furthermore, even in blog providers such as doblog, the user remains at the level of searching for information of interest on a keyword basis and accessing the blog site according to the search result, and the unknown keyword or community in which the user is interested. Or I couldn't find a blog site.
One reason for this is that the current search method is only keyword search, and a high-precision search using the class (concept) system and class attributes, that is, class names and instances (substances) cannot be performed. It is done. The keyword is just a character string, but the ontology class has multiple instances as members, and the individual preference is reflected in the class depending on what instance is a member of the class. Can do. Also, the preference of each individual can be reflected in the class depending on the class hierarchy.
Here, in the conventional method for calculating the degree of approximation between ontology, as disclosed in Non-Patent Document 1, an ontology constructed in a completely distributed environment is targeted. For this reason, as a pre-process for calculating the degree of approximation between ontology, a correspondence relationship between classes of ontology is derived.

図7は、従来の完全に分散された環境下で構築されたオントロジの構成例を示す図である。
図7において、オントロジOAには、“ロック”というクラスが存在している。そして、“ロック”というクラスには、“US”という子クラスが存在し、“US”という子クラスには、“インディーズ”という子クラスが存在し、“インディーズ”という子クラスには、“グランジ”という子クラスが存在している。そして、“グランジ”という子クラスには、“nirvana”、“Foo Fighters”および“super chunk”というインスタンスが存在しているものとする。
FIG. 7 is a diagram illustrating a configuration example of an ontology constructed in a conventional completely distributed environment.
In FIG. 7, the ontology OA has a class called “lock”. The class “Rock” has a child class “US”, the child class “US” has a child class “Indie”, and the child class “Indies” has a “Grunge” class. There is a child class. Further, it is assumed that instances “nirvana”, “Foo Fighters”, and “super chunk” exist in the child class “grunge”.

一方、オントロジOBには、“ロック”というクラスが存在している。そして、“ロック”というクラスには、“アメリカ”および“イギリス”という子クラスが存在し、“アメリカ”という子クラスには、“アメリカ”という子クラスには“indies”という子クラスが存在し、“indies”という子クラスには“nirvana”および“Stone temple pilots”というインスタンスが存在しているものとする。   On the other hand, the ontology OB has a class called “lock”. The class “Rock” has child classes “America” and “UK”, and the child class “America” has a child class “Indies” in the child class “America”. It is assumed that instances “nirvana” and “Stone temple pilots” exist in the child class “indies”.

さらに、“イギリス”という子クラスには、“オルタナティブ”という子クラスが存在し、“オルタナティブ”という子クラスには、“スコットランド”という子クラスが存在している。そして、“スコットランド”には、“teenage”というインスタンスが存在しているものとする。
そして、オントロジOA、OB間の近似度を計測する場合、これらのオントロジOA、OBにそれぞれ含まれるクラス間のマッピングを行う。ここで、オントロジOA、OBにそれぞれ含まれるクラス間のマッピングを行う場合、各オントロジOA、OBを構成するクラス間の全組み合わせに対して近似度を計測することができる。
Further, a child class “UK” has a child class “Alternative”, and a child class “Alternative” has a child class “Scotland”. Assume that an instance of “tenage” exists in “Scotland”.
When the degree of approximation between the ontology OA and OB is measured, mapping between classes included in the ontology OA and OB is performed. Here, when mapping between classes included in the ontology OA and OB is performed, the degree of approximation can be measured for all combinations between classes constituting the ontology OA and OB.

すなわち、図8および図9に示すように、各オントロジOA、OBに含まれる全てのクラス間で総当りにて近似度をそれぞれ算出することにより、オントロジOA、OB間のマッピングを行うことができる。なお、近似度を計測方法としては、クラスの持つ名前属性や各種プロパティ、インスタンス集合などのクラス特性の近似度に基づいて計算することができる。   That is, as shown in FIG. 8 and FIG. 9, mapping between ontology OA and OB can be performed by calculating the approximation degree between all classes included in each ontology OA and OB. . As a method of measuring the degree of approximation, it can be calculated based on the degree of approximation of class characteristics such as name attributes, various properties, and instance sets possessed by a class.

図10は、図7のクラス間におけるマッピング結果の一例を示す図である。
図10において、オントロジOA、OB間のマッピングの結果、オントロジOAの“ロック”というクラスとオントロジOBの“ロック”というクラスとがマッピングされ、オントロジOAの“US”というクラスとオントロジOBの“アメリカ”というクラスとがマッピングされ、オントロジOAの“インディーズ”というクラスとオントロジOBの“indies”というクラスとがマッピングされ、オントロジOAの“グランジ”というクラスとオントロジOBの“indies”というクラスとがマッピングされたものとする。
FIG. 10 is a diagram illustrating an example of a mapping result between the classes of FIG.
In FIG. 10, as a result of mapping between ontology OA and OB, ontology OA “lock” class and ontology OB “lock” class are mapped, ontology OA “US” class and ontology OB “USA” ”Is mapped, ontology OA“ indie ”class and ontology OB“ indies ”class are mapped, ontology OA“ grunge ”class and ontology OB“ indies ”class are mapped It shall be assumed.

そして、オントロジOA、OBのクラス間におけるマッピングが行われると、近似度の高いクラスの隣接クラスからなるクラス集合間の近似度を計測する。なお、クラス集合間の近似度の計測方法としては、例えば、Jaccard係数を用いることができる。このJaccard係数では、クラス集合X、Y間の近似度は、(X∩Y)/(X∪Y)にて求めることができる。   When mapping between the classes of ontology OA and OB is performed, the degree of approximation between the class sets composed of the adjacent classes of the class having a high degree of approximation is measured. As a method for measuring the degree of approximation between class sets, for example, a Jaccard coefficient can be used. With this Jaccard coefficient, the degree of approximation between the class sets X and Y can be obtained by (X∩Y) / (X∪Y).

図11は、図7のオントロジ間における近似度計測結果の一例を示す図である。
図11において、図7のオントロジOA、OBのクラス間において、図10のマッピング結果が得られたものとする。この場合、オントロジOAにおいて、“ロック”というクラスおよび“US”というクラスからなるクラス集合G11、“ロック”というクラス、“US”というクラスおよび“インディーズ”というクラスからなるクラス集合G12、“インディーズ”というクラスおよび“グランジ”というクラスからなるクラス集合G13が得られる。
FIG. 11 is a diagram illustrating an example of the approximation degree measurement result between the ontology in FIG.
In FIG. 11, it is assumed that the mapping result of FIG. 10 is obtained between the classes of ontology OA and OB of FIG. In this case, in ontology OA, a class set G11 consisting of a class called "lock" and a class called "US", a class called "lock", a class set G12 consisting of a class called "US" and a class called "indie", "indie" And a class set G13 including the class “grunge” is obtained.

一方、オントロジOBにおいて、“ロック”というクラス、“アメリカ”というクラスおよび“イギリス”というクラスからなるクラス集合G21、“ロック”というクラス、“アメリカ”というクラスおよび“indies”というクラスからなるクラス集合G22、“アメリカ”というクラスおよび“indies”というクラスからなるクラス集合G23が得られる。   On the other hand, in ontology OB, a class set G21 consisting of a class "Rock", a class "America" and a class "UK", a class set "Class" "Rock", a class "America" and a class "Indies" G22, a class set G23 consisting of a class “America” and a class “indies” is obtained.

そして、クラス集合G11、G21間では、クラス集合G11の“ロック”というクラスとクラス集合G21の“ロック”というクラスとは対応関係にあるので、これらで1個のメンバとみなし、クラス集合G11の“US”というクラスとクラス集合G21の“アメリカ”というクラスとは対応関係にあるので、これらで1個のメンバとみなし、さらにクラス集合G21には“イギリス”というクラスが含まれるので、クラス集合G11、G21全体のメンバ数(G11∪G21)は3となる。   Between the class sets G11 and G21, the class “lock” in the class set G11 and the class “lock” in the class set G21 are in a correspondence relationship. Since the class “US” and the class “USA” in the class set G21 are in a corresponding relationship, they are regarded as one member, and the class set G21 includes a class “UK”. The total number of members G11 and G21 (G11∪G21) is 3.

一方、クラス集合G11の“ロック”というクラスとクラス集合G21の“ロック”というクラスとは対応関係にあり、クラス集合G11の“US”というクラスとクラス集合G21の“アメリカ”というクラスとは対応関係にあり、クラス集合G21の“イギリス”に対応するクラスはクラス集合G11にはないので、クラス集合G11、G21間に共通に含まれるメンバ数(G11∩G21)は2となる。この結果、クラス集合G11、G21間におけるJaccard係数は2/3となる。   On the other hand, the class “lock” in the class set G11 and the class “lock” in the class set G21 have a correspondence relationship, and the class “US” in the class set G11 and the class “America” in the class set G21 correspond to each other. Since there is no class corresponding to “UK” in the class set G21 in the class set G11, the number of members commonly included between the class sets G11 and G21 (G11∩G21) is two. As a result, the Jaccard coefficient between the class sets G11 and G21 is 2/3.

同様に、クラス集合G12、G22間におけるJaccard係数は2/4、クラス集合G13、G23間におけるJaccard係数は1/3となる。
そして、オントロジOA、OBのクラス集合間におけるJaccard係数がそれぞれ求まると、これらのクラス集合間におけるJaccard係数を足し合わせる。そして、Jaccard係数を足し合わせた結果をソースオントロジOAのクラス数にて除することで、オントロジOAからみたオントロジOBの近似度を計測することができる。例えば、図11では、ソースオントロジOAのクラス数は4なので、オントロジOAからみたオントロジOBの近似度は、(2/3+2/4+1/3)/4=3/8となる。
Similarly, the Jaccard coefficient between the class sets G12 and G22 is 2/4, and the Jaccard coefficient between the class sets G13 and G23 is 1/3.
When the Jaccard coefficients between the ontology OA and OB class sets are found, the Jaccard coefficients between these class sets are added together. Then, by dividing the result obtained by adding the Jaccard coefficients by the number of classes of the source ontology OA, the degree of approximation of the ontology OB viewed from the ontology OA can be measured. For example, in FIG. 11, since the number of classes of the source ontology OA is 4, the degree of approximation of the ontology OB viewed from the ontology OA is (2/3 + 2/4 + 1/3) / 4 = 3/8.

図12は、従来の複数のオントロジに対する近似度計測結果の比較例を示す図である。
図12において、オントロジOCでは、オントロジOBの“イギリス”というクラス以下の子クラスがないものとする。そして、オントロジOCでは、“ロック”というクラスおよび“アメリカ”というクラスからなるクラス集合G31、“ロック”というクラス、“アメリカ”というクラスおよび“indies”というクラスからなるクラス集合G32、“アメリカ”というクラスおよび“indies”というクラスからなるクラス集合G33が得られる。
FIG. 12 is a diagram illustrating a comparative example of the degree-of-approximation measurement results for a plurality of conventional ontology.
In FIG. 12, it is assumed that the ontology OC has no child class below the class “UK” of the ontology OB. In the ontology OC, a class set G31 composed of a class “Rock” and a class “America”, a class set G32 composed of a class “Lock”, a class “America” and a class “indies”, “America” A class set G33 including the class and the class “indies” is obtained.

この場合、クラス集合G11、G31間におけるJaccard係数は2/2、クラス集合G12、G32間におけるJaccard係数は2/4、クラス集合G13、G33間におけるJaccard係数は1/3となる。この結果、オントロジOAからみたオントロジOCの近似度は、(2/2+2/4+1/3)/4=11/24となる。
また、非特許文献2には、複数のオントロジを構成するクラス間のマッピングを半自動で実現する方法が開示されている。
In this case, the Jaccard coefficient between the class sets G11 and G31 is 2/2, the Jaccard coefficient between the class sets G12 and G32 is 2/4, and the Jaccard coefficient between the class sets G13 and G33 is 1/3. As a result, the degree of approximation of ontology OC viewed from ontology OA is (2/2 + 2/4 + 1/3) / 4 = 11/24.
Non-Patent Document 2 discloses a method for realizing semi-automatic mapping between classes constituting a plurality of ontology.

Maedche,A.and Staab,S.:Measuring Similarity between Ontologies,In Technical Report,E0448,University of Karlsruhe(2001)Maedche, A .; and Staab, S .; : Measuring Similarity between Ontologies, In Technical Report, E0448, University of Karlsruhe (2001) 中辻真、三好優、木村辰幸:“柔軟なシステム連携のための意味情報に基づくメッセージマッピング手法の提案と評価”,日本データベース学会 Letters,Vol.4,No.1,pp.37−40(2005)Makoto Nakajo, Yu Miyoshi, Yasuyuki Kimura: “Proposal and Evaluation of Message Mapping Method Based on Semantic Information for Flexible System Cooperation”, Database Society of Japan Letters, Vol. 4, no. 1, pp. 37-40 (2005)

しかしながら、非特許文献1に開示された方法では、オントロジ間の近似度を計算するためには、オントロジの持つクラス間の対応関係の判定(クラスマッピング)を行う必要があり、オントロジの持つクラスの数が増大すると、計算量が膨大になるという問題があった。
また、非特許文献2に開示された方法では、完全に分散された環境下で構築されたオントロジ間のクラス間の対応を計測するもので、クラスのマッピングを行ったからといって、オントロジ間の近似度が計算されるわけではないという問題があった。
However, in the method disclosed in Non-Patent Document 1, in order to calculate the degree of approximation between ontology, it is necessary to determine the correspondence (class mapping) between the classes possessed by the ontology. When the number increases, there is a problem that the calculation amount becomes enormous.
In addition, the method disclosed in Non-Patent Document 2 measures the correspondence between classes between ontology constructed in a completely distributed environment. There was a problem that the degree of approximation was not calculated.

さらに、従来のオントロジ間の近似度の計測方法では、あるアーチストを熱心に語っているユーザ同士であろうが、あるユーザはそのアーチストについて熱心に語っており、別のユーザはそのアーチストについて熱心に語っていない場合であろうが、そのアーチストについての興味の近さは同じであると計測されることから、ユーザの興味を十分に反映しながら、オントロジ間の近似度の計測することができないという問題があった。
そこで、本発明の目的は、計算量を抑制しつつ、ユーザの興味を十分に反映しながらオントロジ間の近似度を計算することが可能なオントロジの近似度計測装置、オントロジの近似度計測方法およびオントロジの近似度計測プログラムを提供することである。
Furthermore, in the conventional method for measuring the degree of approximation between ontologies, users who are eagerly talking about an artist, one user is eagerly talking about the artist, and another user is eagerly talking about the artist. Although it may not be the case, since the degree of interest in the artist is measured to be the same, the degree of approximation between ontology cannot be measured while sufficiently reflecting the user's interest. There was a problem.
Therefore, an object of the present invention is to provide an ontology approximation measuring device, an ontology approximation measuring method, and an ontology approximation measuring method capable of calculating an approximation between ontology while sufficiently reflecting a user's interest while suppressing a calculation amount. To provide an ontology approximation measurement program.

上述した課題を解決するために、請求項1記載のオントロジの近似度計測装置によれば、オントロジを構成するクラスまたはインスタンスが、個人の興味が反映されたエントリに含まれる割合に基づいて、前記クラスまたはインスタンスに対する興味度を計測する興味度計測手段と、前記興味度計測手段にて計測された興味度に基づいて、前記オントロジ間の近似度を計測する近似度計測手段とを備えることを特徴とする。   In order to solve the above-described problem, according to the ontology approximation degree measuring device according to claim 1, the class or instance constituting the ontology is based on a ratio included in an entry reflecting an individual's interest. An interest degree measuring means for measuring an interest degree for a class or an instance, and an approximation degree measuring means for measuring an approximation degree between the ontology based on the interest degree measured by the interest degree measuring means. And

また、請求項2記載のオントロジの近似度計測装置によれば、各個人ごとに構築された興味情報に含まれる単語を抽出する単語抽出手段と、興味情報が概念階層化された雛形オントロジから前記単語を含むクラスまたはインスタンスを抽出する分類子適用手段と、前記抽出されたクラスまたはインスタンスおよびそれらの上位のクラスをパーソナルオントロジとして前記雛形オントロジから抽出するパーソナルオントロジ抽出手段と、個人の興味が反映されたエントリに前記クラスまたはインスタンスが含まれる割合に基づいて、前記クラスまたはインスタンスに対する興味度を計測する興味度計測手段と、前記興味度計測手段にて計測された興味度に基づいて、前記パーソナルオントロジ間の近似度を計測する近似度計測手段とを備えることを特徴とする。   Further, according to the ontology approximation degree measuring apparatus according to claim 2, the word extraction means for extracting words included in the interest information constructed for each individual, and the template ontology in which the interest information is conceptually hierarchized The classifier application means for extracting a class or instance including a word, the personal ontology extraction means for extracting the extracted class or instance and their higher class from the template ontology as a personal ontology, and the interest of the individual is reflected. An interest degree measuring means for measuring the degree of interest in the class or instance based on the ratio of the class or instance included in the entry, and the personal ontology based on the interest degree measured by the interest degree measuring means. And an approximation degree measuring means for measuring the degree of approximation between The features.

また、請求項3記載のオントロジの近似度計測方法によれば、各個人ごとに構築された興味情報に含まれる単語を抽出するステップと、興味情報が概念階層化された雛形オントロジから前記単語を含むクラスまたはインスタンスを抽出するステップと、前記抽出されたクラスまたはインスタンスおよびそれらの上位のクラスをパーソナルオントロジとして前記雛形オントロジから抽出するステップと、個人の興味が反映されたエントリに前記クラスまたはインスタンスが含まれる割合に基づいて、前記クラスまたはインスタンスに対する興味度を計測するステップと、前記計測された興味度に基づいて、前記パーソナルオントロジ間の近似度を計測するステップとを備えることを特徴とする。   In addition, according to the ontology approximation measurement method according to claim 3, the step of extracting words included in the interest information constructed for each individual, and the word from the template ontology in which the interest information is conceptually hierarchized. Extracting a class or instance including the step of extracting the extracted class or instance and a class higher than the extracted class or instance as a personal ontology from the template ontology; The step of measuring the degree of interest with respect to the class or instance based on the included ratio, and the step of measuring the degree of approximation between the personal ontology based on the measured degree of interest.

また、請求項4記載のオントロジの近似度計測プログラムによれば、各個人ごとに構築された興味情報に含まれる単語を抽出するステップと、興味情報が概念階層化された雛形オントロジから前記単語を含むクラスまたはインスタンスを抽出するステップと、前記抽出されたクラスまたはインスタンスおよびそれらの上位のクラスをパーソナルオントロジとして前記雛形オントロジから抽出するステップと、個人の興味が反映されたエントリに前記クラスまたはインスタンスが含まれる割合に基づいて、前記クラスまたはインスタンスに対する興味度を計測するステップと、前記計測された興味度に基づいて、前記パーソナルオントロジ間の近似度を計測するステップとをコンピュータに実行させることを特徴とする。   According to the ontology approximation measurement program according to claim 4, the step of extracting words included in the interest information constructed for each individual, and the word from the template ontology in which the interest information is conceptually hierarchized. Extracting a class or instance including the step of extracting the extracted class or instance and a class higher than the extracted class or instance as a personal ontology from the template ontology; Making the computer execute a step of measuring the degree of interest in the class or instance based on the included ratio, and a step of measuring the degree of approximation between the personal ontology based on the measured degree of interest And

以上説明したように、本発明によれば、個人の興味の強さを考慮しながら単なる文字列ではなく概念間の一致性に基づいて、自分の嗜好に適合した情報を精度よく検索することが可能となるとともに、自分の嗜好に適合した情報をインターネット上で広く流通させることが可能となり、個人の嗜好に適合したコミュニティを形成することができる。   As described above, according to the present invention, it is possible to accurately search for information suitable for one's preference based on consistency between concepts, not just a character string, taking into account the strength of personal interest. It becomes possible, and information suitable for one's preference can be widely distributed on the Internet, and a community suitable for individual preference can be formed.

以下、本発明の実施形態に係るオントロジの近似度計測装置およびその方法について図面を参照しながら説明する。
図1は、本発明の一実施形態に係るオントロジの近似度計測装置が適用されるシステムの概略構成を示すブロック図である。
図1において、端末2〜4およびサーバ5が通信網1を介して接続されている。なお、通信網1としては、例えば、IP通信を行う公衆通信網を用いることができ、インターネットであってもよい。また、企業間の専用通信網であっても、公衆通信網であってもよいが、高信頼性とセキュリティとを備えた専用通信を提供できるIP−VPN(Internet Protocol−Virtual Private Network)のような通信網であってもよい。
Hereinafter, an ontology approximation measuring apparatus and method according to an embodiment of the present invention will be described with reference to the drawings.
FIG. 1 is a block diagram showing a schematic configuration of a system to which an ontology approximation measuring apparatus according to an embodiment of the present invention is applied.
In FIG. 1, terminals 2 to 4 and a server 5 are connected via a communication network 1. As the communication network 1, for example, a public communication network that performs IP communication can be used, and the Internet may be used. Further, it may be a private communication network between companies or a public communication network, but it is like an IP-VPN (Internet Protocol-Virtual Private Network) that can provide dedicated communication with high reliability and security. A simple communication network may be used.

また、端末2〜4としては、ノート型パーソナルコンピュータあるいはデスクトップ型パーソナルコンピュータでもよく、携帯電話端末やPDA(Personal Data Assistant)などでもよい。また、サーバ5は、ブログプロバイダやISP(Information Service Provider)上に設置することができる。   Further, the terminals 2 to 4 may be a notebook personal computer or a desktop personal computer, and may be a mobile phone terminal or a PDA (Personal Data Assistant). The server 5 can be installed on a blog provider or ISP (Information Service Provider).

ここで、サーバ5には、端末2〜4にそれぞれ対応したブログサイト7〜9が設けられ、各ブログサイト7〜9には、ブログエントリ7a〜7n、8a〜8n、9a〜9nがそれぞれ保持されている。なお、ブログエントリ7a〜7n、8a〜8n、9a〜9nはブログにおける記事の最小単位を表し、日にちごとに設けることができる。また、サーバ5には雛形オントロジ6が保持され、雛形オントロジ6には、個人の興味情報が概念階層化されたパーソナルオントロジの雛形が設けられている。   Here, the server 5 is provided with blog sites 7 to 9 corresponding to the terminals 2 to 4 respectively, and the blog entries 7a to 7n, 8a to 8n, and 9a to 9n are held in the blog sites 7 to 9, respectively. Has been. The blog entries 7a to 7n, 8a to 8n, and 9a to 9n represent minimum units of articles in the blog, and can be provided for each day. The server 5 holds a template ontology 6, and the template ontology 6 is provided with a personal ontology template in which personal interest information is conceptually hierarchized.

なお、雛形オントロジ6は、ブログプロバイダ側で恣意的に作成することができる。例えば、ブログプロバイダが音楽に関するパーソナルオントロジを各端末2〜4のユーザに構築させたければ、音楽に関する雛形オントロジ6を構築すればよい。ここで、各端末2〜4のユーザの興味を細やかに表現するために、可能な限り細分化された網羅性の高い雛形オントロジ6を構築することが好ましい。また、雛形オントロジ6の実体は、オントロジ記述言語OWLなどのXML言語で記述されたテキストファイル等、クラス・インスタンスツリーをDB上で表現したものである。また、情報の整理の簡単化のため、インスタンスは最下位クラスにのみ分類してもよい。   The template ontology 6 can be arbitrarily created on the blog provider side. For example, if the blog provider wants the users of the terminals 2 to 4 to construct a personal ontology related to music, the template ontology 6 related to music may be constructed. Here, in order to express the interests of the users of the terminals 2 to 4 in detail, it is preferable to construct a template ontology 6 that is subdivided as much as possible and has high coverage. The entity of the template ontology 6 is a representation of a class / instance tree on the DB, such as a text file described in an XML language such as the ontology description language OWL. In order to simplify the organization of information, instances may be classified only into the lowest class.

さらに、サーバ5には、ブログエントリ7a〜7n、8a〜8n、9a〜9nに対して形態素解析をそれぞれ適用することにより、ブログエントリ7a〜7n、8a〜8n、9a〜9nに頻出する単語を抽出する頻出単語抽出手段5a、ブログエントリ7a〜7n、8a〜8n、9a〜9nに頻出する単語を含むクラスまたはインスタンスを雛形オントロジ6から抽出する分類子適用手段5b、分類子適用手段5bにて抽出されたクラスまたはインスタンスおよびそれらの上位の全てのクラスをパーソナルオントロジとして雛形オントロジ6から抽出するパーソナルオントロジ抽出手段5c、分類子適用手段5bにて抽出されたクラスまたはインスタンスがブログエントリ7a〜7n、8a〜8n、9a〜9nに含まれる割合に基づいて、それらのクラスまたはインスタンスに対する興味度を計測する興味度計測手段5d、ならびに興味度計測手段5dにて計測された興味度に基づいて、パーソナルオントロジ間の近似度を計測する近似度計測手段5eが設けられている。   Furthermore, the server 5 applies words that appear frequently in the blog entries 7a to 7n, 8a to 8n, and 9a to 9n by applying morphological analysis to the blog entries 7a to 7n, 8a to 8n, and 9a to 9n, respectively. In the frequent word extraction means 5a to be extracted, the classifier application means 5b and the classifier application means 5b to extract from the template ontology 6 a class or instance including words that frequently appear in the blog entries 7a to 7n, 8a to 8n, and 9a to 9n. Personal ontology extraction means 5c for extracting the extracted class or instance and all higher classes thereof from the template ontology 6 as personal ontology 6, and the class or instance extracted by the classifier applying means 5b are blog entries 7a to 7n, Based on the percentages included in 8a-8n, 9a-9n, An interest degree measuring means 5d for measuring the degree of interest in these classes or instances, and an approximation degree measuring means 5e for measuring the degree of approximation between personal ontology based on the interest degree measured by the interest degree measuring means 5d are provided. It has been.

そして、頻出単語抽出手段5aは、ブログエントリ7a〜7n、8a〜8n、9a〜9nに対して形態素解析をそれぞれ適用する。そして、同一ユーザの持つ複数のブログエントリ7a〜7n、8a〜8n、9a〜9nで頻出する形態素を抽出する。
次に、分類子適用手段5bは、ブログエントリ7a〜7n、8a〜8n、9a〜9nで頻出する各形態素を雛形オントロジ6に適用し、雛形オントロジ6内のクラスまたはインスタンスに一致する文字列があるかどうかを調べる。そして、雛形オントロジ6内のクラスまたはインスタンスに一致する文字列がある場合、パーソナルオントロジ抽出手段5cは、雛形オントロジ6のルートクラスから、そのクラスまたはインスタンスまでの直接的な子孫クラスおよびインスタンスをパーソナルオントロジとして抽出する。
The frequent word extraction means 5a applies morphological analysis to the blog entries 7a to 7n, 8a to 8n, and 9a to 9n, respectively. Then, morphemes that frequently appear in a plurality of blog entries 7a to 7n, 8a to 8n, and 9a to 9n possessed by the same user are extracted.
Next, the classifier applying unit 5b applies each morpheme frequently appearing in the blog entries 7a to 7n, 8a to 8n, and 9a to 9n to the template ontology 6, and a character string that matches the class or instance in the template ontology 6 is applied. Find out if there is. When there is a character string that matches the class or instance in the template ontology 6, the personal ontology extracting means 5c determines the direct descendant classes and instances from the root class of the template ontology 6 to the class or instance. Extract as

また、興味度計測手段5dは、パーソナルオントロジ抽出手段5cにて抽出されたクラスまたはインスタンスがブログエントリ7a〜7n、8a〜8n、9a〜9nに含まれる割合に基づいて、それらのクラスまたはインスタンスに対する興味度を計測する。そして、近似度計測手段5eは、興味度計測手段5dにて計測された興味度とともに、パーソナルオントロジ抽出手段5cにて抽出されたパーソナルオントロジのトポロジをも考慮しながら、パーソナルオントロジ間の近似度を計測することができる。   Also, the interest level measuring means 5d determines the class or instance extracted by the personal ontology extracting means 5c based on the ratio of the blog entries 7a to 7n, 8a to 8n, and 9a to 9n. Measure interest. Then, the degree-of-approximation measuring means 5e calculates the degree of approximation between personal ontology while taking into consideration the topology of the personal ontology extracted by the personal ontology extracting means 5c together with the degree of interest measured by the interest degree measuring means 5d. It can be measured.

これにより、個人の興味の強さを考慮しながら単なる文字列ではなく概念間の一致性に基づいて、自分の嗜好に適合した情報を精度よく検索することが可能となるとともに、自分の嗜好に適合した情報をインターネット上で広く流通させることが可能となり、個人の嗜好に適合したコミュニティを形成することができる。
なお、雛形オントロジ6は、デスクワークにて人手で作成してサーバ5に保持させるようにしてもよいし、パーソナルオントロジ抽出手段5cにて抽出されたパーソナルオントロジを既存の雛形オントロジ6とマージすることにより作成してもよい。さらに、雛形オントロジ6から抽出されたパーソナルオントロジに対してユーザが興味のあるクラスまたはインスタンスを追加したり、ユーザが興味のないクラスまたはインスタンスを削除したりするようにしてもよい。
This makes it possible to accurately search for information that suits one's preference based on the consistency between concepts, not just a character string, taking into account the strength of personal interests. Suitable information can be widely distributed on the Internet, and a community adapted to personal tastes can be formed.
Note that the template ontology 6 may be manually created by desk work and stored in the server 5, or the personal ontology extracted by the personal ontology extracting means 5c may be merged with the existing template ontology 6. You may create it. Furthermore, a class or instance that the user is interested in may be added to the personal ontology extracted from the template ontology 6, or a class or instance that the user is not interested in may be deleted.

また、頻出単語抽出手段5a、分類子適用手段5b、パーソナルオントロジ抽出手段5c、興味度計測手段5dおよび近似度計測手段5eは、これらの手段で行われる処理を遂行させる命令が記述されたプログラムをコンピュータに実行させることにより実現することができる。
そして、このプログラムをCD−ROMなどの記憶媒体に記憶しておけば、サーバ5のコンピュータに記憶媒体を装着し、そのプログラムをコンピュータにインストールすることにより、頻出単語抽出手段5a、分類子適用手段5b、パーソナルオントロジ抽出手段5c、興味度計測手段5dおよび近似度計測手段5eで行われる処理を実現することができる。また、このプログラムを通信網1を介してダウンロードすることにより、このプログラムを容易に普及させることができる。
The frequent word extracting means 5a, classifier applying means 5b, personal ontology extracting means 5c, interest degree measuring means 5d, and approximation degree measuring means 5e are programs having instructions for executing the processing performed by these means. This can be realized by causing a computer to execute it.
If this program is stored in a storage medium such as a CD-ROM, the frequent word extraction means 5a and classifier application means are installed by installing the storage medium in the computer of the server 5 and installing the program in the computer. 5b, the processing performed by the personal ontology extracting means 5c, the interest degree measuring means 5d, and the approximation degree measuring means 5e can be realized. Moreover, by downloading this program via the communication network 1, this program can be easily spread.

また、頻出単語抽出手段5a、分類子適用手段5b、パーソナルオントロジ抽出手段5c、興味度計測手段5dおよび近似度計測手段5eで行われる処理を遂行させる命令が記述されたプログラムをコンピュータに実行させる場合、スタンドアロン型コンピュータで実行させるようにしてもよく、ネットワークに接続された複数のコンピュータに分散処理させるようにしてもよい。   In addition, when a computer executes a program in which an instruction for performing processing performed by the frequent word extraction unit 5a, the classifier application unit 5b, the personal ontology extraction unit 5c, the interest degree measurement unit 5d, and the approximation degree measurement unit 5e is described. It may be executed by a stand-alone computer, or may be distributed to a plurality of computers connected to a network.

図2は、本発明の一実施形態に係るパーソナルオントロジの生成方法を示す図である。
図2において、pingサーバなどを通じ、ユーザA、B、・・・、Xのエントリ集合をそれぞれ収集し、これらの収集した全てのブログエントリに対して形態素解析を行うことにより、インデックスを作成する(ステップS1)。
次に、pingサーバにて収集された全てのブログエントリを雛形オントロジOHに対して分類する(ステップS2)。ここで、ブログエントリの分類方法としては、雛形オントロジOHのあるクラスCの名前属性があるエントリ内の記述にあれば、そのエントリをクラスCに分類することができる。また、雛形オントロジOHのあるクラスCに所属するインスタンスI(∈C)の名前属性があるエントリ内の記述にあれば、そのエントリをクラスCに所属するインスタンスIに分類することができる。なお、同一のエントリが複数のクラスに分類されてもよい。
FIG. 2 is a diagram illustrating a method for generating a personal ontology according to an embodiment of the present invention.
In FIG. 2, an entry set of users A, B,..., X is collected through a ping server or the like, and an index is created by performing morphological analysis on all the collected blog entries ( Step S1).
Next, all the blog entries collected by the ping server are classified with respect to the template ontology OH (step S2). Here, as a method for classifying blog entries, if there is a description in an entry having a name attribute of class C i having a template ontology OH, the entry can be classified into class C i . Also, if the name attribute of the instance I i (∈C i ) belonging to the class C i having the template ontology OH is in the description in the entry, the entry is classified into the instance I i belonging to the class C i. Can do. Note that the same entry may be classified into a plurality of classes.

例えば、“Charlatans”という文字列がエントリ内の記述にある場合、そのエントリは、クラス“Madchester”のインスタンス“Charlatans”に分類することができる。
次に、雛形オントロジOHを形成する最下層クラスCの持つ各インスタンスに興味を持つユーザA、B、・・・、Xの数を計測する(ステップS3)。なお、クラスCのインスタンスに興味を持つユーザA、B、・・・、Xの数を計測する場合、同一のユーザが複数のエントリにおいてインスタンスIを記述している場合においても、ユーザ数は1と計測する。
For example, if the character string “Charlantans” is in the description in the entry, the entry can be classified into an instance “Charlantans” of the class “Madchester”.
Next, the number of users A, B,..., X who are interested in each instance of the lowermost class C 1 forming the template ontology OH is measured (step S3). When the number of users A, B,..., X who are interested in instances of class C l is measured, the number of users even when the same user describes instance I l in a plurality of entries. Measures 1

次に、雛形オントロジOHを形成する最下層クラスCに興味を持つユーザA、B、・・・、Xの数を計測する。ここで、雛形オントロジOHを形成する最下層クラスCに興味を持つユーザA、B、・・・、Xの数は、最下層クラスCの配下の全てのインスタンスに興味を持つユーザ数と、最下層クラスC自体に興味を持つユーザ数との総和にて算出することができる。なお、同一のユーザが複数のインスタンスに興味を持っていたり、最下層クラスとその最下層クラスに所属するインスタンスに同時に興味を持っている場合においても、ユーザ数は1と計測する。このようにして、雛形オントロジOHを形成するクラスやインスタンスに興味を持つユーザA、B、・・・、Xの数をルートクラスまで再帰的に計測することで、そのドメインに興味を持つユーザA、B、・・・、Xの分布を算出することができる。 Next, the user A interested in lowermost class C l to form a stationery ontology OH, measured B, · · ·, the number of X. Here, the number of users A, B,..., X interested in the lowest class C 1 forming the template ontology OH is the number of users interested in all instances under the lowest class C 1. , it can be calculated by the sum of the number of users interested in the lowest layer class C l itself. Note that the number of users is measured as 1 even when the same user is interested in a plurality of instances or is interested in the lowermost class and instances belonging to the lowermost class at the same time. In this way, by recursively measuring the number of users A, B,..., X interested in the class or instance forming the template ontology OH up to the root class, the user A interested in the domain , B,..., X can be calculated.

次に、pingサーバにて収集された全てのブログエントリが雛形オントロジOHに対して分類されると、その分類結果をユーザIDごとに整理することにより、各ユーザA、B、・・・、Xごとの興味オントロジOA、・・・、OXを生成する(ステップS4)。
ここで、pingサーバにて収集された全てのブログエントリを雛形オントロジOHに対して分類する場合、オントロジの持つ同一クラスに所属するインスタンスは同一の性質を持つという特性と、クラス階層の近いクラス間の性質は近く、両者のインスタンス間の性質も近いという特性を用いることにより、分類の誤りを除去することができる。
Next, when all the blog entries collected by the ping server are classified with respect to the template ontology OH, the classification results are arranged for each user ID, whereby each user A, B,. Each interest ontology OA,..., OX is generated (step S4).
Here, when all the blog entries collected by the ping server are classified with respect to the template ontology OH, the instances that belong to the same class of the ontology have the same property, and between classes close to the class hierarchy The classification error can be eliminated by using the property that the properties of are close and the properties of both instances are also close.

図3は、本発明の一実施形態に係るパーソナルオントロジ間の近似度計測方法を示す図である。なお、以下の説明では、あるオントロジに対する別のオントロジとの間の近似度を計測する場合、前者をソースオントロジ、後者をターゲットオントロジと呼ぶ。
図3において、雛形オントロジOHの“a1”というクラスの直下には、“b1”、“b2”および“b3”というクラスが存在し、“b1”というクラスの直下には、“c1”および“c2”というクラスが存在し、“c1”というクラスの直下には、“d1”および“d2”というクラスが存在しているものとする。また、“b2”というクラスの直下には、“c3”および“c4”というクラスが存在し、“b3”というクラスの直下には、“c5”というクラスが存在しているものとする。
FIG. 3 is a diagram illustrating a method for measuring the degree of approximation between personal ontology according to an embodiment of the present invention. In the following description, when the degree of approximation between an ontology and another ontology is measured, the former is called a source ontology and the latter is called a target ontology.
In FIG. 3, classes “b1”, “b2”, and “b3” exist immediately below the class “a1” of the template ontology OH, and “c1” and “c1” immediately below the class “b1”. It is assumed that a class called “c2” exists and classes “d1” and “d2” exist immediately below the class called “c1”. Also, it is assumed that classes “c3” and “c4” exist immediately below the class “b2”, and a class “c5” exists immediately below the class “b3”.

また、“d1”というクラスには、“j”および“k”というインスタンスが存在し、“d2”というクラスには、“l”というインスタンスが存在し、“c2”というクラスには、“m”というインスタンスが存在し、“b2”というクラスには、“n”というインスタンスが存在し、“c3”というクラスには、“a”、“e”、“c”、“f”、“b”、“d”および“g”というインスタンスが存在し、“c4”というクラスには、“p”、“g”、“j”および“h”というインスタンスが存在しているものとする。   The class “d1” includes instances “j” and “k”, the class “d2” includes the instance “l”, and the class “c2” includes “m”. "B", the class "b2" has an instance "n", and the class "c3" has "a", "e", "c", "f", "b" ”,“ D ”, and“ g ”exist, and the class“ c4 ”includes instances“ p ”,“ g ”,“ j ”, and“ h ”.

そして、各ユーザのブログエントリに頻出する単語をそれぞれ抽出し、その単語を含むクラスまたはインスタンスおよびそれらの上位の全てのクラスを雛形オントロジOHからそれぞれ抽出することにより、パーソナルオントロジOA、OBが作成されたものとする。
ここで、パーソナルオントロジOAの“a1というクラスの直下には、“b1”および“b2”というクラスが存在し、“b1”というクラスの直下には、“c1”および“c2”というクラスが存在し、“c1”というクラスの直下には、“d1”というクラスが存在し、“b2”というクラスの直下には、“c3”および“c4”というクラスが存在しているものとする。また、“d1”というクラスには、“j”および“k”というインスタンスが存在し、“c2”というクラスには、“m”というインスタンスが存在し、“c3”というクラスには、“a”、“c”、“b”および“d”というインスタンスが存在し、“c4”というクラスには、“q”および“h”というインスタンスが存在しているものとする。
Then, the words that frequently appear in each user's blog entry are extracted, and the classes or instances including the words and all the classes above them are extracted from the template ontology OH, thereby creating personal ontologies OA and OB. Shall be.
Here, the classes “b1” and “b2” exist immediately below the class “a1” of the personal ontology OA, and the classes “c1” and “c2” exist immediately below the class “b1”. It is assumed that a class “d1” exists immediately below the class “c1”, and a class “c3” and “c4” exist immediately below the class “b2”. , The class “d1” includes instances “j” and “k”, the class “c2” includes the instance “m”, and the class “c3” includes “a”. , “C”, “b”, and “d” exist, and the class “c4” includes instances “q” and “h”.

また、パーソナルオントロジOBの“a1”というクラスの直下には、“b1”、“b2”および“b3”というクラスが存在し、“b1”というクラスの直下には、“c1”というクラスが存在し、“c1”というクラスの直下には、“d1”というクラスが存在し、“b2”というクラスの直下には、“c3”および“c4”というクラスが存在しているものとする。また、“d2”というクラスには、“l”というインスタンスが存在し、“b2”というクラスには、“n”というインスタンスが存在し、“c3”というクラスには、“a”、“c”、“e”および“f”というインスタンスが存在し、“c4”というクラスには、“p”および“j”というインスタンスが存在しているものとする。   Also, in the personal ontology OB, there are “b1”, “b2”, and “b3” classes directly under the “a1” class, and there is a “c1” class directly under the “b1” class. Assume that a class “d1” exists immediately below the class “c1”, and a class “c3” and “c4” exist immediately below the class “b2”. The class “d2” has an instance “l”, the class “b2” has an instance “n”, and the class “c3” has “a” and “c”. ”,“ E ”, and“ f ”exist, and“ c4 ”class includes“ p ”and“ j ”.

そして、雛形オントロジOHおよびパーソナルオントロジOA、OB間で末端クラスを除く共通クラスを分析し、共通クラスを親クラスとした親子クラスからなるトポロジを抽出する。なお、図2の例では、末端クラスは、“d1”、“d2”、“c3”および“c4”とする。この結果、雛形オントロジOHおよびパーソナルオントロジOA、OB間において、クラス“a1”を親クラスとした子クラス集合G1、クラス“b1”を親クラスとした子クラス集合G2、クラス“c1”を親クラスとした子クラス集合G3、クラス“b2”を親クラスとした子クラス集合G4、クラス“b3”を親クラスとした子クラス集合G5を抽出することができる。   Then, a common class excluding a terminal class is analyzed between the template ontology OH and the personal ontology OA and OB, and a topology composed of parent and child classes with the common class as a parent class is extracted. In the example of FIG. 2, the end classes are “d1”, “d2”, “c3”, and “c4”. As a result, a child class set G1 having the class “a1” as the parent class, a child class set G2 having the class “b1” as the parent class, and the class “c1” being the parent class between the template ontology OH and the personal ontologies OA and OB. Child class set G3, child class set G4 having class “b2” as a parent class, and child class set G5 having class “b3” as a parent class can be extracted.

なお、この共通クラスの分析は、同じクラスIDが雛形オントロジOHおよびパーソナルオントロジOA、OB間に存在するかということだけを確認すればよい。このため、クラスの名前属性やインスタンス集合プロパティなどの近似度を計測する必要がなくなり、クラス間の対応関係を正確に維持しつつ、計算量を減らすことができる。
次に、パーソナルオントロジOA、OB間で各トポロジを形成する子クラス集合X、Y間の近似度を深さ優先で計算する。ここで、雛形オントロジOHを構成するクラスの子クラスの集合をZとすると、子クラス集合X、Y間の近似度は、|X∩Y|/|Z|にて求めることができる。そして、各トポロジの子クラス集合間の近似度を足し合わせることにより、パーソナルオントロジOA、OB間でのトポロジの近似度Sを計測することができる。
The analysis of the common class only needs to confirm whether the same class ID exists between the template ontology OH and the personal ontology OA, OB. For this reason, it is not necessary to measure the degree of approximation of class name attributes, instance set properties, etc., and the amount of calculation can be reduced while maintaining the correspondence between classes accurately.
Next, the degree of approximation between the child class sets X and Y forming each topology between the personal ontology OA and OB is calculated with depth priority. Here, if the set of child classes of the classes constituting the template ontology OH is Z, the degree of approximation between the child class sets X and Y can be obtained by | X∩Y | / | Z |. By adding the approximation degree between the child class set for each topology, it is possible to measure the degree of approximation S T personal ontology OA, between OB topology.

例えば、子クラス集合G1において、雛形オントロジOHには“b1”、“b2”および“b3”という子クラスが含まれているので、子クラス集合G1における雛形オントロジOHの子クラス集合のメンバ数は3となる。また、子クラス集合G1において、パーソナルオントロジOAには“b1”および“b2”という子クラスが含まれ、パーソナルオントロジOBには“b1”、“b2”および“b3”という子クラスが含まれているので、パーソナルオントロジOA、OBに共通に含まれている子クラスは“b1”およびb2”だけとなり、子クラス集合G1におけるパーソナルオントロジOA、OBの子クラス集合の積集合のメンバ数は2となる。この結果、パーソナルオントロジOA、OBの子クラス集合G1間における近似度は2/3となる。   For example, in the child class set G1, since the template ontology OH includes child classes “b1”, “b2”, and “b3”, the number of members of the child class set of the template ontology OH in the child class set G1 is 3 In the child class set G1, the personal ontology OA includes child classes “b1” and “b2”, and the personal ontology OB includes child classes “b1”, “b2”, and “b3”. Therefore, the child classes commonly included in the personal ontologies OA and OB are only “b1” and b2 ”, and the number of members of the product set of the child class sets of the personal ontology OA and OB in the child class set G1 is 2. As a result, the degree of approximation between the child ontology sets G1 of the personal ontology OA and OB is 2/3.

同様に、パーソナルオントロジOA、OBの子クラス集合G2間における近似度は1/2、子クラス集合G3間における近似度は0/2、子クラス集合G4間における近似度は2/2となる。この結果、パーソナルオントロジOA、OB間でのトポロジの近似度Sは2/3+1/2+0/2+2/2となる。
なお、パーソナルオントロジOA、OB間でのトポロジの近似度の計算でも、雛形オントロジOHから割り振られたクラスIDを参照し、雛形オントロジOHの接続形態に沿ったものがパーソナルオントロジOA、OB間に存在するかということだけを確認すればよい。例えば、パーソナルオントロジOA、OBにおけるa1−b1−c1という接続形態は雛形オントロジOHの接続形態と同じであるかどうかは、“a1”、“b1”および“c1”というクラスがパーソナルオントロジOA、OBにて保持されているかどうかということを確認するだけで判断することができる。
Similarly, the degree of approximation between the personal ontology OA and OB between the child class sets G2 is 1/2, the degree of approximation between the child class sets G3 is 0/2, and the degree of approximation between the child class sets G4 is 2/2. As a result, personal ontology OA, similarity S T topology between OB becomes 2/3 + 1/2 + 0/2 + 2/2.
In the calculation of the approximate degree of topology between the personal ontology OA and OB, the class ID assigned from the template ontology OH is referred to, and the one along the connection form of the template ontology OH exists between the personal ontology OA and OB. You only have to confirm whether you want to do it. For example, whether the connection form a1-b1-c1 in the personal ontology OA, OB is the same as the connection form of the template ontology OH depends on whether the classes “a1”, “b1”, and “c1” are the personal ontology OA, OB. It can be determined simply by confirming whether or not it is held at.

このため、パーソナルオントロジOA、OB間のトポロジの一致度を確認するために、パーソナルオントロジOA、OBが持つクラスIDを調べるだけでよく、対応クラスを起点として、上下クラスにさらに対応クラスがあるかを調べる必要がなくなり、パーソナルオントロジOA、OB間でのトポロジの近似度の計算量を減らすことができる。   For this reason, in order to confirm the degree of coincidence of the topology between the personal ontology OA and OB, it is only necessary to check the class ID possessed by the personal ontology OA and OB. Therefore, it is possible to reduce the calculation amount of the degree of approximation of the topology between the personal ontology OA and OB.

次に、パーソナルオントロジOA、OBの共通クラス間の近似度を計算する。ここで、パーソナルオントロジOA、OBの共通クラス間の近似度を計算する場合、クラスに所属するインスタンス集合を用いることができる。すなわち、あるクラスC1において、ソースオントロジのインスタンス集合をx、ターゲットオントロジのインスタンス集合をy、雛形オントロジOHのインスタンス集合をzとすると、パーソナルオントロジOA、OBの共通クラス間の近似度は、|x∩y|/|z|にて求めることができる。そして、共通クラス間の近似度を足し合わせることにより、パーソナルオントロジOA、OBのクラス間の近似度Sを計測することができる。 Next, the degree of approximation between the common classes of the personal ontology OA and OB is calculated. Here, when calculating the degree of approximation between the common classes of the personal ontology OA and OB, an instance set belonging to the class can be used. That is, in a certain class C1, if the instance set of the source ontology is x, the instance set of the target ontology is y, and the instance set of the template ontology OH is z, the degree of approximation between the common classes of the personal ontology OA and OB is | x ∩y | / | z |. By adding the degree of approximation between the common class, it is possible to measure the degree of approximation S C between personal ontology OA, the OB classes.

例えば、パーソナルオントロジOA、OB間の共通クラス“b2”において、パーソナルオントロジOAの共通クラス“b2”におけるインスタンス集合G6には、インスタンス“n”が存在し、パーソナルオントロジOBの共通クラス“b2”におけるインスタンス集合G6には、インスタンス“n”が存在し、雛形オントロジOHの共通クラス“b2”にはインスタンス“n”が存在している。この結果、雛形オントロジOHの共通クラス“b2”のインスタンスのメンバ数は1、パーソナルオントロジOA、OBのインスタンス集合G6の積集合のメンバ数は1となり、“b2”という共通クラス間の近似度は1/1となる。   For example, in the common class “b2” between the personal ontologies OA and OB, the instance set G6 in the common class “b2” of the personal ontology OA includes the instance “n”, and the common class “b2” of the personal ontology OB. An instance “n” exists in the instance set G6, and an instance “n” exists in the common class “b2” of the template ontology OH. As a result, the number of members of the common class “b2” of the template ontology OH is 1, the number of members of the product set of the instance set G6 of the personal ontology OA and OB is 1, and the degree of approximation between the common classes “b2” is 1/1.

また、パーソナルオントロジOA、OB間の共通クラス“c2”において、パーソナルオントロジOAの共通クラス“c2”におけるインスタンス集合G7には、インスタンス“a”、“c”、“b”および“d”が存在し、パーソナルオントロジOBの共通クラス“c3”におけるインスタンス集合G7には、インスタンス“a”、“c”、“e”および“f”が存在し、雛形オントロジOHの共通クラス“c3”にはインスタンス“a”、“e”、“c”、“f”、“b”、“d”および“g”が存在している。   In the common class “c2” between the personal ontology OA and OB, the instance set G7 in the common class “c2” of the personal ontology OA includes instances “a”, “c”, “b”, and “d”. In the instance set G7 in the common class “c3” of the personal ontology OB, instances “a”, “c”, “e”, and “f” exist, and in the common class “c3” of the template ontology OH “A”, “e”, “c”, “f”, “b”, “d”, and “g” exist.

この結果、雛形オントロジOHの共通クラス“c3”のインスタンスのメンバ数は7、パーソナルオントロジOA、OBのインスタンス集合G7の積集合のメンバ数は2となり、“c3”という共通クラス間の近似度は2/7となる。
従って、パーソナルオントロジOA、OBのクラス間の近似度Sは1/1+2/7となる。
As a result, the number of members of the common class “c3” of the template ontology OH is 7, the number of members of the product set of the instance set G7 of the personal ontologies OA and OB is 2, and the degree of approximation between the common classes “c3” is 2/7.
Therefore, the degree of approximation S C between personal ontology OA, the OB class is 1/1 + 2/7.

なお、パーソナルオントロジOA、OBの共通クラス間の近似度の計算でも、雛形オントロジOHから割り振られたインスタンスIDがパーソナルオントロジOA、OB間に存在するかということだけを確認すればよい。このため、パーソナルオントロジOA、OBのクラス間の近似度を計算するために、インスタンスの名前の一致性などによるインスタンスの対応関係を予め確認する必要がなくなり、計算量を減らすことができる。   Note that even in the calculation of the degree of approximation between the common classes of the personal ontology OA and OB, it is only necessary to confirm whether the instance ID allocated from the template ontology OH exists between the personal ontology OA and OB. For this reason, in order to calculate the degree of approximation between the classes of the personal ontology OA and OB, it is not necessary to confirm in advance the correspondence between instances based on the consistency of the names of instances, and the amount of calculation can be reduced.

そして、パーソナルオントロジOA、OBにおけるトポロジの近似度Sおよびクラス間の近似度Sが求まると、トポロジとクラスに対する重要度に応じた評価関数f(X)を用いることにより、以下の式にてパーソナルオントロジOA、OB間の近似度S(AB)を与えることができる。
(AB)=S+f(S
これにより、雛形オントロジOHの持つクラス特性を継承させつつパーソナルオントロジOA、OBを構築することが可能となるとともに、インスタンス集合間の共起度をパーソナルオントロジOA、OB間の近似度の計測に直接用いることができ、計算量を抑制しつつ、個人の嗜好に適合したパーソナルオントロジOA、OBを適正に抽出することが可能となるとともに、パーソナルオントロジOA、OBが雛形オントロジOHの持つドメインの知識を保有しているかの相対的な尺度として利用することができ、そのドメインに対する知識を多く持つユーザを有効的に絞り込むことができる。
Then, the personal ontology OA, the similarity S C between the degree of approximation S T and class topology in OB is determined, by using an evaluation function f (X) corresponding to the importance for the topology and class, the following expression The degree of approximation S O (AB) between the personal ontology OA and OB can be given.
S O (AB) = S T + f (S C )
This makes it possible to construct personal ontology OA and OB while inheriting the class characteristics possessed by the template ontology OH, and directly measure the co-occurrence between instance sets to the degree of approximation between the personal ontology OA and OB. It is possible to appropriately extract personal ontology OA and OB adapted to individual tastes while suppressing the amount of calculation, and the domain ontology OH possesses knowledge of the domain possessed by the template ontology OH. It can be used as a relative measure of possession, and users who have a lot of knowledge about the domain can be effectively narrowed down.

また、パーソナルオントロジOA、OBにおけるトポロジの近似度Sを計測する場合、雛形オントロジのクラス集合のメンバ数を基準として、パーソナルオントロジOA、OB間のトポロジの近似度を計測することにより、パーソナルオントロジOA、OBのクラス集合のメンバ数が増大した場合においても、パーソナルオントロジOA、OB間のトポロジの近似度が小さくなることを防止することができ、クラスが豊富にあるという意味で知識量の多いパーソナルオントロジOA、OBとの近似度を大きくすることができる。
なお、図3の例では、ユーザの興味度を考慮することなく、パーソナルオントロジOA、OB間の近似度を計測する方法について説明したが、クラスまたはインスタンスに対する興味度を導入し、ユーザの興味度を考慮しながらパーソナルオントロジOA、OB間の近似度を計測することもできる。
The personal ontology OA, when measuring the degree of approximation S T topology in OB, based on the number of members of the class set stationery ontology, personal ontology OA, by measuring the degree of approximation topology between OB, personal ontology Even when the number of members of the class set of OA and OB increases, the degree of topology approximation between the personal ontology OA and OB can be prevented from decreasing, and the amount of knowledge is large in the sense that there are abundant classes. The degree of approximation with the personal ontology OA, OB can be increased.
In the example of FIG. 3, the method for measuring the degree of approximation between the personal ontology OA and OB without considering the user's interest level has been described. The degree of approximation between the personal ontology OA and OB can also be measured in consideration of the above.

ここで、クラスまたはインスタンスに対する興味度は、例えば、以下のように定義することができる。
(1)1エントリ当たりのユーザの興味度を1とする。
(2)あるエントリEに出現するユーザのクラスおよびインスタンスの種類をN(E)個とすると、そのエントリEにおけるユーザの各クラスおよびインスタンスの興味度は1/N(E)である。
(3)オントロジ内の各インスタンスIに対する興味度は、ユーザの全蓄積エントリ集合をEとすると、以下の式で与えられる。
Here, the degree of interest in a class or instance can be defined as follows, for example.
(1) The degree of interest of the user per entry is 1.
(2) If the types of user classes and instances appearing in an entry E i are N (E i ), the degree of interest of each class and instance of the user in the entry E i is 1 / N (E i ). is there.
(3) The degree of interest for each instance I i in the ontology is given by the following equation, where E is the total accumulated entry set of the user.

Figure 2008027143
Figure 2008027143

(4)オントロジ内の各クラスCに対する興味度は、ユーザの全蓄積エントリ集合をEとすると、以下の式で与えられる。 (4) The degree of interest for each class C i in the ontology is given by the following equation, where E is the total accumulated entry set of the user.

Figure 2008027143
Figure 2008027143

(5)インスタンスの興味度は、そのインスタンスが所属するクラスの興味度に引き継がれ、子クラスの興味度は、親クラスの興味度に引き継がれる。
図4は、本発明の一実施形態に係るクラスおよびインスタンスの興味度の一例を示す図である。
図4において、ユーザAの全蓄積エントリには、エントリE、Eが含まれているものとする。そして、ユーザAの興味オントロジOAには、“オルタナティブ”というクラスが存在し、“オルタナティブ”というクラスには、“Madchester”および“Shoegaze”という子クラスが存在しているものとする。また、オルタナティブ”というクラスには、“nirvana”というインスタンスが存在し、“Madchester”というクラスには、“New Order”および“Stone Roses”というインスタンスが存在し、“Shoegaze”というクラスには、“My Bloody Valentine”および“Ride”というインスタンスが存在しているものとする。
(5) The interest level of the instance is inherited by the interest level of the class to which the instance belongs, and the interest level of the child class is inherited by the interest level of the parent class.
FIG. 4 is a diagram illustrating an example of the degree of interest of classes and instances according to an embodiment of the present invention.
In FIG. 4, it is assumed that entries E 1 and E 2 are included in all the stored entries of user A. In the interest ontology OA of the user A, a class called “alternative” exists, and a class called “alternative” has child classes called “Madchester” and “Shoegaze”. The class “alternative” has an instance “nirvana”, the class “Madchester” has instances “New Order” and “Stone Roses”, and the class “Shoegaze” has “ Assume that instances of “My Bloody Valentine” and “Ride” exist.

そして、エントリEでは、“Stone Roses”、“My Bloody Valentine”、“nirvana”および“New Order”という4アーチストが出現し、エントリEでは、“My Bloody Valentine”という1アーチストが再度出現する上に、“Shoegaze”という1ジャンルと、“Ride”という1アーチストが出現している。 In entry E 1 , four artists “Stone Roses”, “My Bloody Valentine”, “nirvana”, and “New Order” appear, and in entry E 2 , one artist “My Bloody Valentine” appears again. Above, one genre “Shoegaze” and one artist “Ride” appear.

このため、“New Order”というインスタンスの興味度は1/4、“Stone Roses”というインスタンスの興味度は1/4、“My Bloody Valentine”というインスタンスの興味度は1/4+1/3=7/12、“Ride”というインスタンスの興味度は1/3、“nirvana”というインスタンスの興味度は1/4となる。   Therefore, the interest level of the instance “New Order” is 1/4, the interest level of the instance “Stone Roses” is 1/4, and the interest level of the instance “My Bloody Valentine” is 1/4 + 1/3 = 7 / 12. The interest level of the instance “Ride” is 1/3, and the interest level of the instance “nirvana” is 1/4.

また、“Madchester”というクラスの興味度は、そのクラスの配下の“New Order”および“Stone Roses”というインスタンスの興味度を足し合わせることで求めることができ、1/4+1/4=1/2となる。また、“Shoegaze”というクラスの興味度は、そのクラスの配下の“My Bloody Valentine”および“Ride”というインスタンスの興味度を足し合わせることで求めることができ、7/12+1/3=5/4となる。さらに、“オルタナティブ”というクラスの興味度は、そのクラスの配下の“nirvana”というインスタンス、“Madchester”および“Shoegaze”というクラスの興味度を足し合わせることで求めることができ、1/2+5/4+1/4=2となる。   The interest level of the class “Madchester” can be obtained by adding the interest levels of the instances “New Order” and “Stone Roses” under the class, and 1/4 + 1/4 = 1/2. It becomes. Further, the interest level of the class “Shoegaze” can be obtained by adding the interest levels of the instances “My Bloody Valentine” and “Ride” under the class, and 7/12 + 1/3 = 5/4 It becomes. Furthermore, the interest level of the class “alternative” can be obtained by adding the interest levels of the instances “nirvana”, “Madchester”, and “Shoegaze” under the class, 1/2 + 5/4 + 1 / 4 = 2.

これにより、“My Bloody Valentine”というにアーチストついては、2つのエントリE、Eに書き込みがなされているため、ユーザAの興味が強いということを認識することができる。また、“Shoegaze”というにジャンルついては、そのクラス名もエントリEに出現する上に、その配下のアーチストをエントリE、Eにおいて頻繁に語っているため、興味度を大きくすることができ、単純に配下にアーチストを多く持っていても、興味としては均等に扱われることを防止することができる。 As a result, it is possible to recognize that the user A's interest is strong because the artist “My Bloody Valentine” has been written in the two entries E 1 and E 2 . In addition, regarding the genre of “Shoegaze”, the class name also appears in entry E 2 and the subordinate artists are frequently spoken in entries E 1 and E 2 , so the degree of interest can be increased. Even if there are many artists under their control, it can be prevented that they are treated equally as interests.

図5は、本発明の一実施形態に係る興味度を考慮したパーソナルオントロジ間の近似度計測方法を示す図である。
図5において、ユーザAの興味オントロジOAの“a1というクラスの直下には、“b1”および“b2”というクラスが存在し、“b2”というクラスの直下には、“c3”および“c4”というクラスが存在しているものとする。また、“b1”というクラスには、“m”および“k”というインスタンスが存在し、“b2”というクラスには、“n”というインスタンスが存在し、“c3”というクラスには、“a”、“b”および“c”というインスタンスが存在し、“c4”というクラスには、“g”および“h”というインスタンスが存在しているものとする。
FIG. 5 is a diagram illustrating a method for measuring the degree of approximation between personal ontology considering the degree of interest according to an embodiment of the present invention.
In FIG. 5, there are “b1” and “b2” classes immediately below the “a1” class of the user A's interest ontology OA, and “c3” and “c4” immediately below the “b2” class. The class “b1” has instances “m” and “k”, and the class “b2” has an instance “n”. The class “c3” has instances “a”, “b”, and “c”, and the class “c4” has instances “g” and “h”. To do.

そして、オントロジOAにおいて、“c3”というクラスの興味度は1、“a”というインスタンスの興味度は2、“b”というインスタンスの興味度は5、“c”というインスタンスの興味度は4であるとすると、“c3”というクラスの配下の興味度は1+2+5+4=12となる。
また、オントロジOAにおいて、“c4”というクラスの興味度は0、“g”というインスタンスの興味度は2、“h”というインスタンスの興味度は1であるとすると、“c4”というクラスの配下の興味度は0+2+1=3となる。
In the ontology OA, the interest degree of the class “c3” is 1, the interest degree of the instance “a” is 2, the interest degree of the instance “b” is 5, and the interest degree of the instance “c” is 4. If there is, the degree of interest under the class “c3” is 1 + 2 + 5 + 4 = 12.
Also, in the ontology OA, if the interest level of the class “c4” is 0, the interest level of the instance “g” is 2, and the interest level of the instance “h” is 1, the subordinate of the class “c4” The degree of interest is 0 + 2 + 1 = 3.

また、オントロジOAにおいて、“b2”というクラスの興味度は1、“n”というインスタンスの興味度は2であるとすると、“b2”というクラスの配下の興味度は12+3+1+2=18となる。
また、オントロジOAにおいて、“b1”というクラスの興味度は0、“m”というインスタンスの興味度は3、“k”というインスタンスの興味度は2であるとすると、“b1”というクラスの配下の興味度は0+3+2=5となる。
In the ontology OA, if the interest level of the class “b2” is 1, and the interest degree of the instance “n” is 2, the interest degree under the class “b2” is 12 + 3 + 1 + 2 = 18.
Also, in the ontology OA, if the interest level of the class “b1” is 0, the interest degree of the instance “m” is 3, and the interest degree of the instance “k” is 2, the subordinate of the class “b1” The degree of interest is 0 + 3 + 2 = 5.

また、オントロジOAにおいて、“a1”というクラスの興味度は0であるとすると、“a1”というクラスの配下の興味度は5+18=23となる。
また、ユーザBの興味オントロジOBの“a1というクラスの直下には、“b1”、“b2”および“b3”というクラスが存在し、“b1”というクラスの直下には、“c1”というクラスが存在し“b2”というクラスの直下には、“c3”および“c4”というクラスが存在しているものとする。また、“c1”というクラスには、“l”というインスタンスが存在し、“b2”というクラスには、“n”というインスタンスが存在し、“b3”というクラスには、“d”というインスタンスが存在し、“c3”というクラスには、“a”、“c”および“e”というインスタンスが存在し、“c4”というクラスには、“p”および“i”というインスタンスが存在しているものとする。
In the ontology OA, if the interest level of the class “a1” is 0, the interest level under the class “a1” is 5 + 18 = 23.
In addition, classes “b1”, “b2”, and “b3” exist immediately below the class “a1” of the user B's interest ontology OB, and a class “c1” exists immediately below the class “b1”. And a class “c3” and a class “c4” exist immediately under the class “b2”, and an instance “l” exists in the class “c1”. The class “b2” has an instance “n”, the class “b3” has an instance “d”, the class “c3” has “a”, “c”, and It is assumed that an instance “e” exists, and a class “c4” includes instances “p” and “i”.

そして、オントロジOBにおいて、“c3”というクラスの興味度は0、“a”というインスタンスの興味度は3、“c”というインスタンスの興味度は3、“e”というインスタンスの興味度は3であるとすると、“c3”というクラスの配下の興味度は3+3+3=9となる。
また、オントロジOBにおいて、“c4”というクラスの興味度は1、“p”というインスタンスの興味度は3、“i”というインスタンスの興味度は2であるとすると、“c4”というクラスの配下の興味度は1+3+2=6となる。
In the ontology OB, the interest degree of the class “c3” is 0, the interest degree of the instance “a” is 3, the interest degree of the instance “c” is 3, and the interest degree of the instance “e” is 3. If there is, the degree of interest under the class “c3” is 3 + 3 + 3 = 9.
Also, in the ontology OB, if the interest level of the class “c4” is 1, the interest degree of the instance “p” is 3, and the interest degree of the instance “i” is 2, the subordinate of the class “c4” Is 1 + 3 + 2 = 6.

また、オントロジOBにおいて、“b3”というクラスの興味度は0、“d”というインスタンスの興味度は2であるとすると、“b3”というクラスの配下の興味度は0+2=2となる。
また、オントロジOBにおいて、“b2”というクラスの興味度は0、“n”というインスタンスの興味度は6であるとすると、“b2”というクラスの配下の興味度は6+9+6=21となる。
また、オントロジOBにおいて、“b1”というクラスの興味度は0であるとすると、“b1”というクラスの配下の興味度は0+3=3となる。
また、オントロジOBにおいて、“a1”というクラスの興味度は0であるとすると、“a1”というクラスの配下の興味度は3+21+2=26となる。
In the ontology OB, if the interest level of the class “b3” is 0 and the interest degree of the instance “d” is 2, the interest degree under the class “b3” is 0 + 2 = 2.
Further, in the ontology OB, if the interest level of the class “b2” is 0 and the interest degree of the instance “n” is 6, the subordinate interest level of the class “b2” is 6 + 9 + 6 = 21.
In the ontology OB, if the degree of interest of the class “b1” is 0, the degree of interest under the class “b1” is 0 + 3 = 3.
In the ontology OB, if the degree of interest of the class “a1” is 0, the degree of interest under the class “a1” is 3 + 21 + 2 = 26.

ここで、オントロジ間の興味一致度の計算に用いる用語を以下のように定義する。親クラスおよび子クラスからなるトポロジをT、クラスとインスタンスからなるトポロジをTとする。さらに、興味オントロジOA、OBの共通クラスをCと定義し、共通インスタンスをI∈Iと定義する。特に、トポロジTに所属するクラス集合をC(T)、トポロジTに所属するクラス集合をC(T)とする。また、共通クラスCに対する興味一致度をI(C)とし、共通インスタンスIに対する興味一致度をI(I)とし、共通クラスCの配下の興味一致度をI(C)とする。 Here, the terms used for calculating the degree of interest matching between ontology are defined as follows. Let T 1 be the topology consisting of the parent class and child class, and T 2 be the topology consisting of the class and instance. Further, a common class of interest ontology OA and OB is defined as C i, and a common instance is defined as I i ∈I. In particular, a class set belonging to topology T 1 is C (T 1 ), and a class set belonging to topology T 2 is C (T 2 ). Further, the interest coincidence for the common class C i is I (C i ), the interest coincidence for the common instance I i is I (I i ), and the interest coincidence under the common class C i is I t (C i). ).

(1)そして、興味オントロジOA、OBの共通クラスCを分析し、両トポロジT、Tを形成する共通クラスCが存在することに注意しながら、トポロジTを形成する共通クラスCとトポロジTを形成する共通クラスCとを抽出する。例えば、図5の例では、共通クラスa1、b1、b2はトポロジTを形成し、共通クラスb2、c3、c4はトポロジTを形成することができる。 (1) Then, the common class C i of the interest ontology OA, OB is analyzed, and the common class C i forming both topologies T 1 and T 2 exists, and the common class forming the topology T 1 is noted. C i and common class C i forming topology T 2 are extracted. For example, in the example of FIG. 5, the common class a1, b1, b2 forms a topology T 1, the common class b2, c3, c4 can form a topology T 2.

(2)共通クラスCが興味オントロジOA、OB間で共通インスタンスIを持つとすると、共通インスタンスIに対する興味一致度をI(I)は、興味オントロジOA、OBのインスタンスに対する興味度のうち小さい方とすることができる。例えば、図5の例では、共通クラスc3の配下の共通インスタンスaに対する興味一致度は2、共通クラスc3の配下の共通インスタンスcに対する興味一致度は3となる。 (2) common classes C i interested ontology OA, when to have a common instance I i between OB, the interest degree of coincidence with respect to a common instance I i I (I i) is interest degree of interest ontology OA, OB instance of Can be the smaller of the two. For example, in the example of FIG. 5, the interest coincidence with respect to the common instance a under the common class c3 is 2, and the interest coincidence with respect to the common instance c under the common class c3 is 3.

(3)興味オントロジOA、OBにおける共通クラスCに対する興味一致度I(C)は、興味オントロジOA、OBのクラスに対する興味度のうち小さい方とすることができる。例えば、図5の例では、共通クラスc3に対する興味一致度は0、共通クラスc4に対する興味一致度は1となる。
(4)共通クラスC∈C(T)の配下の興味一致度I(C)は、興味オントロジOA、OBにおけるクラスCの配下の子クラスの積集合をN(C)、和集合をU(C)とすると、以下の式で与えることができる。
(3) The interest coincidence I (C i ) for the common class C i in the interest ontologies OA and OB can be the smaller of the interest degrees for the classes of the interest ontologies OA and OB. For example, in the example of FIG. 5, the interest coincidence for the common class c3 is 0, and the interest coincidence for the common class c4 is 1.
(4) The interest coincidence I t (C i ) under the common class C i εC (T 1 ) is the product set of child classes under the class C i in the interest ontology OA and OB as N (C i ). When the union is U (C i ), it can be given by the following equation.

Figure 2008027143
Figure 2008027143

例えば、図5の例では、共通クラスb2の配下の興味一致度I(C)は、(9+3)/2=6となる。
そして、以下の式で示すように、トポロジTを形成する全ての共通クラスCについての興味一致度I(C)を足し合わせた値を、トポロジTを形成する共通クラス集合に対する興味一致度S(T)とすることができる。
For example, in the example of FIG. 5, the interest coincidence I t (C i ) under the common class b2 is (9 + 3) / 2 = 6.
Then, as shown by the following equation, all common classes C i value obtained by adding an interest matching score I t (C i) for forming a topology T 1, to a common class set forming a topology T 1 The degree of interest coincidence S (T 1 ) can be used.

Figure 2008027143
Figure 2008027143

(5)一方、共通クラスC∈C(T)の配下の興味一致度I(C)は、興味オントロジOAにおけるクラスCの配下のインスタンス集合をI(C)、興味オントロジOBにおけるクラスCの配下のインスタンス集合をI(C)とすると、以下の式で与えることができる。 (5) On the other hand, the interest coincidence I t (C i ) under the common class C i ∈ C (T 2 ) is defined as an instance set under the class C i in the interest ontology OA as I A (C i ), If the instance set under the class C i in the ontology OB is I B (C i ), it can be given by the following equation.

Figure 2008027143
Figure 2008027143

例えば、図5の例では、共通クラスc3の配下の興味一致度I(C)は、(2+0+3+0)/4=5/4となる。
そして、以下の式で示すように、トポロジTを形成する全ての共通クラスCについての興味一致度I(C)を足し合わせた値を、トポロジTを形成する共通クラス集合に対する興味一致度S(T)とすることができる。
For example, in the example of FIG. 5, the interest coincidence degree I t (C i ) under the common class c3 is (2 + 0 + 3 + 0) / 4 = 5/4.
Then, as shown by the following equation, all common classes C i value obtained by adding an interest matching score I t (C i) for forming a topology T 2, to a common class set forming a topology T 2 The degree of interest coincidence S (T 2 ) can be used.

Figure 2008027143
Figure 2008027143

(6)そして、トポロジT、Tに対する重要度に応じた評価関数をf(X)とすると、興味度を考慮した興味オントロジOA、OB間の近似度はS(AB)=S(T)+f(S(T))で与えることができる。
そして、図1の近似度計測手段5eは、パーソナルオントロジ抽出手段5cにて抽出されたパーソナルオントロジのトポロジだけでなく、ユーザの興味度を考慮しながら、パーソナルオントロジ間の近似度を計測することにより、個人の興味の強さを考慮しながら単なる文字列ではなく概念間の一致性に基づいて、自分の嗜好に適合した情報を精度よく検索することが可能となる。
(6) If the evaluation function corresponding to the importance for the topologies T 1 and T 2 is f (X), the degree of approximation between the interest ontology OA and OB considering the degree of interest is S O (AB) = S ( T 1 ) + f (S (T 2 )).
Then, the degree-of-approximation measuring means 5e in FIG. 1 measures the degree of approximation between personal ontology while considering not only the topology of the personal ontology extracted by the personal ontology extracting means 5c but also the degree of interest of the user. Thus, it is possible to accurately search for information suitable for one's preference based on consistency between concepts, not just a character string, taking into account the strength of personal interest.

図6は、本発明の一実施形態に係る興味オントロジの近似性を利用したコミュニティ形成方法を示す図である。
図6において、各ユーザA、BのブログエントリPA、PBを雛形オントロジに対してそれぞれ分類することにより、各ユーザA、Bの興味オントロジKA、KBがそれぞれ生成されたものとする(ステップS11)。そして、各ユーザA、Bの興味オントロジKA、KB間の近似度を計測し(ステップS12)、近似度の高い興味オントロジKA、KB間で共起するクラスやインスタンスを分析することで、トポロジが異なるにも関わらず興味を持つ可能性が高い情報を他のユーザのエントリを介して意外な情報としてユーザに推奨することができる(ステップS13)。
FIG. 6 is a diagram illustrating a community formation method using the approximation of interest ontology according to an embodiment of the present invention.
In FIG. 6, it is assumed that the blog entries PA and PB of the users A and B are classified with respect to the template ontology, thereby generating the interest ontologies KA and KB of the users A and B, respectively (step S11). . Then, the degree of approximation between the interest ontologies KA and KB of the users A and B is measured (step S12), and the topologies are analyzed by analyzing classes and instances that co-occur between the interest ontologies KA and KB having a high degree of approximation. Although it is different, information that is highly likely to be of interest can be recommended to the user as unexpected information through the entry of another user (step S13).

例えば、各ユーザA、Bの興味オントロジKA、KB間の近似度を計測することにより、“Madchester”などのクラスや“Happy Mondays”などのインスタンスに興味を持つユーザは、“Glasgow”というクラスや“Teenage Fanclub”というインスタンスにも興味を持つ可能性が高いことが判る。
また、このような興味オントロジKA、KBをブログに適用することで、単純なキーワード検索ではなく、興味オントロジKA、KB間の近似度に基づく意外なエントリ推薦によるコミュニティの形成を支援することができ、ユーザの興味を自然に広げることができる(ステップS14)。
For example, by measuring the degree of approximation between the interest ontologies KA and KB of each user A and B, a user who is interested in a class such as “Madchester” or an instance such as “Happy Mondays” can have a class “Glasgow” It can be seen that there is a high possibility of being interested in an instance of “Teenage Fanclub”.
Moreover, by applying such interest ontologies KA and KB to a blog, it is possible to support the formation of a community based on an unexpected entry recommendation based on the degree of approximation between the interest ontologies KA and KB rather than a simple keyword search. The user's interest can be naturally expanded (step S14).

本発明は、パーソナルオントロジを簡易に作成して自分の興味にマッチングする情報を速やかに入手することができ、情報通信システムが持つ情報源から自分の興味にマッチングする情報を自動的かつ効率的に活用することができる。   The present invention makes it possible to easily create a personal ontology and quickly obtain information that matches one's interest, and automatically and efficiently information that matches one's interest from an information source of an information communication system. Can be used.

本発明の一実施形態に係るオントロジの近似度計測装置が適用されるシステムの概略構成を示すブロック図である。1 is a block diagram showing a schematic configuration of a system to which an ontology approximation measuring device according to an embodiment of the present invention is applied. 本発明の一実施形態に係るパーソナルオントロジの生成方法を示す図である。It is a figure which shows the production | generation method of the personal ontology based on one Embodiment of this invention. 本発明の一実施形態に係るパーソナルオントロジ間の近似度計測方法を示す図である。It is a figure which shows the approximation measuring method between personal ontology concerning one Embodiment of this invention. 本発明の一実施形態に係るクラスおよびインスタンスの興味度の一例を示す図である。It is a figure which shows an example of the interest degree of the class and instance which concern on one Embodiment of this invention. 本発明の一実施形態に係る興味度を考慮したパーソナルオントロジ間の近似度計測方法を示す図である。It is a figure which shows the approximation measuring method between personal ontology which considered the degree of interest based on one Embodiment of this invention. 本発明の一実施形態に係る興味オントロジの近似性を利用したコミュニティ形成方法を示す図である。It is a figure which shows the community formation method using the approximation of the interest ontology which concerns on one Embodiment of this invention. 従来の完全に分散された環境下で構築されたオントロジの構成例を示す図である。It is a figure which shows the structural example of the ontology constructed | assembled in the conventional completely distributed environment. 図7のクラス間における総当り方式による近似度計測方法の一例を示す図である。It is a figure which shows an example of the approximation measuring method by the brute force method between the classes of FIG. 図7のクラス間における総当り方式による近似度計測方法の一例を示す図である。It is a figure which shows an example of the approximation measuring method by the brute force method between the classes of FIG. 図7のクラス間におけるマッピング結果の一例を示す図である。It is a figure which shows an example of the mapping result between the classes of FIG. 図7のオントロジ間における近似度計測結果の一例を示す図である。It is a figure which shows an example of the approximation degree measurement result between the ontology of FIG. 従来の複数のオントロジに対する近似度計測結果の比較例を示す図である。It is a figure which shows the comparative example of the approximation degree measurement result with respect to the conventional some ontology.

符号の説明Explanation of symbols

1 通信網
2〜4 端末
5 サーバ
5a 頻出単語抽出手段
5b 分類子適用手段
5c パーソナルオントロジ抽出手段
5d 興味度計測手段
5e 近似度計測手段
6 雛形オントロジ
7〜9 ブログサイト
7a〜7n、8a〜8n、9a〜9n ブログエントリ
DESCRIPTION OF SYMBOLS 1 Communication network 2-4 Terminal 5 Server 5a Frequent word extraction means 5b Classifier application means 5c Personal ontology extraction means 5d Interest measurement means 5e Approximation degree measurement means 6 Model ontology 7-9 Blog site 7a-7n, 8a-8n, 9a-9n Blog entry

Claims (4)

オントロジを構成するクラスまたはインスタンスが、個人の興味が反映されたエントリに含まれる割合に基づいて、前記クラスまたはインスタンスに対する興味度を計測する興味度計測手段と、
前記興味度計測手段にて計測された興味度に基づいて、前記オントロジ間の近似度を計測する近似度計測手段とを備えることを特徴とするオントロジの近似度計測装置。
An interest degree measuring means for measuring an interest degree for the class or instance based on a ratio of the class or instance constituting the ontology included in the entry reflecting the interest of the individual;
An ontology approximation degree measuring apparatus comprising: an approximation degree measuring means for measuring an approximation degree between the ontology based on the interest degree measured by the interest degree measuring means.
各個人ごとに構築された興味情報に含まれる単語を抽出する単語抽出手段と、
興味情報が概念階層化された雛形オントロジから前記単語を含むクラスまたはインスタンスを抽出する分類子適用手段と、
前記抽出されたクラスまたはインスタンスおよびそれらの上位のクラスをパーソナルオントロジとして前記雛形オントロジから抽出するパーソナルオントロジ抽出手段と、
個人の興味が反映されたエントリに前記クラスまたはインスタンスが含まれる割合に基づいて、前記クラスまたはインスタンスに対する興味度を計測する興味度計測手段と、
前記興味度計測手段にて計測された興味度に基づいて、前記パーソナルオントロジ間の近似度を計測する近似度計測手段とを備えることを特徴とするオントロジの近似度計測装置。
A word extraction means for extracting words included in the interest information constructed for each individual;
Classifier application means for extracting a class or instance containing the word from a template ontology in which interest information is conceptually hierarchized;
Personal ontology extraction means for extracting the extracted class or instance and the higher class thereof from the template ontology as a personal ontology;
An interest degree measuring means for measuring an interest degree of the class or instance based on a ratio of the class or instance being included in an entry reflecting an individual's interest;
An ontology approximation degree measuring apparatus comprising: an approximation degree measuring means for measuring an approximation degree between the personal ontology based on the interest degree measured by the interest degree measuring means.
各個人ごとに構築された興味情報に含まれる単語を抽出するステップと、
興味情報が概念階層化された雛形オントロジから前記単語を含むクラスまたはインスタンスを抽出するステップと、
前記抽出されたクラスまたはインスタンスおよびそれらの上位のクラスをパーソナルオントロジとして前記雛形オントロジから抽出するステップと、
個人の興味が反映されたエントリに前記クラスまたはインスタンスが含まれる割合に基づいて、前記クラスまたはインスタンスに対する興味度を計測するステップと、
前記計測された興味度に基づいて、前記パーソナルオントロジ間の近似度を計測するステップとを備えることを特徴とするオントロジの近似度計測方法。
Extracting words included in the interest information constructed for each individual;
Extracting a class or instance containing the word from a template ontology in which interest information is conceptually hierarchized;
Extracting the extracted classes or instances and their superior classes from the template ontology as personal ontology;
Measuring the degree of interest in the class or instance based on the percentage of the class or instance in an entry reflecting an individual's interest;
And a step of measuring the degree of approximation between the personal ontology based on the measured degree of interest.
各個人ごとに構築された興味情報に含まれる単語を抽出するステップと、
興味情報が概念階層化された雛形オントロジから前記単語を含むクラスまたはインスタンスを抽出するステップと、
前記抽出されたクラスまたはインスタンスおよびそれらの上位のクラスをパーソナルオントロジとして前記雛形オントロジから抽出するステップと、
個人の興味が反映されたエントリに前記クラスまたはインスタンスが含まれる割合に基づいて、前記クラスまたはインスタンスに対する興味度を計測するステップと、
前記計測された興味度に基づいて、前記パーソナルオントロジ間の近似度を計測するステップとをコンピュータに実行させることを特徴とするオントロジの近似度計測プログラム。
Extracting words included in the interest information constructed for each individual;
Extracting a class or instance including the word from a template ontology in which interest information is conceptually hierarchized;
Extracting the extracted classes or instances and their superior classes from the template ontology as a personal ontology;
Measuring the degree of interest in the class or instance based on the percentage of the class or instance included in an entry reflecting an individual's interest;
An ontology approximation degree measurement program that causes a computer to execute the step of measuring the degree of approximation between the personal ontology based on the measured degree of interest.
JP2006198414A 2006-07-20 2006-07-20 Ontology approximation device, ontology approximation method, and ontology approximation program Active JP4607831B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006198414A JP4607831B2 (en) 2006-07-20 2006-07-20 Ontology approximation device, ontology approximation method, and ontology approximation program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006198414A JP4607831B2 (en) 2006-07-20 2006-07-20 Ontology approximation device, ontology approximation method, and ontology approximation program

Publications (2)

Publication Number Publication Date
JP2008027143A true JP2008027143A (en) 2008-02-07
JP4607831B2 JP4607831B2 (en) 2011-01-05

Family

ID=39117716

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006198414A Active JP4607831B2 (en) 2006-07-20 2006-07-20 Ontology approximation device, ontology approximation method, and ontology approximation program

Country Status (1)

Country Link
JP (1) JP4607831B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010113683A (en) * 2008-11-10 2010-05-20 Nec Corp Device, method and program for recommending information

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002073677A (en) * 2000-09-05 2002-03-12 Zenrin Co Ltd Device for collecting personal preference information on reader and information reading support device using the information collecting device

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002073677A (en) * 2000-09-05 2002-03-12 Zenrin Co Ltd Device for collecting personal preference information on reader and information reading support device using the information collecting device

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010113683A (en) * 2008-11-10 2010-05-20 Nec Corp Device, method and program for recommending information

Also Published As

Publication number Publication date
JP4607831B2 (en) 2011-01-05

Similar Documents

Publication Publication Date Title
Efron et al. Improving retrieval of short texts through document expansion
Åström Changes in the LIS research front: Time‐sliced cocitation analyses of LIS journal articles, 1990–2004
Kagdi et al. Assigning change requests to software developers
TWI493367B (en) Progressive filtering search results
JP4920023B2 (en) Inter-object competition index calculation method and system
JP5229226B2 (en) Information sharing system, information sharing method, and information sharing program
CN102193994B (en) Method for searching Web services according to non-functional requirements of user
Forstall et al. Modeling the scholars: Detecting intertextuality through enhanced word-level n-gram matching
JP2011141666A (en) Device, method and program for recommending interest information
CN103246719B (en) A kind of Network Information Resource Integration method of sing on web
Haak et al. Auditing search query suggestion bias through recursive algorithm interrogation
US11487827B2 (en) Extended query performance prediction framework utilizing passage-level information
Upadhyaya et al. Quality of experience: What end-users say about web services?
JP4728063B2 (en) Interest information generating apparatus, interest information generating method, and interest information generating program
JP4607830B2 (en) Interest information generating apparatus, interest information generating method, and interest information generating program
JP4672578B2 (en) Interest information providing apparatus, interest information providing method, and interest information providing program
JP5734118B2 (en) Method and program for extracting, naming and visualizing small groups from social networks
JP4607831B2 (en) Ontology approximation device, ontology approximation method, and ontology approximation program
Gao et al. Service recommendation from the evolution of composition patterns
JP4580352B2 (en) Ontology approximation device, ontology approximation method, and ontology approximation program
Dighton Arranging a rhetorical feminist methodology: The visualization of anti-gentrification rhetoric on Twitter
JP4745993B2 (en) Consciousness system construction device and consciousness system construction program
JP4580351B2 (en) Interest information generating apparatus, interest information generating method, and interest information generating program
Ryhänen et al. Generic data models for Semantic e-Government interoperability: Literature Review
Carriero et al. Empirical ontology design patterns and shapes from Wikidata

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080213

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20090501

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20090501

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100407

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100420

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100621

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101005

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101007

R150 Certificate of patent or registration of utility model

Ref document number: 4607831

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131015

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350