JP5250463B2 - Semantic association apparatus, processing method thereof, and program - Google Patents

Semantic association apparatus, processing method thereof, and program Download PDF

Info

Publication number
JP5250463B2
JP5250463B2 JP2009070472A JP2009070472A JP5250463B2 JP 5250463 B2 JP5250463 B2 JP 5250463B2 JP 2009070472 A JP2009070472 A JP 2009070472A JP 2009070472 A JP2009070472 A JP 2009070472A JP 5250463 B2 JP5250463 B2 JP 5250463B2
Authority
JP
Japan
Prior art keywords
information
definition
semantic
word
definition information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009070472A
Other languages
Japanese (ja)
Other versions
JP2010224799A (en
Inventor
尋論 黒川
洋一 山田
Original Assignee
エヌ・ティ・ティ・コムウェア株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by エヌ・ティ・ティ・コムウェア株式会社 filed Critical エヌ・ティ・ティ・コムウェア株式会社
Priority to JP2009070472A priority Critical patent/JP5250463B2/en
Publication of JP2010224799A publication Critical patent/JP2010224799A/en
Application granted granted Critical
Publication of JP5250463B2 publication Critical patent/JP5250463B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、データベースを構成する意味判定対象情報と意味的に合致する、指定された比較対象情報を出力する処理を、手作業によるデータ作成作業なしに行うことができる、意味的対応付け装置及びその処理方法とプログラムに関する。   The present invention provides a semantic associating device capable of performing processing for outputting designated comparison target information that is semantically matched with semantic determination target information constituting a database, without manual data creation work, and It relates to the processing method and program.

コンピュータシステム内のデータベースを構成する情報のうち、意味判定対象情報と意味的に合致する情報を出力するような場合、その処理を行う情報処理装置は、意味判定対象情報に意味的に合致する情報が、指定された比較対象情報のどの情報かを判定することが必要となる。この時、情報処理装置は、予めデータベースを構成する各情報の意味を知る必要がある。例えば、情報処理装置は、意味判定対象情報の表す単語と、同一の単語によって表される情報が、指定された比較対象情報に存在しない場合には、それら単語の文字列のマッチングによってでは、指定された比較対象情報から情報を抽出できない。従って、予め意味判定対象情報と指定された比較対象情報のそれぞれの単語が示す意味によって、意味判定対象情報と指定された比較対象情報とをマッチングさせて、意味の一致する情報をデータベースから出力する必要がある。   In the case of outputting information that semantically matches the semantic determination target information among the information constituting the database in the computer system, the information processing apparatus that performs the processing is information that semantically matches the semantic determination target information. It is necessary to determine which information of the specified comparison target information. At this time, the information processing apparatus needs to know the meaning of each piece of information constituting the database in advance. For example, if the information represented by the same word as the word represented by the semantic determination target information does not exist in the specified comparison target information, the information processing apparatus designates the word by matching the character strings of the words. Information cannot be extracted from the compared information. Therefore, the semantic determination target information is matched with the specified comparison target information according to the meanings indicated by the respective words of the semantic determination target information and the specified comparison target information, and information having the same meaning is output from the database. There is a need.

ここで、関連する技術として特許文献1が開示されている。この特許文献1には、変換元電子文書と変換先電子文書との対応関係を抽出し、その結果、変換元電子文書の情報要素を、変換先電子文書の情報要素へ変換するための変換手順データを作成し、その変換手順データを用いて、変換元電子文書の情報要素を、変換先電子文書の情報要素へ変換する技術が開示されている。   Here, Patent Document 1 is disclosed as a related technique. This Patent Document 1 extracts a correspondence relationship between a conversion source electronic document and a conversion destination electronic document, and as a result, a conversion procedure for converting information elements of the conversion source electronic document into information elements of the conversion destination electronic document. A technique for creating data and converting information elements of a conversion-source electronic document into information elements of a conversion-destination electronic document using the conversion procedure data is disclosed.

特開2005−10976号公報JP 2005-10976 A

しかしながら、上述の特許文献1の技術では、変換元電子文書の情報要素を、変換先電子文書の情報要素へと変換するための変換手順データの作成の際に、変換元電子文書の情報要素を示す要素辞書を手作業で作成しなければならず、このための労力を要してしまう。また、上述の特許文献1の技術では、変換元電子文書の情報要素を、変換先電子文書の情報要素へと変換するための変換手順データを作成するにあたり、それら変換元電子文書の情報要素と、変換先電子文書の情報要素の、各要素辞書を比較して、キーワードが一致する、変換元電子文書と、変換先電子文書の対応関係を抽出し、その間の情報要素の変換しかできないような変換手順データを作成している。従って、変換元電子文書の情報要素と、変換先電子文書の情報要素の、各要素辞書のキーワードが一致しない、変換元電子文書と、変換先電子文書との間での情報要素の、自動的な変換はできない可能性が多くなる。つまり、変換元電子文書では顧客、変換先電子文書ではユーザという情報要素を保持しており、これらの情報要素はほぼ同じ意味を持っているが、それらのキーワードが一致しないために、変換元電子文書の情報要素を変換先電子文書の情報要素へ変換することが、手作業なしにはできず、これについても変換作業の労力が増えるという問題がある。   However, in the technique of the above-mentioned Patent Document 1, when creating the conversion procedure data for converting the information element of the conversion source electronic document into the information element of the conversion destination electronic document, the information element of the conversion source electronic document is changed. The element dictionary to be shown must be created manually, and this requires labor. Further, in the technique of the above-described Patent Document 1, when creating conversion procedure data for converting information elements of a conversion source electronic document into information elements of a conversion destination electronic document, Compare the element dictionaries of the information elements of the conversion destination electronic document, extract the correspondence between the conversion source electronic document and the conversion destination electronic document that match the keywords, and only convert the information elements between them Conversion procedure data is created. Accordingly, the information elements between the conversion source electronic document and the conversion destination electronic document are not automatically matched, and the keyword of each element dictionary of the information element of the conversion source electronic document and the conversion destination electronic document does not match. There is a possibility that it cannot be converted easily. In other words, the conversion source electronic document holds information elements called customer and the conversion destination electronic document holds user elements, and these information elements have almost the same meaning, but the keywords do not match. There is a problem that converting the information element of the document into the information element of the conversion-destination electronic document cannot be performed without manual work, and this also increases the labor of the conversion work.

そして、データベースを構成する情報のうち、指定された比較対象情報と意味的に合致する情報を出力する際に、上述の特許文献1の技術のような、手作業によるデータ作成を行う手順を省き、作業者の手間を削減できることが望ましい。   And, when outputting information that semantically matches the specified comparison target information among the information constituting the database, the procedure for manually creating data, such as the technique of Patent Document 1 described above, is omitted. It is desirable that the labor of the operator can be reduced.

そこでこの発明は、データベースを構成する情報のうち、意味判定対象情報と意味的に合致する、指定された比較対象情報を出力する処理を、手作業によるデータ作成作業なしに行うことのできる、意味的対応付け装置及びその処理方法とプログラムを提供することを目的としている。   Therefore, the present invention has a meaning that the process of outputting the specified comparison target information that semantically matches the semantic determination target information among the information constituting the database can be performed without manual data creation work. It is an object of the present invention to provide an automatic association apparatus, a processing method therefor, and a program.

上記目的を達成するために、本発明は、意味判定対象情報の要素を単語で表した第1の要素名と、当該第1の要素名が表す前記単語の意味を定義する第1の定義情報とを少なくとも対応付けて保持した前記意味判定対象情報を情報提供元より受信する意味判定対象情報受信手段と、比較対象としての単語で表される第2の要素名と、その第2の要素名の意味を定義する文章で表された第2の定義情報とを少なくとも対応付けて保持した比較対象情報を一つ又は複数記憶する比較対象情報記憶手段と、前記第2の定義情報で表される前記文章を形態素解析して前記第2の定義情報を表す単語を抽出し、前記第1の定義情報を表す単語と前記第2の定義情報を表す単語の合致率を算出する要素情報合致率算出手段と、前記第1の定義情報を表す単語と前記第2の定義情報を表す単語の合致率が第1の閾値以上かを判定する要素情報合致率判定手段と、前記第1の定義情報を表す単語と前記第2の定義情報を表す単語の合致率が、前記第1の閾値以上である場合に、それら合致率の算出に用いた意味判定対象情報と比較対象情報との組を抽出する抽出手段と、指定された比較対象情報と組で前記抽出された意味判定対象情報を出力する情報出力手段と、を備えることを特徴とする意味的対応付け装置である。 In order to achieve the above object, the present invention provides a first element name that represents an element of meaning determination target information with a word, and first definition information that defines the meaning of the word represented by the first element name. Meaning determination target information receiving means for receiving from the information provider the meaning determination target information stored in association with each other, a second element name represented by a word as a comparison target, and the second element name represented a second definition information represented by text to define the meaning of the compared information storage means for one or more stores comparative information held by at least association, in the second definition information the sentence and morphological analysis to extract a word representing the second definition information, wherein the first element information matching ratio calculation that calculates definition information words representing the a concordance rate of words representing the second definition information single indicating means, said first definition information Words representing the word match rate representing the second definition information and determines element information match rate determination means for determining more than the first threshold value, wherein the words representing the first definition information second definition information When the match rate is equal to or higher than the first threshold, the extracting means for extracting the set of the semantic determination target information and the comparison target information used for calculating the match rate, and the specified comparison target information and the set And an information output means for outputting the extracted meaning determination target information.

また本発明は、意味判定対象情報の要素の属性情報の表す単語の意味を定義する第3の定義情報を保持した前記意味判定対象情報を情報提供元より受信する意味判定対象情報受信手段と、比較対象としての単語の属性情報が表す単語の意味を定義する文章で表された第4の定義情報を保持した比較対象情報を一つ又は複数記憶する比較対象情報記憶手段と、前記第4の定義情報で表される前記文章を形態素解析して前記第4の定義情報を表す単語を抽出し、前記第3の定義情報を表す単語と前記第4の定義情報を表す単語の合致率を算出する属性情報合致率算出手段と、前記第3の定義情報を表す単語と前記第4の定義情報を表す単語の合致率が第2の閾値以上かを判定する属性情報合致率判定手段と、前記第3の定義情報を表す単語と前記第4の定義情報を表す単語の合致率が、前記第2の閾値以上である場合に、それら合致率の算出に用いた意味判定対象情報と比較対象情報とを抽出する抽出手段と、指定された比較対象情報と組で前記抽出された意味判定対象情報を出力する情報出力手段と、を備えることを特徴とする意味的対応付け装置である。 Further, the present invention provides a semantic determination target information receiving means for receiving from the information provider the semantic determination target information that holds the third definition information that defines the meaning of the word represented by the attribute information of the element of the semantic determination target information. Comparison object information storage means for storing one or a plurality of comparison object information holding fourth definition information represented by a sentence that defines the meaning of the word represented by the word attribute information as the comparison object ; A morphological analysis is performed on the sentence represented by the definition information to extract a word representing the fourth definition information, and a match rate between the word representing the third definition information and the word representing the fourth definition information is calculated. Attribute information match rate calculating means, attribute information match rate determining means for determining whether the match rate between the word representing the third definition information and the word representing the fourth definition information is greater than or equal to a second threshold, wherein the word representing the third definition information Word match rate indicating a fourth definition information, when the it is the second threshold or more, an extraction means for extracting a comparison target information and semantic determination target information used for calculation of their match rate, designated An information output unit that outputs the extracted semantic determination target information in combination with comparison target information.

また本発明は、上述の意味的対応付け装置において、前記意味判定対象情報が、前記第1の要素名に対応付けられて前記情報提供元のデータベースに登録されている属性情報と、当該属性情報が表す単語の意味を定義する第3の定義情報とを保持し、前記比較対象情報が、前記第2の要素名に対応付けられてデータベースに登録される属性情報と、当該属性情報が表す単語の意味を定義する文章で表された第4の定義情報とを保持し、前記第4の定義情報で表される文章を形態素解析して前記第4の定義情報を表す単語を抽出し、前記抽出した意味判定対象情報と比較対象情報との組みに基づいて、前記第3の定義情報を表す単語と前記第4の定義情報を表す単語の合致率を算出する属性情報合致率算出手段と、前記第3の定義情報を表す単語と前記第4の定義情報を表す単語の合致率が第2の閾値以上かを判定する属性情報合致率判定手段と、を備え、前記抽出手段は、さらに、前記第3の定義情報を表す単語と前記第4の定義情報を表す単語の合致率が前記第2の閾値以上である場合にのみ、それら合致率の算出に用いた意味判定対象情報と比較対象情報を抽出することを特徴とする。 According to the present invention, in the above semantic association device, the semantic determination target information is attribute information registered in the database of the information provider in association with the first element name, and the attribute information. 3rd definition information that defines the meaning of the word represented by, the comparison target information is attribute information registered in the database in association with the second element name, and the word represented by the attribute information And the fourth definition information represented by a sentence defining the meaning of the word, extracting the word representing the fourth definition information by performing morphological analysis on the sentence represented by the fourth definition information, based on the set of extracted semantic determination target information and the comparison information, and the attribute information match rate calculation means for calculating a matching rate of words representing the third and the fourth definition information words representing the definition information, single representing the third definition information The fourth word match rate indicating the definition information of and an attribute information match rate determination means for determining whether more than a second threshold value, the extraction means further words representing the third definition information And the meaning determination target information and the comparison target information used for calculating the match rate are extracted only when the match rate of the word representing the fourth definition information is equal to or higher than the second threshold value. .

また本発明は、上述の意味的対応付け装置において、前記抽出手段は、前記第1の定義情報を表す単語と前記第2の定義情報を表す単語の合致率が、前記第1の閾値以上となった意味判定対象情報と比較対象情報の組み合わせのうち、最も合致率の高い意味判定対象情報と比較対象情報の組み合わせを抽出することを特徴とする。 Further, the present invention is the above semantic association device, wherein the extraction means has a match rate between the word representing the first definition information and the word representing the second definition information equal to or higher than the first threshold. Among the combinations of semantic determination target information and comparison target information, the combination of semantic determination target information and comparison target information having the highest match rate is extracted.

また本発明は、上述の意味的対応付け装置において、前記抽出手段は、前記第3の定義情報を表す単語と前記第4の定義情報を表す単語の合致率が、前記第2の閾値以上となった意味判定対象情報と比較対象情報の組み合わせのうち、最も合致率の高い意味判定対象情報と比較対象情報の組み合わせを抽出することを特徴とする。 Further, the present invention provides the semantic association apparatus, wherein the extraction unit has a match rate between the word representing the third definition information and the word representing the fourth definition information equal to or greater than the second threshold. Among the combinations of semantic determination target information and comparison target information, the combination of semantic determination target information and comparison target information having the highest match rate is extracted.

また本発明は、上述の意味的対応付け装置において、少なくとも、前記要素名、前記第1の定義情報を表す単語、前記第3の定義情報を表す単語が、前記意味判定対象情報に格納されているかを判定する構成判定手段と、を備えることを特徴とする。
また本発明は、前記抽出手段の抽出した意味判定対象情報と比較対象情報の組み合わせを記憶する対応付け結果記憶手段と、前記意味判定対象情報の要素の属性情報についての実データの変更通知であって、前記意味判定対象情報の要素の属性情報の識別情報が含まれる変更通知を受け付けた場合に、当該変更通知に含まれる識別情報に基づいて前記対応付け結果記憶手段において記録されている意味判定対象情報と組み合わせとなる比較対象情報を特定して、その比較対象情報の属性情報についての実データを、前記変更通知で受け付けた実データへと書き換える評価後処理手段と、を備えることを特徴とする。
According to the present invention, in the above semantic association device, at least the element name, the word representing the first definition information, and the word representing the third definition information are stored in the semantic determination target information. And a configuration determining means for determining whether or not there is.
Further, the present invention is an association result storage means for storing a combination of semantic judgment target information and comparison target information extracted by the extraction means, and an actual data change notification for attribute information of elements of the semantic judgment target information. When the change notification including the identification information of the attribute information of the element of the semantic determination target information is received, the semantic determination recorded in the association result storage unit based on the identification information included in the change notification Characterized by comprising post-evaluation processing means for identifying comparison target information to be combined with target information and rewriting the actual data about the attribute information of the comparison target information to the actual data received in the change notification. To do.

また本発明は、意味的対応付け装置における処理方法であって、前記意味的対応付け装置の意味判定対象情報受信手段が、意味判定対象情報の要素を単語で表した第1の要素名と、当該第1の要素名が表す前記単語の意味を定義する第1の定義情報とを少なくとも対応付けて保持した前記意味判定対象情報を情報提供元より受信し、前記意味的対応付け装置の比較対象情報記憶手段が、比較対象としての単語で表される第2の要素名と、その第2の要素名の意味を定義する文章で表された第2の定義情報とを少なくとも対応付けて保持した比較対象情報を一つ又は複数記憶し、前記意味的対応付け装置の要素情報合致率算出手段が、前記第2の定義情報で表される前記文章を形態素解析して前記第2の定義情報を表す単語を抽出し、前記第1の定義情報を表す単語と前記第2の定義情報を表す単語の合致率を算出し、前記意味的対応付け装置の要素情報合致率判定手段が、前記第1の定義情報を表す単語と前記第2の定義情報を表す単語の合致率が第1の閾値以上かを判定し、前記意味的対応付け装置の抽出手段が、前記第1の定義情報を表す単語と前記第2の定義情報を表す単語の合致率が、前記第1の閾値以上である場合に、それら合致率の算出に用いた意味判定対象情報と比較対象情報との組を抽出し、前記意味的対応付け装置の情報出力手段が、指定された比較対象情報と組で前記抽出された意味判定対象情報を出力することを特徴とする処理方法である。 Further, the present invention is a processing method in the semantic association device, wherein the semantic determination target information receiving means of the semantic correlation device includes a first element name in which elements of the semantic determination target information are represented by words, The semantic determination target information that holds at least the first definition information that defines the meaning of the word represented by the first element name is received from the information provider, and the comparison target of the semantic correlation device The information storage means holds at least the second element name represented by a word as a comparison target and the second definition information represented by a sentence defining the meaning of the second element name in association with each other One or a plurality of pieces of comparison target information are stored, and the element information coincidence rate calculation means of the semantic association device performs morphological analysis on the sentence represented by the second definition information to obtain the second definition information. words representing extracted, the first Calculating a word representing the definition information concordance rate of words representing the second definition information, the semantic mapping element information match rate determination means of the device, said the word second representing the first definition information word word match rate indicating the definition information determines whether or first threshold, extraction means of the semantic mapping device, representing the word with the second definition information representing a first definition information When the match rate is equal to or higher than the first threshold, a set of semantic determination target information and comparison target information used to calculate the match rate is extracted, and the information output unit of the semantic association device The processing method is characterized in that the extracted semantic determination target information is output in combination with specified comparison target information.

また本発明は、意味的対応付け装置における処理方法であって、前記意味的対応付け装置の意味判定対象情報受信手段が、意味判定対象情報の要素の属性情報の表す単語の意味を定義する第3の定義情報を保持した前記意味判定対象情報を情報提供元より受信し、前記意味的対応付け装置の比較対象情報記憶手段が、比較対象としての単語の属性情報が表す単語の意味を定義する文章で表された第4の定義情報を保持した比較対象情報を一つ又は複数記憶し、前記意味的対応付け装置の属性情報合致率算出手段が、前記第4の定義情報で表される前記文章を形態素解析して前記第4の定義情報を表す単語を抽出し、前記第3の定義情報を表す単語と前記第4の定義情報を表す単語の合致率を算出し、前記意味的対応付け装置の属性情報合致率判定手段が、前記第3の定義情報を表す単語と前記第4の定義情報を表す単語の合致率が第2の閾値以上かを判定し、前記意味的対応付け装置の抽出手段が、前記第3の定義情報を表す単語と前記第4の定義情報を表す単語の合致率が、前記第2の閾値以上である場合に、それら合致率の算出に用いた意味判定対象情報と比較対象情報とを抽出し、前記意味的対応付け装置の情報出力手段が、指定された比較対象情報と組で前記抽出された意味判定対象情報を出力することを特徴とする処理方法である。 The present invention is also a processing method in the semantic association device, wherein the semantic determination target information receiving means of the semantic correlation device defines the meaning of the word represented by the attribute information of the element of the semantic determination target information. 3 is received from the information provider, and the comparison target information storage unit of the semantic association device defines the meaning of the word represented by the attribute information of the word as the comparison target. One or a plurality of pieces of comparison target information holding the fourth definition information represented by sentences is stored, and the attribute information match rate calculation means of the semantic association device is represented by the fourth definition information. A morphological analysis is performed on the sentence to extract a word representing the fourth definition information , a matching rate between the word representing the third definition information and the word representing the fourth definition information is calculated, and the semantic association is performed. Device attribute information match rate A constant section, the third definition information representing words and matching rate of words representing the fourth definition information determines whether or second threshold value, the extraction means of the semantic mapping device, wherein the When the match rate between the word representing the definition information 3 and the word representing the fourth definition information is greater than or equal to the second threshold value, the semantic determination target information and the comparison target information used to calculate the match rate , And the information output means of the semantic association device outputs the extracted semantic determination target information in combination with the specified comparison target information.

また本発明は、上述の処理方法において、前記意味判定対象情報が、前記第1の要素名に対応付けられて前記情報提供元のデータベースに登録されている属性情報と、当該属性情報が表す単語の意味を定義する第3の定義情報とを保持し、前記意味的対応付け装置の前記比較対象情報が、前記第2の要素名に対応付けられてデータベースに登録される属性情報と、当該属性情報が表す単語の意味を定義する文章で表された第4の定義情報とを保持し、前記意味的対応付け装置の属性情報合致率算出手段が、前記第4の定義情報で表される文章を形態素解析して前記第4の定義情報を表す単語を抽出し、前記抽出した意味判定対象情報と比較対象情報との組みに基づいて、前記第3の定義情報を表す単語と前記第4の定義情報を表す単語の合致率を算出し、前記意味的対応付け装置の属性情報合致率判定手段が、前記第3の定義情報を表す単語と前記第4の定義情報を表す単語の合致率が第2の閾値以上かを判定し、前記意味的対応付け装置の前記抽出手段は、さらに、前記第3の定義情報を表す単語と前記第4の定義情報を表す単語の合致率が前記第2の閾値以上である場合にのみ、それら合致率の算出に用いた意味判定対象情報と比較対象情報を抽出することを特徴とする。 According to the present invention, in the processing method described above, the semantic determination target information is attribute information registered in the information provider database in association with the first element name, and a word represented by the attribute information. Attribute information registered in the database in association with the second element name and the comparison target information of the semantic association device, and the attribute And the fourth definition information represented by a sentence defining the meaning of the word represented by the information, and the attribute information match rate calculating means of the semantic association device represents the sentence represented by the fourth definition information. Morphological analysis is performed to extract a word representing the fourth definition information, and based on a combination of the extracted meaning determination target information and comparison target information, the word representing the third definition information and the fourth definition information match of the words that describe the definition information Calculates, determines whether the attribute information match rate determination means of the semantic mapping device, the third and the word representing the definition information the fourth word match rate indicating the definition information of the second threshold value or more In addition, the extraction unit of the semantic association device further includes only when the match rate between the word representing the third definition information and the word representing the fourth definition information is equal to or greater than the second threshold. The semantic determination target information and the comparison target information used for calculating the match rate are extracted.

また本発明は、比較対象としての単語で表される第2の要素名と、その第2の要素名の意味を定義する文章で表された第2の定義情報とを少なくとも対応付けて保持した比較対象情報を一つ又は複数記憶する比較対象情報記憶手段を備えた意味的対応付け装置のコンピュータを、意味判定対象情報の要素を単語で表した第1の要素名と、当該第1の要素名が表す前記単語の意味を定義する第1の定義情報とを少なくとも対応付けて保持した前記意味判定対象情報を情報提供元より受信する意味判定対象情報受信手段、前記第2の定義情報で表される前記文章を形態素解析して前記第2の定義情報を表す単語を抽出し、前記第1の定義情報を表す単語と前記第2の定義情報を表す単語の合致率を算出する要素情報合致率算出手段、前記第1の定義情報を表す単語と前記第2の定義情報を表す単語の合致率が第1の閾値以上かを判定する要素情報合致率判定手段、前記第1の定義情報を表す単語と前記第2の定義情報を表す単語の合致率が、前記第1の閾値以上である場合に、それら合致率の算出に用いた意味判定対象情報と比較対象情報との組を抽出する抽出手段、指定された比較対象情報と組で前記抽出された意味判定対象情報を出力する情報出力手段、として機能させることを特徴とするプログラムである。 The present invention also holds at least the second element name represented by a word as a comparison target and the second definition information represented by a sentence defining the meaning of the second element name in association with each other. A computer of a semantic association device having comparison target information storage means for storing one or more comparison target information, a first element name representing elements of semantic determination target information in words, and the first element Meaning determination target information receiving means for receiving from the information provider the meaning determination target information that holds at least the first definition information that defines the meaning of the word represented by the name, and is represented by the second definition information. the sentences and morphological analysis to extract a word representing the second definition information, the first definition information element information matches to calculate the matching rate of words representing the the word second definition information representing Rate calculating means, the first constant Word and the word match rate representing the second definition information determines element information match rate determination means for determining more than the first threshold value representing the information, the second definition information words representing the first definition information Extraction means for extracting a set of semantic determination target information and comparison target information used for calculating the match rate when the match rate of the word representing is equal to or higher than the first threshold, specified comparison target information And a set of information output means for outputting the extracted meaning determination target information.

また本発明は、比較対象としての単語の属性情報が表す単語の意味を定義する文章で表された第4の定義情報を保持した比較対象情報を一つ又は複数記憶する比較対象情報記憶手段を備えた意味的対応付け装置のコンピュータを、意味判定対象情報の要素の属性情報の表す単語の意味を定義する第3の定義情報を保持した前記意味判定対象情報を情報提供元より受信する意味判定対象情報受信手段、前記第4の定義情報で表される前記文章を形態素解析して前記第4の定義情報を表す単語を抽出し、前記第3の定義情報を表す単語と前記第4の定義情報を表す単語の合致率を算出する属性情報合致率算出手段、前記第3の定義情報を表す単語と前記第4の定義情報を表す単語の合致率が第2の閾値以上かを判定する属性情報合致率判定手段、前記第3の定義情報を表す単語と前記第4の定義情報を表す単語の合致率が、前記第2の閾値以上である場合に、それら合致率の算出に用いた意味判定対象情報と比較対象情報とを抽出する抽出手段、指定された比較対象情報と組で前記抽出された意味判定対象情報を出力する情報出力手段、として機能させることを特徴とするプログラムである。 The present invention also provides comparison target information storage means for storing one or a plurality of comparison target information holding fourth definition information represented by sentences defining the meaning of the word represented by the word attribute information as the comparison target. Semantic determination in which the computer of the provided semantic association device receives the semantic determination target information holding the third definition information defining the meaning of the word represented by the attribute information of the element of the semantic determination target information from the information provider. object information receiving means, wherein the sentence represented in the fourth definition information by morphological analysis to extract a word representing the fourth definition information, the third said a word fourth representative of the definition information of the definition of attribute information matching ratio calculation means for calculating a matching rate of words representing the information, the third definition information words representing a concordance rate of words representing the fourth definition information attribute determines whether or second threshold value Information match rate determination means, Serial third definition information words representing a concordance rate of words representing the fourth definition information, when the it is the second threshold or more, compared with the mean determination target information used for calculation of their match rate A program that functions as an extraction unit that extracts information and an information output unit that outputs the extracted meaning determination target information in combination with specified comparison target information.

また本発明は、前記意味判定対象情報が、前記第1の要素名に対応付けられて前記情報提供元のデータベースに登録されている属性情報と、当該属性情報が表す単語の意味を定義する第3の定義情報とを保持し、前記比較対象情報が、前記第2の要素名に対応付けられてデータベースに登録される属性情報と、当該属性情報が表す単語の意味を定義する文章で表された第4の定義情報とを保持し、前記コンピュータを、さらに、前記第4の定義情報で表される文章を形態素解析して前記第4の定義情報を表す単語を抽出し、前記抽出した意味判定対象情報と比較対象情報との組みに基づいて、前記第3の定義情報を表す単語と前記第4の定義情報を表す単語の合致率を算出する属性情報合致率算出手段、前記第3の定義情報を表す単語と前記第4の定義情報を表す単語の合致率が第2の閾値以上かを判定する属性情報合致率判定手段、として機能させ、前記抽出手段が、さらに、前記第3の定義情報を表す単語と前記第4の定義情報を表す単語の合致率が前記第2の閾値以上である場合にのみ、それら合致率の算出に用いた意味判定対象情報と比較対象情報を抽出することを特徴とするプログラムである。 According to the present invention, the meaning determination target information defines attribute information associated with the first element name and registered in the database of the information providing source, and a meaning of a word represented by the attribute information. 3 definition information, and the comparison target information is represented by attribute information associated with the second element name and registered in the database, and a sentence defining the meaning of the word represented by the attribute information. a fourth definition information holding the, said computer further, the fourth by morphological analysis text represented by the definition information extracting word representing the fourth definition information, and the extracted meaning based on the combination of the comparison information and the judgment object information, the third attribute information match rate calculation means for calculating a word representing the definition information concordance rate of words representing the fourth definition information, the third It said a word that represents the definition information Attribute information match rate determination means for determining word matching rate if more than a second threshold representing a fourth definition information, to function as, the extraction means further wherein a word representing the third definition information first 4 is a program characterized by extracting meaning determination target information and comparison target information used for calculating the match rate only when the match rate of the word representing the definition information of 4 is equal to or higher than the second threshold. .

本発明によれば、提供元情報データベース2に格納されている情報をそのまま用いて、当該提供元情報データベース2に対応する比較対象情報記憶部13に登録されている比較対象情報との対応付けを行っている。従って、提供元情報データベース2に格納された情報のうち、指定された比較対象情報と意味的に合致する情報を出力する処理を、手作業によるデータ作成作業なしに行うことができる。   According to the present invention, using the information stored in the provider information database 2 as it is, the association with the comparison target information registered in the comparison target information storage unit 13 corresponding to the provider information database 2 is performed. Is going. Therefore, the process of outputting the information stored in the provider information database 2 that matches the specified comparison target information semantically can be performed without manual data creation.

意味的対応付け装置の構成を示すブロック図である。It is a block diagram which shows the structure of a semantic matching apparatus. 提供元情報のデータ例を示す図である。It is a figure which shows the example of data of provider information. 比較対象情報のデータ例を示す図である。It is a figure which shows the example of data of comparison object information. 意味的対応付け装置1の処理概要を示す図である。It is a figure which shows the process outline | summary of the semantic matching apparatus 1. FIG. 意味的対応付け装置の処理フローを示す第1の図である。It is a 1st figure which shows the processing flow of a semantic matching apparatus. 意味的対応付け装置の処理フローを示す第2の図である。It is a 2nd figure which shows the processing flow of a semantic matching apparatus. 意味的対応付け装置の処理フローを示す第3の図である。It is a 3rd figure which shows the processing flow of a semantic matching apparatus.

以下、本発明の一実施形態による意味的対応付け装置を図面を参照して説明する。
図1は同実施形態による意味的対応付け装置の構成を示すブロック図である。
この図において、符号1は意味的対応付け装置である。また2は提供元情報データベースである。そして、意味的対応付け装置1は、提供元情報を提供元情報データベースから取得する提供元情報受信部11(意味判定対象情報受信手段)と、提供元情報のデータ構成のルールをチェックするルールチェック処理部12(構成判定手段)と、比較対象情報を記憶する比較対象情報記憶部13(比較対象情報記憶手段)と、ルールチェックが完了した提供元情報と比較対象情報とを比較してその合致率の算出等の処理を行う情報比較処理部14(要素情報合致率算出手段、属性情報合致率算出手段)と、比較結果の評価処理を行う比較結果評価部15(要素情報合致率判定手段、属性情報合致率判定手段、抽出手段)、評価結果に基づいて、提供元情報に対する後処理を行う評価後処理部16、合致率閾値を記憶する対応付け評価情報記憶部17、の各処理部や記憶部を備えている。
Hereinafter, a semantic association apparatus according to an embodiment of the present invention will be described with reference to the drawings.
FIG. 1 is a block diagram showing the configuration of the semantic association apparatus according to the embodiment.
In this figure, reference numeral 1 denotes a semantic association device. Reference numeral 2 denotes a provider information database. Then, the semantic association device 1 includes a provider information receiving unit 11 (semantic determination target information receiving unit) that acquires the provider information from the provider information database, and a rule check that checks the data configuration rules of the provider information. The processing unit 12 (configuration determination unit), the comparison target information storage unit 13 (comparison target information storage unit) that stores the comparison target information, and the source information that has undergone the rule check and the comparison target information are compared and matched. An information comparison processing unit 14 (element information match rate calculation unit, attribute information match rate calculation unit) that performs processing such as rate calculation, and a comparison result evaluation unit 15 (element information match rate determination unit, element that performs comparison result evaluation processing) Attribute information match rate determination unit, extraction unit), post-evaluation processing unit 16 that performs post-processing on the provider information based on the evaluation result, and association evaluation information storage unit that stores a match rate threshold value 7, and a respective processing unit and the storage unit of.

図2は提供元情報のデータ例を示す図である。
ここで、提供元情報とは、図2で示すように、情報提供元データベース2に格納された情報であって、情報要素名(第1の情報要素名)、情報要素キーワード(第1の定義情報)、属性名、属性キーワード(第3の定義情報)などからなる情報である。
より具体的には、情報要素名が「ラック」という情報であれば、この「ラック」は、コンピュータや通信中継機器(ルータ)などの物理装置を収容する物理装置である。従って、情報提供元データベース2には、「ラック」という情報要素名に対応付けて、「物理装置、収容、物理装置」などの、情報要素名の意味を定義する情報要素キーワード(第1の定義情報)が格納されるものとする。
また情報提供元データベース2には、情報要素名が「ラック」という情報であれば、この「ラック」の属性として、例えば、ラックの高さ、長さ、奥行き、重さ、種別などの、その情報要素名であるラックに関する属性名(高さ、長さ、奥行き、重さ、種別など)が格納される。
また、さらに、情報提供元データベース2には、属性名に対応付けて、その属性名の意味を定義する属性キーワードが登録される。属性キーワードは、例えば、属性名が「高さ」であれば、その属性名が何に対する(「ラック」に対する)何なのか(「高さ」)の意味を定義する情報「ラック,高さ」である。
そして、情報提供元データベース2には、複数の様々な情報要素名について、情報要素キーワード、属性名、属性キーワードなどの情報が登録されているものとする。
また、提供元情報には、上述した、情報要素名、情報要素キーワード、属性名、属性キーワードの情報のほか、各属性名に対応する変数データを保持している。つまり、要素名「ラック」に関する属性名である、「高さ」,「長さ」,「奥行き」,「重さ」,「種別」についての実データ(変数)が格納されている。例えば、「高さ」=2m,「長さ」=0.5m,「奥行き」=1cm,「重さ」=20kg,「種別」=ラック大などの実データである。
FIG. 2 is a diagram illustrating an example of data of provider information.
Here, the provider information is information stored in the information provider database 2, as shown in FIG. 2, and includes an information element name (first information element name) and an information element keyword (first definition). Information), attribute names, attribute keywords (third definition information), and the like.
More specifically, if the information element name is information “rack”, this “rack” is a physical device that accommodates a physical device such as a computer or a communication relay device (router). Therefore, in the information providing source database 2, an information element keyword (first definition) that defines the meaning of the information element name such as “physical device, accommodation, physical device” is associated with the information element name “rack”. Information) is stored.
Further, if the information element name is information “rack” in the information provider database 2, the attributes of the “rack” include, for example, the height, length, depth, weight, type, and the like of the rack. The attribute name (height, length, depth, weight, type, etc.) relating to the rack, which is the information element name, is stored.
Furthermore, an attribute keyword that defines the meaning of the attribute name is registered in the information provider database 2 in association with the attribute name. For example, if the attribute name is “height”, the attribute keyword is information “rack, height” that defines the meaning of what the attribute name is (for “rack”) (“height”). It is.
It is assumed that information such as an information element keyword, an attribute name, and an attribute keyword is registered in the information provider database 2 for a plurality of various information element names.
In addition to the information on the information element name, information element keyword, attribute name, and attribute keyword described above, the provider information holds variable data corresponding to each attribute name. In other words, actual data (variables) about the attribute names “rack”, “height”, “length”, “depth”, “weight”, and “type” are stored. For example, actual data such as “height” = 2 m, “length” = 0.5 m, “depth” = 1 cm, “weight” = 20 kg, “type” = rack size, and the like.

図3は比較対象情報のデータ例を示す図である。
比較対象情報とは、図3で示すように、提供元情報データベース2に格納された何れかの情報と、意味的に合致するかを判定するための情報であり、情報要素名(第2の要素名)、情報要素定義(第2の定義情報)、属性名、属性定義(第4の定義情報)などからなる情報である。これらの情報は、それぞれ、提供元情報の情報要素名、情報要素キーワード、属性名、属性キーワードに対応する情報である。
つまり、情報要素名が「ラック」という情報であれば、この「ラック」は、コンピュータや通信中継機器(ルータ)などの物理装置を収容する物理装置である。そして、比較対象情報記憶部13には、「ラック」という情報要素名に対応付けて、「物理装置、収容、物理装置」などの、情報要素名の意味を定義する情報要素定義が格納されるものとする。
また比較対象情報記憶部13には、情報要素名が「ラック」という情報であれば、この「ラック」の属性として、例えば、ラックの高さ、長さ、奥行き、重さ、種別などの、その情報要素名であるラックに関する属性名(高さ、長さ、奥行き、重さ、種別など)が格納される。
また、さらに、比較対象情報記憶部13には、属性名に対応付けて、その属性名の意味を定義する属性定義が登録される。属性定義は、例えば、属性名が「高さ」であれば、その属性名が何に対する(「ラック」に対する)何なのか(「高さ」)の意味を定義する情報「ラック,高さ」である。
そして、比較対象情報記憶部13には、一つ又は複数の様々な情報要素名について、情報要素定義、属性名、属性定義などの情報が登録されているものとする。
FIG. 3 is a diagram illustrating an example of data of comparison target information.
The comparison target information is information for determining whether any information stored in the provider information database 2 is semantically matched as shown in FIG. Element name), information element definition (second definition information), attribute name, attribute definition (fourth definition information), and the like. These pieces of information are information corresponding to the information element name, information element keyword, attribute name, and attribute keyword of the provider information, respectively.
That is, if the information element name is information “rack”, this “rack” is a physical device that accommodates a physical device such as a computer or a communication relay device (router). The comparison target information storage unit 13 stores an information element definition that defines the meaning of the information element name such as “physical device, accommodation, physical device” in association with the information element name “rack”. Shall.
Further, if the information element name is information “rack” in the comparison target information storage unit 13, for example, the rack height, length, depth, weight, type, and the like can be used as the attributes of the “rack”. The attribute name (height, length, depth, weight, type, etc.) relating to the rack, which is the information element name, is stored.
Furthermore, an attribute definition that defines the meaning of the attribute name is registered in the comparison target information storage unit 13 in association with the attribute name. For example, if the attribute name is “height”, the attribute definition is information “rack, height” that defines the meaning of what the attribute name is (for “rack”) (“height”). It is.
It is assumed that information such as an information element definition, an attribute name, and an attribute definition is registered in the comparison target information storage unit 13 for one or a plurality of various information element names.

そして、本実施形態による意味的対応付け装置1は、情報提供元(提供元情報データベースなど)より取得した提供元情報(意味判定対象情報)であって、該情報の要素を単語で表した情報要素名(第1の情報要素名)と、当該情報要素名が表す単語の意味を定義する情報要素キーワード(第1の定義情報)とを少なくとも対応付けて保持した提供元情報を受信する。また意味的対応付け装置1は、比較対象としての単語で表される情報要素名(第2の要素名)と、その情報要素の意味を定義する情報要素定義(第2の定義情報)とを少なくとも対応付けて保持した比較対象情報を、異なる情報要素について一つ又は複数記憶する。そして、意味的対応付け装置1は、提供元情報が示す情報要素キーワードと、比較対象情報が示す情報要素定義の合致率を算出し、該合致率が定義情報合致率の閾値(第1の閾値)以上であるかを判定する。そして、意味的対応付け装置1は、提供元情報が示す情報要素キーワードと、比較対象情報が示す情報要素定義の合致率が定義情報合致率の閾値以上である場合には、それら合致率の算出に用いた提供元情報と比較対象情報との組を抽出する。そして、意味的対応付け装置1は、提供元情報と組で抽出された指定された比較対象情報を、提供元情報に意味的に対応する情報として出力する処理を行う。   The semantic association device 1 according to the present embodiment is provider information (semantic determination target information) acquired from an information provider (provider information database or the like), and information that represents elements of the information in words. Provided source information that holds at least an element name (first information element name) and an information element keyword (first definition information) that defines the meaning of the word represented by the information element name is received. Further, the semantic association apparatus 1 obtains an information element name (second element name) represented by a word as a comparison target and an information element definition (second definition information) that defines the meaning of the information element. One or a plurality of pieces of comparison target information stored in association with each other are stored for different information elements. Then, the semantic association device 1 calculates a match rate between the information element keyword indicated by the provider information and the information element definition indicated by the comparison target information, and the match rate is a threshold value of the definition information match rate (first threshold value). ) Determine whether it is above. Then, the semantic matching device 1 calculates the matching rate when the matching rate between the information element keyword indicated by the providing source information and the information element definition indicated by the comparison target information is equal to or higher than the threshold of the definition information matching rate. A set of the provider information and comparison target information used in the above is extracted. Then, the semantic association device 1 performs a process of outputting the specified comparison target information extracted in combination with the provider information as information semantically corresponding to the provider information.

また本実施形態による意味的対応付け装置1は、提供元情報が、当該提供元情報に対応付けられて提供元情報データベース2(情報提供元のデータベース)などに登録されている属性情報と、当該属性情報が表す単語の意味を定義する属性キーワード(第3の定義情報)とを保持し、比較対象情報が、当該比較対象情報の情報要素名(第2の要素名)に対応付けられて提供元情報データベース2などに登録される属性情報と、当該属性情報が表す単語の意味を定義する属性定義(第4の定義情報)とを保持する。そして、意味的対応付け装置1は、上述の抽出した提供元情報と比較対象情報との組みに基づいて、提供元情報の属性情報によって特定される属性キーワードと、比較対象情報の属性情報によって定義される属性定義の合致率を算出し、該合致率が属性情報合致率の閾値以上であるかを判定する。そして、意味的対応付け装置1は、提供元情報の属性情報によって特定される属性キーワードと、比較対象情報の属性情報によって定義される属性定義の合致率が属性情報合致率の閾値以上である場合にのみ、それら合致率の算出に用いた提供元情報と比較対象情報を抽出する。   Further, the semantic association apparatus 1 according to the present embodiment includes the attribute information registered in the provider information database 2 (information provider database) in association with the provider information, the provider information, An attribute keyword (third definition information) that defines the meaning of the word represented by the attribute information is held, and the comparison target information is provided in association with the information element name (second element name) of the comparison target information It holds attribute information registered in the original information database 2 and the like, and an attribute definition (fourth definition information) that defines the meaning of the word represented by the attribute information. The semantic association device 1 is defined by the attribute keyword specified by the attribute information of the provider information and the attribute information of the comparison target information based on the combination of the extracted provider information and the comparison target information. The match rate of the attribute definition to be calculated is calculated, and it is determined whether the match rate is equal to or higher than the threshold of the attribute information match rate. Then, the semantic association device 1 has a case where the match rate of the attribute keyword specified by the attribute information of the provider information and the attribute definition defined by the attribute information of the comparison target information is equal to or greater than the threshold of the attribute information match rate Only, the provider information and the comparison target information used to calculate the match rate are extracted.

以上の処理により、提供元情報データベース2に格納された情報のうち、提供元情報と意味的に合致する指定された比較対象情報を、当該提供元情報に意味的に対応する情報として出力する処理を、手作業によるデータ作成作業なしに行うことができる意味的対応付け装置1を提供することを目的とする。
また提供元情報が示す情報要素名の文字列と、比較対象情報が示す情報要素名の文字列とが、完全に一致しない場合においても、提供元情報の情報要素名に対する要素キーワードや属性キーワードと、比較対象情報の情報要素名に対する情報要素定義や属性定義とによって、情報要素名の意味的合致率が計算されて、提供元情報と意味的に合致する指定された比較対象情報を、自動的に特定することができる意味的対応付け装置1を提供することを目的とする。
The process of outputting the specified comparison target information that semantically matches the provider information among the information stored in the provider information database 2 as information that corresponds semantically to the provider information by the above processing. It is an object of the present invention to provide a semantic association device 1 that can perform the above without manual data creation.
In addition, even when the character string of the information element name indicated by the provider information and the character string of the information element name indicated by the comparison target information do not completely match, the element keyword or attribute keyword corresponding to the information element name of the provider information Based on the information element definition and attribute definition for the information element name of the comparison target information, the semantic match rate of the information element name is calculated, and the specified comparison target information that semantically matches the provider information is automatically It is an object of the present invention to provide a semantic association device 1 that can be specified as follows.

図4は意味的対応付け装置1の処理概要を示す図である。
この図が示すように、意味的対応付け装置1は、提供元情報を受信して、ある情報要素名の提供元情報を提供元情報データベース2より取得して、その提供元情報に格納されている情報要素名、情報要素キーワード、属性名、属性キーワードを抽出する処理を行う。そして、それら抽出した情報と、比較対象情報に格納されている情報要素名、情報要素定義、属性名、属性定義とを比較して、その合致率に基づいて、提供元情報データベース2に格納された情報のうち、提供元情報と意味的に合致する指定された比較対象情報を、当該提供元情報に意味的に対応する情報として出力する。
FIG. 4 is a diagram showing an outline of processing of the semantic association apparatus 1.
As shown in this figure, the semantic association device 1 receives the provider information, acquires the provider information of a certain information element name from the provider information database 2, and stores it in the provider information. The process of extracting the existing information element name, information element keyword, attribute name, and attribute keyword is performed. The extracted information is compared with the information element name, information element definition, attribute name, and attribute definition stored in the comparison target information, and stored in the provider information database 2 based on the matching rate. Among the received information, the specified comparison target information that semantically matches the provider information is output as information that semantically corresponds to the provider information.

図5は意味的対応付け装置の処理フローを示す第1の図である。
図6は意味的対応付け装置の処理フローを示す第2の図である。
図7は意味的対応付け装置の処理フローを示す第3の図である。
次に、図5〜図7を用いて意味的対応付け装置1の処理の詳細について説明する。
まず、図5より、意味的対応付け装置1は、例えば外部装置から提供元情報データベース2に格納されている情報の取得要求を受け付け、これを契機に処理の開始を検出する。すると、意味的対応付け装置1の提供元情報受信部11は、提供元情報データベース2へ提供元情報の要求信号を出力し、ある1つ目の提供元情報を受信する。提供元情報受信部11は、提供元情報を受信するとルールチェック処理部12へ転送する。すると、ルールチェック処理部12は、提供元情報がある規定のデータ構造になっているかどうかのルールチェック処理を行う。
FIG. 5 is a first diagram illustrating a processing flow of the semantic association apparatus.
FIG. 6 is a second diagram showing the processing flow of the semantic association apparatus.
FIG. 7 is a third diagram illustrating the processing flow of the semantic association apparatus.
Next, details of the processing of the semantic association apparatus 1 will be described with reference to FIGS.
First, referring to FIG. 5, the semantic association device 1 receives an acquisition request for information stored in the provider information database 2 from, for example, an external device, and detects the start of processing based on this request. Then, the provider information receiving unit 11 of the semantic association device 1 outputs a provider information request signal to the provider information database 2 and receives certain first provider information. The provider information receiving unit 11 receives the provider information and transfers it to the rule check processing unit 12. Then, the rule check processing unit 12 performs a rule check process to determine whether the providing source information has a specified data structure.

このルールチェック処理において、まず、ルールチェック処理部12は、提供元情報(図2)のデータ内に、「情報要素定義START」という記述と「情報要素定義END」という記述がペアになって存在するかを判定する(ステップS101)。またルールチェック処理部12は、提供元情報のデータ内に、情報要素名を定義する項目が一つのみ存在するかを判定する(ステップS102)。またルールチェック処理部12は、提供元情報のデータ内に、情報要素キーワードを定義する項目が一つのみ存在するかを判定する(ステップS103)。またルールチェック処理部12は、提供元情報のデータ内に、属性名を定義する項目が一つ以上存在するかを判定する(ステップS104)。またルールチェック処理部12は、提供元情報のデータ内に、属性キーワードを定義する項目が一つ以上存在するかを判定する(ステップS105)。またルールチェック処理部12は、提供元情報のデータ内に、属性名を定義する項目の数と、属性キーワードを定義する項目の数が同数記述されているかを判定する(ステップS106)。そして、ルールチェック処理部12は、これら、ステップS101〜ステップS106の全ての判定においてYesと判定した場合には、情報比較処理部14へ処理の開始を指示するとともに、提供元情報を転送する。また、ルールチェック処理部12は、上述のステップS101〜ステップS106の何れかの判定においてNoと判定した場合には、エラーメッセージなどを意味的対応付け装置1の表示部等に出力する(ステップS107)とともに、判定対象とした提供元情報を破棄する等の処理を行う。   In this rule check process, first, the rule check processing unit 12 has a pair of description “information element definition START” and description “information element definition END” in the data of the provider information (FIG. 2). It is determined whether or not to perform (step S101). Further, the rule check processing unit 12 determines whether there is only one item defining the information element name in the data of the provider information (step S102). Further, the rule check processing unit 12 determines whether there is only one item defining the information element keyword in the data of the provider information (step S103). Further, the rule check processing unit 12 determines whether or not one or more items defining attribute names exist in the data of the provider information (step S104). Further, the rule check processing unit 12 determines whether one or more items defining attribute keywords exist in the data of the provider information (step S105). Further, the rule check processing unit 12 determines whether or not the number of items defining the attribute name and the number of items defining the attribute keyword are described in the provider information data (step S106). When the rule check processing unit 12 determines Yes in all the determinations of step S101 to step S106, the rule check processing unit 12 instructs the information comparison processing unit 14 to start processing and transfers the provider information. Further, when the rule check processing unit 12 determines No in any of the above-described steps S101 to S106, the rule check processing unit 12 outputs an error message or the like to the display unit or the like of the semantic association device 1 (step S107). ) And processing such as discarding the provider information to be determined.

図6より、次に、情報比較処理部14は、提供元情報を受け付けると、当該提供元情報のデータ内に格納されている情報要素名、情報要素キーワード、属性名、属性キーワードを予めこれらの情報を識別するための付加しておいた提供元情報の識別IDに基づいて抽出し、それら抽出した情報要素名、情報要素キーワード、属性名、属性キーワードを、メモリなどに格納されている提供元情報テーブル100に登録する(ステップS201)。また、情報比較処理部14は、比較対象情報記憶部13から1つ目の比較対象情報(図3)を取得する(ステップS202)。また情報比較処理部14は、比較対象情報のデータ内に格納されている情報要素定義の文章の形態素解析などを行って、1つまたは複数の単語を抽出する(ステップS203)。そして、情報比較処理部14は、提供元情報から抽出した、情報要素キーワードの単語と、比較対象情報のデータ内に記述されている情報要素定義から抽出した単語との合致率を算出する(ステップS204)。ここで、図4で示されているように、提供元情報から抽出した情報要素キーワードが「物理装置」,「収容」,「物理装置」の3つであり、比較対象情報の情報要素定義から抽出した単語の中に「物理装置」,「収容」,「物理装置」が含まれているとする。この場合、(比較対象情報の情報要素定義から抽出した単語の中のうち、情報要素キーワードで示される各単語と一致する単語の数)÷(情報要素キーワード数)を算出して、合致率を算出する。図4の場合、比較対象情報の情報要素定義から抽出した単語の中のうち、情報要素キーワードで示される各単語と一致する単語の数は「3」、情報要素キーワード数「3」であるため、合致率は100%となる。   Next, when the information comparison processing unit 14 accepts the provider information, the information comparison processing unit 14 converts the information element name, information element keyword, attribute name, and attribute keyword stored in the data of the provider information in advance. Providers that are extracted based on the identification ID of provider information that has been added to identify information, and that the extracted information element name, information element keyword, attribute name, and attribute keyword are stored in a memory or the like Register in the information table 100 (step S201). Further, the information comparison processing unit 14 acquires the first comparison target information (FIG. 3) from the comparison target information storage unit 13 (step S202). In addition, the information comparison processing unit 14 performs morphological analysis of information element definition text stored in the comparison target information data, and extracts one or more words (step S203). Then, the information comparison processing unit 14 calculates a match rate between the word of the information element keyword extracted from the provider information and the word extracted from the information element definition described in the comparison target information data (step) S204). Here, as shown in FIG. 4, there are three information element keywords extracted from the provider information: “physical device”, “accommodation”, and “physical device”. It is assumed that “physical device”, “accommodation”, and “physical device” are included in the extracted words. In this case, (the number of words that match each word indicated by the information element keyword among the words extracted from the information element definition of the comparison target information) / (number of information element keywords) is calculated, and the matching rate is calculated. calculate. In the case of FIG. 4, among the words extracted from the information element definition of the comparison target information, the number of words that match each word indicated by the information element keyword is “3”, and the number of information element keywords is “3”. The match rate is 100%.

そして、情報比較処理部14は、提供元情報の情報要素キーワードの単語と、1つ目の比較対象情報の情報要素定義から抽出した単語と、の合致率の算出を終えると、それら提供元情報の識別ID、その提供元情報から抽出した情報要素キーワードの単語、1つ目の比較対象情報の識別ID、その比較対象情報の情報要素定義から抽出した単語、それらの合致率を対応付けて、合致率集計テーブル200に登録する(ステップS205)。そして、情報比較処理部14は、他の比較対象情報が比較対象情報記憶部13に記録されているかを判定し(ステップS206)、記録されている場合には、2つ目の比較対象情報を、比較対象情報記憶部13から読み取る(ステップS207)。そして情報比較処理部14は、提供元情報の情報要素キーワードの単語と、2つ目の比較対象情報の情報要素定義から抽出した単語と、の合致率の算出と、合致率集計テーブル200への情報の登録を同様に行う。また同様に、情報比較処理部14は、比較対象情報記憶部13に記憶されている全ての比較対象情報を、順次読み取って、同様の処理により、提供元情報の情報要素キーワードの単語と、比較対象情報の情報要素定義から抽出した単語と、の合致率の算出と、合致率集計テーブル200への情報の登録を行う。   Then, when the information comparison processing unit 14 finishes calculating the match rate between the word of the information element keyword of the provider information and the word extracted from the information element definition of the first comparison target information, the provider information The ID of the information element keyword extracted from the provider information, the identification ID of the first comparison target information, the word extracted from the information element definition of the comparison target information, and their match rates, Registration is made in the match rate totaling table 200 (step S205). Then, the information comparison processing unit 14 determines whether other comparison target information is recorded in the comparison target information storage unit 13 (step S206), and if it is recorded, the second comparison target information is displayed. The data is read from the comparison target information storage unit 13 (step S207). Then, the information comparison processing unit 14 calculates the match rate between the word of the information element keyword of the source information and the word extracted from the information element definition of the second comparison target information, and stores the match rate into the match rate totaling table 200. Register information in the same way. Similarly, the information comparison processing unit 14 sequentially reads all the comparison target information stored in the comparison target information storage unit 13 and compares it with the information element keyword word of the providing source information. The match rate of the word extracted from the information element definition of the target information is calculated, and the information is registered in the match rate totaling table 200.

そして、情報比較処理部14が、提供元情報データベース2から受信した1つ目の提供元情報と、比較対象情報記憶部13に記録されている全ての比較対象情報とのペア毎に、情報要素キーワードの単語と、情報要素定義から抽出した単語の合致率を算出した場合、情報比較処理部14は、比較結果評価部15へ評価処理を行うよう通知する。そして、比較結果評価部15は、合致率集計テーブル200の中から、算出した合致率が要素情報合致率の閾値を上回り、かつ、最も高い合致率を算出した、提供元情報と比較対象情報のペアを抽出する(ステップS208)。本実施形態においては、図2および図3で示した提供元情報と比較対象情報の合致率が100%であるため、それら提供元情報と比較対象情報のペアを抽出したものとする。なお、比較結果評価部15は、合致率集計テーブル200の中の、何れの合致率も要素情報合致率の閾値を超えるものがない場合には、提供元情報データベース2から取得した提供元情報に意味的に合致する比較対象情報が無い旨を示すエラー情報を表示部に出力し、提供元情報データベース2から取得した1つ目の提供元情報を破棄する。そして、算出した合致率のうち要素情報合致率を超えるものがあれば、抽出した提供元情報と比較対象情報のペアの識別IDを、情報比較処理部14へ通知する。また比較結果処理部15は、最も高い合致率を算出した、提供元情報と比較対象情報のペアに基づいて、提供元情報の情報要素名と、比較対象情報の情報要素名とを対応付けて、対応付け結果テーブル300に登録する(ステップS209)。   Then, the information comparison processing unit 14 sets an information element for each pair of the first providing source information received from the providing source information database 2 and all the comparison target information recorded in the comparison target information storage unit 13. When the match rate between the keyword word and the word extracted from the information element definition is calculated, the information comparison processing unit 14 notifies the comparison result evaluation unit 15 to perform the evaluation process. Then, the comparison result evaluating unit 15 calculates the highest match rate from the match rate totaling table 200 in which the calculated match rate exceeds the threshold of the element information match rate, and provides the highest match rate. A pair is extracted (step S208). In this embodiment, since the matching rate between the provider information and the comparison target information shown in FIGS. 2 and 3 is 100%, it is assumed that a pair of the provider information and the comparison target information is extracted. In addition, the comparison result evaluation unit 15 uses the provider information acquired from the provider information database 2 when none of the match rates in the match rate totaling table 200 exceed the threshold of the element information match rate. Error information indicating that there is no semantically matching comparison target information is output to the display unit, and the first provider information acquired from the provider information database 2 is discarded. If any of the calculated match rates exceeds the element information match rate, the information comparison processing unit 14 is notified of the identification ID of the pair of the extracted source information and comparison target information. Further, the comparison result processing unit 15 associates the information element name of the providing source information and the information element name of the comparison target information based on the pair of the providing source information and the comparison target information for which the highest match rate is calculated. And registered in the association result table 300 (step S209).

図7より、次に、情報比較処理部14は、比較結果評価部15から通知を受けた提供元情報(図2)識別IDに基づいて、提供元情報テーブル100から、属性名が示す単語と、属性キーワードが示す単語とを読み取る(ステップS301)。また情報比較処理部14は、比較結果評価部15から通知を受けた比較対象情報の識別IDに基づいて、当該比較対象情報の属性名が示す単語を抽出する(ステップS302)。また比較結果処理部14は、比較結果評価部15から通知を受けた比較対象情報の識別IDに基づいて、当該比較対象情報の属性定義が示す文章を読み取り、その文書を形態素解析して属性定義が示す単語を抽出する(ステップS303)。そして、情報比較処理部14は、提供元情報から抽出した、属性キーワードの単語と、比較対象情報のデータ内に記述されている属性定義から抽出した単語との合致率を算出する(ステップS304)。   From FIG. 7, the information comparison processing unit 14 then extracts the word indicated by the attribute name from the provider information table 100 based on the provider ID (FIG. 2) identification ID notified from the comparison result evaluation unit 15. The word indicated by the attribute keyword is read (step S301). The information comparison processing unit 14 extracts a word indicated by the attribute name of the comparison target information based on the identification ID of the comparison target information notified from the comparison result evaluation unit 15 (step S302). In addition, the comparison result processing unit 14 reads the text indicated by the attribute definition of the comparison target information based on the identification ID of the comparison target information notified from the comparison result evaluation unit 15 and performs morphological analysis on the document to perform attribute definition. Is extracted (step S303). Then, the information comparison processing unit 14 calculates a match rate between the attribute keyword word extracted from the provider information and the word extracted from the attribute definition described in the comparison target information data (step S304). .

ここで、図4で示されているように、提供元情報から抽出した属性キーワード1が「ラック」,「高さ」の2つであり、比較対象情報の属性定義Aから抽出した単語の中に「ラック」,「高さ」の単語が含まれているとする。この場合、(比較対象情報の属性定義Aから抽出した単語の中のうち、属性キーワード1で示される各単語と一致する単語の数)÷(属性キーワード1の数)を算出して、合致率を算出する。図4の場合、比較対象情報の属性定義Aから抽出した単語の中のうち、提供元情報から抽出した属性キーワード1で示される各単語と一致する単語の数は「2」、提供元情報から抽出した属性キーワード1の数「2」であるため、合致率は100%となる。これにより、情報比較処理部14は、提供元情報の属性名1と、比較対象情報の属性名Aとに対応付けて合致率100%の情報を合致率集計テーブル200に書き込む。   Here, as shown in FIG. 4, there are two attribute keywords 1 extracted from the provider information, “rack” and “height”, and among the words extracted from the attribute definition A of the comparison target information. Suppose that the words “rack” and “height” are included. In this case, (the number of words that match each word indicated by the attribute keyword 1 among the words extracted from the attribute definition A of the comparison target information) / (the number of attribute keywords 1) is calculated, and the match rate Is calculated. In the case of FIG. 4, among the words extracted from the attribute definition A of the comparison target information, the number of words that match each word indicated by the attribute keyword 1 extracted from the provider information is “2”. Since the number of extracted attribute keywords 1 is “2”, the match rate is 100%. As a result, the information comparison processing unit 14 writes information of the match rate 100% in the match rate totaling table 200 in association with the attribute name 1 of the provider information and the attribute name A of the comparison target information.

そして、情報比較処理部14は、比較対象情報に他の属性名と属性定義のペアが存在するかを判定し(ステップS305)、存在すれば、その属性定義から抽出する単語を合致率の算出対象と決定する(ステップS306)。例えば、図4で示すように比較対象情報には、属性名Aに対応する属性定義Aの、属性名と属性定義のペア以外に、属性名Bとそれに対応する属性定義Bのペアが記述されている。従って、情報比較処理部14は、提供元情報の属性キーワード1の単語と、比較対象情報の属性定義Bから抽出した単語との合致率を算出する。図4で示されているように、提供元情報から抽出した属性キーワード1が「ラック」,「高さ」の2つであり、比較対象情報の属性定義Bから抽出した単語の中に「ラック」,「種別」の単語が含まれているとする。この場合、(比較対象情報の属性定義Bから抽出した単語の中のうち、属性キーワード1で示される各単語と一致する単語の数)÷(属性キーワード1の数)を算出して、合致率を算出する。図4の場合、比較対象情報の属性定義Bから抽出した単語の中のうち、提供元情報から抽出した属性キーワード1で示される各単語と一致する単語の数は「1」、提供元情報から抽出した属性キーワード1の数「2」であるため、合致率は50%となる。これにより、情報比較処理部14は、提供元情報の属性名1と、比較対象情報の属性名Bとに対応付けて合致率50%の情報を合致率集計テーブル200に書き込む。   Then, the information comparison processing unit 14 determines whether another pair of attribute name and attribute definition exists in the comparison target information (step S305), and if it exists, calculates a match rate for a word extracted from the attribute definition. The target is determined (step S306). For example, as shown in FIG. 4, in the comparison target information, a pair of attribute name B and attribute definition B corresponding thereto is described in addition to the attribute name and attribute definition pair of attribute definition A corresponding to attribute name A. ing. Therefore, the information comparison processing unit 14 calculates a match rate between the word of the attribute keyword 1 of the provider information and the word extracted from the attribute definition B of the comparison target information. As shown in FIG. 4, the attribute keyword 1 extracted from the provider information is “rack” and “height”, and “rack” is included in the words extracted from the attribute definition B of the comparison target information. ”And“ type ”are included. In this case, (the number of words that match each word indicated by the attribute keyword 1 among the words extracted from the attribute definition B of the comparison target information) / (the number of attribute keywords 1) is calculated, and the match rate Is calculated. In the case of FIG. 4, among the words extracted from the attribute definition B of the comparison target information, the number of words that match each word indicated by the attribute keyword 1 extracted from the provider information is “1”. Since the number of extracted attribute keywords 1 is “2”, the match rate is 50%. As a result, the information comparison processing unit 14 writes information on the match rate 50% in the match rate totaling table 200 in association with the attribute name 1 of the provider information and the attribute name B of the comparison target information.

すると比較結果評価部15は、提供元情報に記述されている1つ目の属性名1に対応する、比較対象情報のデータ内の属性名として、最も合致率の高い属性名Aを特定し、それら属性名1と属性名Aとを対応付けて、対応付け結果テーブル300に登録する(ステップS307)。つまり、これにより、提供元情報のデータ内の属性名1に対応する情報が、比較対象情報のデータ内の属性名Aであることを特定したこととなる。   Then, the comparison result evaluation unit 15 specifies the attribute name A having the highest match rate as the attribute name in the data of the comparison target information corresponding to the first attribute name 1 described in the provider information, The attribute name 1 and the attribute name A are associated with each other and registered in the association result table 300 (step S307). That is, this specifies that the information corresponding to the attribute name 1 in the data of the provider information is the attribute name A in the data of the comparison target information.

また、情報比較処理部14は、提供元情報に他の属性名と属性キーワードのペアが存在するかを判定し(ステップS308)、存在すれば、その属性キーワードから抽出する単語と、比較対象情報の属性キーワードとを合致率の算出対象と決定する(ステップS309)。つまり、図4で示すように、提供元情報には、属性名1に対応する属性キーワード1の属性名と属性キーワードのペア以外に、属性名2とそれに対応する属性キーワード2のペアが記述されている。従って、情報比較処理部14は、提供元情報の属性キーワード2の単語と、比較対象情報の属性定義Aから抽出した単語との合致率を算出する。図4で示されているように、提供元情報から抽出した属性キーワード2が「ラック」,「種別」の2つであり、比較対象情報の属性定義Aから抽出した単語の中に「ラック」,「高さ」の単語が含まれているとする。この場合、(比較対象情報の属性定義Aから抽出した単語の中のうち、属性キーワード2で示される各単語と一致する単語の数)÷(属性キーワード2の数)を算出して、合致率を算出する。図4の場合、比較対象情報の属性定義Aから抽出した単語の中のうち、提供元情報から抽出した属性キーワード2で示される各単語と一致する単語の数は「1」、提供元情報から抽出した属性キーワード2の数「2」であるため、合致率は50%となる。これにより、情報比較処理部14は、提供元情報の属性名2と、比較対象情報の属性名Aとに対応付けて合致率50%の情報を合致率集計テーブル200に書き込む。   In addition, the information comparison processing unit 14 determines whether another pair of attribute name and attribute keyword exists in the provider information (step S308), and if it exists, the word extracted from the attribute keyword and the comparison target information The attribute keyword is determined as a match rate calculation target (step S309). That is, as shown in FIG. 4, in the provider information, a pair of attribute name 2 and attribute keyword 2 corresponding thereto is described in addition to the attribute name and attribute keyword pair of attribute keyword 1 corresponding to attribute name 1. ing. Therefore, the information comparison processing unit 14 calculates a match rate between the word of the attribute keyword 2 of the provider information and the word extracted from the attribute definition A of the comparison target information. As shown in FIG. 4, the attribute keyword 2 extracted from the provider information is “rack” and “type”, and “rack” is included in the word extracted from the attribute definition A of the comparison target information. , Suppose that the word “height” is included. In this case, (the number of words that match each word indicated by the attribute keyword 2 among the words extracted from the attribute definition A of the comparison target information) / (the number of attribute keywords 2) is calculated, and the match rate Is calculated. In the case of FIG. 4, among the words extracted from the attribute definition A of the comparison target information, the number of words that match each word indicated by the attribute keyword 2 extracted from the provider information is “1”. Since the number of extracted attribute keywords 2 is “2”, the match rate is 50%. As a result, the information comparison processing unit 14 writes information on the match rate 50% in the match rate totaling table 200 in association with the attribute name 2 of the providing source information and the attribute name A of the comparison target information.

また、図4で示すように比較対象情報には、属性名Aに対応する属性定義Aの、属性名と属性定義のペア以外に、属性名Bとそれに対応する属性定義Bのペアが記述されている。従って、情報比較処理部14は、提供元情報の属性キーワード2の単語と、比較対象情報の属性定義Bから抽出した単語との合致率を算出する。図4で示されているように、提供元情報から抽出した属性キーワード2が「ラック」,「種別」の2つであり、比較対象情報の属性定義Bから抽出した単語の中に「ラック」,「種別」の単語が含まれているとする。この場合、(比較対象情報の属性定義Bから抽出した単語の中のうち、属性キーワード2で示される各単語と一致する単語の数)÷(属性キーワード2の数)を算出して、合致率を算出する。図4の場合、比較対象情報の属性定義Bから抽出した単語の中のうち、提供元情報から抽出した属性キーワード2で示される各単語と一致する単語の数は「2」、提供元情報から抽出した属性キーワード2の数「2」であるため、合致率は100%となる。これにより、情報比較処理部14は、提供元情報の属性名2と、比較対象情報の属性名Bとに対応付けて合致率100%の情報を合致率集計テーブル200に書き込む。   Further, as shown in FIG. 4, in the comparison target information, in addition to the attribute name / attribute definition pair of attribute definition A corresponding to attribute name A, a pair of attribute name B and corresponding attribute definition B is described. ing. Therefore, the information comparison processing unit 14 calculates a match rate between the word of the attribute keyword 2 of the provider information and the word extracted from the attribute definition B of the comparison target information. As shown in FIG. 4, there are two attribute keywords 2 extracted from the provider information, “rack” and “type”, and “rack” is included in the words extracted from the attribute definition B of the comparison target information. , “Type” word is included. In this case, (the number of words that match each word indicated by the attribute keyword 2 among the words extracted from the attribute definition B of the comparison target information) / (the number of attribute keywords 2) is calculated, and the match rate Is calculated. In the case of FIG. 4, among the words extracted from the attribute definition B of the comparison target information, the number of words that match each word indicated by the attribute keyword 2 extracted from the provider information is “2”. Since the number of extracted attribute keywords 2 is “2”, the match rate is 100%. As a result, the information comparison processing unit 14 writes information with a match rate of 100% in the match rate totaling table 200 in association with the attribute name 2 of the provider information and the attribute name B of the comparison target information.

すると比較結果評価部15は、提供元情報に記述されている2つ目の属性名2に対応する、比較対象情報のデータ内の属性名として、合致率の高い属性名Bを特定し、それら属性名2と属性名Bとを対応付けて、対応付け結果テーブル300に登録する。つまり、これにより、提供元情報のデータ内の属性名2に対応する情報が、比較対象情報のデータ内の属性名Bであることを特定したこととなる。   Then, the comparison result evaluation unit 15 identifies attribute names B having a high match rate as attribute names in the data of the comparison target information corresponding to the second attribute name 2 described in the provider information, and Attribute name 2 and attribute name B are associated with each other and registered in the association result table 300. That is, this specifies that the information corresponding to the attribute name 2 in the data of the provider information is the attribute name B in the data of the comparison target information.

以上の処理によって、意味的対応付け装置1は、提供元情報データベース2から取得した1つ目の提供元情報の要素名に、意味的に合致する要素名を、比較対象情報記憶部13の中から特定し、さらに、それら提供元情報と比較対象情報のペアにおいて、それぞれに記述された属性名と属性定義のデータ内容を対応付けることができる。そして、意味的対応付け装置1は、次の提供元情報の送信を提供元情報データベース2へ要求し、2つ目の提供元情報を用いて、上述の処理を繰り返す。これにより、提供元情報データベース2に格納されている提供元情報の全てについて、意味的に対応する比較対象情報記憶部13内の比較対象情報を特定することができる。   As a result of the above processing, the semantic association apparatus 1 stores an element name that matches the element name of the first provider information acquired from the provider information database 2 in the comparison target information storage unit 13. Further, in the pair of the provider information and the comparison target information, the attribute name described in each of the pair and the data contents of the attribute definition can be associated with each other. Then, the semantic association apparatus 1 requests the provider information database 2 to transmit the next provider information, and repeats the above-described processing using the second provider information. Thereby, it is possible to specify the comparison target information in the comparison target information storage unit 13 that semantically corresponds to all of the supply source information stored in the supply source information database 2.

そして、評価後処理部16は、対応付け結果テーブル300を用いて、提供元情報に対応する比較対象情報を特定し、該提供元情報の属性名に関する実データを、該比較対象情報の属性名に関する実データとして出力し、例えば、比較対象情報記憶部13に登録する(ステップS310)。つまり、提供元情報のうちの比較対象情報で規定された属性名に対応する情報のみを、比較対象情報に反映させる。   Then, the post-evaluation processing unit 16 uses the association result table 300 to identify the comparison target information corresponding to the provider information, and the actual data regarding the attribute name of the provider information is used as the attribute name of the comparison target information. For example, and is registered in the comparison target information storage unit 13 (step S310). That is, only information corresponding to the attribute name defined in the comparison target information in the provider information is reflected in the comparison target information.

そして、評価後処理部16は、対応付け結果テーブル300を用いて、その後の処理を行う。つまり、提供元情報データベース2内の提供元情報には、属性名に対応する実データが対応付けられて登録されている。この値は、提供元情報データベース2の処理によって変更される場合がある。そして、評価後処理部16は、例えば提供元情報データベース2から、変更した提供元情報の識別ID、変更した実データを保持する属性名を示す、変更処理実施の通知を受信する。そして、評価後処理部16は、その変更処理実施の通知を受信した場合には、変更された実データの情報を、提供元情報データベース2内に格納された提供元情報から取得する。また、評価後処理部16は、変更処理実施の通知に基づいて、変更した実データを保持する提供元情報の識別IDに対応付けられて対応付け結果テーブル300に登録されている比較対象情報を特定し、また、変更された実データに対応する属性名から、その属性名に対応付けられて対応付け結果テーブル300に登録されている比較対象情報側の属性名を特定する。そして、その比較対象情報側の属性名に対応する実データを、変更された実データへと書き換える。   Then, the post-evaluation processing unit 16 performs subsequent processing using the association result table 300. That is, actual data corresponding to the attribute name is registered in association with the provider information in the provider information database 2. This value may be changed by processing of the provider information database 2. Then, the post-evaluation processing unit 16 receives, from the provider information database 2, for example, a notification of execution of the change process indicating the identification ID of the changed provider information and the attribute name holding the changed actual data. When the post-evaluation processing unit 16 receives the notification of the execution of the change process, the post-evaluation processing unit 16 acquires the changed real data information from the provider information stored in the provider information database 2. Further, the post-evaluation processing unit 16 compares the comparison target information registered in the association result table 300 in association with the identification ID of the provider information that holds the changed actual data, based on the notification of the execution of the change process. In addition, the attribute name on the comparison target information side that is associated with the attribute name and registered in the association result table 300 is identified from the attribute name corresponding to the changed actual data. Then, the actual data corresponding to the attribute name on the comparison target information side is rewritten with the changed actual data.

以上のような意味的対応付け装置1の処理により、提供元情報データベース2に格納された提供元情報の中から、指定された比較対象情報に対応する情報を出力する際に、比較対象情報で規定された情報要素名、属性名に、意味的に関連する提供元情報のみを、出力する。   When the information corresponding to the specified comparison target information is output from the provider information stored in the provider information database 2 by the processing of the semantic association device 1 as described above, Only the provider information that is semantically related to the specified information element name and attribute name is output.

そして、上述の処理によれば、提供元データベース2の提供元情報が示す情報要素名の文字列と、比較対象情報が示す情報要素名の文字列とが、完全に一致しない場合においても、提供元情報の情報要素名に対する要素キーワードや属性キーワードと、比較対象情報の情報要素名に対する情報要素定義や属性定義とによって、情報要素名の意味的合致率が計算されて、提供元情報と意味的に合致する指定された比較対象情報を、自動的に特定することができ、これにより、作業者の労力を軽減することができる。   And according to the above-mentioned processing, even when the character string of the information element name indicated by the provider information of the provider database 2 and the character string of the information element name indicated by the comparison target information do not completely match, the provision is made Based on the element keyword and attribute keyword for the information element name of the original information and the information element definition and attribute definition for the information element name of the comparison target information, the semantic match rate of the information element name is calculated, and the source information and semantic It is possible to automatically specify the designated comparison target information that matches the above, thereby reducing the labor of the operator.

なお、上述の意味的対応付け装置の処理では、提供元情報が示す情報要素キーワードと、比較対象情報が示す情報要素定義の合致率が定義情報合致率の閾値以上である場合の、それら合致率の算出に用いた提供元情報と比較対象情報との組を抽出し、その後、その抽出結果に対して、提供元情報の属性情報によって特定される属性キーワードと、比較対象情報の属性情報によって定義される属性定義の合致率を算出し、属性情報合致率の閾値以上である場合の、それら合致率の算出に用いた提供元情報と比較対象情報を抽出している。しかしながら、意味的対応付け装置の処理において、前者の処理を省き、後者のみの処理によって、提供元情報と比較対象情報を抽出するようにしてもよい。
つまり、意味判定対象情報を情報提供元より受信し、その意味判定対象情報の要素の属性情報の表す単語の意味を定義する属性キーワードと、比較対象としての単語の属性情報が表す単語の意味を定義する属性定義の合致率を算出し、それら、属性キーワードと属性定義の合致率が閾値(第2の閾値)以上かを判定し、属性キーワードと属性定義の合致率が閾値以上である場合に、それら合致率の算出に用いた意味判定対象情報と比較対象情報とを抽出する。そして、指定された比較対象情報と組で抽出された意味判定対象情報を出力するようにしてもよい。
Note that, in the above-described processing of the semantic association device, the matching rate when the matching rate of the information element keyword indicated by the providing source information and the information element definition indicated by the comparison target information is equal to or greater than the threshold of the definition information matching rate. The pair of provider information and comparison target information used for calculation of the source information is extracted, and then the extracted result is defined by the attribute keyword specified by the attribute information of the provider information and the attribute information of the comparison target information The match rate of the attribute definition to be calculated is calculated, and when the attribute information match rate is equal to or higher than the threshold of the attribute information match rate, the provider information and the comparison target information used to calculate the match rate are extracted. However, in the process of the semantic association device, the former process may be omitted, and the provider information and the comparison target information may be extracted by only the latter process.
That is, the semantic determination target information is received from the information provider, the attribute keyword that defines the meaning of the word represented by the attribute information of the element of the semantic determination target information, and the meaning of the word represented by the attribute information of the word as the comparison target. When the match rate of the attribute definition to be defined is calculated, whether the match rate of the attribute keyword and the attribute definition is greater than or equal to a threshold (second threshold), and the match rate of the attribute keyword and the attribute definition is greater than or equal to the threshold Then, the semantic determination target information and the comparison target information used for calculating the match rate are extracted. Then, the semantic determination target information extracted in combination with the designated comparison target information may be output.

なお、上述の意味的対応付け装置は内部に、コンピュータシステムを有している。そして、上述した各処理の過程は、プログラムの形式でコンピュータ読み取り可能な記録媒体に記憶されており、このプログラムをコンピュータが読み出して実行することによって、上記処理が行われる。ここでコンピュータ読み取り可能な記録媒体とは、磁気ディスク、光磁気ディスク、CD−ROM、DVD−ROM、半導体メモリ等をいう。また、このコンピュータプログラムを通信回線によってコンピュータに配信し、この配信を受けたコンピュータが当該プログラムを実行するようにしても良い。   In addition, the above-mentioned semantic matching apparatus has a computer system inside. Each process described above is stored in a computer-readable recording medium in the form of a program, and the above process is performed by the computer reading and executing the program. Here, the computer-readable recording medium means a magnetic disk, a magneto-optical disk, a CD-ROM, a DVD-ROM, a semiconductor memory, or the like. Alternatively, the computer program may be distributed to the computer via a communication line, and the computer that has received the distribution may execute the program.

また、上記プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であっても良い。   The program may be for realizing a part of the functions described above. Furthermore, what can implement | achieve the function mentioned above in combination with the program already recorded on the computer system, what is called a difference file (difference program) may be sufficient.

1・・・意味的対応付け装置
2・・・提供元情報データベース
11・・・提供元情報受信部
12・・・ルールチェック処理部
13・・・比較対象情報記憶部
14・・・情報比較処理部
15・・・比較結果処理部
16・・・評価後処理部
DESCRIPTION OF SYMBOLS 1 ... Semantic matching apparatus 2 ... Provider information database 11 ... Provider information receiving part 12 ... Rule check process part 13 ... Comparison object information storage part 14 ... Information comparison process Unit 15 ... Comparison result processing unit 16 ... Post-evaluation processing unit

Claims (13)

意味判定対象情報の要素を単語で表した第1の要素名と、当該第1の要素名が表す前記単語の意味を定義する第1の定義情報とを少なくとも対応付けて保持した前記意味判定対象情報を情報提供元より受信する意味判定対象情報受信手段と、
比較対象としての単語で表される第2の要素名と、その第2の要素名の意味を定義する文章で表された第2の定義情報とを少なくとも対応付けて保持した比較対象情報を一つ又は複数記憶する比較対象情報記憶手段と、
前記第2の定義情報で表される前記文章を形態素解析して前記第2の定義情報を表す単語を抽出し、前記第1の定義情報を表す単語と前記第2の定義情報を表す単語の合致率を算出する要素情報合致率算出手段と、
前記第1の定義情報を表す単語と前記第2の定義情報を表す単語の合致率が第1の閾値以上かを判定する要素情報合致率判定手段と、
前記第1の定義情報を表す単語と前記第2の定義情報を表す単語の合致率が、前記第1の閾値以上である場合に、それら合致率の算出に用いた意味判定対象情報と比較対象情報との組を抽出する抽出手段と、
指定された比較対象情報と組で前記抽出された意味判定対象情報を出力する情報出力手段と、
を備えることを特徴とする意味的対応付け装置。
The meaning determination target that holds at least the first element name that represents the element of the meaning determination target information in words and the first definition information that defines the meaning of the word represented by the first element name Meaning determination target information receiving means for receiving information from an information provider;
One piece of comparison object information is stored in association with at least the second element name represented by the word as the comparison object and the second definition information represented by the sentence defining the meaning of the second element name. Comparison target information storage means for storing one or more;
Wherein said sentences are represented by the second definition information by morphological analysis to extract a word representing the second definition information, the word representing the said a word representing the first definition information second definition information Element information match rate calculation means for calculating the match rate;
Element information match rate determination means for determining whether the match rate between the word representing the first definition information and the word representing the second definition information is greater than or equal to a first threshold;
When the match rate between the word representing the first definition information and the word representing the second definition information is equal to or higher than the first threshold, the semantic determination target information and the comparison target used to calculate the match rate An extraction means for extracting a pair with information;
Information output means for outputting the extracted semantic determination target information in combination with specified comparison target information;
A semantic associating device comprising:
意味判定対象情報の要素の属性情報の表す単語の意味を定義する第3の定義情報を保持した前記意味判定対象情報を情報提供元より受信する意味判定対象情報受信手段と、
比較対象としての単語の属性情報が表す単語の意味を定義する文章で表された第4の定義情報を保持した比較対象情報を一つ又は複数記憶する比較対象情報記憶手段と、
前記第4の定義情報で表される前記文章を形態素解析して前記第4の定義情報を表す単語を抽出し、前記第3の定義情報を表す単語と前記第4の定義情報を表す単語の合致率を算出する属性情報合致率算出手段と、
前記第3の定義情報を表す単語と前記第4の定義情報を表す単語の合致率が第2の閾値以上かを判定する属性情報合致率判定手段と、
前記第3の定義情報を表す単語と前記第4の定義情報を表す単語の合致率が、前記第2の閾値以上である場合に、それら合致率の算出に用いた意味判定対象情報と比較対象情報とを抽出する抽出手段と、
指定された比較対象情報と組で前記抽出された意味判定対象情報を出力する情報出力手段と、
を備えることを特徴とする意味的対応付け装置。
Semantic determination target information receiving means for receiving, from an information provider, the semantic determination target information that holds the third definition information that defines the meaning of the word represented by the attribute information of the element of the semantic determination target information;
Comparison target information storage means for storing one or more pieces of comparison target information holding fourth definition information represented by sentences defining the meaning of the word represented by the word attribute information as the comparison target;
And morphological analysis of the sentence expressed by the fourth definition information extracting word representing the fourth definition information, the word representing the third and the fourth definition information words representing the definition information Attribute information match rate calculation means for calculating the match rate,
Attribute information match rate determination means for determining whether the match rate between the word representing the third definition information and the word representing the fourth definition information is equal to or greater than a second threshold;
When the match rate between the word representing the third definition information and the word representing the fourth definition information is greater than or equal to the second threshold value, the semantic determination target information and the comparison target used to calculate the match rate Extraction means for extracting information;
Information output means for outputting the extracted semantic determination target information in combination with specified comparison target information;
A semantic associating device comprising:
前記意味判定対象情報が、前記第1の要素名に対応付けられて前記情報提供元のデータベースに登録されている属性情報と、当該属性情報が表す単語の意味を定義する第3の定義情報とを保持し、
前記比較対象情報が、前記第2の要素名に対応付けられてデータベースに登録される属性情報と、当該属性情報が表す単語の意味を定義する文章で表された第4の定義情報とを保持し、
前記第4の定義情報で表される文章を形態素解析して前記第4の定義情報を表す単語を抽出し、前記抽出した意味判定対象情報と比較対象情報との組みに基づいて、前記第3の定義情報を表す単語と前記第4の定義情報を表す単語の合致率を算出する属性情報合致率算出手段と、
前記第3の定義情報を表す単語と前記第4の定義情報を表す単語の合致率が第2の閾値以上かを判定する属性情報合致率判定手段と、を備え、
前記抽出手段は、さらに、前記第3の定義情報を表す単語と前記第4の定義情報を表す単語の合致率が前記第2の閾値以上である場合にのみ、それら合致率の算出に用いた意味判定対象情報と比較対象情報を抽出する
ことを特徴とする請求項1に記載の意味的対応付け装置。
The semantic determination target information is attribute information registered in the information provider database in association with the first element name, and third definition information that defines the meaning of the word represented by the attribute information. Hold
The comparison target information holds attribute information registered in the database in association with the second element name, and fourth definition information represented by a sentence that defines the meaning of the word represented by the attribute information. And
The sentence represented by the fourth definition information is subjected to morphological analysis to extract a word representing the fourth definition information. Based on the combination of the extracted meaning determination target information and comparison target information, the third and attribute information matching ratio calculation means for calculating a matching rate of words and word representing the definition information indicating the fourth definition information,
Attribute information match rate determination means for determining whether the match rate between the word representing the third definition information and the word representing the fourth definition information is equal to or greater than a second threshold;
The extraction means is further used to calculate the match rate only when the match rate between the word representing the third definition information and the word representing the fourth definition information is greater than or equal to the second threshold. The semantic matching device according to claim 1, wherein the semantic determination target information and the comparison target information are extracted.
前記抽出手段は、前記第1の定義情報を表す単語と前記第2の定義情報を表す単語の合致率が、前記第1の閾値以上となった意味判定対象情報と比較対象情報の組み合わせのうち、最も合致率の高い意味判定対象情報と比較対象情報の組み合わせを抽出する
ことを特徴とする請求項1に記載の意味的対応付け装置。
The extraction means includes a combination of meaning determination target information and comparison target information in which a match rate between the word representing the first definition information and the word representing the second definition information is equal to or higher than the first threshold. The semantic association device according to claim 1, wherein a combination of semantic determination target information and comparison target information having the highest match rate is extracted.
前記抽出手段は、前記第3の定義情報を表す単語と前記第4の定義情報を表す単語の合致率が、前記第2の閾値以上となった意味判定対象情報と比較対象情報の組み合わせのうち、最も合致率の高い意味判定対象情報と比較対象情報の組み合わせを抽出する
ことを特徴とする請求項2または請求項3記載の意味的対応付け装置。
The extraction means includes a combination of meaning determination target information and comparison target information in which a match rate between the word representing the third definition information and the word representing the fourth definition information is equal to or greater than the second threshold. The semantic association device according to claim 2 or 3, wherein a combination of semantic determination target information and comparison target information having the highest match rate is extracted.
少なくとも、前記要素名、前記第1の定義情報を表す単語、前記第3の定義情報を表す単語が、前記意味判定対象情報に格納されているかを判定する構成判定手段と、
を備えることを特徴とする請求項1から請求項5の何れかに記載の意味的対応付け装置。
Configuration determination means for determining whether at least the element name, the word representing the first definition information, and the word representing the third definition information are stored in the meaning determination target information;
The semantic association device according to any one of claims 1 to 5, further comprising:
前記抽出手段の抽出した意味判定対象情報と比較対象情報の組み合わせを記憶する対応付け結果記憶手段と、Association result storage means for storing a combination of semantic determination target information and comparison target information extracted by the extraction means;
前記意味判定対象情報の要素の属性情報についての実データの変更通知であって、前記意味判定対象情報の要素の属性情報の識別情報が含まれる変更通知を受け付けた場合に、当該変更通知に含まれる識別情報に基づいて前記対応付け結果記憶手段において記録されている意味判定対象情報と組み合わせとなる比較対象情報を特定して、その比較対象情報の属性情報についての実データを、前記変更通知で受け付けた実データへと書き換える評価後処理手段と、  Included in the change notification when the change notification of the actual data regarding the attribute information of the element of the semantic determination target information is received and includes the identification information of the attribute information of the element of the semantic determination target information Identifying comparison target information to be combined with the semantic determination target information recorded in the association result storage means based on the identification information to be obtained, and the actual data about the attribute information of the comparison target information in the change notification Post-evaluation processing means for rewriting the received actual data;
を備えることを特徴とする請求項2,3,5の何れか一項に記載の意味的対応付け装置。  The semantic association device according to any one of claims 2, 3, and 5.
意味的対応付け装置における処理方法であって、
前記意味的対応付け装置の意味判定対象情報受信手段が、意味判定対象情報の要素を単語で表した第1の要素名と、当該第1の要素名が表す前記単語の意味を定義する第1の定義情報とを少なくとも対応付けて保持した前記意味判定対象情報を情報提供元より受信し、
前記意味的対応付け装置の比較対象情報記憶手段が、比較対象としての単語で表される第2の要素名と、その第2の要素名の意味を定義する文章で表された第2の定義情報とを少なくとも対応付けて保持した比較対象情報を一つ又は複数記憶し、
前記意味的対応付け装置の要素情報合致率算出手段が、前記第2の定義情報で表される前記文章を形態素解析して前記第2の定義情報を表す単語を抽出し、前記第1の定義情報を表す単語と前記第2の定義情報を表す単語の合致率を算出し、
前記意味的対応付け装置の要素情報合致率判定手段が、前記第1の定義情報を表す単語と前記第2の定義情報を表す単語の合致率が第1の閾値以上かを判定し、
前記意味的対応付け装置の抽出手段が、前記第1の定義情報を表す単語と前記第2の定義情報を表す単語の合致率が、前記第1の閾値以上である場合に、それら合致率の算出に用いた意味判定対象情報と比較対象情報との組を抽出し、
前記意味的対応付け装置の情報出力手段が、指定された比較対象情報と組で前記抽出された意味判定対象情報を出力する
ことを特徴とする処理方法。
A processing method in a semantic association device,
A semantic determination target information receiving unit of the semantic association device defines a first element name representing an element of the semantic determination target information as a word and a meaning of the word represented by the first element name. The semantic determination target information that is stored in association with at least the definition information from the information provider,
The comparison object information storage means of the semantic association device has a second element name represented by a word as a comparison object and a second definition represented by a sentence defining the meaning of the second element name. Storing one or a plurality of pieces of comparison target information held in association with at least information;
The element information coincidence rate calculating means of the semantic association device extracts a word representing the second definition information by performing morphological analysis on the sentence represented by the second definition information, and the first definition calculating a matching ratio of a word representing the second definition information words representing the information,
The element information match rate determination means of the semantic association device determines whether the match rate between the word representing the first definition information and the word representing the second definition information is greater than or equal to a first threshold,
When the extraction means of the semantic association device has a match rate between the word representing the first definition information and the word representing the second definition information equal to or higher than the first threshold, Extract the set of semantic judgment target information and comparison target information used in the calculation,
The processing method characterized in that the information output means of the semantic association device outputs the extracted semantic determination target information in combination with specified comparison target information.
意味的対応付け装置における処理方法であって、
前記意味的対応付け装置の意味判定対象情報受信手段が、意味判定対象情報の要素の属性情報の表す単語の意味を定義する第3の定義情報を保持した前記意味判定対象情報を情報提供元より受信し、
前記意味的対応付け装置の比較対象情報記憶手段が、比較対象としての単語の属性情報が表す単語の意味を定義する文章で表された第4の定義情報を保持した比較対象情報を一つ又は複数記憶し、
前記意味的対応付け装置の属性情報合致率算出手段が、前記第4の定義情報で表される前記文章を形態素解析して前記第4の定義情報を表す単語を抽出し、前記第3の定義情報を表す単語と前記第4の定義情報を表す単語の合致率を算出し、
前記意味的対応付け装置の属性情報合致率判定手段が、前記第3の定義情報を表す単語と前記第4の定義情報を表す単語の合致率が第2の閾値以上かを判定し、
前記意味的対応付け装置の抽出手段が、前記第3の定義情報を表す単語と前記第4の定義情報を表す単語の合致率が、前記第2の閾値以上である場合に、それら合致率の算出に用いた意味判定対象情報と比較対象情報とを抽出し、
前記意味的対応付け装置の情報出力手段が、指定された比較対象情報と組で前記抽出された意味判定対象情報を出力する
ことを特徴とする処理方法。
A processing method in a semantic association device,
The semantic determination target information receiving means of the semantic association device receives the semantic determination target information holding third definition information defining the meaning of the word represented by the attribute information of the element of the semantic determination target information from the information provider. Receive,
The comparison object information storage means of the semantic association device has one or more pieces of comparison object information holding fourth definition information represented by sentences defining the meaning of the word represented by the attribute information of the word as the comparison object Remember multiple,
The attribute information match rate calculation means of the semantic association device extracts a word representing the fourth definition information by performing morphological analysis on the sentence represented by the fourth definition information, and the third definition calculating a matching ratio of the words representing the fourth definition information words representing the information,
The attribute information match rate determination means of the semantic association device determines whether the match rate between the word representing the third definition information and the word representing the fourth definition information is equal to or greater than a second threshold;
When the extraction means of the semantic association device has a match rate between the word representing the third definition information and the word representing the fourth definition information equal to or greater than the second threshold, Extract the semantic determination target information and comparison target information used in the calculation,
The processing method characterized in that the information output means of the semantic association device outputs the extracted semantic determination target information in combination with specified comparison target information.
前記意味判定対象情報が、前記第1の要素名に対応付けられて前記情報提供元のデータベースに登録されている属性情報と、当該属性情報が表す単語の意味を定義する第3の定義情報とを保持し、
前記意味的対応付け装置の前記比較対象情報が、前記第2の要素名に対応付けられてデータベースに登録される属性情報と、当該属性情報が表す単語の意味を定義する文章で表された第4の定義情報とを保持し、
前記意味的対応付け装置の属性情報合致率算出手段が、前記第4の定義情報で表される文章を形態素解析して前記第4の定義情報を表す単語を抽出し、前記抽出した意味判定対象情報と比較対象情報との組みに基づいて、前記第3の定義情報を表す単語と前記第4の定義情報を表す単語の合致率を算出し、
前記意味的対応付け装置の属性情報合致率判定手段が、前記第3の定義情報を表す単語と前記第4の定義情報を表す単語の合致率が第2の閾値以上かを判定し、
前記意味的対応付け装置の前記抽出手段は、さらに、前記第3の定義情報を表す単語と前記第4の定義情報を表す単語の合致率が前記第2の閾値以上である場合にのみ、それら合致率の算出に用いた意味判定対象情報と比較対象情報を抽出する
ことを特徴とする請求項に記載の処理方法。
The semantic determination target information is attribute information registered in the information provider database in association with the first element name, and third definition information that defines the meaning of the word represented by the attribute information. Hold
The comparison target information of the semantic association device is attribute information registered in the database in association with the second element name, and a sentence that defines the meaning of the word represented by the attribute information. 4 definition information,
The attribute information coincidence rate calculating means of the semantic association device extracts a word representing the fourth definition information by performing morphological analysis on the sentence represented by the fourth definition information, and the extracted semantic determination target based on the set of information and the comparison information, and calculates the matching rate of the words representing the third and the fourth definition information words representing the definition information,
The attribute information match rate determination means of the semantic association device determines whether the match rate between the word representing the third definition information and the word representing the fourth definition information is equal to or greater than a second threshold;
The extraction means of the semantic association device further includes only when the match rate between the word representing the third definition information and the word representing the fourth definition information is equal to or greater than the second threshold. The processing method according to claim 8 , wherein the semantic determination target information and the comparison target information used for calculating the match rate are extracted.
比較対象としての単語で表される第2の要素名と、その第2の要素名の意味を定義する文章で表された第2の定義情報とを少なくとも対応付けて保持した比較対象情報を一つ又は複数記憶する比較対象情報記憶手段を備えた意味的対応付け装置のコンピュータを、
意味判定対象情報の要素を単語で表した第1の要素名と、当該第1の要素名が表す前記単語の意味を定義する第1の定義情報とを少なくとも対応付けて保持した前記意味判定対象情報を情報提供元より受信する意味判定対象情報受信手段、
前記第2の定義情報で表される前記文章を形態素解析して前記第2の定義情報を表す単語を抽出し、前記第1の定義情報を表す単語と前記第2の定義情報を表す単語の合致率を算出する要素情報合致率算出手段、
前記第1の定義情報を表す単語と前記第2の定義情報を表す単語の合致率が第1の閾値以上かを判定する要素情報合致率判定手段、
前記第1の定義情報を表す単語と前記第2の定義情報を表す単語の合致率が、前記第1の閾値以上である場合に、それら合致率の算出に用いた意味判定対象情報と比較対象情報との組を抽出する抽出手段、
指定された比較対象情報と組で前記抽出された意味判定対象情報を出力する情報出力手段、
として機能させることを特徴とするプログラム。
One piece of comparison object information is stored in association with at least the second element name represented by the word as the comparison object and the second definition information represented by the sentence defining the meaning of the second element name. A computer of a semantic association device provided with comparison target information storage means for storing one or more,
The meaning determination target that holds at least the first element name that represents the element of the meaning determination target information in words and the first definition information that defines the meaning of the word represented by the first element name Meaning determination target information receiving means for receiving information from an information provider,
Wherein said sentences are represented by the second definition information by morphological analysis to extract a word representing the second definition information, the word representing the said a word representing the first definition information second definition information Element information match rate calculation means for calculating the match rate,
Element information match rate determination means for determining whether the match rate between the word representing the first definition information and the word representing the second definition information is greater than or equal to a first threshold;
When the match rate between the word representing the first definition information and the word representing the second definition information is equal to or higher than the first threshold, the semantic determination target information and the comparison target used to calculate the match rate Extraction means for extracting a pair with information,
Information output means for outputting the extracted semantic determination target information in combination with the specified comparison target information;
A program characterized by functioning as
比較対象としての単語の属性情報が表す単語の意味を定義する文章で表された第4の定義情報を保持した比較対象情報を一つ又は複数記憶する比較対象情報記憶手段を備えた意味的対応付け装置のコンピュータを、
意味判定対象情報の要素の属性情報の表す単語の意味を定義する第3の定義情報を保持した前記意味判定対象情報を情報提供元より受信する意味判定対象情報受信手段、
前記第4の定義情報で表される前記文章を形態素解析して前記第4の定義情報を表す単語を抽出し、前記第3の定義情報を表す単語と前記第4の定義情報を表す単語の合致率を算出する属性情報合致率算出手段、
前記第3の定義情報を表す単語と前記第4の定義情報を表す単語の合致率が第2の閾値以上かを判定する属性情報合致率判定手段、
前記第3の定義情報を表す単語と前記第4の定義情報を表す単語の合致率が、前記第2の閾値以上である場合に、それら合致率の算出に用いた意味判定対象情報と比較対象情報とを抽出する抽出手段、
指定された比較対象情報と組で前記抽出された意味判定対象情報を出力する情報出力手段、
として機能させることを特徴とするプログラム。
Semantic correspondence provided with comparison object information storage means for storing one or more pieces of comparison object information holding the fourth definition information represented by a sentence defining the meaning of the word represented by the word attribute information as the comparison object Mounting device computer,
Meaning determination target information receiving means for receiving from the information provider the meaning determination target information that holds the third definition information that defines the meaning of the word represented by the attribute information of the element of the meaning determination target information;
And morphological analysis of the sentence expressed by the fourth definition information extracting word representing the fourth definition information, the word representing the third and the fourth definition information words representing the definition information Attribute information match rate calculation means for calculating the match rate,
Attribute information match rate determination means for determining whether the match rate between the word representing the third definition information and the word representing the fourth definition information is greater than or equal to a second threshold;
When the match rate between the word representing the third definition information and the word representing the fourth definition information is greater than or equal to the second threshold value, the semantic determination target information and the comparison target used to calculate the match rate Extraction means for extracting information,
Information output means for outputting the extracted semantic determination target information in combination with the specified comparison target information;
A program characterized by functioning as
前記意味判定対象情報が、前記第1の要素名に対応付けられて前記情報提供元のデータベースに登録されている属性情報と、当該属性情報が表す単語の意味を定義する第3の定義情報とを保持し、
前記比較対象情報が、前記第2の要素名に対応付けられてデータベースに登録される属性情報と、当該属性情報が表す単語の意味を定義する文章で表された第4の定義情報とを保持し、
前記コンピュータを、さらに、
前記第4の定義情報で表される文章を形態素解析して前記第4の定義情報を表す単語を抽出し、前記抽出した意味判定対象情報と比較対象情報との組みに基づいて、前記第3の定義情報を表す単語と前記第4の定義情報を表す単語の合致率を算出する属性情報合致率算出手段、
前記第3の定義情報を表す単語と前記第4の定義情報を表す単語の合致率が第2の閾値以上かを判定する属性情報合致率判定手段、
として機能させ、
前記抽出手段が、さらに、前記第3の定義情報を表す単語と前記第4の定義情報を表す単語の合致率が前記第2の閾値以上である場合にのみ、それら合致率の算出に用いた意味判定対象情報と比較対象情報を抽出する
ことを特徴とする請求項11に記載のプログラム。
The semantic determination target information is attribute information registered in the information provider database in association with the first element name, and third definition information that defines the meaning of the word represented by the attribute information. Hold
The comparison target information holds attribute information registered in the database in association with the second element name, and fourth definition information represented by a sentence that defines the meaning of the word represented by the attribute information. And
Said computer further
The sentence represented by the fourth definition information is subjected to morphological analysis to extract a word representing the fourth definition information. Based on the combination of the extracted meaning determination target information and comparison target information, the third attribute information matching ratio calculation means for calculating a matching rate of words and word representing the definition information indicating the fourth definition information,
Attribute information match rate determination means for determining whether the match rate between the word representing the third definition information and the word representing the fourth definition information is greater than or equal to a second threshold;
Function as
The extraction means is used for calculating the match rate only when the match rate between the word representing the third definition information and the word representing the fourth definition information is greater than or equal to the second threshold. the program according to claim 11, which means the determination target information and extracting a comparison target information.
JP2009070472A 2009-03-23 2009-03-23 Semantic association apparatus, processing method thereof, and program Expired - Fee Related JP5250463B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009070472A JP5250463B2 (en) 2009-03-23 2009-03-23 Semantic association apparatus, processing method thereof, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009070472A JP5250463B2 (en) 2009-03-23 2009-03-23 Semantic association apparatus, processing method thereof, and program

Publications (2)

Publication Number Publication Date
JP2010224799A JP2010224799A (en) 2010-10-07
JP5250463B2 true JP5250463B2 (en) 2013-07-31

Family

ID=43041930

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009070472A Expired - Fee Related JP5250463B2 (en) 2009-03-23 2009-03-23 Semantic association apparatus, processing method thereof, and program

Country Status (1)

Country Link
JP (1) JP5250463B2 (en)

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3123836B2 (en) * 1992-11-10 2001-01-15 日本電信電話株式会社 Text type database device
JPH08249335A (en) * 1995-03-13 1996-09-27 Nippon Telegr & Teleph Corp <Ntt> Method and device for supporting key word collation
JP2004086782A (en) * 2002-08-29 2004-03-18 Hitachi Ltd Apparatus for supporting integration of heterogeneous database
JP2004110161A (en) * 2002-09-13 2004-04-08 Fuji Xerox Co Ltd Text sentence comparing device
JP4451624B2 (en) * 2003-08-19 2010-04-14 富士通株式会社 Information system associating device and associating method
JP4859456B2 (en) * 2005-12-27 2012-01-25 株式会社日立製作所 Data schema mapping program and computer system
JP4855080B2 (en) * 2006-01-13 2012-01-18 三菱電機株式会社 Schema integration support apparatus, schema integration support method of schema integration support apparatus, and schema integration support program
US8275783B2 (en) * 2007-08-01 2012-09-25 Nec Corporation Conversion program search system and conversion program search method

Also Published As

Publication number Publication date
JP2010224799A (en) 2010-10-07

Similar Documents

Publication Publication Date Title
US20070118351A1 (en) Apparatus, method and computer program product for translating speech input using example
JP6505421B2 (en) Information extraction support device, method and program
JP6737151B2 (en) Synonym expression extraction device, synonym expression extraction method, and synonym expression extraction program
US20150169676A1 (en) Generating a Table of Contents for Unformatted Text
CN102227723A (en) Device and method for supporting detection of mistranslation
JP5687312B2 (en) Digital information analysis system, digital information analysis method, and digital information analysis program
JP6662689B2 (en) Word judgment device
JP5355483B2 (en) Abbreviation Complete Word Restoration Device, Method and Program
JP5117744B2 (en) Word meaning tag assigning device and method, program, and recording medium
JP5342760B2 (en) Apparatus, method, and program for creating data for translation learning
JP2011028379A (en) Program and device for converting data structure
CN110634480B (en) Voice dialogue system and model creation device and method thereof
JP5290218B2 (en) Document simplification device, simplification rule table creation device, and program
JP5250463B2 (en) Semantic association apparatus, processing method thereof, and program
JP2018045657A (en) Learning device, program parameter and learning method
JP7045970B2 (en) Risk identification equipment, risk identification methods, and programs
JP2006309377A (en) Document retrieval device, document retrieval method, its program, and recording medium
KR102519955B1 (en) Apparatus and method for extracting of topic keyword
JP5417359B2 (en) Document evaluation support system and document evaluation support method
JP2018147205A (en) Information processing device and information processing program
JP2013182580A (en) Identity vector construction device, identity vector construction method, predicate similarity calculation device, predicate similarity calculation method and predicate similarity calculation program
JP2008046850A (en) Document type determination device, and document type determination program
JP5853090B2 (en) Digital information analysis system, digital information analysis method, and digital information analysis program
JP2003006190A (en) Device, method and program for preparing dictionary, device, method and program for automatic translation, computer-readable recording medium with dictionary preparation program recorded thereon, computer readable recording medium with automatic translation program recorded thereon and preparation of translation sentence
JP5047209B2 (en) Error conversion pointing device and method for indicating error conversion based on conversion break position

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110317

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20121108

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121113

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130115

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130319

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130415

R150 Certificate of patent or registration of utility model

Ref document number: 5250463

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160419

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees