JP2020060988A - Name matching device and method - Google Patents

Name matching device and method Download PDF

Info

Publication number
JP2020060988A
JP2020060988A JP2018192245A JP2018192245A JP2020060988A JP 2020060988 A JP2020060988 A JP 2020060988A JP 2018192245 A JP2018192245 A JP 2018192245A JP 2018192245 A JP2018192245 A JP 2018192245A JP 2020060988 A JP2020060988 A JP 2020060988A
Authority
JP
Japan
Prior art keywords
name
word
sensing
matching
composite
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018192245A
Other languages
Japanese (ja)
Other versions
JP7114433B2 (en
Inventor
本村 哲朗
Tetsuro Motomura
哲朗 本村
泰芽 阿部
Taiga Abe
泰芽 阿部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2018192245A priority Critical patent/JP7114433B2/en
Publication of JP2020060988A publication Critical patent/JP2020060988A/en
Application granted granted Critical
Publication of JP7114433B2 publication Critical patent/JP7114433B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Testing And Monitoring For Control Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

To associate a site signal name of a power plant or a plant with a standard signal name used in an analysis substrate of data for using sensor data of various site signals in the analysis substrate.SOLUTION: A name matching device includes: a storage device that stores a word attribute dictionary in which two composite names composed of an object composite name and a standard composite name and an attribute of a word appearing in the composite names, and a syntax of the composite names composed of the word attribute; and a processing part which extracts keywords that characterize the composite name, matches the keywords extracted from the two composite names composed of the object composite name and the standard composite name, and calculates a matching degree of the two composite names.SELECTED DRAWING: Figure 1

Description

本発明は、名称マッチング技術に関する。   The present invention relates to name matching technology.

様々な「モノ(物)」がインターネットに接続され、情報交換することにより相互に制御する仕組みであるIoT(Internet of Things)が注目されている。発電所やプラントにおいてもIoTを利用し、各種センサデータを収集し、必要な情報を抽出して分析する基盤の整備が求められている。   IoT (Internet of Things), which is a mechanism in which various “things” are connected to the Internet and mutually controlled by exchanging information, is drawing attention. Power plants and plants are also required to develop a base for collecting various sensor data, extracting necessary information, and analyzing it by using IoT.

医学生物学分野の論文から研究者が興味を持つ情報を自動的に文献から抽出する技術として、特許文献1が挙げられる。   Patent Literature 1 is a technique for automatically extracting information of interest from researchers from articles in the field of medical biology.

特開2002−32374号公報JP-A-2002-32374

特許文献1は、学術文献等の文章である自然言語処理を対象とするため、文献を名詞等の用語と動詞等の並びに基づいて言語的に解析しているが、発電所やプラント等におけるセンサ信号のように、動詞が使われることのなく、一般の文章とは異なる体系からなり、自然言語処理が単純に適応できない情報の解析については、何ら言及されていない。   Since Patent Document 1 is intended for natural language processing that is a sentence of an academic document or the like, the document is linguistically analyzed based on terms such as nouns and verbs, but sensors in power plants, plants, etc. No mention is made of the analysis of information, such as signals, which does not use verbs and has a system different from that of ordinary sentences and in which natural language processing cannot simply be applied.

そこで、本発明の目的は、各種現場信号のセンサデータを分析基盤で利用するためデータの分析基盤で利用される標準信号名に、発電所やプラントの現場信号名を対応付ける名称マッチング装置及び方法を提供することを目的とする。   Therefore, an object of the present invention is to provide a name matching device and method for associating a field signal name of a power plant or a plant with a standard signal name used in the data analysis platform for using sensor data of various field signals in the analysis platform. The purpose is to provide.

本発明は、上記の課題を解決するための名称マッチング装置に関連し、その適用形態の一例を挙げるならば、名称マッチング装置は、対象複合名称と標準複合名称からなる二つの複合名称と、複合名称に出現するワードの属性を登録したワード属性辞書と、ワード属性から構成される複合名称の構文とを格納する記憶装置と、ワード属性辞書と複合名称の構文から、複合名称を特徴付けるキーワードを抽出する抽出し、対象複合名称と標準複合名称からなる二つの複合名称から抽出されたキーワード同士をマッチングして、二つの複合名称のマッチング度を算出する処理部とを有する。   The present invention relates to a name matching device for solving the above problems, and if an example of its application is given, the name matching device includes two compound names including a target compound name and a standard compound name, and a compound name. A word attribute dictionary in which the attributes of words appearing in a name are registered, a storage device that stores the syntax of a compound name composed of word attributes, and a keyword that characterizes the compound name is extracted from the word attribute dictionary and the syntax of the compound name. And a processing unit for matching the keywords extracted from the two compound names including the target compound name and the standard compound name to calculate the matching degree of the two compound names.

本発明によれば、対象複合名称と標準複合名称からなる二つの複合名称との対応付け、例えば、発電所やプラント等で用いられる各種センサの信号に含まれる現場信号名と分析基盤の標準信号名との対応付け、を効率よく行うことができる。   According to the present invention, the target compound name and the two compound names consisting of the standard compound name are associated with each other, for example, the field signal name included in the signals of various sensors used in the power plant or the plant and the standard signal of the analysis base. Correspondence with the name can be efficiently performed.

システムの全体構成の概要説明図。FIG. 2 is a schematic explanatory diagram of the overall configuration of the system. 信号名ファイルを示した図。The figure which showed the signal name file. 信号名マッチングリストを示した図。The figure which showed the signal name matching list. システムのハードウェア構成図。System hardware configuration diagram. システムの他のハードウェア構成図。The other hardware block diagram of a system. コンテクストマッチング内の前処理のフロー図。Flow chart of preprocessing in context matching. ワード属性を表すテーブルを示す図。The figure which shows the table showing a word attribute. 複数の意味づけを持つワードを示した図。Diagram showing words with multiple meanings. ワードの意味づけを決定するためのGUIを示した図。The figure which showed the GUI for determining the meaning of a word. 信号名のBNFの例を示した図。The figure which showed the example of BNF of a signal name. 信号名の構文木の例を示した図。The figure which showed the example of the syntax tree of a signal name. キーワード抽出とキーワードマッチングの処理フロー図。The processing flow figure of keyword extraction and keyword matching. キーワードの抽出ルールを示した図。The figure which showed the extraction rule of a keyword. 修飾ワードの抽出ルールを示した図。The figure which showed the extraction rule of a modifier word. マッチング度の計算方法を示した図。The figure which showed the calculation method of a matching degree. キーワードマッチング度計算のためのマッチング条件を示した図。The figure which showed the matching conditions for keyword matching degree calculation.

<明細書中の用語の定義>
以下、本発明の実施の形態を、図を用いて説明する。各図において、同一の構成には同一の符号を付す。
<Definition of terms in the specification>
Embodiments of the present invention will be described below with reference to the drawings. In each figure, the same components are designated by the same reference numerals.

以下、発明の実施の形態を、図面を参照して詳細に説明する。以下の記載および図面は、本発明を説明するための例示であって、説明の明確化のため、適宜、省略および簡略化がなされている。本発明は、他の種々の形態でも実施する事が可能である。特に限定しない限り、各構成要素は単数でも複数でも構わない。   Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings. The following description and drawings are exemplifications for explaining the present invention, and are appropriately omitted and simplified for clarifying the description. The present invention can be implemented in various other modes. Unless otherwise specified, each component may be singular or plural.

図面において示す各構成要素の位置、大きさ、形状、範囲などは、発明の理解を容易にするため、実際の位置、大きさ、形状、範囲などを表していない場合がある。このため、本発明は、必ずしも、図面に開示された位置、大きさ、形状、範囲などに限定されない。   The position, size, shape, range, etc. of each component shown in the drawings may not represent the actual position, size, shape, range, etc., for easy understanding of the invention. Therefore, the present invention is not necessarily limited to the position, size, shape, range, etc. disclosed in the drawings.

以下の説明では、「テーブル」、「リスト」、「キュー」等の表現にて各種情報を説明することがあるが、各種情報は、これら以外のデータ構造で表現されていてもよい。データ構造に依存しないことを示すために「XXテーブル」、「XXリスト」等を「XX情報」と呼ぶことがある。識別情報について説明する際に、「識別情報」、「識別子」、「名」、「ID」、「番号」、「Region」等の表現を用いるが、これらについてはお互いに置換が可能である。   In the following description, various information may be described by expressions such as “table”, “list”, “queue”, etc., but the various information may be expressed by a data structure other than these. “XX table”, “XX list”, etc. may be referred to as “XX information” to indicate that they do not depend on the data structure. In describing the identification information, expressions such as “identification information”, “identifier”, “name”, “ID”, “number”, and “Region” are used, but these can be replaced with each other.

同一あるいは同様な機能を有する構成要素が複数ある場合には、同一の符号に異なる添字を付して説明する場合がある。ただし、これらの複数の構成要素を区別する必要がない場合には、添字を省略して説明する場合がある。   When there are a plurality of constituent elements having the same or similar functions, the same reference numerals may be given with different subscripts. However, when it is not necessary to distinguish between these plural components, the subscripts may be omitted in the description.

また、以下の説明では、プログラムを実行して行う処理を説明する場合があるが、プログラムは、プロセッサ(例えばCPU、GPU)によって実行されることで、定められた処理を、適宜に記憶資源(例えば記憶装置)および/またはインターフェースデバイス(例えば通信ポート)等を用いながら行うため、処理の主体がプロセッサとされてもよい。同様に、プログラムを実行して行う処理の主体が、プロセッサを有するコントローラ、装置、システム、計算機、ノードであってもよい。プログラムを実行して行う処理の主体は、制御部であれば良く、特定の処理を行う専用回路(例えばFPGAやASIC)を含んでいてもよい。   Further, in the following description, a process performed by executing a program may be described, but the program is executed by a processor (for example, a CPU or GPU) so that a predetermined process can be performed as appropriate for a storage resource ( For example, since the processing is performed while using a storage device and / or an interface device (for example, a communication port), the main body of processing may be the processor. Similarly, the main body of processing executed by executing the program may be a controller having a processor, a device, a system, a computer, or a node. The main body of the processing executed by executing the program may be the control unit, and may include a dedicated circuit (for example, FPGA or ASIC) for performing the specific processing.

プログラムは、プログラムソースから計算機のような装置にインストールされてもよい。プログラムソースは、例えば、プログラム配布サーバまたは計算機が読み取り可能な記憶メディアであってもよい。プログラムソースがプログラム配布サーバの場合、プログラム配布サーバはプロセッサと配布対象のプログラムを記憶する記憶資源を含み、プログラム配布サーバのプロセッサが配布対象のプログラムを他の計算機に配布してもよい。また、以下の説明において、2以上のプログラムが1つのプログラムとして実現されてもよいし、1つのプログラムが2以上のプログラムとして実現されてもよい。   The program may be installed from a program source into a device such as a computer. The program source may be, for example, a program distribution server or a computer-readable storage medium. When the program source is the program distribution server, the program distribution server may include a processor and a storage resource for storing the distribution target program, and the processor of the program distribution server may distribute the distribution target program to another computer. Further, in the following description, two or more programs may be realized as one program, or one program may be realized as two or more programs.

<概要>
分析基盤で利用される標準信号名に、発電所やプラント等の現場信号名に対応付けられていた現場のセンサデータを対応付けるため、標準信号名と現場信号名を対応付ける必要がある。このように、分析基盤で現場信号名のような対象複合名称を解析しようとする場合、分析基盤で用いられる標準信号名のような標準複合名称との対応を行う必要がある。
<Outline>
In order to associate the standard signal name used in the analysis platform with the on-site sensor data that was associated with the on-site signal name of the power plant or plant, it is necessary to associate the standard signal name with the on-site signal name. As described above, when trying to analyze a target composite name such as a field signal name on the analysis platform, it is necessary to deal with a standard composite name such as a standard signal name used on the analysis platform.

しかし、複合名称である信号名は現場ごとに命名規則が異なるため、この対応付けは工数が必要となる。例えば、電力プラントでは、2000本程度の信号名に対して、現場信号を熟知するドメインエクスパートが2人月程度必要になるといわれている。   However, since the signal name, which is a composite name, has a different naming rule for each site, this association requires man-hours. For example, in a power plant, it is said that a domain expert familiar with on-site signals is required for about two man-months for about 2000 signal names.

そこで、二つの複合名称である標準信号名と現場信号名の対応付けを、プラントで共通の種類のキーワードを抽出して、キーワードをマッチングすることにより行う。以下、二つの複合名称を、理解を容易にするために標準信号名、現場信号名と具体的に記載するが、本発明がこれらに限定されることを意図するものではなく、一般の複合名称に適応可能であることは言うまでもない。   Therefore, the standard signal name and the field signal name, which are two compound names, are associated with each other by extracting keywords of a common type in the plant and matching the keywords. Hereinafter, the two composite names will be specifically described as a standard signal name and a field signal name for easy understanding, but the present invention is not intended to be limited to these, and a general composite name. Needless to say, it is applicable to.

(1)これらの信号名は、「デバイス」「センシングパラメタ」「位置」等の分野特有のワード属性を持つワードにより構成される複合名称となっている。信号名の構文は、このワード属性により構成されており、その構文は信号名がセンシング対象部とセンシング部からなることを示す。センシング対象部はセンシングする部位を示す部分であり、ここからデバイスなどのセンシングを行う部位に関するキーワードを抽出する。センシング部はどんなセンシングを行うかを示す部分で、センシングの種類を示すキーワードを抽出する。さらに、二つに分けられた部分の中で、ワード属性の出現順を示す構文によっても異なる種類のキーワードが抽出される。   (1) These signal names are compound names composed of words having field-specific word attributes such as “device”, “sensing parameter”, and “position”. The syntax of the signal name is composed of this word attribute, and the syntax indicates that the signal name consists of the sensing target section and the sensing section. The sensing target part is a part indicating a part to be sensed, and a keyword relating to a part to be sensed such as a device is extracted from here. The sensing unit is a part that indicates what kind of sensing is performed, and extracts a keyword that indicates the type of sensing. Furthermore, different types of keywords are extracted from the divided parts by the syntax indicating the appearance order of word attributes.

例えば、センシングパラメタ属性である「温度」という名称が信号名中のどこに出現するかで、「キーセンシングパラメタ」というキーワードとなるかが決まる。また、センシング対象部の中で、デバイス属性である「FDF」の出現順により、「メインデバイス」か「センシング対象デバイス」のいずれのキーワードとなるかが決まる。ここで述べたキーワードの種類の定義は後述する。   For example, where the name "temperature", which is the sensing parameter attribute, appears in the signal name determines whether it becomes the keyword "key sensing parameter". Further, in the sensing target unit, the keyword of “main device” or “sensing target device” is determined depending on the appearance order of the device attribute “FDF”. The definition of the types of keywords described here will be described later.

(2) (1)で抽出されたキーワードを元にして、さらに、キーワードに対する修飾ワードも信号名の構文から抽出する。   (2) Based on the keyword extracted in (1), the modifier word for the keyword is also extracted from the syntax of the signal name.

<システムの全体構成の概要>
図1は、システムの全体構成の概要説明図である。
ここで行う処理111はコンテクストマッチングと呼ぶ。コンテクストとはデータを意味づける情報の総称名であり、信号名が一例である。コンテクストマッチング111は、前処理112、キーワード抽出113、およびキーワードマッチング114からなる。前処理112はキーワード抽出113とキーワードマッチング114の処理を行い易くするためのデータ構造の変更であり、具体的には信号名をワード属性の表現の構文木に変換する。
<Overview of overall system configuration>
FIG. 1 is a schematic explanatory diagram of the overall configuration of the system.
The process 111 performed here is called context matching. The context is a generic name of information that means data, and a signal name is an example. The context matching 111 includes preprocessing 112, keyword extraction 113, and keyword matching 114. The preprocessing 112 is a modification of the data structure for facilitating the processing of the keyword extraction 113 and the keyword matching 114. Specifically, the signal name is converted into a syntax tree of a word attribute expression.

キーワード抽出113は信号名からキーワードと修飾ワード、および特有の特性を抽出する処理である。キーワードマッチング114は、標準信号名と現場信号名のキーワードと修飾ワード、および特性のマッチングを行ってマッチング度を計算し、信号名マッチングリスト115を出力する。信号名マッチングリスト115の結果を見て、ユーザが対応信号を最終決定する(117)。以上の処理の詳細は後述する。   The keyword extraction 113 is a process of extracting a keyword, a modifier word, and a unique characteristic from the signal name. The keyword matching 114 calculates the matching degree by matching the keyword of the standard signal name and the keyword of the field signal, the modifier word, and the characteristic, and outputs the signal name matching list 115. The user finally determines the corresponding signal by looking at the result of the signal name matching list 115 (117). Details of the above processing will be described later.

入力情報として、信号情報108と電力などのある分野に共通に用いられる入力情報101があり、出力情報として、信号名マッチングリスト115がある。中間出力情報として、信号名から抽出されたキーワード情報105がある。   Input information includes signal information 108 and input information 101 commonly used in a certain field such as electric power, and output information includes a signal name matching list 115. As the intermediate output information, there is keyword information 105 extracted from the signal name.

入力情報101には、種々のワード属性辞書103と、ワード属性により信号名の構文を表現したBNF(Backus−Naur form)104がある。信号情報108は、標準信号に対しては、標準信号名109と標準信号の単位1029がある。現場信号に対しても、同様に現場信号名110と単位1020がある。ここで単位とは信号のデータの単位を示し、単位を見て電圧や温度などの信号の意味が判断できる情報である。   The input information 101 includes various word attribute dictionaries 103 and a BNF (Backus-Naur form) 104 that expresses the syntax of a signal name by word attributes. The signal information 108 has a standard signal name 109 and a standard signal unit 1029 for a standard signal. For the field signal, similarly, there is a field signal name 110 and a unit 1020. Here, the unit is a unit of signal data, and is information that allows the meaning of the signal such as voltage and temperature to be determined by looking at the unit.

出力情報115には、現場信号名に対する標準信号名の候補リストを、両者の一致度を表すマッチング度共に出力する。   As the output information 115, a standard signal name candidate list for the field signal name is output together with the matching degree indicating the matching degree between the two.

中間出力情報105には、標準信号名と現場信号名の各々に対してキーワード、修飾ワード、および特性を抽出した結果を出力する。   In the intermediate output information 105, the result of extracting the keyword, the modifier word, and the characteristic for each of the standard signal name and the field signal name is output.

コンテクストマッチング111の機能の概要を示すため、主要な入力である、標準信号名109、現場信号名110、及び標準信号名と現場信号名とのマッチングリスト(信号名マッチングリスト)115を、図2と図3に従い説明する。   In order to show the outline of the function of the context matching 111, the standard signal name 109, the field signal name 110, and the matching list (signal name matching list) 115 of the standard signal name and the field signal name, which are the main inputs, are shown in FIG. Will be described with reference to FIG.

図2(A)は、標準信号名109を、図2(B)は現場信号名110を示している。信号ID501は、信号を一意に特定するためのIDである。信号名502は信号名を表している。例えば、標準信号ファイル500の信号ID「002」の標準信号名は「A・FDF 用 電動機 軸受 温度」であることを示している。また、現場信号ファイル510の信号ID「002」の現場信号名は「A・FDF 軸受 温度」であること示している。   2A shows the standard signal name 109, and FIG. 2B shows the on-site signal name 110. The signal ID 501 is an ID for uniquely identifying the signal. The signal name 502 represents the signal name. For example, the standard signal name of the signal ID “002” in the standard signal file 500 indicates that it is “A / FDF motor bearing temperature”. In addition, the field signal name of the signal ID “002” of the field signal file 510 is “A / FDF bearing temperature”.

図3は、信号名マッチングリスト115を示した図である。現場信号名601と標準信号名候補602、マッチング度603、結果604が対応して記憶される。例えば、現場信号名601が「Aボイラ出力温度」の場合、標準信号名候補602として「Aボイラ出力温度」と「Aボイラ入力湿度」がある。そして、「Aボイラ出力温度」のマッチング度603は「1」、「Aボイラ入力湿度」のマッチング度603は「0.83」と計算される。この計算値を元にユーザにより最終マッチング決定117が行われる。マッチング度の計算の詳細については後述する。   FIG. 3 is a diagram showing the signal name matching list 115. A field signal name 601, a standard signal name candidate 602, a matching degree 603, and a result 604 are stored in association with each other. For example, when the site signal name 601 is “A boiler output temperature”, the standard signal name candidates 602 are “A boiler output temperature” and “A boiler input humidity”. Then, the matching degree 603 of "A boiler output temperature" is calculated as "1", and the matching degree 603 of "A boiler input humidity" is calculated as "0.83". The user makes a final matching decision 117 based on this calculated value. Details of the calculation of the matching degree will be described later.

以降では、まず、図4と図5に従い、システムのハードウェア構成を述べた後、図1で示したコンテクストマッチング111を構成する各処理について述べる。   In the following, first, the hardware configuration of the system will be described with reference to FIGS. 4 and 5, and then each process that configures the context matching 111 shown in FIG.

<システムのハードウェア構成>
図4は、システムのハードウェア構成図である。計算機202は、一般のサーバやパーソナルコンピュータ(PC)と同様の構成である。計算機202は、処理部203、各種情報やプログラムを格納する記憶装置205、メモリ204によって構成され、表示装置201に接続されている。処理部203は、本発明を実現するプログラムをメモリ204に読み込み、実行することで各種機能を実現する。
<System hardware configuration>
FIG. 4 is a hardware configuration diagram of the system. The computer 202 has the same configuration as a general server or personal computer (PC). The computer 202 includes a processing unit 203, a storage device 205 that stores various information and programs, and a memory 204, and is connected to the display device 201. The processing unit 203 implements various functions by reading a program that implements the present invention into the memory 204 and executing it.

記憶装置205には、信号の単位102(標準信号の単位1029、現場信号の単位1020)、ワード属性辞書103、信号構文BNF104、標準信号名キーワード106、現場信号名キーワード107、標準信号名109、現場信号名110、信号名マッチングリスト115が格納され、処理部203によってコンテクストマッチング処理111を行う。   In the storage device 205, the signal unit 102 (standard signal unit 1029, field signal unit 1020), word attribute dictionary 103, signal syntax BNF 104, standard signal name keyword 106, field signal name keyword 107, standard signal name 109, The field signal name 110 and the signal name matching list 115 are stored, and the processing unit 203 performs the context matching processing 111.

図5は、図4に示したシステムハードウェア構成図の他の例である。計算機202は図4と同様の構成となるが、計算機はインターネット等のネットワーク303に接続される。ネットワーク303に接続される端末302に表示装置301がある。ユーザは端末302を用いて、ネットワーク303に接続される計算機と通信することで、図1のワード決定116や最終マッチング決定117を行う。   FIG. 5 is another example of the system hardware configuration diagram shown in FIG. The computer 202 has the same configuration as that of FIG. 4, but the computer is connected to the network 303 such as the Internet. The terminal 302 connected to the network 303 has a display device 301. The user uses the terminal 302 to communicate with a computer connected to the network 303 to make the word determination 116 and the final matching determination 117 of FIG.

以降では、コンテクストマッチング111を構成する各処理について述べる。   Hereinafter, each process that constitutes the context matching 111 will be described.

<前処理>
図6は、前処理のフロー図であり、図1の前処理112の詳細とその後のキーワード抽出処理の概要を示す。
<Pretreatment>
FIG. 6 is a flowchart of the preprocessing, showing the details of the preprocessing 112 in FIG. 1 and the outline of the subsequent keyword extraction processing.

前処理112は、標準信号名109と現場信号名110の各々に対して、各々の信号の単位1029と1020、ワード属性辞書103、信号名の構文規則であるBNF104を入力して、標準信号名の構文木410と現場信号名の構文木411を出力する。   The preprocessing 112 inputs the unit 1029 and 1020 of each signal, the word attribute dictionary 103, and the BNF 104, which is a syntax rule of the signal name, to each of the standard signal name 109 and the field signal name 110, and inputs the standard signal name. It outputs the syntax tree 410 of and the syntax tree 411 of the field signal name.

最初の処理、形態素解析401は、信号名をワード単位に分割する処理である。ワード属性辞書103はワード属性に属するワードが記載されており、ワードの種類を示す辞書ということもできる。この辞書を利用して、信号名をワード単位に分割する。その後、ワード属性変換402により、信号名内の分割されたワードをワード属性に変換する。最後にパーサ404により、信号名を構文とワード属性により表現される構文木に変換する。ここでパーサ404はBNF104をパーサジェネレータ403により自動生成する。形態素解析、BNF、パーサジェネレータは公知の表現と技術であり、ここでは説明は割愛する。   The first process, morphological analysis 401, is a process of dividing the signal name into word units. The word belonging to the word attribute is described in the word attribute dictionary 103, and can also be referred to as a dictionary indicating the type of word. The signal name is divided into words using this dictionary. Then, the word attribute conversion 402 converts the divided words in the signal name into word attributes. Finally, the parser 404 converts the signal name into a syntax tree represented by the syntax and word attributes. Here, the parser 404 automatically generates the BNF 104 by the parser generator 403. Morphological analysis, BNF, and parser generator are well-known expressions and techniques, and will not be described here.

以下では、形態素解析401、ワード属性変換402、パーサ404の各処理について説明する。
形態素解析401の入力であるワード属性辞書103は、ワード属性ごとにワードを分類した辞書である。図7は、ワード属性を表すテーブルを示す図で、ワード属性702ごとにワードを分類したファイルがワード属性辞書103である。例えば、ワード属性702が「デバイス」の場合、ワードの例703として「押込みファン(FDF)」が含まれる。ワード属性は、図7に示す、Device(デバイス)、Position in Device(デバイスにおける位置)、Sensing Parameter(センシングパラメタ)、Material(センシングされる物質)、Input from Control Computer(制御コンピュータ入力)の5種類がある。信号名に含まれるこれ以外のワードは一般ワードの属性とする。本発明の処理には関係ないので、詳細は割愛する。
Hereinafter, each processing of the morphological analysis 401, the word attribute conversion 402, and the parser 404 will be described.
The word attribute dictionary 103, which is an input to the morphological analysis 401, is a dictionary in which words are classified according to word attributes. FIG. 7 is a diagram showing a table showing word attributes, and a file in which words are classified for each word attribute 702 is a word attribute dictionary 103. For example, when the word attribute 702 is “device”, the word example 703 includes “push fan (FDF)”. There are five types of word attributes, as shown in FIG. 7, that is, Device (Position in Device), Sensing Parameter, Material (Sensing Parameter), Input from Control Computer (Control computer input). There is. Other words included in the signal name are attributes of the general word. Details are omitted because they are not related to the processing of the present invention.

形態素解析401では、ワード属性辞書からワードの種類を読み取り、信号名をワードごとに分割する。
ワード属性変換402は、この変換された表現を用いて、信号名内の分割されたワードをワード属性に変換する。ここで一つ注意点がある。ワードによっては、同じワードの表現を用いていながら、異なる意味のワードを意味しているケースがある。この場合は、どちらの意味で用いているかをユーザに問い合わせて元の信号名のワードを変換する。例えば、図8の例では、電圧というワードが、意味として電圧というワードを意味する場合と温度というワードを意味する場合があり、どちらの意味を示すかを決定する必要がある。この決定は図9に示すGUIによってユーザに決定してもらう。
In the morphological analysis 401, the word type is read from the word attribute dictionary and the signal name is divided for each word.
The word attribute conversion 402 uses this converted representation to convert the split words in the signal name to word attributes. There is one caveat here. Depending on the word, there are cases where the same word expression is used but different words are meant. In this case, the user is asked which meaning it is used to convert the word of the original signal name. For example, in the example of FIG. 8, the word voltage may mean the word voltage or the word temperature, and it is necessary to determine which the word means. This decision is made by the user using the GUI shown in FIG.

最後に、パーサ404を説明する。
パーサ404はBNF104で示す信号名の構文を用いて、標準信号名109、現場信号名110の各々を構文木410、411に変換する。ここでは、BNF104と構文木の表現について説明する。これらの利用方法は後述する。
Finally, the parser 404 will be described.
The parser 404 converts each of the standard signal name 109 and the field signal name 110 into syntax trees 410 and 411 using the syntax of the signal name indicated by the BNF 104. Here, the BNF 104 and the representation of the syntax tree will be described. How to use these will be described later.

図10に信号名のBNF104の例を示す。ここでBNFの表現をその文法と共に簡単に説明しておく。詳細な文法は一般のコンパイラのドキュメントなどを参照されたい。左の表現は右の表現で定義することを示す。このとき左と右は”:”で区分する。右が複数の構成要素から構成されているときには、構成要素の間は空白で区切る。右の表現が、複数の表現のいずれかのOR(オア)であるときには、各表現を”|”で区切る。   FIG. 10 shows an example of the signal name BNF 104. Here, I will briefly explain the expression of BNF together with its grammar. For detailed grammar, refer to general compiler documentation. The expression on the left indicates that it is defined by the expression on the right. At this time, the left and right are separated by ":". When the right side consists of multiple components, the components are separated by a space. When the expression on the right is an OR of multiple expressions, each expression is separated by "|".

1601は、信号名(signal_name)が、センシング対象部(sensing_target_part)とセンシング部(sensing_part)から構成することを示す。センシング対象部は、このBNF表現で定義できるが、別の表現を用いると、信号名の最初からデバイスまたは位置の属性のワードで終了する部分までで定義する。センシング部は信号名の中でセンシング対象部以外の残りの部分を示す。   Reference numeral 1601 indicates that the signal name (signal_name) is composed of a sensing target part (sensing_target_part) and a sensing part (sensing_part). Although the sensing target part can be defined by this BNF expression, if another expression is used, it is defined from the beginning of the signal name to the part ending with the word of the attribute of the device or position. The sensing unit indicates the rest of the signal name other than the sensing target unit.

これらの構成要素はさらに、他の構成要素により定義できる。1602はセンシング対象部が、センシングsensing_target_series)で表現されることを示す。sensing_taret_seriesはセンシング対象(sensing_target)が複数連なることを示す。1603では、センシング対象(sensing_target)が、センシング対象属性(sensing_taget_attribute)か、補助語のシリーズ(complimentary_series)とセンシング対象属性からなることを示す。1604で、センシング対象属性は、デバイスのワード属性(DECVICE)または位置のワード属性(POSISION)であることを示す。1605で、補助語は、修飾語(modifying_word)か識別子(ID_part)であることを示す。1606で、修飾語は物質のワード属性(MATERIAL)か、センシングパラメタのワード属性(SENSING_PARAMETER)か、一般語のワード属性(GENERAL_WORD)か、接尾語のワード属性(POSTFIX)のいずれかであることを示す。1607で、センシング部は、センシング属性のシリーズ(sensing_attribute_series)か、一般トークンのシリーズ(general_token_series)とセンシング属性のシリーズからなることを示す。一般トークンシリーズは、図7で示したセンシング特有のワード属性以外の一般のワード属性のシリーズを示す。センシング属性は1608で示すように、センシングパラメタのワード属性(SENSING_PARAMETER)か、物質のワード属性(MATERIAL)か、制御コンピュータ入力のワード属性(Input from Control Computer)からなることを示す。   These components can be further defined by other components. Reference numeral 1602 indicates that the sensing target part is represented by sensing sensing_target_series). sensing_taret_series indicates that a plurality of sensing targets (sensing_target) are connected. 1603 indicates that the sensing target (sensing_target) is made up of a sensing target attribute (sensing_taget_attribute) or a series of auxiliary words (complimentary_series) and a sensing target attribute. At 1604, it indicates that the sensing target attribute is a device word attribute (DECVICE) or a position word attribute (POSISION). At 1605, the auxiliary word is a modifier (modifying_word) or an identifier (ID_part). In 1606, the modifier is either the substance word attribute (MATERIAL), the sensing parameter word attribute (SENSING_PARAMETER), the generic word attribute (GENERAL_WORD), or the suffix word attribute (POSTFIX). Show. At 1607, it is indicated that the sensing unit includes a sensing attribute series (sensing_attribute_series) or a general token series (general_token_series) and a sensing attribute series. The general token series indicates a series of general word attributes other than the sensing-specific word attributes shown in FIG. 7. As indicated by 1608, the sensing attribute is composed of a sensing parameter word attribute (SENSING_PARAMETER), a substance word attribute (MATERIAL), or a control computer input word attribute (Input from Control Computer).

パーサ404は、信号名がBNF104に従う構文となっていることをチェックして、このBNFに従っていなければエラーとなり、従っていれば構文木の表現に変換する。図11に「A・FDF 用 電動機 軸受 温度」の信号名の構文木を示す。最上位のノード1701が信号名(signal_name)であり、BNF104の定義通り、信号名(signal_name)が、センシング対象部(sensing_target_part)とセンシング部(sensing_part)からなることを、その下の階層1702で示す。同様にして、BNF104通りに下位の階層で表現していくと、「A・B FDF 軸受」までが、センシング対象部(sensing_target_part)で、「A・」が識別子(ID_part)であり、「FDF」が装置(DEVICE)であり、「軸受」が装置(DEVICE)であることが解析できる。同様にして、センシング部(sensing_part)は「温度」の部分であり、「温度」はセンシングパラメータ(SENSING_PARAMETR)であることが解析できる。このように、信号名に含まれるキーワードがセンシング対象部かセンシング部であるかを把握できる。   The parser 404 checks that the signal name has a syntax conforming to the BNF 104, and if it does not conform to this BNF, an error occurs, and if so, it converts it into a syntax tree expression. Fig. 11 shows the syntax tree of the signal name of "motor for A / FDF bearing temperature". The highest-level node 1701 is a signal name (signal_name), and as defined by the BNF 104, the signal name (signal_name) is composed of a sensing target part (sensing_target_part) and a sensing part (sensing_part), which is shown in the lower layer 1702. . In the same way, when expressed in the lower hierarchy as BNF104, up to "A / B FDF bearing" is the sensing target part (sensing_target_part), "A ・" is the identifier (ID_part), and "FDF" Can be analyzed as a device (DEVICE) and the "bearing" as a device (DEVICE). Similarly, it can be analyzed that the sensing part (sensing_part) is a “temperature” part, and the “temperature” is a sensing parameter (SENSING_PARAMETR). In this way, it is possible to know whether the keyword included in the signal name is the sensing target unit or the sensing unit.

<キーワード抽出113とキーワードマッチング114>
キーワード抽出113は、全ての現場信号名と標準信号名に対して、キーワードなどのマッチング対象となるキーワードと修飾ワード、および特性を抽出する処理である。キーワードマッチング114は、現場信号名の各々に対して、抽出したワードや特性がマッチする標準信号名を、対応する標準信号名の候補として、現場信号名と標準信号名との一致度を表すマッチング度と共に出力する。
<Keyword extraction 113 and keyword matching 114>
The keyword extraction 113 is a process of extracting a keyword such as a keyword to be matched, a modifier word, and a characteristic for all field signal names and standard signal names. The keyword matching 114 is a matching that represents the degree of coincidence between the field signal name and the standard signal name by using the standard signal name that matches the extracted word or characteristic for each field signal name as a candidate for the corresponding standard signal name. Output with degrees.

キーワード抽出113とキーワードマッチング114の処理フローを図12に示す。これらの処理は、現場信号名と標準信号名の2重ループで処理する。   FIG. 12 shows a processing flow of keyword extraction 113 and keyword matching 114. These processes are performed in a double loop of the field signal name and the standard signal name.

ステップ1302が現場信号名のループである。ステップ1303は、一つの現場信号名の構文木411からキーワードと修飾ワード、および特性を抽出する。同じく、ステップ1304では標準信号名の構文木410からキーワードと修飾ワード、および特性を抽出する。ステップ1306は各現場信号名に対する各標準信号名に対するキーワードマッチング114の処理を示す。これはマッチング度の計算処理で、各現場信号名に対する全ての標準信号名の一致度を表すマッチング度を計算し、キーワードに対するマッチング度が閾値1311以上の標準信号名を候補として、そのマッチング度と共に、信号名マッチングリスト115として出力する。ステップ1310で示すウェイトはマッチング度を計算するためのキーワードの重みづけである。マッチング度の計算の詳細は後述する。   Step 1302 is a loop of the field signal name. Step 1303 extracts a keyword, a modifier word, and a characteristic from the syntax tree 411 of one field signal name. Similarly, in step 1304, the keyword, the modifier word, and the characteristic are extracted from the syntax tree 410 of the standard signal name. Step 1306 shows the process of keyword matching 114 for each standard signal name for each field signal name. This is a matching degree calculation process, in which the matching degree representing the matching degree of all standard signal names with respect to each field signal name is calculated, and the matching degree with respect to the keyword is used as a candidate for the standard signal name with a threshold value of 1311 or more. , As the signal name matching list 115. The weight shown in step 1310 is the weighting of the keyword for calculating the matching degree. Details of the calculation of the matching degree will be described later.

以下では、図12の各処理の詳細を述べる。
まず、ステップ1303とステップ1305で示すキーワードと修飾ワード、および特性の抽出の処理を述べる。図13は、キーワードの抽出ルールと、信号名「A・FDF軸受温度」を示した図11の構文木から、このルールに従って抽出されたキーワードの例を示した図である。
The details of each process in FIG. 12 will be described below.
First, the processing of extracting keywords and modifier words and characteristics shown in steps 1303 and 1305 will be described. FIG. 13 is a diagram showing an example of keywords extracted according to this rule from the syntax tree of FIG. 11 showing the keyword extraction rule and the signal name “A / FDF bearing temperature”.

キーワード902「Key Sensing Parameter」に対し、抽出ルール「The Rightmost “Sensing Parameter” Word in Sensing Part」、つまり、センシング部における最も右側の“センシングパラメタ”をセンシングパラメタとして抽出するルールが設定され、「温度」が標準信号名のキーワード106として、抽出されている。   For the keyword 902 “Key Sensing Parameter”, the extraction rule “The Rightmost“ Sensing Parameter ”Word in Sensing Part”, that is, the rule for extracting the rightmost “sensing parameter” in the sensing unit as a sensing parameter is set, and Is extracted as the keyword 106 of the standard signal name.

同様に、キーワード902「Main Device」に対し、抽出ルール903「The Leftmost Device”Word in Sensing Target Part」、つまり、“センシング対象部のワードで最も左側をメインデバイス”として、デバイスを抽出するルールが設定されている。マクロデバイスは、信号名において、センシング対象部の最も左側に現れるからである。この例では、デバイスとして、「FDF」が抽出されている。   Similarly, for the keyword 902 “Main Device”, there is an extraction rule 903 “The Leftmost Device“ Word in Sensing Target Part ”, that is, a rule for extracting a device with“ the leftmost side of the word of the sensing target part as the main device ”. It is set. This is because the macro device appears on the leftmost side of the sensing target part in the signal name. In this example, "FDF" is extracted as the device.

同様に、キーワード902「Sensing Target Device」に対し、抽出ルール903「The Rightmost “Device” Word in Sensing Target Part」、つまり、「センシング対象部のワードで最も右側をデバイス」として、デバイスを抽出するルールが設定されている。デバイスは、信号名において、センシング対象部の最も右側に現れるからである。この例では、デバイスとして、「軸受」が信号名のキーワードとして、抽出されている。   Similarly, for keyword 902 “Sensing Target Device”, extraction rule 903 “The Rightmost“ Device ”Word in Sensing Target Part”, that is, a rule for extracting a device with “the rightmost device in the word of the sensing target part” Is set. This is because the device appears on the rightmost side of the sensing target part in the signal name. In this example, “bearing” is extracted as the device name keyword for the device.

図14は、キーワードの修飾語と特性に関する抽出ルールと抽出された修飾ワードと特性の例を示した図である。例えば、番号1001「1」に修飾語1002「Sensing Target Material(センシング対象物質)」を抽出するためのルールとして、「The Left “Material” Word of Key Sensing Parameter(キーセンシングパラメタの左側にある物質)」が設定されている。そして、「メタル」「油」が信号名のキーワード106、107として、抽出されている。番号「2」から「5」も各修飾語等が、信号名中に登場する位置によって、抽出ルールを設定し、修飾語のキーワードを抽出する。   FIG. 14 is a diagram showing an example of an extraction rule regarding a keyword modifier and a characteristic, and an extracted modifier word and a characteristic. For example, the rule for extracting the modifier 1002 “Sensing Target Material” to the number 1001 “1” is “The Left“ Material ”Word of Key Sensing Parameter (the substance to the left of the key sensing parameter). Is set. Then, "metal" and "oil" are extracted as signal name keywords 106 and 107. With respect to the numbers “2” to “5”, the modifiers and the like are set according to the positions where the modifiers appear in the signal name, and the modifier keywords are extracted.

次に、1306で示すマッチング度の計算処理を、図15と図16に従い説明する。
図15において、マッチング度1402は、キーワード全体に対して与えられるマッチング度を示す。Definitionで示す式で定義する。キーセンシングパラメタ、マクロデバイス、センシング対象デバイスの各々に対してウェイト1、ウェイト2、ウェイト3が与えられ、各々のキーワードとその修飾ワードがマッチするか否かによりマッチが1または0となる。ウェイトとマッチにより与えられたDefinitionの式が、マッチング度の定義を示す。 ウェイトはその重要度に従い、Condition1からCondition3の条件を満たすように設定する。キーセンシングパラメタ、マクロデバイス、センシング対象デバイスの各々に対して例えば、「0.6」「0.3」「0.1」が設定される。Condition1では、全ての重みの総計が「1」となる条件であり、Condition2では、他のキーワードの重みの総計よりも大きくする条件である。Condition3では、キーワードの重みを、キーセンシングパラメタを最大とする条件であり、その他、キーセンシングパラメタのマッチングが信号名のマッチングにおいて必須とする条件を設定することができる。
Next, the matching degree calculation processing indicated by 1306 will be described with reference to FIGS. 15 and 16.
In FIG. 15, a matching degree 1402 indicates the matching degree given to the entire keyword. It is defined by the formula shown in Definition. Weight 1, weight 2, and weight 3 are given to each of the key sensing parameter, the macro device, and the sensing target device, and the match becomes 1 or 0 depending on whether or not each keyword matches the modifier word. The Definition expression given by the weight and the match indicates the definition of the matching degree. The weight is set so as to satisfy the conditions of Condition 1 to Condition 3 according to its importance. For example, “0.6”, “0.3”, and “0.1” are set for each of the key sensing parameter, macro device, and sensing target device. Condition 1 is a condition that the total of all weights is “1”, and Condition 2 is a condition that is larger than the total of the weights of other keywords. In Condition3, the weight of the keyword is a condition for maximizing the key sensing parameter, and in addition, the condition that the matching of the key sensing parameter is indispensable for the matching of the signal name can be set.

マッチするか否かの条件は、各キーワードに対して図16で示す。1502はキーセンシングパラメタに対する条件、1503はメインデバイスに対する条件、1504はセンシング対象デバイスに対する条件を示す。Condition1、Condition2、Condition3のアンド条件が条件となる。
標準信号名と現場信号名のキーワードが一致していても、修飾語が一致していない場合、同じ信号名として対応付けすることができない場合がある。標準信号名と現場信号名の修飾語が共に同じ内容であれば、図15のDefinitionで示すMatchは1となる。標準信号名と現場信号名の一方のみに修飾ワードが入っていた場合も、Matchは1として対応する信号名とする。図16は、このような条件を表している。
The conditions for matching or not are shown in FIG. 16 for each keyword. Reference numeral 1502 indicates a condition for a key sensing parameter, 1503 a condition for a main device, and 1504 a condition for a sensing target device. The AND condition of Condition1, Condition2, and Condition3 is the condition.
Even if the keywords of the standard signal name and the field signal name match, if the modifiers do not match, they may not be associated as the same signal name. If both the standard signal name and the field signal name have the same modifier, the Match shown in Definition in FIG. 15 is 1. Even when only one of the standard signal name and the field signal name has a qualifying word, 1 is set as the corresponding signal name in Match. FIG. 16 shows such a condition.

図15のマッチング度1403はデバイス階層に対して与えられ、マッチング対象のデバイスの数を現場信号名のデバイスの数で除算した「3/4」が設定されている。   The matching degree 1403 in FIG. 15 is given to the device hierarchy, and is set to "3/4", which is obtained by dividing the number of devices to be matched by the number of devices of the field signal name.

以上、本実施例では、発電所やプラント等におけるセンサ信号のように、動詞が使われることのなく、一般の文章とは異なる体系からなり、自然言語処理が単純に適応できない情報を分析基盤で利用するためデータの分析基盤で利用される標準信号名に、対応付けることができる。これにより、発電所やプラントのセンサデータを効率よく分析することができる。   As described above, in the present embodiment, like sensor signals in power plants and plants, verbs are not used, the system is different from general sentences, and natural language processing is based on information that cannot be simply applied. It can be associated with the standard signal name used in the data analysis platform for use. As a result, the sensor data of the power plant or plant can be efficiently analyzed.

101:入力情報、103:ワード属性辞書、109:標準信号名、110:現場信号名、112:前処理、113:キーワード抽出、114:キーワードマッチング、115:キーワードマッチングリスト、202:計算機、203:処理部、204:メモリ、205:記憶装置、302:端末、303:ネットワーク。 101: input information, 103: word attribute dictionary, 109: standard signal name, 110: field signal name, 112: preprocessing, 113: keyword extraction, 114: keyword matching, 115: keyword matching list, 202: calculator, 203: Processing unit, 204: memory, 205: storage device, 302: terminal, 303: network.

Claims (9)

対象複合名称と標準複合名称からなる二つの複合名称と、複合名称に出現するワードの属性を登録したワード属性辞書と、ワード属性から構成される複合名称の構文とを格納する記憶装置と、
ワード属性辞書と複合名称の構文から、複合名称を特徴付けるキーワードを抽出する抽出し、対象複合名称と標準複合名称からなる二つの複合名称から抽出されたキーワード同士をマッチングして、二つの複合名称のマッチング度を算出する処理部とを有する、ことを特徴とする名称マッチング装置。
A storage device that stores two compound names consisting of a target compound name and a standard compound name, a word attribute dictionary in which the attributes of words that appear in the compound name are registered, and a syntax of the compound name composed of word attributes,
Extract the keywords that characterize the composite name from the word attribute dictionary and the syntax of the composite name.Match the keywords extracted from the two composite names consisting of the target composite name and the standard composite name to extract the two composite names. A name matching device, comprising: a processing unit that calculates a matching degree.
前記処理部は、抽出されたキーワードに重み付けてキーワードのマッチング度を算出する、ことを特徴とする請求項1記載の名称マッチング装置。   The name matching device according to claim 1, wherein the processing unit calculates the matching degree of the keyword by weighting the extracted keyword. 前記処理部は、キーワードの重みを、キーセンシングパラメタを最大とするか、他のキーワードの重みの総計よりも大きくするか、キーセンシングパラメタのマッチングが信号名のマッチングにおいて必須とするかを、条件とする、ことを特徴とする請求項1記載の名称マッチング装置。   The processing unit determines whether the weight of the keyword is the maximum of the key sensing parameter, is larger than the total of the weights of the other keywords, or whether the matching of the key sensing parameter is indispensable in the matching of the signal name. The name matching device according to claim 1, wherein: 前記複合名称は信号名であり、
前記ワード属性辞書は、デバイス、センシングパラメタ、デバイスにおける位置、センシングされる物質、及び制御コンピュータからの入力を含み、
前記処理部は、前記ワード属性辞書を参照して信号名に出現するワードのワード属性を判定する、ことを特徴とする、請求項1に記載の名称マッチング装置。
The composite name is a signal name,
The word attribute dictionary includes devices, sensing parameters, positions on the device, substances to be sensed, and inputs from the control computer,
The name matching device according to claim 1, wherein the processing unit determines a word attribute of a word appearing in a signal name by referring to the word attribute dictionary.
前記複合名称は信号名であり、
前記信号名の構文は、前記信号名をセンシング対象部とセンシング部に分割する分割ルールを構文の一部に含む、ことを特徴とする請求項1記載の名称マッチング装置。
The composite name is a signal name,
The name matching device according to claim 1, wherein the syntax of the signal name includes a division rule for dividing the signal name into a sensing target portion and a sensing portion, as a part of the syntax.
前記センシング対象部は、前記信号名の最初からデバイスまたは位置の属性のワードで終了する部分までで定義し、センシング部はセンシング対象部を除いた部分の全てで定義されたものである、ことを特徴とする請求項5記載の名称マッチング装置。   The sensing target part is defined from the beginning of the signal name to a part ending with a word of a device or position attribute, and the sensing part is defined in all parts except the sensing target part. The name matching device according to claim 5, which is characterized in that. 前記処理部により抽出されるキーワードは、キーセンシングパラメタ、メインデバイス、およびセンシング対象デバイスからなり、
前記キーセンシングパラメタは、前記センシング対象部の中で、最も右にあるセンシングパラメタ属性のワードであり、前記メインデバイスは、前記センシング対象部の中で、最も左に位置するデバイス属性のワードであり、前記センシング対象デバイスは、前記センシング対象部の中で最も右に位置するデバイス属性のワードである、ことを特徴とする請求項6記載の名称マッチング装置。
The keyword extracted by the processing unit consists of a key sensing parameter, a main device, and a sensing target device,
The key sensing parameter is a rightmost sensing parameter attribute word in the sensing target section, and the main device is a leftmost device attribute word in the sensing target section. 7. The name matching device according to claim 6, wherein the sensing target device is a word having a device attribute located at the rightmost position in the sensing target unit.
前記記憶装置は、信号値の単位である信号の単位を記憶し、複数の意味を持つワードの種類を特定する請求項4記載の名称マッチング装置。   The name matching device according to claim 4, wherein the storage device stores a signal unit which is a unit of a signal value, and specifies word types having a plurality of meanings. 記憶装置に対象複合名称と標準複合名称からなる二つの複合名称と、複合名称に出現するワードの属性を登録したワード属性辞書と、ワード属性から構成される複合名称の構文とを格納し、
処理部によって、
ワード属性辞書と複合名称の構文から、複合名称を特徴付けるキーワードを抽出し、
対象複合名称と標準複合名称からなる二つの複合名称から抽出されたキーワード同士をマッチングして、二つの複合名称のマッチング度を算出する、ことを特徴とする名称マッチング方法。
The storage device stores two compound names consisting of a target compound name and a standard compound name, a word attribute dictionary in which attributes of words appearing in the compound name are registered, and a compound name syntax composed of word attributes,
Depending on the processing unit,
Extract the keywords that characterize the compound name from the word attribute dictionary and the syntax of the compound name,
A name matching method, characterized in that keywords extracted from two compound names consisting of a target compound name and a standard compound name are matched with each other to calculate a matching degree of the two compound names.
JP2018192245A 2018-10-11 2018-10-11 Name matching device and method Active JP7114433B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018192245A JP7114433B2 (en) 2018-10-11 2018-10-11 Name matching device and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018192245A JP7114433B2 (en) 2018-10-11 2018-10-11 Name matching device and method

Publications (2)

Publication Number Publication Date
JP2020060988A true JP2020060988A (en) 2020-04-16
JP7114433B2 JP7114433B2 (en) 2022-08-08

Family

ID=70220017

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018192245A Active JP7114433B2 (en) 2018-10-11 2018-10-11 Name matching device and method

Country Status (1)

Country Link
JP (1) JP7114433B2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112541326A (en) * 2020-11-16 2021-03-23 中国南方电网有限责任公司 PSD-BPA bus name generation method and system
CN113222455A (en) * 2021-05-28 2021-08-06 西安热工研究院有限公司 Generator set parameter name matching method based on modular decomposition and matching

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04215182A (en) * 1990-12-13 1992-08-05 Nippon Telegr & Teleph Corp <Ntt> Data naming and registering device

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04215182A (en) * 1990-12-13 1992-08-05 Nippon Telegr & Teleph Corp <Ntt> Data naming and registering device

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112541326A (en) * 2020-11-16 2021-03-23 中国南方电网有限责任公司 PSD-BPA bus name generation method and system
CN112541326B (en) * 2020-11-16 2024-02-20 中国南方电网有限责任公司 PSD-BPA bus name generation method and system
CN113222455A (en) * 2021-05-28 2021-08-06 西安热工研究院有限公司 Generator set parameter name matching method based on modular decomposition and matching

Also Published As

Publication number Publication date
JP7114433B2 (en) 2022-08-08

Similar Documents

Publication Publication Date Title
US10664660B2 (en) Method and device for extracting entity relation based on deep learning, and server
JP6727610B2 (en) Context analysis device and computer program therefor
EP3635540A1 (en) Intent-based organisation of apis
WO2019169858A1 (en) Searching engine technology based data analysis method and system
KR20110064833A (en) Apparatus and method for knowledge graph stabilization
CN107679035B (en) Information intention detection method, device, equipment and storage medium
KR102468481B1 (en) Implication pair expansion device, computer program therefor, and question answering system
CN103646112A (en) Dependency parsing field self-adaption method based on web search
WO2019114673A1 (en) Minimum branch path function birthmark-based software local plagiarism evidence generation method
Fernandez-Álvarez et al. Automatic extraction of shapes using sheXer
JP2019082931A (en) Retrieval device, similarity calculation method, and program
JP2020060988A (en) Name matching device and method
EP3404553A1 (en) Open information extraction method and system for extracting reified ternary relationship
JP5916016B2 (en) Synonym determination device, synonym learning device, and program
Yu et al. English translation model based on intelligent recognition and deep learning
KR20170065417A (en) Method and system for constructing schema on natural language processing and knowledge database thereof
JP6327799B2 (en) Natural language reasoning system, natural language reasoning method and program
JP6326940B2 (en) Method and apparatus for evaluating phrases in intermediate language, and machine translation method and apparatus
JP2015028697A (en) Classification model learning device, classification determining device, method and program
JP6482084B2 (en) Grammar rule filter model learning device, grammar rule filter device, syntax analysis device, and program
KR101671892B1 (en) Entity&#39;s uri recognition system in text based on uri&#39;s definition statement and additional information, estimate for topic dispersion and method for selecting uri
KR20200068105A (en) System of providing documents for machine reading comprehension and question answering system including the same
JP7273888B2 (en) Decision device, decision method and decision program
JP2013182580A (en) Identity vector construction device, identity vector construction method, predicate similarity calculation device, predicate similarity calculation method and predicate similarity calculation program
KR20240047736A (en) Method for domain-specific keyword extraction and system thereof

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210816

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220420

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220510

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220623

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220705

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220727

R150 Certificate of patent or registration of utility model

Ref document number: 7114433

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150