JP2020060988A - Name matching device and method - Google Patents
Name matching device and method Download PDFInfo
- Publication number
- JP2020060988A JP2020060988A JP2018192245A JP2018192245A JP2020060988A JP 2020060988 A JP2020060988 A JP 2020060988A JP 2018192245 A JP2018192245 A JP 2018192245A JP 2018192245 A JP2018192245 A JP 2018192245A JP 2020060988 A JP2020060988 A JP 2020060988A
- Authority
- JP
- Japan
- Prior art keywords
- name
- word
- sensing
- matching
- composite
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Testing And Monitoring For Control Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本発明は、名称マッチング技術に関する。 The present invention relates to name matching technology.
様々な「モノ(物)」がインターネットに接続され、情報交換することにより相互に制御する仕組みであるIoT(Internet of Things)が注目されている。発電所やプラントにおいてもIoTを利用し、各種センサデータを収集し、必要な情報を抽出して分析する基盤の整備が求められている。 IoT (Internet of Things), which is a mechanism in which various “things” are connected to the Internet and mutually controlled by exchanging information, is drawing attention. Power plants and plants are also required to develop a base for collecting various sensor data, extracting necessary information, and analyzing it by using IoT.
医学生物学分野の論文から研究者が興味を持つ情報を自動的に文献から抽出する技術として、特許文献1が挙げられる。
特許文献1は、学術文献等の文章である自然言語処理を対象とするため、文献を名詞等の用語と動詞等の並びに基づいて言語的に解析しているが、発電所やプラント等におけるセンサ信号のように、動詞が使われることのなく、一般の文章とは異なる体系からなり、自然言語処理が単純に適応できない情報の解析については、何ら言及されていない。
Since
そこで、本発明の目的は、各種現場信号のセンサデータを分析基盤で利用するためデータの分析基盤で利用される標準信号名に、発電所やプラントの現場信号名を対応付ける名称マッチング装置及び方法を提供することを目的とする。 Therefore, an object of the present invention is to provide a name matching device and method for associating a field signal name of a power plant or a plant with a standard signal name used in the data analysis platform for using sensor data of various field signals in the analysis platform. The purpose is to provide.
本発明は、上記の課題を解決するための名称マッチング装置に関連し、その適用形態の一例を挙げるならば、名称マッチング装置は、対象複合名称と標準複合名称からなる二つの複合名称と、複合名称に出現するワードの属性を登録したワード属性辞書と、ワード属性から構成される複合名称の構文とを格納する記憶装置と、ワード属性辞書と複合名称の構文から、複合名称を特徴付けるキーワードを抽出する抽出し、対象複合名称と標準複合名称からなる二つの複合名称から抽出されたキーワード同士をマッチングして、二つの複合名称のマッチング度を算出する処理部とを有する。 The present invention relates to a name matching device for solving the above problems, and if an example of its application is given, the name matching device includes two compound names including a target compound name and a standard compound name, and a compound name. A word attribute dictionary in which the attributes of words appearing in a name are registered, a storage device that stores the syntax of a compound name composed of word attributes, and a keyword that characterizes the compound name is extracted from the word attribute dictionary and the syntax of the compound name. And a processing unit for matching the keywords extracted from the two compound names including the target compound name and the standard compound name to calculate the matching degree of the two compound names.
本発明によれば、対象複合名称と標準複合名称からなる二つの複合名称との対応付け、例えば、発電所やプラント等で用いられる各種センサの信号に含まれる現場信号名と分析基盤の標準信号名との対応付け、を効率よく行うことができる。 According to the present invention, the target compound name and the two compound names consisting of the standard compound name are associated with each other, for example, the field signal name included in the signals of various sensors used in the power plant or the plant and the standard signal of the analysis base. Correspondence with the name can be efficiently performed.
<明細書中の用語の定義>
以下、本発明の実施の形態を、図を用いて説明する。各図において、同一の構成には同一の符号を付す。
<Definition of terms in the specification>
Embodiments of the present invention will be described below with reference to the drawings. In each figure, the same components are designated by the same reference numerals.
以下、発明の実施の形態を、図面を参照して詳細に説明する。以下の記載および図面は、本発明を説明するための例示であって、説明の明確化のため、適宜、省略および簡略化がなされている。本発明は、他の種々の形態でも実施する事が可能である。特に限定しない限り、各構成要素は単数でも複数でも構わない。 Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings. The following description and drawings are exemplifications for explaining the present invention, and are appropriately omitted and simplified for clarifying the description. The present invention can be implemented in various other modes. Unless otherwise specified, each component may be singular or plural.
図面において示す各構成要素の位置、大きさ、形状、範囲などは、発明の理解を容易にするため、実際の位置、大きさ、形状、範囲などを表していない場合がある。このため、本発明は、必ずしも、図面に開示された位置、大きさ、形状、範囲などに限定されない。 The position, size, shape, range, etc. of each component shown in the drawings may not represent the actual position, size, shape, range, etc., for easy understanding of the invention. Therefore, the present invention is not necessarily limited to the position, size, shape, range, etc. disclosed in the drawings.
以下の説明では、「テーブル」、「リスト」、「キュー」等の表現にて各種情報を説明することがあるが、各種情報は、これら以外のデータ構造で表現されていてもよい。データ構造に依存しないことを示すために「XXテーブル」、「XXリスト」等を「XX情報」と呼ぶことがある。識別情報について説明する際に、「識別情報」、「識別子」、「名」、「ID」、「番号」、「Region」等の表現を用いるが、これらについてはお互いに置換が可能である。 In the following description, various information may be described by expressions such as “table”, “list”, “queue”, etc., but the various information may be expressed by a data structure other than these. “XX table”, “XX list”, etc. may be referred to as “XX information” to indicate that they do not depend on the data structure. In describing the identification information, expressions such as “identification information”, “identifier”, “name”, “ID”, “number”, and “Region” are used, but these can be replaced with each other.
同一あるいは同様な機能を有する構成要素が複数ある場合には、同一の符号に異なる添字を付して説明する場合がある。ただし、これらの複数の構成要素を区別する必要がない場合には、添字を省略して説明する場合がある。 When there are a plurality of constituent elements having the same or similar functions, the same reference numerals may be given with different subscripts. However, when it is not necessary to distinguish between these plural components, the subscripts may be omitted in the description.
また、以下の説明では、プログラムを実行して行う処理を説明する場合があるが、プログラムは、プロセッサ(例えばCPU、GPU)によって実行されることで、定められた処理を、適宜に記憶資源(例えば記憶装置)および/またはインターフェースデバイス(例えば通信ポート)等を用いながら行うため、処理の主体がプロセッサとされてもよい。同様に、プログラムを実行して行う処理の主体が、プロセッサを有するコントローラ、装置、システム、計算機、ノードであってもよい。プログラムを実行して行う処理の主体は、制御部であれば良く、特定の処理を行う専用回路(例えばFPGAやASIC)を含んでいてもよい。 Further, in the following description, a process performed by executing a program may be described, but the program is executed by a processor (for example, a CPU or GPU) so that a predetermined process can be performed as appropriate for a storage resource ( For example, since the processing is performed while using a storage device and / or an interface device (for example, a communication port), the main body of processing may be the processor. Similarly, the main body of processing executed by executing the program may be a controller having a processor, a device, a system, a computer, or a node. The main body of the processing executed by executing the program may be the control unit, and may include a dedicated circuit (for example, FPGA or ASIC) for performing the specific processing.
プログラムは、プログラムソースから計算機のような装置にインストールされてもよい。プログラムソースは、例えば、プログラム配布サーバまたは計算機が読み取り可能な記憶メディアであってもよい。プログラムソースがプログラム配布サーバの場合、プログラム配布サーバはプロセッサと配布対象のプログラムを記憶する記憶資源を含み、プログラム配布サーバのプロセッサが配布対象のプログラムを他の計算機に配布してもよい。また、以下の説明において、2以上のプログラムが1つのプログラムとして実現されてもよいし、1つのプログラムが2以上のプログラムとして実現されてもよい。 The program may be installed from a program source into a device such as a computer. The program source may be, for example, a program distribution server or a computer-readable storage medium. When the program source is the program distribution server, the program distribution server may include a processor and a storage resource for storing the distribution target program, and the processor of the program distribution server may distribute the distribution target program to another computer. Further, in the following description, two or more programs may be realized as one program, or one program may be realized as two or more programs.
<概要>
分析基盤で利用される標準信号名に、発電所やプラント等の現場信号名に対応付けられていた現場のセンサデータを対応付けるため、標準信号名と現場信号名を対応付ける必要がある。このように、分析基盤で現場信号名のような対象複合名称を解析しようとする場合、分析基盤で用いられる標準信号名のような標準複合名称との対応を行う必要がある。
<Outline>
In order to associate the standard signal name used in the analysis platform with the on-site sensor data that was associated with the on-site signal name of the power plant or plant, it is necessary to associate the standard signal name with the on-site signal name. As described above, when trying to analyze a target composite name such as a field signal name on the analysis platform, it is necessary to deal with a standard composite name such as a standard signal name used on the analysis platform.
しかし、複合名称である信号名は現場ごとに命名規則が異なるため、この対応付けは工数が必要となる。例えば、電力プラントでは、2000本程度の信号名に対して、現場信号を熟知するドメインエクスパートが2人月程度必要になるといわれている。 However, since the signal name, which is a composite name, has a different naming rule for each site, this association requires man-hours. For example, in a power plant, it is said that a domain expert familiar with on-site signals is required for about two man-months for about 2000 signal names.
そこで、二つの複合名称である標準信号名と現場信号名の対応付けを、プラントで共通の種類のキーワードを抽出して、キーワードをマッチングすることにより行う。以下、二つの複合名称を、理解を容易にするために標準信号名、現場信号名と具体的に記載するが、本発明がこれらに限定されることを意図するものではなく、一般の複合名称に適応可能であることは言うまでもない。 Therefore, the standard signal name and the field signal name, which are two compound names, are associated with each other by extracting keywords of a common type in the plant and matching the keywords. Hereinafter, the two composite names will be specifically described as a standard signal name and a field signal name for easy understanding, but the present invention is not intended to be limited to these, and a general composite name. Needless to say, it is applicable to.
(1)これらの信号名は、「デバイス」「センシングパラメタ」「位置」等の分野特有のワード属性を持つワードにより構成される複合名称となっている。信号名の構文は、このワード属性により構成されており、その構文は信号名がセンシング対象部とセンシング部からなることを示す。センシング対象部はセンシングする部位を示す部分であり、ここからデバイスなどのセンシングを行う部位に関するキーワードを抽出する。センシング部はどんなセンシングを行うかを示す部分で、センシングの種類を示すキーワードを抽出する。さらに、二つに分けられた部分の中で、ワード属性の出現順を示す構文によっても異なる種類のキーワードが抽出される。 (1) These signal names are compound names composed of words having field-specific word attributes such as “device”, “sensing parameter”, and “position”. The syntax of the signal name is composed of this word attribute, and the syntax indicates that the signal name consists of the sensing target section and the sensing section. The sensing target part is a part indicating a part to be sensed, and a keyword relating to a part to be sensed such as a device is extracted from here. The sensing unit is a part that indicates what kind of sensing is performed, and extracts a keyword that indicates the type of sensing. Furthermore, different types of keywords are extracted from the divided parts by the syntax indicating the appearance order of word attributes.
例えば、センシングパラメタ属性である「温度」という名称が信号名中のどこに出現するかで、「キーセンシングパラメタ」というキーワードとなるかが決まる。また、センシング対象部の中で、デバイス属性である「FDF」の出現順により、「メインデバイス」か「センシング対象デバイス」のいずれのキーワードとなるかが決まる。ここで述べたキーワードの種類の定義は後述する。 For example, where the name "temperature", which is the sensing parameter attribute, appears in the signal name determines whether it becomes the keyword "key sensing parameter". Further, in the sensing target unit, the keyword of “main device” or “sensing target device” is determined depending on the appearance order of the device attribute “FDF”. The definition of the types of keywords described here will be described later.
(2) (1)で抽出されたキーワードを元にして、さらに、キーワードに対する修飾ワードも信号名の構文から抽出する。 (2) Based on the keyword extracted in (1), the modifier word for the keyword is also extracted from the syntax of the signal name.
<システムの全体構成の概要>
図1は、システムの全体構成の概要説明図である。
ここで行う処理111はコンテクストマッチングと呼ぶ。コンテクストとはデータを意味づける情報の総称名であり、信号名が一例である。コンテクストマッチング111は、前処理112、キーワード抽出113、およびキーワードマッチング114からなる。前処理112はキーワード抽出113とキーワードマッチング114の処理を行い易くするためのデータ構造の変更であり、具体的には信号名をワード属性の表現の構文木に変換する。
<Overview of overall system configuration>
FIG. 1 is a schematic explanatory diagram of the overall configuration of the system.
The
キーワード抽出113は信号名からキーワードと修飾ワード、および特有の特性を抽出する処理である。キーワードマッチング114は、標準信号名と現場信号名のキーワードと修飾ワード、および特性のマッチングを行ってマッチング度を計算し、信号名マッチングリスト115を出力する。信号名マッチングリスト115の結果を見て、ユーザが対応信号を最終決定する(117)。以上の処理の詳細は後述する。
The
入力情報として、信号情報108と電力などのある分野に共通に用いられる入力情報101があり、出力情報として、信号名マッチングリスト115がある。中間出力情報として、信号名から抽出されたキーワード情報105がある。
Input information includes
入力情報101には、種々のワード属性辞書103と、ワード属性により信号名の構文を表現したBNF(Backus−Naur form)104がある。信号情報108は、標準信号に対しては、標準信号名109と標準信号の単位1029がある。現場信号に対しても、同様に現場信号名110と単位1020がある。ここで単位とは信号のデータの単位を示し、単位を見て電圧や温度などの信号の意味が判断できる情報である。
The input information 101 includes various word attribute
出力情報115には、現場信号名に対する標準信号名の候補リストを、両者の一致度を表すマッチング度共に出力する。
As the
中間出力情報105には、標準信号名と現場信号名の各々に対してキーワード、修飾ワード、および特性を抽出した結果を出力する。 In the intermediate output information 105, the result of extracting the keyword, the modifier word, and the characteristic for each of the standard signal name and the field signal name is output.
コンテクストマッチング111の機能の概要を示すため、主要な入力である、標準信号名109、現場信号名110、及び標準信号名と現場信号名とのマッチングリスト(信号名マッチングリスト)115を、図2と図3に従い説明する。
In order to show the outline of the function of the context matching 111, the
図2(A)は、標準信号名109を、図2(B)は現場信号名110を示している。信号ID501は、信号を一意に特定するためのIDである。信号名502は信号名を表している。例えば、標準信号ファイル500の信号ID「002」の標準信号名は「A・FDF 用 電動機 軸受 温度」であることを示している。また、現場信号ファイル510の信号ID「002」の現場信号名は「A・FDF 軸受 温度」であること示している。
2A shows the
図3は、信号名マッチングリスト115を示した図である。現場信号名601と標準信号名候補602、マッチング度603、結果604が対応して記憶される。例えば、現場信号名601が「Aボイラ出力温度」の場合、標準信号名候補602として「Aボイラ出力温度」と「Aボイラ入力湿度」がある。そして、「Aボイラ出力温度」のマッチング度603は「1」、「Aボイラ入力湿度」のマッチング度603は「0.83」と計算される。この計算値を元にユーザにより最終マッチング決定117が行われる。マッチング度の計算の詳細については後述する。
FIG. 3 is a diagram showing the signal
以降では、まず、図4と図5に従い、システムのハードウェア構成を述べた後、図1で示したコンテクストマッチング111を構成する各処理について述べる。 In the following, first, the hardware configuration of the system will be described with reference to FIGS. 4 and 5, and then each process that configures the context matching 111 shown in FIG.
<システムのハードウェア構成>
図4は、システムのハードウェア構成図である。計算機202は、一般のサーバやパーソナルコンピュータ(PC)と同様の構成である。計算機202は、処理部203、各種情報やプログラムを格納する記憶装置205、メモリ204によって構成され、表示装置201に接続されている。処理部203は、本発明を実現するプログラムをメモリ204に読み込み、実行することで各種機能を実現する。
<System hardware configuration>
FIG. 4 is a hardware configuration diagram of the system. The
記憶装置205には、信号の単位102(標準信号の単位1029、現場信号の単位1020)、ワード属性辞書103、信号構文BNF104、標準信号名キーワード106、現場信号名キーワード107、標準信号名109、現場信号名110、信号名マッチングリスト115が格納され、処理部203によってコンテクストマッチング処理111を行う。
In the
図5は、図4に示したシステムハードウェア構成図の他の例である。計算機202は図4と同様の構成となるが、計算機はインターネット等のネットワーク303に接続される。ネットワーク303に接続される端末302に表示装置301がある。ユーザは端末302を用いて、ネットワーク303に接続される計算機と通信することで、図1のワード決定116や最終マッチング決定117を行う。
FIG. 5 is another example of the system hardware configuration diagram shown in FIG. The
以降では、コンテクストマッチング111を構成する各処理について述べる。 Hereinafter, each process that constitutes the context matching 111 will be described.
<前処理>
図6は、前処理のフロー図であり、図1の前処理112の詳細とその後のキーワード抽出処理の概要を示す。
<Pretreatment>
FIG. 6 is a flowchart of the preprocessing, showing the details of the
前処理112は、標準信号名109と現場信号名110の各々に対して、各々の信号の単位1029と1020、ワード属性辞書103、信号名の構文規則であるBNF104を入力して、標準信号名の構文木410と現場信号名の構文木411を出力する。
The preprocessing 112 inputs the
最初の処理、形態素解析401は、信号名をワード単位に分割する処理である。ワード属性辞書103はワード属性に属するワードが記載されており、ワードの種類を示す辞書ということもできる。この辞書を利用して、信号名をワード単位に分割する。その後、ワード属性変換402により、信号名内の分割されたワードをワード属性に変換する。最後にパーサ404により、信号名を構文とワード属性により表現される構文木に変換する。ここでパーサ404はBNF104をパーサジェネレータ403により自動生成する。形態素解析、BNF、パーサジェネレータは公知の表現と技術であり、ここでは説明は割愛する。
The first process,
以下では、形態素解析401、ワード属性変換402、パーサ404の各処理について説明する。
形態素解析401の入力であるワード属性辞書103は、ワード属性ごとにワードを分類した辞書である。図7は、ワード属性を表すテーブルを示す図で、ワード属性702ごとにワードを分類したファイルがワード属性辞書103である。例えば、ワード属性702が「デバイス」の場合、ワードの例703として「押込みファン(FDF)」が含まれる。ワード属性は、図7に示す、Device(デバイス)、Position in Device(デバイスにおける位置)、Sensing Parameter(センシングパラメタ)、Material(センシングされる物質)、Input from Control Computer(制御コンピュータ入力)の5種類がある。信号名に含まれるこれ以外のワードは一般ワードの属性とする。本発明の処理には関係ないので、詳細は割愛する。
Hereinafter, each processing of the
The
形態素解析401では、ワード属性辞書からワードの種類を読み取り、信号名をワードごとに分割する。
ワード属性変換402は、この変換された表現を用いて、信号名内の分割されたワードをワード属性に変換する。ここで一つ注意点がある。ワードによっては、同じワードの表現を用いていながら、異なる意味のワードを意味しているケースがある。この場合は、どちらの意味で用いているかをユーザに問い合わせて元の信号名のワードを変換する。例えば、図8の例では、電圧というワードが、意味として電圧というワードを意味する場合と温度というワードを意味する場合があり、どちらの意味を示すかを決定する必要がある。この決定は図9に示すGUIによってユーザに決定してもらう。
In the
The
最後に、パーサ404を説明する。
パーサ404はBNF104で示す信号名の構文を用いて、標準信号名109、現場信号名110の各々を構文木410、411に変換する。ここでは、BNF104と構文木の表現について説明する。これらの利用方法は後述する。
Finally, the
The
図10に信号名のBNF104の例を示す。ここでBNFの表現をその文法と共に簡単に説明しておく。詳細な文法は一般のコンパイラのドキュメントなどを参照されたい。左の表現は右の表現で定義することを示す。このとき左と右は”:”で区分する。右が複数の構成要素から構成されているときには、構成要素の間は空白で区切る。右の表現が、複数の表現のいずれかのOR(オア)であるときには、各表現を”|”で区切る。
FIG. 10 shows an example of the
1601は、信号名(signal_name)が、センシング対象部(sensing_target_part)とセンシング部(sensing_part)から構成することを示す。センシング対象部は、このBNF表現で定義できるが、別の表現を用いると、信号名の最初からデバイスまたは位置の属性のワードで終了する部分までで定義する。センシング部は信号名の中でセンシング対象部以外の残りの部分を示す。
これらの構成要素はさらに、他の構成要素により定義できる。1602はセンシング対象部が、センシングsensing_target_series)で表現されることを示す。sensing_taret_seriesはセンシング対象(sensing_target)が複数連なることを示す。1603では、センシング対象(sensing_target)が、センシング対象属性(sensing_taget_attribute)か、補助語のシリーズ(complimentary_series)とセンシング対象属性からなることを示す。1604で、センシング対象属性は、デバイスのワード属性(DECVICE)または位置のワード属性(POSISION)であることを示す。1605で、補助語は、修飾語(modifying_word)か識別子(ID_part)であることを示す。1606で、修飾語は物質のワード属性(MATERIAL)か、センシングパラメタのワード属性(SENSING_PARAMETER)か、一般語のワード属性(GENERAL_WORD)か、接尾語のワード属性(POSTFIX)のいずれかであることを示す。1607で、センシング部は、センシング属性のシリーズ(sensing_attribute_series)か、一般トークンのシリーズ(general_token_series)とセンシング属性のシリーズからなることを示す。一般トークンシリーズは、図7で示したセンシング特有のワード属性以外の一般のワード属性のシリーズを示す。センシング属性は1608で示すように、センシングパラメタのワード属性(SENSING_PARAMETER)か、物質のワード属性(MATERIAL)か、制御コンピュータ入力のワード属性(Input from Control Computer)からなることを示す。
These components can be further defined by other components.
パーサ404は、信号名がBNF104に従う構文となっていることをチェックして、このBNFに従っていなければエラーとなり、従っていれば構文木の表現に変換する。図11に「A・FDF 用 電動機 軸受 温度」の信号名の構文木を示す。最上位のノード1701が信号名(signal_name)であり、BNF104の定義通り、信号名(signal_name)が、センシング対象部(sensing_target_part)とセンシング部(sensing_part)からなることを、その下の階層1702で示す。同様にして、BNF104通りに下位の階層で表現していくと、「A・B FDF 軸受」までが、センシング対象部(sensing_target_part)で、「A・」が識別子(ID_part)であり、「FDF」が装置(DEVICE)であり、「軸受」が装置(DEVICE)であることが解析できる。同様にして、センシング部(sensing_part)は「温度」の部分であり、「温度」はセンシングパラメータ(SENSING_PARAMETR)であることが解析できる。このように、信号名に含まれるキーワードがセンシング対象部かセンシング部であるかを把握できる。
The
<キーワード抽出113とキーワードマッチング114>
キーワード抽出113は、全ての現場信号名と標準信号名に対して、キーワードなどのマッチング対象となるキーワードと修飾ワード、および特性を抽出する処理である。キーワードマッチング114は、現場信号名の各々に対して、抽出したワードや特性がマッチする標準信号名を、対応する標準信号名の候補として、現場信号名と標準信号名との一致度を表すマッチング度と共に出力する。
<
The
キーワード抽出113とキーワードマッチング114の処理フローを図12に示す。これらの処理は、現場信号名と標準信号名の2重ループで処理する。
FIG. 12 shows a processing flow of
ステップ1302が現場信号名のループである。ステップ1303は、一つの現場信号名の構文木411からキーワードと修飾ワード、および特性を抽出する。同じく、ステップ1304では標準信号名の構文木410からキーワードと修飾ワード、および特性を抽出する。ステップ1306は各現場信号名に対する各標準信号名に対するキーワードマッチング114の処理を示す。これはマッチング度の計算処理で、各現場信号名に対する全ての標準信号名の一致度を表すマッチング度を計算し、キーワードに対するマッチング度が閾値1311以上の標準信号名を候補として、そのマッチング度と共に、信号名マッチングリスト115として出力する。ステップ1310で示すウェイトはマッチング度を計算するためのキーワードの重みづけである。マッチング度の計算の詳細は後述する。
以下では、図12の各処理の詳細を述べる。
まず、ステップ1303とステップ1305で示すキーワードと修飾ワード、および特性の抽出の処理を述べる。図13は、キーワードの抽出ルールと、信号名「A・FDF軸受温度」を示した図11の構文木から、このルールに従って抽出されたキーワードの例を示した図である。
The details of each process in FIG. 12 will be described below.
First, the processing of extracting keywords and modifier words and characteristics shown in
キーワード902「Key Sensing Parameter」に対し、抽出ルール「The Rightmost “Sensing Parameter” Word in Sensing Part」、つまり、センシング部における最も右側の“センシングパラメタ”をセンシングパラメタとして抽出するルールが設定され、「温度」が標準信号名のキーワード106として、抽出されている。
For the
同様に、キーワード902「Main Device」に対し、抽出ルール903「The Leftmost Device”Word in Sensing Target Part」、つまり、“センシング対象部のワードで最も左側をメインデバイス”として、デバイスを抽出するルールが設定されている。マクロデバイスは、信号名において、センシング対象部の最も左側に現れるからである。この例では、デバイスとして、「FDF」が抽出されている。
Similarly, for the
同様に、キーワード902「Sensing Target Device」に対し、抽出ルール903「The Rightmost “Device” Word in Sensing Target Part」、つまり、「センシング対象部のワードで最も右側をデバイス」として、デバイスを抽出するルールが設定されている。デバイスは、信号名において、センシング対象部の最も右側に現れるからである。この例では、デバイスとして、「軸受」が信号名のキーワードとして、抽出されている。
Similarly, for
図14は、キーワードの修飾語と特性に関する抽出ルールと抽出された修飾ワードと特性の例を示した図である。例えば、番号1001「1」に修飾語1002「Sensing Target Material(センシング対象物質)」を抽出するためのルールとして、「The Left “Material” Word of Key Sensing Parameter(キーセンシングパラメタの左側にある物質)」が設定されている。そして、「メタル」「油」が信号名のキーワード106、107として、抽出されている。番号「2」から「5」も各修飾語等が、信号名中に登場する位置によって、抽出ルールを設定し、修飾語のキーワードを抽出する。
FIG. 14 is a diagram showing an example of an extraction rule regarding a keyword modifier and a characteristic, and an extracted modifier word and a characteristic. For example, the rule for extracting the
次に、1306で示すマッチング度の計算処理を、図15と図16に従い説明する。
図15において、マッチング度1402は、キーワード全体に対して与えられるマッチング度を示す。Definitionで示す式で定義する。キーセンシングパラメタ、マクロデバイス、センシング対象デバイスの各々に対してウェイト1、ウェイト2、ウェイト3が与えられ、各々のキーワードとその修飾ワードがマッチするか否かによりマッチが1または0となる。ウェイトとマッチにより与えられたDefinitionの式が、マッチング度の定義を示す。 ウェイトはその重要度に従い、Condition1からCondition3の条件を満たすように設定する。キーセンシングパラメタ、マクロデバイス、センシング対象デバイスの各々に対して例えば、「0.6」「0.3」「0.1」が設定される。Condition1では、全ての重みの総計が「1」となる条件であり、Condition2では、他のキーワードの重みの総計よりも大きくする条件である。Condition3では、キーワードの重みを、キーセンシングパラメタを最大とする条件であり、その他、キーセンシングパラメタのマッチングが信号名のマッチングにおいて必須とする条件を設定することができる。
Next, the matching degree calculation processing indicated by 1306 will be described with reference to FIGS. 15 and 16.
In FIG. 15, a
マッチするか否かの条件は、各キーワードに対して図16で示す。1502はキーセンシングパラメタに対する条件、1503はメインデバイスに対する条件、1504はセンシング対象デバイスに対する条件を示す。Condition1、Condition2、Condition3のアンド条件が条件となる。
標準信号名と現場信号名のキーワードが一致していても、修飾語が一致していない場合、同じ信号名として対応付けすることができない場合がある。標準信号名と現場信号名の修飾語が共に同じ内容であれば、図15のDefinitionで示すMatchは1となる。標準信号名と現場信号名の一方のみに修飾ワードが入っていた場合も、Matchは1として対応する信号名とする。図16は、このような条件を表している。
The conditions for matching or not are shown in FIG. 16 for each keyword.
Even if the keywords of the standard signal name and the field signal name match, if the modifiers do not match, they may not be associated as the same signal name. If both the standard signal name and the field signal name have the same modifier, the Match shown in Definition in FIG. 15 is 1. Even when only one of the standard signal name and the field signal name has a qualifying word, 1 is set as the corresponding signal name in Match. FIG. 16 shows such a condition.
図15のマッチング度1403はデバイス階層に対して与えられ、マッチング対象のデバイスの数を現場信号名のデバイスの数で除算した「3/4」が設定されている。 The matching degree 1403 in FIG. 15 is given to the device hierarchy, and is set to "3/4", which is obtained by dividing the number of devices to be matched by the number of devices of the field signal name.
以上、本実施例では、発電所やプラント等におけるセンサ信号のように、動詞が使われることのなく、一般の文章とは異なる体系からなり、自然言語処理が単純に適応できない情報を分析基盤で利用するためデータの分析基盤で利用される標準信号名に、対応付けることができる。これにより、発電所やプラントのセンサデータを効率よく分析することができる。 As described above, in the present embodiment, like sensor signals in power plants and plants, verbs are not used, the system is different from general sentences, and natural language processing is based on information that cannot be simply applied. It can be associated with the standard signal name used in the data analysis platform for use. As a result, the sensor data of the power plant or plant can be efficiently analyzed.
101:入力情報、103:ワード属性辞書、109:標準信号名、110:現場信号名、112:前処理、113:キーワード抽出、114:キーワードマッチング、115:キーワードマッチングリスト、202:計算機、203:処理部、204:メモリ、205:記憶装置、302:端末、303:ネットワーク。 101: input information, 103: word attribute dictionary, 109: standard signal name, 110: field signal name, 112: preprocessing, 113: keyword extraction, 114: keyword matching, 115: keyword matching list, 202: calculator, 203: Processing unit, 204: memory, 205: storage device, 302: terminal, 303: network.
Claims (9)
ワード属性辞書と複合名称の構文から、複合名称を特徴付けるキーワードを抽出する抽出し、対象複合名称と標準複合名称からなる二つの複合名称から抽出されたキーワード同士をマッチングして、二つの複合名称のマッチング度を算出する処理部とを有する、ことを特徴とする名称マッチング装置。 A storage device that stores two compound names consisting of a target compound name and a standard compound name, a word attribute dictionary in which the attributes of words that appear in the compound name are registered, and a syntax of the compound name composed of word attributes,
Extract the keywords that characterize the composite name from the word attribute dictionary and the syntax of the composite name.Match the keywords extracted from the two composite names consisting of the target composite name and the standard composite name to extract the two composite names. A name matching device, comprising: a processing unit that calculates a matching degree.
前記ワード属性辞書は、デバイス、センシングパラメタ、デバイスにおける位置、センシングされる物質、及び制御コンピュータからの入力を含み、
前記処理部は、前記ワード属性辞書を参照して信号名に出現するワードのワード属性を判定する、ことを特徴とする、請求項1に記載の名称マッチング装置。 The composite name is a signal name,
The word attribute dictionary includes devices, sensing parameters, positions on the device, substances to be sensed, and inputs from the control computer,
The name matching device according to claim 1, wherein the processing unit determines a word attribute of a word appearing in a signal name by referring to the word attribute dictionary.
前記信号名の構文は、前記信号名をセンシング対象部とセンシング部に分割する分割ルールを構文の一部に含む、ことを特徴とする請求項1記載の名称マッチング装置。 The composite name is a signal name,
The name matching device according to claim 1, wherein the syntax of the signal name includes a division rule for dividing the signal name into a sensing target portion and a sensing portion, as a part of the syntax.
前記キーセンシングパラメタは、前記センシング対象部の中で、最も右にあるセンシングパラメタ属性のワードであり、前記メインデバイスは、前記センシング対象部の中で、最も左に位置するデバイス属性のワードであり、前記センシング対象デバイスは、前記センシング対象部の中で最も右に位置するデバイス属性のワードである、ことを特徴とする請求項6記載の名称マッチング装置。 The keyword extracted by the processing unit consists of a key sensing parameter, a main device, and a sensing target device,
The key sensing parameter is a rightmost sensing parameter attribute word in the sensing target section, and the main device is a leftmost device attribute word in the sensing target section. 7. The name matching device according to claim 6, wherein the sensing target device is a word having a device attribute located at the rightmost position in the sensing target unit.
処理部によって、
ワード属性辞書と複合名称の構文から、複合名称を特徴付けるキーワードを抽出し、
対象複合名称と標準複合名称からなる二つの複合名称から抽出されたキーワード同士をマッチングして、二つの複合名称のマッチング度を算出する、ことを特徴とする名称マッチング方法。 The storage device stores two compound names consisting of a target compound name and a standard compound name, a word attribute dictionary in which attributes of words appearing in the compound name are registered, and a compound name syntax composed of word attributes,
Depending on the processing unit,
Extract the keywords that characterize the compound name from the word attribute dictionary and the syntax of the compound name,
A name matching method, characterized in that keywords extracted from two compound names consisting of a target compound name and a standard compound name are matched with each other to calculate a matching degree of the two compound names.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018192245A JP7114433B2 (en) | 2018-10-11 | 2018-10-11 | Name matching device and method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018192245A JP7114433B2 (en) | 2018-10-11 | 2018-10-11 | Name matching device and method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020060988A true JP2020060988A (en) | 2020-04-16 |
JP7114433B2 JP7114433B2 (en) | 2022-08-08 |
Family
ID=70220017
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018192245A Active JP7114433B2 (en) | 2018-10-11 | 2018-10-11 | Name matching device and method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7114433B2 (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112541326A (en) * | 2020-11-16 | 2021-03-23 | 中国南方电网有限责任公司 | PSD-BPA bus name generation method and system |
CN113222455A (en) * | 2021-05-28 | 2021-08-06 | 西安热工研究院有限公司 | Generator set parameter name matching method based on modular decomposition and matching |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04215182A (en) * | 1990-12-13 | 1992-08-05 | Nippon Telegr & Teleph Corp <Ntt> | Data naming and registering device |
-
2018
- 2018-10-11 JP JP2018192245A patent/JP7114433B2/en active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04215182A (en) * | 1990-12-13 | 1992-08-05 | Nippon Telegr & Teleph Corp <Ntt> | Data naming and registering device |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112541326A (en) * | 2020-11-16 | 2021-03-23 | 中国南方电网有限责任公司 | PSD-BPA bus name generation method and system |
CN112541326B (en) * | 2020-11-16 | 2024-02-20 | 中国南方电网有限责任公司 | PSD-BPA bus name generation method and system |
CN113222455A (en) * | 2021-05-28 | 2021-08-06 | 西安热工研究院有限公司 | Generator set parameter name matching method based on modular decomposition and matching |
Also Published As
Publication number | Publication date |
---|---|
JP7114433B2 (en) | 2022-08-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10664660B2 (en) | Method and device for extracting entity relation based on deep learning, and server | |
JP6727610B2 (en) | Context analysis device and computer program therefor | |
EP3635540A1 (en) | Intent-based organisation of apis | |
WO2019169858A1 (en) | Searching engine technology based data analysis method and system | |
KR20110064833A (en) | Apparatus and method for knowledge graph stabilization | |
CN107679035B (en) | Information intention detection method, device, equipment and storage medium | |
KR102468481B1 (en) | Implication pair expansion device, computer program therefor, and question answering system | |
CN103646112A (en) | Dependency parsing field self-adaption method based on web search | |
WO2019114673A1 (en) | Minimum branch path function birthmark-based software local plagiarism evidence generation method | |
Fernandez-Álvarez et al. | Automatic extraction of shapes using sheXer | |
JP2019082931A (en) | Retrieval device, similarity calculation method, and program | |
JP2020060988A (en) | Name matching device and method | |
EP3404553A1 (en) | Open information extraction method and system for extracting reified ternary relationship | |
JP5916016B2 (en) | Synonym determination device, synonym learning device, and program | |
Yu et al. | English translation model based on intelligent recognition and deep learning | |
KR20170065417A (en) | Method and system for constructing schema on natural language processing and knowledge database thereof | |
JP6327799B2 (en) | Natural language reasoning system, natural language reasoning method and program | |
JP6326940B2 (en) | Method and apparatus for evaluating phrases in intermediate language, and machine translation method and apparatus | |
JP2015028697A (en) | Classification model learning device, classification determining device, method and program | |
JP6482084B2 (en) | Grammar rule filter model learning device, grammar rule filter device, syntax analysis device, and program | |
KR101671892B1 (en) | Entity's uri recognition system in text based on uri's definition statement and additional information, estimate for topic dispersion and method for selecting uri | |
KR20200068105A (en) | System of providing documents for machine reading comprehension and question answering system including the same | |
JP7273888B2 (en) | Decision device, decision method and decision program | |
JP2013182580A (en) | Identity vector construction device, identity vector construction method, predicate similarity calculation device, predicate similarity calculation method and predicate similarity calculation program | |
KR20240047736A (en) | Method for domain-specific keyword extraction and system thereof |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210816 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220420 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220510 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220623 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220705 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220727 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7114433 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |