JP7114433B2 - 名称マッチング装置及び方法 - Google Patents
名称マッチング装置及び方法 Download PDFInfo
- Publication number
- JP7114433B2 JP7114433B2 JP2018192245A JP2018192245A JP7114433B2 JP 7114433 B2 JP7114433 B2 JP 7114433B2 JP 2018192245 A JP2018192245 A JP 2018192245A JP 2018192245 A JP2018192245 A JP 2018192245A JP 7114433 B2 JP7114433 B2 JP 7114433B2
- Authority
- JP
- Japan
- Prior art keywords
- name
- matching
- sensing
- word
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Testing And Monitoring For Control Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
以下、本発明の実施の形態を、図を用いて説明する。各図において、同一の構成には同一の符号を付す。
分析基盤で利用される標準信号名に、発電所やプラント等の現場信号名に対応付けられていた現場のセンサデータを対応付けるため、標準信号名と現場信号名を対応付ける必要がある。このように、分析基盤で現場信号名のような対象複合名称を解析しようとする場合、分析基盤で用いられる標準信号名のような標準複合名称との対応を行う必要がある。
図1は、システムの全体構成の概要説明図である。
ここで行う処理111はコンテクストマッチングと呼ぶ。コンテクストとはデータを意味づける情報の総称名であり、信号名が一例である。コンテクストマッチング111は、前処理112、キーワード抽出113、およびキーワードマッチング114からなる。前処理112はキーワード抽出113とキーワードマッチング114の処理を行い易くするためのデータ構造の変更であり、具体的には信号名をワード属性の表現の構文木に変換する。
図4は、システムのハードウェア構成図である。計算機202は、一般のサーバやパーソナルコンピュータ(PC)と同様の構成である。計算機202は、処理部203、各種情報やプログラムを格納する記憶装置205、メモリ204によって構成され、表示装置201に接続されている。処理部203は、本発明を実現するプログラムをメモリ204に読み込み、実行することで各種機能を実現する。
図6は、前処理のフロー図であり、図1の前処理112の詳細とその後のキーワード抽出処理の概要を示す。
形態素解析401の入力であるワード属性辞書103は、ワード属性ごとにワードを分類した辞書である。図7は、ワード属性を表すテーブルを示す図で、ワード属性702ごとにワードを分類したファイルがワード属性辞書103である。例えば、ワード属性702が「デバイス」の場合、ワードの例703として「押込みファン(FDF)」が含まれる。ワード属性は、図7に示す、Device(デバイス)、Position in Device(デバイスにおける位置)、Sensing Parameter(センシングパラメタ)、Material(センシングされる物質)、Input from Control Computer(制御コンピュータ入力)の5種類がある。信号名に含まれるこれ以外のワードは一般ワードの属性とする。本発明の処理には関係ないので、詳細は割愛する。
ワード属性変換402は、この変換された表現を用いて、信号名内の分割されたワードをワード属性に変換する。ここで一つ注意点がある。ワードによっては、同じワードの表現を用いていながら、異なる意味のワードを意味しているケースがある。この場合は、どちらの意味で用いているかをユーザに問い合わせて元の信号名のワードを変換する。例えば、図8の例では、電圧というワードが、意味として電圧というワードを意味する場合と温度というワードを意味する場合があり、どちらの意味を示すかを決定する必要がある。この決定は図9に示すGUIによってユーザに決定してもらう。
パーサ404はBNF104で示す信号名の構文を用いて、標準信号名109、現場信号名110の各々を構文木410、411に変換する。ここでは、BNF104と構文木の表現について説明する。これらの利用方法は後述する。
キーワード抽出113は、全ての現場信号名と標準信号名に対して、キーワードなどのマッチング対象となるキーワードと修飾ワード、および特性を抽出する処理である。キーワードマッチング114は、現場信号名の各々に対して、抽出したワードや特性がマッチする標準信号名を、対応する標準信号名の候補として、現場信号名と標準信号名との一致度を表すマッチング度と共に出力する。
まず、ステップ1303とステップ1305で示すキーワードと修飾ワード、および特性の抽出の処理を述べる。図13は、キーワードの抽出ルールと、信号名「A・FDF軸受温度」を示した図11の構文木から、このルールに従って抽出されたキーワードの例を示した図である。
図15において、マッチング度1402は、キーワード全体に対して与えられるマッチング度を示す。Definitionで示す式で定義する。キーセンシングパラメタ、マクロデバイス、センシング対象デバイスの各々に対してウェイト1、ウェイト2、ウェイト3が与えられ、各々のキーワードとその修飾ワードがマッチするか否かによりマッチが1または0となる。ウェイトとマッチにより与えられたDefinitionの式が、マッチング度の定義を示す。 ウェイトはその重要度に従い、Condition1からCondition3の条件を満たすように設定する。キーセンシングパラメタ、マクロデバイス、センシング対象デバイスの各々に対して例えば、「0.6」「0.3」「0.1」が設定される。Condition1では、全ての重みの総計が「1」となる条件であり、Condition2では、他のキーワードの重みの総計よりも大きくする条件である。Condition3では、キーワードの重みを、キーセンシングパラメタを最大とする条件であり、その他、キーセンシングパラメタのマッチングが信号名のマッチングにおいて必須とする条件を設定することができる。
標準信号名と現場信号名のキーワードが一致していても、修飾語が一致していない場合、同じ信号名として対応付けすることができない場合がある。標準信号名と現場信号名の修飾語が共に同じ内容であれば、図15のDefinitionで示すMatchは1となる。標準信号名と現場信号名の一方のみに修飾ワードが入っていた場合も、Matchは1として対応する信号名とする。図16は、このような条件を表している。
Claims (7)
- 対象複合名称と標準複合名称からなる二つの複合名称と、複合名称に出現するワードの属性を登録したワード属性辞書と、ワード属性から構成される複合名称の構文とを格納する記憶装置と、
前記対象複合名称と前記標準複合名称のそれぞれに対し、信号の単位と、前記記憶装置に格納された、前記ワード属性辞書と前記構文とが入力され、
前記対象複合名称の第一の構文木と、前記標準複合名称の第二の構文木を出力し、
前記第一の構文木と前記第二の構文木からキーワードを抽出し、
対象複合名称と標準複合名称からなる二つの複合名称から抽出されたキーワード同士をマッチングして、二つの複合名称のマッチング度を算出する処理部とを有し、
前記処理部は、キーワードの重みを、キーセンシングパラメタを最大とするか、他のキーワードの重みの総計よりも大きくするか、キーセンシングパラメタのマッチングが信号名のマッチングにおいて必須とするかを、条件とし、抽出されたキーワードに重み付けてキーワードのマッチング度を算出する、ことを特徴とする名称マッチング装置。 - 前記複合名称は信号名であり、
前記ワード属性辞書は、デバイス、センシングパラメタ、デバイスにおける位置、センシングされる物質、及び制御コンピュータからの入力を含み、
前記処理部は、前記ワード属性辞書を参照して信号名に出現するワードのワード属性を判定する、ことを特徴とする、請求項1に記載の名称マッチング装置。 - 前記複合名称は信号名であり、
前記信号名の構文は、前記信号名をセンシング対象部とセンシング部に分割する分割ルールを構文の一部に含む、ことを特徴とする請求項1記載の名称マッチング装置。 - 前記センシング対象部は、前記信号名の最初からデバイスまたは位置の属性のワードで終了する部分までで定義し、センシング部はセンシング対象部を除いた部分の全てで定義されたものである、ことを特徴とする請求項3記載の名称マッチング装置。
- 前記処理部により抽出されるキーワードは、キーセンシングパラメタ、メインデバイス、およびセンシング対象デバイスからなり、
前記キーセンシングパラメタは、前記センシング部の中で、最も右にあるセンシングパラメタ属性のワードであり、前記メインデバイスは、前記センシング対象部の中で、最も左に位置するデバイス属性のワードであり、前記センシング対象デバイスは、前記センシング対象部の中で最も右に位置するデバイス属性のワードである、ことを特徴とする請求項4記載の名称マッチング装置。 - 前記記憶装置は、信号値の単位である信号の単位を記憶し、複数の意味を持つワードの種類を特定する請求項2記載の名称マッチング装置。
- 記憶装置に対象複合名称と標準複合名称からなる二つの複合名称と、複合名称に出現するワードの属性を登録したワード属性辞書と、ワード属性から構成される複合名称の構文とを格納し、
処理部は、
前記対象複合名称と前記標準複合名称のそれぞれに対し、信号の単位と、前記記憶装置に格納された、前記ワード属性辞書と前記構文とが入力され、
前記対象複合名称の第一の構文木と、前記標準複合名称の第二の構文木を出力し、
前記第一の構文木と前記第二の構文木からキーワードを抽出し、
対象複合名称と標準複合名称からなる二つの複合名称から抽出されたキーワード同士をマッチングして、二つの複合名称のマッチング度を算出する際、キーワードの重みを、キーセンシングパラメタを最大とするか、他のキーワードの重みの総計よりも大きくするか、キーセンシングパラメタのマッチングが信号名のマッチングにおいて必須とするかを、条件とし、抽出されたキーワードに重み付けてキーワードのマッチング度を算出することを特徴とする名称マッチング方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018192245A JP7114433B2 (ja) | 2018-10-11 | 2018-10-11 | 名称マッチング装置及び方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018192245A JP7114433B2 (ja) | 2018-10-11 | 2018-10-11 | 名称マッチング装置及び方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020060988A JP2020060988A (ja) | 2020-04-16 |
JP7114433B2 true JP7114433B2 (ja) | 2022-08-08 |
Family
ID=70220017
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018192245A Active JP7114433B2 (ja) | 2018-10-11 | 2018-10-11 | 名称マッチング装置及び方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7114433B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112541326B (zh) * | 2020-11-16 | 2024-02-20 | 中国南方电网有限责任公司 | 一种psd-bpa母线名称生成方法及系统 |
CN113222455A (zh) * | 2021-05-28 | 2021-08-06 | 西安热工研究院有限公司 | 一种基于模块化分解与匹配的发电机组参数名称匹配方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2500680B2 (ja) * | 1990-12-13 | 1996-05-29 | 日本電信電話株式会社 | デ−タ名付与登録装置 |
-
2018
- 2018-10-11 JP JP2018192245A patent/JP7114433B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2020060988A (ja) | 2020-04-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6727610B2 (ja) | 文脈解析装置及びそのためのコンピュータプログラム | |
US20200192727A1 (en) | Intent-Based Organisation Of APIs | |
RU2607976C1 (ru) | Извлечение информации из структурированных документов, содержащих текст на естественном языке | |
JP6955963B2 (ja) | 検索装置、類似度算出方法、およびプログラム | |
KR20110020462A (ko) | 지능형 질의 응답 검색 시스템 및 방법 | |
CN110096599B (zh) | 知识图谱的生成方法及装置 | |
KR102468481B1 (ko) | 함의 페어 확장 장치, 그것을 위한 컴퓨터 프로그램, 및 질문 응답 시스템 | |
JP2022115815A (ja) | 拡張プログラミング言語コーパスに基づく意味コード検索 | |
Krishna et al. | A dataset for Sanskrit word segmentation | |
JP7114433B2 (ja) | 名称マッチング装置及び方法 | |
Simov et al. | Using context information for knowledge-based word sense disambiguation | |
Palagin et al. | Distributional semantic modeling: A revised technique to train term/word vector space models applying the ontology-related approach | |
KR101802051B1 (ko) | 자연 언어 처리 스키마 및 그 지식 데이터베이스 구축 방법 및 시스템 | |
JP6327799B2 (ja) | 自然言語推論システム、自然言語推論方法及びプログラム | |
WO2017122904A1 (ko) | 구체화된 삼항 관계 추출을 위한 개방형 정보 추출 방법 및 시스템 | |
KR102130779B1 (ko) | 기계 독해를 위한 문서를 제공하는 시스템 및 이를 포함하는 질의 응답 시스템 | |
Mishra | Natural Language Processing Using PyTorch | |
Tovar et al. | Validation of Semantic Relation of Synonymy in Domain Ontologies Using Lexico-Syntactic Patterns and Acronyms | |
JP2008140204A (ja) | データ検索システム及びプログラム | |
Gokhan et al. | Node-Weighted Centrality Ranking for Unsupervised Long Document Summarization | |
EP3176708B1 (en) | Method and system for constructing natural language processing schema and knowledge database thereof | |
Labidi et al. | An nlp-based ontology population for intentional structure | |
JP2019003237A (ja) | 提示方法、提示装置及び提示プログラム | |
US20210192316A1 (en) | Device and method for processing digital data | |
Nugaliyadde et al. | Multi-level Search of a Knowledgebase for Semantic Parsing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210816 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220420 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220510 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220623 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220705 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220727 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7114433 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |