JP7114433B2 - 名称マッチング装置及び方法 - Google Patents

名称マッチング装置及び方法 Download PDF

Info

Publication number
JP7114433B2
JP7114433B2 JP2018192245A JP2018192245A JP7114433B2 JP 7114433 B2 JP7114433 B2 JP 7114433B2 JP 2018192245 A JP2018192245 A JP 2018192245A JP 2018192245 A JP2018192245 A JP 2018192245A JP 7114433 B2 JP7114433 B2 JP 7114433B2
Authority
JP
Japan
Prior art keywords
name
matching
sensing
word
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018192245A
Other languages
English (en)
Other versions
JP2020060988A (ja
Inventor
哲朗 本村
泰芽 阿部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2018192245A priority Critical patent/JP7114433B2/ja
Publication of JP2020060988A publication Critical patent/JP2020060988A/ja
Application granted granted Critical
Publication of JP7114433B2 publication Critical patent/JP7114433B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Testing And Monitoring For Control Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、名称マッチング技術に関する。
様々な「モノ(物)」がインターネットに接続され、情報交換することにより相互に制御する仕組みであるIoT(Internet of Things)が注目されている。発電所やプラントにおいてもIoTを利用し、各種センサデータを収集し、必要な情報を抽出して分析する基盤の整備が求められている。
医学生物学分野の論文から研究者が興味を持つ情報を自動的に文献から抽出する技術として、特許文献1が挙げられる。
特開2002-32374号公報
特許文献1は、学術文献等の文章である自然言語処理を対象とするため、文献を名詞等の用語と動詞等の並びに基づいて言語的に解析しているが、発電所やプラント等におけるセンサ信号のように、動詞が使われることのなく、一般の文章とは異なる体系からなり、自然言語処理が単純に適応できない情報の解析については、何ら言及されていない。
そこで、本発明の目的は、各種現場信号のセンサデータを分析基盤で利用するためデータの分析基盤で利用される標準信号名に、発電所やプラントの現場信号名を対応付ける名称マッチング装置及び方法を提供することを目的とする。
本発明は、上記の課題を解決するための名称マッチング装置に関連し、その適用形態の一例を挙げるならば、名称マッチング装置は、対象複合名称と標準複合名称からなる二つの複合名称と、複合名称に出現するワードの属性を登録したワード属性辞書と、ワード属性から構成される複合名称の構文とを格納する記憶装置と、ワード属性辞書と複合名称の構文から、複合名称を特徴付けるキーワードを抽出する抽出し、対象複合名称と標準複合名称からなる二つの複合名称から抽出されたキーワード同士をマッチングして、二つの複合名称のマッチング度を算出する処理部とを有する。
本発明によれば、対象複合名称と標準複合名称からなる二つの複合名称との対応付け、例えば、発電所やプラント等で用いられる各種センサの信号に含まれる現場信号名と分析基盤の標準信号名との対応付け、を効率よく行うことができる。
システムの全体構成の概要説明図。 信号名ファイルを示した図。 信号名マッチングリストを示した図。 システムのハードウェア構成図。 システムの他のハードウェア構成図。 コンテクストマッチング内の前処理のフロー図。 ワード属性を表すテーブルを示す図。 複数の意味づけを持つワードを示した図。 ワードの意味づけを決定するためのGUIを示した図。 信号名のBNFの例を示した図。 信号名の構文木の例を示した図。 キーワード抽出とキーワードマッチングの処理フロー図。 キーワードの抽出ルールを示した図。 修飾ワードの抽出ルールを示した図。 マッチング度の計算方法を示した図。 キーワードマッチング度計算のためのマッチング条件を示した図。
<明細書中の用語の定義>
以下、本発明の実施の形態を、図を用いて説明する。各図において、同一の構成には同一の符号を付す。
以下、発明の実施の形態を、図面を参照して詳細に説明する。以下の記載および図面は、本発明を説明するための例示であって、説明の明確化のため、適宜、省略および簡略化がなされている。本発明は、他の種々の形態でも実施する事が可能である。特に限定しない限り、各構成要素は単数でも複数でも構わない。
図面において示す各構成要素の位置、大きさ、形状、範囲などは、発明の理解を容易にするため、実際の位置、大きさ、形状、範囲などを表していない場合がある。このため、本発明は、必ずしも、図面に開示された位置、大きさ、形状、範囲などに限定されない。
以下の説明では、「テーブル」、「リスト」、「キュー」等の表現にて各種情報を説明することがあるが、各種情報は、これら以外のデータ構造で表現されていてもよい。データ構造に依存しないことを示すために「XXテーブル」、「XXリスト」等を「XX情報」と呼ぶことがある。識別情報について説明する際に、「識別情報」、「識別子」、「名」、「ID」、「番号」、「Region」等の表現を用いるが、これらについてはお互いに置換が可能である。
同一あるいは同様な機能を有する構成要素が複数ある場合には、同一の符号に異なる添字を付して説明する場合がある。ただし、これらの複数の構成要素を区別する必要がない場合には、添字を省略して説明する場合がある。
また、以下の説明では、プログラムを実行して行う処理を説明する場合があるが、プログラムは、プロセッサ(例えばCPU、GPU)によって実行されることで、定められた処理を、適宜に記憶資源(例えば記憶装置)および/またはインターフェースデバイス(例えば通信ポート)等を用いながら行うため、処理の主体がプロセッサとされてもよい。同様に、プログラムを実行して行う処理の主体が、プロセッサを有するコントローラ、装置、システム、計算機、ノードであってもよい。プログラムを実行して行う処理の主体は、制御部であれば良く、特定の処理を行う専用回路(例えばFPGAやASIC)を含んでいてもよい。
プログラムは、プログラムソースから計算機のような装置にインストールされてもよい。プログラムソースは、例えば、プログラム配布サーバまたは計算機が読み取り可能な記憶メディアであってもよい。プログラムソースがプログラム配布サーバの場合、プログラム配布サーバはプロセッサと配布対象のプログラムを記憶する記憶資源を含み、プログラム配布サーバのプロセッサが配布対象のプログラムを他の計算機に配布してもよい。また、以下の説明において、2以上のプログラムが1つのプログラムとして実現されてもよいし、1つのプログラムが2以上のプログラムとして実現されてもよい。
<概要>
分析基盤で利用される標準信号名に、発電所やプラント等の現場信号名に対応付けられていた現場のセンサデータを対応付けるため、標準信号名と現場信号名を対応付ける必要がある。このように、分析基盤で現場信号名のような対象複合名称を解析しようとする場合、分析基盤で用いられる標準信号名のような標準複合名称との対応を行う必要がある。
しかし、複合名称である信号名は現場ごとに命名規則が異なるため、この対応付けは工数が必要となる。例えば、電力プラントでは、2000本程度の信号名に対して、現場信号を熟知するドメインエクスパートが2人月程度必要になるといわれている。
そこで、二つの複合名称である標準信号名と現場信号名の対応付けを、プラントで共通の種類のキーワードを抽出して、キーワードをマッチングすることにより行う。以下、二つの複合名称を、理解を容易にするために標準信号名、現場信号名と具体的に記載するが、本発明がこれらに限定されることを意図するものではなく、一般の複合名称に適応可能であることは言うまでもない。
(1)これらの信号名は、「デバイス」「センシングパラメタ」「位置」等の分野特有のワード属性を持つワードにより構成される複合名称となっている。信号名の構文は、このワード属性により構成されており、その構文は信号名がセンシング対象部とセンシング部からなることを示す。センシング対象部はセンシングする部位を示す部分であり、ここからデバイスなどのセンシングを行う部位に関するキーワードを抽出する。センシング部はどんなセンシングを行うかを示す部分で、センシングの種類を示すキーワードを抽出する。さらに、二つに分けられた部分の中で、ワード属性の出現順を示す構文によっても異なる種類のキーワードが抽出される。
例えば、センシングパラメタ属性である「温度」という名称が信号名中のどこに出現するかで、「キーセンシングパラメタ」というキーワードとなるかが決まる。また、センシング対象部の中で、デバイス属性である「FDF」の出現順により、「メインデバイス」か「センシング対象デバイス」のいずれのキーワードとなるかが決まる。ここで述べたキーワードの種類の定義は後述する。
(2) (1)で抽出されたキーワードを元にして、さらに、キーワードに対する修飾ワードも信号名の構文から抽出する。
<システムの全体構成の概要>
図1は、システムの全体構成の概要説明図である。
ここで行う処理111はコンテクストマッチングと呼ぶ。コンテクストとはデータを意味づける情報の総称名であり、信号名が一例である。コンテクストマッチング111は、前処理112、キーワード抽出113、およびキーワードマッチング114からなる。前処理112はキーワード抽出113とキーワードマッチング114の処理を行い易くするためのデータ構造の変更であり、具体的には信号名をワード属性の表現の構文木に変換する。
キーワード抽出113は信号名からキーワードと修飾ワード、および特有の特性を抽出する処理である。キーワードマッチング114は、標準信号名と現場信号名のキーワードと修飾ワード、および特性のマッチングを行ってマッチング度を計算し、信号名マッチングリスト115を出力する。信号名マッチングリスト115の結果を見て、ユーザが対応信号を最終決定する(117)。以上の処理の詳細は後述する。
入力情報として、信号情報108と電力などのある分野に共通に用いられる入力情報101があり、出力情報として、信号名マッチングリスト115がある。中間出力情報として、信号名から抽出されたキーワード情報105がある。
入力情報101には、種々のワード属性辞書103と、ワード属性により信号名の構文を表現したBNF(Backus-Naur form)104がある。信号情報108は、標準信号に対しては、標準信号名109と標準信号の単位1029がある。現場信号に対しても、同様に現場信号名110と単位1020がある。ここで単位とは信号のデータの単位を示し、単位を見て電圧や温度などの信号の意味が判断できる情報である。
出力情報115には、現場信号名に対する標準信号名の候補リストを、両者の一致度を表すマッチング度共に出力する。
中間出力情報105には、標準信号名と現場信号名の各々に対してキーワード、修飾ワード、および特性を抽出した結果を出力する。
コンテクストマッチング111の機能の概要を示すため、主要な入力である、標準信号名109、現場信号名110、及び標準信号名と現場信号名とのマッチングリスト(信号名マッチングリスト)115を、図2と図3に従い説明する。
図2(A)は、標準信号名109を、図2(B)は現場信号名110を示している。信号ID501は、信号を一意に特定するためのIDである。信号名502は信号名を表している。例えば、標準信号ファイル500の信号ID「002」の標準信号名は「A・FDF 用 電動機 軸受 温度」であることを示している。また、現場信号ファイル510の信号ID「002」の現場信号名は「A・FDF 軸受 温度」であること示している。
図3は、信号名マッチングリスト115を示した図である。現場信号名601と標準信号名候補602、マッチング度603、結果604が対応して記憶される。例えば、現場信号名601が「Aボイラ出力温度」の場合、標準信号名候補602として「Aボイラ出力温度」と「Aボイラ入力湿度」がある。そして、「Aボイラ出力温度」のマッチング度603は「1」、「Aボイラ入力湿度」のマッチング度603は「0.83」と計算される。この計算値を元にユーザにより最終マッチング決定117が行われる。マッチング度の計算の詳細については後述する。
以降では、まず、図4と図5に従い、システムのハードウェア構成を述べた後、図1で示したコンテクストマッチング111を構成する各処理について述べる。
<システムのハードウェア構成>
図4は、システムのハードウェア構成図である。計算機202は、一般のサーバやパーソナルコンピュータ(PC)と同様の構成である。計算機202は、処理部203、各種情報やプログラムを格納する記憶装置205、メモリ204によって構成され、表示装置201に接続されている。処理部203は、本発明を実現するプログラムをメモリ204に読み込み、実行することで各種機能を実現する。
記憶装置205には、信号の単位102(標準信号の単位1029、現場信号の単位1020)、ワード属性辞書103、信号構文BNF104、標準信号名キーワード106、現場信号名キーワード107、標準信号名109、現場信号名110、信号名マッチングリスト115が格納され、処理部203によってコンテクストマッチング処理111を行う。
図5は、図4に示したシステムハードウェア構成図の他の例である。計算機202は図4と同様の構成となるが、計算機はインターネット等のネットワーク303に接続される。ネットワーク303に接続される端末302に表示装置301がある。ユーザは端末302を用いて、ネットワーク303に接続される計算機と通信することで、図1のワード決定116や最終マッチング決定117を行う。
以降では、コンテクストマッチング111を構成する各処理について述べる。
<前処理>
図6は、前処理のフロー図であり、図1の前処理112の詳細とその後のキーワード抽出処理の概要を示す。
前処理112は、標準信号名109と現場信号名110の各々に対して、各々の信号の単位1029と1020、ワード属性辞書103、信号名の構文規則であるBNF104を入力して、標準信号名の構文木410と現場信号名の構文木411を出力する。
最初の処理、形態素解析401は、信号名をワード単位に分割する処理である。ワード属性辞書103はワード属性に属するワードが記載されており、ワードの種類を示す辞書ということもできる。この辞書を利用して、信号名をワード単位に分割する。その後、ワード属性変換402により、信号名内の分割されたワードをワード属性に変換する。最後にパーサ404により、信号名を構文とワード属性により表現される構文木に変換する。ここでパーサ404はBNF104をパーサジェネレータ403により自動生成する。形態素解析、BNF、パーサジェネレータは公知の表現と技術であり、ここでは説明は割愛する。
以下では、形態素解析401、ワード属性変換402、パーサ404の各処理について説明する。
形態素解析401の入力であるワード属性辞書103は、ワード属性ごとにワードを分類した辞書である。図7は、ワード属性を表すテーブルを示す図で、ワード属性702ごとにワードを分類したファイルがワード属性辞書103である。例えば、ワード属性702が「デバイス」の場合、ワードの例703として「押込みファン(FDF)」が含まれる。ワード属性は、図7に示す、Device(デバイス)、Position in Device(デバイスにおける位置)、Sensing Parameter(センシングパラメタ)、Material(センシングされる物質)、Input from Control Computer(制御コンピュータ入力)の5種類がある。信号名に含まれるこれ以外のワードは一般ワードの属性とする。本発明の処理には関係ないので、詳細は割愛する。
形態素解析401では、ワード属性辞書からワードの種類を読み取り、信号名をワードごとに分割する。
ワード属性変換402は、この変換された表現を用いて、信号名内の分割されたワードをワード属性に変換する。ここで一つ注意点がある。ワードによっては、同じワードの表現を用いていながら、異なる意味のワードを意味しているケースがある。この場合は、どちらの意味で用いているかをユーザに問い合わせて元の信号名のワードを変換する。例えば、図8の例では、電圧というワードが、意味として電圧というワードを意味する場合と温度というワードを意味する場合があり、どちらの意味を示すかを決定する必要がある。この決定は図9に示すGUIによってユーザに決定してもらう。
最後に、パーサ404を説明する。
パーサ404はBNF104で示す信号名の構文を用いて、標準信号名109、現場信号名110の各々を構文木410、411に変換する。ここでは、BNF104と構文木の表現について説明する。これらの利用方法は後述する。
図10に信号名のBNF104の例を示す。ここでBNFの表現をその文法と共に簡単に説明しておく。詳細な文法は一般のコンパイラのドキュメントなどを参照されたい。左の表現は右の表現で定義することを示す。このとき左と右は”:”で区分する。右が複数の構成要素から構成されているときには、構成要素の間は空白で区切る。右の表現が、複数の表現のいずれかのOR(オア)であるときには、各表現を”|”で区切る。
1601は、信号名(signal_name)が、センシング対象部(sensing_target_part)とセンシング部(sensing_part)から構成することを示す。センシング対象部は、このBNF表現で定義できるが、別の表現を用いると、信号名の最初からデバイスまたは位置の属性のワードで終了する部分までで定義する。センシング部は信号名の中でセンシング対象部以外の残りの部分を示す。
これらの構成要素はさらに、他の構成要素により定義できる。1602はセンシング対象部が、センシングsensing_target_series)で表現されることを示す。sensing_taret_seriesはセンシング対象(sensing_target)が複数連なることを示す。1603では、センシング対象(sensing_target)が、センシング対象属性(sensing_taget_attribute)か、補助語のシリーズ(complimentary_series)とセンシング対象属性からなることを示す。1604で、センシング対象属性は、デバイスのワード属性(DECVICE)または位置のワード属性(POSISION)であることを示す。1605で、補助語は、修飾語(modifying_word)か識別子(ID_part)であることを示す。1606で、修飾語は物質のワード属性(MATERIAL)か、センシングパラメタのワード属性(SENSING_PARAMETER)か、一般語のワード属性(GENERAL_WORD)か、接尾語のワード属性(POSTFIX)のいずれかであることを示す。1607で、センシング部は、センシング属性のシリーズ(sensing_attribute_series)か、一般トークンのシリーズ(general_token_series)とセンシング属性のシリーズからなることを示す。一般トークンシリーズは、図7で示したセンシング特有のワード属性以外の一般のワード属性のシリーズを示す。センシング属性は1608で示すように、センシングパラメタのワード属性(SENSING_PARAMETER)か、物質のワード属性(MATERIAL)か、制御コンピュータ入力のワード属性(Input from Control Computer)からなることを示す。
パーサ404は、信号名がBNF104に従う構文となっていることをチェックして、このBNFに従っていなければエラーとなり、従っていれば構文木の表現に変換する。図11に「A・FDF 用 電動機 軸受 温度」の信号名の構文木を示す。最上位のノード1701が信号名(signal_name)であり、BNF104の定義通り、信号名(signal_name)が、センシング対象部(sensing_target_part)とセンシング部(sensing_part)からなることを、その下の階層1702で示す。同様にして、BNF104通りに下位の階層で表現していくと、「A・B FDF 軸受」までが、センシング対象部(sensing_target_part)で、「A・」が識別子(ID_part)であり、「FDF」が装置(DEVICE)であり、「軸受」が装置(DEVICE)であることが解析できる。同様にして、センシング部(sensing_part)は「温度」の部分であり、「温度」はセンシングパラメータ(SENSING_PARAMETR)であることが解析できる。このように、信号名に含まれるキーワードがセンシング対象部かセンシング部であるかを把握できる。
<キーワード抽出113とキーワードマッチング114>
キーワード抽出113は、全ての現場信号名と標準信号名に対して、キーワードなどのマッチング対象となるキーワードと修飾ワード、および特性を抽出する処理である。キーワードマッチング114は、現場信号名の各々に対して、抽出したワードや特性がマッチする標準信号名を、対応する標準信号名の候補として、現場信号名と標準信号名との一致度を表すマッチング度と共に出力する。
キーワード抽出113とキーワードマッチング114の処理フローを図12に示す。これらの処理は、現場信号名と標準信号名の2重ループで処理する。
ステップ1302が現場信号名のループである。ステップ1303は、一つの現場信号名の構文木411からキーワードと修飾ワード、および特性を抽出する。同じく、ステップ1304では標準信号名の構文木410からキーワードと修飾ワード、および特性を抽出する。ステップ1306は各現場信号名に対する各標準信号名に対するキーワードマッチング114の処理を示す。これはマッチング度の計算処理で、各現場信号名に対する全ての標準信号名の一致度を表すマッチング度を計算し、キーワードに対するマッチング度が閾値1311以上の標準信号名を候補として、そのマッチング度と共に、信号名マッチングリスト115として出力する。ステップ1310で示すウェイトはマッチング度を計算するためのキーワードの重みづけである。マッチング度の計算の詳細は後述する。
以下では、図12の各処理の詳細を述べる。
まず、ステップ1303とステップ1305で示すキーワードと修飾ワード、および特性の抽出の処理を述べる。図13は、キーワードの抽出ルールと、信号名「A・FDF軸受温度」を示した図11の構文木から、このルールに従って抽出されたキーワードの例を示した図である。
キーワード902「Key Sensing Parameter」に対し、抽出ルール「The Rightmost “Sensing Parameter” Word in Sensing Part」、つまり、センシング部における最も右側の“センシングパラメタ”をセンシングパラメタとして抽出するルールが設定され、「温度」が標準信号名のキーワード106として、抽出されている。
同様に、キーワード902「Main Device」に対し、抽出ルール903「The Leftmost Device”Word in Sensing Target Part」、つまり、“センシング対象部のワードで最も左側をメインデバイス”として、デバイスを抽出するルールが設定されている。マクロデバイスは、信号名において、センシング対象部の最も左側に現れるからである。この例では、デバイスとして、「FDF」が抽出されている。
同様に、キーワード902「Sensing Target Device」に対し、抽出ルール903「The Rightmost “Device” Word in Sensing Target Part」、つまり、「センシング対象部のワードで最も右側をデバイス」として、デバイスを抽出するルールが設定されている。デバイスは、信号名において、センシング対象部の最も右側に現れるからである。この例では、デバイスとして、「軸受」が信号名のキーワードとして、抽出されている。
図14は、キーワードの修飾語と特性に関する抽出ルールと抽出された修飾ワードと特性の例を示した図である。例えば、番号1001「1」に修飾語1002「Sensing Target Material(センシング対象物質)」を抽出するためのルールとして、「The Left “Material” Word of Key Sensing Parameter(キーセンシングパラメタの左側にある物質)」が設定されている。そして、「メタル」「油」が信号名のキーワード106、107として、抽出されている。番号「2」から「5」も各修飾語等が、信号名中に登場する位置によって、抽出ルールを設定し、修飾語のキーワードを抽出する。
次に、1306で示すマッチング度の計算処理を、図15と図16に従い説明する。
図15において、マッチング度1402は、キーワード全体に対して与えられるマッチング度を示す。Definitionで示す式で定義する。キーセンシングパラメタ、マクロデバイス、センシング対象デバイスの各々に対してウェイト1、ウェイト2、ウェイト3が与えられ、各々のキーワードとその修飾ワードがマッチするか否かによりマッチが1または0となる。ウェイトとマッチにより与えられたDefinitionの式が、マッチング度の定義を示す。 ウェイトはその重要度に従い、Condition1からCondition3の条件を満たすように設定する。キーセンシングパラメタ、マクロデバイス、センシング対象デバイスの各々に対して例えば、「0.6」「0.3」「0.1」が設定される。Condition1では、全ての重みの総計が「1」となる条件であり、Condition2では、他のキーワードの重みの総計よりも大きくする条件である。Condition3では、キーワードの重みを、キーセンシングパラメタを最大とする条件であり、その他、キーセンシングパラメタのマッチングが信号名のマッチングにおいて必須とする条件を設定することができる。
マッチするか否かの条件は、各キーワードに対して図16で示す。1502はキーセンシングパラメタに対する条件、1503はメインデバイスに対する条件、1504はセンシング対象デバイスに対する条件を示す。Condition1、Condition2、Condition3のアンド条件が条件となる。
標準信号名と現場信号名のキーワードが一致していても、修飾語が一致していない場合、同じ信号名として対応付けすることができない場合がある。標準信号名と現場信号名の修飾語が共に同じ内容であれば、図15のDefinitionで示すMatchは1となる。標準信号名と現場信号名の一方のみに修飾ワードが入っていた場合も、Matchは1として対応する信号名とする。図16は、このような条件を表している。
図15のマッチング度1403はデバイス階層に対して与えられ、マッチング対象のデバイスの数を現場信号名のデバイスの数で除算した「3/4」が設定されている。
以上、本実施例では、発電所やプラント等におけるセンサ信号のように、動詞が使われることのなく、一般の文章とは異なる体系からなり、自然言語処理が単純に適応できない情報を分析基盤で利用するためデータの分析基盤で利用される標準信号名に、対応付けることができる。これにより、発電所やプラントのセンサデータを効率よく分析することができる。
101:入力情報、103:ワード属性辞書、109:標準信号名、110:現場信号名、112:前処理、113:キーワード抽出、114:キーワードマッチング、115:キーワードマッチングリスト、202:計算機、203:処理部、204:メモリ、205:記憶装置、302:端末、303:ネットワーク。

Claims (7)

  1. 対象複合名称と標準複合名称からなる二つの複合名称と、複合名称に出現するワードの属性を登録したワード属性辞書と、ワード属性から構成される複合名称の構文とを格納する記憶装置と、
    前記対象複合名称と前記標準複合名称のそれぞれに対し、信号の単位と、前記記憶装置に格納された、前記ワード属性辞書と前記構文とが入力され、
    前記対象複合名称の第一の構文木と、前記標準複合名称の第二の構文木を出力し、
    前記第一の構文木と前記第二の構文木からキーワードを抽出し、
    対象複合名称と標準複合名称からなる二つの複合名称から抽出されたキーワード同士をマッチングして、二つの複合名称のマッチング度を算出する処理部とを有し、
    前記処理部は、キーワードの重みを、キーセンシングパラメタを最大とするか、他のキーワードの重みの総計よりも大きくするか、キーセンシングパラメタのマッチングが信号名のマッチングにおいて必須とするかを、条件とし、抽出されたキーワードに重み付けてキーワードのマッチング度を算出する、ことを特徴とする名称マッチング装置。
  2. 前記複合名称は信号名であり、
    前記ワード属性辞書は、デバイス、センシングパラメタ、デバイスにおける位置、センシングされる物質、及び制御コンピュータからの入力を含み、
    前記処理部は、前記ワード属性辞書を参照して信号名に出現するワードのワード属性を判定する、ことを特徴とする、請求項1に記載の名称マッチング装置。
  3. 前記複合名称は信号名であり、
    前記信号名の構文は、前記信号名をセンシング対象部とセンシング部に分割する分割ルールを構文の一部に含む、ことを特徴とする請求項1記載の名称マッチング装置。
  4. 前記センシング対象部は、前記信号名の最初からデバイスまたは位置の属性のワードで終了する部分までで定義し、センシング部はセンシング対象部を除いた部分の全てで定義されたものである、ことを特徴とする請求項3記載の名称マッチング装置。
  5. 前記処理部により抽出されるキーワードは、キーセンシングパラメタ、メインデバイス、およびセンシング対象デバイスからなり、
    前記キーセンシングパラメタは、前記センシング部の中で、最も右にあるセンシングパラメタ属性のワードであり、前記メインデバイスは、前記センシング対象部の中で、最も左に位置するデバイス属性のワードであり、前記センシング対象デバイスは、前記センシング対象部の中で最も右に位置するデバイス属性のワードである、ことを特徴とする請求項4記載の名称マッチング装置。
  6. 前記記憶装置は、信号値の単位である信号の単位を記憶し、複数の意味を持つワードの種類を特定する請求項2記載の名称マッチング装置。
  7. 記憶装置に対象複合名称と標準複合名称からなる二つの複合名称と、複合名称に出現するワードの属性を登録したワード属性辞書と、ワード属性から構成される複合名称の構文とを格納し、
    処理部は、
    前記対象複合名称と前記標準複合名称のそれぞれに対し、信号の単位と、前記記憶装置に格納された、前記ワード属性辞書と前記構文とが入力され、
    前記対象複合名称の第一の構文木と、前記標準複合名称の第二の構文木を出力し、
    前記第一の構文木と前記第二の構文木からキーワードを抽出し、
    対象複合名称と標準複合名称からなる二つの複合名称から抽出されたキーワード同士をマッチングして、二つの複合名称のマッチング度を算出する際、キーワードの重みを、キーセンシングパラメタを最大とするか、他のキーワードの重みの総計よりも大きくするか、キーセンシングパラメタのマッチングが信号名のマッチングにおいて必須とするかを、条件とし、抽出されたキーワードに重み付けてキーワードのマッチング度を算出することを特徴とする名称マッチング方法。
JP2018192245A 2018-10-11 2018-10-11 名称マッチング装置及び方法 Active JP7114433B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018192245A JP7114433B2 (ja) 2018-10-11 2018-10-11 名称マッチング装置及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018192245A JP7114433B2 (ja) 2018-10-11 2018-10-11 名称マッチング装置及び方法

Publications (2)

Publication Number Publication Date
JP2020060988A JP2020060988A (ja) 2020-04-16
JP7114433B2 true JP7114433B2 (ja) 2022-08-08

Family

ID=70220017

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018192245A Active JP7114433B2 (ja) 2018-10-11 2018-10-11 名称マッチング装置及び方法

Country Status (1)

Country Link
JP (1) JP7114433B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112541326B (zh) * 2020-11-16 2024-02-20 中国南方电网有限责任公司 一种psd-bpa母线名称生成方法及系统
CN113222455A (zh) * 2021-05-28 2021-08-06 西安热工研究院有限公司 一种基于模块化分解与匹配的发电机组参数名称匹配方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2500680B2 (ja) * 1990-12-13 1996-05-29 日本電信電話株式会社 デ−タ名付与登録装置

Also Published As

Publication number Publication date
JP2020060988A (ja) 2020-04-16

Similar Documents

Publication Publication Date Title
JP6727610B2 (ja) 文脈解析装置及びそのためのコンピュータプログラム
US20200192727A1 (en) Intent-Based Organisation Of APIs
RU2607976C1 (ru) Извлечение информации из структурированных документов, содержащих текст на естественном языке
JP6955963B2 (ja) 検索装置、類似度算出方法、およびプログラム
KR20110020462A (ko) 지능형 질의 응답 검색 시스템 및 방법
CN110096599B (zh) 知识图谱的生成方法及装置
KR102468481B1 (ko) 함의 페어 확장 장치, 그것을 위한 컴퓨터 프로그램, 및 질문 응답 시스템
JP2022115815A (ja) 拡張プログラミング言語コーパスに基づく意味コード検索
Krishna et al. A dataset for Sanskrit word segmentation
JP7114433B2 (ja) 名称マッチング装置及び方法
Simov et al. Using context information for knowledge-based word sense disambiguation
Palagin et al. Distributional semantic modeling: A revised technique to train term/word vector space models applying the ontology-related approach
KR101802051B1 (ko) 자연 언어 처리 스키마 및 그 지식 데이터베이스 구축 방법 및 시스템
JP6327799B2 (ja) 自然言語推論システム、自然言語推論方法及びプログラム
WO2017122904A1 (ko) 구체화된 삼항 관계 추출을 위한 개방형 정보 추출 방법 및 시스템
KR102130779B1 (ko) 기계 독해를 위한 문서를 제공하는 시스템 및 이를 포함하는 질의 응답 시스템
Mishra Natural Language Processing Using PyTorch
Tovar et al. Validation of Semantic Relation of Synonymy in Domain Ontologies Using Lexico-Syntactic Patterns and Acronyms
JP2008140204A (ja) データ検索システム及びプログラム
Gokhan et al. Node-Weighted Centrality Ranking for Unsupervised Long Document Summarization
EP3176708B1 (en) Method and system for constructing natural language processing schema and knowledge database thereof
Labidi et al. An nlp-based ontology population for intentional structure
JP2019003237A (ja) 提示方法、提示装置及び提示プログラム
US20210192316A1 (en) Device and method for processing digital data
Nugaliyadde et al. Multi-level Search of a Knowledgebase for Semantic Parsing

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210816

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220420

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220510

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220623

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220705

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220727

R150 Certificate of patent or registration of utility model

Ref document number: 7114433

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150