JP7392841B2 - 名称データ対応付け装置、名称データ対応付け方法及びプログラム - Google Patents
名称データ対応付け装置、名称データ対応付け方法及びプログラム Download PDFInfo
- Publication number
- JP7392841B2 JP7392841B2 JP2022518540A JP2022518540A JP7392841B2 JP 7392841 B2 JP7392841 B2 JP 7392841B2 JP 2022518540 A JP2022518540 A JP 2022518540A JP 2022518540 A JP2022518540 A JP 2022518540A JP 7392841 B2 JP7392841 B2 JP 7392841B2
- Authority
- JP
- Japan
- Prior art keywords
- cycle
- building
- name data
- database
- path
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 51
- 238000000605 extraction Methods 0.000 claims description 51
- 239000000284 extract Substances 0.000 claims description 36
- 238000013075 data extraction Methods 0.000 claims description 11
- 230000006870 function Effects 0.000 claims description 8
- 238000013507 mapping Methods 0.000 claims description 6
- 238000013506 data mapping Methods 0.000 claims 3
- 238000010586 diagram Methods 0.000 description 38
- 238000012545 processing Methods 0.000 description 27
- 238000004891 communication Methods 0.000 description 14
- 238000011156 evaluation Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 3
- 239000004065 semiconductor Substances 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005401 electroluminescence Methods 0.000 description 2
- 230000012447 hatching Effects 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
図1は、この発明の一実施形態に係る名称データ対応付け装置の構成の一例を示すブロック図である。なお、この発明は、名称データを対応付けするデータベースの個数に制限は特にないが、本一実施形態では、説明の簡単化のため、対象とするデータベースは2つであるとしている。
次に、名称データ対応付け装置の動作を説明する。
gc:Ec→P(Vc) Ecの元に頂点集合Vcの部分集合を対応させる写像。ただし、P(Vc)はVcの冪集合である
Gc :=(gc,Vc,Ec)
gd: Ed→P(Vd) Edの元に頂点集合Vdの部分集合を対応させる写像。ただし、P(Vd)はVdの冪集合である
Gd :=(gd,Vd,Ed)
Γk[l]: Γkを構成する頂点のうちl番目の頂点 (第l要素)
|Γk|: ベクトルΓkの長さ (Γkを構成する頂点の個数)
Γk=(sk,…,sk)
(Γk[l],Γk[l+1])∈Ec
l∈{1,2,…,|Γk|}
1.全てのskに対してsk=djを満たすdj∈Vdが存在する。
2.閉路を構成する全ての辺は、Ecに存在する。
3.∀ci∈Vcは、いずれかの閉路に所属している。
条件1: 自己ループを持つ
条件2: 頂点を省略してできた辺が2本以上接続されており、次数が4以上
Ik :={x|Γk[x]∈S,Γk[x]≠sk}
条件1: 次数が1である頂点を除き、同じ頂点及び辺は2回以上通らない
条件2: 始点skを通過しない
を満たす必要がある。ここで、作成された閉路の集合をBiと表記する。作成された閉路は、データメモリ103の一時記憶部1033に記憶される。
αi[Ij]=vk
bj1'=αi[1:Ij-1]+bj[2:]+αi[Ij+1:]
bj2'=αi[1:Ij-1]+rev(bj)[2:]+αi[Ij+1:]
bj3'=rev(bj1')
bj4'=rev(bj2')
ここで、+はパスを結合させる演算子、rev(b')はパスb'を逆順にする関数である。また、αi[x:y]及びαi[x:]は、
αi[x:y]=αiの第x要素から第y要素までの配列(x≦y)
αi[x:]=αiの第x要素から第|αi|要素までの配列(|αi|:αiの要素数)
である。
条件1: |αi|=|Γk|
条件2: αi[x]=Γk[x] x∈Ik
そして、プロセッサ101は、この基礎DBの閉路グラフからの閉路作成処理を終了して、上位のルーチンに戻る。
union :=|{∪iαi │αi∈cycle set}|
ただし、∪iαiは、閉路αiを構成する頂点dlの集合のiについての和集合を表す。
αi :={dl |dl∈αi,αi∈cycle set}
∪iαi :=∪i{dl |dl∈αi,αi∈cycle set}
まず、プロセッサ101は、初期値として、集合cycle setから異なる2つの閉路αi及びαjを選択する(ステップS604)。
αi,αj∈cycle set
shared vertex :=αi∩αj
αi∩αj :={dl |dl∈αi,dl∈αj}
∃xai,xzi s.t. αi[xai]=a_point, αi[xzi]=z_point
∃xaj,xzj s.t. αj[xaj]=a_point, αj[xzj]=z_point
pi1 :=αi[xai: xzi]
pi2 :=αi[xzi: xai]
pj1 :=αj[xaj: xzj]
pj2 :=αj[xzj: xaj]
ただし、αl[x:y]は以下の通りである。ここで、l∈{i,j}である。
insert_x,insert_y=argminx,y{|px∪py| |shared vertex⊆px∩py∩sk}, x,y∈{i1,i2,j1,j2}
insert cycleij :=pinsert_x+pinsert_y
pinsert_x+pinsert_y: pinsert_xとpinsert_yの第2要素以降の部分を結合させた配列
insert cycleijが1つである場合は、
insert :=|insert cycleij|
であり、insert cycleijが複数ある場合は、
insert :=|∪ijinsert cycleij|
である。ただし、∪ijinsert cycleijは、閉路insert cycleijを構成する頂点集合のijについての和集合である。
score :=union-insert
として得、得られた評価値scoreをデータメモリ103の一時記憶部1033に記憶する(ステップS612)。
本実施形態の動作例として、適用した名称データの概要と結果を説明する。
Vc={いわきビル、沼ノ内ビル、常磐ビル、小名浜ビル、内郷ビル、窪田ビル、泉ビル、小川ビル、若葉台ビル、江名ビル、田人ビル}
Vd={いわきビル、沼之内ビル、いわき常磐ビル、小名浜ビル、梨花の里ビル、いわき窪田ビル、いわき泉ビル、いわき小川ビル、いわき若葉台ビル、江名ビル、田人ビル}
{(いわきビル、いわきビル)、(沼ノ内ビル、沼之内ビル)、(常磐ビル、いわき常磐ビル)、(小名浜ビル、小名浜ビル)、(内郷ビル、梨花の里ビル)、(窪田ビル、いわき窪田ビル)、(泉ビル、いわき泉ビル)、(小川ビル、いわき小川ビル)、(若葉台ビル、いわき若葉台ビル)、(江名ビル、江名ビル)、(田人ビル、田人ビル)}
Ec={(いわきビル、沼ノ内ビル)、(沼ノ内ビル、小川ビル)、(小川ビル、江名ビル)、(江名ビル、いわきビル)、(いわきビル、若葉台ビル)、(若葉台ビル、小名浜ビル)、(小名浜ビル、窪田ビル)、(窪田ビル、田人ビル)、(田人ビル、常磐ビル)、(常磐ビル、泉ビル)、(泉ビル、小名浜ビル)、(小名浜ビル、内郷ビル)、(内郷ビル、いわきビル)}
Ed={(いわきビル、沼之内ビル)、(いわきビル、江名ビル)、(いわきビル、いわき小川ビル)、(沼之内ビル、いわき小川ビル)、(江名ビル、いわき小川ビル)、(いわきビル、いわき若葉台ビル)、(小名浜ビル、いわき若葉台ビル)、(梨花の里ビル、小名浜ビル)、(梨花の里ビル、いわきビル)、(梨花の里ビル、いわき常磐ビル)、(いわき泉ビル、いわき常磐ビル)、(田人ビル、いわき常磐ビル)、(小名浜ビル、いわき窪田ビル)、(田人ビル、いわき窪田ビル)、(小名浜ビル、いわき泉ビル)}
Γ1=(いわきビル、内郷ビル、小名浜ビル、窪田ビル、田人ビル、常磐ビル、泉ビル、若葉台ビル、いわきビル)
Γ2=(いわきビル、沼ノ内ビル、小川ビル、江名ビル、いわきビル)
省略グラフにおける頂点:{いわきビル、梨花の里ビル、いわき常磐ビル、小名浜ビル、いわき小川ビル}
辺:{(いわきビル、梨花の里ビル)、(梨花の里ビル、小名浜ビル)、(小名浜ビル、いわき常磐ビル)、(小名浜ビル、いわき常磐ビル)、(小名浜ビル、いわきビル)、(梨花の里ビル、いわき常磐ビル)、(いわきビル、いわき小川ビル)、(いわきビル、いわき小川ビル)、(いわきビル、いわき小川ビル)}
頂点の省略により作成された辺:{(いわきビル、いわき小川ビル)、(いわきビル、いわき小川ビル)、(いわき常磐ビル、小名浜ビル)、(いわき常磐ビル、小名浜ビル)、(いわきビル、小名浜ビル)}
Vt :={小名浜ビル}
を抽出する。
S={いわきビル、小名浜ビル、江名ビル、田人ビル}
I1={3,5}
I2={4}
α1=(いわきビル、江名ビル、いわき小川ビル、いわきビル)
α2=(いわきビル、沼之内ビル、いわき小川ビル、江名ビル、いわきビル)
α3=(いわきビル、沼之内ビル、いわき小川ビル、いわきビル)
α4=(いわきビル、いわき若葉台ビル、小名浜ビル、梨花の里ビル、いわきビル)
α5=(いわきビル、いわき若葉台ビル、小名浜ビル、いわき泉ビル、いわき常磐ビル、梨花の里ビル、いわきビル)
α6=(いわきビル、いわき若葉台ビル、小名浜ビル、いわき窪田ビル、田人ビル、いわき常磐ビル、梨花の里ビル、いわきビル)
b1=(小名浜ビル、いわき泉ビル、いわき常磐ビル、田人ビル、いわき窪田ビル、小名浜ビル)
b2=(小名浜ビル、いわき泉ビル、いわき常磐ビル、梨花の里ビル、小名浜ビル)
bj1'=(いわきビル、いわき若葉台ビル、いわき泉ビル、いわき常磐ビル、田人ビル、いわき窪田ビル、小名浜ビル、梨花の里ビル、いわきビル)
bj2'=(いわきビル、いわき若葉台ビル、小名浜ビル、いわき窪田ビル、田人ビル、いわき常磐ビル、いわき泉ビル、梨花の里ビル、いわきビル)
bj3'=rev(bj1')
bj4'=rev(bj2')
となる。図17Aは結合された閉路bj1'を、また、図17Bは結合された閉路bj2'を、それぞれ示す模式図である。
条件1: |αi|=|Γk|
条件2: αi[x]=Γk[x] x∈Ik
を見たす閉路を抽出する。
|αi|=|Γ1|=9
且つ
αi[3]=小名浜ビル、αi[5]=田人ビル
を満たすような要素を抽出し、それを閉路A1'とする。
A1'={(いわきビル、梨花の里ビル、小名浜ビル、いわき窪田ビル、田人ビル、いわき常磐ビル、いわき泉ビル、いわき若葉台ビル、いわきビル),(いわきビル、いわき若葉台ビル、小名浜ビル、いわき窪田ビル、田人ビル、いわき常磐ビル、いわき泉ビル、梨花の里ビル、いわきビル)}
|αi|=|Γ2|=5
且つ
αi[4]=江名ビル
を満たすような要素を抽出し、それを閉路Α2'とする。
Α2'={(いわきビル、沼之内ビル、いわき小川ビル、江名ビル、いわきビル)}。
cycle set=A10'∪A20'
cycle set=A11'∪A20'
union :=|{(いわきビル、梨花の里ビル、小名浜ビル、いわき窪田ビル、田人ビル、いわき常磐ビル、いわき泉ビル、いわき若葉台ビル、沼之内ビル、いわき小川ビル、江名ビル)}|=11
を得、cycle set=A11'∪A20'に対し、
union :=|{(いわきビル、梨花の里ビル、小名浜ビル、いわき窪田ビル、田人ビル、いわき常磐ビル、いわき泉ビル、いわき若葉台ビル、沼之内ビル、いわき小川ビル、江名ビル)}|=11
を得る。
shared vertex={いわきビル}
を得る。ここで、shared vertexの要素数が1以下なので、プロセッサ101は、ステップS609において、
insert cycleij=φ
を生成する。この作成した閉路insert cycleより、プロセッサ101は、ステップS611及びステップS612において、
insert :=|insert cycleij|=0
score :=union-insert=11
を求めることができる。
shared vertex={いわきビル}
を得る。ここで、shared vertexの要素数が1以下なので、プロセッサ101は、ステップS609において、
insert cycleij=φ
を生成する。この作成した閉路insert cycleより、プロセッサ101は、ステップS611及びステップS612において、
insert :=|insert cycleij|=0
score :=union-insert=11
を求めることができる。
(いわきビル、梨花の里ビル、小名浜ビル、いわき窪田ビル、田人ビル、いわき常磐ビル、いわき泉ビル、いわき若葉台ビル、いわきビル))
と、
Γ1=(いわきビル、内郷ビル、小名浜ビル、窪田ビル、田人ビル、常磐ビル、泉ビル、若葉台ビル、いわきビル)
より、
{(内郷ビル、梨花の里ビル)、(窪田ビル、いわき窪田ビル)、(常磐ビル、いわき常磐ビル)、(泉ビル、いわき泉ビル)、(若葉台ビル、いわき若葉台ビル)}
を得る。
(いわきビル、沼之内ビル、いわき小川ビル、江名ビル、いわきビル)
と、
Γ2=(いわきビル、沼ノ内ビル、小川ビル、江名ビル、いわきビル)
より、
{(沼ノ内ビル、沼之内ビル)、(小川ビル、いわき小川ビル)}
を得る。
(いわきビル、いわき若葉台ビル、小名浜ビル、いわき窪田ビル、田人ビル、いわき常磐ビル、いわき泉ビル、梨花の里ビル、いわきビル))
と、
Γ1=(いわきビル、内郷ビル、小名浜ビル、窪田ビル、田人ビル、常磐ビル、泉ビル、若葉台ビル、いわきビル)
より、
{(内郷ビル、いわき若葉台ビル)、(窪田ビル、いわき窪田ビル)、(常磐ビル、いわき常磐ビル)、(泉ビル、いわき泉ビル)、(若葉台ビル、梨花の里ビル)}
を得る。
(いわきビル、沼之内ビル、いわき小川ビル、江名ビル、いわきビル)
と、
Γ2=(いわきビル、沼ノ内ビル、小川ビル、江名ビル、いわきビル)
より、
{(沼ノ内ビル、沼之内ビル)、(小川ビル、いわき小川ビル)}
を得る。
「内郷」に対して「いわき若葉台」または「梨花の里」
「若葉台」に対して「いわき若葉台」または「梨花の里」
という名称データの対応付けを選択して、ステップS704において、それらを、対応付け結果として、データメモリ103の一時記憶部1033に記憶する。
比較として、既存の文字列検索手法(特許文献1または2)を使用した対応付けを、動作例で扱ったデータに対して行った。
比較実験概要: 頂点集合Vc,Vdを単なる名称データの集合と見なし、Vdの各データからVcのデータの編集距離をそれぞれ計算し、距離が最小となるデータを選択する
結果: 11頂点中6頂点の正確な対応付けに成功(いわきビル、小名浜ビル、いわき若葉台、江名ビル、田人ビル、沼之内ビル)。
前記一実施形態では、始点と終点が同一の頂点である閉路を例に説明したが、始点と終点が異なる頂点であるパスを利用しても良い。すなわち、名称データ対応付け装置では、対象とする2つのデータベースにおいて、各隣接情報を使用して、名称データを頂点とするパスを描画することができるので、パス識別情報が付与されていない基礎データベース1のパス上で、派生データベース2のパスから得られたパス情報と同条件(頂点数、始点が同一)のパスを作成し、その中から最適なパスを選択することで、名称データの対応付けを行う。これにより、統合するデータベース間で表記ゆれが存在する同義の名称データを、名称データに対応する文字列別データがデータベース間で対応関係を有していなくとも、人的稼働を掛けずに対応付けることができる。またこの場合、データベースの情報に基づいて、名称データを頂点とする無向グラフを作成し、この無向グラフを利用することで、容易にパスを生成することができる。
2…派生データベース
3…グラフ作成部
4…共通データ抽出部
5…パス情報抽出部
6…スルー頂点抽出部
7…パス作成部
8…対応付け部
9…データ出力部
101…プロセッサ
102…プログラムメモリ
103…データメモリ
104…通信インタフェース
105…入出力インタフェース
106…バス
107…入力部
108…表示部
1031…基礎データベース記憶部
1032…派生データベース記憶部
1033…一時記憶部
1034…出力情報記憶部
Claims (8)
- 複数の名称データ及びそれら名称データの隣接関係を示す隣接情報を保持する第1のデータベースと、複数の名称データ、それら名称データの隣接情報及びそれら名称データが属するパスを表すパス識別情報を保持する第2のデータベースとの間で異なる表記を有する同義の名称データを対応付ける名称データ対応付け装置であって、
前記第1のデータベースと前記第2のデータベースとの間で同じ表記である名称データを共通データとして抽出する共通データ抽出部と、
前記第2のデータベースが保持する情報に基づいて、前記共通データ抽出部が抽出した前記共通データのうち1つを始点とし、前記第2のデータベースが保持する前記名称データを頂点とする、全てのパスを生成し、それらのパスそれぞれについて、頂点数、含まれる共通データ及びその位置を含むパス情報を抽出するパス情報抽出部と、
前記第1のデータベースが保持する情報に基づいて、前記パス情報抽出部が抽出した各パスの前記パス情報に含まれる前記始点の名称データ、前記頂点数、前記含まれる共通データ及び前記位置と一致する全てのパスを生成するパス作成部と、
前記パス作成部が生成した各パスから、通過する頂点数がより多く且つ重複する箇所がより少ないパスの組み合わせを抽出し、その抽出された各パスの頂点と前記パス情報抽出部が生成した各パスの頂点とを対応付けることで、前記第1のデータベースが保持する前記名称データと前記第2のデータベースが保持する前記名称データとを対応付ける対応付け部と、
を具備し、
前記対応付け部は、前記第1のデータベースの前記名称データと前記第2のデータベースの前記名称データとの対応付け結果として複数の結果が得られた場合、全ての対応付け結果を選択する、名称データ対応付け装置。 - 前記第1及び第2のデータベースが保持する前記情報に基づいて、前記名称データを頂点とする無向グラフを作成するグラフ作成部と、
前記グラフ作成部が作成した前記無向グラフが含む頂点の中から、そこを2度通るが、辺は少なくとも1度しか通らない頂点である、スルー頂点を抽出するスルー頂点抽出部と、
をさらに具備し、
前記パス情報抽出部は、前記グラフ作成部が作成した前記無向グラフと前記第2のデータベースが保持する前記パス識別情報とに基づいて、前記共通データのうち1つを前記始点とし、前記第2のデータベースが保持する前記名称データを頂点とする、全てのパスを生成し、それらのパスそれぞれについて、前記パス情報を抽出し、
前記パス作成部は、前記グラフ作成部が作成した前記無向グラフに基づいて、前記パス情報抽出部が抽出した前記各パスの前記パス情報に含まれる前記始点の前記名称データ、前記頂点数、前記含まれる共通データ及び前記位置が一致する全てのパスを生成すると共に、それら生成したパスから前記スルー頂点を始点とするパスを作成して、前記全てのパスと前記スルー頂点を始点とするパスとを結合する、請求項1に記載の名称データ対応付け装置。 - 前記グラフ作成部は、前記無向グラフとして、前記第1及び第2のデータベースが保持する前記隣接情報に基づいて、前記名称データを頂点とする閉路グラフを作成する、閉路グラフ作成部を含み、
スルー頂点抽出部は、前記閉路グラフ作成部が作成した前記閉路グラフが含む頂点の中から前記スルー頂点を抽出し、
前記パス情報抽出部は、前記パスとして、前記閉路グラフ作成部が作成した前記閉路グラフと前記第2のデータベースが保持する前記パス識別情報である閉路識別情報とに基づいて、前記共通データのうち1つを前記始点且つ終点とし、前記第2のデータベースが保持する前記名称データを頂点とする、全ての閉路を生成し、前記パス情報として、前記生成した全ての閉路それぞれについて、前記頂点数、前記含まれる共通データ及び前記位置を含む閉路情報を抽出する、閉路情報抽出部を含み、
前記パス作成部は、前記パスとして、前記閉路グラフ作成部が作成した前記閉路グラフに基づいて、前記閉路情報抽出部が抽出した前記各閉路の前記閉路情報に含まれる前記始点且つ前記終点の前記名称データ、前記頂点数、前記含まれる共通データ及び前記位置が一致する全ての閉路を生成すると共に、それら生成した閉路から前記スルー頂点を始点とする閉路を作成して、前記全ての閉路と前記スルー頂点を始点とする閉路とを結合する閉路作成部を含み、
前記対応付け部は、前記閉路作成部が生成した各閉路から、通過する頂点数がより多く且つ重複する箇所がより少ない閉路の組み合わせを抽出し、その抽出された各閉路の頂点と前記閉路情報抽出部が生成した各閉路の頂点とを対応付けることで、前記第1のデータベースが保持する前記名称データと前記第2のデータベースが保持する前記名称データとを対応付ける、請求項2に記載の名称データ対応付け装置。 - 前記対応付け部は、前記閉路作成部が生成した閉路が1つだけであるとき、その閉路の頂点と前記閉路情報抽出部が抽出した各閉路の頂点とを対応付けることで、前記第1のデータベースが保持する前記名称データと前記第2のデータベースが保持する前記名称データとを対応付ける、請求項3に記載の名称データ対応付け装置。
- 前記対応付け部は、前記閉路作成部が生成した閉路が複数あるとき、それら複数の閉路の中から、前記閉路情報抽出部が生成した閉路の個数ずつ閉路の組み合わせを選択し、それぞれの閉路の組み合わせについて、通過する頂点数及び重複する箇所を判別することで、前記通過する頂点数がより多く且つ前記重複する箇所がより少ない前記閉路の組み合わせを抽出する最適組み合わせ抽出部を含む、請求項3に記載の名称データ対応付け装置。
- 前記対応付け部による対応付けの結果に基づいて、名称データの対応表を含む出力情報を生成する出力部をさらに具備する、請求項1乃至5のいずれかに記載の名称データ対応付け装置。
- プロセッサと、複数の名称データ及びそれら名称データの隣接関係を示す隣接情報を保持する第1のデータベースと、複数の名称データ、それら名称データの隣接情報及びそれら名称データが属するパスを表すパス識別情報を保持する第2のデータベースとを記憶したメモリと、を備え、前記第1のデータベースと前記第2のデータベースとの間で異なる表記を有する同義の名称データを対応付ける名称データ対応付け装置における名称データ対応付け方法であって、
前記プロセッサにより、前記メモリに記憶されている前記第1のデータベースと前記第2のデータベースとの間で同じ表記である名称データを共通データとして抽出し、
前記プロセッサにより、前記第2のデータベースが保持する情報に基づいて、前記抽出した前記共通データのうち1つを始点とし、前記第2のデータベースが保持する前記名称データを頂点とする、全てのパスを生成し、
前記プロセッサにより、前記第2のデータベースが保持する情報に基づいて生成したパスそれぞれについて、頂点数、含まれる共通データ及びその位置を含むパス情報を抽出し、
前記プロセッサにより、前記第1のデータベースが保持する情報に基づいて、前記抽出した各パスの前記パス情報に含まれる前記始点の名称データ、前記頂点数、前記含まれる共通データ及び前記位置と一致する全てのパスを生成し、
前記プロセッサにより、前記第1のデータベースが保持する情報に基づいて生成した各パスから、通過する頂点数がより多く且つ重複する箇所がより少ないパスの組み合わせを抽出し、
前記プロセッサにより、前記抽出されたパスの組み合わせにおける各パスの頂点と、前記第2のデータベースが保持する情報に基づいて生成した各パスの頂点とを対応付けることで、前記第1のデータベースが保持する前記名称データと前記第2のデータベースが保持する前記名称データとを対応付け、
前記第1のデータベースの前記名称データと前記第2のデータベースの前記名称データとの対応付け結果として複数の結果が得られた場合、前記プロセッサにより、全ての対応付け結果を選択する、
名称データ対応付け方法。 - 請求項1乃至6のいずれかに記載の名称データ対応付け装置の前記各部としてプロセッサを機能させる名称データ対応付け処理プログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2020/018273 WO2021220464A1 (ja) | 2020-04-30 | 2020-04-30 | 名称データ対応付け装置、名称データ対応付け方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2021220464A1 JPWO2021220464A1 (ja) | 2021-11-04 |
JP7392841B2 true JP7392841B2 (ja) | 2023-12-06 |
Family
ID=78331853
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022518540A Active JP7392841B2 (ja) | 2020-04-30 | 2020-04-30 | 名称データ対応付け装置、名称データ対応付け方法及びプログラム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP7392841B2 (ja) |
WO (1) | WO2021220464A1 (ja) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001187477A (ja) | 1999-12-28 | 2001-07-10 | Ibm Japan Ltd | 階層リンク・テーブルを備えたデータベース・システム |
JP2010134828A (ja) | 2008-12-08 | 2010-06-17 | Toshiba Corp | データベース合成装置、文字認識支援システム、及びデータベースの合成方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5058729B2 (ja) * | 2007-09-11 | 2012-10-24 | 株式会社野村総合研究所 | 分類データ管理システム |
-
2020
- 2020-04-30 JP JP2022518540A patent/JP7392841B2/ja active Active
- 2020-04-30 WO PCT/JP2020/018273 patent/WO2021220464A1/ja active Application Filing
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001187477A (ja) | 1999-12-28 | 2001-07-10 | Ibm Japan Ltd | 階層リンク・テーブルを備えたデータベース・システム |
JP2010134828A (ja) | 2008-12-08 | 2010-06-17 | Toshiba Corp | データベース合成装置、文字認識支援システム、及びデータベースの合成方法 |
Also Published As
Publication number | Publication date |
---|---|
JPWO2021220464A1 (ja) | 2021-11-04 |
WO2021220464A1 (ja) | 2021-11-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI656500B (zh) | 嚮導配對系統、嚮導配對方法以及電腦可讀取記憶媒體 | |
JP2003140942A (ja) | 共起する対象の階層的ソフトクラスタリングのための製造方法、装置および製品 | |
JP7295189B2 (ja) | ドキュメントコンテンツの抽出方法、装置、電子機器及び記憶媒体 | |
US20210133390A1 (en) | Conceptual graph processing apparatus and non-transitory computer readable medium | |
US20230281392A1 (en) | Computer-readable recording medium storing computer program, machine learning method, and natural language processing apparatus | |
JP2019204214A (ja) | 学習装置、学習方法、プログラム及び推定装置 | |
KR20230057114A (ko) | 기술 문서 데이터 베이스를 통한 키워드 도출 방법 및 장치 | |
JP6145562B2 (ja) | 情報構造化システム及び情報構造化方法 | |
JP7392841B2 (ja) | 名称データ対応付け装置、名称データ対応付け方法及びプログラム | |
JP7392840B2 (ja) | 名称データ対応付け装置、名称データ対応付け方法及びプログラム | |
CN116503031A (zh) | 基于简历解析的人员相似性计算方法、装置、设备及介质 | |
JP2019148859A (ja) | フローダイアグラムを用いたモデル開発環境におけるデザインパターンの発見を支援する装置および方法 | |
CN115329083A (zh) | 文档分类方法、装置、计算机设备和存储介质 | |
JP7276509B2 (ja) | 名称データ対応付け装置、名称データ対応付け方法及びプログラム | |
JP2019133534A (ja) | 併合方法、併合装置、および併合プログラム | |
JPWO2019171537A1 (ja) | 意味推定システム、方法およびプログラム | |
JP7380696B2 (ja) | 人員の手配装置、手配方法およびプログラム | |
JPWO2014170965A1 (ja) | 文書処理方法、文書処理装置および文書処理プログラム | |
JP6001173B2 (ja) | データ分析装置、rdfデータの拡張方法、およびデータ分析プログラム | |
WO2022259303A1 (ja) | 名称データ対応付け装置、名称データ対応付け方法及び名称データ対応付けプログラム | |
JP5358981B2 (ja) | 情報処理装置、情報処理装置の制御方法および情報処理装置の制御用プログラム | |
JP5087518B2 (ja) | 評価装置、及び、コンピュータプログラム | |
JP7286291B2 (ja) | 固有表現抽出装置、方法およびプログラム | |
WO2023084704A1 (ja) | 画像処理装置、方法およびプログラム | |
CN108052508B (zh) | 一种信息抽取方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220902 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20230104 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20230208 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231024 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231106 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7392841 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |