JP2011175486A - 名寄せチェック支援装置、名寄せチェック支援プログラム及び名寄せチェック支援方法 - Google Patents
名寄せチェック支援装置、名寄せチェック支援プログラム及び名寄せチェック支援方法 Download PDFInfo
- Publication number
- JP2011175486A JP2011175486A JP2010039332A JP2010039332A JP2011175486A JP 2011175486 A JP2011175486 A JP 2011175486A JP 2010039332 A JP2010039332 A JP 2010039332A JP 2010039332 A JP2010039332 A JP 2010039332A JP 2011175486 A JP2011175486 A JP 2011175486A
- Authority
- JP
- Japan
- Prior art keywords
- web page
- information
- name identification
- corporation
- content
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 77
- 238000000605 extraction Methods 0.000 claims description 2
- 238000012790 confirmation Methods 0.000 description 33
- 238000010586 diagram Methods 0.000 description 26
- 239000000284 extract Substances 0.000 description 7
- 230000002250 progressing effect Effects 0.000 description 4
- 239000002699 waste material Substances 0.000 description 3
- 238000004590 computer program Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
Images
Landscapes
- Information Transfer Between Computers (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
【解決手段】名寄せチェック支援装置40は、確定情報記憶部2及び候補情報記憶部3を参照して、一の法人に属すると確定された又は一の法人に属すると推定された名寄せ対象の双方をキーとして第1のコンテンツを取得するコンテンツ取得手段52と、取得した第1のコンテンツと近似する格納位置の第2のコンテンツを取得し、第1及び第2のコンテンツに記載されている名寄せ対象が一の法人に属するときに、第1のコンテンツの情報を、候補テーブルの名寄せ対象が、名寄せ対象が属すると推定された法人に属するかを判定するためのコンテンツとしてコンテンツタイプ情報テーブルに記録するコンテンツタイプ決定手段53とを有することにより上記課題を解決する。
【選択図】 図9
Description
(付記1)
名寄せ対象を該名寄せ対象が属する法人に名寄せする処理により出力された、名寄せ対象の情報と該名寄せ対象が属すると確定された法人の情報とを対応付けた確定情報記憶部、及び、名寄せ対象の情報と該名寄せ対象が属すると推定された法人の情報とを対応付けた候補情報記憶部を参照して、一の法人に属すると確定された名寄せ対象の情報と該一の法人に属すると推定された名寄せ対象の情報とを抽出し、前記一の法人に属すると確定された名寄せ対象の情報及び該一の法人に属すると推定された名寄せ対象の情報の双方をキーとして検索エンジンにより第1のコンテンツを取得するコンテンツ取得手段と、
前記取得した第1のコンテンツのリンク情報に基づき、該リンク情報に近似する格納位置の第2のコンテンツを取得し、前記第1のコンテンツ及び前記第2のコンテンツに記載されている名寄せ対象が前記一の法人に属するときに、前記第1のコンテンツの情報を、前記候補情報記憶部の前記名寄せ対象が、該名寄せ対象が属すると推定された法人に属するかを判定するためのコンテンツとしてコンテンツタイプ情報記憶部に記録するコンテンツタイプ決定手段と
を有する名寄せチェック支援装置。
(付記2)
前記コンテンツタイプ決定手段は、前記第1のコンテンツ及び前記第2のコンテンツに記載されている名寄せ対象が重複せず別々の前記法人に属するときに、前記第1のコンテンツの情報を、前記候補情報記憶部の前記名寄せ対象が、該名寄せ対象が属すると推定された法人に属しないかを判定するためのコンテンツとしてコンテンツタイプ情報記憶部に記録する
付記1記載の名寄せチェック支援装置。
(付記3)
前記候補情報記憶部の前記名寄せ対象が、該名寄せ対象が属すると推定された法人に属するか否かをユーザに判定させる画面を作成する際、前記コンテンツタイプ情報記憶部に記録した前記第1のコンテンツの情報を載せる画面作成手段を更に有する
付記1又は2記載の名寄せチェック支援装置。
(付記4)
コンピュータを、
名寄せ対象を該名寄せ対象が属する法人に名寄せする処理により出力された、名寄せ対象の情報と該名寄せ対象が属すると確定された法人の情報とを対応付けた確定情報記憶部、及び、名寄せ対象の情報と該名寄せ対象が属すると推定された法人の情報とを対応付けた候補情報記憶部を参照して、一の法人に属すると確定された名寄せ対象の情報と該一の法人に属すると推定された名寄せ対象の情報とを抽出し、前記一の法人に属すると確定された名寄せ対象の情報及び該一の法人に属すると推定された名寄せ対象の情報の双方をキーとして検索エンジンにより第1のコンテンツを取得するコンテンツ取得手段と、
前記取得した第1のコンテンツのリンク情報に基づき、該リンク情報に近似する格納位置の第2のコンテンツを取得し、前記第1のコンテンツ及び前記第2のコンテンツに記載されている名寄せ対象が前記一の法人に属するときに、前記第1のコンテンツの情報を、前記候補情報記憶部の前記名寄せ対象が、該名寄せ対象が属すると推定された法人に属するかを判定するためのコンテンツとしてコンテンツタイプ情報記憶部に記録するコンテンツタイプ決定手段と
して機能させるための名寄せチェック支援プログラム。
(付記5)
前記コンテンツタイプ決定手段は、前記第1のコンテンツ及び前記第2のコンテンツに記載されている名寄せ対象が重複せず別々の前記法人に属するときに、前記第1のコンテンツの情報を、前記候補情報記憶部の前記名寄せ対象が、該名寄せ対象が属すると推定された法人に属しないかを判定するためのコンテンツとしてコンテンツタイプ情報記憶部に記録する
付記4記載の名寄せチェック支援プログラム。
(付記6)
前記候補情報記憶部の前記名寄せ対象が、該名寄せ対象が属すると推定された法人に属するか否かをユーザに判定させる画面を作成する際、前記コンテンツタイプ情報記憶部に記録した前記第1のコンテンツの情報を載せる画面作成手段
として更に機能させるための付記4又は5記載の名寄せチェック支援プログラム。
(付記7)
コンピュータによって実行される名寄せチェック支援方法であって、
前記コンピュータが、
名寄せ対象を該名寄せ対象が属する法人に名寄せする処理により出力された、名寄せ対象の情報と該名寄せ対象が属すると確定された法人の情報とを対応付けた確定情報記憶部、及び、名寄せ対象の情報と該名寄せ対象が属すると推定された法人の情報とを対応付けた候補情報記憶部を参照して、一の法人に属すると確定された名寄せ対象の情報と該一の法人に属すると推定された名寄せ対象の情報とを抽出する抽出ステップと、
前記一の法人に属すると確定された名寄せ対象の情報及び該一の法人に属すると推定された名寄せ対象の情報の双方をキーとして検索エンジンにより第1のコンテンツを取得するコンテンツ取得ステップと、
前記取得した第1のコンテンツのリンク情報に基づき、該リンク情報に近似する格納位置の第2のコンテンツを取得し、前記第1のコンテンツ及び前記第2のコンテンツに記載されている名寄せ対象が前記一の法人に属するときに、前記第1のコンテンツの情報を、前記候補情報記憶部の前記名寄せ対象が、該名寄せ対象が属すると推定された法人に属するかを判定するためのコンテンツとしてコンテンツタイプ情報記憶部に記録するコンテンツタイプ決定ステップと
を実行する名寄せチェック支援方法。
(付記8)
前記コンテンツタイプ決定ステップは、前記第1のコンテンツ及び前記第2のコンテンツに記載されている名寄せ対象が重複せず別々の前記法人に属するときに、前記第1のコンテンツの情報を、前記候補情報記憶部の前記名寄せ対象が、該名寄せ対象が属すると推定された法人に属しないか否かを判定するためのコンテンツとしてコンテンツタイプ情報記憶部に記録する
付記7記載の名寄せチェック支援方法。
(付記9)
前記候補情報記憶部の前記名寄せ対象が、該名寄せ対象が属すると推定された法人に属するか否かをユーザに判定させる画面を作成する際、前記コンテンツタイプ情報記憶部に記録した前記第1のコンテンツの情報を載せる画面作成ステップを更に実行する
付記7又は8記載の名寄せチェック支援方法。
2 確定テーブル
3 候補テーブル
11 候補レコード
12,100 確定レコード群
13 クエリ
20〜23 リンク情報
31〜33 ウェブページ
40 名寄せチェック支援装置
41 入力装置
42 出力装置
43 ドライブ装置
44 補助記憶装置
45 主記憶装置
46 演算処理装置
47 インターフェース装置
48 記録媒体
49 バス
51 全体処理部
52 ウェブページ群取得部
53 ウェブページ群タイプ決定部
54 ウェブページタイプ決定部
55 検索エンジン
56 インターネット
57 ウェブページタイプテーブル
101,104,107,108,111,114 選択ウェブページ
102,103,105,106,109,110,112,113,115,116 類似ウェブページ
Claims (5)
- 名寄せ対象を該名寄せ対象が属する法人に名寄せする処理により出力された、名寄せ対象の情報と該名寄せ対象が属すると確定された法人の情報とを対応付けた確定情報記憶部、及び、名寄せ対象の情報と該名寄せ対象が属すると推定された法人の情報とを対応付けた候補情報記憶部を参照して、一の法人に属すると確定された名寄せ対象の情報と該一の法人に属すると推定された名寄せ対象の情報とを抽出し、前記一の法人に属すると確定された名寄せ対象の情報及び該一の法人に属すると推定された名寄せ対象の情報の双方をキーとして検索エンジンにより第1のコンテンツを取得するコンテンツ取得手段と、
前記取得した第1のコンテンツのリンク情報に基づき、該リンク情報に近似する格納位置の第2のコンテンツを取得し、前記第1のコンテンツ及び前記第2のコンテンツに記載されている名寄せ対象が前記一の法人に属するときに、前記第1のコンテンツの情報を、前記候補情報記憶部の前記名寄せ対象が、該名寄せ対象が属すると推定された法人に属するかを判定するためのコンテンツとしてコンテンツタイプ情報記憶部に記録するコンテンツタイプ決定手段と
を有する名寄せチェック支援装置。 - 前記コンテンツタイプ決定手段は、前記第1のコンテンツ及び前記第2のコンテンツに記載されている名寄せ対象が重複せず別々の前記法人に属するときに、前記第1のコンテンツの情報を、前記候補情報記憶部の前記名寄せ対象が、該名寄せ対象が属すると推定された法人に属しないかを判定するためのコンテンツとしてコンテンツタイプ情報記憶部に記録する
請求項1記載の名寄せチェック支援装置。 - 前記候補情報記憶部の前記名寄せ対象が、該名寄せ対象が属すると推定された法人に属するか否かをユーザに判定させる画面を作成する際、前記コンテンツタイプ情報記憶部に記録した前記第1のコンテンツの情報を載せる画面作成手段を更に有する
請求項1又は2記載の名寄せチェック支援装置。 - コンピュータを、
名寄せ対象を該名寄せ対象が属する法人に名寄せする処理により出力された、名寄せ対象の情報と該名寄せ対象が属すると確定された法人の情報とを対応付けた確定情報記憶部、及び、名寄せ対象の情報と該名寄せ対象が属すると推定された法人の情報とを対応付けた候補情報記憶部を参照して、一の法人に属すると確定された名寄せ対象の情報と該一の法人に属すると推定された名寄せ対象の情報とを抽出し、前記一の法人に属すると確定された名寄せ対象の情報及び該一の法人に属すると推定された名寄せ対象の情報の双方をキーとして検索エンジンにより第1のコンテンツを取得するコンテンツ取得手段と、
前記取得した第1のコンテンツのリンク情報に基づき、該リンク情報に近似する格納位置の第2のコンテンツを取得し、前記第1のコンテンツ及び前記第2のコンテンツに記載されている名寄せ対象が前記一の法人に属するときに、前記第1のコンテンツの情報を、前記候補情報記憶部の前記名寄せ対象が、該名寄せ対象が属すると推定された法人に属するかを判定するためのコンテンツとしてコンテンツタイプ情報記憶部に記録するコンテンツタイプ決定手段と
して機能させるための名寄せチェック支援プログラム。 - コンピュータによって実行される名寄せチェック支援方法であって、
前記コンピュータが、
名寄せ対象を該名寄せ対象が属する法人に名寄せする処理により出力された、名寄せ対象の情報と該名寄せ対象が属すると確定された法人の情報とを対応付けた確定情報記憶部、及び、名寄せ対象の情報と該名寄せ対象が属すると推定された法人の情報とを対応付けた候補情報記憶部を参照して、一の法人に属すると確定された名寄せ対象の情報と該一の法人に属すると推定された名寄せ対象の情報とを抽出する抽出ステップと、
前記一の法人に属すると確定された名寄せ対象の情報及び該一の法人に属すると推定された名寄せ対象の情報の双方をキーとして検索エンジンにより第1のコンテンツを取得するコンテンツ取得ステップと、
前記取得した第1のコンテンツのリンク情報に基づき、該リンク情報に近似する格納位置の第2のコンテンツを取得し、前記第1のコンテンツ及び前記第2のコンテンツに記載されている名寄せ対象が前記一の法人に属するときに、前記第1のコンテンツの情報を、前記候補情報記憶部の前記名寄せ対象が、該名寄せ対象が属すると推定された法人に属するかを判定するためのコンテンツとしてコンテンツタイプ情報記憶部に記録するコンテンツタイプ決定ステップと
を実行する名寄せチェック支援方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010039332A JP5423470B2 (ja) | 2010-02-24 | 2010-02-24 | 名寄せチェック支援装置、名寄せチェック支援プログラム及び名寄せチェック支援方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010039332A JP5423470B2 (ja) | 2010-02-24 | 2010-02-24 | 名寄せチェック支援装置、名寄せチェック支援プログラム及び名寄せチェック支援方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011175486A true JP2011175486A (ja) | 2011-09-08 |
JP5423470B2 JP5423470B2 (ja) | 2014-02-19 |
Family
ID=44688277
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010039332A Active JP5423470B2 (ja) | 2010-02-24 | 2010-02-24 | 名寄せチェック支援装置、名寄せチェック支援プログラム及び名寄せチェック支援方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5423470B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6019187B1 (ja) * | 2015-08-03 | 2016-11-02 | 株式会社インフォマート | 企業情報整合装置および企業情報整合用プログラム |
JP2017102878A (ja) * | 2015-12-01 | 2017-06-08 | 株式会社データン | 法人番号検索装置、システム、方法、プログラム及び法人番号追加プログラム |
JP2020064417A (ja) * | 2018-10-16 | 2020-04-23 | Nttテクノクロス株式会社 | 管理装置、管理方法及びプログラム |
JP2021043695A (ja) * | 2019-09-11 | 2021-03-18 | デジタル・アドバタイジング・コンソーシアム株式会社 | プログラム及び情報処理装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003076838A (ja) * | 2001-09-04 | 2003-03-14 | Mizuho Bank Ltd | 名寄せ処理方法及び名寄せ処理プログラム |
JP2003173280A (ja) * | 2001-12-05 | 2003-06-20 | Nippon Telegr & Teleph Corp <Ntt> | データベース生成装置、データベース生成方法及びデータベース生成プログラム |
JP2004139237A (ja) * | 2002-10-16 | 2004-05-13 | Toshiba Corp | 名寄せ方法および名寄せシステム並びに会計処理方法および会計処理システム |
JP2004303117A (ja) * | 2003-04-01 | 2004-10-28 | Hitachi Ltd | 名寄せデータベース設計支援方法およびシステム |
-
2010
- 2010-02-24 JP JP2010039332A patent/JP5423470B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003076838A (ja) * | 2001-09-04 | 2003-03-14 | Mizuho Bank Ltd | 名寄せ処理方法及び名寄せ処理プログラム |
JP2003173280A (ja) * | 2001-12-05 | 2003-06-20 | Nippon Telegr & Teleph Corp <Ntt> | データベース生成装置、データベース生成方法及びデータベース生成プログラム |
JP2004139237A (ja) * | 2002-10-16 | 2004-05-13 | Toshiba Corp | 名寄せ方法および名寄せシステム並びに会計処理方法および会計処理システム |
JP2004303117A (ja) * | 2003-04-01 | 2004-10-28 | Hitachi Ltd | 名寄せデータベース設計支援方法およびシステム |
Non-Patent Citations (2)
Title |
---|
CSNG200800063066; 小野 真吾、外2名: 'Webにおける名寄せシステム' 言語処理学会第12回年次大会発表論文集 , 20060313, p.372-375, 言語処理学会 * |
JPN6013052770; 小野 真吾、外2名: 'Webにおける名寄せシステム' 言語処理学会第12回年次大会発表論文集 , 20060313, p.372-375, 言語処理学会 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6019187B1 (ja) * | 2015-08-03 | 2016-11-02 | 株式会社インフォマート | 企業情報整合装置および企業情報整合用プログラム |
JP2017102878A (ja) * | 2015-12-01 | 2017-06-08 | 株式会社データン | 法人番号検索装置、システム、方法、プログラム及び法人番号追加プログラム |
JP2020064417A (ja) * | 2018-10-16 | 2020-04-23 | Nttテクノクロス株式会社 | 管理装置、管理方法及びプログラム |
JP7120875B2 (ja) | 2018-10-16 | 2022-08-17 | Nttテクノクロス株式会社 | 管理装置、管理方法及びプログラム |
JP2021043695A (ja) * | 2019-09-11 | 2021-03-18 | デジタル・アドバタイジング・コンソーシアム株式会社 | プログラム及び情報処理装置 |
Also Published As
Publication number | Publication date |
---|---|
JP5423470B2 (ja) | 2014-02-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4857075B2 (ja) | ウェブドキュメントの集合において効率的に日付を検索する方法、コンピュータプログラム | |
US8166013B2 (en) | Method and system for crawling, mapping and extracting information associated with a business using heuristic and semantic analysis | |
Li et al. | Here's what I did: Sharing and reusing web activity with ActionShot | |
US7624102B2 (en) | System and method for grouping by attribute | |
US20070198727A1 (en) | Method, apparatus and system for extracting field-specific structured data from the web using sample | |
CN107924402A (zh) | 来自资源内容中的搜索结果过滤器 | |
US7949646B1 (en) | Method and apparatus for building sales tools by mining data from websites | |
US20110238653A1 (en) | Parsing and indexing dynamic reports | |
JP4636473B2 (ja) | リンク情報抽出装置、リンク情報抽出方法およびプログラム | |
JP5423470B2 (ja) | 名寄せチェック支援装置、名寄せチェック支援プログラム及び名寄せチェック支援方法 | |
CN105808605B (zh) | 一种搜索日志合并方法和系统 | |
JP5284064B2 (ja) | 商品idサーバ装置、および商品idサーバ装置の制御方法 | |
US8843488B1 (en) | Nested display of contextual search results | |
JP4912384B2 (ja) | 文書検索装置、文書検索方法、および文書検索プログラム | |
JP2000331020A (ja) | 情報参照方法,情報参照装置および情報参照プログラムを格納した記憶媒体 | |
CN101398856A (zh) | 获取导航查询词的方法、装置及展现搜索结果的方法 | |
JP4796527B2 (ja) | ドキュメント絞り込み検索装置、方法及びプログラム | |
JP2007304644A (ja) | 静的ウェブページ生成方法、プログラム、記録媒体及び静的ウェブページ生成管理システム | |
JP2010272006A (ja) | 関係抽出装置、関係抽出方法、及びプログラム | |
KR20120090131A (ko) | 검색결과 제공 방법, 시스템 및 컴퓨터 판독 가능한 기록 매체 | |
JP2006236221A (ja) | ウエブページ検索のための管理サーバ装置 | |
JP2010186474A (ja) | 関連度辞書を用いた検索モデリングシステムおよび方法 | |
JP2010287143A (ja) | 記事整理システム | |
JP2006195535A (ja) | 情報抽出装置及び情報抽出方法並びに情報抽出プログラム | |
Mundluru et al. | Experiences in crawling deep web in the context of local search |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130108 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20131011 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131029 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131111 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 5423470 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |