JP2018151805A - データ項目名推定装置、データ項目名推定方法、及びプログラム - Google Patents
データ項目名推定装置、データ項目名推定方法、及びプログラム Download PDFInfo
- Publication number
- JP2018151805A JP2018151805A JP2017046895A JP2017046895A JP2018151805A JP 2018151805 A JP2018151805 A JP 2018151805A JP 2017046895 A JP2017046895 A JP 2017046895A JP 2017046895 A JP2017046895 A JP 2017046895A JP 2018151805 A JP2018151805 A JP 2018151805A
- Authority
- JP
- Japan
- Prior art keywords
- data item
- attribute
- item name
- learning
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
学習用のテーブルにおけるデータ項目名毎に、当該データ項目名が付与されているデータの特徴値を抽出し、抽出した特徴値と当該データ項目名に対応する属性との関係を定義し、前記属性毎に、対応するデータ項目名を特定し、前記学習用のテーブルにおける前記属性と前記データ項目名との組合せを学習して、学習モデルを作成する、学習処理部と、
対象となるテーブルのデータ項目毎の特徴値を、前記学習処理部による定義に照合して、各データ項目の属性を推定し、推定したデータ項目毎の属性を、前記学習モデルに適用して、前記対象となるテーブルのデータ項目のデータ項目名を推定する、推定処理部と、
を備えている、ことを特徴とする。
(a)学習用のテーブルにおけるデータ項目名毎に、当該データ項目名が付与されているデータの特徴値を抽出し、抽出した特徴値と当該データ項目名に対応する属性との関係を定義し、前記属性毎に、対応するデータ項目名を特定し、前記学習用のテーブルにおける前記属性と前記データ項目名との組合せを学習して、学習モデルを作成する、ステップと、
(b)対象となるテーブルのデータ項目毎の特徴値を、前記(a)のステップで得られた定義に照合して、各データ項目の属性を推定し、推定したデータ項目毎の属性を、前記学習モデルに適用して、前記対象となるテーブルのデータ項目のデータ項目名を推定する、ステップと、
を有する、ことを特徴とする。
コンピュータに、
(a)学習用のテーブルにおけるデータ項目名毎に、当該データ項目名が付与されているデータの特徴値を抽出し、抽出した特徴値と当該データ項目名に対応する属性との関係を定義し、前記属性毎に、対応するデータ項目名を特定し、前記学習用のテーブルにおける前記属性と前記データ項目名との組合せを学習して、学習モデルを作成する、ステップと、
(b)対象となるテーブルのデータ項目毎の特徴値を、前記(a)のステップで得られた定義に照合して、各データ項目の属性を推定し、推定したデータ項目毎の属性を、前記学習モデルに適用して、前記対象となるテーブルのデータ項目のデータ項目名を推定する、ステップと、
を実行させることを特徴とする。
本発明では、データ項目名の推定対象となるテーブルのデータ項目から、特徴値を抽出し、抽出した特徴値と属性との類似度を算出して、類似度の高い属性にそれぞれのデータ項目を分類する。そして、推定対象となるテーブルを構成するデータ項目の属性の組み合わせを、事前に学習しておいたデータ項目の属性の組み合わせとデータ項目名との対応関係に適用することで、データ項目にどのようなデータ項目名が付与されるかを推定する。つまり、本発明では、主に、学習処理と推定処理とが行なわれる。以下に具体的説明する。
以下、本発明の実施の形態における、データ項目推定装置、データ項目推定方法、及びプログラムについて、図1〜図12を参照しながら説明する。
最初に、本実施の形態におけるデータ項目推定装置の構成について説明する。図1は、本発明の実施の形態におけるデータ項目推定装置の概略構成を示すブロック図である。
次に、本実施の形態におけるデータ項目推定装置100の動作について図3〜図10を用いて説明する。また、本実施の形態では、データ項目推定装置100を動作させることによって、データ項目推定方法が実施される。よって、本実施の形態におけるデータ項目推定方法の説明は、以下のデータ項目推定装置100の動作説明に代える。
(参照文献1)G. Piatetsky-Shapiro(1991). Discovery, analysis, and presentation of strong rules. In G. Piatetsky-Shapiro and W. J. Frawley, editors, Knowledge Discovery in Databases. AAAI/MIT Press, Cambridge, MA.
(参照文献2)R. Agrawal, T. Imielinski, and A. Swami(1993). Mining association rules between sets of items in large databases. In Proceedings of the 1993 ACM SIGMOD International Conference on Management of Data, pages 207-216.
本実施の形態におけるプログラムは、コンピュータに、図5に示すステップA1〜A6、図9に示すステップB1〜B8を実行させるプログラムであれば良い。このプログラムをコンピュータにインストールし、実行することによって、本実施の形態におけるデータ項目推定装置100とデータ項目推定方法とを実現することができる。この場合、コンピュータのCPU(Central Processing Unit)は、学習処理部10及び推定処理部20として機能し、処理を行なう。
11 学習テーブル受付部
12 特徴抽出部
13 属性情報作成部
14 属性個物情報作成部
15 属性組合せ情報作成部
20 推定処理部
21 対象テーブル受付部
22 特徴抽出部
23 属性推定部
24 項目名推定部
25 推定結果表示部
26 結果編集部
30 記憶部
31 属性情報
32 属性個物情報
33 属性組合せ情報
100 データ項目名推定装置
110 コンピュータ
111 CPU
112 メインメモリ
113 記憶装置
114 入力インターフェイス
115 表示コントローラ
116 データリーダ/ライタ
117 通信インターフェイス
118 入力機器
119 ディスプレイ装置
120 記録媒体
121 バス
Claims (9)
- 学習用のテーブルにおけるデータ項目名毎に、当該データ項目名が付与されているデータの特徴値を抽出し、抽出した特徴値と当該データ項目名に対応する属性との関係を定義し、前記属性毎に、対応するデータ項目名を特定し、前記学習用のテーブルにおける前記属性と前記データ項目名との組合せを学習して、学習モデルを作成する、学習処理部と、
対象となるテーブルのデータ項目毎の特徴値を、前記学習処理部による定義に照合して、各データ項目の属性を推定し、推定したデータ項目毎の属性を、前記学習モデルに適用して、前記対象となるテーブルのデータ項目のデータ項目名を推定する、推定処理部と、
を備えている、ことを特徴とするデータ項目名推定装置。 - 前記学習処理部が、
抽出した特徴値と当該データ項目名に対応する属性との関係を定義した属性情報を作成し、
更に、作成した前記属性情報に含まれる属性毎に、対応するデータ項目名が付与された属性個物情報を作成し、
そして、前記属性個物情報を用いて、前記学習モデルとして、前記学習用のテーブルにおける前記属性の組合わせと前記属性それぞれに対応するデータ項目名とを示す属性組合せ情報を作成する、
請求項1に記載のデータ項目名推定装置。 - 前記推定処理部が、
対象となるテーブルのレコードから、データ項目毎に、特徴値を抽出し、
抽出した特徴値を前記属性情報に照合して、各データ項目の属性を推定し、
そして、推定した属性を用いて、属性の組合せを設定し、設定した属性の組合せ毎に、前記属性組合せ情報及び前記属性個物情報を用いて、特定のデータ項目名が出現する頻度を算出し、
算出結果に基づいて、前記対象となるテーブルのデータ項目それぞれのデータ項目名を推定する、
請求項2に記載のデータ項目名推定装置。 - (a)学習用のテーブルにおけるデータ項目名毎に、当該データ項目名が付与されているデータの特徴値を抽出し、抽出した特徴値と当該データ項目名に対応する属性との関係を定義し、前記属性毎に、対応するデータ項目名を特定し、前記学習用のテーブルにおける前記属性と前記データ項目名との組合せを学習して、学習モデルを作成する、ステップと、
(b)対象となるテーブルのデータ項目毎の特徴値を、前記(a)のステップで得られた定義に照合して、各データ項目の属性を推定し、推定したデータ項目毎の属性を、前記学習モデルに適用して、前記対象となるテーブルのデータ項目のデータ項目名を推定する、ステップと、
を有する、ことを特徴とするデータ項目名推定方法。 - 前記(a)のステップにおいて、
抽出した特徴値と当該データ項目名に対応する属性との関係を定義した属性情報を作成し、
更に、作成した前記属性情報に含まれる属性毎に、対応するデータ項目名が付与された属性個物情報を作成し、
そして、前記属性個物情報を用いて、前記学習モデルとして、前記学習用のテーブルにおける前記属性の組合わせと前記属性それぞれに対応するデータ項目名とを示す属性組合せ情報を作成する、
請求項4に記載のデータ項目名推定方法。 - 前記(b)のステップにおいて、
対象となるテーブルのレコードから、データ項目毎に、特徴値を抽出し、
抽出した特徴値を前記属性情報に照合して、各データ項目の属性を推定し、
そして、推定した属性を用いて、属性の組合せを設定し、設定した属性の組合せ毎に、前記属性組合せ情報及び前記属性個物情報を用いて、特定のデータ項目名が出現する頻度を算出し、
算出結果に基づいて、前記対象となるテーブルのデータ項目それぞれのデータ項目名を推定する、
請求項5に記載のデータ項目名推定方法。 - コンピュータに、
(a)学習用のテーブルにおけるデータ項目名毎に、当該データ項目名が付与されているデータの特徴値を抽出し、抽出した特徴値と当該データ項目名に対応する属性との関係を定義し、前記属性毎に、対応するデータ項目名を特定し、前記学習用のテーブルにおける前記属性と前記データ項目名との組合せを学習して、学習モデルを作成する、ステップと、
(b)対象となるテーブルのデータ項目毎の特徴値を、前記(a)のステップで得られた定義に照合して、各データ項目の属性を推定し、推定したデータ項目毎の属性を、前記学習モデルに適用して、前記対象となるテーブルのデータ項目のデータ項目名を推定する、ステップと、
を実行させる、プログラム。 - 前記(a)のステップにおいて、
抽出した特徴値と当該データ項目名に対応する属性との関係を定義した属性情報を作成し、
更に、作成した前記属性情報に含まれる属性毎に、対応するデータ項目名が付与された属性個物情報を作成し、
そして、前記属性個物情報を用いて、前記学習モデルとして、前記学習用のテーブルにおける前記属性の組合わせと前記属性それぞれに対応するデータ項目名とを示す属性組合せ情報を作成する、
請求項7に記載のプログラム。 - 前記(b)のステップにおいて、
対象となるテーブルのレコードから、データ項目毎に、特徴値を抽出し、
抽出した特徴値を前記属性情報に照合して、各データ項目の属性を推定し、
そして、推定した属性を用いて、属性の組合せを設定し、設定した属性の組合せ毎に、前記属性組合せ情報及び前記属性個物情報を用いて、特定のデータ項目名が出現する頻度を算出し、
算出結果に基づいて、前記対象となるテーブルのデータ項目それぞれのデータ項目名を推定する、
請求項8に記載のプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017046895A JP7235269B2 (ja) | 2017-03-13 | 2017-03-13 | データ項目名推定装置、データ項目名推定プログラム、及びデータ項目名推定方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017046895A JP7235269B2 (ja) | 2017-03-13 | 2017-03-13 | データ項目名推定装置、データ項目名推定プログラム、及びデータ項目名推定方法 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2018151805A true JP2018151805A (ja) | 2018-09-27 |
JP2018151805A5 JP2018151805A5 (ja) | 2020-04-16 |
JP7235269B2 JP7235269B2 (ja) | 2023-03-08 |
Family
ID=63680451
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017046895A Active JP7235269B2 (ja) | 2017-03-13 | 2017-03-13 | データ項目名推定装置、データ項目名推定プログラム、及びデータ項目名推定方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7235269B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020144469A (ja) * | 2019-03-04 | 2020-09-10 | 富士ゼロックス株式会社 | 情報処理装置及びプログラム |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100570224B1 (ko) * | 2003-02-24 | 2006-04-11 | 가부시키가이샤 히타치세이사쿠쇼 | 전표정의데이터 작성방법 및 전표처리장치 |
JP2008071052A (ja) * | 2006-09-13 | 2008-03-27 | Softbank Mobile Corp | メディア変換メッセージシステム |
JP2013522733A (ja) * | 2010-03-12 | 2013-06-13 | マイクロソフト コーポレーション | サービスとしての情報に関連するセマンティックスの更新および適応性のあるインタフェース |
JP2013232025A (ja) * | 2012-04-27 | 2013-11-14 | Ntt Docomo Inc | データ移行支援装置及びデータ移行支援方法 |
WO2016194248A1 (ja) * | 2015-06-03 | 2016-12-08 | 三菱電機株式会社 | 推論装置及び推論方法 |
-
2017
- 2017-03-13 JP JP2017046895A patent/JP7235269B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100570224B1 (ko) * | 2003-02-24 | 2006-04-11 | 가부시키가이샤 히타치세이사쿠쇼 | 전표정의데이터 작성방법 및 전표처리장치 |
JP2008071052A (ja) * | 2006-09-13 | 2008-03-27 | Softbank Mobile Corp | メディア変換メッセージシステム |
JP2013522733A (ja) * | 2010-03-12 | 2013-06-13 | マイクロソフト コーポレーション | サービスとしての情報に関連するセマンティックスの更新および適応性のあるインタフェース |
JP2013232025A (ja) * | 2012-04-27 | 2013-11-14 | Ntt Docomo Inc | データ移行支援装置及びデータ移行支援方法 |
WO2016194248A1 (ja) * | 2015-06-03 | 2016-12-08 | 三菱電機株式会社 | 推論装置及び推論方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020144469A (ja) * | 2019-03-04 | 2020-09-10 | 富士ゼロックス株式会社 | 情報処理装置及びプログラム |
JP7383885B2 (ja) | 2019-03-04 | 2023-11-21 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP7235269B2 (ja) | 2023-03-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20190251471A1 (en) | Machine learning device | |
US9223815B2 (en) | Method, apparatus, and program for supporting creation and management of metadata for correcting problem in dynamic web application | |
CN111625161B (zh) | 标签的处理方法、装置及电子设备 | |
US9104709B2 (en) | Cleansing a database system to improve data quality | |
US20180246958A1 (en) | Analysis server device, data analysis system, and data analysis method | |
US11379466B2 (en) | Data accuracy using natural language processing | |
US9026643B2 (en) | Contents' relationship visualizing apparatus, contents' relationship visualizing method and its program | |
CN113486187A (zh) | 佛学知识图谱构建方法、装置、设备及存储介质 | |
CN109165119B (zh) | 一种电子商务数据处理方法和系统 | |
US10586169B2 (en) | Common feature protocol for collaborative machine learning | |
JP2007188343A (ja) | スキーマ統合支援装置、スキーマ統合支援方法およびスキーマ統合支援プログラム | |
US20220004885A1 (en) | Computer system and contribution calculation method | |
CN110618926A (zh) | 源代码分析方法和源代码分析装置 | |
WO2019085118A1 (zh) | 基于主题模型的关联词分析方法、电子装置及存储介质 | |
JP7235269B2 (ja) | データ項目名推定装置、データ項目名推定プログラム、及びデータ項目名推定方法 | |
JP5890340B2 (ja) | 画像分類装置及び画像分類プログラム | |
CN112241262A (zh) | 一种面向软件定义卫星的可复用代码提取、分析与检索方法与装置 | |
JP4630691B2 (ja) | データベース装置とその処理方法 | |
US20150134660A1 (en) | Data clustering system and method | |
Pahwa et al. | An efficient algorithm for data cleaning | |
WO2018206819A1 (en) | Data storage method and apparatus | |
JPWO2023037399A5 (ja) | ||
US8775873B2 (en) | Data processing apparatus that performs test validation and computer-readable storage medium | |
KR100567813B1 (ko) | 텐덤 시스템의 트랜잭션 분석 시스템 | |
JP7442430B2 (ja) | 審査支援システム、及び審査支援方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200302 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200302 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210129 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210209 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210409 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20211012 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220111 |
|
C60 | Trial request (containing other claim documents, opposition documents) |
Free format text: JAPANESE INTERMEDIATE CODE: C60 Effective date: 20220111 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20220121 |
|
C21 | Notice of transfer of a case for reconsideration by examiners before appeal proceedings |
Free format text: JAPANESE INTERMEDIATE CODE: C21 Effective date: 20220125 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20220401 |
|
C211 | Notice of termination of reconsideration by examiners before appeal proceedings |
Free format text: JAPANESE INTERMEDIATE CODE: C211 Effective date: 20220405 |
|
C22 | Notice of designation (change) of administrative judge |
Free format text: JAPANESE INTERMEDIATE CODE: C22 Effective date: 20220517 |
|
C13 | Notice of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: C13 Effective date: 20221011 |
|
C22 | Notice of designation (change) of administrative judge |
Free format text: JAPANESE INTERMEDIATE CODE: C22 Effective date: 20221011 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221207 |
|
C23 | Notice of termination of proceedings |
Free format text: JAPANESE INTERMEDIATE CODE: C23 Effective date: 20221220 |
|
C03 | Trial/appeal decision taken |
Free format text: JAPANESE INTERMEDIATE CODE: C03 Effective date: 20230124 |
|
C30A | Notification sent |
Free format text: JAPANESE INTERMEDIATE CODE: C3012 Effective date: 20230124 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230216 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7235269 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |