JP2015082292A - 転用状況可視化システム及び転用状況可視化方法 - Google Patents
転用状況可視化システム及び転用状況可視化方法 Download PDFInfo
- Publication number
- JP2015082292A JP2015082292A JP2013221194A JP2013221194A JP2015082292A JP 2015082292 A JP2015082292 A JP 2015082292A JP 2013221194 A JP2013221194 A JP 2013221194A JP 2013221194 A JP2013221194 A JP 2013221194A JP 2015082292 A JP2015082292 A JP 2015082292A
- Authority
- JP
- Japan
- Prior art keywords
- diversion
- data
- source
- cluster
- destination
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 26
- 238000006243 chemical reaction Methods 0.000 claims abstract description 30
- 239000013598 vector Substances 0.000 claims abstract description 25
- 238000012545 processing Methods 0.000 claims abstract description 24
- 230000010354 integration Effects 0.000 claims abstract description 20
- 238000004364 calculation method Methods 0.000 claims abstract description 6
- 238000012800 visualization Methods 0.000 claims description 19
- 238000007794 visualization technique Methods 0.000 claims description 11
- 239000000284 extract Substances 0.000 claims description 9
- 238000013507 mapping Methods 0.000 claims description 7
- 238000011156 evaluation Methods 0.000 claims description 6
- 238000012937 correction Methods 0.000 claims 1
- 238000007726 management method Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 8
- 238000012546 transfer Methods 0.000 description 7
- 238000007792 addition Methods 0.000 description 5
- 240000004050 Pentaglottis sempervirens Species 0.000 description 4
- 235000004522 Pentaglottis sempervirens Nutrition 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000013500 data storage Methods 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】
データ統合サブシステム300が、転用元データ及び転用先データの変換スキーマの解析を行って統合データ群DB602へ格納するデータ統合処理を行い、自動分類サブシステム500が、統合データ群DB602に格納したデータを元に生成した特徴ベクトルを用いた類似度計算によるクラスタリング処理を行って統合データ群DB602に格納する自動分類処理を行い、転用状況判定サブシステム400が、転用元データ及び転用先データの転用状況を、クラスタ最新データとクラスタ内最新転用元データの同一性及び類似性に基づいて転用状況の判定を行う転用状況可視化システム100。
【選択図】図1
Description
操作者による転用元データ及び転用先データを入力するための入力部及び転用状況判定結果画面他のデータ表示を行う表示部を有する可視化サブシステムと、
転用元データおよび転用先データが統合されたデータにマッピングするための変換スキーマ定義情報を格納する変換スキーマ定義データベースと、
転用元及び転用先を統合したフォーマットのデータを格納する統合データ群データベースと、
前記入力部から入力された転用元データ及び転用先データが「転用元」か「転用先」かを表すソース区分を転用元データ及び転用先データに追加するソース区分追加部及び変換スキーマ定義データベースに定義された変換スキーマ定義を用いて統合データ群データベースのデータ形式に沿ったデータ形式に変換し、統合データ群データベースに格納するスキーマ管理部とを有するデータ統合サブシステムと、
統合データ群データベースに格納されたデータから特徴量を抽出し、ベクトル化した特徴ベクトルを生成する特徴ベクトル生成部及び各統合データの該特徴ベクトル上の類似性を用いて類似するクラスタを生成するクラスタリング部を有する自動分類サブシステムと、
前記クラスタリング部で出力されたクラスタ情報を格納するクラスタ情報データベースと、
前記クラスタ群データベースに格納した各クラスタを構成する統合データのソース区分に基づいて転用元データのみから成るクラスタ区分である「転用元類似」か転用先のみから成るクラスタ区分である「転用先流用」か転用元及び転用先を含むクラスタ区分である「転用元転用」かに区分するクラスタ区分部並びに前記クラスタ区分とクラスタ情報を入力として転用判定結果を統合データ群データベースに格納する転用判定部を有する転用状況判定サブシステムとを備えることを第1の特徴とする。
前記コンピュータシステムが、
入力部から入力された転用元データ及び転用先データが「転用元」か「転用先」かを表すソース区分を転用元データ及び転用先データに追加するソース区分追加機能及び変換スキーマ定義データベースに定義された変換スキーマ定義を用いて統合データ群データベースのデータ形式に沿ったデータ形式に変換し、統合データ群データベースに格納するスキーマ管理機能を行うデータ統合サブ工程と、
統合データ群データベースに格納されたデータから特徴量を抽出し、ベクトル化した特徴ベクトルを生成する特徴ベクトル生成機能及び各統合データの該特徴ベクトル上の類似性を用いて類似するクラスタを生成するクラスタリング機能を行う自動分類サブ工程と、
前記クラスタ群データベースに格納した各クラスタを構成する統合データのソース区分に基づいて転用元データのみから成るクラスタ区分である「転用元類似」か転用先のみから成るクラスタ区分である「転用先流用」か転用元及び転用先を含むクラスタ区分である「転用元転用」かに区分するクラスタ区分機能並びに前記クラスタ区分とクラスタ情報を入力として転用判定結果を統合データ群データベースに格納する転用判定機能を行う転用状況判定サブ工程とを実行することを第4の特徴とする。
[構成]
本実施形態による転用状況可視化システムは、図1に示す如く、転用元となるデータを一意に表すデータソースと該データソースの区分とデータ項目(テキストデータ項目、音声データ項目)とを含む変換スキーマ定義情報を格納する変換スキーマ定義(データベース)DB601と、一意の識別子別のデータソース区分とクラスタと転用状況(修正転用・履歴参照)とデータ内容(テキストデータの内容)とを含む総合情報を格納する統合データ群DB602と、類似する要素群のクラスタ間の距離を含むクラスタ情報を格納するクラスタ情報DB603と、操作者による入力データ(転用元データ、転用先データ、変換スキーマ定義を含む様々な要求)を入力するための入力部201及び転用状況判定結果画面他の表示を行う表示部202を有する可視化サブシステム200と、前記入力部201から入力された転用元データ及び転用先データに対してソース区分(「転用元」、「転用先」のラベル)を追加するソース区分追加部301及び変換スキーマ定義DB601に定義された変換スキーマ定義6032を用いて統合データ群DB602のデータ形式に沿ったデータ形式に変換し、統合データ群DB602に格納するスキーマ管理部302とを有するデータ統合サブシステム300と、前記クラスタ情報DB603に格納したクラスタ情報間の転用判定を行って転用判定結果を出力する転用判定部401及び該転用判定結果を更に転用判定の高精度化のために必要に応じて更に区分し、転用判定結果を統合データ群DB602に格納するクラスタ区分部402を有する転用状況判定サブシステム400と、統合データ群DB602に格納されたデータから特徴量を抽出し、ベクトル化した特徴ベクトルを生成する特徴ベクトル生成部501及び該特徴ベクトルを用いて自動分類処理を行うクラスタリング部502を有する自動分類サブシステム500とを備える。また、本実施形態による転用状況可視化システムは、一般のコンピュータシステムから構成され、後述する処理においては図示しないCPU等の制御手段がメモリの一時記憶領域に各種データを格納・参照・更新しながら所定の動作を実行するものであり、このメモリへのデータ格納・参照・更新の詳細については省略して説明する。
前述のように構成された本実施形態によるデータ統合サブシステム300は、図2に示す如く、ソース区分追加部301が、入力されたデータ6031に含まれるスキーマ定義から一意の識別子及びデータ型を抽出し、該入力データ6031のスキーマ(構造)を抽出するステップS3011と、該ステップS3011で抽出したスキーマ又は入力されたデータスキーマに基づいて一意の識別子を選定し、一意の識別子候補がなければ自動的に連番の識別子を採番するステップS3012と、該ステップS3012により選定または採番された一意識別子に、変換スキーマ定義のデータソース区分に基づいて接頭字を追加するステップS3013とを実行する。尚、前記データ区分とは、転用元か転用先かの種別に基づく組合せ、「転用先」「転用元」である。
201 入力部、202 表示部、300 データ統合サブシステム、
301 ソース区分追加部、302 スキーマ管理部、
400 転用状況判定サブシステム、401 転用判定部、
402 クラスタ区分部、500 自動分類サブシステム、
501 特徴ベクトル生成部、502 クラスタリング部、
601 変換スキーマ定義DB、602 統合データ群DB、
603 クラスタ情報DB
Claims (6)
- 転用元データ及び転用先データを入力として、その転用状況の評価を支援する転用状況可視化システムであって、
操作者による転用元データ及び転用先データを入力するための入力部及び転用状況判定結果画面他のデータ表示を行う表示部を有する可視化サブシステムと、
転用元データおよび転用先データが統合されたデータにマッピングするための変換スキーマ定義情報を格納する変換スキーマ定義データベースと、
転用元及び転用先を統合したフォーマットのデータを格納する統合データ群データベースと、
前記入力部から入力された転用元データ及び転用先データが「転用元」か「転用先」かを表すソース区分を転用元データ及び転用先データに追加するソース区分追加部及び変換スキーマ定義データベースに定義された変換スキーマ定義を用いて統合データ群データベースのデータ形式に沿ったデータ形式に変換し、統合データ群データベースに格納するスキーマ管理部とを有するデータ統合サブシステムと、
統合データ群データベースに格納されたデータから特徴量を抽出し、ベクトル化した特徴ベクトルを生成する特徴ベクトル生成部及び各統合データの該特徴ベクトル上の類似性を用いて類似するクラスタを生成するクラスタリング部を有する自動分類サブシステムと、
前記クラスタリング部で出力されたクラスタ情報を格納するクラスタ情報データベースと、
前記クラスタ群データベースに格納した各クラスタを構成する統合データのソース区分に基づいて転用元データのみから成るクラスタ区分である「転用元類似」か転用先のみから成るクラスタ区分である「転用先流用」か転用元及び転用先を含むクラスタ区分である「転用元転用」かに区分するクラスタ区分部並びに前記クラスタ区分とクラスタ情報を入力として転用判定結果を統合データ群データベースに格納する転用判定部を有する転用状況判定サブシステムとを備えることを特徴とする転用状況可視化システム。 - 前記転用状況判定サブシステムの転用判定部が、クラスタ区分とクラスタ情報を入力とし、クラスタ内の転用元データ及び転用先データ、転用元データ同士、あるいは転用先データ同士の比較と類似度処理によって、転用状況である「未転用」「転用」「修正転用」「転用不良」「履歴参照」を判定するサブ工程を実施することを特徴とする請求項1記載の転用状況可視化システム。
- 前記自動分類サブシステムが、データ統合サブシステムに格納したデータが文書テキストの場合に単語毎の出現頻度、テキストの文字数を算出すること、及び又は音声ファイルの場合に音の大きさや音素の数を算出することにより特徴量を抽出することを特徴とする請求項1又は2記載の転用状況可視化システム。
- 操作者による転用元データ及び転用先データを入力するための入力部及び転用状況判定結果画面他のデータ表示を行う表示部を有する可視化サブシステムと、転用元データおよび転用先データが統合されたデータにマッピングするための変換スキーマ定義情報を格納する変換スキーマ定義データベースと、転用元及び転用先を統合したフォーマットのデータを格納する統合データ群データベースと、クラスタ情報を格納するクラスタ情報データベースと、を備え、転用元データ及び転用先データを入力として転用状況の評価を支援するコンピュータシステムの転用状況可視化方法であって、
前記コンピュータシステムが、
入力部から入力された転用元データ及び転用先データが「転用元」か「転用先」かを表すソース区分を転用元データ及び転用先データに追加するソース区分追加機能及び変換スキーマ定義データベースに定義された変換スキーマ定義を用いて統合データ群データベースのデータ形式に沿ったデータ形式に変換し、統合データ群データベースに格納するスキーマ管理機能を行うデータ統合サブ工程と、
統合データ群データベースに格納されたデータから特徴量を抽出し、ベクトル化した特徴ベクトルを生成する特徴ベクトル生成機能及び各統合データの該特徴ベクトル上の類似性を用いて類似するクラスタを生成するクラスタリング機能を行う自動分類サブ工程と、
前記クラスタ群データベースに格納した各クラスタを構成する統合データのソース区分に基づいて転用元データのみから成るクラスタ区分である「転用元類似」か転用先のみから成るクラスタ区分である「転用先流用」か転用元及び転用先を含むクラスタ区分である「転用元転用」かに区分するクラスタ区分機能並びに前記クラスタ区分とクラスタ情報を入力として転用判定結果を統合データ群データベースに格納する転用判定機能を行う転用状況判定サブ工程とを実行することを特徴とする転用状況可視化方法。 - 前記転用状況判定サブ工程において、クラスタ区分とクラスタ情報を入力とし、クラスタ内の転用元データ及び転用先データ、転用元データ同士、あるいは転用先データ同士の比較と類似度処理によって、転用状況である「未転用」「転用」「修正転用」「転用不良」「履歴参照」を判定することを特徴とする請求項4記載の転用状況可視化方法。
- 前記コンピュータシステムが、データ統合サブ工程により格納したデータが文書テキストの場合に単語毎の出現頻度、テキストの文字数を算出すること、及び又は音声ファイルの場合に音の大きさや音素の数を算出することにより特徴量を抽出する工程を実行することを特徴とする請求項4又は5記載の転用状況可視化方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013221194A JP6251004B2 (ja) | 2013-10-24 | 2013-10-24 | 転用状況可視化システム及び転用状況可視化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013221194A JP6251004B2 (ja) | 2013-10-24 | 2013-10-24 | 転用状況可視化システム及び転用状況可視化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015082292A true JP2015082292A (ja) | 2015-04-27 |
JP6251004B2 JP6251004B2 (ja) | 2017-12-20 |
Family
ID=53012832
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013221194A Expired - Fee Related JP6251004B2 (ja) | 2013-10-24 | 2013-10-24 | 転用状況可視化システム及び転用状況可視化方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6251004B2 (ja) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002108879A (ja) * | 2000-09-27 | 2002-04-12 | Nec Corp | 製品検索システムおよび製品検索方法 |
JP2006092381A (ja) * | 2004-09-27 | 2006-04-06 | Hitachi Ltd | メディアマイニング方法 |
JP2010067243A (ja) * | 2008-09-12 | 2010-03-25 | Yahoo Japan Corp | 引用判定方法及びそれを用いた評判抽出方法 |
-
2013
- 2013-10-24 JP JP2013221194A patent/JP6251004B2/ja not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002108879A (ja) * | 2000-09-27 | 2002-04-12 | Nec Corp | 製品検索システムおよび製品検索方法 |
JP2006092381A (ja) * | 2004-09-27 | 2006-04-06 | Hitachi Ltd | メディアマイニング方法 |
JP2010067243A (ja) * | 2008-09-12 | 2010-03-25 | Yahoo Japan Corp | 引用判定方法及びそれを用いた評判抽出方法 |
Also Published As
Publication number | Publication date |
---|---|
JP6251004B2 (ja) | 2017-12-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107402992B (zh) | 一种分布式NewSQL数据库系统和全文检索建立方法 | |
CN105808284B (zh) | 一种增量升级方法及应用其的服务器 | |
JP5328808B2 (ja) | データをクラスタリングする方法、システム、装置およびその方法を適用するためのコンピュータ・プログラム | |
CN103810212A (zh) | 一种数据库索引的自动创建方法及系统 | |
US20210357461A1 (en) | Method, apparatus and storage medium for searching blockchain data | |
US20190243912A1 (en) | Rapid design, development, and reuse of blockchain environment and smart contracts | |
CN110781183A (zh) | Hive数据库中增量数据的处理方法、装置以及计算机设备 | |
US9734178B2 (en) | Searching entity-key associations using in-memory objects | |
CN103970751A (zh) | 多国语言网页转换系统及方法 | |
KR20130139724A (ko) | 컴퓨팅 시스템 및 그 실행 제어 방법과, 그 실행 제어 프로그램을 기록한 기록 매체 | |
KR20090041519A (ko) | 정보 맵 관리 시스템 및 방법 | |
CN112527819A (zh) | 通讯录信息检索方法、装置、电子设备及存储介质 | |
JP6251004B2 (ja) | 転用状況可視化システム及び転用状況可視化方法 | |
CN106126633B (zh) | 贵金属数据的处理方法、装置和系统 | |
US11341190B2 (en) | Name matching using enhanced name keys | |
WO2017072872A1 (ja) | 業務プログラム生成支援システムおよび業務プログラム生成支援方法 | |
JP6150664B2 (ja) | マイニング分析装置、方法及びプログラム | |
JP5184987B2 (ja) | 索引情報作成装置、索引情報作成方法及びプログラム | |
JP5199968B2 (ja) | キーワードタイプ判定装置、キーワードタイプ判定方法およびキーワードタイプ判定プログラム | |
JP5229170B2 (ja) | ソフトウェア更新装置、方法、及びプログラム | |
CN111311329B (zh) | 标签数据获取方法、装置、设备及可读存储介质 | |
JP2020064383A (ja) | リスク特定装置、リスク特定方法、およびプログラム | |
KR101975998B1 (ko) | Sql 구문 기반의 데이터 이관 장치 및 방법 | |
JP6801268B2 (ja) | テーブル管理装置、テーブル管理方法およびテーブル管理プログラム | |
JP6627809B2 (ja) | データベース処理装置、システム、方法およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20161011 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170804 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170815 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171016 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20171031 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20171124 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6251004 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |