JP7100422B2 - データプロパティ認識のための装置、プログラム、及び方法 - Google Patents
データプロパティ認識のための装置、プログラム、及び方法 Download PDFInfo
- Publication number
- JP7100422B2 JP7100422B2 JP2016233527A JP2016233527A JP7100422B2 JP 7100422 B2 JP7100422 B2 JP 7100422B2 JP 2016233527 A JP2016233527 A JP 2016233527A JP 2016233527 A JP2016233527 A JP 2016233527A JP 7100422 B2 JP7100422 B2 JP 7100422B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- feature vector
- data entry
- property
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
- G06F16/256—Integrating or interfacing systems involving database management systems in federated or virtual databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
- G06F16/9024—Graphs; Linked lists
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/30181—Instruction operation extension or modification
- G06F9/30192—Instruction operation extension or modification according to data descriptor, e.g. dynamic data typing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/68—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/683—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/12—Fingerprints or palmprints
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/76—Television signal recording
- H04N5/765—Interface circuits between an apparatus for recording and another apparatus
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Quality & Reliability (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
最小値、
最大値、
第1の四分位値(first quartile value)、
第3の四分位値(third quartile value)、
中央値、
平均値、
標準偏差、
分散、
最も繰り返されるデータエントリ。
データエントリのアルファベット、
データエントリ当たりの平均文字数、
データエントリ当たりの平均空白文字数、
データエントリ当たりの平均ピリオド数、
データエントリ当たりの平均コンマ数、
データエントリ当たりの平均セミコロン数、
最も繰り返されるデータエントリ、
最長共通サブストリング、
ユニークなエントリの割合。
エントリの数、
最小数値、
最大数値、
第1の四分位数値(first quartile numerical value)、
第3の四分位数値(third quartile numerical value)、
中央数値、
数値の平均、
標準偏差、
分散、
共分散、
歪度、
尖度、
開始日、
終了日。
(付記1) データプロパティ認識装置であって、
記憶ユニットと、
モデルデータ取得プロセッサであって、複数のデータエントリモデルセットを取得するよう構成され、各々の個々のデータエントリモデルセットは、前記データエントリモデルセットに共通の識別されたプロパティを個々に表す複数のデータエントリであり、及び前記データ要素モデルセットに共通のデータ型である、モデルデータ取得プロセッサと、
特徴ベクトル生成プロセッサであって、データエントリ入力セットを受信し、複数のサポートされるデータ型の中から前記データエントリ入力セットに共通のデータ型を認識し、前記の認識したデータ型に依存して前記データエントリ入力セットを表す統計的特徴セットを選択し、前記データエントリ入力セットから前記の選択した統計的特徴セットの各々の値を生成し、前記の生成した統計的特徴の値から成る特徴ベクトルを出力するよう構成される、特徴ベクトル生成プロセッサと、
を有し、
前記モデルデータ取得プロセッサは、前記取得した複数のデータエントリモデルセットの各々について、データエントリ入力セットとして、前記特徴ベクトル生成プロセッサに前記データエントリモデルセットを提出し、前記特徴ベクトル生成プロセッサにより出力される前記特徴ベクトルを得て、前記データエントリモデルセットに共通の前記識別したプロパティに関連付けて前記特徴ベクトルを前記記憶ユニットに提出するよう構成され、
前記記憶ユニットは、前記個々の識別されたプロパティに関連付けて前記提出された特徴ベクトルを、前記個々のデータエントリにより共通に表されるプロパティの識別情報が捜し出されるデータエントリクエリセットについて、前記特徴ベクトル生成プロセッサにより出力される特徴ベクトルと比較するための特徴ベクトル基準セットとして、格納するよう構成される、
データプロパティ認識装置。
(付記2) クエリプロセッサであって、前記クエリプロセッサは、前記個々のデータエントリにより共通に表されるプロパティの識別情報が捜し出されるデータエントリクエリセットを得て、前記データエントリクエリセットを前記特徴ベクトル生成プロセッサに提出し、前記出力された特徴ベクトルと前記格納された特徴ベクトル基準セットとの間の比較を実行して、前記出力された特徴ベクトルについて前記格納された特徴ベクトル基準セットの間で最良一致特徴ベクトルを識別し、前記最良一致特徴ベクトルに関連付けて格納された前記識別されたプロパティを、前記データエントリクエリセットの中の前記個々のデータエントリにより表されるデータプロパティとして認識し、前記認識したデータプロパティを出力するよう構成される、クエリプロセッサ、
を更に有する付記1に記載のデータプロパティ認識装置。
(付記3) 前記クエリプロセッサは、前記データエントリクエリセット及び前記認識されたデータプロパティを前記記憶ユニットに提出するよう構成され、
前記記憶ユニットは、前記データエントリクエリセットを、認識されたデータエントリセットとして、前記認識されたデータプロパティに関連付けて格納するよう構成される、
付記2に記載のデータプロパティ認識装置。
(付記4) 前記記憶ユニットは、前記個々の識別されたプロパティに関連付けて及び前記特徴ベクトルが生成された前記個々のデータエントリモデルセットに関連付けて、前記特徴ベクトル基準セットを格納するよう構成される、
付記1に記載のデータプロパティ認識装置。
(付記5) 基準特徴ベクトル更新プロセッサであって、前記記憶ユニットに格納された前記認識されたデータエントリセットの提出により、前記提出された認識されたデータエントリセットと同じ識別されたプロパティに関連付けて格納されたデータエントリ基準セットの各々と他の認識されたデータエントリセットの各々とを有するデータエントリ合成セットを編成し、前記特徴ベクトル生成プロセッサに前記データエントリ合成セットを提出し、更新基準特徴ベクトルとして前記特徴ベクトル生成プロセッサにより出力された前記特徴ベクトルを得て、前記識別されたプロパティと関連付けて格納された前記特徴ベクトル基準セットの中に存在する特徴ベクトルを、前記更新基準特徴ベクトルで置き換えるよう構成される、基準特徴ベクトル更新プロセッサ、
を更に有する付記3又は4に記載のデータプロパティ認識装置。
(付記6) 前記の実行される比較は、前記出力される特徴ベクトルと前記格納された特徴ベクトル基準セットの各々との間であり、前記比較は、
前記基準セットからの前記特徴ベクトルにより表される前記データエントリセットのデータ型を、前記出力される特徴ベクトルにより表される前記データエントリクエリセットのデータ型と比較するステップと、
前記データ型が異なる場合、数学的比較により前記基準セットから前記特徴ベクトルを除外するステップと、
前記データ型が同じ場合、前記出力される特徴ベクトルと前記基準セットからの前記特徴ベクトルとの間の数学的比較を実行して、類似性値を得るステップと、
を有し、
最大類似性値が得られた特徴ベクトルは、前記最良一致特徴ベクトルである、
付記3に記載のデータプロパティ認識装置。
(付記7) 数値型であるとして認識されたデータエントリ入力セットの前記統計的特徴セットは、
データエントリの数、
最小値、
最大値、
第1の四分位値、
第3の四分位値、
中央値、
平均値、
標準偏差、
分散、
最も繰り返されるデータエントリ、
の中からの2以上を有する、付記1に記載のデータプロパティ認識装置。
(付記8) 文字列型であるとして認識されたデータエントリ入力セットの前記統計的特徴セットは、
データエントリの数、
データエントリのアルファベット、
データエントリ当たりの平均文字数、
データエントリ当たりの平均空白数、
データエントリ当たりの平均ピリオド数、
データエントリ当たりの平均コンマ数、
データエントリ当たりの平均セミコロン数、
最も繰り返されるデータエントリ、
最長共通サブストリング、
ユニークなエントリの割合、
の中からの2以上を有する、付記1に記載のデータプロパティ認識装置。
(付記9) 数値時系列型であるとして認識されたデータ値入力セットの前記統計的特徴セットは、
データ値の数、
エントリの数、
最小数値、
最大数値、
第1の四分位数値、
第3の四分位数値、
中央数値、
数値の平均値、
標準偏差、
分散、
共分散、
歪度、
尖度、
開始日、
終了日、
の中からの2以上を有する、付記1に記載のデータプロパティ認識装置。
(付記10) 前記複数のサポートされるデータ型は、数値、文字列、及び数値時系列型を有する、付記1に記載のデータプロパティ認識装置。
(付記11) 第1のデータソースからの複数のデータエントリモデルセットの指定と更なるデータソースからの複数のデータエントリクエリセットの指定とを、ユーザから受け付けるユーザインタフェースと、
付記3に記載のデータプロパティ認識装置であって、前記複数のデータエントリモデルセットは前記ユーザにより指定される、データプロパティ認識装置と、
データプロパティリコンシレーションプロセッサであって、前記記憶ユニットに、前記第1のデータソースのコピー及び前記更なるデータソースの各々のコピーを提出するよう構成され、認識されたデータプロパティが前記クエリプロセッサにより出力された前記データエントリクエリセットは、前記個々の認識されたデータプロパティと関連付けて格納される、データプロパティリコンシレーションプロセッサと、
を有するデータセットリコンシレーション装置。
(付記12) 複数のデータエントリモデルセットを取得するステップであって、各々の個々のデータエントリモデルセットは、前記データエントリモデルセットに共通の識別されたプロパティを個々に表す複数のデータエントリであり、及び前記データ要素モデルセットに共通のデータ型である、ステップと、
データエントリ入力セットとして前記取得された複数のデータエントリモデルセットの各々について、複数のサポートされるデータ型の中から前記データエントリ入力セットに共通のデータ型を認識し、前記認識したデータ型に依存して前記データエントリ入力セットを表す統計的特徴セットを選択し、前記複数のデータエントリから前記選択された統計的特徴セットの各々の値を生成し、前記生成した統計的特徴の値から成る特徴ベクトルを出力するステップと、
前記取得した複数のデータエントリモデルセットの各々について、前記出力された特徴ベクトルを得て、前記データエントリモデルセットに共通の前記識別されたプロパティと関連付けて前記出力された特徴ベクトルを記憶ユニットに提出するステップと、
前記個々のデータエントリにより共通に表されるプロパティの識別情報が捜し出されるデータエントリクエリセットのために生成された特徴ベクトルと比較するための特徴ベクトル基準セットとして、前記個々の識別されたプロパティと関連付けて前記提出された特徴ベクトルを格納するステップと、
を有する方法。
(付記13) 前記個々のデータエントリにより共通に表されるプロパティの識別情報が捜し出されるデータエントリクエリセットを得て、複数のサポートされるデータ型の中から前記データエントリクエリセットに共通のデータ型を認識し、前記データエントリクエリセットの前記認識されたデータ型に依存して、データエントリ入力セットを表す統計的特徴セットのうちの1つを選択し、前記データエントリクエリセットから前記選択された統計的特徴セットの各々の値を生成し、前記生成された統計的特徴の値から成る特徴ベクトルを出力するステップであって、前記複数のサポートされるデータ型は、数値型、文字列型、及び数値時系列型を有する、ステップと、
前記データエントリクエリセットについて出力された前記特徴ベクトルと前記格納された特徴ベクトル基準セットとの間の比較を実行して、前記データエントリクエリセットについて出力された前記特徴ベクトルに対して、前記格納された特徴ベクトル基準セットの中で最良一致特徴ベクトルを識別し、前記最良一致特徴ベクトルに関連付けて格納された前記識別されたプロパティを、前記データエントリクエリセットの中の前記個々のデータエントリにより表される認識されたデータプロパティとして認識し、前記認識されたデータプロパティを出力するステップと、
を更に有する付記12に記載の方法。
(付記14) コンピュータプログラムであって、コンピューティング装置により実行されると、前記コンピューティング装置に方法を実行させ、前記方法は、
複数のデータエントリモデルセットを取得するステップであって、各々の個々のデータエントリモデルセットは、前記データエントリモデルセットに共通の識別されたプロパティを個々に表す複数のデータエントリであり、及び前記データ要素モデルセットに共通のデータ型である、ステップと、
データエントリ入力セットとして前記取得された複数のデータエントリモデルセットの各々について、複数のサポートされるデータ型の中から前記データエントリ入力セットに共通のデータ型を認識し、前記認識したデータ型に依存して前記データエントリ入力セットを表す統計的特徴セットを選択し、前記複数のデータエントリセットから前記選択された統計的特徴セットの各々の値を生成し、前記生成した統計的特徴の値から成る特徴ベクトルを出力するステップと、
前記取得した複数のデータエントリモデルセットの各々について、前記出力された特徴ベクトルを得て、前記データエントリモデルセットに共通の前記識別されたプロパティと関連付けて前記出力された特徴ベクトルを記憶ユニットに提出するステップと、
前記個々のデータエントリにより共通に表されるプロパティの識別情報が捜し出されるデータエントリクエリセットのために生成された特徴ベクトルと比較するための特徴ベクトル基準セットとして、前記個々の識別されたプロパティと関連付けて前記提出された特徴ベクトルを格納するステップと、
を有する、コンピュータプログラム。
12 モデルデータ取得プロセッサ
18 クエリプロセッサ
14 特徴ベクトル生成プロセッサ
16 記憶ユニット
Claims (14)
- データプロパティ認識装置であって、
記憶ユニットと、
モデルデータ取得プロセッサであって、複数のデータエントリモデルセットを取得するよう構成され、各々の個々のデータエントリモデルセットは、前記データエントリモデルセットに共通の識別されたプロパティを個々に表す複数のデータエントリであり、及び前記データエントリモデルセットに共通のデータ型である、モデルデータ取得プロセッサと、
特徴ベクトル生成プロセッサであって、データエントリ入力セットを受信し、複数のサポートされるデータ型の中から前記データエントリ入力セットに共通のデータ型を認識し、前記の認識したデータ型に依存して前記データエントリ入力セットを表す統計的特徴セットを選択し、前記データエントリ入力セットから前記の選択した統計的特徴セットの各々の値を生成し、前記の生成した統計的特徴の値から成る特徴ベクトルを出力するよう構成される、特徴ベクトル生成プロセッサと、
を有し、
前記モデルデータ取得プロセッサは、前記取得した複数のデータエントリモデルセットの各々について、データエントリ入力セットとして、前記特徴ベクトル生成プロセッサに前記データエントリモデルセットを提出し、前記特徴ベクトル生成プロセッサにより出力される前記特徴ベクトルを得て、前記データエントリモデルセットに共通の前記識別したプロパティに関連付けて前記特徴ベクトルを前記記憶ユニットに提出するよう構成され、
前記記憶ユニットは、前記個々の識別されたプロパティに関連付けて前記提出された特徴ベクトルを、前記個々のデータエントリにより共通に表されるプロパティの識別情報が捜し出されるデータエントリクエリセットについて、前記特徴ベクトル生成プロセッサにより出力される特徴ベクトルと比較するための特徴ベクトル基準セットとして、格納するよう構成され、
前記データプロパティ認識装置は、前記特徴ベクトルと前記特徴ベクトルの生成されたデータエントリにより表される前記プロパティの識別情報との間の関連を格納するデータプロパティマッパであって、前記関連は前記記憶ユニットに格納された知識モデル又は外部知識モデルへのリンクを表す、データプロパティマッパを更に含む、
データプロパティ認識装置。 - クエリプロセッサであって、前記クエリプロセッサは、前記個々のデータエントリにより共通に表されるプロパティの識別情報が捜し出されるデータエントリクエリセットを得て、前記データエントリクエリセットを前記特徴ベクトル生成プロセッサに提出し、前記出力された特徴ベクトルと前記格納された特徴ベクトル基準セットとの間の比較を実行して、前記出力された特徴ベクトルについて前記格納された特徴ベクトル基準セットの間で最良一致特徴ベクトルを識別し、前記最良一致特徴ベクトルに関連付けて格納された前記識別されたプロパティを、前記データエントリクエリセットの中の前記個々のデータエントリにより表されるデータプロパティとして認識し、前記認識したデータプロパティを出力するよう構成される、クエリプロセッサ、
を更に有する請求項1に記載のデータプロパティ認識装置。 - 前記クエリプロセッサは、前記データエントリクエリセット及び前記認識されたデータプロパティを前記記憶ユニットに提出するよう構成され、
前記記憶ユニットは、前記データエントリクエリセットを、認識されたデータエントリセットとして、前記認識されたデータプロパティに関連付けて格納するよう構成される、
請求項2に記載のデータプロパティ認識装置。 - 前記記憶ユニットは、前記個々の識別されたプロパティに関連付けて及び前記特徴ベクトルが生成された前記個々のデータエントリモデルセットに関連付けて、前記特徴ベクトル基準セットを格納するよう構成される、
請求項1に記載のデータプロパティ認識装置。 - 基準特徴ベクトル更新プロセッサであって、前記記憶ユニットに格納された前記認識されたデータエントリセットの提出により、前記提出された認識されたデータエントリセットと同じ識別されたプロパティに関連付けて格納されたデータエントリ基準セットの各々と他の認識されたデータエントリセットの各々とを有するデータエントリ合成セットを編成し、前記特徴ベクトル生成プロセッサに前記データエントリ合成セットを提出し、更新基準特徴ベクトルとして前記特徴ベクトル生成プロセッサにより出力された前記特徴ベクトルを得て、前記識別されたプロパティと関連付けて格納された前記特徴ベクトル基準セットの中に存在する特徴ベクトルを、前記更新基準特徴ベクトルで置き換えるよう構成される、基準特徴ベクトル更新プロセッサ、
を更に有する請求項3又は4に記載のデータプロパティ認識装置。 - 前記の実行される比較は、前記出力される特徴ベクトルと前記格納された特徴ベクトル基準セットの各々との間であり、前記比較は、
前記基準セットからの前記特徴ベクトルにより表される前記データエントリセットのデータ型を、前記出力される特徴ベクトルにより表される前記データエントリクエリセットのデータ型と比較するステップと、
前記データ型が異なる場合、数学的比較により前記基準セットから前記特徴ベクトルを除外するステップと、
前記データ型が同じ場合、前記出力される特徴ベクトルと前記基準セットからの前記特徴ベクトルとの間の数学的比較を実行して、類似性値を得るステップと、
を有し、
最大類似性値が得られた特徴ベクトルは、前記最良一致特徴ベクトルである、
請求項3に記載のデータプロパティ認識装置。 - 数値型であるとして認識されたデータエントリ入力セットの前記統計的特徴セットは、
データエントリの数、
最小値、
最大値、
第1の四分位値、
第3の四分位値、
中央値、
平均値、
標準偏差、
分散、
最も繰り返されるデータエントリ、
の中からの2以上を有する、請求項1に記載のデータプロパティ認識装置。 - 文字列型であるとして認識されたデータエントリ入力セットの前記統計的特徴セットは、
データエントリの数、
データエントリのアルファベット、
データエントリ当たりの平均文字数、
データエントリ当たりの平均空白数、
データエントリ当たりの平均ピリオド数、
データエントリ当たりの平均コンマ数、
データエントリ当たりの平均セミコロン数、
最も繰り返されるデータエントリ、
最長共通サブストリング、
ユニークなエントリの割合、
の中からの2以上を有する、請求項1に記載のデータプロパティ認識装置。 - 数値時系列型であるとして認識されたデータ値入力セットの前記統計的特徴セットは、
データ値の数、
エントリの数、
最小数値、
最大数値、
第1の四分位数値、
第3の四分位数値、
中央数値、
数値の平均値、
標準偏差、
分散、
共分散、
歪度、
尖度、
開始日、
終了日、
の中からの2以上を有する、請求項1に記載のデータプロパティ認識装置。 - 前記複数のサポートされるデータ型は、数値、文字列、及び数値時系列型を有する、請求項1に記載のデータプロパティ認識装置。
- 第1のデータソースからの複数のデータエントリモデルセットの指定と更なるデータソースからの複数のデータエントリクエリセットの指定とを、ユーザから受け付けるユーザインタフェースと、
請求項3に記載のデータプロパティ認識装置であって、前記複数のデータエントリモデルセットは前記ユーザにより指定される、データプロパティ認識装置と、
データプロパティリコンシレーションプロセッサであって、前記記憶ユニットに、前記第1のデータソースのコピー及び前記更なるデータソースの各々のコピーを提出するよう構成され、認識されたデータプロパティが前記クエリプロセッサにより出力された前記データエントリクエリセットは、前記個々の認識されたデータプロパティと関連付けて格納される、データプロパティリコンシレーションプロセッサと、
を有するデータセットリコンシレーション装置。 - 複数のデータエントリモデルセットを取得するステップであって、各々の個々のデータエントリモデルセットは、前記データエントリモデルセットに共通の識別されたプロパティを個々に表す複数のデータエントリであり、及び前記データエントリモデルセットに共通のデータ型である、ステップと、
データエントリ入力セットとして前記取得された複数のデータエントリモデルセットの各々について、複数のサポートされるデータ型の中から前記データエントリ入力セットに共通のデータ型を認識し、前記認識したデータ型に依存して前記データエントリ入力セットを表す統計的特徴セットを選択し、前記複数のデータエントリから前記選択された統計的特徴セットの各々の値を生成し、前記生成した統計的特徴の値から成る特徴ベクトルを出力するステップと、
前記取得した複数のデータエントリモデルセットの各々について、前記出力された特徴ベクトルを得て、前記データエントリモデルセットに共通の前記識別されたプロパティと関連付けて前記出力された特徴ベクトルを記憶ユニットに提出するステップと、
前記個々のデータエントリにより共通に表されるプロパティの識別情報が捜し出されるデータエントリクエリセットのために生成された特徴ベクトルと比較するための特徴ベクトル基準セットとして、前記個々の識別されたプロパティと関連付けて前記提出された特徴ベクトルを格納するステップと、
前記特徴ベクトルと前記特徴ベクトルの生成されたデータエントリにより表される前記プロパティの識別情報との間の関連を格納するステップであって、前記関連は前記記憶ユニットに格納された知識モデル又は外部知識モデルへのリンクを表す、ステップと、
を有する方法。 - 前記個々のデータエントリにより共通に表されるプロパティの識別情報が捜し出されるデータエントリクエリセットを得て、複数のサポートされるデータ型の中から前記データエントリクエリセットに共通のデータ型を認識し、前記データエントリクエリセットの前記認識されたデータ型に依存して、データエントリ入力セットを表す統計的特徴セットのうちの1つを選択し、前記データエントリクエリセットから前記選択された統計的特徴セットの各々の値を生成し、前記生成された統計的特徴の値から成る特徴ベクトルを出力するステップであって、前記複数のサポートされるデータ型は、数値型、文字列型、及び数値時系列型を有する、ステップと、
前記データエントリクエリセットについて出力された前記特徴ベクトルと前記格納された特徴ベクトル基準セットとの間の比較を実行して、前記データエントリクエリセットについて出力された前記特徴ベクトルに対して、前記格納された特徴ベクトル基準セットの中で最良一致特徴ベクトルを識別し、前記最良一致特徴ベクトルに関連付けて格納された前記識別されたプロパティを、前記データエントリクエリセットの中の前記個々のデータエントリにより表される認識されたデータプロパティとして認識し、前記認識されたデータプロパティを出力するステップと、
を更に有する請求項12に記載の方法。 - コンピュータプログラムであって、コンピューティング装置により実行されると、前記コンピューティング装置に方法を実行させ、前記方法は、
複数のデータエントリモデルセットを取得するステップであって、各々の個々のデータエントリモデルセットは、前記データエントリモデルセットに共通の識別されたプロパティを個々に表す複数のデータエントリであり、及び前記データエントリモデルセットに共通のデータ型である、ステップと、
データエントリ入力セットとして前記取得された複数のデータエントリモデルセットの各々について、複数のサポートされるデータ型の中から前記データエントリ入力セットに共通のデータ型を認識し、前記認識したデータ型に依存して前記データエントリ入力セットを表す統計的特徴セットを選択し、前記複数のデータエントリセットから前記選択された統計的特徴セットの各々の値を生成し、前記生成した統計的特徴の値から成る特徴ベクトルを出力するステップと、
前記取得した複数のデータエントリモデルセットの各々について、前記出力された特徴ベクトルを得て、前記データエントリモデルセットに共通の前記識別されたプロパティと関連付けて前記出力された特徴ベクトルを記憶ユニットに提出するステップと、
前記個々のデータエントリにより共通に表されるプロパティの識別情報が捜し出されるデータエントリクエリセットのために生成された特徴ベクトルと比較するための特徴ベクトル基準セットとして、前記個々の識別されたプロパティと関連付けて前記提出された特徴ベクトルを格納するステップと、
前記特徴ベクトルと前記特徴ベクトルの生成されたデータエントリにより表される前記プロパティの識別情報との間の関連を格納するステップであって、前記関連は前記記憶ユニットに格納された知識モデル又は外部知識モデルへのリンクを表す、ステップと、
を有する、コンピュータプログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102016220771 | 2016-10-21 | ||
DE102016220771.7 | 2016-10-21 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018067279A JP2018067279A (ja) | 2018-04-26 |
JP7100422B2 true JP7100422B2 (ja) | 2022-07-13 |
Family
ID=57708417
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016233527A Active JP7100422B2 (ja) | 2016-10-21 | 2016-11-30 | データプロパティ認識のための装置、プログラム、及び方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US10430440B2 (ja) |
EP (1) | EP3312778A1 (ja) |
JP (1) | JP7100422B2 (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10803034B2 (en) * | 2016-11-23 | 2020-10-13 | Amazon Technologies, Inc. | Global column indexing in a graph database |
EP3407206B1 (en) | 2017-05-22 | 2021-08-04 | Fujitsu Limited | Reconciled data storage system |
EP3407207A1 (en) | 2017-05-22 | 2018-11-28 | Fujitsu Limited | System, method, and program for reconciling input datasets with a model ontology |
US11474978B2 (en) * | 2018-07-06 | 2022-10-18 | Capital One Services, Llc | Systems and methods for a data search engine based on data profiles |
US11068259B2 (en) | 2019-01-04 | 2021-07-20 | T-Mobile Usa, Inc. | Microservice-based dynamic content rendering |
US10983767B2 (en) * | 2019-01-04 | 2021-04-20 | T-Mobile Usa, Inc. | Microservice-based software development |
CN110298743A (zh) * | 2019-06-21 | 2019-10-01 | 深圳前海微众银行股份有限公司 | 车辆质押物状态预警方法、装置、设备及存储介质 |
CN111580890A (zh) * | 2020-05-18 | 2020-08-25 | 北京字节跳动网络技术有限公司 | 用于处理特征的方法、装置、电子设备和计算机可读介质 |
CN114741381B (zh) * | 2022-04-14 | 2023-04-14 | 郑州轻工业大学 | 基于关联依赖的数据清洗方法 |
CN116029571B (zh) * | 2023-03-29 | 2023-06-16 | 肯特智能技术(深圳)股份有限公司 | 基于元宇宙的数据处理方法及相关装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080208855A1 (en) | 2007-02-27 | 2008-08-28 | Christoph Lingenfelder | Method for mapping a data source to a data target |
JP2013541754A (ja) | 2010-09-14 | 2013-11-14 | インターナショナル・ビジネス・マシーンズ・コーポレーション | データ・セットを取り扱うための方法及び構成、データ処理プログラム及びコンピュータ・プログラム製品 |
US20140337358A1 (en) | 2013-05-09 | 2014-11-13 | Microsoft Corporation | Inferring entity attribute values |
WO2016049437A1 (en) | 2014-09-26 | 2016-03-31 | Oracle International Corporation | Techniques for similarity analysis and data enrichment using knowledge sources |
Family Cites Families (72)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR111574A (ja) | 1973-12-13 | 1900-01-01 | ||
US6990453B2 (en) | 2000-07-31 | 2006-01-24 | Landmark Digital Services Llc | System and methods for recognizing sound and music signals in high noise and distortion |
BR0309598A (pt) | 2002-04-25 | 2005-02-09 | Shazam Entertainment Ltd | Método para a caracterização de um relacionamento entre uma primeira e uma segunda amostras de áudio, produto de programa de computador e sistema de computador |
US20040006559A1 (en) | 2002-05-29 | 2004-01-08 | Gange David M. | System, apparatus, and method for user tunable and selectable searching of a database using a weigthted quantized feature vector |
US6961736B1 (en) | 2002-05-31 | 2005-11-01 | Adobe Systems Incorporated | Compact color feature vector representation |
US7081579B2 (en) | 2002-10-03 | 2006-07-25 | Polyphonic Human Media Interface, S.L. | Method and system for music recommendation |
US20060013451A1 (en) | 2002-11-01 | 2006-01-19 | Koninklijke Philips Electronics, N.V. | Audio data fingerprint searching |
US8005919B2 (en) | 2002-11-18 | 2011-08-23 | Aol Inc. | Host-based intelligent results related to a character stream |
US20050060350A1 (en) | 2003-09-15 | 2005-03-17 | Baum Zachariah Journey | System and method for recommendation of media segments |
TW594510B (en) | 2003-11-05 | 2004-06-21 | Ind Tech Res Inst | Method and system of automatic service composition |
US7433835B2 (en) | 2004-01-27 | 2008-10-07 | Amazon Technologies, Inc. | Providing a marketplace for web services |
US7797198B1 (en) | 2004-01-27 | 2010-09-14 | Amazon Technologies, Inc. | Providing an invocable composite network service based on multiple other invocable constituent network services |
US7558822B2 (en) | 2004-06-30 | 2009-07-07 | Google Inc. | Accelerating user interfaces by predicting user actions |
US7823123B2 (en) | 2004-07-13 | 2010-10-26 | The Mitre Corporation | Semantic system for integrating software components |
US7324976B2 (en) | 2004-07-19 | 2008-01-29 | Amazon Technologies, Inc. | Automatic authorization of programmatic transactions |
JP4476786B2 (ja) | 2004-11-10 | 2010-06-09 | 株式会社東芝 | 検索装置 |
US8195693B2 (en) | 2004-12-16 | 2012-06-05 | International Business Machines Corporation | Automatic composition of services through semantic attribute matching |
US7734515B1 (en) | 2005-08-17 | 2010-06-08 | Amazon Technologies, Inc. | Generating new invocable composite network services based on multiple other invocable constituent network services |
US7949529B2 (en) | 2005-08-29 | 2011-05-24 | Voicebox Technologies, Inc. | Mobile systems and methods of supporting natural language human-machine interactions |
WO2008015417A1 (en) | 2006-07-31 | 2008-02-07 | British Telecommunications Public Limited Company | Automatic composition of web services based on syntactiv and semantic rules |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US8312426B2 (en) | 2008-01-07 | 2012-11-13 | International Business Machines Corporation | Method and system for simplified service composition in web environment |
CN101262374A (zh) | 2008-04-22 | 2008-09-10 | 北京邮电大学 | 一种服务注册的方法和装置 |
US8344233B2 (en) | 2008-05-07 | 2013-01-01 | Microsoft Corporation | Scalable music recommendation by search |
US8660924B2 (en) | 2009-04-30 | 2014-02-25 | Navera, Inc. | Configurable interactive assistant |
US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
WO2011096728A2 (en) | 2010-02-03 | 2011-08-11 | Samsung Life Public Welfare Foundation | Method for proliferating stem cells by activating c-met/hgf signaling and notch signaling |
US8391590B2 (en) | 2010-03-04 | 2013-03-05 | Flashscan3D, Llc | System and method for three-dimensional biometric data feature detection and recognition |
US8386929B2 (en) | 2010-06-22 | 2013-02-26 | Microsoft Corporation | Personal assistant for task utilization |
CN102385858B (zh) | 2010-08-31 | 2013-06-05 | 国际商业机器公司 | 情感语音合成方法和系统 |
KR20120052610A (ko) | 2010-11-16 | 2012-05-24 | 삼성전자주식회사 | 신경망 학습을 통한 동작 인식 방법 및 장치 |
US9064006B2 (en) | 2012-08-23 | 2015-06-23 | Microsoft Technology Licensing, Llc | Translating natural language utterances to keyword search queries |
US9146917B2 (en) | 2011-07-15 | 2015-09-29 | International Business Machines Corporation | Validating that a user is human |
MX2012011426A (es) | 2011-09-30 | 2013-04-01 | Apple Inc | Utilizar informacion de contexto para facilitar el procesamiento de comandos en un asistente virtual. |
US8655989B2 (en) | 2011-10-14 | 2014-02-18 | Sap Ag | Business network access protocol for the business network |
KR101910576B1 (ko) | 2011-11-08 | 2018-12-31 | 삼성전자주식회사 | 인공신경망을 이용하여 신속하게 입력 패턴을 분류하는 방법 및 장치 |
KR101912165B1 (ko) | 2011-12-09 | 2018-10-29 | 삼성전자주식회사 | 스파이킹 뉴런 기반 작업 기억 장치 |
US8788269B2 (en) | 2011-12-15 | 2014-07-22 | Microsoft Corporation | Satisfying specified intent(s) based on multimodal request(s) |
US9177168B2 (en) | 2012-03-19 | 2015-11-03 | Alcatel Lucent | Method of modifying access control for web services using query languages |
US10417037B2 (en) | 2012-05-15 | 2019-09-17 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
EP2704029A1 (en) | 2012-09-03 | 2014-03-05 | Agfa Healthcare | Semantic data warehouse |
EP2736042A1 (en) | 2012-11-23 | 2014-05-28 | Samsung Electronics Co., Ltd | Apparatus and method for constructing multilingual acoustic model and computer readable recording medium for storing program for performing the method |
KR20140066640A (ko) | 2012-11-23 | 2014-06-02 | 삼성전자주식회사 | 다국어 음향 모델 구축 장치 및 이의 다국어 음향 모델 구축 방법, 그리고 그 방법을 수행하는 프로그램이 기록된 컴퓨터 판독 가능 매체 |
US20140201629A1 (en) | 2013-01-17 | 2014-07-17 | Microsoft Corporation | Collaborative learning through user generated knowledge |
IN2013CH00359A (ja) | 2013-01-28 | 2015-08-07 | Samsung R & D Inst India Bangalore Private Ltd | |
US9268617B1 (en) | 2013-03-11 | 2016-02-23 | Ca, Inc. | Bus-based dynamic evaluation with dynamic data lookups |
US11470036B2 (en) | 2013-03-14 | 2022-10-11 | Microsoft Technology Licensing, Llc | Email assistant for efficiently managing emails |
US9031933B2 (en) | 2013-04-03 | 2015-05-12 | International Business Machines Corporation | Method and apparatus for optimizing the evaluation of semantic web queries |
US9081411B2 (en) | 2013-05-10 | 2015-07-14 | Sri International | Rapid development of virtual personal assistant applications |
US9491063B2 (en) | 2013-05-15 | 2016-11-08 | Telefonaktiebolaget Lm Ericsson (Publ) | Method and apparatus for providing network services orchestration |
US9607612B2 (en) | 2013-05-20 | 2017-03-28 | Intel Corporation | Natural human-computer interaction for virtual personal assistant systems |
KR101922663B1 (ko) | 2013-06-09 | 2018-11-28 | 애플 인크. | 디지털 어시스턴트의 둘 이상의 인스턴스들에 걸친 대화 지속성을 가능하게 하기 위한 디바이스, 방법 및 그래픽 사용자 인터페이스 |
US9299331B1 (en) | 2013-12-11 | 2016-03-29 | Amazon Technologies, Inc. | Techniques for selecting musical content for playback |
EP2894587B1 (en) | 2014-01-09 | 2019-01-09 | Fujitsu Limited | Stored data access controller |
US10721312B2 (en) | 2014-02-23 | 2020-07-21 | Intel Corporation | Orchestration and management of services to deployed devices |
US9473944B2 (en) | 2014-02-24 | 2016-10-18 | Microsoft Technology Licensing, Llc | Local personal daemon |
US9984158B2 (en) | 2014-03-18 | 2018-05-29 | Axis Ab | Finding services in a service-oriented architecture (SOA) network |
US9705995B2 (en) | 2014-03-18 | 2017-07-11 | Axis Ab | Capability monitoring in a service oriented architecture |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
US20160044380A1 (en) | 2014-06-12 | 2016-02-11 | Bertrand Barrett | Personal helper bot system |
US10374910B2 (en) | 2014-06-13 | 2019-08-06 | Convida Wireless, Llc | Automated service profiling and orchestration |
US10659851B2 (en) | 2014-06-30 | 2020-05-19 | Apple Inc. | Real-time digital assistant knowledge updates |
EP2977918A1 (en) | 2014-07-24 | 2016-01-27 | Tata Consultancy Services Limited | A system and method for executing a sparql query |
KR102239714B1 (ko) | 2014-07-24 | 2021-04-13 | 삼성전자주식회사 | 신경망 학습 방법 및 장치, 데이터 처리 장치 |
US9836701B2 (en) | 2014-08-13 | 2017-12-05 | Microsoft Technology Licensing, Llc | Distributed stage-wise parallel machine learning |
US10446141B2 (en) | 2014-08-28 | 2019-10-15 | Apple Inc. | Automatic speech recognition based on user feedback |
US20160063874A1 (en) | 2014-08-28 | 2016-03-03 | Microsoft Corporation | Emotionally intelligent systems |
US10698585B2 (en) | 2014-08-29 | 2020-06-30 | Nuance Communications, Inc. | Virtual assistant development system |
US20160070580A1 (en) | 2014-09-09 | 2016-03-10 | Microsoft Technology Licensing, Llc | Digital personal assistant remote invocation |
CN104202416A (zh) | 2014-09-16 | 2014-12-10 | 浪潮(北京)电子信息产业有限公司 | 一种云操作系统下的服务编排系统及方法 |
US10152558B2 (en) | 2014-12-23 | 2018-12-11 | Intel Corporation | Graph operations |
CN105357143B (zh) | 2015-11-27 | 2019-10-01 | 华为技术有限公司 | 一种转发方法及服务路由中继节点 |
-
2016
- 2016-11-30 JP JP2016233527A patent/JP7100422B2/ja active Active
- 2016-12-23 EP EP16206620.3A patent/EP3312778A1/en not_active Ceased
-
2017
- 2017-08-17 US US15/679,296 patent/US10430440B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080208855A1 (en) | 2007-02-27 | 2008-08-28 | Christoph Lingenfelder | Method for mapping a data source to a data target |
JP2013541754A (ja) | 2010-09-14 | 2013-11-14 | インターナショナル・ビジネス・マシーンズ・コーポレーション | データ・セットを取り扱うための方法及び構成、データ処理プログラム及びコンピュータ・プログラム製品 |
US20140337358A1 (en) | 2013-05-09 | 2014-11-13 | Microsoft Corporation | Inferring entity attribute values |
WO2016049437A1 (en) | 2014-09-26 | 2016-03-31 | Oracle International Corporation | Techniques for similarity analysis and data enrichment using knowledge sources |
Also Published As
Publication number | Publication date |
---|---|
EP3312778A1 (en) | 2018-04-25 |
JP2018067279A (ja) | 2018-04-26 |
US10430440B2 (en) | 2019-10-01 |
US20180113926A1 (en) | 2018-04-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7100422B2 (ja) | データプロパティ認識のための装置、プログラム、及び方法 | |
Lawrence | Integration and virtualization of relational SQL and NoSQL systems including MySQL and MongoDB | |
JP6787087B2 (ja) | データプロパティ認識のための装置、方法及びプログラム | |
CN112037920A (zh) | 医疗知识图谱构建方法、装置、设备及存储介质 | |
US11775859B2 (en) | Generating feature vectors from RDF graphs | |
US9785725B2 (en) | Method and system for visualizing relational data as RDF graphs with interactive response time | |
Hai et al. | Query rewriting for heterogeneous data lakes | |
Spoth et al. | Adaptive schema databases | |
CN112687364B (zh) | 一种基于Hbase的医疗数据管理方法及其系统 | |
JP2018198045A (ja) | 自然言語処理イベントの生成のための装置および方法 | |
Banane et al. | SPARQL2Hive: An approach to processing SPARQL queries on Hive based on meta-models | |
Newman et al. | Scalable Semantics–the Silver Lining of Cloud Computing | |
WO2014161201A1 (en) | Keyword search on databases | |
Glavic et al. | The perm provenance management system in action | |
KR102345410B1 (ko) | 빅데이터 지능형 수집 방법 및 장치 | |
US20210294813A1 (en) | Automated extract, transform, and load process | |
Satti et al. | Semantic bridge for resolving healthcare data interoperability | |
US10896227B2 (en) | Data processing system, data processing method, and data structure | |
Ulrich et al. | Using Graph Tools on Metadata Repositories. | |
Leeka et al. | RQ-RDF-3X: going beyond triplestores | |
Sazontev et al. | An extensible approach for materialized big data integration in distributed computation environments | |
Paneva-Marinova et al. | Intelligent Data Curation in Virtual Museum for Ancient History and Civilization | |
US10977284B2 (en) | Text search of database with one-pass indexing including filtering | |
Ramulu et al. | A Read and Write Enhanced Platform-R2R Ingression for RDF-to-RDB | |
Valêncio et al. | A system proposal for automated data cleaning environment |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170804 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190807 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200422 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200512 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200710 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20201027 |
|
C60 | Trial request (containing other claim documents, opposition documents) |
Free format text: JAPANESE INTERMEDIATE CODE: C60 Effective date: 20210127 |
|
C22 | Notice of designation (change) of administrative judge |
Free format text: JAPANESE INTERMEDIATE CODE: C22 Effective date: 20210803 |
|
C22 | Notice of designation (change) of administrative judge |
Free format text: JAPANESE INTERMEDIATE CODE: C22 Effective date: 20220412 |
|
C22 | Notice of designation (change) of administrative judge |
Free format text: JAPANESE INTERMEDIATE CODE: C22 Effective date: 20220510 |
|
C23 | Notice of termination of proceedings |
Free format text: JAPANESE INTERMEDIATE CODE: C23 Effective date: 20220517 |
|
C03 | Trial/appeal decision taken |
Free format text: JAPANESE INTERMEDIATE CODE: C03 Effective date: 20220614 |
|
C30A | Notification sent |
Free format text: JAPANESE INTERMEDIATE CODE: C3012 Effective date: 20220614 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220701 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7100422 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |