JP2023533453A - データ抽出のためのマルチステージデータスニッファ - Google Patents
データ抽出のためのマルチステージデータスニッファ Download PDFInfo
- Publication number
- JP2023533453A JP2023533453A JP2022579820A JP2022579820A JP2023533453A JP 2023533453 A JP2023533453 A JP 2023533453A JP 2022579820 A JP2022579820 A JP 2022579820A JP 2022579820 A JP2022579820 A JP 2022579820A JP 2023533453 A JP2023533453 A JP 2023533453A
- Authority
- JP
- Japan
- Prior art keywords
- data
- stage
- sniffer
- file
- instance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013075 data extraction Methods 0.000 title description 13
- 239000000284 extract Substances 0.000 claims abstract description 22
- 238000000034 method Methods 0.000 claims description 60
- 238000012545 processing Methods 0.000 claims description 21
- 230000004044 response Effects 0.000 claims description 14
- 230000004931 aggregating effect Effects 0.000 claims description 2
- 230000008569 process Effects 0.000 description 17
- 238000012795 verification Methods 0.000 description 14
- 230000008859 change Effects 0.000 description 7
- 238000013500 data storage Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000008676 import Effects 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000010200 validation analysis Methods 0.000 description 3
- 230000004075 alteration Effects 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 230000007717 exclusion Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 238000013501 data transformation Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
- G06F16/254—Extract, transform and load [ETL] procedures, e.g. ETL data flows in data warehouses
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/11—File system administration, e.g. details of archiving or snapshots
- G06F16/116—Details of conversion of file system types or formats
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
- G06F16/258—Data format conversion from or to a database
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/04—Real-time or near real-time messaging, e.g. instant messaging [IM]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/55—Push-based network services
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/12—Messaging; Mailboxes; Announcements
- H04W4/14—Short messaging services, e.g. short message services [SMS] or unstructured supplementary service data [USSD]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
以下に、上記実施形態から把握できる技術思想を付記として記載する。
[付記1]
マルチステージデータスニッファインスタンスを備える機械実行可能命令を有する非一時的機械可読媒体であって、前記マルチステージデータスニッファインスタンスは、
所与のファイルの選択されたフォーマットに関する設定ファイルに基づいて、前記所与のファイルを一組のデータフィールドに関してスキャンする第1ステージと、
前記選択されたフォーマットに関する前記一組のデータフィールド内の各データフィールド内の値を評価して、前記一組のデータフィールド内の値の有効性を判定する第2ステージと、
前記所与のファイルの前記一組のデータフィールド内のデータを抽出し、前記設定ファイルにおいて定義された所定の一組のルールに基づいてデータを統合し、統合されたデータを特徴付けるデータマートデータベースにデータを出力する第3ステージと、を含む、非一時的機械可読媒体。
[付記2]
前記データマートデータベース内のコンテンツに基づいてダッシュボードおよび/またはチャートを生成するグラフィカルユーザインタフェース(GUI)ジェネレータをさらに備える、付記1に記載の非一時的機械可読媒体。
[付記3]
前記マルチステージデータスニッファインスタンスの前記第2ステージは、前記一組のデータフィールド内の少なくとも1つのデータフィールドが欠落していることを検出したことに応答してエラーメッセージを生成する、付記1に記載の非一時的機械可読媒体。
[付記4]
前記エラーメッセージは、電子メール、プッシュ通知、およびショートメッセージサービス(SMS)メッセージのうちの1つまたは複数を介した連絡先への通知において提供される、付記3に記載の非一時的機械可読媒体。
[付記5]
前記マルチステージデータスニッファインスタンスは、前記所与のファイルのファイル名に基づいて、所定の場所における前記所与のファイルに関する前記選択されたフォーマットを識別するマルチステージデータスニッファのコンポーネントである、付記1に記載の非一時的機械可読媒体。
[付記6]
前記所定の場所は、前記設定ファイルに基づく、付記5に記載の非一時的機械可読媒体。
[付記7]
前記選択されたフォーマットは、前記設定ファイルにおいて定義された複数のフォーマットから選択される、付記5に記載の非一時的機械可読媒体。
[付記8]
前記マルチステージデータスニッファインスタンスは、バルクデータスニッファインスタンスをインスタンス化するマルチステージデータスニッファのコンポーネントであり、前記バルクデータスニッファインスタンスは、ソースデータベースからデータを抽出し、前記設定ファイルにおいて定義された前記所定の一組のルールに基づいて抽出データを統合するエージェントを含む、付記1に記載の非一時的機械可読媒体。
[付記9]
データを抽出するためのシステムであって、
機械実行可能命令を有する非一時的メモリと、
前記非一時的メモリにアクセスし、前記機械実行可能命令を実行するための処理ユニットと、を備え、前記機械実行可能命令は、複数のマルチステージデータスニッファインスタンスを並列に実行するマルチステージデータスニッファを備え、各マルチステージデータスニッファインスタンスは、
所定の場所から抽出された所与のファイルを、前記所与のファイルの選択されたフォーマットを定義する設定ファイルに基づいて、一組のデータフィールド内の必要なデータフィールドおよび任意選択のデータフィールドに関してスキャンする第1ステージと、
前記選択されたフォーマットに関する前記一組のデータフィールド内の各データフィールド内の値を評価して、前記一組のデータフィールド内の値の有効性を判定する第2ステージと、
前記所与のファイルの複数のフィールド内のデータを抽出し、前記設定ファイルにおいて定義された所定の一組のルールに基づいてデータを統合し、統合されたデータを特徴付けるデータマートデータベースにデータを出力する第3ステージと、を含む、システム。
[付記10]
前記データマートデータベース内のコンテンツに基づいてダッシュボードおよび/またはチャートを生成するグラフィカルユーザインタフェース(GUI)ジェネレータをさらに備える、付記9に記載のシステム。
[付記11]
各マルチステージデータスニッファインスタンスの前記第2ステージは、前記一組のデータフィールド内の少なくとも1つのデータフィールドが欠落していることを検出したことに応答してエラーメッセージを生成する、付記9に記載のシステム。
[付記12]
前記エラーメッセージは、電子メール、プッシュ通知、およびショートメッセージサービス(SMS)メッセージのうちの1つまたは複数を介して連絡先への通知において提供される、付記11に記載のシステム。
[付記13]
前記マルチステージデータスニッファは、前記所与のファイルのファイル名に基づいて、所定の場所における前記所与のファイルに関する前記選択されたフォーマットを識別する、付記9に記載のシステム。
[付記14]
前記所定の場所は、前記設定ファイルに基づく、付記13に記載のシステム。
[付記15]
前記選択されたフォーマットは、前記設定ファイルにおいて定義された複数のフォーマットから選択される、付記14に記載のシステム。
[付記16]
前記マルチステージデータスニッファは、ソースデータベースからデータを抽出するとともに、前記設定ファイルにおいて定義された前記所定の一組のルールに基づいて抽出データを統合するエージェントを含むバルクデータスニッファインスタンスをインスタンス化する、付記9に記載のシステム。
[付記17]
データを抽出するための方法であって、
コンピューティングプラットフォーム上で実行されるマルチステージデータスニッファが、複数のマルチステージデータスニッファインスタンスを並列に実行するステップを含み、各マルチステージデータスニッファインスタンスは、
所定の場所から抽出された所与のファイルを、前記所与のファイルの選択されたフォーマットを定義する設定ファイルに基づいて、一組のデータフィールド内の必要なデータフィールドおよび任意選択のデータフィールドに関してスキャンするステップと、
前記選択されたフォーマットに関する前記一組のデータフィールド内の各データフィールド内の値を検証して、前記一組のデータフィールド内の値の有効性を判定するステップと、
前記所与のファイルの複数のフィールド内のデータを抽出するステップと、
前記設定ファイルにおいて定義された所定の一組のルールに基づいて前記データを統合するステップと、
統合されたデータを特徴付けるデータマートデータベースにデータを出力するステップと、を含むサブメソッドを実行する、方法。
[付記18]
前記データマートデータベースのコンテンツに基づいて、ダッシュボードおよび/またはチャートを生成するステップをさらに含む、付記17に記載の方法。
[付記19]
前記複数のマルチステージデータスニッファインスタンスと並列に、ソースデータベースから抽出されたデータを用いて前記データマートデータベースを拡張するバルクデータスニッファインスタンスを実行するステップをさらに含む、付記17に記載の方法。
[付記20]
各サブメソッドに関して前記選択されたフォーマットが、個々の所与のファイルのファイル名に基づいて選択される、付記17に記載の方法。
Claims (20)
- マルチステージデータスニッファインスタンスを備える機械実行可能命令を有する非一時的機械可読媒体であって、前記マルチステージデータスニッファインスタンスは、
所与のファイルの選択されたフォーマットに関する設定ファイルに基づいて、前記所与のファイルを一組のデータフィールドに関してスキャンする第1ステージと、
前記選択されたフォーマットに関する前記一組のデータフィールド内の各データフィールド内の値を評価して、前記一組のデータフィールド内の値の有効性を判定する第2ステージと、
前記所与のファイルの前記一組のデータフィールド内のデータを抽出し、前記設定ファイルにおいて定義された所定の一組のルールに基づいてデータを統合し、統合されたデータを特徴付けるデータマートデータベースにデータを出力する第3ステージと、を含む、非一時的機械可読媒体。 - 前記データマートデータベース内のコンテンツに基づいてダッシュボードおよび/またはチャートを生成するグラフィカルユーザインタフェース(GUI)ジェネレータをさらに備える、請求項1に記載の非一時的機械可読媒体。
- 前記マルチステージデータスニッファインスタンスの前記第2ステージは、前記一組のデータフィールド内の少なくとも1つのデータフィールドが欠落していることを検出したことに応答してエラーメッセージを生成する、請求項1に記載の非一時的機械可読媒体。
- 前記エラーメッセージは、電子メール、プッシュ通知、およびショートメッセージサービス(SMS)メッセージのうちの1つまたは複数を介した連絡先への通知において提供される、請求項3に記載の非一時的機械可読媒体。
- 前記マルチステージデータスニッファインスタンスは、前記所与のファイルのファイル名に基づいて、所定の場所における前記所与のファイルに関する前記選択されたフォーマットを識別するマルチステージデータスニッファのコンポーネントである、請求項1に記載の非一時的機械可読媒体。
- 前記所定の場所は、前記設定ファイルに基づく、請求項5に記載の非一時的機械可読媒体。
- 前記選択されたフォーマットは、前記設定ファイルにおいて定義された複数のフォーマットから選択される、請求項5に記載の非一時的機械可読媒体。
- 前記マルチステージデータスニッファインスタンスは、バルクデータスニッファインスタンスをインスタンス化するマルチステージデータスニッファのコンポーネントであり、前記バルクデータスニッファインスタンスは、ソースデータベースからデータを抽出し、前記設定ファイルにおいて定義された前記所定の一組のルールに基づいて抽出データを統合するエージェントを含む、請求項1に記載の非一時的機械可読媒体。
- データを抽出するためのシステムであって、
機械実行可能命令を有する非一時的メモリと、
前記非一時的メモリにアクセスし、前記機械実行可能命令を実行するための処理ユニットと、を備え、前記機械実行可能命令は、複数のマルチステージデータスニッファインスタンスを並列に実行するマルチステージデータスニッファを備え、各マルチステージデータスニッファインスタンスは、
所定の場所から抽出された所与のファイルを、前記所与のファイルの選択されたフォーマットを定義する設定ファイルに基づいて、一組のデータフィールド内の必要なデータフィールドおよび任意選択のデータフィールドに関してスキャンする第1ステージと、
前記選択されたフォーマットに関する前記一組のデータフィールド内の各データフィールド内の値を評価して、前記一組のデータフィールド内の値の有効性を判定する第2ステージと、
前記所与のファイルの複数のフィールド内のデータを抽出し、前記設定ファイルにおいて定義された所定の一組のルールに基づいてデータを統合し、統合されたデータを特徴付けるデータマートデータベースにデータを出力する第3ステージと、を含む、システム。 - 前記データマートデータベース内のコンテンツに基づいてダッシュボードおよび/またはチャートを生成するグラフィカルユーザインタフェース(GUI)ジェネレータをさらに備える、請求項9に記載のシステム。
- 各マルチステージデータスニッファインスタンスの前記第2ステージは、前記一組のデータフィールド内の少なくとも1つのデータフィールドが欠落していることを検出したことに応答してエラーメッセージを生成する、請求項9に記載のシステム。
- 前記エラーメッセージは、電子メール、プッシュ通知、およびショートメッセージサービス(SMS)メッセージのうちの1つまたは複数を介して連絡先への通知において提供される、請求項11に記載のシステム。
- 前記マルチステージデータスニッファは、前記所与のファイルのファイル名に基づいて、所定の場所における前記所与のファイルに関する前記選択されたフォーマットを識別する、請求項9に記載のシステム。
- 前記所定の場所は、前記設定ファイルに基づく、請求項13に記載のシステム。
- 前記選択されたフォーマットは、前記設定ファイルにおいて定義された複数のフォーマットから選択される、請求項14に記載のシステム。
- 前記マルチステージデータスニッファは、ソースデータベースからデータを抽出するとともに、前記設定ファイルにおいて定義された前記所定の一組のルールに基づいて抽出データを統合するエージェントを含むバルクデータスニッファインスタンスをインスタンス化する、請求項9に記載のシステム。
- データを抽出するための方法であって、
コンピューティングプラットフォーム上で実行されるマルチステージデータスニッファが、複数のマルチステージデータスニッファインスタンスを並列に実行するステップを含み、各マルチステージデータスニッファインスタンスは、
所定の場所から抽出された所与のファイルを、前記所与のファイルの選択されたフォーマットを定義する設定ファイルに基づいて、一組のデータフィールド内の必要なデータフィールドおよび任意選択のデータフィールドに関してスキャンするステップと、
前記選択されたフォーマットに関する前記一組のデータフィールド内の各データフィールド内の値を検証して、前記一組のデータフィールド内の値の有効性を判定するステップと、
前記所与のファイルの複数のフィールド内のデータを抽出するステップと、
前記設定ファイルにおいて定義された所定の一組のルールに基づいて前記データを統合するステップと、
統合されたデータを特徴付けるデータマートデータベースにデータを出力するステップと、を含むサブメソッドを実行する、方法。 - 前記データマートデータベースのコンテンツに基づいて、ダッシュボードおよび/またはチャートを生成するステップをさらに含む、請求項17に記載の方法。
- 前記複数のマルチステージデータスニッファインスタンスと並列に、ソースデータベースから抽出されたデータを用いて前記データマートデータベースを拡張するバルクデータスニッファインスタンスを実行するステップをさらに含む、請求項17に記載の方法。
- 各サブメソッドに関して前記選択されたフォーマットが、個々の所与のファイルのファイル名に基づいて選択される、請求項17に記載の方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US16/925,118 US11314765B2 (en) | 2020-07-09 | 2020-07-09 | Multistage data sniffer for data extraction |
US16/925,118 | 2020-07-09 | ||
PCT/US2021/034703 WO2022010590A1 (en) | 2020-07-09 | 2021-05-28 | Multistage data sniffer for data extraction |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2023533453A true JP2023533453A (ja) | 2023-08-03 |
Family
ID=76502892
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022579820A Pending JP2023533453A (ja) | 2020-07-09 | 2021-05-28 | データ抽出のためのマルチステージデータスニッファ |
Country Status (4)
Country | Link |
---|---|
US (1) | US11314765B2 (ja) |
EP (1) | EP4179431A1 (ja) |
JP (1) | JP2023533453A (ja) |
WO (1) | WO2022010590A1 (ja) |
Family Cites Families (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5560005A (en) | 1994-02-25 | 1996-09-24 | Actamed Corp. | Methods and systems for object-based relational distributed databases |
AU707240B2 (en) | 1994-09-21 | 1999-07-08 | Intellectual Ventures Fund 83 Llc | A link manager for managing links integrating data between application programs |
US6199068B1 (en) | 1997-09-11 | 2001-03-06 | Abb Power T&D Company Inc. | Mapping interface for a distributed server to translate between dissimilar file formats |
GB2354850B (en) | 1999-09-29 | 2002-01-09 | Ibm | Data processing with reuse of existing message structure to allow access to distribution list |
US7076541B1 (en) | 2000-06-05 | 2006-07-11 | Register.Com, Inc. | Method and apparatus providing distributed domain management capabilities |
US7284008B2 (en) | 2000-08-30 | 2007-10-16 | Kontera Technologies, Inc. | Dynamic document context mark-up technique implemented over a computer network |
US7260777B2 (en) | 2001-08-17 | 2007-08-21 | Desknet Inc. | Apparatus, method and system for transforming data |
GB0107882D0 (en) | 2001-03-29 | 2001-05-23 | Ibm | Parsing messages with multiple data formats |
US20030208493A1 (en) | 2002-04-12 | 2003-11-06 | Hall Bradley S. | Object relational database management system |
EP2463627B1 (en) | 2002-04-30 | 2017-07-19 | Intel Corporation | Navigation system using corridor maps |
US7325042B1 (en) | 2002-06-24 | 2008-01-29 | Microsoft Corporation | Systems and methods to manage information pulls |
US7302678B2 (en) | 2003-09-10 | 2007-11-27 | Sap Aktiengesellschaft | Symmetric transformation processing system |
US20050108206A1 (en) | 2003-11-14 | 2005-05-19 | Microsoft Corporation | System and method for object-oriented interaction with heterogeneous data stores |
US20060143220A1 (en) | 2003-12-31 | 2006-06-29 | Spencer Herman Jr | Software application framework using meta-data defined object definitions |
US20050216917A1 (en) | 2004-03-23 | 2005-09-29 | Srivatsa Krishnaswamy | Method and system for data object transformation |
US20060090155A1 (en) | 2004-10-12 | 2006-04-27 | Gurevich Michael N | Methods and apparatus for message oriented invocation |
US7979405B2 (en) | 2005-01-14 | 2011-07-12 | Microsoft Corporation | Method for automatically associating data with a document based on a prescribed type of the document |
GB0514191D0 (en) | 2005-07-12 | 2005-08-17 | Ibm | Methods, apparatus and computer programs for optimized parsing and service invocation |
JP4997749B2 (ja) | 2005-12-07 | 2012-08-08 | 富士ゼロックス株式会社 | 文書処理方法、プログラム及びシステム |
GB0613178D0 (en) | 2006-07-01 | 2006-08-09 | Ibm | An apparatus for deferred handling of a message |
US20080033968A1 (en) | 2006-08-07 | 2008-02-07 | Quan Dennis A | Methods and apparatus for input specialization |
US20080071735A1 (en) | 2006-09-05 | 2008-03-20 | International Business Machines Corporation | Method, apparatus, and computer progam product for data transformation |
US20100211539A1 (en) * | 2008-06-05 | 2010-08-19 | Ho Luy | System and method for building a data warehouse |
US9514205B1 (en) | 2015-09-04 | 2016-12-06 | Palantir Technologies Inc. | Systems and methods for importing data from electronic data files |
US11321339B2 (en) * | 2017-05-05 | 2022-05-03 | Thoughtspot, Inc. | Data integration for distributed and massively parallel processing environments |
US11042562B2 (en) * | 2019-10-11 | 2021-06-22 | Sap Se | Scalable data extractor |
US20210152650A1 (en) * | 2019-11-18 | 2021-05-20 | Salesforce.Com, Inc. | Extraction of data from secure data sources to a multi-tenant cloud system |
EP4081910A4 (en) * | 2019-12-24 | 2024-01-10 | Consilient Labs Inc | EPISODIC MEMORY REFERENCES, DATA INGESTION AND RELATED QUERY SYSTEMS, INCLUDING EXAMPLES OF AUTONOMOUS INTELLIGENT AGENTS |
-
2020
- 2020-07-09 US US16/925,118 patent/US11314765B2/en active Active
-
2021
- 2021-05-28 JP JP2022579820A patent/JP2023533453A/ja active Pending
- 2021-05-28 EP EP21733346.7A patent/EP4179431A1/en active Pending
- 2021-05-28 WO PCT/US2021/034703 patent/WO2022010590A1/en unknown
Also Published As
Publication number | Publication date |
---|---|
EP4179431A1 (en) | 2023-05-17 |
US11314765B2 (en) | 2022-04-26 |
US20220012260A1 (en) | 2022-01-13 |
WO2022010590A1 (en) | 2022-01-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11256852B2 (en) | Converting portions of documents between structured and unstructured data formats to improve computing efficiency and schema flexibility | |
US8886648B1 (en) | System and method for computation of document similarity | |
US6631382B1 (en) | Data retrieval method and apparatus with multiple source capability | |
US7562088B2 (en) | Structure extraction from unstructured documents | |
US9047346B2 (en) | Reporting language filtering and mapping to dimensional concepts | |
US7739309B2 (en) | Method, system, and computer-readable medium for merging data from multiple data sources for use in an electronic document | |
US11972201B2 (en) | Facilitating auto-completion of electronic forms with hierarchical entity data models | |
US8429740B2 (en) | Search result presentation | |
US20170322930A1 (en) | Document based query and information retrieval systems and methods | |
US10671671B2 (en) | Supporting tuples in log-based representations of graph databases | |
US9740698B2 (en) | Document merge based on knowledge of document schema | |
US6915303B2 (en) | Code generator system for digital libraries | |
US9053112B2 (en) | Automated data validation | |
US20070073675A1 (en) | Database query translation | |
AU2015331030A1 (en) | System generator module for electronic document and electronic file | |
US10445370B2 (en) | Compound indexes for graph databases | |
US10942910B1 (en) | Journal queries of a ledger-based database | |
US11487819B2 (en) | Threaded leaf nodes in database journal | |
US11310054B2 (en) | Symmetric function for journaled database proof | |
WO2018226255A1 (en) | Functional equivalence of tuples and edges in graph databases | |
US11487733B2 (en) | Database journal redaction | |
CN108694172B (zh) | 信息输出方法和装置 | |
CN110704635B (zh) | 一种知识图谱中三元组数据的转换方法及装置 | |
US11550777B2 (en) | Determining metadata of a dataset | |
US11314765B2 (en) | Multistage data sniffer for data extraction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221222 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221222 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240130 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240305 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240507 |