JPWO2021144683A5 - - Google Patents
Download PDFInfo
- Publication number
- JPWO2021144683A5 JPWO2021144683A5 JP2022542891A JP2022542891A JPWO2021144683A5 JP WO2021144683 A5 JPWO2021144683 A5 JP WO2021144683A5 JP 2022542891 A JP2022542891 A JP 2022542891A JP 2022542891 A JP2022542891 A JP 2022542891A JP WO2021144683 A5 JPWO2021144683 A5 JP WO2021144683A5
- Authority
- JP
- Japan
- Prior art keywords
- document
- elements
- hierarchical structure
- relationships
- relationship
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 claims 14
- 230000000007 visual effect Effects 0.000 claims 8
- 238000012800 visualization Methods 0.000 claims 5
- 238000004590 computer program Methods 0.000 claims 2
Claims (20)
- 電子文書の階層構造を決定するためのコンピュータ実装の方法であって、
前記階層構造を全体として含む複数の要素に前記文書を分割するステップであって、各要素が、一つまたは複数の視覚的特性、および、一つまたは複数の位置特性を有する、ステップと、
前記文書の前記階層構造を決定するように、ユニット比較器のセットを含むマスタ比較器を前記複数の要素に適用するステップであって、前記マスタ比較器が、
前記文書における要素の各ペアに対して、少なくとも前記要素のペアにおける前記視覚的特性または前記位置特性を使用して、前記要素のペアの間における家族性関係を決定するように、前記ユニット比較器のセットを順序付けられた配列で適用することにより、前記階層構造を決定し、
前記複数の要素の間における前記家族性関係が、前記文書の前記階層構造を同定する、ステップと、
前記文書の前記階層構造を表す文書階層ツリーを生成するステップであって、前記文書階層ツリーが、前記複数の要素の間における前記家族性関係の視覚化である、ステップと
を備えることを特徴とする、方法。 - 各要素に対して、前記要素に関する複数の方向関係を決定するステップであって、前記方向関係が、前記要素と前記文書における任意の近接する要素との間における近接の種類を規定し、
前記マスタ比較器が、前記方向関係に基づいて要素のペアを比較する、ステップ
をさらに備えることを特徴とする、請求項1記載の方法。 - 前記家族性関係が、要素間の前記方向関係にさらに基づいていることを特徴とする、請求項2記載の方法。
- 前記ユニット比較器のセットにおける各ユニット比較器が、異なる視覚的特性を比較することを特徴とする、請求項1記載の方法。
- 前記ユニット比較器のセットにおける各ユニット比較器が、異なる位置特性を比較することを特徴とする、請求項1記載の方法。
- 前記階層構造を決定するステップが、
前記文書における前記複数の要素に関する書式設定の構造を決定するステップ
をさらに備え、
階層構造が、前記書式設定の構造に基づいている
ことを特徴とする、請求項1記載の方法。 - 前記階層構造を決定するステップが、
前記文書における前記複数の要素に関する索引付けの構造を決定するステップ
をさらに備え、
階層構造が、前記索引付けの構造に基づいている
ことを特徴とする、請求項1記載の方法。 - 前記文書の前記階層構造が、複数の家族性関係を含み、前記複数の家族性関係が、複数の親関係、複数の子関係、および、複数の兄弟関係を含むことを特徴とする、請求項1記載の方法。
- 前記文書が、第一の要素および第二の要素を含み、
前記第一の要素および前記第二の要素の間における親関係は、前記第一の要素が前記第二の要素よりも前記文書の前記階層構造において高レベルとなる階層を有することを規定し、
前記第一の要素および前記第二の要素の間における子関係は、前記第一の要素が前記第二の要素よりも前記文書の前記階層構造において低レベルとなる階層を有することを規定し、
前記第一の要素および前記第二の要素の間における兄弟関係は、前記第一の要素および前記第二の要素が前記文書の前記階層構造において同一レベルとなる階層を有することを規定する
ことを特徴とする、請求項8記載の方法。 - 前記文書の前記階層構造における祖父母関係および孫関係を有する要素のペアに前記マスタ比較器を適用することにより、前記複数の要素の間における前記家族性関係を検証するステップ
をさらに備えることを特徴とする、請求項1記載の方法。 - リモートクライアントシステムから前記視覚化を生成するための要求を受信するステップと、
前記リモートクライアントシステムへ前記視覚化を送信するステップと
をさらに備えることを特徴とする、請求項1記載の方法。 - 前記要求が、前記マスタ比較器における前記ユニット比較器のセットの構成を含むことを特徴とする、請求項11記載の方法。
- 電子文書の階層構造を決定するためのコンピュータ命令を含む非一時的コンピュータ可読記憶メディアであって、プロセッサによって実行されると、前記コンピュータ命令が、前記プロセッサに
前記階層構造を全体として含む複数の要素に前記文書を分割することであって、各要素が、一つまたは複数の視覚的特性、および、一つまたは複数の位置特性を有する、ことと、
前記文書の前記階層構造を決定するように、ユニット比較器のセットを含むマスタ比較器を前記複数の要素に適用することであって、前記マスタ比較器が、
前記文書における要素の各ペアに対して、少なくとも前記要素のペアにおける前記視覚的特性または前記位置特性を使用して、前記要素のペアの間における家族性関係を決定するように、前記ユニット比較器のセットを順序付けられた配列で適用することより、前記階層構造を決定し、
前記複数の要素の間における前記家族性関係が、前記文書の前記階層構造を同定する、ことと、
前記文書の前記階層構造を表す文書階層ツリーを生成することであって、前記文書階層ツリーが、前記複数の要素の間における前記家族性関係の視覚化である、こと
を行わせることを特徴とする、非一時的コンピュータ可読記憶メディア。 - 前記プロセッサによって実行されると、前記コンピュータ命令が、前記プロセッサに
各要素に対して、前記要素に関する複数の方向関係を決定することであって、前記方向関係が、前記要素と前記文書における任意の隣接する要素との間における近接の種類を規定する、ことをさらに行わせて、
前記マスタ比較器が、前記方向関係に基づいて要素のペアを比較する
ことを特徴とする、請求項13記載の非一時的コンピュータ可読記憶メディア。 - 前記家族性関係が、要素間の前記方向関係にさらに基づいていることを特徴とする、請求項14記載の非一時的コンピュータ可読記憶メディア。
- 前記ユニット比較器のセットにおける各ユニット比較器が、異なる視覚的特性を比較することを特徴とする、請求項13記載の非一時的コンピュータ可読記憶メディア。
- 前記ユニット比較器のセットにおける各ユニット比較器が、異なる位置特性を比較することを特徴とする、請求項13記載の非一時的コンピュータ可読記憶メディア。
- 前記文書の前記階層構造が、複数の家族性関係を含み、前記複数の家族性関係が、複数の親関係、複数の子関係、および、複数の兄弟関係を含むことを特徴とする、請求項13記載の非一時的コンピュータ可読記憶メディア。
- 前記文書が、第一の要素および第二の要素を含み、
前記第一の要素および前記第二の要素の間における親関係は、前記第一の要素が前記第二の要素よりも前記文書の前記階層構造において高レベルとなる階層を有することを規定し、
前記第一の要素および前記第二の要素の間における子関係は、前記第一の要素が前記第二の要素よりも前記文書の前記階層構造において低レベルとなる階層を有することを規定し、
前記第一の要素および前記第二の要素の間における兄弟関係は、前記第一の要素および前記第二の要素が前記文書の前記階層構造において同一レベルとなる階層を有することを規定する
ことを特徴とする、請求項13記載の非一時的コンピュータ可読記憶メディア。 - 電子文書の階層構造を決定するためのシステムであって、
コンピュータプログラム命令を実行するためのコンピュータプロセッサと、
前記コンピュータプロセッサによって実行可能であるコンピュータプログラム命令を保存することにより、
前記階層構造を全体として含む複数の要素に前記文書を分割することであって、各要素が、一つまたは複数の視覚的特性、および、一つまたは複数の位置特性を有する、ことと、
前記文書の前記階層構造を決定するように、ユニット比較器のセットを含むマスタ比較器を前記複数の要素に適用することであって、前記マスタ比較器が、
前記文書における要素の各ペアに対して、少なくとも前記要素のペアにおける前記視覚的特性または前記位置特性を使用して、前記要素のペアの間における家族性関係を決定するように、前記ユニット比較器のセットを順序付けられた配列で適用することにより、前記階層構造を決定し、
前記複数の要素の間における前記家族性関係が、前記文書の前記階層構造を同定する、ことと、
前記文書の前記階層構造を表す文書階層ツリーを生成することであって、前記文書階層ツリーが、前記複数の要素の間における前記家族性関係の視覚化である、ことと
を含む操作を実行する非一時的コンピュータ可読メディアと
を備えることを特徴とする、システム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US16/740,754 US11657101B2 (en) | 2020-01-13 | 2020-01-13 | Document information extraction system using sequenced comparators |
US16/740,754 | 2020-01-13 | ||
PCT/IB2021/050179 WO2021144683A1 (en) | 2020-01-13 | 2021-01-12 | Document information extraction system using sequenced comparators |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023509996A JP2023509996A (ja) | 2023-03-10 |
JPWO2021144683A5 true JPWO2021144683A5 (ja) | 2024-01-22 |
Family
ID=76760573
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022542891A Withdrawn JP2023509996A (ja) | 2020-01-13 | 2021-01-12 | 順序付けられた比較器を使用する文書情報抽出システム |
Country Status (5)
Country | Link |
---|---|
US (2) | US11657101B2 (ja) |
EP (1) | EP4091088A4 (ja) |
JP (1) | JP2023509996A (ja) |
CN (1) | CN115244538A (ja) |
WO (1) | WO2021144683A1 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20210350006A1 (en) * | 2020-05-08 | 2021-11-11 | NortonLifeLock Inc. | Systems and methods for identifying software vulnerabilities in embedded device firmware |
US11443102B1 (en) * | 2021-08-13 | 2022-09-13 | Pricewaterhousecoopers Llp | Methods and systems for artificial intelligence-assisted document annotation |
US11645462B2 (en) | 2021-08-13 | 2023-05-09 | Pricewaterhousecoopers Llp | Continuous machine learning method and system for information extraction |
US11657078B2 (en) * | 2021-10-14 | 2023-05-23 | Fmr Llc | Automatic identification of document sections to generate a searchable data structure |
US11615231B1 (en) * | 2022-02-15 | 2023-03-28 | Atlassian Pty Ltd. | System for generating outline navigational interface for native mobile browser applications |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7702641B2 (en) * | 2001-06-04 | 2010-04-20 | Oracle America, Inc. | Method and system for comparing and updating file trees |
US6889226B2 (en) * | 2001-11-30 | 2005-05-03 | Microsoft Corporation | System and method for relational representation of hierarchical data |
CN101055578A (zh) * | 2006-04-12 | 2007-10-17 | 龙搜(北京)科技有限公司 | 基于规则的文档内容挖掘器 |
US8935249B2 (en) | 2007-06-26 | 2015-01-13 | Oracle Otc Subsidiary Llc | Visualization of concepts within a collection of information |
US7890438B2 (en) * | 2007-12-12 | 2011-02-15 | Xerox Corporation | Stacked generalization learning for document annotation |
US8539342B1 (en) * | 2008-10-16 | 2013-09-17 | Adobe Systems Incorporated | Read-order inference via content sorting |
US7996435B2 (en) * | 2008-12-01 | 2011-08-09 | Sap Ag | Apparatus and method for comparing computer documents using tree structures |
US8473467B2 (en) * | 2009-01-02 | 2013-06-25 | Apple Inc. | Content profiling to dynamically configure content processing |
US20120072824A1 (en) | 2010-09-20 | 2012-03-22 | Research In Motion Limited | Content acquisition documents, methods, and systems |
US8543911B2 (en) * | 2011-01-18 | 2013-09-24 | Apple Inc. | Ordering document content based on reading flow |
US20140149132A1 (en) | 2012-11-27 | 2014-05-29 | Jan DeHaan | Adaptive medical documentation and document management |
US9817804B2 (en) * | 2013-09-12 | 2017-11-14 | Wix.Com Ltd. | System for comparison and merging of versions in edited websites and interactive applications |
US20170364483A9 (en) * | 2014-09-09 | 2017-12-21 | Intentional Software Corporation | Generating visual layout nodes to fill a display area based on an anchor point |
US10565444B2 (en) * | 2017-09-07 | 2020-02-18 | International Business Machines Corporation | Using visual features to identify document sections |
-
2020
- 2020-01-13 US US16/740,754 patent/US11657101B2/en active Active
-
2021
- 2021-01-12 CN CN202180020493.3A patent/CN115244538A/zh active Pending
- 2021-01-12 JP JP2022542891A patent/JP2023509996A/ja not_active Withdrawn
- 2021-01-12 EP EP21741282.4A patent/EP4091088A4/en active Pending
- 2021-01-12 WO PCT/IB2021/050179 patent/WO2021144683A1/en unknown
-
2023
- 2023-04-13 US US18/134,485 patent/US20230267154A1/en not_active Abandoned
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Kiveris et al. | Connected components in mapreduce and beyond | |
US11520780B2 (en) | Distributed database systems and structures | |
US10628449B2 (en) | Method and apparatus for processing database data in distributed database system | |
Park et al. | Parallel computation of skyline and reverse skyline queries using mapreduce | |
US8984516B2 (en) | System and method for shared execution of mixed data flows | |
US9965821B2 (en) | Fully parallel in-place construction of 3D acceleration structures in a graphics processing unit | |
US20160063037A1 (en) | Apparatus and method for distributed graph processing | |
US8429526B2 (en) | Efficient evaluation for diff of XML documents | |
CN112711591B (zh) | 基于知识图谱的字段级的数据血缘确定方法及装置 | |
WO2016095726A1 (zh) | 一种用于分布式执行关系型计算指令的方法与设备 | |
CN111324577B (zh) | 一种Yml文件读写的方法及装置 | |
WO2021046750A1 (zh) | 数据重分布方法、装置及系统 | |
US20160140196A1 (en) | Computer product, processing system, and processing method | |
US20160321317A1 (en) | Methods and systems for managing distributed concurrent data updates of business objects | |
JP2023509996A (ja) | 順序付けられた比較器を使用する文書情報抽出システム | |
Bidoit et al. | Processing XML queries and updates on map/reduce clusters | |
US10345482B2 (en) | Global grid building unfaulting sequence for complex fault-network topologies | |
JPWO2021144683A5 (ja) | ||
JP6329552B2 (ja) | 単一テーブルから複数テーブルへの参照データセグメント化 | |
US20150160838A1 (en) | Method and apparatus for automatic graphic editing with map-dependent constraints | |
US10838930B2 (en) | Database migration sequencing using dynamic object-relationship diagram | |
EP3123699B1 (en) | System and method for supporting data types conversion in a heterogeneous computing environment | |
Li et al. | An algorithm for filling complex holes in reverse engineering | |
US11288261B2 (en) | Data ingestion into a polystore | |
US20220215021A1 (en) | Data Query Method and Apparatus, Computing Device, and Storage Medium |