JPWO2021144683A5 - - Google Patents

Download PDF

Info

Publication number
JPWO2021144683A5
JPWO2021144683A5 JP2022542891A JP2022542891A JPWO2021144683A5 JP WO2021144683 A5 JPWO2021144683 A5 JP WO2021144683A5 JP 2022542891 A JP2022542891 A JP 2022542891A JP 2022542891 A JP2022542891 A JP 2022542891A JP WO2021144683 A5 JPWO2021144683 A5 JP WO2021144683A5
Authority
JP
Japan
Prior art keywords
document
elements
hierarchical structure
relationships
relationship
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022542891A
Other languages
English (en)
Other versions
JP2023509996A (ja
Publication date
Priority claimed from US16/740,754 external-priority patent/US11657101B2/en
Application filed filed Critical
Publication of JP2023509996A publication Critical patent/JP2023509996A/ja
Publication of JPWO2021144683A5 publication Critical patent/JPWO2021144683A5/ja
Withdrawn legal-status Critical Current

Links

Claims (20)

  1. 電子文書の階層構造を決定するためのコンピュータ実装の方法であって、
    前記階層構造を全体として含む複数の要素に前記文書を分割するステップであって、各要素が、一つまたは複数の視覚的特性、および、一つまたは複数の位置特性を有する、ステップと、
    前記文書の前記階層構造を決定するように、ユニット比較器のセットを含むマスタ比較器を前記複数の要素に適用するステップであって、前記マスタ比較器が、
    前記文書における要素の各ペアに対して、少なくとも前記要素のペアにおける前記視覚的特性または前記位置特性を使用して、前記要素のペアの間における家族性関係を決定するように、前記ユニット比較器のセットを順序付けられた配列で適用することにより、前記階層構造を決定し、
    前記複数の要素の間における前記家族性関係が、前記文書の前記階層構造を同定する、ステップと、
    前記文書の前記階層構造を表す文書階層ツリーを生成するステップであって、前記文書階層ツリーが、前記複数の要素の間における前記家族性関係の視覚化である、ステップと
    を備えることを特徴とする、方法。
  2. 各要素に対して、前記要素に関する複数の方向関係を決定するステップであって、前記方向関係が、前記要素と前記文書における任意の近接する要素との間における近接の種類を規定し、
    前記マスタ比較器が、前記方向関係に基づいて要素のペアを比較する、ステップ
    をさらに備えることを特徴とする、請求項1記載の方法。
  3. 前記家族性関係が、要素間の前記方向関係にさらに基づいていることを特徴とする、請求項2記載の方法。
  4. 前記ユニット比較器のセットにおける各ユニット比較器が、異なる視覚的特性を比較することを特徴とする、請求項1記載の方法。
  5. 前記ユニット比較器のセットにおける各ユニット比較器が、異なる位置特性を比較することを特徴とする、請求項1記載の方法。
  6. 前記階層構造を決定するステップが、
    前記文書における前記複数の要素に関する書式設定の構造を決定するステップ
    をさらに備え、
    階層構造が、前記書式設定の構造に基づいている
    ことを特徴とする、請求項1記載の方法。
  7. 前記階層構造を決定するステップが、
    前記文書における前記複数の要素に関する索引付けの構造を決定するステップ
    をさらに備え、
    階層構造が、前記索引付けの構造に基づいている
    ことを特徴とする、請求項1記載の方法。
  8. 前記文書の前記階層構造が、複数の家族性関係を含み、前記複数の家族性関係が、複数の親関係、複数の子関係、および、複数の兄弟関係を含むことを特徴とする、請求項1記載の方法。
  9. 前記文書が、第一の要素および第二の要素を含み、
    前記第一の要素および前記第二の要素の間における親関係は、前記第一の要素が前記第二の要素よりも前記文書の前記階層構造において高レベルとなる階層を有することを規定し、
    前記第一の要素および前記第二の要素の間における子関係は、前記第一の要素が前記第二の要素よりも前記文書の前記階層構造において低レベルとなる階層を有することを規定し、
    前記第一の要素および前記第二の要素の間における兄弟関係は、前記第一の要素および前記第二の要素が前記文書の前記階層構造において同一レベルとなる階層を有することを規定する
    ことを特徴とする、請求項8記載の方法。
  10. 前記文書の前記階層構造における祖父母関係および孫関係を有する要素のペアに前記マスタ比較器を適用することにより、前記複数の要素の間における前記家族性関係を検証するステップ
    をさらに備えることを特徴とする、請求項1記載の方法。
  11. リモートクライアントシステムから前記視覚化を生成するための要求を受信するステップと、
    前記リモートクライアントシステムへ前記視覚化を送信するステップと
    をさらに備えることを特徴とする、請求項1記載の方法。
  12. 前記要求が、前記マスタ比較器における前記ユニット比較器のセットの構成を含むことを特徴とする、請求項1記載の方法。
  13. 電子文書の階層構造を決定するためのコンピュータ命令を含む非一時的コンピュータ可読記憶メディアであって、プロセッサによって実行されると、前記コンピュータ命令が、前記プロセッサに
    前記階層構造を全体として含む複数の要素に前記文書を分割することであって、各要素が、一つまたは複数の視覚的特性、および、一つまたは複数の位置特性を有する、ことと、
    前記文書の前記階層構造を決定するように、ユニット比較器のセットを含むマスタ比較器を前記複数の要素に適用することであって、前記マスタ比較器が、
    前記文書における要素の各ペアに対して、少なくとも前記要素のペアにおける前記視覚的特性または前記位置特性を使用して、前記要素のペアの間における家族性関係を決定するように、前記ユニット比較器のセットを順序付けられた配列で適用することより、前記階層構造を決定し、
    前記複数の要素の間における前記家族性関係が、前記文書の前記階層構造を同定する、ことと、
    前記文書の前記階層構造を表す文書階層ツリーを生成することであって、前記文書階層ツリーが、前記複数の要素の間における前記家族性関係の視覚化である、こと
    を行わせることを特徴とする、非一時的コンピュータ可読記憶メディア。
  14. 前記プロセッサによって実行されると、前記コンピュータ命令が、前記プロセッサに
    各要素に対して、前記要素に関する複数の方向関係を決定することであって、前記方向関係が、前記要素と前記文書における任意の隣接する要素との間における近接の種類を規定する、ことをさらに行わせて、
    前記マスタ比較器が、前記方向関係に基づいて要素のペアを比較する
    ことを特徴とする、請求項13記載の非一時的コンピュータ可読記憶メディア。
  15. 前記家族性関係が、要素間の前記方向関係にさらに基づいていることを特徴とする、請求項1記載の非一時的コンピュータ可読記憶メディア。
  16. 前記ユニット比較器のセットにおける各ユニット比較器が、異なる視覚的特性を比較することを特徴とする、請求項13記載の非一時的コンピュータ可読記憶メディア。
  17. 前記ユニット比較器のセットにおける各ユニット比較器が、異なる位置特性を比較することを特徴とする、請求項13記載の非一時的コンピュータ可読記憶メディア。
  18. 前記文書の前記階層構造が、複数の家族性関係を含み、前記複数の家族性関係が、複数の親関係、複数の子関係、および、複数の兄弟関係を含むことを特徴とする、請求項13記載の非一時的コンピュータ可読記憶メディア。
  19. 前記文書が、第一の要素および第二の要素を含み、
    前記第一の要素および前記第二の要素の間における親関係は、前記第一の要素が前記第二の要素よりも前記文書の前記階層構造において高レベルとなる階層を有することを規定し、
    前記第一の要素および前記第二の要素の間における子関係は、前記第一の要素が前記第二の要素よりも前記文書の前記階層構造において低レベルとなる階層を有することを規定し、
    前記第一の要素および前記第二の要素の間における兄弟関係は、前記第一の要素および前記第二の要素が前記文書の前記階層構造において同一レベルとなる階層を有することを規定する
    ことを特徴とする、請求項13記載の非一時的コンピュータ可読記憶メディア。
  20. 電子文書の階層構造を決定するためのシステムであって、
    コンピュータプログラム命令を実行するためのコンピュータプロセッサと、
    前記コンピュータプロセッサによって実行可能であるコンピュータプログラム命令を保存することにより、
    前記階層構造を全体として含む複数の要素に前記文書を分割することであって、各要素が、一つまたは複数の視覚的特性、および、一つまたは複数の位置特性を有する、ことと、
    前記文書の前記階層構造を決定するように、ユニット比較器のセットを含むマスタ比較器を前記複数の要素に適用することであって、前記マスタ比較器が、
    前記文書における要素の各ペアに対して、少なくとも前記要素のペアにおける前記視覚的特性または前記位置特性を使用して、前記要素のペアの間における家族性関係を決定するように、前記ユニット比較器のセットを順序付けられた配列で適用することにより、前記階層構造を決定し、
    前記複数の要素の間における前記家族性関係が、前記文書の前記階層構造を同定する、ことと、
    前記文書の前記階層構造を表す文書階層ツリーを生成することであって、前記文書階層ツリーが、前記複数の要素の間における前記家族性関係の視覚化である、ことと
    を含む操作を実行する非一時的コンピュータ可読メディアと
    を備えることを特徴とする、システム。
JP2022542891A 2020-01-13 2021-01-12 順序付けられた比較器を使用する文書情報抽出システム Withdrawn JP2023509996A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US16/740,754 US11657101B2 (en) 2020-01-13 2020-01-13 Document information extraction system using sequenced comparators
US16/740,754 2020-01-13
PCT/IB2021/050179 WO2021144683A1 (en) 2020-01-13 2021-01-12 Document information extraction system using sequenced comparators

Publications (2)

Publication Number Publication Date
JP2023509996A JP2023509996A (ja) 2023-03-10
JPWO2021144683A5 true JPWO2021144683A5 (ja) 2024-01-22

Family

ID=76760573

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022542891A Withdrawn JP2023509996A (ja) 2020-01-13 2021-01-12 順序付けられた比較器を使用する文書情報抽出システム

Country Status (5)

Country Link
US (2) US11657101B2 (ja)
EP (1) EP4091088A4 (ja)
JP (1) JP2023509996A (ja)
CN (1) CN115244538A (ja)
WO (1) WO2021144683A1 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210350006A1 (en) * 2020-05-08 2021-11-11 NortonLifeLock Inc. Systems and methods for identifying software vulnerabilities in embedded device firmware
US11443102B1 (en) * 2021-08-13 2022-09-13 Pricewaterhousecoopers Llp Methods and systems for artificial intelligence-assisted document annotation
US11645462B2 (en) 2021-08-13 2023-05-09 Pricewaterhousecoopers Llp Continuous machine learning method and system for information extraction
US11657078B2 (en) * 2021-10-14 2023-05-23 Fmr Llc Automatic identification of document sections to generate a searchable data structure
US11615231B1 (en) * 2022-02-15 2023-03-28 Atlassian Pty Ltd. System for generating outline navigational interface for native mobile browser applications

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7702641B2 (en) * 2001-06-04 2010-04-20 Oracle America, Inc. Method and system for comparing and updating file trees
US6889226B2 (en) * 2001-11-30 2005-05-03 Microsoft Corporation System and method for relational representation of hierarchical data
CN101055578A (zh) * 2006-04-12 2007-10-17 龙搜(北京)科技有限公司 基于规则的文档内容挖掘器
US8935249B2 (en) 2007-06-26 2015-01-13 Oracle Otc Subsidiary Llc Visualization of concepts within a collection of information
US7890438B2 (en) * 2007-12-12 2011-02-15 Xerox Corporation Stacked generalization learning for document annotation
US8539342B1 (en) * 2008-10-16 2013-09-17 Adobe Systems Incorporated Read-order inference via content sorting
US7996435B2 (en) * 2008-12-01 2011-08-09 Sap Ag Apparatus and method for comparing computer documents using tree structures
US8473467B2 (en) * 2009-01-02 2013-06-25 Apple Inc. Content profiling to dynamically configure content processing
US20120072824A1 (en) 2010-09-20 2012-03-22 Research In Motion Limited Content acquisition documents, methods, and systems
US8543911B2 (en) * 2011-01-18 2013-09-24 Apple Inc. Ordering document content based on reading flow
US20140149132A1 (en) 2012-11-27 2014-05-29 Jan DeHaan Adaptive medical documentation and document management
US9817804B2 (en) * 2013-09-12 2017-11-14 Wix.Com Ltd. System for comparison and merging of versions in edited websites and interactive applications
US20170364483A9 (en) * 2014-09-09 2017-12-21 Intentional Software Corporation Generating visual layout nodes to fill a display area based on an anchor point
US10565444B2 (en) * 2017-09-07 2020-02-18 International Business Machines Corporation Using visual features to identify document sections

Similar Documents

Publication Publication Date Title
Kiveris et al. Connected components in mapreduce and beyond
US11520780B2 (en) Distributed database systems and structures
US10628449B2 (en) Method and apparatus for processing database data in distributed database system
Park et al. Parallel computation of skyline and reverse skyline queries using mapreduce
US8984516B2 (en) System and method for shared execution of mixed data flows
US9965821B2 (en) Fully parallel in-place construction of 3D acceleration structures in a graphics processing unit
US20160063037A1 (en) Apparatus and method for distributed graph processing
US8429526B2 (en) Efficient evaluation for diff of XML documents
CN112711591B (zh) 基于知识图谱的字段级的数据血缘确定方法及装置
WO2016095726A1 (zh) 一种用于分布式执行关系型计算指令的方法与设备
CN111324577B (zh) 一种Yml文件读写的方法及装置
WO2021046750A1 (zh) 数据重分布方法、装置及系统
US20160140196A1 (en) Computer product, processing system, and processing method
US20160321317A1 (en) Methods and systems for managing distributed concurrent data updates of business objects
JP2023509996A (ja) 順序付けられた比較器を使用する文書情報抽出システム
Bidoit et al. Processing XML queries and updates on map/reduce clusters
US10345482B2 (en) Global grid building unfaulting sequence for complex fault-network topologies
JPWO2021144683A5 (ja)
JP6329552B2 (ja) 単一テーブルから複数テーブルへの参照データセグメント化
US20150160838A1 (en) Method and apparatus for automatic graphic editing with map-dependent constraints
US10838930B2 (en) Database migration sequencing using dynamic object-relationship diagram
EP3123699B1 (en) System and method for supporting data types conversion in a heterogeneous computing environment
Li et al. An algorithm for filling complex holes in reverse engineering
US11288261B2 (en) Data ingestion into a polystore
US20220215021A1 (en) Data Query Method and Apparatus, Computing Device, and Storage Medium