JPWO2021055102A5 - - Google Patents

Download PDF

Info

Publication number
JPWO2021055102A5
JPWO2021055102A5 JP2022542307A JP2022542307A JPWO2021055102A5 JP WO2021055102 A5 JPWO2021055102 A5 JP WO2021055102A5 JP 2022542307 A JP2022542307 A JP 2022542307A JP 2022542307 A JP2022542307 A JP 2022542307A JP WO2021055102 A5 JPWO2021055102 A5 JP WO2021055102A5
Authority
JP
Japan
Prior art keywords
chunks
semantic role
documents
labels
computer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022542307A
Other languages
English (en)
Other versions
JP2022547750A (ja
Publication date
Application filed filed Critical
Priority claimed from PCT/US2020/043606 external-priority patent/WO2021055102A1/en
Publication of JP2022547750A publication Critical patent/JP2022547750A/ja
Publication of JPWO2021055102A5 publication Critical patent/JPWO2021055102A5/ja
Pending legal-status Critical Current

Links

Claims (20)

  1. ドキュメントを分析および改善する命令を実行するコンピュータシステムで実行されるコンピュータ実行方法であって、
    複数のドキュメントを含むドキュメントセットにアクセスすることであって、前記ドキュメントセットは、前記ドキュメントセットの個々のドキュメント内のチャンクも識別する、ことと、
    セマンティックロールラベルを複数のチャンクに自動的に割り当てることであって、前記セマンティックロールラベルは、前記ドキュメントによって記述されるトランザクションにおける前記チャンクによって果たされるセマンティックロールを記述し、セマンティックロールラベルを前記チャンクに自動的に割り当てることは、(a)機械学習および/または自然言語処理方法を使用してチャンクのセマンティックロールを決定することを含み、(b)前記ドキュメントセットにわたる異なるドキュメントにおけるカウンターパートチャンクの発生のパターンにも基づいており、前記カウンターパートチャンクは、それぞれのドキュメント内で同じセマンティックロールを果たす異なるドキュメント内の異なるチャンクである、ことと
    前記ドキュメントセット内のドキュメントのさらなる処理において、前記チャンクおよびそれらのセマンティックロールラベルを使用することと、
    を含むコンピュータ実行方法。
  2. 前記ドキュメントセット内の複数のドキュメントは、全て同じドキュメントタイプである、請求項1のコンピュータ実行方法。
  3. 前記ドキュメントセット内の前記チャンクは、
    ドキュメントテンプレートにおけるフィールドとして使用するのに適した前記ドキュメント内のコンテンツを含むフィールドチャンクであって、前記フィールドチャンクのいくつかは階層的であり、サブチャンクとして他のチャンクを含む、フィールドチャンクと、
    前記ドキュメントのレイアウト内の構造を含むコンテンツを含む構造チャンクと、
    を含む、請求項1のコンピュータ実行方法。
  4. 前記ドキュメントセットは法律ドキュメントを含み、前記セマンティックロールは、(a)前記法律ドキュメントの当事者によって果たされる役割と、(b)日付、期間または他の時間表現によって果たされる役割とを含む、請求項1のコンピュータ実行方法。
  5. セマンティックロールラベルをチャンクに自動的に割り当てることは、
    前記セマンティックロールラベルのいくつかをチャンクから自動的に抽出することと、
    前記抽出されたセマンティックロールラベルをチャンクに割り当てることと、
    を含む、請求項1のコンピュータ実行方法。
  6. セマンティックロールラベルをチャンクに自動的に割り当てることは、
    機械学習を使用して、(a)個々のドキュメント内のチャンクのコンテンツ、レイアウト、およびコンテキストに基づいて、(b)前記ドキュメントセット内の前記ドキュメントにわたるチャンクのコンテンツ、レイアウト、およびコンテキストのパターンに基づいて、ならびに(c)チャンクのデータタイプに基づいて、チャンクからセマンティックロールラベルを自動的に抽出することと
    前記抽出されたセマンティックロールラベルをチャンクに割り当てることと、
    を含む、請求項1のコンピュータ実行方法。
  7. セマンティックロールラベルをチャンクに自動的に割り当てることは、
    オートエンコーダ機械学習技術を使用して、前記セマンティックロールラベルのいくつかを自動的に抽出することと、
    前記抽出されたセマンティックロールラベルをチャンクに割り当てることと、
    を含む、請求項1のコンピュータ実行方法。
  8. セマンティックロールラベルをチャンクに自動的に割り当てることは、
    候補セマンティックロールラベルを前記チャンクから自動的に抽出することと、
    機械学習を使用して、前記候補セマンティックロールラベルをリファインすることと、
    前記抽出されたセマンティックロールラベルをチャンクに割り当てることと、
    を含む、請求項1のコンピュータ実行方法。
  9. セマンティックロールラベルをチャンクに自動的に割り当てることは、
    前記ドキュメントセット内の異なるドキュメントからのチャンクのコンテンツ、レイアウトおよび/またはコンテキストの類似性に基づいて、チャンクから前記セマンティックロールラベルのいくつかを自動的に抽出することと
    前記抽出されたセマンティックロールラベルをチャンクに割り当てることと、
    を含む、請求項1のコンピュータ実行方法。
  10. セマンティックロールラベルをチャンクに自動的に割り当てることは、
    候補セマンティックロールラベルをチャンクに割り当てることと、
    前記チャンクによって果たされる前記セマンティックロールの類似性に基づいて、チャンクをクラスタにグループ化することと、
    クラスタ内の前記チャンクの間の前記候補セマンティックロールラベルを標準化することと、
    前記標準化されたセマンティックロールラベルをチャンクに割り当てることと、
    を含む、請求項1のコンピュータ実行方法。
  11. セマンティックロールラベルをチャンクに自動的に割り当てることは、
    候補セマンティックロールラベルをチャンクに割り当てることと、
    前記チャンクのサイズおよびテキスト埋め込みの類似性に基づいて、チャンクをチャンククラスタにグループ化することと、
    前記候補セマンティックロールラベルのテキスト埋め込みの類似性に基づいて、候補セマンティックロールラベルをラベルクラスタにグループ化することと、
    前記チャンククラスタおよび前記ラベルクラスタに基づいて前記候補セマンティックロールラベルを標準化することと、
    前記標準化されたセマンティックロールラベルをチャンクに割り当てることと、
    を含む、請求項1のコンピュータ実行方法。
  12. セマンティックロールラベルをチャンクに自動的に割り当てることは、
    候補セマンティックロールラベルをドキュメントのセクションを含むチャンクに割り当てることであって、前記候補セマンティックロールラベルが前記セクションの見出しに基づいている、ことと、
    前記セクション内のコンテンツの類似性に基づいて、前記チャンクをクラスタにグループ化することと、
    前記候補セマンティックロールラベルを、クラスタ内の全てのチャンクの前記セマンティックロールラベルとして最も一般的な候補セマンティックロールラベルを選択することによって標準化することと、
    前記標準化されたセマンティックロールラベルをチャンクに割り当てることと、
    を含む、請求項1のコンピュータ実行方法。
  13. 前記セマンティックロールラベルは、セマンティックロールラベルの所定のセットから選択される、請求項1のコンピュータ実行方法。
  14. 前記セマンティックロールラベルは、前記ドキュメントセット内のドキュメントのさらなる処理のために使用されるソフトウェアアプリケーションによって認識されるラベルを含む、請求項1のコンピュータ実行方法。
  15. セマンティックロールラベルをチャンクに自動的に割り当てることは、
    (a)機械学習を使用して、近くにある他のチャンクに基づいて、または前記チャンクを含むチャンクを含むことに基づいて、チャンクのセマンティックロールを決定すること、または
    (b)近くのチャンクの文法的構造に基づいて、自然言語処理方法を使用して、チャンクのセマンティックロールを決定すること、
    の少なくとも1つを含む、請求項1のコンピュータ実行方法。
  16. 前記チャンクのいくつかは名前付きエンティティ認識であり、そのようなチャンクは、前記ドキュメント内のそれらの前記チャンクによって果たされる前記セマンティックロールに対するセマンティックロールラベルでラベル付けされ、そのようなチャンクはまた、前記チャンクのデータタイプでラベル付けされる、請求項1のコンピュータ実行方法。
  17. 前記チャンクのいくつかは前記ドキュメント内のマルチパラグラフ構造であり、そのようなチャンクは、前記ドキュメント内のそれらのチャンクによって果たされる前記セマンティックロールに対するセマンティックロールラベルでラベル付けされる、請求項1のコンピュータ実行方法。
  18. 前記自動的に割り当てられたセマンティックロールラベルの信頼レベルを推定することと、
    前記推定された信頼レベルに基づいて、確認のためにいくつかの割り当てをユーザに提示することと、
    前記自動的に割り当てられたセマンティックロールラベルに対するユーザフィードバックを受信することと、
    前記ユーザフィードバックに応答して、前記機械学習および/または自然言語処理方法を改善することと、
    をさらに含む、請求項1のコンピュータ実行方法。
  19. ドキュメントを分析および改善するための実行可能なコンピュータプログラム命令を格納する非一時的コンピュータ可読記憶媒体であって、前記コンピュータプログラム命令は、コンピュータシステムによって実行可能であり、前記コンピュータシステムに
    複数のドキュメントを含むドキュメントセットにアクセスすることであって、前記ドキュメントセットは、前記ドキュメントセットの個々のドキュメント内のチャンクも識別する、ことと、
    セマンティックロールラベルを複数のチャンクに自動的に割り当てることであって、前記セマンティックロールラベルは、前記ドキュメントによって記述されるトランザクションにおける前記チャンクによって果たされるセマンティックロールを記述し、セマンティックロールラベルを前記チャンクに自動的に割り当てることは、(a)機械学習および/または自然言語処理方法を使用してチャンクのセマンティックロールを決定することを含み、(b)前記ドキュメントセットにわたる異なるドキュメントにおけるカウンターパートチャンクの発生のパターンにも基づいており、前記カウンターパートチャンクは、それぞれのドキュメント内で同じセマンティックロールを果たす異なるドキュメント内の異なるチャンクである、ことと
    前記チャンクおよびそれらのセマンティックロールラベルを、前記ドキュメントセット内のドキュメントのさらなる処理のために利用可能にすることと
    を含む方法を実行させる、非一時的コンピュータ可読記憶媒体。
  20. ドキュメントを分析および改善するコンピュータシステムであって、
    複数のドキュメントを含むドキュメントセットを受信して格納する記憶媒体であって、前記ドキュメントセットはまた、前記ドキュメントセットの個々のドキュメント内のチャンクを識別する、記憶媒体と
    前記記憶媒体へのアクセスを有し、ドキュメントを分析および改善するアプリケーションプログラムを実行するプロセッサシステムと、
    を含み、
    前記プロセッサシステムが
    セマンティックロールラベルを複数の前記チャンクに自動的に割り当て、前記セマンティックロールラベルは、前記ドキュメントによって記述されるトランザクションにおける前記チャンクによって果たされるセマンティックロールを記述し、セマンティックロールラベルを前記チャンクに自動的に割り当てることは、(a)機械学習および/または自然言語処理方法を使用してチャンクのセマンティックロールを決定することを含み、(b)前記ドキュメントセットにわたる異なるドキュメントにおけるカウンターパートチャンクの発生のパターンにも基づいており、前記カウンターパートチャンクは、それぞれのドキュメント内で同じセマンティックロールを果たす異なるドキュメント内の異なるチャンクであり、
    前記チャンクおよびそれらのセマンティックロールラベルを前記ドキュメントセット内のドキュメントのさらなる処理のために利用可能にする、
    前記アプリケーションプログラムを実行する、
    コンピュータシステム。
JP2022542307A 2019-09-16 2020-07-24 クロスドキュメントインテリジェントオーサリングおよび処理アシスタント Pending JP2022547750A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962900793P 2019-09-16 2019-09-16
US62/900,793 2019-09-16
PCT/US2020/043606 WO2021055102A1 (en) 2019-09-16 2020-07-24 Cross-document intelligent authoring and processing assistant

Publications (2)

Publication Number Publication Date
JP2022547750A JP2022547750A (ja) 2022-11-15
JPWO2021055102A5 true JPWO2021055102A5 (ja) 2023-08-01

Family

ID=74867926

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022542307A Pending JP2022547750A (ja) 2019-09-16 2020-07-24 クロスドキュメントインテリジェントオーサリングおよび処理アシスタント

Country Status (6)

Country Link
US (7) US11514238B2 (ja)
EP (1) EP4028961A4 (ja)
JP (1) JP2022547750A (ja)
KR (1) KR20220059526A (ja)
CN (1) CN114616572A (ja)
CA (1) CA3150535A1 (ja)

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3460685A1 (en) * 2017-09-12 2019-03-27 Bricsys NV Improved semantic classification of an entity in a building information model
JP2022547750A (ja) 2019-09-16 2022-11-15 ドキュガミ インコーポレイテッド クロスドキュメントインテリジェントオーサリングおよび処理アシスタント
US11875778B1 (en) * 2019-11-15 2024-01-16 Yahoo Assets Llc Systems and methods for voice rendering of machine-generated electronic messages
US11763071B2 (en) * 2020-01-06 2023-09-19 Catachi Co. Methods and systems for facilitating unifying of multiple regulatory documents
US20220092097A1 (en) * 2020-09-18 2022-03-24 Anurag Gupta Method for Extracting and Organizing Information from a Document
US20220156489A1 (en) * 2020-11-18 2022-05-19 Adobe Inc. Machine learning techniques for identifying logical sections in unstructured data
CN112435651B (zh) * 2020-11-20 2023-05-02 昆明学院 一种语音数据自动标注的质量评估方法
EP4295267A1 (en) * 2021-02-17 2023-12-27 Applica Sp. z.o.o. Iterative training for text-image-layout transformer
US11594054B2 (en) * 2021-02-19 2023-02-28 Capital One Services, Llc Document lineage management system
US11790568B2 (en) * 2021-03-29 2023-10-17 Kyndryl, Inc Image entity extraction and granular interactivity articulation
US11521639B1 (en) * 2021-04-02 2022-12-06 Asapp, Inc. Speech sentiment analysis using a speech sentiment classifier pretrained with pseudo sentiment labels
US20220366188A1 (en) * 2021-04-29 2022-11-17 International Business Machines Corporation Parameterized neighborhood memory adaptation
US20220358287A1 (en) * 2021-05-10 2022-11-10 International Business Machines Corporation Text mining based on document structure information extraction
US11755839B2 (en) * 2021-05-19 2023-09-12 International Business Machines Corporation Low resource named entity recognition for sensitive personal information
WO2023287952A1 (en) * 2021-07-14 2023-01-19 Kpmg Llp System and method for implementing a medical records analytics platform
US11763803B1 (en) 2021-07-28 2023-09-19 Asapp, Inc. System, method, and computer program for extracting utterances corresponding to a user problem statement in a conversation between a human agent and a user
CN113505201A (zh) * 2021-07-29 2021-10-15 宁波薄言信息技术有限公司 一种基于SegaBert预训练模型的合同抽取方法
CN113722555A (zh) * 2021-07-29 2021-11-30 武汉光庭信息技术股份有限公司 一种数据标注项质检方法及系统
US20230074189A1 (en) * 2021-08-19 2023-03-09 Fmr Llc Methods and systems for intelligent text classification with limited or no training data
US11941147B2 (en) * 2021-08-31 2024-03-26 Box, Inc. Detection of personally identifiable information
US11657078B2 (en) 2021-10-14 2023-05-23 Fmr Llc Automatic identification of document sections to generate a searchable data structure
US11361151B1 (en) 2021-10-18 2022-06-14 BriefCatch LLC Methods and systems for intelligent editing of legal documents
WO2024072483A2 (en) * 2022-04-12 2024-04-04 The Trustees Of Dartmouth College Processing architecture for fundamental symbolic logic operations and method for employing the same
US11907643B2 (en) * 2022-04-29 2024-02-20 Adobe Inc. Dynamic persona-based document navigation
US20230350954A1 (en) * 2022-05-02 2023-11-02 SparkCognition, Inc. Systems and methods of filtering topics using parts of speech tagging
JP2023166252A (ja) * 2022-05-09 2023-11-21 キヤノン株式会社 情報処理装置、情報処理方法及びプログラム
US11853335B1 (en) 2022-06-13 2023-12-26 International Business Machines Corporation Cooperative build and content annotation for conversational design of virtual assistants
US12026458B2 (en) 2022-11-11 2024-07-02 State Farm Mutual Automobile Insurance Company Systems and methods for generating document templates from a mixed set of document types

Family Cites Families (100)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU6245396A (en) 1996-07-03 1998-02-02 Polydoc N.V. Document producing support system
US6076051A (en) 1997-03-07 2000-06-13 Microsoft Corporation Information retrieval utilizing semantic representation of text
US7287219B1 (en) 1999-03-11 2007-10-23 Abode Systems Incorporated Method of constructing a document type definition from a set of structured electronic documents
US6924828B1 (en) 1999-04-27 2005-08-02 Surfnotes Method and apparatus for improved information representation
US20020002481A1 (en) * 2000-05-16 2002-01-03 Hirokazu Uchio Information processing apparatus for management of documents relevant to patent application
WO2002017128A1 (en) * 2000-08-24 2002-02-28 Science Applications International Corporation Word sense disambiguation
US7251781B2 (en) * 2001-07-31 2007-07-31 Invention Machine Corporation Computer based summarization of natural language documents
US9009590B2 (en) * 2001-07-31 2015-04-14 Invention Machines Corporation Semantic processor for recognition of cause-effect relations in natural language documents
US20040001099A1 (en) 2002-06-27 2004-01-01 Microsoft Corporation Method and system for associating actions with semantic labels in electronic documents
US7523394B2 (en) 2002-06-28 2009-04-21 Microsoft Corporation Word-processing document stored in a single XML file that may be manipulated by applications that understand XML
US20050027664A1 (en) * 2003-07-31 2005-02-03 Johnson David E. Interactive machine learning system for automated annotation of information in text
US20050060643A1 (en) 2003-08-25 2005-03-17 Miavia, Inc. Document similarity detection and classification system
US20050060140A1 (en) 2003-09-15 2005-03-17 Maddox Paul Christopher Using semantic feature structures for document comparisons
US20050108630A1 (en) 2003-11-19 2005-05-19 Wasson Mark D. Extraction of facts from text
US7742911B2 (en) 2004-10-12 2010-06-22 At&T Intellectual Property Ii, L.P. Apparatus and method for spoken language understanding by using semantic role labeling
US8719700B2 (en) 2010-05-04 2014-05-06 Xerox Corporation Matching a page layout for each page of a document to a page template candidate from a list of page layout candidates
US20060235870A1 (en) * 2005-01-31 2006-10-19 Musgrove Technology Enterprises, Llc System and method for generating an interlinked taxonomy structure
US7606781B2 (en) 2005-03-30 2009-10-20 Primal Fusion Inc. System, method and computer program for facet analysis
US8249344B2 (en) 2005-07-01 2012-08-21 Microsoft Corporation Grammatical parsing of document visual structures
US8176004B2 (en) 2005-10-24 2012-05-08 Capsilon Corporation Systems and methods for intelligent paperless document management
US20070150802A1 (en) * 2005-12-12 2007-06-28 Canon Information Systems Research Australia Pty. Ltd. Document annotation and interface
US7788579B2 (en) * 2006-03-06 2010-08-31 Ricoh Co., Ltd. Automated document layout design
US20080008391A1 (en) 2006-07-10 2008-01-10 Amir Geva Method and System for Document Form Recognition
US9495358B2 (en) 2006-10-10 2016-11-15 Abbyy Infopoisk Llc Cross-language text clustering
US8738359B2 (en) 2006-10-18 2014-05-27 Honda Motor Co., Ltd. Scalable knowledge extraction
US8671341B1 (en) 2007-01-05 2014-03-11 Linguastat, Inc. Systems and methods for identifying claims associated with electronic text
US7778953B2 (en) * 2007-02-19 2010-08-17 Kabushiki Kaisha Toshiba Document management apparatus and document management method
US8180633B2 (en) 2007-03-08 2012-05-15 Nec Laboratories America, Inc. Fast semantic extraction using a neural network architecture
US8209278B1 (en) 2007-03-23 2012-06-26 Jay Bradley Straus Computer editing system for common textual patterns in legal documents
WO2008132706A1 (en) 2007-04-26 2008-11-06 Markport Limited A web browsing method and system
US8527262B2 (en) * 2007-06-22 2013-09-03 International Business Machines Corporation Systems and methods for automatic semantic role labeling of high morphological text for natural language processing applications
US20090049018A1 (en) * 2007-08-14 2009-02-19 John Nicholas Gross Temporal Document Sorter and Method Using Semantic Decoding and Prediction
EP2185999A4 (en) 2007-08-31 2011-11-02 Microsoft Corp SUBJECT OF SEARCH RESULTS BY MEANING OF TERM
US8229730B2 (en) * 2007-08-31 2012-07-24 Microsoft Corporation Indexing role hierarchies for words in a search index
US8280885B2 (en) 2007-10-29 2012-10-02 Cornell University System and method for automatically summarizing fine-grained opinions in digital text
US8392436B2 (en) * 2008-02-07 2013-03-05 Nec Laboratories America, Inc. Semantic search via role labeling
US8145632B2 (en) 2008-02-22 2012-03-27 Tigerlogic Corporation Systems and methods of identifying chunks within multiple documents
US8196030B1 (en) 2008-06-02 2012-06-05 Pricewaterhousecoopers Llp System and method for comparing and reviewing documents
US8286132B2 (en) 2008-09-25 2012-10-09 International Business Machines Corporation Comparing and merging structured documents syntactically and semantically
US8214734B2 (en) 2008-10-09 2012-07-03 International Business Machines Corporation Credibility of text analysis engine performance evaluation by rating reference content
US20100153318A1 (en) * 2008-11-19 2010-06-17 Massachusetts Institute Of Technology Methods and systems for automatically summarizing semantic properties from documents with freeform textual annotations
US9460063B2 (en) 2009-01-02 2016-10-04 Apple Inc. Identification, selection, and display of a region of interest in a document
US9262395B1 (en) 2009-02-11 2016-02-16 Guangsheng Zhang System, methods, and data structure for quantitative assessment of symbolic associations
US8335754B2 (en) 2009-03-06 2012-12-18 Tagged, Inc. Representing a document using a semantic structure
WO2010120925A2 (en) * 2009-04-15 2010-10-21 Evri Inc. Search and search optimization using a pattern of a location identifier
JP5340847B2 (ja) 2009-07-27 2013-11-13 株式会社日立ソリューションズ 文書データ処理装置
JP5477635B2 (ja) * 2010-02-15 2014-04-23 ソニー株式会社 情報処理装置および方法、並びにプログラム
US8805840B1 (en) 2010-03-23 2014-08-12 Firstrain, Inc. Classification of documents
US9129300B2 (en) 2010-04-21 2015-09-08 Yahoo! Inc. Using external sources for sponsored search AD selection
US9594730B2 (en) 2010-07-01 2017-03-14 Yahoo! Inc. Annotating HTML segments with functional labels
US20150112664A1 (en) 2010-12-09 2015-04-23 Rage Frameworks, Inc. System and method for generating a tractable semantic network for a concept
US8818932B2 (en) 2011-02-14 2014-08-26 Decisive Analytics Corporation Method and apparatus for creating a predictive model
US10303999B2 (en) * 2011-02-22 2019-05-28 Refinitiv Us Organization Llc Machine learning-based relationship association and related discovery and search engines
US8543577B1 (en) 2011-03-02 2013-09-24 Google Inc. Cross-channel clusters of information
US8719692B2 (en) 2011-03-11 2014-05-06 Microsoft Corporation Validation, rejection, and modification of automatically generated document annotations
US20120296637A1 (en) * 2011-05-20 2012-11-22 Smiley Edwin Lee Method and apparatus for calculating topical categorization of electronic documents in a collection
US8606780B2 (en) 2011-07-08 2013-12-10 Microsoft Corporation Image re-rank based on image annotations
US8488916B2 (en) 2011-07-22 2013-07-16 David S Terman Knowledge acquisition nexus for facilitating concept capture and promoting time on task
US9280525B2 (en) * 2011-09-06 2016-03-08 Go Daddy Operating Company, LLC Method and apparatus for forming a structured document from unstructured information
DK2639749T3 (en) 2012-03-15 2017-02-27 Cortical Io Gmbh Methods, apparatus and products for semantic processing of text
US9008443B2 (en) 2012-06-22 2015-04-14 Xerox Corporation System and method for identifying regular geometric structures in document pages
US20150100877A1 (en) 2012-06-29 2015-04-09 Yahoo! Inc. Method or system for automated extraction of hyper-local events from one or more web pages
US9280520B2 (en) * 2012-08-02 2016-03-08 American Express Travel Related Services Company, Inc. Systems and methods for semantic information retrieval
US9582494B2 (en) 2013-02-22 2017-02-28 Altilia S.R.L. Object extraction from presentation-oriented documents using a semantic and spatial approach
US20140324808A1 (en) * 2013-03-15 2014-10-30 Sumeet Sandhu Semantic Segmentation and Tagging and Advanced User Interface to Improve Patent Search and Analysis
US9922102B2 (en) 2013-07-31 2018-03-20 Splunk Inc. Templates for defining fields in machine data
GB2517976A (en) 2013-09-09 2015-03-11 Ibm Business rule management system
US20150089399A1 (en) 2013-09-26 2015-03-26 Polis Technology Inc. System and methods for real-time formation of groups and decentralized decision making
US9058374B2 (en) 2013-09-26 2015-06-16 International Business Machines Corporation Concept driven automatic section identification
US20150134321A1 (en) 2013-11-08 2015-05-14 Thomas Fennell System and method for translating text
US9396763B2 (en) 2013-11-15 2016-07-19 Clipmine, Inc. Computer-assisted collaborative tagging of video content for indexing and table of contents generation
US10424016B2 (en) 2013-12-19 2019-09-24 International Business Machines Corporation Modeling asset transfer flow relationships discovered in unstructured data
US10055402B2 (en) 2014-03-17 2018-08-21 Accenture Global Services Limited Generating a semantic network based on semantic connections between subject-verb-object units
US10140578B1 (en) 2014-03-17 2018-11-27 Intuit Inc. System and method for managing social-based questions and answers
US9477654B2 (en) * 2014-04-01 2016-10-25 Microsoft Corporation Convolutional latent semantic models and their applications
US9760626B2 (en) 2014-09-05 2017-09-12 International Business Machines Corporation Optimizing parsing outcomes of documents
US10325511B2 (en) 2015-01-30 2019-06-18 Conduent Business Services, Llc Method and system to attribute metadata to preexisting documents
EP3057009A1 (en) 2015-02-10 2016-08-17 ResearchGate GmbH Online publication system and method
US20160267165A1 (en) 2015-03-14 2016-09-15 Hui Wang Automated Key Words (Phrases) Discovery In Document Stacks And Its Application To Document Classification, Aggregation, and Summarization
US9940681B2 (en) 2015-09-01 2018-04-10 International Business Machines Corporation Predictive approach to contract management
US10504010B2 (en) 2015-10-02 2019-12-10 Baidu Usa Llc Systems and methods for fast novel visual concept learning from sentence descriptions of images
US9760556B1 (en) 2015-12-11 2017-09-12 Palantir Technologies Inc. Systems and methods for annotating and linking electronic documents
US10755804B2 (en) 2016-08-10 2020-08-25 Talix, Inc. Health information system for searching, analyzing and annotating patient data
JP2018045664A (ja) 2016-09-16 2018-03-22 株式会社リコー 利用量管理装置、利用量管理方法、利用量管理プログラム、及び、利用量管理システム
US20180150768A1 (en) 2016-11-30 2018-05-31 Gluru Limited Automated generation of natural language task/expectation descriptions
US10380228B2 (en) 2017-02-10 2019-08-13 Microsoft Technology Licensing, Llc Output generation based on semantic expressions
WO2018170321A1 (en) 2017-03-15 2018-09-20 Exari Group, Inc. Machine evaluation of contract terms
US20180300315A1 (en) 2017-04-14 2018-10-18 Novabase Business Solutions, S.A. Systems and methods for document processing using machine learning
US10540440B2 (en) 2017-06-05 2020-01-21 International Business Machines Corporation Relation extraction using Q and A
EP3688609A1 (en) 2017-09-28 2020-08-05 Oracle International Corporation Determining cross-document rhetorical relationships based on parsing and identification of named entities
EP3462331B1 (en) 2017-09-29 2021-08-04 Tata Consultancy Services Limited Automated cognitive processing of source agnostic data
US20190102697A1 (en) 2017-10-02 2019-04-04 International Business Machines Corporation Creating machine learning models from structured intelligence databases
US10838996B2 (en) * 2018-03-15 2020-11-17 International Business Machines Corporation Document revision change summarization
US10650186B2 (en) 2018-06-08 2020-05-12 Handycontract, LLC Device, system and method for displaying sectioned documents
US10891316B2 (en) 2018-07-02 2021-01-12 Salesforce.Com, Inc. Identifying homogenous clusters
US11232132B2 (en) * 2018-11-30 2022-01-25 Wipro Limited Method, device, and system for clustering document objects based on information content
US20200311123A1 (en) 2019-03-28 2020-10-01 Wipro Limited Method and a system for multimodal search key based multimedia content extraction
US10614345B1 (en) * 2019-04-12 2020-04-07 Ernst & Young U.S. Llp Machine learning based extraction of partition objects from electronic documents
WO2021055102A1 (en) 2019-09-16 2021-03-25 Docugami, Inc. Cross-document intelligent authoring and processing assistant
JP2022547750A (ja) 2019-09-16 2022-11-15 ドキュガミ インコーポレイテッド クロスドキュメントインテリジェントオーサリングおよび処理アシスタント

Similar Documents

Publication Publication Date Title
JPWO2021055102A5 (ja)
WO2019218514A1 (zh) 网页目标信息的提取方法、装置及存储介质
JP5751251B2 (ja) 意味抽出装置、意味抽出方法、および、プログラム
CA3088695C (en) Method and system for decoding user intent from natural language queries
JP5534280B2 (ja) テキストクラスタリング装置、テキストクラスタリング方法、およびプログラム
CN109074642A (zh) 机器学习装置
JP6150291B2 (ja) 矛盾表現収集装置及びそのためのコンピュータプログラム
US9697099B2 (en) Real-time or frequent ingestion by running pipeline in order of effectiveness
WO2022078308A1 (zh) 裁判文书摘要生成方法、装置、电子设备及可读存储介质
WO2022222300A1 (zh) 开放关系抽取方法、装置、电子设备及存储介质
CN110162630A (zh) 一种文本去重的方法、装置及设备
JPWO2020243499A5 (ja)
TW200527229A (en) Learning and using generalized string patterns for information extraction
JP7281905B2 (ja) 文書評価装置、文書評価方法及びプログラム
US11481202B2 (en) Transformation templates to automate aspects of computer programming
CN111666415A (zh) 话题聚类方法、装置、电子设备及存储介质
Rupp et al. Dealing with heterogeneous big data when geoparsing historical corpora
CA3149710A1 (en) Data collecting method, device, computer equipment and storage medium
JP2022041801A (ja) 領域固有ナレッジベースを用いて高度なレビューの理解を得るためのシステム及び方法
CN111078881B (zh) 细粒度情感分析方法、系统、电子设备和存储介质
Eyal et al. Large scale substitution-based word sense induction
JP2018063600A (ja) 情報処理装置、情報処理方法およびプログラム
CN111639250B (zh) 企业描述信息获取方法、装置、电子设备及存储介质
US12014276B2 (en) Deterministic training of machine learning models
CN111222032B (zh) 舆情分析方法及相关设备