JPWO2021055102A5 - - Google Patents
Download PDFInfo
- Publication number
- JPWO2021055102A5 JPWO2021055102A5 JP2022542307A JP2022542307A JPWO2021055102A5 JP WO2021055102 A5 JPWO2021055102 A5 JP WO2021055102A5 JP 2022542307 A JP2022542307 A JP 2022542307A JP 2022542307 A JP2022542307 A JP 2022542307A JP WO2021055102 A5 JPWO2021055102 A5 JP WO2021055102A5
- Authority
- JP
- Japan
- Prior art keywords
- chunks
- semantic role
- documents
- labels
- computer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Claims (20)
- ドキュメントを分析および改善する命令を実行するコンピュータシステムで実行されるコンピュータ実行方法であって、
複数のドキュメントを含むドキュメントセットにアクセスすることであって、前記ドキュメントセットは、前記ドキュメントセットの個々のドキュメント内のチャンクも識別する、ことと、
セマンティックロールラベルを複数のチャンクに自動的に割り当てることであって、前記セマンティックロールラベルは、前記ドキュメントによって記述されるトランザクションにおける前記チャンクによって果たされるセマンティックロールを記述し、セマンティックロールラベルを前記チャンクに自動的に割り当てることは、(a)機械学習および/または自然言語処理方法を使用してチャンクのセマンティックロールを決定することを含み、(b)前記ドキュメントセットにわたる異なるドキュメントにおけるカウンターパートチャンクの発生のパターンにも基づいており、前記カウンターパートチャンクは、それぞれのドキュメント内で同じセマンティックロールを果たす異なるドキュメント内の異なるチャンクである、ことと
前記ドキュメントセット内のドキュメントのさらなる処理において、前記チャンクおよびそれらのセマンティックロールラベルを使用することと、
を含むコンピュータ実行方法。 - 前記ドキュメントセット内の複数のドキュメントは、全て同じドキュメントタイプである、請求項1のコンピュータ実行方法。
- 前記ドキュメントセット内の前記チャンクは、
ドキュメントテンプレートにおけるフィールドとして使用するのに適した前記ドキュメント内のコンテンツを含むフィールドチャンクであって、前記フィールドチャンクのいくつかは階層的であり、サブチャンクとして他のチャンクを含む、フィールドチャンクと、
前記ドキュメントのレイアウト内の構造を含むコンテンツを含む構造チャンクと、
を含む、請求項1のコンピュータ実行方法。 - 前記ドキュメントセットは法律ドキュメントを含み、前記セマンティックロールは、(a)前記法律ドキュメントの当事者によって果たされる役割と、(b)日付、期間または他の時間表現によって果たされる役割とを含む、請求項1のコンピュータ実行方法。
- セマンティックロールラベルをチャンクに自動的に割り当てることは、
前記セマンティックロールラベルのいくつかをチャンクから自動的に抽出することと、
前記抽出されたセマンティックロールラベルをチャンクに割り当てることと、
を含む、請求項1のコンピュータ実行方法。 - セマンティックロールラベルをチャンクに自動的に割り当てることは、
機械学習を使用して、(a)個々のドキュメント内のチャンクのコンテンツ、レイアウト、およびコンテキストに基づいて、(b)前記ドキュメントセット内の前記ドキュメントにわたるチャンクのコンテンツ、レイアウト、およびコンテキストのパターンに基づいて、ならびに(c)チャンクのデータタイプに基づいて、チャンクからセマンティックロールラベルを自動的に抽出することと
前記抽出されたセマンティックロールラベルをチャンクに割り当てることと、
を含む、請求項1のコンピュータ実行方法。 - セマンティックロールラベルをチャンクに自動的に割り当てることは、
オートエンコーダ機械学習技術を使用して、前記セマンティックロールラベルのいくつかを自動的に抽出することと、
前記抽出されたセマンティックロールラベルをチャンクに割り当てることと、
を含む、請求項1のコンピュータ実行方法。 - セマンティックロールラベルをチャンクに自動的に割り当てることは、
候補セマンティックロールラベルを前記チャンクから自動的に抽出することと、
機械学習を使用して、前記候補セマンティックロールラベルをリファインすることと、
前記抽出されたセマンティックロールラベルをチャンクに割り当てることと、
を含む、請求項1のコンピュータ実行方法。 - セマンティックロールラベルをチャンクに自動的に割り当てることは、
前記ドキュメントセット内の異なるドキュメントからのチャンクのコンテンツ、レイアウトおよび/またはコンテキストの類似性に基づいて、チャンクから前記セマンティックロールラベルのいくつかを自動的に抽出することと
前記抽出されたセマンティックロールラベルをチャンクに割り当てることと、
を含む、請求項1のコンピュータ実行方法。 - セマンティックロールラベルをチャンクに自動的に割り当てることは、
候補セマンティックロールラベルをチャンクに割り当てることと、
前記チャンクによって果たされる前記セマンティックロールの類似性に基づいて、チャンクをクラスタにグループ化することと、
クラスタ内の前記チャンクの間の前記候補セマンティックロールラベルを標準化することと、
前記標準化されたセマンティックロールラベルをチャンクに割り当てることと、
を含む、請求項1のコンピュータ実行方法。 - セマンティックロールラベルをチャンクに自動的に割り当てることは、
候補セマンティックロールラベルをチャンクに割り当てることと、
前記チャンクのサイズおよびテキスト埋め込みの類似性に基づいて、チャンクをチャンククラスタにグループ化することと、
前記候補セマンティックロールラベルのテキスト埋め込みの類似性に基づいて、候補セマンティックロールラベルをラベルクラスタにグループ化することと、
前記チャンククラスタおよび前記ラベルクラスタに基づいて前記候補セマンティックロールラベルを標準化することと、
前記標準化されたセマンティックロールラベルをチャンクに割り当てることと、
を含む、請求項1のコンピュータ実行方法。 - セマンティックロールラベルをチャンクに自動的に割り当てることは、
候補セマンティックロールラベルをドキュメントのセクションを含むチャンクに割り当てることであって、前記候補セマンティックロールラベルが前記セクションの見出しに基づいている、ことと、
前記セクション内のコンテンツの類似性に基づいて、前記チャンクをクラスタにグループ化することと、
前記候補セマンティックロールラベルを、クラスタ内の全てのチャンクの前記セマンティックロールラベルとして最も一般的な候補セマンティックロールラベルを選択することによって標準化することと、
前記標準化されたセマンティックロールラベルをチャンクに割り当てることと、
を含む、請求項1のコンピュータ実行方法。 - 前記セマンティックロールラベルは、セマンティックロールラベルの所定のセットから選択される、請求項1のコンピュータ実行方法。
- 前記セマンティックロールラベルは、前記ドキュメントセット内のドキュメントのさらなる処理のために使用されるソフトウェアアプリケーションによって認識されるラベルを含む、請求項1のコンピュータ実行方法。
- セマンティックロールラベルをチャンクに自動的に割り当てることは、
(a)機械学習を使用して、近くにある他のチャンクに基づいて、または前記チャンクを含むチャンクを含むことに基づいて、チャンクのセマンティックロールを決定すること、または
(b)近くのチャンクの文法的構造に基づいて、自然言語処理方法を使用して、チャンクのセマンティックロールを決定すること、
の少なくとも1つを含む、請求項1のコンピュータ実行方法。 - 前記チャンクのいくつかは名前付きエンティティ認識であり、そのようなチャンクは、前記ドキュメント内のそれらの前記チャンクによって果たされる前記セマンティックロールに対するセマンティックロールラベルでラベル付けされ、そのようなチャンクはまた、前記チャンクのデータタイプでラベル付けされる、請求項1のコンピュータ実行方法。
- 前記チャンクのいくつかは前記ドキュメント内のマルチパラグラフ構造であり、そのようなチャンクは、前記ドキュメント内のそれらのチャンクによって果たされる前記セマンティックロールに対するセマンティックロールラベルでラベル付けされる、請求項1のコンピュータ実行方法。
- 前記自動的に割り当てられたセマンティックロールラベルの信頼レベルを推定することと、
前記推定された信頼レベルに基づいて、確認のためにいくつかの割り当てをユーザに提示することと、
前記自動的に割り当てられたセマンティックロールラベルに対するユーザフィードバックを受信することと、
前記ユーザフィードバックに応答して、前記機械学習および/または自然言語処理方法を改善することと、
をさらに含む、請求項1のコンピュータ実行方法。 - ドキュメントを分析および改善するための実行可能なコンピュータプログラム命令を格納する非一時的コンピュータ可読記憶媒体であって、前記コンピュータプログラム命令は、コンピュータシステムによって実行可能であり、前記コンピュータシステムに
複数のドキュメントを含むドキュメントセットにアクセスすることであって、前記ドキュメントセットは、前記ドキュメントセットの個々のドキュメント内のチャンクも識別する、ことと、
セマンティックロールラベルを複数のチャンクに自動的に割り当てることであって、前記セマンティックロールラベルは、前記ドキュメントによって記述されるトランザクションにおける前記チャンクによって果たされるセマンティックロールを記述し、セマンティックロールラベルを前記チャンクに自動的に割り当てることは、(a)機械学習および/または自然言語処理方法を使用してチャンクのセマンティックロールを決定することを含み、(b)前記ドキュメントセットにわたる異なるドキュメントにおけるカウンターパートチャンクの発生のパターンにも基づいており、前記カウンターパートチャンクは、それぞれのドキュメント内で同じセマンティックロールを果たす異なるドキュメント内の異なるチャンクである、ことと
前記チャンクおよびそれらのセマンティックロールラベルを、前記ドキュメントセット内のドキュメントのさらなる処理のために利用可能にすることと
を含む方法を実行させる、非一時的コンピュータ可読記憶媒体。 - ドキュメントを分析および改善するコンピュータシステムであって、
複数のドキュメントを含むドキュメントセットを受信して格納する記憶媒体であって、前記ドキュメントセットはまた、前記ドキュメントセットの個々のドキュメント内のチャンクを識別する、記憶媒体と
前記記憶媒体へのアクセスを有し、ドキュメントを分析および改善するアプリケーションプログラムを実行するプロセッサシステムと、
を含み、
前記プロセッサシステムが
セマンティックロールラベルを複数の前記チャンクに自動的に割り当て、前記セマンティックロールラベルは、前記ドキュメントによって記述されるトランザクションにおける前記チャンクによって果たされるセマンティックロールを記述し、セマンティックロールラベルを前記チャンクに自動的に割り当てることは、(a)機械学習および/または自然言語処理方法を使用してチャンクのセマンティックロールを決定することを含み、(b)前記ドキュメントセットにわたる異なるドキュメントにおけるカウンターパートチャンクの発生のパターンにも基づいており、前記カウンターパートチャンクは、それぞれのドキュメント内で同じセマンティックロールを果たす異なるドキュメント内の異なるチャンクであり、
前記チャンクおよびそれらのセマンティックロールラベルを前記ドキュメントセット内のドキュメントのさらなる処理のために利用可能にする、
前記アプリケーションプログラムを実行する、
コンピュータシステム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962900793P | 2019-09-16 | 2019-09-16 | |
US62/900,793 | 2019-09-16 | ||
PCT/US2020/043606 WO2021055102A1 (en) | 2019-09-16 | 2020-07-24 | Cross-document intelligent authoring and processing assistant |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022547750A JP2022547750A (ja) | 2022-11-15 |
JPWO2021055102A5 true JPWO2021055102A5 (ja) | 2023-08-01 |
Family
ID=74867926
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022542307A Pending JP2022547750A (ja) | 2019-09-16 | 2020-07-24 | クロスドキュメントインテリジェントオーサリングおよび処理アシスタント |
Country Status (6)
Country | Link |
---|---|
US (7) | US11514238B2 (ja) |
EP (1) | EP4028961A4 (ja) |
JP (1) | JP2022547750A (ja) |
KR (1) | KR20220059526A (ja) |
CN (1) | CN114616572A (ja) |
CA (1) | CA3150535A1 (ja) |
Families Citing this family (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3460685A1 (en) * | 2017-09-12 | 2019-03-27 | Bricsys NV | Improved semantic classification of an entity in a building information model |
JP2022547750A (ja) | 2019-09-16 | 2022-11-15 | ドキュガミ インコーポレイテッド | クロスドキュメントインテリジェントオーサリングおよび処理アシスタント |
US11875778B1 (en) * | 2019-11-15 | 2024-01-16 | Yahoo Assets Llc | Systems and methods for voice rendering of machine-generated electronic messages |
US11763071B2 (en) * | 2020-01-06 | 2023-09-19 | Catachi Co. | Methods and systems for facilitating unifying of multiple regulatory documents |
US20220092097A1 (en) * | 2020-09-18 | 2022-03-24 | Anurag Gupta | Method for Extracting and Organizing Information from a Document |
US20220156489A1 (en) * | 2020-11-18 | 2022-05-19 | Adobe Inc. | Machine learning techniques for identifying logical sections in unstructured data |
CN112435651B (zh) * | 2020-11-20 | 2023-05-02 | 昆明学院 | 一种语音数据自动标注的质量评估方法 |
EP4295267A1 (en) * | 2021-02-17 | 2023-12-27 | Applica Sp. z.o.o. | Iterative training for text-image-layout transformer |
US11594054B2 (en) * | 2021-02-19 | 2023-02-28 | Capital One Services, Llc | Document lineage management system |
US11790568B2 (en) * | 2021-03-29 | 2023-10-17 | Kyndryl, Inc | Image entity extraction and granular interactivity articulation |
US11521639B1 (en) * | 2021-04-02 | 2022-12-06 | Asapp, Inc. | Speech sentiment analysis using a speech sentiment classifier pretrained with pseudo sentiment labels |
US20220366188A1 (en) * | 2021-04-29 | 2022-11-17 | International Business Machines Corporation | Parameterized neighborhood memory adaptation |
US20220358287A1 (en) * | 2021-05-10 | 2022-11-10 | International Business Machines Corporation | Text mining based on document structure information extraction |
US11755839B2 (en) * | 2021-05-19 | 2023-09-12 | International Business Machines Corporation | Low resource named entity recognition for sensitive personal information |
WO2023287952A1 (en) * | 2021-07-14 | 2023-01-19 | Kpmg Llp | System and method for implementing a medical records analytics platform |
US11763803B1 (en) | 2021-07-28 | 2023-09-19 | Asapp, Inc. | System, method, and computer program for extracting utterances corresponding to a user problem statement in a conversation between a human agent and a user |
CN113505201A (zh) * | 2021-07-29 | 2021-10-15 | 宁波薄言信息技术有限公司 | 一种基于SegaBert预训练模型的合同抽取方法 |
CN113722555A (zh) * | 2021-07-29 | 2021-11-30 | 武汉光庭信息技术股份有限公司 | 一种数据标注项质检方法及系统 |
US20230074189A1 (en) * | 2021-08-19 | 2023-03-09 | Fmr Llc | Methods and systems for intelligent text classification with limited or no training data |
US11941147B2 (en) * | 2021-08-31 | 2024-03-26 | Box, Inc. | Detection of personally identifiable information |
US11657078B2 (en) | 2021-10-14 | 2023-05-23 | Fmr Llc | Automatic identification of document sections to generate a searchable data structure |
US11361151B1 (en) | 2021-10-18 | 2022-06-14 | BriefCatch LLC | Methods and systems for intelligent editing of legal documents |
WO2024072483A2 (en) * | 2022-04-12 | 2024-04-04 | The Trustees Of Dartmouth College | Processing architecture for fundamental symbolic logic operations and method for employing the same |
US11907643B2 (en) * | 2022-04-29 | 2024-02-20 | Adobe Inc. | Dynamic persona-based document navigation |
US20230350954A1 (en) * | 2022-05-02 | 2023-11-02 | SparkCognition, Inc. | Systems and methods of filtering topics using parts of speech tagging |
JP2023166252A (ja) * | 2022-05-09 | 2023-11-21 | キヤノン株式会社 | 情報処理装置、情報処理方法及びプログラム |
US11853335B1 (en) | 2022-06-13 | 2023-12-26 | International Business Machines Corporation | Cooperative build and content annotation for conversational design of virtual assistants |
US12026458B2 (en) | 2022-11-11 | 2024-07-02 | State Farm Mutual Automobile Insurance Company | Systems and methods for generating document templates from a mixed set of document types |
Family Cites Families (100)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU6245396A (en) | 1996-07-03 | 1998-02-02 | Polydoc N.V. | Document producing support system |
US6076051A (en) | 1997-03-07 | 2000-06-13 | Microsoft Corporation | Information retrieval utilizing semantic representation of text |
US7287219B1 (en) | 1999-03-11 | 2007-10-23 | Abode Systems Incorporated | Method of constructing a document type definition from a set of structured electronic documents |
US6924828B1 (en) | 1999-04-27 | 2005-08-02 | Surfnotes | Method and apparatus for improved information representation |
US20020002481A1 (en) * | 2000-05-16 | 2002-01-03 | Hirokazu Uchio | Information processing apparatus for management of documents relevant to patent application |
WO2002017128A1 (en) * | 2000-08-24 | 2002-02-28 | Science Applications International Corporation | Word sense disambiguation |
US7251781B2 (en) * | 2001-07-31 | 2007-07-31 | Invention Machine Corporation | Computer based summarization of natural language documents |
US9009590B2 (en) * | 2001-07-31 | 2015-04-14 | Invention Machines Corporation | Semantic processor for recognition of cause-effect relations in natural language documents |
US20040001099A1 (en) | 2002-06-27 | 2004-01-01 | Microsoft Corporation | Method and system for associating actions with semantic labels in electronic documents |
US7523394B2 (en) | 2002-06-28 | 2009-04-21 | Microsoft Corporation | Word-processing document stored in a single XML file that may be manipulated by applications that understand XML |
US20050027664A1 (en) * | 2003-07-31 | 2005-02-03 | Johnson David E. | Interactive machine learning system for automated annotation of information in text |
US20050060643A1 (en) | 2003-08-25 | 2005-03-17 | Miavia, Inc. | Document similarity detection and classification system |
US20050060140A1 (en) | 2003-09-15 | 2005-03-17 | Maddox Paul Christopher | Using semantic feature structures for document comparisons |
US20050108630A1 (en) | 2003-11-19 | 2005-05-19 | Wasson Mark D. | Extraction of facts from text |
US7742911B2 (en) | 2004-10-12 | 2010-06-22 | At&T Intellectual Property Ii, L.P. | Apparatus and method for spoken language understanding by using semantic role labeling |
US8719700B2 (en) | 2010-05-04 | 2014-05-06 | Xerox Corporation | Matching a page layout for each page of a document to a page template candidate from a list of page layout candidates |
US20060235870A1 (en) * | 2005-01-31 | 2006-10-19 | Musgrove Technology Enterprises, Llc | System and method for generating an interlinked taxonomy structure |
US7606781B2 (en) | 2005-03-30 | 2009-10-20 | Primal Fusion Inc. | System, method and computer program for facet analysis |
US8249344B2 (en) | 2005-07-01 | 2012-08-21 | Microsoft Corporation | Grammatical parsing of document visual structures |
US8176004B2 (en) | 2005-10-24 | 2012-05-08 | Capsilon Corporation | Systems and methods for intelligent paperless document management |
US20070150802A1 (en) * | 2005-12-12 | 2007-06-28 | Canon Information Systems Research Australia Pty. Ltd. | Document annotation and interface |
US7788579B2 (en) * | 2006-03-06 | 2010-08-31 | Ricoh Co., Ltd. | Automated document layout design |
US20080008391A1 (en) | 2006-07-10 | 2008-01-10 | Amir Geva | Method and System for Document Form Recognition |
US9495358B2 (en) | 2006-10-10 | 2016-11-15 | Abbyy Infopoisk Llc | Cross-language text clustering |
US8738359B2 (en) | 2006-10-18 | 2014-05-27 | Honda Motor Co., Ltd. | Scalable knowledge extraction |
US8671341B1 (en) | 2007-01-05 | 2014-03-11 | Linguastat, Inc. | Systems and methods for identifying claims associated with electronic text |
US7778953B2 (en) * | 2007-02-19 | 2010-08-17 | Kabushiki Kaisha Toshiba | Document management apparatus and document management method |
US8180633B2 (en) | 2007-03-08 | 2012-05-15 | Nec Laboratories America, Inc. | Fast semantic extraction using a neural network architecture |
US8209278B1 (en) | 2007-03-23 | 2012-06-26 | Jay Bradley Straus | Computer editing system for common textual patterns in legal documents |
WO2008132706A1 (en) | 2007-04-26 | 2008-11-06 | Markport Limited | A web browsing method and system |
US8527262B2 (en) * | 2007-06-22 | 2013-09-03 | International Business Machines Corporation | Systems and methods for automatic semantic role labeling of high morphological text for natural language processing applications |
US20090049018A1 (en) * | 2007-08-14 | 2009-02-19 | John Nicholas Gross | Temporal Document Sorter and Method Using Semantic Decoding and Prediction |
EP2185999A4 (en) | 2007-08-31 | 2011-11-02 | Microsoft Corp | SUBJECT OF SEARCH RESULTS BY MEANING OF TERM |
US8229730B2 (en) * | 2007-08-31 | 2012-07-24 | Microsoft Corporation | Indexing role hierarchies for words in a search index |
US8280885B2 (en) | 2007-10-29 | 2012-10-02 | Cornell University | System and method for automatically summarizing fine-grained opinions in digital text |
US8392436B2 (en) * | 2008-02-07 | 2013-03-05 | Nec Laboratories America, Inc. | Semantic search via role labeling |
US8145632B2 (en) | 2008-02-22 | 2012-03-27 | Tigerlogic Corporation | Systems and methods of identifying chunks within multiple documents |
US8196030B1 (en) | 2008-06-02 | 2012-06-05 | Pricewaterhousecoopers Llp | System and method for comparing and reviewing documents |
US8286132B2 (en) | 2008-09-25 | 2012-10-09 | International Business Machines Corporation | Comparing and merging structured documents syntactically and semantically |
US8214734B2 (en) | 2008-10-09 | 2012-07-03 | International Business Machines Corporation | Credibility of text analysis engine performance evaluation by rating reference content |
US20100153318A1 (en) * | 2008-11-19 | 2010-06-17 | Massachusetts Institute Of Technology | Methods and systems for automatically summarizing semantic properties from documents with freeform textual annotations |
US9460063B2 (en) | 2009-01-02 | 2016-10-04 | Apple Inc. | Identification, selection, and display of a region of interest in a document |
US9262395B1 (en) | 2009-02-11 | 2016-02-16 | Guangsheng Zhang | System, methods, and data structure for quantitative assessment of symbolic associations |
US8335754B2 (en) | 2009-03-06 | 2012-12-18 | Tagged, Inc. | Representing a document using a semantic structure |
WO2010120925A2 (en) * | 2009-04-15 | 2010-10-21 | Evri Inc. | Search and search optimization using a pattern of a location identifier |
JP5340847B2 (ja) | 2009-07-27 | 2013-11-13 | 株式会社日立ソリューションズ | 文書データ処理装置 |
JP5477635B2 (ja) * | 2010-02-15 | 2014-04-23 | ソニー株式会社 | 情報処理装置および方法、並びにプログラム |
US8805840B1 (en) | 2010-03-23 | 2014-08-12 | Firstrain, Inc. | Classification of documents |
US9129300B2 (en) | 2010-04-21 | 2015-09-08 | Yahoo! Inc. | Using external sources for sponsored search AD selection |
US9594730B2 (en) | 2010-07-01 | 2017-03-14 | Yahoo! Inc. | Annotating HTML segments with functional labels |
US20150112664A1 (en) | 2010-12-09 | 2015-04-23 | Rage Frameworks, Inc. | System and method for generating a tractable semantic network for a concept |
US8818932B2 (en) | 2011-02-14 | 2014-08-26 | Decisive Analytics Corporation | Method and apparatus for creating a predictive model |
US10303999B2 (en) * | 2011-02-22 | 2019-05-28 | Refinitiv Us Organization Llc | Machine learning-based relationship association and related discovery and search engines |
US8543577B1 (en) | 2011-03-02 | 2013-09-24 | Google Inc. | Cross-channel clusters of information |
US8719692B2 (en) | 2011-03-11 | 2014-05-06 | Microsoft Corporation | Validation, rejection, and modification of automatically generated document annotations |
US20120296637A1 (en) * | 2011-05-20 | 2012-11-22 | Smiley Edwin Lee | Method and apparatus for calculating topical categorization of electronic documents in a collection |
US8606780B2 (en) | 2011-07-08 | 2013-12-10 | Microsoft Corporation | Image re-rank based on image annotations |
US8488916B2 (en) | 2011-07-22 | 2013-07-16 | David S Terman | Knowledge acquisition nexus for facilitating concept capture and promoting time on task |
US9280525B2 (en) * | 2011-09-06 | 2016-03-08 | Go Daddy Operating Company, LLC | Method and apparatus for forming a structured document from unstructured information |
DK2639749T3 (en) | 2012-03-15 | 2017-02-27 | Cortical Io Gmbh | Methods, apparatus and products for semantic processing of text |
US9008443B2 (en) | 2012-06-22 | 2015-04-14 | Xerox Corporation | System and method for identifying regular geometric structures in document pages |
US20150100877A1 (en) | 2012-06-29 | 2015-04-09 | Yahoo! Inc. | Method or system for automated extraction of hyper-local events from one or more web pages |
US9280520B2 (en) * | 2012-08-02 | 2016-03-08 | American Express Travel Related Services Company, Inc. | Systems and methods for semantic information retrieval |
US9582494B2 (en) | 2013-02-22 | 2017-02-28 | Altilia S.R.L. | Object extraction from presentation-oriented documents using a semantic and spatial approach |
US20140324808A1 (en) * | 2013-03-15 | 2014-10-30 | Sumeet Sandhu | Semantic Segmentation and Tagging and Advanced User Interface to Improve Patent Search and Analysis |
US9922102B2 (en) | 2013-07-31 | 2018-03-20 | Splunk Inc. | Templates for defining fields in machine data |
GB2517976A (en) | 2013-09-09 | 2015-03-11 | Ibm | Business rule management system |
US20150089399A1 (en) | 2013-09-26 | 2015-03-26 | Polis Technology Inc. | System and methods for real-time formation of groups and decentralized decision making |
US9058374B2 (en) | 2013-09-26 | 2015-06-16 | International Business Machines Corporation | Concept driven automatic section identification |
US20150134321A1 (en) | 2013-11-08 | 2015-05-14 | Thomas Fennell | System and method for translating text |
US9396763B2 (en) | 2013-11-15 | 2016-07-19 | Clipmine, Inc. | Computer-assisted collaborative tagging of video content for indexing and table of contents generation |
US10424016B2 (en) | 2013-12-19 | 2019-09-24 | International Business Machines Corporation | Modeling asset transfer flow relationships discovered in unstructured data |
US10055402B2 (en) | 2014-03-17 | 2018-08-21 | Accenture Global Services Limited | Generating a semantic network based on semantic connections between subject-verb-object units |
US10140578B1 (en) | 2014-03-17 | 2018-11-27 | Intuit Inc. | System and method for managing social-based questions and answers |
US9477654B2 (en) * | 2014-04-01 | 2016-10-25 | Microsoft Corporation | Convolutional latent semantic models and their applications |
US9760626B2 (en) | 2014-09-05 | 2017-09-12 | International Business Machines Corporation | Optimizing parsing outcomes of documents |
US10325511B2 (en) | 2015-01-30 | 2019-06-18 | Conduent Business Services, Llc | Method and system to attribute metadata to preexisting documents |
EP3057009A1 (en) | 2015-02-10 | 2016-08-17 | ResearchGate GmbH | Online publication system and method |
US20160267165A1 (en) | 2015-03-14 | 2016-09-15 | Hui Wang | Automated Key Words (Phrases) Discovery In Document Stacks And Its Application To Document Classification, Aggregation, and Summarization |
US9940681B2 (en) | 2015-09-01 | 2018-04-10 | International Business Machines Corporation | Predictive approach to contract management |
US10504010B2 (en) | 2015-10-02 | 2019-12-10 | Baidu Usa Llc | Systems and methods for fast novel visual concept learning from sentence descriptions of images |
US9760556B1 (en) | 2015-12-11 | 2017-09-12 | Palantir Technologies Inc. | Systems and methods for annotating and linking electronic documents |
US10755804B2 (en) | 2016-08-10 | 2020-08-25 | Talix, Inc. | Health information system for searching, analyzing and annotating patient data |
JP2018045664A (ja) | 2016-09-16 | 2018-03-22 | 株式会社リコー | 利用量管理装置、利用量管理方法、利用量管理プログラム、及び、利用量管理システム |
US20180150768A1 (en) | 2016-11-30 | 2018-05-31 | Gluru Limited | Automated generation of natural language task/expectation descriptions |
US10380228B2 (en) | 2017-02-10 | 2019-08-13 | Microsoft Technology Licensing, Llc | Output generation based on semantic expressions |
WO2018170321A1 (en) | 2017-03-15 | 2018-09-20 | Exari Group, Inc. | Machine evaluation of contract terms |
US20180300315A1 (en) | 2017-04-14 | 2018-10-18 | Novabase Business Solutions, S.A. | Systems and methods for document processing using machine learning |
US10540440B2 (en) | 2017-06-05 | 2020-01-21 | International Business Machines Corporation | Relation extraction using Q and A |
EP3688609A1 (en) | 2017-09-28 | 2020-08-05 | Oracle International Corporation | Determining cross-document rhetorical relationships based on parsing and identification of named entities |
EP3462331B1 (en) | 2017-09-29 | 2021-08-04 | Tata Consultancy Services Limited | Automated cognitive processing of source agnostic data |
US20190102697A1 (en) | 2017-10-02 | 2019-04-04 | International Business Machines Corporation | Creating machine learning models from structured intelligence databases |
US10838996B2 (en) * | 2018-03-15 | 2020-11-17 | International Business Machines Corporation | Document revision change summarization |
US10650186B2 (en) | 2018-06-08 | 2020-05-12 | Handycontract, LLC | Device, system and method for displaying sectioned documents |
US10891316B2 (en) | 2018-07-02 | 2021-01-12 | Salesforce.Com, Inc. | Identifying homogenous clusters |
US11232132B2 (en) * | 2018-11-30 | 2022-01-25 | Wipro Limited | Method, device, and system for clustering document objects based on information content |
US20200311123A1 (en) | 2019-03-28 | 2020-10-01 | Wipro Limited | Method and a system for multimodal search key based multimedia content extraction |
US10614345B1 (en) * | 2019-04-12 | 2020-04-07 | Ernst & Young U.S. Llp | Machine learning based extraction of partition objects from electronic documents |
WO2021055102A1 (en) | 2019-09-16 | 2021-03-25 | Docugami, Inc. | Cross-document intelligent authoring and processing assistant |
JP2022547750A (ja) | 2019-09-16 | 2022-11-15 | ドキュガミ インコーポレイテッド | クロスドキュメントインテリジェントオーサリングおよび処理アシスタント |
-
2020
- 2020-07-24 JP JP2022542307A patent/JP2022547750A/ja active Pending
- 2020-07-24 KR KR1020227011501A patent/KR20220059526A/ko active IP Right Grant
- 2020-07-24 CA CA3150535A patent/CA3150535A1/en active Pending
- 2020-07-24 CN CN202080064610.1A patent/CN114616572A/zh active Pending
- 2020-07-24 EP EP20864772.7A patent/EP4028961A4/en active Pending
- 2020-08-05 US US16/986,142 patent/US11514238B2/en active Active
- 2020-08-05 US US16/986,151 patent/US11822880B2/en active Active
- 2020-08-05 US US16/986,136 patent/US11392763B2/en active Active
- 2020-08-05 US US16/986,139 patent/US11816428B2/en active Active
- 2020-08-05 US US16/986,146 patent/US11507740B2/en active Active
-
2022
- 2022-04-20 US US17/724,934 patent/US11960832B2/en active Active
-
2024
- 2024-03-19 US US18/609,740 patent/US20240232518A1/en active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPWO2021055102A5 (ja) | ||
WO2019218514A1 (zh) | 网页目标信息的提取方法、装置及存储介质 | |
JP5751251B2 (ja) | 意味抽出装置、意味抽出方法、および、プログラム | |
CA3088695C (en) | Method and system for decoding user intent from natural language queries | |
JP5534280B2 (ja) | テキストクラスタリング装置、テキストクラスタリング方法、およびプログラム | |
CN109074642A (zh) | 机器学习装置 | |
JP6150291B2 (ja) | 矛盾表現収集装置及びそのためのコンピュータプログラム | |
US9697099B2 (en) | Real-time or frequent ingestion by running pipeline in order of effectiveness | |
WO2022078308A1 (zh) | 裁判文书摘要生成方法、装置、电子设备及可读存储介质 | |
WO2022222300A1 (zh) | 开放关系抽取方法、装置、电子设备及存储介质 | |
CN110162630A (zh) | 一种文本去重的方法、装置及设备 | |
JPWO2020243499A5 (ja) | ||
TW200527229A (en) | Learning and using generalized string patterns for information extraction | |
JP7281905B2 (ja) | 文書評価装置、文書評価方法及びプログラム | |
US11481202B2 (en) | Transformation templates to automate aspects of computer programming | |
CN111666415A (zh) | 话题聚类方法、装置、电子设备及存储介质 | |
Rupp et al. | Dealing with heterogeneous big data when geoparsing historical corpora | |
CA3149710A1 (en) | Data collecting method, device, computer equipment and storage medium | |
JP2022041801A (ja) | 領域固有ナレッジベースを用いて高度なレビューの理解を得るためのシステム及び方法 | |
CN111078881B (zh) | 细粒度情感分析方法、系统、电子设备和存储介质 | |
Eyal et al. | Large scale substitution-based word sense induction | |
JP2018063600A (ja) | 情報処理装置、情報処理方法およびプログラム | |
CN111639250B (zh) | 企业描述信息获取方法、装置、电子设备及存储介质 | |
US12014276B2 (en) | Deterministic training of machine learning models | |
CN111222032B (zh) | 舆情分析方法及相关设备 |