JP2018506087A5 - - Google Patents

Download PDF

Info

Publication number
JP2018506087A5
JP2018506087A5 JP2016574128A JP2016574128A JP2018506087A5 JP 2018506087 A5 JP2018506087 A5 JP 2018506087A5 JP 2016574128 A JP2016574128 A JP 2016574128A JP 2016574128 A JP2016574128 A JP 2016574128A JP 2018506087 A5 JP2018506087 A5 JP 2018506087A5
Authority
JP
Japan
Prior art keywords
document
document image
image
visual
visual identifier
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2016574128A
Other languages
English (en)
Other versions
JP2018506087A (ja
Filing date
Publication date
Application filed filed Critical
Priority claimed from PCT/US2016/016104 external-priority patent/WO2016126665A1/en
Publication of JP2018506087A publication Critical patent/JP2018506087A/ja
Publication of JP2018506087A5 publication Critical patent/JP2018506087A5/ja
Pending legal-status Critical Current

Links

Images

Claims (19)

  1. 複数の文書を盛り込んだ画像から文書画像を抽出するための方法であって、
    複数の文書画像を含む複数文書画像を受信するステップを含み、各文書画像は文書に関連付けられ、前記方法はさらに、
    前記複数文書画像から複数の視覚的識別子を抽出するステップを含み、各視覚的識別子は、前記複数の文書画像のうちの1つに関連付けられ、前記方法はさらに、
    各文書画像を識別するために前記複数の視覚的識別子を分析するステップと、
    前記分析に基づいて各文書画像の画像エリアを判断するステップと、
    各文書画像をその画像エリアに基づいて抽出するステップとを含む、方法。
  2. 前記複数の視覚的識別子を分析するステップは、各視覚的識別子に関連付けられたメタデータを識別するために、少なくとも1つの機械撮像プロセスを実行するステップをさらに含む、請求項1に記載の方法。
  3. 各画像エリアを判断するステップは、各文書画像について、前記分析に基づいて境界を識別するステップをさらに含み、前記境界は前記文書画像のすべての視覚的識別子を含み、前記文書の前記画像エリアは前記境界によって規定される、請求項1に記載の方法。
  4. 各境界は、複数文書画像のうちテキストが見当たらない部分に基づいて識別される、請求項3に記載の方法。
  5. 複数のファイルを作成するステップをさらに含み、各ファイルは、抽出された前記文書画像のうちの1つを含む、請求項1に記載の方法。
  6. 各文書画像を抽出するステップは、前記文書画像をカットするステップ、前記文書画像をコピーするステップ、および前記文書画像をトリミングするステップのうちの少なくとも1つをさらに含む、請求項1に記載の方法。
  7. 各文書画像は視覚的識別子しきい値に基づいて識別され、前記視覚的識別子しきい値は、多数の視覚的識別子、ある特定の視覚的識別子、および視覚的識別子の組合せのうちのいずれかである、請求項1に記載の方法。
  8. 各文書画像について、必要な視覚的識別子がまだ抽出されていないかどうかを判断するステップと、
    少なくとも1つの必要な視覚的識別子がまだ抽出されていないと判断すると、前記少なくとも1つの必要な視覚的識別子を検索するステップとをさらに含む、請求項7に記載の方法。
  9. 各文書画像について、潜在的な付加価値税(VAT)払い戻しに関する資格を、前記視覚的識別子に基づいて判断するステップをさらに含む、請求項8に記載の方法。
  10. 請求項1に記載の方法を1つ以上の処理ユニットに実行させるための命令を格納した、コンピュータ読取可能媒体。
  11. 複数の文書を盛り込んだ画像から文書画像を抽出するためのシステムであって、
    処理システムと、
    メモリとを含み、
    前記メモリは命令を含み、前記命令は、処理システムによって実行されると、前記システムを、
    複数の文書画像を含む複数文書画像を受信するように構成し、各文書画像は文書に関連付けられ、さらに、
    前記複数文書画像から複数の視覚的識別子を抽出するように構成し、各視覚的識別子は前記複数の文書画像のうちの1つに関連付けられ、さらに、
    各文書画像を識別するために前記複数の視覚的識別子を分析し、
    前記分析に基づいて各文書画像の画像エリアを判断し、
    各文書画像をその画像エリアに基づいて抽出するように構成する、システム。
  12. 前記システムはさらに、各視覚的識別子に関連付けられたメタデータを識別するために、少なくとも1つの機械撮像プロセスを実行するように構成される、請求項11に記載のシステム。
  13. 前記システムはさらに、各文書画像について、前記分析に基づいて境界を識別するように構成され、前記境界は前記文書画像のすべての視覚的識別子を含み、前記文書の前記画像エリアは前記境界によって規定される、請求項11に記載のシステム。
  14. 各境界は、複数文書画像のうちテキストが見当たらない部分に基づいて識別される、請求項13に記載のシステム。
  15. 前記システムはさらに、複数のファイルを作成するように構成され、各ファイルは、抽出された前記文書画像のうちの1つを含む、請求項11に記載のシステム。
  16. 前記システムはさらに、前記文書画像をカットすること、前記文書画像をコピーすること、および前記文書画像をトリミングすることのうちの少なくとも1つを行なうように構成される、請求項11に記載のシステム。
  17. 各文書画像は視覚的識別子しきい値に基づいて識別され、前記視覚的識別子しきい値は、多数の視覚的識別子、ある特定の視覚的識別子、および視覚的識別子の組合せのうちのいずれかである、請求項11に記載のシステム。
  18. 前記システムはさらに、
    各文書画像について、必要な視覚的識別子がまだ抽出されていないかどうかを判断し、
    少なくとも1つの必要な視覚的識別子がまだ抽出されていないと判断すると、前記少なくとも1つの必要な視覚的識別子を検索するように構成される、請求項17に記載のシステム。
  19. 前記システムはさらに、各文書画像について、潜在的な付加価値税(VAT)払い戻しに関する資格を、前記視覚的識別子に基づいて判断するように構成される、請求項18に記載のシステム。
JP2016574128A 2015-02-04 2016-02-02 複数の文書を盛り込んだ画像から文書画像を抽出するためのシステムおよび方法 Pending JP2018506087A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201562111690P 2015-02-04 2015-02-04
US62/111,690 2015-02-04
PCT/US2016/016104 WO2016126665A1 (en) 2015-02-04 2016-02-02 A system and methods for extracting document images from images featuring multiple documents

Publications (2)

Publication Number Publication Date
JP2018506087A JP2018506087A (ja) 2018-03-01
JP2018506087A5 true JP2018506087A5 (ja) 2018-12-13

Family

ID=56554532

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016574128A Pending JP2018506087A (ja) 2015-02-04 2016-02-02 複数の文書を盛り込んだ画像から文書画像を抽出するためのシステムおよび方法

Country Status (5)

Country Link
US (1) US10621676B2 (ja)
EP (1) EP3149659A4 (ja)
JP (1) JP2018506087A (ja)
CN (1) CN106489156A (ja)
WO (1) WO2016126665A1 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018217891A1 (en) * 2017-05-23 2018-11-29 Vatbox, Ltd. System and method for identification of missing data elements in electronic documents
CN109146011B (zh) * 2017-06-16 2021-12-21 北京京华印象科技文化发展有限公司 一种信息分类处理方法与装置
CN109146010B (zh) * 2017-06-16 2021-12-21 北京京华印象科技文化发展有限公司 一种电子信息自动化处理方法与系统
CN109146009B (zh) * 2017-06-16 2021-12-10 北京京华印象科技文化发展有限公司 一种基于标记识别的信息处理方法、装置及终端
US11030450B2 (en) * 2018-05-31 2021-06-08 Vatbox, Ltd. System and method for determining originality of computer-generated images
CN111414111A (zh) * 2019-01-04 2020-07-14 珠海金山办公软件有限公司 一种页面裁剪方法及装置
CN109740548B (zh) * 2019-01-08 2020-12-08 北京易道博识科技有限公司 一种报销票据图像分割方法及系统
EP4198913A1 (en) * 2021-12-16 2023-06-21 Amadeus S.A.S. Method and device for scanning multiple documents for further processing

Family Cites Families (68)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5606609A (en) 1994-09-19 1997-02-25 Scientific-Atlanta Electronic document verification system and method
US5903876A (en) 1997-11-21 1999-05-11 Va-T-En, L.L.C., A Limited Method of refunding value added tax
US7215773B1 (en) 1998-10-14 2007-05-08 Certicom.Corp. Key validation scheme
US20020091671A1 (en) 2000-11-23 2002-07-11 Andreas Prokoph Method and system for data retrieval in large collections of data
US20030163778A1 (en) 2002-02-28 2003-08-28 Michelle Shores System and method for improved validation for claims compliance
US7818657B1 (en) 2002-04-01 2010-10-19 Fannie Mae Electronic document for mortgage transactions
EP1359523A1 (en) 2002-05-02 2003-11-05 Accenture Global Services GmbH A tax transaction system
US20040010451A1 (en) 2002-07-12 2004-01-15 Romano Aaron A. Method and system for finalizing specific processes through a dynamic system
US20050004891A1 (en) 2002-08-12 2005-01-06 Mahoney John J. Methods and systems for categorizing and indexing human-readable data
US7519607B2 (en) 2002-08-14 2009-04-14 Anderson Iv Robert Computer-based system and method for generating, classifying, searching, and analyzing standardized text templates and deviations from standardized text templates
US20040068452A1 (en) 2002-10-02 2004-04-08 Ina Ullrich Computer-implemented method and system for determining and reporting VAT information and amounts for business transactions
US7305129B2 (en) * 2003-01-29 2007-12-04 Microsoft Corporation Methods and apparatus for populating electronic forms from scanned documents
SE0300692L (sv) 2003-03-12 2004-09-13 Global Refund Holdings Ab System för hantering av återbäring av mervärdesskatt
JP2004280274A (ja) 2003-03-13 2004-10-07 Toshiba Corp 情報読み取り装置、方法およびプログラム
US20050021410A1 (en) 2003-06-26 2005-01-27 Global Refund Holding Ab System for handling refund of value-added tax
US7827079B2 (en) 2003-06-30 2010-11-02 Ebay Inc. Method and system for assessing and reporting VAT charges for network-based marketplace services
SG111251A1 (en) 2003-10-31 2005-05-30 Global Refund Holdings Ab System for handling refunding of value-added tax
US7894670B2 (en) 2004-04-01 2011-02-22 Exbiblio B.V. Triggering actions in response to optically or acoustically capturing keywords from a rendered document
US8065611B1 (en) 2004-06-30 2011-11-22 Google Inc. Method and system for mining image searches to associate images with concepts
US7434058B2 (en) 2004-06-07 2008-10-07 Reconnex Corporation Generating signatures over a document
US8762191B2 (en) 2004-07-02 2014-06-24 Goldman, Sachs & Co. Systems, methods, apparatus, and schema for storing, managing and retrieving information
US8326775B2 (en) 2005-10-26 2012-12-04 Cortica Ltd. Signature generation for multimedia deep-content-classification by a large-scale matching system and method thereof
WO2007117334A2 (en) * 2006-01-03 2007-10-18 Kyos Systems Inc. Document analysis system for integration of paper records into a searchable electronic database
US20070217692A1 (en) 2006-03-17 2007-09-20 Data Trace Information Services, Llc Property record document data verification systems and methods
US20080079979A1 (en) 2006-09-29 2008-04-03 David Lowell Holt System and method for securing a document
JP4388545B2 (ja) 2006-12-27 2009-12-24 キヤノンソフトウェア株式会社 画像処理装置及び方法、並びにプログラム
US8009921B2 (en) 2008-02-19 2011-08-30 Xerox Corporation Context dependent intelligent thumbnail images
JP5239423B2 (ja) * 2008-03-17 2013-07-17 株式会社リコー 情報処理装置,情報処理方法,プログラム,および記録媒体
JP4538507B2 (ja) * 2008-05-02 2010-09-08 シャープ株式会社 画像照合方法、画像照合装置、画像データ出力処理装置、プログラム及び記憶媒体
US20100161616A1 (en) 2008-12-16 2010-06-24 Carol Mitchell Systems and methods for coupling structured content with unstructured content
US8774516B2 (en) 2009-02-10 2014-07-08 Kofax, Inc. Systems, methods and computer program products for determining document validity
JP5274305B2 (ja) * 2009-02-27 2013-08-28 キヤノン株式会社 画像処理装置、画像処理方法、コンピュータプログラム
GB2471072A (en) 2009-06-12 2010-12-22 Provenance Information Assurance Ltd Electronic document verification system
US8200642B2 (en) 2009-06-23 2012-06-12 Maze Gary R System and method for managing electronic documents in a litigation context
US20110016043A1 (en) * 2009-07-20 2011-01-20 Barbara Dornseif Account transaction value added tax reimbursement
BR112012002803A2 (pt) * 2009-08-07 2019-09-24 Google Inc método implementado por computador para processamento de uma consulta visual, sistema servidor,e, mídia de armazenamento não temporário legível por computador
US9158833B2 (en) 2009-11-02 2015-10-13 Harry Urbschat System and method for obtaining document information
WO2011041795A1 (en) * 2009-10-02 2011-04-07 Aravind Musuluri System and method for block segmenting, identifying and indexing visual elements, and searching documents
US8832853B2 (en) 2009-12-07 2014-09-09 Dst Technologies, Inc. Managed virtual point to point communication service having verified directory, secure transmission and controlled delivery
US9002838B2 (en) 2009-12-17 2015-04-07 Wausau Financial Systems, Inc. Distributed capture system for use with a legacy enterprise content management system
US20110255794A1 (en) 2010-01-15 2011-10-20 Copanion, Inc. Systems and methods for automatically extracting data by narrowing data search scope using contour matching
US20120078768A1 (en) 2010-09-24 2012-03-29 King Technology, Inc. Method and system for managing commodity transactions
US20120078682A1 (en) * 2010-09-29 2012-03-29 The Npd Group, Inc. Consumer receipt information methodologies and systems
US8275672B1 (en) 2011-04-04 2012-09-25 Google Inc. Coordinating multiple devices in a product purchasing system
US9846902B2 (en) 2011-07-19 2017-12-19 Slice Technologies, Inc. Augmented aggregation of emailed product order and shipping information
US8467606B2 (en) * 2011-08-25 2013-06-18 Eastman Kodak Company Method for segmenting a composite image
US8438089B1 (en) 2012-02-10 2013-05-07 Nice Systems Ltd. Method and apparatus for transaction verification
US8890978B1 (en) 2012-03-27 2014-11-18 Intuit Inc. Accurately extracting information using multiple images
US20140006234A1 (en) 2012-06-28 2014-01-02 Sap Ag Consistent interface for customer project expense list and deviating tax calculation rule
US20140108210A1 (en) * 2012-10-16 2014-04-17 American Express Travel Related Services Company, Inc. Systems and Methods for Expense Management
US20140207634A1 (en) 2013-01-19 2014-07-24 Kevin Edmonds Refund purchase system
DE112014001016T5 (de) 2013-02-27 2015-12-03 Vatbox Ltd. Web-basiertes System und Verfahren zur Verarbeitung der Mehrwertsteuerrückerstattung
US20150106247A1 (en) 2013-02-27 2015-04-16 Isaac SAFT System and method for pursuing a value-added tax (vat) reclaim through a mobile technology platform
US20150019409A1 (en) 2013-07-11 2015-01-15 Anvesh Yah Vagiri Systems and methods for location-based transaction information capturing
US9495347B2 (en) 2013-07-16 2016-11-15 Recommind, Inc. Systems and methods for extracting table information from documents
US10140257B2 (en) 2013-08-02 2018-11-27 Symbol Technologies, Llc Method and apparatus for capturing and processing content from context sensitive documents on a mobile device
US20170308517A1 (en) 2013-09-11 2017-10-26 Google Inc. Automatic generation of templates for parsing electronic documents
GB2523355A (en) 2014-02-21 2015-08-26 Mastercard International Inc System and method for recovering refundable taxes
GB2523596A (en) 2014-02-28 2015-09-02 Mastercard International Inc System and method for recovering refundable taxes
WO2015175722A1 (en) 2014-05-13 2015-11-19 Nant Holdings Ip, Llc Healthcare transaction validation via blockchain proof-of-work, systems and methods
US20150356174A1 (en) 2014-06-06 2015-12-10 Wipro Limited System and methods for capturing and analyzing documents to identify ideas in the documents
US9785693B2 (en) 2014-06-30 2017-10-10 Microsoft Technology Licensing, Llc Intelligent conflict detection and semantic expression of document edits
WO2017060850A1 (en) 2015-10-07 2017-04-13 Way2Vat Ltd. System and methods of an expense management system based upon business document analysis
US10127209B2 (en) 2015-11-24 2018-11-13 Bank Of America Corporation Transforming unstructured documents
US10445659B2 (en) 2016-06-03 2019-10-15 International Business Machines Corporation Machine learning for determining confidence for reclamation of storage volumes
EP3526759A4 (en) 2017-01-12 2020-04-01 Vatbox, Ltd. ELECTRONIC DOCUMENT NOTIFICATION GENERATION SYSTEM AND METHOD
WO2018217891A1 (en) 2017-05-23 2018-11-29 Vatbox, Ltd. System and method for identification of missing data elements in electronic documents
US11113557B2 (en) 2018-02-06 2021-09-07 Vatbox, Ltd. System and method for generating an electronic template corresponding to an image of an evidence

Similar Documents

Publication Publication Date Title
JP2018506087A5 (ja)
US9621571B2 (en) Apparatus and method for searching for similar malicious code based on malicious code feature information
CN107729526B (zh) 一种文本结构化的方法
WO2017160654A3 (en) Systems, methods, and computer readable media for extracting data from portable document format (pdf) files
US7937338B2 (en) System and method for identifying document structure and associated metainformation
CN109635148B (zh) 人脸图片存储方法及装置
JP2018128996A5 (ja)
JP2016508264A5 (ja)
RU2014112237A (ru) Ввод данных с изображений документов с фиксированной структурой
JP2017519300A5 (ja)
JP2017503273A5 (ja)
JP2014016823A5 (ja)
JP2017514211A5 (ja)
JP2015508205A5 (ja)
CN109472017B (zh) 获得待生成裁判文书本院认为段相关信息的方法及装置
KR20140031742A (ko) 이미지 특징 추출 장치 및 이미지 특징 추출 방법, 그를 이용한 영상 처리 시스템
JP2019512127A (ja) 文字列距離計算方法及び装置
SG10201710531VA (en) Program, information processing apparatus and method
CN112860855A (zh) 一种信息抽取方法、装置及电子设备
JP2016006646A5 (ja)
RU2015102525A (ru) Сегментация изображения для верификации данных
JP2016054564A5 (ja)
CN112418199B (zh) 多模态信息提取方法、装置、电子设备及存储介质
US20180173787A1 (en) Data search method and device
JP6427480B2 (ja) 画像検索装置、方法、及びプログラム