JP2017084336A - 画像化された文書からテキストを抽出する方法及び装置 - Google Patents
画像化された文書からテキストを抽出する方法及び装置 Download PDFInfo
- Publication number
- JP2017084336A JP2017084336A JP2016162925A JP2016162925A JP2017084336A JP 2017084336 A JP2017084336 A JP 2017084336A JP 2016162925 A JP2016162925 A JP 2016162925A JP 2016162925 A JP2016162925 A JP 2016162925A JP 2017084336 A JP2017084336 A JP 2017084336A
- Authority
- JP
- Japan
- Prior art keywords
- partial image
- character
- cluster
- image
- designated character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 52
- 230000000007 visual effect Effects 0.000 claims abstract description 52
- 238000012015 optical character recognition Methods 0.000 claims description 74
- 238000004458 analytical method Methods 0.000 claims description 16
- 239000002131 composite material Substances 0.000 claims description 10
- 238000000605 extraction Methods 0.000 abstract description 24
- 230000000875 corresponding effect Effects 0.000 description 66
- 238000012545 processing Methods 0.000 description 44
- 230000006870 function Effects 0.000 description 41
- 230000015654 memory Effects 0.000 description 22
- 238000004891 communication Methods 0.000 description 14
- 230000008569 process Effects 0.000 description 14
- 238000010586 diagram Methods 0.000 description 13
- 238000007689 inspection Methods 0.000 description 9
- 238000005516 engineering process Methods 0.000 description 8
- 238000011160 research Methods 0.000 description 8
- 230000007547 defect Effects 0.000 description 6
- 230000008901 benefit Effects 0.000 description 5
- 230000002596 correlated effect Effects 0.000 description 5
- 238000007639 printing Methods 0.000 description 5
- 238000012790 confirmation Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 238000003384 imaging method Methods 0.000 description 3
- 230000011218 segmentation Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000002730 additional effect Effects 0.000 description 1
- 230000002547 anomalous effect Effects 0.000 description 1
- 230000003466 anti-cipated effect Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000003139 buffering effect Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000037303 wrinkles Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
- G06V20/63—Scene text, e.g. street names
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/762—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks
- G06V10/763—Non-hierarchical techniques, e.g. based on statistics of modelling distributions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/98—Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns
- G06V10/987—Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns with the intervention of an operator
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/12—Detection or correction of errors, e.g. by rescanning the pattern
- G06V30/127—Detection or correction of errors, e.g. by rescanning the pattern with the intervention of an operator
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Quality & Reliability (AREA)
- Character Discrimination (AREA)
- Character Input (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】抽出方法は、文書の画像を、文書中の個々の文字に対応する局所的な部分画像に分割するステップ、基準部分画像に対する部分画像それぞれの視覚的相関に基づいて、部分画像それぞれをクラスタに分類するステップを含む。基準部分画像とクラスタに分類される部分画像それぞれとの間の視覚的相関は、相関閾値を超える。さらに、クラスタに分類された部分画像に基づいてクラスタの指定文字を識別するステップ、指定文字を、クラスタに分類された部分画像それぞれに関連付けられた文書の画像中の位置に関連付けるステップを含む。
【選択図】図8
Description
104 消費者
106 レシート
108 市場調査エンティティ
110 データ処理機能
112、114 画像
202 通信インターフェース
204 バッチ指定器
206 画像分析器
208 文字識別器
210 ユーザインターフェース
212 符号化テキスト生成器
214 文字識別データベース
216 端末
302、304、402、601、602、603、604、605、606、607 部分画像
608 クラスタ
306、310 境界
308、706、708、710、712、716、718、720、722 隅
404 マージン
1412 プロセッサ
1413 ローカルメモリ
1414 揮発性メモリ
1416 不揮発性メモリ
1418 バス
1420 インターフェース回路
1422 入力装置
1424 出力装置
1426 ネットワーク
1428 大容量記憶装置
1432 符号化命令
Claims (20)
- プロセッサで、文書の画像を、前記文書中の個々の文字に対応する局所的な部分画像に分割するステップと、
前記プロセッサで、前記部分画像それぞれを、基準部分画像に対する前記部分画像それぞれの視覚的相関に基づいてクラスタに分類するステップであって、前記基準部分画像と前記クラスタに分類される前記部分画像それぞれとの間の前記視覚的相関が相関閾値を超える、ステップと、
前記プロセッサで、前記クラスタに分類された前記部分画像に基づいて前記クラスタの指定文字を識別するステップと、
前記プロセッサで、前記指定文字を、前記クラスタに分類された前記部分画像それぞれに関連付けられた前記文書の画像中の位置に関連付けるステップと、
を含む方法。 - 前記指定文字が、光学文字認識エンジンを使用せずに識別される、請求項1に記載の方法。
- 前記クラスタに関連付けられた代表部分画像を人間の点検者に提示することと、
前記人間の点検者から前記指定文字を示すフィードバックを受け取ることと、
により、前記クラスタの前記指定文字を識別するステップをさらに含む、請求項1に記載の方法。 - 前記指定文字が、前記クラスタに関連付けられた代表部分画像の光学文字認識に基づいて識別される、請求項1に記載の方法。
- 前記代表部分画像が、前記クラスタに分類された前記部分画像のうち1番目の部分画像に対応する、請求項4に記載の方法。
- 前記代表部分画像が、前記クラスタに分類された前記部分画像それぞれの合成である、請求項4に記載の方法。
- 変形部分画像を求めるために前記基準部分画像に対応する空間的向きを持つように前記部分画像のうち1番目の部分画像を変形することと、
前記変形部分画像の周囲にマージンを付加することと、
前記マージンで定義される境界内における、前記変形部分画像に相対的な前記基準部分画像の種々の位置について、前記変形部分画像と前記基準部分画像との間の相関値を計算することと、
前記相関値のうち最も大きい相関値を、前記基準部分画像に対する前記部分画像のうち前記1番目の部分画像の前記視覚的相関として割り当てることと、
により、前記基準部分画像に対する前記部分画像のうち1番目の部分画像の前記視覚的相関を求めるステップをさらに含む、請求項1に記載の方法。 - 前記クラスタの代表部分画像の光学文字認識分析の出力に基づいて、前記指定文字の信頼性を判定するステップと、
前記指定文字が信頼できると判定された場合、自動的に前記指定文字を前記クラスタに割り当てるステップと、
をさらに含む、請求項1に記載の方法。 - 前記指定文字が信頼できないと判定された場合、前記代表部分画像を、以前に人間の点検者によって検証された記憶されている指定文字に関連付けられた記憶されている部分画像と比較するステップと、
前記代表部分画像と前記記憶されている部分画像との間の視覚的相関が前記相関閾値を超える場合、前記記憶されている指定文字を、自動的に前記クラスタの前記指定文字として割り当てるステップと、
をさらに含む、請求項8に記載の方法。 - 前記指定文字が信頼できないと判定された場合、前記指定文字を検証するように人間の点検者を促すステップをさらに含む、請求項8に記載の方法。
- 前記クラスタの代表部分画像の光学文字認識分析で生成された位置誤差値が位置誤差閾値を満たさない場合に、前記指定文字が信頼できないと判定され、前記位置誤差値は、前記代表部分画像の中で識別された前記指定文字の境界の位置と前記代表部分画像の境界との差に相当する、請求項10に記載の方法。
- 前記光学文字認識分析で生成された信頼度値が信頼度の閾値を満たさない場合に、前記指定文字が信頼できないと判定される、請求項10に記載の方法。
- 前記指定文字を検証するように前記人間の点検者を促すステップが、
前記信頼度値が前記信頼度の閾値を満たさず、且つ確定閾値を満たす場合に、前記指定文字を前記代表部分画像と並べて表示し、前記指定文字が前記代表部分画像に対応することを確定するように前記人間の点検者に要求することと、
前記信頼度値が前記確定閾値を満たさない場合に、前記代表部分画像を表示し、前記代表部分画像を識別するように前記人間の点検者に要求することと、
を含む、請求項12に記載の方法。 - 前記代表部分画像の中にある前景画素であり、且つ前記代表部分画像の中で識別された前記指定文字の境界よりも外にある前景画素の量が画素閾値を満たさない場合に、前記指定文字が信頼できないと判定される請求項10に記載の方法。
- プロセッサを介して実装される画像分析器であって、文書の画像を、前記文書中の個々の文字に対応する局所的な部分画像に分割し、前記部分画像それぞれを、基準部分画像に対する前記部分画像それぞれの視覚的相関に基づいてクラスタに分類し、前記基準部分画像と前記クラスタに分類される前記部分画像それぞれとの間の前記視覚的相関が相関閾値を超える、画像分析器と、
前記プロセッサを介して実装される文字識別器であって、前記クラスタに分類された前記部分画像に基づいて前記クラスタの指定文字を識別する、文字識別器と、
前記プロセッサを介して実装される符号化テキスト生成器であって、前記指定文字を、前記クラスタに分類された前記部分画像それぞれに関連付けられた前記文書の画像中の位置に関連付ける、符号化テキスト生成器と、
を備える装置。 - 前記文字識別器が、
前記クラスタの代表部分画像の光学文字認識分析の出力に基づいて、前記指定文字の信頼性を判定し、
前記指定文字が信頼できると判定された場合、自動的に前記指定文字を前記クラスタに割り当てる、請求項15に記載の装置。 - 前記指定文字が信頼できないと判定された場合、前記文字識別器が、前記指定文字を検証するように人間の点検者を促す、請求項16に記載の装置。
- 命令を備えた有形のコンピュータ可読記憶媒体であって、該命令は、実行されると機械に、少なくとも、
文書の画像を、前記文書中の個々の文字に対応する局所的な部分画像に分割するステップと、
前記部分画像それぞれを、基準部分画像に対する前記部分画像それぞれの視覚的相関に基づいてクラスタに分類するステップであって、前記基準部分画像と前記クラスタに分類される前記部分画像それぞれとの間の前記視覚的相関が相関閾値を超える、ステップと、
前記クラスタに分類された前記部分画像に基づいて前記クラスタの指定文字を識別するステップと、
前記指定文字を、前記クラスタに分類された前記部分画像それぞれに関連付けられた前記文書の画像中の位置に関連付けるステップと、
を実行させる、有形のコンピュータ可読記憶媒体。 - 前記命令は、さらに前記機械に、
前記クラスタの代表部分画像の光学文字認識分析の出力に基づいて、前記指定文字の信頼性を判定するステップと、
前記指定文字が信頼できると判定された場合、自動的に前記指定文字を前記クラスタに割り当てるステップと、
を実行させる、請求項18に記載の有形のコンピュータ可読記憶媒体。 - 前記命令は、さらに前記機械に、前記指定文字が信頼できないと判定された場合、前記指定文字を検証するように人間の点検者を促すステップを実行させる、請求項19に記載の有形のコンピュータ可読記憶媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US14/927,014 US9684842B2 (en) | 2015-10-29 | 2015-10-29 | Methods and apparatus to extract text from imaged documents |
US14/927,014 | 2015-10-29 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017084336A true JP2017084336A (ja) | 2017-05-18 |
JP6366024B2 JP6366024B2 (ja) | 2018-08-01 |
Family
ID=58638513
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016162925A Expired - Fee Related JP6366024B2 (ja) | 2015-10-29 | 2016-08-23 | 画像化された文書からテキストを抽出する方法及び装置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US9684842B2 (ja) |
JP (1) | JP6366024B2 (ja) |
KR (1) | KR101783337B1 (ja) |
CN (1) | CN107045632B (ja) |
TW (1) | TWI606406B (ja) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10235585B2 (en) | 2016-04-11 | 2019-03-19 | The Nielsen Company (US) | Methods and apparatus to determine the dimensions of a region of interest of a target object from an image using target object landmarks |
US10176397B2 (en) * | 2016-10-30 | 2019-01-08 | Vium, Inc. | Method of reading degraded symbols |
US10402163B2 (en) * | 2017-02-14 | 2019-09-03 | Accenture Global Solutions Limited | Intelligent data extraction |
US10789281B2 (en) * | 2017-06-29 | 2020-09-29 | Xerox Corporation | Regularities and trends discovery in a flow of business documents |
US11410446B2 (en) | 2019-11-22 | 2022-08-09 | Nielsen Consumer Llc | Methods, systems, apparatus and articles of manufacture for receipt decoding |
CN110969044B (zh) * | 2019-11-29 | 2021-04-13 | 联想(北京)有限公司 | 一种扫码设备及扫码方法 |
CN111680688B (zh) * | 2020-06-10 | 2023-08-08 | 创新奇智(成都)科技有限公司 | 字符识别方法及装置、电子设备、存储介质 |
US11810380B2 (en) | 2020-06-30 | 2023-11-07 | Nielsen Consumer Llc | Methods and apparatus to decode documents based on images using artificial intelligence |
KR102533962B1 (ko) | 2021-02-02 | 2023-05-22 | 서울대학교병원 | 안구 관련 데이터베이스 구축 시스템 및 방법 |
JP2022181367A (ja) * | 2021-05-26 | 2022-12-08 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置及びプログラム |
CN113077018A (zh) * | 2021-06-07 | 2021-07-06 | 浙江大华技术股份有限公司 | 一种目标对象识别方法、装置、存储介质及电子装置 |
US11822216B2 (en) | 2021-06-11 | 2023-11-21 | Nielsen Consumer Llc | Methods, systems, apparatus, and articles of manufacture for document scanning |
US11625930B2 (en) | 2021-06-30 | 2023-04-11 | Nielsen Consumer Llc | Methods, systems, articles of manufacture and apparatus to decode receipts based on neural graph architecture |
KR20230061026A (ko) | 2021-10-28 | 2023-05-08 | 유니원아이앤씨 주식회사 | 기울기 보정을 제공하는 문자 인식 시스템 |
TWI807467B (zh) * | 2021-11-02 | 2023-07-01 | 中國信託商業銀行股份有限公司 | 要項偵測模型建立方法、業務導向要項鍵值辨識系統及方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005352735A (ja) * | 2004-06-10 | 2005-12-22 | Fuji Xerox Co Ltd | 文書ファイル作成支援装置、文書ファイル作成支援方法及びそのプログラム |
JP2010055142A (ja) * | 2008-08-26 | 2010-03-11 | Fuji Xerox Co Ltd | 文書処理装置およびプログラム |
Family Cites Families (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5321773A (en) | 1991-12-10 | 1994-06-14 | Xerox Corporation | Image recognition method using finite state networks |
GB9226137D0 (en) | 1992-12-15 | 1993-02-10 | Ibm | Data entry system |
US5764799A (en) | 1995-06-26 | 1998-06-09 | Research Foundation Of State Of State Of New York | OCR method and apparatus using image equivalents |
US6915011B2 (en) | 2001-03-28 | 2005-07-05 | Eastman Kodak Company | Event clustering of images using foreground/background segmentation |
US7383258B2 (en) | 2002-10-03 | 2008-06-03 | Google, Inc. | Method and apparatus for characterizing documents based on clusters of related words |
CN1316418C (zh) * | 2004-04-16 | 2007-05-16 | 中国科学院自动化研究所 | 门牌号自动识别系统及方法 |
US7460710B2 (en) * | 2006-03-29 | 2008-12-02 | Amazon Technologies, Inc. | Converting digital images containing text to token-based files for rendering |
US8175394B2 (en) | 2006-09-08 | 2012-05-08 | Google Inc. | Shape clustering in post optical character recognition processing |
CN101329734B (zh) * | 2008-07-31 | 2010-08-25 | 重庆大学 | 基于k-l变换和ls-svm的车牌字符识别方法 |
US8116567B2 (en) * | 2008-10-07 | 2012-02-14 | International Business Machines Corporation | Digitizing documents |
US8331739B1 (en) | 2009-01-21 | 2012-12-11 | Google Inc. | Efficient identification and correction of optical character recognition errors through learning in a multi-engine environment |
US8391609B2 (en) * | 2009-02-24 | 2013-03-05 | Stephen G. Huntington | Method of massive parallel pattern matching against a progressively-exhaustive knowledge base of patterns |
US8285057B2 (en) | 2010-05-14 | 2012-10-09 | Palo Alto Research Center Incorporated | Learning image anchor templates for document classification |
US8635155B2 (en) | 2010-06-18 | 2014-01-21 | Fiserv, Inc. | Systems and methods for processing a payment coupon image |
US8340429B2 (en) | 2010-09-18 | 2012-12-25 | Hewlett-Packard Development Company, Lp | Searching document images |
US20120078682A1 (en) | 2010-09-29 | 2012-03-29 | The Npd Group, Inc. | Consumer receipt information methodologies and systems |
CN102136064A (zh) * | 2011-03-24 | 2011-07-27 | 成都四方信息技术有限公司 | 一种图像文字识别系统 |
US8509525B1 (en) | 2011-04-06 | 2013-08-13 | Google Inc. | Clustering of forms from large-scale scanned-document collection |
US8861861B2 (en) | 2011-05-10 | 2014-10-14 | Expensify, Inc. | System and method for processing receipts and other records of users |
US8831361B2 (en) | 2012-03-09 | 2014-09-09 | Ancora Software Inc. | Method and system for commercial document image classification |
US9384389B1 (en) * | 2012-09-12 | 2016-07-05 | Amazon Technologies, Inc. | Detecting errors in recognized text |
US20140181155A1 (en) | 2012-12-21 | 2014-06-26 | Dropbox, Inc. | Systems and methods for directing imaged documents to specified storage locations |
US8965127B2 (en) | 2013-03-14 | 2015-02-24 | Konica Minolta Laboratory U.S.A., Inc. | Method for segmenting text words in document images |
US8831329B1 (en) | 2013-06-28 | 2014-09-09 | Google Inc. | Extracting card data with card models |
CN103488983B (zh) * | 2013-09-13 | 2016-10-26 | 复旦大学 | 一种基于知识库的名片ocr数据修正方法和系统 |
CN103593645A (zh) * | 2013-10-11 | 2014-02-19 | 合肥工业大学 | 剪切图像源相机识别方法 |
-
2015
- 2015-10-29 US US14/927,014 patent/US9684842B2/en active Active
-
2016
- 2016-08-23 JP JP2016162925A patent/JP6366024B2/ja not_active Expired - Fee Related
- 2016-10-06 KR KR1020160129128A patent/KR101783337B1/ko active IP Right Grant
- 2016-10-28 TW TW105135125A patent/TWI606406B/zh not_active IP Right Cessation
- 2016-10-31 CN CN201610931615.5A patent/CN107045632B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005352735A (ja) * | 2004-06-10 | 2005-12-22 | Fuji Xerox Co Ltd | 文書ファイル作成支援装置、文書ファイル作成支援方法及びそのプログラム |
JP2010055142A (ja) * | 2008-08-26 | 2010-03-11 | Fuji Xerox Co Ltd | 文書処理装置およびプログラム |
Also Published As
Publication number | Publication date |
---|---|
KR101783337B1 (ko) | 2017-09-29 |
JP6366024B2 (ja) | 2018-08-01 |
TWI606406B (zh) | 2017-11-21 |
CN107045632A (zh) | 2017-08-15 |
CN107045632B (zh) | 2020-06-12 |
US9684842B2 (en) | 2017-06-20 |
US20170124413A1 (en) | 2017-05-04 |
KR20170051227A (ko) | 2017-05-11 |
TW201719505A (zh) | 2017-06-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6366024B2 (ja) | 画像化された文書からテキストを抽出する方法及び装置 | |
US11853347B2 (en) | Product auditing in point-of-sale images | |
US10891474B1 (en) | Optical receipt processing | |
JP6528147B2 (ja) | 会計データ入力支援システム、方法およびプログラム | |
US8494273B2 (en) | Adaptive optical character recognition on a document with distorted characters | |
CN109657673B (zh) | 图像识别方法和终端 | |
US9965695B1 (en) | Document image binarization method based on content type separation | |
US11574489B2 (en) | Image processing system, image processing method, and storage medium | |
US9959475B2 (en) | Table data recovering in case of image distortion | |
US20090196501A1 (en) | Method and Apparatus for Modifying the Histogram of an Image | |
US11341739B2 (en) | Image processing device, image processing method, and program recording medium | |
RU2581786C1 (ru) | Определение преобразований изображения для повышения качества оптического распознавания символов | |
CN111652208A (zh) | 用户界面组件的识别方法、装置、电子设备及存储介质 | |
CN111209865A (zh) | 文件内容提取方法、装置、电子设备及存储介质 | |
CN108090728B (zh) | 一种基于智能终端的快递信息录入方法及录入系统 | |
CN111199240A (zh) | 银行卡识别模型的训练方法、银行卡识别方法以及装置 | |
JP2019219901A (ja) | 情報処理システム | |
CN116030472A (zh) | 文字坐标确定方法及装置 | |
CN112434700A (zh) | 车牌识别方法、装置、设备及存储介质 | |
WO2023171132A1 (ja) | 情報処理システム | |
JP7343115B1 (ja) | 情報処理システム | |
CN114202761B (zh) | 一种基于图片信息聚类的信息批量提取方法 | |
CN116311292A (zh) | 单据图像信息提取方法、装置、计算机设备和存储介质 | |
CN113903040A (zh) | 购物小票的文字识别方法、设备、系统和计算机可读介质 | |
CN114092937A (zh) | 印章识别方法、装置、设备和介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170823 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20171003 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171226 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180605 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180625 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6366024 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |