JP2012212425A - 入力画像を分析する方法、入力画像を分析する装置およびコンピューター読み取り可能な媒体 - Google Patents
入力画像を分析する方法、入力画像を分析する装置およびコンピューター読み取り可能な媒体 Download PDFInfo
- Publication number
- JP2012212425A JP2012212425A JP2012034850A JP2012034850A JP2012212425A JP 2012212425 A JP2012212425 A JP 2012212425A JP 2012034850 A JP2012034850 A JP 2012034850A JP 2012034850 A JP2012034850 A JP 2012034850A JP 2012212425 A JP2012212425 A JP 2012212425A
- Authority
- JP
- Japan
- Prior art keywords
- input image
- image
- analyzing
- image analyzing
- features
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 32
- 238000004458 analytical method Methods 0.000 abstract description 7
- 230000011218 segmentation Effects 0.000 description 8
- 239000000872 buffer Substances 0.000 description 7
- 238000001514 detection method Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 238000000605 extraction Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 238000010191 image analysis Methods 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000003709 image segmentation Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012015 optical character recognition Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 238000003702 image correction Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 150000003212 purines Chemical class 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/414—Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/16—Image preprocessing
- G06V30/162—Quantising the image signal
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/146—Aligning or centring of the image pick-up or image-field
- G06V30/147—Determination of region of interest
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/16—Image preprocessing
- G06V30/1607—Correcting image deformation, e.g. trapezoidal deformation caused by perspective
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Graphics (AREA)
- Geometry (AREA)
- Artificial Intelligence (AREA)
- Image Analysis (AREA)
- Character Input (AREA)
- Studio Devices (AREA)
Abstract
【解決手段】入力画像を複数のピクセルのブロックに分割することにより入力画像から特徴画像を形成し、それにより入力画像における各ピクセルのブロックを特徴画像における1つのピクセルに結び付け、特徴画像をさらなる分析またはメモリーに記憶するために出力する。文書画像から特徴を抽出して分析することによりページ領域、歪み領域、および書物の背領域に結び付いて特定の特徴を検出する。抽出された特徴をさらに分析して段落、行、言葉、および文字レベルにおける文書の特徴を検出することができる。
【選択図】図2
Description
本発明はそのコンポーネントを用いてさまざまな拡張および分割化ソリューションを構築できるので、デジタル文書画像処理および操作用のスキャナーおよび画像ソフトウェアに適用される。
A.入力画像
B.特徴画像の形成
C.特徴画像の分析および分割
D.ページ領域、ページ配向、およびテキスト領域の検出
E.書物の背の検出、および
F.まとめの考察。
スキャナーは通常スキャン領域の表面全体をスキャンし、スキャナーの表面におけるスキャンされた文書のサイズおよび位置双方とも相当変化し得るので、本発明は特徴抽出(図3、ステップ304)を用いて後の分析用に特徴画像を形成する。スキャンプロセスの際デジタル化された文書画像に導入されるさまざまなスキャンの欠点および雑音に対し頑強さを達成するために、本発明は入力画像をブロック毎に処理する。
分析の目的および意図される用途双方により、上述の特徴抽出手順は特定寸法の特徴画像または1つ以上の特徴画像を形成するのに用いることができる。
従って、例えばオブジェクトのサイズおよび形状などのさまざまな幾何学的制約といった単純な制約のセットを用いて望ましくないオブジェクトを検討から外すことができる。このような幾何学的制約の具体的な形式は分割化の目標(例、テキストのページ領域の分割化対文字の分割化)および実施ストラテジーによりかなり異なることができる。例えば、本発明の用途の1つであるテキストのページ領域の検出の目的において、目標は小さなオブジェクトおよび不規則なアスペクト比の境界箱を有するオブジェクトを取り除くことが目標である。
方程式(5)における1つ以上の条件を満足するオブジェクトはオブジェクトリストから取り除かれ、これはバイナリーマップdにおける対応ピクセルd(m,n)をゼロに設定することを伴うことができる。方程式(5)は実施例であり、本発明は上述の実施形態に限定されないことが特記される。
Claims (20)
-
-
-
-
-
-
-
-
- 前記プロセッサーは前記オブジェクトを分析し前記オブジェクトの高さを前記オブジェクトの幅と比較して前記入力画像xにおけるページ配向を検出する請求項7に記載の入力画像を分析する方法。
- 前記プロセッサーは前記オブジェクトを分析して前記入力画像xにおける書物の背を検出する請求項7に記載の入力画像を分析する方法。
-
-
-
-
- 前記画像取り込み部はスキャン部である請求項11に記載の入力画像を分析する装置。
-
-
-
-
-
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US13/075,978 US8306335B2 (en) | 2011-03-30 | 2011-03-30 | Method of analyzing digital document images |
US13/075,978 | 2011-03-30 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012212425A true JP2012212425A (ja) | 2012-11-01 |
JP5994279B2 JP5994279B2 (ja) | 2016-09-21 |
Family
ID=46926913
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012034850A Expired - Fee Related JP5994279B2 (ja) | 2011-03-30 | 2012-02-21 | 入力画像を分析する方法、入力画像を分析する装置及びプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US8306335B2 (ja) |
JP (1) | JP5994279B2 (ja) |
CN (1) | CN102737240B (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8457403B2 (en) * | 2011-05-19 | 2013-06-04 | Seiko Epson Corporation | Method of detecting and correcting digital images of books in the book spine area |
US8559063B1 (en) | 2012-11-30 | 2013-10-15 | Atiz Innovation Co., Ltd. | Document scanning and visualization system using a mobile device |
US9588675B2 (en) | 2013-03-15 | 2017-03-07 | Google Inc. | Document scale and position optimization |
US20170083196A1 (en) * | 2015-09-23 | 2017-03-23 | Google Inc. | Computer-Aided Navigation of Digital Graphic Novels |
US10346723B2 (en) * | 2016-11-01 | 2019-07-09 | Snap Inc. | Neural network for object detection in images |
US11741732B2 (en) * | 2021-12-22 | 2023-08-29 | International Business Machines Corporation | Techniques for detecting text |
CN114170423B (zh) * | 2022-02-14 | 2022-06-28 | 成都数之联科技股份有限公司 | 一种图像文档版面识别方法、装置及其系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06309455A (ja) * | 1993-04-21 | 1994-11-04 | Olympus Optical Co Ltd | 画像2値化処理装置 |
JP2000261653A (ja) * | 1999-03-09 | 2000-09-22 | Hitachi Ltd | 画像処理装置 |
JP2001043312A (ja) * | 1999-05-26 | 2001-02-16 | Ricoh Co Ltd | 文書画像処理装置 |
JP2002232720A (ja) * | 2000-12-28 | 2002-08-16 | Xerox Corp | 被走査画像の適応照明補正方法及び装置 |
JP2005269451A (ja) * | 2004-03-19 | 2005-09-29 | Casio Comput Co Ltd | 画像処理装置、画像処理方法及びプログラム |
JP2008205964A (ja) * | 2007-02-21 | 2008-09-04 | Sharp Corp | 画像処理装置、画像形成装置、画像読取装置、画像処理プログラムおよび記録媒体 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6307962B1 (en) | 1995-09-01 | 2001-10-23 | The University Of Rochester | Document data compression system which automatically segments documents and generates compressed smart documents therefrom |
WO2001011864A2 (en) | 1999-08-11 | 2001-02-15 | Asci, Inc. | System and method for processing optically scanned documents |
NL1015943C2 (nl) * | 2000-08-16 | 2002-02-19 | Ocu Technologies B V | Interpretatie van gekleurde documenten. |
US6771836B2 (en) * | 2001-06-21 | 2004-08-03 | Microsoft Corporation | Zero-crossing region filtering for processing scanned documents |
US7693329B2 (en) | 2004-06-30 | 2010-04-06 | Lexmark International, Inc. | Bound document scanning method and apparatus |
US7379593B2 (en) * | 2005-12-21 | 2008-05-27 | Xerox Corporation | Method for image segmentation from proved detection of background and text image portions |
US20070201743A1 (en) * | 2006-02-28 | 2007-08-30 | Sharp Laboratories Of America, Inc. | Methods and systems for identifying characteristics in a digital image |
JP4764231B2 (ja) * | 2006-03-31 | 2011-08-31 | キヤノン株式会社 | 画像処理装置、制御方法、コンピュータプログラム |
KR100944002B1 (ko) * | 2006-07-14 | 2010-02-24 | 삼성전자주식회사 | 이미지 처리 장치 및 이미지 처리 방법 |
US7840071B2 (en) * | 2006-12-12 | 2010-11-23 | Seiko Epson Corporation | Method and apparatus for identifying regions of different content in an image |
US7899247B2 (en) * | 2007-01-24 | 2011-03-01 | Samsung Electronics Co., Ltd. | Apparatus and method of segmenting an image according to a cost function and/or feature vector and/or receiving a signal representing the segmented image in an image coding and/or decoding system |
US8355186B2 (en) * | 2009-02-10 | 2013-01-15 | Fuji Xerox Co., Ltd. | Systems and methods for interactive semi-automatic document scanning |
CN101833746B (zh) * | 2010-04-23 | 2012-05-30 | 北京大学 | 一种数字图像中可逆水印的嵌入方法及其提取方法 |
-
2011
- 2011-03-30 US US13/075,978 patent/US8306335B2/en active Active
-
2012
- 2012-02-17 CN CN201210037636.4A patent/CN102737240B/zh active Active
- 2012-02-21 JP JP2012034850A patent/JP5994279B2/ja not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06309455A (ja) * | 1993-04-21 | 1994-11-04 | Olympus Optical Co Ltd | 画像2値化処理装置 |
JP2000261653A (ja) * | 1999-03-09 | 2000-09-22 | Hitachi Ltd | 画像処理装置 |
JP2001043312A (ja) * | 1999-05-26 | 2001-02-16 | Ricoh Co Ltd | 文書画像処理装置 |
JP2002232720A (ja) * | 2000-12-28 | 2002-08-16 | Xerox Corp | 被走査画像の適応照明補正方法及び装置 |
JP2005269451A (ja) * | 2004-03-19 | 2005-09-29 | Casio Comput Co Ltd | 画像処理装置、画像処理方法及びプログラム |
JP2008205964A (ja) * | 2007-02-21 | 2008-09-04 | Sharp Corp | 画像処理装置、画像形成装置、画像読取装置、画像処理プログラムおよび記録媒体 |
Also Published As
Publication number | Publication date |
---|---|
CN102737240A (zh) | 2012-10-17 |
US8306335B2 (en) | 2012-11-06 |
US20120250105A1 (en) | 2012-10-04 |
CN102737240B (zh) | 2014-10-29 |
JP5994279B2 (ja) | 2016-09-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5994279B2 (ja) | 入力画像を分析する方法、入力画像を分析する装置及びプログラム | |
US9584729B2 (en) | Systems and methods for improving video captured using mobile devices | |
JP6965320B2 (ja) | 畳み込みニューラルネットワークを介してイメージ偽変造を探知するシステム、方法、及びこれを利用して無補正探知サービスを提供する方法 | |
US10108860B2 (en) | Systems and methods for generating composite images of long documents using mobile video data | |
JP4952625B2 (ja) | 透視変換歪み発生文書画像補正装置および方法 | |
JP2012243307A (ja) | 入力画像における歪を検出する方法、入力画像における歪を検出する装置およびコンピューター読み取り可能な媒体 | |
JP2010218551A (ja) | 顔認識方法、コンピューター読み取り可能な媒体および画像処理装置 | |
US9275448B2 (en) | Flash/no-flash imaging for binarization | |
US8073284B2 (en) | Thresholding gray-scale images to produce bitonal images | |
US10455163B2 (en) | Image processing apparatus that generates a combined image, control method, and storage medium | |
JP5640621B2 (ja) | 赤目オブジェクト候補を分類する方法、コンピューター読み取り可能な媒体および画像処理装置 | |
JP5640622B2 (ja) | 赤目オブジェクト候補を分類する方法、コンピューター読み取り可能な媒体および画像処理装置 | |
US8300927B2 (en) | Mouth removal method for red-eye detection and correction | |
US8260084B2 (en) | Binary image stitching based on grayscale approximation | |
KR101011908B1 (ko) | 디지털 이미지의 노이즈 감소 방법 및 이를 이용한 이미지 처리 장치 | |
JP2006514344A (ja) | 通信端末に装備したカメラによる情報のデジタル捕捉、記憶、及び送信方法 | |
KR101726692B1 (ko) | 객체 추출 장치 및 방법 | |
JP4779851B2 (ja) | オブジェクト検出装置 | |
WO2021098861A1 (zh) | 识别文本的方法、装置、识别设备和存储介质 | |
KR101601755B1 (ko) | 영상 특징 추출 방법 및 장치 및 이를 구현한 프로그램을 기록한 기록 매체 | |
JP6194677B2 (ja) | 画像処理装置およびプログラム | |
JP2006065816A (ja) | 顔検出装置、顔検出方法および顔検出プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20141119 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20150106 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150807 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150908 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20151105 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160119 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160314 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20160609 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20160617 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160726 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160808 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5994279 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |