JP4469873B2 - 画像文書の検索装置、プログラム、及び記録媒体 - Google Patents
画像文書の検索装置、プログラム、及び記録媒体 Download PDFInfo
- Publication number
- JP4469873B2 JP4469873B2 JP2007137163A JP2007137163A JP4469873B2 JP 4469873 B2 JP4469873 B2 JP 4469873B2 JP 2007137163 A JP2007137163 A JP 2007137163A JP 2007137163 A JP2007137163 A JP 2007137163A JP 4469873 B2 JP4469873 B2 JP 4469873B2
- Authority
- JP
- Japan
- Prior art keywords
- feature
- image document
- image
- unit
- feature vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Processing Or Creating Images (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
2 画像前処理部
3 2値化処理部
4 ノイズ除去部
5 傾き補正部
6 エッジ除去部
7 特徴ベクトル生成部
8 矩形画像抽出部
9 ブロック分割部
10 特徴ブロック選択部
11 特徴算出部
12 特徴ベクトルデータベース(特徴ベクトル蓄積部)
13 画像識別部)(画像文書識別部)
14 検索結果表示部
15 画像データベース(画像文書蓄積部)
16 特徴ベクトル蓄積部
17 検索部
Claims (8)
- 文字と図表を主な内容とする画像文書の検索装置であって、
頁画像文書の特徴ベクトルを生成する特徴ベクトル生成部と、
前記特徴ベクトル生成部を用いて生成された、識別対象の頁画像文書の特徴ベクトルと検索対象に蓄積されている頁画像文書の特徴ベクトルとを比較し、検索対象より識別対象の頁画像文書に対応する頁画像文書を抽出する画像文書識別部とを備え、
前記特徴ベクトル生成部は、
頁画像文書における文字部分を連結して矩形画像を抽出する矩形画像抽出部と、
前記矩形画像抽出部にて抽出された矩形画像の情報を基に、頁の幾何構造を分析して前記頁画像文書を複数のブロックに分割するブロック分割部と、
前記ブロック分割部にて分割された複数のブロックの中から、当該頁画像文書の特徴を現す特徴ブロックを選択する特徴ブロック選択部と、
前記特徴ブロック選択部にて選択された複数の特徴ブロックの情報を、当該頁画像文書の特徴として算出する特徴算出部とを有し、
前記特徴算出部の算出結果を、当該頁画像文書の特徴ベクトルの要素に含めるようになっており、さらに、
前記ブロック分割部は、矩形画像の情報を基に、垂直方向に投影し、矩形画像間の背景領域の水平方向の寸法が他の背景領域の同方向の寸法と類似しない箇所に垂直に分割線を引く操作と、水平方向に投影し、矩形画像間の背景領域の垂直方向の寸法が他の背景領域の同方向の寸法と類似しない箇所に水平に分割線を引く操作とを、分割線にて区分されたそれぞれの領域において、領域内における矩形画像間の各背景領域の水平方向の寸法が互いに類似すると共に、矩形画像間の各背景領域の垂直方向の寸法が互いに類似するまで交互に繰り返すことを特徴とする画像文書の検索装置。 - 文字と図表を主な内容とする画像文書の検索装置であって、
頁画像文書の特徴ベクトルを生成する特徴ベクトル生成部と、
前記特徴ベクトル生成部を用いて生成された、識別対象の頁画像文書の特徴ベクトルと検索対象に蓄積されている頁画像文書の特徴ベクトルとを比較し、検索対象より識別対象の頁画像文書に対応する頁画像文書を抽出する画像文書識別部とを備え、
前記特徴ベクトル生成部は、
頁画像文書における文字部分を連結して矩形画像を抽出する矩形画像抽出部と、
前記矩形画像抽出部にて抽出された矩形画像の情報を基に、頁の幾何構造を分析して前記頁画像文書を複数のブロックに分割するブロック分割部と、
前記ブロック分割部にて分割された複数のブロックの中から、当該頁画像文書の特徴を現す特徴ブロックを選択する特徴ブロック選択部と、
前記特徴ブロック選択部にて選択された複数の特徴ブロックの情報を、当該頁画像文書の特徴として算出する特徴算出部とを有し、
前記特徴算出部の算出結果を、当該頁画像文書の特徴ベクトルの要素に含めるようになっており、さらに、
前記特徴ブロック選択部は、n(nは3以上の整数)個の特徴ブロックを選択し、
前記特徴算出部は、当該頁画像文書の特徴として、n個の特徴ブロックの情報に加えて、n個の特徴ブロックの中心を頂点としたn角形(nは3以上の整数)の情報を算出し、
前記画像文書識別部は、識別対象の頁画像文書の特徴ベクトルと検索対象に蓄積されている頁画像文書の特徴ベクトルとを比較するに際し、特徴ベクトルに含まれる頁画像文書の特徴のうちのn角形の情報を使用して、識別対象の頁画像文書のn角形と検索対象に蓄積されている頁画像文書のn角形とが相似するかどうかを判断し、相似する場合のみ、n個の特徴ブロックの情報についての比較を行い、
前記ブロック分割部は、矩形画像の情報を基に、垂直方向に投影し、矩形画像間の背景領域の水平方向の寸法が他の背景領域の同方向の寸法と類似しない箇所に垂直に分割線を引く操作と、水平方向に投影し、矩形画像間の背景領域の垂直方向の寸法が他の背景領域の同方向の寸法と類似しない箇所に水平に分割線を引く操作とを、分割線にて区分されたそれぞれの領域において、領域内における矩形画像間の各背景領域の水平方向の寸法が互いに類似すると共に、矩形画像間の各背景領域の垂直方向の寸法が互いに類似するまで交互に繰り返すことを特徴とする画像文書の検索装置。 - 文字と図表を主な内容とする画像文書の検索装置であって、
頁画像文書の特徴ベクトルを生成する特徴ベクトル生成部と、
前記特徴ベクトル生成部を用いて生成された、識別対象の頁画像文書の特徴ベクトルと検索対象に蓄積されている頁画像文書の特徴ベクトルとを比較し、検索対象より識別対象の頁画像文書に対応する頁画像文書を抽出する画像文書識別部とを備え、
前記特徴ベクトル生成部は、
頁画像文書における文字部分を連結して矩形画像を抽出する矩形画像抽出部と、
前記矩形画像抽出部にて抽出された矩形画像の情報を基に、頁の幾何構造を分析して前記頁画像文書を複数のブロックに分割するブロック分割部と、
前記ブロック分割部にて分割された複数のブロックの中から、当該頁画像文書の特徴を現す特徴ブロックを選択する特徴ブロック選択部と、
前記特徴ブロック選択部にて選択された複数の特徴ブロックの情報を、当該頁画像文書の特徴として算出する特徴算出部とを有し、
前記特徴算出部の算出結果を、当該頁画像文書の特徴ベクトルの要素に含めるようになっており、さらに、
前記特徴ブロック選択部は、n(nは3以上の整数)個の特徴ブロックを選択し、
前記特徴算出部は、当該頁画像文書の特徴として、n個の特徴ブロックの情報に加えて、n個の特徴ブロックの中心を頂点としたn角形(nは3以上の整数)の情報を算出し、
前記画像文書識別部は、識別対象の頁画像文書の特徴ベクトルと検索対象に蓄積されている頁画像文書の特徴ベクトルとを比較するに際し、特徴ベクトルに含まれる頁画像文書の特徴のうちのn角形の情報を使用して、識別対象の頁画像文書のn角形と検索対象に蓄積されている頁画像文書のn角形とが相似するかどうかを判断し、相似する場合のみ、n個の特徴ブロックの情報についての比較を行うことを特徴とする画像文書の検索装置。 - 前記特徴算出部は、n個の特徴ブロックの情報として、各特徴ブロックにおける、ブロックの高さ、ブロックの幅、ブロックの周長をブロックの面積で除した値、及びブロックに含まれる黒画素の数をブロックの面積で除した値の、4つの特性を算出することを特徴とする請求項3に記載の画像文書の検索装置。
- 前記特徴ベクトル生成部の前段に、前記頁画像文書より外周部の影を除去するエッジ除去部が設けられていることを特徴とする請求項1〜4の何れか1項に記載の画像文書の検索装置。
- 頁画像文書を蓄積させていく画像文書蓄積部と、
前記特徴ベクトル生成部を用いて、前記画像文書蓄積部に蓄積される頁画像文書の特徴ベクトルを生成し、前記画像文書蓄積部に対応付けて蓄積させていく特徴ベクトル蓄積部とを備え、
前記画像文書識別部は、識別対象の頁画像文書の特徴ベクトルと、前記特徴ベクトル蓄積部に蓄積されている特徴ベクトルとを比較し、前記画像文書蓄積部より識別対象の頁画像文書に対応する頁画像文書を抽出することを特徴とする請求項1〜5の何れか1項に記載の画像文書の検索装置。 - 請求項1〜6の何れか1項に記載の検索装置の各部としてコンピュータを機能させるためのプログラム。
- 請求項7に記載のプログラムが記録されたコンピュータ読み取り可能な記録媒体。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2007100906707A CN101276363B (zh) | 2007-03-30 | 2007-03-30 | 文档图像的检索装置及文档图像的检索方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008257670A JP2008257670A (ja) | 2008-10-23 |
JP4469873B2 true JP4469873B2 (ja) | 2010-06-02 |
Family
ID=39794508
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007137163A Active JP4469873B2 (ja) | 2007-03-30 | 2007-05-23 | 画像文書の検索装置、プログラム、及び記録媒体 |
Country Status (3)
Country | Link |
---|---|
US (1) | US8027550B2 (ja) |
JP (1) | JP4469873B2 (ja) |
CN (1) | CN101276363B (ja) |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5004082B2 (ja) * | 2007-07-27 | 2012-08-22 | 公立大学法人大阪府立大学 | 文書画像検索方法、文書画像登録方法、そのプログラムおよび装置 |
US8738647B2 (en) * | 2009-02-18 | 2014-05-27 | A9.Com, Inc. | Method and system for image matching |
JP5430243B2 (ja) * | 2009-06-17 | 2014-02-26 | キヤノン株式会社 | 画像検索装置及びその制御方法並びにプログラム |
CN102890826B (zh) * | 2011-08-12 | 2015-09-09 | 北京多看科技有限公司 | 一种扫描版文档重排版的方法 |
US8687886B2 (en) | 2011-12-29 | 2014-04-01 | Konica Minolta Laboratory U.S.A., Inc. | Method and apparatus for document image indexing and retrieval using multi-level document image structure and local features |
JP6021557B2 (ja) * | 2012-09-28 | 2016-11-09 | 株式会社Pfu | 画像処理装置、画像処理システム、画像処理方法、及び画像処理プログラム |
US9147275B1 (en) | 2012-11-19 | 2015-09-29 | A9.Com, Inc. | Approaches to text editing |
US9043349B1 (en) | 2012-11-29 | 2015-05-26 | A9.Com, Inc. | Image-based character recognition |
US9201958B2 (en) * | 2013-10-24 | 2015-12-01 | TCL Research America Inc. | Video object retrieval system and method |
US9342930B1 (en) | 2013-01-25 | 2016-05-17 | A9.Com, Inc. | Information aggregation for recognized locations |
US9424598B1 (en) | 2013-12-02 | 2016-08-23 | A9.Com, Inc. | Visual search in a controlled shopping environment |
US9536161B1 (en) | 2014-06-17 | 2017-01-03 | Amazon Technologies, Inc. | Visual and audio recognition for scene change events |
CN104036272A (zh) * | 2014-06-24 | 2014-09-10 | 联想(北京)有限公司 | 一种文本检测方法及电子设备 |
JP6372696B2 (ja) | 2014-10-14 | 2018-08-15 | ソニー株式会社 | 情報処理装置、情報処理方法、並びにプログラム |
CN104766082B (zh) * | 2015-03-20 | 2018-08-14 | 福建天晴数码有限公司 | 基于安卓系统的图像识别方法和装置 |
US10102206B2 (en) | 2016-03-31 | 2018-10-16 | Dropbox, Inc. | Intelligently identifying and presenting digital documents |
WO2018194603A1 (en) * | 2017-04-20 | 2018-10-25 | Hewlett-Packard Development Company, L.P. | Document security |
CN110019898A (zh) * | 2017-08-08 | 2019-07-16 | 航天信息股份有限公司 | 一种动漫图像处理系统 |
JP7167615B2 (ja) * | 2018-10-05 | 2022-11-09 | コニカミノルタ株式会社 | 画像検査装置、画像検査方法及び画像検査プログラム |
CN109492644A (zh) * | 2018-10-16 | 2019-03-19 | 深圳壹账通智能科技有限公司 | 一种习题图像的匹配识别方法及终端设备 |
US11803581B2 (en) * | 2021-05-24 | 2023-10-31 | Infrrd Inc | System for identifying and linking entity relationships in documents |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5680479A (en) | 1992-04-24 | 1997-10-21 | Canon Kabushiki Kaisha | Method and apparatus for character recognition |
JPH05342325A (ja) | 1992-06-04 | 1993-12-24 | Fuji Xerox Co Ltd | 文書処理装置およびその装置のためのフォーム登録装置 |
JP2576350B2 (ja) | 1993-02-25 | 1997-01-29 | 日本電気株式会社 | 文字列抽出装置 |
JPH07168910A (ja) | 1993-10-19 | 1995-07-04 | N T T Data Tsushin Kk | 文書レイアウト解析装置及び文書フォ−マット識別装置 |
JP3738631B2 (ja) | 1999-09-27 | 2006-01-25 | 三菱電機株式会社 | 画像検索システムおよび画像検索方法 |
KR100355404B1 (ko) | 1999-12-03 | 2002-10-11 | 삼성전자 주식회사 | 주파수 공간상에서의 가보 필터를 이용한 질감표현방법 및질감기반 영상 검색방법 |
KR100788643B1 (ko) | 2001-01-09 | 2007-12-26 | 삼성전자주식회사 | 색과 질감의 조합을 기반으로 하는 영상 검색 방법 |
KR100499130B1 (ko) | 2001-11-27 | 2005-07-04 | 삼성전자주식회사 | 조명 변화에 강건한 영상 검색 방법 및 장치 |
US7466856B2 (en) | 2002-09-26 | 2008-12-16 | Samsung Electronics Co., Ltd. | Image retrieval method and apparatus independent of illumination change |
CN1290061C (zh) | 2003-07-23 | 2006-12-13 | 西北工业大学 | 一种利用显著边缘进行图像检索的方法 |
CN1286064C (zh) | 2003-07-23 | 2006-11-22 | 西北工业大学 | 一种基于显著兴趣点的图像检索方法 |
CN100353379C (zh) | 2003-07-23 | 2007-12-05 | 西北工业大学 | 一种基于图像纹理特征的图像检索方法 |
US7475061B2 (en) * | 2004-01-15 | 2009-01-06 | Microsoft Corporation | Image-based document indexing and retrieval |
US7386789B2 (en) * | 2004-02-27 | 2008-06-10 | Hewlett-Packard Development Company, L.P. | Method for determining logical components of a document |
CN1687969A (zh) * | 2005-05-12 | 2005-10-26 | 北京航空航天大学 | 基于文档图像内容分析与特征提取的文档图像压缩方法 |
JP4920928B2 (ja) | 2005-08-08 | 2012-04-18 | キヤノン株式会社 | 画像処理装置及びその制御方法、プログラム |
JP2007048057A (ja) | 2005-08-10 | 2007-02-22 | Canon Inc | 画像処理装置 |
JP4856925B2 (ja) * | 2005-10-07 | 2012-01-18 | 株式会社リコー | 画像処理装置、画像処理方法及び画像処理プログラム |
CN100511230C (zh) | 2006-05-29 | 2009-07-08 | 北京万网志成科技有限公司 | 基于网页页面文本的图像检索及显示方法 |
-
2007
- 2007-03-30 CN CN2007100906707A patent/CN101276363B/zh not_active Expired - Fee Related
- 2007-05-23 JP JP2007137163A patent/JP4469873B2/ja active Active
- 2007-11-30 US US11/998,793 patent/US8027550B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2008257670A (ja) | 2008-10-23 |
US8027550B2 (en) | 2011-09-27 |
CN101276363B (zh) | 2011-02-16 |
CN101276363A (zh) | 2008-10-01 |
US20080240618A1 (en) | 2008-10-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4469873B2 (ja) | 画像文書の検索装置、プログラム、及び記録媒体 | |
US6993185B2 (en) | Method of texture-based color document segmentation | |
Zhang et al. | Detecting image seam carving with low scaling ratio using multi-scale spatial and spectral entropies | |
Gllavata et al. | A robust algorithm for text detection in images | |
US8050499B2 (en) | Image-processing apparatus, image-processing method, and computer program used therewith | |
US8200012B2 (en) | Image determination apparatus, image search apparatus and computer readable recording medium storing an image search program | |
JP5050075B2 (ja) | 画像判別方法 | |
US7889947B2 (en) | Image completion | |
US9965871B1 (en) | Multi-binarization image processing | |
Cohen et al. | Robust text and drawing segmentation algorithm for historical documents | |
US8385651B2 (en) | Character recognition device, image-reading device, computer readable medium, and character recognition method | |
JP4522468B2 (ja) | 画像判別装置、画像検索装置、画像検索プログラムおよび記録媒体 | |
JP2002190957A (ja) | 文書処理装置及び方法 | |
KR20110139113A (ko) | 주석이 달린 문서 이미지들로부터 클린 문서를 복원하기 위한 시스템 및 방법 | |
US20210056429A1 (en) | Apparatus and methods for converting lineless tables into lined tables using generative adversarial networks | |
JP6671613B2 (ja) | 文字認識方法及びコンピュータプログラム | |
CN112884074B (zh) | 基于决策树的图像设计方法、设备、存储介质及装置 | |
JP5222776B2 (ja) | 画像処理装置及び方法 | |
KR20050051029A (ko) | 코드이미지 검출 방법 및 장치 | |
Montero et al. | Watermark detection and clearance in video using simple signal and image processing techniques | |
Konya et al. | Adaptive methods for robust document image understanding | |
JP2008299673A (ja) | 画像処理装置、画像処理プログラムおよび該画像処理プログラムを記録したコンピュータ読み取り可能な記録媒体、ならびに画像処理方法 | |
Bawa et al. | A review on binarization algorithms for camera based natural scene images | |
Xu | Content Understanding for Imaging Systems: Page Classification, Fading Detection, Emotion Recognition, and Saliency Based Image Quality Assessment and Cropping | |
JP4409678B2 (ja) | 罫線抽出方式 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091110 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100108 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100202 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100301 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4469873 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130305 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130305 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140305 Year of fee payment: 4 |