JP2015118628A - 文書画像検索装置、方法、及びプログラム - Google Patents
文書画像検索装置、方法、及びプログラム Download PDFInfo
- Publication number
- JP2015118628A JP2015118628A JP2013262949A JP2013262949A JP2015118628A JP 2015118628 A JP2015118628 A JP 2015118628A JP 2013262949 A JP2013262949 A JP 2013262949A JP 2013262949 A JP2013262949 A JP 2013262949A JP 2015118628 A JP2015118628 A JP 2015118628A
- Authority
- JP
- Japan
- Prior art keywords
- feature
- document image
- series
- rectangle
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Abstract
Description
1.登録文書画像における連結成分の外接矩形を抽出
2.連結成分の外接矩形から重なり矩形を抽出
3.重なり矩形毎に、内部パターンの特徴ベクトルを算出
4.重なり矩形毎に、所定方向に隣り合う重なり矩形を探索
5.特徴ベクトル及び隣り合う重なり矩形の識別情報を、重なり矩形毎の特徴として、特徴DB23に記憶
文書画像から、一文字の少なくとも一部に相当する部分に外接する領域の各々を抽出し、所定方向に隣り合う複数の領域の各々の特徴を、領域の配列順に並べた特徴系列を抽出する抽出部と、
複数の登録文書画像の各々から抽出され、登録文書画像の識別情報と対応付けて記憶部に記憶された複数の特徴系列の各々と、前記抽出部により対象文書画像から抽出された特徴系列とを照合し、前記対象文書画像に類似する登録文書画像を検索する検索部と、
を含む文書画像検索装置。
前記抽出部により前記特徴系列として抽出された高次元の特徴ベクトル系列を、低次元の特徴ベクトル系列に変換する変換部を含む付記1記載の文書画像検索装置。
前記変換部は、ラプラシアン固有マップ法を用いて、前記高次元の特徴ベクトル系列を前記低次元の特徴ベクトル系列に変換する付記2記載の文書画像検索装置。
前記検索部は、前記登録文書画像の特徴系列の各々と、前記対象文書画像の特徴系列との最近傍識別により、前記対象文書画像に類似する登録文書画像を検索する付記1〜付記3のいずれか1項記載の文書画像検索装置。
コンピュータに、
文書画像から、一文字の少なくとも一部に相当する部分に外接する領域の各々を抽出し、所定方向に隣り合う複数の領域の各々の特徴を、領域の配列順に並べた特徴系列を抽出し、
複数の登録文書画像の各々から抽出され、登録文書画像の識別情報と対応付けて記憶部に記憶された複数の特徴系列の各々と、対象文書画像から抽出された特徴系列とを照合し、前記対象文書画像に類似する登録文書画像を検索する
ことを含む処理を実行させる文書画像検索方法。
前記コンピュータに、前記特徴系列として抽出された高次元の特徴ベクトル系列を、低次元の特徴ベクトル系列に変換することを含む処理を実行させる付記5記載の文書画像検索方法。
ラプラシアン固有マップ法を用いて、前記高次元の特徴ベクトル系列を前記低次元の特徴ベクトル系列に変換する付記6記載の文書画像検索方法。
前記登録文書画像の特徴系列の各々と、前記対象文書画像の特徴系列との最近傍識別により、前記対象文書画像に類似する登録文書画像を検索する付記5〜付記7のいずれか1項記載の文書画像検索方法。
コンピュータに、
文書画像から、一文字の少なくとも一部に相当する部分に外接する領域の各々を抽出し、所定方向に隣り合う複数の領域の各々の特徴を、領域の配列順に並べた特徴系列を抽出し、
複数の登録文書画像の各々から抽出され、登録文書画像の識別情報と対応付けて記憶部に記憶された複数の特徴系列の各々と、対象文書画像から抽出された特徴系列とを照合し、前記対象文書画像に類似する登録文書画像を検索する
ことを含む処理を実行させるための文書画像検索プログラム。
前記コンピュータに、前記特徴系列として抽出された高次元の特徴ベクトル系列を、低次元の特徴ベクトル系列に変換することを含む処理を実行させるための付記9記載の文書画像検索プログラム。
ラプラシアン固有マップ法を用いて、前記高次元の特徴ベクトル系列を前記低次元の特徴ベクトル系列に変換する付記10記載の文書画像検索プログラム。
前記登録文書画像の特徴系列の各々と、前記対象文書画像の特徴系列との最近傍識別により、前記対象文書画像に類似する登録文書画像を検索する付記5〜付記7のいずれか1項記載の文書画像検索プログラム。
20 登録部
21 第1特徴抽出部
22 第1特徴変換部
23 特徴DB
25 ハッシュテーブル
30 照合部
31 第2特徴抽出部
32 第2特徴変換部
33 検索部
34 特徴メモリ
35 ハッシュ値メモリ
40 コンピュータ
42 CPU
44 メモリ
46 記憶部
50 文書画像検索プログラム
60 登録プログラム
70 照合プログラム
Claims (6)
- 文書画像から、一文字の少なくとも一部に相当する部分に外接する領域の各々を抽出し、所定方向に隣り合う複数の領域の各々の特徴を、領域の配列順に並べた特徴系列を抽出する抽出部と、
複数の登録文書画像の各々から抽出され、登録文書画像の識別情報と対応付けて記憶部に記憶された複数の特徴系列の各々と、前記抽出部により対象文書画像から抽出された特徴系列とを照合し、前記対象文書画像に類似する登録文書画像を検索する検索部と、
を含む文書画像検索装置。 - 前記抽出部により前記特徴系列として抽出された高次元の特徴ベクトル系列を、低次元の特徴ベクトル系列に変換する変換部を含む請求項1記載の文書画像検索装置。
- 前記変換部は、ラプラシアン固有マップ法を用いて、前記高次元の特徴ベクトル系列を前記低次元の特徴ベクトル系列に変換する請求項2記載の文書画像検索装置。
- 前記検索部は、前記登録文書画像の特徴系列の各々と、前記対象文書画像の特徴系列との最近傍識別により、前記対象文書画像に類似する登録文書画像を検索する請求項1〜請求項3のいずれか1項記載の文書画像検索装置。
- コンピュータに、
文書画像から、一文字の少なくとも一部に相当する部分に外接する領域の各々を抽出し、所定方向に隣り合う複数の領域の各々の特徴を、領域の配列順に並べた特徴系列を抽出し
複数の登録文書画像の各々から抽出され、登録文書画像の識別情報と対応付けて記憶部に記憶された複数の特徴系列の各々と、対象文書画像から抽出された特徴系列とを照合し、前記対象文書画像に類似する登録文書画像を検索する
ことを含む処理を実行させる文書画像検索方法。 - コンピュータに、
文書画像から、一文字の少なくとも一部に相当する部分に外接する領域の各々を抽出し、所定方向に隣り合う複数の領域の各々の特徴を、領域の配列順に並べた特徴系列を抽出し、
複数の登録文書画像の各々から抽出され、登録文書画像の識別情報と対応付けて記憶部に記憶された複数の特徴系列の各々と、対象文書画像から抽出された特徴系列とを照合し、前記対象文書画像に類似する登録文書画像を検索する
ことを含む処理を実行させるための文書画像検索プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013262949A JP6187237B2 (ja) | 2013-12-19 | 2013-12-19 | 文書画像検索装置、方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013262949A JP6187237B2 (ja) | 2013-12-19 | 2013-12-19 | 文書画像検索装置、方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015118628A true JP2015118628A (ja) | 2015-06-25 |
JP6187237B2 JP6187237B2 (ja) | 2017-08-30 |
Family
ID=53531263
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013262949A Expired - Fee Related JP6187237B2 (ja) | 2013-12-19 | 2013-12-19 | 文書画像検索装置、方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6187237B2 (ja) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6006226A (en) * | 1997-09-24 | 1999-12-21 | Ricoh Company Limited | Method and system for document image feature extraction |
US6226640B1 (en) * | 1997-11-17 | 2001-05-01 | Telecordia Technologies, Inc. | Method for determining approximate hamming distance and approximate nearest neighbors of a query |
JP2001337993A (ja) * | 2000-05-30 | 2001-12-07 | Fujitsu Ltd | 文字認識結果を利用して情報を検索する検索装置および方法 |
JP2009032109A (ja) * | 2007-07-27 | 2009-02-12 | Osaka Prefecture Univ | 文書画像検索方法、文書画像登録方法、そのプログラムおよび装置 |
JP2009122758A (ja) * | 2007-11-12 | 2009-06-04 | Ricoh Co Ltd | 文書処理装置、文書処理方法及び文書処理プログラム |
-
2013
- 2013-12-19 JP JP2013262949A patent/JP6187237B2/ja not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6006226A (en) * | 1997-09-24 | 1999-12-21 | Ricoh Company Limited | Method and system for document image feature extraction |
US6226640B1 (en) * | 1997-11-17 | 2001-05-01 | Telecordia Technologies, Inc. | Method for determining approximate hamming distance and approximate nearest neighbors of a query |
JP2001337993A (ja) * | 2000-05-30 | 2001-12-07 | Fujitsu Ltd | 文字認識結果を利用して情報を検索する検索装置および方法 |
JP2009032109A (ja) * | 2007-07-27 | 2009-02-12 | Osaka Prefecture Univ | 文書画像検索方法、文書画像登録方法、そのプログラムおよび装置 |
JP2009122758A (ja) * | 2007-11-12 | 2009-06-04 | Ricoh Co Ltd | 文書処理装置、文書処理方法及び文書処理プログラム |
Non-Patent Citations (2)
Title |
---|
水原 悠子: "DTW距離を用いた時系列データのベクトル空間への埋込", 電子情報通信学会論文誌, vol. J88−D−II 第2号, JPN6017014245, 1 February 2005 (2005-02-01), JP, pages 241 - 249, ISSN: 0003543803 * |
白川 真一: "文献紹介 Liu, W., Wang, J., Ji, R., Jiang, Y. G. and Chang, S. F.: Supervised hashing with kernels", 人工知能学会誌, vol. 第27巻 第6号, JPN6017014247, 1 November 2012 (2012-11-01), JP, pages 715 - 718, ISSN: 0003543804 * |
Also Published As
Publication number | Publication date |
---|---|
JP6187237B2 (ja) | 2017-08-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Shekhar et al. | Word image retrieval using bag of visual words | |
US9864928B2 (en) | Compact and robust signature for large scale visual search, retrieval and classification | |
CN107209860B (zh) | 用于处理弱监督图像的方法、系统和计算机存储介质 | |
Amato et al. | kNN based image classification relying on local feature similarity | |
KR101191223B1 (ko) | 이미지 검색 방법, 장치, 및 이 방법을 실행하기 위한 컴퓨터 판독 가능한 기록 매체 | |
US9361523B1 (en) | Video content-based retrieval | |
WO2010101187A1 (ja) | 画像データベースの作成方法、作成プログラム及び画像検索方法 | |
US9569698B2 (en) | Method of classifying a multimodal object | |
Vieux et al. | Content based image retrieval using bag-of-regions | |
Li et al. | Fuzzy bag of words for social image description | |
JP6373292B2 (ja) | 特徴量生成装置、方法、及びプログラム | |
JP6017277B2 (ja) | 特徴ベクトルの集合で表されるコンテンツ間の類似度を算出するプログラム、装置及び方法 | |
JP5833499B2 (ja) | 高次元の特徴ベクトル集合で表現されるコンテンツを高精度で検索する検索装置及びプログラム | |
JP4703487B2 (ja) | 画像分類方法及び装置及びプログラム | |
JP5959446B2 (ja) | コンテンツをバイナリ特徴ベクトルの集合で表現することによって高速に検索する検索装置、プログラム及び方法 | |
JP6187237B2 (ja) | 文書画像検索装置、方法、及びプログラム | |
Alaei et al. | A brief review of document image retrieval methods: Recent advances | |
Ghosh et al. | Efficient indexing for query by string text retrieval | |
Zaghden et al. | Characterization of ancient document images composed by Arabic and Latin scripts | |
Selvam et al. | A new architecture for image retrieval optimization with HARP algorithm | |
Al-Barhamtoshy | Towards large scale image similarity discovery model | |
Mironică et al. | The influence of the similarity measure to relevance feedback | |
Amato et al. | On knn classification and local feature based similarity functions | |
Nayef et al. | Efficient symbol retrieval by building a symbol index from a collection of line drawings | |
Tianjiao et al. | Calligraphy word style recognition by KNN based feature library filtering |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160905 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170419 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170425 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170623 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170704 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170717 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6187237 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |