JP4408129B2 - 画像文書処理装置、画像文書処理方法、プログラム、及び記録媒体 - Google Patents
画像文書処理装置、画像文書処理方法、プログラム、及び記録媒体 Download PDFInfo
- Publication number
- JP4408129B2 JP4408129B2 JP2007069610A JP2007069610A JP4408129B2 JP 4408129 B2 JP4408129 B2 JP 4408129B2 JP 2007069610 A JP2007069610 A JP 2007069610A JP 2007069610 A JP2007069610 A JP 2007069610A JP 4408129 B2 JP4408129 B2 JP 4408129B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- character
- search
- document
- index matrix
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5846—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using extracted text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/24—Character recognition characterised by the processing or recognition method
- G06V30/242—Division of the character sequences into groups prior to recognition; Selection of dictionaries
- G06V30/244—Division of the character sequences into groups prior to recognition; Selection of dictionaries using graphical properties, e.g. alphabet type or font
- G06V30/245—Font recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Library & Information Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Processing Or Creating Images (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
C(k+1)i=Cki+1,C(m+1)i=Cmi+1(m>k)
の関係にある。
+W(m−1)+Q*(Wm+W(m+1))+…+Wr
該式において、W1は、第1番目の検索文字C1が適合した文字相関値であり、W2は第2番目の検索文字C2が適合した文字相関値、W(k−1)は、第(k−1)番目の検索文字C(k−1)が適合した文字相関値である。同様にして、W(k)は、第k番目の検索文字Ckが適合した文字相関値であり、W(k+1)は、第(k+1)番目の検索文字C(k+1)が適合した文字相関値である。また、W(m−1)は、第(m−1)番目の検索文字C(m−1)が適合した文字相関値である。同様にして、W(m)は、第m番目の検索文字Cmが適合した文字相関値であり、W(m+1)は、第(m+1)番目の検索文字C(m+1)が適合した文字相関値である。そして、最後のWrは、第r番目の最後の検索文字C1が適合した文字相関値である。
+W(m−1)+Q*(Wm+W(m+1))+…+W(r−1)
また、全ての検索文字C1、C2、…Crがインデックス行列内の何れかの候補文字と適合する関係にあり、かつ、検索キーワードの第k+1番目の検索文字と第k番目の検索文字、及び、第k+2番目の検索文字と第k+1番目の検索文字とが、それぞれ隣接した2行に適合する関係にある場合、相関度を算出する式は次式のようになるであろう。
+Q*(Wk+W(k+1)+W(k+2))…+WR
この場合も、検索キーワードの第k−1番目の検索文字と第k番目の検索文字は、隣接した2行に適合する関係にはないため、W(k−1)とWkとの両方に対して相関度加重因子Qを掛け合わせてはいない。
15 字形特徴辞書
16 特徴適合部
17 インデックス情報データベース(インデックス情報格納部)
18 見出し領域初期処理部(見出し抽出部)
22 検索部
22a インデックス行列検索処理部
22b 文字相関値保存部(保存部)
22c 相関度算出部
22d 表示順序決定部(順序決定部)
30 字形特徴辞書生成部
51 文書名作成部
52 画像文書DB管理部
55 候補文字列生成部
57 画像文書管理部
Claims (9)
- 蓄積された画像文書に文書名を付して管理する画像文書処理装置であって、
文字画像の画像特徴を1文字単位で格納している字形特徴辞書と、
入力された画像文書中にある見出し領域を切り出す見出し抽出部と、
前記見出し抽出部にて切り出された見出し領域に含まれる文字列の文字画像を1文字ごとに分割して各文字画像の画像特徴を抽出する画像特徴抽出部と、
前記画像特徴抽出部にて抽出された文字画像の画像特徴を基に、前記字形特徴辞書より、画像特徴の適合度が高い順にN個(N>1の整数)の文字画像を候補文字として選択して、前記文字列の文字数をM個(M>1の整数)とした場合に、M×N次のインデックス行列を作成するインデックス行列作成部と、
前記インデックス行列における連続する各行の適合度が最も高い1列目に位置する各候補文字を順に連ねた候補文字列が意味のある候補文字列となるように、意味解析法を用いて、1列目に位置する各候補文字を、行毎に定められたN個の候補文字の中から選択することで調整し、前記連続する各行の1列目に位置する各候補文字を連ねた候補文字列を意味のある候補文字列とする候補文字列作成部と、
前記入力された画像文書に対し、前記候補文字列作成部にて生成された意味のある候補文字列を含む第1の文書名を作成する文書名作成部とを有すると共に、
前記インデックス行列作成部にて作成されたインデックス行列を、前記入力された画像文書に対応づけて格納するインデックス情報格納部と、
入力された検索式中の検索キーワードを構成する1検索文字単位に前記インデックス情報格納部を検索し、検索文字を含むインデックス行列を有する画像文書を取り出す検索部とを有し、
さらに、前記インデックス行列の各要素には、位置に応じた相関値が設定されており、
前記検索部は、
検索キーワードを構成する1検索文字単位にインデックス行列を検索して検索文字を含むインデックス行列を検出し、当該インデックス行列内における検索文字の適合位置の情報を、インデックス行列を有する画像文書の情報と共に保存部に格納するインデックス行列検索処理部と、
前記保存部に格納された適合位置の情報より、各検索文字の相関値を累積して、検索キーワードとインデックス行列との相関度を算出する相関度算出部と、
前記相関度算出部の算出結果に基づいて画像文書の取り出す順序を決定する順序決定部とを含むことを特徴とする画像文書処理装置。 - 前記相関度算出部は、前記適合位置の情報より、インデックス行列における隣接する行に適合していると判断すると、隣接する各行の相関値を行の相関度加重因子にて加重した上で累積することを特徴とする請求項1に記載の画像文書処理装置。
- 前記文書名作成部は、前記入力された画像文書が入力された時間のデータを第1の文書名に含めることを特徴とする請求項1又は2に記載の画像文書処理装置。
- 前記文書名作成部は、前記入力された画像文書が入力された時間のデータを含む第2の文書名を第1の文書名とは別に作成し、1つの画像文書を第1の文書名と第2の文書名とで管理することを特徴とする請求項1,2又は3に記載の画像文書処理装置。
- 前記画像特徴抽出部は、網格方向特徴と文字画像外囲特徴との組み合わせにより、文字画像の画像特徴を抽出することを特徴とする請求項1〜4のいずれか1項に記載の画像文書処理装置。
- 蓄積された画像文書に文書名を付して管理する画像文書処理方法であって、
入力された画像文書中にある見出し領域を抽出する見出し抽出ステップと、
前記見出し抽出ステップにて抽出された見出し領域に含まれる文字列の文字画像を1文字ごとに分割して各文字画像の画像特徴を抽出する画像特徴抽出ステップと、
前記画像特徴抽出ステップにて抽出された文字画像の画像特徴を基に、文字画像の画像特徴を1文字単位で格納している字形特徴辞書より、画像特徴の適合度が高い順にN個(N>1の整数)の文字画像を候補文字として選択して、前記文字列の文字数をM個(M>1の整数)とした場合に、M×N次のインデックス行列を作成するインデックス行列作成ステップと、
前記インデックス行列作成ステップにて作成された前記インデックス行列における連続する各行の適合度が最も高い1列目に位置する各候補文字を順に連ねた候補文字列が意味のある候補文字列となるように、意味解析法を用いて、1列目に位置する各候補文字を、行毎に定められたN個の候補文字の中から選択することで調整し、前記連続する各行の1列目に位置する各候補文字を連ねた候補文字列を意味のある候補文字列とする候補文字列作成ステップと、
前記入力された画像文書に対し、前記候補文字列作成ステップにて作成された意味のある候補文字列を含む第1の文書名を作成する文書名作成ステップとを有し、
前記第1の文書名にて蓄積された画像文書を管理し、
さらに、前記インデックス行列作成ステップにて作成されたインデックス行列を、前記入力された画像文書に対応づけて格納するインデックス情報格納ステップと、
入力された検索式中の検索キーワードを構成する1検索文字単位に前記インデックス情報格納ステップにて格納されたインデックス情報を検索し、検索文字を含むインデックス行列を有する画像文書を取り出す検索ステップとを有し、
さらに、前記インデックス行列の各要素には、位置に応じた相関値が設定されており、
前記検索ステップでは、
検索キーワードを構成する1検索文字単位にインデックス行列を検索して検索文字を含むインデックス行列を検出し、当該インデックス行列内における検索文字の適合位置の情報を、インデックス行列を有する画像文書の情報と共に保存部に格納するインデックス行列検索処理ステップと、
前記保存部に格納された適合位置の情報より、各検索文字の相関値を累積して、検索キーワードとインデックス行列との相関度を算出する相関度算出ステップと、
前記相関度算出ステップの算出結果に基づいて画像文書の取り出す順序を決定する順序決定ステップとを含む画像文書処理方法。 - 前記相関度算出ステップでは、前記適合位置の情報より、インデックス行列における隣接する行に適合していると判断すると、隣接する各行の相関値を行の相関度加重因子にて加重した上で累積することを特徴とする請求項6に記載の画像文書処理方法。
- 請求項1から5の何れか1項に記載の画像文書処理装置の各部としてコンピュータを機能させるためのプログラム。
- 請求項8に記載のプログラムが記録されたコンピュータ読み取り可能な記録媒体。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2007100009608A CN101226595B (zh) | 2007-01-15 | 2007-01-15 | 文档图像处理装置以及文档图像处理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008171380A JP2008171380A (ja) | 2008-07-24 |
JP4408129B2 true JP4408129B2 (ja) | 2010-02-03 |
Family
ID=39668054
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007069610A Active JP4408129B2 (ja) | 2007-01-15 | 2007-03-16 | 画像文書処理装置、画像文書処理方法、プログラム、及び記録媒体 |
Country Status (3)
Country | Link |
---|---|
US (1) | US8290269B2 (ja) |
JP (1) | JP4408129B2 (ja) |
CN (1) | CN101226595B (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009026288A (ja) * | 2007-07-23 | 2009-02-05 | Sharp Corp | 画像文書処理装置、画像文書処理方法、画像処理プログラムおよび画像処理プログラムを記録した記録媒体 |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4539756B2 (ja) * | 2008-04-14 | 2010-09-08 | 富士ゼロックス株式会社 | 画像処理装置及び画像処理プログラム |
JP5332369B2 (ja) * | 2008-07-18 | 2013-11-06 | ソニー株式会社 | 画像処理装置及び画像処理方法、並びにコンピュータ・プログラム |
US8131720B2 (en) * | 2008-07-25 | 2012-03-06 | Microsoft Corporation | Using an ID domain to improve searching |
KR101355299B1 (ko) * | 2009-04-14 | 2014-01-23 | 닛본 덴끼 가부시끼가이샤 | 이미지 시그니처 추출 장치 |
JP5427577B2 (ja) * | 2009-12-04 | 2014-02-26 | パナソニック株式会社 | 表示制御装置及び表示画像形成方法 |
JP2011170690A (ja) * | 2010-02-19 | 2011-09-01 | Sony Corp | 情報処理装置、情報処理方法、およびプログラム。 |
US9323726B1 (en) * | 2012-06-27 | 2016-04-26 | Amazon Technologies, Inc. | Optimizing a glyph-based file |
EP2962253A1 (en) | 2013-02-27 | 2016-01-06 | Longsand Limited | Textual representation of an image |
US9639526B2 (en) * | 2014-01-10 | 2017-05-02 | Microsoft Technology Licensing, Llc | Mobile language translation of web content |
JP6050843B2 (ja) | 2015-01-30 | 2016-12-21 | 株式会社Pfu | 情報処理装置、方法およびプログラム |
US10528649B2 (en) * | 2016-09-29 | 2020-01-07 | Adobe Inc. | Recognizing unseen fonts based on visual similarity |
CN108287858B (zh) * | 2017-03-02 | 2021-08-10 | 腾讯科技(深圳)有限公司 | 自然语言的语义提取方法及装置 |
CN109064787B (zh) * | 2018-07-17 | 2021-09-24 | 广东小天才科技有限公司 | 一种点读设备 |
JP7343311B2 (ja) * | 2019-06-11 | 2023-09-12 | ファナック株式会社 | 文書検索装置及び文書検索方法 |
US10803301B1 (en) * | 2019-08-02 | 2020-10-13 | Capital One Services, Llc | Detecting fraud in image recognition systems |
CN113673544A (zh) * | 2020-05-13 | 2021-11-19 | 珠海金山办公软件有限公司 | 一种相似字体的确定方法、装置、电子设备及存储介质 |
CN112199545B (zh) * | 2020-11-23 | 2021-09-07 | 湖南蚁坊软件股份有限公司 | 基于图片文字定位的关键词显示方法、装置及存储介质 |
CN112733658B (zh) * | 2020-12-31 | 2022-11-25 | 北京华宇信息技术有限公司 | 电子文档归档方法及其装置 |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE69330423T2 (de) * | 1993-01-11 | 2002-05-16 | Canon Kk | Gerät und Verfahren zur Bildverarbeitung |
JPH07152774A (ja) | 1993-11-30 | 1995-06-16 | Hitachi Ltd | 文書検索方法および装置 |
JPH07182465A (ja) * | 1993-12-22 | 1995-07-21 | Hitachi Ltd | 文字認識方法 |
US5821929A (en) * | 1994-11-30 | 1998-10-13 | Canon Kabushiki Kaisha | Image processing method and apparatus |
JPH08153110A (ja) | 1994-11-30 | 1996-06-11 | Canon Inc | 文書ファイリング装置及び方法 |
JPH08272811A (ja) | 1995-03-30 | 1996-10-18 | Canon Inc | 文書管理方法及びその装置 |
US5999647A (en) * | 1995-04-21 | 1999-12-07 | Matsushita Electric Industrial Co., Ltd. | Character extraction apparatus for extracting character data from a text image |
JPH09319747A (ja) | 1996-05-29 | 1997-12-12 | Ricoh Co Ltd | 文書画像の構造化方法 |
JP2973944B2 (ja) * | 1996-06-26 | 1999-11-08 | 富士ゼロックス株式会社 | 文書処理装置および文書処理方法 |
US6327387B1 (en) * | 1996-12-27 | 2001-12-04 | Fujitsu Limited | Apparatus and method for extracting management information from image |
JP3375292B2 (ja) | 1998-12-16 | 2003-02-10 | 日本電信電話株式会社 | 文字認識処理方法及びその装置及びその方法を記録した記録媒体 |
JP2001043221A (ja) * | 1999-07-29 | 2001-02-16 | Matsushita Electric Ind Co Ltd | 中国語単語分割装置 |
JP3425408B2 (ja) | 2000-05-31 | 2003-07-14 | 株式会社東芝 | 文書読取装置 |
US6944344B2 (en) * | 2000-06-06 | 2005-09-13 | Matsushita Electric Industrial Co., Ltd. | Document search and retrieval apparatus, recording medium and program |
JP4461769B2 (ja) | 2003-10-29 | 2010-05-12 | 株式会社日立製作所 | 文書検索・閲覧手法及び文書検索・閲覧装置 |
KR20050082593A (ko) | 2004-02-19 | 2005-08-24 | 엘지전자 주식회사 | Gps를 이용한 영상데이터 파일명 설정방법 및 장치 |
JP2005275849A (ja) | 2004-03-25 | 2005-10-06 | Canon Inc | 文書処理装置および文書処理方法 |
JP2006059075A (ja) * | 2004-08-19 | 2006-03-02 | Fuji Xerox Co Ltd | 文書処理装置およびプログラム |
CN1746884A (zh) | 2004-09-06 | 2006-03-15 | 英保达股份有限公司 | 数字影像文件自动命名方法及系统 |
JP2006085582A (ja) * | 2004-09-17 | 2006-03-30 | Fuji Xerox Co Ltd | 文書処理装置およびプログラム |
-
2007
- 2007-01-15 CN CN2007100009608A patent/CN101226595B/zh not_active Expired - Fee Related
- 2007-03-16 JP JP2007069610A patent/JP4408129B2/ja active Active
- 2007-12-10 US US11/953,695 patent/US8290269B2/en active Active
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009026288A (ja) * | 2007-07-23 | 2009-02-05 | Sharp Corp | 画像文書処理装置、画像文書処理方法、画像処理プログラムおよび画像処理プログラムを記録した記録媒体 |
JP4533920B2 (ja) * | 2007-07-23 | 2010-09-01 | シャープ株式会社 | 画像文書処理装置、画像文書処理方法、画像処理プログラムおよび画像処理プログラムを記録した記録媒体 |
Also Published As
Publication number | Publication date |
---|---|
US20080181505A1 (en) | 2008-07-31 |
JP2008171380A (ja) | 2008-07-24 |
CN101226595A (zh) | 2008-07-23 |
CN101226595B (zh) | 2012-05-23 |
US8290269B2 (en) | 2012-10-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4408129B2 (ja) | 画像文書処理装置、画像文書処理方法、プログラム、及び記録媒体 | |
JP4533920B2 (ja) | 画像文書処理装置、画像文書処理方法、画像処理プログラムおよび画像処理プログラムを記録した記録媒体 | |
JP4364914B2 (ja) | 画像文書処理装置、画像文書処理方法、プログラム、及び記録媒体 | |
JP4740916B2 (ja) | 画像文書処理装置、画像文書処理プログラムおよび画像文書処理プログラムを記録した記録媒体 | |
JP2009026287A (ja) | 文字画像抽出装置および文字画像抽出方法 | |
JP4570648B2 (ja) | 画像文書処理装置、画像文書処理方法、画像文書処理プログラムおよび記録媒体 | |
US8577882B2 (en) | Method and system for searching multilingual documents | |
JP4772817B2 (ja) | 画像文書処理装置および画像文書処理方法 | |
EP2806336A1 (en) | Text prediction in a text input associated with an image | |
KR102373884B1 (ko) | 텍스트 기반 이미지 검색을 위한 이미지 데이터 처리 방법 | |
US20160103915A1 (en) | Linking thumbnail of image to web page | |
JP5430312B2 (ja) | データ処理装置、データ名生成方法及びコンピュータプログラム | |
JP3693734B2 (ja) | 情報検索装置およびその情報検索方法 | |
KR20020006223A (ko) | 자동 색인 로봇 시스템 및 이를 이용한 처리 방법 | |
JPH08272813A (ja) | ファイリング装置 | |
JP2009110204A (ja) | 文書処理装置、文書処理システム、文書処理方法及び文書処理プログラム | |
CN116842138A (zh) | 基于文档的检索方法、装置、设备及存储介质 | |
JP2001092831A (ja) | 文書検索装置及び文書検索方法 | |
Keerthika et al. | Multi-linguistic optical character recognition | |
JP2004287992A (ja) | 文書情報処理装置並びにプログラム | |
JPH0954781A (ja) | 文書検索システム | |
JP2001184365A (ja) | 文書検索システムおよび記録媒体 | |
KR20160139484A (ko) | 워드 추출 방법 및 장치 | |
JPH04352063A (ja) | 日本語文書処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090609 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090715 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090825 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091009 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20091104 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20091105 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4408129 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121120 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121120 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131120 Year of fee payment: 4 |