JP2009026288A - 画像文書処理装置、画像文書処理方法、画像処理プログラムおよび画像処理プログラムを記録した記録媒体 - Google Patents
画像文書処理装置、画像文書処理方法、画像処理プログラムおよび画像処理プログラムを記録した記録媒体 Download PDFInfo
- Publication number
- JP2009026288A JP2009026288A JP2007246158A JP2007246158A JP2009026288A JP 2009026288 A JP2009026288 A JP 2009026288A JP 2007246158 A JP2007246158 A JP 2007246158A JP 2007246158 A JP2007246158 A JP 2007246158A JP 2009026288 A JP2009026288 A JP 2009026288A
- Authority
- JP
- Japan
- Prior art keywords
- character
- image
- search
- unit
- index matrix
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5846—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using extracted text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/26—Techniques for post-processing, e.g. correcting the recognition result
- G06V30/262—Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
- G06V30/268—Lexical context
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/28—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
- G06V30/287—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of Kanji, Hiragana or Katakana characters
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Library & Information Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Processing Or Creating Images (AREA)
Abstract
【解決手段】 画像文書中の文字数がMである文字列の画像を切り出し、これを1文字ごとに分割して各文字画像の画像特徴を抽出し、その画像特徴に基づき、文字画像の画像特徴を1文字単位で格納している字形特徴辞書より、適合度が高い順にN個(N>1の整数)の文字画像を候補文字として選択し、切り出した文字列の文字数M×N次の第1インデックス行列を作成する。この第1インデックス行列の第1列を構成する複数の候補文字からなる候補文字列に対して、予め定める言語モデルによる語彙解析を適用することにより、候補文字列を意味を成す文字列に調整した第2インデックス行列を作成し、言語モデルの基で統計を行った後、語彙解析を行う。
【選択図】 図1
Description
入力された画像文書中にある文字画像を複数の文字よりなる文字列単位で切り出す文字列抽出部と、
前記文字列抽出部にて切り出された文字列の文字画像を1文字ごとに分割して各文字画像の画像特徴を抽出する画像特徴抽出部と、
前記画像特徴抽出部にて抽出された文字画像の画像特徴を基に、前記字形特徴辞書より、画像特徴の適合度が高い順にN個(N>1の整数)の文字画像を候補文字として選択し、前記文字列の文字数をM個(M>1の整数)とした場合に、M×N次の第1インデックス行列を作成し、この第1インデックス行列の第1列を構成する複数の候補文字からなる候補文字列に対して、予め定める言語モデルによる語彙解析を適用して意味を成す文字列に調整した第2インデックス行列を作成する特徴適合部と、
前記特徴適合部にて作成された第2インデックス行列を、前記入力された画像文書に対応づけて格納するインデックス情報格納部と、
検索時に、入力された検索式中の検索キーワードを構成する1検索文字単位に前記インデックス情報格納部を検索し、検索文字を含む第2インデックス行列を有する画像文書を取り出す検索部とを有することを特徴とする画像文書処理装置である。
前記検索部は、
検索キーワードを構成する1検索文字単位にインデックス行列を検索して検索文字を含む第2インデックス行列を検出し、当該第2インデックス行列内における検索文字の適合位置の情報を、第2インデックス行列を有する画像文書の情報と共に保存部に格納するインデックス行列検索処理部と、
前記保存部に格納された適合位置の情報より、各検索文字の相関値を累積して、検索キーワードと第2インデックス行列との相関度を算出する相関度算出部と、
前記相関度算出部の算出結果に基づいて画像文書の取り出す順序を決定する順序決定部とを含むことを特徴とする。
また本発明は、前記画像特徴抽出部を用いて、前記字形特徴辞書を作成する字形特徴辞書作成部を備えることを特徴とする。
前記文字列抽出ステップにて抽出された文字列の文字画像を1文字ごとに分割して各文字画像の画像特徴を抽出する画像特徴抽出ステップと、
前記画像特徴抽出ステップにて抽出された文字画像の画像特徴を基に、文字画像の画像特徴を1文字単位で格納している字形特徴辞書より、画像特徴の適合度が高い順にN個(N>1の整数)の文字画像を候補文字として選択し、前記文字列の文字数をM個(M>1の整数)とした場合に、M×N次のインデックス行列を作成し、この第1インデックス行列の第1列を構成する複数の候補文字からなる候補文字列に対して、予め定める言語モデルによる語彙解析を適用して意味を成す文字列に調整した第2インデックス行列を作成する特徴適合ステップと、
前記特徴適合ステップにて作成された第2インデックス行列を、前記入力された画像文書に対応づけて格納するインデックス情報格納ステップと、
検索時に、前記インデックス情報格納ステップにて格納されたインデックス情報を、入力された検索式中の検索キーワードを構成する1検索文字単位に検索し、検索文字を含む第2インデックス行列を有する画像文書を取り出す検索ステップとを有することを特徴とする画像文書処理方法である。
また本発明によれば、最も正確な順序にて候補文字を選択してインデックス行列を作成することができる。
図1は、画像文書処理装置10の構成を大略的に示すブロック図である。画像文書処理装置10は、プロセッサ4と、プロセッサ4が実際の処理を行うためのソフトウエアなどを格納する外部記憶装置5とを含む。
バイグラムモデルは、2つの文字、2つの音節、または2つの単語のグループであり、テキストの簡単な統計分析の基礎として非常に一般的に使用される。
辞書データの第1列目301は、2字の組み合わせの1番目の文字を示している。第2行目302は、1番目の文字と共に組み合わせを構成した文字の数を示している。第3行目303は、1番目の文字と共に組み合わせを構成した文字を示し、第4行目304は、組み合わせを構成した回数を示している。さらに、第5行目305は、組み合わせの中国語の文字数を示している。ここでは、バイグラムモデルを用いているので、文字数は全て2である。
文字ベースでのバイグラムモデルを用いて、まず2行目と3行目との関係から、2行目の第2候補「神」を「伸」と入れ替えて第1候補とする。また、4行目と5行目との関係から、5行目の第3候補「住」を「任」と入れ替えて第1候補とする。
C(k+1)i=Cki+1,C(m+1)i=Cmi+1(m>k)…(1)
の関係にある。
SimDegree=W1+W2+…+W(k−1)+Q*(Wk+W(k+1))+…
+W(m−1)+Q*(Wm+W(m+1))+…+Wr …(2)
SimDegree=W2+…+W(k−1)+Q*(Wk+W(k+1))+…
+W(m−1)+Q*(Wm+W(m+1))+…+W(r−1)
SimDegree=W1+W2+…+W(k−1)
+Q*(Wk+W(k+1)+W(k+2))…+WR
2 イメージスキャナ
3 表示装置
4 プロセッサ
5 外部記憶装置
6 デジタルカメラ
10 画像文書処理装置
11 文字DB入力部
12 字体正規化処理部
12a 字形見本
12b 変形処理部
12c 字体基準部
13 字形見本DB
14 文字画像特徴抽出部
14a 字形基準化部
14b 文字画像特徴取出部
14c 特徴分類部
15 字形特徴辞書
16 特徴適合部
17 インデックス情報DB
18 領域初期処理部
19 画像文書DB
20 画像文書特徴DB
21 画像文書入力部
22 検索部
22a インデックス行列検索処理部
22b 文字相関値保存部
22c 相関度算出部
22d 表示順序決定部
22e 画像文書抽出部
23 語彙解析部
23a 語義分析処理部
23b 語義辞典
24 キーワード入力部
25 検索結果表示部
30 字形特徴辞書生成部
31 画像文書特徴抽出部
32 インデックス情報生成部
50 画像文書
51 文書名作成部
52 画像文書DB管理部
53 画像文書表示部
54 指示入力部
55 候補文字列生成部
57 画像文書管理部
60 時間データ等発生部
61 言語モデル
100,200 インデックス行列
Claims (17)
- 文字画像の画像特徴を1文字単位で格納している字形特徴辞書と、
入力された画像文書中にある文字画像を複数の文字よりなる文字列単位で切り出す文字列抽出部と、
前記文字列抽出部にて切り出された文字列の文字画像を1文字ごとに分割して各文字画像の画像特徴を抽出する画像特徴抽出部と、
前記画像特徴抽出部にて抽出された文字画像の画像特徴を基に、前記字形特徴辞書より、画像特徴の適合度が高い順にN個(N>1の整数)の文字画像を候補文字として選択し、前記文字列の文字数をM個(M>1の整数)とした場合に、M×N次の第1インデックス行列を作成し、この第1インデックス行列の第1列を構成する複数の候補文字からなる候補文字列に対して、予め定める言語モデルによる語彙解析を適用して意味を成す文字列に調整した第2インデックス行列を作成する特徴適合部と、
前記特徴適合部にて作成された第2インデックス行列を、前記入力された画像文書に対応づけて格納するインデックス情報格納部と、
検索時に、入力された検索式中の検索キーワードを構成する1検索文字単位に前記インデックス情報格納部を検索し、検索文字を含む第2インデックス行列を有する画像文書を取り出す検索部とを有することを特徴とする画像文書処理装置。 - 前記特徴適合部は、言語モデルとしてバイグラムまたはマルチグラムモデルを用いて候補文字列の語彙解析を行うことを特徴とする請求項1記載の画像文書処理装置。
- 前記特徴適合部は、語彙解析に基づいて、前記第1インデックス行列の第1列の候補文字と、同じ行の他の候補文字とを入れ替えることにより意味を成す候補文字列を調整することを特徴とする請求項1記載の画像文書処理装置。
- 前記文字列抽出部は、前記入力された画像文書における見出し領域を切り出すことを特徴とする請求項1に記載の画像文書処理装置。
- 前記文字列抽出部は、連通域統計分析法とにより、画像文書における重要領域を切り出すことを特徴とする請求項1に記載の画像文書処理装置。
- 前記画像特徴抽出部は、網格方向特徴と文字画像外囲特徴との組み合わせにより、文字画像の画像特徴を抽出することを特徴とする請求項1に記載の画像文書処理装置。
- 前記特徴適合部は、抽出された文字画像の画像特徴を、前記字形特徴辞書に格納されている全ての文字画像と適合させて候補文字を選択することを特徴とする請求項1に記載の画像文書処理装置。
- 前記特徴適合部が選択する候補文字数Nが変更可能であることを特徴とする請求項1に記載の画像文書処理装置。
- 前記検索部は、検索キーワードを構成する各検索文字のインデックス行列内の適合位置が高いインデックス行列を有する画像文書から順に取り出すことを特徴とする請求項1に記載の画像文書処理装置。
- 前記インデックス行列の各要素には、位置に応じた相関値が設定されており、
前記検索部は、
検索キーワードを構成する1検索文字単位にインデックス行列を検索して検索文字を含む第2インデックス行列を検出し、当該第2インデックス行列内における検索文字の適合位置の情報を、第2インデックス行列を有する画像文書の情報と共に保存部に格納するインデックス行列検索処理部と、
前記保存部に格納された適合位置の情報より、各検索文字の相関値を累積して、検索キーワードと第2インデックス行列との相関度を算出する相関度算出部と、
前記相関度算出部の算出結果に基づいて画像文書の取り出す順序を決定する順序決定部とを含むことを特徴とする請求項1に記載の画像文書処理装置。 - 前記相関度算出部は、前記適合位置の情報より、インデックス行列における隣接する行に適合していると判断すると、隣接する各行の相関値を行の相関度加重因子にて加重した上で累積することを特徴とする請求項10に記載の画像文書処理装置。
- 前記第2インデックス行列の各要素に設定されている相関値が、変更が可能であることを特徴とする請求項10に記載の画像文書処理装置。
- 前記行の相関度加重因子が、変更が可能であることを特徴とする請求項11に記載の画像文書処理装置。
- 前記画像特徴抽出部を用いて、前記字形特徴辞書を作成する字形特徴辞書作成部を備えることを特徴とする請求項1に記載の画像文書処理装置。
- 入力された画像文書中にある文字画像を複数の文字よりなる文字列単位で抽出する文字列抽出ステップと、
前記文字列抽出ステップにて抽出された文字列の文字画像を1文字ごとに分割して各文字画像の画像特徴を抽出する画像特徴抽出ステップと、
前記画像特徴抽出ステップにて抽出された文字画像の画像特徴を基に、文字画像の画像特徴を1文字単位で格納している字形特徴辞書より、画像特徴の適合度が高い順にN個(N>1の整数)の文字画像を候補文字として選択し、前記文字列の文字数をM個(M>1の整数)とした場合に、M×N次のインデックス行列を作成し、この第1インデックス行列の第1列を構成する複数の候補文字からなる候補文字列に対して、予め定める言語モデルによる語彙解析を適用して意味を成す文字列に調整した第2インデックス行列を作成する特徴適合ステップと、
前記特徴適合ステップにて作成された第2インデックス行列を、前記入力された画像文書に対応づけて格納するインデックス情報格納ステップと、
検索時に、前記インデックス情報格納ステップにて格納されたインデックス情報を、入力された検索式中の検索キーワードを構成する1検索文字単位に検索し、検索文字を含む第2インデックス行列を有する画像文書を取り出す検索ステップとを有することを特徴とする画像文書処理方法。 - コンピュータに請求項15記載の画像処理方法を実行させるための画像処理プログラム。
- コンピュータに請求項15記載の画像処理方法を実行させるための画像処理プログラムを記録したコンピュータ読み取り可能な記録媒体。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2007101296065A CN101354703B (zh) | 2007-07-23 | 2007-07-23 | 文档图像处理装置和文档图像处理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009026288A true JP2009026288A (ja) | 2009-02-05 |
JP4533920B2 JP4533920B2 (ja) | 2010-09-01 |
Family
ID=40295414
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007246158A Active JP4533920B2 (ja) | 2007-07-23 | 2007-09-21 | 画像文書処理装置、画像文書処理方法、画像処理プログラムおよび画像処理プログラムを記録した記録媒体 |
Country Status (3)
Country | Link |
---|---|
US (1) | US8208765B2 (ja) |
JP (1) | JP4533920B2 (ja) |
CN (1) | CN101354703B (ja) |
Families Citing this family (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090208446A1 (en) * | 2006-05-12 | 2009-08-20 | The Queen's University Of Belfast | DUB3 as a Cancer Therapy Target |
US10936650B2 (en) | 2008-03-05 | 2021-03-02 | Ebay Inc. | Method and apparatus for image recognition services |
US9495386B2 (en) | 2008-03-05 | 2016-11-15 | Ebay Inc. | Identification of items depicted in images |
US8818978B2 (en) | 2008-08-15 | 2014-08-26 | Ebay Inc. | Sharing item images using a similarity score |
US8825660B2 (en) * | 2009-03-17 | 2014-09-02 | Ebay Inc. | Image-based indexing in a network-based marketplace |
US9164577B2 (en) | 2009-12-22 | 2015-10-20 | Ebay Inc. | Augmented reality system, method, and apparatus for displaying an item image in a contextual environment |
CN102402693B (zh) * | 2010-09-09 | 2014-07-30 | 富士通株式会社 | 处理包含字符的图像的方法和设备 |
US8340429B2 (en) * | 2010-09-18 | 2012-12-25 | Hewlett-Packard Development Company, Lp | Searching document images |
US10127606B2 (en) | 2010-10-13 | 2018-11-13 | Ebay Inc. | Augmented reality system and method for visualizing an item |
CN102750514A (zh) * | 2011-04-20 | 2012-10-24 | 富士通株式会社 | 确定输入图像中的表单的类别的方法和装置 |
US9449342B2 (en) | 2011-10-27 | 2016-09-20 | Ebay Inc. | System and method for visualization of items in an environment using augmented reality |
US9934522B2 (en) | 2012-03-22 | 2018-04-03 | Ebay Inc. | Systems and methods for batch- listing items stored offline on a mobile device |
US10846766B2 (en) | 2012-06-29 | 2020-11-24 | Ebay Inc. | Contextual menus based on image recognition |
JP2014067154A (ja) * | 2012-09-25 | 2014-04-17 | Toshiba Corp | 文書分類支援装置、方法及びプログラム |
JP2014127186A (ja) * | 2012-12-27 | 2014-07-07 | Ricoh Co Ltd | 画像処理装置、画像処理方法およびプログラム |
JP2014174923A (ja) * | 2013-03-12 | 2014-09-22 | Ricoh Co Ltd | 文書処理装置、文書処理方法、および文書処理プログラム |
JP5915628B2 (ja) * | 2013-11-26 | 2016-05-11 | コニカミノルタ株式会社 | 画像形成装置、テキストデータの埋め込み方法及び埋め込みプログラム |
US10546015B2 (en) * | 2015-12-01 | 2020-01-28 | Facebook, Inc. | Determining and utilizing contextual meaning of digital standardized image characters |
JP6805720B2 (ja) | 2016-10-21 | 2020-12-23 | 富士通株式会社 | データ検索プログラム、データ検索装置およびデータ検索方法 |
JP6866636B2 (ja) * | 2016-12-26 | 2021-04-28 | カシオ計算機株式会社 | 文字編集方法、電子機器、及び、プログラム |
JP7059516B2 (ja) * | 2017-03-29 | 2022-04-26 | 富士通株式会社 | 符号化プログラム、符号化装置および符号化方法 |
RU2652461C1 (ru) * | 2017-05-30 | 2018-04-26 | Общество с ограниченной ответственностью "Аби Девелопмент" | Дифференциальная классификация с использованием нескольких нейронных сетей |
RU2701678C2 (ru) * | 2017-10-02 | 2019-09-30 | Федеральное государственное бюджетное образовательное учреждение высшего образования "Юго-Западный государственный университет "(ЮЗГУ) | Способ и устройство для обезвреживания и утилизации массива коммунальных отходов |
JP6346367B1 (ja) * | 2017-11-07 | 2018-06-20 | 株式会社Fronteoヘルスケア | 類似性指標値算出装置、類似検索装置および類似性指標値算出用プログラム |
CN109582813B (zh) * | 2018-12-04 | 2021-10-01 | 广州欧科信息技术股份有限公司 | 一种文物展品的检索方法、装置、设备和存储介质 |
JP7343311B2 (ja) * | 2019-06-11 | 2023-09-12 | ファナック株式会社 | 文書検索装置及び文書検索方法 |
CN111160843B (zh) * | 2019-12-04 | 2023-12-19 | 中国航空工业集团公司西安飞行自动控制研究所 | 产品数据管理系统中图与文档自检方法 |
JP7467107B2 (ja) * | 2019-12-25 | 2024-04-15 | キヤノン株式会社 | 画像処理装置、画像処理方法、およびプログラム |
CN111444907B (zh) * | 2020-03-24 | 2023-05-16 | 上海东普信息科技有限公司 | 文字识别的方法、装置、设备及存储介质 |
CN116847004B (zh) * | 2023-08-30 | 2023-11-17 | 江铃汽车股份有限公司 | 一种汽车can信号的解析方法、系统及计算机设备 |
Citations (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04115384A (ja) * | 1990-09-06 | 1992-04-16 | Nec Software Ltd | 単語チェック機能を持つ日本語ocr |
JPH05216995A (ja) * | 1991-07-30 | 1993-08-27 | Xerox Corp | 距離を方向の関数として用いる画像処理 |
JPH06103415A (ja) * | 1992-09-22 | 1994-04-15 | Toshiba Corp | 文章作成装置 |
JPH08153110A (ja) * | 1994-11-30 | 1996-06-11 | Canon Inc | 文書ファイリング装置及び方法 |
JPH08272811A (ja) * | 1995-03-30 | 1996-10-18 | Canon Inc | 文書管理方法及びその装置 |
JPH09319747A (ja) * | 1996-05-29 | 1997-12-12 | Ricoh Co Ltd | 文書画像の構造化方法 |
JPH1074250A (ja) * | 1996-06-26 | 1998-03-17 | Fuji Xerox Co Ltd | 文書処理装置、文書処理方法、および記憶媒体 |
JPH11316797A (ja) * | 1998-03-06 | 1999-11-16 | Matsushita Electric Ind Co Ltd | 文書画像の領域識別方法および装置 |
JP2000090201A (ja) * | 1998-09-11 | 2000-03-31 | Masaki Nakagawa | バイグラム辞書とその小型化方法並びに手書き文字の認識処理方法およびその装置 |
JP2000181994A (ja) * | 1998-12-16 | 2000-06-30 | Nippon Telegr & Teleph Corp <Ntt> | 文字認識処理方法及びその装置及びその方法を記録した記録媒体 |
JP2001344562A (ja) * | 2000-05-31 | 2001-12-14 | Toshiba Corp | 文書読取装置および文書読取方法 |
JP2002024765A (ja) * | 2000-07-04 | 2002-01-25 | Fuji Xerox Co Ltd | 文字認識装置及び文字認識方法 |
JP2003108926A (ja) * | 2001-09-26 | 2003-04-11 | Sanyo Electric Co Ltd | 文字認識装置、文字認識方法、その実行プログラムおよびそれを記憶した記録媒体 |
JP2005275849A (ja) * | 2004-03-25 | 2005-10-06 | Canon Inc | 文書処理装置および文書処理方法 |
JP2006085582A (ja) * | 2004-09-17 | 2006-03-30 | Fuji Xerox Co Ltd | 文書処理装置およびプログラム |
JP2007026386A (ja) * | 2005-07-21 | 2007-02-01 | Fuji Xerox Co Ltd | 画像検索システム及び方法 |
JP2007148925A (ja) * | 2005-11-29 | 2007-06-14 | Canon Inc | 情報処理装置及び情報処理方法 |
JP2007172077A (ja) * | 2005-12-19 | 2007-07-05 | Fuji Xerox Co Ltd | 画像検索システム及び方法及びプログラム |
JP4408129B2 (ja) * | 2007-01-15 | 2010-02-03 | シャープ株式会社 | 画像文書処理装置、画像文書処理方法、プログラム、及び記録媒体 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0797373B2 (ja) * | 1985-08-23 | 1995-10-18 | 株式会社日立製作所 | 文書フアイリングシステム |
EP0606780B1 (en) * | 1993-01-11 | 2001-07-11 | Canon Kabushiki Kaisha | Image processing method and apparatus |
JPH07152774A (ja) | 1993-11-30 | 1995-06-16 | Hitachi Ltd | 文書検索方法および装置 |
US5821929A (en) * | 1994-11-30 | 1998-10-13 | Canon Kabushiki Kaisha | Image processing method and apparatus |
US5999647A (en) * | 1995-04-21 | 1999-12-07 | Matsushita Electric Industrial Co., Ltd. | Character extraction apparatus for extracting character data from a text image |
JP3425834B2 (ja) * | 1995-09-06 | 2003-07-14 | 富士通株式会社 | 文書画像からのタイトル抽出装置および方法 |
US5835633A (en) * | 1995-11-20 | 1998-11-10 | International Business Machines Corporation | Concurrent two-stage multi-network optical character recognition system |
JP4280355B2 (ja) * | 1999-05-06 | 2009-06-17 | 富士通株式会社 | 文字認識装置 |
AUPQ439299A0 (en) | 1999-12-01 | 1999-12-23 | Silverbrook Research Pty Ltd | Interface system |
US6463428B1 (en) | 2000-03-29 | 2002-10-08 | Koninklijke Philips Electronics N.V. | User interface providing automatic generation and ergonomic presentation of keyword search criteria |
JP2002245062A (ja) | 2001-02-14 | 2002-08-30 | Ricoh Co Ltd | 文書検索装置、文書検索方法、プログラムおよび記録媒体 |
US7801392B2 (en) * | 2005-07-21 | 2010-09-21 | Fuji Xerox Co., Ltd. | Image search system, image search method, and storage medium |
CN100511230C (zh) | 2006-05-29 | 2009-07-08 | 北京万网志成科技有限公司 | 基于网页页面文本的图像检索及显示方法 |
-
2007
- 2007-07-23 CN CN2007101296065A patent/CN101354703B/zh not_active Expired - Fee Related
- 2007-09-21 JP JP2007246158A patent/JP4533920B2/ja active Active
-
2008
- 2008-01-10 US US11/972,446 patent/US8208765B2/en active Active
Patent Citations (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04115384A (ja) * | 1990-09-06 | 1992-04-16 | Nec Software Ltd | 単語チェック機能を持つ日本語ocr |
JPH05216995A (ja) * | 1991-07-30 | 1993-08-27 | Xerox Corp | 距離を方向の関数として用いる画像処理 |
JPH06103415A (ja) * | 1992-09-22 | 1994-04-15 | Toshiba Corp | 文章作成装置 |
JPH08153110A (ja) * | 1994-11-30 | 1996-06-11 | Canon Inc | 文書ファイリング装置及び方法 |
JPH08272811A (ja) * | 1995-03-30 | 1996-10-18 | Canon Inc | 文書管理方法及びその装置 |
JPH09319747A (ja) * | 1996-05-29 | 1997-12-12 | Ricoh Co Ltd | 文書画像の構造化方法 |
JPH1074250A (ja) * | 1996-06-26 | 1998-03-17 | Fuji Xerox Co Ltd | 文書処理装置、文書処理方法、および記憶媒体 |
JPH11316797A (ja) * | 1998-03-06 | 1999-11-16 | Matsushita Electric Ind Co Ltd | 文書画像の領域識別方法および装置 |
JP2000090201A (ja) * | 1998-09-11 | 2000-03-31 | Masaki Nakagawa | バイグラム辞書とその小型化方法並びに手書き文字の認識処理方法およびその装置 |
JP2000181994A (ja) * | 1998-12-16 | 2000-06-30 | Nippon Telegr & Teleph Corp <Ntt> | 文字認識処理方法及びその装置及びその方法を記録した記録媒体 |
JP2001344562A (ja) * | 2000-05-31 | 2001-12-14 | Toshiba Corp | 文書読取装置および文書読取方法 |
JP2002024765A (ja) * | 2000-07-04 | 2002-01-25 | Fuji Xerox Co Ltd | 文字認識装置及び文字認識方法 |
JP2003108926A (ja) * | 2001-09-26 | 2003-04-11 | Sanyo Electric Co Ltd | 文字認識装置、文字認識方法、その実行プログラムおよびそれを記憶した記録媒体 |
JP2005275849A (ja) * | 2004-03-25 | 2005-10-06 | Canon Inc | 文書処理装置および文書処理方法 |
JP2006085582A (ja) * | 2004-09-17 | 2006-03-30 | Fuji Xerox Co Ltd | 文書処理装置およびプログラム |
JP2007026386A (ja) * | 2005-07-21 | 2007-02-01 | Fuji Xerox Co Ltd | 画像検索システム及び方法 |
JP2007148925A (ja) * | 2005-11-29 | 2007-06-14 | Canon Inc | 情報処理装置及び情報処理方法 |
JP2007172077A (ja) * | 2005-12-19 | 2007-07-05 | Fuji Xerox Co Ltd | 画像検索システム及び方法及びプログラム |
JP4408129B2 (ja) * | 2007-01-15 | 2010-02-03 | シャープ株式会社 | 画像文書処理装置、画像文書処理方法、プログラム、及び記録媒体 |
Also Published As
Publication number | Publication date |
---|---|
CN101354703B (zh) | 2010-11-17 |
CN101354703A (zh) | 2009-01-28 |
US8208765B2 (en) | 2012-06-26 |
US20090028446A1 (en) | 2009-01-29 |
JP4533920B2 (ja) | 2010-09-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4533920B2 (ja) | 画像文書処理装置、画像文書処理方法、画像処理プログラムおよび画像処理プログラムを記録した記録媒体 | |
JP4740916B2 (ja) | 画像文書処理装置、画像文書処理プログラムおよび画像文書処理プログラムを記録した記録媒体 | |
JP4364914B2 (ja) | 画像文書処理装置、画像文書処理方法、プログラム、及び記録媒体 | |
JP4408129B2 (ja) | 画像文書処理装置、画像文書処理方法、プログラム、及び記録媒体 | |
JP2009026287A (ja) | 文字画像抽出装置および文字画像抽出方法 | |
JP4570648B2 (ja) | 画像文書処理装置、画像文書処理方法、画像文書処理プログラムおよび記録媒体 | |
JP4772817B2 (ja) | 画像文書処理装置および画像文書処理方法 | |
EP0544432B1 (en) | Method and apparatus for document processing | |
US8731300B2 (en) | Handwritten word spotter system using synthesized typed queries | |
EP0844583B1 (en) | Method and apparatus for character recognition | |
KR101588890B1 (ko) | 카메라 기반 영상의 문자 인식 및 번역 방법 | |
US20070143272A1 (en) | Method and apparatus for retrieving similar image | |
Wilkinson et al. | Neural Ctrl-F: segmentation-free query-by-string word spotting in handwritten manuscript collections | |
JPH05250408A (ja) | 取り込んだ情報で文書画像を復号することなく選択した文書の重要な部分を補完するための方法 | |
EP2806336A1 (en) | Text prediction in a text input associated with an image | |
US5890182A (en) | Sentence processing method and apparatus | |
JP2009110204A (ja) | 文書処理装置、文書処理システム、文書処理方法及び文書処理プログラム | |
JP2006092226A (ja) | 文書属性取得方法および装置並びにプログラムを記録した記録媒体 | |
Song et al. | Free-Flow: Unintrusive Reading Device for a Printed Text | |
JPH0696285A (ja) | 文字認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100212 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100309 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100415 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100518 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100614 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4533920 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130618 Year of fee payment: 3 |