JP2001337993A - 文字認識結果を利用して情報を検索する検索装置および方法 - Google Patents

文字認識結果を利用して情報を検索する検索装置および方法

Info

Publication number
JP2001337993A
JP2001337993A JP2000159688A JP2000159688A JP2001337993A JP 2001337993 A JP2001337993 A JP 2001337993A JP 2000159688 A JP2000159688 A JP 2000159688A JP 2000159688 A JP2000159688 A JP 2000159688A JP 2001337993 A JP2001337993 A JP 2001337993A
Authority
JP
Japan
Prior art keywords
character
keyword
information
rectangle
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2000159688A
Other languages
English (en)
Other versions
JP3917349B2 (ja
Inventor
Yutaka Katsuyama
裕 勝山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2000159688A priority Critical patent/JP3917349B2/ja
Publication of JP2001337993A publication Critical patent/JP2001337993A/ja
Application granted granted Critical
Publication of JP3917349B2 publication Critical patent/JP3917349B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 文書画像を文字認識した後の情報を用いて、
より高精度な検索を行うことが課題である。 【解決手段】 キーワードとして“富士通研究所”が入
力されると、文書画像の認識結果から、そのキーワード
を構成する各文字の情報が抽出される。例えば、文字
“通”が抽出された場合、その文字を含み、かつ、キー
ワードの文字数に対応する領域が推定され、その領域内
の画像情報を用いてキーワードが抽出される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、画像情報に対する
文字認識処理の結果を利用して、画像内の情報を検索す
る検索装置およびその方法に関する。
【0002】
【従来の技術】近年、企業等の組織内では、情報の共有
化および迅速な情報利用の観点から、文書を電子化して
共有する文書管理システムが使用されている。電子化文
書としては、作成時から電子化されているワードプロセ
ッサ文書やプレゼンテーション文書等のテキスト検索可
能な文書がよく使用されるが、その他にも、そのままで
はテキスト検索ができない画像情報も使用される。
【0003】画像を文書管理システムに登録する方法と
しては、後の検索処理のために、画像を文字認識して検
索可能なテキスト情報を抽出し、その情報を画像ととも
に保存する方法が一般的である。
【0004】しかし、文字認識処理の認識率は100%
ではなく、認識結果には誤認識も含まれる。また、通常
の検索方法では、誤認識を検出することができない。こ
のため、文書中にキーワードの文字列があるにもかかわ
らず、その文字列が誤認識のためにキーワードと一致せ
ず、検索できない場合がある。
【0005】これを防ぐために、文字認識の特性を利用
した検索用データ作成方法と、文字認識後のデータに対
する検索方法の開発が必要とされている。文字認識後の
情報を検索する従来の検索技術としては、例えば、以下
のような文献が挙げられる。 (#1)丸川(Marukawa)、藤澤(Fujisawa)、嶋(Sh
ima )「認識機能の出力あいまい性を許容した情報検索
手法の一検討 認識誤り特性に着目した検索手法の分析
評価」電子情報通信学会論文誌vol.J79-D-II, no.5, pp
785-794, 1996 (#2)太田(Ohta)、高須(Takasu)、安達(Adach
i)「認識誤りを含む和文テキストにおける全文検索手
法」情処学会論文誌vol.39, no.3, pp625-635, 1998 (#3)糸乗(Itonori )、尾崎(Ozaki )「類似文字
による日本語単語抽出」信学技報(Technical Report o
f IEICE)PRMU98-87, pp25-32, 1998 (#4)今川(Imagawa )、松川(Matsukawa )、近藤
(Kondo )、目片(Mekata)「文字毎に認識信頼度を付
与した誤認識を含むテキストからの検索手法」信学技報
PRMU99-72, pp63-75, 1999 (#5)近藤、松川、今川、目片「文字認識誤りを含む
テキストからのあいまい検索に関する一検討」信学技報
PRMU99-73, pp69-75, 1999 (#6)遊佐(Yusa)、田中(Tanaka)「日本語文書画
像に対する文字列検索機能の実現」情報処理、情報メデ
ィア研究報告19-1, pp1-8, 1995 (#7)中西(Nakanishi )、大町(Omachi)、阿曽
(Aso )「低品位文書画像に対応した高精度なキーワー
ド検索システム」信学技報PRMU98-232, pp97-104,1999 (#8)松川、今川、近藤、目片「形状特徴検索併用に
よる文書画像検索の性能向上」信学技報PRMU99-74, pp7
7-83, 1999 これらの従来技術は、以下のように分類できる。 a)文字認識候補とキーワードとの照合を行う方法 文字認識時に認識候補を生成し、検索時に候補を用い
て、複数の可能性を考慮しながら検索する。 文献(#1) 認識候補の数は固定数ではなく、文字毎に類似度のしき
い値処理を行い、認識候補を絞り込んでいる(しきい
値:4種類)。 b)類似文字によるキーワードの展開方法 b−1)類似文字テーブルによるキーワード文字列展開 1つのキーワードを類似文字情報により複数個に展開し
て検索する。 文献(#1) あらかじめ作っておいたコンフュージョンマトリクス
で、単純にキーワードを展開する。1文字に対する類似
文字数は固定数ではなく、あらかじめ文字毎に類似度の
しきい値処理を行い、類似文字を絞り込んでいる(しき
い値:4種類)。 文献(#2) 誤認識、誤欠落、誤挿入、誤結合、および誤分割を確率
的に表した誤り易さに基づく確率を格納したテーブルを
あらかじめ作っておき、そのテーブルを用いて、確率が
0以外のすべての組み合わせでキーワードを展開する。
次に、展開されたキーワードを使って全文検索を行う。
そして、検索で抽出された文字列毎に、確率的に求めた
文字列の確信度を計算し、しきい値を用いて適否を決め
る。 b−2)類似文字テーブルによる検索 文字認識された文字列に対して、類似文字テーブルを用
いて、検索毎の複数の対応関係の可能性を考慮して検索
する。 文献(#3) 形状の似た複数の文字を1つのカテゴリとして扱い、言
語処理で1つに絞り込んで検索する。
【0006】辞書作成)まず、階層的クラスタリングで
類似文字のカテゴリ(クラスタ)を作成する。次に、類
似文字クラスタを分割し、分割クラスタを再統合する。
【0007】識別)画像に対して、類似文字識別、形態
素解析、および詳細識別の順で処理を行い、単語列を生
成する。類似文字識別では、1000個または2000
個のカテゴリが用いられる。
【0008】まず、再統合クラスタ→分割クラスタ→類
似文字クラスタの階層的識別で、入力文字に最も近い類
似文字カテゴリを求め、類似文字カテゴリでできた文字
列を作成する。次に、類似文字カテゴリ用の形態素解析
で、類似文字カテゴリ内の文字を使った単語を生成す
る。このとき、形態素解析で1単語に絞り込めなかった
文字だけ、詳細識別で決定する。 文献(#4) 認識結果の確信度(信頼度)に応じて、類似文字テーブ
ルの展開文字数を文字毎に可変にしている。あらかじ
め、正しい文字と認識結果、およびその確信度からなる
類似文字テーブルを作り、認識時に文字認識結果とその
確信度を出力しておく。検索時には、キーワードの文字
と認識結果の文字、およびその確信度から、類似文字テ
ーブルを使って検索文字との照合確率を求める。そし
て、その値が正である場合に認識結果が照合されたもの
とみなして、検索を行う。この方法は、照合確率が正に
なる類似文字に限定した検索と同じである。 文献(#5) 文字毎に付与された文字認識の信頼度と文字数別特定可
能確率を用いる文献(#4)の検索方法に加えて、n文
字の単語のうちk文字が一致した場合にその単語が一意
に特定できる確率を使って検索する。文字数別特定可能
確率とは、比較的長い文字列長をもった単語の一部をワ
イルドカード扱いにして検索を行っても、別の単語が検
索されない確率のことである。 c)画像検索方法 画像照合により、文書画像からキーワード画像を直接検
索する。 文献(#6) まず、文字矩形を正方形とみなして16等分し、隣り合
った部分同士を縦または横に2つ組み合わせてできる長
方形を1単位とする。そして、隣同士の2つの長方形の
組み合わせのうち、正方形を作るような組み合わせを抽
出する。1文字からは、18セットの組み合わせができ
る。次に、1単位の中の黒画素密度を求め、隣同士の単
位間における黒画素密度の比を00〜11の2ビットで
コード化したものを特徴量とする。1文字当たり36ビ
ットの特徴量が得られ、照合時には、8ビットの誤りま
で許容される。 文献(#7) 複数の切り出し候補を出力し、切り出し候補毎に特徴ベ
クトルを登録する。検索時には、キーワード文字の最初
の文字から1文字毎にマッチングを行い、距離値が固定
しきい値以下である場合に、マッチしたものとする。こ
のとき、前の文字がマッチしたら次の文字は切り出し候
補を絞ることで、処理を高速化する。そして、すべての
文字の距離値がしきい値以下で、かつ、距離値の和が別
の固定しきい値以下の場合に、キーワードを検出する。 d)類似文字検索と画像検索を組み合わせた方法 文献:(#8) 認識結果の確信度(信頼度)に応じて、類似文字検索と
画像検索を切り替える。b−2)における文献(#4)
の類似文字検索を行い、照合条件に合う文字を抽出す
る。そして、類似文字検索で検出されず、かつ、信頼度
が固定しきい値より低い文字が連続する場合に、形状特
徴検索を行う。形状特徴検索では、キーワードの文字か
ら推定した幅になるように、隣接する低信頼度の文字を
統合して切り出す。次に、文字の特徴量を求め、それと
キーワードの文字の特徴量との間のユークリッド距離を
求める。そして、距離値が固定しきい値以下であれば、
照合されたものとする。
【0009】
【発明が解決しようとする課題】しかしながら、上述し
た従来の検索技術には、次のような問題がある。 a)文字認識候補とキーワードとの照合を行う方法 文献(#1) 検索対象文書画像のフォントによっては、候補文字の中
に正解が入らない場合がある。特に、類似文字が多数あ
る場合には、正解が候補文字の下位になってしまうと、
候補文字数の制限から足切りされて、候補文字の中に正
解が入らない。 b)類似文字によるキーワードの展開方法 b−1) 文献(#1) 展開したキーワードの数が、類似文字テーブルの大きさ
によって指数関数的に増え、計算量が膨大になる。 文献(#2) 処理対象が広がると、展開したキーワードの数が爆発的
に増える。 b−2) 文献(#3) 言語処理が入るので、複合語や文字数が少ない単語では
精度が悪くなる。 文献(#4) あらかじめ用意される類似文字テーブルの作り方によっ
ては、精度が期待できない。実際に、低解像度文字では
精度が悪いことが、この文献の著者らによって報告され
ている。 文献(#5) 複合語や文字数が少ない単語に弱い。また、文献(#
4)の方法と同様に、あらかじめ用意される類似文字テ
ーブルの作り方によっては、精度が期待できない。 c)画像検索方法 文献(#6) この方法で使用されている特徴量では、高精度が期待で
きない。また、テキストのみを使う検索に比べて、計算
量が多い。さらに、辞書作成フォント以外では、高精度
にならない。 文献(#7) テキストのみを使う検索に比べて、計算量が多い。ま
た、キーワードの最初の文字が検出できないと、対応す
る文字列を検索できない。さらに、辞書作成フォント以
外では、高精度にならない。 d)類似文字検索と画像検索を組み合わせた方法 文献(#8) 文献(#4)の方法と同様に、あらかじめ用意される類
似文字テーブルの作り方によっては、精度が期待できな
い。
【0010】本発明の課題は、文字認識後の情報の検索
処理において、上述した検索技術の良い部分を残し、不
完全な部分を改良して、より高精度な検索を行う検索装
置およびその方法を提供することである。
【0011】
【課題を解決するための手段】図1は、本発明の検索装
置の原理図である。図1の検索装置は、入力手段10
1、抽出手段102、推定手段103、および出力手段
104を備え、文書画像の認識結果の情報を用いて、そ
の文書画像内の情報を検索する。
【0012】入力手段101は、キーワードを入力し、
抽出手段102は、文書画像から、キーワードを構成す
る任意の文字をキー文字として抽出する。推定手段10
3は、抽出されたキー文字の位置情報に基づいて、文書
画像内のキーワードに対応する領域を推定し、出力手段
104は、推定された領域の情報に基づいて、検索結果
を出力する。
【0013】入力手段101は、例えば、ユーザにより
指定されたキーワードを検索装置に入力し、抽出手段1
02は、入力されたキーワードに含まれる任意の文字
を、文書画像から抽出し、それをキー文字として推定手
段103に渡す。推定手段103は、受け取ったキー文
字の位置から、そのキー文字を含み、かつ、キーワード
を構成する文字の数に対応するような領域を推定する。
そして、出力手段104は、推定された領域のうち、キ
ーワードに対応する文字列を含む領域の位置および範囲
の情報を出力する。
【0014】このような検索装置によれば、文書画像に
含まれる文字パターンのうち、キーワードを構成する任
意の文字に対応するパターンの位置を基準として、自動
的にキーワード領域を推定することができる。したがっ
て、キーワードの最初の文字が検出されなくても、他の
文字がキー文字として抽出されれば、キーワードに対応
する領域の情報が出力される。これにより、検索処理の
精度が向上する。
【0015】例えば、図1の入力手段101は、後述す
る図14の入力装置113に対応し、図1の抽出手段1
02および推定手段103は、図14のCPU111と
メモリ112の組み合わせに対応し、図1の出力手段1
04は、図14の出力装置114に対応する。
【0016】
【発明の実施の形態】以下、図面を参照しながら、本発
明の実施の形態を詳細に説明する。本実施形態の検索装
置は、まず、入力された画像情報の領域識別と文字認識
を行い、検索に必要な認識結果を含む検索用情報を生成
する。次に、検索用情報を用いて、キーワードを構成す
る文字を入力画像内で探索し、その文字の位置からキー
ワードが存在する領域の範囲を推定する。そして、その
領域内の画像情報を用いて文字列を検証し、キーワード
が抽出されれば、その位置を検索結果として出力する。
【0017】図2は、検索用情報生成処理のフローチャ
ートである。検索装置は、まず、検索対象の文書画像を
入力する(ステップS1)。このとき、ユーザは、紙文
書をスキャナ等の画像入力装置で光学的に読み取って、
検索装置に入力する。これにより、文書画像が検索装置
に登録される。文書画像としては、基本的に白黒の2値
画像を想定しているが、カラー画像であっても、前処理
として2値化を行うことで、2値画像と同様に扱うこと
ができる。
【0018】次に、検索装置は、文書画像を走査し、公
知の技術で領域識別を行って、文字領域を抽出する(ス
テップS2)。ここでは、例えば、画像全体をラベリン
グして黒画素連結領域の外接矩形を抽出し、一定サイズ
以上の矩形を図形・表領域候補として抽出する。次に、
図・表領域候補の各矩形の内部を対象として罫線抽出を
行い、縦横の罫線が抽出されれば、その矩形を表領域と
識別する。また、罫線が抽出されなければ、その矩形を
図領域と識別する。そして、図・表領域以外の領域を文
字領域として抽出する。
【0019】次に、文字領域から行(文字列)を抽出
し、各行を対象として文字認識を行い、認識結果を含む
検索用情報を生成して出力する(ステップS3)。この
とき、黒画素連結領域の外接矩形を元にして1文字の領
域が決められ、画像情報から文字パターンが切り出され
る。
【0020】ただし、文字同士が接触している場合もあ
るので、接触文字切り出し技術を用いて接触文字を分割
し、文字あるいは文字の部分パターンを単位(基本矩
形)として、検索用情報を出力する。接触文字切り出し
技術としては、例えば、特開平11−338975
(「文字切り出し処理方式および文字切り出し処理プロ
グラムを記録した記録媒体」)の技術が用いられる。
【0021】また、“川”のような分離文字を正確に抽
出するため、隣接する基本矩形を統合して文字候補の統
合矩形を作り、その矩形についても同様の検索用情報を
出力する。
【0022】以下では、検索用情報の出力単位となる基
本矩形と統合矩形を合わせて、文字矩形と呼ぶことにす
る。検索用情報の出力は行単位で行われ、1つの行内で
各文字矩形の情報をソートして出力する。各文字矩形の
検索用情報には、以下のようなものが含まれる。 a)文字認識結果情報 この情報は、文字認識により得られた第1位から第n位
までの認識候補の情報である(n≧1)。各候補の情報
の内容は、文字コード、距離値、評価値、または確信度
である。文字コードは、検索するときのために、すべて
全角コードに変換しておく。距離値は、認識対象の文字
パターンと認識辞書の文字パターンの間の類似度を表
し、評価値は、認識候補に対する評価を表す。また、確
信度は、認識候補の確からしさを表し、例えば、その候
補の距離値と他の候補の距離値を用いて算出される。 b)文字図形特徴情報 この情報は、複数の文字の図形的な特徴を表す情報で、
以下の情報を含む。 ・文字パターンそのもの ・文字パターンを画像処理した情報(画像特徴) 文字の識別能力がはっきりしている情報が望ましく、具
体的には、特徴ベクトル等が用いられる。キーワードの
中の1文字の文字コードをキーとして、認識辞書中の特
徴ベクトルとこの特徴ベクトルを整合させたときに、同
じ文字同士では確実に整合でき、異なる文字同士では整
合できないような性質が要求される。例えば、以下のよ
うな特徴ベクトルが挙げられる。 1)文字パターンから求めた詳細分類用特徴ベクトル
(288次元) 文字パターンから多元圧縮法という公知技術を用いて、
288次元の特徴ベクトルを抽出する(Hai, Kabuyama,
Yamamoto「手書き漢字認識の一手法 多元圧縮法と部
分パターン法による認識」電子情報通信学会論文誌vol.
J68-D no.4, pp773-780, 1985 )。この方法では、ま
ず、文字パターンの輪郭点毎に、4方向の属性を持たせ
て方向線素を求め、文字パターンを非線形正規化した後
に、方向毎に異なる数の領域に分割する。そして、各領
域毎に方向線素の画素数をカウントして、カウント値を
規定の順序で並べ、ベクトル化する。これにより、詳細
分類用特徴ベクトルが得られる。 2)文字パターンから求めた大分類用特徴ベクトル(1
6次元) 上述の詳細分類用特徴ベクトルを元にして、カテゴリ毎
に固有値と固有ベクトルを求め、固有値の大きい方から
16本の軸(固有ベクトル)を求める。そして、各軸上
にカテゴリの代表ベクトルを投影した値を要素とする1
6次元のベクトルを生成する。これにより、大分類用特
徴ベクトルが得られる。
【0023】これらの特徴ベクトルを用いれば、キーワ
ードの中の1文字の文字コードに相当する認識辞書中の
特徴ベクトルと、検索対象文書中の文字の特徴ベクトル
を整合させたときに、同じ文字同士では、距離のしきい
値を用いることでそれらが同じ文字であると判別でき
る。また、異なる文字同士では、同じ距離のしきい値を
用いて、それらが異なっていると判別できる。 c)文字情報 ・文字の位置 例えば、文字の黒画素連結領域の外接矩形の左上および
右下の頂点の座標値が用いられる。 ・サイズ情報 この情報は、文字が属する行内に含まれる代表的な文字
矩形のサイズを表す。例えば、文字が属する行内に含ま
れる文字矩形の高さと幅の最頻値が用いられる。 ・行内の文字間隔距離の代表値 例えば、行内の文字の外接矩形間の距離の平均値が用い
られる。 ・行内の文字矩形の並びと、文字矩形の順序を表す情報 例えば、横書き行であれば、図3に示すように、基本矩
形の間隙部に、左側から順に、0,1,2,...のよ
うな通し番号を付ける。そして、1つの文字矩形の開始
番号として、その矩形の左側の間隙番号を設定し、終了
番号として右側の間隙番号を設定して、文字矩形の順序
情報を生成する。
【0024】図3の文字矩形のうち、矩形1〜矩形9は
基本矩形に対応し、矩形10〜矩形15は、複数の基本
矩形を統合した統合矩形に対応する。例えば、矩形10
は、矩形1と矩形2を統合して生成され、矩形14は、
矩形1、矩形2、および矩形3を統合して生成される。
これらの矩形は、1つの行に対する複数の異なる切り出
し結果を表している。また、これらの矩形の順序情報
は、図4のようになる。 d)行情報 ・行番号 行番号は、ページ内の各行に付けられたユニークな番号
を表す。 ・行方向 行方向は、縦または横を表す。
【0025】図5は、出力された検索用情報に基づく全
文検索処理のフローチャートである。まず、ユーザは、
検索したいキーワードを入力する(ステップS11)。
次に、検索装置は、検索用情報を格納した検索対象ファ
イルから、キーワードを構成する文字(キー文字)を抽
出し(ステップS12)、キー文字に基づいて、キーワ
ードに対応する文字列が存在する領域を推定する(ステ
ップS13)。
【0026】次に、その領域内の画像情報を認識辞書の
情報と比較して、領域内にキーワードが含まれているか
否かを検証し、キーワードと整合する文字列を抽出する
(ステップS14)。そして、抽出された文字列の位置
情報を検索結果として出力し(ステップS15)、処理
を終了する。
【0027】次に、図6から図13までを参照しなが
ら、全文検索処理の具体例について説明する。図6およ
び図7は、図5のステップS12で行われるキー文字抽
出処理のフローチャートである。この処理では、認識候
補の確信度に基づくキー文字探索が行われる。そして、
入力されたキーワードの中の1文字の文字コードと検索
対象ファイルの中の文字(第2位以下の認識候補も含
む)の文字コードが一致し、かつ、確信度が一定しきい
値を越える場合に、その文字をキー文字として抽出す
る。
【0028】検索装置は、まず、キーワードの中の各文
字を保持する配列keycodeを作成し(図6のステ
ップS21)、キーワードの文字数を変数keywor
d_numに入れる(ステップS22)。次に、抽出さ
れたキー文字の数を表す変数extract_numに
0を入れ(ステップS23)、検索対象ファイルから認
識結果の1文字を抽出する(ステップS24)。
【0029】次に、認識候補の順位を表す変数iに1を
入れ(ステップS25)、配列keycodeのインデ
ックスを表す変数jに1を入れて(ステップS26)、
i番目の候補の文字コードを、keycodeのj番目
の文字の文字コードと比較する(ステップS27)。
【0030】2つの文字コードが一致すれば、次に、i
番目の候補の確信度を一定しきい値と比較する(ステッ
プS28)。確信度がしきい値を越えていれば、ステッ
プS24で抽出された文字をキー文字とみなし、key
codeのj番目の文字コードと、抽出された文字の位
置を記録する(ステップS29)。そして、extra
ct_num=extract_num+1とおく(ス
テップS30)。
【0031】次に、j=j+1とおき(図7のステップ
S31)、jをkeyword_numと比較する(ス
テップS32)。そして、jがkeyword_num
以下であれば、ステップS27以降の処理を繰り返す。
【0032】また、ステップS27において2つの文字
コードが一致しない場合、および、ステップS28にお
いて確信度がしきい値以下である場合は、ステップS2
4で抽出された文字はキー文字ではないと判断して、ス
テップS31以降の処理を行う。
【0033】ステップS32においてjがkeywor
d_numを越えると、次に、i=i+1とおき(ステ
ップS33)、iを認識候補の数と比較する(ステップ
S34)。そして、iが認識候補の数以下であれば、ス
テップS26以降の処理を繰り返す。
【0034】iが認識候補の数を越えると、次に、検索
対象ファイルの中の文字が終了したか否かをチェックす
る(ステップS35)。未処理の文字が残っていれば、
次の文字についてステップS24以降の処理を繰り返
す。そして、すべての文字が処理されると、処理を終了
する。
【0035】この処理では、認識候補の確信度の代わり
に、評価値や距離値を用いることもできる。評価値を用
いた場合は、ステップS28において認識候補の評価値
を一定しきい値と比較し、評価値がしきい値を越えてい
れば、検索対象ファイルの文字をキー文字とみなす。ま
た、距離値を用いた場合は、ステップS28において認
識候補の距離値を一定しきい値と比較し、距離値がしき
い値を下回れば、検索対象ファイルの文字をキー文字と
みなす。
【0036】上述したキー文字抽出処理によれば、検索
対象ファイルの中の各文字について、複数の認識候補と
キーワードを構成する文字とが照合されるので、文書画
像中のキー文字が検出され易くなる。また、認識候補の
確信度、評価値、または距離値に基づいてキー文字が抽
出されるので、キー文字の抽出精度が向上する。
【0037】図8および図9は、図5のステップS13
で行われるキーワード領域推定処理のフローチャートで
ある。この処理では、抽出されたキー文字の文字情報か
ら、キーワード内におけるその文字の位置を獲得する。
そして、キーワード内の位置と、キーワードの文字数や
文字幅等の文字範囲情報から、キー文字を囲む推定キー
ワード領域を求める。例えば、横書きの場合は、キー文
字から左右に伸びるキーワード領域が生成され、縦書き
の場合は、キー文字から上下に伸びるキーワード領域が
生成される。
【0038】検索装置は、まず、抽出されたキー文字の
1つを指す変数iに1を入れ(図8のステップS4
1)、既抽出キーワード領域の数を表す変数kwnum
に0を入れて(ステップS42)、i番目のキー文字の
文字コードと検索対象ファイル内の位置の情報を取得す
る(ステップS43)。
【0039】次に、キー文字の位置、サイズ(キー文字
が属する行の文字の幅または高さ)、文字間隔距離等の
文字情報と、そのキー文字のキーワード内における位置
から、文書画像内におけるキーワード領域を推定する
(ステップS44)。
【0040】例えば、キーワードとして“富士通研究
所”が入力され、キー文字として“通”が抽出された場
合を考える。この例では、図10に示すように、文書画
像内にxy座標系が設定され、抽出された文字“通”の
文字情報には、文字矩形の左上頂点の座標(x,y)=
(200,500)と右下頂点の座標(250,55
0)が、位置として記録されている。また、代表的な文
字幅は50ドットであり、文字間隔距離は10ドットで
あることが記録されている。
【0041】この場合、推定キーワード領域の上端およ
び下端の座標値としては、それぞれ、左上頂点のy座標
500および右下頂点のy座標550が採用され、左端
および右端の座標値は、次式により計算される。 左座標: 左上頂点のx座標−(文字幅+文字間隔距離)×(キー文字の左側の文字数) =200−(50+10)×2 =80 右座標: 右下頂点のx座標+(文字幅+文字間隔距離)×(キー文字の右側の文字数) =250+(50+10)×3 =430 したがって、推定キーワード領域の範囲を左上および右
下頂点の座標を用いて表すと、(80,500)−(4
30,550)となる。
【0042】次に、検索装置は、既に登録されたキーワ
ード領域の1つを指す変数jに1を入れ、既抽出キーワ
ード領域との重複フラグ変数kwnum2に0を入れて
(ステップS45)、推定キーワード領域がj番目の既
登録キーワード領域と重複するか否かをチェックする
(ステップS46)。
【0043】2つのキーワード領域が重複すれば、それ
らのキーワード領域を囲む矩形領域を新たなキーワード
領域として求め、j番目の既登録キーワード領域の座標
を更新する(ステップS47)。これにより、j番目の
既登録キーワード領域の範囲が新たなキーワード領域の
範囲に置き換えられる。そして、kwnum2=1とお
く。
【0044】次に、j=j+1とおき(ステップS4
8)、jとkwnumを比較する(図9のステップS4
9)。そして、jがkwnum以下であれば、ステップ
S46以降の処理を繰り返し、jがkwnumを越えれ
ば、次に、kwnum2の値をチェックする。
【0045】kwnum2=0であれば、推定キーワー
ド領域を新規に登録し、kwnum=kwnum+1と
おく(ステップS51)。次に、i=i+1とおいて
(ステップS52)、i番目の抽出キー文字の情報があ
るか否かをチェックする(ステップS53)。そして、
i番目の抽出キー文字があれば、ステップS43以降の
処理を繰り返し、抽出キー文字の情報が終了すれば、処
理を終了する。
【0046】ステップS46において、2つのキーワー
ド領域が重複しなければ、そのままステップS48以降
の処理を行い、ステップS50において、kwnum2
>0であれば、ステップS52以降の処理を行う。
【0047】このようなキーワード領域推定処理によれ
ば、抽出されたキー文字の位置に基づいて、その文字を
含むキーワード領域の範囲を精度良く推定することがで
きる。また、キーワードの最初の文字がキー文字として
抽出されなくても、他の文字がキー文字として抽出され
れば、その文字の位置から対応するキーワード領域を推
定することができる。さらに、複数のキー文字が1つの
キーワード領域を構成する場合に、そのキーワード領域
を正しく抽出することができる。
【0048】図11は、図5のステップS14で行われ
るキーワード抽出処理のフローチャートである。この処
理では、得られた推定キーワード領域の範囲の文字矩形
を対象として、文字パターンの画像を認識辞書の対応す
る文字と整合させ、領域内の文字列が本当にキーワード
であるか否かを検証する。
【0049】例えば、キーワード領域内の重複しない矩
形の組み合わせをすべて求め、得られた組み合わせの各
々について、各矩形内の文字パターンから求めた画像特
徴と、辞書から求めたキーワード構成文字の画像特徴を
整合させる。これらの組み合わせは、それぞれ異なる文
字切り出し結果に対応する。そして、整合度が一定しき
い値以上(例えば、距離値の合計が一定しきい値以下)
の組み合わせが存在する場合に、キーワードが検出され
たものとみなす。
【0050】例えば、キーワード領域内に図3の文字矩
形が含まれる場合、以下のような矩形の組み合わせが考
えられる。 ・矩形1〜矩形9 ・矩形10、および矩形3〜矩形9 ・矩形10、矩形13、および矩形4〜矩形9 ・矩形10、矩形11、および矩形5〜矩形9 ・矩形10〜矩形12、および矩形7〜矩形9 ・矩形1、矩形2、矩形11、および矩形5〜矩形9 ・矩形1、矩形2、矩形11、矩形12、および矩形7
〜矩形9 ・矩形1〜矩形4、矩形12、および矩形7〜矩形9 ・矩形1、矩形13、および矩形4〜矩形9 ・矩形1、矩形13、矩形4、矩形12、および矩形7
〜矩形9 ・矩形14、および矩形4〜矩形9 ・矩形14、矩形4、矩形12、および矩形7〜矩形9 ・矩形14、矩形15、および矩形6〜矩形9 ・矩形10、矩形3、矩形15、および矩形6〜矩形9 ・矩形1、矩形13、矩形15、および矩形6〜矩形9 図11では、1つの推定キーワード領域についての検証
処理が示されているが、検索装置は、同様の処理をすべ
ての推定キーワード領域について行い、キーワードが検
出された領域だけを、検索結果として出力する。推定キ
ーワード領域内の各組み合わせに含まれる矩形は、あら
かじめ、対応する行の先頭に近いものから順にソートさ
れているものとする。
【0051】検索装置は、まず、キーワード領域内の矩
形の組み合わせの1つに注目し、その組み合わせの最初
の矩形をカレント矩形として選択する(ステップS6
1)。次に、キーワードの中の文字と一致した領域内の
文字の数を表す変数numに0を入れ、キーワードの中
の文字を指す変数kに1を入れて(ステップS62)、
再帰的整合処理を呼び出す(ステップS63)。再帰的
整合処理では、画像特徴を用いて領域内の各文字パター
ンとキーワードの文字パターンとを照合し、一致した文
字数を復帰値としてnumに設定する。
【0052】次に、復帰値numとキーワードの文字数
を比較し(ステップS64)、両者が一致しなければ、
同じキーワード領域内に他の組み合わせがあるか否かを
チェックする(ステップS65)。他の組み合わせがあ
れば、その組み合わせについてステップS61以降の処
理を繰り返す。
【0053】ステップS64において、numとキーワ
ード文字数が一致すれば、キーワードが検出された領域
の数をインクリメントして(ステップS66)、ステッ
プS65の処理を行う。そして、ステップS65におい
て、キーワード領域内のすべての組み合わせの検証が終
了すれば、処理を終了する。
【0054】ステップS63の再帰的整合処理では、ま
ず、キーワード領域内の矩形の文字パターンと文字情報
を取得する。その後の処理で用いられる検証方法には、
以下のような方法がある。 a)すべての矩形の文字パターンについて検証を行う方
法 領域内のすべての矩形について、画像情報を用いた整合
処理としきい値処理を行い、対象矩形がキーワードを構
成する文字か否かを検証する。
【0055】具体的には、領域内のすべての矩形につい
て画像情報によるマッチングを行い、しきい値以下の距
離の矩形をキーワードの文字と整合したものとみなす。
そして、キーワードの文字がすべて領域内の矩形と整合
した場合に、キーワードが抽出されたとみなす。この方
法によれば、すべての矩形が画像情報を用いて検証され
るため、キーワードの抽出精度が向上する。 b)確信度の低い矩形の文字パターンのみについて検証
を行う方法 領域内の矩形から、確信度が所定の条件を満たすような
ものを除き、残りの矩形を対象として、画像特徴情報を
用いた整合処理としきい値処理を行う。
【0056】具体的には、領域内の矩形のうち、確信度
がしきい値より高い矩形は、既にキーワードの文字と整
合がとれているとみなし、確信度がしきい値以下の矩形
について、画像情報によるマッチングを行う。そして、
しきい値以下の距離の矩形をキーワードの文字と整合し
たものとみなし、キーワードの文字がすべて領域内の矩
形と整合した場合に、キーワードが抽出されたとみな
す。この方法によれば、キーワードの抽出精度を損なう
ことなく、処理時間を削減することができる。
【0057】図12および図13は、a)の検証方法を
用いた再帰的整合処理のフローチャートである。検索装
置は、まず、カレント矩形の開始番号とその前の矩形の
終了番号を比較する(図12のステップS71)。両者
が一致しなければ、次に、カレント矩形の開始番号が0
であるか否かをチェックする(ステップS72)。カレ
ント矩形の開始番号が0であれば、次に、カレント矩形
の行番号が前の行の行番号+1であるか否かをチェック
する(ステップS73)。
【0058】カレント矩形の行番号が前の行の行番号+
1であれば、次に、カレント矩形内の文字の画像特徴
(特徴ベクトル等)と、キーワードのk番目の文字の画
像特徴を比較する(ステップS74)。そして、画像特
徴間の距離がしきい値以下であれば、カレント矩形の文
字とキーワードのk番目の文字が一致したものとみな
し、num=num+1とおく(ステップS75)。
【0059】次に、k+1をキーワードの文字数と比較
する(図13のステップS76)。そして、k+1がキ
ーワード文字数以下であれば、k=k+1とおき(ステ
ップS77)、カレント矩形の次の矩形を新たなカレン
ト矩形に設定する(ステップS78)。次の矩形として
は、カレント矩形の終了番号を開始番号として持つ矩形
が選択される。そして、再帰的整合処理を呼び出して復
帰値numを取得し(ステップS79)、呼び出し元に
numを返して(ステップS80)、処理を終了する。
【0060】ステップS71において、カレント矩形の
開始番号と前の矩形の終了番号が一致すれば、ステップ
S74以降の処理を行う。また、ステップS72におい
て開始番号が0でない場合と、ステップS73において
行番号が前の行の行番号+1でない場合と、ステップS
74においてカレント矩形の文字とキーワードのk番目
の文字が一致しない場合は、そのままステップS80の
処理を行う。また、ステップS76において、k+1が
キーワード文字数を越えた場合も、ステップS80の処
理を行う。
【0061】b)の検証方法を用いた場合は、領域内の
すべての矩形ではなく、確信度が高い矩形の間にある矩
形を対象にして、図12および図13と同様の処理を行
う。この場合、図11のステップS64では、キーワー
ドの中の文字のうち、確信度が高い文字を除いた残りの
文字(部分的な文字列)の数がキーワード文字数として
用いられる。
【0062】また、b)の検証方法において、確信度の
代わりに、評価値や距離値を用いて同様の処理を行うこ
ともできる。この場合、キーワード領域内の矩形から、
評価値または距離値が所定の条件を満たすようなものを
除き、残りの矩形を対象として、整合処理としきい値処
理を行う。
【0063】本実施形態のパターン抽出装置は、例え
ば、図14に示すような情報処理装置(コンピュータ)
を用いて構成することができる。図14の情報処理装置
は、CPU(中央処理装置)111、メモリ112、入
力装置113、出力装置114、外部記憶装置115、
媒体駆動装置116、ネットワーク接続装置117、お
よび画像入力装置118を備え、それらはバス119に
より互いに接続されている。
【0064】メモリ112は、例えば、ROM(read o
nly memory)、RAM(random access memory)等を含
み、処理に用いられるプログラムとデータを格納する。
CPU111は、メモリ112を利用してプログラムを
実行することにより、必要な処理を行う。
【0065】入力装置113は、例えば、キーボード、
ポインティングデバイス、タッチパネル等であり、ユー
ザからの指示や情報の入力に用いられる。出力装置11
4は、例えば、ディスプレイ、プリンタ、スピーカ等で
あり、ユーザへの問い合わせや処理結果の出力に用いら
れる。
【0066】外部記憶装置115は、例えば、磁気ディ
スク装置、光ディスク装置、光磁気ディスク(magneto-
optical disk)装置等である。情報処理装置は、この外
部記憶装置115に、上述のプログラムとデータを保存
しておき、必要に応じて、それらをメモリ112にロー
ドして使用することができる。また、外部記憶装置11
5は、検索対象ファイルを格納するデータベースとして
も用いられる。
【0067】媒体駆動装置116は、可搬記録媒体12
0を駆動し、その記録内容にアクセスする。可搬記録媒
体120としては、メモリカード、フロッピー(登録商
標)ディスク、CD−ROM(compact disk read only
memory )、光ディスク、光磁気ディスク等、任意のコ
ンピュータ読み取り可能な記録媒体が用いられる。ユー
ザは、この可搬記録媒体120に上述のプログラムとデ
ータを格納しておき、必要に応じて、それらをメモリ1
12にロードして使用することができる。
【0068】ネットワーク接続装置117は、LAN
(local area network)等の任意の通信ネットワークへ
の接続に用いられ、通信に伴うデータ変換を行う。情報
処理装置は、上述のプログラムとデータをネットワーク
接続装置117を介して外部の装置から受け取り、それ
らをメモリ112にロードして使用することができる。
【0069】画像入力装置118は、例えば、CCDカ
メラやスキャナ等の撮像装置であり、カラー画像を含む
文書画像の入力に用いられる。図15は、図14の情報
処理装置にプログラムとデータを供給することのできる
コンピュータ読み取り可能な記録媒体を示している。可
搬記録媒体120や外部のデータベース121に保存さ
れたプログラムとデータは、メモリ112にロードされ
る。そして、CPU111は、そのデータを用いてその
プログラムを実行し、必要な処理を行う。
【0070】以上説明した実施形態では、文字位置の情
報として矩形の座標を用いているが、本発明では、その
他の任意の形状の座標を用いることができる。また、推
定キーワード領域として、矩形以外の形状を用いてもよ
い。 (付記1) 文書画像の認識結果の情報を用いて、該文
書画像内の情報を検索する検索装置であって、キーワー
ドを入力する入力手段と、前記文書画像から、前記キー
ワードを構成する任意の文字をキー文字として抽出する
抽出手段と、前記キー文字の位置情報に基づいて、前記
文書画像内の前記キーワードに対応する領域を推定する
推定手段と、推定された領域の情報に基づいて、検索結
果を出力する出力手段とを備えることを特徴とする検索
装置。 (付記2) 前記抽出手段は、前記文書画像内の文字の
複数の認識候補と前記キーワードを構成する任意の文字
を比較して、前記キー文字を抽出することを特徴とする
付記1記載の検索装置。 (付記3) 前記抽出手段は、前記文書画像内の文字の
認識候補の確信度、評価値、および距離値のうちの1つ
を用いて、前記キー文字を抽出することを特徴とする付
記1記載の検索装置。 (付記4) 前記推定手段は、前記文書画像内の文字の
サイズ情報および文字間隔の情報のうち少なくとも一方
と、前記キー文字の位置情報とを用いて、前記キーワー
ドに対応する領域の範囲を計算することを特徴とする付
記1記載の検索装置。 (付記5) 前記推定された領域内の文字パターンに基
づいて、該推定された領域内の文字列が前記キーワード
であるか否かを検証する検証手段をさらに備え、前記出
力手段は、該キーワードであることが検証された文字列
を含む領域の情報を、前記検索結果として出力すること
を特徴とする付記1記載の検索装置。 (付記6) 前記検証手段は、前記推定された領域内の
すべての文字パターンを対象として、画像特徴情報を用
いた整合処理としきい値処理を行い、対象文字パターン
がキーワードを構成する文字か否かを検証することを特
徴とする付記5記載の検索装置。 (付記7) 前記検証手段は、前記推定された領域内の
文字パターンから、確信度、評価値、および距離値のう
ちの1つが所定の条件を満たすような文字パターンを除
き、残りの文字パターンを対象として、画像特徴情報を
用いた整合処理としきい値処理を行い、対象文字パター
ンがキーワードを構成する文字か否かを検証することを
特徴とする付記5記載の検索装置。 (付記8) 前記検証手段は、複数の文字切り出し結果
に対応する、文字パターンの複数の組み合わせの各々に
ついて、画像特徴情報を用いた整合処理としきい値処理
を行い、各組み合わせが前記キーワードに対応するか否
かを検証することを特徴とする付記5記載の検索装置。 (付記9) あらかじめ前記文書画像を文字認識して、
認識結果を含む検索用情報を生成する生成手段と、該検
索用情報を検索対象ファイルとして格納する格納手段を
さらに備え、前記抽出手段と推定手段は、該格納手段に
格納された該検索用情報を用いて処理を行うことを特徴
とする付記1記載の検索装置。 (付記10) 文書画像の認識結果の情報を用いて、該
文書画像内の情報を検索するコンピュータのためのプロ
グラムを記録した記録媒体であって、前記プログラム
は、前記文書画像から、キーワードを構成する任意の文
字をキー文字として抽出し、前記キー文字の位置情報に
基づいて、前記文書画像内の前記キーワードに対応する
領域を推定し、推定された領域の情報に基づいて、検索
結果を出力する処理を前記コンピュータに実行させるこ
とを特徴とするコンピュータ読み取り可能な記録媒体。 (付記11) 文書画像の認識結果の情報を用いて、該
文書画像内の情報を検索する検索方法であって、キーワ
ードを指定し、前記文書画像から、前記キーワードを構
成する任意の文字をキー文字として抽出し、前記キー文
字の位置情報に基づいて、前記文書画像内の前記キーワ
ードに対応する領域を推定し、推定された領域の情報に
基づいて、検索結果を提示することを特徴とする検索方
法。
【0071】
【発明の効果】本発明によれば、画像内の情報の検索処
理において、文字認識結果が有効に利用され、高精度な
検索を行うことができる。これにより、従来では誤認識
のために検索できなかった文書画像中の単語について
も、キーワードによる全文検索が可能になる。
【図面の簡単な説明】
【図1】本発明の検索装置の原理図である。
【図2】検索用情報生成処理のフローチャートである。
【図3】文字矩形を示す図である。
【図4】文字矩形の順序情報を示す図である。
【図5】全文検索処理のフローチャートである。
【図6】キー文字抽出処理のフローチャート(その1)
である。
【図7】キー文字抽出処理のフローチャート(その2)
である。
【図8】キーワード領域推定処理のフローチャート(そ
の1)である。
【図9】キーワード領域推定処理のフローチャート(そ
の2)である。
【図10】キーワード領域を示す図である。
【図11】キーワード抽出処理のフローチャートであ
る。
【図12】再帰的整合処理のフローチャート(その1)
である。
【図13】再帰的整合処理のフローチャート(その2)
である。
【図14】情報処理装置の構成図である。
【図15】記録媒体を示す図である。
【符号の説明】
101 入力手段 102 抽出手段 103 推定手段 104 出力手段 111 CPU 112 メモリ 113 入力装置 114 出力装置 115 外部記憶装置 116 媒体駆動装置 117 ネットワーク接続装置 118 画像入力装置 119 バス 120 可搬記録媒体 121 データベース

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 文書画像の認識結果の情報を用いて、該
    文書画像内の情報を検索する検索装置であって、 キーワードを入力する入力手段と、 前記文書画像から、前記キーワードを構成する任意の文
    字をキー文字として抽出する抽出手段と、 前記キー文字の位置情報に基づいて、前記文書画像内の
    前記キーワードに対応する領域を推定する推定手段と、 推定された領域の情報に基づいて、検索結果を出力する
    出力手段とを備えることを特徴とする検索装置。
  2. 【請求項2】 前記推定手段は、前記文書画像内の文字
    のサイズ情報および文字間隔の情報のうち少なくとも一
    方と、前記キー文字の位置情報とを用いて、前記キーワ
    ードに対応する領域の範囲を計算することを特徴とする
    請求項1記載の検索装置。
  3. 【請求項3】 前記推定された領域内の文字パターンに
    基づいて、該推定された領域内の文字列が前記キーワー
    ドであるか否かを検証する検証手段をさらに備え、前記
    出力手段は、該キーワードであることが検証された文字
    列を含む領域の情報を、前記検索結果として出力するこ
    とを特徴とする請求項1記載の検索装置。
  4. 【請求項4】 文書画像の認識結果の情報を用いて、該
    文書画像内の情報を検索するコンピュータのためのプロ
    グラムを記録した記録媒体であって、 前記プログラムは、 前記文書画像から、キーワードを構成する任意の文字を
    キー文字として抽出し、 前記キー文字の位置情報に基づいて、前記文書画像内の
    前記キーワードに対応する領域を推定し、 推定された領域の情報に基づいて、検索結果を出力する
    処理を前記コンピュータに実行させることを特徴とする
    コンピュータ読み取り可能な記録媒体。
  5. 【請求項5】 文書画像の認識結果の情報を用いて、該
    文書画像内の情報を検索する検索方法であって、 キーワードを指定し、 前記文書画像から、前記キーワードを構成する任意の文
    字をキー文字として抽出し、 前記キー文字の位置情報に基づいて、前記文書画像内の
    前記キーワードに対応する領域を推定し、 推定された領域の情報に基づいて、検索結果を提示する
    ことを特徴とする検索方法。
JP2000159688A 2000-05-30 2000-05-30 文字認識結果を利用して情報を検索する検索装置および方法 Expired - Fee Related JP3917349B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000159688A JP3917349B2 (ja) 2000-05-30 2000-05-30 文字認識結果を利用して情報を検索する検索装置および方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000159688A JP3917349B2 (ja) 2000-05-30 2000-05-30 文字認識結果を利用して情報を検索する検索装置および方法

Publications (2)

Publication Number Publication Date
JP2001337993A true JP2001337993A (ja) 2001-12-07
JP3917349B2 JP3917349B2 (ja) 2007-05-23

Family

ID=18663982

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000159688A Expired - Fee Related JP3917349B2 (ja) 2000-05-30 2000-05-30 文字認識結果を利用して情報を検索する検索装置および方法

Country Status (1)

Country Link
JP (1) JP3917349B2 (ja)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006277089A (ja) * 2005-03-28 2006-10-12 Fuji Xerox Co Ltd ドキュメント処理装置
JP2007058448A (ja) * 2005-08-23 2007-03-08 National Institute Of Advanced Industrial & Technology 電子ファイリング方法及び装置並びにプログラム
JP2009193191A (ja) * 2008-02-13 2009-08-27 Fuji Xerox Co Ltd 情報処理装置及び情報処理プログラム
JP2009230658A (ja) * 2008-03-25 2009-10-08 Mitsubishi Electric Corp 文字検索システム
US7756872B2 (en) 2005-07-14 2010-07-13 Seiko Epson Corporation Searching device and program product
WO2011105607A1 (ja) 2010-02-26 2011-09-01 楽天株式会社 情報処理装置、情報処理方法、情報処理プログラムを記録した記録媒体
JPWO2010109594A1 (ja) * 2009-03-24 2012-09-20 三菱電機インフォメーションシステムズ株式会社 文書検索装置、文書検索システム、文書検索プログラム、および文書検索方法
JP2015118628A (ja) * 2013-12-19 2015-06-25 富士通株式会社 文書画像検索装置、方法、及びプログラム
CN111783786A (zh) * 2020-07-06 2020-10-16 上海摩勤智能技术有限公司 图片的识别方法、系统、电子设备及存储介质
US11080472B2 (en) 2015-04-24 2021-08-03 Fujitsu Limited Input processing method and input processing device
US11206335B2 (en) 2019-09-02 2021-12-21 Fujifilm Business Innovation Corp. Information processing apparatus, method and non-transitory computer readable medium

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4682663B2 (ja) * 2005-03-28 2011-05-11 富士ゼロックス株式会社 ドキュメント処理装置
JP2006277089A (ja) * 2005-03-28 2006-10-12 Fuji Xerox Co Ltd ドキュメント処理装置
US7756872B2 (en) 2005-07-14 2010-07-13 Seiko Epson Corporation Searching device and program product
JP2007058448A (ja) * 2005-08-23 2007-03-08 National Institute Of Advanced Industrial & Technology 電子ファイリング方法及び装置並びにプログラム
JP2009193191A (ja) * 2008-02-13 2009-08-27 Fuji Xerox Co Ltd 情報処理装置及び情報処理プログラム
JP2009230658A (ja) * 2008-03-25 2009-10-08 Mitsubishi Electric Corp 文字検索システム
JPWO2010109594A1 (ja) * 2009-03-24 2012-09-20 三菱電機インフォメーションシステムズ株式会社 文書検索装置、文書検索システム、文書検索プログラム、および文書検索方法
WO2011105607A1 (ja) 2010-02-26 2011-09-01 楽天株式会社 情報処理装置、情報処理方法、情報処理プログラムを記録した記録媒体
WO2011105608A1 (ja) 2010-02-26 2011-09-01 楽天株式会社 情報処理装置、情報処理方法、情報処理プログラムを記録した記録媒体
US8825670B2 (en) 2010-02-26 2014-09-02 Rakuten, Inc. Information processing device, information processing method, and recording medium that has recorded information processing program
US8949267B2 (en) 2010-02-26 2015-02-03 Rakuten, Inc. Information processing device, information processing method, and recording medium that has recorded information processing program
JP2015118628A (ja) * 2013-12-19 2015-06-25 富士通株式会社 文書画像検索装置、方法、及びプログラム
US11080472B2 (en) 2015-04-24 2021-08-03 Fujitsu Limited Input processing method and input processing device
US11206335B2 (en) 2019-09-02 2021-12-21 Fujifilm Business Innovation Corp. Information processing apparatus, method and non-transitory computer readable medium
CN111783786A (zh) * 2020-07-06 2020-10-16 上海摩勤智能技术有限公司 图片的识别方法、系统、电子设备及存储介质

Also Published As

Publication number Publication date
JP3917349B2 (ja) 2007-05-23

Similar Documents

Publication Publication Date Title
JP2973944B2 (ja) 文書処理装置および文書処理方法
Casey et al. A survey of methods and strategies in character segmentation
Khurshid et al. Word spotting in historical printed documents using shape and sequence comparisons
Lee et al. Recognition of handwritten Chinese characters via short line segments
US20050074169A1 (en) Holistic-analytical recognition of handwritten text
Hu et al. Comparison and classification of documents based on layout similarity
Riba et al. Handwritten word spotting by inexact matching of grapheme graphs
JP2006338687A (ja) 走査された及びリアルタイムの手書き文字の識別を行う文字認識システム
Lehal et al. Feature extraction and classification for OCR of Gurmukhi script
JP3917349B2 (ja) 文字認識結果を利用して情報を検索する検索装置および方法
JPH11203415A (ja) 類似パターンカテゴリ識別辞書作成装置および方法
Hassan et al. Word shape descriptor-based document image indexing: a new DBH-based approach
Gopakumar et al. Zone-based structural feature extraction for script identification from Indian documents
Lu et al. Chinese word searching in imaged documents
Kameshiro et al. A document image retrieval method tolerating recognition and segmentation errors of OCR using shape-feature and multiple candidates
Tombre et al. Pattern recognition methods for querying and browsing technical documentation
Khayyat et al. Arabic handwritten word spotting using language models
Procter et al. Cursive handwriting recognition using hidden Markov models and a lexicon-driven level building algorithm
Srihari et al. Language independent word spotting in scanned documents
Goswami et al. High level shape representation in printed Gujarati character
Lu et al. Word searching in document images using word portion matching
Khayyat et al. Verification of hierarchical classifier results for handwritten Arabic word spotting
Nagasudha et al. Key word spotting using HMM in printed Telugu documents
Marcelli et al. A structural indexing method for character recognition
KANGAS Experiments with a self-supervised adaptive classification strategy in on-line recognition of isolated handwritten latin characters

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060808

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060927

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061121

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070112

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070206

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070208

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110216

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110216

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120216

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130216

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130216

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140216

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees