JP3405155B2 - 文書検索装置 - Google Patents

文書検索装置

Info

Publication number
JP3405155B2
JP3405155B2 JP30546997A JP30546997A JP3405155B2 JP 3405155 B2 JP3405155 B2 JP 3405155B2 JP 30546997 A JP30546997 A JP 30546997A JP 30546997 A JP30546997 A JP 30546997A JP 3405155 B2 JP3405155 B2 JP 3405155B2
Authority
JP
Japan
Prior art keywords
character
search
image
segment
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP30546997A
Other languages
English (en)
Other versions
JPH11143879A (ja
Inventor
善彦 松川
強司 目片
太郎 今川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP30546997A priority Critical patent/JP3405155B2/ja
Publication of JPH11143879A publication Critical patent/JPH11143879A/ja
Application granted granted Critical
Publication of JP3405155B2 publication Critical patent/JP3405155B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、画像データとして
蓄積された大量の文書から文字認識を行わずに検索を行
う装置に関するものである。
【0002】
【従来の技術】従来、検索対象となる文書画像を文字認
識して認識結果を蓄積し、キーワードとのテキスト照合
による検索を行っていた。
【0003】図16が従来技術を説明する構成図であ
る。1601は文書画像入力装置、1602は傾き補正
装置、1603は領域分割装置、1604は文字切り出
し装置、1605は文字認識装置、1606は検索文字
列入力装置、1607は文字列検索装置である。
【0004】まず、文書画像入力装置1601から検索
対象となる文書画像が入力され、傾き補正装置1602
によって傾きが補正される。傾きが補正された文書画像
を用いて領域分割装置1603は領域を分割し、文字列
領域を抽出する。そして、文字切り出し装置1604は
文字列領域から文字を一文字ずつ切り出し、文字認識装
置1605は文字を認識して文字コードへ変換する。
【0005】一方、検索文字列入力装置は検索したい文
字列を入力して文字コード列を得る。そして、文字列検
索装置1607において、文字認識された結果である文
字コード列から検索文字列の文字コード列を抽出する。
この方法は例えば全文検索手法などが利用される。
【0006】
【発明が解決しようとする課題】しかしながら、前記の
ような構成では以下に列記するような問題を有してい
た。
【0007】*文字認識結果のうち検索対象部分で一部
分でも間違っていた場合、テキスト(文字コード列)照
合では検索文字列に一致しなくなる。
【0008】*人手を介して上記の文字認識の誤りを訂
正するにしてもかなりの労力を必要とする。
【0009】*検索時に全対象文書画像に対して文字認
識を行うと処理時間が長くなる。 *文字コード化されていない、新しい文字、外字、図
形、マークなどをキーとして文書を検索することができ
ない。
【0010】
【課題を解決するための手段】対象文書画像の誤認識に
より検索文字列が抽出できなくなるという問題は、領域
分割装置から得られた各文字素片を認識するのではな
く、検索文字画像生成装置によって得られた検索文字画
像と順次特徴量同士を比較することにより解決できる。
【0011】複数の特徴量抽出装置を用いることによ
り、最初から計算の複雑な特徴量を用いて検索するので
はなく、より簡単な特徴量から用いることで徐々に調べ
る文字素片を絞りこみ、全体として少ない処理時間で検
索を行う事が可能となる。
【0012】「か」のような一文字が複数の文字素片か
ら成る場合や、文字がかすれて複数の文字素片に分かれ
てしまった場合でも、検索文字選択装置において検索文
字画像の縦横比から文字素片結合範囲を求め、文字素片
選択装置において前記文字素片結合範囲内に存在する複
数の文字素片を結合して比較することで、正確な比較が
可能となる。
【0013】「か」のような一文字が複数の文字素片か
ら成る場合それぞれの文字素片は文字として意味をなさ
ず、どの文字と比較しても一致することはないが、検索
文字画像生成装置によって得られた検索文字を画像素片
抽出装置及び領域分割装置を用いて複数の検索文字素片
に分割することにより、正確な比較が可能となる。
【0014】文書画像中の文字同士が接触してしまった
場合、得られた文字素片と検索文字とは正確な比較がで
きなくなるが、上記と同様に画像素片抽出装置及び領域
分割装置を用いて検索文字を分割して前記文字素片の縦
横比から得られた検索文字素片結合範囲に収まる複数の
検索文字素片を結合して前記文字素片と比較することに
より、正確な比較が可能となる。
【0015】領域分割装置において領域分割の結果とし
て文字列領域の順番も得ることにより、行間にまたがっ
た検索文字列も検索することが可能となる。
【0016】文書画像が傾いている場合、傾き補正装置
を用いて文書画像全体の傾きを補正すると処理時間がか
かるが、文書画像の方ではなく、検索文字生成装置にお
いて検索文字画像を回転させることで処理の高速化が図
れる。
【0017】文書画像が様々なフォントで書かれていた
場合、一つの固定したフォントを用いて検索すると検索
精度が悪くなるが、検索文字画像生成装置において複数
のフォントについて検索文字画像を生成し、これらの複
数のフォントのうち少なくとも一つのフォントからなる
検索文字画像を用いて検索できれば該当する文書画像が
検索できたとすることで、様々なフォントで書かれた文
書画像でも高精度に検索することが可能となる。
【0018】また、フォント識別装置を備えることによ
り、予め文書画像で用いられているフォントを知ること
ができ、このフォントを用いて検索文字画像生成装置に
おいて検索文字画像を生成すれば、様々なフォントから
なる文書を正確に、かつ迅速に検索することが可能とな
る。
【0019】未知の言語で書かれた文書画像を検索した
い場合、言語を知らないために検索文字列が入力できな
いが、翻訳装置とフォント識別装置を備えることによ
り、フォント識別装置は文書画像に用いられている言語
及びフォントを識別し、翻訳装置は検索文字列を未知言
語の文字列へ変換し、前記識別されたフォントを用いた
未知言語の検索文字画像を用いることで、未知言語によ
る文書画像でも既知言語の検索文字列を用いて検索を行
うことが可能となる。
【0020】コード化されていない、新しい文字、外
字、図形、マークなどを検索したい場合には、コードが
存在しないので検索キーを入力することができないが、
検索キーをコードで入力するのではなく、検索文字列画
像入力装置を用いて検索画像を入力することにより、コ
ードが存在しない検索キーによる検索が可能となる。
【0021】大量の文書画像を検索する場合、処理時間
がかかるが、文字頻度表を備えることにより、検索文字
列中の頻度の少ない文字から検索を開始することがで
き、処理の早いうちから調べる文字素片を絞り込むこと
が可能となり、処理の高速化につながる。
【0022】検索するのが1次元的な文字列ではなく2
次元的な広がりをもつ一般的な検索画像を用いた場合、
検索対象となる画像中のオブジェクトがかすれて複数の
画像素片に分かれた場合、検索画像と正確な比較が行え
ないが、検索画像素片選択装置において検索画像素片を
選択すると同時に画像素片結合範囲を求め、画像素片選
択装置において前記画像素片結合範囲内に存在する複数
の画像素片を結合して新しい画像素片を得、この新しい
画像素片と前記検索画像素片とを比較することで正確な
検索を行うことが可能となる。
【0023】
【発明の実施の形態】以下、本発明の実施形態につい
て、図1から図15を用いて説明する。
【0024】(実施の形態1)図1は本発明による文書
検索装置の構成図である。図1において、101は画像
素片抽出装置、102は傾き補正装置、103は領域分
割装置、104は文字素片選択装置、105a、105
bは特徴量抽出装置、106は検索文字選択装置、10
7は検索文字画像生成装置、108は検索文字列入力装
置、109は特徴量比較装置、110は終了判定装置、
111は文字素片バッファをそれぞれ示している。ここ
で、傾き補正装置102で用いる傾きの検出方法は例え
ば、松川らによる「投影長を用いた文書画像の傾き検出
方式、1992年信学会秋季大会予稿、D-312」等が利用で
き、また領域分割装置103で用いる領域分割方法は例
えば、朴らによる「汎用的な文書画像の階層的領域分割
と識別法、信学論D-II,Vol.J75-D-II, No.2, pp.246-pp
256」等が利用できる。
【0025】傾き補正装置102により得られた傾き角
度を検索文字画像生成装置107に送ることにより検索
文字画像の方を文書画像に合わせて傾ける。ここで対象
文書画像の傾きは検出するのみで補正はしない。そし
て、文字素片にリンクされた傾いた文書画像中の部分画
像と同じ角度だけ傾いた検索文字画像の特徴量を比較す
ることにより、傾いた画像にでも対応することが可能と
なる。
【0026】図2は、領域分割装置103による領域分
割の様子を説明したものである。図2(a)は対象文書画
像を示しており、段落領域d0はn個の文字列領域t0〜
文字列領域tn-1に分割され、さらに文字列領域、例え
ば文字列領域t0はm個の文字素片r0〜文字素片rm-1
に分割される。この時分割された領域の包含・位置関係
は図2(b)に示すように木構造として表現されている。
従って、図3(a)に示したように文字列領域情報には領
域を示す矩形情報(文書画像中の座標等)の他に、文字
列の方向(縦・横)、後続の文字列領域情報へのポイン
タ、文字素片が並んでいる順番などが記憶されている。
【0027】文字素片はおおよそ文字単位の情報を表し
ており、文字列を構成する文字 文字の一部、あるいは
これらのうち隣接して結合したものの塊の他に、図3
(b)に示すように文字素片には画像上の領域を示す矩形
情報、前後の文字素片へのポインタ、後述するマークを
付与するためのフラグ、特徴量などを含んでいる。この
特徴量は、同じ文字素片について複数回の特徴量計算を
避け最初に計算されたものを格納しておくために用い
る。検索文字素片も文字素片と同様におおよそ文字単位
の情報を表しており、検索文字画像、前後の検索文字素
片へのポインタ、特徴量等が記憶されている。以降文中
で検索文字素片と記述している部分は検索文字画像と読
み替えても差し支えなく、検索文字素片と文字素片とを
比較すると言う表現は、検索文字素片に対応した検索文
字画像と文字素片に対応した対象文書画像上の画像領域
との特徴量同士の比較という意味である。
【0028】以上のように構成された文書検索装置につ
いて、以下図1の構成図及び図4のフローチャートを基
にその動作を述べる。処理は、文書画像からの文字素片
を抽出する過程(対象文字素片抽出装置)と、検索文字
列から検索文字素片を生成する過程(検索文字素片抽出
装置)、そして文字素片と検索文字素片の比較・判定
(特徴量系列検索装置)の大別して3つの部分からな
る。
【0029】まず、文書検索のキーワードを検索文字列
入力装置108から入力する(401a)。そして、入
力された文字列(文字コード列)の一文字一文字から検
索文字画像(文字フォント)及び検索文字素片を検索文
字画像生成装置107にて生成する(401b)。
【0030】次に、文書画像を入力して(402a)画
像素片抽出装置101は画像素片(例えば黒画素の連結
成分の外接矩形)を全て抽出し(402b)、この画像
素片を基に傾き補正装置102によって傾きを補正し
(402c)、傾きが補正された画像素片を基に領域分
割装置103は文書画像中から文字領域を分離し、段
落、文字列、文字素片の順に文字領域を細分割してゆく
(402d)。
【0031】そして、文字素片選択装置及び検索文字選
択装置によって通常は文字列の方向に順番に文字素片r
(=rj)及び検索文字素片ki(i=0〜 h-1)(検索文字列
はh文字から成る)が選択される。このようにして選択さ
れた検索文字素片kiと文字素片r(=rj)それぞれに
対応する画像領域から特徴量抽出装置105a、105
bを用いて2つの特徴量を抽出する(404b及び40
5b)。
【0032】次に、2つの特徴量を特徴量比較装置10
9にて比較し類似度を求め(407)、その類似度から
終了判定装置110にて類似しているかを判定し(40
8)、もし類似していれば、文字素片バッファ111に
文字素片r(へのポインタ)を登録する(409)。そ
して、文字素片バッファ内の文字素片の数がh個(検索
文字数)になるまで文字素片に対応する画像領域から求
まる特徴量を順次比較する。文字素片バッファ内の文字
素片の数がh個になれば、検索文字列が対象とする文書
画像に存在したと判定する。ここで、文書画像中の全て
の検索文字列を検索したい場合には文字素片バッファ内
の文字素片にマークし(413)、文字素片バッファを
クリアする(414)。
【0033】手順408で、2つの特徴量が類似してい
た場合、終了判定装置110は文字素片選択装置104
と検索文字選択装置106のそれぞれに、前回比較した
文字素片及び検索文字素片それぞれに継続する文字素片
及び検索文字素片を選択するように指示する(41
5)。また、手順408で2つの特徴量が類似していな
かった場合、終了判定装置110は文字素片バッファを
クリアし(410)、文字素片選択装置104に、文字
素片バッファの先頭文字素片の次に後続する文字素片を
選択するよう指示し(但し、文字素片バッファが空の場
合は前回特徴量を比較した文字素片に後続する文字素片
を選択するように指示する)、検索文字選択装置106
には1文字目の検索文字素片を選択するように指示する
(411)。このように、特徴量を比較する文字素片が
なくなるか、検索文字列に類似した文字素片列が見つか
るまで、上記の操作を繰り返す。また、各文字列領域は
その属性値として後続する文字列領域へのポインタを保
持しているので、行にまたがった検索文字列に一致する
部分も抽出することが可能となる。
【0034】領域分割装置103によって得られる文字
素片は必ずしもそれ自身が一文字の文字を表していると
は限らない。図5(a)に示したように「あかい」と書か
れた文書画像を領域分割して得られる文字素片はr0〜r4
の5つとなり、「か」、あるいは「い」という文字は2
つの文字素片に分離してしまう。そのため、検索文字画
像生成装置106によって得られる検索文字素片と正確
に比較できないという問題が現れる。この実施の形態1
では検索文字素片の文字の縦横比を考慮し、連続した複
数の文字素片を結合した新しい文字素片と検索文字素片
とを比較することでこの問題を解決できる。具体例を図
5を基に説明する。今「あかい」と横書きで書かれた文
書画像を考える。検索文字列は「あか」で「あ」同士は
既に照合し類似していると判定されていると仮定する。
次に「か」という文字を比較する。ここで、検索文字画
像生成装置107において、生成する文字フォントの大
きさをポイント数等で指定するが、この大きさを文字フ
ォントが配置されるべき文字列の高さ(fh)と考え、それ
に対する検索文字画像の幅(fw)の比(fw/fh)を得る。一
方、現在対象となっている文字素片が存在する文字列の
高さ(th)は領域分割の結果の文字列領域情報から得られ
る。そうすれば、現在探そうとしている「か」という文
字は文書画像中では幅s(=th*fw/fh)をもって配置されて
いる可能性が高いので、文字素片選択装置104は終了
判定装置110から次の文字素片を選択するよう指示を
得ると同時に、検索文字選択装置106からこの文字素
片結合範囲sを得、現在の文字素片から始まり文字素片
結合範囲以内に収まる連続した文字素片を結合したもの
を新しい文字素片として特徴量抽出装置105に送出す
る。このようにすれば正しい大きさの画像同士の比較が
行える。
【0035】なお、様々なフォントにも対応できるよう
にするには、検索文字画像生成装置107においてフォ
ントの種類を指定する必要があるが、予めゴシック体、
明朝体等いくつかのフォントを決めておきそのそれぞれ
のフォントを順に用いて文書画像を検索すればよい。
【0036】さらに、文書画像が90度単位で回転され
て入力されていた場合でも対応できるようにするには、
検索文字画像生成装置107においてフォントを90度
毎に回転した4つの検索文字素片を生成し、これら4つ
の検索文字素片を順に用いて文書画像を検索すればよ
い。ただし、右方向へ180度及び270度回転した検
索文字素片を用いる場合には、検索文字選択装置におい
て通常の文字列の方向とは逆の方向から検索文字素片を
選択するようにする。例えば、「あか」という検索文字
列であれば、「か」、「あ」の順に文字を探す。
【0037】また、図1において2つの特徴量抽出装置
105a、105bは切り替えることにより同じものを
使用することができるものとする。
【0038】本実施の形態によれば、文書画像を検索文
字列(キーワード)で検索する場合、文字認識をおこな
わないので高速に処理でき、また文字の誤認識によって
検索文字列が一致しないという問題を解決することがで
きる。さらに、文書画像が傾いている場合、文書画像の
方ではなく、検索文字画像を回転させるので処理の高速
化が図れる。また、対象文書画像が90度単位で回転し
て入力された場合でも検索文字素片側を90度単位で回
転したものを用意することにより正確に検索することが
可能である。
【0039】(実施の形態2)図6は本発明による文書
検索装置の第2の実施形態を表す構成図である。図6に
おいて、601a、602bは図1の特徴量抽出装置1
05a、105bの代わりに用いられる複数の特徴量抽
出装置である。
【0040】以上のように構成された文書検索装置につ
いて以下にその動作を述べる。まず、最も簡単な特徴量
を計算できる第1の特徴量抽出装置602a、602b
を用いて第1の実施形態と同様、検索文字列に類似する
文字素片を探し出す。この時、探し出された文字素片に
はマークを付けておく。全ての文字素片を調べた後、今
度はマークされた文字素片を対象に、第2の特徴量抽出
装置603a、603bを用いて検索文字列に類似する
文字素片を探し出す。この時、検索文字列の各文字に類
似しなかった文字素片のマークは消去しておく。これを
繰り返し、第Nの特徴量抽出装置604a、604bを
用いた後もマークが付けられた文字素片が残れば、その
文書画像が該当する文書画像となる。
【0041】このように構成することにより、最初から
計算の複雑な第Nの特徴量抽出装置604a、604b
を全ての文字素片に適応するのに比べて、より簡単な第
1の特徴量抽出装置602a、602bから用いること
で徐々に検索文字列と一致する部分を絞り込めるので、
少ない処理時間で検索を行う事が可能となる。
【0042】なお、図6において、2つの複数の特徴量
抽出装置601aと601bは切り替えることにより同
じものを使用することができるものとする。
【0043】(実施の形態3)図7は本発明による文書
検索装置の第3の実施の形態を表す構成図である。図7
において、図1と同一物は同一番号を付す。701は画
像素片抽出装置、702は領域分割装置、703は文字
素片選択装置、704は検索文字選択装置である。
【0044】図7を用いて本実施の形態の動作について
述べる。第1及び第2の実施の形態では検索文字の縦横
比に合うように文書画像から得られる文字素片を結合し
ていたが、本実施の形態は逆に図8(a)のように文字同
士が接触していた場合に対処するものである。すなわ
ち、検索文字画像生成装置107の後段に画像素片抽出
装置701及び領域分割装置702を配置し、検索文字
画像を生成した後に領域分割し、検索文字素片を得てい
る。図8を用いて具体的な動作を説明する。先ほどと同
様に「あかい」と横書きで書かれた文書(図8(a))と
「あか」という検索文字列(図8(b))を考える。次に文
字が分離した場合とは逆に文字素片選択装置703によ
って得られた文字素片の縦横比(rw0/th)を求める。ここ
で、rw0は文字素片r0の幅である。そして、これに検索
文字画像に使用する文字フォントの高さ(fh)を乗じた大
きさs(=fh*rw0/th)が幅(検索文字素片結合範囲)とな
るような検索文字素片を考えればよい。まず、文字素片
選択装置703によって、文字素片を選択し、この文字
素片から上記の検索文字素片結合範囲を求め、これを考
慮に入れて検索文字選択装置704は現在の検索文字素
片から始まり検索文字素片結合範囲s以内に収まる検索
文字素片(k0,k1)を結合して新しい検索文字素片を得
る。この新しい検索文字素片と現在対象となっている文
字素片とを比較すれば正しい大きさの画像同士の比較が
行える。ただし、検索文字素片を結合する際には、本来
の文字間の間隙を0とし、文字内に存在する間隙はその
ままの値を使用するようにする。また、この場合は、縦
書きと横書きの2組の検索文字素片を生成し、検索対象
となっている文字列領域情報の文字列の向きにあったも
のを使用する必要がある。
【0045】文書画像中で文字同士が接触していた場
合、文字素片が1文字以上の大きさになり、1文字単位
の検索文字素片では正確な比較できないが、本実施の形
態によりこのような問題を解決することが可能となる。
【0046】なお、画像素片抽出装置101と701、
領域分割装置103と702はそれぞれ切り替えること
により同じものを使用できるものする。
【0047】(実施の形態4)次に本発明の第4の実施
形態について述べる。なお、本実施の形態の構成は図1
と同じものであり、一部の装置(文字素片選択装置10
4及び検索文字選択装置106)の動作を以下に示すよ
うに変えるだけでよい。
【0048】文字素片選択装置104及び検索文字選択
選択装置106の手順の具体例を図9に示す。「あか
い」と横書きされた文書画像(図9(a))から、「あ
か」という検索文字列(図9(b))を検索する場合、検
索文字選択装置106において、「あ」という画像と
「あか」という2種類の画像を用意し、それぞれに対応
した文字素片結合範囲s0(=fw0/fh*th)とs1(=(fw0+fw1)/
fh*th)とを求める。fw0、fw1はそれぞれ「あ」と「か」
のフォントの幅を表す。そして、まず文書画像中の文字
素片r0から始まって文字素片結合範囲(s0)の終点が文
字素片の間に位置するか否かを調べる。この例の場合は
「あ」と「か」が接触しているため、文字素片結合範囲
(s0)の終点は文字素片の間には位置しない。次に文字
素片結合範囲(s1)の終点は「か」と「い」の間に位置
するので、文字素片選択装置104は文字素片r0から始
まり文字素片結合範囲(s1)内に収まる文字素片r0〜r1
を結合した新しい文字素片を生成し、特徴量抽出装置1
05に送る。一方、検索文字選択装置106は文字素片
結合範囲(s1)を求めるために使用した検索文字素片
「あ」と「か」を結合した新しい検索文字素片を特徴量
抽出装置105に送る。
【0049】なお、各文字素片結合範囲の終点が文字素
片の間に位置するか否かを判定する際、文字素片間の大
きさが小さく、うまく終点が文字素片間に位置しない場
合があるので、もし終点が文字素片にかかった場合、そ
の文字素片にかかっている幅が文字素片の幅の10%以下
あるいは90%以上であればその文字素片の左側あるいは
右側の隙間をそれぞれ文字素片結合範囲の終点と考え
る。
【0050】実施の形態1で述べた分離文字の問題には
2種類あって、「か」という文字のように本質的に分離
している場合と、文書画像の入力時に文字がかすれて分
離してしまう場合とがある。連続した2つの文字で、一
方がかすれ、もう一方が接触している場合等は、第1及
び第3の実施の形態では処理できないが、本実施の形態
を用いればこの問題を解決することが可能となる。
【0051】(実施の形態5)図10は本発明における
第5の実施の形態による文書検索装置の構成図である。
図10において、1001はフォント識別装置、100
2は領域分割装置、1003は検索文字画像生成装置を
示している。
【0052】領域分割装置1002によって抽出された
文字素片からフォント識別装置1001を用いてフォン
トを識別し、フォント情報を検索文字画像生成装置10
03に送る。フォントの識別の方法には例えば、公開特
許公報「特開平8−123904、書体種類処理装置」
を使用することができる。そして、検索文字画像生成装
置1003は前記フォント情報を用いて検索対象文書と
同一のフォントで検索文字画像及び検索文字素片を生成
する。
【0053】本実施の形態によれば、複数のフォントを
用意して比較するのに比べて、メモリの削減、及び処理
の高速化につながる。
【0054】(実施の形態6)図11は本発明による文
書検索装置の構成図である。図11において、1101
a、1101bは傾き補正装置、1102は検索文字選
択装置、1103は検索文字列画像入力装置であり、そ
れ以外は前述した装置を用いている。
【0055】検索文字列画像入力装置1103は検索し
たい文字列画像を検索対象となっている文書あるいは全
く関係のない文書から入力し、検索対象となる文書画像
と同様に画像素片抽出装置701、傾き補正装置110
1b、領域分割装置702を用いて検索文字素片を得、
検索文字選択装置1102は検索文字素片を選択して特
徴量抽出装置105bへ渡す。この時、対象文書画像の
傾きを傾き補正装置1101aから得、傾き補正装置1
101bは検索文字列画像の傾きを得、前記対象文書画
像の傾きに合わせるように検索文字列画像を回転させ
る。その他の動作は第3の実施形態と同様に行う。
【0056】本実施の形態によれば、検索対象文書で用
いられている文字フォントと同一又は類似のフォントで
検索文字画像が生成できない場合や、文字以外の記号列
を検索したい場合でも、検索したい文字列や記号列の画
像又は画像データを検索文字列画像入力装置1103で
入力することにより検索をおこなうことができる。
【0057】(実施の形態7)図12は本発明による文
書検索装置の構成図である。図12において、1201
はフォント識別装置、1202は翻訳装置であり、それ
以外は前述した装置を用いている。
【0058】フォント識別装置1201は、「明朝
体」、「ゴシック体」など、文字フォント(フォント情
報)を識別できるだけでなく、どこの国の文字か(国情
報)も識別することが可能である。そして、そのフォン
ト情報を検索文字画像生成装置107に、また国情報を
翻訳装置1202にそれぞれ転送する。一方、検索文字
列入力装置108から入力された文字列を翻訳装置12
02において前記国情報が示す国の文字列(文字コード
列)に変換し、検索文字画像生成装置107は前記国情
報が示す国の前記フォント情報が示すフォントを用いて
検索文字素片を生成する。その後は、第5の実施形態と
同様の処理を進める。
【0059】本実施の形態によれば、知らない言語の文
書でも母国語の言語のキーワードを用いて検索が可能と
なる。
【0060】(実施の形態8)図13は本発明による文
書検索装置の構成図である。図13において、1301
は文字頻度表、1302は文字素片選択装置、1303
は検索文字選択装置であり、それ以外は前述した装置を
用いている。文字頻度表1301は、各文字が一般文書
中、あるいは検索対象となる文書画像中に出現する頻度
を予め調べて記憶しておいたものである。
【0061】まず、検索文字列中の文字で最も出現頻度
の小さいものを文字頻度表1301を用いて検索文字選
択装置1303で選択して検索を開始する。もし類似し
た文字素片が見つかれば、次に検索する文字には前回ま
でに検索された文字列の前後にくる文字のうち出現頻度
が低いものを検索文字選択装置1303にて選択し、文
字素片結合範囲と同時に検索方向(文字列の前方か後方
か)を文字素片選択装置1302に送り、文字素片選択
装置1302は検索方向へ文字素片結合範囲内に収まる
文字素片を結合して新しい文字素片を生成し、特徴量抽
出装置105へ送出する。
【0062】本実施の形態によれば、比較する文字素片
の数が減り、処理の高速化へつながる。
【0063】なお、文字頻度表として次に示したものを
使用することも可能である。つまり、多数の文書画像に
文字認識を適用し、誤認識となる確率を各文字毎に予め
調べ、誤認識となる確率の低い順に文字を並べたもので
ある。そして、この文字頻度表を参照して検索文字列中
で誤認識となる確率の低いものから順に検索に用いる。
【0064】(実施の形態9)図14は本発明による画
像検索装置の構成図である。図14において、1401
a、1401bは画像素片抽出装置、1402は画像素
片選択装置、1403a、1403bは特徴量抽出装
置、1404は検索画像素片選択装置、1405は検索
画像入力装置、1406は特徴量比較装置、1407は
終了判定装置、1408は画像素片バッファをそれぞれ
示している。なお、画像素片抽出装置1401a、14
01bと特徴量抽出装置1403a、1403bは切り
替えることにより同じものを利用することも可能であ
る。
【0065】以上の第8の実施形態までは文字列をキー
ワードとして指定して、そこから文字画像を生成し、文
書画像を検索するものであったが、これを一般化して、
検索画像を指定して画像データベースから検索画像を含
むものを探し出したり、カメラ等で得られた画像から検
索画像を見つけだすことも可能である。
【0066】図14を用いて本実施の形態について説明
する。文書画像の場合は文字素片が特徴量を抽出する最
小の単位であったが、ここでは画像素片が最小の単位と
なる。画像から画像素片抽出装置1401aを用いて画
像素片を抽出する。ここで、画像素片とは注目色(複数
あってもよい)の画素が連結した領域とする。画像素片
抽出の方法は注目色に対するラベリング等を用いればよ
い。一方、検索画像入力装置1405から検索画像を入
力し、検索画像から画像素片抽出装置1401bによっ
て画像素片を抽出する。以上のようにして対象画像と検
索画像のそれぞれから得られた画像素片から画像素片選
択装置1402及び検索画像素片選択装置1404を用
いて一つずつ画像素片を選び出し、特徴量抽出装置14
03a、1403bを用いてそれぞれの特徴量を求めて
比較する。終了判定装置1407において、両者が類似
していれば、画像素片バッファ1408に格納し、画像
素片バッファ1408内の画像素片の数が検索画像素片
数と一致すれば画像素片バッファ1408内の画像素片
にマークし、画像素片バッファ1408をクリアする。
もし、そうでなければ、終了判定装置1407は検索画
像素片選択装置1404と画像素片選択装置1402の
両者に継続する画像素片を選択するよう指示する。しか
し2つの画像素片が類似していなければ、画像素片バッ
ファ1408をクリアする。
【0067】画像素片選択装置1402と検索画像素片
選択装置1404において、継続する画像素片及び検索
画像素片を選択する方法述べる。文書画像の場合には領
域分割装置103によって予め文字素片の並んでいる順
番が調べられていたし、検索文字列はもともと検索文字
の順番が決まっていた。しかし、一般画像では画像素片
同士の関係が明らかではないので、予め順番を決めるこ
とは困難である。そこで、一般画像の場合は、初めに検
索画像素片の方に検索する順番をつけ、この順に画像素
片の中から該当するものを検索してゆく。図15に示し
たように、2番目以降の検索画像素片1503を検索す
る際には、1番目の検索画像素片1502からの相対的
な位置と大きさ(画像素片結合範囲s)を利用する。こ
の画像素片結合範囲sは画像素片選択装置1402へ送
られる。
【0068】画像素片結合範囲sの求め方について述べ
る。まず、検索方向ベクトルd(検索画像素片1502
の重心から検索画像素片1503の重心を結ぶベクト
ル)に拡大率zを乗じたベクトルzdを考える。ベクト
ルzdが対象画像中の画像素片1501の重心を始点と
したときの終点を重心として、幅sw、高さshとなる
領域を画像素片結合範囲sとする。ここで、拡大率zは
1番目の検索画像素片1502が画像素片1501と類
似したときの大きさの比(rh0/kh0)とする。
【0069】この画像素片結合範囲sを受けた画像素片
選択装置1402は1番目の検索画像素片1502に類
似した画像素片1501から見て、この画像素片結合範
囲s内に存在する画像素片(r1とr2)を結合して新しい
画像素片を得、この新しい画像素片を特徴量抽出装置1
403aへ送出する。以上のようにして対象画像から検
索画像の検索を高速に行うことができる。
【0070】文書画像を検索する時の高速化の手段とし
て、図13の実施の形態において検索文字列中の頻度の
低い(特異な)文字を最初に全て探し出し、その部分を
手がかりに文字列を検索する方法を前に述べたが、一般
画像を検索する場合も同様の方法が考えられる。つま
り、検索画像素片選択装置1404によって最初に選択
すべき検索画像素片になるべく特異なものを選択する。
ここで特異とは例えば検索画像素片のなかで最も大きな
ものとすることにする。そうすることにより、画像素片
の比較回数を減らすことができ処理の高速化につなが
る。なお、特異な検索画像素片として、最も入り組んだ
形をしているものを選んでもよい。また、検索画像入力
装置1405において検索画像に使用されている色情報
を画像素片抽出装置1401aに送り、この色情報を持
つ画像素片のみを抽出して検索画像に用いれば、さらに
処理の高速化が図れる。
【0071】画像素片抽出装置1401aは、抽出する
画像素片の色情報が指定されていればその色情報を、指
定されていなければまず画像内の主要な色情報を抽出す
る。そして、色情報が決まれば、その色情報を持つ画素
に対してラベリングを行い、ラベル毎に輪郭をたどっ
て、外接矩形つまり画像素片を抽出することができる。
なお、色情報が複数あった場合、全ての色情報について
同様な処理を繰り返す。なお、これまでに述べてきた全
ての実施の形態で用いられる特徴量(ベクトル量でもス
カラー量でもよい)には、例えば、ある領域内における
特定色(例えば黒画素)の画素数の割合、輪郭方向密
度、背景密度特徴、色情報などが利用でき、またこれら
の組み合わせなども利用できる。さらに、ある特徴量が
決まれば、領域間(例えば隣り合う文字素片間)の特徴
量の差を特徴量とすることもできる。実施の形態2の複
数の特徴量抽出装置においては、第1の特徴量抽出装置
602a、602bに特定色の画素数の割合、第2の特
徴量抽出装置603a、603bに背景密度特徴、第N
の特徴量抽出装置604a、604bに背景密度特徴と
輪郭方向密度の組み合わせ等を選ぶことが可能である。
この場合、ある領域について一度求めた特徴量は再度求
めないようにすれば処理時間を短縮できる。また、これ
まで特徴量比較装置109、1406によって類似度を
求めているが、この類似度として、特徴量間の距離を用
い、終了判定装置110、1407では予め閾値を設
け、前記特徴量間の距離がその閾値よりも小さければ2
つの画像は類似していると見なすものとする。
【0072】なお、特徴量抽出装置を独自に設けず、領
域分割装置の領域分割過程、あるいは画像素片抽出装置
の画像素片抽出過程で使用する特徴量の照合により検索
を行ってもよい。
【0073】さらに、以上までは装置(ハードウェア)
として記述したが、ソフトウェアで実現してもかまわな
い。
【0074】
【発明の効果】請求項1記載の発明によれば、検索対象
となる対象文書画像を文字素片に分割してそれぞれの特
徴量系列を求め、一方、検索文字列から検索文字画像を
生成して検索文字画像の特徴量系列を求め、検索文字画
像の特徴量系列を前記文字素片の特徴量系列から検索
し、文字認識をおこなう場合に比べて高速に処理でき、
また文字の誤認識によって検索文字列が一致しないとい
う問題を解決することができるとともに、「か」のよう
に一文字が複数の要素すなわち 文字素片で構成される
場合各文字素片は文字として意味をなさず、どの文字と
比較しても一致することはないが、検索文字側を複数の
文字要素(文字素片)に分割することにより、正確な比較
が可能となる。記号の場合は記号を構成する要素を文字
素片とし同様のことがいえる。
【0075】請求項5記載の発明によれば、対象文書画
像中の文字素片の並んでいる順序を予め領域分割装置で
調べることにより、検索を効率的に行うことができる。
【0076】請求項6記載の発明によれば、領域分割の
結果として文字列領域の順番も得ることにより、行間に
またがった場合や縦書き横書きが混在した場合でも検索
文字列を検索することが可能となる。
【0077】請求項7記載の発明によれば、検索文字列
を文字コードで入力しフォントから検索文字画像を生成
するので、検索文字列の画像が手元になくても検索文字
画像を容易に得ることが可能となる。
【0078】請求項10記載の発明によれば、最初から
計算の複雑な特徴量を用いて検索するのではなく、より
簡単な特徴量から用いることで徐々に調べる文字素片を
絞りこみ、全体として少ない処理時間で検索を行う事が
可能となる。
【0079】請求項11記載の発明によれば、「か」の
ような一文字が複数の文字要素、すなわち文字素片から
成る場合や、一文字がかすれて複数の文字要素に分かれ
てしまった場合でも、検索文字画像の縦横比から前記複
数の文字素片を結合して比較することが可能となり、正
確な比較が可能となる。
【0080】
【0081】
【0082】請求項15及び16記載の発明によれば、
文書画像が傾いている場合、文書画像の方ではなく、検
索文字画像を回転させるので処理の高速化が図れる。
【0083】請求項17記載の発明によれば、検索文字
画像を複数のフォントについて生成し、これらの複数の
フォントのうち少なくとも一つのフォントからなる検索
文字画像を用いて検索できれば、該当する文書画像が検
索できたとすることができ、さまざまなフォントで書か
れた文書画像でも正確に検索することが可能となる。請
求項18記載の発明によれば、フォント識別装置を備え
ることにより、予め文書画像で用いられているフォント
を知ることができ、このフォントを用いて検索文字画像
を生成すれば、様々なフォントからなる文書を正確に、
かつ迅速に検索することが可能となる。
【0084】請求項19記載の発明によれば、翻訳装置
とフォント識別装置を備えることにより、フォント識別
装置は文書画像に用いられている言語及びフォントを識
別し、翻訳装置は検索文字列をその他言語の文字列へ変
換し、前記識別されたフォントを用いた他言語の検索文
字画像を用いることで、未知言語による文書画像でも自
国語の検索文字列を用いて検索を行うことが可能とな
る。
【0085】請求項20記載の発明によれば、検索文字
画像生成装置において90度毎に回転した4つの検索文
字画像を生成し、これらの4つの検索文字画像の内少な
くとも一つの検索文字画像を用いて検索できれば、該当
する文書画像が検索できたとすることができ、誤って9
0度毎に回転して入力された文書画像でも正確に検索す
ることが可能となる。
【0086】請求項12記載の発明によれば、検索文字
列を文字コードで入力するのではなく、画像で入力する
ので、文字コードが存在しない未知言語による文書画像
や記号列でも検索可能となる。
【0087】請求項22記載の発明によれば、対象文書
画像と画像で入力された検索文字列画像の両方が傾いて
いた場合でも正確な検索が可能となる。
【0088】請求項14記載の発明によれば、文字頻度
表を備えることにより、検索文字列中の頻度の少ない文
字から検索を開始することができ、処理の早いうちから
調べる文字素片を絞り込むことが可能となり、処理の高
速化につながる。
【0089】
【図面の簡単な説明】
【図1】本発明の第1の実施形態における文書検索装置
の構成図
【図2】図1の文書検索装置において、領域分割装置に
よって得られる領域情報の説明図
【図3】図1の文書検索装置において、領域分割装置に
よって得られる文字列領域データ及び文字素片データの
説明図
【図4】図1の文書検索装置において、動作を説明する
フローチャート
【図5】図1の文書検索装置において、文字素片結合範
囲の求め方と文字素片の結合を説明する図
【図6】本発明の第2の実施形態における文書検索装置
の構成図
【図7】本発明の第3の実施形態における文書検索装置
の構成図
【図8】図7の文書検索装置において、検索文字素片結
合範囲の求め方と検索文字素片の結合を説明する図
【図9】本発明の第4の実施形態において、文字のかす
れによる分離と接触が同時の起こった場合の処理を説明
する図
【図10】本発明の第5の実施形態における文書検索装
置の構成図
【図11】本発明の第6の実施形態における文書検索装
置の構成図
【図12】本発明の第7の実施形態における文書検索装
置の構成図
【図13】本発明の第8の実施形態における文書検索装
置の構成図
【図14】本発明の第9の実施形態における画像検索装
置の構成図
【図15】図14の画像検索装置において、一般画像に
おける画像素片結合範囲の求め方を説明する図
【図16】従来技術による文書検索装置の構成図
【符号の説明】
101 画像素片抽出装置 102 傾き補正装置 103 領域分割装置 104 文字素片選択装置 105a 特徴量抽出装置 105b 特徴量抽出装置 106 検索文字選択装置 107 検索文字画像生成装置 112 対象文字素片抽出装置 113 検索文字素片抽出装置 114 特徴量系列検索装置 601a 複数の特徴量抽出装置 601b 複数の特徴量抽出装置 1001 フォント識別装置 1201 フォント識別装置 1202 翻訳装置 1301 文字頻度表 1401a 画像素片抽出装置 1401b 画像素片抽出装置 1403a 特徴量抽出装置 1403b 特徴量抽出装置
フロントページの続き (56)参考文献 特開 昭57−139866(JP,A) 特開 平5−242298(JP,A) 遊佐実、田中譲,日本語文書画像に対 する文字列検索機能の実現,情報処理学 会研究報告(95−IM−19),日本,社 団法人情報処理学会,1995年 1月13 日,Vol.95,No.1,pp.1− 8 鳥居秀行、田中譲,トランスメディ ア・マシンにおける英単語検索,情報処 理学会第37回(昭和63年後期)全国大会 講演論文集(I),日本,社団法人情報 処理学会,1988年 9月12日,pp. 429−430 横澤一彦,人間の文字探索特性とそれ に基づく文書検索法,電子情報通信学会 論文誌,日本,社団法人電子情報通信学 会,1990年 2月25日,Vol.J73− D−II,No.2,pp.191−199 (58)調査した分野(Int.Cl.7,DB名) G06F 17/30 G06K 9/00 JICSTファイル(JOIS)

Claims (22)

    (57)【特許請求の範囲】
  1. 【請求項1】 検索対象となる対象文書画像から、文字
    列を構成する文字、文字の一部、あるいはこれらのうち
    隣接して結合したものの塊を少なくとも含む情報である
    対象文字素片を抽出する対象文字素片抽出装置と、検索
    する文字列画像から文字列を構成する文字 文字の一
    部、あるいはこれらのうち隣接して結合したものの塊を
    少なくとも含む情報である検索文字素片を抽出する検索
    文字素片抽出装置と、前記対象文字素片の一つを選択
    し、選択された対象文字素片の縦横比と前記文字列の文
    字方向とから検索文字素片結合範囲を求める文字素片選
    択装置と、 前記検索文字素片結合範囲内に存在する少なくとも一つ
    以上の前記検索文字素片を結合して新しい検索文字素片
    を生成する検索文字選択装置と、前記対象文字素片の系
    列より得られる特徴量系列の中から前記新しい検索文字
    素片の系列より得られる特徴量系列に類似した部分を検
    索する特徴量系列検索装置を具備し、前記新しい検索文
    字素片の系列より得られた特徴量系列に類似した部分が
    前記対象文字素片の系列より得られる特徴量列の中に存
    在すれば前記対象文書画像が該当する文書画像であると
    する文書検索装置。
  2. 【請求項2】 前記対象文字素片は画像上の領域を示す
    矩形情報の他に、前後の文字へのポインタ、前記検索文
    字素片と類似していた場合に付すマークを付与するため
    のフラグ、特徴量を有する請求項1記載の文書検索装
    置。
  3. 【請求項3】 前記対象文字素片は、画像上の領域を示
    す矩形情報と、前後に継続する文字素片へのポインタ
    と、特徴量と、前記検索文字素片と類似していた場合に
    付すマークを有し、前記検索文字素片は、検索文字画像
    と、前後に継続する検索文字素片へのポインタと、特徴
    有することを特徴とする請求項1記載の文書検索装
    置。
  4. 【請求項4】 特徴量系列検索装置において、前記対象
    文字素片の系列より得られる特徴量系列の中から前記検
    索文字素片の系列より得られる特徴量系列に類似した部
    分を検索する手段は、比較する特徴量系列間の対応する
    特徴量同士の距離がそれぞれある閾値以下であれば前記
    対象文書画像が該当する文書画像とする請求項1記載の
    文書検索装置。
  5. 【請求項5】 対象文字素片抽出装置は、検索対象とな
    る文書画像から黒連結成分である画像素片を抽出する画
    像素片抽出装置と、前記画像素片を基に文書画像を分割
    して文字列領域情報を得る領域分割装置とを備え、予め
    前記領域分割装置により文字領域及び前記文字領域内の
    文字方向を調べる事により検索を容易にすることを特徴
    とする請求項1記載の文書検索装置。
  6. 【請求項6】 文字列領域情報は、画像上の領域を示す
    矩形情報と、文字列の方向と、後続の文字列領域情報へ
    のポインタと、文字列内に存在し先頭となる前記対象
    字素片へのポインタとを有し、行にまたがった文字列や
    縦書き横書きが混在した前記対象文書画像でももれがな
    く検索できることを特徴とする請求項5記載の文書検索
    装置。
  7. 【請求項7】 検索文字素片抽出装置は、検索文字列を
    入力する検索文字列入力装置と、前記検索文字列から検
    索文字素片を生成する検索文字画像生成装置とを備え、
    検索文字列の画像が手元になくても検索が行える請求項
    1記載の文書検索装置。
  8. 【請求項8】 特徴量系列検索装置は、前記対象文字素
    片抽出装置から得られた前記対象文字素片の一つを選択
    する文字素片選択装置と、前記検索文字素片抽出装置か
    ら得られた前記検索文字素片の一つを選択する検索文字
    選択装置と、前記対象文字素片及び前記検索文字素片か
    ら2つの特徴量を抽出する特徴量抽出装置と、前記2つ
    の特徴量どうしを比較する特徴量比較装置と、前記検索
    文字素片抽出装置から得られた検索文字素片数と前記特
    徴量比較装置から得られた類似度を基に検索文字列が検
    索できたかどうかを判定する終了判定装置と、前記類似
    度が予め設定した条件を満たした場合に前記対象文字素
    片を格納する文字素片バッファとを備え、継続する前記
    対象文字素片と前記検索文字素片とを順次比較し、前記
    文字素片バッファ内の文字素片の数が前記検索文字素片
    数に等しければ、前記対象文書画像が該当する文書画像
    とする請求項1記載の文書検索装置。
  9. 【請求項9】 請求項5記載の対象文字素片抽出装置、
    請求項7記載の検索文字素片抽出装置、及び請求項8記
    載の特徴量系列検索装置を具備する請求項1記載の文
    検索装置。
  10. 【請求項10】 特徴量系列検索装置において、特徴量
    抽出装置は複雑さの異なる特徴量を計算できる複数の特
    徴量抽出装置から成り、終了判定装置は前記対象文字素
    片と前記検索文字素片の特徴量が類似していた場合に前
    対象文字素片にマークを付すことが可能であり、前記
    対象文字素片抽出装置によって出力された文字素片と前
    記検索文字素片抽出装置により得られた検索文字素片の
    それぞれに対応する画像から前記複数の特徴量抽出装置
    のうち複雑さの小さい第1の特徴量抽出装置を用いて特
    徴量を抽出して順次比較し、前記終了判定装置は検索さ
    れた対象文字素片列にマークを付し、2度目以降はマー
    クが付けられた前記対象文字素片列を対象に第2以降の
    特徴量抽出装置を用いて1度目と同様に前記検索文字列
    に類似した前記対象文字素片列を検索して前記終了判定
    装置によりマークを付け直し、同様に前記複数の特徴量
    抽出装置の全てを用いて前記検索文字列を検索した後に
    マークが付けられた前記文字素片列が残っていれば前記
    対象文書画像が該当する文書画像とする請求項8記載の
    文書検索装置。
  11. 【請求項11】 領域分割装置により得られる文字列領
    域情報には文字列方向が記憶されており、検索文字選択
    装置は現在注目している検索文字素片の縦横比と前記文
    字列方向とから文字素片結合範囲を出力し、前記対象
    字素片選択装置は現在注目している文字素片から前記文
    字素片結合範囲内に存在する前記対象文字素片を結合し
    て新しい文字素片を生成し、前記検索文字素片と前記新
    しい文字素片とを比較することにより前記領域分割装置
    において文字が分離してしまった場合でも正確な検索が
    できることを特徴とする請求項9記載の文書検索装置。
  12. 【請求項12】 検索文字素片抽出装置は、検索文字列
    画像を入力する検索文字列画像入力装置と、前記検索文
    字列画像から黒連結成分である画像素片を抽出する画像
    素片抽出装置と、前記画像素片を基に前記検索文字列画
    像を分割して前記文字列領域情報を得る領域分割装置と
    を備え、検索文字列を画像として入力することにより検
    索する文字が未知であっても検索が可能な請求項1記載
    の文書検索装置。
  13. 【請求項13】 請求項5記載の対象文字素片抽出装置
    及び請求項8記載の特徴量系列検索装置を具備する請求
    項1記載の文書検索装置。
  14. 【請求項14】 特徴量系列検索装置は、各文字が一般
    文書中又は検索の対象となる前記文書画像中に出現する
    頻度を予め調べて記憶しておいた文字頻度表を備え、検
    索文字画像選択装置は最も文字頻度の小さい文字に対応
    した検索文字素片から順に選択し、前記対象文字素片を
    検索する回数を減らすことによって処理を高速化するこ
    とを特徴とする請求項8または10記載の文書検索装
    置。
  15. 【請求項15】 対象文字素片抽出装置は、傾き補正装
    置を備え、前記傾き補正装置は傾き情報を出力し、検索
    文字画像生成装置は前記傾き情報を考慮して傾いた検索
    文字画像を属性として持つ傾いた検索文字素片を生成
    し、前記対象文字素片と前記傾いた検索文字素片とを比
    較し、傾いた文書画像でも正しく前記検索文字列が検索
    できることを特徴とする請求項9記載の文書検索装置。
  16. 【請求項16】 対象文字素片抽出装置は、傾き補正装
    置を備え、前記傾き補正装置は傾き情報を出力し、検索
    文字選択装置は前記新しい検索文字素片と前記傾き情報
    とを用いて傾いた検索文字画像を属性として持つ傾いた
    検索文字素片を生成し、前記対象文字素片と前記傾いた
    検索文字素片とを比較し、傾いた文書画像でも正しく前
    記検索文字列が検索できることを特徴とする請求項13
    記載の文書検索装置。
  17. 【請求項17】 検索文字画像生成装置は、複数のフォ
    ントからなる複数の検索文字素片を生成し、前記複数の
    フォントのうち、少なくとも一つのフォントからなる前
    記検索文字素片を用いて前記検索文字列が検索できれ
    ば、前記対象文書画像を該当する文書画像とし、前記対
    象文書画像が複数のフォントを用いて記述されていても
    正しく検索が行える請求項7記載の文書検索装置。
  18. 【請求項18】 対象文字素片抽出装置は、前記領域分
    割装置より得られた文字列領域情報からフォント情報を
    出力するフォント識別装置を備え、検索文字素片抽出装
    置は前記フォント情報に対応した検索文字素片を生成
    し、前記文書画像が複数のフォントを用いて記述されて
    いても正しく検索が行える請求項5記載の文書検索装
    置。
  19. 【請求項19】 対象文字素片抽出装置は、前記領域分
    割装置より得られた文字列領域情報からフォント情報と
    国情報を出力するフォント識別装置を備え、検索文字素
    片抽出装置は、検索文字列を入力すると前記国情報が示
    す国の対応する文字列へ変換する翻訳装置を備え、前記
    検索文字画像生成装置は前記国情報に対応した国の、前
    記フォント情報に対応したフォントからなる検索文字素
    片を生成し、未知の言語の文書でも検索が可能となるこ
    とを特徴とした請求項9または13記載の文書検索装
    置。
  20. 【請求項20】 検索文字画像生成装置はフォントを90
    度毎に回転した4組の検索文字素片を生成し、前記4組
    の検索文字素片のうち、少なくとも一組の検索文字画像
    を該当する文書画像とし、前記文書画像が90度単位で
    回転されて入力されていても正しく検索が行える請求項
    7記載の文書検索装置。
  21. 【請求項21】 請求項5記載の対象文字素片抽出装
    置、請求項12記載の検索文字素片抽出装置、及び請求
    項8記載の特徴量系列検索装置を具備する請求項1記載
    の文書検索装置。
  22. 【請求項22】 対象文字素片抽出装置は、第一の傾き
    補正装置を備え、検索文字素片抽出装置は、第二の傾き
    補正装置を備え、前記第一の傾き補正装置から得られた
    前記対象文書画像の傾きに合うように前記第二の傾き補
    正装置は前記検索文字列画像の傾きを補正し、前記対象
    文書画像及び前記検索文字列画像が共に傾いて入力され
    た場合でも正確な検索が可能な請求項21記載の文書検
    索装置。
JP30546997A 1997-11-07 1997-11-07 文書検索装置 Expired - Fee Related JP3405155B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP30546997A JP3405155B2 (ja) 1997-11-07 1997-11-07 文書検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP30546997A JP3405155B2 (ja) 1997-11-07 1997-11-07 文書検索装置

Publications (2)

Publication Number Publication Date
JPH11143879A JPH11143879A (ja) 1999-05-28
JP3405155B2 true JP3405155B2 (ja) 2003-05-12

Family

ID=17945534

Family Applications (1)

Application Number Title Priority Date Filing Date
JP30546997A Expired - Fee Related JP3405155B2 (ja) 1997-11-07 1997-11-07 文書検索装置

Country Status (1)

Country Link
JP (1) JP3405155B2 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3803219B2 (ja) * 1999-12-14 2006-08-02 三菱電機株式会社 全文検索装置及び全文検索方法
JP4271878B2 (ja) 2001-03-22 2009-06-03 株式会社日立製作所 映像中の文字検索方法及び装置並びに文字検索処理プログラム
JP2007058448A (ja) * 2005-08-23 2007-03-08 National Institute Of Advanced Industrial & Technology 電子ファイリング方法及び装置並びにプログラム
JP2008004116A (ja) * 2007-08-02 2008-01-10 Hitachi Ltd 映像中の文字検索方法及び装置
JP5488077B2 (ja) * 2010-03-15 2014-05-14 オムロン株式会社 文字列検知装置、文字評価装置、画像処理装置、文字列検知方法、文字評価方法、制御プログラムおよび記録媒体
JP5787925B2 (ja) * 2013-03-22 2015-09-30 ヤフー株式会社 検索装置、検索プログラム、および検索方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57139866A (en) * 1981-02-20 1982-08-30 Toshiyuki Sakai Accumulation system and retrieval system of picture
CA2077970C (en) * 1991-11-19 1999-02-23 Daniel P. Huttenlocher Optical word recognition by examination of word shape

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
横澤一彦,人間の文字探索特性とそれに基づく文書検索法,電子情報通信学会論文誌,日本,社団法人電子情報通信学会,1990年 2月25日,Vol.J73−D−II,No.2,pp.191−199
遊佐実、田中譲,日本語文書画像に対する文字列検索機能の実現,情報処理学会研究報告(95−IM−19),日本,社団法人情報処理学会,1995年 1月13日,Vol.95,No.1,pp.1−8
鳥居秀行、田中譲,トランスメディア・マシンにおける英単語検索,情報処理学会第37回(昭和63年後期)全国大会講演論文集(I),日本,社団法人情報処理学会,1988年 9月12日,pp.429−430

Also Published As

Publication number Publication date
JPH11143879A (ja) 1999-05-28

Similar Documents

Publication Publication Date Title
US8295600B2 (en) Image document processing device, image document processing method, program, and storage medium
EP0844583B1 (en) Method and apparatus for character recognition
US5467411A (en) System with approximation mechanism for recognizing graphical elements in a drawing
US6944344B2 (en) Document search and retrieval apparatus, recording medium and program
JP3452774B2 (ja) 文字認識方法
US6327384B1 (en) Character recognition apparatus and method for recognizing characters
JP4577931B2 (ja) ドキュメント処理システム及びインデックス情報獲得方法
EP1993064A2 (en) Image processing apparatus and image retrieval method
EP2172856A2 (en) Image processing apparatus, image processing method and program
JPH05242292A (ja) 分離方法
JPH0139154B2 (ja)
JP2730665B2 (ja) 文字認識装置および方法
JP3405155B2 (ja) 文書検索装置
JP3216800B2 (ja) 手書き文字認識方法
US20010016068A1 (en) Electronic document generating apparatus, electronic document generating method, and program thereof
JP2002063548A (ja) 手書き文字認識方法
JP3319203B2 (ja) 文書ファイリング方法及び装置
US20030123730A1 (en) Document recognition system and method using vertical line adjacency graphs
JPH08194716A (ja) 画像処理方法及びその装置
JPH08161432A (ja) 文字切り出し方法および文字切り出し装置
JPH05346974A (ja) 文字認識装置
JPH1166230A (ja) 文書認識装置、文書認識方法及び媒体
JP2592756B2 (ja) 文字切り出し装置およびこれを用いた文字認識装置
JP2006163830A (ja) 文字認識装置、文字認識方法、および文字認識プログラム
JP2931485B2 (ja) 文字切出し装置及び方法

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees