JP5240047B2 - キーワード識別方法及装置 - Google Patents

キーワード識別方法及装置 Download PDF

Info

Publication number
JP5240047B2
JP5240047B2 JP2009106923A JP2009106923A JP5240047B2 JP 5240047 B2 JP5240047 B2 JP 5240047B2 JP 2009106923 A JP2009106923 A JP 2009106923A JP 2009106923 A JP2009106923 A JP 2009106923A JP 5240047 B2 JP5240047 B2 JP 5240047B2
Authority
JP
Japan
Prior art keywords
keyword
key character
character
key
identification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009106923A
Other languages
English (en)
Other versions
JP2009266232A (ja
Inventor
俊 孫
勇作 藤井
浩明 武部
克仁 藤本
聡 直井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of JP2009266232A publication Critical patent/JP2009266232A/ja
Application granted granted Critical
Publication of JP5240047B2 publication Critical patent/JP5240047B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

本発明は、キーワード識別方法及装置に関し、例えば、共有画像や文字を有する複数の画像又はファイルから共有キーワードを抽出するキーワード識別方法及装置に関するものである。
従来の文字識別方法は通常、遮断されていない完全な情報に対して文字識別をすることである。図1に示す6枚のPowerPoint(登録商標)(以下、PPT)ファイルに、1枚の画像毎に「CONFIDENTIAL」という単語があるが、完全な「CONFIDENTIAL」というキーワードを含む画像は1枚もない。各画像で文字又はパターンがキーワードの一部を遮断しているため、キーワードに文字の脱落又は字形の劣化が生じる。また、汎用の文字識別方法は動的計画方法(Dynamic Programming)によって文字列の識別を行うため、字形の退化により識別距離は確実でなくなり、文字列識別は失敗となる。しかも、汎用の文字識別方法は、1回に1枚の画像の文字識別問題のみを処理できるが、複数の画像における情報を組み合わせて識別することはないため、図1に示すキーワードを理想的に識別することができない。
非特許文献1には、ファイルに含まれる文字の左右位置関係に基づいて、最大完全部分グラフによって、ある文字列が存在する可能性があるかを判断する技術案が開示されている。
武部浩明,藤本克仁, "文字仮説の多重生成による帳票画像からの単語抽出方式",信学会技報PRMU2007-217, pp.19-24, 2007
しかし、このような判断は、ただ大まかな推定だけで、ある位置関係を有する複数の文字が1つのファイルに存在しているとしか決定できず、ファイルに所定の文字列が1つ存在していると確実に判断することができない。そして、識別する文字そのものは遮断されていないことが必要である。
そのため、共有画像や文字を有する複数の画像又はファイルから共有キーワードを的確に及び/又は満足いくように抽出できる技術は必要である。開示の技術は、たとえ何らかの原因で共有画像が劣化した場合にも、満足いくような結果を取得することができるよう、従来技術における前記1つ又は複数の問題を解決するためのものである。
本願が開示するキーワード識別方法は、1つの態様において、共有キーワードを有する複数の画像又はファイルから前記共有キーワードを識別するキーワード識別方法であって、前記複数の画像又はファイルにおける前記共有キーワードを含む領域の階調値に基づいて2値前景累積図を生成するステップと、前記2値前景累積図に基づいて当該2値前景累積図の分割点を決定し、可能なキー文字分割セグメントを決定するステップと、あらゆる可能なキー文字分割セグメントに対して文字識別を行って、当該あらゆる可能なキー文字分割セグメントに対応した識別文字を取得するステップと、標準キーワード辞書に含まれる少なくとも1つの標準キーワードに対して、当該標準キーワードのキー文字組合せ対と、当該キー文字組合せ対に対応した標準キーワードに含まれるキー文字からなり、且つ、前記識別文字に含まれる前記キー文字組合せ対の文字と同一な文字からなるキー文字マッチング対との間の対応関係によって、前記共有キーワードの中心の位置を推定するステップと、推定されたキーワードの中心の位置に対応した複数の前記キー文字マッチング対に含まれる識別文字を頂点とし、前記キー文字マッチング対に含まれたキー文字を2つずつ連結してなる図において頂点の数が最も多い最大完全部分グラフに基づいて的確なキー文字を決定するステップと、前記推定されたキーワードの中心の位置と前記的確なキー文字と前記標準キーワードとに基づいて、脱落キー文字を決定するステップと、前記推定されたキーワードの中心の位置と前記的確なキー文字と決定された前記脱落キー文字と前記標準キーワードとに基づいて、結合キー文字を識別するステップと、前記標準キーワードに対して識別された前記的確なキー文字と、前記決定された脱落キー文字及び結合キー文字とに基づいて、前記共有キーワードにどの標準キーワードを含むかを判定するステップと、を含む。
また、キーワード識別装置は、1つの態様において、共有キーワードを有する複数の画像又はファイルから前記共有キーワードを識別するキーワード識別装置であって、前記複数の画像又はファイルにおける前記共有キーワードを含む領域の階調値に基づいて2値前景累積図を生成する装置と、前記2値前景累積図の分割点を決定する分割部と、前記分割点に基づいてあらゆる可能なキー文字分割セグメントを決定するキー文字分割可能セグメント決定部と、前記あらゆる可能なキー文字分割セグメントにおける対象に対して文字識別を行って、前記あらゆる可能なキー文字分割セグメントに対応した識別文字を取得する文字識別部と、標準キーワード辞書に含まれる少なくとも1つの標準キーワードに対して、当該標準キーワードのキー文字組合せ対と、当該キー文字組合せ対に対応した標準キーワードに含まれるキー文字からなり、且つ、前記識別文字に含まれる、前記キー文字組合せ対の文字と同一な文字からなるキー文字マッチング対との間の対応関係によって、前記共有キーワードの中心の位置を推定するキーワード中心位置推定部と、推定されたキーワードの中心の位置に対応した複数の前記キー文字マッチング対に含まれる識別文字を頂点とし、前記キー文字マッチング対に含まれたキー文字を2つずつ連結してなる図において頂点の数が最も多い最大完全部分グラフに基づいて的確なキー文字を決定する最大完全部分グラフ・キー文字抽出部と、前記推定されたキーワードの中心の位置と前記的確なキー文字と前記それぞれの標準キーワードとに基づいて、脱落キー文字を決定する脱落キー文字識別部と、前記推定されたキーワードの中心の位置と前記的確なキー文字と決定された前記脱落キー文字と前記標準キーワードとに基づいて、結合キー文字を識別する結合キー文字識別部と、前記標準キーワードに対して識別された前記的確なキー文字と、前記決定された脱落キー文字及び結合キー文字とに基づいて、前記共有キーワードに前記標準キーワード辞書におけるどの標準キーワードを含むかを判定するキーワード決定部と、を備える。
本願が開示するキーワード識別方法およびキーワード識別装置によれば、背景が複雑で遮断されている複数の画像又はファイルから共有画像又は文字を識別することができるという効果を奏する。
図1は、「CONFIDENTIAL」という共有キーワードを付けた6枚のPPTを示す図である。 図2は、実施例1による複数の画像における共有画像を識別するためのキーワード識別装置を示すブロック図である。 図3は、実施例1による複数の画像における共有画像を識別するためのキーワード識別方法を示すフローチャートである。 図4は、実施例1による複数の画像における共有画像を識別するためのキーワード識別方法を示す図である。 図5は、図4中の4cにおける2値前景累積図に対して継承可能な分割を行う概略図である。 図6は、図4中の4cにおける2値前景累積図に対して継承可能な分割を行うフローチャートである。 図7は、標準キーワード辞書における「CONFIDENTIAL」というキーワードに対して最大完全部分グラフに基づいてキー文字抽出を行う概略図である。 図8は、図5に含まれる6枚の画像の垂直方向における投影ヒストグラムを示す図である。 図9は、標準キーワード辞書に記憶された「CONFIDENTIAL」に関する理想投影ヒストグラムである。 図10は、実施例2による複数の画像における共有画像を識別するためのキーワード識別装置を示すブロック図である。 図11は、実施例1および実施例2のキーワード識別装置のハードウェア構成の一例を示す図である。
本願の開示するキーワード識別方法およびキーワード識別装置を実施するための最良の形態を図面に基づいて以下に説明する。なお、図面は、本出願の一部であり、本発明への限定とならない。
また、本願に関する基本的な理解を提供するために、本願に関する簡潔な概述を下記に記載している。しかし、この概述は本願に関する徹底的な概述ではなく、本願の主要な部分又は大切な部分を決定することを意図せず、本願の範囲を限定しない。簡単な形式で本願に関する概念を示すことだけを目的としている。当業者は、本願の下記各態様と添付した独立請求項によって限定される方案を、本願の実施の形態及び/又は従属請求項のいずれかと組み合わせることができる。
図1は、「CONFIDENTIAL」という共有キーワードが付けられた6枚のPPTを示す図である。この6枚の画像において、「CONFIDENTIAL」というキーワードは遮蔽などの原因で、いずれも不完全なものであり、これによりいずれの単独画像からも完全なキーワードを取り出すことはできず、その中の何れか1枚の画像だけによってキーワードを的確に識別することはできないことが分かる。
図2は、本願に係るキーワードを識別するための装置の構造を示すものである。以下に図2に示す部品のそれぞれを参照して詳しく説明する。
本願では、共有画像を有する複数の画像を組み合わせてキーワードの識別を行う。まず、図1に示す6枚のPPT画像に対して位置合わせを行う。画像の位置合わせを行うことは、例えば、本出願者が前に提出した中国特許出願番号2008100087720.2、発明名称が「画像処理方法と装置及び透かしチェックシステム」に記載の方法を採用してもよいが、これのみに限らない。従来の画像位置合わせの方法はいずれも、画像位置合わせを行うために本願に開示の技術に適用することができる。
複数のPPT画像から「CONFIDENTIAL」という共有キーワードを含む画像をそれぞれ切り出す。画像毎に含まれるキーワードが文字や画像によりある程度遮蔽されているため、切り出し画像は、キーワードと背景画像(例えば白、グレイの背景、或いは他の紋様付きの背景)の他に、キーワードを遮蔽する文字やパターンも含んでいる。以下に、キーワードを遮蔽する文字やパターンを遮蔽パターンと略称する。
図4中の4aは、図1の6枚のPPT画像に対して位置合わせを行った後、その中からそれぞれ切り出した「CONFIDENTIAL」というキーワードを含む6つの階調パターンの例示である。この6つの階調パターンについて、まず背景を除去することにより、キーワードのパターンと遮蔽パターン(前記背景パターンと区分するために、ここで、キーワードと遮蔽パターンを含むパターンを前景パターンと称する)のみが残される。背景を除去する方法は多種あり、例えば下記の方法を使用すればよい。
まず、式(1)によって、切り出した6枚の画像における画素点毎に、当該画素点における画像階調の平均値と分散を求める。
Figure 0005240047
ここで、iは切り出した画像の番号を示し、且つiは6以下である。4aに示すように、(x,y)は1枚の切り出し画像における画素点の座標位置を示し、1枚の画像毎の座標原点(0,0)として切り出し画像の左下方の点Aを選定することができる。もちろん、座標原点の選定はこの点には限らない。G xyはi番目の切り出し画像における、画素点(x,y)の階調値を示し、Mxyは6枚の切り出し画像における同一位置(x,y)の階調の平均値を示し、Vxyは前記同一位置(x,y)の分散値を示す。
通常、背景点の数が前景点より遥かに多い。異なる画像において、背景画素点の階調は変化がそれほど激しくないが、前景画素点の階調は変化が激しいため、分散閾値(例えば分散の平均値)を1つ設定することで、分散値が分散閾値より小さいあらゆる画素点を取り出してもよい。このように算出して得られた分散値が分散閾値より小さい画素点は、分散の変化が小さな背景点、及び分散の変化が小さなキーワードのストローク画素点を含む可能性がある。キーワードストロークの階調と背景点の階調とが異なるので、分散値が分散閾値より小さい点をその階調によって2種類に分け、仮に背景点の数がキーワードのストローク画素点の数より多い場合に、分類の結果から背景点を決定することができる。階調による分類法がいろいろあり、例えば、あらゆる点の階調平均値を閾値として簡単に算出して、2種類に分けることができる。図4中の4bは、背景パターン除去後の前景図を示す。前景図4bでは、背景画素点の階調値は255に統一されている。
背景パターンが除去された6枚の前景パターンから6枚の画像の前景累積階調図が得られる。前景累積階調図の算出式(2)は以下のようであり、階調値が255より小さい画素点に対応する値を1とし、その他は0とする。もちろん、ここで選定した値である255は1つの例示であり、他の値に定めてもよい。
Figure 0005240047
上記式において、iは6枚の画像における各画像の番号を示し、xとyは切り出し画像毎にある画素点のx方向とy方向位置における値をそれぞれ示し、Pxyは(x,y)における6枚の画像の前景累積階調値を示す。上記式から分かるように、前景累積階調図における各点の累積階調値の最大値は、共有キーワードを含む画像の個数Nであり、ここで、N=6である。6枚の切り出し画像のある位置(x,y)における階調値がいずれも255である場合、Pxyは0であるが、6枚の切り出し画像のうち、1枚の画像のみ(x,y)における階調値が255より小さい場合、Pxyは1であり、こうして、6枚の切り出し画像のうち、あらゆる画像の(x,y)における階調値が255より小さい場合、Pxyは6である。
式(3)によって、前景累積階調図より図4中の4cに示すような2値前景累積図が得られる。
Figure 0005240047
2値前景累積図にはN層を含み、Nは共有キーワードを含む切り出し画像の数と等しい。ここでは切り出し画像は6枚なので、N=6である。式(3)に示すように、2値前景累積図のi番目の層の値を255とすれば、少なくともi枚の画像が点(x,y)で前景点となり、値が0だとすれば、最大でi−1枚の画像が点(x,y)で前景点となる。4cに示すように、最上層(ここではi=6、上から6番目の行に対応)の黒い点は、6枚の切り出し画像のいずれも前景点である点を表し、2番目層(ここではi=5、上から5番目の行に対応)では、少なくともN−1(ここでは5)枚の画像に前景点である点を表し、こうして、最下層は(ここではi=1、一番上の行)、6枚の切り出し画像で前景点が少なくとも1回現れた点を表す。
上記2値前景累積図の生成過程は、あくまでも1つの例示であり、当業者にとって、2値前景累積図の生成方法が多種類あるので、ここで一々述べるまでもない。
上記2値前景累積図は後にキーワード識別をする基礎となる。生成した2値前景累積図は図2に示す分割部1に提供され、分割部1は、2値前景累積図の空白部分によって、それを分割する。ここで、分割部1は、継承可能な文字分割法によって分割する。もちろん、分割の方法はいろいろあるが、ここで継承可能な文字分割法のみを例として説明する。
図5は、分割部1による2値前景累積図に対して継承可能な分割を行う概略図である。まず、層毎のキーワード画像から、黒い画素点の間の空白部分を空白分割セグメントとして取り出す。これら空白分割セグメントの中点(midpoint)は、物理分割点を表す。図5に示すように、破線の分割線で表示する。そして、物理分割点を統合して下層に継承する。2番目層から、前層の空白分割セグメントのそれぞれに対して、それと重なる空白分割セグメントがこの層にあるかをチェックする。上記2値前景累積図の生成方式より分かるように、下層の2値累積画像が常に上層の2値累積画像を完全に含むため、下層の空白分割セグメントが上層のものと重なった場合、下層の空白分割セグメントにより表される分割情報はより的確なはずである。そのため、下層の空白分割セグメントの中点で上層の空白分割セグメントの中点を取って代えて、物理分割点の統合過程とする。上層の物理分割セグメントが下層のものと重ならない場合、下層の画像はこの分割セグメント範囲内で結合が生じたこととなり、上層の物理分割セグメントからの物理分割点を下層の結合分割点(図で実線の分割線で表示する)と見なす。この過程は、物理分割点の継承というものである。最下層の図における分割点は、最終の分割結果を表す。
上記のように分割結果が得られたものの、前記識別される切り出し画像のキーワードが遮蔽されたり結合したりするといった原因で、この場合に得られた分割結果では、図5に示すように、キー文字が途中から切断されている可能性がある。そのため、キー文字の的確な分割位置を決定することができないので、最終の分割点を全て得た後、それらの分割点から、あらゆる可能なキー文字分割セグメントを算出する必要がある。
分割部1は、あらゆる可能なキー文字分割セグメントを取り出すように、得られた最終の分割結果をキー文字分割可能セグメント決定部2へ提供する。まず、仮に切り出したキーワード画像の高さをキーワードにおけるキー文字の高さとし、1つのキー文字分割セグメントの最大の幅とキー文字の高さとの比率関係を予め設定しておけば、例えば、キー文字分割セグメントの最大の幅をキー文字の高さの1.5倍(ここで1.5倍はただ1つの例のみであり、実際の場合に応じて他の値にも設定可能である。例えば1.2など)に設定して、このキー文字の幅の条件を満たすあらゆる分割セグメント及び分割セグメントの組合せを取り出して、それを可能なキー文字分割セグメントとして決定することができる。キー文字分割可能セグメント決定部2は、可能なキー文字分割セグメントを取得した後、決定された可能なキー文字分割セグメントを文字識別部3に提供する。文字識別部3は、N層画像における可能なキー文字分割セグメントのそれぞれの画像に対して文字識別を行う。結果は、表1に示すようになる。
Figure 0005240047
表1において、第2コラムのうちの分割セグメント起点座標は、ある可能なキー文字分割セグメントの起点座標値を示し、分割セグメント終点座標は、ある可能なキー文字分割セグメントの終点座標値を示す。前記のように、可能なキー文字分割セグメントの幅をキーワードの高さの約1.5倍以下と設定し、ここで、仮にキー文字の高さが55画素点だと分かったとすれば、可能なキー文字分割セグメントの最大の幅は82画素点となる。これによって、表1の第2コラムに示す39個の可能なキー文字分割セグメントを決定することができる。
詳しくは、図5に示すように、分割点1から座標起点(0,0)までの距離は081個の画素点であり、座標の値が081に該当し、分割点2から座標起点(0,0)までの距離は114個の画素点であり、座標の値が114に該当するので、分割点1から分割点2までの分割セグメントは(081,114)で示され、114−081=33である。そのため、即ちこの分割セグメントの幅が可能なキー文字分割セグメントの最大の幅82より小さいため、キー文字分割可能セグメント決定部2はそれを1番目の可能なキー文字分割セグメントとして決定する。分割点1から分割点3までの分割セグメントは(081,120)で示され、キー文字分割可能セグメント決定部2はそれを2番目の可能なキー文字分割セグメントとして決定する。こうして,分割点1から分割点4までの分割セグメントは(081,159)で示され、4番目の可能なキー文字分割セグメントとして決定される。分割点1から分割点5までの分割セグメントの幅は193−081=112の画素点であり、112は可能なキー文字分割セグメントの最大の幅082より大きいため、可能なキー文字分割セグメントとして決定されない。0081を起点とした可能なキー文字分割セグメントが全て決定された後、次の1番目の画素点として2番目の分割点を起点として、可能なキー文字分割セグメント(114が分割セグメント(081,114)にあることは既に決定されたため、その次の1番目の分割点を起点とする)を再び順に決定する。例えば、114の次の1番目の画素点115を起点とすると、分割セグメント(115,120)が決定される。こうして、キー文字分割可能セグメント決定部2が、あらゆる可能なキー文字分割セグメントを決定する。
表1は、可能なキー文字分割セグメントにおけるパターンに対する、6つのキー文字識別結果と6つのキー文字識別距離を行ごとに示したものである。6つのキー文字識別結果は、文字識別部3による各層に対する識別結果をそれぞれ表し、6つのキー文字識別距離は、各層でのパターンの階調ベクトル(各キー文字識別段にあるパターンを8×8のブロックのように分けた、ブロックごとの階調平均値からなるベクトル)と、文字を識別するための標準フォントにおける26英文アルファベットに対する標準階調ベクトルとのベクトル距離をそれぞれ表す。この識別距離は値が小さければ小さいほど、それに対応する識別結果は的確である。
文字識別部3は、キーワードの中心の位置を推定するように、表1における(分割セグメント起点座標、分割セグメント終点座標)、識別した1番目層の識別結果、1番目層の識別距離、2番目層の識別結果、2番目層の識別距離、……、6番目層の識別結果、6番目層の識別距離を下記に説明するキーワード中心位置推定部5にそれぞれ提供する。
図5と表1より分かるように、2値前景累積図にノイズがたくさんあるため、識別結果が非常に不安定であり、しかも、完全に遮蔽された文字もありうる(例えばDENにおけるN)ので、「CONFIDENTIAL」とすることができる組合せを直接に見付けるのは非常に難しい。本願に開示の技術では、標準キーワード辞書生成部4によって、識別するあらゆるキーワード情報の標準キーワード辞書を生成する。例えば、「CONFIDENTIAL」、「DO NOT COPY」、「NO COPY」、「TOP SECRET」、「SECRET」、「INTERNAL USE ONLY」、「ORIGINAL」などのファイルの機密度合いに関するキーワード情報を予め格納しておく。もちろん、これらの言葉はただの例であり、標準キーワード辞書に格納された識別する情報は、機密度合いに関する言葉の情報だけには限らない。標準キーワード辞書生成部4は、実際の必要に応じて、識別するあらゆるキーワード情報を含む標準キーワード辞書を生成することができる。
まず、標準キーワード辞書生成部4は、キーワード画像のそれぞれを一律の幅と高さに正規化する。例えば、比率に従って伸縮して、その幅を1000画素点とする。そして、各キーワード画像に含まれた各文字の中心点位置及び文字同士を分割する点を求める。ここで、各文字の中心点位置は当該文字の中心から当該キーワードの1番目のアルファベットの中心までの相対距離でもよいし、当該文字の中心から当該キーワードの1番目のアルファベットの最左側のエッジポイントまでの相対距離でもよい。この位置の起点がどのように決定されたかは大切ではないが、上記各文字の中心位置によって、当該キーワードに含まれたいずれかの2つのアルファベット同士の相対距離、及びいずれかの1つのアルファベットから当該キーワードの中心までの相対距離を決定できることは、何より大切である。次に、標準キーワード辞書生成部4は、上記位置情報と分割点によって、キーワードにおける各キー文字に番号を付けることで、当該キーワードに含まれたあらゆる文字2つずつからなる、あらゆるキー文字組合せ対を取り出し、各キー文字組合せ対の下記の情報の統計をとる。例えば、キー文字組合せ対番号、キー文字組合せ対における2つの文字、キー文字組合せ対における2つのキー文字の番号、キー文字組合せ対における2つのキー文字の中心点同士の距離、キー文字組合せ対における1番目の文字(左側の文字であり、ここで1番目の文字に限るものではなく、もちろん、2番目の文字からキーワードの中心までの距離を利用することも可能)からキーワードの中心までの距離である。
標準キーワード辞書生成部4は、キーワード毎に、フォントが異なる当該キーワードを複数選択して、各フォントの当該キーワードのいずれに対しても、上記位置情報と距離情報を算出し、各キーワードに対する位置情報と距離情報について、それぞれ平均値を取り、最終の標準キーワード辞書を取得する。「CONFIDENTIAL」というキーワードについて、標準キーワード辞書の内容は表2−1および表2−2の通りである。
Figure 0005240047
Figure 0005240047
番号01の内容を例として、表2−1および表2−2にある各コラムの情報の意味を説明する。CとOは、それぞれ1つの組合せ対に含まれた2つのキー文字であり、表2−2の00と01は、CとOのキーワードにおける番号をそれぞれ表す。即ち、CとOは、「CONFIDENTIAL」における0番目と1番目の文字であり、表2−2の99は、表2−1のアルファベットCとアルファベットOとの距離138−039=99を表し、461は、アルファベットCから中心点500までの距離500−039=461を表す。
もちろん、上記組合せ対の選択は、アルファベットを2つずつ組成するものに限られず、2つ以上のアルファベットからなる組合せ対によっても本願に開示の技術を実現することもできる。
キーワード識別を行う場合、標準キーワード辞書生成部4は、生成された各キーワードに関する標準キーワード辞書情報をキーワード中心位置推定部5に提供し、キーワード中心位置推定部5は、文字識別部3により提供された文字識別結果に基づいて、標準キーワード辞書に含まれた各キーワードに関するキー文字情報によって、上記文字識別部3により識別された文字に対するキーワードの中心を算出する。
実際の算出過程において、キーワード中心位置推定部5は、標準キーワード辞書生成部4により生成された、表2−1および表2−2に示すようなキーワード情報を、文字識別部3により識別された文字とマッチングさせることにより、キーワードの識別を行う必要がある。ここでは、標準キーワード辞書生成部4により生成された「CONFIDENTIAL」というキーワードに関する情報のみを例として、どのようにして、文字識別部3により識別された文字を、標準キーワード辞書における「CONFIDENTIAL」に含まれたキー文字組合せ対とマッチングして、キーワード識別を行うかについて説明する。
文字識別部3で文字がいくつか識別されたが、2値前景累積図にノイズ情報があるので、それらの文字がこのキーワードにおける何番目なのかは決定できない。そのため、文字識別部3により識別された文字に、標準キーワード辞書におけるキー文字組合せ対にある2つの文字と同一の2つの文字が出たとき、当該キー文字組合せ対のキー文字マッチング対とし、当該キー文字組合せ対における2つのキー文字同士の位置関係及び上記マッチング対における2つの文字同士の位置関係との比例関係、及び1番目のキー文字からキーワードの中心までの距離情報によって、当該マッチング対における2つの文字に対応するキーワードの中心を推定する。例えば、「CONFIDENTIAL」に「N」が2つ出たが、キーワード中心位置推定部5は、キーワードの中心の位置を推定する時に、文字識別部3により識別された「N」が「CONFIDENTIAL」において何番目のNなのかは分からないため、文字識別部3により識別された「N」と文字識別部3により識別された他の文字(例えば「C」)との位置関係、及び表2−2における当該2つの文字(「N」と「C」)に対応するあらゆるキー文字組合せ対(例えば番号02と07に該当する2つの「CN」について)の情報によって、キーワードの中心の位置を推定する。上記算出過程は下記の式(4)で表す。
Figure 0005240047
式(4)で、D1は、標準キーワード辞書で生成された、キー文字組合せ対における2つのキー文字同士の距離を表し、D2は、当該キー文字組合せ対に該当したキー文字マッチング対における2つの文字同士の距離を表し、D1’は、標準キーワード辞書で生成された、キー文字組合せ対における1番目の文字からキーワードの中心までの距離を表し、D2’は、キー文字マッチング対における1番目の文字から推定の中心までの距離を表し、その距離は、D1,D2,D1’,D2’の比例関係の算出によって得られる。
もちろん、ここでは、キー文字組合せ対におけるキー文字同士の距離と、キー文字マッチング対における文字同士の距離との対応比例関係によって、キーワードの中心を推定するが、それだけに限られず、キー文字組合せ対におけるキー文字とキー文字マッチング対におけるキー文字との固有比例関係により、キーワードの中心の位置を推定することができる。例えば、キー文字組合せ対におけるキー文字の幅とキー文字組合せ対における1つの文字からキーワードの中心までの距離との比率と、キー文字マッチング対における文字の幅とこの文字からキーワードの中心までの距離との比率との対応比例関係によって、キーワードの中心を推定することもできる。
上記のように、切り出し画像におけるキーワードと標準キーワード辞書におけるキーワードに、同一な文字が複数存在している場合、上記マッチング方法によってキーワードの中心の位置を推定したとすると的確でない推定値が生じる恐れがある。また、表1に示すように、ノイズの影響で、識別された文字にそもそも間違った文字がかなり混ざっているので、間違った文字によって上記キー文字マッチングを行うとすると、得られたキーワードの中心の位置の推定値は、本当のキーワードの中心の位置ではなくなる。そのため、本願に開示の技術においては投票の原理を利用する。まずカウンタの序列を設定し、カウンタの長さがキーワードを含む切り出し画像の幅と等しくなるようにする。そして、キーワードの中心の位置を推定するたびに、カウンタに、推定されたキーワードの中心の位置に対して値を1つ累積すれば、的確に識別されたキー文字に基づいて算出された的確なキーワードの中心の位置に、ピークが現れるはずである。具体的には、「CONFIDENTIAL」に対してマッチングを行う時に、切り出し画像から的確に識別された文字(例えば「C」、「O」、「N」、「F」など)によって、キーワードの中心の位置を算出すると、キーワードの中心が的確に算出でき、しかも、的確なキーワードの中心にピークが形成されている。そうでない場合として、もし元の切り出し画像に含まれたキーワードが「CONFIDENTIAL」の場合、その中の文字「C」、「O」、「E」と「T」が的確に識別されたものの、前述の対応比例関係によって、「TOP SECRET」というキーワード情報における「T」、「O」、「E」、「E」、「T」の文字とマッチングすると、切り出し画像における識別されるキーワードと「TOP SECRET」との位置関係そのものは対応していないため、「TOP SECRET」の的確なキーワードの中心にピークが1つ形成するということがない。好ましくは、誤差の推定を避けるために、推定された中心位置に対して値を1つ累加するとともに、中心位置の近くの画素点に対して、わずかに小さな数値をそれぞれ累加する。例えば、中心位置のプラスとマイナスの10個の画素点に対して、下記の表3の数値をそれぞれ累加することができる。もちろん、これらの値はあくまでも例示の1つである。
Figure 0005240047
上記表3における「100」は、識別された1つの中心位置に累加される値を表し、最も左側の「2」は、当該中心位置から左10画素にある点に累加される値であり、最も右側の「2」は、当該中心位置から右10画素にある点に累加される値である。また、好ましくは、ガウス関数、三角関数で、推定されたキーワードの中心の位置に、より大きな値を累加し、推定されたキーワードの中心の位置の近くの点に、より小さな数値をそれぞれ累加する。
上記のように、投票の結果は、的確に識別された文字に対応する的確なキーワードの中心の位置にピークを形成する。図4中の4eの最上層の投票の結果は、4fに示すようなものとなる。しかし、ノイズの影響で、投票の結果はしばしばピークが1つ以上現れ、的確なキーワードの中心に対応する位置が1番高いピークであるとは限らない。そのため、1つの閾値を予め設定しておき、設定された閾値より高いあらゆるピークを残し、下記の最大完全部分グラフに基づく方法によって、それをその都度チェックして、キーワードの中心に対応する本当のピークを取り出す。好ましくは、1番高いピークの半分を閾値とする。
上記中心位置の投票を行った後、キーワード中心位置推定部5は、上記残された複数のキーワードの中心の位置のそれぞれを、当該中心位置が推定されたキー文字マッチング対に対応付けてそれぞれ格納し、上記キー文字マッチング対における文字が当該キーワードにある番号も格納し、最大完全部分グラフ・キー文字抽出部6に提供する。ここで、1つのキー文字マッチング対が推定されたキーワードの中心と現在のキーワードの中心の位置との偏差が予定の範囲より小さいと、当該キー文字マッチング対が現在のキーワードの中心に対応すると思われるので、それを対応付けて格納してから、最大完全部分グラフ・キー文字抽出部6に提供する。好ましくは、当該予定範囲を高さの1倍とすればよい。例えば、現在のキーワードの中心の位置は500とし、文字の高さは100とすれば、(400,600)範囲の位置に投票されたキー文字マッチング対はいずれも現在のキーワードの中心と対応していると思われる。
最大完全部分グラフ・キー文字抽出部6は、上記残されたキーワードの中心に対して、キーワード中心位置推定部5からのキーワードの中心の位置のそれぞれと、当該中心位置が推定されたキー文字マッチング対との対応関係によって、現在推定されたキーワードの中心と対応する複数のマッチング対、及びマッチング対に含まれた文字の当該キーワードにおける番号を抽出する。
最大完全部分グラフ・キー文字抽出部6は、推定されたキーワードの中心毎に、下記の最大完全部分グラフに基づくキー文字抽出方法によって、当該中心に対応したキー文字を取得する。あるキーワードの中心に応じて見つけたキー文字の数が最大であるキーワードの中心は、本当のキーワードの中心であると思われる。表4は、図4中の4fの投票によって得られたキーワードの推定中心ピークに対応したあらゆるキー文字マッチング対を列挙したものである。ここで、閾値を超えたピークは仮に1つのみとする。表4には、左欄から右欄にかけて、番号、1番目の頂点の文字、2番目の頂点の文字、1番目の頂点のキー文字番号、2番目の頂点のキー文字番号、及び推定されたキーワードの中心の位置が含まれている。
Figure 0005240047
最大完全部分グラフ・キー文字抽出部6は、現在のキーワードの中心に対応したあらゆるキー文字マッチング対を取り出した後、これらあらゆるキー文字マッチング対に対して、図を1つ作成する。図7に示すように、図の各頂点は、上記マッチング対における1つの文字をそれぞれ表す。表1に示す1つの文字分割セグメントに異なった文字識別結果が2つ出ており、しかも、その異なった文字識別結果がいずれも標準キーワード辞書における現在識別されるキーワードに含まれている場合、それらがそれぞれ異なる頂点となるようにする。例えば、表1の31番目の項目に、「O」と「E」という2つの識別結果があると、「O」と「E」のいずれも「CONFIDENTIAL」における文字なので、どちらの文字が間違ったのかは判定できないため、当該2つの識別結果を全て残し、それぞれ1つの頂点として、この文字分割セグメントに対して2つの頂点を得る。現在のキーワードの中心に対応するあらゆるキーワードマッチング対に対して、キーワードマッチング対毎にそれぞれ含まれた2つ頂点を繋げると、1つの図構造となる。図7は、現在のキーワードの中心のピークに対応するあらゆるキー文字マッチング対によって描かれたものを示す。
そして、図7に示すような図構造から、2つずつの頂点間が繋がり且つ部分グラフに含まれる頂点が一番多い最大完全部分グラフを取り出す。上記のようなキーワードの中心の推定過程より分かるように、2つずつ繋がったキー文字は、このような2つのキー文字によって同一のキーワードの中心を推定したと表すと、最大完全部分グラフにおけるあらゆる頂点の間で2つずつ繋がっているため、最大完全部分グラフにおけるあらゆる頂点は同一のキーワードの中心を推定し、最大完全部分グラフに含まれたあらゆる頂点に対応した文字は、現在のキーワードの中心に対応した的確に識別されたキー文字と決定される。
図7に示したように、表4に示すような現在のキーワードの中心に対応した28個のマッチング対における各マッチング対に含まれる2つのキー文字を繋ぐと、キー文字番号が0、2、3、4、5、6、9であるキー文字C(0)、N(2)、F(3)、I(4)、D(5)、E(6)、I(9)の頂点が2つずつ連結している。これらの頂点が繋がってなる部分グラフが最大完全部分グラフであり、これらの頂点により表される分割セグメントはお互いに重なっていないし、いずれも同一のキーワードの中心を的確に推定しているので、これらの頂点により表される文字を現在のキーワードの中心に対応した的確に識別されたキー文字とする。
ここで、現在のキーワードの中心、及び的確に識別されたこれらのキー文字をキーワード識別の基準とする。最大部分グラフに基づいてキー文字を識別した後、脱落キー文字識別部7は表4におけるキー文字C(0)、N(2)、F(3)、I(4)、D(5)、E(6)、I(9)という頂点からなる各キー文字マッチング対、及び表2−1および表2−2の標準キーワード辞書に格納された、各文字の中心位置及び各文字の間の距離に関する情報によって、その他の識別されるキー文字(残った決定されていないキー文字)の中心位置を推定し、各識別されるキー文字の中心位置における文字を識別し、切り出し画像の当該位置にある文字は「CONFIDENTIAL」の当該位置にあるキー文字と対応しているかを判断する。即ち、算出された文字中心位置に予定のキー文字が現れるかを判断し、予定のキー文字が現れた場合、この文字を当該位置に脱落した的確なキー文字と判断する。
例えば、最大完全部分グラフ・キー文字抽出部6で、切り出し画像にキー文字C(0)、N(2)、F(3)、I(4)、D(5)、E(6)、I(9)を含むと決定した場合、完全な「CONFIDENTIAL」と比べることにより、脱落キー文字識別部7は、(1)の位置に「O」が現れ、(7)の位置に「N」が現れ、(8)の位置に「T」が現れ、(10)の位置に「A」が現れ、(11)の位置に「L」が現れると推測する。「NT」と「AL」とでは結合が生じているので、位置(1)にある文字を識別する。(1)の位置に確かに「O」が現れたので、脱落キー文字識別部7は、ここでの文字「O」が的確な文字であると判定できる。
上記文字識別の方法はたくさんあるが、好ましくは、表1のうちの各層に対する識別結果によって上記判定を行うが、改めて識別する必要はない。表1のうちの各可能な文字分割セグメント対する識別結果に基づいて、ある可能なキー文字分割セグメントが下記の三つの条件を満すと、推測された脱落キー文字が当該可能なキー文字分割セグメントに含まれると判定できる。
1.当該可能なキー文字分割セグメントは、識別されたキー文字と、位置が重なっていない。
2.推定されたキー文字の中心位置は当該可能なキー文字分割セグメントの範囲内にある。
3.当該可能なキー文字分割セグメントの識別結果には識別されるキー文字が含まれる。
脱落キー文字の判断によって、「O」は脱落した的確なキー文字であると決定できる。あらゆる脱落キー文字が識別された後、結合で的確に識別されないキー文字もあるので、最後は結合キー文字識別部8によって結合キー文字を識別する。
従来の方法によって結合キー文字を識別すればよい。好ましくは、ヒストグラム投影の方法によって、識別される切り出し画像から、先ずあらゆる識別されていないキー文字及びそれに対応する画像セグメントを取り出し、2つ以上の連続な識別されていないキー文字があると、これらの文字の間に結合が生じたと判定し、切り出し画像におけるこのような画像セグメントを全部取り出し、これらの画像セグメントの投影ヒストグラムを求める。
図5では、「NT」と「AL」で結合が生じている。図8は、図5に含まれる6枚の画像の垂直方向における投影ヒストグラムを示す図である。投影ヒストグラムは画像処理領域の周知の技術である。即ち、文字の階調画像に対して、文字の上端の方向から文字の下端へ投影し、投影線と交差する黒点画素を累計で和を求めることで、文字の階調累積分布図を取得する。投影図における曲線の値は、この水平位置における黒い画素点の数を表す。縦線12と線13との間は識別されなかった「AL」の部分である。
図9は、標準キーワード辞書に記憶された「CONFIDENTIAL」に関する理想投影ヒストグラムを示す。26の英文文字の標準投影ヒストグラムは、それぞれの形状に対応する特定の分布を有するので、結合文字「AL」の投影ヒストグラムの情報によって、標準キーワード辞書内の「CONFIDENTIAL」に関する理想投影ヒストグラムにおける例えば縦線14と15の間の部分のような対応部分を取り出し、ヒストグラムマッチングの方法によって、図5に含まれる6枚の画像の垂直方向における投影ヒストグラムを標準投影ヒストグラムと合わせることができる。ヒストグラムマッチングの1つの方法は、下記のようである。
1.上記6枚の画像の垂直方向における投影ヒストグラムの幅を標準キーワード辞書における「CONFIDENTIAL」というキーワードのヒストグラムと同じような幅まで伸縮する。
2.上記6枚の画像の垂直方向における投影ヒストグラムと、キーワード辞書における「CONFIDENTIAL」というキーワードのヒストグラムの1次元のデータの関連値を求めることによって、6枚の画像の垂直方向における投影ヒストグラムと標準投影ヒストグラムとの最適のマッチングオフセット量を求め、このオフセット量によって、6枚の画像の垂直方向における投影ヒストグラムを、標準投影ヒストグラムと合わせる。
3.最後に、標準キーワード辞書における「CONFIDENTIAL」に関する理想投影ヒストグラムの各キー文字の分割点(表2−1で示している)によって、上記6枚の画像の垂直方向における投影ヒストグラムにおける結合部分の分割位置を決定する。
上記結合分割が完了した後、分割された切り出し画像における分割セグメントに対して文字識別を行う。文字識別の結果が当該位置に現れるべくキー文字と一致すると、結合キー文字識別部8は、結合分割の結果が的確であると判定し、結合したキー文字を識別する。
図4中の4eは、最大完全部分グラフに基づいたキー文字の抽出、脱落キー文字の抽出及び結合キー文字の抽出をして得られた結果の概略図である。ただし、陰影で最大完全部分グラフに基づくキー文字「C」、「N」、「F」、「I(5)」、「D」、「E」、「I(9)」を示し、斜線で脱落キー文字の位置に基づいて推定されたキー文字「O」を示し、罫線で結合分割後に識別された結合キー文字「T」、「A」、「L」を示している。
そして、標準キーワード辞書における識別される「CONFIDENTIAL」というキーワードに応じて、切り出し画像のキーワードを上記のように判定し、得られた的確に識別されたキー文字の数が「CONFIDENTIAL」の総数(12個)を所定の比率で超えた場合、キーワード決定部9は、共有画像を含む切り出し画像に含まれたキーワードが「CONFIDENTIAL」であると判定する。例えば、当該比率を70%とし、当該比率を超えたキーワードならば、チェックされる画像が目標キーワードを含む可能性があると判定する。上記例示では、識別されたキー文字「C」、「N」、「F」、「I」、「D」、「E」、「O」、「T」、「A」、「L」、即ち識別されたキー文字の数が11となっているが、キー文字の総数が12であり、識別の比率が11/12=91.7%となって所定の比率を超えたので、キーワード決定部9は、チェックされる切り出し画像に「CONFIDENTIAL」というキーワードを確実に含むことを直接判断できる。
上記のように、1つ以上のキーワードをチェックする必要があると、キーワードごとに標準キーワード辞書を作成し、標準キーワード辞書における各キーワードに対して、上記過程によって、識別されたキー文字の総数を得る。また、キーワード決定部9により判定を行う際、各標準キーワード辞書におけるキーワード毎に上記識別された総数を算出し、識別されたキー文字の数でキーワードにおけるキー文字の数を割ると識別の比率が得られるので、最大識別比率を有するキーワードが切り出し画像に確実に含まれたものであると判定してもよい。
上記方法を介して、共有画像や文字を含む複数のパターンやファイルによって、その中から共有画像や文字を含む画像を複数切り出し、複数画像に含まれた情報を最上限まで利用することによって、遮蔽、結合などの原因で各画像が完全な共有画像の情報を含んでいないために共有画像を的確に識別できないという技術問題を克服して解決した。しかも、共有キーワードに含まれた各キー文字間の位置関係、各キー文字とキーワードの中心との位置関係によって各キー文字が互いにチェックされるので、的確なキー文字を判定でき、共有画像や文字の識別を効率よく且つ的確に実現できる。
図10は、実施例2の複数の画像における共有画像を識別するためのキーワード識別装置を示すブロック図である。実施例2は、実施例1のキーワード識別装置に比べて、キーワード辞書生成部4とキーワード中心位置推定部5の間にキー文字マッチング対選別部10を更に有する点で相違している。
キーワード中心位置推定部5によってキーワードの中心の位置を推定する投票を行う前に、キー文字マッチング対選別部10でキー文字マッチング対を選別し、位置が重なり、コードが同じであるキー文字マッチング対を削除することで、キーワードの中心の位置を推定するための投票時間を減少させる。
例えば、表1の順番(00と04)と順番(01と05)とから識別された文字は、いずれも「C」と「O」を含み、いずれも表2−2における順番が01であるキー文字組成対「CO」のキー文字マッチング対とされる。ここで、2つのCと2つのOとは位置がそれぞれ重なっているが、重なっている位置に同一な文字が2つ現れることは実際にはあり得ず、的確なマッチング対では位置とコードにおける衝突がありえないので、この2対のうちの1対が間違っていることが分かる。そのため、キー文字マッチング対選別部10はマッチング対における2つのキー文字の識別距離の和が最小であるキー文字マッチング対のみを残す(識別距離が小さければ小さいほど識別結果の信頼性が高い)。
ここで、表1の順番(00と04)における「C」と「O」の識別距離の和の最小値は、順番00における(6つの識別距離の最小値である)5番目層の識別距離793+順番04における1番目層の識別距離920=1713であり、順番(01と05)における「C」と「O」の識別距離の和は694+920=1614である。そのため、キー文字マッチング対選別部10は、順番01と05における「C」と「O」からなるキー文字マッチング対「CO」のみを残し、順番00と04における「C」と「O」からなるキー文字マッチング対「CO」を削除する。
キー文字マッチング対選別部10によって、余計なキーワードマッチング対を削除することで、キーワードの中心の位置を推定する時間を大幅に削減することができるので、キーワード識別に必要な時間を短縮でき、キーワード識別の効率を大幅に向上させることができる。
実施例3では、共有画像に含まれるキーワードを識別する過程は実施例1と実施例2と同じである。異なる点は、共有キーワードを識別する際に入力したファイルが反転している場合、即ち識別される共有キーワードがファイル毎に全部反転している場合、共有キーワードに対しても的確に識別を行うように、文字識別部3は、各可能なキー文字分割セグメントにおける文字に対して表裏連次識別を行う。あるキー文字分割セグメントに含まれる文字が全部反転されていれば(「
Figure 0005240047
」が反転されると「A」である)、文字識別部3は、決定されたあらゆる可能なキー文字分割セグメントにおける文字に対して全部表裏2次識別を行い、キー文字分割セグメントにおける文字に関する識別結果を2組取得して、2組の文字の識別結果をそれぞれキーワード中心位置推定部5に入力し、後続の推定を行う。その後のキー文字抽出の方法は、実施例1および2と同じである。
好ましい実施例3を用いると、ユーザのミスで入れたファイルが上下に反転されている時にも、複数の画像における共有キーワードを的確に識別することができ、例えば機密ファイルをコピーする時も、機密情報漏れを効率的に防止することができる。
本願に開示の技術におけるキーワード識別装置と方法は、スキャナ、プリンタ又は多機能一体機などのデバイスに適用可能であり、当該スキャナ、プリンタ又は多機能一体機などのデバイスは、共有画像又は文字を含む複数の画像又はファイルの中から共有画像又は文字を抽出することができる。ここで、共有の画像又は文字はその中に透かしを嵌めることが可能であり、ファイルを管理し、機密ファイルのコピー、スキャンなどを防止することができる。もちろん、上記キーワードの検出装置と方法は、共有画像又は文字を識別するためのその他の場合に適用することもできる。
また、本申請は共有画像を有するPPTを例として説明したが、もちろん、前述のキーワード識別装置と方法はPPTファイルに限られず、wordファイル、pdfファイル、その他のフォーマットのテキストファイル又は各種の画像フォーマットのファイルに適用して、共有画像又は文字を識別することもできる。
また、本願では「CONFIDENTIAL」というキーワードを例として説明したが、もちろん、前述のキーワード識別装置と方法は、実際運用上の必要に応じて、標準キーワード辞書に複数のキーワードの情報を立てることができる。つまり、キーワードの数は制限されず、実際の場合に応じて選択することができる。それに、上記識別方法は英文キーワードの識別に限られず、中国語、フランス語、ドイツ語、ギリシア語などその他の各種言語の文字の識別にも使われる。
ほかに、もちろん、本願の上記方法による各操作過程は、コンピュータプログラムや各種機械読み取り可能な記憶媒体に格納されるコンピュータの実行可能なプログラムでも実現される。
それに、下記の方式で本願の目的を達すこともできる。上記実行可能なプログラムコードが格納されている記憶媒体を直接又は間接的にシステム或いはデバイスに提供し、当該システム或いはデバイスにあるコンピュータ又はCPUが上記プログラムコードを読み取り実行する。
上記機械読み取り可能な記憶媒体は、各種類のメモリと記憶手段、半導体デバイス、光、磁気、光磁気ディスクなどのような磁気ディスク手段、及び情報の記憶に適するその他の媒体などを含む。しかし、これらに限らない。
それに、コンピュータは、インターネット上の対応サイトと接続され、本願に係るコンピュータプログラムコードをダウンロードし、コンピュータにインストールしてから当該プログラムを実行することで本願に開示の技術を実現することもできる。
図11は、実施例にかかるキーワード識別装置を構成するコンピュータ20のハードウェア構成の一例を示す図である。図11に示すように、このコンピュータ(キーワード識別装置)20は、入力装置21、モニタ22、RAM(Random Access Memory)23、ROM(Read Only Memory)24、ネットワークインターフェース25、記憶媒体から情報を読み取る媒体読取装置26、CPU(Central Processing Unit)27、HDD(Hard Disk Drive)28がバス29で接続されている。
そして、HDD28には、上述したキーワード識別装置の機能と同様の機能を発揮するキーワード識別プログラム28bが記憶されている。CPU27が、キーワード識別プログラム28bを読み出して実行することにより、キーワード識別プロセス27aが起動される。ここで、キーワード識別プロセス27aは、図3に示したST1〜ST9に対応する。
なお、HDD28には、図3に示したST1〜ST9の処理に係る各種データ28aを記憶する。CPU27は、HDD28に記憶された各種データ28aをRAM23に読み出し、各種データ23aを基にしてキーワード識別を実行する。
ところで、図11に示したキーワード識別プログラム28bおよび各種データ28aは、必ずしも最初からHDD28に記憶させておく必要はない。たとえば、情報処置装置としてのコンピュータに挿入されるフレキシブルディスク(FD)、CD−ROM、DVDディスク、光磁気ディスク、ICカードなどの「可搬用の記憶媒体」、または、コンピュータの内外に備えられるハードディスクドライブ(HDD)などの「固定用の記憶媒体」、さらには、公衆回線、インターネット、LAN、WANなどを介してコンピュータに接続される「他のコンピュータ(またはサーバ)」などにキーワード識別プログラム28bを記憶しておき、コンピュータがこれらからキーワード識別プログラム28bおよび各種データ28aを読み出して、キーワード識別プログラム28bを実行するようにしてもよい。
(付記1)共有キーワードを有する複数の画像又はファイルから前記共有キーワードを識別するキーワード識別装置であって、
前記複数の画像又はファイルにおける前記共有キーワードを含む領域の階調値に基づいて2値前景累積図を生成する装置と、
前記2値前景累積図の分割点を決定する分割部と、
前記分割点に基づいてあらゆる可能なキー文字分割セグメントを決定するキー文字分割可能セグメント決定部と、
前記あらゆる可能なキー文字分割セグメントにおける対象に対して文字識別を行って、前記あらゆる可能なキー文字分割セグメントに対応した識別文字を取得する文字識別部と、
標準キーワード辞書に含まれる少なくとも1つの標準キーワードに対して、当該標準キーワードのキー文字組合せ対と、当該キー文字組合せ対に対応した標準キーワードに含まれるキー文字からなり、且つ、前記識別文字に含まれる、前記キー文字組合せ対の文字と同一な文字からなるキー文字マッチング対との間の対応関係によって、前記共有キーワードの中心の位置を推定するキーワード中心位置推定部と、
推定されたキーワードの中心の位置に対応した複数の前記キー文字マッチング対に含まれる識別文字を頂点とし、前記キー文字マッチング対に含まれたキー文字を2つずつ連結してなる図において頂点の数が最も多い最大完全部分グラフに含まれたあらゆる頂点により表されるキー文字を決定する最大完全部分グラフ・キー文字抽出部と、
前記推定されたキーワードの中心の位置と前記最大完全部分グラフ・キー文字抽出部により決定されたキー文字と前記それぞれの標準キーワードとに基づいて、脱落キー文字を決定する脱落キー文字識別部と、
前記推定されたキーワードの中心の位置と、前記最大完全部分グラフ・キー文字抽出部により決定されたキー文字と、前記脱落キー文字識別部により決定された脱落キー文字と、前記標準キーワードとに基づいて、結合キー文字を識別する結合キー文字識別部と、
前記最大完全部分グラフ・キー文字抽出部により決定されたキー文字と、前記前記脱落キー文字識別部により決定された脱落キー文字及び前記結合キー文字識別部により識別された結合キー文字とに基づいて、前記共有キーワードに前記標準キーワード辞書におけるどの標準キーワードを含むかを判定するキーワード決定部と、
を備えたことを特徴とするキーワード識別装置。
(付記2)前記キーワード中心位置推定部により前記共有キーワードの中心の位置を推定する前に、同一の文字からなり、位置が重なる複数のキー文字マッチング対においてキー文字識別距離の和が最小でないキー文字マッチング対を削除するキー文字マッチング対選別部を更に備えたことを特徴とする付記1に記載のキーワード識別装置。
(付記3)前記標準キーワードに含まれるあらゆるキー文字の2つずつの組合せから前記キー文字組合せ対を構成する標準キーワード辞書生成部を更に備えたことを特徴とする付記1又は2に記載のキーワード識別装置。
(付記4)前記分割部は継承可能な分割方法によって前記可能なキー文字分割セグメントを決定することを特徴とする付記1又は2に記載のキーワード識別装置。
(付記5)前記キーワード中心位置推定部は、前記キー文字組合せ対におけるキー文字間の距離と当該キー文字組合せ対に対応した前記キー文字マッチング対における文字間の距離との対応比例関係、及び前記キー文字組合せ対における少なくとも1つのキー文字から前記それぞれの標準キーワードの中心までの距離によって、前記共有キーワードの中心の位置を推定することを特徴とする付記1又は2に記載のキーワード識別装置。
(付記6)コンピュータが共有キーワードを有する複数の画像又はファイルから前記共有キーワードを識別するキーワード識別方法であって、
前記コンピュータが、
前記複数の画像又はファイルにおける前記共有キーワードを含む領域の階調値に基づいて2値前景累積図を生成するステップと、
前記2値前景累積図に基づいて当該2値前景累積図の分割点を決定し、可能なキー文字分割セグメントを決定するステップと、
あらゆる前記可能なキー文字分割セグメントに対して文字識別を行って、当該あらゆる可能なキー文字分割セグメントに対応した識別文字を取得するステップと、
標準キーワード辞書に含まれる少なくとも1つの標準キーワードに対して、当該標準キーワードのキー文字組合せ対と、当該キー文字組合せ対に対応した標準キーワードに含まれるキー文字からなり、且つ、前記識別文字に含まれる前記キー文字組合せ対の文字と同一な文字からなるキー文字マッチング対との間の対応関係によって、前記共有キーワードの中心の位置を推定するステップと、
推定されたキーワードの中心の位置に対応した複数の前記キー文字マッチング対に含まれる識別文字を頂点とし、前記キー文字マッチング対に含まれたキー文字を2つずつ連結してなる図において頂点の数が最も多い最大完全部分グラフに含まれたあらゆる頂点により表されるキー文字を決定するステップと、
前記推定されたキーワードの中心の位置と決定された前記キー文字と前記標準キーワードとに基づいて、脱落キー文字を決定するステップと、
前記推定されたキーワードの中心の位置と決定された前記キー文字と決定された前記脱落キー文字と前記標準キーワードとに基づいて、結合キー文字を識別するステップと、
前記標準キーワードに対して識別された、決定された前記キー文字と、決定された前記脱落キー文字及び結合キー文字とに基づいて、前記共有キーワードがどの標準キーワードを含むかを判定するステップと、
を含んだことを特徴とするキーワード識別方法。
(付記7)前記コンピュータは、前記共有キーワードの中心の位置を推定する前に、同一の文字からなり、位置が重なる複数の前記キー文字マッチング対においてキー文字識別距離の和が最小でないキー文字マッチング対を削除することを特徴とする付記6に記載のキーワード識別方法。
(付記8)前記コンピュータは、前記標準キーワードに含まれるあらゆるキー文字の2つずつの組合せから前記キー文字組合せ対を構成することを特徴とする付記6又は7に記載のキーワード識別方法。
(付記9)前記コンピュータは、継承可能な分割方法によって前記可能なキー文字分割セグメントを決定することを特徴とする付記6又は7に記載のキーワード識別方法。
(付記10)前記コンピュータは、前記キー文字組合せ対におけるキー文字間の距離と当該キー文字組合せ対に対応した前記キー文字マッチング対における文字間の距離との対応比例関係、及び前記キー文字組合せ対における少なくとも1つのキー文字から前記標準キーワードの中心までの距離によって、共有キーワードの中心の位置を推定することを特徴とする付記6又は7に記載のキーワード識別方法。
1 分割部
2 キー文字分割可能セグメント決定部
3 文字識別部
4 キーワード辞書生成部
5 キーワード中心位置推定部
6 最大完全部分グラフ・キー文字抽出部
7 脱落キー文字識別部
8 結合キー文字識別部
9 キーワード決定部
10 キー文字マッチング対選別部
20 コンピュータ
21 入力装置
22 モニタ
23 RAM
24 ROM
25 ネットワークインターフェース
26 記憶媒体から情報を読み取る媒体読取装置
27 CPU
28 HDD
29 バス

Claims (6)

  1. 共有キーワードを有する複数の画像又はファイルから前記共有キーワードを識別するキーワード識別装置であって、
    前記複数の画像又はファイルにおける前記共有キーワードを含む領域の階調値に基づいて2値前景累積図を生成する装置と、
    前記2値前景累積図の分割点を決定する分割部と、
    前記分割点に基づいてあらゆる可能なキー文字分割セグメントを決定するキー文字分割可能セグメント決定部と、
    前記あらゆる可能なキー文字分割セグメントにおける対象に対して文字識別を行って、前記あらゆる可能なキー文字分割セグメントに対応した識別文字を取得する文字識別部と、
    標準キーワード辞書に含まれる少なくとも1つの標準キーワードに対して、当該標準キーワードのキー文字組合せ対と、当該キー文字組合せ対に対応した標準キーワードに含まれるキー文字からなり、且つ、前記識別文字に含まれる、前記キー文字組合せ対の文字と同一な文字からなるキー文字マッチング対との間の対応関係によって、前記共有キーワードの中心の位置を推定するキーワード中心位置推定部と、
    推定されたキーワードの中心の位置に対応した複数の前記キー文字マッチング対に含まれる識別文字を頂点とし、前記キー文字マッチング対に含まれたキー文字を2つずつ連結してなる図において頂点の数が最も多い最大完全部分グラフに含まれたあらゆる頂点により表されるキー文字を決定する最大完全部分グラフ・キー文字抽出部と、
    前記推定されたキーワードの中心の位置と前記最大完全部分グラフ・キー文字抽出部により決定されたキー文字と前記それぞれの標準キーワードとに基づいて、脱落キー文字を決定する脱落キー文字識別部と、
    前記推定されたキーワードの中心の位置と、前記最大完全部分グラフ・キー文字抽出部により決定されたキー文字と、前記脱落キー文字識別部により決定された脱落キー文字と、前記標準キーワードとに基づいて、結合キー文字を識別する結合キー文字識別部と、
    前記最大完全部分グラフ・キー文字抽出部により決定されたキー文字と、前記前記脱落キー文字識別部により決定された脱落キー文字及び前記結合キー文字識別部により識別された結合キー文字とに基づいて、前記共有キーワードに前記標準キーワード辞書におけるどの標準キーワードを含むかを判定するキーワード決定部と、
    を備えたことを特徴とするキーワード識別装置。
  2. 前記キーワード中心位置推定部により前記共有キーワードの中心の位置を推定する前に、同一の文字からなり、位置が重なる複数のキー文字マッチング対においてキー文字識別距離の和が最小でないキー文字マッチング対を削除するキー文字マッチング対選別部を更に備えたことを特徴とする請求項1に記載のキーワード識別装置。
  3. 前記標準キーワードに含まれるあらゆるキー文字の2つずつの組合せから前記キー文字組合せ対を構成する標準キーワード辞書生成部を更に備えたことを特徴とする請求項1又は2に記載のキーワード識別装置。
  4. 前記分割部は継承可能な分割方法によって前記可能なキー文字分割セグメントを決定することを特徴とする請求項1又は2に記載のキーワード識別装置。
  5. 前記キーワード中心位置推定部は、前記キー文字組合せ対におけるキー文字間の距離と当該キー文字組合せ対に対応した前記キー文字マッチング対における文字間の距離との対応比例関係、及び前記キー文字組合せ対における少なくとも1つのキー文字から前記それぞれの標準キーワードの中心までの距離によって、前記共有キーワードの中心の位置を推定することを特徴とする請求項1又は2に記載のキーワード識別装置。
  6. コンピュータが共有キーワードを有する複数の画像又はファイルから前記共有キーワードを識別するキーワード識別方法であって、
    前記コンピュータが、
    前記複数の画像又はファイルにおける前記共有キーワードを含む領域の階調値に基づいて2値前景累積図を生成するステップと、
    前記2値前景累積図に基づいて当該2値前景累積図の分割点を決定し、可能なキー文字分割セグメントを決定するステップと、
    あらゆる前記可能なキー文字分割セグメントに対して文字識別を行って、当該あらゆる可能なキー文字分割セグメントに対応した識別文字を取得するステップと、
    標準キーワード辞書に含まれる少なくとも1つの標準キーワードに対して、当該標準キーワードのキー文字組合せ対と、当該キー文字組合せ対に対応した標準キーワードに含まれるキー文字からなり、且つ、前記識別文字に含まれる前記キー文字組合せ対の文字と同一な文字からなるキー文字マッチング対との間の対応関係によって、前記共有キーワードの中心の位置を推定するステップと、
    推定されたキーワードの中心の位置に対応した複数の前記キー文字マッチング対に含まれる識別文字を頂点とし、前記キー文字マッチング対に含まれたキー文字を2つずつ連結してなる図において頂点の数が最も多い最大完全部分グラフに含まれたあらゆる頂点により表されるキー文字を決定するステップと、
    前記推定されたキーワードの中心の位置と決定された前記キー文字と前記標準キーワードとに基づいて、脱落キー文字を決定するステップと、
    前記推定されたキーワードの中心の位置と決定された前記キー文字と決定された前記脱落キー文字と前記標準キーワードとに基づいて、結合キー文字を識別するステップと、
    前記標準キーワードに対して識別された、決定された前記キー文字と、決定された前記脱落キー文字及び結合キー文字とに基づいて、前記共有キーワードがどの標準キーワードを含むかを判定するステップと、
    を含んだことを特徴とするキーワード識別方法。
JP2009106923A 2008-04-28 2009-04-24 キーワード識別方法及装置 Expired - Fee Related JP5240047B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2008100912990A CN101571921B (zh) 2008-04-28 2008-04-28 关键字识别方法和装置
CN200810091299.0 2008-04-28

Publications (2)

Publication Number Publication Date
JP2009266232A JP2009266232A (ja) 2009-11-12
JP5240047B2 true JP5240047B2 (ja) 2013-07-17

Family

ID=41231276

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009106923A Expired - Fee Related JP5240047B2 (ja) 2008-04-28 2009-04-24 キーワード識別方法及装置

Country Status (2)

Country Link
JP (1) JP5240047B2 (ja)
CN (1) CN101571921B (ja)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5647919B2 (ja) * 2011-03-07 2015-01-07 株式会社Nttドコモ 文字認識装置、文字認識方法、文字認識システム、および文字認識プログラム
US8331670B2 (en) * 2011-03-22 2012-12-11 Konica Minolta Laboratory U.S.A., Inc. Method of detection document alteration by comparing characters using shape features of characters
US9087039B2 (en) * 2012-02-07 2015-07-21 Microsoft Technology Licensing, Llc Language independent probabilistic content matching
CN103577414B (zh) * 2012-07-20 2017-04-12 富士通株式会社 数据处理方法和设备
CN103345481B (zh) * 2013-06-19 2016-08-24 新疆大学 一种维吾尔文图像文件的标注方法
CN103886096A (zh) * 2014-04-03 2014-06-25 江苏物联网研究发展中心 基于图片的远程虫害识别方法
JP6342298B2 (ja) * 2014-10-31 2018-06-13 株式会社東芝 文字認識装置、画像表示装置、画像検索装置、文字認識方法およびプログラム
JP6341059B2 (ja) * 2014-10-31 2018-06-13 オムロン株式会社 文字認識装置、文字認識方法、およびプログラム
CN106202086B (zh) * 2015-05-04 2020-02-28 阿里巴巴集团控股有限公司 一种图片处理、获取方法、装置及系统
WO2016187888A1 (zh) * 2015-05-28 2016-12-01 北京旷视科技有限公司 基于字符识别的关键词通知方法及设备、计算机程序产品
CN106485246B (zh) * 2016-09-19 2019-07-16 北京小米移动软件有限公司 字符识别方法及装置
CN106586135B (zh) * 2016-12-28 2018-09-18 天津普达软件技术有限公司 一种产品包装盒生产日期喷印不良品剔除方法
CN106682671A (zh) * 2016-12-29 2017-05-17 成都数联铭品科技有限公司 图像文字识别系统
US10311874B2 (en) 2017-09-01 2019-06-04 4Q Catalyst, LLC Methods and systems for voice-based programming of a voice-controlled device
CN107766826B (zh) * 2017-10-30 2020-11-03 广东小天才科技有限公司 一种查找单词释义的方法及电子设备
CN108540629B (zh) * 2018-04-20 2020-10-27 蚌埠翰邦知识产权服务有限公司 一种儿童用终端保护外壳
CN110059572B (zh) * 2019-03-22 2021-08-10 中国科学院自动化研究所 基于单字匹配的文档图像中文关键词检测方法、系统
CN113191343A (zh) * 2021-03-31 2021-07-30 成都飞机工业(集团)有限责任公司 一种基于卷积神经网络的航空线材识别码自动识别方法
CN113657330B (zh) * 2021-08-24 2024-02-09 深圳市快易典教育科技有限公司 一种字体书写笔顺生成方法、系统及其应用方法
CN116072274B (zh) * 2023-03-06 2023-06-13 四川互慧软件有限公司 一种救护车医护自动调派系统

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03218567A (ja) * 1989-09-11 1991-09-26 Oki Electric Ind Co Ltd 電子辞書
US5850476A (en) * 1995-12-14 1998-12-15 Xerox Corporation Automatic method of identifying drop words in a document image without performing character recognition
JP3692018B2 (ja) * 2000-01-24 2005-09-07 株式会社東芝 テロップ情報処理装置
JP4136316B2 (ja) * 2001-01-24 2008-08-20 富士通株式会社 文字列認識装置
CN100478979C (zh) * 2002-11-26 2009-04-15 中国科学院计算技术研究所 利用身材信息辅助人脸信息的身份识别方法
CN100485711C (zh) * 2003-05-16 2009-05-06 中国地质大学(武汉) 手写字体的计算机识别与自动输入方法
JP4294456B2 (ja) * 2003-12-08 2009-07-15 株式会社リコー 特定キャラクタ列検索装置、特定キャラクタ列検索方法、特定キャラクタ列検索プログラム、および記録媒体

Also Published As

Publication number Publication date
JP2009266232A (ja) 2009-11-12
CN101571921B (zh) 2012-07-25
CN101571921A (zh) 2009-11-04

Similar Documents

Publication Publication Date Title
JP5240047B2 (ja) キーワード識別方法及装置
JP3308032B2 (ja) スキュー補正方法およびスキュー角検出方法およびスキュー補正装置およびスキュー角検出装置
US8351691B2 (en) Object extraction in colour compound documents
Bhowmick et al. Fast polygonal approximation of digital curves using relaxed straightness properties
US10885325B2 (en) Information processing apparatus, control method, and storage medium
JPH08305803A (ja) 文字テンプレートセット学習マシン動作方法
JP3943638B2 (ja) Ocrを利用しない文書画像中のドロップワードの自動認識方法
US8418050B2 (en) Computer readable recording medium on which form data extracting program is recorded, form data extracting apparatus, and form data extracting method
US20090041361A1 (en) Character recognition apparatus, character recognition method, and computer product
KR20100035108A (ko) 화상 처리 장치, 화상 처리 방법 및 프로그램을 기억하는 컴퓨터 판독 기억 매체
JPH09179937A (ja) 文書画像のセンテンスの境界の自動識別方法
CN105719243A (zh) 图像处理装置和方法
US20150055866A1 (en) Optical character recognition by iterative re-segmentation of text images using high-level cues
US8787702B1 (en) Methods and apparatus for determining and/or modifying image orientation
JP4977232B2 (ja) 文字読取結果確認装置および文字読取結果確認方法
US20130050765A1 (en) Method and apparatus for document authentication using image comparison on a block-by-block basis
RU2597163C2 (ru) Сравнение документов с использованием достоверного источника
EP3151159A1 (en) Information processing apparatus, information processing method and program
JP4706764B2 (ja) 画像処理装置及び画像処理プログラム
JP2018055256A (ja) 情報処理装置、情報処理方法及びプログラム
US9437020B2 (en) System and method to check the correct rendering of a font
EP2416281A2 (en) Font matching
US11611678B2 (en) Image processing apparatus and non-transitory computer readable medium
JP2020047138A (ja) 情報処理装置
US20220406083A1 (en) Image processing apparatus, control method thereof, and storage medium

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20111205

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130226

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130305

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130318

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160412

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees