JP3781810B2 - 走査面の記号注釈領域のセグメント化方法 - Google Patents

走査面の記号注釈領域のセグメント化方法 Download PDF

Info

Publication number
JP3781810B2
JP3781810B2 JP22507195A JP22507195A JP3781810B2 JP 3781810 B2 JP3781810 B2 JP 3781810B2 JP 22507195 A JP22507195 A JP 22507195A JP 22507195 A JP22507195 A JP 22507195A JP 3781810 B2 JP3781810 B2 JP 3781810B2
Authority
JP
Japan
Prior art keywords
token
image
line
board
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP22507195A
Other languages
English (en)
Other versions
JPH08101883A (ja
Inventor
サウンド エリック
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xerox Corp
Original Assignee
Xerox Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xerox Corp filed Critical Xerox Corp
Publication of JPH08101883A publication Critical patent/JPH08101883A/ja
Application granted granted Critical
Publication of JP3781810B2 publication Critical patent/JP3781810B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Processing Or Creating Images (AREA)
  • Digital Computer Display Output (AREA)
  • Character Discrimination (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、画像におけるテキスト領域をセグメント化するための画像分析技法に係り、詳細には、特定のテキストラインに文字を構成する、ストローク又はトークンを分離することに関する。
【0002】
【従来の技術】
協同で作業する状況において、表示された情報の視認と操作を同時に行なうことをたびたび要求するユーザは少なくない。ホワイトボード及びブラックボード(以下「ボード」と称する)は、「壁サイズ」の表面の手書きの文書画像と図形画像を維持するために広く使用されている。ボード媒体は種々の対話式作業を容易にする一定の特性を供与する。即ち、マーキングは複数の人間によって視認されるのに十分な大きさのものであること、マーキングは消去及び書き直しによって編集可能であること、表面は静止しているために、見失ったり、しわが寄ったり、破れたり、又は風で吹き飛ばされることがないこと、表面は容易に消去され、完全に再利用可能であり、(実質的には)磨滅しない。しかしながら、ボードの使用に対する一つの問題点は、情報が他の媒体に容易に転送されないことである。従って、現時点では、ボード上の文書及び図形における対話の記録を維持し且つその記録を用紙又は他の携帯及び記憶可能な媒体に対し迅速、簡単、且つ自動的に転写しながら、任意の相手との対話を保持することは不可能である。
【0003】
この作業を実行するための既存の方法は手間がかかり、時間を浪費し、且つ不便なものである。その一つは、ボード上に存在する文書及び図形の一部又は全部を手書きにより用紙上に転記できるにすぎない。これは多くの時間を要し、人間が読み書きする際の間違いからエラーを被ることがある。あるいは、カメラでボードを写真に撮ることもできる。これはカメラを手近に置く必要があり、フィルムを現像することによる遅延を生じ、「インスタント」カメラを用いると費用が高くなる可能性があり、不正確な焦点及び露出によって品質の低い表現になりやすい。カメラはさらに、通常では読み取り難い非常に縮小されたサイズの画像を生成する。
【0004】
あるいはまた、ポスターパッド等の「壁サイズ」の用紙によって、書かれたものについての比較的永久性であり且つ携帯可能な記録が可能となるが、これらの用紙は大型且つ取り扱い難く、画像生成中は消去することができない。
【0005】
コピー−ボード装置はハードコピー用紙に転記可能な書き込み面を提供するが、これらは現在では、てこ装置を有する組み込み式ボードにとって代わる見やすい携帯用のホワイトボードとして考えられる。
【0006】
上述した解決法には、画像をボードから電子的に使用可能な形式に転写することを補助するものはない。
【0007】
同時出願されたアメリカ特許出願(アメリカ特許出願第08/303、918号)では、ボード上のマークを電子形式に転記するための動機づけと特定の技術的詳細を示している。要約すると、ビデオカメラはパン/チルト(pan/tilt)ヘッドに取り付けられる。高解像度タイルは画像のパッチ上にカメラをズーム−インすることによって得られる。これらは後でつなぎ合わされてフルサイズの高解像度複合画像を形成する。透視歪み、均等でない照明の影響、及びタイルの重複部分(オーバーラップ)は画像処理操作によって処理される。
【0008】
このような転記(転写)装置は、ボード画像の電子バージョンが画像データの更なる使用において多様性と柔軟性を付与することから、有用である。例えば、電子画像はハードコピー化されたり、ファクシミリで電送されたり、ファイルに記憶されたり、電子ワークステーションに転送されるか又はスクリーン上に投射される。さらに、これらの操作の前に、画像自体は処理されて、例えば、画像の領域を正確に選び出し、特定の色を正しく選択し、ラインワークを強化もしくは修正したり、リスト内の項目を再順序付けするなどの作業を行なう。
【0009】
ボード画像を転記するための基本的能力によって利用可能とされる多数の操作によって、制御の問題、即ち、ユーザが実行すべき操作をどのような方法で、また何時、指定するか、が提起される。本出願と同時出願のアメリカ特許出願(アメリカ特許出願第08/303、929号)では、シームレス(継ぎ目なし)生成、捕捉、及び、ホワイトボード上で生ずる画像の電子的に調停された使用のための動機づけと特定の技術的詳細が示されている。ユーザインターフェースはボード自体にユーザによって描画されたマークから構成されることになる。例えば、最も簡単な事例では、ユーザは特別な「ボタン」記号を描画し、次に、ボタンが「押される」時に内部にチェックマークを描画する。ボタン記号に更なる指令の注釈を付けることによって機能性の向上が達成される。
【0010】
既述されたインターフェースによって、ユーザがこの図式方法でシステムと通信する方法に関しての知識を有する必要がなくなるわけではない。但し、この知識はさらに理解しやすいものであり、多くのボードユーザによって制御パネル又はコンピュータコンソールベースのインターフェースよりもさらに容易に同化されることができる。
【0011】
図式インターフェースはボード上に描画する際にユーザの既存の技能を利用し、さらに、基本の機能性に対して非常に簡単なアクセスを付与し、より大きな機能性を微調整するのに必要とされるさらに高い図式複雑性を増分的に導入することができる。最後に、ボード自体に描出されたマークから成る図式インターフェースは、画像の領域を抽出する等の空間的な制御指令を提供することに対して最適である。
【0012】
ボード転記システムに対する図式ユーザインターフェースは、ボード上のマークを首尾よく解釈するためにコンピュータプログラムの能力しだいで決まる。
【0013】
本発明は、ワード及びラインレベルで手書きのテキストのセグメント化を支援するコンピュータビジョン技法の新しい適用について説明する。本発明は手書きテキストの認識を実行するものではないが、セグメント化されたテキストはビットマップとして抽出されて、補助認識モジュールに送られる。ここで示される技法によって、手書き図式の機械解釈における頑強性の程度は当該分野で既に実証されている方法よりも大きくなる。
【0014】
【発明が解決しようとする課題】
本発明の目的は、走査された画像におけるテキストラインを分離することである。これらテキストラインは、いつでもボード上の任意の位置に描画できる画像から形成され、ボードから制御操作を選択するための方法を提供する。
【0015】
【課題を解決するための手段】
本発明は、走査された画像の手書きのテキスト領域をセグメント化するための方法を提供する。同方法は文字の一部を表わす第1のトークンを検出し、そこからライン高さ及び位置を決定する。第2のトークンが検出されると、そのライン高さ及び位置が決定される。第2のトークンの位置がライン位置に対し十分に類似したものである場合、第2のトークンはライン文字として受け取られ、新しいライン高さ及び位置が受け取られたライン文字のすべてに基づいて決定される。
【0016】
本発明の一態様は、走査面の記号注釈領域をセグメント化するための方法であって、記号注釈領域の開始点を決定し、前記記号注釈領域開始点に近接する候補トークンを決定し、前記開始点の右側にある第1のトークンを決定し、前記第1のトークンのガウス分布を計算することを有するとともに、前記ガウス分布の分散は前記記号注釈領域の平均高さを表わし、平均は前記記号注釈領域の垂直位置を表わし、残りのすべての候補トークンについて、次の右側の候補トークンを決定し、平均を計算することを含む、前記次の候補トークンのガウス分布を計算し、前記次の候補トークンの前記平均が前記ラインの前記平均の受容可能な分散範囲内にある場合、前記次の候補トークンを前記ラインの一部として受容し、前記ラインの新しいガウス分布を計算するために前記次の候補トークンを前記ラインと結合することを有する。
【0017】
本発明の別の態様は、前記態様の走査面の記号注釈領域のセグメント化方法において、前記トークン位置が前記ラインの前記平均と十分には類似していないが、前記ラインの前記平均の中間範囲内にあるとされる各候補トークンについて、前記候補トークンは前記ラインの一部として受容されて、前記ラインの新しいガウス分布を計算するために前記次の候補トークンを前記ラインと結合することを特徴とする。
【0018】
【発明の実施の形態】
A.概念的フレームワーク
以下の概念的フレームワークは、本発明の広範囲の領域を理解するのに有用であり、以下に定義される用語は、請求項を含む本発明の明細書にわたって指示される意味を有する。この概念的フレームワークは、以下の係属中、且つ参照によってここに組み込まれ、本出願と同時に譲渡された2件のアメリカ特許出願(アメリカ特許出願第08/303、918号及び同第08/303、929号)に示された修正及び拡張である。
【0019】
B.概略システム説明
図1は、本発明の技術が用いられる一般的ボード走査システム50を示している。ここに述べられる技術がまた、さらに他のタイプのシステムにも利用できることは明らかである。例えば、ここに述べられた技術を用いて、ペーパーベースのユーザインターフェースにおいて用紙上のマークを介して制御コマンドを解釈することもできる。さらに、本技法をペンベースの計算システムに対するコマンド入口インターフェースとして使用することもできる。しかしながら、これについての説明は主として後述されるボード走査システムの項目でなされる。
【0020】
図1と図2のシステムの特徴及び操作についての更なる詳細は、先に示された係属中且つ同時譲渡されたアメリカ特許出願第08/303、918号に示される。
【0021】
ボード52はユーザ51からのマーキングを受け取る。カメラサブシステム54はボードの1つの又は複数の画像を捕捉し、それ(ら)はネットワーク58を介してコンピュータ56に供給される。一般に、ビデオカメラ等の電子カメラの解像度は、ボード上のマーキングをはっきりと識別するために十分な細部描写を備えた全体のボード画像を捕捉するには不十分である。このため、「画像タイル(image tile)」と呼ばれる、ボード上のより小さなサブ領域の数個のズーム・イン画像は個別に捕捉され、さらに結合されなければならない。
【0022】
カメラサブシステム54は、コンピュータ制御パン/チルト(pan/tilt)ヘッド55に取り付けられ、画像捕捉コマンドが実行されると、プログラム制御のもとで種々のサブ領域で順次方向付けされる。あるいは、カメラサブシステム54は、固定式カメラのアレイを有し、これらカメラはそれぞれ異なるサブ領域(単数又は複数)に向けられる。説明の便宜上、カメラサブシステム54は単にカメラ54と称する。
【0023】
「生」画像タイルは概して互いに重なり合うものであり、カメラの軸視点からはずれて見るために透視による歪みを含み、また、未制御の照明条件と反射によって、前景(書き込みマーク)と背景(未表記のボード)との間のボードにわたって不均等な明るさレベルを含む。図2のフローチャートは、上述した影響に対する補償を含む、走査画像セクションの集合からボードの2値表現(描写)を生成するための一般的な方法を示している。ステップ100では、走査画像セクションは「タイル」として捕捉される。各タイルは、例えば54で示されるカメラによって走査されたボード画像の一部である。ボードは一連のタイルとして捕捉される。これらタイルは隣接したタイルとわずかに重なり合っているので、全体の画像は「欠落した」空間をあけずに走査される。各タイルの位置は、タイルが走査されるとパン/チルトヘッド上のカメラの位置と方向から識別される。タイルが「生画像」又は「カメラ画像」タイルとして説明することもできるのは、これらタイルをディジタル画像において解釈したり又は正確に位置付けるようにタイルに対し何ら処理が施されていないからである。ステップ102ではセンタ・サラウンド(中心囲み)処理が各カメラ画像タイル上に実行される。センタ・サラウンド処理はタイル間及びタイル内における明るさのばらつきを補償する。
【0024】
ステップ104では重なり合ったタイルにおける対応「ランドマーク(landmark:境界標)」が得られる。「ランドマーク」はボード上のマークとして説明され、隣接したタイルの正確な配向及び重なり位置を提供するために使用することができる。2つのタイル間のオーバーラップ領域に出現するランドマークを用いることにより、これら2つのタイルを整合させて画像を再構築することになる。
【0025】
ステップ106は、全体的なランドマーク不整合(不一致)関数を最適化する透視歪み修正の問題を解決する。このステップは、画像内のタイル位置の推測航法(推測一決定法:dead reckoning)において生じるエラーを修正する。変換は前のステップで得られた、各ランドマークの位置の信頼性によって重み付けされる。ステップ108は、ステップ106において決定された透視変換を用いてすべてのタイルに関して透視修正を実行する。
【0026】
ステップ110では、すべてのタイルについての修正されたデータはグレイレベルボード表現(描画)画像内に書き込まれる。ステップ112では、このグレイレベル画像はしきい値処理されて、ボード画像の2値の電子的操作可能な表現を生成する。
【0027】
以下の説明において、ボード画像をディジタル画像に変換する実際のステップを既述したように実行すべきものと想定する。
【0028】
C.一般的特徴及びアーキテクチャー概観
図3及び図4は本発明の適用について示している。ここで説明されるコマンド機能に関する更なる詳細は、先に参照されたアメリカ特許出願第08/303、929号に示されている。
【0029】
図3はボード画像150を示し、2つの「入れ子形」正方形、即ち、一つの正方形が他のすぐ内側にあるもの、から構成される手書きのボタンを有する。これは、NESTED−BOX−BUTTON(入れ子形−ボックス−ボタン)、又はNBB158と称される。ボタン内に「x」又はチェックマークを描画することによって、そのボタンを「選択」する。NBB158は、ハードコピーがプリンタ「デイリープラネット」に送信され、「test.im 」と称される画像ファイルが記憶されて、赤と青の色のみが転記されるように指示する記号テキスト注釈に導かれるラインを示している。
【0030】
図4は画像160を示しており、アーノルド・ロベル(Arnold Lobel)による「フロッグ、ヒキガエルと一緒(Frog and Toad Together)」(1972年、HarperCollins Publishers)の「リスト(A list)」の一部である。画像160は、NBB164によって選択された、テキストのラインを有する領域162を有する。
【0031】
図5は、本発明を支援する全体の機能体系180を示している。画像182の内容についての情報は、スケール−スペースブラックボード(SSB)データ構造184に存在する記号トークンとして維持される。これらの記号トークンは空間分析手順186の資源としての働きをし、時には新しいトークンをボードデータ構造に寄与することもある。トップレベルでは、タスク制御モジュール190は空間分析手順186を指示して、画像182に関する情報を収集し、即時タスクに関する画像の態様の記述を構築する。
【0032】
スケール・スペースブラックボードデータ構造184は、空間的位置及びスケールに基づいて記号トークンの指標付けを行なうことによって空間的及び幾何学的計算を容易にする。これらのトークンは、曲線、角(コーナー)、入れ子形ボックス、文字等の発生などの、抽象画像事象のコンパクトな記号記述子である。SSBデータ構造184は、E. Saundによる「2次元スケール・スペース画像の記号構築」(IEEE TPAMI, V.12 No.8, August 1990)にさらに記載されている。便宜上、実際に数個のSSBデータ構造は、それぞれが種々の処理ステージを表わす異なる種類の情報を保持するように維持される。
【0033】
大型且つ拡張可能な視覚機能ライブラリ188は、空間分析手順186に関連して維持され、新しいトークンをSSB上に置くことによって明確にラベル付け可能なプロトタイプの空間事象の知識ベースを備えている。これらの空間分析手順は、コマンド記号を認識し、曲線経路をトレースし、さらに手書きのテキストのラインをセグメント化する主な画像分析作業の基礎となっている。
【0034】
トップレベルのタスク制御モジュール190は、特定の図式ユーザインターフェース仕様に対して定義されるタスク実行戦略に従って空間分析手順186の適用を指示する。タスク制御モジュール190には、一時記憶の空間焦点キャッシュ192が対応付けられ、これは処理資源が利用可能になると調査を詳細に要求する画像の位置に関する情報と同様に、どのボタンボックス又は他のタスクレベル目的が画像内にあると考えられるかについての状態を維持する。
【0035】
D.処理技法
以下に示す説明と図面は、トークンを識別し、曲線とコーナーをトレースして、手書きのテキストラインをセグメントに別けて、上述したようにタスク制御の方法を実行するために使用することのできる画像処理技法を示している。
【0036】
1.基本曲線処理
最も基本の形のトークンはPRIMITIVE−CURVE−FRAGMENT(基本曲線フラグメント)と称され、内部の接合部や他の曲線との交差のない曲線の比較的直線的な部分を表わしている。図6に示されるステップを用いて曲線フラグメントを識別する。
【0037】
ステップ200はまず、形態の浸食、即ち、コンピュータビジョンの専門家には周知の技術を用いて描画のラインを細くする。ステップ202は、3×3画素の接合形状を表わすマスクを備えた形態のヒット−ミス変換を用いて曲線接合部を検出する。
【0038】
ステップ204は、コンピュータビジョン分野で周知の多くの曲線トレース方法の一つを用いて、接合部間の曲線をトレースする。ステップ206は曲線上のコーナーを検出する。これを実施するための技法はコンピュータビジョン分野においても利用できる。
【0039】
ステップ208はコーナーにおける曲線を中断させて、PRIMITIVE−CURVE−FRAGMENT形のトークンとしてラベル付けされる基本のフラグメントを残し、これらはSSBデータ構造上に書き込まれる。
【0040】
これらの処理工程は、係属中且つ同時譲渡されたSaund他によるアメリカ特許出願第101、646号の「グラフィックスシステムにおける多重構造解釈を動的に維持するための方法」に記載されている。
【0041】
2.手書きテキストのセグメント化
図式ユーザインターフェースにおける手書きテキストの使用は画像分析の2つの下位の問題を伴なう。まず、関連テキスト指示は識別されて、ボード上の他のマーキングからセグメント化される必要があり、次に、そのテキストを認識する必要がある。本発明はこれら下位の問題の第1のものを解決するための手段を付与する。
【0042】
コマンド記号と曲線トレースとの組み合わせによって、テキストのラインの始めである画像の位置を識別することになる。また、テキストセグメント化はテキストを含む画像の領域を画定する。これは、アセンダ及びディセンダが現在行の上下の行に拡張する場合、また、テキストラインが水平ラインによって明確に分離できないようにテキストが高さ方向に変化する場合に、困難である可能性がある。
【0043】
この技法は図7に示されるように説明される。図7はNBB400に対応付けられる単純コマンド構造を示している。種々のトレース方法を使用して、テキストが求められるとするポイント402を識別することもできる。ポイント402から開始すると、テキストラインを形成するトークンの固結性クラスタリングを実行することができる。テキストのセグメント化は、垂直位置ならびに範囲が、ラインの垂直位置ならびに範囲の現在推定にほぼ一致されるトークンのみを受け入れるテキストラインに沿って左から右へトークンを蓄積することに基づいて行なわれる。
【0044】
エラーバー404と406はラインの現在高さの推定を示している。この現在高さは、次の文字を受け入れるべきか否かを決定するためのパラメータとして使用される。これは、ラインの進行とともに書き込みが小さくなったり大きくなったりするラインの受取りの際に有用である。例えば、ライン408上のテキストは、画像の境界に接近するにつれてさらに小さくなる。本発明の技法は、ラインがどこにあるか、また、ラインがその距離に沿って各地点でどの程度の大きさであるかをトレースし続ける。各文字は、前のシステムにおいて実行されたように、第1の文字を推定してその第1の文字とラインの残りの文字と比較することよりもむしろその直後の文字と比較される。さらに、例えば、ライン410にあるように、手書き画像の別の共通問題を堆積させる傾向があるので、テキストに追随するようにセグメント化の実行が可能である。
【0045】
図8のフローチャートは、適応固結性トークンクラスタリングに基づいたテキストセグメント化のステップを提供する。ステップ378は、テキストライン領域の初期開始位置の決定を要求する。これは、先に参照されたアメリカ特許出願第08/303、929号に示されたステップを介しての多数の方法によって決定することもできる。
【0046】
ステップ380では、初期の位置に基づいて、ライン垂直位置及び垂直範囲の初期推定が形成される。これらは、その平均が垂直位置であり且つ分散が垂直範囲であるガウス分布として決定される。例えば、図9において、初期トークン471は平均472と分散474を有する。
【0047】
ステップ382は、初期の水平位置の近傍及びその右側にPRIMITIVE−CURVE−FRAGMENTトークンを収集する。これらトークンはステップ384において左から右に分類されて、「候補」トークンと称される。ステップ386における各候補トークンについて、各候補トークンの垂直位置及び垂直範囲は、ステップ390において現在推定ライン垂直位置及び垂直範囲と比較される。
【0048】
ステップ392においてそのトークンがしきい値垂直位置内にある場合、このトークンはステップ398においてラインの一部として受け入れられ、ステップ399においてライン推定垂直位置及び垂直範囲はガウス平均と分散を組み合わせるための周知の公式によって更新される。図9において理解されるように、トークン477の追加は更新された平均又は垂直距離478と、垂直範囲480を付与する。
【0049】
垂直しきい値距離は、「Pattern Classification and Scene Analysis (by Richard Duda and Peter Hart, 1973, by John Wiley & Sons, Inc., pages 114-118) 」に述べられているように、フィッシャ線形識別距離測定(Fisher linear discriminant distance measure)に従って決定することもできる。「フィッシャ距離」は2つのガウス分布間の類似性のレベルを説明する。既存のラインでグループ分けすべきかどうかを確認するべく新しいトークンを検査するために、以下のように距離を計算する。
【0050】
【数1】
Figure 0003781810
【0051】
ここで、ml とvl は上述したように既存ラインの平均及び分散パラメータである。
【0052】
【数2】
Figure 0003781810
【0053】
ここで、ts とbs は、考慮されているストロークの頂部ならびに底部範囲の垂直位置である。nl とns はそれぞれ、既存ラインと新しいストロークの重み係数である。既存ラインは新しいストロークよりも大きな重みが付与される。例えば、新しいストロークよりも10倍大きな重みのある既存ラインを付与するために、10:1の割合、もしくは、nl =10.0、ns =1.0が使用される。
【0054】
ステップ392でははフィッシャ距離しきい値内にないが、ステップ394では現在行の位置に対して中間フィッシャ距離にある候補トークンは、ステップ396において「問題となるトークン」の個別のリストに維持される。すべての候補トークンがステップ386で処理された場合、あらかじめ受け取られた候補トークンに接触するそれら問題となるトークンはステップ388で受け取られる。例えば、図9においてトークン481は垂直範囲482の若干外側にある垂直平均483を有するので、受け入れられなければならない。トークン483はたいていの場合、先の分散の外側にあり、問題があると考えられることもある。しかしながら、トークン483は受け取られたトークン481とタッチし、このため受け取られることになる。
【0055】
この技法の効果は、左から右へテキストラインに沿ってトークンを収集し、推定ラインの垂直位置とライン高さをその道に沿って動的に更新することである。これらのトークンから、オリジナルのビットマップ画像の対応領域を抽出して、テキスト認識のための個別の手書き認識モジュールに送信することは簡単なことである。
【図面の簡単な説明】
【図1】一般的な面走査システムを示す図である。
【図2】走査画像セクションの集合からボードの2値表現を生成するための一般的な方法を示すフローチャートである。
【図3】記号のテキスト注釈へと導かれるラインを有する複雑な手書きコマンド構造を示す図である。
【図4】手書きのテキストラインを含む選択された領域を有する画像を示す図である。
【図5】本発明を支持する全体の機能体系を表わした図である。
【図6】基本の曲線フラグメントを識別するために使用されるステップを示すフローチャートである。
【図7】対応付けられたテキストを備えた簡単なコマンド構造を示す図である。
【図8】適応固結性トークンクラスタリングに基づいたテキストセグメント化のステップを付与するフローチャートである。
【図9】ライン分散と位置の推定を示す図である。

Claims (1)

  1. 走査面の記号注釈領域をセグメント化するための方法であって、
    記号注釈領域の開始点を決定し、
    前記記号注釈領域開始点に近接する候補トークンを決定し、
    前記開始点の右側にある第1のトークンを決定し、
    前記第1のトークンのガウス分布を計算することを有するとともに、前記ガウス分布の分散は前記記号注釈領域の平均高さを表し、平均は前記記号注釈領域の垂直位置を表し、
    前記第1のトークンをラインとし、
    残りのすべての候補トークンについて、
    次の右側の候補トークンを決定し、
    平均を計算することを含む、前記次の候補トークンのガウス分布を計算し、
    前記次の候補トークンの前記平均が前記ラインの平均の所定の閾値垂直位置内にある場合、前記次の候補トークンを前記ラインの一部として受容し、前記次の候補トークンを前記ラインと結合することを有する、
    走査面の記号注釈領域のセグメント化方法。
JP22507195A 1994-09-09 1995-09-01 走査面の記号注釈領域のセグメント化方法 Expired - Fee Related JP3781810B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US30396294A 1994-09-09 1994-09-09
US303962 1994-09-09

Publications (2)

Publication Number Publication Date
JPH08101883A JPH08101883A (ja) 1996-04-16
JP3781810B2 true JP3781810B2 (ja) 2006-05-31

Family

ID=23174449

Family Applications (1)

Application Number Title Priority Date Filing Date
JP22507195A Expired - Fee Related JP3781810B2 (ja) 1994-09-09 1995-09-01 走査面の記号注釈領域のセグメント化方法

Country Status (3)

Country Link
EP (1) EP0701226B1 (ja)
JP (1) JP3781810B2 (ja)
DE (1) DE69520396T2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101584045B1 (ko) * 2015-09-02 2016-01-11 주식회사 시큐브 세그먼트 기반 수기서명 인증 시스템 및 방법

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4998285A (en) * 1988-03-11 1991-03-05 Kabushiki Kaisha Toshiba Character recognition apparatus
JPH0816918B2 (ja) * 1989-04-18 1996-02-21 シャープ株式会社 行抽出方法

Also Published As

Publication number Publication date
DE69520396D1 (de) 2001-04-26
DE69520396T2 (de) 2001-08-30
EP0701226A2 (en) 1996-03-13
EP0701226B1 (en) 2001-03-21
JPH08101883A (ja) 1996-04-16
EP0701226A3 (en) 1997-05-14

Similar Documents

Publication Publication Date Title
US5511148A (en) Interactive copying system
EP0701225B1 (en) System for transcribing images on a board using a camera based board scanner
US6411732B1 (en) Method for interpreting hand drawn diagrammatic user interface commands
US6760009B2 (en) Coordinate position inputting/detecting device, a method for inputting/detecting the coordinate position, and a display board system
US5581637A (en) System for registering component image tiles in a camera-based scanner device transcribing scene images
US7697776B2 (en) Model-based dewarping method and apparatus
Erol et al. HOTPAPER: multimedia interaction with paper using mobile phones
JP6089722B2 (ja) 画像処理装置、画像処理方法および画像処理プログラム
Ablameyko et al. Machine Interpretation of Line Drawing Images: Technical Drawings, Maps and Diagrams
EP1330109B1 (en) Index and retrieval system and method for scanned notes from whiteboard
US20040193697A1 (en) Accessing a remotely-stored data set and associating notes with that data set
US20040165786A1 (en) System and method for converting whiteboard content into an electronic document
CN106156761A (zh) 面向移动终端拍摄的图像表格检测与识别方法
JPH06508461A (ja) 画像を自動併合するための装置及び方法
JP4630777B2 (ja) デジタル文書を変更する方法、装置、コンピュータプログラム及び記憶媒体
WO2001003416A1 (fr) Dispositif et procede d'elimination de bordure, et dispositif de creation
JP2000259338A (ja) 入力システム、表示システム、プレゼンテーションシステム及び情報記憶媒体
Black et al. The digital office: Overview
JP3781810B2 (ja) 走査面の記号注釈領域のセグメント化方法
JPH10222688A (ja) 画像処理方法
Li et al. Automated registration of high resolution images from slide presentation and whiteboard handwriting via a video camera
JP2001155139A (ja) カメラ付きペン型入力装置用記憶媒体
JP2011193294A (ja) 文書画像処理装置、文書画像処理方法および文書画像処理プログラム
JP2011018359A (ja) ドロップアウトカラー処理装置およびこれを用いたドロップアウトカラー処理方法
Saund et al. The Digital Office: Overview

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051018

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060105

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060207

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060308

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100317

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110317

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110317

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120317

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130317

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140317

Year of fee payment: 8

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees