JP5505106B2 - 手書き文字分離装置、手書き文字分離方法及び手書き文字分離プログラム - Google Patents

手書き文字分離装置、手書き文字分離方法及び手書き文字分離プログラム Download PDF

Info

Publication number
JP5505106B2
JP5505106B2 JP2010134214A JP2010134214A JP5505106B2 JP 5505106 B2 JP5505106 B2 JP 5505106B2 JP 2010134214 A JP2010134214 A JP 2010134214A JP 2010134214 A JP2010134214 A JP 2010134214A JP 5505106 B2 JP5505106 B2 JP 5505106B2
Authority
JP
Japan
Prior art keywords
image
character string
handwriting
character
coordinate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010134214A
Other languages
English (en)
Other versions
JP2011258129A (ja
Inventor
宏 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2010134214A priority Critical patent/JP5505106B2/ja
Publication of JP2011258129A publication Critical patent/JP2011258129A/ja
Application granted granted Critical
Publication of JP5505106B2 publication Critical patent/JP5505106B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

本件は、手書き文字分離装置、手書き文字分離方法及び手書き文字分離プログラムに関する。
近年、多くの業務が計算機上でのデータ処理によって行われており、紙に書かれた文字を計算機に入力するようなデータ処理も多々行われている。最近では、データ処理における文字入力の工数削減を目的として、紙に書かれた文字を自動認識してテキスト化する手書き文字認識技術も用いられている。
文字認識の対象となる手書きデータには例えば2種類の形式があり、それぞれ文字認識の方法が異なる。例えば、第1のデータ形式としては、ビットマップ形式などの画像データとして表現された文字列画像が挙げられ、第2のデータ形式は、筆跡を座標値の系列(座標点列)で表した筆跡座標データが挙げられる。前者では、画像から文字列を認識する技術として、OCR(Optical Character Recognition)技術が採用され、後者では、座標点列を認識する技術として、オンライン認識技術が採用されている。なお、OCR技術は、オンライン認識技術に対応してオフライン認識技術とも呼ばれる。
OCR技術で認識する文字列画像(第1のデータ形式)は、紙文書をスキャナやデジタルカメラで読み込むことによって取得することができる。OCR技術は、一般的に文書画像から文字列を含む行を切り出し、行を構成する文字の区切り位置を推定して、一文字ごとの文字画像を生成する。そして、生成された文字画像を認識して文字認識結果を取得し、文書画像をテキスト化する。OCR技術により文書画像をテキスト化する技術は様々な例があり、製品も多数発売されている。なお、OCR技術の公知例としては、例えば、特許文献1等が挙げられる。
ここで、文字列画像から一文字ごとの画像を分離する技術としては、例えば、特許文献2に記載の技術がある。この特許文献2の技術では、文字列画像の中に隣接する文字と接触している接触文字と、接触していない非接触文字とが存在する場合に、非接触文字を接触文字から予め分離しておき、その後に接触文字を1文字ごとに分離する。接触文字の分離では、接触文字の上輪郭線と下輪郭線を求めるとともに、輪郭線の極大・極小点を用いて切断すべき箇所を求め、当該箇所において画像を2つに切断する。
一方、オンライン文字認識技術(第2のデータ形式)においては、筆跡座標データを、例えばタブレット装置などの筆跡座標入力装置上におけるスタイラスペンの動きから取得することができる。オンライン文字認識技術の具体的な内容については、例えば非特許文献1に開示されている。
ここで、オンライン文字認識技術において、筆跡データを1文字ごとに分離する技術には、非特許文献2に記載の技術などがある。この種の技術では、文字を構成する一画ごとの筆跡座標データ(「ストローク」と呼ぶ)が、始点座標、連続する中間座標、及び終点座標という順序で座標値の系列で表現される。このため、文字と文字の位置が重なっていてもストロークごとに分離することができることから、当該ストロークをグループ化することで、筆跡データを1文字ごとに分離することができる。
なお、最近では、オンライン及びオフライン文字認識を同時に用いる例も出現してきている(例えば特許文献3、4、非特許文献3参照)。特許文献3、4は、オンライン認識技術とオフライン認識技術の両方を用いて認識し、それらの認識結果を統合して高精度な文字認識を行うものである。また、非特許文献3は、手書き文字列に対してオンライン認識、オフライン認識の両方を行い、それらの認識結果を統合するものである。
特開平7−262317号公報 特開2001−22885号公報 特開平8−115384号公報 特開平6−348904号公報
福島、中川:「確率モデルに基づくオンライン枠なし手書き文字列認識」、電子情報通信学会技術報告PRMU98-139, 1999.12 田中、秋山、石垣:「階層遅延セグメンテーションを用いた実時間枠なしオンライン手書き文字認識」、電子情報通信学会技術報告PRMU2001-264, 2002.03 M.Liwicki, H.Bunke, "Recognition of Whitebord Notes," pp.129-153, World Scientific社, ISBN-10 981-281-453-1
上述した特許文献3,4及び非特許文献3の技術では、オンライン及びオフライン文字認識を行ってはいるものの、筆跡データとしてはオンラインデータのみを用いており、文字列(文字)の画像は筆跡座標データから生成している。このため、紙に筆記した手書きデータをスキャナ等で読み込んで取得した画像から文字認識を行った場合とは異なる認識結果が得られてしまう可能性がある。例えば、紙に筆記しているときに文字の掠れや書き損じなどが生じると、ユーザは同じ辺を繰り返し筆記するなどして文字を修正することが多々ある。このような場合、オンラインデータのみを用いた文字認識では、同じ辺の筆記を別の辺の筆記と認識してしまい、高精度な文字認識ができない可能性が高い。
このような観点からすると、紙に筆記した手書き文字画像が接触している場合に、それらの手書き文字画像を1文字ずつ分離できれば、文字認識精度を向上することができると考えられる。
そこで本件は上記の課題に鑑みてなされたものであり、手書き文字の画像を精度良く1文字ごとに分離することが可能な手書き文字分離装置、手書き文字分離方法及び手書き文字分離プログラムを提供することを目的とする。
本明細書に記載の手書き文字分離装置は、手書き文字列を含む画像を読み込む画像読み込み部と、前記手書き文字列の筆跡の座標に関する筆跡座標データを取得する座標データ取得部と、前記画像から、前記手書き文字列の画像を抽出する文字列抽出部と、前記筆跡座標データから前記筆跡の各ストロークの座標データを抽出し、前記手書き文字列の画像の黒画像部分に所定の割合以上重複する筆跡の座標を抽出する対応座標抽出部と、前記筆跡座標データから前記対応座標抽出部により抽出された筆跡の座標を、1文字ごとに統合する座標統合部と、前記座標統合部により1文字ごとに統合された筆跡の座標に基づいて、前記手書き文字列の画像を分離する文字列分離部と、を備える。
本明細書に記載の手書き文字分離方法は、コンピュータが、手書き文字列を含む画像を読み込む画像読み込み工程と、前記手書き文字列の筆跡の座標に関する筆跡座標データを取得する座標データ取得工程と、前記画像から、前記手書き文字列の画像を抽出する文字列抽出工程と、前記筆跡座標データから前記筆跡の各ストロークの座標データを抽出し、前記手書き文字列の画像の黒画像部分に所定の割合以上重複する筆跡の座標を抽出する対応座標抽出工程と、前記筆跡座標データから前記対応座標抽出工程で抽出された筆跡の座標を、1文字ごとに統合する座標統合工程と、前記座標統合工程で1文字ごとに統合された筆跡の座標に基づいて、前記手書き文字列の画像を分離する文字列分離工程と、を実行する手書き文字分離方法である。
本明細書に記載の手書き文字分離プログラムは、コンピュータに、手書き文字列を含む画像を読み込む画像読み込み工程、前記手書き文字列の筆跡の座標に関する筆跡座標データを取得する座標データ取得工程、前記画像から、前記手書き文字列の画像を抽出する文字列抽出工程、前記筆跡座標データから前記筆跡の各ストロークの座標データを抽出し、前記手書き文字列の画像の黒画像部分に所定の割合以上重複する筆跡の座標を抽出する対応座標抽出工程、前記筆跡座標データから前記対応座標抽出工程で抽出された筆跡の座標を、1文字ごとに統合する座標統合工程、及び前記座標統合工程で1文字ごとに統合された筆跡の座標に基づいて、前記手書き文字列の画像を分離する文字列分離工程、を実行させる手書き文字分離プログラムである。
本明細書に記載の手書き文字分離装置、手書き文字分離方法及び手書き文字分離プログラムは、手書き文字の画像を精度良く1文字ずつ分離することができるという効果を奏する。
一実施形態に係る情報処理システムの構成を概略的に示す図である。 図2(a)は、筆跡座標データ入力部で得られる座標点列情報のデータ構造を示す図であり、図2(b)は、図2(a)の状態の値の意味を示す表である。 PCのハードウェア構成を示す図である。 PCの機能ブロック図である。 PCの処理を示すフローチャートである。 図5のステップS16〜S20の処理を説明するための図である。 図5のステップS22の具体的な処理を示すフローチャートである。 図8(a)〜図8(d)は、図7の処理を説明するための図である。 図9(a)、図9(b)は、図7のステップS42を説明するための図(その1)である。 図7のステップS42を説明するための図(その2)である。 図5のステップS24の具体的な処理を示すフローチャートである。 図11のステップS52の具体的な処理を示すフローチャートである。 図12のステップS68の統合条件2を説明するための図である。 図11のステップS54の具体的な処理を示すフローチャートである。 図15(a)〜図15(d)は、図14の処理を説明するための図(その1)である。 図16(a)〜図16(c)は、図14の処理を説明するための図(その2)である。 図14の処理の結果を示す図である。 図18(a)、図18(b)は、比較例を示す図である。
以下、手書き文字分離装置、手書き文字分離方法及び手書き文字分離プログラムの一実施形態について、図1〜図17に基づいて詳細に説明する。図1には、手書き文字分離装置として機能するPC10を含む情報処理システム100の構成が概略的に示されている。この図1に示すように、情報処理システム100は、PC10と、筆跡座標データ入力部20と、文字列画像入力部30と、表示装置40と、を備える。
PC10は、筆跡座標データ入力部20から入力される座標点列情報(オンラインデータとも呼ばれる)と、文字列画像入力部30から入力される文字画像データ(オフラインデータとも呼ばれる)とから、手書き文字を認識する。そして、文字認識結果に基づいて手書き文字を文字データ(テキスト文字列)に変換し、当該文字データを表示装置40に表示させる。また、PC10は、手書き文字を認識する前に、隣接する手書き文字が接触しているような場合には、当該接触している手書き文字を分離する。なお、PC10のハードウェア構成や機能ブロック及び処理の詳細等については後述する。
筆跡座標データ入力部20は、ユーザが筆記した筆跡を表す座標点の系列(座標点列情報)を取得するものであり、市販のタブレット装置などを用いることができる。筆跡座標データ入力部20では、ユーザが紙に文字列を筆記する際の、座標点列情報を取得する。具体的には、ユーザは、図1に示すように筆跡座標データ入力部20上に文字を筆記する紙を置き、ペン先にインクの吐出口を有するスタイラスペン21を用いて、紙に文字列を筆記する。これにより、筆跡座標データ入力部20は、ユーザが文字列を筆記している間の座標点列情報を取得することが可能となる。なお、ユーザは、紙以外のシート状部材を筆記座標データ入力部20上に置いて、当該シート状部材に文字列を筆記するようにしても良い。
座標点列情報は、x座標とy座標で表される座標点の系列であり、スタイラスペン21の筆記を開始した点(ペンダウン)からペンが紙から持ち上げられた点(ペンアップ)までが文字の一画(1ストローク)を表す。座標点列情報は、座標点を時間順に配列したものであり、一例として、図2(a)に示すようなデータ構造を有している。図2(a)のデータ構造では、座標点ごとに「x座標」、「y座標」、「時間」、「筆記状態」が記録される。これらのうち、「x座標」と「y座標」は2バイトの整数値で表される。「時間」は座標点列データの最初の座標点からの相対経過時間が4バイトで表される。4バイトデータの前半2バイトが「秒」を、後半2バイトが「ミリ秒」を表す。なお、t1は常に0である。更に、「筆記状態」には0〜3のいずれかの値が入力される。筆記状態を示す値は、図2(b)に示すように、「0」がペンが空中にあって筆記していない状態、「1」がストローク(一画)の始点、「2」が筆記中の座標点で、始点・終点以外の状態、「3」がストローク(一画)の終点を意味する。
図1に戻り、文字列画像入力部30は、紙に筆記された文字列の画像を取得するものであり、例えば、スキャナ装置や、スキャナ機能を有する複合機、デジタルカメラなどの画像入力装置が用いられる。文字列画像入力部30が取得する画像は、一般的なフォーマットの画像、例えばビットマップ(BMP)形式や、JPEG形式、GIF形式、TIFF形式など様々な形式の画像である。これらの形式では、画像の一画素ごとの画素値が保存されるため、2次元座標(x、y座標)で表される画素ごとに値が割り振られることになる。画像データが二値画像であれば、筆跡に対応する画素が黒画素(例えば「1」)であり、それ以外の画素(背景など)が白画素(例えば「0」)で表される。
表示装置40は、液晶ディスプレイや有機ELディスプレイ等を含み、PC10からの指示に基づいて、手書き文字から認識された文字(テキスト)を表示したり、ユーザからの指示に基づく表示を行ったりする。
図3には、PC10のハードウェア構成が示されている。この図3に示すように、PC10は、CPU90、ROM91、RAM92、記憶部(ここではHDD(Hard Disk Drive))93、入出力部94等を備えており、PC10の構成各部は、バス95に接続されている。PC10では、ROM91あるいはHDD93に格納されているプログラムをCPU90が実行することにより、図4の各部の機能が実現される。また、入出力部94には、図1の筆跡座標データ入力部20、文字列画像入力部30及び表示装置40等が接続されている。
図4は、PC10の機能ブロック図である。図4に示すように、PC10は、手書き文字分離装置としての手書き文字分離部50と、文字認識部52と、表示制御部54と、を有する。
手書き文字分離部50は、紙に筆記された文字列の画像(手書き文字列画像)から文字を1文字ずつ分離する。この手書き文字分離部50は、図4に示すように、画像読み込み部62と、文字列抽出部64と、座標データ取得部66と、対応座標抽出部68と、座標統合部70と、文字列分離部72と、を有する。
画像読み込み部62は、手書き文字列を含む画像を読み込む。具体的には、画像読み込み部62は、図1の文字列画像入力部30において、ユーザの操作によりスキャンされた画像を画素データとして読み込む。文字列抽出部64は、画像読み込み部62において読み込まれた画像から、手書き文字列の画像(以下、単に「文字列画像」と呼ぶ)を抽出するとともに、文字列画像をグループ化する。なお、文字列画像のグループ化は、文字列画像のうち隣接する文字と接触していない非接触文字のみのグループと、隣接する文字と接触している接触文字を複数含むグループとに分ける処理である。
座標データ取得部66は、手書き文字列画像の筆跡の座標に関する筆跡座標データ(座標点列データ)を取得する。対応座標抽出部68は、座標点列データのうち、文字列抽出部64で抽出された文字列画像に対応する座標点列を抽出する。座標統合部70は、対応座標抽出部68により抽出された座標点列を、1文字ごとにグループ化して統合する。文字列分離部72は、座標統合部70により1文字ごとに統合された座標点列に基づいて、文字列画像を1文字ごとに分離する。
文字認識部52は、文字列分離部72において1文字ずつ分離された文字列画像を、OCR(Optical Character Reader)技術等を用いて認識し、当該認識結果を表示制御部54に対して出力する。
表示制御部54は、文字認識部52からの出力に基づいて、表示装置40に文字認識部52で認識された文字列(テキスト)を表示する。
次に、上記のように構成される情報処理システム100の処理について、図5〜図17に基づいて詳細に説明する。
図5は、PC10における処理を示すフローチャートである。図5のフローチャートに示すように、まず、ステップS10では、座標データ取得部66が、文字列の書込みがあったか否かを判断する。すなわち、ユーザが筆跡座標データ入力部20上に紙を置いて、当該紙に文字を筆記したか否かを判断する。ここでの判断が肯定されると、ステップS12に移行するが、否定された場合には、ステップS10の判断が肯定されるまで、ステップS10の判断を繰り返す。
ステップS12では、座標データ取得部66が、筆跡座標データ入力部20にて取得された座標点列データを取得する。ここで取得される座標点列データは、図2(a)のようなデータ構造を有している。次いで、ステップS14では、画像読み込み部62が、文字列画像入力部30において画像が読み込まれたか否かを判断する。ここでの判断が肯定されると、ステップS16に移行するが、否定された場合には、ステップS14の判断が肯定されるまで、ステップS14の判断を繰り返す。
ステップS16では、画像読み込み部62が、文字列画像入力部30において取得された(スキャンされた)画像を画素データとして取得し、文字列抽出部64が、当該画像から文字列画像を抽出する。ここでは、図6(a)に示すような、「中原区」の文字列画像が抽出されたものとする。
次いで、ステップS18では、文字列抽出部64が、文字列画像を連結成分に分離する。具体的には、図6(a)に示す文字列画像を、図6(b)に示すように、連結して一塊になっている部分ごとに、連結成分A〜Eとして分離する。
次いで、ステップS20では、文字列抽出部64が、連結成分のグループ化を行う。具体的には、図6(b)のように分離された連結成分A〜Eのうち、紙面横方向に関して重複している連結成分を纏めて、グループ化する。図6(b)の場合、図6(c)に示すように、連結グループGA、GBにグループ化される。すなわち、ここでは、「中」と、「原区」とが別々の連結グループとなり、このうち、連結グループGBは、「原区」の各文字が接触した、接触文字部分となる。
次いで、ステップS22では、対応座標抽出部68が、連結グループ(「中」「原区」部分)に対応する座標点列の取得に関するサブルーチンを実行する。具体的には、対応座標抽出部68は、図7のフローチャートに沿った処理を実行する。
図7のフローチャートでは、まず、ステップS40において、対応座標抽出部68が、対応付ける文字列画像(ここでは、連結グループGB(「原区」部分)とする)を太線化する。具体的には、対応座標抽出部68が、例えば文字列画像の黒画素に対して、隣接する8方向(上・下・左・右・右上・右下・左上・左下)の画素が白画素であった場合に黒画素に変換する、などの操作を行う。なお、図8(a)に示す文字列画像が、太線化された後の文字列画像であるものとする。
次いで、ステップS42では、対応座標抽出部68が、座標点列データから1ストローク分のデータを取得し、それが文字列画像と重なっているかどうかを判定する。具体的には、対応座標抽出部68は、図8(c)に示すような座標点列データから、1ストローク(1画)分(例えば、図8(c)の符合S部分)を取得して、その1ストロークが太線化された文字列画像とどの程度一致するかを判定する。なお、1ストローク(一画)は、前述したように、ペンが紙に接触し始めてから、紙から離れるまでの間のペンの移動軌跡を意味する。
なお、ステップS42を実施するにあたっては、文字が筆記されたときの紙の位置と、筆跡座標データ入力部20(タブレット)の位置とを、予め対応させておく必要がある。このため、ユーザが筆跡座標データ入力部20上に設けた紙に文字を書くときに、筆跡座標データ入力部20と紙との位置関係をある一定の関係に維持するようにしておくことが好ましい。具体的には、例えば筆跡座標データ入力部20及び紙にマーカ等を設けておき、各マーカの位置を一致させた状態でユーザが紙に文字を書くなどすることで、位置関係を維持することができる。
次いで、ステップS43では、対応座標抽出部68が、重なりが大きな画(ストローク)か否かを判断する。具体的には、対応座標抽出部68は、1ストローク(一画)分の筆記座標に沿って画素値を調べ、黒画素の割合が所定割合(例えば95%)以上であれば、ここでの判断が肯定される。ステップS43の判断が肯定された場合、ステップS44に移行し、判断を行った(取得した)一画(ストローク)を座標統合部70に対して出力する。
ここで、1ストローク分の画素における黒画素の割合を算出する処理は以下のようにして行う。すなわち、座標点列データは、実際には、筆跡上の離散点の座標であり、実際の筆跡はそれらの離散点を線分で繋げて表示される。例えば図9(a)のように離散した座標点P1,P2の並びは、図10のようなデータ形式で表され、座標点P1,P2がストローク1に含まれる場合には、ストローク1の座標点(x1,y1)〜(x4,y4)のうちの2点となる。したがって、座標点列データを用いて、1つのストロークの画素値をカウントする場合は、離散した座標点を部分直線Lで結んだ線上にある黒画素をカウントする。すなわち、図9(b)において黒塗りにて示す画素が、2点P1,P2間でカウントすべき画素に相当する。
このように、座標点列データを構成する全ての座標点の間で同様の処理を行うことで、1ストローク分の画素における黒画素の割合を求めることができる。
なお、上述のようにしてステップS44の処理が行われた後は、図7に示すように、ステップS46に移行する。一方、ステップS43の判断が否定された場合には、ステップS44を経ずに、ステップS46に移行する。
次のステップS46では、対応座標抽出部68が、全画(全てのストローク)についての判定が行われたか否かを判断する。ここでの判定が否定された場合には、ステップS42に戻る。そして、ステップS46の判断が肯定されるまで、ステップS42〜S44を繰り返し行う。
その後、ステップS46の判断が肯定されると、ステップS48に移行する。なお、ステップS46の判断が肯定された段階では、対応座標抽出部58は、座標統合部70に対して、文字列画像と重なっている座標点列データ(ストローク)のみを出力することになる。すなわち、図8(b)及び図8(d)に示すように、「中原区」を示す座標点列データのうち、文字列画像のうちの連結グループGB(「原区」部分)に対応する座標点列データが出力されることになる。
図7に戻り、ステップS48に移行すると、対応座標抽出部68は、全ての連結グループについて、処理が行われたか否かを判断する。ここでは、未だ連結グループGBの処理を行ったのみなので、判断は否定されて、ステップS49に移行する。ステップS49では、対応座標抽出部68が、次のグループ(ここでは、連結グループGAとする)を処理対象にして、ステップS40に戻る。なお、上記説明では、説明の便宜上、連結グループGB、GAの順に処理を行うこととしたが、これに限らず、連結グループGA、GBの順位処理が行われることとしても良い。
以上のような処理を実行し、ステップS48の判断が肯定されると、図7の全処理を終了し、図5のステップS24に移行する。なお、図7の全処理が終了した段階では、連結グループGB(「原区」部分)に対応する座標点列データ(図8(d)参照)と、連結グループGA(「中」部分)に対応する座標点列データと、が座標統合部70に対して出力される。
図5に戻り、次のステップS24では、座標統合部70及び文字列分離部72が、座標点列を用いた画像分離のサブルーチンを実行する。このステップS24では、座標統合部70及び文字列分離部72は、図11に示す処理を実行する。
図11では、まず、ステップS50において、座標統合部70が、文字列画像が複数ストローク(複数画)であるか否かを判断する。なお、ここでは、1つの連結グループを処理対象とするものとし、一例として、連結グループGBが処理対象に設定されているものとする。ステップS50の判断が否定された場合には、ステップS58に移行するが、判断が肯定された場合には、ステップS52に移行する。なお、連結グループGBの場合、複数ストロークであるので、ステップS50の判断は肯定されて、ステップS52に移行する。
ステップS52では、座標統合部70が、座標点列を文字境界で分離するサブルーチンを実行する。具体的には、座標統合部70は、図12に示すような処理を実行する。
図12の処理では、まず、ステップS60において、座標統合部70が、座標点列を筆記順にソートする。次いで、ステップS62では、座標統合部70が、隣り合ったストローク同士を統合条件1にしたがって統合する。ここで、統合条件1は、ストローク間の時間間隔が短い場合には文字間の境界ではない(同一文字内である)と判定するための条件である。すなわち、統合条件1としては、例えば、ストロークの筆記時間間隔が一定時間(例えば0.05秒)よりも短い場合に、統合する、という条件を採用することができる。なお、統合条件1として上記のような時間に関する条件を用いる場合、図2(a)や図10のように、座標点列データからストローク間の筆記時間間隔が得られることが必要となる。なお、時間間隔が取得できないような場合には、統合条件1によるストロークの統合は行わない、すなわち、ステップS60〜S64を省略する、こととしても良い。
なお、統合条件1としては、上記条件に限られるものではなく、例えば、「岡本、山本、吉川、堀井:「物理的特徴量を用いたオンライン文字自動切り出し手法」、電子情報通信学会PRU95-13, 1995.05」に記載されている条件などを採用することができる。具体的には、例えば、前のストロークの始点位置と次のストロークの始点位置が近い場合に統合する、などの条件を採用することができる。また、統合条件1としては、例えば、「相澤、若原、小高:「複数のストローク特徴を用いた手書き文字列からの実時間文字切り出し」、電子情報通信学会PRU95-185, 1995.12」のようなニューラルネットを用いた判定を行うこととしても良い。あるいは、上述した各条件のうちの2以上の条件で判定を行い、各判定結果を総合して、統合するか否かを判定することとしても良い。
次いで、ステップS64では、座標統合部70は、全てのストロークのソートが完了したか否かを判断する。ここでの判断が否定された場合には、ステップS60に戻り、上記と同様にステップS60、S62の処理を行うが、肯定された場合には、ステップS66に移行する。
ステップS66に移行した場合、座標統合部70は、統合した筆跡を座標順にソートする。次いで、ステップS68では、座標統合部70は、隣り合った統合筆跡を統合条件2にしたがって統合する。
ここで、統合条件2について、具体的に説明する。図13(a)、図13(b)は、統合条件2を説明するための図である。統合条件2としては、本実施形態のように文字列が横書き(図13(a)のx軸方向に沿った筆記順)の場合であれば、2つの統合筆跡1、2のうち、一方の統合筆跡の外接矩形のx軸方向に関する中心座標(cx1又はcx2)が、他方の統合筆跡の外接矩形のx軸方向範囲内に含まれている場合に統合する、という条件を採用することができる。
例えば、図13(a)に示すように、一方の中心座標が他方の外接矩形の範囲に含まれていない場合には、統合条件2を満たさないと判断する。これに対し、図13(b)に示すように、いずれか一方の中心座標が他方の外接矩形の範囲に含まれている場合には、統合条件2を満たすと判断する。なお、縦書きの場合には、y軸方向を基準として判断すれば良い。
本実施形態において、統合条件2に従った統合処理を行うのは、例えば、「原」の文字の最終画(10画目)のストロークが、直前の画(9画目)のストロークから0.05秒以内に書かれていないなどで、統合条件1を満たしていないとされた場合でも、最終画のストロークを、「原」ののストロークとして統合するためである。このように、統合条件1、2を併用することで、高精度にストロークを1文字ごとに分離(統合)することができるようになる。
図12に戻り、次のステップS70では、座標統合部70が、全ての統合筆跡をソートしたか否かを判断する。ここでの判断が否定された場合には、ステップS66に戻るが、肯定された場合には、図12の全処理を終了し、図11のステップS54に移行する。なお、図12(ステップS52)の処理が終了した段階では、座標点列が文字ごとに分離(統合)された状態となる。
次いで、図11のステップS54では、文字列分離部72が、文字列画像の各画素を分離するサブルーチンを実行する。このステップS54のサブルーチンでは、図14に示すフローチャートに沿った処理を実行する。なお、ここでは、処理対象として、連結グループGB(「原区」のグループ)が選択されているものとする。
図14の処理では、まず、ステップS80において、文字列分離部72は、統合筆跡幅の推定値を求め、推定値をwとする。統合筆跡幅の推定値wとしては、例えば図9(b)に示すように座標点列データの座標点の間で画素をカウントする場合であれば、統合筆跡に対して直交する方向に黒画素が存在する幅の平均値を算出した結果を採用することができる。
次いで、ステップS82では、文字列分離部72が、文字毎にストロークの周辺w幅以内(±w/2以内)の画素を、その文字に属する画素として分類する。一例として、図15(a)に示すような文字画像データ(画素データ)と、これに対応して、ある文字(文字1とする)のストローク1と別の文字(文字2とする)のストローク2があるとする。この場合、文字列分離部72は、図15(b)に示すように文字1のストローク1に近接する画素を文字1の画素(文字1に対応する画素)として分類する。また、文字列分離部72は、図15(c)に示すように、文字2のストローク2に近接する画素を、文字2の画素(文字2に対応する画素)として分類する。なお、画素の中には、図15(d)に示すように、文字1の画素と文字2の画素の両方に対応する画素、すなわち、文字1と文字2に共通する画素も存在する。
次いで、ステップS84では、文字列分離部72が、いずれの文字にも分類されていない画素を、分類済みの画素で最も近いものと同じ文字に分類する。この結果、図16(a)に示すように、文字1の画素及び文字2の画素(両方の文字の画素も含む)に分類される。
次いで、ステップS86では、文字列分離部72が、各文字の画素を抽出して文字画像を作成する。具体的には、図16(a)の場合であれば、文字列分離部72は、図16(b)のように文字1に対応する画素と両方に対応する画素とを抽出して文字1の画像を作成する。また、図16(c)のように文字2に対応する画素と両方に対応する画素とを抽出して文字2の画像を作成する。これにより、本実施形態のように処理対象が「原区」である場合には、図17に示すように、1文字ずつ「原」と「区」の文字画像に分離されることになる。なお、ステップS86では、文字列分離部72が、手書き文字列の画像のうち、隣接する文字間で重なり合っている部分を、隣接する各文字に割り振る処理を行っているとも言える。
以上のようにして、図14(ステップS54)の処理が終了すると、図11のステップS56に移行する。ステップS56では、文字列分離部72が図4の文字認識部52に向けて、分離した文字画像を出力する。次いで、ステップS58では、文字列分離部72は、全ての連結グループの処理が終了したか否かを判断する。ここでの判断が否定された場合には、ステップS59において、次の連結グループを処理対象にした後、ステップS50に戻る。本実施形態では、未だ連結グループGA(「中」のグループ)の処理が終了していないので、ここでの判断は否定されて、ステップS59に移行する。そして、連結グループGAに対しても、上記と同様の処理が行われると、ステップS58の判断が肯定される。ステップS58の判断が肯定されると、図11の全処理を終了し、図5のステップS26に移行する。
ステップS26では、文字認識部52が、文字画像に基づいて、文字認識を行う。この文字認識においては、既存のOCR技術などが用いられる。
次いで、ステップS28では、表示制御部54が、表示装置40を介して認識した文字を表示する。このようにして、PC10における全処理が終了する。
以上、詳細に説明したように、本実施形態によると、画像読み込み部62が、ユーザにより筆記された手書き文字列を含む画像を読み込み、座標データ取得部66が、手書き文字列がユーザにより筆記された際の座標点列データを取得する。そして、文字列抽出部64が、画像から文字列部分の画像を抽出し、対応座標抽出部68が、座標点列データから筆跡の各ストロークの座標データを抽出し、手書き文字列の画像の黒画像部分に所定の割合以上重複する筆跡の座標(座標点列)を抽出する。更に、座標統合部70が、抽出された座標点列を、1文字ごとに統合して、文字列分離部72が、統合された筆跡の座標に基づいて手書き文字列の画像を分離する。このように、手書き文字列の画像が筆記された際の座標点列データを1文字ごとに統合した結果を用いることで、隣接する手書き文字が接触しているような場合であっても、手書き文字列の画像を1文字ごとに高精度に分離することができる。また、上記のように高精度に分離された手書き文字列の画像を用いて文字認識処理を行うことで、高精度に文字を認識することが可能となる。すなわち、従来のように座標点列のみから文字認識を行うこととすると、ユーザが文字を筆記する際に同じ辺を繰り返し書くなどした場合、繰り返し書いた部分は、別の辺として扱われ、誤認識される可能性が高かった。しかしながら、本実施形態のように、1文字ごとに分離された手書き文字を用いて文字認識を行うことで、誤認識の可能性を低減することが可能となる。なお、図18(a)には、手書き文字列の形状から手書き文字列を分離した場合の例が示されている。この図18(a)に示すように、手書き文字列を形状から分離する方法を採用した場合には、文字の形状や文字の接触度合等によっては、不適切な位置で文字が分離されるおそれがある。
また、本実施形態では、文字列抽出部64が、手書き文字列の画像から、隣接する文字と接触している接触文字部分(連結グループGB)を抽出し、対応座標抽出部68が、接触文字部分に対応する筆跡の座標を抽出する。すなわち、本実施形態のように「中原区」の文字列のうち、非接触文字部分(連結グループGA)を予め分離した状態で、「原区」の画像を分離する。これにより、「中原区」の文字列の全てについて同時に分離するような場合と比べて、精度良く文字列の画像を分離することができる。
また、本実施形態では、文字列分離部72は、文字列部分を分離する際に、隣接する文字間で重なり合っている部分を、隣接する各文字に割り振ることとしている。これにより、重なり合っている部分を考慮して、文字列を1文字ごとに適切に分離することができる。この場合、画像読み込み部62が手書き文字列画像を画素データとして読み込み、文字列分離部72は、1文字ごとに統合された筆跡の座標に基づいて、隣接する文字のうちの一方の文字に対応する画素、他方の文字に対応する画素、及び両方の文字に対応する画素に分類し、分類された画素のうち、一方の文字に対応する画素と前記両方の文字に対応する画素とを、一方の文字の画素データとして分離し、他方の文字に対応する画素と両方の文字に対応する画素とを、他方の文字の画素データとして分離することから、簡易な方法で、文字列を1文字ごとに適切に分離することができる。なお、図18(b)には、両方の文字に共通する画素を考慮しない場合の例が示されている。この図18(b)に示すように、両方の文字に共通する画素を考慮しないこととすると、文字「原」と「区」の接触部分において、適切な分離がされない部分が生じるおそれがある。このように、適切な分離がされない部分が生じると、文字認識精度が低下するおそれがある。
また、本実施形態では、対応座標抽出部68は、手書き文字列の画像を太線化し、太線化後の画像と対応する、座標点列データの筆跡の座標を抽出する。したがって、手書き文字列と座標点列との位置関係が多少ずれても、高精度に筆跡の座標を抽出することができる。
なお、上記実施形態では、図6(c)のように、手書き文字列の画像を連結グループGA、GBに分け(ステップS20)、その後に、グループごとの座標点列の取得(ステップS22)及び手書き文字列の画像の分離(ステップS24)を行う場合について説明した。しかしながら、これに限られるものではなく、ステップS20を行わずに、ステップS22、S24を行うこととしても良い。このようにしても、手書き文字列の画像を1文字ずつ分離することは可能である。
また、上記実施形態では、図7のステップS40において連結グループの画像を太線化する場合について説明したが、これに限られるものではなく、太線化しなくても良い。
なお、上記実施形態では、図2(a)に示すような座標点列のデータ構造を採用した場合について説明したが、これに限らず、データ構造には、x座標、y座標、筆記状態が含まれていれば良い。ただし、このようなデータ構造を採用した場合には、前述のように、図12の統合条件を適宜変更する必要がある。
なお、上記実施形態では、統合条件1、2を用いて、座標点列を1文字ごとに分離(統合)する場合について説明したが、これに限らず、いずれか一方のみを用いることとしても良い。
なお、上記実施形態では、筆跡座標データ入力部20として、タブレット装置を例示したが、これに限られるものではない。例えば、超音波センサを用いて座標点列を検知する超音波型電子ペンや、紙上に印刷された位置座標情報をペン先のカメラで読み取って座標点列を検知するデジタルペンなどを、筆跡座標データ入力部として用いることとしても良い。
なお、上記実施形態では、本件の手書き文字分離プログラムが、PC10内に組み込まれ、図1の各部の各機能を実現する。しかしながら、これに限らず、例えば、インターネット等の通信網に接続されたサーバコンピュータを本件の手書き文字分離装置とし、これに接続されたパーソナルコンピュータ等の通信装置が有する表示装置に、表示を行うサービスをサーバコンピュータから提供するようにしても良い(ASP(Application Service Provider))。
なお、上記の処理機能は、コンピュータによって実現することができる。その場合、処理装置が有すべき機能の処理内容を記述したプログラムが提供される。そのプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。
プログラムを流通させる場合には、例えば、そのプログラムが記録されたDVD(Digital Versatile Disc)、CD−ROM(Compact Disc Read Only Memory)などの可搬型記録媒体の形態で販売される。また、プログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することもできる。
プログラムを実行するコンピュータは、例えば、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、自己の記憶装置に格納する。そして、コンピュータは、自己の記憶装置からプログラムを読み取り、プログラムに従った処理を実行する。なお、コンピュータは、可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することもできる。また、コンピュータは、サーバコンピュータからプログラムが転送されるごとに、逐次、受け取ったプログラムに従った処理を実行することもできる。
上述した実施形態は本発明の好適な実施の例である。但し、これに限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々変形実施可能である。
なお、以上の説明に関して更に以下の付記を開示する。
(付記1) 手書き文字列を含む画像を読み込む画像読み込み部と、前記手書き文字列の筆跡の座標に関する筆跡座標データを取得する座標データ取得部と、前記画像から、前記手書き文字列の画像を抽出する文字列抽出部と、前記筆跡座標データから前記筆跡の各ストロークの座標データを抽出し、前記手書き文字列の画像の黒画像部分に所定の割合以上重複する筆跡の座標を抽出する対応座標抽出部と、前記筆跡座標データから前記対応座標抽出部により抽出された筆跡の座標を、1文字ごとに統合する座標統合部と、前記座標統合部により1文字ごとに統合された筆跡の座標に基づいて、前記手書き文字列の画像を分離する文字列分離部と、を備える手書き文字分離装置。
(付記2) 前記文字列抽出部は、前記手書き文字列の画像から、隣接する文字と接触している接触文字部分を抽出し、前記対応座標抽出部は、前記接触文字部分に対応する筆跡の座標を抽出することを特徴とする付記1に記載の手書き文字分離装置。
(付記3) 前記文字列分離部は、前記手書き文字列の画像を分離する際に、隣接する文字間で重なり合っている部分を、隣接する各文字に割り振ることを特徴とする付記1又は2に記載の手書き文字分離装置。
(付記4) 前記画像読み込み部は、前記手書き文字列の画像を画素データとして読み込み、前記文字列分離部は、前記文字列部分に対応する画素を、1文字ごとに統合された筆跡の座標に基づいて、隣接する文字のうちの一方の文字に対応する画素、他方の文字に対応する画素、及び両方の文字に対応する画素に分類し、前記分類された画素のうち、前記一方の文字に対応する画素と前記両方の文字に対応する画素とを、前記一方の文字の画素データとして分離し、前記他方の文字に対応する画素と前記両方の文字に対応する画素とを、前記他方の文字の画素データとして分離することを特徴とする付記3に記載の手書き文字分離装置。
(付記5) 前記対応座標抽出部は、前記手書き文字列の画像を太線化し、当該太線化後の画像と対応する、前記筆跡座標データの筆跡の座標を抽出することを特徴とする付記1〜4のいずれかに記載の手書き文字分離装置。
(付記6) コンピュータが、手書き文字列を含む画像を読み込む画像読み込み工程と、前記手書き文字列の筆跡の座標に関する筆跡座標データを取得する座標データ取得工程と、前記画像から、前記手書き文字列の画像を抽出する文字列抽出工程と、前記筆跡座標データから前記筆跡の各ストロークの座標データを抽出し、前記手書き文字列の画像の黒画像部分に所定の割合以上重複する筆跡の座標を抽出する対応座標抽出工程と、前記筆跡座標データから前記対応座標抽出工程で抽出された筆跡の座標を、1文字ごとに統合する座標統合工程と、前記座標統合工程で1文字ごとに統合された筆跡の座標に基づいて、前記手書き文字列の画像を分離する文字列分離工程と、を実行することを特徴とする手書き文字分離方法。
(付記7) 前記コンピュータは、前記文字列抽出工程では、前記手書き文字列の画像から、隣接する文字と接触している接触文字部分を抽出し、前記対応座標抽出工程では、前記接触文字部分に対応する筆跡の座標を抽出することを特徴とする付記6に記載の手書き文字分離方法。
(付記8) 前記コンピュータは、前記文字列分離工程では、前記手書き文字列の画像を分離する際に、隣接する文字間で重なり合っている部分を、隣接する各文字に割り振ることを特徴とする付記6又は7に記載の手書き文字分離方法。
(付記9) 前記コンピュータは、前記画像読み込み工程では、前記手書き文字列の画像を画素データとして読み込み、前記文字列分離部は、前記文字列部分に対応する画素を、1文字ごとに統合された筆跡の座標に基づいて、隣接する文字のうちの一方の文字に対応する画素、他方の文字に対応する画素、及び両方の文字に対応する画素に分類し、前記分類された画素のうち、前記一方の文字に対応する画素と前記両方の文字に対応する画素とを、前記一方の文字の画素データとして分離し、前記他方の文字に対応する画素と前記両方の文字に対応する画素とを、前記他方の文字の画素データとして分離することを特徴とする付記8に記載の手書き文字分離方法。
(付記10) 前記コンピュータは、前記対応座標抽出工程では、前記手書き文字列の画像を太線化し、当該太線化後の画像と対応する、前記筆跡座標データの筆跡の座標を抽出することを特徴とする付記6〜9のいずれかに記載の手書き文字分離方法。
(付記11)コンピュータに、手書き文字列を含む画像を読み込む画像読み込み工程、前記手書き文字列の筆跡の座標に関する筆跡座標データを取得する座標データ取得工程、前記画像から、前記手書き文字列の画像を抽出する文字列抽出工程、前記筆跡座標データから前記筆跡の各ストロークの座標データを抽出し、前記手書き文字列の画像の黒画像部分に所定の割合以上重複する筆跡の座標を抽出する対応座標抽出工程、前期筆跡座標データから前記対応座標抽出工程で抽出された筆跡の座標を、1文字ごとに統合する座標統合工程、及び前記座標統合工程で1文字ごとに統合された筆跡の座標に基づいて、前記手書き文字列の画像を分離する文字列分離工程、を実行させることを特徴とする手書き文字分離プログラム。
(付記12) 前記文字列抽出工程では、前記手書き文字列の画像から、隣接する文字と接触している接触文字部分を抽出し、前記対応座標抽出工程では、前記接触文字部分に対応する筆跡の座標を抽出することを特徴とする付記11に記載の手書き文字分離プログラム。
(付記13) 前記文字列分離工程では、前記手書き文字列の画像を分離する際に、隣接する文字間で重なり合っている部分を、隣接する各文字に割り振ることを特徴とする付記11又は12に記載の手書き文字分離プログラム。
(付記14) 前記画像読み込み工程では、前記手書き文字列の画像を画素データとして読み込み、前記文字列分離部は、前記文字列部分に対応する画素を、1文字ごとに統合された筆跡の座標に基づいて、隣接する文字のうちの一方の文字に対応する画素、他方の文字に対応する画素、及び両方の文字に対応する画素に分類し、前記分類された画素のうち、前記一方の文字に対応する画素と前記両方の文字に対応する画素とを、前記一方の文字の画素データとして分離し、前記他方の文字に対応する画素と前記両方の文字に対応する画素とを、前記他方の文字の画素データとして分離することを特徴とする付記13に記載の手書き文字分離プログラム。
(付記15) 前記対応座標抽出工程では、前記手書き文字列の画像を太線化し、当該太線化後の画像と対応する、前記筆跡座標データの筆跡の座標を抽出することを特徴とする付記11〜14のいずれかに記載の手書き文字分離プログラム。
50 手書き文字分離部(手書き文字分離装置)
62 画像読み込み部
64 文字列抽出部
66 座標データ取得部
68 対応座標抽出部
70 座標統合部
72 文字列分離部

Claims (7)

  1. 手書き文字列を含む画像を読み込む画像読み込み部と、
    前記手書き文字列の筆跡の座標に関する筆跡座標データを取得する座標データ取得部と、
    前記画像から、前記手書き文字列の画像を抽出する文字列抽出部と、
    前記筆跡座標データから前記筆跡の各ストロークの座標データを抽出し、前記手書き文字列の画像の黒画像部分に所定の割合以上重複する筆跡の座標を抽出する対応座標抽出部と、
    前期筆跡座標データから前記対応座標抽出部により抽出された筆跡の座標を、1文字ごとに統合する座標統合部と、
    前記座標統合部により1文字ごとに統合された筆跡の座標に基づいて、前記手書き文字列の画像を分離する文字列分離部と、を備える手書き文字分離装置。
  2. 前記文字列抽出部は、前記手書き文字列の画像から、隣接する文字と接触している接触文字部分を抽出し、
    前記対応座標抽出部は、前記接触文字部分に対応する筆跡の座標を抽出することを特徴とする請求項1に記載の手書き文字分離装置。
  3. 前記文字列分離部は、前記手書き文字列の画像を分離する際に、隣接する文字間で重なり合っている部分を、隣接する各文字に割り振ることを特徴とする請求項1又は2に記載の手書き文字分離装置。
  4. 前記画像読み込み部は、前記手書き文字列の画像を画素データとして読み込み、
    前記文字列分離部は、
    前記文字列部分に対応する画素を、1文字ごとに統合された筆跡の座標に基づいて、隣接する文字のうちの一方の文字に対応する画素、他方の文字に対応する画素、及び両方の文字に対応する画素に分類し、
    前記分類された画素のうち、前記一方の文字に対応する画素と前記両方の文字に対応する画素とを、前記一方の文字の画素データとして分離し、前記他方の文字に対応する画素と前記両方の文字に対応する画素とを、前記他方の文字の画素データとして分離することを特徴とする請求項3に記載の手書き文字分離装置。
  5. 前記対応座標抽出部は、前記手書き文字列の画像を太線化し、当該太線化後の画像と対応する、前記筆跡座標データの筆跡の座標を抽出することを特徴とする請求項1〜4のいずれか一項に記載の手書き文字分離装置。
  6. コンピュータが、
    手書き文字列を含む画像を読み込む画像読み込み工程と、
    前記手書き文字列の筆跡の座標に関する筆跡座標データを取得する座標データ取得工程と、
    前記画像から、前記手書き文字列の画像を抽出する文字列抽出工程と、
    前記筆跡座標データから前記筆跡の各ストロークの座標データを抽出し、前記手書き文字列の画像の黒画像部分に所定の割合以上重複する筆跡の座標を抽出する対応座標抽出工程と、
    前記筆跡座標データから前記対応座標抽出工程で抽出された筆跡の座標を、1文字ごとに統合する座標統合工程と、
    前記座標統合工程で1文字ごとに統合された筆跡の座標に基づいて、前記手書き文字列の画像を分離する文字列分離工程と、を実行することを特徴とする手書き文字分離方法。
  7. コンピュータに、
    手書き文字列を含む画像を読み込む画像読み込み工程、
    前記手書き文字列の筆跡の座標に関する筆跡座標データを取得する座標データ取得工程、
    前記画像から、前記手書き文字列の画像を抽出する文字列抽出工程、
    前記筆跡座標データから前記筆跡の各ストロークの座標データを抽出し、前記手書き文字列の画像の黒画像部分に所定の割合以上重複する筆跡の座標を抽出する対応座標抽出工程、
    前記筆跡座標データから前記対応座標抽出工程で抽出された筆跡の座標を、1文字ごとに統合する座標統合工程、及び
    前記座標統合工程で1文字ごとに統合された筆跡の座標に基づいて、前記手書き文字列の画像を分離する文字列分離工程、を実行させることを特徴とする手書き文字分離プログラム。
JP2010134214A 2010-06-11 2010-06-11 手書き文字分離装置、手書き文字分離方法及び手書き文字分離プログラム Expired - Fee Related JP5505106B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010134214A JP5505106B2 (ja) 2010-06-11 2010-06-11 手書き文字分離装置、手書き文字分離方法及び手書き文字分離プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010134214A JP5505106B2 (ja) 2010-06-11 2010-06-11 手書き文字分離装置、手書き文字分離方法及び手書き文字分離プログラム

Publications (2)

Publication Number Publication Date
JP2011258129A JP2011258129A (ja) 2011-12-22
JP5505106B2 true JP5505106B2 (ja) 2014-05-28

Family

ID=45474210

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010134214A Expired - Fee Related JP5505106B2 (ja) 2010-06-11 2010-06-11 手書き文字分離装置、手書き文字分離方法及び手書き文字分離プログラム

Country Status (1)

Country Link
JP (1) JP5505106B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6229254B2 (ja) * 2012-10-05 2017-11-15 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム
JP6229303B2 (ja) * 2013-05-16 2017-11-15 富士通株式会社 プログラム、情報処理装置および文字認識方法
JP6519361B2 (ja) * 2015-07-01 2019-05-29 富士通株式会社 手書き文字修正プログラム、手書き文字修正装置及び手書き文字修正方法
US10997402B2 (en) * 2018-07-03 2021-05-04 Fuji Xerox Co., Ltd. Systems and methods for real-time end-to-end capturing of ink strokes from video

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2985935B2 (ja) * 1995-10-04 1999-12-06 日本電気株式会社 手書文字・図形読取装置
JP3815934B2 (ja) * 1999-12-24 2006-08-30 富士通株式会社 手書き文字認識装置および方法

Also Published As

Publication number Publication date
JP2011258129A (ja) 2011-12-22

Similar Documents

Publication Publication Date Title
US20200065601A1 (en) Method and system for transforming handwritten text to digital ink
JP4698289B2 (ja) カメラで取得されたドキュメント用の低解像度のocr
JP5647919B2 (ja) 文字認識装置、文字認識方法、文字認識システム、および文字認識プログラム
US9292739B1 (en) Automated recognition of text utilizing multiple images
JP5181887B2 (ja) 電子書類を照合するシステム及び照合方法
US20170032493A1 (en) Image display apparatus and image display method
CN112818951B (zh) 一种票证识别的方法
US9081495B2 (en) Apparatus and method for processing data in terminal having touch screen
EP3058513B1 (en) Multi-color channel detection for note recognition and management
JP5505106B2 (ja) 手書き文字分離装置、手書き文字分離方法及び手書き文字分離プログラム
WO2001054054A9 (en) Word recognition using silhouette bar codes
CN113901952A (zh) 一种基于深度学习的印刷体与手写体分开文字识别方法
US9323726B1 (en) Optimizing a glyph-based file
US9367237B2 (en) Shaping device
CN113011412A (zh) 基于笔顺及ocr文字识别方法、装置、设备及存储介质
JP2017120503A (ja) 情報処理装置、情報処理装置の制御方法、及びプログラム
CN113486171B (zh) 一种图像处理方法及装置、电子设备
JP3898645B2 (ja) 帳票書式編集装置および帳票書式編集プログラム
JP4936250B2 (ja) 書込み抽出方法、書込み抽出装置および書込み抽出プログラム
JP4628278B2 (ja) 表認識装置、及びコンピュータプログラム
US5894525A (en) Method and system for simultaneously recognizing contextually related input fields for a mutually consistent interpretation
WO2015189941A1 (ja) 情報処理装置、情報処理方法、および、プログラム
JP4974367B2 (ja) 領域分割方法及び装置、並びにプログラム
JP5105440B2 (ja) 情報処理装置、文字認識方法、文字認識プログラム、および、文字認識プログラムを記録した、コンピュータ読取り可能な記録媒体
JP4431335B2 (ja) 文字列読み取りプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130403

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140207

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140218

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140303

R150 Certificate of patent or registration of utility model

Ref document number: 5505106

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees