JP2012008980A - 情報処理装置およびプログラム - Google Patents

情報処理装置およびプログラム Download PDF

Info

Publication number
JP2012008980A
JP2012008980A JP2010146894A JP2010146894A JP2012008980A JP 2012008980 A JP2012008980 A JP 2012008980A JP 2010146894 A JP2010146894 A JP 2010146894A JP 2010146894 A JP2010146894 A JP 2010146894A JP 2012008980 A JP2012008980 A JP 2012008980A
Authority
JP
Japan
Prior art keywords
line
lines
character
information processing
drawn
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010146894A
Other languages
English (en)
Other versions
JP5630098B2 (ja
Inventor
Takashi Isozaki
隆司 磯崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2010146894A priority Critical patent/JP5630098B2/ja
Publication of JP2012008980A publication Critical patent/JP2012008980A/ja
Application granted granted Critical
Publication of JP5630098B2 publication Critical patent/JP5630098B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Discrimination (AREA)
  • Position Input By Displaying (AREA)

Abstract

【課題】予め決められた種類の文字と区別して、これ以外の文字を認識する。
【解決手段】CPU11は、受信部15を介して電子ペン2からストローク群をそれぞれ表す各ストローク情報を取得すると、このストローク群の中から、区切線を検出したか否か判断する。区切線を検出した場合、CPU11は、区切線の前後または左右でストローク群を区分し、区分されたグループごとに文字認識処理を行う。そして、CPU11は、グループごとの認識結果を合成する。区切線を検出しなかった場合、CPU11は、ストローク群の区分を行わず、このストローク群を1つのグループとして文字認識処理を行う。文字認識処理が終了すると、CPU11は、文字認識処理の結果である文字列を表示部16に表示させる。
【選択図】図1

Description

本発明は、情報処理装置およびプログラムに関する。
手書き文字を認識するための様々な技術が開発されている。特許文献1には、手書きの前に予め文字種を指定して文字認識を行う技術が記載されている。特許文献2には、手書き入力用の枠に沿って手書きされた文字に対し、その枠を領域分割して拗音等を認識する技術が記載されている。
特開平8−7044号公報 特開平8−30735号公報
本発明の目的は、予め決められた種類の文字と区別して、これ以外の文字を認識することにある。
上述した課題を解決するため、本発明の請求項1に係る情報処理装置は、それぞれが一筆で描かれる複数の線のうち、描かれる領域の大きさが第1閾値未満であり、且つ他の線と交差しないことを条件として満たすものを検出する検出手段と、前記検出手段により検出された線を、予め決められた種類の文字を構成する特定線として特定する特定手段と、前記複数の線のうち、前記特定線以外の線により構成される文字に対して文字認識を行う第1認識手段と、前記第1認識手段による文字認識の結果とを出力する出力手段とを具備することを特徴とする。
また、本発明の請求項2に係る情報処理装置は、請求項1に記載の態様において、前記複数の線に対する、前記特定線の描かれた順序または位置を取得する取得手段と、前記取得手段により取得された前記順序または位置に基づいて、前記複数の線のうち、前記特定線以外の線を複数のグループに区分する区分手段とを具備し、前記第1認識手段は、前記区分手段により前記複数のグループに区分された線によりそれぞれ構成される文字に対して当該グループごとに文字認識を行うことを特徴とする。
また、本発明の請求項3に係る情報処理装置は、請求項1または2に記載の態様において、前記条件は、前記複数の線に対する相対的な位置に基づくものであることを特徴とする。
また、本発明の請求項4に係る情報処理装置は、請求項1から3のいずれかに記載の態様において、前記複数の線のうち、第2閾値未満の間隔で配置された一連の線を1つの線群に分類する分類手段と、前記分類手段により分類された各線群が描かれる領域の大きさに応じてそれぞれ前記第1閾値を決定する決定手段とを具備し、前記検出手段は、前記分類手段により1つの線群に分類された一連の線のうち、描かれる領域の大きさが前記決定手段により決定された第1閾値未満であり、且つ他の線と交差しないことを前記条件として満たすものを検出することを特徴とする。
また、本発明の請求項5に係る情報処理装置は、請求項1から4のいずれかに記載の態様において、前記条件は、他の線までの距離が第3閾値以上であることを含むことを特徴とする。
また、本発明の請求項6に係る情報処理装置は、請求項1から5のいずれかに記載の態様において、前記条件は、描かれた順序が既に検出した他の線と連続していないことを含むことを特徴とする。
また、本発明の請求項7に係る情報処理装置は、請求項1から6のいずれかに記載の態様において、前記条件は、描かれた方向を表す角度が予め定められた範囲内であることを含むことを特徴とする。
また、本発明の請求項8に係る情報処理装置は、請求項1から7のいずれかに記載の態様において、前記特定線により構成される、前記予め決められた種類の文字に対して文字認識を行う第2認識手段を具備し、前記出力手段は、前記特定手段による特定の結果として前記第2認識手段が認識した文字と、前記第1認識手段による文字認識の結果として当該第1認識手段が認識した文字とを合成して出力することを特徴とする。
また、本発明の請求項9に係るプログラムは、コンピュータを、それぞれが一筆で描かれる複数の線のうち、描かれる領域の大きさが第1閾値未満であり、且つ他の線と交差しないことを条件として満たすものを検出する検出手段と、前記検出手段により検出された線を、予め決められた種類の文字を構成する特定線として特定する特定手段と、前記複数の線のうち、前記特定線以外の線により構成される文字に対して文字認識を行う第1認識手段と、前記第1認識手段による文字認識の結果とを出力する出力手段として機能させるためのプログラムである。
請求項1に記載の情報処理装置によれば、予め決められた種類の文字と区別して、これ以外の文字を認識することができる。
請求項2に記載の情報処理装置によれば、文字認識を行う範囲を絞り込むことができる。
請求項3に記載の情報処理装置によれば、描かれた複数の文字における予め決められた種類の文字の位置を絞り込むことができる。
請求項4に記載の情報処理装置によれば、描かれた複数の文字の大きさに応じて、予め決められた種類の文字を認識することができる。
請求項5〜7に記載の情報処理装置によれば、この構成を用いない場合に比べて、文字を区切る位置を誤って特定する可能性を低減させることができる。
請求項8に記載の情報処理装置によれば、予め決められた種類の文字を認識することができる。
請求項9に記載のプログラムによれば、予め決められた種類の文字と区別して、これ以外の文字を認識することができる。
情報処理システムのハードウェア構成を説明するためのブロック図である。 電子ペンによる手書き文字を説明するための図である。 情報処理装置の機能的構成を説明するためのブロック図である。 情報処理システムの動作を示すフロー図である。 情報処理システムにより行われる文字認識を説明する図である。 他の線までの距離を説明するための図である。 描かれた順序に応じて検出条件を変える動作を説明するための図である。
1.構成
1−1.全体構成
本発明の実施形態である情報処理システム9の構成を説明する。
図1は、情報処理システム9のハードウェア構成を説明するためのブロック図である。図1に示すように、情報処理システム9は、情報処理装置1と電子ペン2を含む。
CPU11は、ROM12に記憶されているブートローダや記憶部14に記憶されているコンピュータプログラムを読み出して実行することによりバス19を介して接続された情報処理装置1の各部を制御する。例えば、CPU11は、後述する検出手段や認識手段として機能する。
ROM12は半導体素子等で構成された読み出し専用の不揮発性記憶装置である。このROM12には、記憶部14に記憶されている基本OS(Operating System)をRAM(Random Access Memory)13にロードするためのブートローダやBIOS(Basic Input/Output System)などが記憶されている。RAM13はCPU11がプログラムを実行する際のワークエリアとして利用される。記憶部14はハードディスクドライブやフラッシュメモリなどの書き換え可能な不揮発性記憶手段であり、CPU11に読み込まれる基本OSやプログラムを記憶する。また、記憶部14は、文字認識に用いられる辞書として、文字のパターンとその文字のコード(以下、文字コードという)とが対応づけられているパターン辞書141を記憶している。
受信部15は、電子ペン2から送信されるデータを受信するためのインターフェースとして機能する。
電子ペン2は、専用の用紙に手書きの文字を書き込む際に、ペン先の動作や軌跡をデータ化して情報処理装置1に供給する装置である。電子ペン2により文字が書き込まれる用紙には、赤外線を吸収する顔料によって用紙の位置に応じたパターンが印刷されている。電子ペン2は、ペン先部分に赤外線カメラを備えており、このカメラによって撮像された画像を表す撮像画像データを情報処理装置1に送信する。ROM12には、用紙に印刷されたパターンとそのパターンの用紙における位置との対応表が記憶されており、情報処理装置1のCPU11は、この対応表を参照して撮像画像データに含まれるパターンを解析することにより、電子ペン2のペン先の動作や軌跡を表す情報を取得する。
図2は、電子ペン2による手書き文字を説明するための図である。電子ペン2のペン先を用紙の点P1に接触させ、点P2→点P3→点P4を通過させて点P5まで移動させた後に用紙から離すと、用紙には図2(a)に示す線が描かれる。以下、この電子ペン2のペン先が用紙に接触してから離れるまでの一連の動作を「ストローク」と呼ぶ。すなわち、ストロークとは、一筆で描かれる線を表す一連の動作である。このとき、ペン先は点P1から点P5まで移動したストロークをデータ化する。具体的には、電子ペン2は用紙との接触を検知し、用紙に印刷されたパターンの撮像を開始する。そして、ペン先が用紙に接触したまま移動させられる期間にわたって、電子ペン2は、一定の時間間隔(例えば100ミリ秒)ごとに撮像された撮像画像データを情報処理装置1に送信する。そして、電子ペン2は用紙から離れたことを検知すると、撮像を終了する。
CPU11は、ペン先が点P1に接触したときに、そのペン先に備えられた赤外線カメラが撮像した画像から、点P1の座標である(x1、y1)を算出する。そして、CPU11は、このときの時刻を示す時刻情報t1と算出された座標(x1、y1)との組をRAM13に記憶する。
次に、CPU11は、上記の時間間隔をおいて撮像された画像から、ペン先が通過している位置の座標を算出する。例えば、ペン先が、点P1に接触してから100ミリ秒後に点P2を通過したとすると、CPU11は、赤外線カメラが撮像した画像から点P2の座標である(x2、y2)を算出する。そして、CPU11は、このときの時刻を示す時刻情報t2と算出された座標(x2、y2)との組をRAM13に記憶する。
電子ペン2のペン先は、点P5まで移動させられた後、用紙から離される。電子ペン2は、このタイミングを検知して、点P5の座標を示すパターンが印刷された部分を赤外線カメラにより撮像させる。CPU11は、この画像から点P5の座標である(x5、y5)を算出する。そして、CPU11は、RAM13に記憶させた時刻と座標との複数組のリストに固有の識別記号(ここでは「st001」)を付与し、これによって得られる図2(b)に示す情報を1つのストローク情報として扱う。
ストローク「st001」が記憶された後、さらに電子ペン2により線が描かれる。すなわち、用紙から離れた電子ペン2のペン先をユーザが用紙の点P6に接触させ、点P7→点P8を通過させて点P9まで移動させた後に用紙から離すと、図2(c)に示す線が描かれる。これにより日本語のカタカナである「イ」が用紙に描かれる。このときのストロークには識別記号として「st002」が割り当てられ、図2(d)に示すストローク情報がRAM13に記憶される。
ストロークの識別記号は、図2(e)に示すようにそのストロークが示す線の描かれた順に並べられたリストとしてRAM13に記憶される。
図1に戻る。表示部16は、CPU11からの指示に応じて、文字認識処理によりストローク情報から認識された文字を含む文書等を表示する。表示部16は、例えば、複数の画素により構成される表示面を有する。
1−2.機能的構成
図3は、情報処理装置1の機能的構成を説明するためのブロック図である。
取得手段111は、電子ペン2から送信される撮像画像データから一筆で描かれる線をそれぞれ表す複数のストロークを特定し、各ストロークをそれぞれ表す情報であるストローク情報を取得する。取得手段111により、手書きの文字から、図2(b)や図2(d)に示したストローク情報が取得される。
検出手段112は、取得手段111により取得された各ストローク情報によりそれぞれ表される複数の線のうち、描かれる領域の大きさが第1閾値未満であり、且つ他の線と交差しないものを検出する。そして、CPU11は、検出手段112により検出された線を、予め決められた種類の文字を構成する特定線として特定する。以下、CPU11により特定される特定線を「区切線」と呼ぶ。“描かれる領域の大きさが第1閾値未満である”とは、対象となる線の長さやその線を包含する最小の矩形(以下、外接矩形という)の面積等が予め定められた閾値である第1閾値未満であることを意味する。区切線は、小数点や句読点、カンマ等、文字同士を区切るための予め決められた種類の文字(以下、区切文字という)を単独で構成するものである。したがって、区切線は他の線と交差しない。そして、区切文字以外の文字に比べ、区切文字は小さいことが多い。そこで、区切線の大きさには上限が設けられている。例えば、線の長さについて定められている第1閾値が2mmである場合、検出手段112は、2mm未満の長さを有する線を区切線として検出する。なお、線の長さは、ストローク情報の座標群から求められる。
区分手段113は、検出手段112により検出された区切線の描かれた順序または位置に基づいて、この区切線以外の線を複数のグループに区分する。例えば、図2(e)に示したリストがRAM13に記憶されていて、検出手段112が検出した区切線の識別記号が「st003」である場合を想定する。この場合において、各線の描かれた順序に基づいてこれらを区分するときには、区分手段113は、図2(e)で示したストロークの順序を示すリストを参照し、識別記号「st003」を有するストロークが示す線(すなわち、区切線)以外の各線を、順序に沿って「st001」「st002」の線の第1グループと、「st004」「st005」「st006」…の線の第2グループとに区分する。
また、区分手段113は、各ストロークが示す線の位置に基づいてこれらを区分する場合には、以下の処理を行う。例えば、検出手段112が検出した区切線の識別記号が「st003」である場合、区分手段113は、識別記号「st003」を有するストロークにより示される線の座標からこの線の位置を特定し、特定された位置より右側(x軸の正方向)にある線を示すストロークと左側(x軸の負方向)にある線を示すストロークとを異なるグループに振り分ける。すなわち、区分手段113は、区切線以外の各線を、この区切線の位置を中心として左右に区分する。なお、区分手段113は、複数のストロークにより示される各線を区切線の位置を中心として上下に区分してもよい。
認識手段114は、区分手段113により区分された線により構成される文字をグループごとに認識する。具体的には、グループごとにそのグループに属する線の形状とパターン辞書141に記述されている文字パターンとを照合し、一致度を算出して、最も一致度の高い文字パターンに対応づけられている文字コードを文字認識の結果としてRAM13に記憶させる。
合成手段115は、認識手段114によりグループごとにそれぞれ認識された文字を、これらの各グループの配置に応じて合成する。すなわち、合成手段115は、認識手段114によりRAM13に記憶された文字コードの配列を、区分手段113により区分されたグループの配置に基づいて決定し、配列された文字コードを文字列としてRAM13に記憶する。上述の例では、第1グループが第2グループよりも左にあった場合、第1グループに属する「st001」「st002」の各線に対して文字認識処理をして得られた文字コードを左側に、第2グループに属する「st004」「st005」「st006」…の各線に対して文字認識処理をして得られた文字コードを右側にそれぞれ配列する。
表示制御手段116は、合成手段115により合成された文字、すなわち、配列が決定されてRAM13に記憶された文字列を表示部16に表示させる。
取得手段111は、複数の線に対する、区切線(特定線)の描かれた順序または位置を取得する取得手段の一例である。また、区分手段113は、取得手段111により取得された順序または位置に基づいて、複数の線のうち、区切線(特定線)以外の線を複数のグループに区分する区分手段の一例である。
2.動作
次に、情報処理システム9の動作を説明する。
図4は、情報処理システム9の動作を示すフロー図である。CPU11は、受信部15を介して電子ペン2から複数の線(以下、線群という)をそれぞれ表す各ストローク情報を取得すると(ステップS101)、この線群の中から、区切線を検出したか否か判断する(ステップS102)。区切線を検出した場合(ステップS102;YES)、CPU11は、区切線の前後または左右で線群を区分し(ステップS103)、区分されたグループごとに文字認識処理を行う(ステップS104)。そして、CPU11は、グループごとの認識結果を合成する(ステップS105)。すなわち、この場合、CPU11は、各グループに属する線から文字認識処理により認識された文字の文字コードの配列を各グループの位置に応じて決定する。
区切線を検出しなかった場合(ステップS102;NO)、CPU11は、線群の区分を行わず、この線群を1つのグループとして文字認識処理を行う(ステップS106)。文字認識処理が終了すると、CPU11は、文字認識処理の結果である文字列を表示部16に表示させる(ステップS107)。
以上のように、情報処理システム9の情報処理装置1は、複数のストロークによりそれぞれ示される線のうち、大きさが第1閾値未満であり、且つ他の線と交差しないものを他の線と区別し、他の線で構成される文字間を区切るものとして利用するので、例えば、手書き文字が描かれる枠が予め定められていない場合であっても、その手書き文字の位置や範囲が特定され、文字の誤認識の可能性は低減する。
図5は、この情報処理システム9により行われる文字認識を説明する図である。図5(a)に示すように、ユーザがこの情報処理システム9の電子ペン2を用いて、手書きで「42.195」という数字を書いたとすると、この情報処理システム9の情報処理装置1は、図5(b)に示すように、区切文字である小数点「.」を表した区切線Dlmを検出し、「42」を第1グループgr1として、「195」を第2グループgr2としてそれぞれ区分する。そして、それぞれのグループについて文字認識処理を行った結果、第1グループgr1からは「4」と「2」の2文字がそれぞれ認識され、第2グループgr2からは「1」「9」「5」の3文字がそれぞれ認識される。このため、情報処理装置1は、小数点「.」を数値の文字認識処理の対象から除外するため、文字の誤認識の可能性が低減する。
例えば、1つのストロークで描かれた線の外接矩形を特定し、その外接矩形の内部をパターン辞書とマッチングさせて、文字認識を行う技術がある。この技術を用いて、図5(d)に示す斜めに傾いた手書文字を認識しようとすると、「2」の外接矩形にその隣の小数点「.」が含まれてしまう場合がある。つまり、「2」と「.」とがまとめて一文字として文字認識の対象となる。その結果、描かれる領域が小さい小数点「.」はノイズと見做され認識されないことも起こり得る。一方、上述した情報処理装置1は、はじめに小数点「.」等の区切文字を表した区切線を検出するので、区切文字の認識漏れが抑制され、その結果、文字認識の精度が向上する。なお、情報処理システム9は、数字、仮名文字や漢字に限らず、英字、ラテン文字、ハングル、アラビア文字、キリル文字等、様々な文字を処理することができる。
3.変形例
以上が実施形態の説明であるが、この実施形態の内容は以下のように変形し得る。また、以下の変形例を組み合わせてもよい。
(1)ストローク情報の取得に関する変形例
実施形態において、ストローク情報は、電子ペン2の赤外線カメラを用いて用紙に予め印刷されたパターンを撮像することで取得されていたが、他の手段により取得されてもよい。例えば、電子ペン2に代えて、ペン先の接触や押圧力を感知するタブレット等を用いてもよい。
(2)区切線(特定線)の条件に関する変形例
(2−1)第1閾値に関する条件
実施形態において、第1閾値は、予め定められた大きさを示す絶対値であったが、検出対象である線群に属する各線の大きさに応じて相対的に定まる値であってもよい。例えば、線群に属する各線の長さについて、相加平均や相乗平均等の代表値を算出し、この代表値に応じて第1閾値を決定してもよい。すなわち、検出手段112は、線群の大きさに応じて第1閾値を決定する決定手段を有していてもよい。
用途やユーザに応じて、手書き文字の大きさは様々である。例えば、文字を大きく手書きしているときの句読点は、文字を小さく手書きしているときのカタカナと同程度の長さを有する場合がある。したがって、第1閾値に絶対値を用いると、或る水準の大きさで手書きされた文字にとっては、句読点であっても、別の水準の大きさで手書きされた文字にとっては、カタカナとなり、区切位置の特定が難しい。そこで、上記のようにすれば、句読点等の区切文字の大きさを、周囲の文字の大きさに応じて推定することができるので、第1閾値に絶対値を用いる場合に比べて、文字の区切位置の誤認が低減される可能性がある。
(2−2)相対的位置に関する条件
実施形態において、区切線は、周囲の他の線との相対的な位置関係に関わらず検出されたが、周囲の他の線との相対的な位置関係によって検出されてもよい。例えば、線群がx軸方向に並んでおり、x軸方向に伸びる横書き1行の文字列を表しているとする。句読点等の区切文字は、横書き1行の文字列において、高さ方向の中央よりも下に描かれることが多い。したがって、この場合、検出手段112は、上記の線群が分布する範囲の中央を通るx軸方向に平行な中心線を導出し、この中心線よりも下方向にあるものを検出してもよい。同様に、線群がy軸方向に並んでおり、y軸方向に伸びる縦書き1列の文字列を表している場合には、区切文字は、幅方向の中央よりも右に描かれることが多い。したがって、この場合、検出手段112は、上記の線群が分布する範囲の中央を通るy軸方向に平行な中心線を導出し、この中心線よりも右方向にあるものを検出してもよい。すなわち、検出手段112は、線群の全体の位置に対する、その線の相対的な位置により、区切線か否かを判断すればよい。要するに、検出手段112は、複数の線のうち、自己の分類された線群における位置が予め定められた条件を満たすものを検出すればよい。
なお、線群が横書きであるか縦書きであるかについて判定するには、線群の外接矩形の長手方向とx軸またはy軸との成す角度に応じて判定してもよい。すなわち、この外接矩形の長手方向とx軸の成す角度が、同方向とy軸の成す角度よりも0度に近い場合には、この線群が横書きであると判定し、長手方向とx軸の成す角度が、同方向とy軸の成す角度よりも0度に近くない場合には、この線群が縦書きであると判定すればよい。
また、手書きされるべき範囲を示す予め定められた枠がある場合には、検出手段112は、この枠の位置に対する、その線の相対的な位置により、区切線か否かを判断してもよい。
(2−3)線群に関する条件
実施形態では、検出手段112は、電子ペン2から取得した全てのストロークによりそれぞれ示される複数の線を検出対象の線群として、この線群から区切線を検出していたが、区切線を検出する前に、線群をさらに細かい線群に分類してもよい。例えば、各線の間隔を第2閾値と比較し、第2閾値未満の間隔で配置された一連の線を1つの線群に分類するようにしてもよい。一般に文書は行や列を有しており、行単位または列単位の処理が可能なことが多い。したがって、例えば、文字の間隔が3mm未満であり、行間が5mm以上である手書き文書に対して、例えば第2閾値を4mmと設定すれば、行ごとに線群が分類される。この線群は、4mm未満の間隔で配置された一連の線である。これにより、区分手段113による区分の負荷が低減される。
(2−4)他の線までの距離に関する条件
実施形態では、区切線は他の線に交差していなければ、他の線までの距離に関わりなく検出されたが、他の線までの距離に基づいて検出されてもよい。例えば、検出手段112は、線群のうち、他の線までの距離が第3閾値以上であるものを検出するようにしてもよい。
図6は、他の線までの距離を説明するための図である。図6(a)に示すように、例えば、カタカナの「ホ」は、その右下部に句読点と同程度の長さの線を有しており、この線はストローク「st014」により示されている。描かれる領域の大きさが第1閾値未満であること、および他の線と交差していないことのみをもって判定すると、このストローク「st014」の線は区切線として検出される可能性がある。一方、上述した検出手段112は、他の線までの距離が第3閾値未満である線を区切線として検出しない。すなわち、この検出手段112は、ストローク「st014」の線について、ストローク「st011」の線までの距離としてd1を、ストローク「st012」の線までの距離としてd2をそれぞれ算出し、これを第3閾値であるΔdと比較する。ここで、Δd>d1、またはΔd>d2であれば、この変形例における検出手段112はストローク「st014」の線を区切線として検出せず、ストローク「st011」の線またはストローク「st012」の線と同じグループとして文字認識処理の対象とする。
一方、図6(b)に示すように、漢字の「寸」および読点の「、」という2文字がこの順序の横書きで描かれている場合に、上述した検出手段112は、読点を表すストローク「st024」の線について、ストローク「st021」の線までの距離としてd3を、ストローク「st022」の線までの距離としてd4を、それぞれ算出し、これを第3閾値であるΔdと比較する。ここで、Δd≦d3、かつΔd≦d4であれば、他の線までの距離が第3閾値以上であるから、この変形例における検出手段112はストローク「st024」の線を区切線として検出する。
このように、第3閾値を設定することで、一文字を構成する一部の線を誤って区切線として検出することが抑制される。
また、例えば、図6(c)に示す[i,j]という文字列は、アルファベットの「i」「j」のいずれにも上部に、描かれる領域の大きさが第1閾値未満であり、且つ他の線と交差しない線を有しているが、これらは他の線までの距離が第3閾値未満であるため、区切線として検出されない。一方、カンマ「,」は、描かれる領域が第1閾値未満であり、且つ他の線と交差していない上に、他の線までの距離が第3閾値以上であるため、区切線として検出される。
(2−5)描かれた順序に関する条件
実施形態では、検出手段112は、連続して描かれた他の線に関係なく区切線を検出していたが、連続して描かれた他の線に応じて区切線の検出を変化させてもよい。
図7は、描かれた順序に応じて区切線の検出条件を変える動作を説明するための図である。図7(a)に示すように、例えば、漢字の「点」という字には、下部に点が4つ並んだ「よつてん」、「れんが」または「れっか」等と呼ばれる部首がある。これら4つの点は、それぞれ読点と同程度の大きさを有しており、他の線とも交差していない。したがって、実施形態の検出手段112によると、同図に示すストローク「st031」〜ストローク「st034」の各線は、それぞれ読点を構成する線として誤認識される可能性がある。そしてその結果、線群は区分手段113により間違った位置で区分されてしまう可能性がある。
この変形例では、検出手段112は、区切線が隣接する他の線から孤立していること(つまり、2つ以上の区切線は連続した順序で描かれないこと)に着目し、例えば、上記の部首等と読点とを区別する。具体的には、検出手段112は、上記の部首を構成する4つの線のうち、最初に描かれたストローク「st031」により示される線について、区切線であるか否かを判断する。ストローク「st031」の線は、大きさが第1閾値未満であること、および他のストロークと交差していないことの両方を満たすため、区切線として仮に検出(以下、仮検出という)される。
次に、検出手段112は、上記の順序においてストローク「st031」の線に続いて描かれたストローク「st032」の線について判断する。このとき、検出手段112は、ストローク「st032」の線が、第1閾値未満の大きさであり、且つ他の線と交差していないことを判定するが、直前に描かれたストローク「st031」の線が区切線として仮検出されているため、ストローク「st032」の線を区切線として検出しない。同様に、ストローク「st033」の線およびストローク「st034」の線も区切線として検出しない。なお、検出手段112は、ストローク「st032」〜ストローク「st034」のいずれかにより示される線が区切線でないと判断されたことをもって、ストローク「st031」の線についての仮検出を遡って取り消してもよい。
一方、図7(b)に示すように、漢字の「占」および読点の「、」という2文字がこの順序の縦書きで描かれている場合に、上述した検出手段112は、漢字の「占」を構成する線であるストローク「st041」の線について判断する。ストローク「st041」は、大きさが第1閾値以上であり、また、他の線と交差しているため、区切線ではないと判断される。次に、検出手段112は、読点を表すストローク「st042」の線について、大きさが第1閾値未満であること、および他の線と交差していないことの両方を満たすことを判定する。このとき、ストローク「st042」の線が描かれる直前に描かれたストローク「st041」の線は、区切線として仮検出されていない。したがって、検出手段112は、ストローク「st042」の線を区切線として仮検出する。そして、この直後に続いて描かれた線が、第1閾値未満の大きさであり、且つ他の線と交差していないという判定条件を満たさない限り、ストローク「st042」の線は、上述した仮検出を取り消されない。
このように、或る線を区切線として検出した場合、その次に描かれた線を判定する条件を変えることにより、2つ以上の区切線が連続して描かれることがないという規則に則って手書きされた文書から、区切線をより正確に検出することができる。要するに、検出手段112は、連続して描かれた複数の線を検出しないように構成されていてもよい。
(2−6)角度に関する条件
実施形態では、ストロークが示す線の角度に関わらず検出手段112は区切線を検出していたが、検出手段112は、ストロークが示す線の角度に応じて区切線を検出してもよい。すなわち、検出手段112は、角度が予め定められた範囲内であるものを検出するように構成されていてもよい。
(3)その他の変形例
(3−1)実施形態において、合成手段115は、認識手段114によりグループごとにそれぞれ認識された文字を、これらの各グループの配置に応じて合成していたが、これらの認識された文字を合成しなくてもよい。
また、実施形態において、認識手段114は、区分手段113により区分された線により構成される文字をグループごとに認識していたが、認識手段114は、区切線以外の線を認識すれば、これらをグループごとに認識しなくてもよい。この場合、区分手段113はなくてもよい。要するに、認識手段114は、複数の線のうち、区切線以外の線により構成される文字に対して文字認識を行えばよい。
区切線によって構成される区切文字は、区切文字以外の文字を構成する線に比較して小さいので、文字認識において無視されたり、他の文字の構成要素として誤認されたりする可能性が高い。この情報処理装置1は、認識手段114とは別に検出手段112を備えており、CPU11は、検出手段112により検出された線を、予め決められた種類の文字を構成する区切線として特定する特定手段として機能する。そして、認識手段114は、特定された区切線以外の線を認識するので、区切線は、他の文字の構成要素として誤認される可能性が抑えられる。また、情報処理装置1は、CPU11(特定手段)による特定の結果と、認識手段114(第1認識手段)による文字認識の結果とを、表示部16に表示(出力)するので、予め決められた種類の文字(区切文字)が無視される可能性が抑えられる。
(3−2)また、実施形態において、表示制御手段116は、合成手段115により合成された文字を表示部16に表示させていたが、合成手段115により合成された文字または、認識手段114によって認識された文字に基づいて、この文字に応じた音声を放音させるように放音部(図示せず)を制御してもよい。この場合には、表示部16はなくてもよい。また、これらの認識された文字は、記憶部14に記憶され、表示部16や放音部等によって、外部に出力されなくてもよい。例えば、CPU11が、図示しない通信部を介して、外部端末から検索キーワードを取得した場合に、記憶部14に記憶された文字コードを検索対象として検索してもよい。この場合、検索キーワードに応じて、文字認識の対象となった各線の属するグループから認識された文字を、送信するようにしてもよい。
(3−3)また、実施形態において、ストローク情報は、ストロークが示す線が通過する位置の座標を、その通過する時刻と対応付けて記述したリストであったが、ストローク情報はストロークを表す情報であれば、通過する時刻の情報はなくてもよい。
(3−4)また、実施形態において、ストローク情報は、ストロークが示す線が通過する位置の座標を、その通過する順序に沿って配列したリストであったが、ストローク情報はストロークを表す情報であれば、この態様に限られない。例えば、ストローク情報は、ベジェ曲線を表すパラメータのように、ストロークが示す線が通過しない制御点を用いて、ストロークを表したものであってもよい。
(3−5)実施形態において、検出手段112により検出された区切線は、認識手段114によって認識されなかったが、区切線に対して認識手段114が文字認識処理を行ってもよい。この場合、区切線と照合するパターン辞書には、区切文字のみのパターンとこれに対応する文字コードとを関連づけて記述した専用のパターン辞書を用いてもよい。すなわち、この変形例における認識手段114は、複数の線のうち、特定線以外の線により構成される文字に対して文字認識を行う第1認識手段の一例であるとともに、区切線により構成される、予め決められた種類の文字に対して文字認識を行う第2認識手段の一例である。これにより、パターンの照合に費やす時間が短縮される。なお、この場合、合成手段115は、区切線から認識された区切文字を、区切線以外から認識された文字とを、それぞれのストロークの配置に応じて合成してもよい。また、区切線に対して文字認識処理を行う認識手段と、区切線以外の線に対して文字認識処理を行う認識手段とを別のプロセッサ等で行ってもよい。
(3−6)情報処理装置1のCPU11によって実行されるプログラムは、磁気テープや磁気ディスクなどの磁気記録媒体、光ディスクなどの光記録媒体、光磁気記録媒体、半導体メモリなどの、コンピュータ装置が読み取り可能な記録媒体に記憶された状態で提供し得る。また、このプログラムを、インターネットのようなネットワーク経由でダウンロードさせることも可能である。なお、上記CPU11によって例示した各種の手段としてはCPU以外にも種々の装置を適用することができ、例えば、専用のプロセッサなどを用いてもよい。
1…情報処理装置、11…CPU、111…取得手段、112…検出手段、113…区分手段、114…認識手段、115…合成手段、116…表示制御手段、12…ROM、13…RAM、14…記憶部、141…パターン辞書、15…受信部、16…表示部、2…電子ペン、9…情報処理システム。

Claims (9)

  1. それぞれが一筆で描かれる複数の線のうち、描かれる領域の大きさが第1閾値未満であり、且つ他の線と交差しないことを条件として満たすものを検出する検出手段と、
    前記検出手段により検出された線を、予め決められた種類の文字を構成する特定線として特定する特定手段と、
    前記複数の線のうち、前記特定線以外の線により構成される文字に対して文字認識を行う第1認識手段と、
    前記第1認識手段による文字認識の結果とを出力する出力手段と
    を具備することを特徴とする情報処理装置。
  2. 前記複数の線に対する、前記特定線の描かれた順序または位置を取得する取得手段と、
    前記取得手段により取得された前記順序または位置に基づいて、前記複数の線のうち、前記特定線以外の線を複数のグループに区分する区分手段とを具備し、
    前記第1認識手段は、前記区分手段により前記複数のグループに区分された線によりそれぞれ構成される文字に対して当該グループごとに文字認識を行う
    ことを特徴とする請求項1に記載の情報処理装置。
  3. 前記条件は、前記複数の線に対する相対的な位置に基づくものである
    ことを特徴とする請求項1または2に記載の情報処理装置。
  4. 前記複数の線のうち、第2閾値未満の間隔で配置された一連の線を1つの線群に分類する分類手段と、
    前記分類手段により分類された各線群が描かれる領域の大きさに応じてそれぞれ前記第1閾値を決定する決定手段とを具備し、
    前記検出手段は、前記分類手段により1つの線群に分類された一連の線のうち、描かれる領域の大きさが前記決定手段により決定された第1閾値未満であり、且つ他の線と交差しないことを前記条件として満たすものを検出する
    ことを特徴とする請求項1から3のいずれかに記載の情報処理装置。
  5. 前記条件は、他の線までの距離が第3閾値以上であることを含む
    ことを特徴とする請求項1から4のいずれかに記載の情報処理装置。
  6. 前記条件は、描かれた順序が既に検出した他の線と連続していないことを含む
    ことを特徴とする請求項1から5のいずれかに記載の情報処理装置。
  7. 前記条件は、描かれた方向を表す角度が予め定められた範囲内であることを含む
    ことを特徴とする請求項1から6のいずれかに記載の情報処理装置。
  8. 前記特定線により構成される、前記予め決められた種類の文字に対して文字認識を行う第2認識手段を具備し、
    前記出力手段は、
    前記特定手段による特定の結果として前記第2認識手段が認識した文字と、前記第1認識手段による文字認識の結果として当該第1認識手段が認識した文字とを合成して出力する
    ことを特徴とする請求項1から7のいずれかに記載の情報処理装置。
  9. コンピュータを、
    それぞれが一筆で描かれる複数の線のうち、描かれる領域の大きさが第1閾値未満であり、且つ他の線と交差しないことを条件として満たすものを検出する検出手段と、
    前記検出手段により検出された線を、予め決められた種類の文字を構成する特定線として特定する特定手段と、
    前記複数の線のうち、前記特定線以外の線により構成される文字に対して文字認識を行う第1認識手段と、
    前記第1認識手段による文字認識の結果とを出力する出力手段と
    して機能させるためのプログラム。
JP2010146894A 2010-06-28 2010-06-28 情報処理装置およびプログラム Expired - Fee Related JP5630098B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010146894A JP5630098B2 (ja) 2010-06-28 2010-06-28 情報処理装置およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010146894A JP5630098B2 (ja) 2010-06-28 2010-06-28 情報処理装置およびプログラム

Publications (2)

Publication Number Publication Date
JP2012008980A true JP2012008980A (ja) 2012-01-12
JP5630098B2 JP5630098B2 (ja) 2014-11-26

Family

ID=45539405

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010146894A Expired - Fee Related JP5630098B2 (ja) 2010-06-28 2010-06-28 情報処理装置およびプログラム

Country Status (1)

Country Link
JP (1) JP5630098B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016071382A (ja) * 2014-09-26 2016-05-09 株式会社東芝 電子機器、方法及びプログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62219187A (ja) * 1986-03-20 1987-09-26 Matsushita Electric Ind Co Ltd 文字認識装置
JPH0554193A (ja) * 1991-06-10 1993-03-05 Fuji Facom Corp 文字認識装置
JPH11126236A (ja) * 1997-10-22 1999-05-11 Matsushita Electric Ind Co Ltd オンライン手書き文字認識装置およびオンライン手書き文字認識方法ならびにその方法を記録した記録媒体

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62219187A (ja) * 1986-03-20 1987-09-26 Matsushita Electric Ind Co Ltd 文字認識装置
JPH0554193A (ja) * 1991-06-10 1993-03-05 Fuji Facom Corp 文字認識装置
JPH11126236A (ja) * 1997-10-22 1999-05-11 Matsushita Electric Ind Co Ltd オンライン手書き文字認識装置およびオンライン手書き文字認識方法ならびにその方法を記録した記録媒体

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016071382A (ja) * 2014-09-26 2016-05-09 株式会社東芝 電子機器、方法及びプログラム

Also Published As

Publication number Publication date
JP5630098B2 (ja) 2014-11-26

Similar Documents

Publication Publication Date Title
US9189694B2 (en) Image processing device and image processing method
Nikolaou et al. Segmentation of historical machine-printed documents using adaptive run length smoothing and skeleton segmentation paths
Zahour et al. Arabic hand-written text-line extraction
US7302099B2 (en) Stroke segmentation for template-based cursive handwriting recognition
JP4787275B2 (ja) セグメント化ベースの認識
JP6286866B2 (ja) 画像処理装置および画像処理方法
JP5729930B2 (ja) 文書内のテキスト行を区分するための方法
US10740899B2 (en) Image processing apparatus for identifying region within image, information processing method, and storage medium
US20050182760A1 (en) Apparatus and method for searching for digital ink query
KR101685473B1 (ko) 화상 처리 장치 및 화상 처리 방법
US8559718B1 (en) Defining a layout of text lines of CJK and non-CJK characters
Bhattacharya et al. An end-to-end system for Bangla online handwriting recognition
Din et al. Line and ligature segmentation in printed Urdu document images
US10984277B2 (en) Image analysis apparatus, image analysis method, and non-transitory computer readable medium
Shafait et al. Layout analysis of Urdu document images
US9418281B2 (en) Segmentation of overwritten online handwriting input
US11551461B2 (en) Text classification
JP5630098B2 (ja) 情報処理装置およびプログラム
EP3477547B1 (en) Optical character recognition systems and methods
US9251412B2 (en) Segmentation of devanagari-script handwriting for recognition
Srivastava et al. Separation of machine printed and handwritten text for Hindi documents
JP5039659B2 (ja) 文字認識方法及び文字認識装置
JP5880472B2 (ja) 画像処理装置及びプログラム
Kaur et al. Adverse conditions and techniques for cross-lingual text recognition
Mandal et al. Slant Estimation and Correction for Online Handwritten Bengali Words

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130522

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140227

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140311

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140507

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140909

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140922

R150 Certificate of patent or registration of utility model

Ref document number: 5630098

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees