JP5630098B2 - 情報処理装置およびプログラム - Google Patents
情報処理装置およびプログラム Download PDFInfo
- Publication number
- JP5630098B2 JP5630098B2 JP2010146894A JP2010146894A JP5630098B2 JP 5630098 B2 JP5630098 B2 JP 5630098B2 JP 2010146894 A JP2010146894 A JP 2010146894A JP 2010146894 A JP2010146894 A JP 2010146894A JP 5630098 B2 JP5630098 B2 JP 5630098B2
- Authority
- JP
- Japan
- Prior art keywords
- line
- lines
- character
- information processing
- drawn
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Character Discrimination (AREA)
- Position Input By Displaying (AREA)
Description
また、本発明の請求項5に係る情報処理装置は、請求項4に記載の態様において、前記複数の線のうち、第2閾値未満の間隔で配置された一連の線を1つの線群に分類する分類手段を具備し、前記決定手段は、前記分類手段により分類された各線群が描かれる領域の大きさに応じてそれぞれ前記第1閾値を決定し、前記検出手段は、前記分類手段により1つの線群に分類された一連の線のうち、描かれる領域の大きさが前記決定手段により決定された第1閾値未満であり、且つ他の線と交差しないことを前記条件として満たすものを検出することを特徴とする。
請求項2に記載の情報処理装置によれば、文字認識を行う範囲を絞り込むことができる。
請求項3に記載の情報処理装置によれば、描かれた複数の文字における予め決められた種類の文字の位置を絞り込むことができる。
請求項4、5に記載の情報処理装置によれば、描かれた複数の文字の大きさに応じて、予め決められた種類の文字を認識することができる。
請求項6、7に記載の情報処理装置によれば、この構成を用いない場合に比べて、文字を区切る位置を誤って特定する可能性を低減させることができる。
請求項8に記載の情報処理装置によれば、予め決められた種類の文字を認識することができる。
請求項9に記載のプログラムによれば、予め決められた種類の文字と区別して、これ以外の文字を認識することができる。
1−1.全体構成
本発明の実施形態である情報処理システム9の構成を説明する。
図1は、情報処理システム9のハードウェア構成を説明するためのブロック図である。図1に示すように、情報処理システム9は、情報処理装置1と電子ペン2を含む。
受信部15は、電子ペン2から送信されるデータを受信するためのインターフェースとして機能する。
ストロークの識別記号は、図2(e)に示すようにそのストロークが示す線の描かれた順に並べられたリストとしてRAM13に記憶される。
図3は、情報処理装置1の機能的構成を説明するためのブロック図である。
取得手段111は、電子ペン2から送信される撮像画像データから一筆で描かれる線をそれぞれ表す複数のストロークを特定し、各ストロークをそれぞれ表す情報であるストローク情報を取得する。取得手段111により、手書きの文字から、図2(b)や図2(d)に示したストローク情報が取得される。
次に、情報処理システム9の動作を説明する。
図4は、情報処理システム9の動作を示すフロー図である。CPU11は、受信部15を介して電子ペン2から複数の線(以下、線群という)をそれぞれ表す各ストローク情報を取得すると(ステップS101)、この線群の中から、区切線を検出したか否か判断する(ステップS102)。区切線を検出した場合(ステップS102;YES)、CPU11は、区切線の前後または左右で線群を区分し(ステップS103)、区分されたグループごとに文字認識処理を行う(ステップS104)。そして、CPU11は、グループごとの認識結果を合成する(ステップS105)。すなわち、この場合、CPU11は、各グループに属する線から文字認識処理により認識された文字の文字コードの配列を各グループの位置に応じて決定する。
以上が実施形態の説明であるが、この実施形態の内容は以下のように変形し得る。また、以下の変形例を組み合わせてもよい。
実施形態において、ストローク情報は、電子ペン2の赤外線カメラを用いて用紙に予め印刷されたパターンを撮像することで取得されていたが、他の手段により取得されてもよい。例えば、電子ペン2に代えて、ペン先の接触や押圧力を感知するタブレット等を用いてもよい。
(2−1)第1閾値に関する条件
実施形態において、第1閾値は、予め定められた大きさを示す絶対値であったが、検出対象である線群に属する各線の大きさに応じて相対的に定まる値であってもよい。例えば、線群に属する各線の長さについて、相加平均や相乗平均等の代表値を算出し、この代表値に応じて第1閾値を決定してもよい。すなわち、検出手段112は、線群の大きさに応じて第1閾値を決定する決定手段を有していてもよい。
実施形態において、区切線は、周囲の他の線との相対的な位置関係に関わらず検出されたが、周囲の他の線との相対的な位置関係によって検出されてもよい。例えば、線群がx軸方向に並んでおり、x軸方向に伸びる横書き1行の文字列を表しているとする。句読点等の区切文字は、横書き1行の文字列において、高さ方向の中央よりも下に描かれることが多い。したがって、この場合、検出手段112は、上記の線群が分布する範囲の中央を通るx軸方向に平行な中心線を導出し、この中心線よりも下方向にあるものを検出してもよい。同様に、線群がy軸方向に並んでおり、y軸方向に伸びる縦書き1列の文字列を表している場合には、区切文字は、幅方向の中央よりも右に描かれることが多い。したがって、この場合、検出手段112は、上記の線群が分布する範囲の中央を通るy軸方向に平行な中心線を導出し、この中心線よりも右方向にあるものを検出してもよい。すなわち、検出手段112は、線群の全体の位置に対する、その線の相対的な位置により、区切線か否かを判断すればよい。要するに、検出手段112は、複数の線のうち、自己の分類された線群における位置が予め定められた条件を満たすものを検出すればよい。
実施形態では、検出手段112は、電子ペン2から取得した全てのストロークによりそれぞれ示される複数の線を検出対象の線群として、この線群から区切線を検出していたが、区切線を検出する前に、線群をさらに細かい線群に分類してもよい。例えば、各線の間隔を第2閾値と比較し、第2閾値未満の間隔で配置された一連の線を1つの線群に分類するようにしてもよい。一般に文書は行や列を有しており、行単位または列単位の処理が可能なことが多い。したがって、例えば、文字の間隔が3mm未満であり、行間が5mm以上である手書き文書に対して、例えば第2閾値を4mmと設定すれば、行ごとに線群が分類される。この線群は、4mm未満の間隔で配置された一連の線である。これにより、区分手段113による区分の負荷が低減される。
実施形態では、区切線は他の線に交差していなければ、他の線までの距離に関わりなく検出されたが、他の線までの距離に基づいて検出されてもよい。例えば、検出手段112は、線群のうち、他の線までの距離が第3閾値以上であるものを検出するようにしてもよい。
このように、第3閾値を設定することで、一文字を構成する一部の線を誤って区切線として検出することが抑制される。
実施形態では、検出手段112は、連続して描かれた他の線に関係なく区切線を検出していたが、連続して描かれた他の線に応じて区切線の検出を変化させてもよい。
実施形態では、ストロークが示す線の角度に関わらず検出手段112は区切線を検出していたが、検出手段112は、ストロークが示す線の角度に応じて区切線を検出してもよい。すなわち、検出手段112は、角度が予め定められた範囲内であるものを検出するように構成されていてもよい。
(3−1)実施形態において、合成手段115は、認識手段114によりグループごとにそれぞれ認識された文字を、これらの各グループの配置に応じて合成していたが、これらの認識された文字を合成しなくてもよい。
Claims (9)
- それぞれが一筆で描かれる複数の線のうち、描かれる領域の大きさが第1閾値未満であり、且つ他の線と交差しないことを条件として満たすものを検出する検出手段と、
前記検出手段により検出された線を、予め決められた種類の文字を構成する特定線として特定する特定手段と、
前記複数の線のうち、前記特定線以外の線により構成される文字に対して文字認識を行う第1認識手段と、
前記第1認識手段による文字認識の結果を出力する出力手段と
を具備し、
前記条件は、描かれた方向を表す角度が予め定められた範囲内であることを含む
ことを特徴とする情報処理装置。 - 前記複数の線に対する、前記特定線の描かれた順序または位置を取得する取得手段と、
前記取得手段により取得された前記順序または位置に基づいて、前記複数の線のうち、前記特定線以外の線を複数のグループに区分する区分手段とを具備し、
前記第1認識手段は、前記区分手段により前記複数のグループに区分された線によりそれぞれ構成される文字に対して当該グループごとに文字認識を行う
ことを特徴とする請求項1に記載の情報処理装置。 - 前記条件は、前記複数の線に対する相対的な位置に基づくものである
ことを特徴とする請求項1または2に記載の情報処理装置。 - 前記複数の線が描かれる各領域の大きさに応じて、前記第1閾値を決定する決定手段を具備する
ことを特徴とする請求項1から3のいずれか1項に記載の情報処理装置。 - 前記複数の線のうち、第2閾値未満の間隔で配置された一連の線を1つの線群に分類する分類手段を具備し、
前記決定手段は、
前記分類手段により分類された各線群が描かれる領域の大きさに応じてそれぞれ前記第1閾値を決定し、
前記検出手段は、前記分類手段により1つの線群に分類された一連の線のうち、描かれる領域の大きさが前記決定手段により決定された第1閾値未満であり、且つ他の線と交差しないことを前記条件として満たすものを検出する
ことを特徴とする請求項4に記載の情報処理装置。 - 前記条件は、他の線までの距離が第3閾値以上であることを含む
ことを特徴とする請求項1から5のいずれか1項に記載の情報処理装置。 - 前記条件は、描かれた順序が既に検出した他の線と連続していないことを含む
ことを特徴とする請求項1から6のいずれか1項に記載の情報処理装置。 - 前記特定線により構成される、前記予め決められた種類の文字に対して文字認識を行う第2認識手段を具備し、
前記出力手段は、
前記特定手段による特定の結果として前記第2認識手段が認識した文字と、前記第1認識手段による文字認識の結果として当該第1認識手段が認識した文字とを合成して出力する
ことを特徴とする請求項1から7のいずれか1項に記載の情報処理装置。 - コンピュータを、
それぞれが一筆で描かれる複数の線のうち、描かれる領域の大きさが第1閾値未満であり、且つ他の線と交差しないことを条件として満たすものを検出する検出手段と、
前記検出手段により検出された線を、予め決められた種類の文字を構成する特定線として特定する特定手段と、
前記複数の線のうち、前記特定線以外の線により構成される文字に対して文字認識を行う第1認識手段と、
前記第1認識手段による文字認識の結果を出力する出力手段と
して機能させるとともに、
描かれた方向を表す角度が予め定められた範囲内であることを、前記条件が含むように前記コンピュータを機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010146894A JP5630098B2 (ja) | 2010-06-28 | 2010-06-28 | 情報処理装置およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010146894A JP5630098B2 (ja) | 2010-06-28 | 2010-06-28 | 情報処理装置およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012008980A JP2012008980A (ja) | 2012-01-12 |
JP5630098B2 true JP5630098B2 (ja) | 2014-11-26 |
Family
ID=45539405
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010146894A Expired - Fee Related JP5630098B2 (ja) | 2010-06-28 | 2010-06-28 | 情報処理装置およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5630098B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6426417B2 (ja) * | 2014-09-26 | 2018-11-21 | 株式会社東芝 | 電子機器、方法及びプログラム |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62219187A (ja) * | 1986-03-20 | 1987-09-26 | Matsushita Electric Ind Co Ltd | 文字認識装置 |
JPH0554193A (ja) * | 1991-06-10 | 1993-03-05 | Fuji Facom Corp | 文字認識装置 |
JPH11126236A (ja) * | 1997-10-22 | 1999-05-11 | Matsushita Electric Ind Co Ltd | オンライン手書き文字認識装置およびオンライン手書き文字認識方法ならびにその方法を記録した記録媒体 |
-
2010
- 2010-06-28 JP JP2010146894A patent/JP5630098B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2012008980A (ja) | 2012-01-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9189694B2 (en) | Image processing device and image processing method | |
Nikolaou et al. | Segmentation of historical machine-printed documents using adaptive run length smoothing and skeleton segmentation paths | |
US7302099B2 (en) | Stroke segmentation for template-based cursive handwriting recognition | |
JP6286866B2 (ja) | 画像処理装置および画像処理方法 | |
JP4787275B2 (ja) | セグメント化ベースの認識 | |
JP5729930B2 (ja) | 文書内のテキスト行を区分するための方法 | |
Razak et al. | Off-line handwriting text line segmentation: A review | |
US10740899B2 (en) | Image processing apparatus for identifying region within image, information processing method, and storage medium | |
KR101685473B1 (ko) | 화상 처리 장치 및 화상 처리 방법 | |
Bhattacharya et al. | An end-to-end system for Bangla online handwriting recognition | |
Din et al. | Line and ligature segmentation in printed Urdu document images | |
US8989485B2 (en) | Detecting a junction in a text line of CJK characters | |
Shanjana et al. | Offline recognition of malayalam handwritten text | |
Chiang et al. | Recognizing arbitrarily connected and superimposed handwritten numerals in intangible writing interfaces | |
Shafait et al. | Layout analysis of Urdu document images | |
CN109409180B (zh) | 图像分析装置和图像分析方法 | |
US9418281B2 (en) | Segmentation of overwritten online handwriting input | |
US11551461B2 (en) | Text classification | |
JP5630098B2 (ja) | 情報処理装置およびプログラム | |
EP3477547B1 (en) | Optical character recognition systems and methods | |
US9251412B2 (en) | Segmentation of devanagari-script handwriting for recognition | |
JP5041775B2 (ja) | 文字切出方法及び文字認識装置 | |
Srivastava et al. | Separation of machine printed and handwritten text for Hindi documents | |
JP5880472B2 (ja) | 画像処理装置及びプログラム | |
Mandal et al. | Slant Estimation and Correction for Online Handwritten Bengali Words |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130522 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140227 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140311 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140507 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140909 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140922 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5630098 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |