JP2017090998A - Character recognizing program, and character recognizing device - Google Patents

Character recognizing program, and character recognizing device Download PDF

Info

Publication number
JP2017090998A
JP2017090998A JP2015216648A JP2015216648A JP2017090998A JP 2017090998 A JP2017090998 A JP 2017090998A JP 2015216648 A JP2015216648 A JP 2015216648A JP 2015216648 A JP2015216648 A JP 2015216648A JP 2017090998 A JP2017090998 A JP 2017090998A
Authority
JP
Japan
Prior art keywords
character
character string
stroke
group
writing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015216648A
Other languages
Japanese (ja)
Other versions
JP6055065B1 (en
Inventor
小野 彰
Akira Ono
彰 小野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Aisan Technology Co Ltd
Original Assignee
Aisan Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Aisan Technology Co Ltd filed Critical Aisan Technology Co Ltd
Priority to JP2015216648A priority Critical patent/JP6055065B1/en
Application granted granted Critical
Publication of JP6055065B1 publication Critical patent/JP6055065B1/en
Publication of JP2017090998A publication Critical patent/JP2017090998A/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

PROBLEM TO BE SOLVED: To make possible accurate recognition of multiple character strings inputted by handwriting without specifying the range in which the multiple characters are inputted or the handwriting direction of the character strings and inputted by handwriting from multiple positions without any sequential relationship.SOLUTION: S100: Image information on character strings is generated from a stroke data group constituting inputted multiple character strings. S102: From the generated image information, character areas around individual characters constituting the character strings are identified. S104: Each character area is classified into character string groups each of a character string series. S106: In each character string group, the stroke data contained in the character string group is rearranged in the order of handwriting. S108: The handwriting directions of the character string groups are determined. S118: If the handwriting direction of any character string group differs from the reference direction, the coordinates of the stroke data are so converted as to bring the handwriting direction of that character string to the reference direction. S120: The stroke data rearranged in the order of handwriting for each character string group and having undergone coordinate conversion is subjected to on-line handwritten character recognition processing.SELECTED DRAWING: Figure 3

Description

本発明は、文字が入力される範囲及び文字列の筆記方向を制約せず、かつ複数個所から順序関係なく手書き入力された複数の文字列を認識することができる文字認識プログラム及び文字認識装置に関する。   The present invention relates to a character recognition program and a character recognition apparatus capable of recognizing a plurality of character strings input by handwriting from a plurality of places without order restriction without restricting a range in which characters are input and a writing direction of the character string. .

従来、手書き文字認識の手法として、文字を書くときの動的な過程に基づいて文字を認識するオンライン手書き文字認識が知られている。この種のオンライン手書き文字認識においては、筆順を考慮することで文字の崩しに対して頑健であるという長所がある一方、筆順誤りや字画の書き足しに対して認識が不安定となる短所がある。   2. Description of the Related Art Conventionally, online handwritten character recognition that recognizes characters based on a dynamic process when writing characters is known as a method for handwritten character recognition. This type of on-line handwritten character recognition has the advantage of being robust against breaking characters by considering the stroke order, but has the disadvantage that the recognition becomes unstable with respect to stroke order errors and stroke addition. .

特許文献1には、オンライン手書き文字認識に必要な文字の切出しを行う技術として、1文字以上遡ってストロークが追加された(すなわち、字画が書き足された)場合でも文字の切出しを行えるようにする技術が記載されている。特許文献1に記載の技術によれば、後からストロークが追加された場合であっても、文字列から精度よく文字を切出すことができるとされている。   In Patent Document 1, as a technique for extracting characters necessary for online handwritten character recognition, a character can be extracted even when a stroke is added retroactively (ie, a stroke is added). The technology to do is described. According to the technique described in Patent Document 1, even if a stroke is added later, a character can be accurately cut out from a character string.

特開平11−213092号公報Japanese Patent Laid-Open No. 11-213092

近年、平面状のポインティングデバイス等の入力デバイスを備える可搬型情報端末(例えば、タブレットコンピュータ)の普及により、複数人による寄せ書きや対話型筆談等の用途にこれらの可搬型情報端末が利用されるケースが増えている。複数人による寄せ書きや対話型筆談等の用途においては、入力デバイス上で文字が入力される範囲や筆記方向が制約されず、入力デバイスに対して上下左右様々な方向から順序関係なく文字列が手書き入力されるといった利用形態が想定される。   In recent years, with the widespread use of portable information terminals (for example, tablet computers) equipped with an input device such as a flat pointing device, these portable information terminals are used for applications such as multi-person writing and interactive writing. Is increasing. In applications such as group writing by multiple people and interactive writing, the range of text input and the writing direction on the input device are not restricted, and character strings are handwritten in any order from the top, bottom, left, or right of the input device. A usage form such as input is assumed.

複数人が様々な方向から同時に入力デバイスに文字列を記入した場合、入力デバイスにおいて取得されるストロークの時系列の筆記順が、様々な方向に書かれた複数の文字列の間で入り乱れることになる。つまり、1つの文字を構成する複数のストロークが必ずしも連続する筆記順となっているとは限らず、間に別の文字を構成するストロークが混じっている可能性がある。このようになっていると、オンライン手書き文字認識においてストロークの筆記順に基づいて正しい文字を認識することが困難となり、認識精度が悪くなるという問題がある。   When multiple people write a character string on the input device from various directions at the same time, the writing order of the time series of strokes acquired at the input device is confused between the multiple character strings written in various directions. become. That is, a plurality of strokes constituting one character are not necessarily in a continuous writing order, and strokes constituting another character may be mixed in between. In such a case, it is difficult to recognize a correct character based on the stroke writing order in online handwritten character recognition, and there is a problem that recognition accuracy is deteriorated.

特許文献1における上述の技術は、1つの文字列の中でストロークの追加がある場合を想定したものである。そのため、特許文献1に記載の技術においては、寄せ書きのようにストロークの時系列の筆記順が複数の文字列の間で入り乱れる状況については想定されておらず、上述の問題を解決することはできない。   The technique described in Patent Document 1 assumes a case where a stroke is added in one character string. Therefore, in the technique described in Patent Document 1, it is not assumed that the writing order of the time series of strokes is confused between a plurality of character strings as in the case of a miscellaneous writing, and solving the above-described problem Can not.

本発明は、上述の問題を解決するためになされたものである。本発明は、手書き文字認識において、文字が入力される範囲及び文字列の筆記方向を特定せず、かつ複数個所から順序関係なく手書き入力された複数の文字列を精度よく認識するための技術を提供することを目的とする。   The present invention has been made to solve the above-described problems. The present invention provides a technique for accurately recognizing a plurality of character strings input by handwriting from a plurality of places without specifying the range in which the characters are input and the writing direction of the character string in handwritten character recognition. The purpose is to provide.

本発明の一形態に係る文字認識プログラムは、取得ステップと、画像化ステップと、グループ化ステップと、筆順決定ステップと、方向判定ステップと、ストローク変換ステップと、文字認識ステップとをコンピュータに実行させるものである。   A character recognition program according to an aspect of the present invention causes a computer to execute an acquisition step, an imaging step, a grouping step, a stroke order determination step, a direction determination step, a stroke conversion step, and a character recognition step. Is.

取得ステップは、複数の文字列に含まれる各入力文字の構成要素であるストロークを筆跡の位置座標列で表した情報と、そのストロークが書き込まれた順番である筆記順を表す情報とを含む複数のストロークデータを取得する手順である。ここで入力される複数の文字列は、文字が入力される範囲及び文字列の筆記方向を制約せず、かつ複数個所から順序関係なく手書き入力されたものである。   The acquisition step includes a plurality of pieces of information including strokes that are constituent elements of each input character included in the plurality of character strings, and information indicating a writing order that is an order in which the strokes are written. This is a procedure for acquiring the stroke data. The plurality of character strings input here are those that are input by handwriting from a plurality of places without any restriction on the range in which the characters are input and the writing direction of the character strings.

画像化ステップは、取得ステップにおいて取得されたストロークデータ群を構成する位置座標列に基づいて、手書き入力された複数の文字列の筆跡を表す画像情報を生成する手順である。文字領域特定ステップは、画像化ステップにおいて生成された画像情報に基づいて、複数の文字列を構成する個々の入力文字を囲む領域である文字領域を特定する手順である。   The imaging step is a procedure for generating image information representing handwriting of a plurality of character strings input by handwriting, based on the position coordinate sequence constituting the stroke data group acquired in the acquisition step. The character region specifying step is a procedure for specifying a character region that is a region surrounding individual input characters constituting a plurality of character strings, based on the image information generated in the imaging step.

グループ化ステップは、文字領域特定ステップにおいて特定された各文字領域を一連の文字列ごとの文字列グループに分類する手順である。筆順決定ステップは、ストロークデータ群の筆記順について、グループ化ステップにおいて分類された文字列グループごとに、各文字列グループに属する文字領域に含まれるストロークデータの集合内における筆記順に並べ替えたグループ内順序を決定する手順である。方向判定ステップは、グループ化ステップにおいて分類された文字列グループごとに、各文字列グループに属する文字領域に含まれるストロークデータから導出される特徴に基づいて文字列の筆記方向を判定する手順である。   The grouping step is a procedure for classifying each character area specified in the character area specifying step into a character string group for each series of character strings. In the stroke order determination step, the stroke order of the stroke data group is sorted in the stroke order in the set of stroke data included in the character area belonging to each character string group for each character string group classified in the grouping step. This is a procedure for determining the order. The direction determination step is a procedure for determining the writing direction of the character string for each character string group classified in the grouping step based on the characteristics derived from the stroke data included in the character area belonging to each character string group. .

ストローク変換ステップは、判定された文字列の筆記方向が、オンライン手書き文字認識処理のために定められた基準の筆記方向である基準方向と異なる場合、その文字列の筆記方向が基準方向に合致するように、該当する文字列グループに属する各文字領域に含まれるストロークデータを構成する位置座標列を座標変換する手順である。文字認識ステップは、筆順決定ステップにおいてグループ内順序に変更され、ストローク変換ステップにおいて座標変換された文字列グループごとのストロークデータに対してオンライン手書き文字認識処理を行い、その認識結果を出力する手順である。   In the stroke conversion step, when the determined writing direction of the character string is different from a reference direction that is a reference writing direction determined for online handwritten character recognition processing, the writing direction of the character string matches the reference direction. As described above, this is a procedure for performing coordinate conversion of the position coordinate sequence constituting the stroke data included in each character region belonging to the corresponding character string group. The character recognition step is a procedure for performing on-line handwritten character recognition processing on the stroke data for each character string group that has been changed to the group order in the stroke order determining step and coordinate-converted in the stroke conversion step, and outputting the recognition result. is there.

本発明における手書き文字認識の対象となる複数の文字列は、文字が入力される範囲及び文字列の筆記方向を制約せず、かつ複数個所から順序関係なく手書き入力されたものである。そのため、ストロークデータの筆記順が複数の文字列を構成する各入力文字の中に分散していることが想定される。このようなストロークデータ群に対してそのままオンライン手書き文字認識処理を実行しても、正しい認識結果にはなり得ない。   The plurality of character strings to be subjected to handwritten character recognition according to the present invention are input by handwriting from a plurality of places without ordering, without restricting the range in which characters are input and the writing direction of the character strings. Therefore, it is assumed that the writing order of the stroke data is dispersed among the input characters constituting a plurality of character strings. Even if the online handwritten character recognition process is directly executed on such a stroke data group, a correct recognition result cannot be obtained.

そこで、まず、ストロークデータから変換された画像情報を用いることで、複数の文字列に分散したストロークの筆記順に影響されず、各入力文字に対応する文字領域を特定し、各文字列を構成する文字列グループを特定できる。そして、特定された文字列グループごとに、その文字クループに属する文字領域に含まれるストロークデータを筆記順に並べ替えることで、複数の文字列に分散しているストロークデータの筆記順を、個々の文字列に属する文字ごとの筆記順に並べ替えることができる。   Therefore, first, by using the image information converted from the stroke data, the character region corresponding to each input character is identified and each character string is configured without being affected by the writing order of the strokes dispersed in a plurality of character strings. A string group can be specified. For each identified character string group, the stroke data included in the character area belonging to the character group is rearranged in the writing order, so that the writing order of the stroke data dispersed in the plurality of character strings is changed to the individual characters. It can be rearranged in writing order for each character belonging to the column.

さらに、入力された文字列の筆記方向と、オンライン手書き文字認識処理のために定められた基準方向とが異なる場合、その文字列に属するストロークデータを構成する位置座標列を、基準方向に沿う位置に座標変換する。これにより、文字列の筆記方向に関わらず、オンライン手書き文字認識の精度を向上できる。   Further, when the writing direction of the input character string is different from the reference direction defined for the online handwritten character recognition process, the position coordinate sequence constituting the stroke data belonging to the character string is set to a position along the reference direction. Convert coordinates to. Thereby, the accuracy of online handwritten character recognition can be improved regardless of the writing direction of the character string.

このように、本発明によれば、文字が入力される範囲及び文字列の筆記方向を特定せず、かつ複数個所から順序関係なく手書き入力された複数の文字列を精度よく認識することができ、寄せ書きや対話型筆談等の用途に適した手書き文字認識を実現できる。   As described above, according to the present invention, it is possible to accurately recognize a plurality of character strings input by handwriting from a plurality of places without specifying the range in which characters are input and the writing direction of the character string. It is possible to realize handwritten character recognition suitable for applications such as group writing and interactive writing.

また、本発明に係る文字認識プログラムの一形態として、次のような構成を挙げる。すなわち、方向判定ステップにおいて、各文字列グループに属する文字領域に含まれるストロークデータを構成する位置座標列から得られる回帰直線の相関関係に基づいて文字列の筆記方向を判定する。このようにすることで、文字列の筆記方向を判定する手順を実現できる。   Moreover, the following structures are mentioned as one form of the character recognition program which concerns on this invention. That is, in the direction determination step, the writing direction of the character string is determined based on the correlation of the regression line obtained from the position coordinate sequence constituting the stroke data included in the character area belonging to each character string group. By doing in this way, the procedure which determines the writing direction of a character string is realizable.

また、本発明に係る文字認識プログラムの一形態として、次のような構成を挙げる。すなわち、方向判定ステップにおいて、各文字列グループに属する文字領域ごとに、各文字領域に含まれるストロークデータを構成する位置座標列の外接領域を特定し、各文字列グループ内における複数の外接領域の位置関係に基づいて文字列の筆記方向を判定する。このようにすることで、文字列の筆記方向を判定する手順を実現できる。   Moreover, the following structures are mentioned as one form of the character recognition program which concerns on this invention. That is, in the direction determination step, for each character area belonging to each character string group, a circumscribing area of the position coordinate string constituting the stroke data included in each character area is specified, and a plurality of circumscribed areas in each character string group are identified. The writing direction of the character string is determined based on the positional relationship. By doing in this way, the procedure which determines the writing direction of a character string is realizable.

また、本発明に係る文字認識プログラムの一形態として、次のような構成を挙げる。すなわち、ストローク変換ステップにおいて、該当する文字列グループに属する文字領域に含まれるストロークデータを構成する位置座標列に対して、座標変換の基準となる座標点である基準座標を設定する。そして、設定された基準座標と位置座標列における各座標点との間の距離及び方向、並びに判定された筆記方向と前記基準方向との方向差を用いて、ストロークデータを構成する位位置座標列を座標変換する。このようにすることで、ストロークデータの位置座標列を基準方向に合わせて座標変換する手順を実現できる。   Moreover, the following structures are mentioned as one form of the character recognition program which concerns on this invention. That is, in the stroke conversion step, reference coordinates, which are coordinate points serving as a reference for coordinate conversion, are set for the position coordinate sequence constituting the stroke data included in the character area belonging to the corresponding character string group. Then, using the distance and direction between the set reference coordinate and each coordinate point in the position coordinate sequence, and the direction difference between the determined writing direction and the reference direction, the position coordinate sequence constituting the stroke data Is transformed. In this way, it is possible to realize a procedure for coordinate conversion of the position coordinate string of the stroke data in accordance with the reference direction.

なお、本発明は、上述した文字認識プログラムにおける各ステップを実行するコンピュータを備えた文字認識装置として実現することもできる。本発明に一形態に係る文字認識装置によれば、上述した文字認識プログラムについて記載した効果と同様の効果が得られる。   The present invention can also be realized as a character recognition device including a computer that executes each step in the above-described character recognition program. According to the character recognition device of an embodiment of the present invention, the same effects as those described for the character recognition program described above can be obtained.

実施形態の手書き文字認識システムの構成を表すブロック図。The block diagram showing the composition of the handwritten character recognition system of an embodiment. 手書き文字列の入力例を表す説明図。Explanatory drawing showing the example of input of a handwritten character string. 文字認識処理の手順を表すフローチャート。The flowchart showing the procedure of a character recognition process. 画像化処理に関する説明図。Explanatory drawing regarding an imaging process. 文字領域の特定に関する説明図。Explanatory drawing regarding specification of a character area. 文字列グループの特定に関する説明図。Explanatory drawing regarding specification of a character string group. 筆記順の並べ替えに関する説明図。Explanatory drawing about rearrangement of writing order. 文字列の筆記方向の判定に関する説明図。Explanatory drawing regarding determination of the writing direction of a character string. ストロークデータの座標変換に関する説明図。Explanatory drawing regarding the coordinate conversion of stroke data. 文字列の認識結果に関する説明図。Explanatory drawing regarding the recognition result of a character string.

以下、本発明の実施形態を図面に基づいて説明する。なお、本発明は下記の実施形態に限定されるものではなく様々な態様にて実施することが可能である。
[文字認識システムの構成の説明]
図1に例示される文字認識システムは、情報処理装置1と、入力装置31と、表示装置34とを備える。また、情報処理装置1と入力装置31との間の情報伝送経路には、外部記憶装置32やネットワーク/無線通信経路33が含まれているものとする。
Hereinafter, embodiments of the present invention will be described with reference to the drawings. In addition, this invention is not limited to the following embodiment, It is possible to implement in various aspects.
[Description of character recognition system configuration]
The character recognition system illustrated in FIG. 1 includes an information processing device 1, an input device 31, and a display device 34. Further, it is assumed that the information transmission path between the information processing apparatus 1 and the input apparatus 31 includes the external storage device 32 and the network / wireless communication path 33.

情報処理装置1は、CPU、ROM、RAM、補助記憶装置、通信インタフェース等(何れも不図示)を中心に構成されたコンピュータであり、入力装置31に書き込まれた手書き文字列を認識する機能を担う。この情報処理装置1は、例えば、パーソナルコンピュータ(PC)や、平板状の外形を有しタッチパネル式の入力表示部を備える、いわゆるタブレットPC等の可搬型情報端末、ネットワークに接続された適宜な情報処理能力を有するサーバ装置等で具現化される。   The information processing apparatus 1 is a computer mainly configured with a CPU, a ROM, a RAM, an auxiliary storage device, a communication interface and the like (all not shown), and has a function of recognizing a handwritten character string written in the input device 31. Bear. The information processing apparatus 1 is, for example, a personal computer (PC), a portable information terminal such as a so-called tablet PC having a flat outer shape and a touch panel type input display unit, and appropriate information connected to a network. It is embodied by a server device having processing capability.

情報処理装置1の各種機能は、CPUが記録媒体に格納されたプログラムを実行することにより実現される。情報処理装置1は、CPUがプログラムを実行することで実現される機能の構成として、読取部10と、画像化部12と、文字領域認識部13と、文字領域グループ化部14と、ストローク順序変更部15と、筆記方向判定部16と、ストローク座標変換部17と、オンライン文字認識部19とを備える。また、情報処理装置1は、上述の機能により利用されるデータを記憶するための構成として、ストロークデータ記憶部11と、ストローク変換結果記憶部18と、テキスト変換結果記憶部20とを適宜のメモリに備える。   Various functions of the information processing apparatus 1 are realized by the CPU executing a program stored in a recording medium. The information processing apparatus 1 includes a reading unit 10, an imaging unit 12, a character region recognition unit 13, a character region grouping unit 14, and a stroke order as functions configured by the CPU executing a program. A change unit 15, a writing direction determination unit 16, a stroke coordinate conversion unit 17, and an online character recognition unit 19 are provided. In addition, the information processing apparatus 1 includes a stroke data storage unit 11, a stroke conversion result storage unit 18, and a text conversion result storage unit 20 as appropriate memories for storing data used by the above functions. Prepare for.

読取部10は、入力装置31に書き込まれた手書き文字のストロークを表すデータであるストロークデータを取得する。このストロークデータは、入力装置31に書き込まれた複数の手書き文字列に含まれる各文字の構成要素であるストロークの筆跡を表す位置座標を時系列に並べた順序列である位置座標列のデータと、そのストロークが書き込まれた順番である筆記順とを含むデータである。   The reading unit 10 acquires stroke data that is data representing a stroke of a handwritten character written in the input device 31. The stroke data includes position coordinate data that is an ordered sequence in which position coordinates representing stroke handwriting that is a constituent element of each character included in a plurality of handwritten character strings written in the input device 31 are arranged in time series, and , Data including the order of writing in which the strokes are written.

ここでいうストロークとは、文字の1画に相当する筆跡である。このストロークの筆跡を表すデータは、例えば、手書き文字の筆跡をデータ化する位置センサにおいて接触が感知され始めてから接触が解除されるまでに連続して検出された位置座標(例えば、xy座標)の順序列で構成される。つまり、1つのストロークデータに含まれる位置座標列で表される軌跡が、文字の1画に相当する筆跡と合致する。読取部10は、入力装置31に書き込まれた複数の文字列を構成する複数のストロークに関するストロークデータ群を外部記憶装置32又はネットワーク/無線通信経路33を経由して取得する。取得されたストロークデータ群はストロークデータ記憶部11に保存される。   The stroke here is a handwriting corresponding to one stroke of a character. The data representing the stroke handwriting is, for example, position coordinates (for example, xy coordinates) continuously detected from when the contact is detected by the position sensor that converts handwriting of handwritten characters into data. Consists of ordered sequences. That is, the locus represented by the position coordinate sequence included in one stroke data matches the handwriting corresponding to one stroke of the character. The reading unit 10 acquires stroke data groups related to a plurality of strokes constituting a plurality of character strings written in the input device 31 via the external storage device 32 or the network / wireless communication path 33. The acquired stroke data group is stored in the stroke data storage unit 11.

なお、本実施形態では、読取部10により取得されるストロークデータ群として、予め定められた記入枠の中に1文字ずつ記入するといった入力範囲の制約や、予め定められた方向のみ文字列を入力するといった筆記方向の制約がなく、かつ複数個所から順序関係なく入力された文字列を構成するものを想定している。そのため、複数の文字列を構成する一連のストロークデータ群における個々のストロークデータの筆記順が、複数の文字列を構成する各入力文字の中に分散していることが想定される。つまり、1つの文字列ないし文字を構成する複数のストロークデータが必ずしも連続する筆記順になっているとは限らず、1つの文字列ないし文字を構成する複数のストロークデータの筆記順の間に別の文字列を構成するストロークデータが介在している可能性がある。   In the present embodiment, as a stroke data group acquired by the reading unit 10, an input range restriction such as entering characters one by one in a predetermined entry frame, or a character string is input only in a predetermined direction. It is assumed that there is no restriction on the writing direction such as, and that the character string is input from a plurality of places without ordering. For this reason, it is assumed that the writing order of individual stroke data in a series of stroke data groups constituting a plurality of character strings is dispersed among the input characters constituting the plurality of character strings. That is, a plurality of stroke data constituting one character string or a character is not necessarily in a continuous writing order, and another stroke order between a plurality of stroke data constituting one character string or a character is different. There is a possibility that the stroke data constituting the character string is interposed.

画像化部12は、ストロークデータ記憶部11に保存されたストロークデータ群に基づいて、そのストロークデータ群で表される複数の文字列の筆跡を表す画像を生成する。具体的には、画像化部12は、ストロークデータ群で表される筆跡の位置座標点を、ストロークデータのxy座標系と相関する画像上のxy座標空間上に筆跡でない部分と色分けして描画される画素として展開する。これにより、画素の集合体からなるラスタ形式の画像が生成される。この画像化においては、画像上の座標系とストロークデータに対応する座標系との縮尺係数を保持することにより、ラスタ形式の画像からストロークデータへ、又はその逆への座標変換が可能となっている。   The imaging unit 12 generates an image representing handwriting of a plurality of character strings represented by the stroke data group based on the stroke data group stored in the stroke data storage unit 11. Specifically, the imaging unit 12 draws the position coordinate point of the handwriting represented by the stroke data group by color-coding the non-handwriting part on the xy coordinate space on the image correlated with the xy coordinate system of the stroke data. It expands as a pixel. Thereby, an image in a raster format composed of a collection of pixels is generated. In this imaging, by maintaining the scale factor between the coordinate system on the image and the coordinate system corresponding to the stroke data, coordinate conversion from the raster format image to the stroke data or vice versa becomes possible. Yes.

文字領域認識部13は、画像化部12により生成された画像に描画されている複数の文字列から個々の文字の範囲を区切った領域である文字領域の位置を特定する。この文字領域は、例えば、個々の文字の形状が描画された範囲を包含する矩形の座標範囲で構成されるものとする。画像情報から文字領域を認識する手法については、従来のオフライン手書き文字認識やOCR(Optical Character Recognition)等で行われている文字切出しと同様のものでよい。   The character area recognition unit 13 specifies the position of a character area that is an area obtained by dividing the range of individual characters from a plurality of character strings drawn in the image generated by the imaging unit 12. This character region is assumed to be composed of, for example, a rectangular coordinate range including a range in which the shape of each character is drawn. The technique for recognizing the character area from the image information may be the same as the character extraction performed in the conventional off-line handwritten character recognition, OCR (Optical Character Recognition), or the like.

文字領域グループ化部14は、文字領域認識部13により特定された各文字領域を、一連の文字列として認識されるグループである文字列グループに分類する。具体的には、特定された複数の文字領域間の距離を算出し、算出された距離に基づいて複数の文字領域同士が近接して列状に並んでいると判定されたまとまりを、1つの文字列グループに分類する。   The character area grouping unit 14 classifies each character area specified by the character area recognition unit 13 into a character string group that is a group recognized as a series of character strings. Specifically, a distance between a plurality of specified character areas is calculated, and a group determined that a plurality of character areas are arranged close to each other based on the calculated distance is arranged as one Classify into string groups.

ストローク順序変更部15は、ストロークデータ記憶部11に保存されているストロークデータ群に対応付けられている筆記順を、文字領域グループ化部14により分類された文字列グループごとの筆記順に並べ替える。ここでは、文字列グループごとに並べ替えられた筆記順をグループ内順序と称する。具体的には、まず、ストロークデータ記憶部11に保存されているストロークデータ群について、筆跡の位置座標値に基づく各文字領域への包含判定を行い、各ストロークデータを包含先の文字領域に振分ける。そして、1つの文字列グループに属する文字領域に包含されるストロークデータの集合について、文字列の先頭に該当する文字領域から順次、その文字領域に含まれるストロークデータに付与されている元の筆記順を一連の連続する筆記順に変更する。このようにすることで、複数の文字列を構成するストロークデータ群について、複数の文字列に分散している筆記順を、個々の文字列グループごとに一連となる筆記順であるグループ内順序に並べ替えることができる。   The stroke order changing unit 15 rearranges the writing order associated with the stroke data group stored in the stroke data storage unit 11 in the writing order for each character string group classified by the character region grouping unit 14. Here, the writing order rearranged for each character string group is referred to as an intra-group order. Specifically, for the stroke data group stored in the stroke data storage unit 11, the inclusion determination for each character area is performed based on the handwriting position coordinate value, and each stroke data is assigned to the inclusion destination character area. Divide. For the set of stroke data included in the character area belonging to one character string group, the original writing order assigned to the stroke data included in the character area sequentially from the character area corresponding to the head of the character string Is changed to a sequential writing order. In this way, for the stroke data group constituting a plurality of character strings, the writing order dispersed in the plurality of character strings is changed to the in-group order which is a series of writing order for each character string group. Can be rearranged.

筆記方向判定部16は、文字領域グループ化部14により分類された各文字列グループについて、文字列の筆記方向を判定する。ここでいう文字列の筆記方向とは、文字列における書き始めから文字が連なる方向を指す。具体的には、筆記方向判定部16は、各文字列グループに属する文字領域に包含されるストロークデータから導出される特徴量と、ストロークデータの筆記順に基づいて筆記方向を算出する。   The writing direction determination unit 16 determines the writing direction of the character string for each character string group classified by the character region grouping unit 14. The writing direction of the character string here refers to the direction in which characters are continued from the beginning of writing in the character string. Specifically, the writing direction determination unit 16 calculates the writing direction based on the feature amount derived from the stroke data included in the character area belonging to each character string group and the writing order of the stroke data.

ストローク座標変換部17は、筆記方向判定部16により判定された筆記方向と、後述のオンライン手書き文字認識処理のための基準の筆記方向である基準方向とを比較し、その比較結果に応じてストロークデータを座標変換する。ここでいう基準方向とは、オンライン手書き文字認識処理において認識対象となる文字の形状や、筆記順、線が書かれた方向を認識辞書に照合するための基準となる筆記方向を指す。オンライン手書き文字認識処理では、基準方向とは異なる筆記方向で書かれた文字列に対して正しい認識を行うことができない場合がある。そこで、本実施形態では文字列グループの筆記方向を基準方向に合致させてから、文字列グループごとにオンライン手書き文字認識処理を行うものとする。   The stroke coordinate conversion unit 17 compares the writing direction determined by the writing direction determination unit 16 with a reference direction that is a reference writing direction for online handwritten character recognition processing described later, and performs a stroke according to the comparison result. Transform data into coordinates. The reference direction here refers to a writing direction serving as a reference for collating the shape of the character to be recognized in the online handwritten character recognition processing, the writing order, and the direction in which the line is written with the recognition dictionary. In the online handwritten character recognition process, there are cases where correct recognition cannot be performed for a character string written in a writing direction different from the reference direction. Therefore, in the present embodiment, the online handwritten character recognition process is performed for each character string group after the writing direction of the character string group matches the reference direction.

具体的には、ストローク座標変換部17は、文字列グループの筆記方向と基準方向とが相違する場合、その文字列グループの筆記方向が基準方向に合致するように、その文字列グループに含まれるストロークデータの位置座標を回転させる。座標変換されたストロークデータは、ストローク変換結果記憶部18に保存される。   Specifically, when the writing direction of the character string group is different from the reference direction, the stroke coordinate conversion unit 17 is included in the character string group so that the writing direction of the character string group matches the reference direction. Rotate the position coordinates of stroke data. The coordinate-converted stroke data is stored in the stroke conversion result storage unit 18.

オンライン文字認識部19は、文字列グループごとに文字列を構成する各文字の内容を認識し、認識された文字の内容をテキスト形式のデータに変換した文字情報を出力する。ここでオンライン文字認識部19は、ストローク変換結果記憶部18により座標変換されたストロークデータで表される筆跡、及びストローク順序変更部15により並べ替えされたグループ内順序を用いて文字認識を行う。なお、ストローク変換結果記憶部18による座標変換が不要だったストロークデータについては、そのまま文字認識に用いる。   The online character recognition unit 19 recognizes the content of each character constituting the character string for each character string group, and outputs character information obtained by converting the recognized character content into text-format data. Here, the online character recognition unit 19 performs character recognition using the handwriting represented by the stroke data coordinate-converted by the stroke conversion result storage unit 18 and the in-group order rearranged by the stroke order changing unit 15. Note that stroke data that does not require coordinate conversion by the stroke conversion result storage unit 18 is used as it is for character recognition.

オンライン文字認識部19による文字認識は、従来のオンライン手書き文字認識で行われている手法と同様のものでよい。例えば、公知の隠れマルコフモデル(Hidden Markov Model)のような推定モデルを用いて筆跡の構成点と認識辞書内の構成点との時系列遷移確率により最尤推定を行う方法などが例示される。オンライン文字認識部19は、各文字列グループについての認識結果を表すテキストデータを、テキスト変換結果記憶部20に保存する。   The character recognition by the online character recognition unit 19 may be the same as the method performed in the conventional online handwritten character recognition. For example, a method of performing maximum likelihood estimation by using a time series transition probability between the constituent points of the handwriting and the constituent points in the recognition dictionary using an estimation model such as a known hidden Markov model is exemplified. The online character recognition unit 19 stores text data representing a recognition result for each character string group in the text conversion result storage unit 20.

入力装置31は、人の手書きによって入力された文字の筆跡をデータ化する入力デバイスであり、手書きされた文字に関するストロークデータを出力する機能を担う。この入力装置31は、それ自体が独立した情報処理端末として構成されたものであってもよいし、情報処理装置1に接続されるか組込まれる入力デバイスとして構成されたものであってもよい。前者の具体例として、タッチパネル式の入力表示部を備えるタブレットPC等の可搬型情報端末が挙げられる。また、後者の具体例として、平板状のセンサを有するポインティングデバイスであるペンタブレットや液晶ペンタブレット等が挙げられる。   The input device 31 is an input device that converts the handwriting of a character input by human handwriting into data, and has a function of outputting stroke data related to the handwritten character. The input device 31 may be configured as an independent information processing terminal itself, or may be configured as an input device that is connected to or incorporated in the information processing device 1. A specific example of the former is a portable information terminal such as a tablet PC having a touch panel type input display unit. Specific examples of the latter include a pen tablet and a liquid crystal pen tablet which are pointing devices having a flat sensor.

入力装置31は、ストロークの書き始めから終わりまでに連続して検出された位置座標群(例えば、xy座標)の順序列と、そのストロークが書き込まれた順序である筆記順とを対応付けたストロークデータを生成する。そして、入力装置31は、個々のストロークに対応するストロークデータごと、又は、一定期間内に取得された全てのストロークデータをまとめたファイルであるストロークデータファイルごとに、適宜のコンピュータネットワークや無線通信を介して外部に転送する。入力装置31から出力されたストロークデータ又はストロークデータファイルは、外部記憶装置32に一旦蓄積されてから複数の文字列を構成するストロークデータ群として情報処理装置1の読取部10によって取得される。あるいは、ネットワーク/無線通信経路33を経由して情報処理装置1の読取部10によって取得される。   The input device 31 is a stroke that associates a sequence of position coordinate groups (for example, xy coordinates) detected continuously from the beginning to the end of stroke writing with a writing order that is the order in which the stroke is written. Generate data. Then, the input device 31 performs appropriate computer network or wireless communication for each stroke data corresponding to each stroke or for each stroke data file that is a file in which all stroke data acquired within a certain period are collected. Forward outside. The stroke data or stroke data file output from the input device 31 is temporarily stored in the external storage device 32 and then acquired by the reading unit 10 of the information processing device 1 as stroke data groups constituting a plurality of character strings. Alternatively, it is acquired by the reading unit 10 of the information processing apparatus 1 via the network / wireless communication path 33.

ここで、入力装置31において複数の文字列が入力される事例について、図2を参照しながら説明する。図2の事例において、入力装置31は、例えばタブレットコンピュータのような平面状のタッチパネル31aを有するものである。この入力装置31のタッチパネル31aに対して、4人の入力者A,B,C,Dがそれぞれ別の方向から一斉に文字列を書き込んだ状況を想定する。   Here, a case where a plurality of character strings are input by the input device 31 will be described with reference to FIG. In the case of FIG. 2, the input device 31 has a flat touch panel 31a such as a tablet computer. Assume that four input users A, B, C, and D simultaneously write character strings from different directions on the touch panel 31a of the input device 31.

図2に例示されるとおり、入力装置31の上側から入力者Aが「てがき」という文字列を書き込んでいる。また、入力装置31の左側から入力者Bが「ひだり」という文字列を書き込んでいる。また、入力装置31の右側から入力者Cが「みぎ」という文字列を書き込んでいる。また、入力装置31の下側から入力者Dが「したがわ」という文字列を書き込んでいる。   As illustrated in FIG. 2, the input person A writes a character string “postcard” from the upper side of the input device 31. Further, the input person B writes the character string “hidari” from the left side of the input device 31. Further, the input person C writes the character string “Migi” from the right side of the input device 31. Further, the input person D writes a character string “Taiga” from the lower side of the input device 31.

なお、タッチパネル31aには、入力装置31の左右方向にx軸、上下方向にy軸が割り当てられた格子状の座標系が設定されており、ペンや入力者の指先等が接触した位置に対応する位置座標を取得できるようになっているものとする。したがって、タッチパネル31aがタブレットコンピュータの液晶ディスプレイと一体に構成されたものであれば、タッチパネル31aにおいて感知された位置座標に基づいて、書き込まれた文字の筆跡をそのまま液晶ディスプレイに表示させることができる。   The touch panel 31a has a grid-like coordinate system in which an x-axis is assigned in the left-right direction and a y-axis is assigned in the up-down direction of the input device 31, and corresponds to the position where the pen or the fingertip of the input person touches. It is assumed that the position coordinates to be acquired can be acquired. Therefore, if the touch panel 31a is configured integrally with the liquid crystal display of the tablet computer, the handwritten character can be displayed on the liquid crystal display as it is based on the position coordinates detected on the touch panel 31a.

図2において、タッチパネル31aに書き込まれた文字の筆跡に付記された丸付き数字は、その筆跡に対応するストロークが書き込まれた順序である筆記順を示す番号である。これらの筆記順からわかるとおり、4人の入力者によって一斉に書き込まれた4つの文字列に含まれるストロークの筆記順は、文字列ごとに連続する数列にはなっておらず、4つの文字列に分散している。具体的には、1番目の筆記順に該当するストロークは、入力者Bが書き込んだ文字列に含まれる「ひ」の文字を構成するストロークである。これに対し、2番目の筆記順に該当するストロークは、1番目のストロークとは別の入力者Dが書き込んだ文字列に含まれる「し」の文字を構成するストロークであるといった具合である。ちなみに、入力者Aが書き込んだ「てがき」の文字列に含まれる「が」の文字の濁点に対応するストロークは、一旦「か」の文字が書き込まれた次に「き」の文字が書き込まれてから1文字遡って「か」の文字に書き足されたものとなっている。   In FIG. 2, the circled numbers added to the handwriting of characters written on the touch panel 31 a are numbers indicating the writing order, which is the order in which strokes corresponding to the handwriting are written. As can be seen from these writing orders, the writing order of the strokes included in the four character strings written simultaneously by the four input users is not a continuous number sequence for each character string. Are distributed. Specifically, the stroke corresponding to the first writing order is a stroke constituting the character “HI” included in the character string written by the input person B. On the other hand, the stroke corresponding to the second writing order is a stroke constituting the character “shi” included in the character string written by the input person D different from the first stroke. By the way, the stroke corresponding to the cloud point of the character “ga” included in the character string “word” written by the input person A is written with the character “ki” once the character “ka” is written once. It has been added to the “ka” character one character later.

さらに、図2に例示される4つの文字列は、向きがそれぞれ異なる入力者から見て左から右へ書き進む横書きに書かれているため、タッチパネル31aに設定されたxy座標系を基準にすると筆記方向がそれぞれ異なっている。具体的には、入力者Aが書き込んだ「てがき」の文字列は、x軸方向に沿って右から左方向に書かれたことになる。また、入力者Bが書き込んだ「ひだり」の文字列は、y軸方向に沿って上から下方向に書かれたことになる。また、入力者Cが書き込んだ「みぎ」の文字列は、y軸方向に沿って下から上方向に書かれたことになる。また、入力者Dが書き込んだ「したがわ」の文字列は、x軸方向に沿って左から右方向に書かれたことになる。   Furthermore, since the four character strings illustrated in FIG. 2 are written in horizontal writing that is written from the left to the right when viewed from the input person having different directions, the xy coordinate system set on the touch panel 31a is used as a reference. Each writing direction is different. Specifically, the character string of “postcard” written by the input person A is written from right to left along the x-axis direction. The character string “hidari” written by the input person B is written from the top to the bottom along the y-axis direction. Further, the character string “MIGI” written by the input person C is written from the bottom to the top along the y-axis direction. In addition, the character string “Shigawa” written by the input person D is written from left to right along the x-axis direction.

入力装置31は、4つの文字列「てがき」、「ひだり」、「みぎ」、「したがわ」に含まれる文字を構成する各ストロークの位置座標群の順序列のデータと、その筆記順とを含む複数のストロークデータからなる一連のストロークデータ群を生成し、これを外部に出力する。   The input device 31 includes data of an ordered sequence of position coordinate groups of strokes constituting characters included in the four character strings “tegaki”, “hidari”, “migi”, and “shigawa”, and the writing order thereof. A series of stroke data groups including a plurality of stroke data including the above are generated and output to the outside.

図1の説明に戻る。表示装置34は、画像を表示する表示デバイスであり、情報処理装置1から送出される文字列の認識結果を表す画像を表示する機能を担う。この表示装置34は、それ自体が独立した情報処理端末として構成されたものであってもよいし、情報処理装置1に接続されるか組込まれる表示デバイスとして構成されたものであってもよい。前者の具体例として、パーソナルコンピュータや、液晶パネル等の表示部を備えるタブレットPC等の可搬型情報端末が挙げられる。また、後者の具体例として、液晶ディスプレイ等が挙げられる。   Returning to the description of FIG. The display device 34 is a display device that displays an image, and has a function of displaying an image representing a recognition result of a character string sent from the information processing device 1. The display device 34 may be configured as an independent information processing terminal itself, or may be configured as a display device connected to or incorporated in the information processing device 1. Specific examples of the former include a portable information terminal such as a personal computer and a tablet PC having a display unit such as a liquid crystal panel. Moreover, a liquid crystal display etc. are mentioned as a specific example of the latter.

[文字認識処理の説明]
情報処理装置1の各部によって実行される文字認識処理の手順について、図3のフローチャートを参照しながら説明する。なお、図3のフローチャートを説明する過程において、図4〜10の説明図を適宜参照する。
[Description of character recognition processing]
The procedure of character recognition processing executed by each unit of the information processing apparatus 1 will be described with reference to the flowchart of FIG. In the process of explaining the flowchart of FIG. 3, the explanation diagrams of FIGS.

S100では、画像化部12が、ストロークデータ記憶部11に保存された複数の文字列に関するストロークデータ群を画像化する。この画像化処理の具体例について、図4を参照しながら説明する。なお、図4の事例は、図2の事例において出力されたストロークデータ群を対象に画像化を行う状況を想定したものである。   In S <b> 100, the imaging unit 12 images the stroke data group related to a plurality of character strings stored in the stroke data storage unit 11. A specific example of this imaging process will be described with reference to FIG. Note that the example of FIG. 4 assumes a situation where imaging is performed on the stroke data group output in the example of FIG.

図4に例示されるとおり、ストロークデータ群に含まれる1番目から40番目までの筆記順に対応する各ストロークデータで表される筆跡の位置座標列が、ストロークデータのxy座標系と相関する画像上のxy座標空間上に画素として展開されることによりラスタ形式の画像を生成される。この画像には、図2の事例において入力された「てがき」、「ひだり」、「みぎ」、「したがわ」の各文字列が画像情報として描画されている。   As illustrated in FIG. 4, the position coordinate sequence of the handwriting represented by each stroke data corresponding to the first to the 40th writing order included in the stroke data group is correlated with the xy coordinate system of the stroke data. An image in a raster format is generated by developing as pixels on the xy coordinate space. In this image, the character strings “tegaki”, “hidari”, “migi”, and “shigawa” input in the example of FIG. 2 are drawn as image information.

図3のフローチャートの説明に戻る。S102では、文字領域認識部13が、S100において生成された画像に描画されている文字列から個々の文字の範囲を区切った領域である文字領域を特定する。この文字領域の特定処理の具体例について、図5を参照しながら説明する。なお、図5の事例は、図4の事例において生成された画像を対象に文字領域を特定する状況を想定したものである。   Returning to the flowchart of FIG. In S102, the character area recognition unit 13 specifies a character area that is an area obtained by dividing the range of individual characters from the character string drawn in the image generated in S100. A specific example of the character region specifying process will be described with reference to FIG. Note that the case of FIG. 5 assumes a situation in which a character area is specified for the image generated in the case of FIG.

図5に例示されるとおり、「てがき」、「ひだり」、「みぎ」、「したがわ」の各文字列が描画された画像の中から個々の文字が切出されることにより、各文字列を構成する個々の文字に対応する文字領域a〜lが算出される。この文字領域は、個々の文字の画像部分を囲んでなる矩形の座標範囲として算出される。文字領域認識部13は、算出された各文字領域を識別するための識別番号をそれぞれの文字領域に割り当てる。   As illustrated in FIG. 5, each character is cut out from an image in which each character string of “tegaki”, “hidari”, “migi”, and “shigawa” is drawn. Character areas a to l corresponding to individual characters constituting the column are calculated. This character area is calculated as a rectangular coordinate range surrounding the image portion of each character. The character area recognition unit 13 assigns an identification number for identifying each calculated character area to each character area.

図3のフローチャートの説明に戻る。S104では、文字領域グループ化部14が、S102において特定された各文字領域を一連の文字列として認識される文字列グループごとに分類する。このグループ化処理は、複数の文字領域間の距離に基づいて、文字領域同士が近接して列状に並んでいると判定されたまとまりを、1つの文字列グループに分類することにより行われる。このグループ化処理の具体例について、図6を参照しながら説明する。なお、図6の事例は、図5の事例において特定された文字領域を対象にグループ化処理を行う状況を想定したものである。   Returning to the flowchart of FIG. In S104, the character area grouping unit 14 classifies each character area specified in S102 for each character string group recognized as a series of character strings. This grouping process is performed by classifying the groups determined to be adjacent to each other in a line based on the distance between the plurality of character areas into one character string group. A specific example of this grouping process will be described with reference to FIG. Note that the case of FIG. 6 assumes a situation in which grouping processing is performed on the character area specified in the case of FIG.

図6に例示されるとおり、画像において特定された文字領域a〜lのうち、a,b,cが、「てがき」の文字列に対応する文字列グループAに分類されている。また、文字領域d,e,fが、「ひだり」の文字列に対応する文字列グループBに分類されている。また、文字領域g,hが、「みぎ」の文字列に対応する文字列グループCに分類されている。また、文字領域i,j,k,lが、「したがわ」の文字列に対応する文字列グループDに分類されている。   As illustrated in FIG. 6, among the character areas a to l specified in the image, a, b, and c are classified into the character string group A corresponding to the character string “postcard”. The character areas d, e, and f are classified into a character string group B corresponding to the character string “hidari”. In addition, the character areas g and h are classified into a character string group C corresponding to the character string “MIGI”. The character areas i, j, k, and l are classified into a character string group D corresponding to the character string “Tagawa”.

図3のフローチャートの説明に戻る。S106では、ストローク順序変更部15が、S104において分類された文字列グループごとに、ストロークデータ群の筆記順を並べ替えてグループ内順序を決定する。具体的には、まず、ストロークデータ記憶部11に保存されているストロークデータ群について各文字領域への包含判定を行うことで、各ストロークデータを包含先の文字領域に振分ける。そして、個々の文字列グループごとに、文字列の先頭に該当する文字領域(すなわち、その文字列グループの中で最も筆記順が早いストロークデータが含まれる文字領域)から順次、元の筆記順を文字列グループごとの一連の連続する筆記順であるグループ内順序に変更する。なお、各文字領域内では、元の筆記順が早いストロークデータから順に、早い番号のグループ内順序が付与される。この筆記順の並べ替え処理の具体例について、図7の(a)〜(d)を参照しながら説明する。なお、図7の事例は、図6の事例において分類された文字列グループを対象にストロークデータの筆記順を並べ替える状況を想定したものである。   Returning to the flowchart of FIG. In S106, the stroke order changing unit 15 rearranges the writing order of the stroke data group for each character string group classified in S104, and determines the in-group order. Specifically, first, the stroke data group stored in the stroke data storage unit 11 is included in each character area, so that each stroke data is distributed to the character area to be included. Then, for each character string group, the original writing order is sequentially changed from the character area corresponding to the head of the character string (that is, the character area including the stroke data with the earliest writing order in the character string group). Change to in-group order, which is a series of consecutive writing orders for each string group. In each character area, an earlier in-group order is assigned in order from the stroke data having the earlier writing order. A specific example of the writing order rearrangement process will be described with reference to FIGS. Note that the case of FIG. 7 assumes a situation where the writing order of stroke data is rearranged for the character string groups classified in the case of FIG.

図7(a)は、文字列グループAに属する文字領域a,b,cに内包されるストロークデータについて、並べ替え前の筆記順から、並べ替え後の筆記順であるグループ内順序への推移を表している。図7(a)に例示されるとおり、並べ替え前において文字領域bに最も筆記順が早い3番目のストロークデータが含まれる。このことから、この文字列グループAは、文字領域c、文字領域b、文字領域aの順で書き込まれたと推定される。したがって、この事例では、文字領域c、文字領域b、文字領域cの順に、各文字領域に含まれるストロークデータの元の筆記順が並べ替えられ、文字領域cから始まる一連のグループ内順序1〜10番が付与される。   FIG. 7A shows a transition from the writing order before rearrangement to the intra-group order that is the writing order after rearrangement of stroke data included in the character areas a, b, and c belonging to the character string group A. Represents. As illustrated in FIG. 7A, the third stroke data with the earliest writing order is included in the character area b before the rearrangement. From this, it is estimated that this character string group A was written in the order of the character area c, the character area b, and the character area a. Therefore, in this example, the original writing order of the stroke data included in each character area is rearranged in the order of the character area c, the character area b, and the character area c, and a series of in-group orders 1 to 1 starting from the character area c. Number 10 is given.

ここで注目すべきは、並べ替え前の文字領域bにおいて、文字領域aの後に遡って追加されたストロークに相当する33及び34番目のストロークデータが、並べ替え後の文字領域b内において連続する一連のグループ内順序に修正されている点である。このようにすることで、1つの文字列の中で1文字以上遡って追加されたストロークについても、追加された文字内で連続する筆記順に修正することができる。   It should be noted here that in the character area b before rearrangement, the 33rd and 34th stroke data corresponding to the stroke added retroactively after the character area a are continuous in the character area b after rearrangement. The point is that it has been corrected to a series of in-group orders. By doing in this way, the stroke added retroactively by one character or more in one character string can be corrected in the order of writing continuously in the added character.

図7(b)は、文字列グループBに属する文字領域d,e,fに内包されるストロークデータについて、並べ替え前の筆記順から、並べ替え後の筆記順であるグループ内順序への推移を表している。図7(b)に例示されるとおり、並べ替え前において文字領域dに最も筆記順が早い1番目のストロークデータが含まれる。このことから、この文字列グループBは、文字領域d、文字領域e、文字領域fの順で書き込まれたと推定される。したがって、この事例では、文字領域d、文字領域e、文字領域fの順に、各文字領域に含まれるストロークデータの元の筆記順が並べ替えられ、文字領域eから始まる一連のグループ内順序1〜9番が付与される。   FIG. 7 (b) shows the transition of the stroke data included in the character areas d, e, and f belonging to the character string group B from the writing order before rearrangement to the intra-group order that is the writing order after rearrangement. Represents. As illustrated in FIG. 7B, the first stroke data with the earliest writing order is included in the character region d before the rearrangement. From this, it is presumed that this character string group B was written in the order of the character region d, the character region e, and the character region f. Therefore, in this example, the original writing order of the stroke data included in each character area is rearranged in the order of the character area d, the character area e, and the character area f, and a series of in-group orders 1 to 1 starting from the character area e. Number 9 is given.

図7(c)は、文字列グループCに属する文字領域g,hに内包されるストロークデータについて、並べ替え前の筆記順から、並べ替え後の筆記順であるグループ内順序への推移を表している。図7(c)に例示されるとおり、並べ替え前において文字領域hに最も筆記順が早い7番目のストロークデータが含まれている。このことから、この文字列グループCは、文字領域h、文字領域gの順で書き込まれたと推定される。したがって、この事例では、文字領域h、文字領域gの順に、各文字領域に含まれるストロークデータの元の筆記順が並べ替えられ、文字領域hから始まる一連のグループ内順序1〜8番が付与される。   FIG. 7C shows a transition from the writing order before rearrangement to the intra-group order that is the writing order after rearrangement of stroke data included in the character regions g and h belonging to the character string group C. ing. As illustrated in FIG. 7C, the seventh stroke data with the earliest writing order is included in the character area h before the rearrangement. From this, it is estimated that this character string group C was written in the order of the character area h and the character area g. Therefore, in this example, the original writing order of the stroke data included in each character area is rearranged in the order of the character area h and the character area g, and a series of intra-group orders 1 to 8 starting from the character area h are given. Is done.

図7(d)は、文字列グループDに属する文字領域i,j,k,lに内包されるストロークデータについて、並べ替え前の筆記順から、並べ替え後の筆記順であるグループ内順序への推移を表している。図7(d)に例示されるとおり、並べ替え前において文字領域iに最も筆記順が早い2番目のストロークデータが含まれる。このことから、この文字列グループDは、文字領域i、文字領域j、文字領域k、文字領域lの順で書き込まれたと推定される。したがって、この事例では、文字領域i、文字領域j、文字領域k、文字領域lの順に、各文字領域に含まれるストロークデータの元の筆記順が並べ替えられ、文字領域iから始まる一連のグループ内順序1〜12番が付与される。   FIG. 7D shows the stroke data included in the character areas i, j, k, and l belonging to the character string group D from the writing order before rearrangement to the intra-group order that is the writing order after rearrangement. This represents the transition of As illustrated in FIG. 7D, the second stroke data with the earliest writing order is included in the character area i before the rearrangement. From this, it is presumed that the character string group D was written in the order of the character area i, the character area j, the character area k, and the character area l. Therefore, in this example, the original writing order of the stroke data included in each character area is rearranged in the order of the character area i, the character area j, the character area k, and the character area l, and a series of groups starting from the character area i. Inner orders 1 to 12 are assigned.

図3のフローチャートの説明に戻る。次のS108〜S120についてはS104において分類された個々の文字列グループを対象に処理を行い、全ての文字列グループについてそれぞれの処理を終えるまでS108〜S120の処理を順次繰返す。   Returning to the flowchart of FIG. In the next steps S108 to S120, the processing is performed on each character string group classified in S104, and the processing of S108 to S120 is sequentially repeated until the respective processes are completed for all the character string groups.

S108では、筆記方向判定部16が、処理対象の文字列グループについて文字列の筆記方向を判定する。文字列の筆記方向を判定する第1の方法として、図8(a)に例示されるように、文字列を構成する各文字の外接領域の配列方向に基づいて判定する方法を用いることができる。   In S108, the writing direction determination unit 16 determines the writing direction of the character string for the character string group to be processed. As a first method for determining the writing direction of a character string, as illustrated in FIG. 8A, a method of determining based on the arrangement direction of the circumscribed area of each character constituting the character string can be used. .

具体的には、まず、文字列グループに属する各文字領域に含まれるストロークデータに基づいて文字ごとの筆跡に外接する領域である外接領域を算出する。図8(a)の事例では、「てがき」の文字列を構成する各文字に対応する外接領域m,n,oが算出される。   Specifically, first, a circumscribing area that is circumscribing the handwriting for each character is calculated based on stroke data included in each character area belonging to the character string group. In the example of FIG. 8A, circumscribed areas m, n, and o corresponding to the characters that constitute the character string of “postcard” are calculated.

そして、各外接領域のある基準点(例えば、外接領域の中心)を直線近似して得られる直線の傾きを、筆記方向の傾きとする。また、筆記方向の向きについては、文字列グループに属する文字領域のうち、最も筆記順が早いストロークデータを含む文字領域側を筆記方向の始点側とし、反対側を終点側とする。図8(a)の事例では、外接領域の中心を直線近似して得られた直線に沿って外接領域m,n,oの順に文字列が書き込まれたとする筆記方向が判定される。   Then, the inclination of a straight line obtained by linearly approximating a reference point (for example, the center of the circumscribed area) in each circumscribed area is set as the inclination in the writing direction. As for the direction of the writing direction, among the character regions belonging to the character string group, the character region side including the stroke data with the earliest writing order is the starting point side of the writing direction, and the opposite side is the end point side. In the case of FIG. 8A, the writing direction is determined on the assumption that a character string is written in the order of the circumscribed areas m, n, and o along a straight line obtained by linearly approximating the center of the circumscribed area.

あるいは、文字列の筆記方向を判定する第2の方法として、図8(b)に例示されるように、ストロークデータを構成する位置座標点から導出される回帰直線に基づいて判定する方法を用いることができる。具体的には、まず、文字列グループに含まれる全てのストロークデータを構成する位置座標点の集合から回帰直線を算出する。そして、算出された回帰直線の傾きを、筆記方向の傾きとする。   Alternatively, as a second method of determining the writing direction of the character string, as illustrated in FIG. 8B, a method of determining based on a regression line derived from position coordinate points constituting stroke data is used. be able to. Specifically, first, a regression line is calculated from a set of position coordinate points constituting all stroke data included in the character string group. Then, the calculated inclination of the regression line is set as the inclination in the writing direction.

また、筆記方向の向きについては、文字列グループに属する文字領域に含まれるストロークデータのうち、最も筆記順が早いストロークデータの始点側を筆記方向の始点側とし、反対側を終点側とする。図8(b)の事例では、ストロークデータを構成する位置座標群から得られた回帰直線に沿って、ストロークデータの右端側も始点側から文字列が書き込まれたとする筆記方向が判定される。   Regarding the direction of the writing direction, among the stroke data included in the character area belonging to the character string group, the start point side of the stroke data with the earliest writing order is set as the start point side of the writing direction, and the opposite side is set as the end point side. In the case of FIG. 8B, the writing direction is determined in which the character string is written from the start point side on the right end side of the stroke data along the regression line obtained from the position coordinate group constituting the stroke data.

図8(c)は、図6の事例において分類された各文字列グループの筆記方向を表したものである。この図8(c)に例示されるとおり、文字列グループAの筆記方向は、x軸方向に概ね沿って右側から左側へと進む方向を示している。また、文字列グループBの筆記方向は、y軸方向に概ね沿って上側から下側へと進む方向を示している。また、文字列グループCの筆記方向は、y軸方向に概ね沿って下側から上側へと進む方向を示している。また、文字列グループDの筆記方向は、x軸方向に概ね沿って左側から右側へと進む方向を示している。   FIG. 8C shows the writing direction of each character string group classified in the case of FIG. As illustrated in FIG. 8C, the writing direction of the character string group A indicates a direction that proceeds from the right side to the left side along the x-axis direction. In addition, the writing direction of the character string group B indicates a direction of proceeding from the upper side to the lower side substantially along the y-axis direction. In addition, the writing direction of the character string group C indicates a direction of proceeding from the lower side to the upper side substantially along the y-axis direction. In addition, the writing direction of the character string group D indicates the direction of moving from the left side to the right side along the x-axis direction.

図3のフローチャートの説明に戻る。S110では、ストローク座標変換部17が、S108において判定された文字列グループの筆記方向と、オンライン手書き文字認識処理のための基準方向とが一致するか否かを判定する。なお、本実施形態では、図8(c)に例示されるように、ストロークデータのxy座標系におけるx軸方向に沿って左側から右側に順次文字が書き進められる方向を基準方向とする。   Returning to the flowchart of FIG. In S110, the stroke coordinate conversion unit 17 determines whether or not the writing direction of the character string group determined in S108 matches the reference direction for online handwritten character recognition processing. In this embodiment, as illustrated in FIG. 8C, the reference direction is a direction in which characters are sequentially written from the left side to the right side along the x-axis direction in the xy coordinate system of the stroke data.

S112では、S110における比較の結果、文字列グループの筆記方向と基準方向とが一致する場合(S112:YES)、S120に進む。一方、文字列グループの筆記方向と基準方向とが相違する場合(S112:NO)、S114に進む。   In S112, if the writing direction of the character string group matches the reference direction as a result of the comparison in S110 (S112: YES), the process proceeds to S120. On the other hand, when the writing direction of the character string group is different from the reference direction (S112: NO), the process proceeds to S114.

S114では、ストローク座標変換部17が、処理対象の文字列グループのストロークデータを座標変換するための基準点を設定する。この基準点は、当該文字列グループ近傍の適宜な座標位置に設定される。次のS116では、ストローク座標変換部17が、処理対象の文字列グループに含まれるストロークデータを構成する全ての位置座標点について、S114において設定された基準点からのオフセット、すなわちx軸方向及びy軸方向の位置座標の差を算出する。このオフセットは、ストロークデータを構成する位置座標点と基準点との間の距離及び方向を表すベクトルである。   In S114, the stroke coordinate conversion unit 17 sets a reference point for coordinate conversion of the stroke data of the character string group to be processed. This reference point is set at an appropriate coordinate position near the character string group. In next S116, the stroke coordinate conversion unit 17 sets the offset from the reference point set in S114, that is, the x-axis direction and the y-direction, for all the position coordinate points constituting the stroke data included in the character string group to be processed. The difference between the position coordinates in the axial direction is calculated. This offset is a vector representing the distance and direction between the position coordinate point constituting the stroke data and the reference point.

S118では、ストローク座標変換部17が、処理対象の文字列グループの筆記方向が基準方向に合致するように、当該文字列グループのストロークデータを座標変換する。ここでは、ストローク座標変換部17は、S114において設定された基準点、S116において算出されたオフセット、及び当該文字列グループの筆記方向と基準方向との方向差を表す角度に基づいて、ストロークデータの座標変換を行う。   In S118, the stroke coordinate conversion unit 17 converts the stroke data of the character string group so that the writing direction of the character string group to be processed matches the reference direction. Here, the stroke coordinate conversion unit 17 uses the reference point set in S114, the offset calculated in S116, and the angle representing the direction difference between the writing direction and the reference direction of the character string group. Perform coordinate transformation.

具体的には、図9(a)に例示されるように、基準点からストロークデータの各位置座標点までのオフセットで表されるベクトルを、基準点を中心に筆記方向と基準方向との方向差に相当する角度だけ回転させる。これにより、文字列グループの筆記方向が基準方向に合致するようにストロークデータが座標変換される。   Specifically, as illustrated in FIG. 9A, a vector represented by an offset from the reference point to each position coordinate point of the stroke data is a direction between the writing direction and the reference direction around the reference point. Rotate by an angle corresponding to the difference. As a result, the stroke data is coordinate-transformed so that the writing direction of the character string group matches the reference direction.

図9(b)は、図8(c)に例示される各文字列グループの筆記方向を基準方向に合致させた結果を表したものである。この図9(b)に例示されるとおり、各文字列グループA〜Dがそれぞれ元の筆記方向から基準方向に沿った横書きの文字列に変換されている。このような座標変換により、各文字列グループのストロークデータがオンライン手書き文字認識のための認識辞書とのマッチングに利用できるようになる。補足として、ストロークデータの座標変換を行う際、他の文字列グループのストロークデータと座標位置が重複する可能性が生じるが、文字列グループごとに逐次文字認識を行うか、あるいは、重複したストロークデータを重複しない位置へ移動することにより対処できる。   FIG. 9B shows the result of matching the writing direction of each character string group exemplified in FIG. 8C with the reference direction. As illustrated in FIG. 9B, each of the character string groups A to D is converted from the original writing direction to a horizontally written character string along the reference direction. By such coordinate conversion, stroke data of each character string group can be used for matching with a recognition dictionary for online handwritten character recognition. As a supplement, when the coordinate conversion of stroke data is performed, there is a possibility that the coordinate position overlaps with the stroke data of other character string groups, but the character recognition is performed sequentially for each character string group, or the overlapping stroke data Can be dealt with by moving to a position that does not overlap.

図3のフローチャートの説明に戻る。S120では、オンライン文字認識部19が、処理対象の文字列グループのストロークデータに対してオンライン手書き文字認識処理を実行する。ここでのオンライン手書き文字認識処理の対象となるのは、S106(筆記順の並べ替え)及びS118(座標変換)による処理結果が反映された文字列グループのストロークデータである。このオンライン手書き文字認識処理により処理対象の文字列グループを構成する文字の内容が認識される。オンライン文字認識部19は、文字列グループごとに認識された文字の内容をテキスト形式のデータに変換した文字情報を出力する。   Returning to the flowchart of FIG. In S120, the online character recognition unit 19 performs an online handwritten character recognition process on the stroke data of the character string group to be processed. The target of the online handwritten character recognition process here is the stroke data of the character string group reflecting the processing results of S106 (order of writing order) and S118 (coordinate conversion). By this online handwritten character recognition processing, the contents of characters constituting the character string group to be processed are recognized. The online character recognition unit 19 outputs character information obtained by converting the content of characters recognized for each character string group into text format data.

図10は、図9(b)に例示される座標変換後の各文字列グループA,B,C,Dについてオンライン手書き文字認識処理が行われ、各文字列の内容がテキストに変換される推移を表したものである。図10に例示されるとおり、文字列グループAから「てがき」の文字列が認識され、文字列グループBから「ひだり」の文字列が認識され、文字列グループCから「みぎ」の文字列が認識され、文字列グループDから「したがわ」の文字列が認識されている。   FIG. 10 shows a transition in which online handwritten character recognition processing is performed for each of the character string groups A, B, C, and D after coordinate conversion exemplified in FIG. 9B, and the contents of each character string are converted into text. It represents. As illustrated in FIG. 10, the character string “Tenaki” is recognized from the character string group A, the character string “hidari” is recognized from the character string group B, and the character string “Migi” is recognized from the character string group C. Is recognized, and the character string “Tagawa” is recognized from the character string group D.

図3のフローチャートの説明に戻る。全ての文字列グループについてS108〜S120の処理を終えた後に進むS122では、テキスト変換結果記憶部20に保存されている各文字列グループに関する認識結果を表すテキストデータが表示装置34に出力される。これにより、表示装置34において、入力装置31に書き込まれた複数の文字列の認識結果の内容を表す画像情報が表示される。   Returning to the flowchart of FIG. In S122, which is performed after the processing of S108 to S120 is completed for all the character string groups, text data representing the recognition result regarding each character string group stored in the text conversion result storage unit 20 is output to the display device 34. Thereby, on the display device 34, image information representing the contents of the recognition results of the plurality of character strings written in the input device 31 is displayed.

[効果]
上記実施形態の文字認識システムによれば、次の効果を奏する。
文字が入力される範囲及び文字列の筆記方向を制約せず、かつ複数個所から順序関係なく手書き入力された複数の文字列に対して、まず、ストロークデータから変換された画像を用いて、各文字に対応する文字領域と各文字列に対応する文字列グループを特定できる。このようにすることで、複数の文字列に分散したストロークの筆記順に影響されず、文字領域及び文字列グループを精度よく特定できる。
[effect]
The character recognition system according to the embodiment has the following effects.
For a plurality of character strings that are handwritten input from a plurality of places without order restriction, without first restricting the writing range of the character input range and the character string, first, using an image converted from stroke data, The character area corresponding to the character and the character string group corresponding to each character string can be specified. By doing so, the character region and the character string group can be accurately identified without being affected by the writing order of the strokes dispersed in the plurality of character strings.

そして、文字列グループごとにストロークデータを筆記順に並べ替えることで、複数の文字列に分散しているストロークデータの筆記順を、文字列グループごとに一連の連続したグループ内順序に並べ替えることができる。また、1つの文字列の中で1文字以上遡って書き足されたストロークの筆記順についても、1つの文字内で連続する筆記順に修正可能である。   Then, by rearranging the stroke data in the writing order for each character string group, the writing order of the stroke data dispersed in a plurality of character strings can be rearranged in a series of consecutive intra-group orders for each character string group. it can. In addition, the writing order of strokes that are added one or more characters backward in one character string can be corrected in the order of writing that continues within one character.

さらに、文字列グループの筆記方向と、オンライン手書き文字認識処理における基準方向とが異なる場合、そのストロークデータを座標変換することにより、文字列グループの筆記方向を基準方向に合致させることができる。これにより、入力された文字列の筆記方向に関わらず、オンライン手書き文字認識の精度を向上できる。   Furthermore, when the writing direction of the character string group is different from the reference direction in the online handwritten character recognition process, the writing direction of the character string group can be matched with the reference direction by converting the coordinates of the stroke data. Thereby, the accuracy of online handwritten character recognition can be improved regardless of the writing direction of the input character string.

以上のことから、上記実施形態の文字認識システムによれば、寄せ書きや対話型筆談等の用途に適した手書き文字認識を実現できる。
[特許請求の範囲に記載の構成との対応]
実施形態の各構成と、特許請求の範囲に記載の構成との対応は次のとおりである。
From the above, according to the character recognition system of the above embodiment, handwritten character recognition suitable for applications such as side-by-side writing and interactive writing can be realized.
[Correspondence with configuration described in claims]
The correspondence between each configuration of the embodiment and the configuration described in the claims is as follows.

読取部10が実行する処理が、取得ステップに相当する。画像化部12が実行する図3のS100が、画像化ステップに相当する。文字領域認識部13が実行する図3のS102が、文字領域特定ステップに相当する。文字領域グループ化部14が実行する図3のS104が、グループ化ステップに相当する。ストローク順序変更部15が実行する図3のS106が、筆順決定ステップに相当する。筆記方向判定部16が実行する図3のS108が、方向判定ステップに相当する。ストローク座標変換部17が実行する図3のS110〜S118が、ストローク変換ステップに相当する。オンライン文字認識部19が実行する図3のS120が、文字認識ステップに相当する。   The process executed by the reading unit 10 corresponds to an acquisition step. S100 in FIG. 3 executed by the imaging unit 12 corresponds to an imaging step. S102 of FIG. 3 executed by the character area recognition unit 13 corresponds to a character area specifying step. S104 in FIG. 3 executed by the character area grouping unit 14 corresponds to a grouping step. S106 in FIG. 3 executed by the stroke order changing unit 15 corresponds to a stroke order determining step. S108 of FIG. 3 which the writing direction determination part 16 performs corresponds to a direction determination step. S110 to S118 of FIG. 3 executed by the stroke coordinate conversion unit 17 corresponds to a stroke conversion step. S120 in FIG. 3 executed by the online character recognition unit 19 corresponds to a character recognition step.

[変形例]
上述の実施形態では、図9の(a)に例示されるとおり、ストローク座標変換部17が文字列グループ近傍に基準点を設定し、その基準点からストロークデータの各位置座標点までのベクトルを回転させて文字列グループの筆記方向を基準方向に合致させる事例について説明した。このようにすることで、例えば、この文字列グループに続けて更に新しい文字列が書き足された場合に、続けて書き足された文字列に対して、座標変換時に同じ基準点からの変換式を利用できるという利点がある。
[Modification]
In the above-described embodiment, as illustrated in FIG. 9A, the stroke coordinate conversion unit 17 sets a reference point near the character string group, and a vector from the reference point to each position coordinate point of the stroke data is set. The case where the writing direction of the character string group is matched with the reference direction by rotating is described. In this way, for example, when a new character string is added after this character string group, the conversion formula from the same reference point at the time of coordinate conversion is applied to the character string that has been continuously added. There is an advantage that can be used.

一方、これとは別に、座標変換の対象となる文字列グループ全体を含む変換対象領域に対して一律に回転を実行することで、ストロークデータの座標変換を実現できる。この場合、例えば、変換対象領域の重心を回転の中心として、ストロークデータの座標変換を行うことが考えられる。このようにすることで、この文字列グループに続けて更に新しい文字列が書き足されないのであれば、比較的に高速にストロークデータの座標変換を行うことができるという利点がある。   On the other hand, coordinate conversion of stroke data can be realized by uniformly performing rotation on the conversion target area including the entire character string group to be subjected to coordinate conversion. In this case, for example, it is conceivable to perform coordinate conversion of stroke data using the center of gravity of the conversion target region as the center of rotation. By doing this, there is an advantage that the coordinate conversion of the stroke data can be performed at a relatively high speed if no new character string is added after the character string group.

上記実施形態における1つの構成要素が有する機能を複数の構成要素として分散させたり、複数の構成要素が有する機能を1つの構成要素に統合させたりしてもよい。なお、特許請求の範囲に記載した文言のみによって特定される技術思想に含まれるあらゆる態様が本発明の実施形態である。   The functions of one component in the above embodiment may be distributed as a plurality of components, or the functions of a plurality of components may be integrated into one component. In addition, all the aspects included in the technical idea specified only by the wording described in the claim are embodiment of this invention.

1…情報処理装置、10…読取部、11…ストロークデータ記憶部、12…画像化部、13…文字領域認識部、14…文字領域グループ化部、15…ストローク順序変更部、16…筆記方向判定部、17…ストローク座標変換部、18…ストローク変換結果記憶部、19…オンライン文字認識部、20…テキスト変換結果記憶部、31…入力装置、32…外部記憶装置、33…ネットワーク/無線通信経路、34…表示装置。   DESCRIPTION OF SYMBOLS 1 ... Information processing apparatus, 10 ... Reading part, 11 ... Stroke data storage part, 12 ... Imaging part, 13 ... Character area recognition part, 14 ... Character area grouping part, 15 ... Stroke order change part, 16 ... Writing direction Determining unit, 17 ... stroke coordinate conversion unit, 18 ... stroke conversion result storage unit, 19 ... online character recognition unit, 20 ... text conversion result storage unit, 31 ... input device, 32 ... external storage device, 33 ... network / wireless communication Route, 34 ... display device.

Claims (8)

文字が入力される範囲及び文字列の筆記方向を制約せず、かつ複数個所から順序関係なく手書き入力された複数の文字列について、前記複数の文字列に含まれる各入力文字の構成要素であるストロークを筆跡の位置座標列で表した情報と、そのストロークが書き込まれた順番である筆記順を表す情報とを含む複数のストロークデータを取得する取得ステップと、
前記取得ステップにおいて取得されたストロークデータ群を構成する位置座標列に基づいて、手書き入力された前記複数の文字列の筆跡を表す画像情報を生成する画像化ステップと、
前記画像化ステップにおいて生成された画像情報に基づいて、前記複数の文字列を構成する個々の入力文字を囲む領域である文字領域を特定する文字領域特定ステップと、
前記文字領域特定ステップにおいて特定された各文字領域を一連の文字列ごとのグループである文字列グループに分類するグループ化ステップと、
前記取得ステップにおいて取得されたストロークデータ群の筆記順について、前記グループ化ステップにおいて分類された文字列グループごとに、各文字列グループに属する文字領域に含まれるストロークデータの集合内における筆記順に並べ替えたグループ内順序を決定する筆順決定ステップと、
前記グループ化ステップにおいて分類された文字列グループごとに、各文字列グループに属する文字領域に含まれるストロークデータから導出される特徴に基づいて文字列の筆記方向を判定する方向判定ステップと、
前記方向判定ステップにおいて判定された文字列の筆記方向が、オンライン手書き文字認識処理のために定められた基準の筆記方向である基準方向と異なる場合、前記文字列の筆記方向が前記基準方向に合致するように、該当する文字列グループに属する各文字領域に含まれるストロークデータを構成する位置座標列を座標変換するストローク変換ステップと、
前記筆順決定ステップにおいてグループ内順序に変更され、また、前記ストローク変換ステップにおいて座標変換された文字列グループごとのストロークデータに対してオンライン手書き文字認識処理を行い、その認識結果を出力する文字認識ステップと、
をコンピュータに実行させるための文字認識プログラム。
It is a constituent element of each input character included in the plurality of character strings with respect to a plurality of character strings that are handwritten input from a plurality of places without order restriction without restricting the writing range of the characters and the writing direction of the character strings. An acquisition step of acquiring a plurality of stroke data including information representing a stroke in a position coordinate sequence of a handwriting and information indicating a writing order which is an order in which the stroke is written;
An imaging step for generating image information representing handwriting of the plurality of character strings input by handwriting based on the position coordinate sequence constituting the stroke data group acquired in the acquisition step;
A character region specifying step for specifying a character region that is a region surrounding each input character constituting the plurality of character strings, based on the image information generated in the imaging step;
A grouping step for classifying each character region identified in the character region identification step into a character string group that is a group for each series of character strings;
Regarding the writing order of the stroke data group acquired in the acquiring step, the character data group classified in the grouping step is rearranged in the writing order in the set of stroke data included in the character area belonging to each character string group. A stroke order determining step for determining the order within the group;
For each character string group classified in the grouping step, a direction determination step for determining a writing direction of the character string based on characteristics derived from stroke data included in a character area belonging to each character string group;
When the writing direction of the character string determined in the direction determining step is different from a reference direction that is a reference writing direction determined for online handwritten character recognition processing, the writing direction of the character string matches the reference direction. A stroke conversion step for converting the position coordinate sequence constituting the stroke data included in each character area belonging to the corresponding character string group,
Character recognition step for performing on-line handwritten character recognition processing on stroke data for each character string group that has been changed to an intra-group order in the stroke order determining step and coordinate-converted in the stroke conversion step, and outputting the recognition result When,
Character recognition program that causes a computer to execute.
請求項1に記載の文字認識プログラムにおいて、
前記方向判定ステップは、前記文字列グループに属する文字領域に含まれるストロークデータを構成する位置座標列から得られる回帰直線の相関関係に基づいて文字列の筆記方向を判定するものであること、
を特徴とする文字認識プログラム。
The character recognition program according to claim 1,
The direction determination step is to determine a writing direction of a character string based on a correlation of regression lines obtained from a position coordinate sequence constituting stroke data included in a character region belonging to the character string group;
Character recognition program characterized by
請求項1に記載の文字認識プログラムにおいて、
前記方向判定ステップは、前記文字列グループに属する文字領域ごとに、各文字領域に含まれるストロークデータを構成する位置座標列の外接領域を特定し、前記文字列グループ内における複数の外接領域の位置関係に基づいて文字列の筆記方向を判定するものであること、
を特徴とする文字認識プログラム。
The character recognition program according to claim 1,
The direction determination step specifies, for each character region belonging to the character string group, a circumscribing region of a position coordinate sequence constituting stroke data included in each character region, and positions of a plurality of circumscribing regions in the character string group To determine the writing direction of the string based on the relationship,
Character recognition program characterized by
請求項1ないし請求項3の何れか1項に記載の文字認識プログラムにおいて、
前記ストローク変換ステップは、前記該当する文字列グループに属する文字領域に含まれるストロークデータを構成する位置座標列に対して、座標変換の基準となる座標点である基準座標を設定し、設定された基準座標と前記位置座標列における各座標点との間の距離及び方向、並びに前記判定された筆記方向と前記基準方向との方向差を用いて、前記ストロークデータを構成する位置座標列を座標変換するものであること、
を特徴とする文字認識プログラム。
The character recognition program according to any one of claims 1 to 3,
In the stroke conversion step, a reference coordinate which is a coordinate point serving as a reference for coordinate conversion is set and set for a position coordinate sequence constituting stroke data included in a character region belonging to the corresponding character string group. Using the distance and direction between the reference coordinate and each coordinate point in the position coordinate sequence, and the direction difference between the determined writing direction and the reference direction, the position coordinate sequence constituting the stroke data is coordinate-transformed. What to do,
Character recognition program characterized by
文字が入力される範囲及び文字列の筆記方向を制約せず、かつ複数個所から順序関係なく手書き入力された複数の文字列について、前記複数の文字列に含まれる各入力文字の構成要素であるストロークを筆跡の位置座標列で表した情報と、そのストロークが書き込まれた順番である筆記順を表す情報とを含む複数のストロークデータを取得する取得手段と、
前記取得手段により取得されたストロークデータ群を構成する位置座標列に基づいて、手書き入力された前記複数の文字列の筆跡を表す画像情報を生成する画像化手段と、
前記画像化手段において生成された画像情報に基づいて、前記複数の文字列を構成する個々の入力文字を囲む領域である文字領域を特定する文字領域特定手段と、
前記文字領域特定手段により特定された各文字領域を一連の文字列ごとのグループである文字列グループに分類するグループ化手段と、
前記取得手段により取得されたストロークデータ群の筆記順について、前記グループ化手段により分類された文字列グループごとに、各文字列グループに属する文字領域に含まれるストロークデータの集合内における筆記順に並べ替えたグループ内順序を決定する筆順決定手段と、
前記グループ化手段により分類された文字列グループごとに、各文字列グループに属する文字領域に含まれるストロークデータから導出される特徴に基づいて文字列の筆記方向を判定する方向判定手段と、
前記方向判定手段により判定された文字列の筆記方向が、オンライン手書き文字認識処理のために定められた基準の筆記方向である基準方向と異なる場合、前記文字列の筆記方向が前記基準方向に合致するように、該当する文字列グループに属する各文字領域に含まれるストロークデータを構成する位置座標列を座標変換するストローク変換手段と、
前記筆順決定手段によりグループ内順序に変更され、また、前記ストローク変換手段により座標変換された文字列グループごとのストロークデータに対してオンライン手書き文字認識処理を行い、その認識結果を出力する文字認識手段と、
を備える文字認識装置。
It is a constituent element of each input character included in the plurality of character strings with respect to a plurality of character strings that are handwritten input from a plurality of places without order restriction without restricting the writing range of the characters and the writing direction of the character strings. Acquisition means for acquiring a plurality of stroke data including information representing a stroke in a position coordinate sequence of a handwriting and information indicating a writing order which is an order in which the stroke is written;
Imaging means for generating image information representing handwriting of the plurality of character strings input by handwriting based on a position coordinate string constituting the stroke data group acquired by the acquisition means;
A character area specifying means for specifying a character area, which is an area surrounding each input character constituting the plurality of character strings, based on image information generated by the imaging means;
Grouping means for classifying each character area specified by the character area specifying means into a character string group that is a group for each series of character strings;
About the writing order of the stroke data group acquired by the acquiring means, the character data group classified by the grouping means is rearranged in the writing order in the set of stroke data included in the character area belonging to each character string group. A stroke order determining means for determining the order within the group;
For each character string group classified by the grouping means, direction determination means for determining the writing direction of the character string based on the characteristics derived from the stroke data included in the character area belonging to each character string group;
When the writing direction of the character string determined by the direction determining means is different from a reference direction that is a reference writing direction determined for online handwritten character recognition processing, the writing direction of the character string matches the reference direction. Stroke conversion means for performing coordinate conversion of a position coordinate sequence constituting stroke data included in each character region belonging to the corresponding character string group,
Character recognition means for performing on-line handwritten character recognition processing on stroke data for each character string group that has been changed to an in-group order by the stroke order determining means and coordinate-converted by the stroke conversion means, and outputting the recognition result When,
A character recognition device comprising:
請求項5に記載の文字認識装置において、
前記方向判定手段は、前記文字列グループに属する文字領域に含まれるストロークデータを構成する位置座標列から得られる回帰直線の相関関係に基づいて文字列の筆記方向を判定すること、
を特徴とする文字認識装置。
The character recognition device according to claim 5,
The direction determining means determines a writing direction of a character string based on a correlation of regression lines obtained from a position coordinate sequence constituting stroke data included in a character region belonging to the character string group;
Character recognition device characterized by.
請求項5に記載の文字認識装置において、
前記方向判定手段は、前記文字列グループに属する文字領域ごとに、各文字領域に含まれるストロークデータを構成する位置座標列の外接領域を特定し、前記文字列グループ内における複数の外接領域の位置関係に基づいて文字列の筆記方向を判定すること、
を特徴とする文字認識装置。
The character recognition device according to claim 5,
The direction determination means specifies, for each character region belonging to the character string group, a circumscribed region of a position coordinate sequence constituting stroke data included in each character region, and positions of a plurality of circumscribed regions in the character string group Determining the writing direction of the string based on the relationship;
Character recognition device characterized by.
請求項5ないし請求項7の何れか1項に記載の文字認識装置において、
前記ストローク変換手段は、前記該当する文字列グループに属する文字領域に含まれるストロークデータを構成する位置座標列に対して、座標変換の基準となる座標点である基準座標を設定し、設定された基準座標と前記位置座標列における各座標点との間の距離及び方向、並びに前記判定された筆記方向と前記基準方向との方向差を用いて、前記ストロークデータを構成する位置座標列を座標変換すること、
を特徴とする文字認識装置。
The character recognition device according to any one of claims 5 to 7,
The stroke conversion means sets a reference coordinate which is a coordinate point serving as a reference for coordinate conversion, for a position coordinate string constituting stroke data included in a character area belonging to the corresponding character string group. Using the distance and direction between the reference coordinate and each coordinate point in the position coordinate sequence, and the direction difference between the determined writing direction and the reference direction, the position coordinate sequence constituting the stroke data is coordinate-transformed. To do,
Character recognition device characterized by.
JP2015216648A 2015-11-04 2015-11-04 Character recognition program and character recognition device Expired - Fee Related JP6055065B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015216648A JP6055065B1 (en) 2015-11-04 2015-11-04 Character recognition program and character recognition device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015216648A JP6055065B1 (en) 2015-11-04 2015-11-04 Character recognition program and character recognition device

Publications (2)

Publication Number Publication Date
JP6055065B1 JP6055065B1 (en) 2016-12-27
JP2017090998A true JP2017090998A (en) 2017-05-25

Family

ID=57582138

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015216648A Expired - Fee Related JP6055065B1 (en) 2015-11-04 2015-11-04 Character recognition program and character recognition device

Country Status (1)

Country Link
JP (1) JP6055065B1 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019087132A (en) * 2017-11-09 2019-06-06 共同印刷株式会社 Method, device, and computer program for generating character data
JP2021125213A (en) * 2020-01-31 2021-08-30 株式会社Osk Information processor, information processing method, and information processing program
JP7388153B2 (en) 2019-11-27 2023-11-29 株式会社リコー Display device, display program, display method

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109147002B (en) * 2018-06-27 2023-06-20 北京捷通华声科技股份有限公司 Image processing method and device
KR20210073196A (en) 2019-12-10 2021-06-18 삼성전자주식회사 Electronic device and method for processing writing input

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0636174B2 (en) * 1986-10-29 1994-05-11 富士通株式会社 Line extraction method for character strings
JPH06337963A (en) * 1993-05-27 1994-12-06 Toshiba Corp Character recognizing device
JP3595900B2 (en) * 1998-09-28 2004-12-02 富士通株式会社 Handwritten character recognition device and recording medium
JP2007188512A (en) * 2000-09-29 2007-07-26 Japan Science & Technology Agency Character recognizing method, character recognizing program and computer readable recording medium recorded with character recognizing program
JP5284523B1 (en) * 2012-09-05 2013-09-11 株式会社東芝 Information processing system, program, and processing method of information processing system
JP5832980B2 (en) * 2012-09-25 2015-12-16 株式会社東芝 Handwriting input support device, method and program

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019087132A (en) * 2017-11-09 2019-06-06 共同印刷株式会社 Method, device, and computer program for generating character data
JP7030479B2 (en) 2017-11-09 2022-03-07 共同印刷株式会社 Character data generation method, character data generation device and computer program
JP7388153B2 (en) 2019-11-27 2023-11-29 株式会社リコー Display device, display program, display method
JP2021125213A (en) * 2020-01-31 2021-08-30 株式会社Osk Information processor, information processing method, and information processing program

Also Published As

Publication number Publication date
JP6055065B1 (en) 2016-12-27

Similar Documents

Publication Publication Date Title
JP6055065B1 (en) Character recognition program and character recognition device
EP3535689A1 (en) Method and system for transforming handwritten text to digital ink
US9378427B2 (en) Displaying handwritten strokes on a device according to a determined stroke direction matching the present direction of inclination of the device
CN102184395B (en) String-kernel-based hand-drawn sketch recognition method
CN112507806B (en) Intelligent classroom information interaction method and device and electronic equipment
CN113792651A (en) Gesture interaction method, device and medium integrating gesture recognition and fingertip positioning
CN115393872A (en) Method, device and equipment for training text classification model and storage medium
US20150220797A1 (en) Information processing system, information processing method, and program
US11341353B2 (en) Preserving styles and ink effects in ink-to-text
CN113610809A (en) Fracture detection method, fracture detection device, electronic device, and storage medium
JP5897726B2 (en) User interface device, user interface method, program, and computer-readable information storage medium
KR20220038477A (en) Extract line of text
CN112486337A (en) Handwriting graph analysis method and device and electronic equipment
CN112487876A (en) Intelligent pen character recognition method and device and electronic equipment
WO2015040740A1 (en) Electronic device and method
JP5330576B1 (en) Information processing apparatus and handwriting search method
JP6039066B2 (en) Electronic device, handwritten document search method and program
CN103547982A (en) Identifying contacts and contact attributes in touch sensor data using spatial and temporal features
CN112487774A (en) Writing form electronization method and device and electronic equipment
JP7162278B2 (en) Recognition processing device, recognition processing program, recognition processing method, and recognition processing system
JP2014078168A (en) Character recognition apparatus and program
JP5666011B1 (en) Method and electronic equipment
WO2022180725A1 (en) Character recognition device, program, and method
WO2020090356A1 (en) Ink data generation device, method, and program
JP5867227B2 (en) Learning data generation device for character recognition, character recognition device, and program

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20161012

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20161108

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20161201

R150 Certificate of patent or registration of utility model

Ref document number: 6055065

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees