JP2012014517A - Handwritten character recognition method and system thereof - Google Patents
Handwritten character recognition method and system thereof Download PDFInfo
- Publication number
- JP2012014517A JP2012014517A JP2010151157A JP2010151157A JP2012014517A JP 2012014517 A JP2012014517 A JP 2012014517A JP 2010151157 A JP2010151157 A JP 2010151157A JP 2010151157 A JP2010151157 A JP 2010151157A JP 2012014517 A JP2012014517 A JP 2012014517A
- Authority
- JP
- Japan
- Prior art keywords
- data
- tablet computer
- handwriting
- text data
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Landscapes
- Character Discrimination (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
Description
本発明は、手書き文字認識方法およびシステムに関する。より詳細に言えば、本発明は、タブレット型コンピュータに実装されているタッチパネルを介して入力された手書き文字を認識する方法およびシステムに関する。 The present invention relates to a handwritten character recognition method and system. More specifically, the present invention relates to a method and system for recognizing handwritten characters input via a touch panel mounted on a tablet computer.
近年、スマートフォンと呼ばれる携帯電話の一種が広まっている。このスマートフォンの中には、筐体にスイッチやボタンがほとんど無く、タッチパネル式のディスプレイを指などで触れる(「ジェスチャー」とも言われる)ことによりほとんどの操作を行うものが知られている。 In recent years, a type of mobile phone called a smartphone has become widespread. Among these smartphones, there are few switches and buttons on the case, and it is known that most operations are performed by touching a touch panel display with a finger (also referred to as “gesture”).
このタイプのスマートフォンの機能を継承したタブレット型コンピュータについても、近年、普及しつつある。このタブレット型コンピュータは、当該スマートフォンの数倍の大きさ(例えば、A4版やB5判ノート程度の大きさ)を有することから、上記スマートフォンでは画面の大きさにより制約があった動画コンテンツの視聴や電子書籍の閲覧など従来よりも拡張されたユーザ体験(user experience)を提供することができる。 In recent years, tablet computers that inherit the functions of this type of smartphone are also becoming popular. Since this tablet computer has a size several times as large as the smartphone (for example, a size of about A4 size or B5 size notebook), the above-mentioned smartphone can view video content that is restricted by the size of the screen. It is possible to provide an extended user experience (user experience) such as browsing electronic books.
このタブレット型コンピュータは、無線LANやセルラーネットワークなどの無線ネットワークを介してインターネットから様々なアプリケーション(ソフトウェア)をダウンロードすることができる。ユーザはそのアプリケーションを個々のニーズにあわせて使用することができる。これらのアプリケーションの中には、手書き方式によりメモを作成することができるものも存在する。ユーザは作成したメモのデータを他のユーザに提供することができ、また、他のアプリケーションと連携させて活用することができる。 This tablet computer can download various applications (software) from the Internet via a wireless network such as a wireless LAN or a cellular network. Users can use the application according to their individual needs. Some of these applications can create a memo by a handwriting method. The user can provide the created memo data to other users, and can utilize the data in cooperation with other applications.
パーソナル・コンピュータ(以下、「PC」とする)や携帯電話・PHSに実装されるアプリケーションにおいては、メモを作成・編集する機能として、従来、以下の機能の1つまたは複数を組み合わせて実施することが知られていた。
1)ある領域(領域A)で入力した文字を別の領域(領域B)に縮小して表示
2)複数の規定領域から入力する領域を選択し、入力文字列を選択した領域内に表示
3)手書き文字認識
4)辞書、および文字の連続性に関する確率を用いた手書き文字認識精度の向上
5)文章内の特定語句の自動認識とそれに対するアノテーション添付
6)タッチスクリーン/タッチパッドで、ジェスチャーを利用した電子機器の操作
7)文章検索
8)電子メール、SNS、ネット上情報保存・共有などのネットワークを介したサービス
9)入力履歴等を用いた、文章入力時の予測変換
10)音声認識による単語および文章の入力
上記の従来技術の他にも手書き文字認識に関しては、従来から多くの改良がなされてきた(特許文献1、2参照)。
In applications installed in personal computers (hereinafter referred to as “PCs”), mobile phones, and PHS, conventionally, one or more of the following functions must be combined to create and edit notes: Was known.
1) Characters input in one area (area A) are reduced to another area (area B) and displayed 2) An area to be input from a plurality of specified areas is selected, and an input character string is displayed in the selected area 3 ) Handwritten character recognition 4) Improvement of handwritten character recognition accuracy using probability related to dictionary and character continuity 5) Automatic recognition of specific words in sentences and attachment of annotations 6) Gestures with touch screen / touchpad Operation of electronic equipment used 7) Text search 8) Service via network such as e-mail, SNS, online information storage / sharing 9) Predictive conversion at the time of text input using input history 10) By voice recognition 2. Input of Words and Sentences In addition to the above-described conventional techniques, many improvements have been made for handwritten character recognition (see Patent Documents 1 and 2).
しかしながら、タブレット型コンピュータに対して、上記従来技術1)〜6)を全て単純に組み合わせて実装すると、ユーザ入力に対する反応が遅くなり、ユーザ体験が劣化するという課題があった。 However, when the conventional techniques 1) to 6) are simply combined and implemented on a tablet computer, there is a problem that a response to a user input becomes slow and a user experience deteriorates.
また、タブレット型コンピュータにおける手書き文字認識では漢字変換を行わないので、特に携帯電話・PHSなどでの単語や文章入力時の効率を大幅に向上させている上記9)予測変換や10)音声認識の機能の恩恵にあずかれないという課題があった。 In addition, since kanji conversion is not performed in handwritten character recognition on a tablet computer, the above-mentioned 9) predictive conversion and 10) speech recognition, which have greatly improved the efficiency at the time of inputting words and sentences especially in mobile phones and PHS, etc. There was a problem of not being able to take advantage of the function.
本発明は、上記課題に鑑みてなされたものであって、その目的とするところは、タブレット型コンピュータにおけるより効率的な手書き文字認識方法およびシステムを提供することにある。 The present invention has been made in view of the above problems, and an object of the present invention is to provide a more efficient handwritten character recognition method and system in a tablet computer.
上記の課題を解決するために、本発明は、タブレット型コンピュータにおける手書き文字認識方法を提供する。当該タブレット型コンピュータが実行する前記方法は、(a)複数のプログラム・モジュールのうち、相対的に優先度の低い処理を行うプログラム・モジュールを処理優先度の低いスレッドとして生成するステップと、(b)前記スレッドを実行するか否かを判定するステップと、(c)前記スレッドを実行しないと判定した場合に、ユーザ入力を受信するステップと、(d)前記ユーザ入力が前記タブレット型コンピュータのディスプレイの第1の領域に対して行われたものであるか否かを判定するステップと、(e)前記ユーザ入力が前記第1の領域に対して行われたと判定された場合に、前記第1の領域に前記ユーザ入力に対応する描画を行うとともに、該描画を前記ディスプレイの第2の領域にビットマップデータとして表示するステップと、(f)前記描画に対応する筆跡データを、前記スレッドのプログラム・モジュールがアクセス可能な共有リストに格納するステップと、(g)前記スレッドを実行するとの判定がされるまで、上記ステップ(b)〜(f)を繰り返すステップと、(h)前記スレッドを実行すると判定した場合に、前記共有リストにユーザによって入力された筆跡データが格納されているか否かを判定するステップと、(i)前記筆跡データが格納されている場合、前記共有リストから前記筆跡データを読み出すステップと、(j)読み出した前記筆跡データに対応する1つまたは複数のテキストデータを推定するステップであって、該1つまたは複数のテキストデータは少なくとも確度の情報を含む、ステップと、(k)前記推定された1つまたは複数のテキストデータを対応する前記筆跡データと結合して格納するステップを含むことを特徴する。 In order to solve the above problems, the present invention provides a handwritten character recognition method in a tablet computer. The method executed by the tablet computer includes: (a) generating a program module that performs processing with a relatively low priority among a plurality of program modules as a thread with a low processing priority; ) Determining whether to execute the thread; (c) receiving user input if it is determined not to execute the thread; and (d) the user input is a display on the tablet computer. And (e) when it is determined that the user input is performed on the first region, the first step is performed to determine whether the first input is performed on the first region. A drawing corresponding to the user input is performed in the area of the display, and the drawing is displayed as bitmap data in the second area of the display. (F) storing the handwriting data corresponding to the drawing in a shared list accessible to the thread's program module; and (g) until the thread is determined to be executed. Repeating steps (b) to (f); (h) determining whether or not handwriting data input by the user is stored in the shared list when it is determined to execute the thread; and (I) when the handwriting data is stored, reading the handwriting data from the shared list; and (j) estimating one or more text data corresponding to the read handwriting data. The one or more text data includes at least accuracy information; and (k) the estimated one or more To comprising the step of storing in conjunction with the handwriting data corresponding to a plurality of text data.
また、本発明は、タブレット型コンピュータにおける手書き文字認識システムを提供する。当該システムは、1つまたは複数のプログラム・モジュールを含む第1のプログラム・モジュール群を格納する手段と、前記第1のプログラム・モジュール群よりも優先度の低い処理を行う1つまたは複数のプログラム・モジュールを含む第2のプログラム・モジュール群を格納する手段と、認識結果データベースを備え、前記第1のプログラム・モジュール群は、受信したユーザ入力が前記タブレット型コンピュータのディスプレイの第1の領域に対して行われたものであると判定した場合に、該第1の領域に該ユーザ入力に対応する描画を行うとともに、該描画を該ディスプレイの第2の領域にビットマップデータである筆跡データとして表示し、該筆跡データを前記第2のプログラム・モジュール群がアクセス可能な共有リストに格納するための縮小表示プログラム・モジュールを少なくとも含み、前記第2のプログラム・モジュール群は、前記共有リストに前記筆跡データが格納されている場合に、該共有リストから該筆跡データを読み出すとともに、読み出した該筆跡データに対応する1つまたは複数のテキストデータを推定するための特定語句認識プログラム・モジュールであって、該テキストデータは少なくとも確度の情報を含む、特定語句認識プログラム・モジュールを少なくとも含み、前記推定されたテキストデータは、対応する前記筆跡データと結合されて前記認識結果データベースに格納される、ことを特徴する。 The present invention also provides a handwritten character recognition system in a tablet computer. The system includes means for storing a first program module group including one or a plurality of program modules, and one or a plurality of programs for performing a process having a lower priority than the first program module group. A means for storing a second program module group including modules, and a recognition result database, wherein the first program module group receives received user input in a first area of the display of the tablet computer; When it is determined that the image is applied to the first area, drawing corresponding to the user input is performed in the first area, and the drawing is written as handwriting data which is bitmap data in the second area of the display. Display and store the handwriting data in a shared list accessible by the second program module group The second program module group reads out the handwriting data from the shared list and reads out the handwriting data when the handwriting data is stored in the shared list. A specific phrase recognition program module for estimating one or more text data corresponding to the handwriting data, wherein the text data includes at least a certain phrase recognition program module, The estimated text data is combined with the corresponding handwriting data and stored in the recognition result database.
本発明によれば、タブレット型コンピュータにおけるより効率的な手書き文字認識方法およびシステムを提供することができる。 According to the present invention, it is possible to provide a more efficient handwritten character recognition method and system in a tablet computer.
また、本発明によれば、手書き入力に対するユーザフィードバックがより迅速に行われ、手書き文字認識を行う際に従来では活用できていなかった予測変換機能や音声認識機能を利用することができる。 Also, according to the present invention, user feedback for handwritten input is performed more quickly, and a predictive conversion function and a voice recognition function that have not been conventionally used when handwritten character recognition is performed can be used.
また、本発明によれば、筆跡情報とともに保存される1つまたは複数のテキストベースの文字列情報が存在するため、作成したメモに対して全文検索を行ったり、あるいはネットワーク上で提供される各種ウェブサービスにテキストベースの文字列情報を送信して連携したりすることも可能となる。 In addition, according to the present invention, since there is one or more text-based character string information stored together with handwriting information, a full-text search is performed on the created memo, or various types provided on the network It is also possible to cooperate by transmitting text-based character string information to the web service.
以下、本発明の例示的な実施形態について詳細に説明する。 Hereinafter, exemplary embodiments of the present invention will be described in detail.
(システム構成)
図1は、本発明に係る手書き文字認識方法が実装されるタブレット型コンピュータ100のシステム構成図である。
(System configuration)
FIG. 1 is a system configuration diagram of a
タブレット型コンピュータ100は、制御部101、主記憶部102、補助記憶部103、インターフェース(I/F)部104、表示部105、認識結果DB106、辞書DB107、文字パターンDB108および個人別履歴DB109を備える。これらの構成要素101〜109はバス120で相互に接続されており、制御部101によって各構成要素102〜109は統括して制御される。また、タブレット型コンピュータ100は、スタイラスペン160を介してユーザ入力を受けることができる。図1では、スタイラスペン160は、タブレット型コンピュータ100と有線で接続されていないことを示すために、破線の矢印で示されている。
The
制御部101は、中央処理装置(CPU)とも呼ばれ、上述したように各構成要素102〜109の制御やデータの演算を行い、また、補助記憶部103に格納されている各種プログラム・モジュールを主記憶部102に読み出して実行する。主記憶部102は、メインメモリとも呼ばれ、タブレット型コンピュータ100が受信した各種データ、コンピュータ実行可能な命令および当該命令による演算処理後のデータなどを記憶する。
The
補助記憶部103は、ハードディスク(HDD)などに代表される記憶装置であり、データやプログラムを長期的に保存する際に使用される。主記憶部102は、補助記憶部103よりも記憶容量が相対的に小さいため、一時的なデータの記憶や演算処理などに使用されるのに対し、補助記憶部103は、必要なデータや情報の長期的な記憶・保存のために使用される。つまり、制御部101がプログラムを実行してデータの演算を行う場合には、補助記憶部103から必要なデータやプログラムを主記憶部102に読み出し、演算結果のデータを長期的に記憶・保存するには制御部101が補助記憶部103に演算結果のデータを書き込むこととなる。
The
インターフェース(I/F)部104は、手書き文字入力用のスタイラスペン160との間でデータを送受信する際のインターフェースの役割を果たす。タブレット型コンピュータ100の外部から受信したデータは、主記憶部102に一時的に記憶される。また、インターフェース部104は、ユーザより各種コマンドや入力データ(各種マスタ、テーブルなど)を受け付けるインターフェース(入力画面などのアプリケーションプログラム)を表示部105に提供する。表示部105は、タブレット型コンピュータ100によって処理されるデータや上記インターフェースを表示する。
The interface (I / F)
認識結果DB106は、タブレット型コンピュータ100によって認識された、ユーザ入力の筆跡情報と当該筆跡情報に結合された1つまたは複数の文字列および/または音声情報を格納する。
The recognition result DB 106 stores handwriting information input by the user recognized by the
辞書DB107は、タブレット型コンピュータ100において使用される、国語、類語、新語、英和・和英などの辞書や百科事典の情報を格納する。これらの辞書や百科事典は、タブレット型コンピュータ100に予め内蔵されていても良いし、ネットワーク経由でダウンロードして格納されても良い。辞書DB107には、音声情報を認識する際に使用されるイントネーションなどの情報も含まれる。また、辞書DB107に格納されている各種辞書や百科事典は、タブレット型コンピュータ100で稼動するアプリケーションで使用することができる管理情報などをメタデータとして保有する(例えば、使用頻度に応じた優先使用順位の情報、など)。
The dictionary DB 107 stores information on dictionaries such as national language, synonyms, new words, English-Japanese / Japanese-English, and encyclopedias used in the
文字パターンDB108は、ユーザによって入力された筆跡情報に基づいて対応する文字や語句を推定する際に使用される文字パターン(テンプレート)を格納する。この文字パターンは、タブレット型コンピュータ100に予め内蔵されていても良いし、ネットワーク経由でダウンロードして格納されても良い。
The
個人別履歴DB109は、以前に入力した筆跡情報、辞書DB107に格納されている辞書や百貨事典の使用頻度および音声の特徴をユーザ別に保存しておくデータベースである。このデータベースを利用することにより、例えば、「会議」という文字についても個々人による筆跡の特徴を記憶することが可能であり、また、個々人の声の特徴も記憶することができるため、文字認識および音声認識の精度向上に役立たせることが可能となる。
The
スタイラスペン160は、タブレット型コンピュータ100に表示される入力欄に文字を描画可能なものであれば、周知の任意のスタイラスペンを利用することができる。
As the
(プログラム・モジュールの機能)
図2は、本発明に係る手書き文字認識方法を実行するためのプログラム・モジュールを示す図である。これらのプログラム・モジュールは、ユーザからの命令(入力)や特定の発生イベントに応答して制御部101によって主記憶部102上で実行される。
(Function of program module)
FIG. 2 is a diagram showing a program module for executing the handwritten character recognition method according to the present invention. These program modules are executed on the
タブレット型コンピュータ100は、第1モジュール群201および第2モジュール群202を有する。第1モジュール群201は、縮小表示モジュール211、選択領域表示モジュール212およびジェスチャー認識モジュール216を有する。第2モジュール群202は、手書き文字認識モジュール213、文字認識精度向上モジュール214および特定語句認識モジュール215を有する。
The
タブレット型コンピュータ100は、文章検索モジュール217、ネットワークサービスモジュール218、予測変換モジュール219および音声認識モジュール220も有する。文章検索モジュール217およびネットワークサービスモジュール218は、ユーザの指示にしたがって第2モジュール群202と連携して起動されることが可能である。
The
文章検索モジュール217は、認識結果DB106に記憶されているテキストベースの文字列データを検索する機能を提供する。スタイラスペン160によって入力された手書き文字は、認識結果DB106に、手書き文字自体である筆跡情報(ビットマップデータ)として保存されると共に1つまたは複数のテキストベースの文字列データとして保存される。文章検索モジュール217は、この1つまたは複数の文字列データに基づいて検索を行うことができる。
The
ネットワークサービスモジュール218は、電子メール送受信機能、SNSへのアクセス機能、およびインターネットなどのネットワーク上に存在する情報をダウンロードして保存し、またネットワークに対してアップロードして共有するための機能を提供する。タブレット型コンピュータ100は、ユーザの操作に基づき、スタイラスペン160によって入力された筆跡情報と文字パターンDB108に記憶されているテンプレートとから画像を生成し、あるいは、認識した文字列の連続から文章を生成し、生成された画像・文章をネットワークサービスモジュール218を介してネットワークに送信し、当該ネットワークから提供される各種アプリケーションによるサービスを利用することができる。
The
予測変換モジュール219は、ユーザによって文字が入力されたことに応答してその文字の変換候補や後続する文字列を予測して提示する機能を提供する。この機能は、例えば、文字を入力する時に一部の文字を入力するとその入力された文字に基づいて予想される変換後の語句や後続の文字を提示する。
The
音声認識モジュール220は、タブレット型コンピュータ100に内蔵されるマイクロホンを介して入力された音声入力を電気信号である音声情報として認識する。かかる認識時に、音声認識モジュール220は、スタイラスペン160によってほぼ同時に入力された筆跡情報がある場合には、その筆跡情報に音声情報を結合することができる。この結合処理に使用される情報は、例えば、sysdateなどの日付時刻情報である。例えば、ペン160を使用して「会議の場所」と手書き入力する時(あるいは入力直後)に、「1階会議室」と音声入力する場合には、筆跡情報「会議の場所」と音声情報「1階会議室」とが結合されて主記憶部102(最終的には認識結果DB106)に記憶される。
The
また、音声認識モジュール220は、音声認識した単語や文章の確度を辞書DB107に基づいて決定することができる。例えば、「きょういく」という音声入力に対して、「今日行く」あるいは「教育」という音声情報として認識される際に、前後の文脈や声のイントネーションに基づいていずれの認識結果が相対的に高い確度であるのかといった情報を決定することができる。この確度の情報(確かさの度合い)は、予測変換の精度を向上させるために使用される。
The
本明細書において説明されているように、筆跡情報(ビットマップデータ)に結合された音声情報がある場合には、音声認識モジュール220は、その音声情報に関しても推定処理を行い、1つまたは複数の文字列データ(テキストデータ)を確度の情報付きで獲得する。
As described herein, when there is speech information combined with handwriting information (bitmap data), the
第1モジュール群201は、ユーザフィードバックを優先して処理するために複数のプログラム・モジュールをまとめたものである。すなわち、第1モジュール群201は、[背景技術]の欄で説明した、1)、2)、6)の機能をベースに付加機能をあわせて実装するモジュール群である。
The
縮小表示モジュール211は、図3に示すように、タブレット型コンピュータ100のディスプレイのある特定の領域(領域A)にスタイラスペン160で入力された文字を、ビットマップデータとしてディスプレイの別の領域(領域B)に縮小して表示させる機能を提供する。例えば、ユーザがスタイラスペン160を使用してメモ作成アプリケーションに対して文字を入力する場合、文字入力欄(領域A)は手書きをしやすい大きさの入力欄であり、筆跡情報が表示される表示欄(領域B)は入力された一連の文章を読むことが十分な大きさの表示欄である。また、縮小表示モジュール211は、スタイラスペン160により入力された筆跡情報を第2モジュール群202に送信する。音声認識モジュール220によって認識された音声情報が筆跡情報に結合されている場合には、筆跡情報と音声情報が結合されたままで送信される。送信された筆跡情報および/または音声情報は、例えば主記憶部102上の可変長リストに記憶されるが、記憶された情報は後述する処理が始まるまでそのまま保存される。
As shown in FIG. 3, the reduced
選択領域表示モジュール212は、複数の規定領域から入力する領域を選択して、入力文字をその選択した領域内へ表示する機能を提供する。図3に示した例で説明すると、ユーザは領域Aおよび領域Bのいずれの領域でも入力領域を選択することができる。選択領域表示モジュール212は、ユーザによって選択された領域に入力された文字を表示する。また、選択領域表示モジュール212は、選択した領域において当該領域の右端に達した場合には自動的に改行処理を行う。改行の間隔は、規定のテンプレートやユーザによって予め設定された設定情報に依存する。さらに、選択領域表示モジュール212は、上記テンプレートや設定情報によっては領域中に筆記した文字が入りきらなくなる場合に、表示部105が表示可能なようになるまで、文字の縮小率を自動的に上げて文字列を表示可能にする。
The selection
ジェスチャー認識モジュール216は、タブレット型コンピュータ100のタッチスクリーン/タッチパッドで、ジェスチャー(例えば、人間の指で表示部105を触れる)を利用した操作を可能にする。例えば、表示部105上に表示されている任意のアプリケーションのアイコンを1回タッチするジェスチャーを感知したら、そのアプリケーションを起動したり、あるいは、当該アイコンをドラッグするジェスチャーを感知したらそのアイコンを表示部105内で移動させたりする。
The
次に、第2モジュール群202の各モジュール213〜215について説明する。第2モジュール群202は、[背景技術]の欄で説明した、3)、4)、5)の機能をベースに付加機能をあわせて実装するモジュール群である。第2モジュール群202は、第1モジュール群201の処理に余裕がある時に処理を行う。第1モジュール群201の処理に余裕があるか否かの判定は、例えば、ユーザがスタイラスペン160による入力を一時休止し、手を休めている時など、所定のイベントに基づいて行われる。
Next, the
手書き文字認識モジュール213は、スタイラスペン160によって入力された手書き文字、すなわち、縮小表示モジュール211から送信されて記憶されている筆跡情報を、例えば可変長リストから読み出して推定する。手書き文字認識モジュール213は、筆跡情報に付随する入力のタイミング情報やストロークの開始位置情報などに基づいて、読み出した筆跡情報から一文字ずつ推定する。ここで一文字に決定することができず、複数候補が推定される場合には、複数候補を確度付きで認識して保存する。なお、かかる推定は、文字パターンDB108に記憶されている文字パターンと照合することによって行うことができる。
The handwritten
文字認識精度向上モジュール214は、辞書や文字の連続性に関する確率情報を用いることによって手書き文字認識の精度を向上させる機能を提供する。辞書は辞書DB107に含まれている辞書であり、文字の連続性とは文章として成立するか否かの情報を示す。また、文字認識精度向上モジュール214は、個人別履歴DB109に格納されているユーザ別の情報を利用して手書き文字認識の精度を向上させる。
The character recognition
特定語句認識モジュール215は、手書き文字認識モジュール213および文字認識精度向上モジュール214と連携することにより、文章内の特定語句の認識とそれに対するアノテーション(注釈)を付する機能を提供する。つまり、特定語句認識モジュール215は、1つまたは複数の文字区切り候補、1つまたは複数の文字認識の候補、辞書や文字の連続性に関する確率情報、および音声認識の結果を総合的に判断して、1つまたは複数の文字の区切りと対応する文字の候補を確度付きで算出する。算出された1つまたは複数の文字の区切りと対応する文字の候補は、タブレット型コンピュータ100のディスプレイ上で常時見えることなく認識結果DB106に保存されており、保存されたこれらのデータはユーザによって行われる検索操作で使用される。この検索操作は、複数の文字の区切りおよび対応する文字の候補が存在する場合には、確度の高い順に行われる。
The specific word /
特定語句認識モジュール215は、算出した1つまたは複数の文字の区切りと対応する文字の候補を確度の高い順に表示部105に表示して、ユーザから文字認識の確定情報を得ることもできる。また特定語句認識モジュール215は、ユーザから文字認識の間違えについて指摘・訂正を受けることができる。かかるユーザからの確定情報や指摘・訂正情報については、アプリケーションを提示してユーザに正しい候補を選択してもらったり、あるいは、誤認識した文字を再度丁寧に筆記してもらったりすることにより得ることができる。
The specific
文章検索モジュール217は、テキストベースの上記算出された文字認識の結果に対して検索を行う。一実施形態ではこの検索は、ユーザによって確定処理された文字列データに対してのみ行われるのではなく、所定の確度以上の文字の組み合わせに対して並行して行われることも可能である。
The
(処理フロー)
図4は、上記各モジュールを使用する、本発明に係る手書き文字認識のフローを示す図である。以下の説明では、図3に示すように、タブレット型コンピュータ100のディスプレイのうちユーザの手元に近い領域を領域Aとして定義し、残りの領域を領域Bとして定義する。領域Aに入力された文字は、筆跡情報として領域Bに縮小表示される。
(Processing flow)
FIG. 4 is a diagram showing a flow of handwritten character recognition according to the present invention using the above modules. In the following description, as shown in FIG. 3, an area close to the user's hand in the display of the
ステップS401にて、タブレット型コンピュータ100は、第2モジュール群202の処理を優先度の低いスレッドとして生成する。ここで、「優先度の低い」とするのは、上述したように、第2モジュール群202の処理は、第1モジュール群201の処理に余裕がある時に行われるためである。また、「スレッド」とはソフトウェアの実行単位であり、1つまたは複数のプログラム・モジュールを含むことができる。
In step S401, the
ステップS402にて、タブレット型コンピュータ100は、第2モジュール群202の処理を開始することができるか否かを判定する。具体的には、タブレット型コンピュータ100に対するユーザ入力が所定の時間ないなど予め定められた期間のユーザ入力の有無を判定する。その期間中、ユーザ入力があればステップS403に処理が進み、ユーザ入力がなければ図5に示す第2モジュール群202の処理フローに処理が進む。
In step S402, the
ステップS403にて、タブレット型コンピュータ100は、ユーザ入力を受信する。ここで、ユーザ入力には、ジェスチャー、スタイラスペン160による入力、音声入力およびタブレット型コンピュータ100本体機器への入力などが含まれる。
In step S403, the
ステップS404にて、タブレット型コンピュータ100は、ユーザ入力が、ジェスチャーに該当するか否かを判定する。上述したように、ジェスチャーとは、タブレット型コンピュータ100のディスプレイに対して行われるユーザの指などによる接触行為のことを指す。ステップS405にて、タブレット型コンピュータ100は、ジェスチャーに対応する処理を行う。具体的には、タブレット型コンピュータ100は、対応するアプリケーションの操作などを行う。タブレット型コンピュータ100は、この処理が終了したら、ステップS402に処理を戻す。
In step S404, the
ステップS406にて、タブレット型コンピュータ100は、ユーザ入力がスタイラスペン160を介した領域Aへの入力に該当するか否かを判定する。
In step S <b> 406, the
ステップS407にて、タブレット型コンピュータ100は、スタイラスペン160による入力に対応する描画を領域Aに行うとともに、縮小表示モジュール211を用いて、所定のタイミングで領域Bに対してその描画に対応するビットマップデータを領域Bに縮小表示する。この縮小表示は、領域Bに既に表示されているビットマップデータと新たに追加されるビットマップデータの大きさを考慮して、領域Bに既に表示されているビットマップデータと新たに追加されるビットマップデータを縮小表示することによって行われる。また、タブレット型コンピュータ100は、領域Aに入力された文字列が画面右端に到達した場合、選択領域表示モジュール212を用いて、使用されているテンプレートや設定情報に従って自動的に改行処理を行う。
In step S407, the
ステップS408にて、タブレット型コンピュータ100は、領域Aに入力された文字を筆跡情報として、縮小表示モジュール211を介して第2モジュール群202に送信し、領域Bとの共有リスト(例えば可変長リスト)に保存する。タブレット型コンピュータ100は、この処理が終了したら、ステップS402に処理を戻す。
In step S408, the
ステップS409にて、タブレット型コンピュータ100は、ユーザ入力が音声入力か否かを判定する。音声入力は、タブレット型コンピュータ100のマイクロホンによって電気信号に変換される。ステップS410にて、タブレット型コンピュータ100は、音声認識モジュール220を使用して、音声入力が行われた際に入力されていた筆跡情報と音声情報を結合し、その後領域Bとの共有リストに保存する。タブレット型コンピュータ100は、この処理が終了したら、ステップS402に処理を戻す。
In step S409, the
ステップS411にて、タブレット型コンピュータ100は、ユーザ入力が機器本体からの入力あるいはスタイラスペン160を介した領域A以外への入力操作なのか否かを判定する。ステップS412にて、タブレット型コンピュータ100は、当該入力に対応する処理を行う(例えば、初期表示画面を表示する、など)。タブレット型コンピュータ100は、この処理が終了したら、ステップS402に処理を戻す。
In step S <b> 411, the
図5は、本発明に係る手書き文字認識のフローのうち、第2モジュール群202に係る処理を示す図である。
FIG. 5 is a diagram showing a process related to the
ステップS501にて、タブレット型コンピュータ100は、領域Aと領域Bの共有リストにデータが保存されているか否かを判定する。上述したように、共有リストには縮小表示モジュール211によって筆跡情報が送信され、保存されている。この共有リストに未処理の筆跡情報が格納されていればステップS502に処理が進み、一方、未処理の筆跡情報が格納されていなければ図5の処理フローは終了する。データが未処理であるか、あるいは処理済であるかを判定するのは、筆跡情報データに付随するフラグの値や所定のメタデータの値によって行うことができる。
In step S501, the
ステップS502にて、タブレット型コンピュータ100は、手書き文字認識モジュール213を用いて共有リストから筆跡情報や音声情報を読み出して主記憶部102に格納する。
In step S <b> 502, the
ステップS503にて、手書き文字認識モジュール213は、筆跡情報のヘッダ部分に格納されている入力のタイミング情報やストロークの開始位置情報などに基づいて、読み出した筆跡情報から一文字ずつ推定する。一文字に決定することができず、複数候補が推定される場合には、複数候補を確度付きで推定しておく。かかる推定は、文字パターンDB108に格納されている文字パターンと照合することによって行うことができる。タブレット型コンピュータ100は、予測変換モジュール219を使用して、読み出した文字列およびその後に続く文字列を推定することも可能である。また、手書き文字認識モジュール213は、上述したような文字認識精度向上モジュール214および特定語句認識モジュール215と連携して処理を行うことにより、当該推定の精度を向上させることができる。
In step S503, the handwritten
また、上記筆跡情報に関連付けられた音声情報がある場合には、音声認識モジュール220は、その音声情報に関して推定処理を行い、1つまたは複数の推定結果(テキストデータ)を確度付きで獲得する。音声認識時に確度の情報を使用することで予測変換を行うことが可能となる。
When there is speech information associated with the handwriting information, the
ステップS504にて、タブレット型コンピュータ100は、任意の処理として、推定した1つまたは複数の文字や語句の確度が所定の確度以上であれば、特定語句認識モジュール215を使用して表示部105に表示する。表示部105に表示された1つまたは複数の文字や語句は、ユーザによって確定処理や誤り訂正処理がなされる。例えば、タブレット型コンピュータ100は、表示部105に1つまたは複数の文字や語句について確定処理をユーザに行わせるための画面を表示させたり、あるいはユーザに誤り訂正をさせるために訂正のための入力欄や編集画面を表示させたりすることができる。ステップS505にて、タブレット型コンピュータ100は、任意の処理として、ユーザによって行われた確定処理や誤り訂正処理にしたがって文字認識を行う。
In step S504, as an arbitrary process, the
ステップS506にて、タブレット型コンピュータ100は、認識結果である1つまたは複数の文字列データ(テキストデータ)を筆跡情報(ビットマップデータ)と結合して認識結果DB106に保存する。保存が完了したら、ステップS501に処理が戻る。
In step S506, the
(その他の実施形態)
上記の実施形態に付加することが可能な以下の機能についてもタブレット型コンピュータ100の有するプログラム・モジュールやデータベースに追加することができる。
(Other embodiments)
The following functions that can be added to the above embodiment can also be added to the program module or database of the
図1に示したように、タブレット型コンピュータ100は、個人別履歴DB109を有する。上述のステップS503において筆跡情報から一文字ずつ推定する際に、個人別履歴DB109に格納されている当該ユーザの筆跡情報と照合することによって、より高い確度の推定を行うことができる。格納されている筆跡情報は以前の文字認識結果である文字列データと関連付けられている。個人別履歴DB109を参照しながら照合を行う際には、タブレット型コンピュータ100は、個人別履歴DB109の筆跡情報を基準にして、ユーザ入力された筆跡情報を必要に応じて拡大または縮小させつつ、あるいは、少しずつずらしながら照合を行う。
As shown in FIG. 1, the
音声認識モジュール220は、個人別履歴DB109に保存されているユーザ別の音声の特徴に基づいて、タブレット型コンピュータ100のユーザの音声を聞き分けて、音声認識を行うこともできる。例えば、会議などで複数の人が発言する場合を想定すると、通常のモードでは、タブレット型コンピュータ100に内蔵されているマイクロホンは複数の人の音声入力に対して音声認識を行ってしまうが、この機能を利用するとタブレット型コンピュータ100のユーザの音声入力だけを選別して音声認識を行うことが可能となる。
The
また、タブレット型コンピュータ100は、入力された文字や語句、あるいは音声認識した単語などから辞書DB107に格納されている各種辞書の優先順位を決定することも可能である。例えば、コンピュータ・サイエンスの分野で使用される文字や語句が格納されている辞書が多く使用される場合には、タブレット型コンピュータ100は、当該辞書を参照する順番を高い優先順位に変更することができる。このようにある特定の辞書が多用される場合には、辞書DB107に格納されている辞書の優先順位を変更することにより、文字や語句の推定の精度を向上させることが可能となる。なお、上述したように、辞書DB107にはネットワークから新たな分野の辞書をダウンロードして追加することが可能である。
The
(まとめ)
上述の実施形態で説明した方法、機能および手段は、コンピュータ実施可能なプログラムとして実装することも可能であり、また、当該プログラムを格納したコンピュータ読み取り可能な記録媒体として実施することも可能である。
(Summary)
The methods, functions, and means described in the above-described embodiments can be implemented as a computer-executable program, or can be implemented as a computer-readable recording medium that stores the program.
上記で説明した実施形態はあくまでも例示であり、本発明は上記の実施形態に限定されることはなく、様々な変形が可能である。すなわち、特許請求の範囲に記載された技術的思想に基づくものである限り、その変形は本発明の技術範囲内に含まれる。 The embodiment described above is merely an example, and the present invention is not limited to the above embodiment, and various modifications are possible. That is, as long as it is based on the technical idea described in the scope of claims, the modifications are included in the technical scope of the present invention.
100 タブレット型コンピュータ
106 認識結果DB
107 辞書DB
108 文字パターンDB
109 個人別履歴DB
160 スタイラスペン
201 第1モジュール群
202 第2モジュール群
211 縮小表示モジュール
212 選択領域表示モジュール
213 手書き文字認識モジュール
214 文字認識精度向上モジュール
215 特定語句認識モジュール
216 ジェスチャー認識モジュール
217 文章検索モジュール
218 ネットワークサービスモジュール
219 予測変換モジュール
220 音声認識モジュール
100
107 Dictionary DB
108 Character pattern DB
109 Personal history DB
160
Claims (10)
該タブレット型コンピュータが実行する前記方法は、
(a)複数のプログラム・モジュールのうち、相対的に優先度の低い処理を行うプログラム・モジュールを処理優先度の低いスレッドとして生成するステップと、
(b)前記スレッドを実行するか否かを判定するステップと、
(c)前記スレッドを実行しないと判定した場合に、ユーザ入力を受信するステップと、
(d)前記ユーザ入力が前記タブレット型コンピュータのディスプレイの第1の領域に対して行われたものであるか否かを判定するステップと、
(e)前記ユーザ入力が前記第1の領域に対して行われたと判定された場合に、前記第1の領域に前記ユーザ入力に対応する描画を行うとともに、該描画を前記ディスプレイの第2の領域にビットマップデータとして表示するステップと、
(f)前記描画に対応する筆跡データを、前記スレッドのプログラム・モジュールがアクセス可能な共有リストに格納するステップと、
(g)前記スレッドを実行するとの判定がされるまで、上記ステップ(b)〜(f)を繰り返すステップと、
(h)前記スレッドを実行すると判定した場合に、前記共有リストにユーザによって入力された筆跡データが格納されているか否かを判定するステップと、
(i)前記筆跡データが格納されている場合、前記共有リストから前記筆跡データを読み出すステップと、
(j)読み出した前記筆跡データに対応する1つまたは複数のテキストデータを推定するステップであって、該1つまたは複数のテキストデータは少なくとも確度の情報を含む、ステップと、
(k)前記推定された1つまたは複数のテキストデータを対応する前記筆跡データと結合して格納するステップと
を含むことを特徴する方法。 A method for recognizing handwritten characters in a tablet computer,
The method performed by the tablet computer includes:
(A) generating a program module that performs processing with a relatively low priority among a plurality of program modules as a thread with a low processing priority;
(B) determining whether to execute the thread;
(C) receiving a user input if it is determined not to execute the thread;
(D) determining whether the user input is made to a first area of the display of the tablet computer;
(E) When it is determined that the user input is performed on the first area, drawing corresponding to the user input is performed on the first area, and the drawing is performed on the second area of the display. Displaying as bitmap data in the area;
(F) storing handwriting data corresponding to the drawing in a shared list accessible by the program module of the thread;
(G) repeating the steps (b) to (f) until it is determined that the thread is to be executed;
(H) a step of determining whether or not handwriting data input by a user is stored in the shared list when it is determined to execute the thread;
(I) if the handwriting data is stored, reading the handwriting data from the shared list;
(J) estimating one or more text data corresponding to the read handwriting data, wherein the one or more text data includes at least accuracy information;
(K) combining and storing the estimated one or more text data with corresponding handwriting data.
(j1)読み出した前記筆跡データに含まれる入力のタイミング情報やストロークの開始位置情報に基づいて、前記対応する1つまたは複数のテキストデータを推定するステップをさらに含み、
前記推定は、前記タブレット型コンピュータに格納されている文字パターンと照合することによって行われ、該照合の結果にしたがって前記確度の情報が決定される、ことを特徴とする請求項1に記載の方法。 The estimating step (j) includes:
(J1) further including the step of estimating the corresponding one or more text data based on input timing information and stroke start position information included in the read handwriting data,
The method according to claim 1, wherein the estimation is performed by collating with a character pattern stored in the tablet computer, and the accuracy information is determined according to the collation result. .
前記推定した前記対応する1つまたは複数のテキストデータに後続するテキストデータの候補を予測するステップをさらに含むことを特徴とする請求項2に記載の方法。 The estimating step (j1) includes:
3. The method of claim 2, further comprising predicting text data candidates that follow the estimated one or more corresponding text data.
前記ユーザに対して提示することに応答して、前記推定された1つまたは複数のテキストデータのうち1つのテキストデータをユーザ入力にしたがって確定するステップと
をさらに含むことを特徴とする請求項1に記載の方法。 Presenting the estimated one or more text data having information of the accuracy exceeding a predetermined threshold to a user;
The method further comprises: determining one text data of the estimated one or more text data according to a user input in response to presenting to the user. The method described in 1.
前記1つまたは複数のテキストデータのうち1つのテキストデータを正しいデータとしてユーザに選択させるための第1のユーザ入力画面を表示するステップと、
前記1つまたは複数のテキストデータのうち1つのテキストデータを正しいデータに修正するための第2のユーザ入力画面を表示するステップと
をさらに含むことを特徴とする請求項5に記載の方法。 Confirming according to the user input comprises:
Displaying a first user input screen for allowing a user to select one text data of the one or more text data as correct data;
6. The method of claim 5, further comprising: displaying a second user input screen for correcting one of the one or more text data to correct data.
前記判定するステップ(h)は、前記共有リストに前記筆跡データおよび該筆跡データに結合されている前記音声データが格納されているか否かを判定するステップをさらに含み、
前記読み出すステップ(i)は、前記筆跡データおよび前記音声データが格納されている場合、前記共有リストから前記筆跡データおよび前記音声データを読み出すステップをさらに含み、
前記推定するステップ(j)は、読み出した前記筆跡データおよび前記音声データに対応する1つまたは複数のテキストデータであって、少なくとも確度の情報を含むテキストデータを推定するステップをさらに含む、
ことを特徴する請求項1または5に記載の方法。 The storing step (f) includes audio data that is a recognition result of the audio input when there is an audio input that is coupled to a drawing corresponding to the user input and that is input via a microphone of the tablet computer. And combining the handwriting data and storing in the shared list,
The determining step (h) further includes a step of determining whether or not the handwriting data and the voice data combined with the handwriting data are stored in the shared list,
The step of reading (i) further includes a step of reading the handwriting data and the voice data from the shared list when the handwriting data and the voice data are stored,
The estimating step (j) further includes estimating one or more text data corresponding to the read handwriting data and the speech data, the text data including at least accuracy information,
The method according to claim 1 or 5, characterized in that:
(j2)読み出した前記音声データの少なくともイントネーションの情報に基づいて、前記音声データに対応する1つまたは複数のテキストデータを推定するステップであって、該イントネーションの情報は前記タブレット型コンピュータに格納されている、ステップと、
(j3)読み出した前記筆跡データに含まれる入力のタイミング情報やストロークの開始位置情報に基づいて推定された前記対応する1つまたは複数のテキストデータに基づいて、前記音声データに対応する1つまたは複数のテキストデータを推定するステップと
の少なくとも1つを含むことを特徴とする請求項8に記載の方法。 The estimating step (j) includes:
(J2) Estimating one or more text data corresponding to the voice data based on at least the intonation information of the read voice data, the intonation information being stored in the tablet computer Step, and
(J3) Based on the corresponding one or more text data estimated based on the input timing information and the stroke start position information included in the read handwriting data, The method of claim 8, comprising at least one of estimating a plurality of text data.
1つまたは複数のプログラム・モジュールを含む第1のプログラム・モジュール群を格納する手段と、
前記第1のプログラム・モジュール群よりも優先度の低い処理を行う1つまたは複数のプログラム・モジュールを含む第2のプログラム・モジュール群を格納する手段と、
認識結果データベースと
を備え、
前記第1のプログラム・モジュール群は、
受信したユーザ入力が前記タブレット型コンピュータのディスプレイの第1の領域に対して行われたものであると判定した場合に、該第1の領域に該ユーザ入力に対応する描画を行うとともに、該描画を該ディスプレイの第2の領域にビットマップデータである筆跡データとして表示し、該筆跡データを前記第2のプログラム・モジュール群がアクセス可能な共有リストに格納するための縮小表示プログラム・モジュール
を少なくとも含み、
前記第2のプログラム・モジュール群は、
前記共有リストに前記筆跡データが格納されている場合に、該共有リストから該筆跡データを読み出すとともに、読み出した該筆跡データに対応する1つまたは複数のテキストデータを推定するための特定語句認識プログラム・モジュールであって、該テキストデータは少なくとも確度の情報を含む、特定語句認識プログラム・モジュール
を少なくとも含み、
前記推定されたテキストデータは、対応する前記筆跡データと結合されて前記認識結果データベースに格納される、
ことを特徴するシステム。 A handwritten character recognition system for a tablet computer,
Means for storing a first group of program modules including one or more program modules;
Means for storing a second program module group including one or more program modules that perform processing with a lower priority than the first program module group;
A recognition result database and
The first program module group includes:
When it is determined that the received user input is performed on the first area of the display of the tablet computer, drawing corresponding to the user input is performed on the first area, and the drawing is performed. At least a reduced display program module for storing the handwriting data in a shared list accessible by the second program module group in the second area of the display. Including
The second program module group includes:
A specific phrase recognition program for reading the handwriting data from the shared list and estimating one or more text data corresponding to the read handwriting data when the handwriting data is stored in the shared list A module, the text data including at least accuracy information, including at least a specific word recognition program module;
The estimated text data is combined with the corresponding handwriting data and stored in the recognition result database.
A system characterized by that.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010151157A JP2012014517A (en) | 2010-07-01 | 2010-07-01 | Handwritten character recognition method and system thereof |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010151157A JP2012014517A (en) | 2010-07-01 | 2010-07-01 | Handwritten character recognition method and system thereof |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2012014517A true JP2012014517A (en) | 2012-01-19 |
Family
ID=45600849
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010151157A Withdrawn JP2012014517A (en) | 2010-07-01 | 2010-07-01 | Handwritten character recognition method and system thereof |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2012014517A (en) |
-
2010
- 2010-07-01 JP JP2010151157A patent/JP2012014517A/en not_active Withdrawn
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10698604B2 (en) | Typing assistance for editing | |
US11954405B2 (en) | Zero latency digital assistant | |
US10067938B2 (en) | Multilingual word prediction | |
US10592601B2 (en) | Multilingual word prediction | |
US10114809B2 (en) | Method and apparatus for phonetically annotating text | |
US10127220B2 (en) | Language identification from short strings | |
US20170263248A1 (en) | Dictation that allows editing | |
US9026428B2 (en) | Text/character input system, such as for use with touch screens on mobile phones | |
JP5462001B2 (en) | Contextual input method | |
JP5860171B2 (en) | Input processing method and apparatus | |
CN111052064B (en) | Method for automatically providing gesture-based auto-completion suggestion and electronic device thereof | |
KR101474854B1 (en) | Apparatus and method for selecting a control object by voice recognition | |
JP2010520530A (en) | Shared language model | |
US20170270092A1 (en) | System and method for predictive text entry using n-gram language model | |
CN108664142B (en) | Input method with inter-document self-learning function | |
CN108664141B (en) | Input method with document context self-learning function | |
KR101447879B1 (en) | Apparatus and method for selecting a control object by voice recognition | |
JP2012511759A (en) | User specified phrase input learning | |
JP2012098891A (en) | Information processing system and information processing method | |
CN110249326B (en) | Natural language content generator | |
JP2012014517A (en) | Handwritten character recognition method and system thereof | |
CN117636915A (en) | Method for adjusting playing progress, related device and computer program product | |
KR102219728B1 (en) | Method and Apparatus for Searching Keyword Using Keypad | |
KR20210020980A (en) | Method and Apparatus for Searching Keyword Using Keypad | |
CN111857362A (en) | Character input method and character input device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20130903 |