JP2017041192A - 文字処理システム及び文字処理プログラム - Google Patents

文字処理システム及び文字処理プログラム Download PDF

Info

Publication number
JP2017041192A
JP2017041192A JP2015163976A JP2015163976A JP2017041192A JP 2017041192 A JP2017041192 A JP 2017041192A JP 2015163976 A JP2015163976 A JP 2015163976A JP 2015163976 A JP2015163976 A JP 2015163976A JP 2017041192 A JP2017041192 A JP 2017041192A
Authority
JP
Japan
Prior art keywords
character
sentence
characters
input
determination unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015163976A
Other languages
English (en)
Other versions
JP6464055B2 (ja
Inventor
伸 小栗
Shin Oguri
伸 小栗
嘉則 池畑
Yoshinori Ikehata
嘉則 池畑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Docomo Inc
Original Assignee
NTT Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Docomo Inc filed Critical NTT Docomo Inc
Priority to JP2015163976A priority Critical patent/JP6464055B2/ja
Publication of JP2017041192A publication Critical patent/JP2017041192A/ja
Application granted granted Critical
Publication of JP6464055B2 publication Critical patent/JP6464055B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Discrimination (AREA)

Abstract

【課題】 文字認識される文字からなる文章を適切に特定する。【解決手段】 文字処理システムである端末10は、入力領域における複数の文字の軌跡を当該文字の順番が特定可能なように入力する軌跡入力部11と、入力された情報から個々の文字を認識すると共に、入力領域における当該個々の文字の位置を特定する文字認識部12と、認識されると共に位置が特定された連続する文字間の位置関係に基づいて、当該文字によって構成される文章の区切りを判断する文章判断部13とを備える。【選択図】 図1

Description

本発明は、手書き文字等の文字を処理する文字処理システム及び文字処理プログラムに関する。
従来から、画像に含まれる文字を認識し、認識結果を翻訳する技術が提案されている(例えば、特許文献1参照)。
特開2010−231812号公報
上記のような翻訳を手書き文字に対してリアルタイムに行うことが考えられる。例えば、タッチパネルにおいて、ユーザの手書き文字の入力を受け付けて、当該手書き文字の翻訳結果を表示することが考えられる。通常、翻訳を行うためには、翻訳の単位となる文章を特定する必要がある。そのために例えば、翻訳対象となる文章を入力する毎にユーザがその旨を入力させることが考えられる。しかし、ユーザの操作性を考慮すると自動的に翻訳の単位となる文章が特定されることが望ましい。
翻訳対象となる文章の自動的な特定は、例えば、手書き文字の入力の時間間隔に基づいて行うことが考えられる。具体的には、手書き文字の入力が一定時間(2秒程度)なかった場合に文章を書き終わったと判断し、それまでに入力された文字列を翻訳対象となる文章として特定する。しかし、このような方法では、書いている途中に少し考えて筆を止めた場合、本来文章が書き終わっていないにもかかわらず書き終わったと判断されてしまうおそれがある。また、別文章とすべき文章でも、連続して手書き文字を入力すると、一つの文章とされてしまうおそれがある。その結果、手書き文字のリアルタイムの翻訳が適切になされないこととなってしまう。
本発明は、上記に鑑みてなされたものであり、文字認識される文字からなる文章を適切に特定することができる文字処理システム及び文字処理プログラムを提供することを目的とする。
上記目的を達成するために、本発明に係る文字処理システムは、入力領域における複数の文字の軌跡を当該文字の順番が特定可能なように入力する軌跡入力手段と、軌跡入力手段によって入力された情報から個々の文字を認識すると共に、入力領域における当該個々の文字の位置を特定する文字認識手段と、文字認識手段によって認識されると共に位置が特定された連続する文字間の位置関係に基づいて、当該文字によって構成される文章の区切りを判断する文章判断手段と、を備える。
本発明に係る文字処理システムでは、連続する文字間の位置関係に基づいて、当該文字によって構成される文章の区切りが判断される。従って、例えば、手書き文字が記載される位置に応じて、翻訳の単位となる文章を適切に判断することができる。即ち、本発明に係る文字処理システムによれば、文字認識される文字からなる文章を適切に特定することができる。
文章判断手段は、文章の最初の文字とそれ以外の各文字間の位置関係にも基づいて文章の区切りを判断することとしてもよい。この構成によれば、例えば、文章が右肩下がりに書かれるような特殊な場合であっても、文章を適切に特定することができる。
軌跡入力手段は、個々の文字の軌跡を入力した時間間隔を示す情報を取得し、文章判断手段は、軌跡入力手段によって取得された情報によって示される時間間隔にも基づいて文章の区切りを判断する、こととしてもよい。この構成によれば、文字認識される文字が入力されるタイミングにも応じて、文章を適切に特定することができる。
文章判断手段は、入力領域における当該個々の文字の位置に応じた時間間隔の判断基準に基づいて文章の区切りを判断することとしてもよい。この構成によれば、入力領域における文字の位置に応じて時間間隔の判断基準を適切なものとし、文章を適切に特定することができる。
文章判断手段は、位置関係に応じた時間間隔の判断基準に基づいて文章の区切りを判断することとしてもよい。この構成によれば、上記の位置関係に応じて時間間隔の判断基準を適切なものとし、文章を適切に特定することができる。
文章判断手段は、時間間隔に基づいて軌跡の入力速度を算出し、算出した入力速度にも基づいて文章の区切りを判断することとしてもよい。この構成によれば、入力速度に応じて時間間隔の判断基準を適切なものとし、文章を適切に特定することができる。
文字処理システムは、文章判断手段によって判断された区切りに基づく文章を翻訳する翻訳手段を更に備えることとしてもよい。この構成によれば、適切に特定した文章に基づいた翻訳まで行うことができる。
ところで、本発明は、上記のように文字処理システムの発明として記述できる他に、以下のように文字処理プログラムの発明としても記述することができる。これはカテゴリが異なるだけで、実質的に同一の発明であり、同様の作用及び効果を奏する。
即ち、本発明に係る文字処理プログラムは、コンピュータを、入力領域における複数の文字の軌跡を当該文字の順番が特定可能なように入力する軌跡入力手段と、軌跡入力手段によって入力された情報から個々の文字を認識すると共に、入力領域における当該個々の文字の位置を特定する文字認識手段と、文字認識手段によって認識されると共に位置が特定された連続する文字間の位置関係に基づいて、当該文字によって構成される文章の区切りを判断する文章判断手段と、として機能させる。
本発明によれば、例えば、手書き文字が記載される位置に応じて、翻訳の単位となる文章を適切に判断することができ、文字認識される文字からなる文章を適切に特定することができる。
本発明の実施形態に係る文字処理システムである端末の構成を示す図である。 文字認識された手書き文字の領域及び四隅の点の座標を示す図である。 手書き文字の書かれ方のパターンを示す図である。 手書き文字が右肩下がりに書かれた例を示す図である。 本発明の実施形態に係る文字処理システムである端末のハードウェア構成を示す図である。 本発明の実施形態に係る文字処理システムである端末で実行される処理全体を示すフローチャートである。 本発明の実施形態に係る文字処理システムである端末で実行される処理のうち文字認識及び文章判断の処理を示すフローチャートである。 時間間隔の判断基準を設定する場合の文字間の位置関係を示す図である。 時間間隔の判断基準を設定する場合の入力領域における文字の位置を示す図である。 本発明の実施形態に係る文字処理プログラムの構成を記録媒体と共に示す図である。
以下、図面と共に本発明に係る文字処理システム及び文字処理プログラムの実施形態について詳細に説明する。なお、図面の説明においては同一要素には同一符号を付し、重複する説明を省略する。
図1に本実施形態に係る文字処理システムである端末10を示す。端末10は、ユーザによって使用される装置であり、例えば、タブレット又はスマートフォン等に相当する。端末10は、ユーザに翻訳の機能を提供する。具体的には、端末10は、例えば、端末10が備えるタッチパネルでユーザから手書き文字の入力を受け付ける。端末10は、入力された手書き文字を認識して、当該手書き文字によって構成される文章を別の言語に翻訳する。端末10は、翻訳後の文章を、例えば、タッチパネルに表示して出力する。これにより、例えば、筆談によって使用言語が異なる複数の人の間で容易に意思の疎通を図ることができる。
図1に示すように、端末10は、軌跡入力部11と、文字認識部12と、文章判断部13と、翻訳部14とを備えて構成される。なお、端末10は、本実施形態に係る機能以外にも、タブレット又はスマートフォン等が通常備える機能を備えていてもよい。
軌跡入力部11は、入力領域における複数の文字の軌跡を当該文字の順番が特定可能なように入力する軌跡入力手段である。入力領域(筆記可能領域)は、手書き文字を入力することができる領域である。また、軌跡入力部11は、個々の文字の軌跡を入力した時間間隔を示す情報を取得する。
軌跡入力部11は、例えば、タッチパネルを備えて構成されている。軌跡入力部11がタッチパネルを備える構成では、タッチパネルの接触を検出する領域が入力領域となる。なお、入力領域は、タッチパネルの全体であってもよいし、タッチパネルの一部であってもよい。軌跡入力部11は、ユーザのタッチパネルに対する手書き文字の入力操作(手書き文字を書く操作)を受け付けることで、入力領域における複数の文字の軌跡を入力する。また、軌跡入力部11は、リアルタイムに軌跡(時系列の軌跡)を入力することで、文字の順番が特定可能なように軌跡を入力する。具体的には、軌跡入力部11は、軌跡を入力した時刻を示す情報を、当該軌跡自体を示す情報に対応付ける。軌跡入力部11は、入力した軌跡を示す情報を文字認識部12に出力する。
なお、軌跡入力部11による文字の軌跡の入力は、必ずしもタッチパネルによって行われる必要はなく、手書き文字の入力操作を行えるデバイスであれば、任意のデバイスが用いられてもよい。例えば、軌跡入力部11は、マウスによる手書き文字の入力操作を受け付ける構成であってもよい。
文字認識部12は、軌跡入力部11から入力された情報から個々の文字を認識すると共に、入力領域における当該個々の文字の位置を特定する文字認識手段である。文字認識部12は、軌跡入力部11から入力された情報によって示される軌跡に対して、文字認識を行って個々の文字を特定する。また、文字認識部12は、文字認識によって特定された個々の文字の入力領域における位置を特定する。個々の文字の位置は、例えば、文字認識によって個々の文字の領域のタッチパネル上の座標によって特定される。個々の文字領域は、例えば、矩形の領域とされる。文字認識部12は、図2に示すように当該領域の四隅の点の座標を特定する。なお、図2の中の「E」は、手書き文字を示している。上記の文字認識及び上記の領域の特定については、従来の技術によって行うことができる。
文字認識部12は、上記の文字認識等の処理を一定時間毎(例えば、数秒毎)に行う。文字認識部12は、軌跡入力部11から入力された情報によって示される軌跡を入力した時刻から、文字認識によって特定された個々の文字が入力された時刻を特定する。文字が入力された時刻として、例えば、文字認識部12は、文字を構成する軌跡の最初を入力した時刻を当該文字が書き始められた時刻とし、文字を構成する軌跡の最後を入力した時刻を当該文字が書き終わった時刻とする。文字認識部12は、当該処理によって得られた情報を文章判断部13に出力する。
文章判断部13は、文字認識部12によって認識される文字から文章の区切りを判断(判定)する文章判断手段である。文章の区切りを判断するとは、複数の手書き文字のどこからどこまでが1つの文章を構成しているかを判断するものである。文章判断部13による判断は、翻訳対象となる(翻訳の単位となる)文章を特定するためのものである。即ち、1つの文章についての手書き終了タイミングを判定するものである。具体的には、文字が一つ前の文字(一つ前に書かれた文字)と同一の文章に属するか否かを判断することで文章の区切りの判断を行う。
図3に本実施形態における手書き文字の書かれ方の例を示す。図3(a)では、アルファベットの順で文字が書かれた順を示している。即ち、A、B、C…の順で文字が書かれることを示している。図3(b)では、手書き文字で書かれる文章の具体例を示している。例えば、図3における(1)のパターンは、「この炊飯器を3つください」という1つの文章で翻訳するべき文字列である。(2)のパターンは、「いくらですか」及び「15,000円です」という2つの文章で翻訳するべき文字列である。なお、図3の各表において、列の左側は、6番目の文字「F」が5番目の文字「E」より左に書かれている例であり、列の右側は、「F」が「E」より右に書かれている例である。
文章判断部13は、文字認識部12によって認識されると共に位置が特定された連続する文字間の位置関係に基づいて文章の区切りを判断する。また、文章判断部13は、文章の最初の文字とそれ以外の各文字間の位置関係にも基づいて文章の区切りを判断する。この位置関係は、例えば、後述するように文字の上下関係及び左右関係である。また、文章判断部13は、文字認識部12から入力される情報によって示される文字間の時間間隔にも基づいて文章の区切りを判断する。具体的には、文章判断部13は、以下のように判断を行う。
文章判断部13は、文字認識部12から入力される情報によって示される文字毎に当該文字が入力された時刻が早い順に判断を行う。文章判断部13は、最初の文字については、文章の最初の文字であると判断する。文章判断部13は、それ以降の文字であるn番目の文字について、以下のように1つ前の文字であるn−1番目の文字との位置の比較を行う。なお、図2に示すようにn番目の文字の左下の点、左上の点、右下の点、右上の点についてのX座標及びY座標をそれぞれ(X0n,Y0n)、(X0n,Y1n)、(X1n,Y0n)、(X1n,Y1n)とする。また、n−1番目の文字の左下の点、左上の点、右下の点、右上の点についてのX座標及びY座標をそれぞれ(X0n−1,Y0n−1)、(X0n−1,Y1n−1)、(X1n−1,Y0n−1)、(X1n−1,Y1n−1)とする。
文章判断部13は、n番目の文字がn−1番目の文字よりも左に位置しているか否かを判断する(判断1)。具体的には、文章判断部13は、X0n<X1n−1であるか否かを判断する。X0n<X1n−1であると判断したら、文章判断部13は、n番目の文字がn−1番目の文字よりも左に位置していると判断する。X0n<X1n−1ではないと判断したら、文章判断部13は、n番目の文字がn−1番目の文字よりも左に位置していないと判断する。
文章判断部13は、n番目の文字がn−1番目の文字よりも下に位置しているか否かを判断する(判断2)。具体的には、文章判断部13は、Y1n<Y0n−1であるか否かを判断する。Y1n<Y0n−1であると判断したら、文章判断部13は、n番目の文字がn−1番目の文字よりも下に位置していると判断する。Y1n<Y0n−1ではないと判断したら、文章判断部13は、n番目の文字がn−1番目の文字よりも下に位置していないと判断する。
文章判断部13は、n番目の文字がn−1番目の文字よりも上に位置しているか否かを判断する(判断3)。具体的には、文章判断部13は、Y0n>Y1n−1であるか否かを判断する。Y0n>Y1n−1であると判断したら、文章判断部13は、n番目の文字がn−1番目の文字よりも上に位置していると判断する。Y0n>Y1n−1ではないと判断したら、文章判断部13は、n番目の文字がn−1番目の文字よりも上に位置していないと判断する。
文章判断部13は、X方向(横方向)においてn番目の文字とn−1番目の文字との間に2文字以上間隔があいているか否かを判断する(判断4)。具体的には、文章判断部13は、2*(X1n−1 − X0n−1)<X0n − X1n−1であるか否かを判断する。上記の判断にように間隔の判断基準に用いられるのは、n−1番目の文字のX方向の長さ(底辺の長さ)である。2*(X1n−1 − X0n−1)<X0n − X1n−1であると判断したら、文章判断部13は、2文字以上間隔があいていると判断する。2*(X1n−1 − X0n−1)<X0n − X1n−1ではないと判断したら、文章判断部13は、2文字以上間隔があいていないと判断する。
文章判断部13は、上記の判断の結果、以下の(i)〜(iv)の場合、n−1番目の文字までで1つの文章であり、n番目の文字は別の文章の最初の文字(別文章の開始)である、即ち、n−1番目の文字とn番目の文字との間に文章の区切りがあると判断する。
(i)上記の判断1において、n番目の文字がn−1番目の文字よりも左に位置していると判断し、判断2において、n番目の文字がn−1番目の文字よりも下に位置していないと判断した場合(図3の表の(2)のパターンの「F」)
(ii)上記の判断1において、n番目の文字がn−1番目の文字よりも左に位置していないと判断し、判断2において、n番目の文字がn−1番目の文字よりも下に位置していると判断した場合(図3の表の(3)パターンの「F」)
(iii)上記の判断1において、n番目の文字がn−1番目の文字よりも左に位置していないと判断し、判断2において、n番目の文字がn−1番目の文字よりも下に位置していないと判断し、判断3において、n番目の文字がn−1番目の文字よりも上に位置していると判断した場合(図3の表の(4)のパターンの「F」)
(iv)上記の判断1において、n番目の文字がn−1番目の文字よりも左に位置していないと判断し、判断2において、n番目の文字がn−1番目の文字よりも下に位置していないと判断し、判断3において、n番目の文字がn−1番目の文字よりも上に位置していないと判断し、判断4において、n番目の文字とn−1番目の文字との間に2文字以上間隔があいていると判断した場合(図3の表の(5)パターンの「F」の「E」との間隔が2文字以上の場合)
文章判断部13は、上記の判断の結果、以下の(v)〜(vi)の場合、更に文字が入力される時間間隔に基づいて、以下に示す判断を行う。
(v)上記の判断1において、n番目の文字がn−1番目の文字よりも左に位置していると判断し、判断2において、n番目の文字がn−1番目の文字よりも下に位置していると判断した場合(図3の表の(1)のパターンの「F」)
(vi)上記の判断1において、n番目の文字がn−1番目の文字よりも左に位置していないと判断し、判断2において、n番目の文字がn−1番目の文字よりも下に位置していないと判断し、判断3において、n番目の文字がn−1番目の文字よりも上に位置していないと判断し、判断3において、n番目の文字とn−1番目の文字との間に2文字以上間隔があいていないと判断した場合(図3の表の(5)のパターンの「F」の「E」との間隔が2文字未満の場合)
この場合、文章判断部13は、文字認識部12から入力される情報によって示されるn−1番目の文字が書き終わった時刻と、n番目の文字が書き始められた時刻との間隔、即ち、それらの文字が入力される時間間隔(n−1番目の文字を書き終えてからn番目の文字を書き始めるまでの時間)を算出する。文章判断部13は、当該時間間隔と予め設定される閾値である判定時間とを比較して、時間間隔が判定時間以上か否かを判断する。判定時間は、文字の位置関係を考慮せずに文章の区切りを判断する場合(例えば、上述したように2秒程度)よりも長い時間(例えば、3秒)としてもよい。
文章判断部13は、時間間隔が判定時間以上であると判断したら、n−1番目の文字までで1つの文章であり、n番目の文字は別の文章の最初の文字(別文章の開始)である、即ち、n−1番目の文字とn番目の文字との間に文章の区切りがあると判断する。文章判断部13は、時間間隔が判定時間以上でないと判断したら、n−1番目の文字とn番目の文字とは同じ文章を構成する(文章が続いている)、即ち、n−1番目の文字とn番目の文字との間に文章の区切りがないと判断する。
なお、図4に示すように、文章が2行に分けられて、かつ右肩下がりに書かれる場合がある。図4に示すように手書き文字が書かれた場合に、「E」と「F」との位置関係は、上記(i)のように判断される。そのため、「E」と「F」とは、別の文章を構成する文字であると判断されてしまう。
それを避けるため、文章判断部13は、上述した判断に加えて、文章の最初の文字と判断対象の文字との間の位置関係にも基づいて文章の区切りを判断することとしてもよい。具体的には、上記(i)の判断を行った場合、文章判断部13は、更に、n番目の文字が、n−1番目の文字が属する文章の最初の文字(図4の例では、「A」)よりも下に位置しているか否かを判断する。具体的には、文章判断部13は、Y1n<Y01(文章の最初の文字の下端のY座標)であるか否かを判断する。
Y1n<Y01であると判断したら、文章判断部13は、n番目の文字が最初の文字よりも下に位置していると判断する。この場合、文章判断部13は、(v)及び(vi)の場合と同様に、文字が入力される時間間隔に基づく判断を行って、当該判断に応じてn番目の文字が、n−1番目の文字とは別の文章を構成するか否かを判断する。Y1n<Y01ではないと判断したら、文章判断部13は、n番目の文字が最初の文字よりも下に位置していないと判断する。この場合、文章判断部13は、(i)〜(iv)の場合と同様に、n−1番目の文字までで1つの文章であり、n番目の文字は別の文章の最初の文字(別文章の開始)であると判断する。
文章判断部13は、文章の区切りを判断すると、1つの文章と判断された文字列を翻訳対象の文章として翻訳部14に出力する。なお、文章判断部13は、文字認識部12から最後に情報を入力してから、上記の判定時間の時間を経過しても新たな情報が入力されなければ、そこまでの文字列を1つの文章と判断して翻訳部14に出力してもよい。
翻訳部14は、文章判断部13によって判断された区切りに基づく文章、即ち、文章判断部13によって1つの文章と判断された文字列を翻訳する翻訳手段である。翻訳部14は、例えば、入力した言語を予め設定された翻訳前の言語から翻訳後の言語への翻訳を行う。翻訳部14による翻訳は、従来の機械翻訳の技術によって行うことができる。
翻訳部14は、翻訳後の文章を出力する。翻訳後の文章の出力は、例えば、端末10が備えるタッチパネルにおいて、手書き文字が書かれた部分以外の部分、例えば、手書き文字が書かれた部分の下の部分に当該文章を表示することで行われる。あるいは、翻訳部14は、翻訳後の文章を音声出力することとしてもよい。以上が、本実施形態に係る端末10の機能構成である。
図5に本実施形態に係る端末10のハードウェア構成を示す。図5に示すように端末10は、CPU(Central Processing Unit)101、主記憶装置であるRAM102及びROM(Read Only Memory)103、並びにタッチパネル104等のハードウェアを備える装置として構成される。これらの構成要素がプログラム等により動作することにより、上述した端末10の機能が発揮される。なお、端末10は、上記以外にも、通常、スマートフォン等が備えるハードウェアを備えていてもよい。以上が、本実施形態に係る端末10の構成である。
引き続いて、図6及び図7のフローチャートを用いて、端末10で実行される処理を説明する。ユーザによって端末10に対して手書き文字の入力操作(例えば、タッチパネルに手書き文字を書く操作)が行われると、端末10では、軌跡入力部11によって、当該入力操作が受け付けられて、文字の軌跡が入力される(S01)。軌跡の情報は、軌跡入力部11から文字認識部12に出力される。続いて、文字認識部12による文字認識と、文章判断部13による文章判断とが行われる(S02)。本処理について、図7のフローチャートを用いて説明する。本処理は、軌跡の情報が軌跡入力部11から文字認識部12に出力される度に(ユーザによって端末10に対して手書き文字の入力操作が行われる度に)行われる。
本処理では、文字認識部12によって、軌跡入力部11から入力された情報からn文字目の文字の文字認識が行われる(S201)。続いて、文字認識部12によって、n文字目の文字の領域の四隅の点の座標((X0n,Y0n)、(X0n,Y1n)、(X1n,Y0n)、(X1n,Y1n))が算出される(S202)。上記の処理によって得られた情報は、文字認識部12から文章判断部13に出力される。
続いて、文章判断部13によって、n文字目の文字について以下のように文章の区切りが判断される。まず、n文字目の文字の1つ前の文字であるn−1番目の文字の領域の四隅の点の座標((X0n−1,Y0n−1)、(X0n−1,Y1n−1)、(X1n−1,Y0n−1)、(X1n−1,Y1n−1))が呼び出される(S203)。なお、最初の文字(nが1の場合)については、文章の最初の文字であると判断し(図示せず)、次の文字から本処理を行う。
続いて、n番目の文字がn−1番目の文字よりも左に位置しているか否かが判断される。具体的には、X0n<X1n−1であるか否かが判断される(S204)。n番目の文字がn−1番目の文字よりも左に位置している(X0n<X1n−1である)と判断された場合(S204のYES)、続いて、n番目の文字がn−1番目の文字よりも下に位置しているか否かが判断される。具体的には、Y1n<Y0n−1であるか否かが判断される(S205)。
n番目の文字がn−1番目の文字よりも下に位置している(Y1n<Y0n−1である)と判断された場合(S205のYES、図3の表の(1)のパターンの「F」)、続いて、n−1番目の文字の入力と、n−1番目の文字の入力との間の時間間隔が予め設定される判定時間である3秒以上か否かが判断される(S206)。時間間隔が判定時間以上であると判断されたら(S206のYES)、n−1番目の文字までで1つの文章であり、n番目の文字は別の文章の最初の文字(別文章の開始)であると判断される(S207)。1つの文章が判断されると、当該文章が文章判断部13から翻訳部14に出力される(以下についても同様)。
S206において、時間間隔が判定時間以上でないと判断されたら(S206のNO)、n−1番目の文字とn番目の文字とは同じ文章を構成する(文章が続いている)と判断される(S208)。S207及びS208の後、更に文字が続いていれば、S201からの処理が繰り返される(以下についても同様)。
S205において、n番目の文字がn−1番目の文字よりも下に位置していない(Y1n<Y0n−1ではない)と判断された場合(S205のNO、図3の表の(2)のパターンの「F」)、n−1番目の文字までで1つの文章であり、n番目の文字は別の文章の最初の文字(別文章の開始)であると判断される(S207)。
S204において、n番目の文字がn−1番目の文字よりも左に位置していない(X0n<X1n−1ではない)と判断された場合(S204のNO)、続いて、n番目の文字がn−1番目の文字よりも下に位置しているか否かが判断される。具体的には、Y1n<Y0n−1であるか否かが判断される(S209)。n番目の文字がn−1番目の文字よりも下に位置している(Y1n<Y0n−1である)と判断された場合(S209のYES、図3の表の(3)のパターンの「F」)、n−1番目の文字までで1つの文章であり、n番目の文字は別の文章の最初の文字(別文章の開始)であると判断される(S207)。
S209において、n番目の文字がn−1番目の文字よりも下に位置していない(Y1n<Y0n−1ではない)と判断された場合(S209のNO)、続いて、n番目の文字がn−1番目の文字よりも上に位置しているか否かが判断される。具体的には、Y0n>Y1n−1であるか否かが判断される(S210)。n番目の文字がn−1番目の文字よりも上に位置している(Y0n>Y1n−1である)と判断された場合(S210のYES、図3の表の(4)のパターンの「F」)、n−1番目の文字までで1つの文章であり、n番目の文字は別の文章の最初の文字(別文章の開始)であると判断される(S207)。
S210において、n番目の文字がn−1番目の文字よりも上に位置していない(Y0n>Y1n−1ではない)と判断された場合(S210のNO)、続いて、X方向(横)においてn番目の文字とn−1番目の文字との間に2文字以上間隔があいているか否かが判断される。具体的には、2*(X1n−1 − X0n−1)<X0n − X1n−1であるか否かが判断される(S211)。n番目の文字とn−1番目の文字との間に2文字以上間隔があいている(2*(X1n−1 − X0n−1)<X0n − X1n−1である)と判断された場合(S211のYES、図3の表の(5)パターンの「F」の「E」との間隔が2文字以上の場合)、n−1番目の文字までで1つの文章であり、n番目の文字は別の文章の最初の文字(別文章の開始)であると判断される(S207)。
S211において、n番目の文字とn−1番目の文字との間に2文字以上間隔があいていない(2*(X1n−1 − X0n−1)<X0n − X1n−1ではない)と判断された場合(S211のNO、図3の表の(5)のパターンの「F」の「E」との間隔が2文字未満の場合)、続いて、n−1番目の文字の入力と、n−1番目の文字の入力との間の時間間隔が予め設定される判定時間である3秒以上か否かが判断される(S206)。S206の判断後については、上記と同様である。
なお、上述したように文字認識部12から文章判断部13に最後に情報が入力されてから、判定時間である3秒を経過しても新たな情報が文章判断部13に入力されなければ、そこまでの文字列が1つの文章と判断されて翻訳部14に出力されてもよい。
図6に戻り、文章判断部13から翻訳部14に文章が出力されると、翻訳部14によって当該文章が翻訳される(S03)。続いて、翻訳部14によって、翻訳された文章の出力が行われる(S04)。以上が、端末10で実行される処理である。
上述したように本実施形態では、連続する文字の位置関係に基づいて、当該文字によって構成される文章の区切りが判断される。従って、例えば、手書き文字が記載される位置に応じて、翻訳の単位となる文章を適切に判断することができる。即ち、本実施形態によれば、文字認識される文字からなる文章を適切に特定することができる。
また、上述した実施形態のように文章の最初の文字との位置関係を考慮することとしてもよい。この構成によれば、例えば、文章が右肩下がりに書かれるような特殊な場合であっても、文章を適切に特定することができる。但し、手書き文字の特殊な書かれ方を想定しない場合等には、必ずしも最初の文字との位置関係を考慮する必要はない。
また、本実施形態のように文字が入力される時間間隔を考慮して文章の区切りを判断することとしてもよい。この構成によれば、文字認識される文字が入力されるタイミングにも応じて、文章を適切に特定することができる。但し、文字が入力される時刻の情報を取得できない場合等には、必ずしも時間間隔を考慮する必要はない。
また、本実施形態のように区切りが判断された文章を翻訳する構成を備えていてもよい。この構成によれば、適切に特定した文章に基づいた翻訳まで行うことができる。但し、必ずしも本発明に係る文字処理システムは翻訳する構成を備えている必要はない。また、本発明に係る文字処理システムは、必ずしも翻訳を前提とする必要はなく、適切な文章の区切りが必要となる任意のものに適用することができる。
引き続いて、本実施形態の変形例について説明する。文章判断部13による1つの文章の区切りの判断(1つの文章の手書き終了タイミングの検出)は、上記の方法に限られず、例えば、以下のように行われてもよい。
文章判断部13は、入力領域における個々の文字の位置に応じた時間間隔の判断基準に基づいて文章の区切りを判断することとしてもよい。更に、文章判断部13は、連続する文字間の位置関係に応じた時間間隔の判断基準に基づいて文章の区切りを判断することとしてもよい。例えば、X方向(横方向)における文字間の間隔(長さ)に基づいて、別文章と判断する(図7のS206での判断に用いられる)判定時間を設定する(可変とする)こととしてもよい。例えば、図8の「E」及び「F」を例に示すように、n−1番目の文字とn番目の文字との間のX方向における間隔L、及びn−1番目の文字の領域のX方向の長さ(底辺)xから、以下の式により判定時間Tを決定する。なお、L=0の場合のTの値は、以下の式から算出できないため、予めTの値を設定しておく。
p=L/x
T=(6*p)/2+1/p
例えば、上記のように判定時間を設定することで、文字間の間隔が大きい(長い)ほど、判定時間Tを短くすることができる。これにより、書き途中に漢字を思い出している場合や、一瞬の思考中断が行われた場合を考慮して、前の文字からの文字間隔が短い場合には、多少時間がかかっていても継続した文章と判断することができる。これにより、上記の位置関係に応じて時間間隔の判断基準を適切なものとし、文章を適切に特定することができる。なお、上記では、X方向の長さとしたが、言語か文章の書かれ方によってはY方向(縦方向)の長さとしてもよい。
また、文章判断部13は、時間間隔に基づいて軌跡の入力速度を算出し、算出した入力速度にも基づいて文章の区切りを判断することとしてもよい。
例えば、文章判断部13は、n−1番目の文字が書き終わってからn番目の文字を書き始めるまでの時間間隔Tn(sec)を記憶しておき、軌跡の入力速度として以下のようにその平均時間Ta(sec)を算出する。なお、平均時間Taは、文章毎に算出されてもよいし、複数の文章で通算して算出されてもよい。
Ta=(T2+…Tn−1+Tn)/(n−1)
文章判断部13は、以下のように算出した平均時間Taを1.5倍した値を判定時間T(sec)とする。
T=Ta*1.5
この構成によれば、入力速度に応じて時間間隔の判断基準を適切なものとし、文章を適切に特定することができる。
更に、上記の平均時間Taを前提として、以下のように判定時間T(sec)を設定してもよい。入力領域における、判断対象のn番目の文字の一つ前のn−1番目の文字の位置に基づいて、判定時間T(sec)を設定する。図9の「E」を例に示すように、n−1番目の文字のX方向の長さLxと、n−1番目の文字から入力領域の右端までの長さ(残りスペース)Lsから、以下の式(条件)により判定時間Tを決定する。
Lx>Lsの場合、T=Ta*1.5
Lx≦Lsの場合、T=Ta
この構成によれば、判定時間Tを入力速度に加えて、手書き文字の位置に応じた値とすることができる。このように判定時間を設定することで、右端に手書き文字が書かれた場合、次の文字について下の行に書かれることを考慮して時間間隔の判断基準を緩くすることができる。これにより、入力領域における文字の位置に応じて時間間隔の判断基準を適切なものとし、文章を適切に特定することができる。
なお、本実施形態では、端末10が文字認識及び翻訳を行う構成を有していることとしたが、必ずしも1つの装置において文字認識及び翻訳が行われる必要はなく、手書き文字を入力する装置と文字認識又は翻訳を行う装置とが別構成となっていてもよい。この場合、当該複数の装置によって本発明に係る文字処理システムが構成される。
引き続いて、上述した一連の端末10による処理をコンピュータに実行させるための文字処理プログラムを説明する。図10に示すように、文字処理プログラム30は、コンピュータに挿入されてアクセスされる、あるいはコンピュータが備える記録媒体20に形成されたプログラム格納領域21内に格納される。
文字処理プログラム30は、軌跡入力モジュール31と、文字認識モジュール32と、文章判断モジュール33と、翻訳モジュール34とを備えて構成される。軌跡入力モジュール31と、文字認識モジュール32と、文章判断モジュール33と、翻訳モジュール34とを実行させることにより実現される機能は、上述した端末10の軌跡入力部11と、文字認識部12と、文章判断部13と、翻訳部14との各機能とそれぞれ同様である。
なお、文字処理プログラム30は、その一部又は全部が、通信回線等の伝送媒体を介して伝送され、他の機器により受信されて記録(インストールを含む)される構成としてもよい。また、文字処理プログラム30の各モジュールは、1つのコンピュータでなく、複数のコンピュータのいずれかにインストールされてもよい。その場合、当該複数のコンピュータによるコンピュータシステムよって上述した一連の文字処理プログラム30の処理が行われる。
10…端末、11…軌跡入力部、12…文字認識部、13…文章判断部、14…翻訳部、101…CPU、102…RAM、103…ROM、104…タッチパネル、20…記録媒体、21…プログラム格納領域、30…文字処理プログラム、31…軌跡入力モジュール、32…文字認識モジュール、33…文章判断モジュール、34…翻訳モジュール。

Claims (8)

  1. 入力領域における複数の文字の軌跡を当該文字の順番が特定可能なように入力する軌跡入力手段と、
    前記軌跡入力手段によって入力された情報から個々の文字を認識すると共に、前記入力領域における当該個々の文字の位置を特定する文字認識手段と、
    前記文字認識手段によって認識されると共に位置が特定された連続する文字間の位置関係に基づいて、当該文字によって構成される文章の区切りを判断する文章判断手段と、
    を備える文字処理システム。
  2. 前記文章判断手段は、文章の最初の文字とそれ以外の各文字間の位置関係にも基づいて文章の区切りを判断する請求項1に記載の文字処理システム。
  3. 前記軌跡入力手段は、個々の文字の軌跡を入力した時間間隔を示す情報を取得し、
    前記文章判断手段は、前記軌跡入力手段によって取得された情報によって示される時間間隔にも基づいて文章の区切りを判断する、請求項1又は2に記載の文字処理システム。
  4. 前記文章判断手段は、前記入力領域における当該個々の文字の位置に応じた前記時間間隔の判断基準に基づいて文章の区切りを判断する請求項3に記載の文字処理システム。
  5. 前記文章判断手段は、前記位置関係に応じた前記時間間隔の判断基準に基づいて文章の区切りを判断する請求項4に記載の文字処理システム。
  6. 前記文章判断手段は、前記時間間隔に基づいて前記軌跡の入力速度を算出し、算出した入力速度にも基づいて文章の区切りを判断する請求項3〜5の何れか一項に記載の文字処理システム。
  7. 前記文章判断手段によって判断された区切りに基づく文章を翻訳する翻訳手段を更に備える請求項1〜6の何れか一項に記載の文字処理システム。
  8. コンピュータを、
    入力領域における複数の文字の軌跡を当該文字の順番が特定可能なように入力する軌跡入力手段と、
    前記軌跡入力手段によって入力された情報から個々の文字を認識すると共に、前記入力領域における当該個々の文字の位置を特定する文字認識手段と、
    前記文字認識手段によって認識されると共に位置が特定された連続する文字間の位置関係に基づいて、当該文字によって構成される文章の区切りを判断する文章判断手段と、
    として機能させる文字処理プログラム。
JP2015163976A 2015-08-21 2015-08-21 文字処理システム及び文字処理プログラム Expired - Fee Related JP6464055B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015163976A JP6464055B2 (ja) 2015-08-21 2015-08-21 文字処理システム及び文字処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015163976A JP6464055B2 (ja) 2015-08-21 2015-08-21 文字処理システム及び文字処理プログラム

Publications (2)

Publication Number Publication Date
JP2017041192A true JP2017041192A (ja) 2017-02-23
JP6464055B2 JP6464055B2 (ja) 2019-02-06

Family

ID=58206519

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015163976A Expired - Fee Related JP6464055B2 (ja) 2015-08-21 2015-08-21 文字処理システム及び文字処理プログラム

Country Status (1)

Country Link
JP (1) JP6464055B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018045377A (ja) * 2016-09-13 2018-03-22 株式会社Nttドコモ 文字処理システム及び文字処理プログラム
JP2020016683A (ja) * 2018-07-23 2020-01-30 大日本印刷株式会社 記入内容分析装置及びプログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01291395A (ja) * 1988-05-19 1989-11-22 Hitachi Ltd 欧文速記文字認識装置
JP2002259908A (ja) * 2000-12-28 2002-09-13 Brother Ind Ltd 筆記データ処理システム、筆記データ処理サーバ及び筆記データ処理装置
JP2003099713A (ja) * 2001-09-25 2003-04-04 Ricoh Co Ltd 手書き情報処理装置、手書き情報処理方法、手書き情報処理プログラム、そのプログラムが記録された記録媒体、及び電子黒板
JP2015045903A (ja) * 2013-08-27 2015-03-12 株式会社Nttドコモ 通信端末、プログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01291395A (ja) * 1988-05-19 1989-11-22 Hitachi Ltd 欧文速記文字認識装置
JP2002259908A (ja) * 2000-12-28 2002-09-13 Brother Ind Ltd 筆記データ処理システム、筆記データ処理サーバ及び筆記データ処理装置
JP2003099713A (ja) * 2001-09-25 2003-04-04 Ricoh Co Ltd 手書き情報処理装置、手書き情報処理方法、手書き情報処理プログラム、そのプログラムが記録された記録媒体、及び電子黒板
JP2015045903A (ja) * 2013-08-27 2015-03-12 株式会社Nttドコモ 通信端末、プログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018045377A (ja) * 2016-09-13 2018-03-22 株式会社Nttドコモ 文字処理システム及び文字処理プログラム
JP2020016683A (ja) * 2018-07-23 2020-01-30 大日本印刷株式会社 記入内容分析装置及びプログラム
JP7187863B2 (ja) 2018-07-23 2022-12-13 大日本印刷株式会社 記入内容分析装置及びプログラム

Also Published As

Publication number Publication date
JP6464055B2 (ja) 2019-02-06

Similar Documents

Publication Publication Date Title
US20210406578A1 (en) Handwriting-based predictive population of partial virtual keyboards
KR102221079B1 (ko) 실시간 필기 인식 관리
US10614300B2 (en) Formatting handwritten content
US9317144B2 (en) Electronic device, handwriting input recognition system, and method for recognizing handwritten input thereof
US20160179364A1 (en) Disambiguating ink strokes and gesture inputs
EP3062237A1 (en) Information processing device, information processing method, and program
US20110234516A1 (en) Handwriting input device, and handwriting input method
US10606475B2 (en) Character recognition method, apparatus and device
US9170734B2 (en) Multiple-input handwriting recognition system and measure thereof
US10671795B2 (en) Handwriting preview window
JP6464055B2 (ja) 文字処理システム及び文字処理プログラム
CN107209640B (zh) 基于输入模式的文本删除
CN107422921B (zh) 一种输入方法、装置、电子设备以及存储介质
JP2014056389A (ja) 文字認識装置、文字認識方法及びプログラム
CN110858291A (zh) 字符切分方法及装置
JP2012173959A (ja) 文字認識装置及びプログラム
KR101659243B1 (ko) 아랍문자 입력장치 및 아랍문자 입력방법
JPH0944600A (ja) オンライン文字認識に於ける入力文字予測方法、及びその装置
US10564819B2 (en) Method, apparatus and system for display of text correction or modification
JP6051692B2 (ja) 文字変換装置、文字変換方法、及びプログラム
WO2013145505A1 (ja) 情報提示装置、情報提示方法、及び情報提示用プログラム
JP2018018366A (ja) 情報処理装置、文字入力プログラムおよび文字入力方法
JP2018045377A (ja) 文字処理システム及び文字処理プログラム
CN103914154A (zh) 文字输入装置及文字输入装置的文字输入方法
JP2016081107A (ja) 文章表示装置、プログラム及び制御方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180215

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20181113

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181129

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20181211

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190107

R150 Certificate of patent or registration of utility model

Ref document number: 6464055

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees