JP6542870B2 - 重畳された手書き文字認識技術システム及び重畳された手書き文字認識技術方法。 - Google Patents

重畳された手書き文字認識技術システム及び重畳された手書き文字認識技術方法。 Download PDF

Info

Publication number
JP6542870B2
JP6542870B2 JP2017503194A JP2017503194A JP6542870B2 JP 6542870 B2 JP6542870 B2 JP 6542870B2 JP 2017503194 A JP2017503194 A JP 2017503194A JP 2017503194 A JP2017503194 A JP 2017503194A JP 6542870 B2 JP6542870 B2 JP 6542870B2
Authority
JP
Japan
Prior art keywords
input
recognition
strokes
superimposed
stroke
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017503194A
Other languages
English (en)
Other versions
JP2017514248A (ja
Inventor
ウィマー ジョルト
ウィマー ジョルト
ペロー フレディ
ペロー フレディ
ラリカン ピエール−ミシェル
ラリカン ピエール−ミシェル
Original Assignee
マイスクリプト
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by マイスクリプト filed Critical マイスクリプト
Publication of JP2017514248A publication Critical patent/JP2017514248A/ja
Application granted granted Critical
Publication of JP6542870B2 publication Critical patent/JP6542870B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/22Character recognition characterised by the type of writing
    • G06V30/226Character recognition characterised by the type of writing of cursive writing
    • G06V30/2268Character recognition characterised by the type of writing of cursive writing using stroke segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0487Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
    • G06F3/0488Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures
    • G06F3/04883Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures for inputting data by handwriting, e.g. gesture or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/70Denoising; Smoothing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/80Geometric correction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/13Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/42Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/192Recognition using electronic means using simultaneous comparisons or correlations of the image signals with a plurality of references
    • G06V30/194References adjustable by an adaptive method, e.g. learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/26Techniques for post-processing, e.g. correcting the recognition result
    • G06V30/262Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
    • G06V30/274Syntactic or semantic context, e.g. balancing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/32Digital ink
    • G06V30/333Preprocessing; Feature extraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/32Digital ink
    • G06V30/36Matching; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Character Discrimination (AREA)
  • Geometry (AREA)

Description

本出願は、2014年4月4日出願の米国特許出願14/245,601号に対する優先権を主張するものであり、参照によりその全体が本明細書に組み込まれ、本明細書の一部を構成する。
本発明は、一般に、ユーザがインプットした様々な文字についての手書き文字を認識することが可能なコンピュータデバイスインターフェースの分野に関する。
コンピュータデバイスは、ユビキタスになり続けている。それらは、デスクトップコンピュータや、ラップトップコンピュータや、タブレットPCや、電子書籍リーダーや、携帯電話や、スマートフォンや、ウェアラブルコンピュータや、全地球測位システム(GPS)装置や、エンタプライズデジタルアシスタンツ(EDAs)や、携帯情報端末(PDA)や、ゲームのコンソールなどの形態を取る。さらに、コンピュータデバイスは、自動車や、トラックや、農機具や、製造装置や、建物の環境制御(例、照明、HVAC)や、家庭用や商業用の電化製品に組み込まれる。
コンピュータデバイスは、一般に、中央処理装置(CPU)、何らかの種類のメモリ、入力及び出力装置のような少なくとも1つの処理要素から構成される。さまざまなコンピュータデバイスとそれに伴う使用により、様々な入力装置が必要となる。そのような入力装置の1つには、ユーザの指、あるいはペン、またはスタイラスペンのような道具とタッチセンサー式の表面とでの接触を通じてユーザの入力が受け入れられるタッチスクリーンやタッチパッドのようなタッチセンサー式の表面がある。別の入力装置には、その上方でユーザによって行われたジェスチャーを感知する入力表面がある。これらの入力方法のどちらかを、描画または文章を入力するために、一般に用いることができる。ユーザによる入力が文章である場合、コンピュータデバイスはオンライン手書き文字認識システムあるいは方法を用いてユーザの手書き文字を解釈しなければならない。
一般に、ユーザがタッチセンサー式の表面に触れる場合(ペンダウン)のようなストロークの開始や、ユーザがタッチセンサー式の表面に触れるのをやめる場合(ペンアップ)のようなストロークの終了、及びユーザが、ストロークの開始と終了との間に彼または彼女の指で行うあらゆる動き(ジェスチャーまたはストローク)が、オンライン手書き文字認識システムあるいは方法によって、モニターされる。
オンライン手書き文字認識システムあるいは方法は、通常、前処理段階と分割段階と認識段階と解釈段階とから構成される。一般に、前処理段階では不適切な入力データを廃棄し、正規化し、サンプリングをし、さらに適切なデータからノイズを取り除く。分割段階では、入力データを個々の文字や単語に分解する様々な方法を規定する。認識には、一般に、特徴を抽出する段階を含み、それは様々な入力のセグメントの特性を明らかにするものである。認識は分類段階をも含み、それはセグメントを考えられる文字候補に関連付けるものである。最後に、解釈段階では、文字候補に関連付けられる文字及び/または単語を同定することを一般に含む。実際には、オンライン手書き文字認識システムまたは方法は、さらなる段階と共にこれらの段階を含み得る。さらに、オンライン手書き文字認識システムまたは方法は、それぞれの段階を明確に線引きしていないことがありうる。
オンライン手書き文字認識システムまたは方法は、単一ストロークまたは多数ストロークであることができる。単一ストローク認識では、アルファベットのそれぞれの文字について単一ストロークの省略表現を用いる(例、Palm社のグラフティ文字)。これらのシステムまたは方法では、入力エラーがより少なくなるが、ユーザが新しいストロークのパターンをすべてのアルファベットについて記憶することが必要となる。多数ストローク認識は自然な手書き文字を認識でき、そして日本語や漢字のような、単一ストロークには簡単に単純化しない文字を含む言語でオンライン手書き文字認識システムを用いる場合に、しばしば必要となる。
コンピュータデバイスのタイプにより、利用される手書き文字認識システムまたは方法のタイプを決定することもできる。例えば、入力表面が充分に大きい場合(例えばタブレットなど)、ユーザは1枚の紙の上で書いているかのように、入力表面上、あるいは上方で、文章あるいはデータをどこででも入力することができる。装置が小さくなるにつれて、マルチボックスやシングルボックスのような様々なシステムあるいは方法が発達してくる。マルチボックスシステムまたは方法は、入力表面を、例として3つのボックスのような複数の領域に分割し、ユーザは、それぞれのボックスにそれぞれの文字を次々に入力していく。これらは、文字の分割が最小限度になるか、あるいは不必要となるため有利である。それらは、多数ストロークの文字に対しても用いることができ、それは、分離している文字を認識する技術を用いて分析されることができる。
さらに小さい装置については、入力表面は複数のボックスに対して充分な大きさでないこともあり得るため、その表面は、基本的にシングルボックスの筆記のインターフェースとなる。この例においては、一度に1文字だけ書くことができる。シングルボックスのインターフェースは、単一ストロークの認識システムに適しているが、日本語や中国語のようなある種の言語は、単一ストロークの省略表現へ簡単には単純化しない多数ストロークの文字を有する。さらに、言語にかかわらず、最も自然な手書き文字には、多数ストロークの文字が含まれる。
多数ストロークシステムまたは方法を用いるシングルボックスのインタフェースには、文字の始めと終わりを決定することと、入力文字の画像を明確に表示することとを含むさらなる問題が発生する。文字の始めと終わりとを決定するための一つの方法では、ユーザは、それぞれの文字の間を明確に区切ることを要求される。しかし、これはユーザがデータを入力する速度を落とすことになるため、最適とはならない。ユーザが連続して中断することなく文字を入力することができるシングルボックスシステムまたは方法において、入力文字は互いに重なっているかあるいは重畳していることがよくある。これは重畳手書き文字、重なり手書き文字またはオントップ筆記文字と呼ばれる。
現在のオンライン重畳手書き文字認識システム及び方法では、分割、認識及び解釈を連続というよりはむしろ同時に行うことによって、ユーザの入力手書き文字認識についての結果を改善している。現在のシステム及び方法では、工程に階層を設けるよりはむしろ同じレベルでこれらの処理過程を行なっている。分割、認識及び解釈を共同して存在させることにより、現在のシステムは、ユーザの入力に基づいて、最も考えられる文字、単語、及び文の候補をユーザに提供する。
以下で述べられる本発明の実例は、オンライン重畳手書き文字認識で使用される方法、システム及びソフトウェアを提供する。これらにより、ユーザは、文字の間を明確に区切ることなく、彼または彼女の自然な手書き文字によりコンピュータ装置に文字を入力することができる。現在の手書き文字認識システム及び方法には、入力表面の形態となっている入力装置に接続されるコンピュータ装置が含まれる。ユーザは、圧力を加えるか、彼または彼女の指、あるいはスタイラスペンやペンのような道具を用いて入力表面の上方でジェスチャーを行うことによって入力を行うことができる。本システム及び方法では、入力のストロークがモニターされる。入力のストロークの前処理を行った後、分割エキスパートと、認識エキスパートと、言語エキスパートとが、同時に入力データを分析する。入力のストロークを処理し、文字、単語、及び文のレベルでの候補を生成する動的プログラミングを通じて、これらの3つのエキスパートは、共同して作業する。
開示されているシステム及び方法の目的は、ユーザの自然な手書き文字の文体を解釈することのできるシステム及び方法を提供することである。これは、ユーザによる入力及び認識エキスパートと言語エキスパートとからの入力に基づき、分割グラフを生成する分割エキスパートと、文字候補のリストと分割グラフのそれぞれのノードの認識スコアとを関連付ける認識エキスパートと、分割グラフにおける様々なパスの言語的な意味を生成する言語エキスパートとが、動的プログラミングを通じて、全部で共同して動作するシステム及び方法を提供することにより実行することが可能となる。
開示されているシステム及び方法の別の目的は、連続した文字の間にあらゆる明確な区切りを設けずに、文字が重ねて書かれている重畳手書き文字を認識することができるオンライン手書き文字認識システム及び方法を提供することである。これは、動的プログラミングを通じて、分割エキスパートと認識エキスパートと言語エキスパートとが共同して作業して、文字、単語、及び文章の入力に対して最も適した候補を提供するシステム及び方法を提供することにより実行することが可能となる。
開示されているシステム及び方法のさらに別の目的は、多数ストローク文字を認識することができるオンライン手書き文字認識システム及び方法を提供することである。これは、分割エキスパートがユーザ入力に基づく分割グラフを生成し、認識エキスパート及び言語エキスパートが分割グラフを分析することを動的プログラミングが含むシステム及び方法を提供することにより実行することが可能となる。
開示されているシステム及び方法の別の目的は、くっついた文字が次々と重ねて書かれた筆記体文字を認識することのできるオンライン手書き文字認識システム及び方法を提供することである。これは、分割エキスパートがストロークをその構成要素となるセグメントに分けるための位置を定義する特定のポイントを検出するシステム及び方法を提供することにより実行することが可能となる。
開示されているシステム及び方法のさらなる目的は、具体的な入力ストロークか、または単語の境界を自動的に検出することに基づいて、単語の境界を提供するオンライン手書き文字認識システム及び方法を提供することである。これは、システムおよび方法を提供し、このシステムが分割エキスパートと認識エキスパートと言語エキスパートとを含み、これらのすべてが具体的な入力ストロークを予期し、入力文字を単語に分けること、すなわち3つのエキスパートが全ての入力文字を総合的に分析することによって単語の変わり目を自動的に追加することによって、実行できる。
いくつかの態様において、本開示は重畳されたストローク入力について手書き文字認識を提供する方法を実施するために実行されるように適合されたコンピュータ読み取り可能なプログラムコードを含むコンピュータ読み取り可能な非一過性媒体を提供し、方法は、複数の入力ストロークに基づいて分割グラフを生成するステップであって、ストロークのうちの少なくとも2つが互いに少なくとも部分的に重畳されており、分割グラフは、少なくとも部分的に重畳されたストロークを考慮するように入力ストロークを分割することによって形成される文字の推測に対応するノードを含むステップと、言語認識情報に基づいて分割グラフの各ノードに認識スコアを割り当てるステップと、認識スコアと言語モデルとに基づいて入力ストロークの言語的意味を生成するステップであって、言語モデルに基づいて重畳された入力における単語の境界を認識することを含むステップと、分割グラフと認識スコアと言語モデルとにつき、同時に分析を行うことに基づいて、出力を提供するステップとを含む。
入力ストロークは前処理されてもよく、前処理は、入力ストロークの正規化と平滑化とを少なくとも含む。
分割グラフは、セグメントの構成要素に分けられた連続した入力ストロークに基づいてもよい。
認識スコアを割り当てることは、特徴抽出段階とニューラルネットワークによって抽出された特徴の分類とを含んでもよい。
ニューラルネットワークは、多層パーセプトロンであってもよい。
いくつかの態様において、本開示は重畳された入力ストロークについて手書き文字認識を提供する方法を提供し、方法は、複数の入力ストロークに基づいて分割グラフを生成するステップであって、ストロークのうちの少なくとも2つが互いに少なくとも部分的に重畳されており、分割グラフは、少なくとも部分的に重畳されたストロークを考慮するように入力ストロークを分割することによって形成される文字の推測に対応するノードを含むステップと、言語認識情報に基づいて分割グラフの各ノードに認識スコアを割り当てるステップと、認識スコアと言語モデルとに基づいて入力ストロークの言語的意味を生成するステップであって、言語モデルに基づいて重畳された入力における単語の境界を認識することを含むステップと、分割グラフと認識スコアと言語モデルとにつき、同時に分析を行うことに基づいて出力を提供するステップとを含む。
入力ストロークは前処理されてもよく、前処理は、入力ストロークの正規化と平滑化とを少なくとも含んでもよい。
分割グラフは、セグメントの構成要素に分けられた連続した入力ストロークに基づいてもよい。
認識スコアを割り当てることは、特徴抽出段階とニューラルネットワークによって抽出された特徴の分類とを含んでもよい。
ニューラルネットワークは、多層パーセプトロンであってもよい。
いくつかの態様において、本開示はコンピュータデバイスへの重畳されたストローク入力について手書き文字認識を提供するシステムを提供し、コンピュータデバイスは、プロセッサと、プロセッサの制御のもとで入力を認識するための少なくとも1つのコンピュータ読み取り可能なプログラムとを含み、少なくとも1つのプログラムは、複数の入力ストロークに基づいて、分割グラフを生成し、ストロークのうちの少なくとも2つが互いに少なくとも部分的に重畳され、分割グラフは、少なくとも部分的に重畳されたストロークを考慮するように入力ストロークを分割することによって形成される文字の推測に対応するノードを含み、言語認識情報に基づいて分割グラフの各ノードに認識スコアを割り当て、認識スコアと言語モデルとに基づいて入力ストロークの言語的意味を生成し、言語モデルに基づいて重畳された入力における単語の境界を認識することを含み、分割グラフと認識スコアと言語モデルとにつき、同時に分析を行うことに基づいて出力を提供するように構成される。
分割グラフは、セグメントの構成要素に分けられた連続した入力ストロークに基づいてもよい。
認識スコアを割り当てることは、特徴抽出段階とニューラルネットワークによって抽出された特徴の分類とを含んでもよい。
ニューラルネットワークは、多層パーセプトロンであってもよい。
本システム及び方法は、その実例の以下の詳細な記述と、図面も共に考慮されることにより充分に理解されることになる。
図1は、本システムの一例によるコンピュータデバイスのブロック図を示す。 図2は、本システムの一例によるオンライン手書き文字認識のためのシステムのブロック図を示す。 図3Aは、本システムの一例による考えられるユーザ入力の説明図を示す。 図3Bは、本システムの一例による分割グラフの概略図を示す。 図4は、本システムの一例による筆記体のユーザ入力のうち、考えられるユーザ入力の概略図を示す。 図5は、本システムの一例による筆記体のユーザ入力の分割に関する概略説明図である。 図6は、本システムの一例による認識エキスパートの概略説明図を示す。 図7は、本システムの一例による言語オートマトンの概略説明図を示す。
以下の詳細な説明において、関連のある教示の完全な理解を提供するために、数多くの具体的な細部を実例の方法により説明する。しかしながら、これらの具体的な細部なしでも本教示を実施し得ることが、当業者には明らかであろう。他の例においては、本教示の態様を不必要に分かりにくくしないように、周知の方法、手続き、構成要素、及び/または回路を詳細なレベルではないが、相対的に高度なレベルで説明している。
ここで述べられる様々な技術は、一般に、オンライン手書き文字認識に関するものであり、より具体的には、様々なコンピュータデバイス上での重畳された手書き文字認識についてのシステムと方法とに関するものである。ここで述べられるシステムと方法は、最善と考えられる文字や単語や文章の候補を提供する分割と認識と解釈との同時の処理により、ユーザの自然な手書き文字入力を認識するために使用され得る。
図1は、コンピュータデバイス100のブロック図を示す。このコンピュータデバイスは、デスクトップコンピュータや、ラップトップコンピュータや、タブレットPCや、電子書籍リーダーや、携帯電話や、スマートフォンや、ウェアラブルコンピュータや、デジタルウォッチや、全地球測位システム(GPS)装置や、エンタプライズデジタルアシスタント(EDA)や、携帯情報端末(PDA)、またはゲームコンソールであることができる。コンピュータデバイス100は、少なくとも1つの処理素子と、何らかの形態のメモリと、入力及び/または出力(I/O)装置とを含む。コネクタや、配線や、バスや、ケーブルや、バッファや、電磁気リンクや、ネットワークや、モデムや、トランスデューサや、IRポートや、アンテナや、または当業者が知る他の手段のような、入力及び出力手段を通じて、構成要素は、互いに通信する。
コンピュータデバイス100は、少なくとも1つの入力表面104を含む。入力表面104は、抵抗性、表面弾性波、容量性、赤外線グリッド、赤外線アクリル投影、光学イメージ、分散信号技術、アコースティックパルス認識、または当業者が知る他の適切な技術のような技術を用いても良い。入力表面104は、その周辺を明確に識別する、常設の境界、あるいは動画生成の境界によって接続されてもよい。
入力表面104に加えて、コンピュータデバイス100は、ローカルインタフェースを介して通信的に結合される1つ以上の付加的なI/O装置(または周辺機器)を含んでもよい。ローカルインタフェースは、制御装置や、バッファ(キャッシュ)や、ドライバや、リピーターや、受信機のような、単純化するために除外されるが当業者に知られている、通信を可能にするための付加的な要素を有してもよい。さらに、ローカルインタフェースは、他のコンピュータ構成要素間で適切に通信できるようにするためのアドレスや、制御手段及び/またはデータ通信を含んでもよい。
そのようなI/Oデバイスの1つは、画像や、文章や、動画のようなコンピュータデバイスのデータを出力する少なくとも1つのディスプレイ102であってもよい。ディスプレイ102は、LCDや、プラズマや、CRTや、または当業者に知られているような他の適切な技術であってもよい。少なくとも、一部のディスプレイ102は、入力表面104と同じ場所に設置することもあり得る。他の付加的なI/O装置は、キーボードや、マウスや、スキャナや、マイクロフォンや、タッチパッドや、バーコードリーダーや、レーザーリーダや、無線装置リーダーや、当業者に知られている他のあらゆる適切な技術のような入力装置を含んでもよい。その上、I/O装置は、プリンタや、バーコードプリンタや、または当業者に知られている他のあらゆる適切な技術のような出力装置をも含んでもよい。最後に、I/O装置は、変調器/復調器(モデム;別の装置や、システムや、またはネットワークにアクセスするため)や、無線周波数(RF)あるいは他のトランシーバーや、電話インタフェースや、ブリッジや、ルーターや、または当業者に知られている他のあらゆる適切な技術のような入力と出力との双方を伝達する装置をさらに含んでもよい。
コンピュータデバイス100は、プロセッサ106をも含み、それはソフトウェア、特に、メモリ108内に記憶されるソフトウェアを実行するためのハードウェア装置である。プロセッサは、あらゆるオーダーメイドの、または商業的に入手可能な一般目的のプロセッサや、中央処理装置(CPU)や、半導体を主材料としたマイクロプロセッサや(マイクロチップ、またはチップセットの形態で)、マイクロプロセッサや、マイクロコントローラや、デジタルシグナルプロセッサ(DSP)や、特定用途向け集積回路(ASIC)や、フィールドプログラマブルゲートアレイ(FPGA)や、または他のプログラムで制御できる論理デバイスや、個別ゲートまたはトランジスタ論理や、個別ハードウェア構成要素や、ステートマシンや、または、当業者に知られるソフトウェア命令を実行するために設計されたこれらのあらゆる組み合わせであってもよい。商業的に入手可能な適切なマイクロプロセッサの例は以下の通りである:ヒューレート-パッカード社のPA-RISCシリーズのマイクロプロセッサ、インテル社の80x86、またはPentiumシリーズのマイクロプロセッサ、IBMのPowerPCマイクロプロセッサ、サンマイクロシステム社のSparcマイクロプロセッサ、モトローラ社の68xxxシリーズのマイクロプロセッサ、DSPマイクロプロセッサ、またはARMマイクロプロセッサ。
メモリ108は、揮発性のメモリ要素(例、ランダムアクセスメモリ(DRAM、SRAM、SDRAM等のようなRAM))と、不揮発性のメモリ要素(例、ROM、EPROM、フラッシュPROM、EEPROM、ハードドライブ、磁気または光学テープ、メモリレジスタ、CD-ROM、WORM、DVD、独立ディスク冗長アレイ(“RAID”)や、別の直接アクセス記憶装置(“DASD”など))とのうちのどれでも1つ、または組み合わせを含むことができる。さらに、メモリ108は、電子の、磁気の、光学の、及び/または他のタイプの記憶装置を組み入れてもよい。メモリ108は、様々な構成要素が互いに離れている状態にあるが、プロセッサ106によってアクセスされることもできる分散型のアーキテクチャを有することもできる。メモリ108は、プロセッサ106に連結されているため、プロセッサ106は、メモリ108から情報を読むことができ、さらにメモリ108に情報を書き込むことができる。別の方法では、メモリ108はプロセッサ106に不可欠であってもよい。別の例では、プロセッサ106とメモリ108とは両方とも単一のASIC内、または他の集積回路内に存在してもよい。
メモリ108内のソフトウェアは、オンライン手書き文字コンピュータプログラムを含み、それは1つ以上の分離したプログラムを含んでもよく、1つ以上の分離したプログラムのそれぞれは論理機能を実施するための実行可能命令の順序つきリストを構成する。オペレーティングシステム110は、プロプライエタリオペレーティングシステムや、または、PALM(登録商標)、WINDOWS(登録商標)、MAC及びIPHONE OS(登録商標)、LINUX、ANDROID(登録商標)などのような商業的に入手可能なオペレーティングシステムであってもよい。他のオペレーティングシステムも、ここで開示されているシステムと方法との趣旨から外れずに利用してもよいことは当然のことである。
メモリ108は、本明細書で述べられている手書き文字認識や、完全に異なる機能や、あるいは両者に関連する、他のアプリケーションプログラム112を含んでもよい。他のアプリケーションプログラム112は、製造時にコンピュータデバイス100に提供されたプログラムを含み、製造後にコンピュータデバイス100にダウンロードされたプログラムをさらに含んでもよい。いくつかの例では、テキストエディタ、電話自動ダイヤル装置、電話帳、インスタントメッセージ機能、メールプログラム、ワードプロセッサプログラム、ウェブブラウザ、カメラなどを含む。
サポート及びコンプライアンス機能を有する、オンライン手書き文字認識コンピュータプログラムは、ソースプログラムや、実行可能プログラム(オブジェクトコード)や、スクリプトや、または、実行される一連の命令を構成するあらゆる他のエンティティであってもよい。ソースプログラムである場合、プログラムは、それがメモリ内に含まれていてもいなくても、オペレーティングシステムと接続して適切に作動するために、コンパイラや、アセンブラや、インタープリタなどによって翻訳されることが必要となる。さらに、サポート及びコンプライアンス機能を有する、オンライン手書き文字認識コンピュータプログラムは、(a)クラスのデータとメソッドとを有するオブジェクト指向のプログラム言語として書かれることができ、または、(b)ルーチン、サブルーチン、及び/または関数を有する手続き型プログラミング言語として書かれることができる。例としては、Cと、C++と、Pascalと、Basicと、Fortranと、Cobolと、Perlと、Java(登録商標)と、Adaとがあげられるが、これらに限定されるものではない。
システムは、入力表面104を介してユーザによって入力されたストロークを、プロセッサ106が検出したときに起動される。ユーザは、指や、または、ペンやスタイラスペンのような何らかの道具を用いてストロークを入力してもよい。ストロークは、少なくとも、ストローク開始の位置と、ストローク終了の位置と、ユーザがストロークの開始とストロークの終了位置とを接続するパスと、によって特徴付けられる。様々なユーザが自然に同じ文字を書くと、少し変化が生じるかもしれないので、本システムは、それぞれの文字が入力され得る様々な方法に対して順応する。
図2は、本システムの一例によるオンライン手書き文字認識システムの概略図である。いったん、少なくとも一つの入力ストロークで起動されると、システムは当該ストロークの前処理114を行う。サイズの正規化及び/または入力を平滑化するためのBスプラインの近似値のような方法を施すことにより、前処理114はストロークの開始位置と、終了位置とにつながるパスを正規化することを含むことができる。次に、入力ストロークは、動的プログラミングを通じて協働する3つのエキスパート(分割エキスパート116と、認識エキスパート118と、言語エキスパート120)に渡されて、文字と、単語と、文のレベルとでの出力候補124を生成する。
分割エキスパート116は、入力ストロークを、単語仮説と、個々の文字仮説とに分割する様々な方法を定義する。文字仮説を形成するために、分割エキスパート116は、元の入力の連続したストロークをグループ化する。これは、各ノードが少なくとも1つの文字仮説に対応し、文字間の隣接性制約が、ノードの接続によって処理されるという分割グラフをもたらす。対応する仮説が共通したストロークを有さないが、ストロークが元の入力において連続している場合、ノードは隣接しているものとみなされる。図3Aは、本システムの一例による、単語BEANの、考えられるユーザ入力を示す。具体的には、図は、多数ストローク文字を用いた重畳筆記文字の一例を表示する。図3Bは、本システムの一例によって作成された、図3Aの入力の考えられる分割グラフを示す。
また、重畳手書き文字認識システム及び方法は、どこで一つの単語が終わり別の単語が始まるかを決定しなければならない。本システムと本方法とは、単語の境界を検索する複数の実施形態が可能となる。一実施形態においては、ユーザは、各単語の後に特有のジェスチャーを入れることが要求される。この実施形態においては、特有のジェスチャーは、スペース文字としての出力となる。この実施形態は、入力ストロークを単語の推測と個々の文字の推測とに分割する様々な方法を減らすため、分割プロセスにより強固さをもたらす。しかし、この実施形態は、各単語の終わりを示す特有のジェスチャーを加えることをユーザに強要し、それは、何人かのユーザによって忘れられるおそれがある。
別の実施形態では、単語を分ける特有のジェスチャーを要求しない。代わりに、オンライン手書き文字認識コンピュータプログラムでは、認識エキスパート118及び/または言語エキスパート120の支援をもって単語の境界を自動的に検出し、このことは、以下に詳細が述べられる。例えば、言語エキスパート120は、言語情報130を用いて、とりわけ、語彙の知識と、N-gramモデル、構文解析、意味解析などのような、所与の言語において一連の連続した単語の可能性をモデリングする技術とに基づいて、単語の境界を検出する。
例えばユーザは、英語の言語から抽出された言語情報130に基づく一実施形態として、重畳筆記で“Whattimeisit?”という文字の並びを入力するかもしれない。この別の実施形態では、“What time is it?”と分割された単語を出力し、入力ストロークに対してグローバルな意味を構成し、言語情報130に基づいて単語の境界を検索する。この実施形態には、ユーザが、各単語の間に特有のジェスチャーを入れずに一連の単語を入力することを可能にするという有利な点がある。
別の実施形態では、前の二つの方法を結び付けることができる。その場合、ユーザは、単語の境界を検出することをより強固にするために、各単語の後に特有のジェスチャーを入れることができる。しかし、ユーザがジェスチャーを入れ忘れたときはいつも、手書き文字認識システムは、認識エキスパート118及び/または言語エキスパート120の支援をもって単語の境界を検出することができる。
一つの例において、図3Aと、図3Bとで見られるように、分割エキスパートは、各個々の文字がペンアップにより隣接する文字と分けられた手書き活字式の文字入力に限定されていない。本システムの分割エキスパート116は、くっついた文字が次々と重ねて書かれる筆記体を処理することもできる。図4は、単語“be”と、“an”との筆記体のユーザ入力を説明する。筆記体のユーザ入力を解釈する場合、分割エキスパート116は、ストロークをセグメントの構成要素に分けるための位置を定義する特定の点の検出に基づいて、各ストロークを分割する。図5は、筆記体の“an”がセグメントの構成要素に分割される一例を説明する。ストロークをセグメントの構成要素に分けるための特定の点は、交差する点、ストロークの軌跡の傾きにおける変化などによって定義される。これらのセグメントの構成要素は、分割グラフを構成するために使用される。
認識エキスパート118は、文字候補のリストを、分割グラフの各ノードに対する確率、または認識スコアに関連付ける。これらの確率、または認識スコアは、言語認識情報122に基づく。言語認識情報は、特定の言語に内在する字母表の全ての様々な文字と、シンボルとを定義する。この情報は、言語依存的であり、字母表の文字を書く様々な個人のスタイルを認識する能力はもちろん、字母表の文字における一般的な違いも構成する。例えば、個人が“7”を書く方法は、その個人が米国、フランス、または実に韓国出身であるかどうかに応じてかなり異なり得る。図3A及び図3Bの例に続き、図6は、2つの段階を含む認識エキスパート118の実施形態を説明する。認識エキスパート118の第1の段階、特徴抽出126は、動的及び静的な特徴との組み合わせに基づく。例えば、動的な特徴は、入力ストロークの軌跡から抽出されることができ、入力ストロークの位置や方向や湾曲とのような情報に基づいている。静的な特徴は、入力ストロークのビットマップの表現から抽出することができ、射影とヒストグラムに基づくことができる。
本実施形態の認識エキスパート118の第2の段階は、ニューラルネットワーク128のようなパターン分類子によって抽出される特徴の分類である。本実施形態において、ニューラルネットワークは、単純な多層パーセプトロンとなりうる。ニューラルネットワークは、不当に分割された文字に対応するノード仮説を、ニューラルネットワークが拒否することをできるようにする追加のクラスを含むこともできる。認識エキスパート118は、分割グラフの各ノードに対する確率、または認識スコアを用いて、文字候補のリストを出力する。他に取りうる実施形態においては、ディープニューラルネットワークや、畳み込みニューラルネットワークや、または、リカレントニューラルネットワークのような、別の種類のニューラルネットワークを活用することができるかもしれない。より一般的には、あらゆる種類のパターン分類子がこの認識タスクに対処するために使用されることができる(例、サポートベクターマシーン、隠れマルコフモデル)。
言語エキスパート120は、分割グラフにおける様々なパスの言語的な意味を生成する。それは、利用できる言語情報130に応じた他のエキスパートによって示唆される候補をチェックする。この言語情報130は、語彙、正規の表現などを含むことができる。言語エキスパート120は、最上の認識パスを発見することを目指す。一実施形態において、言語エキスパート120は、言語情報130の内容を表す最終状態オートマトン(決定的FSA)のような言語モデルを探索することによってこれを行う。図3Aと、図3Bと、図6との例に基づいている図7は、単語BEANと、BYと、CARと、CATと、COWとを含むに過ぎない語彙を有する言語オートマトンを示す。さらに、図7は、ユーザが、単語の境界を定義するために、ダッシュ記号132を入れることを予期する言語エキスパートの実施形態を表す。
語彙の制約に加えて、言語エキスパート120は、ある単語、または所与の一連の単語がどれくらい頻繁に特定の言語に現れるか、または特定のユーザによって使用されるかについてモデリングする静的情報を使用してもよい。例えば、単語のトリグラムでの言語モデルは、分割グラフの所与のパスの解釈に関する言語的な可能性を評価するために用いられてもよい。
分割エキスパート116と、認識エキスパート118と、言語エキスパート120とは、動的プログラミングを通じて協働して、入力ストロークを処理し、文字と、単語と、文章レベルでの出力候補124を生成する。一の実施形態において、動的プログラミングは、分割グラフと言語モデルとの双方とにおいて最良のパスを探索するビーム探索法に基づく。この例において、最良のパスとは、最も低いコストに対応するパスである。最も低いコストのパスは、以下の総計として定義することができる。
・分割グラフにおける対応するパスで遭遇した全ての文字候補のコスト。これらのコストは、分割グラフでこのパスに属している各ノードの確率、または認識スコアから推定されることができる。一の実施形態において、対数非線形関数を適用することにより、コストは、ニューラルネットワークの確率から推定されることができる。
・言語モデルの対応するパスで遭遇した全ての単語のコスト。それらのコストは、言語エキスパート120によるNグラム確率から推定されることができる。一の実施形態において、対数非線形関数を適用することにより、コストは、言語エキスパート120によるNグラム確率から推定される。
本オンライン手書き文字認識コンピュータプログラムの総合的なトレーニングに関して、全てのパラメーターの分類子の自動的な学習についてのテキストレベルでの、グローバルな判別式トレーニングスキーム(例、ニューラルネットワーク128)と、システムのあらゆるメタパラメータとが使用されてもよいが、他のトレーニングシステムと方法とが使用されてもよい。本オンライン重畳手書き文字認識システムと方法とを通じて、ユーザ入力の手書き文字認識に対する最良の結果が、連続した、または階層的な性質よりもむしろ、分割と認識と解釈とを同時に行うことによって提供される。
前記において、ベストモード及び/または他の例であるとみなされるものを記述しているが、様々な変更が可能であることと、本明細書で開示されている主題が様々な形態と例とによって実施可能であること、及びそれらが、多数の他の出願は、組み合わせや、環境において適用可能であり、それらのうちのいくつかが、本明細書で開示されていることにすぎないことを理解されたい。当業者は、主題の真の精神や範囲から離れることなく、開示されている態様を変形したり補正できることについて認識するであろう。それゆえに、主題は、この明細書における特有の詳細と、添付書類と、説明された例とに限定されない。本明細書で開示される有利な概念の真の範囲となるあらゆる、そして全ての修正と変形とを保護することが意図される。

Claims (14)

  1. 重畳されたストローク入力について手書き文字認識を提供する方法を実施するために実行されるように適合されたコンピュータ読み取り可能なプログラムコードを含むコンピュータ読み取り可能な非一過性媒体であって、前記方法は、
    複数の入力ストロークに基づいて、分割グラフを生成するステップであって、前記ストロークのうちの少なくとも2つが互いに少なくとも部分的に重畳されており、前記分割グラフは、前記少なくとも部分的に重畳されたストロークを考慮するように前記入力ストロークを分割することによって形成される文字の推測に対応するノードを含む、ステップと、
    言語認識情報に基づいて、前記分割グラフの各ノードに認識スコアを割り当てるステップと、
    前記認識スコアと言語モデルとに基づいて、前記入力ストロークの言語的意味を生成するステップであって、前記言語モデルに基づいて、前記重畳された入力における単語の境界を認識することを含む、ステップと、
    前記分割グラフと前記認識スコアと前記言語モデルとにつき、同時に分析を行うことに基づいて、出力を提供するステップと
    を含むことを特徴とするコンピュータ読み取り可能な非一過性媒体
  2. 前記入力ストロークは前処理され、前記前処理は、前記入力ストロークの正規化と平滑化とを少なくとも含むことを特徴とする請求項1に記載のコンピュータ読み取り可能な非一過性媒体
  3. 前記分割グラフは、セグメントの構成要素に分けられた連続する入力ストロークに基づいていることを特徴とする請求項1または請求項2に記載のコンピュータ読み取り可能な非一過性媒体
  4. 認識スコアを前記割り当てることは、特徴抽出段階とニューラルネットワークによって抽出された特徴の分類とを含むことを特徴とする請求項1乃至請求項3のいずれか1項に記載のコンピュータ読み取り可能な非一過性媒体
  5. 前記ニューラルネットワークは、多層パーセプトロンであることを特徴とする請求項4に記載のコンピュータ読み取り可能な非一過性媒体
  6. 重畳された入力ストロークについて手書き文字認識を提供する方法であって、前記方法は、
    複数の入力ストロークに基づいて、分割グラフを生成するステップであって、前記ストロークのうちの少なくとも2つが互いに少なくとも部分的に重畳されており、前記分割グラフは、前記少なくとも部分的に重畳されたストロークを考慮するように前記入力ストロークを分割することによって形成される文字の推測に対応するノードを含む、ステップと
    言語認識情報に基づいて、前記分割グラフの各ノードに認識スコアを割り当てるステップと、
    前記認識スコアと言語モデルとに基づいて、前記入力ストロークの言語的意味を生成するステップであって、前記言語モデルに基づいて、前記重畳された入力における単語の境界を認識することを含む、ステップと、
    前記分割グラフと前記認識スコアと前記言語モデルとにつき、同時に分析を行うことに基づいて、出力を提供するステップと
    を含むことを特徴とする方法。
  7. 前記入力ストロークは前処理され、前記前処理は、前記入力ストロークの正規化と平滑化とを少なくとも含む
    ことを特徴とする請求項に記載の方法。
  8. 前記分割グラフは、セグメントの構成要素に分けられた連続する入力ストロークに基づいていることを特徴とする請求項6または請求項7に記載の方法。
  9. 認識スコアを前記割り当てることは、特徴抽出段階とニューラルネットワークによって抽出された特徴の分類とを含むことを特徴とする請求項6乃至請求項8のいずれか1項に記載の方法。
  10. 前記ニューラルネットワークは、多層パーセプトロンであることを特徴とする請求項に記載の方法。
  11. コンピュータデバイスへの重畳されたストローク入力について手書き文字認識を提供するシステムであって、前記コンピュータデバイスは、
    プロセッサと、
    前記プロセッサの制御のもとで前記入力を認識するための少なくとも1つのコンピュータ読み取り可能なプログラムとを含み、前記少なくとも1つのプログラムは、
    複数の入力ストロークに基づいて、分割グラフを生成し、前記ストロークのうちの少なくとも2つが互いに少なくとも部分的に重畳され、前記分割グラフは、前記少なくとも部分的に重畳されたストロークを考慮するように前記入力ストロークを分割することによって形成される文字の推測に対応するノードを含み、
    言語認識情報に基づいて、前記分割グラフの各ノードに認識スコアを割り当て、
    前記認識スコアと言語モデルとに基づいて、前記入力ストロークの言語的意味を生成し、前記言語モデルに基づいて、前記重畳された入力における単語の境界を認識することを含み、
    前記分割グラフと前記認識スコアと前記言語モデルとにつき、同時に分析を行うことに基づいて、出力を提供する、
    ように構成されることを特徴とするシステム
  12. 前記分割グラフは、セグメントの構成要素に分けられた連続する入力ストロークに基づいていることを特徴とする請求項11に記載のシステム
  13. 認識スコアを前記割り当てることは、特徴抽出段階とニューラルネットワークによって抽出された特徴の分類とを含むことを特徴とする請求項11または請求項12に記載のシステム
  14. 前記ニューラルネットワークは、多層パーセプトロンであることを特徴とする請求項13に記載のシステム
JP2017503194A 2014-04-04 2015-03-30 重畳された手書き文字認識技術システム及び重畳された手書き文字認識技術方法。 Active JP6542870B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US14/245,601 2014-04-04
US14/245,601 US9524440B2 (en) 2014-04-04 2014-04-04 System and method for superimposed handwriting recognition technology
PCT/IB2015/000563 WO2015150911A2 (en) 2014-04-04 2015-03-30 System and method for superimposed handwriting recognition technology

Publications (2)

Publication Number Publication Date
JP2017514248A JP2017514248A (ja) 2017-06-01
JP6542870B2 true JP6542870B2 (ja) 2019-07-10

Family

ID=53499033

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017503194A Active JP6542870B2 (ja) 2014-04-04 2015-03-30 重畳された手書き文字認識技術システム及び重畳された手書き文字認識技術方法。

Country Status (6)

Country Link
US (2) US9524440B2 (ja)
EP (1) EP3127043A2 (ja)
JP (1) JP6542870B2 (ja)
KR (1) KR102383624B1 (ja)
CN (1) CN106663189B (ja)
WO (1) WO2015150911A2 (ja)

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6014170B2 (ja) * 2013-01-04 2016-10-25 株式会社Uei 情報処理装置及び情報更新プログラム
US9996255B2 (en) 2015-02-23 2018-06-12 Capit Learning Touch screen finger tracing device
US10387034B2 (en) 2015-09-03 2019-08-20 Microsoft Technology Licensing, Llc Modifying captured stroke information into an actionable form
US10210383B2 (en) 2015-09-03 2019-02-19 Microsoft Technology Licensing, Llc Interacting with an assistant component based on captured stroke information
US10417491B2 (en) * 2015-10-19 2019-09-17 Myscript System and method for recognition of handwritten diagram connectors
US11402991B2 (en) * 2015-12-01 2022-08-02 Myscript System and method for note taking with gestures
US10410316B2 (en) 2015-12-08 2019-09-10 Myscript System and method for beautifying digital ink
US20170242581A1 (en) * 2016-02-23 2017-08-24 Myscript System and method for multiple input management
US10146759B2 (en) * 2016-03-24 2018-12-04 Microsoft Technology Licensing, Llc Controlling digital input
US11209976B2 (en) 2016-04-29 2021-12-28 Myscript System and method for editing input management
WO2017207103A1 (en) 2016-06-02 2017-12-07 Myscript System, method and computer readable medium for input recognition linguistic resource management
US20180032494A1 (en) 2016-07-29 2018-02-01 Myscript System and method for beautifying superimposed digital ink
US20180089316A1 (en) * 2016-09-26 2018-03-29 Twiggle Ltd. Seamless integration of modules for search enhancement
US10067965B2 (en) 2016-09-26 2018-09-04 Twiggle Ltd. Hierarchic model and natural language analyzer
CN106845530B (zh) * 2016-12-30 2018-09-11 百度在线网络技术(北京)有限公司 字符检测方法和装置
CN111611798B (zh) * 2017-01-22 2023-05-16 创新先进技术有限公司 一种词向量处理方法及装置
US20180217970A1 (en) * 2017-01-29 2018-08-02 Voolab Technologies Private Limited Methods and systems for processing intuitive interactive inputs across a note-taking interface
KR102329761B1 (ko) * 2017-05-26 2021-11-22 삼성전자주식회사 외부 장치의 선택 및 제어를 위한 전자 장치와 그의 동작 방법
US10424086B2 (en) * 2017-11-16 2019-09-24 Adobe Inc. Oil painting stroke simulation using neural network
US11005786B2 (en) 2018-06-28 2021-05-11 Microsoft Technology Licensing, Llc Knowledge-driven dialog support conversation system
CN109684633B (zh) * 2018-12-14 2023-05-16 北京百度网讯科技有限公司 搜索处理方法、装置、设备及存储介质
US11048931B2 (en) * 2019-02-19 2021-06-29 Lenovo (Singapore) Pte. Ltd. Recognition based handwriting input conversion
CN111161266B (zh) * 2019-12-06 2022-03-25 西安理工大学 一种基于矢量量化的变分自编码机的多风格字体生成方法
KR20210073196A (ko) * 2019-12-10 2021-06-18 삼성전자주식회사 필기 입력을 처리하는 방법 및 그 장치
CN111383505B (zh) * 2020-03-04 2021-11-09 南京大学 一种基于笔交互的电路教学系统及方法
CN111428623B (zh) * 2020-03-20 2020-12-18 郑州工程技术学院 基于大数据和计算机视觉的中文板书风格分析系统
KR20220135914A (ko) * 2021-03-31 2022-10-07 삼성전자주식회사 학습 기반의 필기 입력을 처리하는 전자 장치, 그 동작 방법 및 저장매체
CN113011413A (zh) * 2021-04-15 2021-06-22 深圳市鹰硕云科技有限公司 基于智能笔手写图像的处理方法、装置、系统及存储介质
KR20230017538A (ko) * 2021-07-28 2023-02-06 삼성전자주식회사 전자 장치 및 필기 인식 방법

Family Cites Families (74)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AUPQ131399A0 (en) 1999-06-30 1999-07-22 Silverbrook Research Pty Ltd A method and apparatus (NPAGE02)
AUPQ055999A0 (en) 1999-05-25 1999-06-17 Silverbrook Research Pty Ltd A method and apparatus (npage01)
US5164996A (en) 1986-04-07 1992-11-17 Jose Pastor Optical character recognition by detecting geo features
US5946406A (en) 1991-06-17 1999-08-31 Microsoft Corporation Method and system for data entry of handwritten symbols
US5544265A (en) 1992-05-27 1996-08-06 Apple Computer, Inc. Shape recognizer for graphical computer systems
US5392363A (en) * 1992-11-13 1995-02-21 International Business Machines Corporation On-line connected handwritten word recognition by a probabilistic method
US5454046A (en) 1993-09-17 1995-09-26 Penkey Corporation Universal symbolic handwriting recognition system
US5596656B1 (en) 1993-10-06 2000-04-25 Xerox Corp Unistrokes for computerized interpretation of handwriting
US5615321A (en) 1994-08-12 1997-03-25 Dassault Systemes Of America Corp. Automatic identification of geometric relationships between elements of a computer-generated drawing
EP0697679A3 (en) 1994-08-12 1998-07-01 Dassault Systemes of America Computerized drawing method
EP0701224B1 (en) 1994-09-09 2000-12-06 Xerox Corporation Method for interpreting hand drawn diagrammatic user interface commands
US6295372B1 (en) 1995-03-03 2001-09-25 Palm, Inc. Method and apparatus for handwriting input on a pen based palmtop computing device
JP3639126B2 (ja) 1998-01-22 2005-04-20 富士通株式会社 住所認識装置及び住所認識方法
JP3092576B2 (ja) 1998-01-22 2000-09-25 日本電気株式会社 文字認識装置
US6816274B1 (en) 1999-05-25 2004-11-09 Silverbrook Research Pty Ltd Method and system for composition and delivery of electronic mail
US6476834B1 (en) 1999-05-28 2002-11-05 International Business Machines Corporation Dynamic creation of selectable items on surfaces
US6731803B1 (en) 1999-07-12 2004-05-04 Advanced Recognition Technologies, Ltd Points based handwriting recognition system
US6459442B1 (en) 1999-09-10 2002-10-01 Xerox Corporation System for applying application behaviors to freeform data
US6609093B1 (en) * 2000-06-01 2003-08-19 International Business Machines Corporation Methods and apparatus for performing heteroscedastic discriminant analysis in pattern recognition systems
NL1015943C2 (nl) 2000-08-16 2002-02-19 Ocu Technologies B V Interpretatie van gekleurde documenten.
JP3974359B2 (ja) 2000-10-31 2007-09-12 株式会社東芝 オンライン文字認識装置及び方法並びにコンピュータ読み取り可能な記憶媒体及びオンライン文字認識プログラム
US7177473B2 (en) 2000-12-12 2007-02-13 Nuance Communications, Inc. Handwriting data input device with multiple character sets
AUPR824501A0 (en) * 2001-10-15 2001-11-08 Silverbrook Research Pty. Ltd. Methods and systems (npw003)
SE520504C2 (sv) 2001-11-30 2003-07-15 Anoto Ab Elektronisk penna och metod för registrering av handskriven information
US7385595B2 (en) 2001-11-30 2008-06-10 Anoto Ab Electronic pen and method for recording of handwritten information
US7120872B2 (en) 2002-03-25 2006-10-10 Microsoft Corporation Organizing, editing, and rendering digital ink
US7174043B2 (en) * 2003-02-25 2007-02-06 Evernote Corp. On-line handwriting recognizer
JP2005084436A (ja) * 2003-09-09 2005-03-31 Advanced Telecommunication Research Institute International 音声認識装置及びコンピュータプログラム
US7324691B2 (en) 2003-09-24 2008-01-29 Microsoft Corporation System and method for shape recognition of hand-drawn objects
US7352902B2 (en) 2003-09-24 2008-04-01 Microsoft Corporation System and method for detecting a hand-drawn object in ink input
US7372993B2 (en) 2004-07-21 2008-05-13 Hewlett-Packard Development Company, L.P. Gesture recognition
FR2880709B1 (fr) * 2005-01-11 2014-04-25 Vision Objects Procede de recherche, reconnaissance et localisation dans l'encre, dispositif, programme et langage correspondants
US20060212430A1 (en) 2005-03-18 2006-09-21 Searete Llc, A Limited Liability Corporation Of The State Of Delaware Outputting a saved hand-formed expression
US7428516B2 (en) * 2005-06-23 2008-09-23 Microsoft Corporation Handwriting recognition using neural networks
US7639250B2 (en) 2005-11-01 2009-12-29 Microsoft Corporation Sketching reality
US7646913B2 (en) * 2005-12-19 2010-01-12 Microsoft Corporation Allograph based writer adaptation for handwritten character recognition
US20070206024A1 (en) 2006-03-03 2007-09-06 Ravishankar Rao System and method for smooth pointing of objects during a presentation
US7907141B2 (en) 2007-03-23 2011-03-15 Palo Alto Research Center Incorporated Methods and processes for recognition of electronic ink strokes
US7885456B2 (en) * 2007-03-29 2011-02-08 Microsoft Corporation Symbol graph generation in handwritten mathematical expression recognition
US8341556B2 (en) 2007-04-30 2012-12-25 Hewlett-Packard Development Company, L.P. Method and system for attention-free user input on a computing device
US7945097B2 (en) 2007-05-21 2011-05-17 Microsoft Corporation Classifying digital ink into a writing or a drawing
US8094939B2 (en) 2007-06-26 2012-01-10 Microsoft Corporation Digital ink-based search
KR101041366B1 (ko) 2007-11-02 2011-06-14 주식회사 코아로직 객체 추적을 이용한 디지털 영상의 손떨림 보정 장치 및방법
US8255822B2 (en) 2007-12-21 2012-08-28 Microsoft Corporation Incorporated handwriting input experience for textboxes
US8116569B2 (en) 2007-12-21 2012-02-14 Microsoft Corporation Inline handwriting recognition and correction
JP5047051B2 (ja) 2008-05-02 2012-10-10 キヤノン株式会社 画像処理装置及び画像符号化方法
US20090278848A1 (en) 2008-05-12 2009-11-12 Microsoft Corporation Drawing familiar graphs while system determines suitable form
JP4582204B2 (ja) 2008-06-11 2010-11-17 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置、画像変換方法、およびコンピュータプログラム
CN101299236B (zh) * 2008-06-25 2010-06-09 华南理工大学 一种中文手写词组识别方法
US20100100866A1 (en) 2008-10-21 2010-04-22 International Business Machines Corporation Intelligent Shared Virtual Whiteboard For Use With Representational Modeling Languages
US8749497B2 (en) 2008-12-12 2014-06-10 Apple Inc. Multi-touch shape drawing
JP5153676B2 (ja) 2009-02-10 2013-02-27 キヤノン株式会社 画像処理装置、画像処理方法、プログラムおよび記憶媒体
US8175389B2 (en) * 2009-03-30 2012-05-08 Synaptics Incorporated Recognizing handwritten words
TWI391850B (zh) 2009-03-31 2013-04-01 Au Optronics Corp 輸入圖形判定方法及電腦可讀儲存媒體
US8766982B2 (en) * 2010-01-19 2014-07-01 Disney Enterprises, Inc. Vectorization of line drawings using global topology and storing in hybrid form
US9495482B2 (en) 2010-01-27 2016-11-15 Dassault Systemes Solidworks Corporation Computer method and apparatus for creating sketch geometry
US8928652B2 (en) 2010-05-11 2015-01-06 Siemens Aktiengesellschaft Sketched overdrawn lines for editing spline-based three-dimensional curves
US8310461B2 (en) 2010-05-13 2012-11-13 Nuance Communications Inc. Method and apparatus for on-top writing
US20110285634A1 (en) 2010-05-24 2011-11-24 Karbonstream Corporation Portable data entry device
US8571321B2 (en) 2010-07-26 2013-10-29 Casio Computer Co., Ltd. Character recognition device and recording medium
CN102375989A (zh) * 2010-08-06 2012-03-14 腾讯科技(深圳)有限公司 手写识别方法及系统
KR101355974B1 (ko) 2010-08-24 2014-01-29 한국전자통신연구원 복수의 객체를 추적하는 객체 추적 방법 및 장치
KR101486174B1 (ko) * 2010-08-24 2015-01-23 노키아 코포레이션 중첩된 수기의 획들을 하나 이상의 그룹으로 분할하는 방법 및 장치
US8564620B2 (en) 2010-10-07 2013-10-22 International Business Machines Corporation Method for automatically adjusting the rendered fidelity of elements of a composition
CN103299254B (zh) * 2010-12-02 2016-09-14 诺基亚技术有限公司 用于重叠手写的方法和装置
US8718375B2 (en) 2010-12-03 2014-05-06 Massachusetts Institute Of Technology Sketch recognition system
CN102156608B (zh) 2010-12-10 2013-07-24 上海合合信息科技发展有限公司 多字符连续书写的手写输入方法
US20120176416A1 (en) 2011-01-10 2012-07-12 King Fahd University Of Petroleum And Minerals System and method for shape recognition and correction
US9645986B2 (en) 2011-02-24 2017-05-09 Google Inc. Method, medium, and system for creating an electronic book with an umbrella policy
US9142056B1 (en) 2011-05-18 2015-09-22 Disney Enterprises, Inc. Mixed-order compositing for images having three-dimensional painting effects
US8094941B1 (en) * 2011-06-13 2012-01-10 Google Inc. Character recognition for overlapping textual user input
KR20130037097A (ko) 2011-10-05 2013-04-15 주식회사 케이티 디지털 콘텐츠의 변형을 탐지하기 위한 디지털 영상 제공 장치 및 디지털 영상 복원 장치
JP5942729B2 (ja) 2012-09-20 2016-06-29 カシオ計算機株式会社 図形描画装置およびプログラム
US9846536B2 (en) * 2012-12-17 2017-12-19 Microsoft Technology Licensing, Llc Composition of handwritten messages on mobile computing devices

Also Published As

Publication number Publication date
WO2015150911A2 (en) 2015-10-08
CN106663189A (zh) 2017-05-10
KR102383624B1 (ko) 2022-04-05
CN106663189B (zh) 2020-03-24
WO2015150911A3 (en) 2015-12-17
US9911052B2 (en) 2018-03-06
KR20170005378A (ko) 2017-01-12
US9524440B2 (en) 2016-12-20
US20150286886A1 (en) 2015-10-08
US20170061223A1 (en) 2017-03-02
JP2017514248A (ja) 2017-06-01
EP3127043A2 (en) 2017-02-08

Similar Documents

Publication Publication Date Title
JP6542870B2 (ja) 重畳された手書き文字認識技術システム及び重畳された手書き文字認識技術方法。
US10007859B2 (en) System and method for superimposed handwriting recognition technology
JP6777723B2 (ja) 複数のオブジェクトの入力を認識するためのシステムならびにそのための方法および製品
JP7105695B2 (ja) デジタルインク対話性のためのシステムおよび方法
JP2006260573A (ja) 単語または文字の境界ベースのスクラッチアウトジェスチャ認識
JP2019512765A (ja) 複数の入力管理のためのシステムおよび方法
US20210350122A1 (en) Stroke based control of handwriting input
JP7486131B2 (ja) フリーハンドライティングモードでの手書きテキスト入力の処理
EP3491580B1 (en) System and method for beautifying superimposed digital ink
EP3535652B1 (en) System and method for recognizing handwritten stroke input
JP6735775B2 (ja) 重畳手書き入力認識技術のためのシステム及び方法
WO2006090404A1 (en) System, method, and apparatus for accomodating variability in chunking the sub-word units of online handwriting
WO2024110354A1 (en) Setting font size in an unconstrained canvas

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180328

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190416

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190514

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190613

R150 Certificate of patent or registration of utility model

Ref document number: 6542870

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250