JP6735775B2 - 重畳手書き入力認識技術のためのシステム及び方法 - Google Patents
重畳手書き入力認識技術のためのシステム及び方法 Download PDFInfo
- Publication number
- JP6735775B2 JP6735775B2 JP2017559679A JP2017559679A JP6735775B2 JP 6735775 B2 JP6735775 B2 JP 6735775B2 JP 2017559679 A JP2017559679 A JP 2017559679A JP 2017559679 A JP2017559679 A JP 2017559679A JP 6735775 B2 JP6735775 B2 JP 6735775B2
- Authority
- JP
- Japan
- Prior art keywords
- input
- fragments
- recognition
- stroke
- character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 63
- 238000005516 engineering process Methods 0.000 title description 7
- 239000012634 fragment Substances 0.000 claims description 96
- 230000002123 temporal effect Effects 0.000 claims description 13
- 238000007781 pre-processing Methods 0.000 claims description 8
- 230000011218 segmentation Effects 0.000 claims description 7
- 238000004458 analytical method Methods 0.000 claims description 4
- 238000011156 evaluation Methods 0.000 claims description 3
- 238000009499 grossing Methods 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 description 10
- 238000013528 artificial neural network Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 9
- 238000004590 computer program Methods 0.000 description 7
- 238000005192 partition Methods 0.000 description 7
- 239000000470 constituent Substances 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000003111 delayed effect Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 2
- 244000046052 Phaseolus vulgaris Species 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 239000000872 buffer Substances 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000013467 fragmentation Methods 0.000 description 2
- 238000006062 fragmentation reaction Methods 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 238000012886 linear function Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000000638 solvent extraction Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 238000010897 surface acoustic wave method Methods 0.000 description 2
- 241000699670 Mus sp. Species 0.000 description 1
- NIXOWILDQLNWCW-UHFFFAOYSA-N acrylic acid group Chemical group C(C=C)(=O)O NIXOWILDQLNWCW-UHFFFAOYSA-N 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000013479 data entry Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012634 optical imaging Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 239000012466 permeate Substances 0.000 description 1
- 235000021251 pulses Nutrition 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0487—Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
- G06F3/0488—Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures
- G06F3/04883—Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures for inputting data by handwriting, e.g. gesture or text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/768—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using context analysis, e.g. recognition aided by known co-occurring patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/142—Image acquisition using hand-held instruments; Constructional details of the instruments
- G06V30/1423—Image acquisition using hand-held instruments; Constructional details of the instruments the instrument generating sequences of position coordinates corresponding to handwriting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/22—Character recognition characterised by the type of writing
- G06V30/226—Character recognition characterised by the type of writing of cursive writing
- G06V30/2268—Character recognition characterised by the type of writing of cursive writing using stroke segmentation
- G06V30/2272—Character recognition characterised by the type of writing of cursive writing using stroke segmentation with lexical matching
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/22—Character recognition characterised by the type of writing
- G06V30/226—Character recognition characterised by the type of writing of cursive writing
- G06V30/2268—Character recognition characterised by the type of writing of cursive writing using stroke segmentation
- G06V30/2276—Character recognition characterised by the type of writing of cursive writing using stroke segmentation with probabilistic networks, e.g. hidden Markov models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/26—Techniques for post-processing, e.g. correcting the recognition result
- G06V30/262—Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/32—Digital ink
- G06V30/36—Matching; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Human Computer Interaction (AREA)
- Probability & Statistics with Applications (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- Character Discrimination (AREA)
Description
本出願は、2015年5月15日に出願された欧州特許出願第15290129.4号、2016年5月13日に出願された国際特許出願PCT/2016/000799の優先権の利益を主張するものであり、その全体が、参照によって本明細書に組み込まれている。
デバイスが小さくなるにつれ、マルチボックス又はシングルボックスのような異なるシステム又は方法が発展した。マルチボックスシステム又は方法は、入力面を3つのボックスのような複数の領域に分割する。ユーザは、各ボックスの中に各文字を次々と入力する。文字分割が最小になるか、不要になるため、これらは有利である。それらはまた、分離文字認識技術で解析できるマルチストローク文字を許容する。
以下の詳細な記載において、好適な技術の徹底した理解を提供するために例示をもって様々な具体的な詳細が明らかにされる。しかし、本技術がそうした詳細なしに実施されうることは当業者にとって明らかであろう。他の例によれば、周知の方法、処理工程、構成要素、及び/又は、回路は相対的に高いレベルで記述され、詳細は省略され、本技術を不必要に不明瞭にする側面を回避する。
・分割グラフの対応するパスで遭遇する全ての文字候補のコスト。これらのコストは、分割グラフ内のこのパスに属する各ノードの確率又は認識スコアから評価されうる。1つの実施形態において、そのコストは、対数非線形関数(log non-linear function)を適用することによりニューラルネットワーク確率から評価される。
・言語モデルの対応するパスで遭遇する全ての単語のコスト。これらのコストは、言語エキスパート120からのN−gram確率から評価されうる。1つの実施形態において、そのコストは、対数非線形関数(log non-linear function)を適用することにより、言語エキスパート120からのN−gram確率から評価される。
Claims (10)
- コンピュータ読み取り可能なプログラムコードを有する非一時的なコンピュータ読み取り可能な記録媒体であって、前記コンピュータ読み取り可能なプログラムコードは、入力ストロークの、少なくとも一部が他と重なった複数の断片についての手書き入力認識を提供する方法を実施するためにコンピュータが実行するように適合され、前記方法は、
前記入力ストロークの少なくとも2つの連続する断片についての入力ストロークの相対位置を検出するステップと、
前記少なくとも2つの連続する断片についての前記入力ストロークの形状を検出するステップと、
前記検出した相対位置から、前記入力ストロークのセグメントの重なりを決定し、そして、前記検出した形状から、前記重なったセグメントがもっともらしく文字を形成するかを判断するステップと、
前記もっともらしいと判断した文字に基づいて前記断片を分類するステップと、
前記分類した断片を、前記分類した断片に基づく文字仮説の評価のための認識エンジンに提供するステップと、を含み、
前記認識エンジンの中で、前記方法は、
前記分類した断片のストロークに基づく分割グラフを生成するステップであって、前記分割グラフは、文字仮説に対応するノードからなる、ステップと、
パターン分類法に基づいて前記分割グラフの各ノードに認識スコアを割り当てるステップと、
前記認識スコア及び言語モデルに基づいて前記入力ストロークの言語学的意味を生成するステップと、
前記分割グラフ、前記認識スコア、及び前記言語モデルの同時分析に基づく出力を提供するステップと、
を含む、コンピュータ読み取り可能な記録媒体。 - 前記入力ストロークは前処理され、前記前処理は、少なくとも前記入力ストロークの正規化及び平滑化を含む、
請求項1に記載の非一時的なコンピュータ読み取り可能な記録媒体。 - 前記分類した断片のそれぞれは、1つ又は複数の入力断片の前記入力ストロークによって形成される完全な文字を含むように定義される
請求項1に記載の非一時的なコンピュータ読み取り可能な記録媒体。 - 重なりのある入力ストロークについての手書き入力認識を提供する方法であって、前記方法は、
前記入力ストロークの少なくとも2つの連続する断片についての入力ストロークの相対位置を検出するステップと、
前記少なくとも2つの連続する断片についての前記入力ストロークの形状を検出するステップと、
前記検出した相対位置から、前記入力ストロークのセグメントの重なりを決定し、そして、前記検出した形状から、前記重なったセグメントがもっともらしく文字を形成するかを判断するステップと、
前記もっともらしいと判断した文字に基づいて前記断片を分類するステップと、
前記分類した断片を、前記分類した断片に基づく文字仮説の評価のための認識エンジンに提供するステップと、を含み、
前記認識エンジンの中で、前記方法は、
前記分類した断片のストロークに基づく分割グラフを生成するステップであって、前記分割グラフは文字仮説に対応するノードからなる、ステップと、
パターン分類法に基づいて前記分割グラフの各ノードに認識スコアを割り当てるステップと、
前記認識スコア及び言語モデルに基づいて前記入力ストロークの言語学的意味を生成するステップと、
前記分割グラフ、前記認識スコア、及び前記言語モデルの同時分析に基づく出力を提供するステップと、
を含む、方法。 - 前記入力ストロークは前処理され、前記前処理は、少なくとも前記入力ストロークの正規化及び平滑化を含む、
請求項4に記載の方法。 - 前記分類した断片のそれぞれは、1つ又は複数の入力断片の前記入力ストロークによって形成される完全な文字を含むように定義される
請求項4に記載の方法。 - 前記少なくとも2つの連続する断片についての前記入力ストロークの前記検出した相対位置は、前記入力ストロークの空間的な及び時間的な情報から検出される
請求項1に記載の非一時的なコンピュータ読み取り可能な記録媒体。 - 前記分割グラフは、さらに、前記分類された断片に基づく前記文字仮説の間の空間仮説に対応するノードを含む、
請求項1に記載のコンピュータ読み取り可能な記録媒体。 - 前記少なくとも2つの連続する断片についての前記入力ストロークの前記検出した相対位置は、前記入力ストロークの空間的及び時間的な情報から検出される
請求項1に記載の非一時的なコンピュータ読み取り可能な記録媒体。 - 前記分割グラフは、さらに、前記分類した断片に基づく前記文字仮説の間の空間仮説に対応するノードを含む、
請求項1に記載の非一時的なコンピュータ読み取り可能な記録媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP15290129.4 | 2015-05-15 | ||
EP15290129 | 2015-05-15 | ||
PCT/EP2016/000799 WO2016184559A1 (en) | 2015-05-15 | 2016-05-13 | System and method for superimposed handwriting recognition technology |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018518755A JP2018518755A (ja) | 2018-07-12 |
JP6735775B2 true JP6735775B2 (ja) | 2020-08-05 |
Family
ID=53396392
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017559679A Active JP6735775B2 (ja) | 2015-05-15 | 2016-05-13 | 重畳手書き入力認識技術のためのシステム及び方法 |
Country Status (5)
Country | Link |
---|---|
EP (1) | EP3295292B1 (ja) |
JP (1) | JP6735775B2 (ja) |
KR (1) | KR102310385B1 (ja) |
CN (1) | CN107912062B (ja) |
WO (1) | WO2016184559A1 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10719701B2 (en) * | 2018-04-25 | 2020-07-21 | Accenture Global Solutions Limited | Optical character recognition of connected characters |
CN114495117A (zh) * | 2022-02-15 | 2022-05-13 | 甘肃政法大学 | 一种中文手写汉字的笔划提取方法 |
KR20240065997A (ko) * | 2022-11-07 | 2024-05-14 | 삼성전자주식회사 | 필기 입력을 인식하는 방법 및 장치 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100703698B1 (ko) * | 2005-02-16 | 2007-04-05 | 삼성전자주식회사 | 공간 필기 인식 장치 및 방법, 그리고 상기 방법을 기록한기록 매체 |
US8077975B2 (en) * | 2008-02-26 | 2011-12-13 | Microsoft Corporation | Handwriting symbol recognition accuracy using speech input |
CN103366151B (zh) * | 2012-03-30 | 2017-05-31 | 佳能株式会社 | 手写字符识别方法以及设备 |
-
2016
- 2016-05-13 CN CN201680028218.5A patent/CN107912062B/zh active Active
- 2016-05-13 JP JP2017559679A patent/JP6735775B2/ja active Active
- 2016-05-13 KR KR1020177036008A patent/KR102310385B1/ko active IP Right Grant
- 2016-05-13 WO PCT/EP2016/000799 patent/WO2016184559A1/en unknown
- 2016-05-13 EP EP16726481.1A patent/EP3295292B1/en active Active
Also Published As
Publication number | Publication date |
---|---|
WO2016184559A1 (en) | 2016-11-24 |
CN107912062A (zh) | 2018-04-13 |
EP3295292B1 (en) | 2020-09-02 |
KR102310385B1 (ko) | 2021-10-07 |
KR20180030966A (ko) | 2018-03-27 |
EP3295292A1 (en) | 2018-03-21 |
CN107912062B (zh) | 2021-02-23 |
JP2018518755A (ja) | 2018-07-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9911052B2 (en) | System and method for superimposed handwriting recognition technology | |
US10007859B2 (en) | System and method for superimposed handwriting recognition technology | |
JP6777723B2 (ja) | 複数のオブジェクトの入力を認識するためのシステムならびにそのための方法および製品 | |
KR101354663B1 (ko) | 수기 기호 인지 방법 및 장치 | |
KR20180115699A (ko) | 다중 입력 관리를 위한 시스템 및 방법 | |
EP3535652B1 (en) | System and method for recognizing handwritten stroke input | |
JP6735775B2 (ja) | 重畳手書き入力認識技術のためのシステム及び方法 | |
EP3491580B1 (en) | System and method for beautifying superimposed digital ink | |
WO2006090404A1 (en) | System, method, and apparatus for accomodating variability in chunking the sub-word units of online handwriting | |
WO2024110354A1 (en) | Setting font size in an unconstrained canvas |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180116 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190513 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200608 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200616 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200714 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6735775 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |