RU2007135946A - Распознавание на основе сегментации - Google Patents
Распознавание на основе сегментации Download PDFInfo
- Publication number
- RU2007135946A RU2007135946A RU2007135946/09A RU2007135946A RU2007135946A RU 2007135946 A RU2007135946 A RU 2007135946A RU 2007135946/09 A RU2007135946/09 A RU 2007135946/09A RU 2007135946 A RU2007135946 A RU 2007135946A RU 2007135946 A RU2007135946 A RU 2007135946A
- Authority
- RU
- Russia
- Prior art keywords
- points
- characteristic
- characteristic points
- point
- characteristic point
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/22—Character recognition characterised by the type of writing
- G06V30/226—Character recognition characterised by the type of writing of cursive writing
- G06V30/2268—Character recognition characterised by the type of writing of cursive writing using stroke segmentation
- G06V30/2272—Character recognition characterised by the type of writing of cursive writing using stroke segmentation with lexical matching
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/32—Digital ink
- G06V30/333—Preprocessing; Feature extraction
- G06V30/347—Sampling; Contour coding; Stroke extraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Character Discrimination (AREA)
- Image Analysis (AREA)
Abstract
1. Способ распознавания рукописного образа, содержащего одну или более кривых, представляющих множество символов, причем упомянутый способ содержит этапы, на которых ! обнаруживают рукописный образ как последовательность точек вдоль упомянутых одной или более кривых рукописного образа, ! идентифицируют потенциальные диакритические знаки в упомянутой последовательности точек рукописного образа, ! выбирают характеристические точки из упомянутой последовательности точек, при этом упомянутые характеристические точки выбираются для использования при сегментации рукописного образа и распознавании этих сегментов рукописного образа как символов, ! определяют признаки упомянутых одной или более кривых непосредственно в каждой или рядом с каждой характеристической точкой, ! назначают, по меньшей мере, один признак, ассоциированный с идентифицированными потенциальными диакритическими знаками, каждой характеристической точке из поднабора характеристических точек, и ! сравнивают рукописный образ с эталонами, причем каждый эталон представляет, по меньшей мере, один символ или часть символа, при этом упомянутое сравнение содержит этап, на котором ! пошагово анализируют характеристические точки одну за другой, причем характеристические точки представляют возможные точки сегментации, а последовательности характеристических точек от первой возможной точки сегментации до второй возможной точки сегментации представляют возможные символы, при этом упомянутый анализ выполняется посредством этапов, на которых ! сопоставляют признаки последовательностей характеристических точек, которые начинаются либо с пер�
Claims (24)
1. Способ распознавания рукописного образа, содержащего одну или более кривых, представляющих множество символов, причем упомянутый способ содержит этапы, на которых
обнаруживают рукописный образ как последовательность точек вдоль упомянутых одной или более кривых рукописного образа,
идентифицируют потенциальные диакритические знаки в упомянутой последовательности точек рукописного образа,
выбирают характеристические точки из упомянутой последовательности точек, при этом упомянутые характеристические точки выбираются для использования при сегментации рукописного образа и распознавании этих сегментов рукописного образа как символов,
определяют признаки упомянутых одной или более кривых непосредственно в каждой или рядом с каждой характеристической точкой,
назначают, по меньшей мере, один признак, ассоциированный с идентифицированными потенциальными диакритическими знаками, каждой характеристической точке из поднабора характеристических точек, и
сравнивают рукописный образ с эталонами, причем каждый эталон представляет, по меньшей мере, один символ или часть символа, при этом упомянутое сравнение содержит этап, на котором
пошагово анализируют характеристические точки одну за другой, причем характеристические точки представляют возможные точки сегментации, а последовательности характеристических точек от первой возможной точки сегментации до второй возможной точки сегментации представляют возможные символы, при этом упомянутый анализ выполняется посредством этапов, на которых
сопоставляют признаки последовательностей характеристических точек, которые начинаются либо с первой характеристической точки, либо с последней характеристической точки предыдущей последовательности характеристических точек с упомянутыми эталонами и вычисляют значение несходства, и
назначают совокупное значение несходства последней характеристической точке в подходящей последовательности характеристических точек, причем упомянутое совокупное значение несходства является суммой значения несходства, назначенного первой характеристической точке в этой последовательности, и вычисленного значения несходства,
посредством чего наименьшее совокупное значение несходства для всех последовательных характеристических точек назначается последней характеристической точке и соответствует последовательности подходящих эталонов, которая представляет множество символов в качестве возможного результата распознавания рукописного образа.
2. Способ по п.1, в котором упомянутое сравнение содержит этапы, на которых
формируют граф, имеющий узлы и дуги, соединяющие узлы, при этом каждый узел представляет характеристическую точку, соответствующую возможной точке сегментации между двумя символами в рукописном образе, а каждая дуга представляет путь по последовательности характеристических точек от одного узла к другому узлу, причем упомянутый путь соответствует возможному символу в рукописном образе,
назначают, по меньшей мере, одно значение несходства каждому пути посредством сопоставления признаков последовательности характеристических точек с упомянутыми эталонами, и
определяют, по меньшей мере, один путь через граф от первого узла к последнему узлу с наименьшим совокупным значением несходства, причем упомянутый путь соответствует последовательности подходящих эталонов, которая представляет множество символов в качестве возможного результата распознавания рукописного образа.
3. Способ по п.2, в котором определяют несколько возможных результатов распознавания, соответствующих путям через граф, имеющим совокупные значения несходства ниже порогового значения.
4. Способ по п.2 или 3, в котором упомянутый граф формируется посредством последовательного добавления характеристических точек в качестве узлов, и при этом упомянутое назначение, по меньшей мере, одного значения несходства выполняется в ходе формирования графа.
5. Способ по п.2 или 3, в котором назначение, по меньшей мере, одного значения несходства содержит этап, на котором назначают каждому пути наименьшее значение несходства, соответствующее эталону, который лучше всего подходит к признакам последовательности характеристических точек.
6. Способ по любому из пп.1-3, в котором этап назначения, по меньшей мере, одного признака, ассоциированного с обнаруженным диакритическим знаком, выполняется до этапа сравнения рукописного образа с эталонами.
7. Способ по любому из пп.1-3, в котором число выбираемых характеристических точек ограничено формой упомянутых одной или более кривых.
8. Способ по п.7, в котором число выбираемых характеристических точек ограничено точками, содержащими информацию об изменениях направления упомянутых одной или более кривых.
9. Способ по любому из пп.1-3, в котором упомянутый выбор характеристических точек содержит этап, на котором выбирают точки, которые являются точками локального экстремума упомянутой одной или более кривых в направлении, ортогональном основному направлению написания рукописного образа.
10. Способ по п.9, в котором характеристические точки классифицируются как характеристические точки N, характеристические точки S и характеристические точки M, где характеристическая точка N является характеристической точкой локального максимума в направлении, ортогональном основному направлению написания, характеристическая точка S является характеристической точкой локального минимума в направлении, ортогональном основному направлению написания, а характеристическая точка M является промежуточной характеристической точкой для характеристических точек N и S, причем способ дополнительно содержит этап, на котором выбирают характеристические точки упомянутого поднабора характеристических точек в качестве характеристических точек N и M.
11. Способ по любому из пп.1-3, в котором упомянутый выбор характеристических точек содержит этап, на котором выбирают точки, в которых абсолютное значение производной от упомянутых одной или более кривых превышает пороговое значение.
12. Способ по любому из пп.1-3, в котором упомянутый выбор характеристических точек содержит этап, на котором выбирают характеристическую точку, где отклонение упомянутых одной или более кривых от прямой линии между двумя соседними характеристическими точками превышает пороговое значение.
13. Способ по любому из пп.1-3, в котором определение признаков содержит этап, на котором определяют y-координату характеристической точки, причем упомянутая y-координата задает позицию в направлении, ортогональном основному направлению написания.
14. Способ по любому из пп.1-3, в котором определение признаков содержит этап, на котором определяют направление кривой к характеристической точке и направление кривой от характеристической точки.
15. Способ по любому из пп.1-3, в котором определение признаков содержит этап, на котором определяют смещение x-координаты от предыдущей характеристической точки, причем упомянутая x-координата задает позицию в направлении, параллельном основному направлению написания.
16. Способ по любому из пп.1-3, в котором определение признаков содержит этап, на котором определяют то, поднималось ли или прижималось перо в характеристической точке.
17. Способ по любому из пп.1-3, в котором значение несходства между характеристической точкой в рукописном образе и точкой эталона вычисляется как взвешенная сумма несходства между каждым признаком характеристической точки и точки эталона.
18. Способ по любому из пп.1-3, в котором рукописный образ сравнивается с эталонами, при этом множество эталонов представляют различные начертания одного и того же символа.
19. Способ по любому из пп.1-3, в котором возможный результат распознавания рукописного образа сравнивается со словарем.
20. Способ по любому из пп.1-3, в котором конкретные последовательности подходящих эталонов запрещены.
21. Способ по любому из пп.1-3, в котором совокупному значению несходства для конкретных последовательностей подходящих эталонов присваивается вес.
22. Способ по любому из пп.1-3, в котором рукописный образ написан скорописью.
23. Устройство распознавания рукописного образа, содержащего одну или более кривых, представляющих множество символов, причем упомянутое устройство содержит средство для выполнения этапов любого из предшествующих пп.
24. Компьютерный программный продукт, непосредственно загружаемый во внутреннее запоминающее устройство устройства обработки данных, содержащий части программного кода для выполнения способа по любому из пп.1-22.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
SE0500466 | 2005-02-28 | ||
SE0500466-8 | 2005-02-28 |
Publications (1)
Publication Number | Publication Date |
---|---|
RU2007135946A true RU2007135946A (ru) | 2009-04-10 |
Family
ID=36927694
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2007135946/09A RU2007135946A (ru) | 2005-02-28 | 2006-02-24 | Распознавание на основе сегментации |
Country Status (8)
Country | Link |
---|---|
US (1) | US7596272B2 (ru) |
EP (1) | EP1854047A1 (ru) |
JP (1) | JP4787275B2 (ru) |
KR (1) | KR101145986B1 (ru) |
CN (1) | CN101128837A (ru) |
RU (1) | RU2007135946A (ru) |
TW (1) | TWI319861B (ru) |
WO (1) | WO2006091155A1 (ru) |
Families Citing this family (36)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7679534B2 (en) * | 1998-12-04 | 2010-03-16 | Tegic Communications, Inc. | Contextual prediction of user words and user actions |
US7712053B2 (en) | 1998-12-04 | 2010-05-04 | Tegic Communications, Inc. | Explicit character filtering of ambiguous text entry |
US7720682B2 (en) | 1998-12-04 | 2010-05-18 | Tegic Communications, Inc. | Method and apparatus utilizing voice input to resolve ambiguous manually entered text input |
US8938688B2 (en) | 1998-12-04 | 2015-01-20 | Nuance Communications, Inc. | Contextual prediction of user words and user actions |
US7881936B2 (en) | 1998-12-04 | 2011-02-01 | Tegic Communications, Inc. | Multimodal disambiguation of speech recognition |
US7030863B2 (en) | 2000-05-26 | 2006-04-18 | America Online, Incorporated | Virtual keyboard system with automatic correction |
US7610194B2 (en) * | 2002-07-18 | 2009-10-27 | Tegic Communications, Inc. | Dynamic database reordering system |
US7286115B2 (en) | 2000-05-26 | 2007-10-23 | Tegic Communications, Inc. | Directional input system with automatic correction |
US7750891B2 (en) | 2003-04-09 | 2010-07-06 | Tegic Communications, Inc. | Selective input system based on tracking of motion parameters of an input device |
AU5299700A (en) | 1999-05-27 | 2000-12-18 | America Online, Inc. | Keyboard system with automatic correction |
US7821503B2 (en) | 2003-04-09 | 2010-10-26 | Tegic Communications, Inc. | Touch screen and graphical user interface |
US8583440B2 (en) | 2002-06-20 | 2013-11-12 | Tegic Communications, Inc. | Apparatus and method for providing visual indication of character ambiguity during text entry |
US7636083B2 (en) * | 2004-02-20 | 2009-12-22 | Tegic Communications, Inc. | Method and apparatus for text input in various languages |
US8095364B2 (en) | 2004-06-02 | 2012-01-10 | Tegic Communications, Inc. | Multimodal disambiguation of speech recognition |
JP5071914B2 (ja) * | 2005-02-28 | 2012-11-14 | ザイ デクマ アクチボラゲット | 認識グラフ |
US8504606B2 (en) * | 2005-11-09 | 2013-08-06 | Tegic Communications | Learner for resource constrained devices |
US7587378B2 (en) | 2005-12-09 | 2009-09-08 | Tegic Communications, Inc. | Embedded rule engine for rendering text and other applications |
US7580925B2 (en) * | 2006-04-19 | 2009-08-25 | Tegic Communications, Inc. | Efficient storage and search of word lists and other text |
US20080030502A1 (en) * | 2006-08-04 | 2008-02-07 | Monotype Imaging, Inc. | Diacritics positioning system for digital typography |
US7907783B2 (en) * | 2007-01-24 | 2011-03-15 | Samsung Electronics Co., Ltd. | Apparatus and method of matching symbols in a text image coding and decoding system |
US8225203B2 (en) | 2007-02-01 | 2012-07-17 | Nuance Communications, Inc. | Spell-check for a keyboard system with automatic correction |
US8201087B2 (en) | 2007-02-01 | 2012-06-12 | Tegic Communications, Inc. | Spell-check for a keyboard system with automatic correction |
US8103499B2 (en) * | 2007-03-22 | 2012-01-24 | Tegic Communications, Inc. | Disambiguation of telephone style key presses to yield Chinese text using segmentation and selective shifting |
US8299943B2 (en) | 2007-05-22 | 2012-10-30 | Tegic Communications, Inc. | Multiple predictions in a reduced keyboard disambiguating system |
TWI385584B (zh) * | 2008-11-05 | 2013-02-11 | Avermedia Information Inc | 自動排列手寫字串之裝置及方法 |
CN102292700A (zh) * | 2009-01-24 | 2011-12-21 | 惠普开发有限公司 | 用于增强安全印刷的系统和方法 |
CN101930545A (zh) * | 2009-06-24 | 2010-12-29 | 夏普株式会社 | 手写识别方法和设备 |
US20110254765A1 (en) * | 2010-04-18 | 2011-10-20 | Primesense Ltd. | Remote text input using handwriting |
US20120281919A1 (en) * | 2011-05-06 | 2012-11-08 | King Abdul Aziz City For Science And Technology | Method and system for text segmentation |
US8965127B2 (en) * | 2013-03-14 | 2015-02-24 | Konica Minolta Laboratory U.S.A., Inc. | Method for segmenting text words in document images |
RU2625020C1 (ru) * | 2013-06-18 | 2017-07-11 | Общество с ограниченной ответственностью "Аби Девелопмент" | Устройства и способы, которые порождают параметризованные символы для преобразования изображений документов в электронные документы |
RU2631168C2 (ru) * | 2013-06-18 | 2017-09-19 | Общество с ограниченной ответственностью "Аби Девелопмент" | Способы и устройства, которые преобразуют изображения документов в электронные документы с использованием trie-структуры данных, содержащей непараметризованные символы для определения слов и морфем на изображении документа |
US9384409B1 (en) | 2015-01-29 | 2016-07-05 | Konica Minolta Laboratory U.S.A., Inc. | Word segmentation for document image using recursive segmentation |
US10332628B2 (en) * | 2016-09-30 | 2019-06-25 | Sap Se | Method and system for control of an electromechanical medical device |
US10438098B2 (en) * | 2017-05-19 | 2019-10-08 | Hand Held Products, Inc. | High-speed OCR decode using depleted centerlines |
TWI676919B (zh) * | 2018-08-02 | 2019-11-11 | 義守大學 | 一種電腦化寫字評估與訓練方法 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS59161779A (ja) * | 1983-03-04 | 1984-09-12 | Oki Electric Ind Co Ltd | オンライン文字認識ストロ−ク抽出方法 |
US4611346A (en) | 1983-09-29 | 1986-09-09 | International Business Machines Corporation | Method and apparatus for character recognition accommodating diacritical marks |
JPH05189617A (ja) * | 1991-04-15 | 1993-07-30 | Microsoft Corp | 手書き文字認識に於けるアークのセグメント化の方法と装置 |
US5392363A (en) * | 1992-11-13 | 1995-02-21 | International Business Machines Corporation | On-line connected handwritten word recognition by a probabilistic method |
JP3675511B2 (ja) * | 1994-09-29 | 2005-07-27 | 新日鉄ソリューションズ株式会社 | 手書き文字認識方法及び装置 |
IL110137A (en) * | 1994-06-27 | 2000-06-29 | Advanced Recognition Tech | Handwriting recognition system |
EP0691623B1 (en) | 1994-07-04 | 2001-10-04 | Hewlett-Packard Company, A Delaware Corporation | Scribble matching |
US6202060B1 (en) * | 1996-10-29 | 2001-03-13 | Bao Q. Tran | Data management system |
JPH10162104A (ja) * | 1996-11-27 | 1998-06-19 | Hitachi Ltd | 文字認識装置 |
US6453070B1 (en) * | 1998-03-17 | 2002-09-17 | Motorola, Inc. | Diacritical processing for unconstrained, on-line handwriting recognition using a forward search |
JP2000353215A (ja) * | 1999-06-11 | 2000-12-19 | Nec Corp | 文字認識装置および文字認識プログラムを記録した記録媒体 |
US6920247B1 (en) * | 2000-06-27 | 2005-07-19 | Cardiff Software, Inc. | Method for optical recognition of a multi-language set of letters with diacritics |
WO2002037933A2 (en) * | 2000-11-08 | 2002-05-16 | New York University | System, process and software arrangement for recognizing handwritten characters |
-
2006
- 2006-02-24 CN CNA200680006317XA patent/CN101128837A/zh active Pending
- 2006-02-24 JP JP2007557965A patent/JP4787275B2/ja not_active Expired - Fee Related
- 2006-02-24 EP EP06716930A patent/EP1854047A1/en not_active Ceased
- 2006-02-24 WO PCT/SE2006/000240 patent/WO2006091155A1/en active Application Filing
- 2006-02-24 RU RU2007135946/09A patent/RU2007135946A/ru not_active Application Discontinuation
- 2006-02-24 KR KR1020077022354A patent/KR101145986B1/ko active IP Right Grant
- 2006-02-27 TW TW095106602A patent/TWI319861B/zh not_active IP Right Cessation
- 2006-02-28 US US11/364,742 patent/US7596272B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
KR20070110398A (ko) | 2007-11-16 |
CN101128837A (zh) | 2008-02-20 |
EP1854047A1 (en) | 2007-11-14 |
KR101145986B1 (ko) | 2012-05-21 |
TWI319861B (en) | 2010-01-21 |
JP4787275B2 (ja) | 2011-10-05 |
WO2006091155A1 (en) | 2006-08-31 |
JP2008532175A (ja) | 2008-08-14 |
US7596272B2 (en) | 2009-09-29 |
TW200701096A (en) | 2007-01-01 |
US20060193519A1 (en) | 2006-08-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2007135946A (ru) | Распознавание на основе сегментации | |
JP5071914B2 (ja) | 認識グラフ | |
US7860313B2 (en) | Methods and apparatuses for extending dynamic handwriting recognition to recognize static handwritten and machine generated text | |
ITRM20130022A1 (it) | Procedimento e apparato di riconoscimento di scrittura a mano | |
SE519014C2 (sv) | Metod och anordning för igenkänning av ett handskrivet mönster | |
JP4817297B2 (ja) | 文字検索装置 | |
RU2259592C2 (ru) | Способ распознавания графических объектов с использованием принципа целостности | |
JP4958236B2 (ja) | 手書きパターンを認識するための方法及び装置 | |
US9092688B2 (en) | Assisted OCR | |
CN107683452B (zh) | 输入装置、物体检测装置及其方法 | |
KR101687941B1 (ko) | 온라인 필기 데이터 라인 분할 방법 및 이를 이용하는 장치 | |
Tang et al. | Reconstructing the correct writing sequence from a set of Chinese character strokes | |
JP5630098B2 (ja) | 情報処理装置およびプログラム | |
JP2014092817A (ja) | 文字認識装置及びプログラム | |
JP2671984B2 (ja) | 情報認識装置 | |
CN115205865A (zh) | 用于识别图像的方法、装置及电子设备 | |
KR940001048B1 (ko) | 온라인 필기체문자인식방법 | |
Dhamad | Arabic Hand Written Segmentation and Recognition | |
JPS63213094A (ja) | オンライン文字確認装置 | |
JPH1049630A (ja) | オンライン手書き文字認識方法および装置 | |
JPS5822775B2 (ja) | ストロ−ク抽出方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FA92 | Acknowledgement of application withdrawn (lack of supplementary materials submitted) |
Effective date: 20100511 |