RU2007135946A - Распознавание на основе сегментации - Google Patents

Распознавание на основе сегментации Download PDF

Info

Publication number
RU2007135946A
RU2007135946A RU2007135946/09A RU2007135946A RU2007135946A RU 2007135946 A RU2007135946 A RU 2007135946A RU 2007135946/09 A RU2007135946/09 A RU 2007135946/09A RU 2007135946 A RU2007135946 A RU 2007135946A RU 2007135946 A RU2007135946 A RU 2007135946A
Authority
RU
Russia
Prior art keywords
points
characteristic
characteristic points
point
characteristic point
Prior art date
Application number
RU2007135946/09A
Other languages
English (en)
Inventor
Якоб СТЕРНБЮ (SE)
Якоб СТЕРНБЮ
Original Assignee
Зи Декума Аб (Se)
Зи Декума Аб
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Зи Декума Аб (Se), Зи Декума Аб filed Critical Зи Декума Аб (Se)
Publication of RU2007135946A publication Critical patent/RU2007135946A/ru

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/22Character recognition characterised by the type of writing
    • G06V30/226Character recognition characterised by the type of writing of cursive writing
    • G06V30/2268Character recognition characterised by the type of writing of cursive writing using stroke segmentation
    • G06V30/2272Character recognition characterised by the type of writing of cursive writing using stroke segmentation with lexical matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/32Digital ink
    • G06V30/333Preprocessing; Feature extraction
    • G06V30/347Sampling; Contour coding; Stroke extraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Abstract

1. Способ распознавания рукописного образа, содержащего одну или более кривых, представляющих множество символов, причем упомянутый способ содержит этапы, на которых ! обнаруживают рукописный образ как последовательность точек вдоль упомянутых одной или более кривых рукописного образа, ! идентифицируют потенциальные диакритические знаки в упомянутой последовательности точек рукописного образа, ! выбирают характеристические точки из упомянутой последовательности точек, при этом упомянутые характеристические точки выбираются для использования при сегментации рукописного образа и распознавании этих сегментов рукописного образа как символов, ! определяют признаки упомянутых одной или более кривых непосредственно в каждой или рядом с каждой характеристической точкой, ! назначают, по меньшей мере, один признак, ассоциированный с идентифицированными потенциальными диакритическими знаками, каждой характеристической точке из поднабора характеристических точек, и ! сравнивают рукописный образ с эталонами, причем каждый эталон представляет, по меньшей мере, один символ или часть символа, при этом упомянутое сравнение содержит этап, на котором ! пошагово анализируют характеристические точки одну за другой, причем характеристические точки представляют возможные точки сегментации, а последовательности характеристических точек от первой возможной точки сегментации до второй возможной точки сегментации представляют возможные символы, при этом упомянутый анализ выполняется посредством этапов, на которых ! сопоставляют признаки последовательностей характеристических точек, которые начинаются либо с пер�

Claims (24)

1. Способ распознавания рукописного образа, содержащего одну или более кривых, представляющих множество символов, причем упомянутый способ содержит этапы, на которых
обнаруживают рукописный образ как последовательность точек вдоль упомянутых одной или более кривых рукописного образа,
идентифицируют потенциальные диакритические знаки в упомянутой последовательности точек рукописного образа,
выбирают характеристические точки из упомянутой последовательности точек, при этом упомянутые характеристические точки выбираются для использования при сегментации рукописного образа и распознавании этих сегментов рукописного образа как символов,
определяют признаки упомянутых одной или более кривых непосредственно в каждой или рядом с каждой характеристической точкой,
назначают, по меньшей мере, один признак, ассоциированный с идентифицированными потенциальными диакритическими знаками, каждой характеристической точке из поднабора характеристических точек, и
сравнивают рукописный образ с эталонами, причем каждый эталон представляет, по меньшей мере, один символ или часть символа, при этом упомянутое сравнение содержит этап, на котором
пошагово анализируют характеристические точки одну за другой, причем характеристические точки представляют возможные точки сегментации, а последовательности характеристических точек от первой возможной точки сегментации до второй возможной точки сегментации представляют возможные символы, при этом упомянутый анализ выполняется посредством этапов, на которых
сопоставляют признаки последовательностей характеристических точек, которые начинаются либо с первой характеристической точки, либо с последней характеристической точки предыдущей последовательности характеристических точек с упомянутыми эталонами и вычисляют значение несходства, и
назначают совокупное значение несходства последней характеристической точке в подходящей последовательности характеристических точек, причем упомянутое совокупное значение несходства является суммой значения несходства, назначенного первой характеристической точке в этой последовательности, и вычисленного значения несходства,
посредством чего наименьшее совокупное значение несходства для всех последовательных характеристических точек назначается последней характеристической точке и соответствует последовательности подходящих эталонов, которая представляет множество символов в качестве возможного результата распознавания рукописного образа.
2. Способ по п.1, в котором упомянутое сравнение содержит этапы, на которых
формируют граф, имеющий узлы и дуги, соединяющие узлы, при этом каждый узел представляет характеристическую точку, соответствующую возможной точке сегментации между двумя символами в рукописном образе, а каждая дуга представляет путь по последовательности характеристических точек от одного узла к другому узлу, причем упомянутый путь соответствует возможному символу в рукописном образе,
назначают, по меньшей мере, одно значение несходства каждому пути посредством сопоставления признаков последовательности характеристических точек с упомянутыми эталонами, и
определяют, по меньшей мере, один путь через граф от первого узла к последнему узлу с наименьшим совокупным значением несходства, причем упомянутый путь соответствует последовательности подходящих эталонов, которая представляет множество символов в качестве возможного результата распознавания рукописного образа.
3. Способ по п.2, в котором определяют несколько возможных результатов распознавания, соответствующих путям через граф, имеющим совокупные значения несходства ниже порогового значения.
4. Способ по п.2 или 3, в котором упомянутый граф формируется посредством последовательного добавления характеристических точек в качестве узлов, и при этом упомянутое назначение, по меньшей мере, одного значения несходства выполняется в ходе формирования графа.
5. Способ по п.2 или 3, в котором назначение, по меньшей мере, одного значения несходства содержит этап, на котором назначают каждому пути наименьшее значение несходства, соответствующее эталону, который лучше всего подходит к признакам последовательности характеристических точек.
6. Способ по любому из пп.1-3, в котором этап назначения, по меньшей мере, одного признака, ассоциированного с обнаруженным диакритическим знаком, выполняется до этапа сравнения рукописного образа с эталонами.
7. Способ по любому из пп.1-3, в котором число выбираемых характеристических точек ограничено формой упомянутых одной или более кривых.
8. Способ по п.7, в котором число выбираемых характеристических точек ограничено точками, содержащими информацию об изменениях направления упомянутых одной или более кривых.
9. Способ по любому из пп.1-3, в котором упомянутый выбор характеристических точек содержит этап, на котором выбирают точки, которые являются точками локального экстремума упомянутой одной или более кривых в направлении, ортогональном основному направлению написания рукописного образа.
10. Способ по п.9, в котором характеристические точки классифицируются как характеристические точки N, характеристические точки S и характеристические точки M, где характеристическая точка N является характеристической точкой локального максимума в направлении, ортогональном основному направлению написания, характеристическая точка S является характеристической точкой локального минимума в направлении, ортогональном основному направлению написания, а характеристическая точка M является промежуточной характеристической точкой для характеристических точек N и S, причем способ дополнительно содержит этап, на котором выбирают характеристические точки упомянутого поднабора характеристических точек в качестве характеристических точек N и M.
11. Способ по любому из пп.1-3, в котором упомянутый выбор характеристических точек содержит этап, на котором выбирают точки, в которых абсолютное значение производной от упомянутых одной или более кривых превышает пороговое значение.
12. Способ по любому из пп.1-3, в котором упомянутый выбор характеристических точек содержит этап, на котором выбирают характеристическую точку, где отклонение упомянутых одной или более кривых от прямой линии между двумя соседними характеристическими точками превышает пороговое значение.
13. Способ по любому из пп.1-3, в котором определение признаков содержит этап, на котором определяют y-координату характеристической точки, причем упомянутая y-координата задает позицию в направлении, ортогональном основному направлению написания.
14. Способ по любому из пп.1-3, в котором определение признаков содержит этап, на котором определяют направление кривой к характеристической точке и направление кривой от характеристической точки.
15. Способ по любому из пп.1-3, в котором определение признаков содержит этап, на котором определяют смещение x-координаты от предыдущей характеристической точки, причем упомянутая x-координата задает позицию в направлении, параллельном основному направлению написания.
16. Способ по любому из пп.1-3, в котором определение признаков содержит этап, на котором определяют то, поднималось ли или прижималось перо в характеристической точке.
17. Способ по любому из пп.1-3, в котором значение несходства между характеристической точкой в рукописном образе и точкой эталона вычисляется как взвешенная сумма несходства между каждым признаком характеристической точки и точки эталона.
18. Способ по любому из пп.1-3, в котором рукописный образ сравнивается с эталонами, при этом множество эталонов представляют различные начертания одного и того же символа.
19. Способ по любому из пп.1-3, в котором возможный результат распознавания рукописного образа сравнивается со словарем.
20. Способ по любому из пп.1-3, в котором конкретные последовательности подходящих эталонов запрещены.
21. Способ по любому из пп.1-3, в котором совокупному значению несходства для конкретных последовательностей подходящих эталонов присваивается вес.
22. Способ по любому из пп.1-3, в котором рукописный образ написан скорописью.
23. Устройство распознавания рукописного образа, содержащего одну или более кривых, представляющих множество символов, причем упомянутое устройство содержит средство для выполнения этапов любого из предшествующих пп.
24. Компьютерный программный продукт, непосредственно загружаемый во внутреннее запоминающее устройство устройства обработки данных, содержащий части программного кода для выполнения способа по любому из пп.1-22.
RU2007135946/09A 2005-02-28 2006-02-24 Распознавание на основе сегментации RU2007135946A (ru)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
SE0500466 2005-02-28
SE0500466-8 2005-02-28

Publications (1)

Publication Number Publication Date
RU2007135946A true RU2007135946A (ru) 2009-04-10

Family

ID=36927694

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2007135946/09A RU2007135946A (ru) 2005-02-28 2006-02-24 Распознавание на основе сегментации

Country Status (8)

Country Link
US (1) US7596272B2 (ru)
EP (1) EP1854047A1 (ru)
JP (1) JP4787275B2 (ru)
KR (1) KR101145986B1 (ru)
CN (1) CN101128837A (ru)
RU (1) RU2007135946A (ru)
TW (1) TWI319861B (ru)
WO (1) WO2006091155A1 (ru)

Families Citing this family (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7679534B2 (en) * 1998-12-04 2010-03-16 Tegic Communications, Inc. Contextual prediction of user words and user actions
US7712053B2 (en) 1998-12-04 2010-05-04 Tegic Communications, Inc. Explicit character filtering of ambiguous text entry
US7720682B2 (en) 1998-12-04 2010-05-18 Tegic Communications, Inc. Method and apparatus utilizing voice input to resolve ambiguous manually entered text input
US8938688B2 (en) 1998-12-04 2015-01-20 Nuance Communications, Inc. Contextual prediction of user words and user actions
US7881936B2 (en) 1998-12-04 2011-02-01 Tegic Communications, Inc. Multimodal disambiguation of speech recognition
US7030863B2 (en) 2000-05-26 2006-04-18 America Online, Incorporated Virtual keyboard system with automatic correction
US7610194B2 (en) * 2002-07-18 2009-10-27 Tegic Communications, Inc. Dynamic database reordering system
US7286115B2 (en) 2000-05-26 2007-10-23 Tegic Communications, Inc. Directional input system with automatic correction
US7750891B2 (en) 2003-04-09 2010-07-06 Tegic Communications, Inc. Selective input system based on tracking of motion parameters of an input device
AU5299700A (en) 1999-05-27 2000-12-18 America Online, Inc. Keyboard system with automatic correction
US7821503B2 (en) 2003-04-09 2010-10-26 Tegic Communications, Inc. Touch screen and graphical user interface
US8583440B2 (en) 2002-06-20 2013-11-12 Tegic Communications, Inc. Apparatus and method for providing visual indication of character ambiguity during text entry
US7636083B2 (en) * 2004-02-20 2009-12-22 Tegic Communications, Inc. Method and apparatus for text input in various languages
US8095364B2 (en) 2004-06-02 2012-01-10 Tegic Communications, Inc. Multimodal disambiguation of speech recognition
JP5071914B2 (ja) * 2005-02-28 2012-11-14 ザイ デクマ アクチボラゲット 認識グラフ
US8504606B2 (en) * 2005-11-09 2013-08-06 Tegic Communications Learner for resource constrained devices
US7587378B2 (en) 2005-12-09 2009-09-08 Tegic Communications, Inc. Embedded rule engine for rendering text and other applications
US7580925B2 (en) * 2006-04-19 2009-08-25 Tegic Communications, Inc. Efficient storage and search of word lists and other text
US20080030502A1 (en) * 2006-08-04 2008-02-07 Monotype Imaging, Inc. Diacritics positioning system for digital typography
US7907783B2 (en) * 2007-01-24 2011-03-15 Samsung Electronics Co., Ltd. Apparatus and method of matching symbols in a text image coding and decoding system
US8225203B2 (en) 2007-02-01 2012-07-17 Nuance Communications, Inc. Spell-check for a keyboard system with automatic correction
US8201087B2 (en) 2007-02-01 2012-06-12 Tegic Communications, Inc. Spell-check for a keyboard system with automatic correction
US8103499B2 (en) * 2007-03-22 2012-01-24 Tegic Communications, Inc. Disambiguation of telephone style key presses to yield Chinese text using segmentation and selective shifting
US8299943B2 (en) 2007-05-22 2012-10-30 Tegic Communications, Inc. Multiple predictions in a reduced keyboard disambiguating system
TWI385584B (zh) * 2008-11-05 2013-02-11 Avermedia Information Inc 自動排列手寫字串之裝置及方法
CN102292700A (zh) * 2009-01-24 2011-12-21 惠普开发有限公司 用于增强安全印刷的系统和方法
CN101930545A (zh) * 2009-06-24 2010-12-29 夏普株式会社 手写识别方法和设备
US20110254765A1 (en) * 2010-04-18 2011-10-20 Primesense Ltd. Remote text input using handwriting
US20120281919A1 (en) * 2011-05-06 2012-11-08 King Abdul Aziz City For Science And Technology Method and system for text segmentation
US8965127B2 (en) * 2013-03-14 2015-02-24 Konica Minolta Laboratory U.S.A., Inc. Method for segmenting text words in document images
RU2625020C1 (ru) * 2013-06-18 2017-07-11 Общество с ограниченной ответственностью "Аби Девелопмент" Устройства и способы, которые порождают параметризованные символы для преобразования изображений документов в электронные документы
RU2631168C2 (ru) * 2013-06-18 2017-09-19 Общество с ограниченной ответственностью "Аби Девелопмент" Способы и устройства, которые преобразуют изображения документов в электронные документы с использованием trie-структуры данных, содержащей непараметризованные символы для определения слов и морфем на изображении документа
US9384409B1 (en) 2015-01-29 2016-07-05 Konica Minolta Laboratory U.S.A., Inc. Word segmentation for document image using recursive segmentation
US10332628B2 (en) * 2016-09-30 2019-06-25 Sap Se Method and system for control of an electromechanical medical device
US10438098B2 (en) * 2017-05-19 2019-10-08 Hand Held Products, Inc. High-speed OCR decode using depleted centerlines
TWI676919B (zh) * 2018-08-02 2019-11-11 義守大學 一種電腦化寫字評估與訓練方法

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59161779A (ja) * 1983-03-04 1984-09-12 Oki Electric Ind Co Ltd オンライン文字認識ストロ−ク抽出方法
US4611346A (en) 1983-09-29 1986-09-09 International Business Machines Corporation Method and apparatus for character recognition accommodating diacritical marks
JPH05189617A (ja) * 1991-04-15 1993-07-30 Microsoft Corp 手書き文字認識に於けるアークのセグメント化の方法と装置
US5392363A (en) * 1992-11-13 1995-02-21 International Business Machines Corporation On-line connected handwritten word recognition by a probabilistic method
JP3675511B2 (ja) * 1994-09-29 2005-07-27 新日鉄ソリューションズ株式会社 手書き文字認識方法及び装置
IL110137A (en) * 1994-06-27 2000-06-29 Advanced Recognition Tech Handwriting recognition system
EP0691623B1 (en) 1994-07-04 2001-10-04 Hewlett-Packard Company, A Delaware Corporation Scribble matching
US6202060B1 (en) * 1996-10-29 2001-03-13 Bao Q. Tran Data management system
JPH10162104A (ja) * 1996-11-27 1998-06-19 Hitachi Ltd 文字認識装置
US6453070B1 (en) * 1998-03-17 2002-09-17 Motorola, Inc. Diacritical processing for unconstrained, on-line handwriting recognition using a forward search
JP2000353215A (ja) * 1999-06-11 2000-12-19 Nec Corp 文字認識装置および文字認識プログラムを記録した記録媒体
US6920247B1 (en) * 2000-06-27 2005-07-19 Cardiff Software, Inc. Method for optical recognition of a multi-language set of letters with diacritics
WO2002037933A2 (en) * 2000-11-08 2002-05-16 New York University System, process and software arrangement for recognizing handwritten characters

Also Published As

Publication number Publication date
KR20070110398A (ko) 2007-11-16
CN101128837A (zh) 2008-02-20
EP1854047A1 (en) 2007-11-14
KR101145986B1 (ko) 2012-05-21
TWI319861B (en) 2010-01-21
JP4787275B2 (ja) 2011-10-05
WO2006091155A1 (en) 2006-08-31
JP2008532175A (ja) 2008-08-14
US7596272B2 (en) 2009-09-29
TW200701096A (en) 2007-01-01
US20060193519A1 (en) 2006-08-31

Similar Documents

Publication Publication Date Title
RU2007135946A (ru) Распознавание на основе сегментации
JP5071914B2 (ja) 認識グラフ
US7860313B2 (en) Methods and apparatuses for extending dynamic handwriting recognition to recognize static handwritten and machine generated text
ITRM20130022A1 (it) Procedimento e apparato di riconoscimento di scrittura a mano
SE519014C2 (sv) Metod och anordning för igenkänning av ett handskrivet mönster
JP4817297B2 (ja) 文字検索装置
RU2259592C2 (ru) Способ распознавания графических объектов с использованием принципа целостности
JP4958236B2 (ja) 手書きパターンを認識するための方法及び装置
US9092688B2 (en) Assisted OCR
CN107683452B (zh) 输入装置、物体检测装置及其方法
KR101687941B1 (ko) 온라인 필기 데이터 라인 분할 방법 및 이를 이용하는 장치
Tang et al. Reconstructing the correct writing sequence from a set of Chinese character strokes
JP5630098B2 (ja) 情報処理装置およびプログラム
JP2014092817A (ja) 文字認識装置及びプログラム
JP2671984B2 (ja) 情報認識装置
CN115205865A (zh) 用于识别图像的方法、装置及电子设备
KR940001048B1 (ko) 온라인 필기체문자인식방법
Dhamad Arabic Hand Written Segmentation and Recognition
JPS63213094A (ja) オンライン文字確認装置
JPH1049630A (ja) オンライン手書き文字認識方法および装置
JPS5822775B2 (ja) ストロ−ク抽出方法

Legal Events

Date Code Title Description
FA92 Acknowledgement of application withdrawn (lack of supplementary materials submitted)

Effective date: 20100511