RU2010122947A - Способ анализа изображения, в частности, для мобильного устройства - Google Patents

Способ анализа изображения, в частности, для мобильного устройства Download PDF

Info

Publication number
RU2010122947A
RU2010122947A RU2010122947/08A RU2010122947A RU2010122947A RU 2010122947 A RU2010122947 A RU 2010122947A RU 2010122947/08 A RU2010122947/08 A RU 2010122947/08A RU 2010122947 A RU2010122947 A RU 2010122947A RU 2010122947 A RU2010122947 A RU 2010122947A
Authority
RU
Russia
Prior art keywords
pixel
pixels
groups
lists
list
Prior art date
Application number
RU2010122947/08A
Other languages
English (en)
Other versions
RU2454718C2 (ru
Inventor
Герд МОСАКОВСКИ (DE)
Герд МОСАКОВСКИ
Original Assignee
Т-Мобиле Интернациональ Аг (De)
Т-Мобиле Интернациональ Аг
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Т-Мобиле Интернациональ Аг (De), Т-Мобиле Интернациональ Аг filed Critical Т-Мобиле Интернациональ Аг (De)
Publication of RU2010122947A publication Critical patent/RU2010122947A/ru
Application granted granted Critical
Publication of RU2454718C2 publication Critical patent/RU2454718C2/ru

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/1801Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections
    • G06V30/18076Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections by analysing connectivity, e.g. edge linking, connected component analysis or slices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)
  • Character Input (AREA)

Abstract

1. Способ оптического распознавания символов (OCR), включающий этапы, на которых: ! a) распознают штрихи посредством формирования списков с ориентацией для групп пикселей, причем в каждом списке представлены отдельные штрихи; ! b) копируют буквы на базе сгенерированных списков; ! c) сравнивают последовательности перемещений при копировании буквы с нормированными эталонными буквами, сохраненными в дереве решений. ! 2. Способ анализа графических данных, состоящих из массива отдельных пикселей, причем каждый пиксель имеет изменяющееся во времени значение пикселя, несущее информацию о цвете или яркости пикселя, включающий этапы, на которых: ! a) получают значение приоритета для каждого пикселя массива посредством задания используемого пикселя в качестве базового пикселя и расчета разности значений пикселей на основании текущего значения базового пикселя по отношению к текущим значениям предварительно заданной группы соседних пикселей; ! b) объединяют в одну группу пиксели, использованные для расчета значения приоритета пикселей; ! c) сортируют группы пикселей на основании значения приоритета соответствующего базового пикселя и сохраняют в массиве приоритетов; ! d) сохраняют и/или передают группы пикселей в соответствии с их приоритетами в массив приоритетов, причем для оптимизации вычислительной мощности для формирования списков используют только часть групп пикселей, отличающийся тем, что в значение приоритета добавляют позиционный фактор, который тем больше, чем ближе расположена группа пикселей к заранее заданному в зависимости от языка начальному пикселю. ! 3. Способ по п.2, отличающийся тем, что разность з

Claims (20)

1. Способ оптического распознавания символов (OCR), включающий этапы, на которых:
a) распознают штрихи посредством формирования списков с ориентацией для групп пикселей, причем в каждом списке представлены отдельные штрихи;
b) копируют буквы на базе сгенерированных списков;
c) сравнивают последовательности перемещений при копировании буквы с нормированными эталонными буквами, сохраненными в дереве решений.
2. Способ анализа графических данных, состоящих из массива отдельных пикселей, причем каждый пиксель имеет изменяющееся во времени значение пикселя, несущее информацию о цвете или яркости пикселя, включающий этапы, на которых:
a) получают значение приоритета для каждого пикселя массива посредством задания используемого пикселя в качестве базового пикселя и расчета разности значений пикселей на основании текущего значения базового пикселя по отношению к текущим значениям предварительно заданной группы соседних пикселей;
b) объединяют в одну группу пиксели, использованные для расчета значения приоритета пикселей;
c) сортируют группы пикселей на основании значения приоритета соответствующего базового пикселя и сохраняют в массиве приоритетов;
d) сохраняют и/или передают группы пикселей в соответствии с их приоритетами в массив приоритетов, причем для оптимизации вычислительной мощности для формирования списков используют только часть групп пикселей, отличающийся тем, что в значение приоритета добавляют позиционный фактор, который тем больше, чем ближе расположена группа пикселей к заранее заданному в зависимости от языка начальному пикселю.
3. Способ по п.2, отличающийся тем, что разность значений пикселей получают из разности значения рассматриваемого пикселя и значения нескольких рассматриваемых соседних пикселей группы.
4. Способ по п.2, отличающийся тем, что на основании разности значений пикселей делают вывод о толщине штриха.
5. Способ по п.2, отличающийся тем, что списки формируют из сходных групп пикселей.
6. Способ по п.2, отличающийся тем, что после этапов 1a)-1d) выполняют этапы, на которых:
сначала выполняют предварительную обработку самонастраивающуюся и оптимизированную по группам пикселей, в ходе которой в изображении ищут штрихи, затем пытаются наиболее оптимальным образом скопировать эти штрихи, затем на основании последовательности перемещений делают вывод о соответствующем символе с помощью сохраненных ключевых слов/поисковых деревьев.
7. Способ по п.2, отличающийся тем, что после этапов 1a)-1d) выполняют этапы, на которых:
сходные группы пикселей объединяют в отдельном списке и каждый полученный таким образом список сортируют так, что группы пикселей, расположенные более низко по оси Y, сортируют по убыванию, при этом, если несколько сходных групп пикселей располагаются в одинаковом положении по оси Y, для них формируют новые списки, причем из этих списков выводят вектора и находят группы пикселей с самым малым и самым большим значением Y, между этими положениями групп пикселей рассчитывают линию и определяют отклонение других групп пикселей от этой линии.
8. Способ по п.7, отличающийся тем, что, если все отклонения лежат ниже определенного порогового значения, для этого списка находят описательный вектор, а если все отклонения лежат выше порогового значения, список делят и пытаются сгенерировать соответствующие вектора для каждой части списка.
9. Способ по п.8, отличающийся тем, что список делят там, где имеются наибольшие отклонения от рассчитанной линии.
10. Способ по п.9, отличающийся тем, что затем нормируют векторные списки, например, по максимальной разности по оси Y.
11. Способ по п.10, отличающийся тем, что с помощью нормированных списков векторов просматривают дерево решений, в котором сохранены различные буквы.
12. Способ по п.11, отличающийся тем, что соприкасающиеся вектора объединяют в дополнительный список векторов и соответственно сортируют значения Y.
13. Способ по п.12, отличающийся тем, что ширину используемой группы пикселей выбирают таким образом, чтобы она была в три раза больше толщины линий, а оптимальная высота группы пикселей зависит от высоты шрифта.
14. Способ по п.13, отличающийся тем, что далее сканируют изображение с помощью таким образом оптимизированных групп пикселей.
15. Способ по п.14, отличающийся тем, что для каждого текста с данным типом шрифта генерируют оптимизированные деревья результатов.
16. Способ по п.15, отличающийся тем, что для машинного шрифта уже распознанные буквы или слоги сохраняют в качестве образцов групп пикселей.
17. Способ по п.16, отличающийся тем, что используют словарь/лексикон, с помощью которых распознанные буквы используют для оптимизации распознавания текста.
18. Способ по п.17, отличающийся тем, что распознанные слова переводят на выбранный язык и выдают оптическим или акустическим способом.
19. Способ по п.18, отличающийся тем, что с помощью обратного контроля на основании распознанных слов оптимизируют соответствующим образом деревья решений и толщину штрихов оригинала.
20. Способ по п.2, отличающийся тем, что выполняют непрерывное определение и выдачу отсортированных по приоритету групп пикселей с помощью используемого устройства съемки изображений, в частности, интегрированного в мобильном телефоне сканера или ПЗС-камеры.
RU2010122947/08A 2007-11-05 2008-10-28 Способ анализа изображения, в частности, для мобильного устройства RU2454718C2 (ru)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE102007052622.0 2007-11-05
DE102007052622A DE102007052622A1 (de) 2007-11-05 2007-11-05 Verfahren zur Bildanalyse, insbesondere für ein Mobilfunkgerät

Publications (2)

Publication Number Publication Date
RU2010122947A true RU2010122947A (ru) 2011-12-20
RU2454718C2 RU2454718C2 (ru) 2012-06-27

Family

ID=40514367

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2010122947/08A RU2454718C2 (ru) 2007-11-05 2008-10-28 Способ анализа изображения, в частности, для мобильного устройства

Country Status (10)

Country Link
US (1) US8532389B2 (ru)
EP (1) EP2208170A1 (ru)
KR (1) KR101606469B1 (ru)
CN (1) CN101855640B (ru)
BR (1) BRPI0820570A2 (ru)
CA (1) CA2704830C (ru)
DE (1) DE102007052622A1 (ru)
MX (1) MX2010004732A (ru)
RU (1) RU2454718C2 (ru)
WO (1) WO2009059715A1 (ru)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2582064C1 (ru) * 2014-12-16 2016-04-20 Общество с ограниченной ответственностью "Аби Девелопмент" Способы и системы эффективного автоматического распознавания символов с использованием леса решений

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9028344B2 (en) * 2010-01-28 2015-05-12 Chsz, Llc Electronic golf assistant utilizing electronic storing
CN102364926A (zh) * 2011-10-21 2012-02-29 镇江科大船苑计算机网络工程有限公司 基于Android智能化信息转换方法
US9053361B2 (en) 2012-01-26 2015-06-09 Qualcomm Incorporated Identifying regions of text to merge in a natural image or video frame
US9064191B2 (en) 2012-01-26 2015-06-23 Qualcomm Incorporated Lower modifier detection and extraction from devanagari text images to improve OCR performance
US9262699B2 (en) 2012-07-19 2016-02-16 Qualcomm Incorporated Method of handling complex variants of words through prefix-tree based decoding for Devanagiri OCR
US9014480B2 (en) 2012-07-19 2015-04-21 Qualcomm Incorporated Identifying a maximally stable extremal region (MSER) in an image by skipping comparison of pixels in the region
US9047540B2 (en) 2012-07-19 2015-06-02 Qualcomm Incorporated Trellis based word decoder with reverse pass
US9076242B2 (en) 2012-07-19 2015-07-07 Qualcomm Incorporated Automatic correction of skew in natural images and video
US9141874B2 (en) 2012-07-19 2015-09-22 Qualcomm Incorporated Feature extraction and use with a probability density function (PDF) divergence metric
RU2587406C2 (ru) * 2014-05-29 2016-06-20 Общество С Ограниченной Ответственностью "Яндекс" Способ обработки визуального объекта и электронное устройство, используемое в нем
RU2598300C2 (ru) 2015-01-27 2016-09-20 Общество с ограниченной ответственностью "Аби Девелопмент" Способы и системы автоматического распознавания символов с использованием дерева решений

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5917668A (ja) * 1982-07-20 1984-01-28 Ricoh Co Ltd ストロ−ク抽出方法
JPS60217477A (ja) * 1984-04-12 1985-10-31 Toshiba Corp 手書き文字認識装置
DE3815869A1 (de) * 1987-05-08 1988-11-17 Ricoh Kk Verfahren zum extrahieren von merkmalsmengen eines zeichens
CN1075565A (zh) * 1992-02-15 1993-08-25 曾怜玉 具有学习能力的文字识别方法
US5319721A (en) * 1992-04-14 1994-06-07 International Business Machines Corporation Methods and apparatus for evolving a starter set of handwriting prototypes into a user-specific set
WO1994004993A1 (en) * 1992-08-18 1994-03-03 Perception Software Corporation A recognition system with an automated development tool
CN1029534C (zh) * 1993-02-25 1995-08-16 清华大学 自由书写联机手写汉字识别方法及其系统
JP3260979B2 (ja) * 1994-07-15 2002-02-25 株式会社リコー 文字認識方法
US5940534A (en) * 1995-07-17 1999-08-17 Nippon Telegraph And Telephone Corporation On-line handwritten character recognition using affine transformation to maximize overlapping of corresponding input and reference pattern strokes
US5796867A (en) * 1996-06-12 1998-08-18 Industrial Technology Research Institute Stroke-number-free and stroke-order-free on-line Chinese character recognition method
US6970599B2 (en) * 2002-07-25 2005-11-29 America Online, Inc. Chinese character handwriting recognition system
RU2249251C2 (ru) * 1999-06-21 2005-03-27 Де ла рю Жиори С.А. Автоматическое распознавание символов на структурированном фоне при помощи комбинирования моделей фона и символов
DE10025017B4 (de) 1999-06-21 2008-04-10 T-Mobile Deutschland Gmbh Verfahren zum Betrieb eines Mobiltelefons
US6807309B1 (en) * 2000-12-27 2004-10-19 Canon Kabushiki Kaisha Linear list compression
US7359560B2 (en) * 2001-03-21 2008-04-15 T-Mobile Deutschland Gmbh Method for compression and decompression of image data with use of priority values
DE10113880B4 (de) 2001-03-21 2004-04-29 T-Mobile Deutschland Gmbh Verfahren zur Komprimierung und Dekomprimierung von Videodaten
DE10163688A1 (de) 2001-12-21 2003-07-03 Blg Complements Gmbh & Co Kg Verfahren und System zur Verfolgung von Gütern sowie Erfassungsgerät hierfür
RU2260280C2 (ru) * 2002-12-15 2005-09-20 Всероссийский научно-исследовательский институт консервной и овощесушильной промышленности (Государственное научное учреждение) Способ защиты вегетирующих пасленовых культур от вредных насекомых
DE102005033001A1 (de) 2005-07-14 2007-01-25 Siemens Ag Verfahren zur Optimierung von Kontrollvorgängen beim Einsatz mobiler Endgeräte
DE202005018376U1 (de) 2005-11-18 2006-02-02 Alcatech Service Und Vertrieb Gmbh & Co Kg Mobiles Gerät als mobiler Personalcomputer oder Mobiltelefon

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2582064C1 (ru) * 2014-12-16 2016-04-20 Общество с ограниченной ответственностью "Аби Девелопмент" Способы и системы эффективного автоматического распознавания символов с использованием леса решений

Also Published As

Publication number Publication date
CA2704830A1 (en) 2009-05-14
CN101855640B (zh) 2013-12-04
US20100296729A1 (en) 2010-11-25
CA2704830C (en) 2014-09-30
US8532389B2 (en) 2013-09-10
EP2208170A1 (de) 2010-07-21
BRPI0820570A2 (pt) 2015-06-16
MX2010004732A (es) 2010-05-20
WO2009059715A1 (de) 2009-05-14
KR20100099154A (ko) 2010-09-10
CN101855640A (zh) 2010-10-06
KR101606469B1 (ko) 2016-03-25
DE102007052622A1 (de) 2009-05-07
RU2454718C2 (ru) 2012-06-27

Similar Documents

Publication Publication Date Title
RU2010122947A (ru) Способ анализа изображения, в частности, для мобильного устройства
EP3660733B1 (en) Method and system for information extraction from document images using conversational interface and database querying
CN1096036C (zh) 以格阵作关键字的字典检索装置和方法
US9785867B2 (en) Character recognition device, image display device, image retrieval device, character recognition method, and computer program product
Bai et al. Image character recognition using deep convolutional neural network learned from different languages
EP2144189A2 (en) Method for recognizing and translating characters in camera-based image
KR20100007722A (ko) 카메라 기반 영상의 문자 인식 및 번역 방법
CN1692404A (zh) 词汇重音预测
JPH0142028B2 (ru)
CN1916940A (zh) 模板优化的字符识别方法和系统
US10438097B2 (en) Recognition device, recognition method, and computer program product
JP2018060389A (ja) プログラム、情報記憶媒体及び文字分割装置
JPH11213160A (ja) 画像処理方法及び装置及びその記憶媒体
US8549023B2 (en) Method and apparatus for resorting a sequence of sorted strings
Gao et al. Double supervised network with attention mechanism for scene text recognition
CN1991743A (zh) 一种语音输入法方法及其装置
Gao et al. DSAN: double supervised network with attention mechanism for scene text recognition
EP2075741A2 (en) Image comparing method, apparatus and program
CN107203572A (zh) 一种图片搜索的方法及装置
CN110969016B (zh) 分词处理方法及装置
Lee et al. Ensemble Algorithm of Convolution Neural Networks for Enhancing Facial Expression Recognition
CN111368124B (zh) 风险识别方法、风险识别装置和电子设备
Chou et al. Learning to binarize document images using a decision cascade
JP2006163830A (ja) 文字認識装置、文字認識方法、および文字認識プログラム
JP2016189146A (ja) 文字認識装置、分類装置及び文字認識方法