RU2010122947A

RU2010122947A - Способ анализа изображения, в частности, для мобильного устройства

Info

Publication number: RU2010122947A
Application number: RU2010122947/08A
Authority: RU
Inventors: Герд МОСАКОВСКИ (DE); Герд МОСАКОВСКИ
Original assignee: Т-Мобиле Интернациональ Аг (De); Т-Мобиле Интернациональ Аг
Priority date: 2007-11-05
Filing date: 2008-10-28
Publication date: 2011-12-20
Also published as: CA2704830A1; CN101855640B; US20100296729A1; CA2704830C; US8532389B2; EP2208170A1; BRPI0820570A2; MX2010004732A; WO2009059715A1; KR20100099154A; CN101855640A; KR101606469B1; DE102007052622A1; RU2454718C2

Abstract

1. Способ оптического распознавания символов (OCR), включающий этапы, на которых: ! a) распознают штрихи посредством формирования списков с ориентацией для групп пикселей, причем в каждом списке представлены отдельные штрихи; ! b) копируют буквы на базе сгенерированных списков; ! c) сравнивают последовательности перемещений при копировании буквы с нормированными эталонными буквами, сохраненными в дереве решений. ! 2. Способ анализа графических данных, состоящих из массива отдельных пикселей, причем каждый пиксель имеет изменяющееся во времени значение пикселя, несущее информацию о цвете или яркости пикселя, включающий этапы, на которых: ! a) получают значение приоритета для каждого пикселя массива посредством задания используемого пикселя в качестве базового пикселя и расчета разности значений пикселей на основании текущего значения базового пикселя по отношению к текущим значениям предварительно заданной группы соседних пикселей; ! b) объединяют в одну группу пиксели, использованные для расчета значения приоритета пикселей; ! c) сортируют группы пикселей на основании значения приоритета соответствующего базового пикселя и сохраняют в массиве приоритетов; ! d) сохраняют и/или передают группы пикселей в соответствии с их приоритетами в массив приоритетов, причем для оптимизации вычислительной мощности для формирования списков используют только часть групп пикселей, отличающийся тем, что в значение приоритета добавляют позиционный фактор, который тем больше, чем ближе расположена группа пикселей к заранее заданному в зависимости от языка начальному пикселю. ! 3. Способ по п.2, отличающийся тем, что разность з

Claims

1. Способ оптического распознавания символов (OCR), включающий этапы, на которых:

a) распознают штрихи посредством формирования списков с ориентацией для групп пикселей, причем в каждом списке представлены отдельные штрихи;

b) копируют буквы на базе сгенерированных списков;

c) сравнивают последовательности перемещений при копировании буквы с нормированными эталонными буквами, сохраненными в дереве решений.

2. Способ анализа графических данных, состоящих из массива отдельных пикселей, причем каждый пиксель имеет изменяющееся во времени значение пикселя, несущее информацию о цвете или яркости пикселя, включающий этапы, на которых:

a) получают значение приоритета для каждого пикселя массива посредством задания используемого пикселя в качестве базового пикселя и расчета разности значений пикселей на основании текущего значения базового пикселя по отношению к текущим значениям предварительно заданной группы соседних пикселей;

b) объединяют в одну группу пиксели, использованные для расчета значения приоритета пикселей;

c) сортируют группы пикселей на основании значения приоритета соответствующего базового пикселя и сохраняют в массиве приоритетов;

d) сохраняют и/или передают группы пикселей в соответствии с их приоритетами в массив приоритетов, причем для оптимизации вычислительной мощности для формирования списков используют только часть групп пикселей, отличающийся тем, что в значение приоритета добавляют позиционный фактор, который тем больше, чем ближе расположена группа пикселей к заранее заданному в зависимости от языка начальному пикселю.

3. Способ по п.2, отличающийся тем, что разность значений пикселей получают из разности значения рассматриваемого пикселя и значения нескольких рассматриваемых соседних пикселей группы.

4. Способ по п.2, отличающийся тем, что на основании разности значений пикселей делают вывод о толщине штриха.

5. Способ по п.2, отличающийся тем, что списки формируют из сходных групп пикселей.

6. Способ по п.2, отличающийся тем, что после этапов 1a)-1d) выполняют этапы, на которых:

сначала выполняют предварительную обработку самонастраивающуюся и оптимизированную по группам пикселей, в ходе которой в изображении ищут штрихи, затем пытаются наиболее оптимальным образом скопировать эти штрихи, затем на основании последовательности перемещений делают вывод о соответствующем символе с помощью сохраненных ключевых слов/поисковых деревьев.

7. Способ по п.2, отличающийся тем, что после этапов 1a)-1d) выполняют этапы, на которых:

сходные группы пикселей объединяют в отдельном списке и каждый полученный таким образом список сортируют так, что группы пикселей, расположенные более низко по оси Y, сортируют по убыванию, при этом, если несколько сходных групп пикселей располагаются в одинаковом положении по оси Y, для них формируют новые списки, причем из этих списков выводят вектора и находят группы пикселей с самым малым и самым большим значением Y, между этими положениями групп пикселей рассчитывают линию и определяют отклонение других групп пикселей от этой линии.

8. Способ по п.7, отличающийся тем, что, если все отклонения лежат ниже определенного порогового значения, для этого списка находят описательный вектор, а если все отклонения лежат выше порогового значения, список делят и пытаются сгенерировать соответствующие вектора для каждой части списка.

9. Способ по п.8, отличающийся тем, что список делят там, где имеются наибольшие отклонения от рассчитанной линии.

10. Способ по п.9, отличающийся тем, что затем нормируют векторные списки, например, по максимальной разности по оси Y.

11. Способ по п.10, отличающийся тем, что с помощью нормированных списков векторов просматривают дерево решений, в котором сохранены различные буквы.

12. Способ по п.11, отличающийся тем, что соприкасающиеся вектора объединяют в дополнительный список векторов и соответственно сортируют значения Y.

13. Способ по п.12, отличающийся тем, что ширину используемой группы пикселей выбирают таким образом, чтобы она была в три раза больше толщины линий, а оптимальная высота группы пикселей зависит от высоты шрифта.

14. Способ по п.13, отличающийся тем, что далее сканируют изображение с помощью таким образом оптимизированных групп пикселей.

15. Способ по п.14, отличающийся тем, что для каждого текста с данным типом шрифта генерируют оптимизированные деревья результатов.

16. Способ по п.15, отличающийся тем, что для машинного шрифта уже распознанные буквы или слоги сохраняют в качестве образцов групп пикселей.

17. Способ по п.16, отличающийся тем, что используют словарь/лексикон, с помощью которых распознанные буквы используют для оптимизации распознавания текста.

18. Способ по п.17, отличающийся тем, что распознанные слова переводят на выбранный язык и выдают оптическим или акустическим способом.

19. Способ по п.18, отличающийся тем, что с помощью обратного контроля на основании распознанных слов оптимизируют соответствующим образом деревья решений и толщину штрихов оригинала.

20. Способ по п.2, отличающийся тем, что выполняют непрерывное определение и выдачу отсортированных по приоритету групп пикселей с помощью используемого устройства съемки изображений, в частности, интегрированного в мобильном телефоне сканера или ПЗС-камеры.