RU2016110914A

RU2016110914A - Способ извлечения области, способ обучения модели и устройства для их осуществления

Info

Publication number: RU2016110914A
Application number: RU2016110914A
Authority: RU
Inventors: Фэй Лун; Тао Чжан; Чжицзюнь ЧЭНЬ
Original assignee: Сяоми Инк.
Priority date: 2015-10-30
Filing date: 2015-12-29
Publication date: 2017-09-28
Also published as: MX2016003753A; WO2017071064A1; EP3163509A1; KR101763891B1; CN105528607A; JP2018503201A; CN105528607B; US20170124719A1; KR20170061628A

Claims

1. Способ извлечения области, содержащий этапы, на которых:

получают модель распознавания, причем модель распознавания формируют путем обучения заданных эталонных изображений с помощью алгоритма классификации, заданные эталонные изображения включают в себя позитивные эталонные изображения и негативные эталонные изображения, каждое из позитивных эталонных изображений имеет по меньшей мере один числовой символ, а каждое из негативных эталонных изображений не имеет числового символа или имеет неполные числовые символы;

распознают изображение, подлежащее распознаванию, в соответствии с моделью распознавания для получения по меньшей мере одной числовой области; и

выполняют сегментацию числовой области для получения по меньшей мере одной области с одним числом.

2. Способ по п. 1, в котором на этапе распознавания:

извлекают область окна-кандидата из изображения, подлежащего распознаванию, в соответствии с заданной стратегией разворачивающегося окна с помощью заданного окна;

классифицируют область окна-кандидата путем ввода признака изображения области окна-кандидата в модель распознавания для получения результата классификации; и

распознают области окна-кандидата в качестве числовой области в случае, когда результатом классификации является положительный результат.

3. Способ по п. 2, в котором существуют по меньшей мере две числовые области, при этом способ дополнительно содержит этап, на котором:

находят n числовых областей, каждая из которых имеет зону пересечения с другой числовой областью в пределах n числовых областей; и

объединяют n числовых областей для получения объединенной числовой области.

4. Способ по п. 3, в котором на этапе объединения:

в случае, когда верхние края и нижние края n числовых областей находятся соответственно на одной прямой,

определяют крайний левый край из n левых краев n числовых областей в качестве объединенного левого края;

определяют крайний правый край из n правых краев n числовых областей в качестве объединенного правого края; и

получают объединенную числовую область на основании верхнего края, нижнего края, объединенного левого края и объединенного правого края.

5. Способ по любому из пп. 1-4, в котором на этапе сегментации:

бинаризируют числовую область для получения бинаризованной числовой области;

вычисляют гистограмму для бинаризованной числовой области в вертикальном направлении, причем гистограмма содержит горизонтальную координату каждого столбца пиксельных точек и совокупное значение пиксельных точек основного цвета в каждом столбце пиксельных точек; и

распознают n областей с одним числом на основании наборов последовательных столбцов в гистограмме, причем каждый из наборов последовательных столбцов состоит из столбцов, в которых совокупные значения пиксельных точек основного цвета превышают заданное пороговое значение.

6. Способ обучения модели, содержащий этапы, на которых:

получают заданные эталонные изображения, причем заданные эталонные изображения включают в себя позитивные эталонные изображения и негативные эталонные изображения, при этом каждое из позитивных изображений имеет по меньшей мере один числовой символ, при этом каждое из негативных эталонных изображений не имеет числового символа или имеет неполные числовые символы; и

обучают заданные эталонные изображения с помощью алгоритма классификации для получения модели распознавания.

7. Способ по п. 6, в котором на этапе обучения:

извлекают признаки изображения из позитивных эталонных изображений и негативных эталонных изображений; и

вводят признаки изображения позитивных эталонных изображений и первую метку, указывающую положительные результаты, в исходную модель и вводят признаки изображения негативных эталонных изображений и вторую метку, указывающую отрицательные результаты, в исходную модель для получения модели распознавания, причем построение исходной модели осуществляют с использованием алгоритма классификации.

8. Способ по п. 6 или 7, в котором алгоритм классификации содержит по меньшей мере один из следующих алгоритмов: Adaboost, метод опорных векторов (SVM), искусственная нейронная сеть, эволюционный алгоритм, наивный байесовский классификатор (Naive Bayes), дерево решений (Decision Trees), алгоритм k-ближайших соседей (K-Nearest Neighbor).

9. Устройство для извлечения области, содержащее:

модуль получения, выполненный с возможностью получения модели распознавания, причем модель распознавания сформирована путем обучения заданных эталонных изображений с помощью алгоритма классификации, причем заданные эталонные изображения включают в себя позитивные эталонные изображения и негативные эталонные изображения, каждое из позитивных эталонных изображений имеет по меньшей мере один числовой символ, а каждое из негативных эталонных изображений не имеет числового символа или имеет неполные числовые символы;

модуль распознавания, выполненный с возможностью распознавания изображения, подлежащего распознаванию, в соответствии с моделью распознавания для получения по меньшей мере одной числовой области; и

модуль сегментации, выполненный с возможностью сегментации числовой области для получения по меньшей мере одной области с одним числом.

10. Устройство по п. 9, в котором модуль распознавания содержит:

подмодуль разворачивающегося окна, выполненный с возможностью извлечения области окна-кандидата из изображения, подлежащего распознаванию, в соответствии с заданной стратегией разворачивающегося окна с помощью заданного окна;

подмодуль классификации, выполненный с возможностью классификации области окна-кандидата путем ввода признака изображения области окна-кандидата в модель распознавания для получения результата классификации; и

подмодуль подтверждения, выполненный с возможностью распознавания области окна-кандидата в качестве числовой области в случае, когда результатом классификации является положительный результат.

11. Устройство по п. 10, в котором существуют по меньшей мере две числовые области, а устройство дополнительно содержит:

модуль нахождения, выполненный с возможностью нахождения n числовых областей, каждая из которых имеет зону пересечения с другой числовой областью в пределах n числовых областей;

модуль объединения, выполненный с возможностью объединения n числовых областей для получения объединенной числовой области.

12. Устройство по п. 11, в котором модуль объединения содержит:

первый подмодуль определения, выполненный с возможностью определения крайнего левого края из n левых краев n числовых областей в качестве объединенного левого края в случае, когда верхние края и нижние края n числовых областей находятся соответственно на одной прямой;

второй подмодуль определения, выполненный с возможностью определения крайнего правого края из n правых краев n числовых областей в качестве объединенного правого края, в случае, когда верхние края и нижние края n числовых областей находятся соответственно на одной прямой; и

третий подмодуль определения, выполненный с возможностью получения объединенной числовой области на основании верхнего края, нижнего края, объединенного левого края и объединенного правого края в случае, когда верхние края и нижние края n числовых областей находятся соответственно на одной прямой.

13. Устройство по любому из пп. 9-12, в котором модуль сегментации содержит:

подмодуль бинаризации, выполненный с возможностью бинаризации числовой области для получения бинаризованной числовой области;

подмодуль вычисления, выполненный с возможностью вычисления гистограммы для бинаризованной числовой области в вертикальном направлении, причем гистограмма содержит горизонтальную координату каждого столбца пиксельных точек и совокупное значение пиксельных точек основного цвета в каждом столбце пиксельных точек; и

подмодуль распознавания чисел, выполненный с возможностью распознавания n областей с одним числом на основании наборов последовательных столбцов в гистограмме, где каждый из наборов последовательных столбцов состоит из столбцов, в которых совокупные значения пиксельных точек основного цвета превышают заданное пороговое значение.

14. Устройство для обучения модели, содержащее:

модуль получения выборки, выполненный с возможностью получения заданных эталонных изображений, причем заданные эталонные изображения включают в себя позитивные эталонные изображения и негативные эталонные изображения, при этом каждое из позитивных эталонных изображений имеет по меньшей мере один числовой символ, и каждое из негативных эталонных изображений не имеет числового символа или имеет неполные числовые символы; и

модуль обучения, выполненный с возможностью обучения заданных эталонных изображений с помощью алгоритма классификации для получения модели распознавания.

15. Устройство по п. 14, в котором модуль обучения содержит:

подмодуль извлечения, выполненный с возможностью извлечения признаков изображения из позитивных эталонных изображений и негативных эталонных изображений; и

подмодуль ввода, выполненный с возможностью ввода признаков изображения позитивных эталонных изображений и первой метки, указывающей положительные результаты, в исходную модель и ввода признаков изображения негативных эталонных изображений и второй метки, указывающей отрицательные результаты, в исходную модель для получения модели распознавания, причем построение исходной модели осуществляется с использованием алгоритма классификации.

16. Устройство по п. 14 или 15, в котором алгоритм классификации содержит по меньшей мере один из следующих алгоритмов: Adaboost, метод опорных векторов (SVM), искусственная нейронная сеть, эволюционный алгоритм, наивный байесовский классификатор (Naive Bayes), дерево решений (Decision Trees), алгоритм k-ближайших соседей (K-Nearest Neighbor).

17. Устройство для извлечения области, содержащее:

процессор; и

память для хранения команд, исполняемых процессором,

причем процессор выполнен с возможностью:

получения модели распознавания, причем модель распознавания формируется путем обучения заданных эталонных изображений с помощью алгоритма классификации, заданные эталонные изображения включают в себя позитивные эталонные изображения и негативные эталонные изображения, каждое из позитивных эталонных изображений имеет по меньшей мере один числовой символ, а каждое из негативных эталонных изображений не имеет числового символа или имеет неполные числовые символы;

распознавания изображения, подлежащего распознаванию, в соответствии с моделью распознавания для получения по меньшей мере одной числовой области; и

выполнения сегментации области в отношении числовой области для получения по меньшей мере одной области с одним числом.

18. Устройство для обучения модели, содержащее:

процессор; и

причем процессор выполнен с возможностью:

получения заданных эталонных изображений, причем заданные эталонные изображения включают в себя позитивные эталонные изображения и негативные эталонные изображения, при этом каждое из позитивных изображений имеет по меньшей мере один числовой символ, при этом каждое из негативных эталонных изображений не имеет числового символа или имеет неполные числовые символы; и

обучения заданных эталонных изображений с помощью алгоритма классификации для получения модели распознавания.