RU2602348C2 - Устройство для идентификации символьной области пикселя и способ - Google Patents

Устройство для идентификации символьной области пикселя и способ Download PDF

Info

Publication number
RU2602348C2
RU2602348C2 RU2013154987/08A RU2013154987A RU2602348C2 RU 2602348 C2 RU2602348 C2 RU 2602348C2 RU 2013154987/08 A RU2013154987/08 A RU 2013154987/08A RU 2013154987 A RU2013154987 A RU 2013154987A RU 2602348 C2 RU2602348 C2 RU 2602348C2
Authority
RU
Russia
Prior art keywords
pixel
interest
pixels
specified
region
Prior art date
Application number
RU2013154987/08A
Other languages
English (en)
Other versions
RU2013154987A (ru
Inventor
Хайфэн ЧЭНЬ
Масаси НАКАО
Original Assignee
ЭЙДЗО Корпорейшн
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ЭЙДЗО Корпорейшн filed Critical ЭЙДЗО Корпорейшн
Publication of RU2013154987A publication Critical patent/RU2013154987A/ru
Application granted granted Critical
Publication of RU2602348C2 publication Critical patent/RU2602348C2/ru

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/40Analysis of texture
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/162Quantising the image signal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/18086Extraction of features or characteristics of the image by performing operations within image blocks or by using histograms
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G3/00Control arrangements or circuits, of interest only in connection with visual indicators other than cathode-ray tubes
    • G09G3/20Control arrangements or circuits, of interest only in connection with visual indicators other than cathode-ray tubes for presentation of an assembly of a number of characters, e.g. a page, by composing the assembly by combination of individual elements arranged in a matrix no fixed position being assigned to or needed to be assigned to the individual characters or partial characters
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/28Quantising the image, e.g. histogram thresholding for discrimination between background and foreground patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computer Hardware Design (AREA)
  • Controls And Circuits For Display Device (AREA)
  • Image Analysis (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Studio Circuits (AREA)
  • Processing Of Color Television Signals (AREA)

Abstract

Изобретение относится к различению текстовой области и нетекстовой области, и, в частности, к оцениванию шрифтового символа, подвергнутого процессу сглаживания. Техническим результатом является расширение арсенала технических средств оценивания того, содержится ли единичный пиксель в символьной области на экране дисплея. В способе оценивания того, содержится ли единичный пиксель в символьной области на экране дисплея, имеющем множество единичных пикселей, каждый из которых имеет три или большее количество подпикселей основных цветов, размещенных в нем, когда задан пиксель, представляющий интерес, задают указанный пиксель и заранее определенное количество единичных пикселей, смежных с ним, в качестве области оценивания. Определяют наибольшие значения подпикселей основных цветов каждых единичных пикселей в области оценивания в качестве репрезентативного значения указанного единичного пикселя. На основании гистограммы репрезентативных значений единичных пикселей в области оценивания производят оценивание того, содержится ли пиксель, представляющий интерес, в символьной области. 8 н. и 3 з.п. ф-лы, 8 ил.

Description

ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ
[0001]
Настоящее изобретение относится к способу различения текстовой области и нетекстовой области, и, в частности, к оцениванию шрифтового символа, подвергнутого процессу сглаживания.
УРОВЕНЬ ТЕХНИКИ
[0002]
В настоящее время для улучшения фактической видимости изображений на экране персонального компьютера область изображения подвергают подсветке. При таком процессе подсветки для устранения подсветки символьной области необходимо произвести оценивание того, является ли пиксель, представляющий интерес, пикселем, содержащимся в символе.
[0003]
Изобретатель выполнял оценивание текстовой области с использованием следующего способа.
[0004]
1) Готовят гистограмму для значений у из девяти пикселей, содержащих пиксель, представляющий интерес, и восемь смежных с ним пикселей. 2) Получают общую сумму из самого часто встречающегося уровня серого, второго по частоте уровня серого и третьего по частоте уровня серого. 3) Общую сумму сравнивают с пороговым значением. Если общая сумма больше порогового значения или равна ему, указанную область оценивают как текстовую; если общая сумма меньше порогового значения, указанную область оценивают как нетекстовую. 4) На основании результата оценивания производят наложение однородно усредняющего фильтра из 3 линий на 5 пикселей для автоматической регулировки интенсивности обработки изображения.
[0005]
Патентный документ 1 раскрывает устройство для обработки изображения, выполненное с возможностью точного распознавания тонкой линии и вывода изображения с тонкими элементами, такого как черный символ, с высоким качеством.
Документы уровня техники
Патентные документы
[0006]
Патентный документ 1:
Публикация не подвергнутой экспертизе заявки на японский патент No. 2003-264689.
СУЩНОСТЬ ИЗОБРЕТЕНИЯ
ЗАДАЧИ, РЕШАЕМЫЕ С ПОМОЩЬЮ ИЗОБРЕТЕНИЯ
[0007]
Однако вышеуказанный способ оценивания с использованием значения яркости вызывает затруднение при распознавании шрифтового символа, подвергнутого процессу сглаживания с использованием подпикселей (далее называемого шрифтовым символом, подвергнутым процессу сглаживания (anti-aliasing font). Причина этого заключается в том, что шрифтовой символ, подвергнутый процессу сглаживания, оценивается традиционными способами оценивания как нетекстовая область на основании значения у, поскольку процессу сглаживания подвергается каждый R компонент, G компонент и В компонент пикселя, содержащегося в крае символа.
[0008]
Настоящее изобретение было сделано для решения вышеупомянутой проблемы, и его задача заключается в создании способа или устройства, которым можно производить оценивание, в качестве пикселя символьной области, даже шрифтового символа, подвергнутого процессу сглаживания с использованием подпикселей.
СРЕДСТВА ДЛЯ РЕШЕНИЯ ПРОБЛЕМ
[0009]
(1) Настоящее изобретение раскрывает способ оценивания того, содержится ли единичный пиксель в символьной области на экране дисплея, имеющем множество единичных пикселей, каждый из которых имеет три или большее количество подпикселей основных цветов, размещенных в нем. Согласно этому способу: когда задан пиксель, представляющий интерес, задают указанный пиксель, представляющий интерес, и заранее определенное количество единичных пикселей, смежных с ним, в качестве области оценивания; определяют наибольшие значения подпикселей основных цветов каждых единичных пикселей в области оценивания в качестве репрезентативного значения указанного единичного пикселя; и на основании репрезентативных значений единичных пикселей в области оценивания производят оценивание того, содержится ли пиксель, представляющий интерес, в символьной области.
[0010]
Таким образом, можно произвести оценивание в качестве пикселя символьной области даже шрифтового символа, подвергнутого процессу сглаживания с использованием подпикселей.
[0011]
(2) Настоящее изобретение раскрывает способ оценивания того, содержится ли единичный пиксель в символьной области на экране дисплея, имеющем множество единичных пикселей, каждый из которых имеет три или большее количество подпикселей основных цветов, размещенных в нем. Согласно этому способу: когда задан пиксель, представляющий интерес, задают указанный пиксель, представляющий интерес, и заранее определенное количество единичных пикселей, смежных с ним, в качестве области оценивания; определяют наименьшие значения подпикселей основных цветов каждых единичных пикселей в области оценивания в качестве репрезентативного значения указанного единичного пикселя и на основании репрезентативных значений единичных пикселей в области оценивания, производят оценивание того, содержится ли пиксель, представляющий интерес, в символьной области.
[0012]
Таким образом, можно произвести оценивание в качестве пикселя символьной области даже шрифтового символа, подвергнутого процессу сглаживания с использованием подпикселей.
[0013]
(3) Настоящее изобретение раскрывает способ оценивания того, содержится ли единичный пиксель в символьной области на экране дисплея, имеющем множество единичных пикселей, каждый из которых имеет три или большее количество подпикселей основных цветов, размещенных в нем в одном и том же порядке. Согласно этому способу: получают разность между значением последнего подпикселя основного цвета в указанном порядке размещения каждых единичных пикселей и значением первого подпикселя основного цвета в указанном порядке размещения последующего единичного пикселя; и на основании полученных разностей между единичными пикселями производят оценивание того, содержится ли единичный пиксель в символьной области.
[0014]
Таким образом, можно произвести оценивание в качестве пикселя символьной области даже шрифтового символа, подвергнутого процессу сглаживания с использованием подпикселей.
[0015]
(4) При реализации способа согласно настоящему изобретению оценивание символьной области предпочтительно выполняют посредством смещения пикселя, представляющего интерес, к другому пикселю и повторения задающего этапа, определительного этапа и оценочного этапа. Таким образом, можно произвести оценивание того, содержится ли определенный пиксель в символьной области, в диапазоне повторения.
[0016]
(5) Настоящее изобретение раскрывает устройство для оценивания того, содержится ли единичный пиксель в символьной области на экране дисплея, имеющем множество единичных пикселей, каждый из которых имеет три или большее количество подпикселей основных цветов, размещенных в нем. Раскрываемое устройство содержит: задающие средства, выполненные с возможностью, когда задан пиксель, представляющий интерес, задания указанного пикселя, представляющего интерес, и заданного количества единичных пикселей, смежных с ним, в качестве области оценивания; определительные средства, выполненные с возможностью определения наибольших значений подпикселей основных цветов каждых единичных пикселей в области оценивания в качестве репрезентативного значения указанного единичного пикселя; и оценочные средства, выполненные с возможностью оценивания того, содержится ли пиксель, представляющий интерес, в символьной области на основании репрезентативных значений единичных пикселей в области оценивания.
[0017]
Таким образом, можно произвести оценивание в качестве пикселя символьной области даже шрифтового символа, подвергнутого процессу сглаживания с использованием подпикселей.
[0018]
(6) Настоящее изобретение раскрывает устройство для оценивания того, содержится ли единичный пиксель в символьной области на экране дисплея, имеющем множество единичных пикселей, каждый из которых имеет три или большее количество подпикселей основных цветов, размещенных в нем. Раскрываемое устройство содержит: задающие средства, выполненные с возможностью, когда задан пиксель, представляющий интерес, задания указанного пикселя, представляющего интерес, и заданного количества единичных пикселей, смежных с ним, в качестве области оценивания; определительные средства, заполненные с возможностью определения наименьших значений подпикселей основных цветов каждых единичных пикселей в области оценивания в качестве репрезентативного значения указанного единичного пикселя; и оценочные средства, выполненные с возможностью оценивания того, содержится ли пиксель, представляющий интерес, в символьной области на основании репрезентативных значений единичных пикселей в области оценивания.
[0019]
Таким образом, можно произвести оценивание в качестве пикселя символьной области даже шрифтового символа, подвергнутого процессу сглаживания с использованием подпикселей.
[0020]
(7) Настоящее изобретение раскрывает устройство для оценивания того, содержится ли единичный пиксель в символьной области на экране дисплея, имеющем множество единичных пикселей, каждый из которых имеет три или большее количество подпикселей основных цветов, размещенных в нем в одном и том же порядке. Раскрываемое устройство содержит: средства расчета разности, выполненные с возможностью получения разности между значением последнего подпикселя основного цвета в указанном порядке размещения каждых единичных пикселей и значением первого подпикселя основного цвета в указанном порядке размещения последующего единичного пикселя; и оценочные средства, выполненные с возможностью оценивания того, содержится ли единичный пиксель в символьной области на основании полученных разностей между единичными пикселями.
[0021]
Таким образом, можно произвести оценивание в качестве пикселя символьной области даже шрифтового символа, подвергнутого процессу сглаживания с использованием подпикселей.
[0022]
(14) Настоящее изобретение раскрывает способ определения репрезентативного значения для оценивания того, содержится ли единичный пиксель в символьной области на экране дисплея, имеющем множество единичных пикселей, каждый из которых имеет три или большее количество подпикселей основных цветов, размещенных в нем. Согласно этому способу: когда задан пиксель, представляющий интерес, задают указанный пиксель, представляющий интерес, и заранее определенное количество единичных пикселей, смежных с ним, в качестве области оценивания; и определяют наибольшее или наименьшее значение из значений подпикселей основных цветов каждых единичных пикселей в области оценивания в качестве репрезентативного значения указанного единичного пикселя.
[0023]
Таким образом, можно получать репрезентативное значение единичного пикселя, представляющего интерес, для определения того, что единичный пиксель, представляющий интерес, является единичным пикселем, содержащимся в символьной области.
[0024]
Следует отметить, что "подпиксели основных цветов" в настоящих описании и формуле изобретения и подпиксели RGB в одном варианте реализации соответствуют друг другу.
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ
[0025]
На ФИГ. 1 показана блочная схема устройства 1 для оценивания символьной области пикселя.
На ФИГ. 2 схематично показан пример конфигурации аппаратного оборудования устройства 1 для оценивания символьной области пикселя, включающего в себя центральный обрабатывающий блок.
На ФИГ. 3 показан общий алгоритм.
На ФИГ. 4 схематично показаны RGB значения подпикселей каждого пикселя в шрифтовом символе, подвергнутом процессу сглаживания.
На ФИГ. 5 схематично показано зеркальное удвоение по краю.
На ФИГ. 6 схематично показаны наибольшие значения пикселей, полученные из RGB значений подпикселей.
На ФИГ. 7 схематично показаны значения яркости у пикселей, полученные из RGB значений подпикселей.
На ФИГ. 8 схематично показано направление полосы.
ВАРИАНТЫ РЕАЛИЗАЦИИ ИЗОБРЕТЕНИЯ
[0026]
1. Вариант реализации настоящего изобретения будет описан со ссылкой на чертежи.
[0027]
1.1. Функциональные блоки
На ФИГ. 1 приведена функциональная блочная схема, показывающая устройство 1 для оценивания символьной области пикселя по одному варианту реализации настоящего изобретения.
[0028]
Устройство 1 для оценивания символьной области пикселя является устройством, которое осуществляет оценивание того, содержится ли единичный пиксель в символьной области на экране дисплея, имеющем множество единичных пикселей, каждый из которых имеет три или большее количество подпикселей основных цветов. Устройство 1 для оценивания символьной области пикселя содержит задающие средства 3, определительные средства 5 и оценочные средства 7.
[0029]
Когда задан единичный пиксель, представляющий интерес, задающие средства 3 задают единичный пиксель, представляющий интерес, и заданное количество единичных пикселей, смежных с ним, в качестве области оценивания. Определительные средства 5 определяют наибольшие значения подпикселей основных цветов каждого единичного пикселя, содержащегося в области оценивания, в качестве репрезентативного значения единичного пикселя. На основании этих репрезентативных значений единичных пикселей в области оценивания, оценочные средства 7 производят оценивание того, содержится ли единичный пиксель, представляющий интерес, в символьной области.
[0030]
1.2. Конфигурация аппаратного оборудования
На ФИГ. 2 показана конфигурация аппаратного оборудования устройства 1 для оценивания символьной области пикселя. Устройство 1 для оценивания символьной области пикселя включает в себя центральный обрабатывающий блок 23, оперативное запоминающее устройство 25 и электрически перепрограммируемое постоянное запоминающее устройство 26. Электрически перепрограммируемое постоянное запоминающее устройство 26 хранит программу 26р. Программа 26р осуществляет процесс оценивания пикселей символьной области, как будет описано позже. Оперативное запоминающее устройство 25 хранит результат расчета или тому подобное. Запоминающее устройство 27 кадров хранит данные изображений одного экрана.
[0031]
В соответствии с программой 26р центральный обрабатывающий блок 23 устанавливает окно из 1*9 пикселей в соответствие с данными изображений, сохраненными в запоминающем устройстве 27, производит оценивание того, включает ли в себя область установки соответствия символьную область, и сохраняет результат оценивания в оперативном запоминающем устройстве 25.
[0032]
1.3. Описание алгоритма
Процесс, осуществляемый программой 26р, показанный на ФИГ. 2, будет описан со ссылкой на ФИГ. 3. Ниже, как показано на ФИГ. 4, будет описан пример, в котором пиксель, представляющий интерес, i является пикселем (1,0), и затем его смещают к пикселю-(1,1), пикселю (1,2) и т.п. Следует отметить, что на ФИГ. 4 представлен увеличенный вид участка, на котором символ "М" записан шрифтовым символом, подвергнутым процессу сглаживания.
[0033]
Когда пикселем, представляющим интерес, с номером i является пиксель (1,0), центральный обрабатывающий блок 23 производит извлечение из пикселя, представляющего интерес (1,0), а также из четырех пикселей, предшествующих пикселю, представляющему интерес, и четырех пикселей, следующих за ним (совокупности девяти пикселей) (этап S3). В отношении указанного края, в настоящем варианте реализации изобретения принято, что четыре пикселя справа от пикселя, представляющего интерес, подвергают зеркальному удвоению, и полученные зеркальным удвоением четыре пикселя находятся слева от пикселя, представляющего интерес. В частности, удвоения выполняют так, что пиксель (1,1), пиксель (1,2), пиксель (1,3) и пиксель (1,4) последовательно находятся слева от пикселя (1,0). На ФИГ. 5 показана конфигурация из общей совокупности в девять пикселей. Таким образом, справа и слева от пикселя (1,0) расположены в сущности одни и те же пиксели.
[0034]
Центральный обрабатывающий блок 23 определяет наибольшие значения подпикселей каждого из этих девяти пикселей в качестве репрезентативного значения каждого пикселя (этап S5 на ФИГ. 3). В этом случае, центральный обрабатывающий блок 23 извлекает "252", "207", "159", "252", "252", "252", "159", "207" и "252" в качестве репрезентативных значений этих девяти пикселей.
[0035]
Центральный обрабатывающий блок 23 представляет эти девять репрезентативных значений как гистограмму и ссылается на эти репрезентативные значения как Н0, H1, Н2 и т.п. в порядке убывания частоты в распределении (этап S7). В этом случае, Н0 репрезентативного значения "252" равно 5; H1 репрезентативного значения "207" равно 2; а Н2 репрезентативного значения "159" равно 2.
[0036]
Центральный обрабатывающий блок 23 определяет, выполняется ли нижеследующая Формула (1) (этап S9).
[0037]
Figure 00000001
Если на этапе S9 установлено выполнение Формулы (1), центральный обрабатывающий блок 23 оценивает пиксель, представляющий интерес, в качестве пикселя несимвольной области (этап S13); если не выполняется, он оценивает пиксель, представляющий интерес, в качестве пикселя символьной области (этап S11). В этом случае Н0 равно 5; H1 равно 2; а Н2 равно 2. В настоящем варианте реализации изобретения принято, что ТН равно 6. Соответственно, Формула (1) не выполняется, и центральный обрабатывающий блок 23 оценивает пиксель, представляющий интерес, с номером (1,0) в качестве пикселя символьной области.
[0038]
Затем центральный обрабатывающий блок 23 производит оценивание того, является ли текущий пиксель, представляющий интерес, i последним (этап S15 на ФИГ. 3). В этом случае, текущий пиксель, представляющий интерес, i не является последним. Соответственно, центральный обрабатывающий блок 23 осуществляет приращение к пикселю, представляющему интерес, i (этап S17).
[0039]
Таким образом, пикселем, представляющим интерес, с номером i становится пиксель (1,1), и центральный обрабатывающий блок 23 производит извлечение из пикселя, представляющего интерес, (1,1) а также из четырех пикселей, предшествующих пикселю (1,1) и четырех пикселей, следующих за ним (совокупности девяти пикселей) (этап S3). Центральный обрабатывающий блок 23 определяет наибольшие значения подпикселей каждого из этих девяти пикселей в качестве репрезентативного значения каждого пикселя (этап S5). В этом случае, центральный обрабатывающий блок 23 производит извлечение "207", "159", "252", "252", "252", "159", "207", "252" и "252" в качестве репрезентативных значений этих девяти пикселей.
[0040]
Центральный обрабатывающий блок 23 представляет эти девять репрезентативных значений как гистограмму и ссылается на эти репрезентативные значения как Н0, H1, Н2 и т.п. в порядке убывания частоты в распределении (этап S7 на ФИГ. 3). В этом случае, Н0 репрезентативного значения "252" равно 5; H1 репрезентативного значения "207" равно 2; а Н2 репрезентативного значения "159" равно 2.
[0041]
Если Формула (1) выполняется, центральный обрабатывающий блок 23 оценивает пиксель, представляющий интерес, в качестве пикселя несимвольной области; если не выполняется, он оценивает пиксель, представляющий интерес, в качестве пикселя символьной области (этапы S9, S11, S13).
[0042]
В этом случае, Н0 равно 5; H1 равно 2; а Н2 равно 1. В настоящем варианте реализации изобретения принято, что ТН равно 6. Соответственно, Формула (1) не выполняется, и центральный обрабатывающий блок 23 оценивает пиксель, представляющий интерес, с номером (1,1) в качестве пикселя символьной области.
[0043]
Схожим образом, центральный обрабатывающий блок 23 последовательно производит оценивание того, является ли пиксель, представляющий интерес, пикселем символьной области.
[0044]
Следует отметить, что в настоящем варианте реализации изобретения зеркальные удвоения также выполняют как по правому краю, так и по левому краю.
[0045]
После обработки последнего пикселя на этапе S15 по ФИГ. 3 этот процесс завершается.
[0046]
Иными словами, в настоящем варианте реализации изобретения, оценивание того, является ли пиксель, представляющий интерес, пикселем символьной области, производят посредством использования наибольших значений каждого единичного пикселя, как показано на ФИГ. 6, в качестве репрезентативного значения этого пикселя. Для сравнения на ФИГ. 7 показаны значения яркости, полученные преобразованием RGB значений по ФИГ. 4. Например, значения яркости "232," "228," "122," "144," "232" и т.п. размещены в этом порядке, начиная со значения пикселя, представляющего интерес, (1,0). Как видно, эти значения значительно разнятся. Соответственно, если оценивание того, что пиксель, представляющий интерес, является пикселем символьной области, произведено на основании значений яркости, то вышеприведенная Формула (1) выполняется. В результате, пиксель, представляющий интерес, оценивается в качестве пикселя несимвольной области, хотя он фактически является пикселем символьной области. С другой стороны, если используются наибольшие значения подпикселей основных цветов, единичные пиксели, имеющие одно и то же значение, находятся вокруг пикселя, представляющего интерес. Соответственно, даже шрифтовой символ, подвергнутый процессу сглаживания, не оценивается ошибочно в качестве области изображения. Для определенного изображения, в наибольших значениях подпикселей основных цветов не обнаруживается такая регулярность. Именно по этой причине, пиксель, представляющий интерес, не подвергается ошибочному оцениванию в качестве пикселя символьной области.
[0047]
Как раскрыто выше, для шрифтового символа, подвергнутого процессу сглаживания, значения подпикселей основных цветов (RGB значения) стремятся быть общими для соседних пикселей. Соответственно, пиксели, содержащиеся в символьной области, имеют в гистограмме особое отклонение, в отличие от несимвольной области. Именно по этой причине в настоящем варианте реализации изобретения определяют наибольшее или наименьшее значение RGB значений подпикселей в качестве репрезентативного значения каждого единичного пикселя, и на основании репрезентативных значений производят оценивание того, является ли пиксель, представляющий интерес, пикселем символьной области. Таким образом, можно произвести оценивание даже шрифтового символа, подвергнутого процессу сглаживания, который образован множеством цветов символа вследствие сглаживающей обработки краев символа, в качестве пикселя, содержащегося в символьной области.
[0048]
В настоящем варианте реализации изобретения производят оценивание того, что каждый единичный пиксель является пикселем, содержащимся в текстовой области, однако дополнительно может быть применен известный способ оценивания весовых характеристик с использованием однородно усредняющего фильтра. Например, оценивание весовых характеристик с использованием однородно усредняющего фильтра выполняют следующим образом. Иными словами, рассчитывают текстовую вероятность t с использованием однородно усредняющего фильтра 3/5; и посредством использования текстовой вероятности t в качестве весовой характеристики Wt изменяют коэффициент выделительного фильтра. В этом случае весовая характеристика Wt может быть равна текстовой вероятности t или рассчитана с использованием приведенной ниже формулы
Wt=k+(1-k)*t, где 0≤k<1 и 0≤t≤1.
Посредством реализации такого способа оценивания весовых характеристик с использованием однородно усредняющего фильтра обеспечивается возможность оценивания текстовой вероятности зоны на основе результатов текстового распознавания соседних пикселей. Иными словами, обеспечивается возможность исключения пикселя, который рассматривается изолированно в качестве текста.
[0049]
В настоящем варианте реализации изобретения, обеспечивается возможность распознавания шрифтового символа, подвергнутого процессу сглаживания, такому как PDF или ClearType, который сложно было распознавать с помощью традиционных методов, благодаря чему улучшается точность текстового распознавания.
[0050]
2. Другие варианты реализации изобретения
В вышеуказанном варианте реализации изобретения в качестве репрезентативного значения каждого пикселя в области оценивания получают наибольшие значения. В альтернативном варианте реализации изобретения может быть использовано наименьшее значение. Для шрифтового символа, подвергнутого процессу сглаживания, наименьшее из значений подпикселей основных цветов (RGB значения) также стремится быть общими для соседних пикселей. Соответственно, использование наименьших значений также обеспечивает возможность оценивания того, является ли пиксель, представляющий интерес, пикселем, содержащимся в символьной области.
[0051]
Следующий способ может быть использован для оценивания того, является ли пиксель, представляющий интерес, пикселем, содержащимся в символьной области.
[0052]
В жидкокристаллическом дисплее множество пикселей основных цветов, каждый образующий единичный пиксель, размещают в матричной форме. Например, в трехцветных (RGB) полосах каждый единичный пиксель включает в себя RGB. Соответственно, пиксели основных цветов размещены в порядке RGBRGBRGB и т.п. Шрифтовой символ, подвергнутый процессу сглаживания, отличается тем, что значение последнего подпикселя основного цвета в вышеуказанном порядке размещения одного единичного пикселя и значение первого подпикселя основного цвета в указанном порядке размещения последующего единичного пикселя близки друг к другу. Соответственно, путем получения разности между обоими пикселями последовательно в указанном порядке размещения можно произвести оценивание того, содержится ли пиксель в символьной области шрифтового символа, подвергнутого процессу сглаживания, или в области изображения.
[0053]
Например, значения подпикселей основных цветов единичных пикселей с (1,1) по (1,4), размещенных на ФИГ.4, показаны на ФИГ. 8. На ФИГ. 8 значение последнего подпикселя В основного цвета единичного пикселя (1,1) составляет "207"; значение первого подпикселя основного цвета R последующего единичного пикселя (1,2) в указанном порядке размещения составляет "159"; а разность составляет "48". Путем получения такой разности последовательно в указанном порядке размещения получают разности между соответствующими соседними единичными пикселями.
[0054]
Если эти разности меньше, чем заранее определенное пороговое значение, единичные пиксели оценивают в качестве пикселей символьной области. Причина этого заключается в том, что разности между соответствующими соседними подпикселями стремятся иметь одно и то же значение. Для осуществления такого распознавания может быть использовано вышеуказанное распознающее устройство гистограммного типа.
[0055]
В настоящем варианте реализации изобретения R, G и В использованы в качестве подпикселей основных цветов, однако могут быть использованы иные основные цвета. С, М, Y или тому подобное.
[0056]
В дополнение к трем основным цветам может быть использован один другой основной цвет или может быть использовано большее количество других основных цветов.
[0057]
В настоящем варианте реализации изобретения оценивание того, что пиксель, представляющий интерес, является единичным пикселем, содержащимся в символьной области, производят на основании соотношения между репрезентативными значениями единичных пикселей. В частности, оценивание того, является ли пиксель, представляющий интерес, пикселем символьной области, выполняют на основании того, превосходит ли общая сумма с первого по третий наибольших значений репрезентативных значений смежных девяти пикселей пороговое значение. Однако способ выполнения оценивания символьной области может быть реализован иными способами, отличающимися от описанного выше.
[0058]
В настоящем варианте реализации изобретения наибольшие значения получают в качестве репрезентативного значения каждого пикселя в области оценивания. Это репрезентативное значение может быть получено в любое время, пока они существуют, когда это необходимо.
[0059]
В настоящем варианте реализации изобретения количество или форма смежных единичных пикселей, включающих в себя единичный пиксель, представляющий интерес, образует 1*9, однако такое количество или такая форма может образовывать, например, 3*3. Кроме того, количество или форма составных пикселей не ограничивается каким-либо конкретным вариантом.
[0060]
Кроме того, можно выполнить монитор или дополнительное внешнее преобразовательное устройство, включая устройство оценивания символьной области пикселя согласно настоящему варианту реализации изобретения. Такое дополнительное внешнее преобразовательное устройство может быть выполнено в виде коммутационного концентратора для переключения монитора назначения входных данных на другой монитор.
[0061]
В настоящем варианте реализации изобретения функции, показанные на ФИГ. 1, реализуются посредством использования центрального обрабатывающего блока 23 и выполнения программного обеспечения. Еще в одном варианте реализации изобретения некоторые или все из указанных функций могут быть реализованы использованием аппаратных средств, таких как логическая схема. Кроме того, часть программы может быть выполнена операционной системой (OS).
ОПИСАНИЕ ЧИСЛОВЫХ ОБОЗНАЧЕНИЙ
[0062]
23 центральный обрабатывающий блок
25 оперативное запоминающее устройство
26 электрически перепрограммируемое постоянное запоминающее устройство

Claims (11)

1. Способ оценивания того, содержится ли единичный пиксель в символьной области на экране дисплея, имеющем множество единичных пикселей, каждый из которых имеет три или большее количество подпикселей основных цветов, размещенных в нем, согласно которому:
когда задан пиксель, представляющий интерес, задают указанный пиксель, представляющий интерес, и заранее определенное количество единичных пикселей, смежных с ним, в качестве области оценивания;
определяют наибольшие значения подпикселей основных цветов каждых единичных пикселей в области оценивания в качестве репрезентативного значения указанного единичного пикселя; и
на основании гистограммы репрезентативных значений единичных пикселей в области оценивания производят оценивание того, содержится ли пиксель, представляющий интерес, в символьной области.
2. Способ по п. 1, при котором
оценивание символьной области выполняют посредством смещения пикселя, представляющего интерес, к другому пикселю и повторения задающего этапа, определительного этапа и оценочного этапа.
3. Способ оценивания того, содержится ли единичный пиксель в символьной области на экране дисплея, имеющем множество единичных пикселей, каждый из которых имеет три или большее количество подпикселей основных цветов, размещенных в нем, согласно которому:
когда задан пиксель, представляющий интерес, задают указанный пиксель, представляющий интерес, и заранее определенное количество единичных пикселей, смежных с ним, в качестве области оценивания;
определяют наименьшие значения подпикселей основных цветов каждых единичных пикселей в области оценивания в качестве репрезентативного значения указанного единичного пикселя; и
на основании гистограммы репрезентативных значений единичных пикселей в области оценивания производят оценивание того, содержится ли пиксель, представляющий интерес, в символьной области.
4. Способ по п. 3, при котором
оценивание символьной области выполняют посредством смещения пикселя, представляющего интерес, к другому пикселю и повторения задающего этапа, определительного этапа и оценочного этапа.
5. Устройство для оценивания того, содержится ли единичный пиксель в символьной области на экране дисплея, имеющем множество единичных пикселей, каждый из которых имеет три или большее количество подпикселей основных цветов, размещенных в нем, при этом устройство содержит:
задающие средства, выполненные с возможностью, когда задан пиксель, представляющий интерес, задания указанного пикселя, представляющего интерес, и заданного количества единичных пикселей, смежных с ним, в качестве области оценивания;
определительные средства, выполненные с возможностью определения наибольших значений подпикселей основных цветов каждых единичных пикселей в области оценивания в качестве репрезентативного значения указанного единичного пикселя; и
оценочные средства, выполненные с возможностью оценивания того, содержится ли пиксель, представляющий интерес, в символьной области на основании гистограммы репрезентативных значений единичных пикселей в области оценивания.
6. Устройство для оценивания того, содержится ли единичный пиксель в символьной области на экране дисплея, имеющем множество единичных пикселей, каждый из которых имеет три или большее количество подпикселей основных цветов, размещенных в нем, при этом устройство содержит:
задающие средства, выполненные с возможностью, когда задан пиксель, представляющий интерес, задания указанного пикселя, представляющего интерес, и заданного количества единичных пикселей, смежных с ним, в качестве области оценивания;
определительные средства, выполненные с возможностью определения наименьших значений подпикселей основных цветов каждых единичных пикселей в области оценивания в качестве репрезентативного значения указанного единичного пикселя; и
оценочные средства, выполненные с возможностью оценивания того, содержится ли пиксель, представляющий интерес, в символьной области на основании гистограммы репрезентативных значений единичных пикселей в области оценивания.
7. Монитор, содержащий устройство по любому из пп. 5-6.
8. Дополнительное внешнее преобразовательное устройство, содержащее устройство по любому из пп. 5-6.
9. Дополнительное внешнее преобразовательное устройство по п. 8, в котором дополнительное внешнее преобразовательное устройство выполнено в виде коммутационного концентратора для переключения монитора назначения входных данных на другой монитор.
10. Машиночитаемый носитель, хранящий программу, обусловливающую выполнение компьютером процесса оценивания пикселей символьной области для оценивания того, содержится ли единичный пиксель в символьной области на экране дисплея, имеющем множество единичных пикселей, каждый из которых имеет три или большее количество подпикселей основных цветов, размещенных в нем, при этом программа обуславливает работу компьютера в качестве:
задающих средств, выполненных с возможностью, когда задан пиксель, представляющий интерес, задания указанного пикселя, представляющего интерес, и заданного количества единичных пикселей, смежных с ним, в качестве области оценивания;
определительных средств, выполненных с возможностью определения наибольших значений подпикселей основных цветов каждых единичных пикселей в области оценивания в качестве репрезентативного значения указанного единичного пикселя; и
оценочных средств, выполненных с возможностью оценивания того, содержится ли пиксель, представляющий интерес, в символьной области на основании гистограммы репрезентативных значений единичных пикселей в области оценивания.
11. Машиночитаемый носитель, хранящий программу, обусловливающую выполнение компьютером процесса оценивания пикселей символьной области для оценивания того, содержится ли единичный пиксель в символьной области на экране дисплея, имеющем множество единичных пикселей, каждый из которых имеет три или большее количество подпикселей основных цветов, размещенных в нем, при этом программа обуславливает работу компьютера в качестве:
задающих средств, выполненных с возможностью, когда задан пиксель, представляющий интерес, задания указанного пикселя, представляющего интерес, и заданного количества единичных пикселей, смежных с ним, в качестве области оценивания;
определительных средств, выполненных с возможностью определения наименьших значений подпикселей основных цветов каждых единичных пикселей в области оценивания в качестве репрезентативного значения указанного единичного пикселя; и
оценочных средств, выполненных с возможностью оценивания того, содержится ли пиксель, представляющий интерес, в символьной области на основании гистограммы репрезентативных значений единичных пикселей в области оценивания.
RU2013154987/08A 2011-06-14 2011-09-09 Устройство для идентификации символьной области пикселя и способ RU2602348C2 (ru)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2011131910A JP4937417B1 (ja) 2011-06-14 2011-06-14 文字領域画素判定装置またはその方法
JP2011-131910 2011-06-14
PCT/JP2011/070573 WO2012172699A1 (ja) 2011-06-14 2011-09-09 文字領域画素判定装置またはその方法

Publications (2)

Publication Number Publication Date
RU2013154987A RU2013154987A (ru) 2015-07-20
RU2602348C2 true RU2602348C2 (ru) 2016-11-20

Family

ID=46395317

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2013154987/08A RU2602348C2 (ru) 2011-06-14 2011-09-09 Устройство для идентификации символьной области пикселя и способ

Country Status (7)

Country Link
US (1) US9430959B2 (ru)
EP (1) EP2722819A4 (ru)
JP (1) JP4937417B1 (ru)
CN (1) CN103548057B (ru)
AU (1) AU2011371057B2 (ru)
RU (1) RU2602348C2 (ru)
WO (1) WO2012172699A1 (ru)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6472336B2 (ja) 2014-06-18 2019-02-20 キヤノン株式会社 画像処理装置、画像処理方法およびプログラム
CN110349530B (zh) * 2019-06-12 2021-07-23 北海惠科光电技术有限公司 文字边界的处理方法、显示面板及计算机可读存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4953013A (en) * 1987-10-08 1990-08-28 Ricoh Company, Ltd. Color image processing device
US5315382A (en) * 1990-06-20 1994-05-24 Canon Kabushiki Kaisha Image processing apparatus
US6473202B1 (en) * 1998-05-20 2002-10-29 Sharp Kabushiki Kaisha Image processing apparatus
RU83870U1 (ru) * 2009-03-18 2009-06-20 Лебедев Данила Валентинович Информационная система

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3048155B2 (ja) * 1989-05-10 2000-06-05 キヤノン株式会社 画像処理装置
US5119185A (en) 1989-05-10 1992-06-02 Canon Kabushiki Kaisha Image processing apparatus including a minimum value signal detector unit
JPH05268518A (ja) * 1992-03-19 1993-10-15 Nippon Telegr & Teleph Corp <Ntt> 映像処理装置
JP3334385B2 (ja) * 1994-12-20 2002-10-15 セイコーエプソン株式会社 画像読み取り装置および読み取り方法
US6504949B2 (en) * 1997-08-19 2003-01-07 Canon Kabushiki Kaisha Image processing apparatus and method
JP3472479B2 (ja) * 1998-05-22 2003-12-02 シャープ株式会社 画像処理装置
JP4271878B2 (ja) * 2001-03-22 2009-06-03 株式会社日立製作所 映像中の文字検索方法及び装置並びに文字検索処理プログラム
ATE459908T1 (de) * 2001-05-02 2010-03-15 Bitstream Inc Verfahren, systeme und programmierung zur herstellung und anzeige von subpixeloptimierten font-bitmaps unter verwendung eines nichtlinearen farbausgleichs
WO2003038801A1 (en) * 2001-11-02 2003-05-08 Telefonaktiebolaget Lm Ericsson (Publ) Method and device providing enhanced characters
JP3855805B2 (ja) * 2002-03-07 2006-12-13 ブラザー工業株式会社 画像処理装置および画像処理方法
US6993185B2 (en) 2002-08-30 2006-01-31 Matsushita Electric Industrial Co., Ltd. Method of texture-based color document segmentation
JP4118749B2 (ja) * 2002-09-05 2008-07-16 株式会社リコー 画像処理装置、画像処理プログラムおよび記憶媒体
KR100533823B1 (ko) * 2003-09-15 2005-12-07 삼성전자주식회사 복수의 디스플레이가 연결된 셋톱박스 및 디스플레이상호간의 통신방법
US7428331B2 (en) * 2004-11-30 2008-09-23 Seiko Epson Corporation Page background estimation using color, texture and edge features
KR100745753B1 (ko) * 2005-11-21 2007-08-02 삼성전자주식회사 영상의 문자 영역 검출장치 및 방법
US8300080B2 (en) * 2007-06-29 2012-10-30 Microsoft Corporation Techniques for detecting a display device
JP5132530B2 (ja) * 2008-02-19 2013-01-30 キヤノン株式会社 画像符号化装置及び画像処理装置及びそれらの制御方法
JP5049920B2 (ja) * 2008-08-26 2012-10-17 キヤノン株式会社 画像処理装置及び画像処理方法
US8786781B2 (en) * 2009-04-09 2014-07-22 Ati Technologies Ulc Detection and enhancement of in-video text
CN102096903B (zh) * 2009-12-14 2013-01-02 北大方正集团有限公司 一种页面光栅化文字平滑处理方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4953013A (en) * 1987-10-08 1990-08-28 Ricoh Company, Ltd. Color image processing device
US5315382A (en) * 1990-06-20 1994-05-24 Canon Kabushiki Kaisha Image processing apparatus
US6473202B1 (en) * 1998-05-20 2002-10-29 Sharp Kabushiki Kaisha Image processing apparatus
RU83870U1 (ru) * 2009-03-18 2009-06-20 Лебедев Данила Валентинович Информационная система

Also Published As

Publication number Publication date
JP2013005074A (ja) 2013-01-07
US9430959B2 (en) 2016-08-30
CN103548057B (zh) 2016-04-20
RU2013154987A (ru) 2015-07-20
US20140118389A1 (en) 2014-05-01
JP4937417B1 (ja) 2012-05-23
AU2011371057A1 (en) 2014-01-16
CN103548057A (zh) 2014-01-29
EP2722819A1 (en) 2014-04-23
AU2011371057B2 (en) 2016-01-07
EP2722819A4 (en) 2015-06-24
WO2012172699A1 (ja) 2012-12-20

Similar Documents

Publication Publication Date Title
US9812086B2 (en) Method for displaying by determined color result image of area extraction result
KR100818988B1 (ko) 영상신호 처리 방법 및 장치
US8121403B2 (en) Methods and systems for glyph-pixel selection
EP2790178B1 (en) Data processing device and display system including the same with compensation for missing colours in a displayed text
EP1986444A2 (en) White balance adjusting device, imaging apparatus, and white balance adjusting program
CN110246129B (zh) 图像检测方法、装置、计算机可读存储介质和计算机设备
US20210193018A1 (en) Image processing method and display device
WO2015035744A1 (zh) 一种图像处理方法
US8000535B2 (en) Methods and systems for refining text segmentation results
RU2602348C2 (ru) Устройство для идентификации символьной области пикселя и способ
CN108921869B (zh) 一种图像二值化方法及装置
JP5151708B2 (ja) 画像処理装置および画像処理プログラム
US8223395B2 (en) Methods and systems for refining text color in a digital image
CN115423724B (zh) 强化学习参数优化的水下图像增强方法、装置及介质
CN111317426A (zh) 一种内窥镜参数自适应调整方法和装置
US20090041344A1 (en) Methods and Systems for Determining a Background Color in a Digital Image
US10915780B2 (en) Error block determination
JP2015012491A (ja) 画像処理装置
CN109087362B (zh) 确定图像中主色的系统和方法及非暂态计算机可读介质
US20070195110A1 (en) Image display apparatus and method employing selective smoothing
US10262430B2 (en) Annotation line determining unit, annotation line removing unit, medical display, and method therefor
CN100366046C (zh) 影像文字增强的方法
US9147124B2 (en) Method of detecting transition area and apparatus for processing image using the same
CN109712126B (zh) 图片识别方法及装置
US20170161916A1 (en) High performance and more accurate method and implementation for solid color background removal

Legal Events

Date Code Title Description
MM4A The patent is invalid due to non-payment of fees

Effective date: 20200910