RU2013104245A - Способ и система преобразования моментального снимка экрана в метафайл - Google Patents

Способ и система преобразования моментального снимка экрана в метафайл Download PDF

Info

Publication number
RU2013104245A
RU2013104245A RU2013104245/08A RU2013104245A RU2013104245A RU 2013104245 A RU2013104245 A RU 2013104245A RU 2013104245/08 A RU2013104245/08 A RU 2013104245/08A RU 2013104245 A RU2013104245 A RU 2013104245A RU 2013104245 A RU2013104245 A RU 2013104245A
Authority
RU
Russia
Prior art keywords
text
fragments
screenshot
module
color
Prior art date
Application number
RU2013104245/08A
Other languages
English (en)
Other versions
RU2534005C2 (ru
Inventor
Сергей Михайлович Михеев
Илья Васильевич Курилин
Илья Владимирович Сафонов
Алексей Михайлович Вилькин
Original Assignee
Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд."
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд." filed Critical Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд."
Priority to RU2013104245/08A priority Critical patent/RU2534005C2/ru
Priority to KR1020140003340A priority patent/KR101887929B1/ko
Publication of RU2013104245A publication Critical patent/RU2013104245A/ru
Application granted granted Critical
Publication of RU2534005C2 publication Critical patent/RU2534005C2/ru

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/40Image enhancement or restoration using histogram techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Image Processing (AREA)

Abstract

1. Способ преобразования моментального снимка экрана (скриншота) в метафайл, включающий в себя выполнение следующих операций:- обнаруживают фрагменты текста на скриншоте;- оценивают цвет фона и цвет символов на каждом фрагменте;- векторизуют контура символов;- модифицируют скриншот за счет заполнения фрагментов текста цветом фона;- создают метафайл на основе модифицированного скриншота и векторизованных контуров, заполненных цветом текста.2. Способ по п.1, отличающийся тем, что фрагменты текста на скриншоте обнаруживают путем выполнения следующих операций:- обнаруживают соседние пиксели с высоким значением горизонтального градиента;- объединяют соседние пиксели во фрагменты;- анализируют гистограммы фрагментов на предмет обнаружения признаков сглаженного текста;- выделяют фрагменты с признаками сглаженного текста.3. Способ по п.2, отличающийся тем, что объединяют соседние пиксели во фрагменты посредством морфологического расширения (дилатапии) и определения ограничивающих прямоугольников для каждой связанной группы пикселей.4. Способ по п.2, отличающийся тем, что в процессе анализа гистограммы фрагментов обнаружение признаков сглаженного текста осуществляют за счет того, что подсчитывают количество изолированных групп с ненулевыми столбцами для каждого цвета и проверяют это количество на превышение заданного порога.5. Способ по п.1, отличающийся тем, что цвет фона и цвет символов на каждом фрагменте оценивают на основе определения крайних столбцов гистограммы фрагмента.6. Способ по п.1, отличающийся тем, что фрагменты текста на скриншоте обнаруживают путем выполнения следующих операций:- делят скриншот �

Claims (10)

1. Способ преобразования моментального снимка экрана (скриншота) в метафайл, включающий в себя выполнение следующих операций:
- обнаруживают фрагменты текста на скриншоте;
- оценивают цвет фона и цвет символов на каждом фрагменте;
- векторизуют контура символов;
- модифицируют скриншот за счет заполнения фрагментов текста цветом фона;
- создают метафайл на основе модифицированного скриншота и векторизованных контуров, заполненных цветом текста.
2. Способ по п.1, отличающийся тем, что фрагменты текста на скриншоте обнаруживают путем выполнения следующих операций:
- обнаруживают соседние пиксели с высоким значением горизонтального градиента;
- объединяют соседние пиксели во фрагменты;
- анализируют гистограммы фрагментов на предмет обнаружения признаков сглаженного текста;
- выделяют фрагменты с признаками сглаженного текста.
3. Способ по п.2, отличающийся тем, что объединяют соседние пиксели во фрагменты посредством морфологического расширения (дилатапии) и определения ограничивающих прямоугольников для каждой связанной группы пикселей.
4. Способ по п.2, отличающийся тем, что в процессе анализа гистограммы фрагментов обнаружение признаков сглаженного текста осуществляют за счет того, что подсчитывают количество изолированных групп с ненулевыми столбцами для каждого цвета и проверяют это количество на превышение заданного порога.
5. Способ по п.1, отличающийся тем, что цвет фона и цвет символов на каждом фрагменте оценивают на основе определения крайних столбцов гистограммы фрагмента.
6. Способ по п.1, отличающийся тем, что фрагменты текста на скриншоте обнаруживают путем выполнения следующих операций:
- делят скриншот на пересекающиеся прямоугольные блоки;
- вычисляют признаки для каждого блока;
- классифицируют каждый блок как текстовый или не текстовый;
- объединяют соседние блоки во фрагменты текста.
7. Способ по п.6, отличающийся тем, что для каждого блока вычисляют следующие характерные признаки:
- число ненулевых столбцов b+ и нулевых столбцов b0 раздельно для каждого канала цветового пространства RGB;
- среднюю яркость блока: I ¯ i = r = 1 N c = 1 N I i ( r , c ) N 2
Figure 00000001
, где Ii(r, c) - яркость пикселя, расположенного в строке r и столбце c, N - количество пикселей в блоке;
- среднюю разность средних яркостей блоков Ik в 4-х связном соседстве с блоком Ii: d I ¯ i = k = 1 4 | I ¯ i I ¯ k | 4
Figure 00000002
;
- среднее значение вертикальных d I y i
Figure 00000003
и горизонтальных d I x i
Figure 00000004
производных по блокам: d x , y I ¯ i = r = 1 N c = 1 N 1 d I x i ( r , c ) + r = 1 N 1 c = 1 N d I y i ( r , c ) + 2 N ( N 1 )
Figure 00000005
;
- однородность блока: H = i , j N d ( i , j ) 1 + | i j |
Figure 00000006
, где Nd - это нормированная матрица вхождений, d - определяет пространственную связь;
- процент пикселей с градиентом выше порога: P g = ( r , c ) B i { 1 | I i ( r , c ) > T } / N 2
Figure 00000007
где ∇Ii(r, c) вычисляется как квадратный корень из суммы квадратов горизонтальных и вертикальных производных;
- процент изменений яркостей пикселей на изображении I i o
Figure 00000008
, полученном в результате применения операции морфологического открытия к бинарному изображению I i b
Figure 00000009
, полученному бинаризацией с пороговым значением 128: P m = ( r , c ) B i { 1 | I i o ( r , c ) I i b ( r , c ) } / N 2
Figure 00000010
.
8. Способ по п.6, отличающийся тем, что классифицируют каждый блок как текстовый или не текстовый по одному из следующих способов: бустинг комитета решающих деревьев, случайный лес решающих деревьев, машина опорных векторов, способ K-ближайших соседей.
9. Способ по п.1, отличающийся тем, что векторизуют контуры символов путем выполнения следующих операций:
- преобразуют фрагмент текста в полутоновое изображение;
- повышают разрешение полутонового изображения;
- бинаризуют фрагмент повышенного разрешения;
- отслеживают точки контуров символов в пределах фрагментов для описания траектории контуров;
- сокращают числа вершин контуров;
- аппроксимируют траекторию контуров с сокращенным числом вершин последовательностью отрезков прямых и кривых.
10. Система преобразования моментального снимка экрана (скриншота) в метафайл, включающая в себя:
- модуль сегментации текста, выполненный с возможностью сегментации текста, создания размеченной карты сегментированного текста и определения координат фрагментов, содержащих текст; причем на вход модуля поступает исходное растровое изображение скриншота, выходы модуля сегментации текста подключены к входам модулей векторизации и ретуширования, куда передается карта, а также к входу модуля оценки цвета, куда передаются координаты фрагментов и исходный скриншот;
- модуль оценки цвета, выполненный с возможностью определения цвета фона и текста для каждого фрагмента; на вход модуля поступают с выхода модуля сегментации текста координаты фрагментов и исходный скриншот; выходы модуля оценки цвета подключены к входу модуля ретуширования и входу модуля создания метафайла;
- модуль векторизации, выполненный с возможностью аппроксимации контуров символов на карте сегментированного текста замкнутой последовательностью отрезков прямых и кривых; вход модуля подключен к выходу модуля сегментации с возможностью получения карты; выход модуля векторизации подключен к входу модуля создания метафайла;
- модуль ретуширования текста, выполненный с возможностью модификации исходного растрового изображения скриншота посредством закрашивания области фрагментов с текстом соответствующим цветом фона; вход модуля подключен к выходу модуля оценки цвета; выход модуля подключен к входу модуль создания метафайла, куда передается модифицированный скриншот;
- модуль создания метафайла, выполненный с возможностью формирования метафайла из следующих записей: модифицированного скриншота, замкнутых последовательностей отрезков прямых и кривых, заполненных соответствующим цветом символа.
RU2013104245/08A 2013-02-01 2013-02-01 Способ и система преобразования моментального снимка экрана в метафайл RU2534005C2 (ru)

Priority Applications (2)

Application Number Priority Date Filing Date Title
RU2013104245/08A RU2534005C2 (ru) 2013-02-01 2013-02-01 Способ и система преобразования моментального снимка экрана в метафайл
KR1020140003340A KR101887929B1 (ko) 2013-02-01 2014-01-10 이미지 처리 장치, 이미지 처리 방법, 컴퓨터 판독가능 기록매체 및 화상형성장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2013104245/08A RU2534005C2 (ru) 2013-02-01 2013-02-01 Способ и система преобразования моментального снимка экрана в метафайл

Publications (2)

Publication Number Publication Date
RU2013104245A true RU2013104245A (ru) 2014-08-10
RU2534005C2 RU2534005C2 (ru) 2014-11-27

Family

ID=51354900

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2013104245/08A RU2534005C2 (ru) 2013-02-01 2013-02-01 Способ и система преобразования моментального снимка экрана в метафайл

Country Status (2)

Country Link
KR (1) KR101887929B1 (ru)
RU (1) RU2534005C2 (ru)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110727495A (zh) * 2019-10-18 2020-01-24 深圳市比量科技传媒有限公司 一种界面元素的自动分段截图方法及系统
CN110930302A (zh) * 2018-08-30 2020-03-27 珠海金山办公软件有限公司 一种图片处理方法、装置、电子设备及可读存储介质

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105338399A (zh) * 2015-10-29 2016-02-17 小米科技有限责任公司 图像获取方法及装置
KR102053659B1 (ko) * 2017-09-13 2019-12-09 (주)다비오 기계학습과 이미지 프로세싱을 이용한 지도 제작 장치

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3446794B2 (ja) * 1996-08-26 2003-09-16 株式会社日本デジタル研究所 文字認識における多角形近似法および文字認識装置
US6169607B1 (en) * 1996-11-18 2001-01-02 Xerox Corporation Printing black and white reproducible colored test documents
WO2002056289A1 (en) * 2001-01-09 2002-07-18 Yitzchak Irving Twersky Improved apparatus and methods for replacing decorative images with text and/or graphical patterns
JP2003324604A (ja) * 2002-05-07 2003-11-14 Sharp Corp 画像処理装置、画像形成装置、画像処理方法、プログラム、および記録媒体
JP4857173B2 (ja) * 2007-04-25 2012-01-18 日立オムロンターミナルソリューションズ株式会社 画像処理装置、画像処理方法及び画像処理プログラム
US8135230B2 (en) * 2007-07-30 2012-03-13 Dolby Laboratories Licensing Corporation Enhancing dynamic ranges of images
US20090148043A1 (en) * 2007-12-06 2009-06-11 International Business Machines Corporation Method for extracting text from a compound digital image
JP5047051B2 (ja) * 2008-05-02 2012-10-10 キヤノン株式会社 画像処理装置及び画像符号化方法
JP5159588B2 (ja) * 2008-12-05 2013-03-06 キヤノン株式会社 画像処理装置、画像処理方法、コンピュータプログラム
US8565554B2 (en) * 2010-01-09 2013-10-22 Microsoft Corporation Resizing of digital images
JP2012003480A (ja) * 2010-06-16 2012-01-05 Nippon Hoso Kyokai <Nhk> テロップ文字領域検出装置、及びプログラム
CN102194114B (zh) * 2011-06-25 2012-11-07 电子科技大学 一种基于边缘梯度方向金字塔直方图的虹膜识别方法
RU2469400C1 (ru) * 2011-11-17 2012-12-10 Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд." Способ преобразования растрового изображения в метафайл

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110930302A (zh) * 2018-08-30 2020-03-27 珠海金山办公软件有限公司 一种图片处理方法、装置、电子设备及可读存储介质
CN110930302B (zh) * 2018-08-30 2024-03-26 珠海金山办公软件有限公司 一种图片处理方法、装置、电子设备及可读存储介质
CN110727495A (zh) * 2019-10-18 2020-01-24 深圳市比量科技传媒有限公司 一种界面元素的自动分段截图方法及系统
CN110727495B (zh) * 2019-10-18 2022-12-23 深圳市比量科技传媒有限公司 一种界面元素的自动分段截图方法及系统

Also Published As

Publication number Publication date
KR101887929B1 (ko) 2018-08-13
RU2534005C2 (ru) 2014-11-27
KR20140099183A (ko) 2014-08-11

Similar Documents

Publication Publication Date Title
US10423827B1 (en) Image text recognition
CN108960229B (zh) 一种面向多方向的文字检测方法和装置
US9275030B1 (en) Horizontal and vertical line detection and removal for document images
TW201732651A (zh) 一種單詞的分割方法和裝置
CN104361336A (zh) 一种水下视频图像的文字识别方法
CN103093228A (zh) 一种在自然场景图像中基于连通域的中文检测方法
CN110598566A (zh) 图像处理方法、装置、终端和计算机可读存储介质
CN104008401A (zh) 一种图像文字识别的方法及装置
KR20110094709A (ko) 문자 영역 추출을 위한 영상 생성 장치 및 방법
CN105447834A (zh) 一种基于特征分类的麻将图像光照不均校正方法
CN112883926B (zh) 表格类医疗影像的识别方法及装置
RU2013104245A (ru) Способ и система преобразования моментального снимка экрана в метафайл
JP2019016350A (ja) 電子文書における強調テキストの識別
Agarwal et al. An efficient algorithm for automatic car plate detection & recognition
JP2011248702A (ja) 画像処理装置、画像処理方法、画像処理プログラム及びプログラム記憶媒体
CN109741273A (zh) 一种手机拍照低质图像的自动处理与评分方法
Bala et al. Image simulation for automatic license plate recognition
JP2019003534A (ja) 画像処理プログラム、画像処理装置、及び画像処理方法
Kaur et al. Text Extraction from Natural Scene using PCA.
Biller et al. Evolution maps for connected components in text documents
Mohana et al. Era identification and recognition of Ganga and Hoysala phase Kannada stone inscriptions characters using advance recognition algorithm
CN111476243A (zh) 影像文字识别方法及装置
Sambyal et al. Connected component based English character set segmentation
Kadam et al. A hybrid approach to detect and recognize texts in images
Vishwas et al. Text line segmentation of unconstrained handwritten kannada historical script documents

Legal Events

Date Code Title Description
PD4A Correction of name of patent owner
PC41 Official registration of the transfer of exclusive right

Effective date: 20170921

PD4A Correction of name of patent owner
MM4A The patent is invalid due to non-payment of fees

Effective date: 20200202