RU2013104245A - Способ и система преобразования моментального снимка экрана в метафайл - Google Patents
Способ и система преобразования моментального снимка экрана в метафайл Download PDFInfo
- Publication number
- RU2013104245A RU2013104245A RU2013104245/08A RU2013104245A RU2013104245A RU 2013104245 A RU2013104245 A RU 2013104245A RU 2013104245/08 A RU2013104245/08 A RU 2013104245/08A RU 2013104245 A RU2013104245 A RU 2013104245A RU 2013104245 A RU2013104245 A RU 2013104245A
- Authority
- RU
- Russia
- Prior art keywords
- text
- fragments
- screenshot
- module
- color
- Prior art date
Links
- 239000012634 fragment Substances 0.000 claims abstract 33
- 238000000034 method Methods 0.000 claims abstract 19
- 238000001514 detection method Methods 0.000 claims abstract 3
- 230000000877 morphologic effect Effects 0.000 claims abstract 3
- 230000011218 segmentation Effects 0.000 claims 4
- 238000011156 evaluation Methods 0.000 claims 3
- 238000003066 decision tree Methods 0.000 claims 2
- 239000011159 matrix material Substances 0.000 claims 1
- 238000007637 random forest analysis Methods 0.000 claims 1
- 238000012706 support-vector machine Methods 0.000 claims 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/387—Composing, repositioning or otherwise geometrically modifying originals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/40—Image enhancement or restoration using histogram techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Facsimile Image Signal Circuits (AREA)
- Image Processing (AREA)
Abstract
1. Способ преобразования моментального снимка экрана (скриншота) в метафайл, включающий в себя выполнение следующих операций:- обнаруживают фрагменты текста на скриншоте;- оценивают цвет фона и цвет символов на каждом фрагменте;- векторизуют контура символов;- модифицируют скриншот за счет заполнения фрагментов текста цветом фона;- создают метафайл на основе модифицированного скриншота и векторизованных контуров, заполненных цветом текста.2. Способ по п.1, отличающийся тем, что фрагменты текста на скриншоте обнаруживают путем выполнения следующих операций:- обнаруживают соседние пиксели с высоким значением горизонтального градиента;- объединяют соседние пиксели во фрагменты;- анализируют гистограммы фрагментов на предмет обнаружения признаков сглаженного текста;- выделяют фрагменты с признаками сглаженного текста.3. Способ по п.2, отличающийся тем, что объединяют соседние пиксели во фрагменты посредством морфологического расширения (дилатапии) и определения ограничивающих прямоугольников для каждой связанной группы пикселей.4. Способ по п.2, отличающийся тем, что в процессе анализа гистограммы фрагментов обнаружение признаков сглаженного текста осуществляют за счет того, что подсчитывают количество изолированных групп с ненулевыми столбцами для каждого цвета и проверяют это количество на превышение заданного порога.5. Способ по п.1, отличающийся тем, что цвет фона и цвет символов на каждом фрагменте оценивают на основе определения крайних столбцов гистограммы фрагмента.6. Способ по п.1, отличающийся тем, что фрагменты текста на скриншоте обнаруживают путем выполнения следующих операций:- делят скриншот �
Claims (10)
1. Способ преобразования моментального снимка экрана (скриншота) в метафайл, включающий в себя выполнение следующих операций:
- обнаруживают фрагменты текста на скриншоте;
- оценивают цвет фона и цвет символов на каждом фрагменте;
- векторизуют контура символов;
- модифицируют скриншот за счет заполнения фрагментов текста цветом фона;
- создают метафайл на основе модифицированного скриншота и векторизованных контуров, заполненных цветом текста.
2. Способ по п.1, отличающийся тем, что фрагменты текста на скриншоте обнаруживают путем выполнения следующих операций:
- обнаруживают соседние пиксели с высоким значением горизонтального градиента;
- объединяют соседние пиксели во фрагменты;
- анализируют гистограммы фрагментов на предмет обнаружения признаков сглаженного текста;
- выделяют фрагменты с признаками сглаженного текста.
3. Способ по п.2, отличающийся тем, что объединяют соседние пиксели во фрагменты посредством морфологического расширения (дилатапии) и определения ограничивающих прямоугольников для каждой связанной группы пикселей.
4. Способ по п.2, отличающийся тем, что в процессе анализа гистограммы фрагментов обнаружение признаков сглаженного текста осуществляют за счет того, что подсчитывают количество изолированных групп с ненулевыми столбцами для каждого цвета и проверяют это количество на превышение заданного порога.
5. Способ по п.1, отличающийся тем, что цвет фона и цвет символов на каждом фрагменте оценивают на основе определения крайних столбцов гистограммы фрагмента.
6. Способ по п.1, отличающийся тем, что фрагменты текста на скриншоте обнаруживают путем выполнения следующих операций:
- делят скриншот на пересекающиеся прямоугольные блоки;
- вычисляют признаки для каждого блока;
- классифицируют каждый блок как текстовый или не текстовый;
- объединяют соседние блоки во фрагменты текста.
7. Способ по п.6, отличающийся тем, что для каждого блока вычисляют следующие характерные признаки:
- число ненулевых столбцов b+ и нулевых столбцов b0 раздельно для каждого канала цветового пространства RGB;
- среднюю яркость блока:
, где Ii(r, c) - яркость пикселя, расположенного в строке r и столбце c, N - количество пикселей в блоке;
- однородность блока:
, где Nd - это нормированная матрица вхождений, d - определяет пространственную связь;
- процент пикселей с градиентом выше порога:
где ∇Ii(r, c) вычисляется как квадратный корень из суммы квадратов горизонтальных и вертикальных производных;
8. Способ по п.6, отличающийся тем, что классифицируют каждый блок как текстовый или не текстовый по одному из следующих способов: бустинг комитета решающих деревьев, случайный лес решающих деревьев, машина опорных векторов, способ K-ближайших соседей.
9. Способ по п.1, отличающийся тем, что векторизуют контуры символов путем выполнения следующих операций:
- преобразуют фрагмент текста в полутоновое изображение;
- повышают разрешение полутонового изображения;
- бинаризуют фрагмент повышенного разрешения;
- отслеживают точки контуров символов в пределах фрагментов для описания траектории контуров;
- сокращают числа вершин контуров;
- аппроксимируют траекторию контуров с сокращенным числом вершин последовательностью отрезков прямых и кривых.
10. Система преобразования моментального снимка экрана (скриншота) в метафайл, включающая в себя:
- модуль сегментации текста, выполненный с возможностью сегментации текста, создания размеченной карты сегментированного текста и определения координат фрагментов, содержащих текст; причем на вход модуля поступает исходное растровое изображение скриншота, выходы модуля сегментации текста подключены к входам модулей векторизации и ретуширования, куда передается карта, а также к входу модуля оценки цвета, куда передаются координаты фрагментов и исходный скриншот;
- модуль оценки цвета, выполненный с возможностью определения цвета фона и текста для каждого фрагмента; на вход модуля поступают с выхода модуля сегментации текста координаты фрагментов и исходный скриншот; выходы модуля оценки цвета подключены к входу модуля ретуширования и входу модуля создания метафайла;
- модуль векторизации, выполненный с возможностью аппроксимации контуров символов на карте сегментированного текста замкнутой последовательностью отрезков прямых и кривых; вход модуля подключен к выходу модуля сегментации с возможностью получения карты; выход модуля векторизации подключен к входу модуля создания метафайла;
- модуль ретуширования текста, выполненный с возможностью модификации исходного растрового изображения скриншота посредством закрашивания области фрагментов с текстом соответствующим цветом фона; вход модуля подключен к выходу модуля оценки цвета; выход модуля подключен к входу модуль создания метафайла, куда передается модифицированный скриншот;
- модуль создания метафайла, выполненный с возможностью формирования метафайла из следующих записей: модифицированного скриншота, замкнутых последовательностей отрезков прямых и кривых, заполненных соответствующим цветом символа.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU2013104245/08A RU2534005C2 (ru) | 2013-02-01 | 2013-02-01 | Способ и система преобразования моментального снимка экрана в метафайл |
KR1020140003340A KR101887929B1 (ko) | 2013-02-01 | 2014-01-10 | 이미지 처리 장치, 이미지 처리 방법, 컴퓨터 판독가능 기록매체 및 화상형성장치 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU2013104245/08A RU2534005C2 (ru) | 2013-02-01 | 2013-02-01 | Способ и система преобразования моментального снимка экрана в метафайл |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2013104245A true RU2013104245A (ru) | 2014-08-10 |
RU2534005C2 RU2534005C2 (ru) | 2014-11-27 |
Family
ID=51354900
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2013104245/08A RU2534005C2 (ru) | 2013-02-01 | 2013-02-01 | Способ и система преобразования моментального снимка экрана в метафайл |
Country Status (2)
Country | Link |
---|---|
KR (1) | KR101887929B1 (ru) |
RU (1) | RU2534005C2 (ru) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110727495A (zh) * | 2019-10-18 | 2020-01-24 | 深圳市比量科技传媒有限公司 | 一种界面元素的自动分段截图方法及系统 |
CN110930302A (zh) * | 2018-08-30 | 2020-03-27 | 珠海金山办公软件有限公司 | 一种图片处理方法、装置、电子设备及可读存储介质 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105338399A (zh) * | 2015-10-29 | 2016-02-17 | 小米科技有限责任公司 | 图像获取方法及装置 |
KR102053659B1 (ko) * | 2017-09-13 | 2019-12-09 | (주)다비오 | 기계학습과 이미지 프로세싱을 이용한 지도 제작 장치 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3446794B2 (ja) * | 1996-08-26 | 2003-09-16 | 株式会社日本デジタル研究所 | 文字認識における多角形近似法および文字認識装置 |
US6169607B1 (en) * | 1996-11-18 | 2001-01-02 | Xerox Corporation | Printing black and white reproducible colored test documents |
WO2002056289A1 (en) * | 2001-01-09 | 2002-07-18 | Yitzchak Irving Twersky | Improved apparatus and methods for replacing decorative images with text and/or graphical patterns |
JP2003324604A (ja) * | 2002-05-07 | 2003-11-14 | Sharp Corp | 画像処理装置、画像形成装置、画像処理方法、プログラム、および記録媒体 |
JP4857173B2 (ja) * | 2007-04-25 | 2012-01-18 | 日立オムロンターミナルソリューションズ株式会社 | 画像処理装置、画像処理方法及び画像処理プログラム |
US8135230B2 (en) * | 2007-07-30 | 2012-03-13 | Dolby Laboratories Licensing Corporation | Enhancing dynamic ranges of images |
US20090148043A1 (en) * | 2007-12-06 | 2009-06-11 | International Business Machines Corporation | Method for extracting text from a compound digital image |
JP5047051B2 (ja) * | 2008-05-02 | 2012-10-10 | キヤノン株式会社 | 画像処理装置及び画像符号化方法 |
JP5159588B2 (ja) * | 2008-12-05 | 2013-03-06 | キヤノン株式会社 | 画像処理装置、画像処理方法、コンピュータプログラム |
US8565554B2 (en) * | 2010-01-09 | 2013-10-22 | Microsoft Corporation | Resizing of digital images |
JP2012003480A (ja) * | 2010-06-16 | 2012-01-05 | Nippon Hoso Kyokai <Nhk> | テロップ文字領域検出装置、及びプログラム |
CN102194114B (zh) * | 2011-06-25 | 2012-11-07 | 电子科技大学 | 一种基于边缘梯度方向金字塔直方图的虹膜识别方法 |
RU2469400C1 (ru) * | 2011-11-17 | 2012-12-10 | Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд." | Способ преобразования растрового изображения в метафайл |
-
2013
- 2013-02-01 RU RU2013104245/08A patent/RU2534005C2/ru not_active IP Right Cessation
-
2014
- 2014-01-10 KR KR1020140003340A patent/KR101887929B1/ko active IP Right Grant
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110930302A (zh) * | 2018-08-30 | 2020-03-27 | 珠海金山办公软件有限公司 | 一种图片处理方法、装置、电子设备及可读存储介质 |
CN110930302B (zh) * | 2018-08-30 | 2024-03-26 | 珠海金山办公软件有限公司 | 一种图片处理方法、装置、电子设备及可读存储介质 |
CN110727495A (zh) * | 2019-10-18 | 2020-01-24 | 深圳市比量科技传媒有限公司 | 一种界面元素的自动分段截图方法及系统 |
CN110727495B (zh) * | 2019-10-18 | 2022-12-23 | 深圳市比量科技传媒有限公司 | 一种界面元素的自动分段截图方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
KR101887929B1 (ko) | 2018-08-13 |
RU2534005C2 (ru) | 2014-11-27 |
KR20140099183A (ko) | 2014-08-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10423827B1 (en) | Image text recognition | |
CN108960229B (zh) | 一种面向多方向的文字检测方法和装置 | |
US9275030B1 (en) | Horizontal and vertical line detection and removal for document images | |
TW201732651A (zh) | 一種單詞的分割方法和裝置 | |
CN104361336A (zh) | 一种水下视频图像的文字识别方法 | |
CN103093228A (zh) | 一种在自然场景图像中基于连通域的中文检测方法 | |
CN110598566A (zh) | 图像处理方法、装置、终端和计算机可读存储介质 | |
CN104008401A (zh) | 一种图像文字识别的方法及装置 | |
KR20110094709A (ko) | 문자 영역 추출을 위한 영상 생성 장치 및 방법 | |
CN105447834A (zh) | 一种基于特征分类的麻将图像光照不均校正方法 | |
CN112883926B (zh) | 表格类医疗影像的识别方法及装置 | |
RU2013104245A (ru) | Способ и система преобразования моментального снимка экрана в метафайл | |
JP2019016350A (ja) | 電子文書における強調テキストの識別 | |
Agarwal et al. | An efficient algorithm for automatic car plate detection & recognition | |
JP2011248702A (ja) | 画像処理装置、画像処理方法、画像処理プログラム及びプログラム記憶媒体 | |
CN109741273A (zh) | 一种手机拍照低质图像的自动处理与评分方法 | |
Bala et al. | Image simulation for automatic license plate recognition | |
JP2019003534A (ja) | 画像処理プログラム、画像処理装置、及び画像処理方法 | |
Kaur et al. | Text Extraction from Natural Scene using PCA. | |
Biller et al. | Evolution maps for connected components in text documents | |
Mohana et al. | Era identification and recognition of Ganga and Hoysala phase Kannada stone inscriptions characters using advance recognition algorithm | |
CN111476243A (zh) | 影像文字识别方法及装置 | |
Sambyal et al. | Connected component based English character set segmentation | |
Kadam et al. | A hybrid approach to detect and recognize texts in images | |
Vishwas et al. | Text line segmentation of unconstrained handwritten kannada historical script documents |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PD4A | Correction of name of patent owner | ||
PC41 | Official registration of the transfer of exclusive right |
Effective date: 20170921 |
|
PD4A | Correction of name of patent owner | ||
MM4A | The patent is invalid due to non-payment of fees |
Effective date: 20200202 |