RU2793611C1 - Способ и система защиты информации от утечки при печати документов с помощью смещения символов - Google Patents

Способ и система защиты информации от утечки при печати документов с помощью смещения символов Download PDF

Info

Publication number
RU2793611C1
RU2793611C1 RU2022106205A RU2022106205A RU2793611C1 RU 2793611 C1 RU2793611 C1 RU 2793611C1 RU 2022106205 A RU2022106205 A RU 2022106205A RU 2022106205 A RU2022106205 A RU 2022106205A RU 2793611 C1 RU2793611 C1 RU 2793611C1
Authority
RU
Russia
Prior art keywords
uid
user
document
processor
digital document
Prior art date
Application number
RU2022106205A
Other languages
English (en)
Inventor
Михаил Артурович Анистратенко
Александр Артурович Анистратенко
Иван Александрович Оболенский
Дмитрий Алексеевич Борисов
Валентин Валерьевич Сысоев
Original Assignee
Публичное Акционерное Общество "Сбербанк России" (Пао Сбербанк)
Filing date
Publication date
Application filed by Публичное Акционерное Общество "Сбербанк России" (Пао Сбербанк) filed Critical Публичное Акционерное Общество "Сбербанк России" (Пао Сбербанк)
Priority to PCT/RU2022/000382 priority Critical patent/WO2023172161A1/ru
Application granted granted Critical
Publication of RU2793611C1 publication Critical patent/RU2793611C1/ru

Links

Images

Abstract

Изобретение относится к области защиты информации, в частности к решениям для предотвращения утечки информации при печати документов. Технический результат заключается в повышении эффективности защиты данных от утечки, за счет внедрения уникального кода пользователя в документ для последующей его идентификации при анализе распечатанных документов. Технический результат достигается при осуществлении способа кодирования информации для защиты от ее утечек при печати документов, выполняемого с помощью процессора компьютерного устройства, в котором получают на компьютерном устройстве пользователя информацию о печати по меньшей мере одного цифрового документа, содержащего по меньшей мере текст, при этом компьютерное устройство связано с УИД (уникальный идентификатор) пользователя; осуществляют до момента передачи цифрового документа на печать его обработку, в ходе которой распознают буквы, содержащиеся в цифровом документе, кодируют УИД пользователя путем смещения букв по горизонтальной оси на заданное количество пикселей; передают цифровой документ на печать с закодированным УИД пользователя. 4 н. и 5 з.п. ф-лы, 5 ил., 9 табл.

Description

ОБЛАСТЬ ТЕХНИКИ
[0001] Заявленное решение относится к области защиты информации, в частности к решениям для предотвращения утечки информации при печати документов.
УРОВЕНЬ ТЕХНИКИ
[0002] Технологии предотвращения утечек (англ. Data Leak Prevention, DLP) представляют собой технологии предотвращения утечек конфиденциальной информации из информационной системы вовне, а также технические устройства (программные или программно-аппаратные) для такого предотвращения утечек.
[0003] Из патентной заявки US 20080091954 A1 (Morris et al., 17.04.2008) известно решение для проверки целостности данных, представленных на печатных документах. Решение базируется на применении уникального идентификатора, с помощью которого осуществляется анализ содержимого документа. Каждому сегменту документа присваивается цифра или группа цифр, и каждой странице или сегменту документа может быть присвоена одна цифра в общем идентификаторе. Совокупность цифр, связанных с документом, объединяется в строку аутентификации. При получении запроса на последующую обработку документа выполняется аутентификация и проверка целостности документа путем считывания представленного документа для получения строки аутентификации, и последующего сравнения новой строки с ранее сохраненной строкой. После успешного сопоставления документ считается действительным, аутентифицированным и неизмененным.
[0004] Недостатком данного решения является невозможность его использования для предотвращения утечек с целью идентификацию сотрудника, допустившего факт утечки при печати документов. Также, другим недостатком является недостаточная эффективность защиты документов, что обусловлено применением кода для сравнения аутентичности документа, что позволяет только установить факт неизменности и подлинности документа, но не предотвратить утечку информации.
СУЩНОСТЬ ИЗОБРЕТЕНИЯ
[0005] Заявленное изобретение направлено на решение технической проблемы, заключающейся в создании эффективного средства для защиты цифровой информации от утечки при ее печати.
[0006] Технический результат заключается в повышении эффективности защиты данных от утечки, за счет внедрения уникального кода пользователя в документ для последующей его идентификации при анализе распечатанных документов.
[0007] Заявленный результат достигается за счет способа кодирования информации для защиты от ее утечек при печати документов, выполняемого с помощью процессора компьютерного устройства, при этом способ содержит этапы, на которых:
получают на компьютерном устройстве пользователя информацию о печати по меньшей мере одного цифрового документа, содержащего по меньшей мере текст, при этом компьютерное устройство связано с УИД (уникальный идентификатор) пользователя;
осуществляют до момента передачи цифрового документа на печать его обработку, в ходе которой распознают буквы, содержащиеся в цифровом документе;
кодируют УИД пользователя путем смещения букв по горизонтальной оси на заданное количество пикселей;
передают цифровой документ на печать с закодированным УИД пользователя.
[0008] В одном из частных примеров реализации способа распознавание цифрового документа выполняется с помощью оптического распознавания символов (OCR).
[0009] В другом частном примере реализации способа распознаются все символы на каждой странице цифрового документа.
[0010] В другом частном примере реализации способа каждый символ УИД пользователя кодируется в двоичный код.
[0011] В другом частном примере реализации способа на основании разряда двоичного кода определяются буквы для их смещения.
[0012] Заявленный технический результат также достигается за счет осуществления способа защиты информации от утечек на печатных документах, выполняемого с помощью процессора компьютерного устройства, при этом способ содержит этапы, на которых:
получают по меньшей мере часть изображения печатного документа с закодированным УИД пользователя вышеуказанным способом;
выполняют распознавание полученного изображения;
определяют смещенные по горизонтальной оси буквы;
выполняют определение и извлечение закодированного УИД.
[0013] В одном из частных примеров выполнения способа распознавание цифрового документа выполняется с помощью OCR.
[0014] Заявленное решение также осуществляется с помощью соответствующих систем, содержащих процессор и память, которые хранят машиночитаемые инструкции для реализации каждого из вышеописанных способов.
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ
[0015] Фиг. 1 иллюстрирует блок-схему способа кодирования цифровой метки.
[0016] Фиг. 2 иллюстрирует пример смещения букв для кодирования УИД.
[0017] Фиг. 3 иллюстрирует блок-схему декодирования цифровых меток.
[0018] Фиг. 4 иллюстрирует диаграмму частоты раскрытия позиций УИД.
[0019] Фиг. 5 иллюстрирует общий вид вычислительного устройства.
ОСУЩЕСТВЛЕНИЕ ИЗОБРЕТЕНИЯ
[0020] На Фиг. 1 представлен способ (100) защиты информации в цифровых документах от утечки с помощью кодирования УИД пользователя путем смещения букв в документе. На первом этапе (101) получается информация о печати цифрового документа. Выполнение способа (100) осуществляется на компьютерном устройстве пользователя, например, сотрудника, при этом к устройству привязан УИД пользователя, позволяющий его идентифицировать. Исполнение этапа (101) одушевляется с помощью программной логики, исполняемой компьютерным устройством и может быть реализовано, например, в виде программного агента или модуля, обеспечивающего получение сигналов от процессора, свидетельствующих об отправке цифрового документа на печать. Цифровой документ представляет собой, как правило, файл и может содержать текст, графику или их сочетания.
[0021] После получения на устройстве команды на перехват и анализ документа до его отправки на принтер на этапе (102) выполняется распознавание упомянутого цифрового документа. Обработка документа выполняется с помощью технологии OCR для обеспечения распознавания букв и символов в цифровом документе.
[0022] После этапа распознавания цифрового документа на этапе (103) осуществляется процесс кодирования УИД. УИД представляет собой, например, числовой табельный номер сотрудника - цифровой код TAB, состоящий, например, из 8-ми цифр. Данный код можно представить как массив цифр ТАВ8={n1, n2, …nm}, TAB8 ∈[0…9], m=8. Схематичный вид кода представлен в таблице 1.
Figure 00000001
[0023] Каждый элемент табельного номера представляет собой число от 0 до 9, соответственно, каждый элемент табельного номера можно отобразить в двоичном виде размерностью в 4 бит, т.е. он будет представлять собой двоичное число от 1 до 1100, являющееся гомоморфизмом со сдвигом, представленным в таблице 2.
Figure 00000002
[0024] Отображение 0 в 0001 необходимо для того, чтобы фиксировать наличие 0 в табельном номере. Для кодирования элемента табельного номера в двоичном коде
Figure 00000003
i=8, необходимо 4 разряда bi={с1, с2, с3, с4}.
[0025] Главная особенность алгоритма кодировки заключается в том, что на каждую букву навешивается только один разряд в табельном номере. Схематично схема кодирования представлена в таблице 3.
Figure 00000004
Figure 00000005
[0026] Таким образом, буквы (20), у которых разряд ci=1 в тексте двигаются влево вправо на некоторое количество пикселей как это представлено на Фиг. 2.
[0027] Шифрование текста происходит следующим образом.
[0028] Пусть документ D содержит l страниц, тогда документ D - есть массив страниц, D={p1, p2, p3 … pl}, l ∈ N.
[0029] На каждой странице pi, i ∈ [1, l] считывается посимвольно текст и записывается в массив символов
Figure 00000006
где
Figure 00000007
- количество символов на странице pi. Символы распознаются с помощью, к примеру, OCR, из них выявляются русские буквы
Figure 00000008
[0030] Далее создаются 32 массива Pos1, Pos2 … Pos32, каждый из которых соответствует каждой позиции табельного номера. Каждый массивов Pos заполняется теми символами из Wruspi, которые соответствуют позиции из таблицы 3. Например, Pos1 заполняется всеми символами из Wruspi, которые имеют значения {а}, вне зависимости от регистра.
[0031] Массивы Pos1, Pos2 …Pos32 перемешиваются, к примеру, тасованием Кнута. Пусть
Figure 00000009
- размерности полученных массивов, Р - процент символов на внедрение метки Р ∈ [0,3 … 0,7], тогда каждый массив из Pos1, Pos2 … Pos32 обрезается с конца до размерности
Figure 00000010
, Pos1, Pos2 … Pos32
Figure 00000011
,
Figure 00000012
Figure 00000013
[0032] Полученные массивы
Figure 00000014
,
Figure 00000015
Figure 00000016
используются для смещения символов по вышеописанному способу. После внедрения всех меток на искомой странице pi тоже самое проделывается для следующей страницы pi+1 и так далее до конца документа pl.
[0033] Рассмотрим пример с кодированием УИД пользователя - 00013400.
[0034] В соответствии с Таблицей 2 УИД переводится в двоичную форму для последующего определения разрядов по Таблице 3. В соответствии с Таблицей 3 определяются буквы, соответствующие 1 в двоичном коде цифры УИД. Для УИД «00013400» получаются буквы: Ч Ш С Т Л Ы Ю Я. Данные буквы смещаются на заданное количество пикселей по горизонтали на каждой странице документа, направленного на печать. Изменение документа выполняется с помощью технологии OCR путем распознавания букв для замены и их замены в цифровом документе.
[0035] После внесения в документ, направленный на печать цифровых меток, кодирующих УИД, на этапе (104) выполняется его направление на печать. Распечатанный документ будет содержать закодированный УИД практически неразличимый для человеческого глаза.
[0036] На Фиг. 3 приведена последовательность этапов, выполняемых при выполнении способа (300) распознавании УИД на распечатанных документах. На этапе (301) вычислительное устройство, используемое для определения УИД в распечатанном документе, получает изображение такого документа. Изображение может содержать полностью или частично текст, с закодированном УИД, полученный, например, с помощью фотографирования внешним устройством (смартфон, камера и т.п.) или при помощи сканирования с помощью OCR распечатанного документа.
[0037] Далее на этапе (302) также при помощи технологии OCR выполняется распознавание букв в документе, при этом если страниц в документе несколько, то распознается каждая страница документа. На этапе (303) выполняется определение букв, которые смещены по горизонтали.
[0038] Принцип выявления смещенных букв в слове заключается в следующем: пусть W - слово в тексте, W={Ch1, Ch2, …, Chn} - слово представляет собой массив символов, п - количество символов в слове. Тогда пусть LW={L1, L2,... Ln-1} массив расстояний меду символами в слове, где Li=|Chi-Chi+1|, i ∈[1 … n-1]. Далее анализируется массив LW и методами выявления аномалий находятся аномалии в Li, таким, как, к примеру, локальный уровень выброса, метод k-ближайших соседей или их аналоги, в том числе построенные на нейронных сетях. Смещенным будет считаться тот символ из W, чьи индексы i будут совпадать Li→Chi.
[0039] После этого выполняется декодирование УИД на этапе (304) в соответствии с примерами в Таблицах 2 и 3. Это позволяет установить табельный номер сотрудника (пользователя), с компьютерного устройства которого была осуществлена печать документа.
[0040] Математическое обоснование метода.
[0041] Частоты раскрытия позиций ТАВ8={n1, n2, … nm}, m=8 равномерно распределены для всех m, что позволяет показать вероятность извлечения табельного номера (УИД) из текста страницы.
[0042] Для математического обоснования было проведено исследование по частоте встречающихся букв в тексте с разным содержанием, к примеру, рассмотрим, такое распределение характерное для литературных произведений. Список литературных произведений, участвующих в эксперименте: Сильмариллион. Дж. Р.Р. Толкин, Двадцать тысяч лье под водой. Жюль Г. Верн, Двадцать лет спустя. Александр Дюма, Три мушкетера. Александр Дюма, Унесенные ветром. Маргарет Митчелл, Айвенго. Вальтер Скотт, Герой нашего времени. Н.В. Гоголь, Война и мир. Л.Н.Толстой, Обитаемый остров. Борис и Аркадий Стругацкие, Преступление и наказание. Ф.М.Достоевский, Живые и мертвые. К.М. Симонов, всего 8 366 594 символов. Математическая лингвистика показала следующие вероятности частоты встречи букв русского алфавита в текстах (Таблица 5).
Figure 00000017
Figure 00000018
[0043] Для получения значения частоты раскрытия позиций ТАВ8={n1, n2, … nm} выполняются следующие действия. Из таблиц 3 и 4 известны буквы, в которые кодируются разряды. Вычисляется среднее арифметическое частот множества букв, по которым вскрыт разряд, так как для вскрытия разряда нужно иметь все буквы разряда, где есть значение 1 в
Figure 00000019
. В результате вышеописанных действий получается таблица 6.
Figure 00000020
Figure 00000021
[0044] На основании таблицы 6 формируется диаграмма, представленная на Фиг. 4. Диаграмма показывает, что частота раскрытия всех позиций распределена относительно равномерно.
[0045] Для метода нанесения точки в пространство возле буквы принимается следующее допущение: процент Р символов на внедрение метки Р=0,3, при передаче через мессенджеры теряется определенный процент М=0,7 меток.
[0046] Вычислим количество каждой буквы русского алфавита экспериментальной выборки:
Figure 00000022
[0047] Для метода нанесения точки в пространство возле буквы принимается следующее допущение: процент Р символов на внедрение метки Р=0,3, при передаче через мессенджеры теряется определенный процент М=0,7 меток. На основании вышеописанного можно вычислить вероятность распознавания текста, если для дешифрования доступно: целая страница;
Figure 00000023
страницы;
Figure 00000024
страницы.
Figure 00000025
Figure 00000026
[0048] Пример Экспериментального применения.
Figure 00000027
В ходе тестирования было распечатано и анализировано около 500 страниц разного содержания: текст, разреженный текст, текст с таблицами, текст с графиками, текст с формулами;
Figure 00000028
с разными типами шрифтов: Arial, Calibri, Times New Roman;
Figure 00000029
разное оформление текста: обычный, курсив, полужирный, подчеркнутый;
Figure 00000030
разной размерности: 12рх, 14рх;
Figure 00000031
разным межстрочным интервалом: 0.5, 1.15, 1,5;
Figure 00000032
разным межзнаковым интервалом: обычный, разреженный, уплотненный;
[0049] В каждом случае рассматривалась возможность извлечения метки с:
Figure 00000033
распечатки напрямую;
Figure 00000034
с фотографии распечатки;
Figure 00000035
переданной по мессенджеру распечатки фотографии.
[0050] Печать проводилась на офисном черно белом лазерном принтере Lexmark MX711de на офисной бумаге «Снегурочка» с белизной CIE 146 по ISO 11475.
[0051] Фотографирование производилось на телефон Samsung А51 при офисном освещении, бумага лежит горизонтально на столе, фотографирование случайное под разными, незначительными углами, порядком 2-4% в 3-х измерениях.
[0052] При передаче фотографий использовался мессенджер Telegram со сжатием изображения при отправлении.
[0053] В ходе эксперимента подбирались параметры, такие как размер меток, их оптимальные места и способы нанесения. Результаты последней фазы эксперимента показаны в таблице 9.
Figure 00000036
[0054] Вышеописанная таблица показывает хорошие результаты анализа переданных по мессенджеру фотографий распечаток на офисном черно-белом принтере. В результате эксперимента были подобраны оптимальные параметры для смещения букв, которые с одной стороны, были бы заметны на распечатках как дефекты принтера, с другой стороны, хорошо извлекались из переданных фотографий по мессенджерам.
[0055] На Фиг. 5 представлен общий вид вычислительного устройства (500), пригодного для выполнения вышеуказанных способов. Устройство (500) может представлять собой, например, компьютер, сервер или иной тип пригодного вычислительного устройства.
[0056] В общем случае вычислительное устройство (500) содержит объединенные общей шиной информационного обмена один или несколько процессоров (501), средства памяти, такие как ОЗУ (502) и ПЗУ (503), интерфейсы ввода/вывода (504), устройства ввода/вывода (505), и устройство для сетевого взаимодействия (506).
[0057] Процессор (501) (или несколько процессоров, многоядерный процессор) могут выбираться из ассортимента устройств, широко применяемых в текущее время, например, компаний Intel™, AMD™, Apple™, Samsung Exynos™, MediaTEK™, Qualcomm Snapdragon™ и т.п. В качестве процессора (501) может также применяться графический процессор, например, Nvidia, AMD, Graphcore и пр.
[0058] ОЗУ (502) представляет собой оперативную память и предназначено для хранения исполняемых процессором (501) машиночитаемых инструкций для выполнение необходимых операций по логической обработке данных. ОЗУ (502), как правило, содержит исполняемые инструкции операционной системы и соответствующих программных компонент (приложения, программные модули и т.п.).
[0059] ПЗУ (503) представляет собой одно или более устройств постоянного хранения данных, например, жесткий диск (HDD), твердотельный накопитель данных (SSD), флэш-память (EEPROM, NAND и т.п.), оптические носители информации (CD-R/RW, DVD-R/RW, BlueRay Disc, MD) и др.
[0060] Для организации работы компонентов устройства (500) и организации работы внешних подключаемых устройств применяются различные виды интерфейсов В/В (504). Выбор соответствующих интерфейсов зависит от конкретного исполнения вычислительного устройства, которые могут представлять собой, не ограничиваясь: PCI, AGP, PS/2, IrDa, Fire Wire, LPT, COM, SATA, IDE, Lightning, USB (2.0, 3.0, 3.1, micro, mini, type C), TRS/Audio jack (2.5, 3.5, 6.35), HDMI, DVI, VGA, Display Port, RJ45, RS232 и т.п.
[0061] Для обеспечения взаимодействия пользователя с вычислительным устройством (500) применяются различные средства (505) В/В информации, например, клавиатура, дисплей (монитор), сенсорный дисплей, тач-пад, джойстик, манипулятор мышь, световое перо, стилус, сенсорная панель, трекбол, динамики, микрофон, средства дополненной реальности, оптические сенсоры, планшет, световые индикаторы, проектор, камера, средства биометрической идентификации (сканер сетчатки глаза, сканер отпечатков пальцев, модуль распознавания голоса) и т.п.
[0062] Средство сетевого взаимодействия (506) обеспечивает передачу данных устройством (500) посредством внутренней или внешней вычислительной сети, например, Интранет, Интернет, ЛВС и т.п. В качестве одного или более средств (506) может использоваться, но не ограничиваться: Ethernet карта, GSM модем, GPRS модем, LTE модем, 5G модем, модуль спутниковой связи, NFC модуль, Bluetooth и/или BLE модуль, Wi-Fi модуль и др.
[0063] Дополнительно могут применяться также средства спутниковой навигации в составе устройства (500), например, GPS, ГЛОНАСС, BeiDou, Galileo.
[0064] Представленные материалы заявки раскрывают предпочтительные примеры реализации технического решения и не должны трактоваться как ограничивающие иные, частные примеры его воплощения, не выходящие за пределы испрашиваемой правовой охраны, которые являются очевидными для специалистов соответствующей области техники.

Claims (25)

1. Способ кодирования информации для защиты от ее утечек при печати документов, выполняемый с помощью процессора компьютерного устройства, при этом способ содержит этапы, на которых:
получают на компьютерном устройстве пользователя информацию о печати по меньшей мере одного цифрового документа, содержащего по меньшей мере текст, при этом компьютерное устройство связано с УИД (уникальным идентификатором) пользователя;
осуществляют до момента передачи цифрового документа на печать его обработку, в ходе которой
распознают буквы, содержащиеся в цифровом документе;
переводят УИД пользователя в двоичную форму;
отображают каждый разряд двоичного представления на соответствующие символы;
кодируют УИД пользователя путем смещения букв по горизонтальной оси влево или вправо на заданное количество пикселей на каждой странице документа, при этом
на каждой i-й странице, i∈[1, l], документа p i считывается посимвольно текст и записывается в массив символов и их положение
Figure 00000037
, где l – количество страниц,
Figure 00000038
количество символов на странице p i ;
формируются массивы
Figure 00000039
из
Figure 00000040
, каждый из которых содержит только один набор символов на странице p i , соответствующий каждой из n позиции двоичного представления УИД;
выполняется перемешивание символов в массивах
Figure 00000041
для равномерного распределения меток по всей странице;
обрезают каждый массив с конца с учетом процента символов на внедрение метки;
полученные массивы используют для кодирования УИД с помощью смещения их символов;
передают цифровой документ на печать с закодированным УИД пользователя.
2. Способ по п. 1, характеризующийся тем, что распознавание цифрового документа выполняется с помощью оптического распознавания символов (OCR).
3. Способ по п. 2, характеризующийся тем, что распознаются все символы на каждой странице цифрового документа.
4. Способ по п. 1, характеризующийся тем, что каждый символ УИД пользователя кодируется в двоичный код.
5. Способ по п. 4, характеризующийся тем, что на основании разряда двоичного кода определяются буквы для их смещения.
6. Способ защиты информации от утечек на печатных документах, выполняемый с помощью процессора компьютерного устройства, при этом способ содержит этапы, на которых:
получают по меньшей мере часть изображения печатного документа с закодированным УИД пользователя способом по любому из пп. 1-5;
выполняют распознавание полученного изображения;
определяют смещенные по горизонтальной оси буквы;
выполняют определение и извлечение закодированного УИД.
7. Способ по п. 6, характеризующийся тем, что распознавание полученного изображения выполняется с помощью OCR.
8. Система кодирования информации для защиты от ее утечек при печати документов, содержащая по меньшей мере один процессор, по меньшей мере одну память, связанную с процессором и содержащую машиночитаемые инструкции, которые при их исполнении процессором осуществляют способ по любому из пп. 1-5.
9. Система защиты информации от утечек на печатных документах, содержащая по меньшей мере один процессор, по меньшей мере одну память, связанную с процессором и содержащую машиночитаемые инструкции, которые при их исполнении процессором осуществляют способ по любому из пп. 6, 7.
RU2022106205A 2022-03-10 2022-03-10 Способ и система защиты информации от утечки при печати документов с помощью смещения символов RU2793611C1 (ru)

Priority Applications (1)

Application Number Priority Date Filing Date Title
PCT/RU2022/000382 WO2023172161A1 (ru) 2022-03-10 2022-12-20 Способ и система защиты информации при печати документов

Publications (1)

Publication Number Publication Date
RU2793611C1 true RU2793611C1 (ru) 2023-04-04

Family

ID=

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040001606A1 (en) * 2002-06-28 2004-01-01 Levy Kenneth L. Watermark fonts
US20070047818A1 (en) * 2005-08-23 2007-03-01 Hull Jonathan J Embedding Hot Spots in Imaged Documents
US20080205699A1 (en) * 2005-10-25 2008-08-28 Fujitsu Limited Digital watermark embedding and detection
RU2446464C2 (ru) * 2010-05-06 2012-03-27 Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд." Способ и система встраивания и извлечения скрытых данных в печатаемых документах
US20130028466A1 (en) * 2005-09-16 2013-01-31 Sursen Corp. Embedding and Detecting Hidden Information
RU2571379C2 (ru) * 2013-12-25 2015-12-20 Общество с ограниченной ответственностью "Аби Девелопмент" Интеллектуальная обработка электронного документа

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040001606A1 (en) * 2002-06-28 2004-01-01 Levy Kenneth L. Watermark fonts
US20070047818A1 (en) * 2005-08-23 2007-03-01 Hull Jonathan J Embedding Hot Spots in Imaged Documents
US20130028466A1 (en) * 2005-09-16 2013-01-31 Sursen Corp. Embedding and Detecting Hidden Information
US20080205699A1 (en) * 2005-10-25 2008-08-28 Fujitsu Limited Digital watermark embedding and detection
RU2446464C2 (ru) * 2010-05-06 2012-03-27 Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд." Способ и система встраивания и извлечения скрытых данных в печатаемых документах
RU2571379C2 (ru) * 2013-12-25 2015-12-20 Общество с ограниченной ответственностью "Аби Девелопмент" Интеллектуальная обработка электронного документа

Similar Documents

Publication Publication Date Title
US11210510B2 (en) Storing anonymized identifiers instead of personally identifiable information
EP3574449B1 (en) Structured text and pattern matching for data loss prevention in object-specific image domain
US11775749B1 (en) Content masking attacks against information-based services and defenses thereto
US10867170B2 (en) System and method of identifying an image containing an identification document
Singh et al. A survey on text based steganography
KR102089797B1 (ko) 인공지능 기반의 홈페이지 개인정보유출차단시스템
Al-Wesabi A smart English text zero-watermarking approach based on third-level order and word mechanism of Markov model
RU2673016C1 (ru) Способы и системы оптического распознавания символов серии изображений
US7596270B2 (en) Method of shuffling text in an Asian document image
Alanazi et al. Involving spaces of unicode standard within irreversible Arabic text steganography for practical implementations
CN114821613A (zh) 一种pdf中表格信息的抽取方法和系统
RU2793611C1 (ru) Способ и система защиты информации от утечки при печати документов с помощью смещения символов
RU2790938C1 (ru) Способ и система защиты информации от утечки при печати документов с помощью внедрения цифровых меток
WO2023172161A1 (ru) Способ и система защиты информации при печати документов
EA045968B1 (ru) Способ и система защиты информации от утечки при печати документов с помощью смещения символов
CN110942075A (zh) 信息处理装置、存储介质及信息处理方法
EA044732B1 (ru) Способ и система защиты информации от утечки при печати документов с помощью внедрения цифровых меток
US20170337165A1 (en) System and method of embedding symbology in alphabetic letters and then linking the letters to a site or sites on the global computer network
WO2023172162A1 (ru) Способ защиты информации при печати документов
JP2009200794A (ja) 文書の改竄検出プログラム及び改竄検出装置
RU2741067C1 (ru) Система и способ обеспечения стеганографического кодирования текста
KR102646428B1 (ko) 인공지능 학습 모델을 이용한 유사 글자 추출 방법 및 장치
US11816182B2 (en) Character encoding and decoding for optical character recognition
KR102629560B1 (ko) 전송 금지된 정보를 포함하는 문서의 ocr 프로세싱 방법 및 시스템
Stewart et al. Unicode search of dirty data, or: How I learned to stop worrying and love Unicode Technical Standard# 18