CN106845159A - 一种pdf文本乱码方法 - Google Patents

一种pdf文本乱码方法 Download PDF

Info

Publication number
CN106845159A
CN106845159A CN201510881153.6A CN201510881153A CN106845159A CN 106845159 A CN106845159 A CN 106845159A CN 201510881153 A CN201510881153 A CN 201510881153A CN 106845159 A CN106845159 A CN 106845159A
Authority
CN
China
Prior art keywords
pdf
document
code method
texts
mess code
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510881153.6A
Other languages
English (en)
Inventor
孟庆功
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Foxit Software Inc
Original Assignee
Foxit Software Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Foxit Software Inc filed Critical Foxit Software Inc
Priority to CN201510881153.6A priority Critical patent/CN106845159A/zh
Priority to PCT/CN2016/000619 priority patent/WO2017092151A1/zh
Priority to US15/779,905 priority patent/US20180352104A1/en
Publication of CN106845159A publication Critical patent/CN106845159A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00838Preventing unauthorised reproduction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/10Protecting distributed programs or content, e.g. vending or licensing of copyrighted material ; Digital rights management [DRM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6209Protecting access to data via a platform, e.g. using keys or access control rules to a single file or object, e.g. in a secure envelope, encrypted and accessed using a key, or with access control rules appended to the object itself
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/126Character encoding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2221/00Indexing scheme relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F2221/21Indexing scheme relating to G06F21/00 and subgroups addressing additional information or applications relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F2221/2107File encryption

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Technology Law (AREA)
  • Bioethics (AREA)
  • Signal Processing (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Document Processing Apparatus (AREA)
  • Storage Device Security (AREA)

Abstract

本发明公开一种PDF文本乱码方法,包括以下步骤:在创建PDF文档或者将PDF文档另存时,在所创建或另存为的PDF文档中嵌入PDF字体;以随机编码的方式,改变嵌入PDF字体编码映射Unicode字典;将PDF文档文本内容的编码改变为所述随机编码。

Description

一种PDF文本乱码方法
技术领域
本发明涉及版权保护领域,具体而言,涉及一种PDF文本乱码方法。
背景技术
PDF文档处于文档创建、编辑、保护、发布、传播、保存整个工业环节的末端。很多电子文档以PDF的形式在互联网传播,如何保护PDF文档作者的权益成为一个亟待解决的问题。
目前流行的做法是通过PDF权限加密的方法,通过设置口令或者其它方式加密文档,允许阅读方以有限权限的方式分享文档内容。但是这种方式无法保证文档的绝对安全,一旦解密,文档的内容,尤其是文本内容和版式就可以随意被复制、编辑。
发明内容
本发明提供一种PDF文本乱码方法,用以确保用户可以不通过加密的方式,在互联网上分享自己的某些文档,而窃取者无法从字库中找到文档文字的Unicode(统一编码)编码。
为达到上述目的,本发明提供了一种PDF文本乱码方法,包括以下步骤:
在创建PDF文档或者将PDF文档另存时,在所创建或另存为的PDF文档中嵌入PDF字体;
以随机编码的方式,改变嵌入PDF字体编码映射ToUnicode字典;
将PDF文档文本内容的编码改变为所述随机编码。
进一步地,所述随机编码为无意义的数字码。
本发明通过改变文本字体映射关系后,虽然PDF文本不能正常映射为Unicode编码,但仍可以照常显示;用户如果用计算机的方式(如复制、剪切等操作)进行PDF内容窃取,不得不进行Unicode编码构建,这个会大大增加商业成本;使用本专利技术,用户可以不通过加密的方式,在互联网上分享自己的某些文档。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一个实施例的PDF文本乱码方法流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有付出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明一个实施例的PDF文本乱码方法流程图。如图所示,该PDF文本乱码方法包括以下步骤:
S110,在创建PDF文档或者将PDF文档另存时,在所创建或另存为的PDF文档中嵌入PDF字体;
S120,以随机编码的方式,改变嵌入PDF字体编码映射ToUnicode字典;
S130,将PDF文档文本内容的编码改变为所述随机编码。
例如,上述随机编码可以为无意义的数字码。这样,通过改变字库中编码映射的方法,使窃取者无法从字库中找到文档文字的Unicode编码,只能找到01、02这样的无意义的内部编码。
本发明的一个优选实施例的具体流程如下:
1、在PDF文档创建或者另存时,嵌入PDF字体。
2、以随机编码的方式,改变嵌入PDF字体编码映射ToUnicode字典。
3、改变PDF文本内容的编码为新的随机编码。
在上述实施例中,通过改变文本字体映射关系后,虽然PDF文本不能正常映射为Unicode编码,但仍可以照常显示;用户如果用计算机的方式(如复制、剪切等操作)进行PDF内容窃取,不得不进行Unicode编码构建,这个会大大增加商业成本;本发明用于PDF文档文本内容的进一步保护,增加PDF文档文本被恶意复制、商业窃取的难度,使用本专利技术,用户可以不通过加密的方式,在互联网上分享自己的某些文档。
本领域普通技术人员可以理解:附图只是一个实施例的示意图,附图中的模块或流程并不一定是实施本发明所必须的。
本领域普通技术人员可以理解:实施例中的装置中的模块可以按照实施例描述分布于实施例的装置中,也可以进行相应变化位于不同于本实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围。

Claims (2)

1.一种PDF文本乱码方法,其特征在于,包括以下步骤:
在创建PDF文档或者将PDF文档另存时,在所创建或另存为的PDF文档中嵌入PDF字体;
以随机编码的方式,改变嵌入PDF字体编码映射Unicode字典;
将PDF文档文本内容的编码改变为所述随机编码。
2.根据权利要求1所述的PDF文本乱码方法,其特征在于,所述随机编码为无意义的数字码。
CN201510881153.6A 2015-12-03 2015-12-03 一种pdf文本乱码方法 Pending CN106845159A (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201510881153.6A CN106845159A (zh) 2015-12-03 2015-12-03 一种pdf文本乱码方法
PCT/CN2016/000619 WO2017092151A1 (zh) 2015-12-03 2016-11-08 一种pdf文本乱码方法
US15/779,905 US20180352104A1 (en) 2015-12-03 2016-11-08 Method for creating garbled pdf text

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510881153.6A CN106845159A (zh) 2015-12-03 2015-12-03 一种pdf文本乱码方法

Publications (1)

Publication Number Publication Date
CN106845159A true CN106845159A (zh) 2017-06-13

Family

ID=58796173

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510881153.6A Pending CN106845159A (zh) 2015-12-03 2015-12-03 一种pdf文本乱码方法

Country Status (3)

Country Link
US (1) US20180352104A1 (zh)
CN (1) CN106845159A (zh)
WO (1) WO2017092151A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109871667A (zh) * 2019-02-18 2019-06-11 北京创鑫旅程网络技术有限公司 数据内容保护方法、装置、服务器及计算机可读介质
CN110765072A (zh) * 2018-07-27 2020-02-07 珠海金山办公软件有限公司 一种保存文件的方法及装置
CN110795258A (zh) * 2018-07-17 2020-02-14 珠海金山办公软件有限公司 字体库匹配方法、装置及设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102542212A (zh) * 2010-12-24 2012-07-04 北大方正集团有限公司 一种文本信息隐藏方法及装置
CN103279693A (zh) * 2013-05-30 2013-09-04 付弦 一种文件加密方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101814120A (zh) * 2010-03-11 2010-08-25 四川大学锦江学院 基于数字水印的word文档数据转移

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102542212A (zh) * 2010-12-24 2012-07-04 北大方正集团有限公司 一种文本信息隐藏方法及装置
CN103279693A (zh) * 2013-05-30 2013-09-04 付弦 一种文件加密方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110795258A (zh) * 2018-07-17 2020-02-14 珠海金山办公软件有限公司 字体库匹配方法、装置及设备
CN110795258B (zh) * 2018-07-17 2023-03-24 珠海金山办公软件有限公司 字体库匹配方法、装置及设备
CN110765072A (zh) * 2018-07-27 2020-02-07 珠海金山办公软件有限公司 一种保存文件的方法及装置
CN109871667A (zh) * 2019-02-18 2019-06-11 北京创鑫旅程网络技术有限公司 数据内容保护方法、装置、服务器及计算机可读介质

Also Published As

Publication number Publication date
US20180352104A1 (en) 2018-12-06
WO2017092151A1 (zh) 2017-06-08

Similar Documents

Publication Publication Date Title
WO2004019191A3 (en) Apparatus, system and method for securing digital documents in a digital appliance
CN106845159A (zh) 一种pdf文本乱码方法
Mir Copyright for web content using invisible text watermarking
Soulsby Dynamics of marine sands: a manual for practical applications
CN105528347A (zh) 数据块储存方法、数据查询方法和数据修改方法
CN106375083A (zh) 一种基于Base64的加解密方法及其装置
CN110704813A (zh) 一种基于字符重新编码的文字防盗版系统
CN101840483B (zh) 一种计算机文档内容保护的方法和系统
Chou et al. A Webpage Data Hiding Method by Using Tag and CSS Attribute Setting
Bullett et al. Regular and limit sets for holomorphic correspondences
He et al. Tolerance-Maps for line-profiles constructed from Boolean intersection of T-Map primitives for arc-segments
CN114091080A (zh) 一种字幕文件加密解密方法、系统、存储介质及电子设备
Reddy et al. Towards web page steganography with attribute truth table
Grafe et al. Laboratory research on alternative cutting concepts on the example of undercutting
Hosmani et al. Dual stage text steganography using unicode homoglyphs
CN109344941A (zh) 一种大数据安全共享方法及装置
Water et al. How to find patterns written in turbulent air
CN104125060B (zh) 一种无固定算法密匙加密技术方法
Odeh Robust Text Steganography Algorithms for Secure Data Communications
CN107229843A (zh) 一种加密文档泄密后自动报警的方法
Jacob et al. DNA Sequence based cryptographic solution for secure image transmission
Simalarides An Elementary Proof of Pólya-Vinogradov's Inequality, II
Harini et al. Attack of SQL Injection on Web Application: Types, Problems, Solution
Kuz’min et al. Selection of type of mating between pools at high dams
Rübenstahl Vermögensabschöpfung bei Korruptionsstraftaten in Deutschland

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20170613

WD01 Invention patent application deemed withdrawn after publication