CN106845159A - 一种pdf文本乱码方法 - Google Patents
一种pdf文本乱码方法 Download PDFInfo
- Publication number
- CN106845159A CN106845159A CN201510881153.6A CN201510881153A CN106845159A CN 106845159 A CN106845159 A CN 106845159A CN 201510881153 A CN201510881153 A CN 201510881153A CN 106845159 A CN106845159 A CN 106845159A
- Authority
- CN
- China
- Prior art keywords
- document
- code method
- texts
- mess code
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 14
- 238000013507 mapping Methods 0.000 claims abstract description 9
- 238000010586 diagram Methods 0.000 description 3
- 238000010008 shearing Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00838—Preventing unauthorised reproduction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/10—Protecting distributed programs or content, e.g. vending or licensing of copyrighted material ; Digital rights management [DRM]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6209—Protecting access to data via a platform, e.g. using keys or access control rules to a single file or object, e.g. in a secure envelope, encrypted and accessed using a key, or with access control rules appended to the object itself
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/126—Character encoding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2221/00—Indexing scheme relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F2221/21—Indexing scheme relating to G06F21/00 and subgroups addressing additional information or applications relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F2221/2107—File encryption
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Computer Security & Cryptography (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computer Hardware Design (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Technology Law (AREA)
- Bioethics (AREA)
- Signal Processing (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Document Processing Apparatus (AREA)
- Storage Device Security (AREA)
Abstract
本发明公开一种PDF文本乱码方法,包括以下步骤:在创建PDF文档或者将PDF文档另存时,在所创建或另存为的PDF文档中嵌入PDF字体;以随机编码的方式,改变嵌入PDF字体编码映射Unicode字典;将PDF文档文本内容的编码改变为所述随机编码。
Description
技术领域
本发明涉及版权保护领域,具体而言,涉及一种PDF文本乱码方法。
背景技术
PDF文档处于文档创建、编辑、保护、发布、传播、保存整个工业环节的末端。很多电子文档以PDF的形式在互联网传播,如何保护PDF文档作者的权益成为一个亟待解决的问题。
目前流行的做法是通过PDF权限加密的方法,通过设置口令或者其它方式加密文档,允许阅读方以有限权限的方式分享文档内容。但是这种方式无法保证文档的绝对安全,一旦解密,文档的内容,尤其是文本内容和版式就可以随意被复制、编辑。
发明内容
本发明提供一种PDF文本乱码方法,用以确保用户可以不通过加密的方式,在互联网上分享自己的某些文档,而窃取者无法从字库中找到文档文字的Unicode(统一编码)编码。
为达到上述目的,本发明提供了一种PDF文本乱码方法,包括以下步骤:
在创建PDF文档或者将PDF文档另存时,在所创建或另存为的PDF文档中嵌入PDF字体;
以随机编码的方式,改变嵌入PDF字体编码映射ToUnicode字典;
将PDF文档文本内容的编码改变为所述随机编码。
进一步地,所述随机编码为无意义的数字码。
本发明通过改变文本字体映射关系后,虽然PDF文本不能正常映射为Unicode编码,但仍可以照常显示;用户如果用计算机的方式(如复制、剪切等操作)进行PDF内容窃取,不得不进行Unicode编码构建,这个会大大增加商业成本;使用本专利技术,用户可以不通过加密的方式,在互联网上分享自己的某些文档。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一个实施例的PDF文本乱码方法流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有付出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明一个实施例的PDF文本乱码方法流程图。如图所示,该PDF文本乱码方法包括以下步骤:
S110,在创建PDF文档或者将PDF文档另存时,在所创建或另存为的PDF文档中嵌入PDF字体;
S120,以随机编码的方式,改变嵌入PDF字体编码映射ToUnicode字典;
S130,将PDF文档文本内容的编码改变为所述随机编码。
例如,上述随机编码可以为无意义的数字码。这样,通过改变字库中编码映射的方法,使窃取者无法从字库中找到文档文字的Unicode编码,只能找到01、02这样的无意义的内部编码。
本发明的一个优选实施例的具体流程如下:
1、在PDF文档创建或者另存时,嵌入PDF字体。
2、以随机编码的方式,改变嵌入PDF字体编码映射ToUnicode字典。
3、改变PDF文本内容的编码为新的随机编码。
在上述实施例中,通过改变文本字体映射关系后,虽然PDF文本不能正常映射为Unicode编码,但仍可以照常显示;用户如果用计算机的方式(如复制、剪切等操作)进行PDF内容窃取,不得不进行Unicode编码构建,这个会大大增加商业成本;本发明用于PDF文档文本内容的进一步保护,增加PDF文档文本被恶意复制、商业窃取的难度,使用本专利技术,用户可以不通过加密的方式,在互联网上分享自己的某些文档。
本领域普通技术人员可以理解:附图只是一个实施例的示意图,附图中的模块或流程并不一定是实施本发明所必须的。
本领域普通技术人员可以理解:实施例中的装置中的模块可以按照实施例描述分布于实施例的装置中,也可以进行相应变化位于不同于本实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围。
Claims (2)
1.一种PDF文本乱码方法,其特征在于,包括以下步骤:
在创建PDF文档或者将PDF文档另存时,在所创建或另存为的PDF文档中嵌入PDF字体;
以随机编码的方式,改变嵌入PDF字体编码映射Unicode字典;
将PDF文档文本内容的编码改变为所述随机编码。
2.根据权利要求1所述的PDF文本乱码方法,其特征在于,所述随机编码为无意义的数字码。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510881153.6A CN106845159A (zh) | 2015-12-03 | 2015-12-03 | 一种pdf文本乱码方法 |
PCT/CN2016/000619 WO2017092151A1 (zh) | 2015-12-03 | 2016-11-08 | 一种pdf文本乱码方法 |
US15/779,905 US20180352104A1 (en) | 2015-12-03 | 2016-11-08 | Method for creating garbled pdf text |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510881153.6A CN106845159A (zh) | 2015-12-03 | 2015-12-03 | 一种pdf文本乱码方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106845159A true CN106845159A (zh) | 2017-06-13 |
Family
ID=58796173
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510881153.6A Pending CN106845159A (zh) | 2015-12-03 | 2015-12-03 | 一种pdf文本乱码方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20180352104A1 (zh) |
CN (1) | CN106845159A (zh) |
WO (1) | WO2017092151A1 (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109871667A (zh) * | 2019-02-18 | 2019-06-11 | 北京创鑫旅程网络技术有限公司 | 数据内容保护方法、装置、服务器及计算机可读介质 |
CN110765072A (zh) * | 2018-07-27 | 2020-02-07 | 珠海金山办公软件有限公司 | 一种保存文件的方法及装置 |
CN110795258A (zh) * | 2018-07-17 | 2020-02-14 | 珠海金山办公软件有限公司 | 字体库匹配方法、装置及设备 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102542212A (zh) * | 2010-12-24 | 2012-07-04 | 北大方正集团有限公司 | 一种文本信息隐藏方法及装置 |
CN103279693A (zh) * | 2013-05-30 | 2013-09-04 | 付弦 | 一种文件加密方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101814120A (zh) * | 2010-03-11 | 2010-08-25 | 四川大学锦江学院 | 基于数字水印的word文档数据转移 |
-
2015
- 2015-12-03 CN CN201510881153.6A patent/CN106845159A/zh active Pending
-
2016
- 2016-11-08 US US15/779,905 patent/US20180352104A1/en not_active Abandoned
- 2016-11-08 WO PCT/CN2016/000619 patent/WO2017092151A1/zh active Application Filing
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102542212A (zh) * | 2010-12-24 | 2012-07-04 | 北大方正集团有限公司 | 一种文本信息隐藏方法及装置 |
CN103279693A (zh) * | 2013-05-30 | 2013-09-04 | 付弦 | 一种文件加密方法 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110795258A (zh) * | 2018-07-17 | 2020-02-14 | 珠海金山办公软件有限公司 | 字体库匹配方法、装置及设备 |
CN110795258B (zh) * | 2018-07-17 | 2023-03-24 | 珠海金山办公软件有限公司 | 字体库匹配方法、装置及设备 |
CN110765072A (zh) * | 2018-07-27 | 2020-02-07 | 珠海金山办公软件有限公司 | 一种保存文件的方法及装置 |
CN109871667A (zh) * | 2019-02-18 | 2019-06-11 | 北京创鑫旅程网络技术有限公司 | 数据内容保护方法、装置、服务器及计算机可读介质 |
Also Published As
Publication number | Publication date |
---|---|
US20180352104A1 (en) | 2018-12-06 |
WO2017092151A1 (zh) | 2017-06-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2004019191A3 (en) | Apparatus, system and method for securing digital documents in a digital appliance | |
CN106845159A (zh) | 一种pdf文本乱码方法 | |
Mir | Copyright for web content using invisible text watermarking | |
Soulsby | Dynamics of marine sands: a manual for practical applications | |
CN105528347A (zh) | 数据块储存方法、数据查询方法和数据修改方法 | |
CN106375083A (zh) | 一种基于Base64的加解密方法及其装置 | |
CN110704813A (zh) | 一种基于字符重新编码的文字防盗版系统 | |
CN101840483B (zh) | 一种计算机文档内容保护的方法和系统 | |
Chou et al. | A Webpage Data Hiding Method by Using Tag and CSS Attribute Setting | |
Bullett et al. | Regular and limit sets for holomorphic correspondences | |
He et al. | Tolerance-Maps for line-profiles constructed from Boolean intersection of T-Map primitives for arc-segments | |
CN114091080A (zh) | 一种字幕文件加密解密方法、系统、存储介质及电子设备 | |
Reddy et al. | Towards web page steganography with attribute truth table | |
Grafe et al. | Laboratory research on alternative cutting concepts on the example of undercutting | |
Hosmani et al. | Dual stage text steganography using unicode homoglyphs | |
CN109344941A (zh) | 一种大数据安全共享方法及装置 | |
Water et al. | How to find patterns written in turbulent air | |
CN104125060B (zh) | 一种无固定算法密匙加密技术方法 | |
Odeh | Robust Text Steganography Algorithms for Secure Data Communications | |
CN107229843A (zh) | 一种加密文档泄密后自动报警的方法 | |
Jacob et al. | DNA Sequence based cryptographic solution for secure image transmission | |
Simalarides | An Elementary Proof of Pólya-Vinogradov's Inequality, II | |
Harini et al. | Attack of SQL Injection on Web Application: Types, Problems, Solution | |
Kuz’min et al. | Selection of type of mating between pools at high dams | |
Rübenstahl | Vermögensabschöpfung bei Korruptionsstraftaten in Deutschland |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20170613 |
|
WD01 | Invention patent application deemed withdrawn after publication |