CN104412255A - 文本处理系统、电子文本、文本处理方法以及程序 - Google Patents

文本处理系统、电子文本、文本处理方法以及程序 Download PDF

Info

Publication number
CN104412255A
CN104412255A CN201280074372.8A CN201280074372A CN104412255A CN 104412255 A CN104412255 A CN 104412255A CN 201280074372 A CN201280074372 A CN 201280074372A CN 104412255 A CN104412255 A CN 104412255A
Authority
CN
China
Prior art keywords
character
font data
text
processing system
character code
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201280074372.8A
Other languages
English (en)
Inventor
前田刚男
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SKK Ltd
Original Assignee
SKK Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SKK Ltd filed Critical SKK Ltd
Publication of CN104412255A publication Critical patent/CN104412255A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/109Font handling; Temporal or kinetic typography
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09CCIPHERING OR DECIPHERING APPARATUS FOR CRYPTOGRAPHIC OR OTHER PURPOSES INVOLVING THE NEED FOR SECRECY
    • G09C1/00Apparatus or methods whereby a given sequence of signs, e.g. an intelligible text, is transformed into an unintelligible sequence of signs by transposing the signs or groups of signs or by replacing them by others according to a predetermined system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/126Character encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L2209/00Additional information or applications relating to cryptographic mechanisms or cryptographic arrangements for secret or secure communication H04L9/00
    • H04L2209/60Digital content management, e.g. content distribution
    • H04L2209/605Copy protection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Document Processing Apparatus (AREA)
  • Controls And Circuits For Display Device (AREA)

Abstract

文本处理系统(10)具备:字符码变更单元(11a),按照语句中的字符的出现顺序来记录所述字符的字体数据,并且将记录了字体数据的字符的字符码变更成由字体数据的排序编号构成的变换字符码;变换表格创建单元(11b),创建表示字符码和变换字符码的对应关系的变换表格;以及输出单元(11c),根据字体数据来以字体输出字符。另外,字符码变更单元(11a)按照通过输入装置(15)输入的字符的顺序来记录字符的字体数据,并且将记录了字体数据的字符的字符码变更成变换字符码。由此,能够提供能够削减数据量同时防止字符码中的数字复制的文本处理系统、电子文本以及文本处理方法。

Description

文本处理系统、电子文本、文本处理方法以及程序
技术领域
本发明涉及文本处理系统、电子文本、文本处理方法以及程序,详细而言,涉及通过使用文本数据和字体数据的对安全技术和压缩技术的改进。
背景技术
近年来,在一些文本处理系统以及电子文本中,有时采用能够使用ISO/IEC 10646(UCS)和Unicode的UTF-8。UTF-8是1字节代码单位的字符编码形式,为了具有与ASCII字符的互换性,对与ASCII相同的部分以1字节进行编码,对其他的部分以2~6字节进行编码。主要由ASCII字符构成的文本能够在几乎不增加数据大小的情况下享受Unicode的优点。
但是,在计算机当中的字符的交换是以基于编码技术而被标准化了的字符代码为基础来进行的。随着被标准化的字符数(字形数)增加,由计算机处理的数据量也增加。为了解决数据量增加的问题,还存在用于高效地处理字符代码的编码方式。在这样的编码方式中,通过例如使字节数可变,来减小数据量,所以关于字符代码的最先的编号具有小的数据量,关于最后的字符具有大的数据量。例如字母“a”利用0和1来表现为“01100001”(1字节:控制比特数1+代码比特数7),然而“日”则表现为“111001101001011110100101”(3字节:控制比特数8+代码比特数16)。
在UTF-8的构造中的最大的数据宽度为:
“111111011011111110111111101111111011111110111111”(6字节:控制比特数17+代码比特数31)。此时,能够处理超20亿的字符。
另外通过采用由Unicode定义了的异体字选择器,能够切换字形。异体字选择器在Unicode中通过“U+FE00~U+FE0F”以及“U+E0100~U+E01EF”的256字符代码位置来指定,并且在UTF-8中采用3字节~4字节。异体字选择器通过接着基本字符排列,能够表示与基本字形不同的字形。
在字符编码方式中,除UTF-8之外还存在与Unicode对应了的UTF-16、UTF-32、Shift-JIS、EUC等各种种类,其中大多采用字节数根据字符代码位置而可变的方式。另外,也存在仅通过采用如URL编码的ASCII字符来表示各种字符的方式。
另外,关于在计算机方面的安全,使用根据标准的字符代码,针对字符代码的数据采用加密技术等,采取对策以防止内容向外部泄漏。然而,加密技术以在计算机上执行的解码为前提,并且如果弄清了密码的破译方法,则待进行通信的数据的内容被全部破译。
另外,防止主要由电子书籍这样的字符构成的内容被复制在实际上是困难的。进而,为了避免用于表现语句的字体数据通过数字复制而外流,该字体数据无法灵活利用于电子书籍。因此,在电子媒体中,诸如类型设计(designs of types)的表现趋向于受损。
在专利文献1中,记载了文本处理系统,该文本处理系统通过随机地更换示出字体内部的字符码和点符(glyph)的对应关系的表格而创建专用字体,并将电子文本的字符码更换成专用字体的编码系统,以使得在未安装有该专用字体的计算机中,通过使电子文本乱码化而仅隐藏字符部分。
另一方面,PDF具有能够将字符数据嵌入PDF数据中的特征。通过生成PDF文件并嵌入字体信息,能够由所生成的文本自身保持字体信息。由此,即使是在输出侧的终端中没有的字体,也能够可靠地输出,并且能够实现再现性优良的文本。关于字体的嵌入,存在仅嵌入被使用的字体的“子集嵌入”、和全部嵌入字体中包含的字符的“完全嵌入”(complete embedding)。
在专利文献2中,记载了信息处理装置,该信息处理装置基于创建了其中反映了图形以及字符的编辑指示的电子文本,进行关于是否嵌入字体信息的询问。
现有技术文献
专利文献
专利文献1:特开2007-109158号公报
专利文献2:特开2006-107033号公报
发明内容
然而,关于这样的以往的文本处理系统,存在以下的问题。
在专利文献1记载的文本处理系统中,必须预先创建用于改变字符码与字体的对应关系的变换表格。关于这样的变换表格,预计取决于文本的种类或者用户的使用环境而会有较大的不同。预先创建满足所有这些要求的变换表格存在耗费劳力和成本的问题。为了提高变换的效率,必须预先创建数据量大的变换表格。进而,还必须构筑用于更新所述变换表格的构造。
在专利文献2记载的信息处理装置中,必须预先加载字体数据。必须根据文本的种类预先准备很多这样的字体数据。进而,还必须构筑用于更新所述变换表格的构造。
本发明的目的在于提供能够削减数据量同时防止字符码中的数字复制的文本处理系统、电子文本、文本处理方法以及程序。
根据本发明,提供一种对能够嵌入字体数据的电子文本进行创建的文本处理系统,具备:字符码变更单元,按照语句中的字符的出现顺序来记录所述字符的字体数据,并且将记录了所述字体数据的字符的字符码变更成由所述字体数据的排序编号构成的变换字符码;变换表格创建单元,创建表示所述字符码和所述变换字符码的对应关系的变换表格;以及输出单元,根据所述字体数据来以字体输出字符。
根据本发明,提供一种通过上述文本处理系统来创建的电子文本。
根据本发明,提供一种对能够嵌入字体数据的电子文本进行创建的文本处理系统,具备:输入单元,输入字符;字符码变更单元,按照通过所述输入单元输入的字符的出现顺序来记录所述字符的字体数据,并且将记录了所述字体数据的字符的字符码变更成由所述字体数据的排序编号构成的变换字符码;变换表格创建单元,创建表示所述字符码和所述变换字符码的对应关系的变换表格;以及输出单元,根据所述字体数据来以字体输出字符。
根据本发明,提供一种用于对能够嵌入字体数据的电子文本进行创建的文本处理方法,包括以下步骤:按照语句中的字符的出现顺序来记录所述字符的字体数据,并且将记录了所述字体数据的字符码变更成由所述字体数据的排序编号构成的变换字符码;创建表示所述字符码和所述变换字符码的对应关系的变换表格;以及根据所述字体数据来以字体输出字符。
根据本发明,提供一种用于使计算机作为文本处理系统发挥功能的程序。
根据本发明,能够削减数据量同时防止字符码中的数字复制。
附图说明
图1是示出实施方式1的文本处理系统的构成的图。
图2是说明实施方式1的文本处理系统的动作的流程图。
图3是说明通过实施方式1的文本处理系统而被文本处理了的电子文本的构造的图。
图4是与以往例子相比较来说明实施方式1的文本处理系统的文本数据的图。
图5是示出恢复实施方式1的文本处理系统的文本的动作的流程图。
图6是说明实施方式2的文本处理系统的动作的流程图。
符号说明
10 文本处理系统
11 CPU
11a 字符码变更单元
11b 变换表格创建单元
11c 输出单元
12 ROM
13 RAM
14 HDD
15 输入装置
16 显示控制部
17 显示器
18 存储介质安装部
19 通信装置
20 电子文本
具体实施方式
以下,参照附图详细说明本发明的实施方式。
(实施方式1)
图1是示出本发明的实施方式1的文本处理系统的构成的图。图1是在由PC(Personal Computer)构成文本处理系统的情况下的框图。
如图1所示,文本处理系统10具备通过总线相互连接了的CPU11、ROM12、RAM13、HDD14、输入装置15、显示控制部16、显示器17、存储介质安装部18、以及通信装置19。
CPU11控制整个PC,并且执行RAM13中的文本处理程序,以作为文本处理系统发挥PC功能。CPU11具有作为字符码变更单元11a、变换表格创建单元11b、以及输出单元11c的一部分的功能,其中,字符码变更单元11a按照语句中的字符的出现顺序来记录字符的字体数据,并且将记录了字体数据的字符的字符码变更成由字体数据的排序编号构成的变换字符码,变换表格创建单元11b创建表示通常的字符码和变换字符码的对应关系的变换表格,输出单元11c根据字体数据来以字体输出字符。
ROM12存储BIOS(Basic Input/Output System,基本输入输出系统)、以及鼠标、键盘等的设备驱动等。通过从BIOS调用引导装载程序(boot loader),能够启动OS(Operating System,操作系统)。
RAM13由DRAM等易失性存储器构成,储存由CPU11所处理的控制程序,并且为CPU11提供执行各种控制时的操作区域。
HDD14存储文本处理程序、OS、后述的变换表格等。也可以代替HDD14而加载SSD(Solid State Drive,固态驱动器)。
输入装置15是键盘、以及鼠标等定位装置,受理来自用户的输入操作。也能够将触摸面板、声音输入装置用作输入装置。
显示控制部16根据各种应用程序所指示的画面信息,通过规定的分辨率、色彩数等控制显示器17上的描绘。显示器17是采用液晶或者有机EL等的FPD(Flat Panel Display,平板显示器)。另外,显示控制部16以及显示器17具有作为根据字体数据来以字体输出字符的输出单元11c的一部分的功能。
存储介质安装部18构成为能够装卸USB存储器、闪存等非易失性存储器、DVD-ROM等光盘介质,并用于从这些存储介质读出数据、以及写入数据到这些存储介质上。
通信装置19是用于连接到LAN、因特网等网络的接口。能够将通过文本处理系统10创建了的电子文本,通过通信装置19经由任意的网络来进行分发。
CPU11执行ROM12中的引导程序(boot program),从HDD14将OS加载到RAM13中。并且,通过将本实施方式中的文本处理程序从HDD14加载到RAM13中来执行,从而该PC作为文本处理系统10发挥功能。
以下,说明如上所述地构成的文本处理系统的动作。
图2是说明本发明的实施方式1的文本处理系统的动作的流程图。本流程通过CPU11的文本处理程序来执行。
首先,在步骤S1中,CPU11从HDD14或者被安装到存储介质安装部18的存储介质中读入语句数据。或者,也可以通过输入装置15输入字符。
接下来,在步骤S2中,字符码变更单元11a按照语句中的字符的出现顺序来记录字符的字体数据。
接下来,在步骤S3中,字符码变更单元11a将记录了字体数据的字符的字符码变更成表示字体数据的排序编号的变换字符码。
接下来,在步骤S4中,变换表格创建单元11b创建表示字符码和变换字符码的对应关系的变换表格。
在步骤S5中,CPU11等待语句读入的确定。
接下来,在步骤S6中,输出单元11c通过适当字体来显示字符并结束本流程。
接下来,说明文本处理系统10的文本处理动作的具体例子。
语句例子:
“そのとき、吾一は学校から帰ったばかりだった。”(22个日文字符)
文本处理系统10在读入了上述语句的情况下,进行以下的文本处理。
首先,系统按照语句中的字符的出现顺序来记录字符的字体数据。同时,系统将记录了字体数据的字符的字符码变更成字体数据的排序编号。即,按照以下方式来变更字符码。
そ→No.1
の→No.2
と→No.3
き→No.4
、→No.5
吾→No.6
一→No.7
上述“そ”是记录了字体数据的字符的字符码,“No.1”是表示字体数据的排序编号的变换字符码。以下同样地,“の”是记录了字体数据的字符的字符码,“No.2”是表示字体数据的排序编号的变换字符码。另外,“→”表示将字符码(标准的字符码)变更成字体数据的排序编号(变换字符码)。
接下来,创建表示字符码(标准的字符码)与字体数据的排序编号(变换字符码)的对应关系的变换表格。
由此,(1)文本处理系统10中的字符码与标准的码不同,它具有随机性,无法简单地进行文本的复制。即,标准的字符码被变更成了字体数据的排序编号(变换字符码),所以无法简单地进行文本的复制。在专利文献1的第[0081]段中,记载了用于改变字符码和字体的对应关系的技术。另外,在专利文献2的第[0100]段中,记载了将子集字体用于字体信息的嵌入的技术。在本实施方式中,也能够得到与专利文献1、2记载的系统相同效果。但是,在专利文献1中,必须预先创建用于使字符码随机化的变换表格。与此相对地,在本实施方式中,具有自动创建各语句所特有的变换表格这样的、与专利文献1、2不同的特有的效果。
(2)另外,在文本处理系统10中的字符码只要能够区分该语句中出现的字符即可,不需要区分所有的字符。因此,在本实施方式中,具有能够减少字符码的比特数这样的、与专利文献1、2不同的特有的效果。
(3)另外,在文本处理系统10中的字体数据只要是在该语句中出现的字符的字体数据即可,系统不需要加载所有的字符的字体。因此,与专利文献2记载的系统同样地,有能够减少字体数据的存储容量的效果。
(4)进而,在文本处理系统10中的子集字体数据具有变换表格的信息,所以文本处理系统具有即使在用户的终端中没有变换表格也能够根据变换字符码和子集字体数据显示正文这样的、与专利文献1、2不同的特有的效果。
(5)进而,文本处理系统10通过使用变换表格,能够使变换字符码恢复到标准的字符码。
说明在准备文本数据时应用本实施方式的文本处理系统10的例子。
图3是说明通过本发明的实施方式1的文本处理系统进行了文本处理的电子文本的构造的图。图3所示的电子文本20存储在例如各种存储介质中,与存储介质一起被分发。另外,电子文本通过通信单元,被分发到例如网络上。
如图3所示,电子文本20是以下格式,在该格式中,在开头处设置作为子集字体识别编号的控制码21,接着设置通过变换字符码来表达的语句22。如果根据控制码21来索取子集字体,则显示通过变换字符码表达的语句的原文。
图4是与以往例子相比较说明本发明的实施方式1的文本处理系统的文本数据的图。图4(a)示出以往的计算机上的文本数据的构造,图4(b)示出以往的计算机上的数据,图4(c)示出采用以往的通常的字体数据的显示结果,图4(d)示出文本处理系统10的字符的表现例,图4(e)示出文本处理系统10的数据,图4(f)示出文本处理系统10的通常的字体数据,并且图4(g)示出采用文本处理系统10的通常的字体数据的显示结果。
语句例:
“本日は晴天なり”(7个日文字符)
在以往例子中,如图4(a)所示,例如“本”(UTF-8)通过E69CAC(16进制)和111001101001110010101100(2进制)来表示。因此,在计算机上的数据宽度如图4(b)所示。另外,采用通常的字体数据的显示结果如图4(c)所示。但是,在以往例子中,准备假定将被使用的所有字体数据,所以字体数据的存储容量大。
与上述以往例子相对地,在本实施方式中,具有按照语句中的字符的出现顺序来记录字体数据,同时将记录了字体数据的字符的字符码变更成字体数据的排序编号这样的特征,文本数据构造、计算机上的数据量、采用字体数据的显示结果分别不同。以往的图4(a)、(b)、(c)分别按该顺序对应于本实施方式的图4(d)、(e)、(f)、(g)。
在本实施方式中,与标准化的字符码独立地,仅将语句中使用了的字符变换成最佳的字符码,准备与其对应的字体数据。具体而言,通过以下方式来将语句中使用了的字符变换成最佳的字符码,即,按照语句中的字符的出现顺序来记录字符的字体数据,同时将记录了字体数据的字符的字符码变更成字体数据的排序编号(变换字符码)。通过按照语句中的字符的出现顺序将字体数据置换成变换字符码,从而自动创建各语句所特有的变换表格。而且,字体数据具有变换表格的信息,所以能够显示原文。即,通过采取按照语句中的字符的出现顺序来将字体数据置换成变换字符码这样的简易的步骤,从而不需要复杂的数据处理,并且也不需要用于该数据处理的管理单元。根据在文本这样的构架中对文本数据进行处理这样的构思,能够实现这样的效果。在本实施方式中,虽然按照语句中的字符的出现顺序来进行向最佳的字符码的变换,但不限定于此,也可以采取其他的方式。但是,通过如本实施方式那样,按照语句中的字符的出现顺序来进行变换,从而得到不需要变换表格这样的优点,因而是优选的。
在本实施方式中,如图4(d)所示,“本”(UTF-8)通过61(16进制)和01100001(2进制)来表示,接着,“日”(UTF-8)通过62(16进制)(变换字符码)、01100010(2进制)(变换字符码)来表示(以下相同),按照语句中的字符的出现顺序来将记录了字体数据的字符的字符码变更成字体数据的排序编号(变换字符码)。因此,如图4(e)所示,计算机上的数据宽度为(7×8=56比特),如下所示:
“01100001011000100110001101100100011001010110011001100111”,
并且与图4(b)所示的以往例子的数据宽度(7×8×3=168比特)(如下所示)相比,可以明确:能够大幅削减计算机上的数据。
“1110011010011100101011001110011010…10101010111000111000001010001010”
另外,文本处理系统10的采用通常的字体数据的显示结果如图4(f)所示,无法理解语句的内容。因此,即使假设破译了被加密了的文本数据的密码,也无法理解语句的内容。如图4(g)所示,只要没有给出采用通过本实施方式创建的字体数据的显示结果,就无法理解语句的内容。因此,即使存在语句的非法复制、通信中的采摘,信息也不会泄漏。
另外,即使对于保护电子书籍等语句信息所需的产品或者服务,通过防止标准化了的字符码中的数字复制,能够防止挪用、被盗。
进而,在以往例子中,准备了假定将被使用的各种字体数据,所以字体数据的存储容量大。与此相对地,在本实施方式中,只要准备在语句中使用了的字体数据即可,所以有字体数据的存储容量小的优点。
接下来,说明在恢复文本数据时应用了本实施方式的文本处理系统10的例子。
图5是示出恢复本发明的实施方式1的文本处理系统的文本的动作的流程图。CPU11具备恢复单元,该恢复单元通过采用变换表格,使变换字符码恢复到标准的字符码。此外,也可以是其他的PC等具备该恢复单元。
首先,在步骤S11中,CPU11读入文本数据。
接下来,在步骤S12中,恢复单元参照变换表格,使读入了的文本数据的变换字符码恢复到标准的字符码。
接下来,在步骤S13中,输出单元11c输出被恢复到标准的字符码了的字体数据的字符并结束本流程。
这样,文本处理系统10通过使用变换表格,能够使变换字符码恢复到标准的字符码。
(实施方式2)
本发明的实施方式2的文本处理系统的整体构成与图1一样,所以省略说明。
图6是说明本发明的实施方式2的文本处理系统的动作的流程图。本流程根据CPU11的文本处理程序来执行。
首先,在步骤S21中,通过键盘等输入装置15输入字符等。
接下来,在步骤S22中,CPU11进行输入方法中的词典变换。例如,输入方法中的词典变换是假名汉字变换。
接下来,在步骤S23中,等待输入的确定。输入的确定通过按下确定键、或者按下回车键等来执行。
接下来,在步骤S24中,字符码变更单元11a按照通过输入装置15输入的字符的顺序来记录字体数据。
接下来,在步骤S25中,字符码变更单元11a将记录了字体数据的字符的字符码变更成表示字体数据的排序编号的变换字符码。
接下来,在步骤S26中,变换表格创建单元11b创建表示字符码和变换字符码的对应关系的变换表格。
在步骤S27中,CPU11等待输入字符的确定。
接下来,在步骤S28中,输出单元11c通过适当字体来显示字符并结束本流程。
接下来,说明上述文本处理系统的文本数据的创建例子。
语句例:
“そのとき、吾一は学校から帰ったばかりだった。”(22个日文字符)
文本处理系统按照输入的字符的顺序来记录字体数据。同时,系统将记录了字体数据的字符的字符码变更成字体数据的排序编号。即,按以下方式变更字符码。
そ→No.1
の→No.2
と→No.3
き→No.4
、→No.5
吾→No.6
一→No.7
接下来,创建表示字符码(标准的字符码)与字体数据的排序编号(变换字符码)的对应关系的变换表格。
如以上详细地说明了的那样,根据本实施方式,文本处理系统具备:字符码变更单元11a,按照通过输入装置15输入的字符的顺序来记录字体数据,并且将记录了字体数据的字符的字符码变更成由字体数据的排序编号构成的变换字符码;变换表格创建单元11b,创建表示字符码和变换字符码的对应关系的变换表格;以及输出单元11c,根据字体数据来以字体输出字符。
由此,字符码与标准的码不同,它具有随机性,无法简单地进行文本的复制。在此,自动创建各语句所特有的变换表格。
另外,字符码只要能够区分该语句中出现的字符即可,不需要区分所有的字符,所以能够减少字符码的比特数。
进而,字体数据只要是在该语句中出现的字符的字体数据即可,系统不需要加载所有的字符的字体,所以能够减少字体数据的存储容量。
在此,子集字体数据具有变换表格的信息,所以即使在用户的终端中没有变换表格,根据变换字符码和子集字体数据也能够显示原文。
另外,通过使用变换表格,能够使变换字符码恢复到标准的字符码。
此外,本发明不限定于上述实施方式,在不脱离本发明的主旨的范围内,能够实施各种变形。
例如,字体数据能够附属于语句,与语句独立地分发,用于计费等。
另外,具有标准字符以外的码的字符也能够和标准字符一样简单地使用。
另外,既能够在不同区域分别记录设计有差异的字体数据,也能够在相同区域连续记录。
另外,在上述各实施方式中,采用了文本处理系统、电子文本以及文本处理方法这样的名称,但这是为了说明上的方便,装置的名称也可以是信息处理装置、文本处理装置,另外,方法的名称也可以是信息处理方法等。
另外,构成上述文本处理系统的各部分例如外部存储装置、通信装置的种类、数量以及连接方法等可以是任意的。
另外,本发明不仅仅针对于日语,能够应用于所有语言。
另外,本发明不仅能够应用于UTF-8的字符编码方式,还能够应用与Unicode对应的UTF-16、UTF-32、Shift-JIS、以及EUC等各种种类。
另外,本发明的文本处理系统也能够通过用于使计算机作为该文本处理系统发挥功能的程序来实现。该程序也可以储存在计算机可读的记录媒体中。
记录了该程序的记录媒体既可以是图1所示的ROM12本身,另外,也可以是通过在存储介质安装部18中插入记录媒体而可读的DVD-ROM等。
另外,上述记录媒体是磁带、盒式磁带、软盘、硬盘、CD/MO/MD等,或者也可以是半导体存储器。
以上说明了的文本处理方法也能够通过用于使该文本处理方法发挥功能的程序来实现。该程序储存在计算机可读的记录媒体中。
本说明书所引用了的所有刊物、专利以及专利申请均原样地作为参考被引入到本文中。
产业上的可利用性
本发明的文本处理系统、电子文本以及文本处理方法优选应用于具有改进了的文本数据和字体数据的安全技术和压缩技术的文本处理系统以及电子文本中。

Claims (9)

1.一种对能够嵌入字体数据的电子文本进行创建的文本处理系统,其特征在于,具备:
字符码变更单元,按照语句中的字符的出现顺序来记录所述字符的字体数据,并且将记录了所述字体数据的字符的字符码变更成由所述字体数据的排序编号构成的变换字符码;
变换表格创建单元,创建表示所述字符码和所述变换字符码的对应关系的变换表格;以及
输出单元,根据所述字体数据来以字体输出字符。
2.根据权利要求1所述的文本处理系统,其特征在于,具备:
恢复单元,采用所述变换表格,使所述变换字符码恢复到标准的字符码。
3.一种对能够嵌入字体数据的电子文本进行创建的文本处理系统,其特征在于,具备:
输入单元,输入字符;
字符码变更单元,按照通过所述输入单元输入的字符的出现顺序来记录所述字符的字体数据,并且将记录了所述字体数据的字符的字符码变更成由所述字体数据的排序编号构成的变换字符码;
变换表格创建单元,创建表示所述字符码和所述变换字符码的对应关系的变换表格;以及
输出单元,根据所述字体数据来以字体输出字符。
4.根据权利要求1至3的任一项所述的文本处理系统,其特征在于,
所述输出单元通过所述字体数据来显示字符。
5.一种电子文本,所述电子文本通过根据权利要求1至4的任一项所述的文本处理系统来创建。
6.根据权利要求5所述的电子文本,其特征在于,
所述电子文本是如下格式,在该格式中,在开头处设置作为子集字体识别编号的控制码,接着设置通过变换字符码来表示的语句。
7.一种用于对能够嵌入字体数据的电子文本进行创建的文本处理方法,其特征在于,包括以下步骤:
按照语句中的字符的出现顺序来记录所述字符的字体数据,并且将记录了所述字体数据的字符码变更成由所述字体数据的排序编号构成的变换字符码;
创建表示所述字符码和所述变换字符码的对应关系的变换表格;以及
根据所述字体数据来以字体输出字符。
8.一种用于使计算机作为根据权利要求1所述的文本处理系统发挥功能的程序。
9.一种计算机可读存储介质,在该计算机可读存储介质中记录了用于使计算机作为根据权利要求1所述的文本处理系统发挥功能的程序。
CN201280074372.8A 2012-06-29 2012-06-29 文本处理系统、电子文本、文本处理方法以及程序 Pending CN104412255A (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2012/066818 WO2014002281A1 (ja) 2012-06-29 2012-06-29 文書処理システム、電子文書、文書処理方法及びプログラム

Publications (1)

Publication Number Publication Date
CN104412255A true CN104412255A (zh) 2015-03-11

Family

ID=49782504

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201280074372.8A Pending CN104412255A (zh) 2012-06-29 2012-06-29 文本处理系统、电子文本、文本处理方法以及程序

Country Status (7)

Country Link
US (1) US20150113391A1 (zh)
EP (1) EP2869210A4 (zh)
JP (1) JP5467155B1 (zh)
KR (1) KR20150044430A (zh)
CN (1) CN104412255A (zh)
HK (1) HK1202948A1 (zh)
WO (1) WO2014002281A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107533617A (zh) * 2015-07-21 2018-01-02 At信息股份有限公司 服务器装置、信息管理系统、信息管理方法以及计算机程序

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6491438B2 (ja) * 2014-08-29 2019-03-27 株式会社日立社会情報サービス マイグレーション支援装置
KR102401229B1 (ko) * 2020-04-29 2022-05-25 (주)폰트릭스 텍스트를 암호화 하는 방법 및 이를 구현하는 장치
CN113595683A (zh) * 2021-07-07 2021-11-02 西安震有信通科技有限公司 基于各类编码文件的转换处理方法、装置、终端及介质
CN116861041B (zh) * 2023-09-04 2023-11-07 世窗信息股份有限公司 一种电子公文处理方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09153044A (ja) * 1995-09-27 1997-06-10 Nec Corp 文字処理装置およびカナ英字変換装置
CN1266237A (zh) * 1999-02-26 2000-09-13 I-Dns通迅国际公司 多语言域名服务
JP2006215654A (ja) * 2005-02-01 2006-08-17 Iena Shoji Kk 文字情報表示システム及び文字情報表示方法
US20080240567A1 (en) * 2007-03-30 2008-10-02 Microsoft Corporation Displaying text of a writing system using syntax-directed translation
US20090300481A1 (en) * 2008-06-02 2009-12-03 Canon Kabushiki Kaisha Server apparatus, information processing apparatus, data processing method, and storage medium including program

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5365018A (en) 1976-11-24 1978-06-10 Hitachi Ltd Character display unit
JPH0619903A (ja) * 1992-06-29 1994-01-28 Canon Inc 文字処理装置
JP2004013680A (ja) * 2002-06-10 2004-01-15 Nec Corp 文字コード圧縮・復元装置および同方法
JP2006107033A (ja) 2004-10-04 2006-04-20 Canon Inc フォント情報の埋め込み機能を備える情報処理装置及び情報処理方法及びプログラム並びに記憶媒体
JP2007109158A (ja) 2005-10-17 2007-04-26 Canon Inc 文書処理システムおよび文書処理方法およびコンピュータが読取り可能な記憶媒体およびプログラム
JP2009271780A (ja) * 2008-05-08 2009-11-19 Canon Inc 電子文書変換装置および電子文書変換方法
US7663511B2 (en) * 2008-06-18 2010-02-16 Microsoft Corporation Dynamic character encoding

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09153044A (ja) * 1995-09-27 1997-06-10 Nec Corp 文字処理装置およびカナ英字変換装置
CN1266237A (zh) * 1999-02-26 2000-09-13 I-Dns通迅国际公司 多语言域名服务
JP2006215654A (ja) * 2005-02-01 2006-08-17 Iena Shoji Kk 文字情報表示システム及び文字情報表示方法
US20080240567A1 (en) * 2007-03-30 2008-10-02 Microsoft Corporation Displaying text of a writing system using syntax-directed translation
US20090300481A1 (en) * 2008-06-02 2009-12-03 Canon Kabushiki Kaisha Server apparatus, information processing apparatus, data processing method, and storage medium including program

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107533617A (zh) * 2015-07-21 2018-01-02 At信息股份有限公司 服务器装置、信息管理系统、信息管理方法以及计算机程序

Also Published As

Publication number Publication date
WO2014002281A1 (ja) 2014-01-03
HK1202948A1 (zh) 2015-10-09
KR20150044430A (ko) 2015-04-24
EP2869210A4 (en) 2016-05-18
JP5467155B1 (ja) 2014-04-09
EP2869210A1 (en) 2015-05-06
JPWO2014002281A1 (ja) 2016-05-30
US20150113391A1 (en) 2015-04-23

Similar Documents

Publication Publication Date Title
Taleby Ahvanooey et al. A comparative analysis of information hiding techniques for copyright protection of text documents
US7958133B2 (en) Application conversion of source data
CN104412255A (zh) 文本处理系统、电子文本、文本处理方法以及程序
US7933924B2 (en) Document objects
Castiglione et al. New steganographic techniques for the OOXML file format
WO2019144547A1 (zh) 数据录入方法、装置、计算机设备和存储介质
CN102360350A (zh) 将样式破坏从可扩展标记语言文档中移除
Sahoo et al. A novel approach for hiding secret data in program files
JP2010520532A (ja) 画数の入力
KR100943318B1 (ko) 클립보드 보안방법
US7289045B1 (en) Two-stage codec for frame-based program images
CN101206708B (zh) 图像处理装置及图像处理方法
KR102401229B1 (ko) 텍스트를 암호화 하는 방법 및 이를 구현하는 장치
US9646015B1 (en) Digital work compression
Egan What are interfaces for, really?
Tiwari et al. A novel steganographic methodology for high capacity data hiding in executable files
JP7466158B2 (ja) プログラム、コンピュータおよび情報処理方法
JP6535978B2 (ja) 文字入力装置、文字入力方法、及び文字入力プログラム
US20220156449A1 (en) System and method for providing steganographic text encoding
JP2010224656A (ja) ソースコード生成装置、プログラム及びソースコード生成方法
Locklair Digital Data Demise: Obsolete Digital Data Formats
CN117094017A (zh) 一种敏感信息随机加密方法、系统、装置及可读存储介质
JP2008129814A (ja) 文書管理方法、文書管理システム、プログラム及び記録媒体
Carnahan et al. An Introduction to Computers
JP2023027894A (ja) 情報処理装置およびプログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1202948

Country of ref document: HK

WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20150311

WD01 Invention patent application deemed withdrawn after publication
REG Reference to a national code

Ref country code: HK

Ref legal event code: WD

Ref document number: 1202948

Country of ref document: HK