CN109325215A - Word文本的输出方法及装置 - Google Patents
Word文本的输出方法及装置 Download PDFInfo
- Publication number
- CN109325215A CN109325215A CN201811476473.3A CN201811476473A CN109325215A CN 109325215 A CN109325215 A CN 109325215A CN 201811476473 A CN201811476473 A CN 201811476473A CN 109325215 A CN109325215 A CN 109325215A
- Authority
- CN
- China
- Prior art keywords
- word
- display width
- error information
- text
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 238000012545 processing Methods 0.000 claims description 19
- 238000007781 pre-processing Methods 0.000 claims description 12
- 238000004364 calculation method Methods 0.000 claims description 10
- 230000004807 localization Effects 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/103—Formatting, i.e. changing of presentation of documents
- G06F40/106—Display of layout of documents; Previewing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Document Processing Apparatus (AREA)
- Controls And Circuits For Display Device (AREA)
Abstract
本公开提供的Word文本的输出方法及装置,涉及Word文本的输出技术领域。本公开提供的Word文本的输出方法及装置,首先对原文档中的各单词进行预处理,再判断是否存在从原文档中输出的单词,如果存在,针对输出的每个单词,计算出该单词在Word文本中的第一显示宽度,以及根据该单词的字符间距和缩放属性,选取多种组合方式调整该单词在Word文本中的显示宽度,得到多个第二显示宽度,将第一显示宽度与各第二显示宽度进行对比,判断是否存在误差,如果存在误差,则获取最小的误差信息及该误差信息对应的组合方式,并将该单词以该组合方式输出至Word文本中,同时根据最小的误差信息调整下一个单词的第一显示宽度,进而抹平单词的宽度误差,提升Word文本定位的精确度。
Description
技术领域
本公开涉及Word文本的输出技术领域,具体而言,涉及一种Word文本的输出方法及装置。
背景技术
版式文档是指符合版式文档格式规范的文档,其版面呈现效果固定的电子文档格式,版式文档的呈现与设备无关,在各种设备上阅读、打印或印刷时,其版面的呈现结果都是一致的,目前,将版式文档转化为Word文档后,会出现文本位置与原文档不对应,无法精确控制Word文本位置,精确度不高。
发明内容
有鉴于此,本公开提供一种Word文本的输出方法,所述方法包括:
对原文档中的各单词进行预处理。
判断是否存在从所述原文档中输出的单词,如果存在,针对输出的每个单词,根据该单词的属性信息计算出该单词在Word文本中的第一显示宽度。
根据该单词的字符间距和缩放属性,选取多种组合方式调整该单词在Word文本中的显示宽度,得到多个第二显示宽度。
将所述第一显示宽度与各所述第二显示宽度进行对比,判断是否存在误差。
如果存在误差,获取最小的误差信息及该误差信息对应的组合方式,并将该单词以该误差信息对应的组合方式输出至所述Word文本中。
根据所述最小的误差信息调整下一个单词的第一显示宽度。
进一步的,将所述第一显示宽度与各所述第二显示宽度进行对比,判断是否存在误差的步骤包括:
将所述第一显示宽度与各所述第二显示宽度进行对比。
计算各所述第二显示宽度与所述第一显示宽度的差值,得到多个误差信息。
判断各所述误差信息的值是否等于零,若存在至少一个所述误差信息的值等于零,判定不存在误差,若各所述误差信息的值均不等于零,判定存在误差。
进一步的,根据所述最小的误差信息调整下一个单词的第一显示宽度的步骤包括:
判断所述最小的误差信息的值是否小于零,如果小于零,根据所述最小的误差信息的值增加所述下一个单词的第一显示宽度。
如果大于零,根据所述最小的误差信息的值减少所述下一个单词的第一显示宽度。
进一步的,对各单词进行预处理的步骤包括:
在各所述单词之间插入空格,所述空格的期望宽度为相邻两个单词的间距,所述空格的属性信息与相邻两个单词中的前一个单词的属性信息相同。
将所述空格作为单词,输出到所述Word文本中。
进一步的,所述单词的属性信息包括单词的内容、字体、字号以及粗斜体。
本公开提供一种Word文本的输出装置,包括处理模块、计算模块、执行模块、输出模块以及调整模块。
所述处理模块用于对原文档中的各单词进行预处理。
所述计算模块用于判断是否存在从所述原文档中输出的单词,如果存在,针对输出的每个单词,根据该单词的属性信息计算出该单词在Word文本中的第一显示宽度。
所述执行模块用于根据该单词的字符间距和缩放属性,选取多种组合方式调整该单词在Word文本中的显示宽度,得到多个第二显示宽度,并将所述第一显示宽度与各所述第二显示宽度进行对比,判断是否存在误差;
其中,如果存在误差,所述输出模块用于获取最小的误差信息及该误差信息对应的组合方式,并将该单词以该误差信息对应的组合方式输出至所述Word文本中。
所述调整模块用于根据所述最小的误差信息调整下一个单词的第一显示宽度。
进一步的,所述执行模块包括执行子模块以及计算子模块;所述执行模块用于将所述第一显示宽度与各所述第二显示宽度进行对比,判断是否存在误差包括:
所述执行子模块用于将所述第一显示宽度与各所述第二显示宽度进行对比。
所述计算子模块用于计算各所述第二显示宽度与所述第一显示宽度的差值,得到多个误差信息。
所述执行子模块用于判断各所述误差信息的值是否等于零,若存在至少一个所述误差信息的值等于零,判定不存在误差,若各所述误差信息的值均不等于零,判定存在误差。
进一步的,所述调整模块用于根据所述最小的误差信息调整下一个单词的第一显示宽度包括:
所述调整模块用于判断所述最小的误差信息的值是否小于零,如果小于零,根据所述最小的误差信息的值增加所述下一个单词的第一显示宽度;或者,
如果大于零,根据所述最小的误差信息的值减少所述下一个单词的第一显示宽度。
进一步的,所述处理模块用于对各单词进行预处理包括:
所述处理模块用于在各所述单词之间插入空格,并将所述空格作为单词,输出到所述Word文本中。
所述空格的期望宽度为相邻两个单词的间距,所述空格的属性信息与相邻两个单词中的前一个单词的属性信息相同。
进一步的,所述单词的属性信息包括单词的内容、字体、字号以及粗斜体。
本公开提供的Word文本的输出方法及装置,首先对原文档中的各单词进行预处理,再判断是否存在从原文档中输出的单词,如果存在,针对输出的每个单词,根据该单词的属性信息计算出该单词在Word文本中的第一显示宽度,以及根据该单词的字符间距和缩放属性,选取多种组合方式调整该单词在Word文本中的显示宽度,得到多个第二显示宽度,将第一显示宽度与各第二显示宽度进行对比,判断是否存在误差,如果存在误差,则获取最小的误差信息及该误差信息对应的组合方式,并将该单词以该误差信息对应的组合方式输出至Word文本中,同时根据最小的误差信息调整下一个单词的第一显示宽度,抹平单词的宽度误差,进而控制Word文本位置,减少Word文本输出所带来的误差,极大提升了Word文本定位的精确度。
为使本公开的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本公开的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本公开的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本公开所提供的电子设备的方框示意图。
图2为本公开所提供的Word文本的输出装置的一种方框示意图。
图3为本公开所提供的Word文本的输出方法的一种流程示意图。
图4为本公开所提供的Word文本的输出方法的另一种流程示意图。
图5为本公开所提供的Word文本的输出方法的又一种流程示意图。
图6为本公开所提供的Word文本的输出方法的又一种流程示意图。
图7为本公开所提供的Word文本的输出装置的另一种方框示意图。
图标:100-电子设备;10-输出装置;11-处理模块;12-计算模块;13-执行模块;131-执行子模块;132-计算子模块;14-输出模块;15-调整模块;20-存储器;30-处理器;40-通信单元。
具体实施方式
下面将结合本公开中附图,对本公开中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本公开的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本公开的实施例的详细描述并非旨在限制要求保护的本公开的范围,而是仅仅表示本公开的选定实施例。基于本公开的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本公开保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
便携式文档格式(Portable Document Format,PDF)文档作为版式文档的一种,具有许多其他电子文档格式无法相比的优点。PDF文档格式可以将文字、字型、格式、颜色及独立于设备和分辨率的图形图像等封装在一个文件中。PDF文档还可以包含超文本链接、声音和动态影像等电子信息,支持特长文件,集成度和安全可靠性都较高。对普通读者而言,用PDF制作的电子书具有纸版书的质感和阅读效果,可以逼真地展现原书的原貌,而显示大小可任意调节,给读者提供了个性化的阅读方式。PDF文档的字型嵌入系统,可使字型随文件一起传输,让用户可以在不同设备终端(如移动端、电子书阅读器等)都可以有相同的阅读体验。PDF文档除了给用户带来极好的编辑与阅读体验,还需要提供给用户将PDF转换为其他格式的功能,方便用户使用。而使用频率最高的,就是PDF文档转换为Word文本。但是PDF中的文本密度不一,转换为Word后,文本位置与原文件不对应。目前,最常用的是通过简单使用字符间距和字符缩放调整文本大小,但是Word文本的字符间距最小单位是0.5磅,缩放的最小单位是1%,存在一定误差,在大段文本尤其是多行文本时,误差会累积得很大,无法精确控制文本位置。
基于上述研究,本公开提供一种Word文本的输出方法及装置,以改善上述问题。
请结合参阅图1,本公开提供的Word文本的输出方法应用于图1所示的电子设备100。由所述电子设备100执行本公开所提供的版式文档的转换方法。在本公开中,所述电子设备100可以是,但不限于,个人电脑(Personal Computer,PC)、笔记本电脑、个人数字助理(Personal Digital Assistant,PDA)或服务器等具有处理能力的电子设备100。
所述电子设备100包括图2所示的输出装置10、存储器20、处理器30以及通信单元40;所述存储器20、处理器30以及通信单元40各个元件相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互直接可通过一条或多条通讯总线或信号线实现电性连接。所述输出装置10包括至少一个可以软件或固件(Firmware)的形式存储于所述存储器20中的软件功能模块,所述处理器30通过运行存储在存储器20内的软件程序以及模块,从而执行各种功能应用以及数据处理。
所述存储器20可以是,但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-OnlyMemory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。
所述处理器30可以是一种集成电路芯片,具有信号的处理能力。所述处理器30可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(NetworkProcessor,NP)等。
所述通信单元40用于通过网络建立所述电子设备100与其他外部设备之间的通信连接,并通过所述网络进行数据传输。
请结合参阅图3,图3为本公开所提供的Word文本的输出方法的流程示意图。下面对图3所示的Word文本的输出方法的具体流程进行详细阐述。
步骤S10:对原文档中的各单词进行预处理。
其中,所述原文档中可能包括多个段落,每个段落可能包括多个单词,为了提升Word文本定位的精确度,本公开中,在输出单词前,需要对所述原文档中的各单词进行预处理。可选的,本公开中,原文档可以为版式文档,例如PDF文档,也可以为Word文档,PPT文档等,原文档的类型不限。
步骤S20:判断是否存在从所述原文档中输出的单词。
如果存在从所述原文档中输出的单词,执行步骤S20,如果不存在从所述原文档中输出的单词,则结束流程。其中,所述原文档中可能包括多个段落,每个段落可能包括多个单词,将所述原文档中的各单词输出至Word文本中,需要对所述原文档中的各单词依次输出,如果,判断得到不存在从所述原文档中输出的单词,则证明已将所述原文档中的各单词输出至Word文本中,完成了各单词的输出;如果,判断得到存在从所述原文档中输出的单词,则需要对该单词进行输出处理,以使该单词输出到Word文本中,且保持位置大小不变。
步骤S30:针对输出的每个单词,根据该单词的属性信息计算出该单词在Word文本中的第一显示宽度。
其中,针对从所述原文档输出的每个单词,都需要根据该单词自身的属性信息计算出该单词输出到Word文本中的第一显示宽度,所述第一显示宽度为期望宽度,即希望该单词在Word文本中显示时占用的宽度。
步骤S40:根据该单词的字符间距和缩放属性,选取多种组合方式调整该单词在Word文本中的显示宽度,得到多个第二显示宽度。
其中,每个单词都有自身的字符间距和缩放属性,由于单词的字符间距和缩放精度有限,因此要根据单词的字符间距和缩放精度,尝试多种组合方式调整单词在Word文本中的显示宽度,一种的组合方式就得到一个第二显示宽度,多种组合方式就得到多个第二显示宽度,所述第二显示宽度为单词在Word文本中的实际显示宽度。
步骤S50:将所述第一显示宽度与各所述第二显示宽度进行对比,判断是否存在误差。
其中,如果存在误差,执行步骤S60;如果不存在误差,则将该单词输出至Word文本中,继续对所述原文档中的下一个单词进行处理,输出下一个单词。
步骤S60:获取最小的误差信息及该误差信息对应的组合方式,并将该单词以该误差信息对应的组合方式输出至所述Word文本中。
其中,将该单词的第一显示宽度与各第二显示宽度进行对比后,如果存在误差,则获取最小的误差信息,即误差值最小的,同时获取该误差值对应的组合方式,以最小的误差信息对应的组合方式将该单词输出到Word文本中,该组合方式包括了该单词在当前状态下的字符间距和缩放精度属性。在本公开中,由于单词的字符间距和缩放精度有限,在每选取一种组合方式调整单词在Word文本中的实际显示宽度时,其字符间距和缩放精度都会发生变化,即每一种组合方式都对应一种字符间距和缩放精度属性。
步骤S70:根据所述最小的误差信息调整下一个单词的第一显示宽度。
其中,如果存在误差,在获取了最小的误差信息及该误差信息对应的组合方式后,以最小的误差信息对应的组合方式将该单词输出至Word文本中,同时根据最小的误差信息调整下一个单词的第一显示宽度,进而将下一个单词调整后的第一显示宽度与下一个单词的各第二显示宽度对比,选取误差最小的组合方式,并以组合方式将下一个单词输出至Word文本中时,就可以抹平上一个单词的宽度误差,极大提升了Word文本定位的精确度。
进一步的,请结合参阅图4,将所述第一显示宽度与各所述第二显示宽度进行对比,判断是否存在误差的步骤包括步骤S51至步骤S53。
步骤S51:将所述第一显示宽度与各所述第二显示宽度进行对比。
步骤S52:计算各所述第二显示宽度与所述第一显示宽度的差值,得到多个误差信息。
其中,将所述第一显示宽度与各所述第二显示宽度进行对比后,计算各所述第二显示宽度与所述第一显示宽度的差值,得到多个误差信息,即将该单词的各所述第二显示宽度与所述第一显示宽度进行做差计算,每一个所述第二显示宽度与第一显示宽度的做差计算,都对应有一个误差信息,该误差信息包括了该误差信息对应的第二显示宽度与第一显示宽度的差值。
步骤S53:判断各所述误差信息的值是否等于零,若存在至少一个所述误差信息的值等于零,执行步骤S531;若各所述误差信息的值均不等于零若各所述误差信息的值均不等于零,执行步骤S532。
S531:判定不存在误差。
其中,若存在至少一个误差信息的值等于零,则判定不存在误差,并将该单词以误差信息为零所对应的组合方式输出至Word文本中,继续处理下一个单词。
S532:判定存在误差。
其中,若各所述误差信息的值都不等于零,则判定存在误差,并选取其中值最小的误差信息以及该误差信息对应的组合方式,以该误差信息对应的组合方式将该单词输出至Word文本中,同时根据该误差信息调整下一个单词的第一显示宽度。
进一步的,请结合参阅图5,根据所述最小的误差信息调整下一个单词的第一显示宽度的步骤包括步骤S71至步骤S73。
步骤S71:判断所述最小的误差信息的值是否小于零,
其中,如果所述最小的误差信息的值小于零,执行步骤S72,如果所述最小的误差信息的值大于零,执行步骤S73。
步骤S72:根据所述最小的误差信息的值增加所述下一个单词的第一显示宽度。
其中,如果所述最小的误差信息的值小于零,则根据所述最小的误差信息的值增加所述下一个单词的第一显示宽度。例如,所述最小的误差信息的值为-C,下一个单词计算出来的第一显示宽度为A,则下一个单词调整后的第一显示宽度为A+C,将下一个单词调整后的第一显示宽度与各第二显示宽度对比,然后选取误差最小的组合方式,并以组合方式将下一个单词输出至Word文本中,进而,抹平上一个单词的宽度误差,极大提升了word文本定位的精确度。
步骤S73:根据所述最小的误差信息的值减少所述下一个单词的第一显示宽度。
同理的,如果所述最小的误差信息的值大于零,则根据所述最小的误差信息的值减少所述下一个单词的第一显示宽度。例如,所述最小的误差信息的值为C,下一个单词计算出来的第一显示宽度为A,则下一个单词调整后的第一显示宽度为A-C。
进一步的,请结合参阅6,对各单词进行预处理的步骤包括步骤S11至步骤S12。
步骤S11:在各所述单词之间插入空格。
其中,所述空格的期望宽度为相邻两个单词的间距,所述空格的属性信息与相邻两个单词中的前一个单词的属性信息相同。可选的,若所述原文档中的各所述单词之间已存在空格,则无需再插入空格。
步骤S12:将所述空格作为单词,输出到所述Word文本中。
其中,在各单词之间插入空格后,所述空格作为普通单词,对空格也进行和单词一样的处理,最后输出至所述Word文本中。
进一步的,所述单词的属性信息包括单词的内容、字体、字号以及粗斜体。
请返回结合参阅图2,本公开提供的Word文本的输出装置10,包括处理模块11、计算模块12、执行模块13、输出模块14以及调整模块15。
所述处理模块11用于对原文档中的各单词进行预处理。
所述计算模块12用于判断是否存在从所述原文档中输出的单词,如果存在,针对输出的每个单词,根据该单词的属性信息计算出该单词在Word文本中的第一显示宽度。
所述执行模块13用于根据该单词的字符间距和缩放属性,选取多种组合方式调整该单词在Word文本中的显示宽度,得到多个第二显示宽度,并将所述第一显示宽度与各所述第二显示宽度进行对比,判断是否存在误差,其中,如果存在误差,所述输出模块14用于获取最小的误差信息及该误差信息对应的组合方式,并将该单词以该误差信息对应的组合方式输出至所述Word文本中。
所述调整模块15用于根据所述最小的误差信息调整下一个单词的第一显示宽度。
进一步的,请结合参阅图7,所述执行模块13包括执行子模块131以及计算子模块132;所述执行模块13用于将所述第一显示宽度与各所述第二显示宽度进行对比,判断是否存在误差包括:
所述执行子模块131用于将所述第一显示宽度与各所述第二显示宽度进行对比。
所述计算子模块132用于计算各所述第二显示宽度与所述第一显示宽度的差值,得到多个误差信息。
所述执行子模块131用于判断各所述误差信息的值是否等于零,若存在至少一个所述误差信息的值等于零,判定不存在误差,若各所述误差信息的值均不等于零,判定存在误差。
进一步的,所述调整模块15用于根据所述最小的误差信息调整下一个单词的第一显示宽度包括:
所述调整模块15用于判断所述最小的误差信息的值是否小于零,如果小于零,根据所述最小的误差信息的值增加所述下一个单词的第一显示宽度;或者,如果大于零,根据所述最小的误差信息的值减少所述下一个单词的第一显示宽度。
进一步的,所述处理模块11用于对各单词进行预处理包括:
所述处理模块11用于在各所述单词之间插入空格,并将所述空格作为单词,输出到所述Word文本中。
所述空格的期望宽度为相邻两个单词的间距,所述空格的属性信息与相邻两个单词中的前一个单词的属性信息相同。
进一步的,所述单词的属性信息包括单词的内容、字体、字号以及粗斜体。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的输出装置10的具体工作过程,可以参考前述方法中的对应过程,在此不再过多赘述。
作为另一种可实施方式,本公开提供的Word文本的输出方法及装置,也可以用于PPT文本输出,即将文本准确的输出至PPT文本中,差别在于Word文本中的单词具有字符间距以及缩放属性,PPT文本中的单词只有字符间距属性。
综上所述,本公开提供的Word文本的输出方法及装置,首先对原文档中的各单词进行预处理,再判断是否存在从原文档中输出的单词,如果存在,针对输出的每个单词,根据该单词的属性信息计算出该单词在Word文本中的第一显示宽度,以及根据该单词的字符间距和缩放属性,选取多种组合方式调整该单词在Word文本中的显示宽度,得到多个第二显示宽度,将第一显示宽度与各第二显示宽度进行对比,判断是否存在误差,如果存在误差,则获取最小的误差信息及该误差信息对应的组合方式,并将该单词以该误差信息对应的组合方式输出至Word文本中,同时根据最小的误差信息调整下一个单词的第一显示宽度,抹平单词的宽度误差,进而控制Word文本位置,减少Word文本输出所带来的误差,极大提升了Word文本定位的精确度。本公开所提供的Word文本的输出方法及装置根据单词的字符间距以及缩放属性,多次调整单词的显示宽度,进而选取最佳组合方式,并结合误差传递,抹平单词的宽度误差,极大提升了Word文本定位的精确度,得以让用户可以精确输出文本到Word中。
在本公开所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置和方法实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本公开的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本公开各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本公开的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,电子设备,或者网络设备等)执行本公开各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。此外,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
以上所述仅为本公开的可选实施例而已,并不用于限制本公开,对于本领域的技术人员来说,本公开可以有各种更改和变化。凡在本公开的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本公开的保护范围之内。
Claims (10)
1.一种Word文本的输出方法,其特征在于,所述方法包括:
对原文档中的各单词进行预处理;
判断是否存在从所述原文档中输出的单词,如果存在,针对输出的每个单词,根据该单词的属性信息计算出该单词在Word文本中的第一显示宽度;
根据该单词的字符间距和缩放属性,选取多种组合方式调整该单词在Word文本中的显示宽度,得到多个第二显示宽度;
将所述第一显示宽度与各所述第二显示宽度进行对比,判断是否存在误差;
如果存在误差,获取最小的误差信息及该误差信息对应的组合方式,并将该单词以该误差信息对应的组合方式输出至所述Word文本中;
根据所述最小的误差信息调整下一个单词的第一显示宽度。
2.根据权利要求1所述的Word文本的输出方法,其特征在于,将所述第一显示宽度与各所述第二显示宽度进行对比,判断是否存在误差的步骤包括:
将所述第一显示宽度与各所述第二显示宽度进行对比;
计算各所述第二显示宽度与所述第一显示宽度的差值,得到多个误差信息;
判断各所述误差信息的值是否等于零,若存在至少一个所述误差信息的值等于零,判定不存在误差,若各所述误差信息的值均不等于零,判定存在误差。
3.根据权利要求2所述的Word文本的输出方法,其特征在于,根据所述最小的误差信息调整下一个单词的第一显示宽度的步骤包括:
判断所述最小的误差信息的值是否小于零,如果小于零,根据所述最小的误差信息的值增加所述下一个单词的第一显示宽度;
如果大于零,根据所述最小的误差信息的值减少所述下一个单词的第一显示宽度。
4.根据权利要求1所述的Word文本的输出方法,其特征在于,对各单词进行预处理的步骤包括:
在各所述单词之间插入空格,所述空格的期望宽度为相邻两个单词的间距,所述空格的属性信息与相邻两个单词中的前一个单词的属性信息相同;
将所述空格作为单词,输出到所述Word文本中。
5.根据权利要求1所述的Word文本的输出方法,其特征在于,所述单词的属性信息包括单词的内容、字体、字号以及粗斜体。
6.一种Word文本的输出装置,其特征在于,包括处理模块、计算模块、执行模块、输出模块以及调整模块;
所述处理模块用于对原文档中的各单词进行预处理;
所述计算模块用于判断是否存在从所述原文档中输出的单词,如果存在,针对输出的每个单词,根据该单词的属性信息计算出该单词在Word文本中的第一显示宽度;
所述执行模块用于根据该单词的字符间距和缩放属性,选取多种组合方式调整该单词在Word文本中的显示宽度,得到多个第二显示宽度,并将所述第一显示宽度与各所述第二显示宽度进行对比,判断是否存在误差;
其中,如果存在误差,所述输出模块用于获取最小的误差信息及该误差信息对应的组合方式,并将该单词以该误差信息对应的组合方式输出至所述Word文本中;
所述调整模块用于根据所述最小的误差信息调整下一个单词的第一显示宽度。
7.根据权利要求6所述的Word文本的输出装置,其特征在于,所述执行模块包括执行子模块以及计算子模块;所述执行模块用于将所述第一显示宽度与各所述第二显示宽度进行对比,判断是否存在误差包括:
所述执行子模块用于将所述第一显示宽度与各所述第二显示宽度进行对比,
所述计算子模块用于计算各所述第二显示宽度与所述第一显示宽度的差值,得到多个误差信息;
所述执行子模块用于判断各所述误差信息的值是否等于零,若存在至少一个所述误差信息的值等于零,判定不存在误差,若各所述误差信息的值均不等于零,判定存在误差。
8.根据权利要求7所述的Word文本的输出装置,其特征在于,所述调整模块用于根据所述最小的误差信息调整下一个单词的第一显示宽度包括:
所述调整模块用于判断所述最小的误差信息的值是否小于零,如果小于零,根据所述最小的误差信息的值增加所述下一个单词的第一显示宽度;或者,
如果大于零,根据所述最小的误差信息的值减少所述下一个单词的第一显示宽度。
9.根据权利要求6所述的Word文本的输出装置,其特征在于,所述处理模块用于对各单词进行预处理包括:
所述处理模块用于在各所述单词之间插入空格,并将所述空格作为单词,输出到所述Word文本中;
所述空格的期望宽度为相邻两个单词的间距,所述空格的属性信息与相邻两个单词中的前一个单词的属性信息相同。
10.根据权利要求6所述的Word文本的输出装置,其特征在于,所述单词的属性信息包括单词的内容、字体、字号以及粗斜体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811476473.3A CN109325215B (zh) | 2018-12-04 | 2018-12-04 | Word文本的输出方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811476473.3A CN109325215B (zh) | 2018-12-04 | 2018-12-04 | Word文本的输出方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109325215A true CN109325215A (zh) | 2019-02-12 |
CN109325215B CN109325215B (zh) | 2023-02-10 |
Family
ID=65256360
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811476473.3A Active CN109325215B (zh) | 2018-12-04 | 2018-12-04 | Word文本的输出方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109325215B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110599899A (zh) * | 2019-09-19 | 2019-12-20 | Oppo广东移动通信有限公司 | 标签显示方法、装置、电子设备以及存储介质 |
CN113723048A (zh) * | 2021-09-06 | 2021-11-30 | 北京字跳网络技术有限公司 | 设置富文本间距的方法、装置、存储介质及电子设备 |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040164980A1 (en) * | 2002-12-04 | 2004-08-26 | Hewlett Gregory J. | Nonlinearity and reset conflicts in pulse width modulated displays |
US20060103665A1 (en) * | 2004-11-12 | 2006-05-18 | Andrew Opala | Method and system for streaming documents, e-mail attachments and maps to wireless devices |
CN1933391A (zh) * | 2005-09-16 | 2007-03-21 | 北京书生国际信息技术有限公司 | 一种隐形编码嵌入和检测的方法 |
CN101052182A (zh) * | 2007-03-27 | 2007-10-10 | 华为技术有限公司 | 实现内容显示的方法、装置和终端 |
CN101127035A (zh) * | 2007-10-11 | 2008-02-20 | 金蝶软件(中国)有限公司 | 在目标区域内绘制字符串的方法及装置 |
CN101501664A (zh) * | 2005-03-29 | 2009-08-05 | 微软公司 | 用于传送网页数据的系统和方法 |
CN101963955A (zh) * | 2010-09-17 | 2011-02-02 | 深圳市万兴软件有限公司 | XML格式文档转换为Word格式文档的系统和方法 |
CN104216868A (zh) * | 2014-09-10 | 2014-12-17 | 武汉钢铁(集团)公司 | 一种文档显示格式的适配方法及装置 |
CN105335346A (zh) * | 2015-11-09 | 2016-02-17 | 汉王科技股份有限公司 | 一种pdf文档的文本提取方法和装置 |
CN106649213A (zh) * | 2016-09-22 | 2017-05-10 | 深圳万兴信息科技股份有限公司 | 一种文档中空格识别方法及系统 |
CN107783956A (zh) * | 2017-11-23 | 2018-03-09 | 掌阅科技股份有限公司 | 文字信息的排版方法、电子设备及计算机存储介质 |
CN108090400A (zh) * | 2016-11-23 | 2018-05-29 | 中移(杭州)信息技术有限公司 | 一种图像文本识别的方法和装置 |
CN108255450A (zh) * | 2018-01-08 | 2018-07-06 | 威创集团股份有限公司 | 一种拼接墙word文档显示控制的方法和系统 |
-
2018
- 2018-12-04 CN CN201811476473.3A patent/CN109325215B/zh active Active
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040164980A1 (en) * | 2002-12-04 | 2004-08-26 | Hewlett Gregory J. | Nonlinearity and reset conflicts in pulse width modulated displays |
US20060103665A1 (en) * | 2004-11-12 | 2006-05-18 | Andrew Opala | Method and system for streaming documents, e-mail attachments and maps to wireless devices |
CN101501664A (zh) * | 2005-03-29 | 2009-08-05 | 微软公司 | 用于传送网页数据的系统和方法 |
CN1933391A (zh) * | 2005-09-16 | 2007-03-21 | 北京书生国际信息技术有限公司 | 一种隐形编码嵌入和检测的方法 |
CN101052182A (zh) * | 2007-03-27 | 2007-10-10 | 华为技术有限公司 | 实现内容显示的方法、装置和终端 |
CN101127035A (zh) * | 2007-10-11 | 2008-02-20 | 金蝶软件(中国)有限公司 | 在目标区域内绘制字符串的方法及装置 |
CN101963955A (zh) * | 2010-09-17 | 2011-02-02 | 深圳市万兴软件有限公司 | XML格式文档转换为Word格式文档的系统和方法 |
CN104216868A (zh) * | 2014-09-10 | 2014-12-17 | 武汉钢铁(集团)公司 | 一种文档显示格式的适配方法及装置 |
CN105335346A (zh) * | 2015-11-09 | 2016-02-17 | 汉王科技股份有限公司 | 一种pdf文档的文本提取方法和装置 |
CN106649213A (zh) * | 2016-09-22 | 2017-05-10 | 深圳万兴信息科技股份有限公司 | 一种文档中空格识别方法及系统 |
CN108090400A (zh) * | 2016-11-23 | 2018-05-29 | 中移(杭州)信息技术有限公司 | 一种图像文本识别的方法和装置 |
CN107783956A (zh) * | 2017-11-23 | 2018-03-09 | 掌阅科技股份有限公司 | 文字信息的排版方法、电子设备及计算机存储介质 |
CN108255450A (zh) * | 2018-01-08 | 2018-07-06 | 威创集团股份有限公司 | 一种拼接墙word文档显示控制的方法和系统 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110599899A (zh) * | 2019-09-19 | 2019-12-20 | Oppo广东移动通信有限公司 | 标签显示方法、装置、电子设备以及存储介质 |
CN113723048A (zh) * | 2021-09-06 | 2021-11-30 | 北京字跳网络技术有限公司 | 设置富文本间距的方法、装置、存储介质及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN109325215B (zh) | 2023-02-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20180197002A1 (en) | Mathematical formula learner support system | |
US20220027740A1 (en) | Auto-formatting of a data table | |
CN109325215B (zh) | Word文本的输出方法及装置 | |
CN108664471B (zh) | 文字识别纠错方法、装置、设备及计算机可读存储介质 | |
CN105095166A (zh) | 流式电子书产生的方法及网站系统 | |
US20220284175A1 (en) | Systems and methods for extracting text from portable document format data | |
CN111797595A (zh) | 一种基于xml模板生成ofd版式页面的方法和装置 | |
CN109582934B (zh) | 版式文档的转换方法及装置 | |
US11663394B2 (en) | Systems for generating instances of variable fonts | |
CN114417226A (zh) | 页面生成方法、显示方法、装置、电子设备和存储介质 | |
US9886426B1 (en) | Methods and apparatus for generating an efficient SVG file | |
CN112198998A (zh) | 文本输入控制方法、相关装置、设备及介质 | |
CN111476006A (zh) | Pdf文件在线批注方法、装置、设备及可读存储介质 | |
US20230260310A1 (en) | Systems and methods for processing documents | |
US10482173B2 (en) | Quality distributions for automated document | |
CN115981617A (zh) | 代码语句推荐方法、装置、电子设备及存储介质 | |
CN115935909A (zh) | 一种文件生成方法、装置及电子设备 | |
CN114629707B (zh) | 一种乱码检测方法、装置及电子设备和存储介质 | |
WO2023024376A1 (zh) | 文本的排版 | |
CN112052647A (zh) | 一种文档编辑方法、装置、电子设备和可读存储介质 | |
CN115687825A (zh) | 一种生成pdf文件的优化方法、装置、设备和存储介质 | |
CN112148869B (zh) | 文本参考信息生成方法、装置、电子设备及存储介质 | |
CN107608947B (zh) | Html文件处理方法及装置、电子设备 | |
KR20220060851A (ko) | 글자체를 제공하는 방법 및 디바이스 | |
CN107122197B (zh) | 阅读版面优化方法、装置及电子阅读终端 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |