CN110348000B - 排版文档交互计算方法、装置、设备及计算机可读介质 - Google Patents
排版文档交互计算方法、装置、设备及计算机可读介质 Download PDFInfo
- Publication number
- CN110348000B CN110348000B CN201910640335.2A CN201910640335A CN110348000B CN 110348000 B CN110348000 B CN 110348000B CN 201910640335 A CN201910640335 A CN 201910640335A CN 110348000 B CN110348000 B CN 110348000B
- Authority
- CN
- China
- Prior art keywords
- calculation
- statistics
- data list
- document
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004364 calculation method Methods 0.000 title claims abstract description 166
- 230000003993 interaction Effects 0.000 title claims abstract description 69
- 230000002452 interceptive effect Effects 0.000 claims abstract description 46
- 238000000605 extraction Methods 0.000 claims abstract description 31
- 238000007781 pre-processing Methods 0.000 claims abstract description 27
- 238000009826 distribution Methods 0.000 claims description 28
- 238000003780 insertion Methods 0.000 claims description 14
- 230000037431 insertion Effects 0.000 claims description 14
- 238000003860 storage Methods 0.000 claims description 8
- 238000001914 filtration Methods 0.000 claims description 7
- 230000002776 aggregation Effects 0.000 claims description 3
- 238000004220 aggregation Methods 0.000 claims description 3
- 238000000034 method Methods 0.000 description 19
- 238000012545 processing Methods 0.000 description 17
- 230000008569 process Effects 0.000 description 13
- 238000010586 diagram Methods 0.000 description 8
- 238000004891 communication Methods 0.000 description 7
- 238000006243 chemical reaction Methods 0.000 description 4
- 238000000926 separation method Methods 0.000 description 3
- 238000012795 verification Methods 0.000 description 3
- 238000009825 accumulation Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/189—Automatic justification
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Document Processing Apparatus (AREA)
Abstract
本发明公开了一种排版文档交互计算方法、装置、设备及计算机可读介质。排版文档交互计算方法,包括:操作人员以任意方式选中文档中的内容;预处理选中的内容,得到数值数据;识别和提取数值数据,得到数据清单;对数据清单进行计算统计,得到计算统计结果;对数据清单或计算统计结果进行交互式按需计算,得到按需计算结果;对按需计算结果进行交互式显示或操纵。排版文档交互计算装置,包括:预处理模块;识别提取模块;计算统计模块;按需计算模块;交互模块。排版文档交互计算设备,设备包括:存储装置和处理器;当一个或多个程序被处理器执行时,处理器实现排版文档交互计算方法。本发明还提供了一种计算机可读介质。
Description
技术领域
本发明涉及字处理排版技术领域,特别是涉及一种排版文档交互计算方法、装置、设备及计算机可读介质。
背景技术
字处理排版软件能将文、图、表等常用文档要素综合格式化地组织在一起,形成一份完整、有型和规范的结果文档,是现代自动化办公必备工具之一,用途非常广泛。在日常各类文档的有些场景,会使用到含义具有整体性、位置却分散的含数值型的(即可以进行运算的数据)内容,文档实际撰写和编辑过程中,会遇到需要对这些内容进行一些基本常见量的计算或复杂一些的统计描述计算,这种需要有时是为了文档内容的验证(即实际工作中的验算),有时是为了提取运算结果,有时是为了复核数值之间的某些逻辑(比如分项累计等于总和、分项百分比累加等于100%等)。
目前,上述这种计算或验算的需要一般是通过这几种方案来满足的:(1)文档编排人员用外部袖珍计算器计算。这需要眼看屏幕显示文档中的数字,然后手工按计算器字符键计算,容易按键出错和看漏数值,效率低。(2)文档编排人员用操作系统自带的计算器工具计算。虽然可以在同一屏幕上进行操作,但是字处理排版软件和计算器工具是两个程序,要么需要手工录入,要么为了避免手工录入错误,就一次一次地找到排版文档中的数据,先复制、再粘贴,如果数据在文档中比较分散地出现,也很容易被遗漏,有时还需要使用窗口滚动条切换,操作效率依然低。(3)利用表格处理工具比如Excel(一种电子表格软件)、WPS表格(一种电子表格软件)。类似地需要把数据粘贴到这些电子表格软件,然后再进行计算,如果需要在文档中使用结果,就需手工粘贴回排版文档中。此方案在复制粘贴源数据时需要注意只能复制数据,不能有其它文本,否则电子表格软件不能过滤非数字符号,导致计算无法完成,结果也需要手工粘贴,跟前两种方案相比,复制粘贴时操作人员要小心,表格处理工具的使用对操作人员也要求较高(有时需要掌握使用公式或函数才能计算),仅仅在计算上略有效率优势。(4)利用字处理排版软件自带的表格计算公式。这种方案只能处理表格中的数据,字处理软件的功能毕竟不在于电子表格的处理,针对复杂表格,公式中单元格的引用还不容易确定,所以用这种方案对操作人员要求最高,还要了解各种公式的含义。而且表格公式也不能对任意内容中的数据进行计算。在个别字处理软件中,比如金山WPS文字(一种文字处理排版软件)仅对表格中的数据提供了快速计算(提供求和、平均值、最大值、最小值四种),而且计算结果一定会自动插入文档,操作人员无法不完成这个自动插入。(5)利用字处理排版软件自带的域代码手工输入计算公式和数据(有的数据还需先建立书签才能引用),对操作人员要求高,手工输入效率低。
综合所述,目前针对排版过程中分散的数值数据如果要进行临时性计算以实现验算验证等需求的各种方案均不能提供很好地人机交互计算操作和控制,不能一次性处理非连续选中内容来参与计算,不能处理位于正文文本中的数值,不能灵活处理中文全角数字,不能灵活处理千分位号的数值。目前方案下,这样一个临时性的简单计算验算需求,操作效率却很低,而且在操作过程中还容易出错。
因此,一种排版文档交互计算方法、装置、设备及计算机可读介质,可以处理和计算任意选中内容中的数据,并保证计算准确和提高操作效率,成为重要需求。
发明内容
基于此,本发明的目的在于,提供一种排版文档交互计算方法、装置、设备及计算机可读介质。
本发明的排版文档交互计算方法,包括:
操作人员以任意方式选中文档中的内容;
预处理选中的内容,得到数值数据;
识别和提取数值数据,得到数据清单;
对数据清单进行计算统计,得到计算统计结果;
对数据清单或计算统计结果进行交互式按需计算,得到按需计算结果;
对按需计算结果进行交互式显示或操纵。
在一种实施方式中,所述预处理选中的内容,得到数值数据,包括:对选中的内容进行归集整理,过滤文档控制符号,文档化成段落,并拼接预处理成一个长文本串;
所述识别和提取数值数据,得到数据清单,包括:根据全角数字字符是否识别为半角数字进行识别提取,及根据“,”号是否视作为千分位号进行识别提取;
所述对数据清单进行计算统计,得到计算统计结果,包括:对数据清单进行常用统计量和其他统计量的计算,以及对数据清单进行数据项目统计得到频次分布表;其中,所述常用统计量包括个数、总和、均值、最大值和最小值,所述其他统计量包括标准差、方差、中数、众数和全距,所述众数包括无、一个或多个。
在一种实施方式中,所述对数据清单或计算统计结果进行交互式按需计算,得到按需计算结果,包括:交互式选取数据清单的数据项和/或计算统计结果作为操作数;所述交互式按需计算包括双操作数运算和/或单操作数运算,其中,所述双操作数运算包括加、减、乘、除和取模,所述单操作数运算包括倒数、平方、自然常数次方、平方根和自然对数;
所述对按需计算结果进行交互式显示或操纵,包括:
显示数据清单、常用统计量、其他统计量和频次分布表;
将某个按需计算结果直接粘贴到文档插入点位置或先复制到粘贴板后再粘贴到文档插入点位置;
将数据清单、常用统计量、其他统计量和频次分布表导出为文本工具能使用的文本内容或电子表格工具能使用的表格内容。
在一种实施方式中,所述选中的内容,包括:
连续选中的段落文本内容;
不连续选中的多个段落文本内容;
连续和不连续选中相结合的综合选中的段落文本内容;
以矩形块或列块方式选中的段落文本内容;
连续或不连续选中的多个表格单元格及其内段落文本内容;
连续或不连续选中的表格单元格和其外部的段落文本内容;
选中单个文本框或图文框及其内部的段落文本内容;
选中多个文本框或图文框及其内部的段落文本内容。
本发明还进一步提供了一种排版文档交互计算装置,包括:
预处理模块,用于预处理选中的内容,得到数值数据;
识别提取模块,用于识别和提取数值数据,得到数据清单;
计算统计模块,用于对数据清单进行计算统计,得到计算统计结果;
按需计算模块,用于对数据清单或计算统计结果进行交互式按需计算,得到按需计算结果;
交互模块,用于对按需计算结果进行交互式显示或操纵。
在一种实施方式中,所述预处理模块,用于对选中的内容进行归集整理,过滤文档控制符号,文档化成段落,并拼接预处理成一个长文本串;
所述识别提取模块,用于根据全角数字字符是否识别为半角数字进行识别提取,以及根据“,”号是否视作为千分位号进行识别提取;
所述计算统计模块,用于对数据清单进行常用统计量和其他统计量的计算,以及对数据清单进行数据项目统计得到频次分布表;其中,所述常用统计量包括个数、总和、均值、最大值和最小值,所述其他统计量包括标准差、方差、中数、众数和全距,所述众数包括无、一个或多个。
在一种实施方式中,所述按需计算模块,用于交互式选取数据清单的数据项和/或计算统计结果作为操作数;所述交互式按需计算包括双操作数运算和/或单操作数运算,其中,所述双操作数运算包括加、减、乘、除和取模,所述单操作数运算包括倒数、平方、自然常数次方、平方根和自然对数;
所述交互模块包括:
交互显示子模块,用于显示数据清单、常用统计量、其他统计量和频次分布表;
以及交互操纵子模块,用于将某个按需计算结果直接粘贴到文档插入点位置或先复制到粘贴板后再粘贴到文档插入点位置,并用于将数据清单、常用统计量、其他统计量和频次分布表导出为文本工具能使用的文本内容或电子表格工具能使用的表格内容。
在一种实施方式中,所述选中的内容,包括:
连续选中的段落文本内容;
不连续选中的多个段落文本内容;
连续和不连续选中相结合的综合选中的段落文本内容;
以矩形块或列块方式选中的段落文本内容;
连续或不连续选中的多个表格单元格及其内段落文本内容;
连续或不连续选中的表格单元格和其外部的段落文本内容;
选中单个文本框或图文框及其内部的段落文本内容;
选中多个文本框或图文框及其内部的段落文本内容。
本发明还提供一种排版文档交互计算设备,所述设备包括:存储装置和处理器,所述存储装置用于存储一个或多个程序;
当所述一个或多个程序被所述处理器执行时,所述处理器实现如上述任一项所述的排版文档交互计算方法。
本发明还进一步提供了一种计算机可读介质,其存储有至少一个程序,当所述程序被处理器执行时,实现如上述任一项所述的排版文档交互计算方法。
为了更好地理解和实施,下面结合附图详细说明本发明。
附图说明
图1是本发明的排版文档交互计算方法的一示例性框图。
图2是本发明的排版文档交互计算方法中预处理的示例性框图。
图3是本发明的排版文档交互计算方法中识别提取的示例性框图。
图4是本发明的排版文档交互计算方法中交互式按需计算的示例性框图。
图5是本发明的排版文档交互计算方法中交互式操纵的示例性框图。
图6是本发明的排版文档交互计算装置的示例性结构图。
图7是本发明的排版文档交互计算装置的交互模块的示例性人机交互界面图。
具体实施方式
以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的方法的例子。
在本公开使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本公开。在本公开和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
本发明的排版文档交互计算方法,包括:
步骤S1,操作人员以任意方式选中文档中的内容;
步骤S2,预处理选中的内容,得到数值数据;
步骤S3,识别和提取数值数据,得到数据清单;
步骤S4,对数据清单进行计算统计,得到计算统计结果;
步骤S5,对数据清单或计算统计结果进行交互式按需计算,得到按需计算结果;
步骤S6,对按需计算结果进行交互式显示或操纵。
具体地,请参阅图1,图1是本发明的排版文档交互计算方法的一示例性框图。
在所述步骤S1之前,提供一种排版文档工具101,该排版文档工具能提供图、文、表的综合排版功能。本发明的方法及装置依附于该工具,并和其中的文档进行交互和集成。
所述步骤S1中,所述选中的内容,包括:
方式1:连续选中的段落文本内容;
方式2:不连续选中的多个段落文本内容;
方式3:连续和不连续选中相结合的综合选中的段落文本内容;
方式4:以矩形块(或列块)方式选中的段落文本内容;
方式5:连续或不连续选中的多个表格单元格及其内段落文本内容;
方式6:连续或不连续选中的表格单元格和其外部的段落文本内容;
方式7:选中单个文本框或图文框及其内部的段落文本内容;
方式8:选中多个文本框或图文框及其内部的段落文本内容。
操作人员排版和查阅文档过程中,可以使用上述任意一种或几种方式的综合选中含有需要计算的内容。
对以上方式选中的内容,现有技术的技术方案和装置均无法直接识别、提取数值进行计算验证或将得到的结果加以利用。而本发明的方法与装置则支持上述全部选中内容的直接交互式计算。
选中方式不属于本发明方案保护范围,它由各种排版文档工具提供。为了完整表述本发明方案能针对各种方式选中的内容而特别在此描述。
图1中102为不连续选中的多个段落文本内容的示例。
上述102示例具体为:在排版文档中,不连续选中了4块文本内容,从上至下分别是仅含数字的7886,混合含有数字和非数字符号(汉字)的“1401户”、“957户”和“五保户1194户”。排版文档操作人员关心这几个含数字的内容的汇总和占比情况是否如文中段落文字所述,现有技术及替代方案是无法直接在文档中交互计算完成的。本发明提出的技术方案可以将类似102所示(不限于102所示的不连续文本内容)这样的选中内容经103送入104所示的方案流程进行计算。
具体为:将102选中的内容送入103选中内容,准备好开启本发明所述方案的计算流程。选中内容不仅限于实施例所示的不连续文本,本发明方案可以针对连续文本选中、连续文本和不连续文本混合选中、矩形块(或列块)文本选中、连续和不连续表格单元格选中、表格单元格和文本混合选中、单个或多个文本框选中进行交互计算。
排版文档工具101和选中示例102由排版文档工具提供,103选中内容由文档操作人员基于102方式所提供,101、102和103所述内容不属于本发明所要求的保护范围,只是为了完整表述本发明技术方案而引入。
图1中104包括S2、S3、S4、S5和S6。实线箭头表明了处理过程,虚线箭头110和111表示计算结果的数据流向。
所述步骤S2,所述预处理选中的内容,得到数值数据,包括:对选中的内容进行归集整理,过滤文档控制符号,文档化成段落,并拼接预处理成一个长文本串。
图1中示例性说明:对103选中内容进行预处理,过滤掉不可能构成数值数据的用于进行文档控制的符号(比如回车符、段落符、制表符等),同时特别注意对不连续选中的区分。
所述步骤S2的具体内容请参阅图2,其中:
201对选中内容文档化,即视作一个片段化的排版文档。通过文档化可以很好地区分选中内容。
202过滤文档控制符,比如制表符、段落符、项目编号和回车符。
203在过滤段落符时将段落符替换为全角空格“ ”。
204进行拼接形成长文本串,这个长文本串含有需要进行计算的数值数据。对于本实施例,预处理最后得到的文本串是“7886▁1401户▁957户▁五保户1194户”(说明:为了示意清晰,用▁表示全角空格)。
所述步骤S3,所述识别和提取数值数据,得到数据清单,包括:根据全角数字字符是否识别为半角数字进行识别提取,及根据“,”号是否视作为千分位号进行识别提取。
其中,所述数据清单,以列表清单方式给出操作人员选中内容中具有的数值数据项目,其中把各数据所在总和百分比也一并给出。
对105预处理的输出,进行智能识别提取得到数据清单,详细流程如图3所示。
301读取参数配置,识别提取之前,先要读取参数配置,如果没有配置就使用默认参数配置。
302对全角数字是否半角化这一参数进行判定:
1)303分支,如果是,则进行305全角数字转换为半角数字,然后进行306的进一步判定。
2)304分支,如果否,则不进行半角化处理,直接进行306的进一步判定。
305是否考虑全角数字识别为半角阿拉伯数字,即将0转换为0,1转换为1,2转换为2,3转换为3,4转换为4,5转换为5,6转换为6,7转换为7,8转换为8,9转换为9(说明:本句中“转换为”前的数字为全角数字,“转换为”后的数字为半角数字)。如果不考虑全角数字识别为半角阿拉伯数字,全角数字字符就会作为非法数字被过滤。
306对“,”号是否视作千分位这一参数进行判定:
是否考虑千分位号,即“,”号是否视作为数据的三位一组分隔符。
1)307分支,如果是,则进行309-310的处理。
2)308分支,如果否,则直接进行311数值分隔提取处理。
309带千分位号数值的合法性识别,在有千分位号的情况下要识别千分位号是否运用合乎规范,不规范的千分位号会被作为普通数值分隔符号。比如:文本串“1274.729,666,678”虽然其中使用了千分位号,但是第一个“,”号并不是合规的千分位号运用,所以这个串被识别为两个数“1274.729”和“666,678”。又如:文本串“12,456.456,7”(引号内)在考虑千分位号的情况下,为数值“12456.4567”;在不考虑千分位号的情况下,将被分隔为数值12、数值456.456和数值7这3个数值。
310带千分位数值的提取,识别之后的千分位数值被提取为纯数学意义上的数值,即去掉千分位号后的数值,如“666,678”被提取为“666678”。
311数值分隔提取,将310千分位数值提取之后的全部数值串按照分隔要求独立成数值序列中的项目。
312综合成数据清单,将311步骤得到的数值序列,进行综合,生成数据清单,这个输出的数据清单将是计算的数据来源和进一步按需计算的对象。
当然,也可以按需设置识别提取方式。
所述步骤S4,所述对数据清单进行计算统计,得到计算统计结果,包括:对数据清单进行常用统计量和其他统计量的计算,以及对数据清单进行数据项目统计得到频次分布表;其中,所述常用统计量包括个数、总和、均值、最大值和最小值,所述其他统计量包括标准差、方差、中数、众数和全距,所述众数包括无、一个或多个。各量的计算方法参照数学定义和约定。
所述常用统计量的计算,对所述数据清单进行常用统计量计算和结果显示,包括数据清单中数据的个数,数据清单中所有数据的求和结果,数据清单数据的平均值,数据清单中数据的最大值和最小值。
所述其他统计量的计算,对所述数据清单进行其他统计量计算和结果显示,包括数据清单中数据的标准差,数据清单中所有数据的方差,数据清单数据的中数,数据清单中数据的众数,数据清单中数据的全距。其中,众数的计算支持提供三类情况:
1)没有众数,比如数据清单“1、2、3”就没有众数;
2)有1个众数,比如数据清单“1、2、 3、 3”的众数是3;
3)有2个及以上的众数,比如数据清单“1、2、2、3、3”的众数是2和3。
频次分布描述,对所述数据清单进行各数据出现的次数(频次)和频率(百分比)情况的描述。
本发明的方法还给出数据清单中各数据的频次分布表情况,以便做进一步的数据分析,频次分布表包括各数据出现的次数和次数占比。
所述步骤S5,所述对数据清单或计算统计结果进行交互式按需计算,得到按需计算结果,包括:交互式选取数据清单的数据项和/或计算统计结果作为操作数;所述交互式按需计算包括双操作数运算和/或单操作数运算,其中,所述双操作数运算包括加、减、乘、除和取模,所述单操作数运算包括倒数、平方、自然常数次方、平方根和自然对数。
具体地,针对图1中107计算统计步骤给出的计算量不足以满足实际,或者需要对计算加以更多实施要求的情况,可以使用按需计算步骤,选取数据清单中的数据、常用统计量的计算结果、其他统计量的计算结果、按需计算的结果或者手工输入操作数进行新的运算。
图1中,110:计算统计结果数据流向按需计算;
计算统计的结果继续交互式的提交给按需计算的操作数,这样可以作进一步所需要的计算。
111:其他计算结果数据流向按需计算;
表示按需计算的结果继续交互式的提交给按需计算的操作数,这样可以作进一步所需要的计算,形成一种结果继续参与计算的循环计算。
所述步骤S5如图4所示,其详细情况如下:
401是按需计算的操作数来源,本发明的方法的操作数来源可以是数据清单中的数据、所述107计算统计处理中常用统计量计算结果、所述107计算统计处理中其他统计量计算结果、单/双操作数计算(即按需计算处理本身)后的结果以及操作人员利用输入设备直接手工输入操作数。
402是操作数存放装置,其中双操作数运算符需要左右两个操作数,而单操作数运算只需要一个操作数。
403是运算符,包括双操作数运算符(加法、减法、乘法、除法、取模数)和单操作数运算符(求倒数、平方、自然常数次方、算术平方根、自然对数)。
404是计算结果,对应403各运算符计算之后的结果数据,如401所述,这些计算结果又可以作为按需计算的操作数做进一步的运算。
所述步骤S6,所述对按需计算结果进行交互式显示或操纵,包括:
显示数据清单、常用统计量、其他统计量和频次分布表;
将某个按需计算结果直接粘贴到文档插入点位置或先复制到粘贴板后再粘贴到文档插入点位置;
将数据清单、常用统计量、其他统计量和频次分布表导出为文本工具能使用的文本内容或电子表格工具能使用的表格内容。
具体地,对所述106识别提取后得到的数据清单,所述107计算统计得到的计算结果和所述108按需计算得到的计算结果,作进一步交互式操纵,包括导出为文本格式的内容,导出为电子表格格式的内容,复制,粘贴到文档目标位置,具体如图5所示。
交互式操纵方式501:将某一个计算结果复制到中间装置,比如剪贴板,以便在文档之外的地方进行粘贴使用;
交互式操纵方式502:将某一个计算结果直接插入到本文档的当前位置;
交互式操纵方式503:将数据清单、频次分布表、常用统计量计算结果和其他统计量计算结果导出为文本工具能使用的文本内容;
交互式操纵方式504:将数据清单、频次分布表、常用统计量计算结果和其他统计量计算结果导出为电子表格工具能使用的电子表格内容。
本发明还进一步提供了一种排版文档交互计算装置,包括:
预处理模块,用于预处理选中的内容,得到数值数据;
识别提取模块,用于识别和提取数值数据,得到数据清单;
计算统计模块,用于对数据清单进行计算统计,得到计算统计结果;
按需计算模块,用于对数据清单或计算统计结果进行交互式按需计算,得到按需计算结果;
交互模块,用于对按需计算结果进行交互式显示或操纵。
具体地,所述选中的内容,包括:
连续选中的段落文本内容;
不连续选中的多个段落文本内容;
连续和不连续选中相结合的综合选中的段落文本内容;
以矩形块或列块方式选中的段落文本内容;
连续或不连续选中的多个表格单元格及其内段落文本内容;
连续或不连续选中的表格单元格和其外部的段落文本内容;
选中单个文本框或图文框及其内部的段落文本内容;
选中多个文本框或图文框及其内部的段落文本内容。
所述预处理模块,用于对选中的内容进行归集整理,过滤文档控制符号,文档化成段落,并拼接预处理成一个长文本串。
所述识别提取模块,用于根据全角数字字符是否识别为半角数字进行识别提取,以及根据“,”号是否视作为千分位号进行识别提取。
所述计算统计模块,用于对数据清单进行常用统计量和其他统计量的计算,以及对数据清单进行数据项目统计得到频次分布表;其中,所述常用统计量包括个数、总和、均值、最大值和最小值,所述其他统计量包括标准差、方差、中数、众数和全距,所述众数包括无、一个或多个。
所述按需计算模块,用于交互式选取数据清单的数据项和/或计算统计结果作为操作数;所述交互式按需计算包括双操作数运算和/或单操作数运算,其中,所述双操作数运算包括加、减、乘、除和取模,所述单操作数运算包括倒数、平方、自然常数次方、平方根和自然对数。
所述交互模块包括:
交互显示子模块,用于显示数据清单、常用统计量、其他统计量和频次分布表;
以及交互操纵子模块,用于将某个按需计算结果直接粘贴到文档插入点位置或先复制到粘贴板后再粘贴到文档插入点位置,并用于将数据清单、常用统计量、其他统计量和频次分布表导出为文本工具能使用的文本内容或电子表格工具能使用的表格内容。
本实施例的排版文档交互计算装置还优选地设置了控制协调模块,所述控制协调模块用于对所述预处理模块、所述识别提取模块、所述计算统计模块、所述按需计算模块和所述交互模块进行参数配置控制,并负责各模块的总体协调。
所述控制协调模块具体包括参数配置单元,所述参数配置单元提供针对文档内容的交互计算所需的参数定制配置,在默认情况下本装置使用固定的参数完成计算过程和显示计算结果。参数配置项目包括:
a.精度控制参数:即保留小数点后几位数字。参数取值在[0,10]之间的整数。
b.千分位控制参数:即数字之间的“,”号是否视作数据的三位一组分隔符。该参数与选中内容的需求理解有关,如果认为 “,”号是千分位号,该参数设置“是”。比如选中文本内容“12中345,123456,78,789.789”(引号内),则识别提取结果就是以下数值:12、345123、456、78789.789这4个数值。如果认为 “,”号不是千分位号,该参数设置“否”。从而“,”号就成为两个不同数值之间的分隔符了。比如选中文本内容“12中345,123456,78,789.789”,则识别提取结果就是以下数值:12、345、123456、78和789.789这5个数值。
c.全角数字转换控制参数:即是否把全角数字字符(0-9)对应转换为半角阿拉伯数字(0-9)。该参数的选取也是基于对选中内容上下文的需求理解,有时文档文字会以全角数字字符来表示数值,此时如果要进行计算,就应该设置全角数字转半角数字。
所述控制协调模块具体还包括协调单元,所述协调单元实现各单元协同工作、显示布局、交互操作、结果操纵、计算有效性判断,具体包括:
a.参数配置后的重新计算和显示。
b.数据清单操作数到按需计算单元的操作数栏的交互和计算实时更新。
c.常用统计量计算结果、其他统计量计算结果、双操作数计算结果和单操作数计算结果到按需计算单元的操作数栏的交互和计算实时更新,即把计算结果作为新的操作数作进一步计算。
d.将常用统计量计算结果、其他统计量计算结果、双操作数计算结果和单操作数计算结果按需复制到如剪贴板这样的中间装置,这样可以在文档之外的其他地方进行粘贴使用。
e.将常用统计量计算结果、其他统计量计算结果、双操作数计算结果和单操作数计算结果按需插入到文档中事先定位好的插入点,通过减少一个复制操作来提高效率。
f.将数据清单、常用统计量和其他统计量计算结果、频次分布表导出为文本文件格式。可供其他文本编辑工具如记事本(一种文本处理工具)等进行处理。
g.将数据清单、频次分布表导出为电子表格文件格式。可以供电子表格工具如MSExcel(一种电子表格处理工具)或WPS表格(一种电子表格处理工具)进行处理。
h.控制参与按需计算的各操作数是否符合计算规则(比如除数不能为0)。
本发明的排版文档交互计算装置整体结构以及与外部装置的集成如图6所示:
601:装置内外分界线,左侧是装置外的操作人员使用输入输出设备操作排版文档工具和装置内的交互模块。
602:本发明的排版文档交互计算装置是通过排版文档工具提供的二次开发环境集成在一起的,交互模块就是集成的界面。用户通过交互模块使用本发明装置完成计算过程和结果的利用。
603:操作人员选中的内容通过集成的交互模块传输给本发明装置的预处理模块,将处理后的文本串传输给识别提取模块。识别提取模块将输出的数据清单经过控制协调模块的控制和协调完成计算处理,最终交由交互模块与操作人员进行交互。控制协调模块完成参数配置和装置各模块的总体协作。
交互模块是最重要的人机交互界面,其组成结构如图7所示,包括:数据清单显示区域、操作区域、常用统计量计算单元、其他统计量计算单元、频次分布描述单元、按需计算单元、以及一个参数配置单元。各单元区域组成元素的含义已经在图中用文字描述。比如,左操作数、右操作数和单操作数是用于接收运算对象的元素,“值1”和“结果”类似的元素就是计算结果显示元素,而类似701这样的控件是用于将相应的值或结果复制到剪贴板这样的中间装置,类似702这样的控件是用于将相应的值或结果粘贴到文档当前的插入点位置。类似703这样的元素是用户发起交互式命令的操作控件。
本发明还提供一种排版文档交互计算设备,所述设备包括:存储装置和处理器,所述存储装置用于存储一个或多个程序;
当所述一个或多个程序被所述处理器执行时,所述处理器实现如上述的排版文档交互计算方法。
另外,所述设备还可以优选地包括通信接口,所述通信接口用于与外部设备进行通信和数据交互传输。
需要说明的是,所述存储装置可能包含高速RAM存储器,也可能还包括非易失性存储器 (nonvolatile memory),例如至少一个磁盘存储器。
在具体实现上,如果存储装置、处理器及通信接口集成在一块芯片上,则存储装置、处理器及通信接口可以通过内部接口完成相互间的通信。如果存储装置、处理器和通信接口独立实现,则存储装置、处理器和通信接口可以通过总线相互连接并完成相互间的通信。
本发明还进一步提供了一种计算机可读介质,其存储有至少一个程序,当所述程序被处理器执行时,实现如上述的排版文档交互计算方法。
应当理解,所述计算机可读介质为可存储数据或程序的任何数据存储设备,所述数据或程序其后可由计算机系统读取。计算机可读介质的示例包括只读存储器、随机存取存储器、CD-ROM、HDD、DVD、磁带和光学数据存储设备等。计算机可读介质还可分布在网络耦接的计算机系统中使得计算机可读代码以分布式方式来存储和执行。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、射频(RadioFrequency,RF)等,或者上述的任意合适的组合。在一些实施方案中,计算机可读介质可以是非暂态的。
本发明与现有技术及相关替代方案相比,具有如下优点与有益效果:
1、提出了一种排版文档交互计算方法,其覆盖现有排版文档工具能提供的所有选中方式及其综合方式所能选中的任何内容,智能识别和提取其中的数据,进行常用统计量、其他统计量、频次分布以及可以交互的双操作数运算和单操作数运算,并支持计算结果与排版文档的高效率集成利用。
2、提出了一种排版文档交互计算装置,该装置能直接在排版文档中启用、与排版文档集成和交互,直接完成常用统计量计算、其他统计量计算和频次分布分析以及其它按需计算。计算操作数可以在装置中交互选取、交换选取、结果选取和直接输入。计算结果可以直接粘贴到文档,可以直接和文档内容进行核查比对,快速满足验算需求。本发明改变了现有技术方案需要频繁切换、计算不综合、内容和计算之间不集成无交互的不足。
3、提出了一种排版文档交互计算设备,该设备可以实现本发明的排版文档交互计算方法。
4、提出了一种计算机可读介质,该计算机可读介质可以实现本发明的排版文档交互计算方法。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。
Claims (10)
1.一种排版文档交互计算方法,其特征在于,包括:
操作人员以任意方式选中文档中的内容;
预处理选中的内容,得到数值数据;
识别和提取数值数据,得到数据清单;
对数据清单进行计算统计,得到计算统计结果;
对数据清单或计算统计结果进行交互式按需计算,得到按需计算结果;
对按需计算结果进行交互式显示或操纵;
所述对数据清单进行计算统计,得到计算统计结果,包括:对数据清单进行常用统计量和其他统计量的计算,以及对数据清单进行数据项目统计得到频次分布表;其中,选中的内容基于文档中的交互模块直接传输以进行预处理;
所述对数据清单或计算统计结果进行交互式按需计算,得到按需计算结果,包括:交互式选取数据清单的数据项和/或计算统计结果作为操作数;所述交互式按需计算包括双操作数运算和/或单操作数运算。
2.根据权利要求1所述的排版文档交互计算方法,其特征在于:
所述预处理选中的内容,得到数值数据,包括:对选中的内容进行归集整理,过滤文档控制符号,文档化成段落,并拼接预处理成一个长文本串;
所述识别和提取数值数据,得到数据清单,包括:根据全角数字字符是否识别为半角数字进行识别提取,及根据“,”号是否视作为千分位号进行识别提取;
其中,所述常用统计量包括个数、总和、均值、最大值和最小值,所述其他统计量包括标准差、方差、中数、众数和全距,所述众数包括无、一个或多个。
3.根据权利要求2所述的排版文档交互计算方法,其特征在于:
所述双操作数运算包括加、减、乘、除和取模,所述单操作数运算包括倒数、平方、自然常数次方、平方根和自然对数;
所述对按需计算结果进行交互式显示或操纵,包括:
显示数据清单、常用统计量、其他统计量和频次分布表;
将某个按需计算结果直接粘贴到文档插入点位置或先复制到粘贴板后再粘贴到文档插入点位置;
将数据清单、常用统计量、其他统计量和频次分布表导出为文本工具能使用的文本内容或电子表格工具能使用的表格内容。
4.根据权利要求1-3任一项所述的排版文档交互计算方法,其特征在于,所述选中的内容,包括:
连续选中的段落文本内容;
不连续选中的多个段落文本内容;
连续和不连续选中相结合的综合选中的段落文本内容;
以矩形块或列块方式选中的段落文本内容;
连续或不连续选中的多个表格单元格及其内段落文本内容;
连续或不连续选中的表格单元格和其外部的段落文本内容;
选中单个文本框或图文框及其内部的段落文本内容;
选中多个文本框或图文框及其内部的段落文本内容。
5.一种排版文档交互计算装置,其特征在于,包括:
预处理模块,用于预处理选中的内容,得到数值数据;
识别提取模块,用于识别和提取数值数据,得到数据清单;
计算统计模块,用于对数据清单进行计算统计,得到计算统计结果;
按需计算模块,用于对数据清单或计算统计结果进行交互式按需计算,得到按需计算结果;
交互模块,用于对按需计算结果进行交互式显示或操纵;
所述计算统计模块,用于对数据清单进行常用统计量和其他统计量的计算,以及对数据清单进行数据项目统计得到频次分布表;其中,选中的内容基于文档中的交互模块直接传输以进行预处理;
所述对数据清单或计算统计结果进行交互式按需计算,得到按需计算结果,包括:交互式选取数据清单的数据项和/或计算统计结果作为操作数;所述交互式按需计算包括双操作数运算和/或单操作数运算。
6.根据权利要求5所述的排版文档交互计算装置,其特征在于:
所述预处理模块,用于对选中的内容进行归集整理,过滤文档控制符号,文档化成段落,并拼接预处理成一个长文本串;
所述识别提取模块,用于根据全角数字字符是否识别为半角数字进行识别提取,以及根据“,”号是否视作为千分位号进行识别提取;
其中,所述常用统计量包括个数、总和、均值、最大值和最小值,所述其他统计量包括标准差、方差、中数、众数和全距,所述众数包括无、一个或多个。
7.根据权利要求6所述的排版文档交互计算装置,其特征在于:
所述双操作数运算包括加、减、乘、除和取模,所述单操作数运算包括倒数、平方、自然常数次方、平方根和自然对数;
所述交互模块包括:
交互显示子模块,用于显示数据清单、常用统计量、其他统计量和频次分布表;
以及交互操纵子模块,用于将某个按需计算结果直接粘贴到文档插入点位置或先复制到粘贴板后再粘贴到文档插入点位置,并用于将数据清单、常用统计量、其他统计量和频次分布表导出为文本工具能使用的文本内容或电子表格工具能使用的表格内容。
8.根据权利要求5-7任一项所述的排版文档交互计算装置,其特征在于,所述选中的内容,包括:
连续选中的段落文本内容;
不连续选中的多个段落文本内容;
连续和不连续选中相结合的综合选中的段落文本内容;
以矩形块或列块方式选中的段落文本内容;
连续或不连续选中的多个表格单元格及其内段落文本内容;
连续或不连续选中的表格单元格和其外部的段落文本内容;
选中单个文本框或图文框及其内部的段落文本内容;
选中多个文本框或图文框及其内部的段落文本内容。
9.一种排版文档交互计算设备,其特征在于,所述设备包括:存储装置和处理器,所述存储装置用于存储一个或多个程序;当所述一个或多个程序被所述处理器执行时,所述处理器实现如权利要求1-4任一项所述的排版文档交互计算方法。
10.一种计算机可读介质,其存储有至少一个程序,其特征在于:当所述程序被处理器执行时,实现如权利要求1-4任一项所述的排版文档交互计算方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910640335.2A CN110348000B (zh) | 2019-07-16 | 2019-07-16 | 排版文档交互计算方法、装置、设备及计算机可读介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910640335.2A CN110348000B (zh) | 2019-07-16 | 2019-07-16 | 排版文档交互计算方法、装置、设备及计算机可读介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110348000A CN110348000A (zh) | 2019-10-18 |
CN110348000B true CN110348000B (zh) | 2023-12-26 |
Family
ID=68176595
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910640335.2A Active CN110348000B (zh) | 2019-07-16 | 2019-07-16 | 排版文档交互计算方法、装置、设备及计算机可读介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110348000B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111506535A (zh) * | 2020-04-09 | 2020-08-07 | 惠州Tcl移动通信有限公司 | 计算信息处理方法、装置、存储介质及电子设备 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102929843A (zh) * | 2012-09-14 | 2013-02-13 | 《中国学术期刊(光盘版)》电子杂志社 | 一种文字编改系统及编改的方法 |
CN105474211A (zh) * | 2013-08-21 | 2016-04-06 | 微软技术许可有限责任公司 | 按照经重排版的格式来呈现固定格式文档 |
CN106681979A (zh) * | 2016-11-23 | 2017-05-17 | 广州阿里巴巴文学信息技术有限公司 | 文章排版方法、设备、可编程设备及文章发布平台 |
CN108665751A (zh) * | 2018-04-28 | 2018-10-16 | 华南师范大学 | 一种基于云文档的交互式测评方法及系统 |
CN109299475A (zh) * | 2018-11-21 | 2019-02-01 | 金色熊猫有限公司 | 一种医学文档的处理方法、装置、介质及电子设备 |
CN109597981A (zh) * | 2017-09-30 | 2019-04-09 | 腾讯科技(深圳)有限公司 | 一种文本互动信息的展示方法、装置及存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8762830B2 (en) * | 2010-06-30 | 2014-06-24 | Konica Minolta Laboratory U.S.A, Inc. | Rendering data in the correct z-order |
-
2019
- 2019-07-16 CN CN201910640335.2A patent/CN110348000B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102929843A (zh) * | 2012-09-14 | 2013-02-13 | 《中国学术期刊(光盘版)》电子杂志社 | 一种文字编改系统及编改的方法 |
CN105474211A (zh) * | 2013-08-21 | 2016-04-06 | 微软技术许可有限责任公司 | 按照经重排版的格式来呈现固定格式文档 |
CN106681979A (zh) * | 2016-11-23 | 2017-05-17 | 广州阿里巴巴文学信息技术有限公司 | 文章排版方法、设备、可编程设备及文章发布平台 |
CN109597981A (zh) * | 2017-09-30 | 2019-04-09 | 腾讯科技(深圳)有限公司 | 一种文本互动信息的展示方法、装置及存储介质 |
CN108665751A (zh) * | 2018-04-28 | 2018-10-16 | 华南师范大学 | 一种基于云文档的交互式测评方法及系统 |
CN109299475A (zh) * | 2018-11-21 | 2019-02-01 | 金色熊猫有限公司 | 一种医学文档的处理方法、装置、介质及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN110348000A (zh) | 2019-10-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102103605B (zh) | 一种智能提取文档结构的方法及系统 | |
CN107392655A (zh) | 优惠券推送方法、系统、存储介质、电子设备及分流方法 | |
CN102141916B (zh) | 嵌入式设备及其在osd界面显示语言文字的方法 | |
CN110738037B (zh) | 用于自动生成电子表格的方法、装置、设备及存储介质 | |
CN110515951B (zh) | 一种bom标准化方法、系统及电子设备和存储介质 | |
CN111512315A (zh) | 文档元数据的按块提取 | |
US20090024667A1 (en) | Information processing device, file data merging method, file naming method, and file data output method | |
CN110245240A (zh) | 一种问题数据答案的确定方法及装置 | |
US20130174024A1 (en) | Method and device for converting document format | |
CN110543303A (zh) | 一种可视化业务平台 | |
CN109445794B (zh) | 一种页面构造方法及装置 | |
CN110348000B (zh) | 排版文档交互计算方法、装置、设备及计算机可读介质 | |
CN112199937A (zh) | 一种短文本相似度分析方法及其系统、计算机设备、介质 | |
CN106648753A (zh) | 一种基于逆波兰式算法的判据自动解析方法 | |
CN113094932A (zh) | 变电工程造价的获取方法、装置、设备和存储介质 | |
JP2012181571A (ja) | 翻訳支援装置、翻訳納期設定方法及びプログラム | |
US20190065474A1 (en) | Synonymy tag obtaining method and apparatus, device and computer readable storage medium | |
CN111914548A (zh) | 一种单据智能填充方法、系统及相关设备 | |
CN113238686B (zh) | 文档处理方法、装置和电子设备 | |
CN100549998C (zh) | 一种数据处理装置及其建立方法 | |
CN101944081A (zh) | 一种古琴减字谱的计算机生成、编辑方法与系统 | |
CN114385540A (zh) | 一种数据单位换算方法及装置 | |
CN114357967A (zh) | 一种票据文件的解析方法和装置 | |
CN113127630A (zh) | 一种电力可视化数据资源管理平台系统 | |
CN113689198A (zh) | 项目文件生成方法、装置、存储介质及终端设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |