CN112000257A - 一种文档重点内容的导出方法及装置 - Google Patents

一种文档重点内容的导出方法及装置 Download PDF

Info

Publication number
CN112000257A
CN112000257A CN201910444932.8A CN201910444932A CN112000257A CN 112000257 A CN112000257 A CN 112000257A CN 201910444932 A CN201910444932 A CN 201910444932A CN 112000257 A CN112000257 A CN 112000257A
Authority
CN
China
Prior art keywords
document
key
content
contents
identification information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910444932.8A
Other languages
English (en)
Inventor
朱健
黎榆荧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Kingsoft Office Software Inc
Zhuhai Kingsoft Office Software Co Ltd
Original Assignee
Beijing Kingsoft Office Software Inc
Zhuhai Kingsoft Office Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Kingsoft Office Software Inc, Zhuhai Kingsoft Office Software Co Ltd filed Critical Beijing Kingsoft Office Software Inc
Priority to CN201910444932.8A priority Critical patent/CN112000257A/zh
Publication of CN112000257A publication Critical patent/CN112000257A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/16File or folder operations, e.g. details of user interfaces specifically adapted to file systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Storage Device Security (AREA)

Abstract

本发明实施例提供了一种文档重点内容的导出方法及装置,该方法包括:获取待编辑的文档;在接收到导出重点内容的触发指令之后,根据预设标识信息,从文档中识别待导出的重点内容;导出重点内容至目标导出文件。通过上述方法,无需用户手动重复复制粘贴操作以完成对文档重点内容的收集整理,可以简化用户的操作过程,提高文档重点内容的导出效率。

Description

一种文档重点内容的导出方法及装置
技术领域
本发明涉及计算机应用技术领域,特别是涉及一种文档重点内容的导出方法及装置。
背景技术
目前,当用户在浏览电子文档时,可能会对电子文档中的一些内容进行高亮、添加下划线、删除等操作,将上述进行高亮、添加下划线、删除等操作的电子文档中的内容称为文档重点内容。用户可以将上述文档重点内容导出至目标导出文件。之后,用户不需要打开电子文档,只需要打开目标导出文件便可以对上述重点内容进行再次阅读和复习。
相关技术中,当用户想要导出上述文档重点内容时,用户需要通过电子文档找到文档重点内容,再将电子文档中的文档重点内容手动复制到剪切板,利用文档编辑软件创建一个用来粘贴电子文档中的文档重点内容的空白文档,重复上述的复制粘贴操作完成对电子文档中的文档重点内容的收集整理。可见,在上述文档重点内容导出的过程中,用户的操作过程繁琐,导致文档重点内容的导出效率较低。
发明内容
本发明实施例的目的在于提供一种文档重点内容的导出方法及装置,以实现简化用户的操作过程,提高文档重点内容的导出效率。具体技术方案如下:
第一方面,本发明实施例提供了一种文档重点内容的导出方法,所述方法包括:
获取待编辑的文档;
在接收到导出重点内容的触发指令之后,根据预设标识信息,从所述文档中识别待导出的重点内容;
导出所述重点内容至目标导出文件。
可选的,所述根据预设标识信息,从所述文档中识别待导出的重点内容,包括:
识别所述文档中各部分文本内容的标识信息;
根据所述各部分文本内容的标识信息与预设标识信息的匹配结果,分别判断所述各部分文本内容的类型是否为待导出类型;
将是待导出类型的文本内容确定为重点内容。
可选的,在所述根据所述各部分文本内容的标识信息与预设标识信息的匹配结果,分别判断所述各部分文本内容的类型是否为待导出类型之后,所述方法还包括:
若所述各部分文本内容的类型均不是待导出类型,则输出提示信息,以提示用户所述文档不包括重点内容。
可选的,所述根据预设标识信息,从所述文档中识别待导出的重点内容,包括:
根据预设标识信息,遍历所述文档,从所述文档中识别待导出的所有重点内容;
所述导出所述重点内容至目标导出文件,包括:
针对所述文档中的所有重点内容,将各重点内容分别作为独立的段落,逐条导出至所述目标导出文件。
第二方面,本发明实施例提供了一种文档重点内容的导出装置,所述装置包括:
获取模块,用于获取待编辑的文档;
识别模块,用于在接收到导出重点内容的触发指令之后,根据预设标识信息,从所述文档中识别待导出的重点内容;
导出模块,用于导出所述重点内容至目标导出文件。
可选的,所述识别模块包括:
第一识别子模块,用于识别所述文档中各部分文本内容的标识信息;
判断子模块,用于根据所述各部分文本内容的标识信息与预设标识信息的匹配结果,分别判断所述各部分文本内容的类型是否为待导出类型;
确定子模块,用于将是待导出类型的文本内容确定为重点内容。
可选的,所述识别模块还包括:
输出子模块,用于若所述各部分文本内容的类型均不是待导出类型,则输出提示信息,以提示用户所述文档不包括重点内容。
可选的,所述识别模块包括:
第二识别子模块,用于根据预设标识信息,遍历所述文档,从所述文档中识别待导出的所有重点内容;
所述导出模块包括:
导出子模块,用于针对所述文档中的所有重点内容,将各重点内容分别作为独立的段落,逐条导出至所述目标导出文件。
第三方面,本发明实施例提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现上述第一方面任一所述的文档重点内容的导出方法。
第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面任一所述的文档重点内容的导出方法。
本发明实施例提供的文档重点内容的导出方法及装置,通过获取待编辑的文档;在接收到导出重点内容的触发指令之后,根据预设标识信息,从待编辑的文档中识别待导出的重点内容;导出重点内容至目标导出文件,无需用户手动重复复制粘贴操作以完成对文档重点内容的收集整理,可以简化用户的操作过程,提高文档重点内容的导出效率。当然,实施本发明的任一产品或方法必不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种文档重点内容的导出方法的实施例一的流程示意图;
图2为本发明实施例提供的一种文档重点内容的导出方法的实施例二的流程示意图;
图3a为本发明实施例提供的一种文档重点内容的导出方法的导出前的实例图;
图3b为本发明实施例提供的一种文档重点内容的导出方法的导出后的实例图;
图4为本发明实施例提供的一种文档重点内容的导出装置的结构示意图;
图5为本发明实施例的电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了简化用户的操作过程,提高文档重点内容的导出效率,本发明实施例提供了一种文档重点内容的导出方法及装置,以下分别进行详细说明。
图1为本发明实施例提供的一种文档重点内容的导出方法的实施例一的流程示意图,如图1所示,本发明实施例的方法可以包括:
S101,获取待编辑的文档。
本发明实施例提供的文档重点内容的导出方法针对的是智能终端设备中的文档文件,因此可以通过台式电脑、笔记本电脑、平板电脑、智能手机等智能终端设备执行。具体的,该导出方法可以应用于上述智能终端设备中安装的文档编辑软件。
可选的,本发明实施例提供的文档重点内容的导出方法,也可以以网页的形式,应用于浏览器中。用户在浏览器中打开相应的网页进行文档编辑时,自动调用本发明实施例提供的文档重点内容的导出方法。
S102,在接收到导出重点内容的触发指令之后,根据预设标识信息,从待编辑的文档中识别待导出的重点内容。
这里的重点内容,即,当用户在浏览文档时,可能会对文档中的一些内容进行高亮、添加下划线、删除等操作,将上述进行高亮、添加下划线、删除等操作的文档中的内容称为重点内容。
具体实现时,触发指令中可以包括触发模式,触发模式指的是以何种形式触发重点内容的导出。下面对触发模式进行说明:
在一些可选的实现方式中,该触发模式可以是通过文档的编辑界面中预设的重点内容导出按键触发,其中,重点内容导出按键可以设置在文档的编辑界面的右上角。当用户触发重点内容导出按键时,文档编辑软件会接收到导出重点内容的触发指令。
在一些可选的实现方式中,该触发模式也可以是通过重点内容导出操作选项触发,其中,重点内容导出操作选项可以预先设置在编辑列表中,当用户点击操作时,编辑列表显示在文档的编辑界面中。可选的,逻辑列表中还可以包括其他操作选项,例如剪切操作选项、复制操作选项、粘贴操作选项、批注操作选项等。
上述预设标识信息可以表示待编辑的文档中各个内容的类型。举例说明,将待编辑的文档中各个内容的类型分为待导出类型和非导出类型,若待编辑的文档中某个内容对应的类型是待导出类型,则从待编辑的文档中识别该待导出类型对应的内容,即,该待导出类型对应的内容就是待导出的重点内容;若待编辑的文档中某个内容对应的类型非导出类型,则该非导出类型对应的内容不是待导出的重点内容。例如,预先将待编辑文档中进行高亮、添加下划线的内容对应的类型设置为待导出类型,当获取到上述待编辑文档中进行高亮、添加下划线的内容所对应的类型是待导出类型时,就可以确定该待导出类型对应的内容就是待导出的重点内容。
作为一种示例,根据预设标识信息,从待编辑的文档中识别待导出的重点内容,可以包括以下步骤:
步骤a:识别待编辑的文档中各部分文本内容的标识信息。
此时,待编辑的文档中各部分文本内容的标识信息可以有两种:待导出类型和非导出类型。
步骤b:根据各部分文本内容的标识信息与预设标识信息的匹配结果,分别判断各部分文本内容的类型是否为待导出类型。
具体的,各部分文本内容的标识信息与预设标识信息的匹配结果指的是各部分文本内容的标识信息与预设标识信息是否相同。
步骤c:将是待导出类型的文本内容确定为重点内容。
可选的,在步骤b后,若各部分文本内容的类型均不是待导出类型,则可以执行步骤d:输出提示信息。
其中,上述提示信息用于提示用户待编辑的文档不包括重点内容。具体实现时,可以在文档的编辑界面中弹出提示框。例如,该提示框的内容可以为“无重点内容”。
S103,导出重点内容至目标导出文件。
具体实现时,上述目标导出文件可以是用户新建的空白文件,也可以是文档编辑软件利用数据库中的空白文件模板自动生成的空白文件。
可选的,从待编辑的文档中识别待导出的所有重点内容后,可以将待导出的所有重点内容作为一个整体,一起导出至目标导出文件;也可以每次导出一个重点内容至目标导出文件,直至将所有重点内容导出至目标导出文件。
可选的,这里的目标导出文件的类型可以是Word(一个文字处理器应用程序对应的文档格式)、PDF(Portable Document Format,便携式文档格式)、TXT(Text,文本)、HTML(Hyper Text Markup Language,超文本编辑语言)等。本发明实施例中不对目标导出文件的类型做出具体的限定。但是,如果目标导出文件的类型是Word,那么,用户可以对该目标导出文件中的重点内容进行编辑,方便用户的使用。
具体实现时,上述触发指令中除了可以包括触发模式,还可以包括目标导出文件的类型。
作为一种示例,对于触发模式是通过文档的编辑界面中预设的重点内容导出按键触发,可以预先设置重点内容导出按键被触发时对应的目标导出文件的类型是Word。当用户触发重点内容导出按键时,文档编辑软件会获取到导出重点内容的触发指令,其中,文档编辑软件获取的导出重点内容的触发指令中,包含的目标导出文件的类型为Word,触发指令的触发模式为重点内容导出按键触发。在本发明实施例中,通过文档的编辑界面中预设的重点内容导出按键触发触发指令的触发模式对应的目标导出文件的类型也可以是PDF、TXT、HTML等,本发明对该触发模式下对应的目标导出文件的类型不做具体的限定。
作为一种示例,对于触发模式是通过重点内容导出操作选项触发,可以预先设置与该触发模式对应的目标导出文件的类型为Word、PDF、TXT、HTML等。当用户触发重点内容导出操作选项时,文档的编辑界面中会显示预设的目标导出文件的所有类型。例如,用户可以从显示的预设的目标导出文件的类型中选择PDF。之后,文档编辑软件会获取到导出重点内容的触发指令,其中,文档编辑软件获取的导出重点内容的触发指令中,包含的目标导出文件的类型为PDF,触发指令的触发模式为重点内容导出操作选项触发触发。
本发明实施例提供的文档重点内容的导出方法,通过获取待编辑的文档;在接收到导出重点内容的触发指令之后,根据预设标识信息,从待编辑的文档中识别待导出的重点内容;导出重点内容至目标导出文件,无需用户手动重复复制粘贴操作以完成对文档重点内容的收集整理,可以简化用户的操作过程,提高文档重点内容的导出效率。
图2为本发明实施例提供的一种文档重点内容的导出方法的实施例二的流程示意图,如图2所示,本发明实施例的方法可以包括:
S201,获取待编辑的文档。
上述步骤S201与图1所示实施例一中的步骤S101类似,在此不再赘述。
S202,在接收到导出重点内容的触发指令之后,根据预设标识信息,遍历待编辑的文档,从待编辑的文档中识别待导出的所有重点内容。
S203,针对待编辑的文档中的所有重点内容,将各重点内容分别作为独立的段落,逐条导出至目标导出文件。
在一种可能的实施方式中,图3a为本发明实施例提供的一种文档重点内容的导出方法的导出前的实例图,进行下划线操作的内容为待导出的重点内容。导出前的文档重点内容如图3a所示,此时,文档的编辑界面中显示了两个待导出的重点内容:“我们过了江,进了车站。我买票,他忙着照看行李。行李太多了,得向脚夫行些小费才可过去。”和“他给我拣定了靠车门的一张椅子;我将他给我做的紫毛大衣铺好座位。他嘱我路上小心,夜里要警醒些,不要受凉。”。
图3b为本发明实施例提供的一种文档重点内容的导出方法的导出后的实例图,假设此时文档中一共有三个重点内容,导出后的文档重点内容如图3b所示,目标导出文件中包括三个含有项目符号的独立的段落。可知,目标导出文件中除了包括图3a中文档的编辑界面中显示的两个待导出的重点内容以外,还包括了一个待导出的重点内容“但他终于不放心,怕茶房不妥帖;颇踌躇了一会。”。当然,文档的编辑界面中可能只能显示有限个(例如图3a所示的文档的编辑界面中显示了两个待导出的重点内容)待导出的重点内容,而在目标导出文件中可以显示所有的重点内容。
本发明实施例提供的文档重点内容的导出方法,通过获取待编辑的文档;在接收到导出重点内容的触发指令之后,根据预设标识信息,遍历待编辑的文档,从待编辑的文档中识别待导出的所有重点内容;针对待编辑的文档中的所有重点内容,将各重点内容分别作为独立的段落,逐条导出至目标导出文件,可以完成对文档重点内容的收集整理,简化了用户的操作过程,提高了文档重点内容的导出效率。
相应于上述方法实施例,图4为本发明实施例提供的一种文档重点内容的导出装置的结构示意图,如图4所示,该文档重点内容的导出装置可以包括:
获取模块410,用于获取待编辑的文档;
识别模块420,用于在接收到导出重点内容的触发指令之后,根据预设标识信息,从待编辑的文档中识别待导出的重点内容;
导出模块430,用于导出重点内容至目标导出文件。
可选的,上述识别模块420可以包括:
第一识别子模块,用于识别待编辑的文档中各部分文本内容的标识信息;
判断子模块,用于根据各部分文本内容的标识信息与预设标识信息的匹配结果,分别判断各部分文本内容的类型是否为待导出类型;
确定子模块,用于将是待导出类型的文本内容确定为重点内容。
可选的,上述识别模块420还可以包括:
输出子模块,用于若各部分文本内容的类型均不是待导出类型,则输出提示信息,以提示用户文档不包括重点内容。
可选的,上述识别模块420可以包括:
第二识别子模块,用于根据预设标识信息,遍历待编辑的文档,从待编辑的文档中识别待导出的所有重点内容;
导出模块430可以包括:
导出子模块,用于针对待编辑的文档中的所有重点内容,将各重点内容分别作为独立的段落,逐条导出至目标导出文件。
本发明实施例提供的文档重点内容的导出装置,通过获取模块获取待编辑的文档;通过识别模块在接收到导出重点内容的触发指令之后,根据预设标识信息,从文档中识别待导出的重点内容;通过导出模块导出重点内容至目标导出文件,无需用户手动重复复制粘贴操作以完成对文档重点内容的收集整理,可以简化用户的操作过程,提高文档重点内容的导出效率。
本发明实施例还提供了一种电子设备,如图5所示,包括处理器501、通信接口502、存储器503和通信总线504,其中,处理器501,通信接口502,存储器503通过通信总线504完成相互间的通信,
存储器503,用于存放计算机程序;
处理器501,用于执行存储器503上所存放的程序时,实现如下步骤:
获取待编辑的文档;
在接收到导出重点内容的触发指令之后,根据预设标识信息,从待编辑的文档中识别待导出的重点内容;
导出重点内容至目标导出文件。
可选的,处理器501在执行上述根据预设标识信息,从待编辑的文档中识别待导出的重点内容步骤时,具体可以实现:
识别待编辑的文档中各部分文本内容的标识信息;
根据各部分文本内容的标识信息与预设标识信息的匹配结果,分别判断各部分文本内容的类型是否为待导出类型;
将是待导出类型的文本内容确定为重点内容。
可选的,处理器501在执行在根据各部分文本内容的标识信息与预设标识信息的匹配结果,分别判断各部分文本内容的类型是否为待导出类型步骤之后,具体还可以实现:
若各部分文本内容的类型均不是待导出类型,则输出提示信息,以提示用户待编辑的文档不包括重点内容。
可选的,处理器501在执行上述根据预设标识信息,从待编辑的文档中识别待导出的重点内容步骤时,具体可以实现:
根据预设标识信息,遍历待编辑的文档,从待编辑的文档中识别待导出的所有重点内容;
处理器501在执行上述导出重点内容至目标导出文件步骤时,具体可以实现:
针对待编辑的文档中的所有重点内容,将各重点内容分别作为独立的段落,逐条导出至目标导出文件。
上述电子设备提到的通信总线可以是PCI(Peripheral ComponentInterconnect,外设部件互连标准)总线或EISA(Extended Industry StandardArchitecture,扩展工业标准结构)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括RAM(Random Access Memory,随机存取存储器),也可以包括NVM(Non-Volatile Memory,非易失性存储器),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括CPU(Central Processing Unit,中央处理器)、NP(Network Processor,网络处理器)等;还可以是DSP(Digital Signal Processor,数字信号处理器)、ASIC(Application Specific Integrated Circuit,专用集成电路)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
本发明实施例还提供了一种计算机可读存储介质,上述计算机可读存储介质内存储有计算机程序,上述计算机程序被处理器执行时实现如下步骤:
获取待编辑的文档;
在接收到导出重点内容的触发指令之后,根据预设标识信息,从待编辑的文档中识别待导出的重点内容;
导出重点内容至目标导出文件。
可选的,上述计算机程序被处理器执行时还可以实现上述任一文档重点内容的导出方法。
可见,应用本发明实施例,无需用户手动重复复制粘贴操作以完成对文档重点内容的收集整理,可以简化用户的操作过程,提高文档重点内容的导出效率。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、电子设备及存储介质的而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (10)

1.一种文档重点内容的导出方法,其特征在于,所述方法包括:
获取待编辑的文档;
在接收到导出重点内容的触发指令之后,根据预设标识信息,从所述文档中识别待导出的重点内容;
导出所述重点内容至目标导出文件。
2.根据权利要求1所述的方法,其特征在于,所述根据预设标识信息,从所述文档中识别待导出的重点内容,包括:
识别所述文档中各部分文本内容的标识信息;
根据所述各部分文本内容的标识信息与预设标识信息的匹配结果,分别判断所述各部分文本内容的类型是否为待导出类型;
将是待导出类型的文本内容确定为重点内容。
3.根据权利要求2所述的方法,其特征在于,在所述根据所述各部分文本内容的标识信息与预设标识信息的匹配结果,分别判断所述各部分文本内容的类型是否为待导出类型之后,所述方法还包括:
若所述各部分文本内容的类型均不是待导出类型,则输出提示信息,以提示用户所述文档不包括重点内容。
4.根据权利要求1所述的方法,其特征在于,所述根据预设标识信息,从所述文档中识别待导出的重点内容,包括:
根据预设标识信息,遍历所述文档,从所述文档中识别待导出的所有重点内容;
所述导出所述重点内容至目标导出文件,包括:
针对所述文档中的所有重点内容,将各重点内容分别作为独立的段落,逐条导出至所述目标导出文件。
5.一种文档重点内容的导出装置,其特征在于,所述装置包括:
获取模块,用于获取待编辑的文档;
识别模块,用于在接收到导出重点内容的触发指令之后,根据预设标识信息,从所述文档中识别待导出的重点内容;
导出模块,用于导出所述重点内容至目标导出文件。
6.根据权利要求5所述的装置,其特征在于,所述识别模块包括:
第一识别子模块,用于识别所述文档中各部分文本内容的标识信息;
判断子模块,用于根据所述各部分文本内容的标识信息与预设标识信息的匹配结果,分别判断所述各部分文本内容的类型是否为待导出类型;
确定子模块,用于将是待导出类型的文本内容确定为重点内容。
7.根据权利要求6所述的装置,其特征在于,所述识别模块还包括:
输出子模块,用于若所述各部分文本内容的类型均不是待导出类型,则输出提示信息,以提示用户所述文档不包括重点内容。
8.根据权利要求5所述的装置,其特征在于,所述识别模块包括:
第二识别子模块,用于根据预设标识信息,遍历所述文档,从所述文档中识别待导出的所有重点内容;
所述导出模块包括:
导出子模块,用于针对所述文档中的所有重点内容,将各重点内容分别作为独立的段落,逐条导出至所述目标导出文件。
9.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-4任一所述的方法步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-4任一所述的方法步骤。
CN201910444932.8A 2019-05-27 2019-05-27 一种文档重点内容的导出方法及装置 Pending CN112000257A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910444932.8A CN112000257A (zh) 2019-05-27 2019-05-27 一种文档重点内容的导出方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910444932.8A CN112000257A (zh) 2019-05-27 2019-05-27 一种文档重点内容的导出方法及装置

Publications (1)

Publication Number Publication Date
CN112000257A true CN112000257A (zh) 2020-11-27

Family

ID=73461808

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910444932.8A Pending CN112000257A (zh) 2019-05-27 2019-05-27 一种文档重点内容的导出方法及装置

Country Status (1)

Country Link
CN (1) CN112000257A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113238686A (zh) * 2021-04-20 2021-08-10 维沃移动通信(杭州)有限公司 文档处理方法、装置和电子设备
WO2022184065A1 (zh) * 2021-03-01 2022-09-09 北京字跳网络技术有限公司 电子文档的处理方法、装置、终端和存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101853246A (zh) * 2010-06-14 2010-10-06 深圳市万兴软件有限公司 一种文档格式的转换方法及装置
CN104317949A (zh) * 2014-11-06 2015-01-28 北京德塔普博软件有限公司 文档片段内容提取方法、装置和系统
US20160350404A1 (en) * 2015-05-29 2016-12-01 Intel Corporation Technologies for dynamic automated content discovery
CN107203498A (zh) * 2016-03-18 2017-09-26 北京京东尚科信息技术有限公司 一种创建电子书的方法、系统及其用户终端和服务器
CN107967249A (zh) * 2017-12-25 2018-04-27 重庆宝力优特科技有限公司 一种文字存储方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101853246A (zh) * 2010-06-14 2010-10-06 深圳市万兴软件有限公司 一种文档格式的转换方法及装置
CN104317949A (zh) * 2014-11-06 2015-01-28 北京德塔普博软件有限公司 文档片段内容提取方法、装置和系统
US20160350404A1 (en) * 2015-05-29 2016-12-01 Intel Corporation Technologies for dynamic automated content discovery
CN107203498A (zh) * 2016-03-18 2017-09-26 北京京东尚科信息技术有限公司 一种创建电子书的方法、系统及其用户终端和服务器
CN107967249A (zh) * 2017-12-25 2018-04-27 重庆宝力优特科技有限公司 一种文字存储方法及装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022184065A1 (zh) * 2021-03-01 2022-09-09 北京字跳网络技术有限公司 电子文档的处理方法、装置、终端和存储介质
CN113238686A (zh) * 2021-04-20 2021-08-10 维沃移动通信(杭州)有限公司 文档处理方法、装置和电子设备
CN113238686B (zh) * 2021-04-20 2023-11-03 维沃移动通信(杭州)有限公司 文档处理方法、装置和电子设备

Similar Documents

Publication Publication Date Title
CN106682219B (zh) 关联文档获取方法及装置
US10853564B2 (en) Operation for copied content
CN111444750B (zh) 一种pdf文档识别方法、装置及电子设备
CN108334588B (zh) 一种用户标签构建方法及装置
CN100447805C (zh) 文档处理装置和文档处理方法
KR102039989B1 (ko) 비정형 텍스트 이미지에서 텍스트 데이터를 추출하는 방법 및 장치
CN104765849A (zh) 一种获取拷贝数据来源信息的方法和系统
CN112000257A (zh) 一种文档重点内容的导出方法及装置
CN113076731A (zh) 报告文件生成方法、装置、计算机设备和存储介质
CN116992081A (zh) 页面表单的数据处理方法、装置和用户终端
CN111597771B (zh) 一种调整文档内容格式的方法、装置、电子设备及介质
CN111126058A (zh) 文本信息自动抽取方法、装置、可读存储介质和电子设备
CN110532359A (zh) 法律条文查询方法、装置、计算机设备和存储介质
CN112182451A (zh) 网页内容摘要生成方法、设备、存储介质及装置
CN109992759B (zh) 表格对象编辑方法、装置、电子设备及存储介质
CN111553130A (zh) 一种章节标题样式转换方法、装置、电子设备及存储介质
KR102463120B1 (ko) 문서 다운로드시 사용자 맞춤형 파일명 생성 기능을 제공하는 특허 문서 검색 서버 및 이를 이용한 특허 문서 검색 방법
US11468228B2 (en) Content frames for productivity applications
CN112231599B (zh) 一种元器件电商平台中元器件型号收藏方法
CN110851346B (zh) 查询语句边界问题的检测方法、装置、设备及存储介质
CN110309103B (zh) 一种文档打开方法、装置、电子设备和可读存储介质
CN111949184A (zh) 一种新建文档的方法及装置
CN112307716A (zh) 文档内容导出方法、导出装置、电子设备及存储介质
CN105718459A (zh) 用于感知情境并推荐信息的电子计算装置及其方法
CN110018868B (zh) 对象处理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20201127