CN108334479A - 文档插入方法和文档插入装置 - Google Patents

文档插入方法和文档插入装置 Download PDF

Info

Publication number
CN108334479A
CN108334479A CN201710041016.0A CN201710041016A CN108334479A CN 108334479 A CN108334479 A CN 108334479A CN 201710041016 A CN201710041016 A CN 201710041016A CN 108334479 A CN108334479 A CN 108334479A
Authority
CN
China
Prior art keywords
document
editing machine
documents
content
html files
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710041016.0A
Other languages
English (en)
Inventor
付科委
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University Founder Group Co Ltd
Beijing Founder Electronics Co Ltd
Original Assignee
Peking University Founder Group Co Ltd
Beijing Founder Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University Founder Group Co Ltd, Beijing Founder Electronics Co Ltd filed Critical Peking University Founder Group Co Ltd
Priority to CN201710041016.0A priority Critical patent/CN108334479A/zh
Publication of CN108334479A publication Critical patent/CN108334479A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/14Tree-structured documents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/14Tree-structured documents
    • G06F40/146Coding or compression of tree-structured data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting

Abstract

本发明提出了一种文档插入方法和文档插入装置,其中,所述文档插入方法包括:检测用户是否触发编辑器上的插入文档按钮;若检测到用户触发所述插入文档按钮,则获取待插入的文档;确定所述文档的类型;根据所述文档的类型,将所述文档的内容插入到所述编辑器中。通过本发明的技术方案,可以更加方便、快捷地将文档的内容插入到编辑器中,从而减少用户的操作。

Description

文档插入方法和文档插入装置
技术领域
本发明涉及文档编辑技术领域,具体而言,涉及一种文档插入方法和一种文档插入装置。
背景技术
在企业信息系统的实施和使用的过程中,随着企业业务的不断发展,客户对企业信息系统的便捷操作要求越来越高。当稿件以文档的形式存在时,若将文档的内容插入到编辑器中,则需要用户使用复制粘贴的方式将文档的内容粘贴到编辑器中继续操作。但是,上述中的将文档的内容插入到编辑器中的方案有很多缺点,例如用户操作起来非常繁琐,用户需要手动打开文档,将文档的内容复制粘贴到编辑器中,操作起来非常不方便。
因此,如何更加方便、快捷地将文档的内容插入到编辑器中成为亟待解决的技术问题。
发明内容
本发明正是基于上述问题,提出了一种新的技术方案,可以更加方便、快捷地将文档的内容插入到编辑器中,从而减少用户的操作。
有鉴于此,本发明的第一方面提出了一种文档插入方法,包括:检测用户是否触发编辑器上的插入文档按钮;若检测到用户触发所述插入文档按钮,则获取待插入的文档;确定所述文档的类型;根据所述文档的类型,将所述文档的内容插入到所述编辑器中。
在该技术方案中,在编辑器上有插入文档按钮,当用户触发该插入文档按钮,获取待插入的文档。由于不同类型的文档的插入方式不同,因此,根据待插入的文档的类型,自动将文档的内容插入到编辑器中,避免用户手动进行复制粘贴操作来将文档的内容插入到编辑器中,从而更加方便、快捷地实现文档的内容的插入,减少了用户的操作,提升了用户的使用体验。
在上述技术方案中,优选地,所述文档为txt类型文档或者word类型文档,所述根据所述文档的类型,将所述文档的内容插入到所述编辑器中,具体包括:若所述文档为txt类型文档,则对所述文档进行解析,以解析出所述文档中的内容,将所述文档中的内容插入到所述编辑器中;若所述文档为word类型文档,则将所述文档转换成html(Hyper TextMarkup Language,超文本标记语言)文件,根据所述html文件,将所述文档的内容插入到所述编辑器中。
在该技术方案中,可以将txt类型文档和word类型文档的内容插入到编辑器中,满足了用户对多种类型文档的插入需求。
在上述任一技术方案中,优选地,在所述文档为word类型文档的情况下,还包括:在将所述文档转换成所述html文件的过程中,若所述文档中包括图片,则将所述图片保存,生成所述图片的保存路径对应的ID,将公共接口和所述ID写入到所述html文件的image标签的属性中,以使所述公共接口根据所述ID获取所述图片。
在该技术方案中,如果文档中存在图片,则将公共接口和图片的保存路径对应的ID写入到html文件的image标签的属性中,该公共接口就可以根据ID获取保存路径,再根据保存路径获取图片来对图片进行展示,以使文档中的图片能在编辑器中使用,解决了图片无法复制到编辑器中的问题,从而保证了插入的文档的内容的完整性。
在上述任一技术方案中,优选地,在所述文档为word类型文档的情况下,在所述将所述文档转换成html文件之后,还包括:统计所述html文件中所述编辑器不支持的样式的节点;将所述编辑器不支持的样式的节点替换成所述编辑器支持的样式的节点。
在该技术方案中,由于word类型文档中的内容带有一些样式,例如字体大小、字体类型等样式,通过将html文件中编辑器不支持的样式的节点替换成编辑器支持的样式的节点,避免了用户手动调整编辑器不支持的样式,从而方便用户使用。
在上述任一技术方案中,优选地,在所述文档为txt类型文档的情况下,所述文档为ANSI编码格式的文档或者UTF-8编码格式的文档。
其中,ANSI是一种字符编码,为使计算机支持更多语音,通常使用0x00-0x7f范围的1个字节来表示一个英文字符。UTF是Unicode Transformation Format的缩写,意思是Unicode的转换格式。
本发明的第二方面提出了一种文档插入装置,包括:检测单元,用于检测用户是否触发编辑器上的插入文档按钮;获取单元,用于若所述检测单元检测到用户触发所述插入文档按钮,则获取待插入的文档;确定单元,用于确定所述文档的类型;插入单元,用于根据所述文档的类型,将所述文档的内容插入到所述编辑器中。
在该技术方案中,在编辑器上有插入文档按钮,当用户触发该插入文档按钮,获取待插入的文档。由于不同类型的文档的插入方式不同,因此,根据待插入的文档的类型,自动将文档的内容插入到编辑器中,避免用户手动进行复制粘贴操作来将文档的内容插入到编辑器中,从而更加方便、快捷地实现文档的内容的插入,减少了用户的操作,提升了用户的使用体验。
在上述技术方案中,优选地,所述文档为txt类型文档或者word类型文档,所述插入单元具体用于,若所述文档为txt类型文档,则对所述文档进行解析,以解析出所述文档中的内容,将所述文档中的内容插入到所述编辑器中,若所述文档为word类型文档,则将所述文档转换成html文件,根据所述html文件,将所述文档的内容插入到所述编辑器中。
在该技术方案中,可以将txt类型文档和word类型文档的内容插入到编辑器中,满足了用户对多种类型文档的插入需求。
在上述任一技术方案中,优选地,在所述文档为word类型文档的情况下,还包括:处理单元,用于在所述插入单元将所述文档转换成所述html文件的过程中,若所述文档中包括图片,则将所述图片保存,生成所述图片的保存路径对应的ID,将公共接口和所述ID写入到所述html文件的image标签的属性中,以使所述公共接口根据所述ID获取所述图片。
在该技术方案中,如果文档中存在图片,则将公共接口和图片的保存路径对应的ID写入到html文件的image标签的属性中,该公共接口就可以根据ID获取保存路径,再根据保存路径获取图片来对图片进行展示,,以使文档中的图片能在编辑器中使用,解决了图片无法复制到编辑器中的问题,从而保证了插入的文档的内容的完整性。
在上述任一技术方案中,优选地,在所述文档为word类型文档的情况下,还包括:统计单元,用于统计所述html文件中所述编辑器不支持的样式的节点;替换单元,用于将所述编辑器不支持的样式的节点替换成所述编辑器支持的样式的节点。
在该技术方案中,由于word类型文档中的内容带有一些样式,例如字体大小、字体类型等样式,通过将html文件中编辑器不支持的样式的节点替换成编辑器支持的样式的节点,避免了用户手动调整编辑器不支持的样式,从而方便用户使用。
在上述任一技术方案中,优选地,在所述文档为txt类型文档的情况下,所述文档为ANSI编码格式的文档或者UTF-8编码格式的文档。
通过本发明的技术方案,可以更加方便、快捷地将文档的内容插入到编辑器中,从而减少用户的操作。
附图说明
图1示出了根据本发明的一个实施例的文档插入方法的流程示意图;
图2示出了根据本发明的一个实施例的文档插入装置的结构示意图。
具体实施方式
为了可以更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的其他方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。
图1示出了根据本发明的一个实施例的文档插入方法的流程示意图。
如图1所示,根据本发明的一个实施例的文档插入方法,包括:
步骤102,检测用户是否触发编辑器上的插入文档按钮。
步骤104,若检测到用户触发所述插入文档按钮,则获取待插入的文档。
步骤106,确定所述文档的类型。
具体地,根据文档的扩展名,确定该文档的类型。
步骤108,根据所述文档的类型,将所述文档的内容插入到所述编辑器中。
在该技术方案中,在编辑器上有插入文档按钮,当用户触发该插入文档按钮,获取待插入的文档。由于不同类型的文档的插入方式不同,因此,根据待插入的文档的类型,自动将文档的内容插入到编辑器中,避免用户手动进行复制粘贴操作来将文档的内容插入到编辑器中,从而更加方便、快捷地实现文档的内容的插入,减少了用户的操作,提升了用户的使用体验。
在上述技术方案中,优选地,所述文档为txt类型文档或者word类型文档,步骤108具体包括:若所述文档为txt类型文档,则对所述文档进行解析,以解析出所述文档中的内容,将所述文档中的内容插入到所述编辑器中;若所述文档为word类型文档,则将所述文档转换成html文件,根据所述html文件,将所述文档的内容插入到所述编辑器中。
在该技术方案中,可以将txt类型文档和word类型文档的内容插入到编辑器中,满足了用户对多种类型文档的插入需求。
其中,word类型文档可以是2003的doc格式的文档,还可以是2007的docx格式的文档。通过apache的poi包将文档转换成html文件。
在上述任一技术方案中,优选地,在所述文档为word类型文档的情况下,还包括:在将所述文档转换成所述html文件的过程中,若所述文档中包括图片,则将所述图片保存,生成所述图片的保存路径对应的ID(Identification,身份标识号),将公共接口和所述ID写入到所述html文件的image标签的属性中,以使所述公共接口根据所述ID获取所述图片。
在该技术方案中,如果文档中存在图片,则将公共接口和图片的保存路径对应的ID写入到html文件的image标签的属性中,该公共接口就可以根据ID获取保存路径,再根据保存路径获取图片来对图片进行展示,以使文档中的图片也能在编辑器中使用,从而保证了插入的文档的内容的完整性。
其中,可以通过FTP(File Transfer Protocol,文件传输协议)将文档中的图片保存在本地,也可以将文档中的图片保存到其他存储器中。文档中图片的保存路径对应的ID是一个唯一的字符串。
在上述任一技术方案中,优选地,在所述文档为word类型文档的情况下,在所述将所述文档转换成html文件之后,还包括:统计所述html文件中所述编辑器不支持的样式的节点;将所述编辑器不支持的样式的节点替换成所述编辑器支持的样式的节点。
在该技术方案中,由于word类型文档中的内容带有一些样式,例如字体大小、字体类型等样式,通过将html文件中编辑器不支持的样式的节点替换成编辑器支持的样式的节点,避免了用户手动调整编辑器不支持的样式,从而方便用户使用。
其中,通过jsoup包解析html文件的每个节点,以统计出html文件中编辑器不支持的样式的节点。使用正则表达式去掉不需要的CSS(Cascading Style Sheets,叠层样式表),从而过滤掉html文件中编辑器不支持的样式的节点。
在上述任一技术方案中,优选地,在所述文档为txt类型文档的情况下,所述文档为ANSI编码格式的文档或者UTF-8编码格式的文档。
图2示出了根据本发明的一个实施例的文档插入装置的结构示意图。
如图2所示,根据本发明的一个实施例的文档插入装置200,包括:检测单元202、获取单元204、确定单元206和插入单元208。
检测单元202,用于检测用户是否触发编辑器上的插入文档按钮;获取单元204,用于若所述检测单元202检测到用户触发所述插入文档按钮,则获取待插入的文档;确定单元206,用于确定所述文档的类型;插入单元208,用于根据所述文档的类型,将所述文档的内容插入到所述编辑器中。
在该技术方案中,在编辑器上有插入文档按钮,当用户触发该插入文档按钮,获取待插入的文档。由于不同类型的文档的插入方式不同,因此,根据待插入的文档的类型,自动将文档的内容插入到编辑器中,避免用户手动进行复制粘贴操作来将文档的内容插入到编辑器中,从而更加方便、快捷地实现文档的内容的插入,减少了用户的操作,提升了用户的使用体验。
在上述技术方案中,优选地,所述文档为txt类型文档或者word类型文档,所述插入单元208具体用于,若所述文档为txt类型文档,则对所述文档进行解析,以解析出所述文档中的内容,将所述文档中的内容插入到所述编辑器中,若所述文档为word类型文档,则将所述文档转换成html文件,根据所述html文件,将所述文档的内容插入到所述编辑器中。
在该技术方案中,可以将txt类型文档和word类型文档的内容插入到编辑器中,满足了用户对多种类型文档的插入需求。
在上述任一技术方案中,优选地,在所述文档为word类型文档的情况下,还包括:处理单元210,用于在插入单元208将所述文档转换成所述html文件的过程中,若所述文档中包括图片,则将所述图片保存,生成所述图片的保存路径对应的ID,将公共接口和所述ID写入到所述html文件的image标签的属性中,以使所述公共接口根据所述ID获取所述图片。
在该技术方案中,如果文档中存在图片,则将公共接口和图片的保存路径对应的ID写入到html文件的image标签的属性中,该公共接口就可以根据ID获取保存路径,再根据保存路径获取图片来对图片进行展示,以使文档中的图片也能在编辑器中使用,从而保证了插入的文档的内容的完整性。
在上述任一技术方案中,优选地,在所述文档为word类型文档的情况下,还包括:统计单元212,用于统计所述html文件中所述编辑器不支持的样式的节点;替换单元214,用于将所述编辑器不支持的样式的节点替换成所述编辑器支持的样式的节点。
在该技术方案中,由于word类型文档中的内容带有一些样式,例如字体大小、字体类型等样式,通过将html文件中编辑器不支持的样式的节点替换成编辑器支持的样式的节点,避免了用户手动调整编辑器不支持的样式,从而方便用户使用。
在上述任一技术方案中,优选地,在所述文档为txt类型文档的情况下,所述文档为ANSI编码格式的文档或者UTF-8编码格式的文档。
以上结合附图详细说明了本发明的技术方案,通过本发明的技术方案,可以更加方便、快捷地将文档的内容插入到编辑器中,从而减少用户的操作。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种文档插入方法,其特征在于,包括:
检测用户是否触发编辑器上的插入文档按钮;
若检测到用户触发所述插入文档按钮,则获取待插入的文档;
确定所述文档的类型;
根据所述文档的类型,将所述文档的内容插入到所述编辑器中。
2.根据权利要求1所述的文档插入方法,其特征在于,所述文档为txt类型文档或者word类型文档,所述根据所述文档的类型,将所述文档的内容插入到所述编辑器中,具体包括:
若所述文档为txt类型文档,则对所述文档进行解析,以解析出所述文档中的内容,将所述文档中的内容插入到所述编辑器中;
若所述文档为word类型文档,则将所述文档转换成html文件,根据所述html文件,将所述文档的内容插入到所述编辑器中。
3.根据权利要求2所述的文档插入方法,其特征在于,在所述文档为word类型文档的情况下,还包括:
在将所述文档转换成所述html文件的过程中,若所述文档中包括图片,则将所述图片保存,生成所述图片的保存路径对应的ID,将公共接口和所述ID写入到所述html文件的image标签的属性中,以使所述公共接口根据所述ID获取所述图片。
4.根据权利要求2所述的文档插入方法,其特征在于,在所述文档为word类型文档的情况下,在所述将所述文档转换成html文件之后,还包括:
统计所述html文件中所述编辑器不支持的样式的节点;
将所述编辑器不支持的样式的节点替换成所述编辑器支持的样式的节点。
5.根据权利要求2至4中任一项所述的文档插入方法,其特征在于,在所述文档为txt类型文档的情况下,所述文档为ANSI编码格式的文档或者UTF-8编码格式的文档。
6.一种文档插入装置,其特征在于,包括:
检测单元,用于检测用户是否触发编辑器上的插入文档按钮;
获取单元,用于若所述检测单元检测到用户触发所述插入文档按钮,则获取待插入的文档;
确定单元,用于确定所述文档的类型;
插入单元,用于根据所述文档的类型,将所述文档的内容插入到所述编辑器中。
7.根据权利要求6所述的文档插入装置,其特征在于,所述文档为txt类型文档或者word类型文档,所述插入单元具体用于,
若所述文档为txt类型文档,则对所述文档进行解析,以解析出所述文档中的内容,将所述文档中的内容插入到所述编辑器中,
若所述文档为word类型文档,则将所述文档转换成html文件,根据所述html文件,将所述文档的内容插入到所述编辑器中。
8.根据权利要求7所述的文档插入装置,其特征在于,在所述文档为word类型文档的情况下,还包括:
处理单元,用于在所述插入单元将所述文档转换成所述html文件的过程中,若所述文档中包括图片,则将所述图片保存,生成所述图片的保存路径对应的ID,将公共接口和所述ID写入到所述html文件的image标签的属性中,以使所述公共接口根据所述ID获取所述图片。
9.根据权利要求7所述的文档插入装置,其特征在于,在所述文档为word类型文档的情况下,还包括:
统计单元,用于统计所述html文件中所述编辑器不支持的样式的节点;
替换单元,用于将所述编辑器不支持的样式的节点替换成所述编辑器支持的样式的节点。
10.根据权利要求7至9中任一项所述的文档插入装置,其特征在于,在所述文档为txt类型文档的情况下,所述文档为ANSI编码格式的文档或者UTF-8编码格式的文档。
CN201710041016.0A 2017-01-20 2017-01-20 文档插入方法和文档插入装置 Pending CN108334479A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710041016.0A CN108334479A (zh) 2017-01-20 2017-01-20 文档插入方法和文档插入装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710041016.0A CN108334479A (zh) 2017-01-20 2017-01-20 文档插入方法和文档插入装置

Publications (1)

Publication Number Publication Date
CN108334479A true CN108334479A (zh) 2018-07-27

Family

ID=62921970

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710041016.0A Pending CN108334479A (zh) 2017-01-20 2017-01-20 文档插入方法和文档插入装置

Country Status (1)

Country Link
CN (1) CN108334479A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111737949A (zh) * 2020-07-22 2020-10-02 江西风向标教育科技有限公司 题目内容提取方法、装置、可读存储介质及计算机设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7454699B2 (en) * 2003-03-24 2008-11-18 Microsoft Corporation Smart content insertion
CN102662928A (zh) * 2012-03-28 2012-09-12 福建榕基软件股份有限公司 带文档导入的富文本编辑方法及装置
CN103353878A (zh) * 2013-06-14 2013-10-16 陆昀 将多种格式的文档显示在网页中的方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7454699B2 (en) * 2003-03-24 2008-11-18 Microsoft Corporation Smart content insertion
CN102662928A (zh) * 2012-03-28 2012-09-12 福建榕基软件股份有限公司 带文档导入的富文本编辑方法及装置
CN103353878A (zh) * 2013-06-14 2013-10-16 陆昀 将多种格式的文档显示在网页中的方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111737949A (zh) * 2020-07-22 2020-10-02 江西风向标教育科技有限公司 题目内容提取方法、装置、可读存储介质及计算机设备
CN111737949B (zh) * 2020-07-22 2021-07-06 江西风向标教育科技有限公司 题目内容提取方法、装置、可读存储介质及计算机设备

Similar Documents

Publication Publication Date Title
CN109062874B (zh) 财政数据的获取方法、终端设备及介质
JP5517162B2 (ja) 文書情報の機密ラベルを判定する方法、コンピュータ・プログラム、装置、及びシステム
KR20080053927A (ko) 소스를 복사된 텍스트에 링크하는 방법 및 시스템
JP2003114882A (ja) 出版用コンテンツをフォーマットするシステム及び方法
US20150347353A1 (en) Document layering platform
CN112016290A (zh) 一种文档自动排版方法、装置、设备及存储介质
CN112527291A (zh) 网页生成方法、装置、电子设备及存储介质
US20150161160A1 (en) Application Localization
CN106407288B (zh) 一种信息同步更新的方法及系统
US7921358B2 (en) Automatic package conformance validation
JP2019522847A (ja) データを抽出するための方法、デバイス及び端末デバイス
US10110771B2 (en) Managing printed documents in a document processing system
CN108334479A (zh) 文档插入方法和文档插入装置
CN104077323A (zh) 一种网页内容转换彩信的方法和装置
US8127219B1 (en) Printing and rendering hyperlink destinations
US8983194B2 (en) Information processing system, information processing method, and non-transitory computer readable medium
US10063738B2 (en) Digital content access using a machine-readable link
CN104216868B (zh) 一种文档显示格式的适配方法及装置
CN105450698B (zh) 一种曝光日志采集系统和方法
CN113297425B (zh) 文档转换方法、装置、服务器及存储介质
JP2006065467A5 (zh)
US10511563B2 (en) Hashes of email text
JP2007041983A (ja) 申請書作成プログラムおよび申請書作成装置
JP2006526190A (ja) 文書コンテンツの複数のレンディションを提供するためのシステムおよび方法
US9946698B2 (en) Inserting text and graphics using hand markup

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180727

RJ01 Rejection of invention patent application after publication