CN110245329A - 文本管理方法、装置、电子设备及计算机可读存储介质 - Google Patents

文本管理方法、装置、电子设备及计算机可读存储介质 Download PDF

Info

Publication number
CN110245329A
CN110245329A CN201810187932.XA CN201810187932A CN110245329A CN 110245329 A CN110245329 A CN 110245329A CN 201810187932 A CN201810187932 A CN 201810187932A CN 110245329 A CN110245329 A CN 110245329A
Authority
CN
China
Prior art keywords
attribute
text
value
objective
preset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810187932.XA
Other languages
English (en)
Inventor
刘堃
胡娟
陈龙
黄国强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Kingsoft Office Software Inc
Zhuhai Kingsoft Office Software Co Ltd
Guangzhou Kingsoft Mobile Technology Co Ltd
Guangzhou Jinshan Mobile Technology Co Ltd
Original Assignee
Beijing Kingsoft Office Software Inc
Zhuhai Kingsoft Office Software Co Ltd
Guangzhou Jinshan Mobile Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Kingsoft Office Software Inc, Zhuhai Kingsoft Office Software Co Ltd, Guangzhou Jinshan Mobile Technology Co Ltd filed Critical Beijing Kingsoft Office Software Inc
Priority to CN201810187932.XA priority Critical patent/CN110245329A/zh
Publication of CN110245329A publication Critical patent/CN110245329A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/117Tagging; Marking up; Designating a block; Setting of attributes

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供了一种文本管理方法、装置、电子设备及计算机可读存储介质,方法包括:获得文本的集合值,其中,集合值由文本的各个目标属性的属性值形成,各个目标属性为:文本所有属性中属于预设属性集合的各个属性;按照集合值与属性标识之间的预设对应关系,确定所得的集合值对应的属性标识,作为目标属性标识;利用目标属性标识来标识文本的预设属性集合。应用本发明实施例提供的技术方案进行文本管理时,简化了文本管理过程。

Description

文本管理方法、装置、电子设备及计算机可读存储介质
技术领域
本发明涉及信息处理技术领域,特别是涉及一种文本管理方法、装置、电子设备及计算机可读存储介质。
背景技术
文本通常由具有某些属性的字符形成,属性包括:中文字体、西文字体、字号、行距、段前间距等,每种属性都包括多种属性值,例如,中文字体的属性值包括:宋体、黑体、微软雅黑等。
现有的文本管理方法,通常是:对于文本的每个属性,用该属性的属性值来标识文本的该属性,由于文本的属性种类繁多,因此,文本的属性值繁多,加大了文本管理的复杂度。
发明内容
本发明实施例的目的在于提供一种文本管理方法,以实现简化文本管理过程。具体技术方案如下:
第一方面,本发明实施例提供了一种文本管理方法,所述方法包括:
获得文本的集合值,其中,所述集合值由所述文本的各个目标属性的属性值形成,所述各个目标属性为:文本所有属性中属于预设属性集合的各个属性;
按照集合值与属性标识之间的预设对应关系,确定所得的集合值对应的属性标识,作为目标属性标识;
利用所述目标属性标识来标识所述文本的预设属性集合。
可选的,所述预设属性集合包括以下属性集合中的至少一种:句属性、段属性-常规、段属性-编号、目录、题注、脚注、尾注、页眉、页脚、页码、页面设置、分隔符类型、分节符位置。
可选的,所述获得文本的集合值,包括:
获得文本各个目标属性的属性值;
将所获得的各个属性值进行合并,得到所述文本的集合值。
可选的,所述获得文本的集合值,包括:
获得文本各个目标属性的属性值;
用所获得的各个属性值查找预设属性表,得到所述各个属性值所对应的集合值,其中,所述预设属性表用于存储各个目标属性的属性值与集合值之间的对应关系。
可选的,在利用所述目标属性标识来标识所述文本的预设属性集合之后,所述方法还包括:
存储所述目标属性标识与所述文本的预设属性集合之间的对应关系。
第二方面,本发明实施例提供了一种文本管理装置,所述装置包括:
获得模块,用于获得文本的集合值,其中,所述集合值由所述文本的各个目标属性的属性值形成,所述各个目标属性为:文本所有属性中属于预设属性集合的各个属性;
确定模块,用于按照集合值与属性标识之间的预设对应关系,确定所得的集合值对应的属性标识,作为目标属性标识;
标识模块,用于利用所述目标属性标识来标识所述文本的预设属性集合。
可选的,所述预设属性集合包括以下属性集合中的至少一种:句属性、段属性-常规、段属性-编号、目录、题注、脚注、尾注、页眉、页脚、页码、页面设置、分隔符类型、分节符位置。
可选的,所述获得模块具体用于:
获得文本各个目标属性的属性值;
将所获得的各个属性值进行合并,得到所述文本的集合值。
可选的,所述获得模块具体用于:
获得文本各个目标属性的属性值;
用所获得的各个属性值查找预设属性表,得到所述各个属性值所对应的集合值,其中,所述预设属性表用于存储各个目标属性的属性值与集合值之间的对应关系。
可选的,所述装置还包括:
存储模块,用于在利用所述目标属性标识来标识所述文本的预设属性集合之后,存储所述目标属性标识与所述文本的预设属性集合之间的对应关系。
第三方面,本发明实施例提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现上述任一所述的文本管理方法的步骤。
第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一所述的文本管理方法。
可见,应用本发明实施例提供的技术方案,利用目标属性标识来标识文本的预设属性集合,由于预设属性集合可以包括多个属性,因此,用一个目标属性标识可以表示多个属性的属性值,相比于现有技术中,文本的每个属性都用一个属性值来标识的方式,实现了简化文本管理过程。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的文本管理方法的一种流程示意图;
图2为本发明实施例提供的文本管理装置的一种结构示意图;
图3为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为简化文本管理过程,本发明实施例提供了一种文本管理方法、装置、电子设备及计算机可读存储介质。
下面首先对本发明实施例提供的一种文本管理方法进行介绍。
需要说明的是,本发明实施例提供的文本管理方法的执行主体,可以为一种文本管理装置,具体的,该文本管理装置可以位于电子设备中,电子设备可以为服务器、移动终端、计算机等,此处不作限定。
参见图1所示,本发明实施例提供的一种文本管理方法,应用于电子设备,包括如下步骤:
S101、获得文本的集合值,
其中,集合值由文本的各个目标属性的属性值形成,各个目标属性为:文本所有属性中属于预设属性集合的各个属性;
文本可以为一段字符,字符包括:中文字符、英文字符、数字、特殊符号等等,文本可以存储于Word文档中,也可以存储于txt文档中,还可以存储于WPS文档中,本发明实施例对文本的存储格式不做限定。
具体的,预设属性集合可以包括以下属性集合中的至少一种:句属性、段属性-常规、段属性-编号、目录、题注、脚注、尾注、页眉、页脚、页码、页面设置、分隔符类型、分节符位置。
属性集合可以由多个属性组成,具体的,每个属性集合所包括的属性可以根据用户需求事先设定,本发明实施例对属性集合所包括的属性不做限定。
句属性可以由用于描述文本中每个句子样式的属性组成,段属性-常规可以由用于描述文本中每个段落样式的属性组成,段属性-编号可以由用于描述段落标题样式的属性组成,目录可以由用于描述文本中目录样式的属性组成,题注可以由用于描述文本中题注样式的属性组成,脚注、尾注、页眉、页脚、页码、页面设置、分隔符类型以及分节符位置也可以分别由用于描述文本中脚注样式、尾注样式、页眉样式、页脚样式、页码样式、页面设置样式、分隔符类型样式以及分节符位置样式的属性组成。
为了便于理解,下面以句属性为例进行说明。
一种实现方式中,句属性可以包括以下属性:中文字体、西文属性、字号、加粗以及上标,中文字体的属性值包括:黑体、楷体、宋体微软雅黑等等,西文字体包括:新罗马(Times New Roman)、黑体、宋体等等,字号包括:一号、二号、三号、四号等等,加粗的属性值包括:是(Y)和否(N),其中,加粗的属性值为“是”表示加粗,加粗的属性值为“否”表示加粗,上标的属性值包括:是(Y)和否(N),上标的属性值为“是”表示带有上标,上标的属性值为“否”表示不带上标。
与设定上述句属性的方式相同,可以预先设定每个属性集合所包括的属性,在此不再一一赘述,示例性的,可以预先设定段属性-常规包括以下属性:对齐、大纲级别、文本前缩进(字符)、特殊缩进格式、特殊格式缩进值(字符)、行距类型、行距设定值、段前间距、段后间距、缩进遵循文档网格、行间距遵循文档网格、段前分页。
在一种实现方式中,获得文本的集合值,可以包括以下步骤:
步骤A1、获得文本各个目标属性的属性值;
各个目标属性为:文本所有属性中属于预设属性集合的各个属性,例如,预设属性为句属性,且句属性包括以下属性:中文字体、西文属性、字号、加粗以及上标,则各个目标属性分别为:中文字体、西文属性、字号、加粗以及上标。
步骤A2、将所获得的各个属性值进行合并,得到文本的集合值。
合并方式可以根据用户需求设定,本发明实施例对具体的合并方式不做限定。
在一种实现方式中,可以直接将将所获得的各个属性值进行合并,得到文本的集合值,
例如,目标属性分别为:中文字体、西文属性、字号、加粗以及上标,所得的各个属性值分别为:黑体、Times New Roman、小四、Y、N,则集合值为:黑体Times New Roman小四YN。
在另一种实现方式中,也可以选取每个属性值预设位置的字符,将所选取的各个字符进行合并,得到文本的集合值。预设位置可以根据用户需求事先设定,在此不做限定。
例如,目标属性分别为:中文字体、西文属性、字号、加粗以及上标,所得的各个属性值分别为:黑体、Times New Roman、小四、Y、N,各个属性值预设位置的字符:黑、T、小四、Y以及N,则集合值为:黑T小四Y N。
另外,还可以采用以下步骤获得文本的集合值:
步骤B1、获得文本各个目标属性的属性值;
步骤B2、用所获得的各个属性值查找预设属性表,得到各个属性值所对应的集合值,
其中,预设属性表用于存储各个目标属性的属性值与集合值之间的对应关系。
示例性的,各个目标属性分别为:中文字体、西文属性、字号、加粗以及上标,可以预先建立如表1所示的属性表,如果所获得的各个属性值分别为:黑体、Times New Roman、三号、Y、N,则可以查找预设属性表,并得到集合值为:黑T三号YN,也就是文本的集合值为:黑T三号YN。
表1
集合值 属性标识(ID) 中文字体 西文字体 字号 加粗 上标
黑A小四NN 1 黑体 Arial 小四 N N
黑T三号YN 2 黑体 Times New Roman 三号 Y N
黑T四号YN 3 黑体 Times New Roman 四号 Y N
黑T五号NN 4 黑体 Times New Roman 五号 N N
S102、按照集合值与属性标识之间的预设对应关系,确定所得的集合值对应的属性标识,作为目标属性标识;
一种实现方式中,预设对应关系也可以存储于属性表中,如表1所示的属性表中还存储有集合值与属性标识(ID)之间的预设对应关系,在得到集合值后,可以查找该属性表,得到集合值对应的属性标识。
示例性的,所得到的集合值为:黑T三号YN,查找表1所示的属性表,则可以得到目标属性标识为:2。
为了保证可以确定出目标属性标识,在一种实现方式中,预设对应关系中记录集合值的每一取值情况对应的每一属性标识。
S103、利用目标属性标识来标识文本的预设属性集合。
例如,预设属性集合为句属性,且得到的目标属性标识为:2,则可以用2来标识文本的句属性。
可见,应用本发明实施例提供的技术方案,利用目标属性标识来标识文本的预设属性集合,由于预设属性集合可以包括多个属性,用一个目标属性标识可以表示多个属性的属性值,相比于现有技术中,文本的每个属性都用一个属性值来标识的方式,实现了简化文本管理过程。
在一种实现方式中,在用目标属性标识来标识文本的预设属性集合之后,方法还可以包括:
存储目标属性标识与文本的预设属性集合之间的对应关系。
具体的,可以将目标属性标识与文本的预设属性集合之间的对应关系存储于主表,主表可以为一张数据表,该数据表可以用于存储目标属性标识与文本的预设属性集合之间的对应关系。
以论文结构为例,论文中的文本可以分为:用于构成篇首结构的字符、用于构成摘要的字符、用于构成目录的字符以及用于构成正文的字符,其中,篇首结构可以包括:首页、独创性声明以及版权使用授权声明;摘要可以包括:中文摘要、中文关键字、英文摘要以及英文关键字;目录可以包括:中文目录样式1和中文目录样式2;正文可以包括:正文内容、题注尾注、图片、表格、公式以及参考文献。
例如,目标属性标识为19,文本为用于构成论文标题的字符,文本的预设属性集合为论文标题的句属性,则可以将“论文标题”的句属性和“19”对应存储于如表2所示的主表中。
表2
相应于上述文本管理方法实施例,本发明实施例提供了一种文本管理装置,参见图2所示,与图1所示流程相对应,装置包括:
获得模块201,用于获得文本的集合值,其中,所述集合值由所述文本的各个目标属性的属性值形成,所述各个目标属性为:文本所有属性中属于预设属性集合的各个属性;
确定模块202,用于按照集合值与属性标识之间的预设对应关系,确定所得的集合值对应的属性标识,作为目标属性标识;
标识模块203,用于利用所述目标属性标识来标识所述文本的预设属性集合。
可见,应用本发明实施例提供的技术方案,利用目标属性标识来标识文本的预设属性集合,由于预设属性集合可以包括多个属性,因此,用一个目标属性标识可以表示多个属性的属性值,相比于现有技术中,文本的每个属性都用一个属性值来标识的方式,实现了简化文本管理过程。
可选的,所述预设属性集合包括以下属性集合中的至少一种:句属性、段属性-常规、段属性-编号、目录、题注、脚注、尾注、页眉、页脚、页码、页面设置、分隔符类型、分节符位置。
可选的,所述获得模块201具体用于:
获得文本各个目标属性的属性值;
将所获得的各个属性值进行合并,得到所述文本的集合值。
可选的,所述获得模块201具体用于:
获得文本各个目标属性的属性值;
用所获得的各个属性值查找预设属性表,得到所述各个属性值所对应的集合值,其中,所述预设属性表用于存储各个目标属性的属性值与集合值之间的对应关系。
可选的,所述装置还包括:
存储模块,用于在利用目标属性标识来标识所述文本的预设属性集合之后,存储所述目标属性标识与所述文本的预设属性集合之间的对应关系。
本发明实施例还提供了一种电子设备,如图3所示,包括处理器301、通信接口302、存储器303和通信总线304,其中,处理器301,通信接口302,存储器303通过通信总线304完成相互间的通信,
存储器303,用于存放计算机程序;
处理器301,用于执行存储器303上所存放的程序时,实现本发明实施例所提供的文本管理方法。
其中,该文本管理方法包括如下步骤:
获得文本的集合值,其中,所述集合值由所述文本的各个目标属性的属性值形成,所述各个目标属性为:文本所有属性中属于预设属性集合的各个属性;
按照集合值与属性标识之间的预设对应关系,确定所得的集合值对应的属性标识,作为目标属性标识;
利用所述目标属性标识来标识所述文本的预设属性集合。
可见,应用本发明实施例提供的技术方案,利用目标属性标识来标识文本的预设属性集合,由于预设属性集合可以包括多个属性,因此,用一个目标属性标识可以表示多个属性的属性值,相比于现有技术中,文本的每个属性都用一个属性值来标识的方式,实现了简化文本管理过程。
需要说明的是,处理器执行存储器上存放的程序而实现的文本管理方法的其他实施例,与前述方法部分提及的文本管理方法的实施例相同,在此不再赘述。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
本发明实施例还提供了一种计算机可读存储介质,该计算机可读存储介质内存储有计算机程序,该计算机程序被处理器执行时实现上述的文本管理方法步骤。
其中,该文本管理方法包括如下步骤:
获得文本的集合值,其中,所述集合值由所述文本的各个目标属性的属性值形成,所述各个目标属性为:文本所有属性中属于预设属性集合的各个属性;
按照集合值与属性标识之间的预设对应关系,确定所得的集合值对应的属性标识,作为目标属性标识;
利用所述目标属性标识来标识所述文本的预设属性集合。
可见,应用本发明实施例提供的技术方案,利用目标属性标识来标识文本的预设属性集合,由于预设属性集合可以包括多个属性,因此,用一个目标属性标识可以表示多个属性的属性值,相比于现有技术中,文本的每个属性都用一个属性值来标识的方式,实现了简化文本管理过程。
需要说明的是,上述计算机程序被处理器执行时实现的文本管理方法的其他实施例,与前述方法部分提及的文本管理方法的实施例相同,在此不再赘述。
本发明实施例提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述各个实施例提供的文本管理方法。
本发明实施例提供了一种计算机程序,当其在计算机上运行时,使得计算机执行上述各个实施例提供的文本管理方法。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、电子设备、计算机可读存储介质、包含指令的计算机程序产品、计算机程序实施例实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (12)

1.一种文本管理方法,其特征在于,所述方法包括:
获得文本的集合值,其中,所述集合值由所述文本的各个目标属性的属性值形成,所述各个目标属性为:文本所有属性中属于预设属性集合的各个属性;
按照集合值与属性标识之间的预设对应关系,确定所得的集合值对应的属性标识,作为目标属性标识;
利用所述目标属性标识来标识所述文本的预设属性集合。
2.根据权利要求1所述的方法,其特征在于,所述预设属性集合包括以下属性集合中的至少一种:句属性、段属性-常规、段属性-编号、目录、题注、脚注、尾注、页眉、页脚、页码、页面设置、分隔符类型、分节符位置。
3.根据权利要求1或2所述的方法,其特征在于,所述获得文本的集合值,包括:
获得文本各个目标属性的属性值;
将所获得的各个属性值进行合并,得到所述文本的集合值。
4.根据权利要求1或2所述的方法,其特征在于,所述获得文本的集合值,包括:
获得文本各个目标属性的属性值;
用所获得的各个属性值查找预设属性表,得到所述各个属性值所对应的集合值,其中,所述预设属性表用于存储各个目标属性的属性值与集合值之间的对应关系。
5.根据权利要求1所述的方法,其特征在于,在利用所述目标属性标识来标识所述文本的预设属性集合之后,所述方法还包括:
存储所述目标属性标识与所述文本的预设属性集合之间的对应关系。
6.一种文本管理装置,其特征在于,所述装置包括:
获得模块,用于获得文本的集合值,其中,所述集合值由所述文本的各个目标属性的属性值形成,所述各个目标属性为:文本所有属性中属于预设属性集合的各个属性;
确定模块,用于按照集合值与属性标识之间的预设对应关系,确定所得的集合值对应的属性标识,作为目标属性标识;
标识模块,用于利用所述目标属性标识来标识所述文本的预设属性集合。
7.根据权利要求6所述的装置,其特征在于,所述预设属性集合包括以下属性集合中的至少一种:句属性、段属性-常规、段属性-编号、目录、题注、脚注、尾注、页眉、页脚、页码、页面设置、分隔符类型、分节符位置。
8.根据权利要求6或7所述的装置,其特征在于,所述获得模块具体用于:
获得文本各个目标属性的属性值;
将所获得的各个属性值进行合并,得到所述文本的集合值。
9.根据权利要求6或7所述的装置,其特征在于,所述获得模块具体用于:
获得文本各个目标属性的属性值;
用所获得的各个属性值查找预设属性表,得到所述各个属性值所对应的集合值,其中,所述预设属性表用于存储各个目标属性的属性值与集合值之间的对应关系。
10.根据权利要求6所述的装置,其特征在于,所述装置还包括:
存储模块,用于在利用所述目标属性标识来标识所述文本的预设属性集合之后,存储所述目标属性标识与所述文本的预设属性集合之间的对应关系。
11.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-5任一所述的方法步骤。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-5任一所述的方法步骤。
CN201810187932.XA 2018-03-07 2018-03-07 文本管理方法、装置、电子设备及计算机可读存储介质 Pending CN110245329A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810187932.XA CN110245329A (zh) 2018-03-07 2018-03-07 文本管理方法、装置、电子设备及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810187932.XA CN110245329A (zh) 2018-03-07 2018-03-07 文本管理方法、装置、电子设备及计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN110245329A true CN110245329A (zh) 2019-09-17

Family

ID=67882492

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810187932.XA Pending CN110245329A (zh) 2018-03-07 2018-03-07 文本管理方法、装置、电子设备及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN110245329A (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003173431A (ja) * 2001-12-07 2003-06-20 Hitachi Information Systems Ltd 図形処理装置とその方法およびその処理プログラム
CN1828587A (zh) * 2004-11-15 2006-09-06 微软公司 电子文档样式矩阵
CN102385570A (zh) * 2010-08-31 2012-03-21 国际商业机器公司 字体匹配方法和系统
CN102650999A (zh) * 2011-02-28 2012-08-29 株式会社理光 一种从网页中抽取对象属性值信息的方法和系统
CN103049473A (zh) * 2012-10-15 2013-04-17 新浪技术(中国)有限公司 一种数据查询方法及装置
US20130124962A1 (en) * 2007-10-30 2013-05-16 Adobe Systems Incorporated Visually distinct text formatting
CN103186633A (zh) * 2011-12-31 2013-07-03 北京百度网讯科技有限公司 一种结构化信息抽取方法、搜索方法和装置
US20160321358A1 (en) * 2015-04-30 2016-11-03 Oracle International Corporation Character-based attribute value extraction system
CN106776508A (zh) * 2016-11-15 2017-05-31 武汉飞博科技有限公司 一种电子表单生成方法及装置

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003173431A (ja) * 2001-12-07 2003-06-20 Hitachi Information Systems Ltd 図形処理装置とその方法およびその処理プログラム
CN1828587A (zh) * 2004-11-15 2006-09-06 微软公司 电子文档样式矩阵
US20130124962A1 (en) * 2007-10-30 2013-05-16 Adobe Systems Incorporated Visually distinct text formatting
CN102385570A (zh) * 2010-08-31 2012-03-21 国际商业机器公司 字体匹配方法和系统
CN102650999A (zh) * 2011-02-28 2012-08-29 株式会社理光 一种从网页中抽取对象属性值信息的方法和系统
CN103186633A (zh) * 2011-12-31 2013-07-03 北京百度网讯科技有限公司 一种结构化信息抽取方法、搜索方法和装置
CN103049473A (zh) * 2012-10-15 2013-04-17 新浪技术(中国)有限公司 一种数据查询方法及装置
US20160321358A1 (en) * 2015-04-30 2016-11-03 Oracle International Corporation Character-based attribute value extraction system
CN106776508A (zh) * 2016-11-15 2017-05-31 武汉飞博科技有限公司 一种电子表单生成方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李旌燕: "EXCEL操作题自动出题和自动阅卷系统的设计与实现", 《中国优秀硕士学位论文全文数据库信息科技辑(月刊)》 *

Similar Documents

Publication Publication Date Title
US11294968B2 (en) Combining website characteristics in an automatically generated website
US9411790B2 (en) Systems, methods, and media for generating structured documents
CN107766328B (zh) 结构化文本的文本信息提取方法、存储介质和服务器
US10552539B2 (en) Dynamic highlighting of text in electronic documents
CN103455475B (zh) 排版方法、设备及系统
US20150067476A1 (en) Title and body extraction from web page
CN111512315A (zh) 文档元数据的按块提取
US11055560B2 (en) Unsupervised domain adaptation from generic forms for new OCR forms
JP2012532395A (ja) 選択的なコンテンツ抽出
US20140379719A1 (en) System and method for tagging and searching documents
CN103324622A (zh) 一种自动生成首页摘要的方法及装置
CN108197085A (zh) 一种投稿审稿方法和装置
CN110162773A (zh) 标题推断器
TWI686717B (zh) 資料的提取方法、裝置及終端設備
CN111046627B (zh) 一种中文文字显示方法及系统
KR20160100322A (ko) 시멘틱상으로 의미있는 텍스트 선택들의 식별
CN106970758A (zh) 电子文档操作处理方法、装置和电子设备
CN112597410A (zh) 基于规则配置库对网页内容执行结构化提取的方法及装置
CN111930890A (zh) 信息发送方法、装置、终端设备及存储介质
JP6538563B2 (ja) 入力支援装置、入力支援方法及びプログラム
CN110245329A (zh) 文本管理方法、装置、电子设备及计算机可读存储介质
US9946698B2 (en) Inserting text and graphics using hand markup
JPWO2015016133A1 (ja) 情報管理装置及び情報管理方法
KR101583073B1 (ko) 기사 요약 서비스 서버 및 방법
US10474726B2 (en) Generation of digital documents

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination