CN109933803A - 一种成语信息展示方法、展示装置、电子设备及存储介质 - Google Patents

一种成语信息展示方法、展示装置、电子设备及存储介质 Download PDF

Info

Publication number
CN109933803A
CN109933803A CN201910228638.3A CN201910228638A CN109933803A CN 109933803 A CN109933803 A CN 109933803A CN 201910228638 A CN201910228638 A CN 201910228638A CN 109933803 A CN109933803 A CN 109933803A
Authority
CN
China
Prior art keywords
chinese idiom
idiom
information
chinese
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910228638.3A
Other languages
English (en)
Other versions
CN109933803B (zh
Inventor
李长亮
汪美玲
赵志新
唐剑波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Kingsoft Interactive Entertainment Co Ltd
Beijing Jinshan Digital Entertainment Technology Co Ltd
Original Assignee
Chengdu Kingsoft Interactive Entertainment Co Ltd
Beijing Jinshan Digital Entertainment Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Kingsoft Interactive Entertainment Co Ltd, Beijing Jinshan Digital Entertainment Technology Co Ltd filed Critical Chengdu Kingsoft Interactive Entertainment Co Ltd
Priority to CN201910228638.3A priority Critical patent/CN109933803B/zh
Publication of CN109933803A publication Critical patent/CN109933803A/zh
Application granted granted Critical
Publication of CN109933803B publication Critical patent/CN109933803B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Abstract

本发明实施例提供了一种成语信息展示方法、展示装置、电子设备及存储介质,其中方法包括:确定电子文档中的目标文档片段;识别目标文档片段中的第一文本数据;将第一文本数据输入预先构建的成语知识图谱,获取第一文本数据的属性信息;基于所获取的属性信息构建与第一文本数据对应的字典;展示字典中的信息。本发明实施例能够使用户不需要切换至第三方工具便可以获知电子文档中的成语信息,使用户更加专注于当前的电子文档处理工作,从而提高用户在电子文档中查看成语信息时的使用体验。

Description

一种成语信息展示方法、展示装置、电子设备及存储介质
技术领域
本发明涉及电子办公技术领域,特别是涉及一种成语信息展示方法、展示装置、电子设备及存储介质。
背景技术
成语是中国汉字语言词汇中定型的词,具有固定的结构形式和固定的说法,用于表示一定的意义。成语通常由四个字组成,也可以为三字成语、五字成语等。
成语数量庞大,当电子文档中出现用户不了解的成语时,用户通常需要查看该成语的读音、释义、出处等信息,而相关技术的电子办公程序中未提供成语释义功能,用户只能切换到第三方搜索引擎、字典等工具进行查阅。
由于用户需要转换至第三方工具查阅成语信息,还需要对第三方工具返回的成语信息进行甄别,在这个过程中容易影响用户的工作思路,相关技术的电子办公程序存在使用体验不佳的问题。
发明内容
本发明实施例的目的在于提供一种成语信息展示方法、展示装置、电子设备及存储介质,以提高在电子文档中查看成语信息时的使用体验。具体技术方案如下:
第一方面,本发明实施例提供了一种成语信息展示方法,包括:
确定电子文档中的目标文档片段;所述目标文档片段为用户正在关注的文档片段;
识别所述目标文档片段中的第一文本数据;所述第一文本数据包括成语名称;
将所述第一文本数据输入预先构建的成语知识图谱,获取所述第一文本数据的属性信息;所述属性信息至少包括:所述第一文本数据的读音,释义,以及出处;
基于所获取的所述属性信息构建所述第一文本数据对应的字典;所述字典中至少包括以下信息:所述第一文本数据的读音,释义,以及出处;
展示所述字典中的信息。
可选的,所述确定电子文档中的目标文档片段之前,所述方法还包括:
构建所述成语知识图谱。
可选的,所述构建所述成语知识图谱的步骤,包括:
获取多个样本成语,各样本成语的标签,以及各样本成语的属性信息;所述标签用于描述所述样本成语的含义;所述样本成语的属性信息至少包括:所述样本成语的读音,释义,以及出处;
针对所获取的多个样本成语中的各样本成语,建立每个样本成语与该样本成语的标签之间的关联关系;
利用所述样本成语,所述样本成语与标签之间的关联关系,以及各样本成语的属性信息,构建图谱结构数据。
可选的,所述识别所述目标文档片段中的第一文本数据的步骤,包括:
利用预设样本成语,构建成语名称字典树;
利用多模式匹配算法,从所述目标文档片段中匹配得到目标成语名称;所述目标成语名称为包含于所述成语名称字典树中的成语的名称。
可选的,所述从所述目标文档片段中匹配得到目标成语名称之后,所述方法还包括:
生成成语名称列表,所述成语名称列表中记录有匹配得到的成语的名称。
可选的,所述基于所获取的所述属性信息构建所述第一文本数据对应的字典的步骤,包括:
利用当前成语的属性信息,生成当前成语的属性信息列表;所述属性信息列表中以列表形式记录有当前成语的读音,释义,以及出处;所述当前成语为所述成语名称列表中记录的成语;
将当前成语的名称作为键,当前成语的属性信息列表作为值,组成当前成语的键值对;
将所述键值对添加至原始成语字典中。
可选的,所述展示所述成语字典中的信息的步骤,包括:
在展示卡片的第一展示区域,展示所述成语字典中属于所述目标文档片段的成语的名称信息;
在展示卡片的第二展示区域,展示所述成语字典中属于所述目标文档片段的成语的读音信息;
在展示卡片的第三展示区域,展示所述成语字典中属于所述目标文档片段的成语的释义信息;
在展示卡片的第四展示区域,展示所述成语字典中属于所述目标文档片段的成语的出处信息。
可选的,所述展示所述成语字典中的信息的步骤,包括:
针对所述电子文档的各个段落,随鼠标指针的移动依次以高亮文本展示鼠标指针所在位置处的段落的成语信息;
或者,针对所述电子文档的各个句子,随鼠标指针的移动依次以高亮文本展示鼠标指针所在位置处的句子的成语信息。
第二方面,本发明实施例提供了一种成语信息展示装置,包括:
确定模块,用于确定电子文档中的目标文档片段;所述目标文档片段为用户正在关注的文档片段;
识别模块,用于识别所述目标文档片段中的第一文本数据;所述第一文本数据包括成语名称;
获取模块,用于将所述第一文本数据输入预先构建的成语知识图谱,获取所述第一文本数据的属性信息;所述属性信息至少包括:所述第一文本数据的读音,释义,以及出处;
第一构建模块,用于基于所获取的所述属性信息构建所述第一文本数据对应的字典;所述字典中至少包括以下信息:所述第一文本数据的读音,释义,以及出处;
展示模块,用于展示所述成语字典中的信息。
可选的,所述装置还包括:
第二构建模块,用于构建所述成语知识图谱。
可选的,所述第二构建模块,包括:
获取子模块,用于获取多个样本成语,各样本成语的标签,以及各样本成语的属性信息;所述标签用于描述所述样本成语的含义;所述样本成语的属性信息至少包括:所述样本成语的读音,释义,以及出处;
建立子模块,用于针对所获取的多个样本成语中的各样本成语,建立每个样本成语与该样本成语的标签之间的关联关系;
第一构建子模块,用于利用所述样本成语,所述样本成语与标签之间的关联关系,以及各样本成语的属性信息,构建图谱结构数据。
可选的,所述确定模块,包括:
第一确定子模块,用于在所述电子文档中,确定当前鼠标指针位置所在的文档片段;
第二确定子模块,用于将所述文档片段确定为目标文档片段。
可选的,所述识别模块,包括:
第二构建子模块,用于利用预设样本成语,构建成语名称字典树;
匹配子模块,用于利用多模式匹配算法,从所述目标文档片段中匹配得到目标成语名称;所述目标成语名称为包含于所述成语名称字典树中的成语的名称。
可选的,所述装置还包括:
生成模块,用于生成成语名称列表,所述成语名称列表中记录有匹配得到的成语的名称。
可选的,所述第一构建模块,包括:
生成子模块,用于利用当前成语的属性信息,生成当前成语的属性信息列表;所述属性信息列表中以列表形式记录有当前成语的读音,释义,以及出处;所述当前成语为所述成语名称列表中记录的成语;
组成子模块,用于将当前成语的名称作为键,当前成语的属性信息列表作为值,组成当前成语的键值对;
第三构建子模块,用于将所述键值对添加至原始成语字典中。
可选的,所述展示模块,包括:
第一展示子模块,用于在展示卡片的第一展示区域,展示所述成语字典中属于所述目标文档片段的成语的名称信息;
第二展示子模块,用于在展示卡片的第二展示区域,展示所述成语字典中属于所述目标文档片段的成语的读音信息;
第三展示子模块,用于在展示卡片的第三展示区域,展示所述成语字典中属于所述目标文档片段的成语的释义信息;
第四展示子模块,用于在展示卡片的第四展示区域,展示所述成语字典中属于所述目标文档片段的成语的出处信息。
可选的,所述展示模块具体用于:
针对所述电子文档的各个段落,随鼠标指针的移动依次以高亮文本展示鼠标指针所在位置处的段落的成语信息;
或者,针对所述电子文档的各个句子,随鼠标指针的移动依次以高亮文本展示鼠标指针所在位置处的句子的成语信息。
第三方面,本发明实施例提供了一种电子设备,包括处理器和机器可读存储介质,所述机器可读存储介质存储有能够被所述处理器执行的机器可执行指令,所述处理器执行所述机器可执行指令以实现上述第一方面提供的成语信息展示方法的方法步骤。
第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时,实现上述第一方面提供的成语信息展示方法的方法步骤。
第五方面,本发明实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述第一方面提供的成语信息展示方法的方法步骤。
第六方面,本发明实施例还提供了一种计算机程序,当其在计算机上运行时,使得计算机执行上述第一方面提供的成语信息展示方法的方法步骤。
本发明实施例提供的一种成语信息展示方法、展示装置、电子设备及存储介质,在确定电子文档中的目标文档片段并识别目标文档片段中的第一文本数据后,通过预设的成语知识图谱获取第一文本数据的读音、释义、出处等属性信息,然后基于所获取的属性信息构建第一文本数据对应的字典,并向用户展示字典中的信息。由于本发明实施例能够自动识别电子文档中用户正在关注的文档片段,即目标文档片段,并自动向用户展示该文档片段中成语信息,因此用户不需要切换至第三方工具便可以获知电子文档中的成语信息,也不需要再对第三方工具返回的成语信息进行甄别,因此能够使用户更加专注于当前的电子文档处理工作,从而提高用户在电子文档中查看成语信息时的使用体验。当然,实施本发明的任一产品或方法必不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的成语信息展示方法的一种流程示意图;
图2为本发明实施例提供的成语信息展示方法中,步骤S101的一种流程示意图;
图3为本发明实施例提供的成语信息展示方法中,步骤S102的一种流程示意图;
图4为本发明实施例提供的成语信息展示方法中,步骤S104的一种流程示意图;
图5为本发明实施例提供的成语信息展示方法中,步骤S105的一种流程示意图;
图6为本发明实施例提供的成语信息展示方法的另一种流程示意图;
图7为本发明实施例提供的成语信息展示方法中,步骤S201的一种流程示意图;
图8为本发明实施例提供的成语信息展示装置的一种结构示意图;
图9为本发明实施例提供的成语信息展示装置中,确定模块的一种结构示意图;
图10为本发明实施例提供的成语信息展示装置中,识别模块的一种结构示意图;
图11为本发明实施例提供的成语信息展示装置的另一种结构示意图;
图12为本发明实施例提供的成语信息展示装置中,第一构建模块的一种结构示意图;
图13为本发明实施例提供的成语信息展示装置中,展示模块的一种结构示意图;
图14为本发明实施例提供的成语信息展示装置的再一种结构示意图;
图15为本发明实施例提供的成语信息展示装置中,第二构建模块的一种结构示意图;
图16为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
方法实施例1
本发明实施例提供了一种成语信息展示方法,如图1所示,该方法可以包括以下步骤:
S101,确定电子文档中的目标文档片段。
一份电子文档中通常可以包括文字内容,文字内容通常可以通过不同的段落组成,每个段落又可以包括多个句子。当用户正在处理一份电子文档时(例如审阅稿件时),用户终端可以识别用户正在关注的文档内容,进而将该文档内容作为目标文档片段,即,所说的目标文档片段,可以是指被确定为用户正在关注的文档片段。确定电子文档中的目标文档片段的过程可以为后台自动处理过程,从而减少对用户的干扰。
用户终端可以是指个人电子计算机,也可以指智能手机,还可以指平板电脑等运行有操作系统的电子设备,例如,运行Windows操作系统(一款由微软公司开发的操作系统)的电子设备,运行Linux操作系统(一款开源操作系统)的电子设备,运行Android操作系统(一款由谷歌公司开发的移动操作系统)的电子设备,运行iOS操作系统(一款由苹果公司开发的移动操作系统)的电子设备。
可以理解的是,用户终端中可以运行电子文档软件,电子文档软件中通常包括文字处理程序,例如,Word(一种由微软公司开发的办公软件)程序,WPS(一种由金山公司开发的办公软件文档)程序,或者其他文字处理程序。当然,除文字处理程序外,电子表格和演示文稿也属于电子文档的一种,它们也可以包括文字内容。
作为本发明实施例一种可选的实施方式,如图2所示,上述步骤S101具体可以包括:
S1011,在电子文档中,确定当前鼠标指针位置所在的文档片段。
本发明实施例中,用户终端可以在电子文档中,确定当前鼠标指针位置所在的文档片段。例如,Word文档中,当用户打字时鼠标指针会随之移动,此时可以确定当前鼠标指针所处的位置,并确定该位置处的文档片段。
当然,除上述所举示例文档片段外,本发明实施例还可以确定当前鼠标指针所在的段落,或者,确定当前鼠标指针所在的文本行等,其实现原理相同,本发明实施例不再赘述。
S1012,将该文档片段确定为目标文档片段。
本发明实施例确定当前鼠标指针位置所在的文档片段后,即可将该文档片段作为目标文档片段。可选的,在确定当前鼠标指针所在的段落位置后,还可以将该段落确定为目标文档片段;或者,在确定当前鼠标指针位置所在的文本行后,还可以将该文本行确定为目标文档片段。
当然,在电子表格或演示文稿中确定目标文档片段的实现原理相同,本发明实施例在此不再赘述。
作为本发明实施例一种可选的实施方式,用户还可以指定目标文档片段,例如,通过选中电子文档中的某一个语句、某一个段落、或者某一行文本行,从而指定目标文档片段。移动终端接收选中指令后,即可将上述选中的内容作为目标文档片段。
作为本发明实施例一种可选的实施方式,系统还可以确定鼠标指针在文档页面中悬停的位置,然后得到位置信息,并利用该位置信息确定文档片段,位置信息例如可以为鼠标指针在显示界面中的坐标值。
S102,识别目标文档片段中的第一文本数据。
在展示目标文档片段中成语的信息前,本发明实施例可以先识别出目标文档片段中的第一文本数据,以进行进一步处理,第一文本数据例如可以为成语的名称,或者与成语相关的数据。
作为本发明实施例一种可选的实施方式,如图3所示,上述步骤S102具体可以包括:
S1021,利用预设样本成语,构建成语名称字典树。
本发明实施例中,预设样本成语可以从存储有样本成语的数据库中获取,该数据库可以以图谱结构的形式存储样本成语。所说的成语名称字典树,可以是指用于进行成语名称查找的字典树(Trie树),它是一种树形结构,可以用于统计和排序大量的字符串。
作为本发明实施例一种可选的实施方式,可以将所获取的所有样本成语的名称的每个字,作为上述成语名称字典树中除根节点外的其中一个节点,从而构建成语名称字典树;当然,还可以将所有样本成语名称的每个字的首字母,作为上述成语名称字典树中除根节点外的其中一个节点,从而构建成语名称字典树。
S1022,利用多模式匹配算法,从目标文档片段中匹配得到目标成语名称;目标成语名称为包含于成语名称字典树中的成语的名称。
多模式匹配算法是一种常用的匹配算法,例如,Aho-Corasick多模式匹配算法。本发明实施例中,可以通过Aho-Corasick多模式匹配算法,从目标文档片段中,匹配得到目标成语名称,即包含于成语名称字典树中的成语的名称。当然,除上述所举的例子所示的实现方式以外,实现该特征的方式均属于本发明实施例的保护范围,本发明实施例在此不再赘述。
作为本发明实施例一种可选的实施方式,在从目标文档片段中匹配得到目标成语名称之后,本发明实施例还可以生成一份成语名称列表,将匹配得到的成语保存在该成语名称列表中,也即,成语名称列表中可以记录有匹配得到的成语的名称。
S103,将第一文本数据输入预先构建的成语知识图谱,获取第一文本数据的属性信息。
可以理解的是,作为一种数据记录形式,在成语知识图谱中可以保存有成语的读音,释义,出处等信息。因此,本发明实施例可以利用预先构建的成语知识图谱,获取目标文档片段中第一文本数据的属性信息,所获取的属性信息至少可以包括:第一文本数据的读音,释义,以及出处。
本发明实施例中,预先构建的成语知识图谱可以保存于本地的办公软件(例如WPS)中,也可以保存于线上服务器中,当然,还可以同时保存于本地的办公软件和线上服务器中。
如果成语知识图谱保存于办公软件中,当用户打开用户终端中的办公软件时,办公软件即可利用所保存的成语知识图谱得到成语的属性信息,并且,用户终端还可以通过联网更新成语知识图谱中的数据。
具体地,用户终端可以向存储有成语属性信息的数据库服务器发送数据更新请求,数据库服务器获取该数据更新请求后,可以向用户终端返回更新数据,用户终端可以接收更新数据,进而对本地保存的成语知识图谱中的数据进行更新。
如果成语知识图谱保存于线上服务器中,则当用户打开用户终端中的办公软件时,用户终端可以通过线上服务器获取成语知识图谱中的数据。
具体地,用户终端可以向存储有成语知识图谱的线上服务器发送数据获取请求,线上服务器接收该数据获取请求后,可以向用户终端返回包含有成语属性信息的应答数据,用户终端可以通过应答数据获取其中的成语属性信息。
S104,基于所获取的属性信息构建第一文本数据对应的字典。
本发明实施例中,上述字典可以如同日常生活中使用的字典一样,记载有第一文本数据的读音,释义,以及出处等信,因此可以成为第一文本数据对应的字典。本发明实施例在获取成语的属性信息后,可以利用上述属性信息构建成语字典。
当然,本发明实施例的成语字典可以是针对目标文档片段中所有的成语而构建的,并且,本发明实施例可以在每获取新的成语的属性信息后,将新的属性信息添加至成语字典中,以实现成语字典内容的不断更新,提高成语字典的内容完善程度。
作为本发明实施例一种可选的实施方式,如图4所示,上述步骤S104具体可以包括:
S1041,利用当前成语的属性信息,生成当前成语的属性信息列表。
本发明实施例中,当前成语可以是成语名称列表中保存的成语。获取当前成语的属性信息后,例如,从成语知识图谱中获取当前成语的属性信息后,可以生成当前成语的属性信息列表,所说的属性信息列表可以是一份用于记录成语属性信息的列表,属性信息列表中可以以列表的形式记录有当前成语的读音,释义,以及出处等信息。
可选的,上述读音,释义,以及出处等信息,可以依次分别是属性信息列表的第1个元素,第2个元素,第3个元素……,并可以以字符串的形式保存数据。当需要从属性信息列表中查询信息时,可以从属性信息列表中元素对应的位置处获取字符串,然后转换为上述读音、释义、或者出处等信息。将文字转换为字符串的目的是为了更加便于保存数据,转换过程可以通过已有的编解码技术实现,本发明实施例在此不再赘述。
S1042,将当前成语的名称作为键,当前成语的属性信息列表作为值,组成当前成语的键值对。
本发明实施例可以以Key-Value(键值对)的形式保存数据,具体地,可以将当前成语的名称作为键,将当前成语的属性信息列表作为值,从而组成当前成语的键值对。可以理解,该键值对中保存有当前成语的名称信息以及属性信息。这种分布式存储方法,具有查询速度快、存放数据量大、支持高并发的优点,更加适合保存本发明实施例中与成语相关的数据。
S1043,将键值对添加至原始成语字典中。
生成当前成语的键值对后,即可将当前成语的键值对添加至原始成语字典中,以构建成语字典。本发明实施例的原始成语字典,可以是指添加当前成语的键值对前的成语字典,可以理解,构建成语字典的过程是一个不断累积的过程,也就是说,在每次得到一个新的当前成语的键值对后,便可以将该键值对添加至原始成语字典中,从而增加成语字典的数据累积量,使成语字典的内容不断完善。
S105,展示成语字典中的信息。
本发明实施例中,可以向用户展示成语字典中的信息,这些信息至少可以包括:成语的读音,释义,以及出处。可以理解的是,所展示的信息可以是目标文档片段中成语的信息。
示例性地,在电子文档中,可以在目标文档片段的一侧展示成语字典中的信息,从而使用户看到目标文档片段中成语的读音、释义、出处等信息,使用户不必再切换至其它第三方工具查找。当然,也可以在目标文档片段的上方或下方展示成语字典中的信息。
作为本发明实施例一种可选的实施方式,如图5所示,上述步骤S105,具体可以包括:
S1051,在展示卡片的第一展示区域,展示成语字典中属于目标文档片段的成语的名称信息。
S1052,在展示卡片的第二展示区域,展示成语字典中属于目标文档片段的成语的读音信息。
S1053,在展示卡片的第三展示区域,展示成语字典中属于目标文档片段的成语的释义信息。
S1054,在展示卡片的第四展示区域,展示成语字典中属于目标文档片段的成语的出处信息。
展示卡片可以是指电子文档中用于展示信息的UI(User Interface,用户界面),该UI形如一张卡片,因此可以称之为展示卡片。可以理解的是,一个展示卡片中可以被划分为不同的展示区域,从而用于展示不同的信息。
如上文所描述的,本发明实施例中,可以在展示卡片的不同展示区域,展示成语不同的信息,如读音信息,释义信息,出处信息。
作为本发明实施例一种具体的实施方式,可以在展示卡片的第一行展示成语名称;第二行展示字符串“读音:”与对应属性列表第1个元素的字符串的链接,即“读音:”与成语读音字符串的链接;第三行展示字符串“释义:”与对应属性列表第2个元素的字符串的链接,即“释义:”与成语释义字符串的链接;第四行展示字符串“出处:”与对应属性列表第3个元素的字符串的链接,即“出处:”与成语出处字符串的链接。
当然,除上述所举示例所展示的成语的信息外,本发明实施例还可以展示其它与成语相关的信息,例如,与当前成语含义相近的成语,或者,与当前成语含义相反的成语,或者,当前成语的外文翻译等,都属于本发明实施例的保护范围。
作为本发明实施例一种可选的实施方式,针对电子文档的各个段落,可以先展示所有段落的成语信息,然后系统可以判断鼠标指针的位置,并随鼠标指针的移动,依次以高亮文本展示鼠标指针所在位置处的段落的成语信息,而其他段落中的成语信息可以模糊化处理。
通过这种展示方式,由于电子文档中各段落的成语信息是一次性计算得到的,而不是逐个计算各段落的成语信息,因此可以减少在后续展示过程中的数据处理量,一方面降低计算机在展示成语信息时的运算压力,另一方面可以提高展示速度。
当然,针对电子文档的各个句子,也可以采用上述展示过程,其展示原理相同,本发明实施例在此不再赘述。
本发明实施例提供的一种成语信息展示方法,在确定电子文档中的目标文档片段并识别目标文档片段中的第一文本数据后,通过预设的成语知识图谱获取第一文本数据的读音、释义、出处等属性信息,然后基于所获取的属性信息构建第一文本数据对应的字典,并向用户展示字典中的信息。由于本发明实施例能够自动识别电子文档中用户正在关注的文档片段,即目标文档片段,并自动向用户展示该文档片段中成语信息,因此用户不需要切换至第三方工具便可以获知电子文档中的成语信息,也不需要再对第三方工具返回的成语信息进行甄别,因此能够使用户更加专注于当前的电子文档处理工作,从而提高用户在电子文档中查看成语信息时的使用体验。
方法实施例2
本发明实施例还提供了一种成语信息展示方法,如图6所示,该方法可以包括以下步骤:
S201,构建成语知识图谱。
成语知识图谱作为一种数据记录形式,可以保存成语的读音,释义,出处等信息。本发明实施例可以利用样本成语数据,构建成语知识图谱,并存储到图数据库中。
作为本发明实施例一种可选的实施方式,如图7所示,上述步骤S201,具体可以包括:
S2011,获取多个样本成语,各样本成语的标签,以及各样本成语的属性信息。
样本成语可以是指用于作为样本的成语实体,样本成语的标签可以是指该样本成语的一个标签实体,可以用于描述该样本成语的含义,例如,“耄耋之年”是成语实体,而耄耋之年的含义是指年龄为八九十岁,因此,“年龄”以及“八九十岁”可以是“耄耋之年”的标签实体。样本成语的属性信息至少可以包括:样本成语的读音,释义,以及出处。
S2012,针对所获取的多个样本成语中的各样本成语,建立每个样本成语与该样本成语的标签之间的关联关系。
本发明实施例可以建立样本成语与其标签之间的关联关系,示例性地,可以将“耄耋之年”与“年龄”、“八九十岁”之间分别用“具有标签”这一关系关联,从而使成语“耄耋之年”与标签“年龄”以及标签“八九十岁”建立关联关系。
S2013,利用样本成语,样本成语与标签之间的关联关系,以及各样本成语的属性信息,构建图谱结构数据。
当得到样本成语、样本成语与标签之间的关联关系、以及各样本成语的属性信息后,便可以利用这些信息构建图谱结构数据,也即本发明实施例所说的成语知识图谱。
示例性地,可以将成语的名称、读音、释义、出处作为成语的属性信息,例如“耄耋之年”是该成语实体的“名称”属性,而且成语实体的“名称”属性具有唯一性,对应的“读音”属性为“mào diézhīnián”,“释义”属性为“八九十岁。耄,音“冒”,耋,音“迭”。耄耋是指年纪很大的人。耄耋之年,年纪十分大的时候。“出处”属性为“语出[汉]曹操《对酒歌》:耄耋皆得以寿终,恩泽广及草木昆虫”。
S202,确定电子文档中的目标文档片段。
一份电子文档中通常可以包括文字内容,文字内容通常可以通过不同的段落组成,每个段落又可以包括多个句子。当用户正在处理一份电子文档时(例如审阅稿件时),用户终端可以识别用户正在关注的文档内容,例如,通过鼠标指针位置识别用户正在关注的文档内容,进而将该文档内容作为目标文档片段,即,所说的目标文档片段,可以是指被确定为用户正在关注的文档片段。确定电子文档中的目标文档片段的过程可以为后台自动处理过程,从而减少对用户的干扰。
用户终端可以是指个人电子计算机,也可以指智能手机,还可以指平板电脑等运行有操作系统的电子设备,例如,运行Windows操作系统的电子设备,运行Linux操作系统的电子设备,运行Android操作系统的电子设备,运行iOS操作系统的电子设备。
可以理解的是,用户终端中可以运行电子文档软件,电子文档软件中通常包括文字处理程序,例如,Word程序,WPS程序,或者其他文字处理程序。当然,除文字处理程序外,电子表格和演示文稿也属于电子文档的一种,它们也可以包括文字内容。
S203,识别目标文档片段中的成语。
对于含有汉字内容的电子文档,其中通常含有成语,因此,在展示目标文档片段中成语的信息前,本发明实施例可以先识别出目标文档片段中的成语,以进行进一步处理。
S204,利用构建的成语知识图谱,获取成语的属性信息。
可以理解的是,作为一种数据记录形式,在成语知识图谱中可以保存有成语的读音,释义,出处等信息。因此,本发明实施例可以利用所构建的成语知识图谱,获取目标文档片段中的成语的属性信息,所获取的属性信息至少可以包括:成语的读音,释义,以及出处。
本发明实施例中,所构建的成语知识图谱可以保存于本地的办公软件(例如WPS)中,也可以保存于线上服务器中,当然,还可以同时保存于本地的办公软件和线上服务器中。
如果成语知识图谱保存于办公软件中,当用户打开用户终端中的办公软件时,办公软件即可利用所保存的成语知识图谱得到成语的属性信息,并且,用户终端还可以通过联网更新成语知识图谱中的数据。
具体地,用户终端可以向存储有成语属性信息的数据库服务器发送数据更新请求,数据库服务器获取该数据更新请求后,可以向用户终端返回更新数据,用户终端可以接收更新数据,进而对本地保存的成语知识图谱中的数据进行更新。
如果成语知识图谱保存于线上服务器中,则当用户打开用户终端中的办公软件时,用户终端可以通过线上服务器获取成语知识图谱中的数据。
具体地,用户终端可以向存储有成语知识图谱的线上服务器发送数据获取请求,线上服务器接收该数据获取请求后,可以向用户终端返回包含有成语属性信息的应答数据,用户终端可以通过应答数据获取其中的成语属性信息。
S205,基于所获取的属性信息构建成语字典。
本发明实施例中,成语字典可以如同日常生活中使用的字典一样,记载有成语的读音,释义,以及出处等信息。本发明实施例在获取成语的属性信息后,可以利用上述属性信息构建成语字典。
S206,展示成语字典中的信息。
本发明实施例中,可以向用户展示成语字典中的信息,这些信息至少可以包括:成语的读音,释义,以及出处。可以理解的是,所展示的信息可以是目标文档片段中成语的信息。
本发明实施例提供的一种成语信息展示方法,通过构建成语知识图谱,在确定电子文档中的目标文档片段并识别目标文档片段中的成语后,通过所构建的成语知识图谱获取成语的读音、释义、出处等属性信息,然后基于所获取的属性信息构建成语字典,并向用户展示成语字典中的信息。由于本发明实施例能够自动识别电子文档中用户正在关注的文档片段,即目标文档片段,并自动向用户展示该文档片段中成语信息,因此用户不需要切换至第三方工具便可以获知电子文档中的成语信息,也不需要再对第三方工具返回的成语信息进行甄别,因此能够使用户更加专注于当前的电子文档处理工作,从而提高用户在电子文档中查看成语信息时的使用体验。
相应于上面的方法实施例,本发明实施例还提供了相应的装置实施例。
装置实施例1
如图8所示,本发明实施例提供了一种成语信息展示装置,包括:
确定模块301,用于确定电子文档中的目标文档片段;目标文档片段为用户正在关注的文档片段。
识别模块302,用于识别目标文档片段中的第一文本数据;第一文本数据包括成语名称。
获取模块303,用于将第一文本数据输入预先构建的成语知识图谱,获取第一文本数据的属性信息;属性信息至少包括:第一文本数据的读音,释义,以及出处。
第一构建模块304,用于基于所获取的所述属性信息构建第一文本数据对应的字典;字典中至少包括以下信息:第一文本数据的读音,释义,以及出处。
展示模块305,用于展示字典中的信息。
作为本发明实施例一种可选的实施方式,如图9所示,上述确定模块301,包括:
第一确定子模块3011,用于在电子文档中,确定当前鼠标指针位置所在的文档片段。
第二确定子模块3012,用于将文档片段确定为目标文档片段。
作为本发明实施例一种可选的实施方式,如图10所示,上述识别模块302,包括:
第二构建子模块3021,用于利用预设样本成语,构建成语名称字典树。
匹配子模块3022,用于利用多模式匹配算法,从目标文档片段中匹配得到目标成语名称;目标成语名称为包含于成语名称字典树中的成语的名称。
作为本发明实施例一种可选的实施方式,在图8所示实施例的基础上,如图11所示,本发明实施例的成语信息展示装置还可以包括:
生成模块401,用于生成成语名称列表,成语名称列表中记录有匹配得到的成语的名称。
作为本发明实施例一种可选的实施方式,如图12所示,上述第一构建模块304,包括:
生成子模块3041,用于利用当前成语的属性信息,生成当前成语的属性信息列表;属性信息列表中以列表形式记录有当前成语的读音,释义,以及出处;当前成语为成语名称列表中记录的成语。
组成子模块3042,用于将当前成语的名称作为键,当前成语的属性信息列表作为值,组成当前成语的键值对。
第三构建子模块3043,用于将键值对添加至原始成语字典中。
作为本发明实施例一种可选的实施方式,如图13所示,上述展示模块305,包括:
第一展示子模块3051,用于在展示卡片的第一展示区域,展示成语字典中属于目标文档片段的成语的名称信息。
第二展示子模块3052,用于在展示卡片的第二展示区域,展示成语字典中属于目标文档片段的成语的读音信息。
第三展示子模块3053,用于在展示卡片的第三展示区域,展示成语字典中属于目标文档片段的成语的释义信息。
第四展示子模块3054,用于在展示卡片的第四展示区域,展示成语字典中属于目标文档片段的成语的出处信息。
作为本发明实施例一种可选的实施方式,上述展示模块305具体用于:
针对电子文档的各个段落,随鼠标指针的移动依次以高亮文本展示鼠标指针所在位置处的段落的成语信息;
或者,针对电子文档的各个句子,随鼠标指针的移动依次以高亮文本展示鼠标指针所在位置处的句子的成语信息。
本发明实施例提供的一种成语信息展示装置,在确定电子文档中的目标文档片段并识别目标文档片段中的第一文本数据后,通过预设的成语知识图谱获取第一文本数据的读音、释义、出处等属性信息,然后基于所获取的属性信息构建第一文本数据对应的字典,并向用户展示字典中的信息。由于本发明实施例能够自动识别电子文档中用户正在关注的文档片段,即目标文档片段,并自动向用户展示该文档片段中成语信息,因此用户不需要切换至第三方工具便可以获知电子文档中的成语信息,也不需要再对第三方工具返回的成语信息进行甄别,因此能够使用户更加专注于当前的电子文档处理工作,从而提高用户在电子文档中查看成语信息时的使用体验。
装置实施例4
在图8所示装置结构的基础上,如图14所示,本发明实施例还提供了一种成语信息展示装置,包括:
第二构建模块501,用于构建成语知识图谱。
作为本发明实施例一种可选的实施方式,如图15所示,上述第二构建模块501,包括:
获取子模块5011,用于获取多个样本成语,各样本成语的标签,以及各样本成语的属性信息;标签用于描述样本成语的含义;样本成语的属性信息至少包括:样本成语的读音,释义,以及出处。
建立子模块5012,用于针对所获取的多个样本成语中的各样本成语,建立每个样本成语与该样本成语的标签之间的关联关系。
第一构建子模块5013,用于利用样本成语,样本成语与标签之间的关联关系,以及各样本成语的属性信息,构建图谱结构数据。
本发明实施例提供的一种成语信息展示装置,通过构建成语知识图谱,在确定电子文档中的目标文档片段并识别目标文档片段中的成语后,通过所构建的成语知识图谱获取成语的读音、释义、出处等属性信息,然后基于所获取的属性信息构建成语字典,并向用户展示成语字典中的信息。由于本发明实施例能够自动识别电子文档中用户正在关注的文档片段,即目标文档片段,并自动向用户展示该文档片段中成语信息,因此用户不需要切换至第三方工具便可以获知电子文档中的成语信息,也不需要再对第三方工具返回的成语信息进行甄别,因此能够使用户更加专注于当前的电子文档处理工作,从而提高用户在电子文档中查看成语信息时的使用体验。
本发明实施例还提供了一种电子设备,具体可以为服务器,如图16所示,该设备600包括处理器601和机器可读存储介质602,机器可读存储介质存储有能够被处理器执行的机器可执行指令,处理器执行机器可执行指令实现以下步骤:
确定电子文档中的目标文档片段;目标文档片段为用户正在关注的文档片段;
识别目标文档片段中的第一文本数据;第一文本数据包括成语名称;
将第一文本数据输入预先构建的成语知识图谱,获取第一文本数据的属性信息;属性信息至少包括:第一文本数据的读音,释义,以及出处;
基于所获取的属性信息构建所述第一文本数据对应的字典;字典中至少包括以下信息:第一文本数据的读音,释义,以及出处;
展示字典中的信息。
机器可读存储介质可以包括随机存取存储器(Random Access Memory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
本发明实施例提供的一种电子设备,在确定电子文档中的目标文档片段并识别目标文档片段中的第一文本数据后,通过预设的成语知识图谱获取第一文本数据的读音、释义、出处等属性信息,然后基于所获取的属性信息构建第一文本数据对应的字典,并向用户展示字典中的信息。由于本发明实施例能够自动识别电子文档中用户正在关注的文档片段,即目标文档片段,并自动向用户展示该文档片段中成语信息,因此用户不需要切换至第三方工具便可以获知电子文档中的成语信息,也不需要再对第三方工具返回的成语信息进行甄别,因此能够使用户更加专注于当前的电子文档处理工作,从而提高用户在电子文档中查看成语信息时的使用体验。
本发明实施例还提供了一种计算机可读存储介质,计算机可读存储介质内存储有计算机程序,计算机程序被处理器执行时,用以执行如下步骤:
确定电子文档中的目标文档片段;目标文档片段为用户正在关注的文档片段;
识别目标文档片段中的第一文本数据;第一文本数据包括成语名称;
将第一文本数据输入预先构建的成语知识图谱,获取第一文本数据的属性信息;属性信息至少包括:第一文本数据的读音,释义,以及出处;
基于所获取的属性信息构建所述第一文本数据对应的字典;字典中至少包括以下信息:第一文本数据的读音,释义,以及出处;
展示字典中的信息。
本发明实施例提供的一种计算机可读存储介质,在确定电子文档中的目标文档片段并识别目标文档片段中的第一文本数据后,通过预设的成语知识图谱获取第一文本数据的读音、释义、出处等属性信息,然后基于所获取的属性信息构建第一文本数据对应的字典,并向用户展示字典中的信息。由于本发明实施例能够自动识别电子文档中用户正在关注的文档片段,即目标文档片段,并自动向用户展示该文档片段中成语信息,因此用户不需要切换至第三方工具便可以获知电子文档中的成语信息,也不需要再对第三方工具返回的成语信息进行甄别,因此能够使用户更加专注于当前的电子文档处理工作,从而提高用户在电子文档中查看成语信息时的使用体验。
本发明实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行以下步骤:
确定电子文档中的目标文档片段;目标文档片段为用户正在关注的文档片段;
识别目标文档片段中的第一文本数据;第一文本数据包括成语名称;
将第一文本数据输入预先构建的成语知识图谱,获取第一文本数据的属性信息;属性信息至少包括:第一文本数据的读音,释义,以及出处;
基于所获取的属性信息构建第一文本数据对应的字典;字典中至少包括以下信息:第一文本数据的读音,释义,以及出处;
展示字典中的信息。
本发明实施例提供的一种包含指令的计算机程序产品,在确定电子文档中的目标文档片段并识别目标文档片段中的第一文本数据后,通过预设的成语知识图谱获取第一文本数据的读音、释义、出处等属性信息,然后基于所获取的属性信息构建第一文本数据对应的字典,并向用户展示字典中的信息。由于本发明实施例能够自动识别电子文档中用户正在关注的文档片段,即目标文档片段,并自动向用户展示该文档片段中成语信息,因此用户不需要切换至第三方工具便可以获知电子文档中的成语信息,也不需要再对第三方工具返回的成语信息进行甄别,因此能够使用户更加专注于当前的电子文档处理工作,从而提高用户在电子文档中查看成语信息时的使用体验。
本发明实施例还提供了一种计算机程序,当其在计算机上运行时,使得计算机执行以下步骤:
确定电子文档中的目标文档片段;目标文档片段为用户正在关注的文档片段;
识别目标文档片段中的第一文本数据;第一文本数据包括成语名称;
将第一文本数据输入预先构建的成语知识图谱,获取第一文本数据的属性信息;属性信息至少包括:第一文本数据的读音,释义,以及出处;
基于所获取的属性信息构建所述第一文本数据对应的字典;字典中至少包括以下信息:第一文本数据的读音,释义,以及出处;
展示字典中的信息。
本发明实施例提供的一种包含指令的计算机程序,在确定电子文档中的目标文档片段并识别目标文档片段中的第一文本数据后,通过预设的成语知识图谱获取第一文本数据的读音、释义、出处等属性信息,然后基于所获取的属性信息构建第一文本数据对应的字典,并向用户展示字典中的信息。由于本发明实施例能够自动识别电子文档中用户正在关注的文档片段,即目标文档片段,并自动向用户展示该文档片段中成语信息,因此用户不需要切换至第三方工具便可以获知电子文档中的成语信息,也不需要再对第三方工具返回的成语信息进行甄别,因此能够使用户更加专注于当前的电子文档处理工作,从而提高用户在电子文档中查看成语信息时的使用体验。
对于装置/电子设备/存储介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (18)

1.一种成语信息展示方法,其特征在于,所述方法包括:
确定电子文档中的目标文档片段;所述目标文档片段为用户正在关注的文档片段;
识别所述目标文档片段中的第一文本数据;所述第一文本数据包括成语名称;
将所述第一文本数据输入预先构建的成语知识图谱,获取所述第一文本数据的属性信息;所述属性信息至少包括:所述第一文本数据的读音,释义,以及出处;
基于所获取的所述属性信息构建所述第一文本数据对应的字典;所述字典中至少包括以下信息:所述第一文本数据的读音,释义,以及出处;
展示所述字典中的信息。
2.根据权利要求1所述的方法,其特征在于,所述确定电子文档中的目标文档片段之前,所述方法还包括:
构建所述成语知识图谱。
3.根据权利要求2所述的方法,其特征在于,所述构建所述成语知识图谱的步骤,包括:
获取多个样本成语,各样本成语的标签,以及各样本成语的属性信息;所述标签用于描述所述样本成语的含义;所述样本成语的属性信息至少包括:所述样本成语的读音,释义,以及出处;
针对所获取的多个样本成语中的各样本成语,建立每个样本成语与该样本成语的标签之间的关联关系;
利用所述样本成语,所述样本成语与标签之间的关联关系,以及各样本成语的属性信息,构建图谱结构数据。
4.根据权利要求1所述的方法,其特征在于,所述识别所述目标文档片段中的第一文本数据的步骤,包括:
利用预设样本成语,构建成语名称字典树;
利用多模式匹配算法,从所述目标文档片段中匹配得到目标成语名称;所述目标成语名称为包含于所述成语名称字典树中的成语的名称。
5.根据权利要求4所述的方法,其特征在于,所述从所述目标文档片段中匹配得到目标成语名称之后,所述方法还包括:
生成成语名称列表,所述成语名称列表中记录有匹配得到的成语的名称。
6.根据权利要求5所述的方法,其特征在于,所述基于所获取的所述属性信息构建所述第一文本数据对应的字典的步骤,包括:
利用当前成语的属性信息,生成当前成语的属性信息列表;所述属性信息列表中以列表形式记录有当前成语的读音,释义,以及出处;所述当前成语为所述成语名称列表中记录的成语;
将当前成语的名称作为键,当前成语的属性信息列表作为值,组成当前成语的键值对;
将所述键值对添加至原始成语字典中。
7.根据权利要求1所述的方法,其特征在于,所述展示所述成语字典中的信息的步骤,包括:
在展示卡片的第一展示区域,展示所述成语字典中属于所述目标文档片段的成语的名称信息;
在展示卡片的第二展示区域,展示所述成语字典中属于所述目标文档片段的成语的读音信息;
在展示卡片的第三展示区域,展示所述成语字典中属于所述目标文档片段的成语的释义信息;
在展示卡片的第四展示区域,展示所述成语字典中属于所述目标文档片段的成语的出处信息。
8.根据权利要求1所述的方法,其特征在于,所述展示所述成语字典中的信息的步骤,包括:
针对所述电子文档的各个段落,随鼠标指针的移动依次以高亮文本展示鼠标指针所在位置处的段落的成语信息;
或者,针对所述电子文档的各个句子,随鼠标指针的移动依次以高亮文本展示鼠标指针所在位置处的句子的成语信息。
9.一种成语信息展示装置,其特征在于,所述装置包括:
确定模块,用于确定电子文档中的目标文档片段;所述目标文档片段为用户正在关注的文档片段;
识别模块,用于识别所述目标文档片段中的第一文本数据;所述第一文本数据包括成语名称;
获取模块,用于将所述第一文本数据输入预先构建的成语知识图谱,获取所述第一文本数据的属性信息;所述属性信息至少包括:所述第一文本数据的读音,释义,以及出处;
第一构建模块,用于基于所获取的所述属性信息构建所述第一文本数据对应的字典;所述字典中至少包括以下信息:所述第一文本数据的读音,释义,以及出处;
展示模块,用于展示所述字典中的信息。
10.根据权利要求9所述的装置,其特征在于,所述装置还包括:
第二构建模块,用于构建所述成语知识图谱。
11.根据权利要求10所述的装置,其特征在于,所述第二构建模块,包括:
获取子模块,用于获取多个样本成语,各样本成语的标签,以及各样本成语的属性信息;所述标签用于描述所述样本成语的含义;所述样本成语的属性信息至少包括:所述样本成语的读音,释义,以及出处;
建立子模块,用于针对所获取的多个样本成语中的各样本成语,建立每个样本成语与该样本成语的标签之间的关联关系;
第一构建子模块,用于利用所述样本成语,所述样本成语与标签之间的关联关系,以及各样本成语的属性信息,构建图谱结构数据。
12.根据权利要求9所述的装置,其特征在于,所述识别模块,包括:
第二构建子模块,用于利用预设样本成语,构建成语名称字典树;
匹配子模块,用于利用多模式匹配算法,从所述目标文档片段中匹配得到目标成语名称;所述目标成语名称为包含于所述成语名称字典树中的成语的名称。
13.根据权利要求12所述的装置,其特征在于,所述装置还包括:
生成模块,用于生成成语名称列表,所述成语名称列表中记录有匹配得到的成语的名称。
14.根据权利要求13所述的装置,其特征在于,所述第一构建模块,包括:
生成子模块,用于利用当前成语的属性信息,生成当前成语的属性信息列表;所述属性信息列表中以列表形式记录有当前成语的读音,释义,以及出处;所述当前成语为所述成语名称列表中记录的成语;
组成子模块,用于将当前成语的名称作为键,当前成语的属性信息列表作为值,组成当前成语的键值对;
第三构建子模块,用于将所述键值对添加至原始成语字典中。
15.根据权利要求9所述的装置,其特征在于,所述展示模块,包括:
第一展示子模块,用于在展示卡片的第一展示区域,展示所述成语字典中属于所述目标文档片段的成语的名称信息;
第二展示子模块,用于在展示卡片的第二展示区域,展示所述成语字典中属于所述目标文档片段的成语的读音信息;
第三展示子模块,用于在展示卡片的第三展示区域,展示所述成语字典中属于所述目标文档片段的成语的释义信息;
第四展示子模块,用于在展示卡片的第四展示区域,展示所述成语字典中属于所述目标文档片段的成语的出处信息。
16.根据权利要求9所述的装置,其特征在于,所述展示模块具体用于:
针对所述电子文档的各个段落,随鼠标指针的移动依次以高亮文本展示鼠标指针所在位置处的段落的成语信息;
或者,针对所述电子文档的各个句子,随鼠标指针的移动依次以高亮文本展示鼠标指针所在位置处的句子的成语信息。
17.一种电子设备,其特征在于,包括处理器和机器可读存储介质,所述机器可读存储介质存储有能够被所述处理器执行的机器可执行指令,所述处理器执行所述机器可执行指令以实现权利要求1-8任一项所述的方法步骤。
18.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-8任一项所述的方法步骤。
CN201910228638.3A 2019-03-25 2019-03-25 一种成语信息展示方法、展示装置、电子设备及存储介质 Active CN109933803B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910228638.3A CN109933803B (zh) 2019-03-25 2019-03-25 一种成语信息展示方法、展示装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910228638.3A CN109933803B (zh) 2019-03-25 2019-03-25 一种成语信息展示方法、展示装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN109933803A true CN109933803A (zh) 2019-06-25
CN109933803B CN109933803B (zh) 2023-06-02

Family

ID=66988095

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910228638.3A Active CN109933803B (zh) 2019-03-25 2019-03-25 一种成语信息展示方法、展示装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN109933803B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110442735A (zh) * 2019-08-13 2019-11-12 北京金山数字娱乐科技有限公司 一种成语近义词推荐方法及装置
CN110491190A (zh) * 2019-07-19 2019-11-22 淮阴工学院 一种课程教育辅助装置
CN112380873A (zh) * 2020-12-04 2021-02-19 鼎富智能科技有限公司 一种规范文书中被选中项确定方法及装置
CN113641816A (zh) * 2021-08-20 2021-11-12 安徽淘云科技股份有限公司 一种信息显示方法、装置、存储介质及设备

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101366021A (zh) * 2006-01-05 2009-02-11 微软公司 经由软件应用用户界面将元数据应用于文档或文档对象
CN102541901A (zh) * 2010-12-26 2012-07-04 上海量明科技发展有限公司 一种文档阅读时的信息识别输出方法及系统
CN104182469A (zh) * 2014-07-25 2014-12-03 北京搜狗科技发展有限公司 对文档进行注释的方法和输入法系统
US20170004184A1 (en) * 2015-06-30 2017-01-05 Microsoft Technology Licensing, Llc Analysis of user text
CN106649286A (zh) * 2016-10-15 2017-05-10 语联网(武汉)信息技术有限公司 一种基于双数组字典树进行术语匹配的方法
CN106919689A (zh) * 2017-03-03 2017-07-04 中国科学技术信息研究所 基于术语释义知识单元的专业领域知识图谱动态构建方法
CN107729327A (zh) * 2017-09-30 2018-02-23 联想(北京)有限公司 一种释义方法及一种释义装置
CN109062871A (zh) * 2018-07-03 2018-12-21 北京明略软件系统有限公司 一种文本标注方法和装置、计算机可读存储介质
CN109213893A (zh) * 2018-07-27 2019-01-15 阿里巴巴集团控股有限公司 一种基于读音的词语显示方法和装置
CN109348145A (zh) * 2018-09-14 2019-02-15 上海连尚网络科技有限公司 基于字幕生成关联弹幕的方法及设备

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101366021A (zh) * 2006-01-05 2009-02-11 微软公司 经由软件应用用户界面将元数据应用于文档或文档对象
CN102541901A (zh) * 2010-12-26 2012-07-04 上海量明科技发展有限公司 一种文档阅读时的信息识别输出方法及系统
CN104182469A (zh) * 2014-07-25 2014-12-03 北京搜狗科技发展有限公司 对文档进行注释的方法和输入法系统
US20170004184A1 (en) * 2015-06-30 2017-01-05 Microsoft Technology Licensing, Llc Analysis of user text
CN107810496A (zh) * 2015-06-30 2018-03-16 微软技术许可有限责任公司 用户文本分析
CN106649286A (zh) * 2016-10-15 2017-05-10 语联网(武汉)信息技术有限公司 一种基于双数组字典树进行术语匹配的方法
CN106919689A (zh) * 2017-03-03 2017-07-04 中国科学技术信息研究所 基于术语释义知识单元的专业领域知识图谱动态构建方法
CN107729327A (zh) * 2017-09-30 2018-02-23 联想(北京)有限公司 一种释义方法及一种释义装置
CN109062871A (zh) * 2018-07-03 2018-12-21 北京明略软件系统有限公司 一种文本标注方法和装置、计算机可读存储介质
CN109213893A (zh) * 2018-07-27 2019-01-15 阿里巴巴集团控股有限公司 一种基于读音的词语显示方法和装置
CN109348145A (zh) * 2018-09-14 2019-02-15 上海连尚网络科技有限公司 基于字幕生成关联弹幕的方法及设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
杨现民 等: "网络环境下共享阅读体验工具的设计与实现", 《 中国电化教育 》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110491190A (zh) * 2019-07-19 2019-11-22 淮阴工学院 一种课程教育辅助装置
CN110491190B (zh) * 2019-07-19 2021-05-25 淮阴工学院 一种课程教育辅助装置
CN110442735A (zh) * 2019-08-13 2019-11-12 北京金山数字娱乐科技有限公司 一种成语近义词推荐方法及装置
CN112380873A (zh) * 2020-12-04 2021-02-19 鼎富智能科技有限公司 一种规范文书中被选中项确定方法及装置
CN112380873B (zh) * 2020-12-04 2024-04-26 鼎富智能科技有限公司 一种规范文书中被选中项确定方法及装置
CN113641816A (zh) * 2021-08-20 2021-11-12 安徽淘云科技股份有限公司 一种信息显示方法、装置、存储介质及设备

Also Published As

Publication number Publication date
CN109933803B (zh) 2023-06-02

Similar Documents

Publication Publication Date Title
CN109933803A (zh) 一种成语信息展示方法、展示装置、电子设备及存储介质
US10423649B2 (en) Natural question generation from query data using natural language processing system
EP2570974B1 (en) Automatic crowd sourcing for machine learning in information extraction
CN101819578B (zh) 检索方法、索引建立方法和装置及检索系统
CN113807098A (zh) 模型训练方法和装置、电子设备以及存储介质
US9224103B1 (en) Automatic annotation for training and evaluation of semantic analysis engines
CN108304375A (zh) 一种信息识别方法及其设备、存储介质、终端
US8868556B2 (en) Method and device for tagging a document
CN109582861A (zh) 一种数据隐私信息检测系统
JP7293643B2 (ja) 構造化文書の内容をチャットベースのインタラクションに翻訳するための半自動化された方法及びシステム、プログラム
US20210073257A1 (en) Logical document structure identification
CN109726274A (zh) 问题生成方法、装置及存储介质
EP2162833A1 (en) A method, system and computer program for intelligent text annotation
Brown et al. Mechanized margin to digitized center: black feminism's contributions to combatting erasure within the digital humanities
US9772991B2 (en) Text extraction
KR101607468B1 (ko) 콘텐츠에 대한 키워드 태깅 방법 및 시스템
Banerjee et al. Bengali question classification: Towards developing qa system
CN103678362A (zh) 搜索方法及系统
US10210251B2 (en) System and method for creating labels for clusters
CN104765849A (zh) 一种获取拷贝数据来源信息的方法和系统
CN110489032B (zh) 用于电子书的词典查询方法及电子设备
CN113836316B (zh) 三元组数据的处理方法、训练方法、装置、设备及介质
CN111602129B (zh) 针对注释和墨迹的智能搜索
US10009297B2 (en) Entity metadata attached to multi-media surface forms
CN110147358B (zh) 自动问答知识库的建设方法及建设系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant