CN110889279B - 一种在文档中显示展示信息的方法及装置 - Google Patents

一种在文档中显示展示信息的方法及装置 Download PDF

Info

Publication number
CN110889279B
CN110889279B CN201810930418.0A CN201810930418A CN110889279B CN 110889279 B CN110889279 B CN 110889279B CN 201810930418 A CN201810930418 A CN 201810930418A CN 110889279 B CN110889279 B CN 110889279B
Authority
CN
China
Prior art keywords
target
information
document
blank area
blank
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810930418.0A
Other languages
English (en)
Other versions
CN110889279A (zh
Inventor
冷志峰
宁廷泽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Kingsoft Office Software Inc
Zhuhai Kingsoft Office Software Co Ltd
Guangzhou Kingsoft Mobile Technology Co Ltd
Original Assignee
Beijing Kingsoft Office Software Inc
Zhuhai Kingsoft Office Software Co Ltd
Guangzhou Kingsoft Mobile Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Kingsoft Office Software Inc, Zhuhai Kingsoft Office Software Co Ltd, Guangzhou Kingsoft Mobile Technology Co Ltd filed Critical Beijing Kingsoft Office Software Inc
Priority to CN201810930418.0A priority Critical patent/CN110889279B/zh
Publication of CN110889279A publication Critical patent/CN110889279A/zh
Application granted granted Critical
Publication of CN110889279B publication Critical patent/CN110889279B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • User Interface Of Digital Computer (AREA)

Abstract

本申请实施例提供了一种显示展示信息的方法及装置,该方法包括:当接收到对应目标文档的开启指令后,获取所述目标文档;确定所述目标文档的空白区域,以及所述空白区域对应的目标文本信息,其中,所述目标文本信息包括预先存储的以所述空白区域为中心的预设范围内的文本信息;从所述目标文本信息和预先存储的所述目标文档的文档标题中提取关键词信息,并根据所述关键词信息确定目标展示信息;在显示所述目标文档的状态下,显示所述目标展示信息。采用本申请,可以提高展示信息与目标文档的关联度。

Description

一种在文档中显示展示信息的方法及装置
技术领域
本申请涉及互联网技术领域,特别是涉及一种显示展示信息的方法及装置。
背景技术
随着互联网的发展与用户数量的壮大,越来越多的服务提供商采用弹窗的形式显示展示信息。
在实际中,当用户通过阅读软件浏览文档时,终端会以弹窗的形式显示展示信息,具体处理过程为:终端接收到文档打开指令后,获取该文档打开指令对应的目标文档、以及目标文档的文档标题;终端可以从文档标题中提取关键词信息,并根据关键词信息确定目标文档对应的目标类型信息;然后终端根据预先存储的类型信息与展示信息的对应关系,确定目标类型信息对应的展示信息,并以弹窗的形式进行显示。其中,目标类型信息包括金融、计算机、以及通信。
然而,终端仅通过目标文档的文档标题确定关键词信息,得到的关键词信息少,因此,基于关键词信息确定出的展示信息与目标文档的关联度低。
申请内容
本申请实施例的目的在于提供一种显示展示信息的方法及装置,以提高展示信息与目标文档的关联度。具体技术方案如下:
第一方面,提供了一种显示展示信息的方法,所述方法包括:
当接收到对应目标文档的开启指令后,获取所述目标文档;
确定所述目标文档的空白区域,以及所述空白区域对应的目标文本信息,其中,所述目标文本信息包括预先存储的以所述空白区域为中心的预设范围内的文本信息;
从所述目标文本信息和预先存储的所述目标文档的文档标题中提取关键词信息,并根据所述关键词信息确定目标展示信息;
在显示所述目标文档的状态下,显示所述目标展示信息。
可选的,所述在显示所述目标文档的状态下,显示所述目标展示信息包括:
在显示所述目标文档的状态下,在所述空白区域中显示所述目标展示信息。
可选的,所述从所述目标文本信息和预先存储的所述目标文档的文档标题中提取关键词信息,并根据所述关键词信息确定目标展示信息包括:
如果所述目标文档的空白区域为多个,针对每个空白区域,从该空白区域对应的目标文本信息和所述文档标题中提取关键词信息;
根据所述关键词信息确定该空白区域的目标展示信息。
可选的,所述在显示所述目标文档的状态下,显示所述目标展示信息包括:
如果空白区域的数目大于预设数目,则在所述多个空白区域中,选择所述预设数目个目标空白区域;
在显示所述目标文档的状态下,分别在每个目标空白区域中,显示该目标空白区域对应的目标展示信息。
第二方面,提供了一种显示展示信息的装置,所述装置包括:
获取模块,用于当接收到对应目标文档的开启指令后,获取所述目标文档;
确定模块,用于确定所述目标文档的空白区域,以及所述空白区域对应的目标文本信息,其中,所述目标文本信息包括预先存储的以所述空白区域为中心的预设范围内的文本信息;
提取模块,用于从所述目标文本信息和预先存储的所述目标文档的文档标题中提取关键词信息,并根据所述关键词信息确定目标展示信息;
显示模块,用于在显示所述目标文档的状态下,显示所述目标展示信息。
可选的,所述显示模块包括:
第一显示子模块,用于在显示所述目标文档的状态下,在所述空白区域中显示所述目标展示信息。
可选的,所述提取模块包括:
提取子模块,用于当所述目标文档的空白区域为多个时,针对每个空白区域,从该空白区域对应的目标文本信息和所述文档标题中提取关键词信息;
确定子模块,用于根据所述关键词信息确定该空白区域的目标展示信息。
可选的,所述显示模块包括:
选择子模块,用于当空白区域的数目大于预设数目时,在所述多个空白区域中,选择所述预设数目个目标空白区域;
第二显示子模块,用于在显示所述目标文档的状态下,分别在每个目标空白区域中,显示该目标空白区域对应的目标展示信息。
第三方面,提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现第一方面所述的方法步骤。
第四方面,提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现第一方面所述的方法步骤。
本申请实施例提供了一种显示展示信息的方法及装置,通过获取目标文档,确定目标文档的空白区域、以及空白区域的目标文本信息;然后,从目标文本信息和预先存储的目标文档的文档标题中,提取关键词信息,并根据关键词信息确定目标展示信息;之后,在显示目标文档的状态下,显示目标展示信息。这样,从目标文档的目标文本信息和文档标题中提取关键词信息,能够提高确定关键词信息的准确度,进而提高展示信息与目标文档的关联度。
当然,实施本申请的任一产品或方法并不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种显示展示信息的方法的方法流程图;
图2a为本申请实施例提供的一种界面显示示意图;
图2b为本申请实施例提供的一种界面显示示意图;
图3为本申请实施例提供的一种显示展示信息的装置的装置结构示意图;
图4为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例提供了一种显示展示信息的方法及装置,该方法应用于终端,终端包括个人电脑、平板电脑、以及手机等电子设备,终端内安装有阅读软件,以便用户通过阅读软件进行文档浏览。本申请实施例中,显示的展示信息可以是广告信息,也可以是新闻信息。
终端可以根据接收到的展示信息点击指令,提供重要客户服务。其中,重要客户服务包括在显示目标文档时,不显示展示信息或增值服务,增值服务包括转换目标文档的文件格式。例如,用户可以通过点击展示信息,获取重要客户服务,以将PDF(PortableDocument Format,便携式文档格式)形式的目标文档转换为doc(document,文档)形式的文档。
本申请实施例提供了一种显示展示信息的方法,如图1所示,该方法的具体处理流程包括:
步骤101,当接收到对应目标文档的开启指令后,获取目标文档。
在实施中,终端中可以预先存储有用于浏览文档的应用程序(即阅读软件),当用户需要浏览文档时,用户可以在终端开启该应用程序,然后选择需要浏览的文档(即目标文档),终端则会接收到对应目标文档的开启指令。其中,文档也可以存储在终端的本地缓存中,也可以存储在该应用程序的后台服务器中,本实施例不做限定。
可选的,开启指令可以由用户双击目标文档产生,开启指令中可以携带有文档标识,文档标识包括文档的文档标题。
当终端接收到用户发出的对应目标文档的开启指令后,可以在终端的本地缓存中或者该应用程序的后台服务器中,根据开启指令携带的文档标识,确定目标文档,然后,终端可以在本地缓存中获取目标文档的数据信息并通过阅读软件打开目标文档。终端也可以发送请求目标文档的指令至该应用程序的后台服务器,并接收后台服务器发送的目标文档的数据信息,之后通过阅读软件打开目标文档。数据信息包括文档包含的字符以及字符在文档中的存储位置。
步骤102,确定目标文档的空白区域,以及空白区域对应的目标文本信息。
其中,目标文本信息包括预先存储的以空白区域为中心的预设范围内的文本信息。空白区域可以是文档中被写入预设的空白字符的文档区域,空白字符表示该字符未被写入数据。预设范围可以是与空白区域相邻的非空白字符的个数。终端可以通过接收技术人员的更改指令,以改变预设范围。
在实施中,终端可以获取目标文档的数据信息,搜索数据信息中的空白字符,并统计连续的空白字符的数目,确定数目大于预设数目阈值的连续的空白字符。确定出的连续的空白字符,即组成空白区域。
终端确定出空白区域后,在目标文档的数据信息中,查找空白区域相邻的预设数目个非空白字符,将得到的非空白字符作为预设范围内的文本信息,进一步的,将该文本信息作为空白区域的目标文本信息。
例如,空白区域如图2a所示,当预设范围为十个非空白字符时,预设范围内的文本信息为:“大主题展开讨论和交流”以及“国际货币论坛是中国人”,也即空白区域对应的目标文本信息。
步骤103,从目标文本信息和预先存储的目标文档的文档标题中提取关键词信息,并根据关键词信息确定目标展示信息。
在实施中,终端可以从目标文档的数据信息中获取目标文档的文档标题,然后通过预设的分词算法,对目标文本信息和文档标题进行分词,得到多个分词。之后,终端通过关键词提取算法和多个分词,提取关键词信息。
终端将关键词信息输入至预设的分类模型中,并将分类模型的输出结果作为目标信息。
其中,分类模型可以是任一深度神经网络,深度神经网络包括LR(LogisticsRegression,逻辑回归)。分词算法可以是任一具有分词功能的算法,例如,结巴中文分词算法。关键词提取算法包括textrank(文本排名)算法和pagerank(页排名)算法。其中,当终端通过结巴中文分词算法对目标文本信息和文档标题进行分词时,可以直接将分词的结果作为关键词信息。
例如,如图2a所示,目标文本信息为“大主题展开讨论和交流”以及“国际货币论坛是中国人”,文档标题为“2018国际货币论坛圆满召开”时,终端对目标文本信息和文档标题进行分词,得到的多个分词为:大、主题、展开、讨论、和、交流、国际货币论坛、是、中国人、2018、圆满、召开。终端通过关键词提取算法从多个分词中提取的关键词信息为国际货币论坛。
步骤104,在显示目标文档的状态下,显示目标展示信息。
在实施中,终端可以在通过阅读软件显示目标文档的状态下,显示目标展示信息。目标展示信息的显示方式可以是多种多样的,例如,可以通过弹窗的形式展示目标展示信息,弹窗可以位于阅读软件显示界面的某一区域。类似的,终端也可以通过浮窗的形式显示目标展示信息,浮窗可以位于阅读软件显示界面的某一区域。
可选的,在显示目标文档的状态下,在空白区域中显示目标展示信息。
在实施中,终端可以在通过阅读软件显示目标文档的状态下,在空白区域中显示目标展示信息。
本申请实施例提供了一种终端在空白区域中显示目标展示信息的界面显示示意图,具体如图2b所示。
本申请实施例通过在空白区域显示目标展示信息,与通过突然出现的弹窗显示展示信息相比,不会打断用户的阅读,能够提高用户阅读的体验,提升展示信息显示效果。
可选的,终端确定出的目标文档的空白区域的数目可能是一个,也可能是多个,针对空白区域数目的不同,终端显示目标展示信息的处理流程也不相同,具体的,空白区域的数目存在如下两种情况:
情况一、如果目标文档的空白区域为一个,终端根据该空白区域的目标文本信息和文档标题中提取关键词信息,并将该关键词信息输入至预先存储的分类模型中,分类模型的输出结果为目标文档对应的目标类型信息。然后,终端根据预先存储的类型信息与展示信息的对应关系,确定目标类型信息对应的展示信息,并将该展示信息作为目标展示信息,显示目标展示信息。
情况二、如果目标文档的空白区域为多个,终端的具体处理流程如下:
步骤一、针对每个空白区域,从该空白区域对应的目标文本信息和文档标题中提取关键词信息。
在实施中,如果目标文档的空白区域为多个,终端针对每个空白区域,确定该空白区域对应的目标文本信息;然后,终端通过分词算法和关键词提取算法,从该空白区域对应的目标文本信息和文档标题中,提取该空白区域对应的关键词信息。
步骤二、根据关键词信息确定该空白区域的目标展示信息。
在实施中,终端针对每个空白区域,将该空白区域对应的关键词信息输入至预先存储的分类模型中,分类模型的输出结果为目标文档对应的目标类型信息。终端根据预先存储的类型信息与展示信息的对应关系,确定目标类型信息对应的展示信息,并将该展示信息作为目标展示信息。
进一步的,终端可以接收技术人员发出的训练指令和训练数据库,训练分类模型,得到展示信息分类模型。终端将关键词信息输入至展示信息分类模型后,展示信息分类模型的输出结果为展示信息,终端可以将该展示信息作为该空白区域的目标展示信息。
由此,终端获得每个空白区域对应的目标展示信息。
本申请实施例中,当目标文档的空白区域为多个时,终端分别针对每个空白区域,确定关键词信息,然后,分别根据每个空白区域对应的关键词信息,确定目标展示信息,这样,针对每个空白区域,确定出的目标展示信息与该空白区域周围的文档内容的关联程度更高。
此外,针对情况二,当目标文档的空白区域为多个时,终端会在多个空白区域中确定目标空白区域,并显示目标空白区域对应的目标展示信息,具体处理流程如下:
步骤一、如果空白区域的数目大于预设数目,则在所述多个空白区域中,选择所述预设数目个目标空白区域。
在实施中,终端可以在确定出的多个空白区域中,选取不超过预设数目的空白区域,作为目标空白区域。终端选取目标空白区域的方式可以是多种多样的。
例如,终端可以获取预先存储的空白区域的显示尺寸信息、和各空白区域对应的目标展示信息的显示尺寸信息。显示尺寸信息可以是空白区域或展示信息在预设的阅读软件显示界面中的显示面积,占显示界面总面积的比例值。为了便于区分,本申请实施例中,将空白区域的显示尺寸信息称为第一显示尺寸信息,将空白区域对应的目标展示信息的显示尺寸信息称为第二显示尺寸信息。
终端可以比较各空白区域的第一显示尺寸信息,选取具有最大显示尺寸信息的空白区域作为目标空白区域,或者选取第一显示尺寸信息不小于预设显示比例值的空白区域作为目标空白区域。
终端也可以针对每个空白区域,比较第一显示尺寸信息与第二显示尺寸信息,如果第一显示尺寸信息大于等于第二显示尺寸信息,则将该空白区域作为目标空白区域。如果第一显示尺寸信息小于第二显示尺寸信息,则不再对该空白区域进行进一步处理。
终端也可以获取各空白区域间的文档间隔,文档间隔包括两空白区域间的文本行数。终端比较各空白区域间的文档间隔,选取文档间隔不小于预设文档间隔阈值的对应空白区域作为目标空白区域。
步骤二、在显示目标文档的状态下,分别在每个目标空白区域中,显示该目标空白区域对应的目标展示信息。
在实施中,如果目标空白区域的个数为1个,终端可以在目标空白区域中,显示目标空白区域对应的目标展示信息;也可以通过弹窗或者其他形式显示目标展示信息。
如果目标空白区域的个数为多个,终端可以分别在每个目标空白区域中,显示该目标空白区域对应的目标展示信息;终端也可以通过弹窗或者其他形式,按照预设的显示方式显示各目标空白区域对应的目标展示信息。预设的显示方式可以是随机选择某一目标空白区域对应的目标展示信息进行显示,也可以是某一目标展示信息的显示时间到达预设的显示时间阈值后,显示另一目标展示信息。
本申请实施例中,当空白区域为多个时,在多个空白区域中选择目标空白区域,能够提高展示信息的显示效果。
本申请实施例提供了一种显示展示信息的方法及装置,通过获取目标文档,确定目标文档的空白区域、以及空白区域的目标文本信息;然后,从目标文本信息和预先存储的目标文档的文档标题中,提取关键词信息,并根据关键词信息确定目标展示信息;之后,在显示目标文档的状态下,显示目标展示信息。这样,从目标文档的目标文本信息和文档标题中提取关键词信息,能够提高确定关键词信息的准确度,进而提高展示信息与目标文档的关联度。
本申请实施例还提供了一种显示展示信息的装置,如图3所示,所述装置包括:
获取模块310,用于当接收到对应目标文档的开启指令后,获取所述目标文档;
确定模块320,用于确定所述目标文档的空白区域,以及所述空白区域对应的目标文本信息,其中,所述目标文本信息包括预先存储的以所述空白区域为中心的预设范围内的文本信息;
提取模块330,用于从所述目标文本信息和预先存储的所述目标文档的文档标题中提取关键词信息,并根据所述关键词信息确定目标展示信息;
显示模块340,用于在显示所述目标文档的状态下,显示所述目标展示信息。
可选的,所述显示模块包括:
第一显示子模块,用于在显示所述目标文档的状态下,在所述空白区域中显示所述目标展示信息。
可选的,所述提取模块包括:
提取子模块,用于当所述目标文档的空白区域为多个时,针对每个空白区域,从该空白区域对应的目标文本信息和所述文档标题中提取关键词信息;
确定子模块,用于根据所述关键词信息确定该空白区域的目标展示信息。
可选的,所述显示模块包括:
选择子模块,用于当空白区域的数目大于预设数目时,在所述多个空白区域中,选择所述预设数目个目标空白区域;
第二显示子模块,用于在显示所述目标文档的状态下,分别在每个目标空白区域中,显示该目标空白区域对应的目标展示信息。
本申请实施例提供了一种显示展示信息的方法及装置,通过获取目标文档,确定目标文档的空白区域、以及空白区域的目标文本信息;然后,从目标文本信息和预先存储的目标文档的文档标题中,提取关键词信息,并根据关键词信息确定目标展示信息;之后,在显示目标文档的状态下,显示目标展示信息。这样,从目标文档的目标文本信息和文档标题中提取关键词信息,能够提高确定关键词信息的准确度,进而提高展示信息与目标文档的关联度。
本申请实施例还提供了一种电子设备,如图4所示,包括处理器401、通信接口402、存储器403和通信总线404,其中,处理器401,通信接口402,存储器403通过通信总线404完成相互间的通信,
存储器403,用于存放计算机程序;
处理器401,用于执行存储器403上所存放的程序时,实现如下步骤:
当接收到对应目标文档的开启指令后,获取所述目标文档;
确定所述目标文档的空白区域,以及所述空白区域对应的目标文本信息,其中,所述目标文本信息包括预先存储的以所述空白区域为中心的预设范围内的文本信息;
从所述目标文本信息和预先存储的所述目标文档的文档标题中提取关键词信息,并根据所述关键词信息确定目标展示信息;
在显示所述目标文档的状态下,显示所述目标展示信息。
可选的,所述在显示所述目标文档的状态下,显示所述目标展示信息包括:
在显示所述目标文档的状态下,在所述空白区域中显示所述目标展示信息。
可选的,所述从所述目标文本信息和预先存储的所述目标文档的文档标题中提取关键词信息,并根据所述关键词信息确定目标展示信息包括:
如果所述目标文档的空白区域为多个,针对每个空白区域,从该空白区域对应的目标文本信息和所述文档标题中提取关键词信息;
根据所述关键词信息确定该空白区域的目标展示信息。
可选的,所述在显示所述目标文档的状态下,显示所述目标展示信息包括:
如果空白区域的数目大于预设数目,则在所述多个空白区域中,选择所述预设数目个目标空白区域;
在显示所述目标文档的状态下,分别在每个目标空白区域中,显示该目标空白区域对应的目标展示信息。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本申请提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一一种显示展示信息的方法的步骤。
在本申请提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一一种显示展示信息的方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
本申请实施例提供了一种显示展示信息的方法及装置,通过获取目标文档,确定目标文档的空白区域、以及空白区域的目标文本信息;然后,从目标文本信息和预先存储的目标文档的文档标题中,提取关键词信息,并根据关键词信息确定目标展示信息;之后,在显示目标文档的状态下,显示目标展示信息。这样,从目标文档的目标文本信息和文档标题中提取关键词信息,能够提高确定关键词信息的准确度,进而提高展示信息与目标文档的关联度。
需要说明的是,在本文中,诸如目标和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本申请的较佳实施例而已,并非用于限定本申请的保护范围。凡在本申请的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本申请的保护范围内。

Claims (4)

1.一种在文档中显示展示信息的方法,其特征在于,所述方法包括:
当接收到对应目标文档的开启指令后,获取所述目标文档;
确定所述目标文档的空白区域,以及所述空白区域对应的目标文本信息,其中,所述目标文本信息包括预先存储的以所述空白区域为中心的预设范围内的文本信息;所述空白区域是所述目标文档中被写入预设的空白字符的文档区域,空白字符表示该字符未被写入数据;所述预设范围是与所述空白区域相邻的非空白字符的个数;
从所述目标文本信息和预先存储的所述目标文档的文档标题中提取关键词信息,并根据所述关键词信息确定目标展示信息;
在显示所述目标文档的状态下,显示所述目标展示信息;
所述根据所述关键词信息确定目标展示信息,包括:
将所述关键词信息输入至预先存储的分类模型中,所述分类模型的输出结果为所述目标文档对应的目标类型信息;
根据预先存储的类型信息与展示信息的对应关系,确定所述目标类型信息对应的展示信息,并将该展示信息作为目标展示信息;
所述从所述目标文本信息和预先存储的所述目标文档的文档标题中提取关键词信息,并根据所述关键词信息确定目标展示信息包括:
如果所述目标文档的空白区域为多个,针对每个空白区域,从该空白区域对应的目标文本信息和所述文档标题中提取关键词信息;
根据所述关键词信息确定该空白区域的目标展示信息;
所述在显示所述目标文档的状态下,显示所述目标展示信息包括:
如果空白区域的数目大于预设数目,则在多个空白区域中,选择所述预设数目个目标空白区域;
在显示所述目标文档的状态下,分别在每个目标空白区域中,显示该目标空白区域对应的目标展示信息;
选取所述目标空白区域的方式为以下任一项:
获取预先存储的空白区域的第一显示尺寸信息和各空白区域对应的目标展示信息的第二显示尺寸信息;比较各空白区域的第一显示尺寸信息;选取具有最大显示尺寸信息的空白区域作为所述目标空白区域,或者选取第一显示尺寸信息不小于预设显示比例值的空白区域作为所述目标空白区域;
针对每个空白区域,比较第一显示尺寸信息与第二显示尺寸信息,如果第一显示尺寸信息大于等于第二显示尺寸信息,将该空白区域作为所述目标空白区域;
获取各空白区域间的文档间隔,文档间隔包括两空白区域间的文本行数;比较各空白区域间的文档间隔,选取文档间隔不小于预设文档间隔阈值的对应空白区域作为所述目标空白区域。
2.一种在文档中显示展示信息的装置,其特征在于,所述装置包括:
获取模块,用于当接收到对应目标文档的开启指令后,获取所述目标文档;
确定模块,用于确定所述目标文档的空白区域,以及所述空白区域对应的目标文本信息,其中,所述目标文本信息包括预先存储的以所述空白区域为中心的预设范围内的文本信息;所述空白区域是所述目标文档中被写入预设的空白字符的文档区域,空白字符表示该字符未被写入数据;所述预设范围是与所述空白区域相邻的非空白字符的个数;
提取模块,用于从所述目标文本信息和预先存储的所述目标文档的文档标题中提取关键词信息,并根据所述关键词信息确定目标展示信息;
显示模块,用于在显示所述目标文档的状态下,显示所述目标展示信息;
所述提取模块,具体用于:
将所述关键词信息输入至预先存储的分类模型中,所述分类模型的输出结果为所述目标文档对应的目标类型信息;
根据预先存储的类型信息与展示信息的对应关系,确定所述目标类型信息对应的展示信息,并将该展示信息作为目标展示信息;
所述提取模块包括:
提取子模块,用于当所述目标文档的空白区域为多个时,针对每个空白区域,从该空白区域对应的目标文本信息和所述文档标题中提取关键词信息;
确定子模块,用于根据所述关键词信息确定该空白区域的目标展示信息;
所述显示模块包括:
选择子模块,用于当空白区域的数目大于预设数目时,在多个空白区域中,选择所述预设数目个目标空白区域;
第二显示子模块,用于在显示所述目标文档的状态下,分别在每个目标空白区域中,显示该目标空白区域对应的目标展示信息;
选取所述目标空白区域的方式为以下任一项:
获取预先存储的空白区域的第一显示尺寸信息和各空白区域对应的目标展示信息的第二显示尺寸信息;比较各空白区域的第一显示尺寸信息;选取具有最大显示尺寸信息的空白区域作为所述目标空白区域,或者选取第一显示尺寸信息不小于预设显示比例值的空白区域作为所述目标空白区域;
针对每个空白区域,比较第一显示尺寸信息与第二显示尺寸信息,如果第一显示尺寸信息大于等于第二显示尺寸信息,将该空白区域作为所述目标空白区域;
获取各空白区域间的文档间隔,文档间隔包括两空白区域间的文本行数;比较各空白区域间的文档间隔,选取文档间隔不小于预设文档间隔阈值的对应空白区域作为所述目标空白区域。
3.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1所述的方法步骤。
4.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1所述的方法步骤。
CN201810930418.0A 2018-08-15 2018-08-15 一种在文档中显示展示信息的方法及装置 Active CN110889279B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810930418.0A CN110889279B (zh) 2018-08-15 2018-08-15 一种在文档中显示展示信息的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810930418.0A CN110889279B (zh) 2018-08-15 2018-08-15 一种在文档中显示展示信息的方法及装置

Publications (2)

Publication Number Publication Date
CN110889279A CN110889279A (zh) 2020-03-17
CN110889279B true CN110889279B (zh) 2024-06-25

Family

ID=69744203

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810930418.0A Active CN110889279B (zh) 2018-08-15 2018-08-15 一种在文档中显示展示信息的方法及装置

Country Status (1)

Country Link
CN (1) CN110889279B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111523289B (zh) * 2020-04-24 2023-05-09 支付宝(杭州)信息技术有限公司 一种文本格式生成方法、装置、设备和可读介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101446959A (zh) * 2008-12-30 2009-06-03 深圳市迅雷网络技术有限公司 一种基于互联网的新闻推荐方法和系统
JP2009225263A (ja) * 2008-03-18 2009-10-01 Yahoo Japan Corp 印刷物への広告出力方法及び装置
CN105608068A (zh) * 2014-11-17 2016-05-25 三星电子株式会社 用于概括文档的显示装置和方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004021746A (ja) * 2002-06-18 2004-01-22 Dainippon Printing Co Ltd 検索結果文字列表示方法およびシステム
CN101174273B (zh) * 2007-12-04 2010-06-23 清华大学 基于元数据分析的新闻事件检测方法
CN103164439B (zh) * 2011-12-14 2016-11-09 中国电信股份有限公司 业务信息动态显示方法、服务器及在线文档浏览终端
CN107526744B (zh) * 2016-06-21 2022-11-18 北京搜狗科技发展有限公司 一种基于搜索的信息展示方法和装置
CN106649562A (zh) * 2016-11-10 2017-05-10 深圳市金立通信设备有限公司 一种信息搜索方法及终端

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009225263A (ja) * 2008-03-18 2009-10-01 Yahoo Japan Corp 印刷物への広告出力方法及び装置
CN101446959A (zh) * 2008-12-30 2009-06-03 深圳市迅雷网络技术有限公司 一种基于互联网的新闻推荐方法和系统
CN105608068A (zh) * 2014-11-17 2016-05-25 三星电子株式会社 用于概括文档的显示装置和方法

Also Published As

Publication number Publication date
CN110889279A (zh) 2020-03-17

Similar Documents

Publication Publication Date Title
CN108319630B (zh) 信息处理方法、装置、存储介质和计算机设备
CN107657048B (zh) 用户识别方法及装置
US9524714B2 (en) Speech recognition apparatus and method thereof
US10402479B2 (en) Method, server, browser, and system for recommending text information
CN104899220B (zh) 应用程序推荐方法和系统
CN110888990A (zh) 文本推荐方法、装置、设备及介质
CN110232126B (zh) 热点挖掘方法及服务器和计算机可读存储介质
US20140379719A1 (en) System and method for tagging and searching documents
CN111767713B (zh) 关键词的提取方法、装置、电子设备及存储介质
CN109918594B (zh) 一种信息显示方法及装置
WO2014206151A1 (en) System and method for tagging and searching documents
CN107111618B (zh) 将图像的缩略图链接到网页
US20150206101A1 (en) System for determining infringement of copyright based on the text reference point and method thereof
WO2016162843A1 (en) Processing a search query and retrieving targeted records from a networked database system
CN107885875B (zh) 检索词的同义变换方法、装置及服务器
CN110750707A (zh) 关键词推荐方法、装置和电子设备
CN113806660A (zh) 数据评估方法、训练方法、装置、电子设备以及存储介质
CN111488434B (zh) 输入联想词的推荐方法、装置、存储介质及电子设备
CN109753611B (zh) 对当前访问页面匹配信息库的方法及装置
CN110889279B (zh) 一种在文档中显示展示信息的方法及装置
CN112836126A (zh) 基于知识图谱的推荐方法、装置、电子设备及存储介质
RU2632126C1 (ru) Способ и система предоставления контекстуальной информации
CN109145261B (zh) 一种生成标签的方法和装置
CN110942070B (zh) 内容展示方法、装置、电子设备及计算机可读存储介质
CN109947947B (zh) 一种文本分类方法、装置及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant