CN109582846A - 通过文章进行搜索的方法、装置、电子设备及存储介质 - Google Patents
通过文章进行搜索的方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN109582846A CN109582846A CN201811393277.XA CN201811393277A CN109582846A CN 109582846 A CN109582846 A CN 109582846A CN 201811393277 A CN201811393277 A CN 201811393277A CN 109582846 A CN109582846 A CN 109582846A
- Authority
- CN
- China
- Prior art keywords
- article
- user
- search
- described search
- link
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请提出一种通过文章进行搜索的方法、装置、电子设备及存储介质,属于互联网技术领域。其中,该方法包括:获取文章,其中,文章中包括搜索引导语,且搜索引导语与搜索引导语相对于的搜索结果链接对应;以及接收用户对搜索引导语的触发指令,并根据搜索结果链接跳转至搜索结果页面。由此,通过这种通过文章进行搜索的方法,实现了在用户浏览信息的同时,可以对感兴趣的内容进行搜索,不仅可以主动引导用户进行搜索以获取流量,而且可以主动满足用户更深层次的探索需求,改善了用户体验。
Description
技术领域
本申请涉及互联网技术领域,尤其涉及一种通过文章进行搜索的方法、装置、电子设备及存储介质。
背景技术
随着互联网信息流爆发式的增长,人们通过互联网浏览新闻等资讯时,资讯中的文字、图片和短视频已经无法满足人们的探索需求,人们需要从文章中获取更加丰富、垂直、富有深度的东西。
在传统互联网媒体中,主要通过用户进行主动搜索的方式获取流量,但是这种方法,无法主动引导用户进行搜索以获取流量,从而导致无法主动满足用户更深层次的探索需求,影响了用户体验。
发明内容
本申请提出的通过文章进行搜索的方法、装置、电子设备及存储介质,用于解决相关技术中,现有通过用户进行主动搜索的方式获取流量的方法,无法主动引导用户进行搜索以获取流量,从而导致无法主动满足用户更深层次的探索需求,影响了用户体验的问题。
本申请一方面实施例提出的通过文章进行搜索的方法,包括:获取文章,其中,所述文章中包括搜索引导语,且所述搜索引导语与所述搜索引导语相对于的搜索结果链接对应;以及接收用户对所述搜索引导语的触发指令,并根据所述搜索结果链接跳转至搜索结果页面。
本申请另一方面实施例提出的通过文章进行搜索的装置,包括:获取模块,用于获取文章,其中,所述文章中包括搜索引导语,且所述搜索引导语与所述搜索引导语相对于的搜索结果链接对应;以及接收模块,用于接收用户对所述搜索引导语的触发指令,并根据所述搜索结果链接跳转至搜索结果页面。
本申请再一方面实施例提出的电子设备,其包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如前所述的通过文章进行搜索的方法。
本申请再一方面实施例提出的计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如前所述的通过文章进行搜索的方法。
本申请又一方面实施例提出的计算机程序,该程序被处理器执行时,以实现本申请实施例所述的通过文章进行搜索的方法。
本申请实施例提供的通过文章进行搜索的方法、装置、电子设备、计算机可读存储介质及计算机程序,可以获取文章,其中,文章中包括搜索引导语,且搜索引导语与搜索引导语相对于的搜索结果链接对应,进而接收用户对搜索引导语的触发指令,并根据搜索结果链接跳转至搜索结果页面。由此,通过在文章中插入搜索引导语以及与搜索引导语对应的搜索结果链接,并在用户点击搜索引导语时,跳转至相应的搜索结果页面,从而实现了在用户浏览信息的同时,可以对感兴趣的内容进行搜索,不仅可以主动引导用户进行搜索以获取流量,而且可以主动满足用户更深层次的探索需求,改善了用户体验。
本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本申请实施例提供的一种通过文章进行搜索的方法的流程示意图;
图2为本申请实施例提供的一种插入搜索引导语以及搜索结果链接的实现样式;
图3为用户阅读页面的示意图;
图4为本申请实施例提供的另一种通过文章进行搜索的方法的流程示意图;
图5为本申请实施例提供的一种通过文章进行搜索的装置的结构示意图;
图6为本申请实施例提供的电子设备的结构示意图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的要素。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。
本申请实施例针对现有通过人工建立敏感词表对文本数据进行敏感度识别的方法,不仅准确率低,而且效率低下,浪费人力资源的问题,提出一种通过文章进行搜索的方法。
本申请实施例提供的通过文章进行搜索的方法,可以获取文章,其中,文章中包括搜索引导语,且搜索引导语与搜索引导语相对于的搜索结果链接对应,进而接收用户对搜索引导语的触发指令,并根据搜索结果链接跳转至搜索结果页面。由此,通过在文章中插入搜索引导语以及与搜索引导语对应的搜索结果链接,并在用户点击搜索引导语时,跳转至相应的搜索结果页面,从而实现了在用户浏览信息的同时,可以对感兴趣的内容进行搜索,不仅可以主动引导用户进行搜索以获取流量,而且可以主动满足用户更深层次的探索需求,改善了用户体验。
下面参考附图对本申请提供的通过文章进行搜索的方法、装置、电子设备、存储介质及计算机程序进行详细描述。
图1为本申请实施例所提供的一种通过文章进行搜索的方法的流程示意图。
如图1所示,该通过文章进行搜索的方法,包括以下步骤:
步骤101,获取文章,其中,所述文章中包括搜索引导语,且所述搜索引导语与所述搜索引导语相对于的搜索结果链接对应。
需要说明的是,随着互联网信息流爆发式的增长,人们通过互联网浏览新闻等资讯时,资讯中的文字、图片和短视频已经无法满足人们的探索需求,人们需要从文章中获取更加丰富、垂直、富有深度的东西。因此,在本申请实施例中,可以通过在文章中插入搜索链接的方式,引导用户对文章中晦涩难懂的内容,或者感兴趣的内容进行进一步的搜索,不仅可以打破信息流产品与搜索割裂的现状,节省用户的搜索时间,而且可以增加用户的步长,主动引导用户进行搜索以获取流量,满足用户更深层次的探索需求。
其中,搜索引导语可以是一句简短的、可以引起用户的点击兴趣,并且可以概括与其对应的搜索结果链接内容的文字,其本质上是一个超链接,点击搜索引导语可以链接至搜索结果链接对应的页面。
在本申请实施例一种可能的实现形式中,可以在文章编辑过程中,允许作者在文章中自定义搜索引导语,以及搜索引导语对应的搜索结果链接。其中,搜索结果链接对应的页面内容,可以是对文章中晦涩难懂的问题的解答,也可以是与文章相关的有趣的内容,以使用户可以获得沉浸式的阅读体验。如图2所示,为本申请实施例提供的一种插入搜索引导语以及搜索结果链接的实现样式。
进一步的,在作者对文章编辑完成并发表之后,还可以对文章的内容以及文件中插入的所述引导语、搜索结果链接对应的页面内容进行审核,以判断文章中是否包含违规内容。即在本申请实施例一种可能的实现形式中,上述步骤101之前,还可以包括:
对所述文章的内容进行校验,如果所述文章的内容通过校验,则进一步获取所述文章中的搜索引导语和所述搜索结果链接;
对所述文章中的搜索引导语和所述搜索结果链接进行校验;
如果所述文章中的搜索引导语和所述搜索结果链接通过校验,则对所述文章进行发布;
如果所述文章的内容未通过校验,或所述文章中的搜索引导语和所述搜索结果链接未通过校验,则拒绝所述文章发布。
需要说明的是,为保证文章内容的合法性,净化网络环境,可以对作者编辑完成并发表的文章进行校验,以筛选出包含违规内容的文章并拒绝其发布。在本申请实施例一种可能的实现形式中,可以首先对文章中除搜索引导语及其对应的搜索结果链接之外的内容(可以包括文章中的文字内容、图片、视频等)进行校验。具体的,可以根据全网内容,通过机器学习的方式对文章的内容进行判重,并根据文章内容与全网内容的重复度,对文章进行打分,文章内容与全网内容的重复度越高,文章的重复度分值越低。
在本申请实施例一种可能的实现形式中,可以预设文章内容重复度的阈值,以及重复度与重复度分值的映射关系。举例来说,预设的重复度阈值可以有第一阈值A、第二阈值B、第三阈值C,并且A<B<C,重复度与重复度分值的映射关系可以是:当文章内容的重复度小于等于第一阈值A时,文章的重复度分值为3分;当文章内容的重复度大于第一阈值A小于等于第二阈值B时,文章的重复度分值为2分;当文章内容的重复度大于第二阈值B小于等于第三阈值C时,文章的重复度分值为1分;当文章的内容重复度大于第三阈值C时,文章的重复度分值为0分。
需要说明的是,文章的重复度分值可以作为一定的权重,影响文章的最终发布。比如,文章的重复度分值为0分时,可以拒绝文章发布;文章的重复度分值为1分时,可以限制文章的发布范围;文章的重复度分值为2分时,可以正常发布文章;文章的重复度分值为3分时,可以推广发布文章。
实际使用时,文章的重复度阈值的个数与具体取值,以及重复度与重复度分值的映射关系、重复度分值与文章对文章发布的影响,可以根据实际需要预设,本申请实施例对此不做限定。
在本申请实施例中,在对文章的内容进行判重之后,可以进一步对文章进行反作弊校验,通过机器学习的方式,对包含恶意上报、恶意商业竞争、商业代理、涉黄涉反、低质量内容、血腥暴力、违法违规、内容不适等作弊场景的文章,可以拒绝发布。
在本申请实施例一种可能的实现形式中,还可以根据发表文章的作者的账号信息,对发表文章的作者进行身份审核,以判断发表文章的作者是否为恶意批量注册用户,对确定出的恶意用户发表的文章,可以直接拒接发布。另外,还可以根据发表文章的作者的账号信息确定作者的信用等级,之后根据文章对应的作者的信用等级,确定对文章的审核力度。若文章对应的作者的信用等级较低,则可以加大对文章的审核力度;若文章对应的作者的信用等级较高,则可以适当放松对文章的审核力度,以节约审核资源。其中,作者的信用等级可以对作者的大量历史操作记录(有无违规操作等)进行统计分析,确定作者的画像,进而根据作者的画像确定出作者的信用等级。
进一步的,在对文章的内容进行反作弊校验之后,还可以对文章的内容进行安全校验,以进一步保证文章的质量。具体的,可以通过机器学习的方式,对文章中的拒绝词、敏感词等进行等进检测,并检测文章中是否包含二维码以及违规图片,并在检测到文章中包含违规内容时,拒绝文章发布。
在本申请实施例中,在通过上述步骤对文章的内容进行校验之后,若文章的内容通过了校验,则可以采用上述校验方法进一步对文章中包含的搜索引导语以及搜索引导语对应的搜索结果链接进行校验,以判断搜索引导语及其对应的搜索结果链接是否合法。
具体的,在对搜索引导语进行校验时,可以通过机器学习的方式,检测搜索引导语中是否包含涉黄涉反、血腥暴力等违规的敏感词;在对搜索结果连接进行校验时,可以具体校验搜索结果链接对应的页面内容是否合法,通过上述方法对搜索结果链接对应的页面内容进行判重、防作弊校验、安全校验等。
需要说明的是,若文章的内容以及文章中的搜索引导语、搜索结果链接,任意一个未通过校验,则可以拒绝文章的发布;若文章的内容以及文章中的搜索引导语、搜索结果链接均通过了校验,则可以直接发布文章。
在本申请实施例另一种可能的实现形式中,对于包含搜索引导语以及搜索结果链接的文章,可以在作者编辑文章的过程中,插入搜索引导语以及搜索结果链接的时,实时对作者插入的搜索引导语以及搜索结果链接进行校验。若作者插入的搜索引导语以及搜索结果链接合法,则可以允许插入该搜索引导语以及搜索结果链接;若作者插入的搜索引导语或搜索结果链接不合法,则不允许插入该搜索引导语以及搜索结果链接。
需要说明的是,在文章通过校验之后,还可以对文章进行存储。在本申请实施例中可以采用分布式的关系型数据库管理系统(MySQL),对文章进行两级存储,即存储内容包括分开存储的文章标识表与文章信息表。文章标识表可以用于查询文章的标识,文章信息表提供文章标识的所有属性信息。而文章的具体内容采用mola分布式非关系型数据库进行存储。其中,文章中的搜索引导语以及搜索结果链接属于文章内容的一部分,所以存储在mola数据库中。
在本申请实施例中,在接收到用户对文章的点击操作时,可以根据用户点击的文章的标识,查找文章信息表的内容,并根据文章信息表中的文章标识,从mola数据库中获取文章的具体内容,并对获取到的数据进行数据加载和渲染,以在用户的电子设备中展示文章中的内容。如图3所示,为用户阅读页面的示意图,其中实线框内的内容为搜索引导语。
步骤102,接收用户对所述搜索引导语的触发指令,并根据所述搜索结果链接跳转至搜索结果页面。
在本申请实施例中,对于通过校验经发布的文章,可以供用户在电子设备中阅读。在用户对文章中的搜索引导语感兴趣时,可以通过电子设备的输入设备,如鼠标、键盘、触摸屏等,输入对搜索引导语的触发指令。比如,通过触摸屏或者鼠标点击搜索引导语。在接收到用户对搜索引导语的触发指令之后,即可根据搜索引导语对应的搜索结果链接,跳转至搜索结果链接对应的搜索结果页面,以供用户浏览。
需要说明的是,在本申请实施例一种可能的实现形式中,可以利用HTML语言标签的a元素,将当前文章链接至搜索结果链接对应的搜索结果页面,以在接收到用户对搜索引导语的触发指令时,跳转至搜索结果链接对应的搜索结果页面。
具体的,a元素的最重要属性为href属性,其可以指定链接的目标。在本申请实施例一种可能的实现形式中,可以采用绝对路径的方式,将搜索结果链接的完整域名嵌套进a元素。以下代码为将一个完整域名嵌套进a元素的示例。
<a
href="https://www.baidu.com/ssid=91e159756b69696b7559dff7dff7e3a0/from=844b/s?word=%E5%BB%B6%E7%A6%A7%E6%94%BB%E7%95%A5&ts=3435685&t_kt=22&ie=utf8&fm_kl=021394be2f&rsv_iqid=1427548242&rsv_t=6822bWjuLQ6v1Gy3tXA50WuzgKDfLtFTmWwLOyKTJC%252FpE74YuLNkyWsgJg&sa=ib&ms=1&rsv_pq=1427548242&rsv_sug4=5694&tj=1&inputT=4485&ss=100target="_blank"data-bjh-box="link"data-bjh-src="http://baijiahao.baidu.com/s?id=1613505461491227276"data-bjh-nid="9066434438523339893"data-bjh-type="news"data-bjh-article-id="1613505461491227276"contenteditable="false">了解更多内容点击延禧攻略</a>
进一步的,还可以根据用户对文章中搜索引导语的点击记录,分析用户的兴趣点,以建立用户的用户模型。即在本申请实施例一种可能的实现形式中,上述步骤102之后,还可以包括:
根据所述用户对所述搜索引导语的历史触发记录对所述用户模型进行更新。
需要说明的是,用户对文章中搜索引导语的点击行为,可以反映出用户的兴趣点。在本申请实施例一种可能的实现形式中,可以在用户对搜索引导语进行点击时,对用户点击的搜索引导语及其对应的搜索结果页面中的关键词进行收集,并利用数据库记录关键词出现的次数、搜索关键词的时间等,并与用户的标识进行关联。比如,用户A在11月初阅读了体育类的文章,并点击了文章中的体育相关的链接,而且相当其他类的文章来说,这个词频的频率很高,那么可以给用户标注一个“体育”标签。在获取到的用户对搜索引导语的历史触发记录足够多时,便可以利用机器学习和大数据对这些数据进行分析,确定出用户对应的用户模型。用户模型可以描绘出用户作为一个自然人最基本的属性,如性别、年龄、星座等,以及描绘出用户在社会活动中的基本属性,如人生阶段、资产状况、所在行业、教育水平等。
本申请实施例提供的通过文章进行搜索的方法,可以获取文章,其中,文章中包括搜索引导语,且搜索引导语与搜索引导语相对于的搜索结果链接对应,进而接收用户对搜索引导语的触发指令,并根据搜索结果链接跳转至搜索结果页面。由此,通过在文章中插入搜索引导语以及与搜索引导语对应的搜索结果链接,并在用户点击搜索引导语时,跳转至相应的搜索结果页面,从而实现了在用户浏览信息的同时,可以对感兴趣的内容进行搜索,不仅可以主动引导用户进行搜索以获取流量,而且可以主动满足用户更深层次的探索需求,改善了用户体验。
在本申请一种可能的实现形式中,文章中的搜索引导语及其对应的搜索结果连接也可以是在用户阅读文章的过程,根据文章中的关键词信息,或用户兴趣点实时生成的,以根据用户的个体差异,为用户精准推荐感兴趣的内容,进一步提高用户体验。
下面结合图4,对本申请实施例提供的通过文章进行搜索的方法进行进一步说明。
图4为本申请实施例所提供的另一种通过文章进行搜索的方法的流程示意图。
如图4所示,该通过文章进行搜索的方法,包括以下步骤:
步骤401,获取文章中的关键词。
在本申请实施例中,可以在根据用户对文章的点击操作,获取到文章的具体内容之后,对文章进行分词处理,并将文章中的各个分词逐一与预设的关键词库中的关键词进行匹配。若文章中的分词与预设的关键词匹配,则可以确定该分词为文章中的关键词,以获取文章中的所有关键词。
在本申请实施例一种可能的实现形式中,可以首先通过机器学习的方式,分别计算出文章中各分词的词向量,以及关键词库中各关键词的词向量,进而根据文章中各分词的词向量与关键词库中各关键词的词向量的余弦相似度,确定,文章中各分词分别与关键词库中各关键词匹配度。若文章中的分词与关键词库中的一个或多个关键词的匹配度大于等于预设的阈值,则可以确定该分词与关键词库中的一个或多个关键词匹配,即该分词为文章中的关键词。
实际使用时,文章中分词与关键词库中关键词的匹配度阈值,可以根据实际预设,本申请实施例对此不做限定。比如,可以是0.9。
需要说明的是,预设的关键词库可以通过人工挖掘的方式建立关键词库,其中,关键词库中包括关键词以及与各关键词对应的搜索引导语以及搜索结果链接。在对关键词库的使用过程中,可以将文章中出现频率较高的分词加入关键词库,并为匹配合适的搜索引导语以及搜索结果链接。
步骤402,获取所述关键词的出现频率。
步骤403,根据所述出现频率对所述关键词进行排序。
在本申请实施例中,确定出文章中的关键词之后,可以统计各关键词在文章中的出现频率,并对各关键词在文章中的出现频率进行排序,确定出出现频率最高的一个或多个关键词。
需要说明的是,确定的关键词的个数可以根据需要预设,本申请实施例对此不做限定。比如,可以确定出现频率最高的前5个关键词。
步骤404,根据排序结果生成所述搜索引导语和所述搜索结果链接。
在本申请实施例中,可以根据对关键词在文章中的出现频率的排序结果,确定出预设个数的关键词,并将确定出的出现频率最高的各关键词对应的搜索引导语以及搜索结果链接插入文章中,并在用户的阅读页面中显示搜索引导语。
进一步的,为使确定的搜索引导语以及搜索结果链接,可以更加符合用户的兴趣点,进一步改善用户体验,以及提高搜索引导语的点击率,还可以根据阅读文章的用户的用户模型,确定搜索引导语以及搜索结果链接。即在本申请实施例一种可能的实现形式中,还可以通过一下方式确定文章中的搜索引导语以及搜索结果链接:
获取用户的用户模型;
根据所述用户模型获取所述用户的兴趣点;
获取所述文章中的关键词;
根据所述用户的兴趣点和所述关键词生成所述搜索引导语和所述搜索结果链接。
可以理解的是,用户模型可以描绘出用户的性别、年龄、星座等作为一个自然人最基本的属性,以及人生阶段、资产状况、所在行业、教育水平等用户在社会活动中的基本属性,因此,根据用户模型可以确定出用户的兴趣点,并根据用户的兴趣点进行精准推荐。在本申请实施例中,可以根据阅读文章的用户标识获取用户的用户模型,进而根据用户模型确定出用户的兴趣点。
举例来说,根据用户模型,确定出用户为年轻女性,收入中等,对美妆类资讯的点击量较高,则可以确定该用户的兴趣点为“美妆”。
在本申请实施例一种可能的实现形式中,可以根据文章中的关键词以及用户的兴趣点共同确定文章中的搜索引导语以及搜索结果链接。在通过对文章进行分词,并根据文章中各分词与关键词库中各关键词的匹配度,确定出文章中的关键词之后,可以根据确定出的用户的兴趣点与文章中的关键词的匹配度,确定出与用户的兴趣点相符的关键词,进而将与用户的兴趣点相符的关键词对应的搜索引导语以及搜索结果链接,确定为文章中的搜索引导语与搜索结果链接,并插入文章中,进而在用户的阅读页面中显示搜索引导语。
步骤405,接收用户对所述搜索引导语的触发指令,并根据所述搜索结果链接跳转至搜索结果页面。
上述步骤405的具体实现过程及原理,可以参照上述实施例的详细描述,此处不再赘述。
本申请实施例提供的通过文章进行搜索的方法,可以获取文章中的关键词以及关键词的出现频率,并根据出现频率对关键词进行排序,之后根据排序结果生成搜索引导语和搜索结果链接,进而接收用户对搜索引导语的触发指令,并根据搜索结果链接跳转至搜索结果页面。由此,通过根据文章中的关键词的出现频率以及用户的用户模型,生成与文章内容相关并且符合用户兴趣点的搜索引导语和搜索结果链接,从而不仅实现了精准投放用户感兴趣的推荐信息,进一步改善了用户体验,而且提高了用户对推荐信息的点击率,提高了平台的经济收益。
为了实现上述实施例,本申请还提出一种通过文章进行搜索的装置。
图5为本申请实施例提供的一种通过文章进行搜索的装置的结构示意图。
如图5所示,该通过文章进行搜索的装置50,包括:
获取模块51,用于获取文章,其中,所述文章中包括搜索引导语,且所述搜索引导语与所述搜索引导语相对于的搜索结果链接对应;
接收模块52,用于接收用户对所述搜索引导语的触发指令,并根据所述搜索结果链接跳转至搜索结果页面。
在实际使用时,本申请实施例提供的通过文章进行搜索的装置,可以被配置在任意电子设备中,以执行前述通过文章进行搜索的方法。
本申请实施例提供的通过文章进行搜索的装置,可以获取文章,其中,文章中包括搜索引导语,且搜索引导语与搜索引导语相对于的搜索结果链接对应,进而接收用户对搜索引导语的触发指令,并根据搜索结果链接跳转至搜索结果页面。由此,通过在文章中插入搜索引导语以及与搜索引导语对应的搜索结果链接,并在用户点击搜索引导语时,跳转至相应的搜索结果页面,从而实现了在用户浏览信息的同时,可以对感兴趣的内容进行搜索,不仅可以主动引导用户进行搜索以获取流量,而且可以主动满足用户更深层次的探索需求,改善了用户体验。
在本申请一种可能的实现形式中,上述通过文章进行搜索的装置50,还包括:
第一校验模块,用于对所述文章的内容进行校验,如果所述文章的内容通过校验,则进一步获取所述文章中的搜索引导语和所述搜索结果链接;
第二校验模块,用于对所述文章中的搜索引导语和所述搜索结果链接进行校验;
发布模块,用于如果所述文章中的搜索引导语和所述搜索结果链接通过校验,则对所述文章进行发布;
拒绝模块,用于如果所述文章的内容未通过校验,或所述文章中的搜索引导语和所述搜索结果链接未通过校验,则拒绝所述文章发布。
进一步的,在本申请另一种可能的实现形式中,上述搜索引导语和所述搜索结果链接通过以下方式获得:
获取所述文章中的关键词;
获取所述关键词的出现频率;
根据所述出现频率对所述关键词进行排序;以及
根据排序结果生成所述搜索引导语和所述搜索结果链接。
进一步的,在本申请再一种可能的实现形式中,上述搜索引导语和所述搜索结果链接通过以下方式获得:
获取用户的用户模型;
根据所述用户模型获取所述用户的兴趣点;
获取所述文章中的关键词;
根据所述用户的兴趣点和所述关键词生成所述搜索引导语和所述搜索结果链接。
进一步的,在本申请又一种可能的实现形式中,上述通过文章进行搜索的装置50,还包括:
更新模块,用于根据所述用户对所述搜索引导语的历史触发记录对所述用户模型进行更新。
需要说明的是,前述对图1、图4所示的通过文章进行搜索的方法实施例的解释说明也适用于该实施例的通过文章进行搜索的装置50,此处不再赘述。
本申请实施例提供的通过文章进行搜索的装置,可以获取文章中的关键词以及关键词的出现频率,并根据出现频率对关键词进行排序,之后根据排序结果生成搜索引导语和搜索结果链接,进而接收用户对搜索引导语的触发指令,并根据搜索结果链接跳转至搜索结果页面。由此,通过根据文章中的关键词的出现频率以及用户的用户模型,生成与文章内容相关并且符合用户兴趣点的搜索引导语和搜索结果链接,从而不仅实现了精准投放用户感兴趣的推荐信息,进一步改善了用户体验,而且提高了用户对推荐信息的点击率,提高了平台的经济收益。
为了实现上述实施例,本申请还提出一种电子设备。
图6为本发明一个实施例的电子设备的结构示意图。
如图6所示,上述电子设备200包括:
存储器210及处理器220,连接不同组件(包括存储器210和处理器220)的总线230,存储器210存储有计算机程序,当处理器220执行所述程序时实现本申请实施例所述的通过文章进行搜索的方法。
总线230表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
电子设备200典型地包括多种电子设备可读介质。这些介质可以是任何能够被电子设备200访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储器210还可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)240和/或高速缓存存储器250。电子设备200可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统260可以用于读写不可移动的、非易失性磁介质(图6未显示,通常称为“硬盘驱动器”)。尽管图6中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线230相连。存储器210可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本申请各实施例的功能。
具有一组(至少一个)程序模块270的程序/实用工具280,可以存储在例如存储器210中,这样的程序模块270包括——但不限于——操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块270通常执行本申请所描述的实施例中的功能和/或方法。
电子设备200也可以与一个或多个外部设备290(例如键盘、指向设备、显示器291等)通信,还可与一个或者多个使得用户能与该电子设备200交互的设备通信,和/或与使得该电子设备200能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口292进行。并且,电子设备200还可以通过网络适配器293与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器293通过总线230与电子设备200的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备200使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理器220通过运行存储在存储器210中的程序,从而执行各种功能应用以及数据处理。
需要说明的是,本实施例的电子设备的实施过程和技术原理参见前述对本申请实施例的通过文章进行搜索的方法的解释说明,此处不再赘述。
本申请实施例提供的电子设备,可以执行如前所述的通过文章进行搜索的方法,可以获取文章,其中,文章中包括搜索引导语,且搜索引导语与搜索引导语相对于的搜索结果链接对应,进而接收用户对搜索引导语的触发指令,并根据搜索结果链接跳转至搜索结果页面。由此,通过在文章中插入搜索引导语以及与搜索引导语对应的搜索结果链接,并在用户点击搜索引导语时,跳转至相应的搜索结果页面,从而实现了在用户浏览信息的同时,可以对感兴趣的内容进行搜索,不仅可以主动引导用户进行搜索以获取流量,而且可以主动满足用户更深层次的探索需求,改善了用户体验。
为了实现上述实施例,本申请还提出一种计算机可读存储介质。
其中,该计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时,以实现本申请实施例所述的通过文章进行搜索的方法。
为了实现上述实施例,本申请再一方面实施例提供一种计算机程序,该程序被处理器执行时,以实现本申请实施例所述的通过文章进行搜索的方法。
一种可选实现形式中,本实施例可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户电子设备上执行、部分地在用户电子设备上执行、作为一个独立的软件包执行、部分在用户电子设备上部分在远程电子设备上执行、或者完全在远程电子设备或服务器上执行。在涉及远程电子设备的情形中,远程电子设备可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户电子设备,或者,可以连接到外部电子设备(例如利用因特网服务提供商来通过因特网连接)。
本领域技术人员在考虑说明书及实践这里申请的发明后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未发明的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由权利要求指出。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制。
Claims (10)
1.一种通过文章进行搜索的方法,其特征在于,包括:
获取文章,其中,所述文章中包括搜索引导语,且所述搜索引导语与所述搜索引导语相对于的搜索结果链接对应;以及
接收用户对所述搜索引导语的触发指令,并根据所述搜索结果链接跳转至搜索结果页面。
2.如权利要求1所述的通过文章进行搜索的方法,其特征在于,在所述获取文章之前,还包括:
对所述文章的内容进行校验,如果所述文章的内容通过校验,则进一步获取所述文章中的搜索引导语和所述搜索结果链接;
对所述文章中的搜索引导语和所述搜索结果链接进行校验;
如果所述文章中的搜索引导语和所述搜索结果链接通过校验,则对所述文章进行发布;
如果所述文章的内容未通过校验,或所述文章中的搜索引导语和所述搜索结果链接未通过校验,则拒绝所述文章发布。
3.如权利要求1所述的通过文章进行搜索的方法,其特征在于,所述搜索引导语和所述搜索结果链接通过以下方式获得:
获取所述文章中的关键词;
获取所述关键词的出现频率;
根据所述出现频率对所述关键词进行排序;以及
根据排序结果生成所述搜索引导语和所述搜索结果链接。
4.如权利要求1所述的通过文章进行搜索的方法,其特征在于,所述搜索引导语和所述搜索结果链接通过以下方式获得:
获取用户的用户模型;
根据所述用户模型获取所述用户的兴趣点;
获取所述文章中的关键词;
根据所述用户的兴趣点和所述关键词生成所述搜索引导语和所述搜索结果链接。
5.如权利要求4所述的通过文章进行搜索的方法,其特征在于,还包括:
根据所述用户对所述搜索引导语的历史触发记录对所述用户模型进行更新。
6.一种通过文章进行搜索的装置,其特征在于,包括:
获取模块,用于获取文章,其中,所述文章中包括搜索引导语,且所述搜索引导语与所述搜索引导语相对于的搜索结果链接对应;以及
接收模块,用于接收用户对所述搜索引导语的触发指令,并根据所述搜索结果链接跳转至搜索结果页面。
7.如权利要求6所述的通过文章进行搜索的装置,其特征在于,还包括:
第一校验模块,用于对所述文章的内容进行校验,如果所述文章的内容通过校验,则进一步获取所述文章中的搜索引导语和所述搜索结果链接;
第二校验模块,用于对所述文章中的搜索引导语和所述搜索结果链接进行校验;
发布模块,用于如果所述文章中的搜索引导语和所述搜索结果链接通过校验,则对所述文章进行发布;
拒绝模块,用于如果所述文章的内容未通过校验,或所述文章中的搜索引导语和所述搜索结果链接未通过校验,则拒绝所述文章发布。
8.如权利要求6所述的通过文章进行搜索的装置,其特征在于,所述搜索引导语和所述搜索结果链接通过以下方式获得:
获取所述文章中的关键词;
获取所述关键词的出现频率;
根据所述出现频率对所述关键词进行排序;以及
根据排序结果生成所述搜索引导语和所述搜索结果链接。
9.一种电子设备,其特征在于,包括:存储器、处理器及存储在存储器上并可在处理器上运行的程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-5中任一所述的通过文章进行搜索的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-5中任一所述的通过文章进行搜索的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811393277.XA CN109582846A (zh) | 2018-11-21 | 2018-11-21 | 通过文章进行搜索的方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811393277.XA CN109582846A (zh) | 2018-11-21 | 2018-11-21 | 通过文章进行搜索的方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109582846A true CN109582846A (zh) | 2019-04-05 |
Family
ID=65923700
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811393277.XA Pending CN109582846A (zh) | 2018-11-21 | 2018-11-21 | 通过文章进行搜索的方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109582846A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113420131A (zh) * | 2021-06-11 | 2021-09-21 | 洪恩完美(北京)教育科技发展有限公司 | 儿童绘本的阅读引导方法、设备及存储介质 |
CN115271822A (zh) * | 2022-08-11 | 2022-11-01 | 北京创新乐知网络技术有限公司 | 一种推广信息投放方法及装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103955465A (zh) * | 2014-03-28 | 2014-07-30 | 百度在线网络技术(北京)有限公司 | 一种用于生成推荐页面的方法和装置 |
CN104951435A (zh) * | 2015-07-28 | 2015-09-30 | 陈包容 | 聊天过程中智能显示关键词的方法及装置 |
CN105574142A (zh) * | 2015-12-15 | 2016-05-11 | 北京奇虎科技有限公司 | 一种向用户推荐内容的方法及系统 |
CN106156259A (zh) * | 2015-04-28 | 2016-11-23 | 天脉聚源(北京)科技有限公司 | 一种用户行为信息展示方法及系统 |
CN106528861A (zh) * | 2016-11-30 | 2017-03-22 | 福建中金在线信息科技有限公司 | 一种添加内链的方法及装置 |
CN107424018A (zh) * | 2017-08-14 | 2017-12-01 | 安徽简道科技有限公司 | 基于标签的互联网广告发布方法 |
-
2018
- 2018-11-21 CN CN201811393277.XA patent/CN109582846A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103955465A (zh) * | 2014-03-28 | 2014-07-30 | 百度在线网络技术(北京)有限公司 | 一种用于生成推荐页面的方法和装置 |
CN106156259A (zh) * | 2015-04-28 | 2016-11-23 | 天脉聚源(北京)科技有限公司 | 一种用户行为信息展示方法及系统 |
CN104951435A (zh) * | 2015-07-28 | 2015-09-30 | 陈包容 | 聊天过程中智能显示关键词的方法及装置 |
CN105574142A (zh) * | 2015-12-15 | 2016-05-11 | 北京奇虎科技有限公司 | 一种向用户推荐内容的方法及系统 |
CN106528861A (zh) * | 2016-11-30 | 2017-03-22 | 福建中金在线信息科技有限公司 | 一种添加内链的方法及装置 |
CN107424018A (zh) * | 2017-08-14 | 2017-12-01 | 安徽简道科技有限公司 | 基于标签的互联网广告发布方法 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113420131A (zh) * | 2021-06-11 | 2021-09-21 | 洪恩完美(北京)教育科技发展有限公司 | 儿童绘本的阅读引导方法、设备及存储介质 |
CN115271822A (zh) * | 2022-08-11 | 2022-11-01 | 北京创新乐知网络技术有限公司 | 一种推广信息投放方法及装置 |
CN115271822B (zh) * | 2022-08-11 | 2023-08-11 | 北京创新乐知网络技术有限公司 | 一种推广信息投放方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20180181573A1 (en) | Search method and device for asking type query based on deep question and answer | |
CN108170859A (zh) | 语音查询的方法、装置、存储介质及终端设备 | |
CN101894134B (zh) | 一种基于空间布局的钓鱼网页检测及其实现方法 | |
KR101723862B1 (ko) | 텍스트를 포함하는 문서 분류 및 분석 방법 및 이를 수행하는 문서 분류 및 분석 장치 | |
US20140172415A1 (en) | Apparatus, system, and method of providing sentiment analysis result based on text | |
CN109325201A (zh) | 实体关系数据的生成方法、装置、设备及存储介质 | |
CN104536980A (zh) | 一种确定候评项的质量信息的方法与装置 | |
CN109360550A (zh) | 语音交互系统的测试方法、装置、设备和存储介质 | |
CN108346075A (zh) | 信息推荐方法和装置 | |
CN107491436A (zh) | 一种标题党识别方法和装置、服务器、存储介质 | |
CN112860841A (zh) | 一种文本情感分析方法、装置、设备及存储介质 | |
CN110414004A (zh) | 一种核心信息提取的方法和系统 | |
CN109213859A (zh) | 一种文本检测方法、装置及系统 | |
CN109582788A (zh) | 垃圾评论训练、识别方法、装置、设备及可读存储介质 | |
CN109241319A (zh) | 一种图片检索方法、装置、服务器和存储介质 | |
CN110489649B (zh) | 标签关联内容的方法及装置 | |
KR102135074B1 (ko) | 인공지능 기반의 팩트 체크 가이드라인을 이용한 가짜 뉴스 판별 시스템 | |
CN110362662A (zh) | 数据处理方法、装置以及计算机可读存储介质 | |
CN111369294B (zh) | 软件造价估算方法及装置 | |
CN108268602A (zh) | 分析文本话题点的方法、装置、设备和计算机存储介质 | |
CN114357204B (zh) | 媒体信息的处理方法及相关设备 | |
CN111931073A (zh) | 内容推送方法、装置、电子设备及计算机可读介质 | |
CN109582846A (zh) | 通过文章进行搜索的方法、装置、电子设备及存储介质 | |
CN111753052A (zh) | 提供针对知识意图问题的知识性回答 | |
KR102206781B1 (ko) | 지식 기반 추론 및 신뢰도 분석을 이용한 가짜뉴스 판별 방법, 이를 수행하기 위한 기록매체 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190405 |
|
RJ01 | Rejection of invention patent application after publication |