CN107273476A - 一种文章搜索方法、装置及服务器 - Google Patents

一种文章搜索方法、装置及服务器 Download PDF

Info

Publication number
CN107273476A
CN107273476A CN201710431415.8A CN201710431415A CN107273476A CN 107273476 A CN107273476 A CN 107273476A CN 201710431415 A CN201710431415 A CN 201710431415A CN 107273476 A CN107273476 A CN 107273476A
Authority
CN
China
Prior art keywords
article
search
listing
preset number
resource database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710431415.8A
Other languages
English (en)
Inventor
潘岸腾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Youshi Network Technology Co Ltd
Original Assignee
Guangzhou Youshi Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Youshi Network Technology Co Ltd filed Critical Guangzhou Youshi Network Technology Co Ltd
Priority to CN201710431415.8A priority Critical patent/CN107273476A/zh
Publication of CN107273476A publication Critical patent/CN107273476A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3347Query execution using vector based model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供一种文章搜索方法、装置及服务器,属于互联网技术领域。该文章搜索方法具体包括:计算输入的搜索词与资源数据库中每篇文章的相似度,以及根据预先统计的所述资源数据库中每篇文章的用户数据,计算每篇文章的质量指标,然后基于得到的所述相似度和文章的质量指标生成对应该搜索词的第一搜索列表。这种综合考虑了搜索词与文章的相似度以及文章的质量指标的文章搜索方法,其搜索出的结果可以明显提升用户的阅读体验,用户可以从搜索结果中得到自己想要阅读或者喜欢阅读的并且有质量保障的文章。

Description

一种文章搜索方法、装置及服务器
技术领域
本发明涉及互联网技术领域,具体而言,涉及一种文章搜索方法、装置及服务器。
背景技术
随着科学技术的不断发展,电子技术也得到了飞速发展。人们可以通过例如智能手机、平板电脑等电子设备下载安装各种资讯类应用(如UC头条、腾讯新闻、网易新闻等)以浏览文章资讯。现有技术中,用户可以在应用界面上通过输入搜索词来获取想要浏览的文章资讯,但是存在的问题是,展示出的搜索结果给用户的体验不佳,经常会出现没有用户想要的文章资讯或者搜索出的文章资讯质量欠佳,不能很好的满足用户的浏览需求。
发明内容
有鉴于此,本发明的目的在于提供一种文章搜索方法、装置及服务器,以改善上述问题。
本发明较佳实施例提供一种文章搜索方法,该方法包括:计算输入的搜索词与资源数据库中每篇文章的相似度;根据预先统计的所述资源数据库中每篇文章的用户数据,计算每篇文章的质量指标;根据计算得到的所述相似度和所述质量指标,生成与所述搜索词对应的包括所述资源数据库中至少一篇文章的第一搜索列表。
本发明另一较佳实施例提供一种文章搜索装置,该装置包括:相似度计算模块,用于计算输入的搜索词与资源数据库中每篇文章的相似度;质量指标计算模块,用于根据预先统计的所述资源数据库中每篇文章的用户数据,计算每篇文章的质量指标;第一搜索列表生成模块,用于根据计算得到的所述相似度和所述质量指标,生成与所述搜索词对应的包括所述资源数据库中至少一篇文章的第一搜索列表。
本发明另一较佳实施例提供一种服务器,所述服务器包括:存储器;处理器;文章搜索装置,该文章搜索装置安装于所述存储器中并包括一个或多个由所述处理器执行的软件功能模块,该文章搜索装置包括:相似度计算模块,用于计算输入的搜索词与资源数据库中每篇文章的相似度;质量指标计算模块,用于根据预先统计的所述资源数据库中每篇文章的用户数据,计算每篇文章的质量指标;第一搜索列表生成模块,用于根据计算得到的所述相似度和所述质量指标,生成与所述搜索词对应的包括所述资源数据库中至少一篇文章的第一搜索列表。
本发明实施例提供的文章搜索方法、装置及服务器,计算输入的搜索词与资源数据库中每篇文章的相似度,以及根据预先统计的所述资源数据库中每篇文章的用户数据,计算每篇文章的质量指标,然后基于得到的所述相似度和文章的质量指标生成对应该搜索词的第一搜索列表。这种综合考虑了搜索词与文章的相似度以及文章的质量指标的文章搜索方法,其搜索出的结果可以明显提升用户的阅读体验,用户可以从搜索结果中得到自己想要阅读或者喜欢阅读的并且有质量保障的文章。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明实施例提供的服务器与至少一个电子设备进行通信的交互示意图;
图2为本发明实施例提供的所述服务器的方框示意图;
图3为本发明实施例提供的一种文章搜索方法的流程图;
图4为本发明实施例提供的另一种文章搜索方法的流程图;
图5为本发明实施例提供的一种文章搜索装置的功能模块示意图。
图标:100-服务器;200-电子设备;文章搜索装置-110;120-存储器;130-处理器;140-通信单元;150-资源数据库;1102-相似度计算模块;1104-质量指标计算模块;1106-第一搜索列表生成模块;1108-搜索结果列表获取模块;1110-用户行为反馈指标计算模块;1112-第二搜索列表生成模块;1114-搜索结果列表生成模块。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,是本发明实施例提供的服务器100与至少一个电子设备200进行通信的交互示意图。所述电子设备200可通过网络与服务器100建立通信连接,以进行数据传输或交互。所述服务器100可以提供至少一个适用于各种操作系统的应用(Application,APP)的安装包供所述电子设备200下载。所述电子设备200可通过所述网络访问所述服务器100以下载适用于该电子设备200的操作系统的应用的安装包,并将所述应用安装到所述电子设备200中。
本实施例中,所述应用可以是资讯类应用,如UC头条、腾讯新闻、新浪新闻、今日头条等。当安装于所述电子设备200上的资讯类应用在前台打开时,用户可以在打开的界面上浏览例如文章的信息资讯,或者在界面上通过输入搜索词搜索自身想要浏览的例如文章的信息资讯。
本实施例中,所述服务器100可以是,但不限于,网络服务器、文件传输协议服务器等。所述电子设备200可以是,但不限于,个人电脑、平板电脑、智能手机、个人数字助理、移动上网设备等。所述网络可以是,但不限于,有线网络或无线网络。所述电子设备200的操作系统可以是,但不限于,安卓(Android)系统、IOS系统、Windows phone系统等。
请参阅图2,是本发明实施例提供的所述服务器100的方框示意图。所述服务器100包括文章搜索装置110、存储器120、处理器130、通信单元140以及资源数据库150。
所述存储器120、处理器130以及通信单元140之间直接或间接的电性连接,以实现数据的传输或交互。所述文章搜索装置110包括至少一个可以软件或固件的形式存储于所述存储器120中或固化在所述服务器100的操作系统中的软件功能模块。所述处理器130用于执行所述存储器120中存储的可执行模块,例如所述文章搜索装置110所包括的软件功能模块及计算机程序等。
所述通信单元140用于通过所述网络建立所述服务器100与电子设备200之间的通信连接,并用于通过所述网络收发数据。
所述资源数据库150中用于存储各种文章资讯,其可以存储于所述存储器120中,以供所述处理器130在执行例如所述文章搜索装置110所包括的软件功能模块时访问。
请参阅图3,是本发明实施例提供的一种文章搜索方法的流程图。本实施例中的方法适用于所述服务器100。所应说明的是,本方法不以图3及下述的具体顺序为限制。下面将对图3所示的各步骤进行详细阐述。
步骤S101,计算输入的搜索词与资源数据库中每篇文章的相似度。
本实施例中,作为一种实施方式,当所述资讯类应用在电子设备200的前台打开时,用户可以在应用界面上的搜索框内输入搜索词,然后通过电子设备200将所述搜索词发送到服务器100,以使服务器100根据接收到的搜索词在所述资源数据库中进行文章搜索。
下面以所述资源数据库中的一篇文章为例,示例性地阐述所述服务器100计算所述搜索词与该篇文章的相似度的实现过程。可以理解,计算所述相似度的方式可以不限制于此。
首先,采用分词算法对该篇文章及所述搜索词进行处理得到分词结果。所述分词算法包括但不限于,最大匹配法、最优匹配法、机械匹配法、逆向匹配法及双向匹配法等。在本实施例中,在进行分词处理时可以对分词结果进行过滤以保留能反映文本内容的分词。具体地,将分词结果中的标点符号(如:句号、顿号及逗号等)和不表达实质内容的分词(如:“无需”、“没有”、“的”及“又”等连接词)过滤掉。
其次,计算出每个分词在所述文章、所述搜索词中出现的词频(term frequency)。所述词频(term frequency)用于表示分词在其对应文本信息中出现的频率。本实施例中,可以采用以下计算式计算每个分词在该篇文章中的词频:
其中,ni表示分词ti在该篇文章中出现的次数,∑knk表示在该篇文章中所有分词出现的次数之和,tfi表示分词ti在该篇文章中出现的频率。
同理,本实施例中,可以采用以下计算式计算每个分词在所述搜索词中的词频:
其中,n′i表示分词ti在所述搜索词中出现的次数,∑kn′k表示在所述搜索词中所有分词出现的次数之和,tf′i表示分词ti在所述搜索词中出现的频率。
再次,根据所述资源数据库中的所有文章,计算每个分词的逆文档频率(inversedocument frequency)。所述逆文档频率用于表征一个分词的重要程度。若某一分词在所有文章中都存在,那么这个分词的重要程度就低。以J表示所述资源数据库中所有文章的集合,isContaini,j表示分词ti是否在文章j中出现,若等于1则表示出现了,若等于0则表示没有出现,idfi表示分词ti的逆文档频率,具体计算公式可以为:
然后,根据每个分词的逆文档频率和在该篇文章中的词频,计算每个分词在该篇文章中的tf-idf(term frequency-inverse document frequency)值。具体地,计算分词ti在该篇文章中的tf-idf值的方式可以是:
tf-idfi=tfi×idfi
其中,idfi表示分词ti的逆文档频率,tfi表示分词ti在该篇文章中出现的频率,tf-idfi表示分词ti在该篇文章中的tf-idf值。
以及,根据每个分词的逆文档频率和在所述搜索词中的词频,计算每个分词在所述搜索词中的tf-idf值。具体地,计算分词ti在该搜索词中的tf-idf值的方式可以是:
tf-idf′i=tf′i×idfi
其中,idfi表示分词ti的逆文档频率,tf′i表示分词ti在所述搜索词中出现的频率,tf-idf′i表示分词ti在所述搜索词中的tf-idf值。
最后,按照上述方法计算出每个分词在该篇文章中的tf-idf值后,得到该篇文章的tf-idf向量:
tdf=(tf-idf1,tf-idf2,...,tf-idfi,...)
其中,tdf表示该篇文章的tf-idf向量。
以及,按照上述方法计算所述出每个分词在所述搜索词中的tf-idf值后,得到该搜索词的tf-idf向量:
tdf′=(tf-idf′1,tf-idf′2,...,tf-idf′i,...)
其中,tdf′表示该篇文章的tf-idf向量。
再根据向量tdf和tdf′计算所述搜索词与该篇文章的相似度,具体计算式可以是:
sim=cos<tdf,tdf′>
即,通过所述搜索词与该篇文章的tf-idf向量的余弦值表示所述相似度。
按照上述示例中所述的方法可以计算出输入的搜索词与资源数据库中每篇文章的相似度。
步骤S103,根据预先统计的所述资源数据库中每篇文章的用户数据,计算每篇文章的质量指标。
本实施例中,所述用户数据可以包括,但不限于,文章被点赞的次数、被评论的次数、被分享的次数以及被收藏的次数。每篇文章的所述用户数据可以通过预先统计得到。
作为一种实施方式,计算每篇文章的质量指标的方式可以是:
根据计算式:计算每篇文章的质量指标,其中,Nsum表示该篇文章被浏览的总次数,Np表示该篇文章被点赞的次数,Nr表示该篇文章被评论的次数,Ns表示该篇文章被分享的次数,Nc表示该篇文章被收藏的次数。以上仅仅是所述文章质量指标的一种计算方式,在其它实施例方式中,还可以加入用于反应用户对所述文章的其它用户数据来计算所述质量指标。
步骤S105,根据计算得到的所述相似度和所述质量指标,生成与所述搜索词对应的包括所述资源数据库中至少一篇文章的第一搜索列表。
作为一种实施方式,生成所述第一搜索列表的过程可以是:先根据计算出的所述相似度对资源数据库150中的文章进行排序,例如按照相似度的降序进行排序,得到候选搜索列表;再将所述候选搜索列表中的文章按序分为多组,每组包括第一预设数目篇文章;然后,分别计算每组中所述第一预设数目篇文章的质量指标,并根据计算出的质量指标对该第一预设数目篇文章进行排序,例如按照质量指标进行降序排列;最后,将每组的第一预设数目篇文章中质量指标最大的第二预设数目篇文章加入预先初始化的一空列表中,得到所述第一搜索列表。
本实施方式中,所述第一预设数目可以为一预设的固定数值或为一预设的数值区间内的任意值。例如,该第一预设数目可以是预设的固定数值25,或者可以是预设的数值区间[10,30]内的任意值。也就是说,上述将候选搜索列表中的文章按序分为多组时,每组包括的文章数目可以相同(例如都是25篇),也可以不同(例如各组的文章数目在10~30之间变化)。作为一种优选,通常将所述第一预设数目设定为一固定值,分组时最后一组的文章数目可以不足于第一预设数目。所述第二预设数目与所述第一预设数目之比可以为预定比例,如0.6~0.8之间任意比例。
下面给出一具体示例,以更好的阐述本实施例中生成所述第一搜索列表的过程,但可以是理解的是,该示例仅是示意性的。本示例中设定所述第一预设数目为固定数值15,设定所述第二预设数目为12,即,两者比值为0.8。
步骤S1,对所述资源数据库中的所有文章,应用步骤S101中所述的方式计算出输入的搜索词与每篇文章的相似度。提取对应相似度大于预设值(如大于0)的所有文章,然后按照相似度进行降序排列,得到候选搜索列表。
步骤S2,从所述候选搜索列表中取出排在前面的第一预设数目篇文章,计算该第一预设数目篇文章的质量指标,然后按照计算出的质量指标的重新降序排列,最后截取质量指标排在前面的第二预设数目篇文章添加进预先初始化的一目标列表中。该目标列表初始时为空列表。
步骤S3,判断所述候选搜索列表是否为空,如果不为空,则返回步骤S2,若此时候选搜索列表中剩余文章数目小于所述第一预设数目,可以默认继续执行,并适应性的按照所述预定比例(本示例中为0.8)改变所述第二预设数目的值;如果所述候选搜索列表为空,则将当前的所述目标列表作为所述第一搜索列表。
本示例中,作为一种实施方式,每次将文章添加进所述目标列表时,可以按照在所述目标列表中从后至前的顺序依次添加。
另外除了上述生成第一搜索列表的方式外,在其他实施例中,也可以根据针对所述相似度和质量指标预设权重参数,然后计算资源数据库中每篇文章的综合指标,最后取综合指标排名靠前的预设篇文章构成所述第一搜索列表。
本实施例中得到的所述第一搜索列表可以直接作为所述搜索词本次被搜索的搜索结果列表返回到所述电子设备200,以通过所述电子设备200展示给用户。用户可以在该搜索结果列表中选择自己想要阅读或者感兴趣的文章,由于本次搜索结果综合考虑了文章的质量指标和与搜索词的相似度,所以可以较好的提升用户的阅读体验。
请参阅图4,是本发明实施例提供的另一文章搜索方法的流程图。如图4所示,本实施例的方法中包括如下步骤:
步骤S201,计算输入的搜索词与资源数据库中每篇文章的相似度。
步骤S203,根据预先统计的所述资源数据库中每篇文章的用户数据,计算每篇文章的质量指标。
步骤S205,根据计算得到的所述相似度和所述质量指标,生成与所述搜索词对应的包括所述资源数据库中至少一篇文章的第一搜索列表。
本实施例中的步骤S201~步骤S205的具体实现方式可以参照图3所示实施例中对步骤S101~步骤S105的详细阐述,在此不再赘述。
步骤S207,获取该搜索词之前每次被搜索时得到的搜索结果列表。
本实施例中,若该搜索词之前被其他用户搜索过,则获取之前其他用户搜索时所获得的搜索结果列表。
可以理解,若该搜索词被频繁搜索导致本次搜索之前的搜索结果列表的数目较为庞大,则可以选择性的获取之前一部分其他用户搜索时所获得的搜索结果列表。
步骤S209,根据得到的各个所述搜索结果列表,计算所述资源数据库中每篇文章对应的用户行为反馈指标。
本实施例中,作为一种实施方式,所述用户行为反馈指标可以根据针对资源数据库中的每篇文章预先统计得到的用户满意率、用户点击率及用户跳过率计算得到。
更为具体地,可以根据计算式计算所述资源数据库中每篇文章的用户跳过率,其中,Numdis表示该篇文章在各个所述搜索结果列表中被展示的总次数,Numi表示展示于各个搜索结果列表中的该篇文章之后的其他文章被点击且同时该篇文章未被点击的总次数;可以根据计算式计算所述资源数据库中每篇文章的用户点击率,其中,Numc表示展示于各个搜索结果列表中的该篇文章被点击的总次数;以及,可以根据计算式计算所述资源数据库中每篇文章的用户满意率,其中,Nums表示展示于各个搜索结果列表中的该篇文章被点击并进入文章内容后,未返回所述搜索结果列表的总次数,或者是预设时间内未返回所述搜索结果列表的总次数。
然后,根据计算式f=αPs+βPc-γPi计算所述资源数据库中每篇文章的用户行为反馈指标。其中,f表示所述用户行为反馈指标,Ps表示按照上述方法预先统计得到的该篇文章的用户满意率,Pc表示按照上述方法预先统计得到的该篇文章的用户点击率,Pi表示按照上述方法预先统计得到的该篇文章的用户跳过率。α、β和γ是预设的权重参数,三者之和为1。一般来讲,α、β和γ的取值可以是相同的。
步骤S211,根据计算得到的所述用户行为反馈指标对所述资源数据库中的文章进行排序,得到第二搜索列表。
本实施例中,可以按照所述用户行为反馈指标的降序进行排序,得到所述第二搜索列表。
步骤S213,结合所述第一搜索列表和所述第二搜索列表,生成该搜索词当前的搜索结果列表。
本实施例中,通过所述第一搜索列表和第二搜索列表生成该搜索词本次被搜索的搜索结果列表可以通过以下步骤S01-S03实现。
步骤S01,初始化一目标列表,该目标列表初始为空列表。
步骤S02,向该目标列表中添加文章。
其中,向该目标列表中添加文章的步骤包括从所述第一搜索列表中按顺序(例如从前至后)获取第三预设数目篇文章加入所述目标列表中,以及从所述第二搜索列表中按顺序(例如从前至后)获取第四预设数目篇文章加入所述目标列表中。
所述第三预设数目和所述第四预设数目根据用于显示所述搜索结果列表的设备每屏能够显示的文章数目预先设定。例如,所述第三预设数目可以设定为每屏能够显示的文章数目的30%,所述第四预设数目可以设定为每屏能够显示的文章数目的70%。假设所述电子设备200每屏可显示6篇文章的标题,则所述第三预设数目可以设定为2,所述第四预设数目可以设定为4。
步骤S03,判断所述第一搜索列表和所述第二搜索列表是否为空。
若第一搜索列表、第二搜索列表都不为空,则返回上述向该目标列表中添加文章的步骤,即,步骤S02。
若第一搜索列表、第二搜索列表中出现一个为空,则将另一个非空的搜索列表中剩余的所有文章添加进上述目标列表中。
若第一搜索列表、第二搜索列表都为空,则将当前的所述目标列表作为该搜索词当前的搜索结果列表并输出。
下面给出一具体示例,以便更好的阐述本实施例中通过所述第一搜索列表和第二搜索列表生成该搜索词本次被搜索的搜索结果列表的过程。可以理解的是,本示例仅是示意性的。
步骤S001,初始化一目标列表,该目标列表初始时为空。
步骤S002,判断所述第一搜索列表中文章数目是否大于等于所述第三预设数目,若大于等于,则取该第一搜索列表中排在前面的第三预设数目篇文章添加进所述目标列表中,若小于,则将该第一搜索列表中所有文章一起添加进所述目标列表中;再判断所述第二搜索列表中文章数目是否大于等于所述第四预设数目,若大于等于,则取该第二搜索列表中排在前面的第四预设数目篇文章添加进所述目标列表中,若小于,则将该第二搜索列表中所有文章一起添加进所述目标列表中。
步骤S003,判断所述第一搜索列表和所述第二搜索列表是否都为空。若全部为空,则将所述目标列表输出作为所述搜索词本次的搜索结果列表;若其中一个为空,则将另一个非空的搜索列表中的剩余所有文章一起添加进所述目标列表中后,再将该目标列表作为所述搜索词本次的搜索结果列表输出;若两个都不为空,则返回上述步骤S002。
本示例中,从所述第一搜索列表和第二搜索列表中取出文章向所述目标列表中添加时,可以是按照在所述目标列表中从后至前的顺序依次添加。
步骤S215,将所述搜索词当前的搜索结果列表发送至所述电子设备200进行展示。
本实施例中提供的文章搜索方法,既考虑了资源数据库中的每篇文章的质量指标以及与搜索词的相似度,又考虑了每篇文章在以往的搜索结果列表中的用户行为反馈指标,通过这种综合、全面的搜索方式得到的搜索结果列表,可以提升用户的搜索体验和后续的浏览体验。
请参阅图5,是本发明实施例提供的一种文章搜索装置110的功能模块框图。所述文章搜索装置110包括相似度计算模块1102、质量指标计算模块1104、第一搜索列表生成模块1106、搜索结果列表获取模块1108、用户行为反馈指标计算模块1110、第二搜索列表生成模块1112、搜索结果列表生成模块1114。
所述相似度计算模块1102,用于计算输入的搜索词与资源数据库中每篇文章的相似度。该相似度计算模块1102可用于执行图3中所示的步骤S101和图4中所示的步骤S201,具体的操作方法可以参照上述对步骤S101的详细阐述。
所述质量指标计算模块1104,用于根据预先统计的所述资源数据库中每篇文章的用户数据,计算每篇文章的质量指标。该质量指标计算模块1104可用于执行图3中所示的步骤S103和图4中所示的步骤S203,具体的操作方法可以参照上述对步骤S103的详细阐述。
所述第一搜索列表生成模块1106,用于根据计算得到的所述相似度和所述质量指标,生成与所述搜索词对应的包括所述资源数据库中至少一篇文章的第一搜索列表。该第一搜索列表生成模块1106可用于执行图3中所示的步骤S105和图4中所示的步骤S205,具体的操作方法可以参照上述对步骤S105的详细阐述。
所述搜索结果列表获取模块1108,用于获取该搜索词之前每次被搜索时得到的搜索结果列表。该搜索结果列表获取模块1108可用于执行图4中所示的步骤S207,具体的操作方法可参照上述对步骤S207的详细阐述。
所述用户行为反馈指标计算模块1110,用于根据得到的各个所述搜索结果列表,计算所述资源数据库中每篇文章对应的用户行为反馈指标。该用户行为反馈指标计算模块1110可用于执行图4中所示的步骤S209,具体的操作方法可参照上述对步骤S209的详细阐述。
所述第二搜索列表生成模块1112,用于根据计算得到的所述用户行为反馈指标对所述资源数据库中的文章进行排序,得到第二搜索列表。该第二搜索列表生成模块1112可用于执行图4中所示的步骤S211,具体的操作方法可参照上述对步骤S211的详细阐述。
所述搜索结果列表生成模块1114,用于结合所述第一搜索列表和所述第二搜索列表,生成该搜索词当前的搜索结果列表。该搜索结果列表生成模块1114可用于执行图4中所示的步骤S213,具体的操作方法可参照上述对步骤S213的详细阐述。
以上各模块可以是由软件代码实现,此时,上述的各模块可存储于服务器的存储器内。以上各模块同样可以由硬件例如集成电路芯片实现。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本发明实施例所提供的文章搜索装置110,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器、随机存取存储器、磁碟或者光盘等各种可以存储程序代码的介质。需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (23)

1.一种文章搜索方法,其特征在于,该方法包括:
计算输入的搜索词与资源数据库中每篇文章的相似度;
根据预先统计的所述资源数据库中每篇文章的用户数据,计算每篇文章的质量指标;
根据计算得到的所述相似度和所述质量指标,生成与所述搜索词对应的包括所述资源数据库中至少一篇文章的第一搜索列表。
2.根据权利要求1所述的方法,其特征在于,所述每篇文章的用户数据包括该篇文章被点赞的次数、被评论的次数、被分享的次数以及被收藏的次数,所述计算每篇文章的质量指标的步骤,包括:
根据计算式:计算每篇文章的质量指标,其中,Nsum表示该篇文章被浏览的总次数,Np表示该篇文章被点赞的次数,Nr表示该篇文章被评论的次数,Ns表示该篇文章被分享的次数,Nc表示该篇文章被收藏的次数。
3.根据权利要求1或2所述的方法,其特征在于,所述根据计算得到的所述相似度和所述质量指标,生成与所述搜索词对应的包括所述资源数据库中至少一篇文章的第一搜索列表的步骤,包括:
初始化一空列表;
根据所述相似度对所述资源数据库中的文章进行排序,得到候选搜索列表;
将所述候选搜索列表中的文章按序分为多组,每组包括第一预设数目篇文章;
根据每组中每篇文章的质量指标,对所述第一预设数目篇文章进行排序;
将每组的第一预设数目篇文章中质量指标最大的第二预设数目篇文章加入所述空列表中,得到所述第一搜索列表。
4.根据权利要求3所述的方法,其特征在于,所述第一预设数目为一预设数值或为一预设的数值区间内的任意值,所述第二预设数目与所述第一预设数目之比为预定比例。
5.根据权利要求1所述的方法,其特征在于,在根据所述相似度及质量指标,生成对应所述搜索词的至少包含一篇所述文章的第一搜索列表的步骤之后,该方法还包括:
获取该搜索词之前每次被搜索时得到的搜索结果列表;
根据上述得到的各个所述搜索结果列表,计算所述资源数据库中每篇文章对应的用户行为反馈指标;
根据计算得到的所述用户行为反馈指标对所述资源数据库中的文章进行排序,得到第二搜索列表;
结合所述第一搜索列表和所述第二搜索列表,生成该搜索词当前的搜索结果列表。
6.根据权利要求5所述的方法,其特征在于,根据得到的各个所述搜索结果列表,计算所述资源数据库中每篇文章对应的用户行为反馈指标的步骤,包括:
根据计算式f=αPs+βPc-γPi计算所述资源数据库中每篇文章的用户行为反馈指标,其中,f表示所述用户行为反馈指标,Ps表示预先统计得到的该篇文章的用户满意率,Pc表示预先统计得到的该篇文章的用户点击率,Pi表示预先统计得到的该篇文章的用户跳过率,α、β和γ是预设的权重参数。
7.根据权利要求5所述的方法,其特征在于,所述结合所述第一搜索列表和所述第二搜索列表,生成该搜索词当前的搜索结果列表的步骤,包括:
初始化一目标列表;
向该目标列表中添加文章;其中,向该目标列表中添加文章的步骤包括从所述第一搜索列表中按顺序获取第三预设数目篇文章加入所述目标列表中,以及从所述第二搜索列表中按顺序获取第四预设数目篇文章加入所述目标列表中,所述第三预设数目和所述第四预设数目根据用于显示所述搜索结果列表的设备每屏能够显示的文章数目预先设定;
判断所述第一搜索列表和所述第二搜索列表是否为空;
若第一搜索列表、第二搜索列表都不为空,则返回上述向该目标列表中添加文章的步骤;
若第一搜索列表、第二搜索列表中出现一个为空,则将另一个非空的搜索列表中剩余的所有文章添加进上述目标列表中;
若第一搜索列表、第二搜索列表都为空,则将当前的所述目标列表作为该搜索词当前的搜索结果列表并输出。
8.根据权利要求1所述的方法,其特征在于,所述计算输入的搜索词与资源数据库中每篇文章的相似度的步骤,包括:
对所述文章及所述搜索词进行分词,并计算出每个分词在所述文章、所述搜索词中出现的词频;
根据所述资源数据库中的所有文章,计算所述每个分词的逆文档频率;
根据所述每个分词在所述文章中出现的词频以及所述每个分词的逆文档频率,计算得到该文章的第一特征向量;
根据所述每个分词在所述搜索词中出现的词频以及所述每个分词的逆文档频率,计算得到该搜索词的第二特征向量;
计算所述第一特征向量和所述第二特征向量的夹角的余弦值,该余弦值表示所述搜索词与所述文章的相似度。
9.一种文章搜索装置,其特征在于,该装置包括:
相似度计算模块,用于计算输入的搜索词与资源数据库中每篇文章的相似度;
质量指标计算模块,用于根据预先统计的所述资源数据库中每篇文章的用户数据,计算每篇文章的质量指标;
第一搜索列表生成模块,用于根据计算得到的所述相似度和所述质量指标,生成与所述搜索词对应的包括所述资源数据库中至少一篇文章的第一搜索列表。
10.根据权利要求9所述的文章搜索装置,其特征在于,所述每篇文章的用户数据包括该篇文章被点赞的次数、被评论的次数、被分享的次数以及被收藏的次数,所述质量指标计算模块计算每篇文章的质量指标的方式,包括:
根据计算式:计算每篇文章的质量指标,其中,Nsum表示该篇文章被浏览的总次数,Np表示该篇文章被点赞的次数,Nr表示该篇文章被评论的次数,Ns表示该篇文章被分享的次数,Nc表示该篇文章被收藏的次数。
11.根据权利要求9或10所述的文章搜索装置,其特征在于,所述第一搜索列表生成模块根据计算得到的所述相似度和所述质量指标,生成与所述搜索词对应的包括所述资源数据库中至少一篇文章的第一搜索列表的方式,包括:
初始化一空列表;
根据所述相似度对所述资源数据库中的文章进行排序,得到候选搜索列表;
将所述候选搜索列表中的文章按序分为多组,每组包括第一预设数目篇文章;
分别计算每组中所述第一预设数目篇文章的质量指标,并根据计算出的质量指标对该第一预设数目篇文章进行排序;
将每组的第一预设数目篇文章中质量指标最大的第二预设数目篇文章加入所述空列表中,得到所述第一搜索列表。
12.根据权利要求11所述的文章搜索装置,其特征在于,所述第一预设数目为一预设数值或为一预设的数值区间内的任意值,所述第二预设数目与所述第一预设数目之比为预定比例。
13.根据权利要求9所述的文章搜索装置,其特征在于,该装置还包括:
搜索结果列表获取模块,用于获取该搜索词之前每次被搜索时得到的搜索结果列表;
用户行为反馈指标计算模块,用于根据上述得到的各个所述搜索结果列表,计算所述资源数据库中每篇文章对应的用户行为反馈指标;
第二搜索列表生成模块,用于根据计算得到的所述用户行为反馈指标对所述资源数据库中的文章进行排序,得到第二搜索列表;
搜索结果列表生成模块,用于结合所述第一搜索列表和所述第二搜索列表,生成该搜索词当前的搜索结果列表。
14.根据权利要求13所述的文章搜索装置,其特征在于,所述用户行为反馈指标计算模块根据得到的各个所述搜索结果列表,计算所述资源数据库中每篇文章对应的用户行为反馈指标的方式,包括:
根据计算式f=αPs+βPc-γPi计算所述资源数据库中每篇文章的用户行为反馈指标,其中,f表示所述用户行为反馈指标,Ps表示预先统计得到的该篇文章的用户满意率,Pc表示预先统计得到的该篇文章的用户点击率,Pi表示预先统计得到的该篇文章的用户跳过率,α、β和γ是预设的权重参数。
15.根据权利要求13所述的文章搜索装置,其特征在于,所述搜索结果列表生成模块结合所述第一搜索列表和所述第二搜索列表,生成该搜索词当前的搜索结果列表的方式,包括:
初始化一目标列表;
向该目标列表中添加文章;其中,向该目标列表中添加文章的步骤包括从所述第一搜索列表中按顺序获取第三预设数目篇文章加入所述目标列表中,以及从所述第二搜索列表中按顺序获取第四预设数目篇文章加入所述目标列表中,所述第三预设数目和所述第四预设数目根据用于显示所述搜索结果列表的设备每屏能够显示的文章数目预先设定;
判断所述第一搜索列表和所述第二搜索列表是否为空;
若第一搜索列表、第二搜索列表都不为空,则返回上述向该目标列表中添加文章的步骤;
若第一搜索列表、第二搜索列表中出现一个为空,则将另一个非空的搜索列表中剩余的所有文章添加进上述目标列表中;
若第一搜索列表、第二搜索列表都为空,则将当前的所述目标列表作为该搜索词当前的搜索结果列表并输出。
16.根据权利要求9所述的文章搜索装置,其特征在于,所述相似度计算模块计算输入的搜索词与资源数据库中每篇文章的相似度的方式,包括:
对所述文章及所述搜索词进行分词,并计算出每个分词在所述文章、所述搜索词中出现的词频;
根据所述资源数据库中的所有文章,计算所述每个分词的逆文档频率;
根据所述每个分词在所述文章中出现的词频以及所述每个分词的逆文档频率,计算得到该文章的第一特征向量;
根据所述每个分词在所述搜索词中出现的词频以及所述每个分词的逆文档频率,计算得到该搜索词的第二特征向量;
计算所述第一特征向量和所述第二特征向量的夹角的余弦值,该余弦值表示所述搜索词与所述文章的相似度。
17.一种服务器,其特征在于,所述服务器包括:
存储器;
处理器;及
文章搜索装置,该文章搜索装置安装于所述存储器中并包括一个或多个由所述处理器执行的软件功能模块,该文章搜索装置包括:
相似度计算模块,用于计算输入的搜索词与资源数据库中每篇文章的相似度;
质量指标计算模块,用于根据预先统计的所述资源数据库中每篇文章的用户数据,计算每篇文章的质量指标;
第一搜索列表生成模块,用于根据计算得到的所述相似度和所述质量指标,生成与所述搜索词对应的包括所述资源数据库中至少一篇文章的第一搜索列表。
18.根据权利要求17所述的服务器,其特征在于,所述每篇文章的用户数据包括该篇文章被点赞的次数、被评论的次数、被分享的次数以及被收藏的次数,所述质量指标计算模块计算每篇文章的质量指标的方式,包括:
根据计算式:计算每篇文章的质量指标,其中,Nsum表示该篇文章被浏览的总次数,Np表示该篇文章被点赞的次数,Nr表示该篇文章被评论的次数,Ns表示该篇文章被分享的次数,Nc表示该篇文章被收藏的次数。
19.根据权利要求17或18所述的服务器,其特征在于,所述第一搜索列表生成模块根据计算得到的所述相似度和所述质量指标,生成与所述搜索词对应的包括所述资源数据库中至少一篇文章的第一搜索列表的方式,包括:
初始化一空列表;
根据所述相似度对所述资源数据库中的文章进行排序,得到候选搜索列表;
将所述候选搜索列表中的文章按序分为多组,每组包括第一预设数目篇文章;
分别计算每组中所述第一预设数目篇文章的质量指标,并根据计算出的质量指标对该第一预设数目篇文章进行排序;
将每组的第一预设数目篇文章中质量指标最大的第二预设数目篇文章加入所述空列表中,得到所述第一搜索列表。
20.根据权利要求19所述的服务器,其特征在于,所述第一预设数目为一预设数值或为一预设的数值区间内的任意值,所述第二预设数目与所述第一预设数目之比为预定比例。
21.根据权利要求17所述的服务器,其特征在于,所述文章搜索装置还包括:
搜索结果列表获取模块,用于获取该搜索词之前每次被搜索时得到的搜索结果列表;
用户行为反馈指标计算模块,用于根据上述得到的各个所述搜索结果列表,计算所述资源数据库中每篇文章对应的用户行为反馈指标;
第二搜索列表生成模块,用于根据计算得到的所述用户行为反馈指标对所述资源数据库中的文章进行排序,得到第二搜索列表;
搜索结果列表生成模块,用于结合所述第一搜索列表和所述第二搜索列表,生成该搜索词当前的搜索结果列表。
22.根据权利要求21所述的服务器,其特征在于,所述用户行为反馈指标计算模块根据上述得到的各个所述搜索结果列表,计算所述资源数据库中每篇文章对应的用户行为反馈指标的方式,包括:
根据计算式f=αPs+βPc-γPi计算所述资源数据库中每篇文章的用户行为反馈指标,其中,f表示所述用户行为反馈指标,Ps表示预先统计得到的该篇文章的用户满意率,Pc表示预先统计得到的该篇文章的用户点击率,Pi表示预先统计得到的该篇文章的用户跳过率,α、β和γ是预设的权重参数。
23.根据权利要求21所述的服务器,其特征在于,所述搜索结果列表生成模块结合所述第一搜索列表和所述第二搜索列表,生成该搜索词当前的搜索结果列表的方式,包括:
初始化一目标列表;
向该目标列表中添加文章;其中,向该目标列表中添加文章的步骤包括从所述第一搜索列表中按顺序获取第三预设数目篇文章加入所述目标列表中,以及从所述第二搜索列表中按顺序获取第四预设数目篇文章加入所述目标列表中,所述第三预设数目和所述第四预设数目根据用于显示所述搜索结果列表的设备每屏能够显示的文章数目预先设定;
判断所述第一搜索列表和所述第二搜索列表是否为空;
若第一搜索列表、第二搜索列表都不为空,则返回上述向该目标列表中添加文章的步骤;
若第一搜索列表、第二搜索列表中出现一个为空,则将另一个非空的搜索列表中剩余的所有文章添加进上述目标列表中;
若第一搜索列表、第二搜索列表都为空,则将当前的所述目标列表作为该搜索词当前的搜索结果列表并输出。
CN201710431415.8A 2017-06-08 2017-06-08 一种文章搜索方法、装置及服务器 Pending CN107273476A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710431415.8A CN107273476A (zh) 2017-06-08 2017-06-08 一种文章搜索方法、装置及服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710431415.8A CN107273476A (zh) 2017-06-08 2017-06-08 一种文章搜索方法、装置及服务器

Publications (1)

Publication Number Publication Date
CN107273476A true CN107273476A (zh) 2017-10-20

Family

ID=60066023

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710431415.8A Pending CN107273476A (zh) 2017-06-08 2017-06-08 一种文章搜索方法、装置及服务器

Country Status (1)

Country Link
CN (1) CN107273476A (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108932320A (zh) * 2018-06-27 2018-12-04 广州优视网络科技有限公司 文章搜索方法、装置及电子设备
CN109241238A (zh) * 2018-06-27 2019-01-18 广州优视网络科技有限公司 文章搜索方法、装置及电子设备
CN109614542A (zh) * 2018-12-11 2019-04-12 平安科技(深圳)有限公司 公众号推荐方法、装置、计算机设备及存储介质
CN110275970A (zh) * 2019-06-21 2019-09-24 北京达佳互联信息技术有限公司 图像检索的方法、装置、服务器及存储介质
CN110377808A (zh) * 2019-06-14 2019-10-25 北京达佳互联信息技术有限公司 文档处理方法、装置、电子设备及存储介质
CN110580278A (zh) * 2019-07-30 2019-12-17 平安科技(深圳)有限公司 根据用户画像的个性化搜索方法、系统、设备及存储介质
WO2020019564A1 (zh) * 2018-07-27 2020-01-30 天津字节跳动科技有限公司 搜索排序方法、装置、电子设备和存储介质
CN111078858A (zh) * 2018-10-19 2020-04-28 阿里巴巴集团控股有限公司 文章搜索方法、装置及电子设备
CN112784597A (zh) * 2019-11-06 2021-05-11 阿里巴巴集团控股有限公司 文章质量的评价方法及设备
CN113254603A (zh) * 2021-07-08 2021-08-13 北京语言大学 一种基于分类体系的领域词表自动构建的方法及装置
CN113434696A (zh) * 2021-06-28 2021-09-24 平安科技(深圳)有限公司 基于知识图谱的搜索结果更新方法、装置和计算机设备
CN114969391A (zh) * 2022-07-29 2022-08-30 华中科技大学同济医学院附属协和医院 文章数据搜索方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103942279A (zh) * 2014-04-01 2014-07-23 百度(中国)有限公司 搜索结果的展现方法和装置
CN104008171A (zh) * 2014-06-03 2014-08-27 中国科学院计算技术研究所 一种法律数据库构建方法及法律检索服务方法
CN105159932A (zh) * 2015-08-07 2015-12-16 南车青岛四方机车车辆股份有限公司 一种数据检索和排序系统和方法
CN106649423A (zh) * 2016-06-23 2017-05-10 新乡学院 一种基于内容相关度的检索模型计算方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103942279A (zh) * 2014-04-01 2014-07-23 百度(中国)有限公司 搜索结果的展现方法和装置
CN104008171A (zh) * 2014-06-03 2014-08-27 中国科学院计算技术研究所 一种法律数据库构建方法及法律检索服务方法
CN105159932A (zh) * 2015-08-07 2015-12-16 南车青岛四方机车车辆股份有限公司 一种数据检索和排序系统和方法
CN106649423A (zh) * 2016-06-23 2017-05-10 新乡学院 一种基于内容相关度的检索模型计算方法

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109241238B (zh) * 2018-06-27 2022-02-08 阿里巴巴(中国)有限公司 文章搜索方法、装置及电子设备
CN109241238A (zh) * 2018-06-27 2019-01-18 广州优视网络科技有限公司 文章搜索方法、装置及电子设备
CN108932320A (zh) * 2018-06-27 2018-12-04 广州优视网络科技有限公司 文章搜索方法、装置及电子设备
WO2020019564A1 (zh) * 2018-07-27 2020-01-30 天津字节跳动科技有限公司 搜索排序方法、装置、电子设备和存储介质
CN111078858B (zh) * 2018-10-19 2023-06-09 阿里巴巴集团控股有限公司 文章搜索方法、装置及电子设备
CN111078858A (zh) * 2018-10-19 2020-04-28 阿里巴巴集团控股有限公司 文章搜索方法、装置及电子设备
CN109614542A (zh) * 2018-12-11 2019-04-12 平安科技(深圳)有限公司 公众号推荐方法、装置、计算机设备及存储介质
CN109614542B (zh) * 2018-12-11 2024-05-14 平安科技(深圳)有限公司 公众号推荐方法、装置、计算机设备及存储介质
CN110377808A (zh) * 2019-06-14 2019-10-25 北京达佳互联信息技术有限公司 文档处理方法、装置、电子设备及存储介质
CN110275970B (zh) * 2019-06-21 2022-05-06 北京达佳互联信息技术有限公司 图像检索的方法、装置、服务器及存储介质
CN110275970A (zh) * 2019-06-21 2019-09-24 北京达佳互联信息技术有限公司 图像检索的方法、装置、服务器及存储介质
CN110580278B (zh) * 2019-07-30 2023-05-26 平安科技(深圳)有限公司 根据用户画像的个性化搜索方法、系统、设备及存储介质
CN110580278A (zh) * 2019-07-30 2019-12-17 平安科技(深圳)有限公司 根据用户画像的个性化搜索方法、系统、设备及存储介质
CN112784597A (zh) * 2019-11-06 2021-05-11 阿里巴巴集团控股有限公司 文章质量的评价方法及设备
CN113434696A (zh) * 2021-06-28 2021-09-24 平安科技(深圳)有限公司 基于知识图谱的搜索结果更新方法、装置和计算机设备
CN113254603A (zh) * 2021-07-08 2021-08-13 北京语言大学 一种基于分类体系的领域词表自动构建的方法及装置
CN113254603B (zh) * 2021-07-08 2021-10-01 北京语言大学 一种基于分类体系的领域词表自动构建的方法及装置
CN114969391A (zh) * 2022-07-29 2022-08-30 华中科技大学同济医学院附属协和医院 文章数据搜索方法及装置
CN114969391B (zh) * 2022-07-29 2022-11-18 华中科技大学同济医学院附属协和医院 文章数据搜索方法及装置

Similar Documents

Publication Publication Date Title
CN107273476A (zh) 一种文章搜索方法、装置及服务器
Sharghi et al. Query-focused extractive video summarization
CN108287864B (zh) 一种兴趣群组划分方法、装置、介质及计算设备
CN104298429B (zh) 一种基于输入的信息展示方法和输入法系统
CN105243087B (zh) It资讯聚合阅读个性化推荐方法
CN103455524B (zh) 展现和获取词条信息的方法和装置
CN107169131A (zh) 一种视频搜索方法、装置及服务器
CN105005564B (zh) 一种基于问答平台的数据处理方法和装置
CN107133345A (zh) 基于人工智能的交互方法和装置
US20120209751A1 (en) Systems and methods of generating use-based product searching
CN111680254B (zh) 一种内容推荐方法及装置
CN107346336A (zh) 基于人工智能的信息处理方法和装置
CN105512285B (zh) 基于机器学习的自适应网络爬虫方法
US11176586B2 (en) Data analysis method and system thereof
CN108829808A (zh) 一种页面个性化排序方法、装置及电子设备
CN107679119A (zh) 生成品牌衍生词的方法和装置
CN103646341B (zh) 一种网站提供对象的推荐方法和装置
CN109711931A (zh) 基于用户画像的商品推荐方法、装置、设备及存储介质
CN104077415A (zh) 搜索方法及装置
CN109189990A (zh) 一种搜索词的生成方法、装置及电子设备
CN107562939A (zh) 垂直领域新闻推荐方法、装置及可读储存介质
CN111639255B (zh) 搜索关键词的推荐方法、装置、存储介质及电子设备
CN107391509A (zh) 标签推荐方法及装置
CN110428295A (zh) 商品推荐方法和系统
CN110147505A (zh) 一种页面展示方法、服务器及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20171020