CN111444429B - 信息推送方法、装置及服务器 - Google Patents

信息推送方法、装置及服务器 Download PDF

Info

Publication number
CN111444429B
CN111444429B CN202010231110.4A CN202010231110A CN111444429B CN 111444429 B CN111444429 B CN 111444429B CN 202010231110 A CN202010231110 A CN 202010231110A CN 111444429 B CN111444429 B CN 111444429B
Authority
CN
China
Prior art keywords
target
medical
keyword
query
acquiring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010231110.4A
Other languages
English (en)
Other versions
CN111444429A (zh
Inventor
康战辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202010231110.4A priority Critical patent/CN111444429B/zh
Publication of CN111444429A publication Critical patent/CN111444429A/zh
Application granted granted Critical
Publication of CN111444429B publication Critical patent/CN111444429B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9566URL specific, e.g. using aliases, detecting broken or misspelled links
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/55Push-based network services

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供了一种信息推送方法、装置及服务器,属于互联网技术领域。所述方法包括:获取当前时间的目标查询词,目标查询词的查询热度大于预设阈值;获取与目标查询词相关的目标新闻内容;根据预设疾病词从目标新闻内容中获取关键词集合,关键词集合中所包括的关键词与预设疾病词匹配;根据关键词集合中的关键词的出现频次,确定关键词的医疗热度分数;根据关键词的医疗热度分数,从关键词集合中获取目标医疗话题;获取与目标医疗话题相关的医疗话题信息,向终端推送医疗话题信息。在本申请中,能够快速挖掘出目标查询词所代表的热门新闻事件背后的目标医疗话题,向终端推送与该目标医疗话题相关的医疗话题信息,提高了医疗话题信息的生产效率。

Description

信息推送方法、装置及服务器
技术领域
本申请涉及互联网技术领域,特别涉及一种信息推送方法、装置及服务器。
背景技术
随着互联网技术在医疗行业的应用和发展,医疗类应用应运而生。医疗类应用能够为用户提供优质、权威的医疗科普信息,但用户通常在需要查询相关的疾病问题时才会使用医疗类应用,医疗类应用的用户活跃度较低。
为提高医疗类应用的用户活跃度,吸引用户更多的了解专业权威的医疗信息,通常会由编辑人工搜集新闻事件,挖掘出热门新闻事件以及热门新闻事件所衍生出的医疗话题,根据热门新闻事件所衍生出的医疗话题,编辑撰写医疗话题信息,将该与热门新闻事件相关的医疗话题信息推送给用户。
相关技术中,由于编辑需要从海量新闻中找到热门新闻事件,从热门新闻事件中挖掘出医疗话题,再根据医疗话题编辑撰写医疗话题信息,导致医疗话题信息的生产效率较低。
发明内容
本申请实施例提供了一种信息推送方法、装置及服务器,能够提高信息推送的效率。所述技术方案如下:
根据本申请实施例的一方面,提供了一种信息推送方法,所述方法包括:
获取当前时间的目标查询词,所述目标查询词的查询热度大于预设阈值;
根据所述目标查询词,获取与所述目标查询词相关的目标新闻内容;
根据预设疾病词,从所述目标新闻内容中获取关键词集合,所述关键词集合中所包括的关键词与所述预设疾病词匹配;
根据所述关键词集合中的关键词的出现频次,确定所述关键词的医疗热度分数;
根据所述关键词的医疗热度分数,从所述关键词集合中,获取目标医疗话题;
获取与所述目标医疗话题相关的医疗话题信息,向终端推送所述医疗话题信息。
根据本申请实施例的另一方面,提供了一种信息推送装置,所述装置包括:
第一获取模块,用于获取当前时间的目标查询词,所述目标查询词的查询热度大于预设阈值;根据所述目标查询词,获取与所述目标查询词相关的目标新闻内容;
第二获取模块,用于根据预设疾病词,从所述目标新闻内容中获取关键词集合,所述关键词集合中所包括的关键词与所述预设疾病词匹配;
确定模块,用于根据所述关键词集合中的关键词的出现频次,确定所述关键词的医疗热度分数;
第三获取模块,用于根据所述关键词的医疗热度分数,从所述关键词集合中,获取目标医疗话题;
第四获取模块,用于获取与所述目标医疗话题相关的医疗话题信息;
推送模块,用于向终端推送所述医疗话题信息。
在一种可能的实现方式中,所述确定模块,还用于获取命中所述预设疾病词的目标新闻内容的第一数量,以及,获取与所述目标查询词相关的目标新闻内容的第二数量;根据所述第一数量和所述第二数量,确定所述目标新闻内容命中所述预设疾病词的命中比重,所述命中比重与所述第二数量呈负相关;根据所述出现频次和所述命中比重,确定所述关键词的医疗热度分数,所述医疗热度分数与所述出现频次和所述命中比重呈正相关。
在另一种可能的实现方式中,所述确定模块,还用于获取所述关键词所属的目标新闻内容的来源站点的站点权重;根据所述关键词的出现频次、所述命中比重和所述站点权重,确定所述关键词的医疗热度分数,所述医疗热度分数与所述出现频次、所述命中比重和所述站点权重呈正相关。
在另一种可能的实现方式中,所述确定模块,还用于获取所述关键词的重要度权重,所述重要度权重用于表示所述关键词所描述疾病的症状轻重程度;根据所述出现频次、所述命中比重和所述重要度权重,确定所述关键词的医疗热度分数,所述医疗热度分数与所述出现频次、所述命中比重和所述重要度权重呈正相关。
在另一种可能的实现方式中,所述确定模块,还用于根据所述关键词集合,确定所述关键词集合中的疾病种类的第三数量和所述关键词的第四数量;根据所述第三数量和所述第四数量,确定所述关键词的出现频次,所述出现频次与所述第四数量呈负相关。
在另一种可能的实现方式中,所述第二获取模块,还用于从所述目标新闻内容中获取所述目标新闻内容的新闻标题;根据预设疾病词,从所述目标新闻内容的新闻标题中获取所述关键词集合。
在另一种可能的实现方式中,所述第一获取模块,还用于根据第一时间段内的新闻搜索日志,获取所述第一时间段内的查询词的第一出现次数,以及获取所述第一时间段内的第一查询总数,所述查询词为所述第一时间段内的任一查询词,所述第一时间段包括所述当前时间,并且,所述第一时间段在所述当前时间之前;根据第二时间段内的新闻搜索日志,获取所述第二时间段内所述查询词的第二出现次数,以及获取所述第二时间段内的第二查询总数,所述第二时间段在所述第一时间段之前,并且,所述第一时间段与所述第二时间段相邻;根据所述第一出现次数、所述第二出现次数、所述第一查询总数和所述第二查询总数,确定所述查询词的卡方值,所述卡方值用于表示所述查询词的查询热度;将卡方值大于预设阈值的查询词确定为当前时间的目标查询词。
在另一种可能的实现方式中,所述第四获取模块,还用于获取所述目标医疗话题所属的目标新闻内容;将所述目标医疗话题所属的目标新闻内容确定为与所述目标医疗话题相关的医疗话题信息。
根据本申请实施例的另一方面,提供了一种服务器,所述服务器包括处理器和存储器,所述存储器中存储有至少一条程序代码,所述至少一条程序代码由所述处理器加载并执行,以实现上述任一可能实现方式所述的信息推送方法。
根据本申请实施例的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条程序代码,所述至少一条程序代码由处理器加载并执行,以实现上述任一可能实现方式所述的信息推送方法。
在本申请实施例中,获取当前时间的目标查询词,该目标查询词的查询热度大于预设阈值;根据该目标查询词,获取与目标查询词相关的目标新闻内容;根据预设疾病词,从目标新闻内容中获取关键词集合,该关键词集合中所包括的关键词与预设疾病词匹配;根据关键词集合中的关键词的出现频次,确定关键词的医疗热度分数;根据关键词的医疗热度分数,从关键词集合中,获取目标医疗话题;获取与目标医疗话题相关的医疗话题信息,向终端推送该医疗话题信息。上述技术方案,根据当前时间的目标查询词,挖掘出当前热门的目标新闻内容,根据目标新闻内容和预设疾病词,从目标新闻内容中挖掘出当前时间的目标医疗话题,进而获取与该目标医疗话题相关的医疗话题信息,提高了医疗话题信息的生产效率。并且,缩短了向终端推送该医疗话题信息相对于目标查询词所代表的新闻事件发生的滞后时间,使医疗话题信息更具有时新性。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种实施环境的示意图;
图2是本申请实施例提供的一种信息推送方法的流程图;
图3是本申请实施例提供的一种信息推送方法的流程图;
图4是本申请实施例提供的一种检验显著性差异的示意图;
图5是本申请实施例提供的一种目标新闻内容获取的示意图;
图6是本申请实施例提供的一种确定关键词的医疗热度分数的流程图;
图7是本申请实施例提供的一种信息推送装置的框图;
图8是本申请实施例提供的一种终端的框图;
图9是本申请实施例提供的一种服务器的框图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
本申请的说明书和权利要求书及所述附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们的任意变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。
图1是本申请实施例提供的一种实施环境的示意图。参见图1,该实施环境中包括终端101和服务器102。
终端101和服务器102可以通过无线或者有线网络连接。服务器102为终端101提供医疗话题信息的推送服务。
终端101上可以安装有用于展示医疗话题信息的客户端。例如,客户端可以为医疗类应用、社交应用或者浏览器等。医疗类应用可以为医疗科普应用、医疗健康应用或者医疗咨询应用等,用户可以通过访问医疗类应用的医疗信息推送界面,浏览被推送的医疗话题信息。用户也可以通过社交应用上的医疗小程序访问医疗信息推送界面,浏览被推送的医疗话题信息。用户还可以通过浏览器访问医疗信息推送界面,浏览被推送的医疗话题信息。
用户可以通过新闻搜索引擎浏览新闻内容,新闻搜索引擎的服务器会基于用户的搜索和浏览行为生成新闻搜索日志,该新闻搜索日志能够表示当前时间新闻搜索的热点。服务器102可以从新闻搜索引擎的服务器获取新闻搜索日志,根据该新闻搜索日志,获取当前时间查询热度大于预设阈值的目标查询词;根据该目标查询词,获取与该目标查询词相关的目标新闻内容;根据预设疾病词,从目标新闻内容中获取关键词集合,该关键词集合中所包括的关键词与预设疾病词匹配;根据关键词集合中的关键词的出现频次,确定关键词的医疗热度分数;根据关键词的医疗热度分数,从关键词集合中,获取目标医疗话题;获取与该目标医疗话题相关的医疗话题信息。终端101可以响应于用于指示显示医疗信息推送界面的操作,向服务器102发送第一获取请求,该第一获取请求用于请求获取医疗话题信息。服务器102接收第一获取请求,向终端101推送与目标医疗话题相关的医疗话题信息。终端101接收该医疗话题信息,将该医疗话题信息显示在医疗信息推送界面中。
上述技术方案,使得服务器102能够基于当前时间查询热度大于预设阈值的目标查询词,快速挖掘出该目标查询词所代表的热门新闻事件背后的目标医疗话题;将与该目标医疗话题相关的医疗话题信息通过终端101推送给用户,提高了医疗话题信息的生产效率,缩短了医疗话题信息的推送相对于热门新闻事件发生的滞后时间,使医疗话题信息更具有时新性,进而还能够增强该医疗话题信息对用户的吸引力,提升用户对医疗话题信息的关注度,对医疗相关信息的科普和用户身心健康的促进产生积极作用。
终端101可以为手机、平板电脑、电脑、可穿戴设备或者其他电子设备。服务器102可以是一台服务器,或者若干台服务器组成的服务器集群,或者一个云计算服务中心。
图2是本申请实施例提供的一种信息推送方法的流程图。参见图2,该信息推送方法包括:
201、获取当前时间的目标查询词。
目标查询词为当前时间的查询热度大于预设阈值的查询词。查询词用于搜索与该查询词相关的新闻内容,并且,查询词能够代表某一新闻事件。用户可以在终端的客户端上通过查询词对新闻内容进行搜索。
在一种可能的实现方式中,获取当前时间的目标查询词,包括:
根据第一时间段内的新闻搜索日志,获取第一时间段内的查询词的第一出现次数,以及获取第一时间段内的第一查询总数,查询词为第一时间段内的任一查询词,第一时间段包括当前时间,并且,第一时间段在当前时间之前;
根据第二时间段内的新闻搜索日志,获取第二时间段内查询词的第二出现次数,以及获取第二时间段内的第二查询总数,第二时间段在第一时间段之前,并且,第一时间段与第二时间段相邻;
根据第一出现次数、第二出现次数、第一查询总数和第二查询总数,确定查询词的卡方值,卡方值用于表示查询词的查询热度;
将卡方值大于预设阈值的查询词确定为当前时间的目标查询词。
202、根据目标查询词,获取与该目标查询词相关的目标新闻内容。
获取到当前时间的目标查询词,则即时获取与该目标查询词相关的目标新闻内容。
203、根据预设疾病词,从目标新闻内容中获取关键词集合。
关键词集合中所包括的关键词与预设疾病词匹配。预设疾病词用于表示疾病的名称,例如,预设疾病词可以为肺癌、肺炎、支气管炎、心脏病、冠心病、胃癌、肝癌或脑血栓等。
在一种可能的实现方式中,根据预设疾病词,从目标新闻内容中获取关键词集合,包括:
从目标新闻内容中获取目标新闻内容的新闻标题;
根据预设疾病词,从目标新闻内容的新闻标题中获取关键词集合。
204、根据关键词集合中的关键词的出现频次,确定该关键词的医疗热度分数。
在一种可能的实现方式中,根据关键词集合中的关键词的出现频次,确定关键词的医疗热度分数,包括:
获取命中预设疾病词的目标新闻内容的第一数量,以及,获取与目标查询词相关的目标新闻内容的第二数量;
根据第一数量和第二数量,确定目标新闻内容命中预设疾病词的命中比重,命中比重与第二数量呈负相关;
根据出现频次和命中比重,确定关键词的医疗热度分数,医疗热度分数与出现频次和命中比重呈正相关。
在另一种可能的实现方式中,根据出现频次和命中比重,确定关键词的医疗热度分数,包括:
获取关键词所属的目标新闻内容的来源站点的站点权重;
根据关键词的出现频次、命中比重和站点权重,确定关键词的医疗热度分数,医疗热度分数与出现频次、命中比重和站点权重呈正相关。
在另一种可能的实现方式中,根据出现频次和命中比重,确定关键词的医疗热度分数,包括:
获取关键词的重要度权重,重要度权重用于表示关键词所描述疾病的症状轻重程度;
根据出现频次、命中比重和重要度权重,确定关键词的医疗热度分数,医疗热度分数与出现频次、命中比重和重要度权重呈正相关。
在另一种可能的实现方式中,根据关键词集合中的关键词的出现频次,确定关键词的医疗热度分数之前,该方法还包括:
根据关键词集合,确定关键词集合中的疾病种类的第三数量和关键词的第四数量;
根据第三数量和第四数量,确定关键词的出现频次,出现频次与第四数量呈负相关。
205、根据关键词的医疗热度分数,从关键词集合中,获取目标医疗话题。
目标医疗话题为具有新闻事件的热度且具有医疗相关性的话题词。
206、获取与目标医疗话题相关的医疗话题信息,向终端推送该医疗话题信息。
在一种可能的实现方式中,获取与目标医疗话题相关的医疗话题信息,包括:
获取目标医疗话题所属的目标新闻内容;
将目标医疗话题所属的目标新闻内容确定为与目标医疗话题相关的医疗话题信息。
在本申请实施例中,获取当前时间的目标查询词,该目标查询词的查询热度大于预设阈值;根据该目标查询词,获取与目标查询词相关的目标新闻内容;根据预设疾病词,从目标新闻内容中获取关键词集合,该关键词集合中所包括的关键词与预设疾病词匹配;根据关键词集合中的关键词的出现频次,确定关键词的医疗热度分数;根据关键词的医疗热度分数,从关键词集合中,获取目标医疗话题;获取与目标医疗话题相关的医疗话题信息,向终端推送该医疗话题信息。上述技术方案,根据当前时间的目标查询词,挖掘出当前热门的目标新闻内容,根据目标新闻内容和预设疾病词,从目标新闻内容中挖掘出当前时间的目标医疗话题,进而获取与该目标医疗话题相关的医疗话题信息,提高了医疗话题信息的生产效率。并且,缩短了向终端推送该医疗话题信息相对于目标查询词所代表的新闻事件发生的滞后时间,使医疗话题信息更具有时新性。
图3是本申请实施例提供的一种信息推送方法的流程图,参见图3,该实施例包括:
301、服务器获取当前时间的目标查询词。
目标查询词为当前时间的查询热度大于预设阈值的查询词。查询词用于搜索与该查询词相关的新闻内容,并且,查询词能够代表某一新闻事件。用户可以在终端的客户端上通过查询词对新闻内容进行搜索。例如,该客户端可以为新闻应用、浏览器或者社交应用等,终端可以通过为该客户端提供服务的新闻搜索引擎的服务器获取与查询词相关的新闻内容,将该新闻内容展示给用户。
用户可以在该客户端的搜索界面的搜索框中输入查询词,终端响应于搜索操作,获取被输入的查询词,向新闻搜索引擎的服务器发送携带该查询词的第二获取请求,该第二获取请求用于请求获取与该查询词相关的新闻内容;用户也可以点击该客户端的搜索界面上显示的查询词,终端响应于对查询词的点击操作,向新闻搜索引擎的服务器发送携带该查询词的第二获取请求,请求获取与该查询词相关的新闻内容。
新闻搜索引擎的服务器接收终端发送的第二获取请求,向终端返回与该第二获取请求携带的查询词相关的新闻内容,并且,将该第二获取请求携带的查询词和接收到该第二获取请求的时间,存储在新闻搜索日志中。服务器可以通过新闻搜索引擎的服务器获取新闻搜索日志,基于该新闻搜索日志,获取当前时间的目标查询词。
服务器可以根据新闻搜索日志,将搜索次数突然陡增的查询词确定为目标查询词,也即热门查询词。服务器可以通过卡方检验的方法,检验两个相邻时间段内某一查询词的出现次数是否有显著性差异。若两个相邻时间段内某一查询词的出现次数有显著性差异,表示该查询词在两个相邻时间段内的出现次数发生了爆发式波动,则将该查询词确定为目标查询词。相应的,服务器获取当前时间的目标查询词可以通过以下步骤(1)至(4)实现:
(1)服务器根据第一时间段内的新闻搜索日志,获取第一时间段内的查询词的第一出现次数,以及获取第一时间段内的第一查询总数。
该查询词为第一时间段内的任一查询词。服务器可以根据第一时间段内的新闻搜索日志,对于第一时间段内出现的每个查询词进行卡方检验,进而从第一时间段内出现的多个查询词中确定出目标查询词。
服务器需要获取当前时间的目标查询词,因此,服务器获取的查询词的第一出现次数是与当前时间最接近的第一时间段内该查询词的出现次数。第一时间段包括当前时间,并且,第一时间段在当前时间之前。
第一时间段的时长可以为10分钟、15分钟或者30分钟等,在本申请实施例中,对第一时间段的时长不做限定。例如,第一时间段的时长为15分钟,若当前时间为11时00分,则第一时间段为10时45分至11时00分这一时间段。
需要说明的一点是,服务器也可以获取第一出现次数和第一时间段内该查询词未出现的次数。
(2)服务器根据第二时间段内的新闻搜索日志,获取第二时间段内该查询词的第二出现次数,以及获取第二时间段内的第二查询总数。
服务器获取的第二出现次数的查询词与服务器获取的第一出现次数的查询词为同一个查询词。
第二时间段在第一时间段之前,并且,第一时间段与第二时间段相邻。第二时间段的时长与第一时间段的时长可以相等,第二时间段的时长与第一时间段的时长也可以不相等。第二时间段的时长可以为10分钟、15分钟或者30分钟等,在本申请实施例中,对第二时间段的时长不做限定。例如,第一时间段为10时45分至11时00分这一时间段,第二时间段可以为10时30分至10时45分这一时间段。
需要说明的一点是,服务器也可以获取第二出现次数和第二时间段内该查询词未出现的次数。
图4是本申请实施例提供的一种检验显著性差异的示意图400,参见图4,服务器获取第一时间段内的查询词的第一出现次数,也即第一时间段内命中某个查询词的次数,以及获取第一时间段内的第一查询总数,也即获取第一时间段内的查询总数,以及获取第二时间段内的该查询词的第二出现次数,也即获取第二时间段内命中该查询词的次数,以及获取第二时间段内的第二查询总数,也即获取第二时间段内的查询总数。其中,第一时间段与第二时间段相邻,进而服务器可以根据第一出现次数、第一查询总数、第二出现次数和第二查询总数,通过卡方检验的方法,确定当前时间的目标查询词。
需要说明的另一点是,服务器可以每隔预设时长,对新闻搜索日志进行统计,确定目标查询词。预设时长可以为10分钟、15分钟或者30分钟等,在本申请实施例中,对预设时长不做限定。
服务器可以将预设时长的时间段划分为第一时间段和第二时间段进行统计,第一时间段的时长与第二时间段的时长之和与预设时长相等。例如,预设时长为30分钟,第一时间段的时长和第二时间段的时长可以分别为15分钟,服务器可以在10时30分,分别对10时00分至10时15分和10时15分至10时30分这两个时间段的新闻搜索日志进行统计;在11时00分,分别对10时30分至10时45分和10时45分至11时00分这两个时间段的新闻搜索日志进行统计。
服务器也可以将预设时长的时间段作为第一时间段,基于第一时间段确定第二时间段,再分别对第一时间段和第二时间段的新闻搜索日志进行统计,第一时间段的时长和第二时间段的时长与预设时长相等,例如,预设时长为15分钟,服务器可以在10时30分,分别对10时15分至10时30分和10时00分至10时15分这两个时间段的新闻搜索日志进行统计;在10时45分,分别对10时30分至10时45分和10时15分至10时30分这两个时间段的新闻搜索日志进行统计;在11时00分,分别对10时45分至11时00分和10时30分至10时45分这两个时间段的新闻搜索日志进行统计。
(3)服务器根据第一出现次数、第二出现次数、第一查询总数和第二查询总数,确定该查询词的卡方值。
该卡方值用于表示该查询词的查询热度。卡方值的大小与查询词的查询热度呈正相关。卡方值越大,表示该查询词的出现次数在两个时间段内存在显著性差异,也即该查询词的出现次数突然变高,也即该查询词的查询热度升高。
服务器可以根据第一出现次数和第一查询总数,确定第一时间段内该查询词未出现的次数;根据第二出现次数和第二查询总数,确定第二时间段内该查询词未出现的次数;根据第一出现次数、第二出现次数、第一查询总数、第二查询总数、第一时间段内该查询词未出现的次数和第二时间段内该查询词未出现的次数,确定该查询词的卡方值,其中,该查询词的卡方值分别与第一查询总数、第二查询总数、第一出现次数与第二出现次数之和以及第一时间段内该查询词未出现的次数与第二时间段内该查询词未出现的次数之和呈负相关;该查询词的卡方值与第一时间段和第二时间段内的总查询次数,也即第一查询次数和第二查询次数之和呈正相关;该查询词的卡方值与该查询词的平方值呈正相关,该查询词的平方值为第一数值和第二数值的差的平方值,第一数值与第一出现次数和第二时间段内该查询词未出现的次数呈正相关,第二数值与第二出现次数和第二时间段内该查询词未出现的次数呈正相关。
服务器可以根据第一出现次数、第二出现次数、第一查询总数和第二查询总数,通过公式一确定该查询词的卡方值:
公式一:
Figure BDA0002429303400000111
其中,a表示第一时间段内查询词的第一出现次数,b表示第一时间段内查询词未出现的次数;a+b表示第一时间段内的第一查询总数;c表示第二时间段内该查询词出现的第二出现次数,d表示第二时间段内该查询词未出现的次数,c+d表示第二时间段内的第二查询总数;a+c表示第一时间段和第二时间段内该查询词出现的次数之和;b+d表示第一时间段和第二时间段内该查询词未出现的次数之和;n表示a、b、c和d之和。
需要说明的一点是,服务器根据第一出现次数、第二出现次数、第一查询总数和第二查询总数,确定该查询词的卡方值之前,还可以建立四格表,根据该四格表确定查询词的卡方值,四格表参见表1。
表1
查询词出现 查询词未出现 合计
第一时间段 a b a+b
第二时间段 c d c+d
合计 a+c b+d a+b+c+d=n
其中,a表示第一时间段内查询词的第一出现次数,b表示第一时间段内查询词未出现的次数;a+b表示第一时间段内的第一查询总数;c表示第二时间段内该查询词出现的第二出现次数,d表示第二时间段内该查询词未出现的次数,c+d表示第二时间段内的第二查询总数;a+c表示第一时间段和第二时间段内该查询词出现的次数之和;b+d表示第一时间段和第二时间段内该查询词未出现的次数之和;n表示a、b、c和d之和。
需要说明的另一点是,服务器可以根据第一出现次数、第二出现次数、第一查询总数和第二查询总数,确定该查询词的卡方值;服务器还可以根据第一出现次数、第二出现次数、第一时间段内该查询词未出现的次数和第二时间段内该查询词未出现的次数,确定该查询词的卡方值。
(4)服务器将卡方值大于预设阈值的查询词确定为当前时间的目标查询词。
预设阈值可以是根据历史的热门查询词的卡方值进行设置的。相应的,服务器获取预设阈值的步骤可以为:服务器获取历史的第三时间段内的热门查询词,以及获取热门查询词的查询热度升高的第四时间段;根据第四时间段内该热门查询词的出现次数,确定该热门查询词的卡方值;根据该热门查询词的卡方值,确定预设阈值。
第三时间段可以为距离当前时间最近的历史的时间段,例如,第三时间段可以为在当前时间之前的两个星期。服务器获取的第三时间段内的热门查询词可以有多个,服务器可以根据多个热门查询词的卡方值,确定预设阈值。
在本申请实施例中,服务器可以通过卡方检验的方法,确定两个相邻时间段内查询词的出现次数是否有显著性差异,进而确定出现次数突然变高,也即具有查询热度的目标查询词,能够在目标查询词的查询热度初步升高时,就快速发现目标查询词,缩短了目标查询词的发现相对于目标查询词真实热度产生的滞后时间,提高了获取目标查询词的效率。
302、服务器根据目标查询词,获取与该目标查询词相关的目标新闻内容。
服务器获取到当前时间的目标查询词,则即时获取与该目标查询词相关的目标新闻内容。
在一种可能的实现方式中,服务器可以向新闻搜索引擎的服务器发送第三获取请求,该第三获取请求携带有目标查询词,且该第三获取请求用于请求获取与该目标查询词相关的目标新闻内容;新闻搜索引擎的服务器可以根据目标查询词,获取目标查询词的查询结果,该查询结果包括至少一个与该目标查询词相关的目标新闻内容;新闻搜索引擎的服务器将查询结果中所包括的目标新闻内容发送给服务器。
图5是本申请实施例提供的一种目标新闻内容获取的示意图,参见图5,例如,目标查询词为“XX去世”,该目标查询词的查询结果可以包括目标新闻内容501:“XX去世,年仅33岁,晚期肺癌患者如何活得更久?从真实故事说起”;目标新闻内容502:“XX去世前,最后一次更新微博,骄傲转发!祝福祖国!”;目标新闻内容503:“XX去世第四天!在X地举行遗体告别仪式,球衣退役时间确定”;以及目标新闻内容504:“泪奔!XX去世前托孤XXX嘱托他帮忙照顾父母和儿子”等。
在另一种可能的实现方式中,服务器可以向新闻搜索引擎的服务器发送第四获取请求,该第四获取请求携带有目标查询词,且该第四获取请求用于请求获取第五数量的热度最高的目标新闻内容;新闻搜索引擎的服务器可以根据目标查询词,获取该目标查询词的查询结果,该查询结果中包括至少一个与该目标查询词相关的目标新闻内容;新闻搜索引擎的服务器从查询结果中获取第五数量的目标新闻内容;将第五数量的目标新闻内容发送给服务器。
第五数量的目标新闻内容可以为查询结果中热度最高的第五数量的目标新闻内容;第五数量的目标新闻内容也可以为查询结果中权威度最高的第五数量的目标新闻内容,目标新闻内容的权威度可以根据目标新闻内容的作者的权重或者目标新闻内容的来源站点的站点权重确定。第五数量可以为任一数值,例如,第五数量可以为10、15或者20等。
在本申请实施例中,服务器可以根据目标查询词,获取第五数量的与目标查询词相关的目标新闻内容,进而根据数量有限的目标新闻内容,挖掘目标医疗话题,能够提高获取目标医疗话题的效率。并且,第五数量的目标新闻内容可以为热度最高或者权威度最高的目标新闻内容,进而根据该第五数量的目标新闻内容,对目标医疗话题进行挖掘,能够提高目标医疗话题挖掘的可靠性。
303、服务器根据预设疾病词,从目标新闻内容中获取关键词集合。
关键词集合中所包括的关键词与预设疾病词匹配。预设疾病词用于表示疾病的名称,例如,预设疾病词可以为肺癌、肺炎、支气管炎、心脏病、冠心病、胃癌、肝癌或脑血栓等。服务器可以存储有疾病词典,该疾病词典中包括多个预设疾病词,该疾病词典中包括的预设疾病词可以为当前已存在较为重大的疾病的名称。
在第一种可能的实现方式中,服务器可以从目标新闻内容的新闻标题中获取关键词集合。相应的,服务器根据预设疾病词,从目标新闻内容中获取关键词集合可以通过以下步骤(1)至(2)实现:
(1)服务器从目标新闻内容中获取目标新闻内容的新闻标题。
在一种可能的实现方式中,服务器获取到的目标新闻内容可以为目标查询词的查询结果所包括的全部目标新闻内容,服务器可以从该查询结果所包括的目标新闻内容中获取每个目标新闻内容的新闻标题。
在另一种可能的实现方式中,服务器获取到的目标新闻内容可以为目标查询词的查询结果所包括的全部的目标新闻内容,服务器还可以从该查询结果所包括的目标新闻内容中获取第五数量的目标新闻内容,从该第五数量的目标新闻内容中获取第五数量的目标新闻内容的新闻标题。
图6是本申请实施例提供的一种确定关键词的医疗热度分数的流程图,参见图6,服务器可以先执行获取第五数量的目标新闻内容的新闻标题的步骤601。
在另一种可能的实现方式中,服务器获取到的目标新闻内容可以为第五数量的目标新闻内容,服务器可以从该第五数量的目标新闻内容中获取第五数量的目标新闻内容的新闻标题。
在本申请实施例中,服务器可以获取第五数量的目标新闻内容的新闻标题,进而从数量有限的新闻标题中获取关键词集合,能够提高获取关键词集合的效率。并且,第五数量的目标新闻内容可以为热度最高或者权威度最高的目标新闻内容,从该第五数量的目标新闻内容的新闻标题中获取关键词集合,进而根据该关键词集合获取目标医疗话题,能够提高目标医疗话题挖掘的可靠性。
(2)服务器根据预设疾病词,从目标新闻内容的新闻标题中获取关键词集合。
在一种可能的实现方式中,服务器可以先对目标新闻内容的新闻标题进行切词处理,再根据预设疾病词获取关键词集合。相应的,本步骤可以为:服务器对目标新闻内容的新闻标题进行切词处理,得到由该新闻标题切分出的多个分词;根据预设疾病词,从该多个分词中获取与预设疾病词匹配的关键词;由与预设疾病词匹配的关键词组成关键词集合。其中,关键词集合包括从多个新闻标题中获取的多个关键词。
例如,目标新闻内容的新闻标题为“XX去世,年仅33岁,晚期肺癌患者如何活得更久?从真实故事说起”,由该新闻标题切分出的多个分词可以包括“XX”、“年”、“仅”、“33”、“岁”、“晚期”、“肺癌”、“如何”、“活”、“得”、“更久”、“从”、“真实”、“故事”和“说起”,预设疾病词包括肺癌,则从该目标新闻内容的新闻标题中获取的关键词为“肺癌”。
继续参见图6,服务器对目标新闻内容的新闻标题进行切词处理,也即执行采用分词器切词的步骤602。
在另一种可能的实现方式中,服务器可以基于预设疾病词,对目标新闻内容的新闻标题进行匹配,从目标新闻内容的新闻标题中匹配出关键词。相应的,服务器根据预设疾病词,从目标新闻内容的新闻标题中获取关键词集合的步骤可以为:服务器从目标新闻内容的新闻标题的起始位置开始,依次获取预设长度的待查字串;将待查字串与预设疾病词进行比较,若待查字串与预设疾病词匹配,则将与预设疾病词匹配的待查字串确定为关键词;由与预设疾病词匹配的关键词组成关键词集合。其中,关键词集合包括从多个新闻标题中获取的多个关键词。
在本申请实施例中,由于目标查询词是即时获取的,目标查询词所代表的热门新闻事件处于刚刚发生的阶段,与预设疾病词匹配的关键词通常出现在目标新闻内容的新闻标题中。与目标查询词相关的目标新闻内容报道的侧重点为该热门新闻事件本身,由该热门新闻事件衍生的对医疗话题讨论的深度文章较少,也就是说,与预设疾病词匹配的关键词在目标新闻内容的文章主体中的出现频次较少,因此,相较于从目标新闻内容的文章主体中获取关键词集合,从目标新闻内容的新闻标题中获取关键词集合,能够减少其他分词对关键词获取的干扰,提高关键词获取的准确性和可靠性。并且,目标新闻内容的新闻标题所包括的词数较少,从目标新闻内容的新闻标题中获取关键词集合,还能够提高关键词获取的效率。
在第二种可能的实现方式中,服务器也可以从目标新闻内容的整体内容中获取关键词集合。服务器从目标新闻内容的整体内容中获取关键词集合的步骤与服务器根据预设疾病词,从目标新闻内容的新闻标题中获取关键词集合的步骤相似,在此不再赘述。
304、服务器根据关键词集合中的关键词的出现频次,确定该关键词的医疗热度分数。
在第一种可能的实现方式中,服务器可以根据关键词集合中的关键词的出现频次,确定该关键词的医疗热度分数,该医疗热度分数与该出现频次呈正相关。例如,服务器可以将该关键词的出现频次确定为该关键词的医疗热度分数。其中,该关键词为关键词集合中的任一关键词。
需要说明的一点是,服务器根据关键词集合中的关键词的出现频次,确定该关键词的医疗热度分数之前,还确定该关键词的出现频次,相应的,服务器确定该关键词的出现频次的步骤可以为:服务器根据关键词集合,确定该关键词集合中的疾病种类的第三数量和该关键词的第四数量;根据第三数量和第四数量,确定该关键词的出现频次,该出现频次与第四数量呈负相关,该出现频次与第三数量呈正相关。
服务器可以将第四数量与第三数量的比值作为该关键词的出现频次。例如,关键词集合包括从新闻标题一中获取的关键词“肺癌”、从新闻标题二中获取的关键词“肺癌”和“肺炎”以及从新闻标题三中获取的关键词“支气管炎”,则该关键词集合中的疾病种类包括肺癌、肺炎和支气管炎,疾病种类的数量为3;关键词“肺癌”的数量为2,关键词“肺炎”的数量为1,关键词“支气管炎”的数量为1;则关键词“肺癌”的出现频次为2/3,关键词“肺炎”的出现频次为1/3,关键词“支气管炎”的出现频次为1/3。
在第二种可能的实现方式中,服务器还结合目标新闻内容命中预设疾病词的命中比重,确定关键词的医疗热度分数。相应的,服务器根据关键词集合中的关键词的出现频次,确定该关键词的医疗热度分数可以通过以下步骤(1)至(4)实现:
(1)服务器获取命中预设疾病词的目标新闻内容的第一数量。
在一种可能的实现方式中,服务器根据预设疾病词,从目标新闻内容的新闻标题中获取关键词集合,命中预设疾病词的目标新闻内容的第一数量为包括有与预设疾病词匹配的关键词的目标新闻内容的新闻标题的数量。
例如,新闻标题一中包括关键词“肺癌”,新闻标题二中包括关键词“肺癌”和“肺炎”,新闻标题三中包括关键词“支气管炎”,命中预设疾病词的目标新闻内容的第一数量为3。
在另一种可能的实现方式中,服务器根据预设疾病词,从目标新闻内容的整体内容中获取关键词集合,命中预设疾病词的目标新闻内容的第一数量为包括有与预设疾病词匹配的关键词的目标新闻内容的数量。
(2)服务器获取与目标查询词相关的目标新闻内容的第二数量。
在一种可能的实现方式中,服务器获取到的目标新闻内容可以为第五数量的目标新闻内容,则服务器可以将第五数量确定为第二数量。
例如,服务器获取到10个热度最高的目标新闻内容,则第二数量为10。
在另一种可能的实现方式中,服务器获取到的目标新闻内容可以为目标查询词的查询结果中所包括的全部的目标新闻内容,则第二数量为该查询结果中所包括的目标新闻内容的数量。
(3)服务器根据第一数量和第二数量,确定目标新闻内容命中预设疾病词的命中比重。
命中比重与第二数量呈负相关,该命中比重与第一数量呈正相关。例如,服务器可以将第一数量和第二数量的比值,确定为目标新闻内容命中预设疾病词的命中比重。
例如,命中预设疾病词的目标新闻内容的数量为3,服务器获取的目标新闻内容的第二数量为10,则命中比重为3/10。
(4)服务器根据出现频次和命中比重,确定该关键词的医疗热度分数。
该医疗热度分数与出现频次和命中比重呈正相关。例如,服务器可以将出现频次和命中比重的乘积确定为该关键词的医疗热度分数。
在本申请实施例中,服务器还可以结合目标新闻内容命中预设疾病词的命中比重,确定关键词的医疗热度分数。该命中比重能够表示目标查询词所代表的热门新闻事件与医疗疾病的相关程度,也就是说,命中预设疾病词的目标新闻内容的比例越高,表示该目标查询词所代表的热门新闻事件与医疗疾病的相关程度越高;命中比重与医疗热度分数呈正相关,命中比重越高,则医疗热度分数越高,因此,服务器结合命中比重,能够挖掘出与医疗疾病相关程度更高的目标医疗话题,提高获取目标医疗话题的准确性和可靠性。
在第三种可能的实现方式中,服务器还可以结合目标新闻内容的来源站点的站点权重,确定关键词的医疗热度分数。相应的,服务器根据出现频次和命中比重,确定关键词的医疗热度分数的步骤可以为:服务器获取该关键词所属的目标新闻内容的来源站点的站点权重;根据该关键词的出现频次、命中比重和站点权重,确定关键词的医疗热度分数,该医疗热度分数与出现频次、命中比重和站点权重呈正相关。
新闻搜索引擎中的新闻内容来源于多个不同的来源站点,例如,来源站点可以为新闻发布平台。服务器可以存储有站点权威度词典,该站点权威度词典中存储有不同的来源站点的站点权重,站点权重与来源站点的权威性呈正相关。服务器可以根据该关键词所属的目标新闻内容的来源站点,从站点权威度词典中获取该来源站点的站点权重。
医疗热度分数与出现频次、命中比重和站点权重呈正相关。例如,服务器可以将出现频次、命中比重和站点权重的乘积确定为该关键词的医疗热度分数。
需要说明的一点是,同一个关键词可能分别来源于多个不同的目标新闻内容,且该多个不同的目标新闻内容的来源站点不同,来源站点的站点权重也不同,服务器可以根据该关键词所属的每个目标新闻内容,获取每个目标新闻内容的来源站点的站点权重;根据每个目标新闻内容的来源站点的站点权重、该关键词的出现频次和命中比重,确定医疗热度分数。
例如,服务器获取的目标新闻内容的数量为10;命中预设疾病词的目标新闻内容的数量为3,且命中预设疾病词的目标新闻内容的新闻标题分别为新闻标题一、新闻标题二和新闻标题三,且新闻标题一中包括关键词“肺癌”,新闻标题一所属的目标新闻内容的来源站点的站点权重为1.0,新闻标题二中包括关键词“肺癌”和“肺炎”,新闻标题二所属的目标新闻内容的来源站点的站点权重为0.8,新闻标题三中包括关键词“支气管炎”,新闻标题三所属的目标新闻内容的来源站点的站点权重为0.4;继续参见图6,服务器可以根据上述数据,执行统计与预设疾病词匹配的关键词在目标新闻内容的新闻标题中的出现次数和站点权重的步骤603,以及根据与预设疾病词匹配的关键词在目标新闻内容的新闻标题中的出现次数和站点权重,确定关键词的医疗热度分数的步骤604。
服务器可以确定关键词集合为“肺癌、肺癌、肺炎、支气管炎”,该关键词集合中的疾病种类的第三数量为3,关键词“肺癌”的第四数量为2;目标新闻内容命中预设疾病词的命中比重为3/10;关键词“肺癌”所属的目标新闻内容的来源站点的站点权重分别为1.0和0.8,则关键词“肺癌”的医疗热度分数可以为:(1.0+0.8)×(2/3)×(3/10),关键词“肺癌”的医疗热度分数为0.36。
关键词“肺炎”的第四数量为1;关键词“肺炎”所属的目标新闻内容的来源站点的站点权重为0.8,则关键词“肺炎”的医疗热度分数可以为:0.8×(1/3)×(3/10),关键词“肺炎”的医疗热度分数为0.08。
关键词“支气管炎”的第四数量为1;关键词“支气管炎”所属的目标新闻内容的来源站点的站点权重为0.4,则关键词“支气管炎”的医疗热度分数可以为:0.4×(1/3)×(3/10),关键词“肺炎”的医疗热度分数为0.03。
在本申请实施例中,服务器还结合目标新闻内容的来源站点的站点权重,确定关键词的医疗热度分数,站点权重越大,表示该来源站点的权威度越高,来源于该来源站点的新闻内容可靠性越高,服务器使站点权重与医疗热度分数呈正关,使站点权重影响医疗热度分数,进而影响目标医疗话题的确定,提高目标医疗话题的可靠性。
在第四种可能的实现方式中,服务器还可以结合该关键词的重要度权重,确定该关键词的医疗热度分数。相应的,服务器根据出现频次和命中权重,确定该关键词的医疗热度分数的步骤可以为:服务器获取关键词的重要度权重,该重要度权重用于表示该关键词所描述疾病的症状轻重程度;根据出现频次、命中比重和重要度权重,确定该关键词的医疗热度分数,该医疗热度分数与出现频次、命中比重和重要度权重呈正相关。
预设疾病词可以对应有相应的重要度权重,该重要度权重可以表示该预设疾病词所描述疾病的症状轻重程度,例如,该预设疾病词可以按照轻症、中症和重症的方式设置重要度权重,其中,轻症的重要度权重小于中症的重要度权重,且中症的中重要度权重小于重症的重要度权重。
该重要度权重还可以表示预设疾病词所代表的疾病的重大程度,例如,预设疾病词“肺癌”的重要度权重大于预设疾病词“肺炎”的重要度权重。
服务器可以在获取到与预设疾病词匹配的关键词时,将该预设疾病词的重要度权重确定为与该预设疾病词匹配的关键词的重要度权重。
医疗热度分数与出现频次、命中比重和重要度权重呈正相关,例如,服务器可以将出现频次、命中比重和重要度权重的乘积确定为医疗热度分数。
需要说明的一点是,服务器还可以根据出现频次、命中权重、重要度权重和站点权重,确定关键词的医疗热度分数,且医疗热度分数与出现频次、命中权重、重要度权重和站点权重呈正相关。
在本申请实施例中,服务器还可以结合关键词的重要度权重,确定关键词的医疗热度分数,重要度权重与关键词所描述疾病的重大程度或者症状轻重程度呈正相关,且重要度权重与医疗热度分数呈正相关,服务器结合重要度权重,能够挖掘出重大程度更高的疾病词作为目标医疗话题,提高目标医疗话题的影响力。
需要说明的另一点是,服务器还可以用目标新闻内容的URL(Uniform ResourceLocator,统一资源定位符)来代表目标新闻内容。
305、服务器根据关键词的医疗热度分数,从关键词集合中,获取目标医疗话题。
服务器可以根据关键词集合中每个关键词的医疗热度分数,从关键词集合中,获取一个关键词作为目标医疗话题。
在一种可能的实现方式中,服务器可以根据关键词的医疗热度分数,从关键词集合中获取医疗热度分数大于设定阈值的关键词,将医疗热度分数大于设定阈值的关键词确定为目标医疗话题。
设定阈值可以是根据历史的目标医疗话题的医疗热度分数的数据分布情况确定的。例如,设定阈值可以为0.3,关键词集合中包括关键词“肺癌”、“肺炎”和“支气管炎”,“肺癌”的医疗热度分数为0.36,“肺炎”的医疗热度分数为0.08,“支气管炎”的医疗热度分数为0.03,则服务器可以确定医疗热度分数大于设定阈值的关键词为“肺癌”,将“肺癌”确定为目标医疗话题。
在本申请实施例中,服务器可以将医疗热度分数大于设定阈值的关键词确定为目标医疗话题,而不将医疗热度分数小于设定阈值的,可靠性较低的关键词,或者医疗热度分数小于设定阈值的,所代表的疾病重要程度不高的关键词作为目标医疗话题,提高了目标医疗话题的可靠性和重要性,从而使向终端推送的与目标医疗话题相关的医疗话题信息更具有影响力。
在另一种可能的实现方式中,预设疾病词可以为属于重大疾病类别的疾病名称,服务器也可以根据关键词的医疗热度分数,从关键词集合中获取医疗热度分数最大的关键词,将医疗热度分数最大的关键词确定为目标医疗话题。
在本申请实施例中,预设疾病词可以为属于重大疾病类别的疾病名称,从而关键词集合中的关键词所描述的疾病为重大疾病,服务器从关键词集合中获取的目标医疗话题所描述的是重大疾病,从而使得向终端推送的与目标医疗话题相关的医疗话题信息更具有影响力。
306、服务器获取与目标医疗话题相关的医疗话题信息。
在一种可能的实现方式中,服务器可以直接获取该目标医疗话题所属的目标新闻内容,将该目标医疗话题所属的目标新闻内容确定为医疗话题信息。
在本申请实施例中,服务器可以直接获取该目标医疗话题所属的目标新闻内容,将该目标新闻内容确定为医疗话题信息,能够提高医疗话题信息的获取效率。
在另一种可能的实现方式中,服务器可以根据目标医疗话题,获取该目标医疗话题对应的医疗科普信息,将医疗科普信息和目标医疗话题所属的目标新闻内容相结合,生成医疗话题信息。
服务器可以从存储有医疗科普信息的数据库中获取该目标医疗话题对应的医疗科普信息,该医疗科普信息用于对目标医疗话题所描述的疾病进行介绍和科普。
需要说明的一点是,服务器将医疗科普信息和目标医疗话题所属的目标新闻内容相结合,生成医疗话题信息后,还可以将该医疗话题信息发送至审核人员对应的终端,接收到审核人员对应的终端发送的用于指示审核通过的信息时,才将该医疗话题信息推送给用户的终端。其中,审核人员可以为与医疗类应用合作的医生和编辑等。
在本申请实施例中,服务器还可以结合目标医疗话题对应的医疗科普信息,生成医疗话题信息,使得医疗话题信息与医疗疾病的相关度更高,使该医疗话题信息能够更深层次的体现目标查询词所代表的热门新闻事件背后的医疗问题,不仅能够提高医疗话题信息的生成效率,还能够提高医疗话题信息的医疗相关度和权威性。
在另一种可能的实现方式中,服务器还可以将目标医疗话题发送给编辑对应的终端,接收编辑对应的终端发送的与目标医疗话题相关的医疗话题信息。
在本申请实施例中,服务器可以将获取到的目标医疗话题发送给编辑对应的终端,由编辑撰写与目标医疗话题相关的医疗话题信息,能够提高医疗话题信息的权威性。
在本申请实施例中,将目标新闻内容与医疗话题信息相结合,能够增强该医疗话题信息对用户的吸引力,提升用户对医疗话题信息的关注度,对医疗相关信息的科普和用户身心健康的促进产生积极作用。
307、服务器向终端推送该医疗话题信息。
终端对应的用户可以通过访问医疗信息推送界面,浏览被推送的医疗话题信息。相应的,终端响应于用于指示显示医疗信息推送界面的操作,向服务器发送第一获取请求,该第一获取请求用于请求获取医疗话题信息;服务器接收终端发送的第一获取请求,向终端推送该医疗话题信息;终端接收服务器推送的医疗话题信息,将该医疗话题信息显示在医疗推送界面中。
在本申请实施例中,获取当前时间的目标查询词,该目标查询词的查询热度大于预设阈值;根据该目标查询词,获取与目标查询词相关的目标新闻内容;根据预设疾病词,从目标新闻内容中获取关键词集合,该关键词集合中所包括的关键词与预设疾病词匹配;根据关键词集合中的关键词的出现频次,确定关键词的医疗热度分数;根据关键词的医疗热度分数,从关键词集合中,获取目标医疗话题;获取与目标医疗话题相关的医疗话题信息,向终端推送该医疗话题信息。上述技术方案,根据当前时间的目标查询词,挖掘出当前热门的目标新闻内容,根据目标新闻内容和预设疾病词,从目标新闻内容中挖掘出当前时间的目标医疗话题,进而获取与该目标医疗话题相关的医疗话题信息,提高了医疗话题信息的生产效率。并且,缩短了向终端推送该医疗话题信息相对于目标查询词所代表的新闻事件发生的滞后时间,使医疗话题信息更具有时新性。
上述所有可选技术方案,可以采用任意结合形成本申请的可选实施例,在此不再一一赘述。
图7是本申请实施例提供的一种信息推送装置的框图。参见图7,该装置包括:
第一获取模块701,用于获取当前时间的目标查询词,目标查询词的查询热度大于预设阈值;根据目标查询词,获取与目标查询词相关的目标新闻内容;
第二获取模块702,用于根据预设疾病词,从目标新闻内容中获取关键词集合,关键词集合中所包括的关键词与预设疾病词匹配;
确定模块703,用于根据关键词集合中的关键词的出现频次,确定关键词的医疗热度分数;
第三获取模块704,用于根据关键词的医疗热度分数,从关键词集合中,获取目标医疗话题;
第四获取模块705,用于获取与目标医疗话题相关的医疗话题信息;
推送模块706,用于向终端推送医疗话题信息。
在一种可能的实现方式中,确定模块703,还用于获取命中预设疾病词的目标新闻内容的第一数量,以及,获取与目标查询词相关的目标新闻内容的第二数量;根据第一数量和第二数量,确定目标新闻内容命中预设疾病词的命中比重,命中比重与第二数量呈负相关;根据出现频次和命中比重,确定关键词的医疗热度分数,医疗热度分数与出现频次和命中比重呈正相关。
在另一种可能的实现方式中,确定模块703,还用于获取关键词所属的目标新闻内容的来源站点的站点权重;根据关键词的出现频次、命中比重和站点权重,确定关键词的医疗热度分数,医疗热度分数与出现频次、命中比重和站点权重呈正相关。
在另一种可能的实现方式中,确定模块703,还用于获取关键词的重要度权重,重要度权重用于表示关键词所描述疾病的症状轻重程度;根据出现频次、命中比重和重要度权重,确定关键词的医疗热度分数,医疗热度分数与出现频次、命中比重和重要度权重呈正相关。
在另一种可能的实现方式中,确定模块703,还用于根据关键词集合,确定关键词集合中的疾病种类的第三数量和关键词的第四数量;根据第三数量和第四数量,确定关键词的出现频次,出现频次与第四数量呈负相关。
在另一种可能的实现方式中,第二获取模块702,还用于从目标新闻内容中获取目标新闻内容的新闻标题;根据预设疾病词,从目标新闻内容的新闻标题中获取关键词集合。
在另一种可能的实现方式中,第一获取模块701,还用于根据第一时间段内的新闻搜索日志,获取第一时间段内的查询词的第一出现次数,以及获取第一时间段内的第一查询总数,查询词为第一时间段内的任一查询词,第一时间段包括当前时间,并且,第一时间段在当前时间之前;根据第二时间段内的新闻搜索日志,获取第二时间段内查询词的第二出现次数,以及获取第二时间段内的第二查询总数,第二时间段在第一时间段之前,并且,第一时间段与第二时间段相邻;根据第一出现次数、第二出现次数、第一查询总数和第二查询总数,确定查询词的卡方值,卡方值用于表示查询词的查询热度;将卡方值大于预设阈值的查询词确定为当前时间的目标查询词。
在另一种可能的实现方式中,第四获取模块705,还用于获取目标医疗话题所属的目标新闻内容;将目标医疗话题所属的目标新闻内容确定为与目标医疗话题相关的医疗话题信息。
需要说明的是:上述实施例提供的信息推送装置在进行医疗话题信息的推送时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将服务器的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的信息推送装置与信息推送方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
在本申请实施例中,获取当前时间的目标查询词,该目标查询词的查询热度大于预设阈值;根据该目标查询词,获取与目标查询词相关的目标新闻内容;根据预设疾病词,从目标新闻内容中获取关键词集合,该关键词集合中所包括的关键词与预设疾病词匹配;根据关键词集合中的关键词的出现频次,确定关键词的医疗热度分数;根据关键词的医疗热度分数,从关键词集合中,获取目标医疗话题;获取与目标医疗话题相关的医疗话题信息,向终端推送该医疗话题信息。上述技术方案,根据当前时间的目标查询词,挖掘出当前热门的目标新闻内容,根据目标新闻内容和预设疾病词,从目标新闻内容中挖掘出当前时间的目标医疗话题,进而获取与该目标医疗话题相关的医疗话题信息,提高了医疗话题信息的生产效率。并且,缩短了向终端推送该医疗话题信息相对于目标查询词所代表的新闻事件发生的滞后时间,使医疗话题信息更具有时新性。
图8是本申请实施例提供的一种终端的框图。该终端800可以是:智能手机、平板电脑、可穿戴设备、笔记本电脑或台式电脑。终端800还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。
通常,终端800包括有:处理器801和存储器802。
处理器801可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器801可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器801也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器801可以在集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器801还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器802可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器802还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器802中的非暂态的计算机可读存储介质用于存储至少一条程序代码,该至少一条程序代码用于被处理器801所执行以实现本申请中方法实施例提供的信息推送方法。
在一些实施例中,终端800还可选包括有:外围设备接口803和至少一个外围设备。处理器801、存储器802和外围设备接口803之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口803相连。具体地,外围设备包括:射频电路804、触摸显示屏805、摄像头组件806、音频电路807、定位组件808和电源809中的至少一种。
外围设备接口803可被用于将I/O(Input/Output,输入/输出)相关的至少一个外围设备连接到处理器801和存储器802。在一些实施例中,处理器801、存储器802和外围设备接口803被集成在同一芯片或电路板上;在一些其他实施例中,处理器801、存储器802和外围设备接口803中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。
射频电路804用于接收和发射RF(Radio Frequency,射频)信号,也称电磁信号。射频电路804通过电磁信号与通信网络以及其他通信设备进行通信。射频电路804将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路804包括:天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路804可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于:城域网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity,无线保真)网络。在一些实施例中,射频电路804还可以包括NFC(Near Field Communication,近距离无线通信)有关的电路,本申请对此不加以限定。
显示屏805用于显示UI(User Interface,用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏805是触摸显示屏时,显示屏805还具有采集在显示屏805的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器801进行处理。此时,显示屏805还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。在一些实施例中,显示屏805可以为一个,设置终端800的前面板;在另一些实施例中,显示屏805可以为至少两个,分别设置在终端800的不同表面或呈折叠设计;在再一些实施例中,显示屏805可以是柔性显示屏,设置在终端800的弯曲表面上或折叠面上。甚至,显示屏805还可以设置成非矩形的不规则图形,也即异形屏。显示屏805可以采用LCD(LiquidCrystal Display,液晶显示屏)、OLED(Organic Light-Emitting Diode,有机发光二极管)等材质制备。
摄像头组件806用于采集图像或视频。可选地,摄像头组件806包括前置摄像头和后置摄像头。通常,前置摄像头设置在终端的前面板,后置摄像头设置在终端的背面。在一些实施例中,后置摄像头为至少两个,分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种,以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality,虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中,摄像头组件806还可以包括闪光灯。闪光灯可以是单色温闪光灯,也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合,可以用于不同色温下的光线补偿。
音频电路807可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器801进行处理,或者输入至射频电路804以实现语音通信。出于立体声采集或降噪的目的,麦克风可以为多个,分别设置在终端800的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器801或射频电路804的电信号转换为声波。扬声器可以是传统的薄膜扬声器,也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时,不仅可以将电信号转换为人类可听见的声波,也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中,音频电路807还可以包括耳机插孔。
定位组件808用于定位终端800的当前地理位置,以实现导航或LBS(LocationBased Service,基于位置的服务)。定位组件808可以是基于美国的GPS(GlobalPositioning System,全球定位系统)、中国的北斗系统、俄罗斯的格雷纳斯系统或欧盟的伽利略系统的定位组件。
电源809用于为终端800中的各个组件进行供电。电源809可以是交流电、直流电、一次性电池或可充电电池。当电源809包括可充电电池时,该可充电电池可以支持有线充电或无线充电。该可充电电池还可以用于支持快充技术。
在一些实施例中,终端800还包括有一个或多个传感器810。该一个或多个传感器810包括但不限于:加速度传感器、陀螺仪传感器、压力传感器、指纹传感器、光学传感器以及接近传感器。
本领域技术人员可以理解,图8中示出的结构并不构成对终端800的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
图9是本申请实施例提供的一种服务器的框图,该服务器900可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(Central Processing Units,CPU)901和一个或一个以上的存储器902,其中,存储器902中存储有至少一条程序代码,至少一条程序代码由处理器901加载并执行以实现上述各个方法实施例提供的信息推送方法。当然,该服务器还可以具有有线或无线网络接口、键盘以及输入输出接口等部件,以便进行输入输出,该服务器还可以包括其他用于实现设备功能的部件,在此不做赘述。
在示例性实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有至少一条程序代码,上述至少一条程序代码可由计算机设备中的处理器执行以完成上述实施例中的信息推送方法。例如,计算机可读存储介质可以是ROM(Read-OnlyMemory,只读存储器)、RAM(Random Access Memory,随机存取存储器)、CD-ROM(CompactDisc Read-Only Memory,只读光盘)、磁带、软盘和光数据存储设备等。
本申请还提供了一种计算机程序产品,计算机程序产品包括一个或多个计算机程序,计算机程序被处理器执行时,用于实现上述各个方法实施例提供的信息推送方法。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本申请的可选实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (8)

1.一种信息推送方法,其特征在于,所述方法包括:
获取当前时间的目标查询词,所述目标查询词的查询热度大于预设阈值;
根据所述目标查询词,获取与所述目标查询词相关的目标新闻内容;
根据预设疾病词,从所述目标新闻内容中获取关键词集合,所述关键词集合中所包括的关键词与所述预设疾病词匹配;
获取命中所述预设疾病词的目标新闻内容的第一数量,以及,获取与所述目标查询词相关的目标新闻内容的第二数量;
根据所述第一数量和所述第二数量,确定所述目标新闻内容命中所述预设疾病词的命中比重,所述命中比重与所述第二数量呈负相关;
获取所述关键词的重要度权重,所述重要度权重用于表示所述关键词所描述疾病的症状轻重程度;
根据所述关键词的出现频次、所述命中比重和所述重要度权重,确定所述关键词的医疗热度分数,所述医疗热度分数与所述出现频次、所述命中比重和所述重要度权重呈正相关;
根据所述关键词的医疗热度分数,从所述关键词集合中,获取目标医疗话题;
获取与所述目标医疗话题相关的医疗话题信息,向终端推送所述医疗话题信息。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取所述关键词所属的目标新闻内容的来源站点的站点权重;
根据所述关键词的出现频次、所述命中比重和所述站点权重,确定所述关键词的医疗热度分数,所述医疗热度分数与所述出现频次、所述命中比重和所述站点权重呈正相关。
3.根据权利要求1所述的方法,其特征在于,所述根据所述关键词的出现频次、所述命中比重和所述重要度权重,确定所述关键词的医疗热度分数之前,所述方法还包括:
根据所述关键词集合,确定所述关键词集合中的疾病种类的第三数量和所述关键词的第四数量;
根据所述第三数量和所述第四数量,确定所述关键词的出现频次,所述出现频次与所述第四数量呈负相关。
4.根据权利要求1所述的方法,其特征在于,所述根据预设疾病词,从所述目标新闻内容中获取关键词集合,包括:
从所述目标新闻内容中获取所述目标新闻内容的新闻标题;
根据预设疾病词,从所述目标新闻内容的新闻标题中获取所述关键词集合。
5.根据权利要求1所述的方法,其特征在于,所述获取当前时间的目标查询词,包括:
根据第一时间段内的新闻搜索日志,获取所述第一时间段内的查询词的第一出现次数,以及获取所述第一时间段内的第一查询总数,所述查询词为所述第一时间段内的任一查询词,所述第一时间段包括所述当前时间,并且,所述第一时间段在所述当前时间之前;
根据第二时间段内的新闻搜索日志,获取所述第二时间段内所述查询词的第二出现次数,以及获取所述第二时间段内的第二查询总数,所述第二时间段在所述第一时间段之前,并且,所述第一时间段与所述第二时间段相邻;
根据所述第一出现次数、所述第二出现次数、所述第一查询总数和所述第二查询总数,确定所述查询词的卡方值,所述卡方值用于表示所述查询词的查询热度;
将卡方值大于预设阈值的查询词确定为当前时间的目标查询词。
6.根据权利要求1所述的方法,其特征在于,所述获取与所述目标医疗话题相关的医疗话题信息,包括:
获取所述目标医疗话题所属的目标新闻内容;
将所述目标医疗话题所属的目标新闻内容确定为与所述目标医疗话题相关的医疗话题信息。
7.一种信息推送装置,其特征在于,所述装置包括:
第一获取模块,用于获取当前时间的目标查询词,所述目标查询词的查询热度大于预设阈值;根据所述目标查询词,获取与所述目标查询词相关的目标新闻内容;
第二获取模块,用于根据预设疾病词,从所述目标新闻内容中获取关键词集合,所述关键词集合中所包括的关键词与所述预设疾病词匹配;
确定模块,用于获取命中所述预设疾病词的目标新闻内容的第一数量,以及,获取与所述目标查询词相关的目标新闻内容的第二数量;根据所述第一数量和所述第二数量,确定所述目标新闻内容命中所述预设疾病词的命中比重,所述命中比重与所述第二数量呈负相关;获取所述关键词的重要度权重,所述重要度权重用于表示所述关键词所描述疾病的症状轻重程度;根据所述关键词的出现频次、所述命中比重和所述重要度权重,确定所述关键词的医疗热度分数,所述医疗热度分数与所述出现频次、所述命中比重和所述重要度权重呈正相关;
第三获取模块,用于根据所述关键词的医疗热度分数,从所述关键词集合中,获取目标医疗话题;
第四获取模块,用于获取与所述目标医疗话题相关的医疗话题信息;
推送模块,用于向终端推送所述医疗话题信息。
8.一种服务器,其特征在于,所述服务器包括处理器和存储器,所述存储器中存储有至少一条程序代码,所述至少一条程序代码由所述处理器加载并执行,以实现如权利要求1-6任一项所述的信息推送方法。
CN202010231110.4A 2020-03-27 2020-03-27 信息推送方法、装置及服务器 Active CN111444429B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010231110.4A CN111444429B (zh) 2020-03-27 2020-03-27 信息推送方法、装置及服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010231110.4A CN111444429B (zh) 2020-03-27 2020-03-27 信息推送方法、装置及服务器

Publications (2)

Publication Number Publication Date
CN111444429A CN111444429A (zh) 2020-07-24
CN111444429B true CN111444429B (zh) 2023-04-07

Family

ID=71654063

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010231110.4A Active CN111444429B (zh) 2020-03-27 2020-03-27 信息推送方法、装置及服务器

Country Status (1)

Country Link
CN (1) CN111444429B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112084448B (zh) * 2020-08-31 2024-05-07 北京金堤征信服务有限公司 相似信息处理方法以及装置
CN112100498A (zh) * 2020-09-16 2020-12-18 北京百度网讯科技有限公司 疾病舆情的监控方法、装置
CN112861005A (zh) * 2021-02-22 2021-05-28 上海风秩科技有限公司 用于信息推送的方法及装置、设备
CN114496198B (zh) 2022-04-06 2022-06-28 成都秦川物联网科技股份有限公司 一种基于物联网的智慧城市疫苗调度方法和系统
CN115314550B (zh) * 2022-08-17 2023-08-25 常州市儿童医院(常州市第六人民医院) 基于数字化的智慧医疗信息推送方法及系统

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105893440A (zh) * 2015-12-15 2016-08-24 乐视网信息技术(北京)股份有限公司 一种关联应用的推荐方法及装置
CN107203631A (zh) * 2017-05-31 2017-09-26 成都明途科技有限公司 基于互联网技术的高质量新闻推送方法
CN107784092A (zh) * 2017-10-11 2018-03-09 深圳市金立通信设备有限公司 一种推荐热词的方法、服务器及计算机可读介质
CN108399241A (zh) * 2018-02-28 2018-08-14 福州大学 一种基于多类特征融合的新兴热点话题检测系统
CN108572990A (zh) * 2017-03-14 2018-09-25 百度在线网络技术(北京)有限公司 信息推送方法和装置
CN108733706A (zh) * 2017-04-20 2018-11-02 腾讯科技(深圳)有限公司 热度信息的生成方法和装置
CN110399548A (zh) * 2018-04-20 2019-11-01 北京搜狗科技发展有限公司 一种搜索处理方法、装置、电子设备以及存储介质
CN110457580A (zh) * 2019-07-31 2019-11-15 百度时代网络技术(北京)有限公司 基于搜索的热点推荐方法及装置
CN110545233A (zh) * 2019-08-09 2019-12-06 五八有限公司 一种信息推送方法、装置、电子设备及存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4587236B2 (ja) * 2008-08-26 2010-11-24 Necビッグローブ株式会社 情報検索装置、情報検索方法、およびプログラム

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105893440A (zh) * 2015-12-15 2016-08-24 乐视网信息技术(北京)股份有限公司 一种关联应用的推荐方法及装置
CN108572990A (zh) * 2017-03-14 2018-09-25 百度在线网络技术(北京)有限公司 信息推送方法和装置
CN108733706A (zh) * 2017-04-20 2018-11-02 腾讯科技(深圳)有限公司 热度信息的生成方法和装置
CN107203631A (zh) * 2017-05-31 2017-09-26 成都明途科技有限公司 基于互联网技术的高质量新闻推送方法
CN107784092A (zh) * 2017-10-11 2018-03-09 深圳市金立通信设备有限公司 一种推荐热词的方法、服务器及计算机可读介质
CN108399241A (zh) * 2018-02-28 2018-08-14 福州大学 一种基于多类特征融合的新兴热点话题检测系统
CN110399548A (zh) * 2018-04-20 2019-11-01 北京搜狗科技发展有限公司 一种搜索处理方法、装置、电子设备以及存储介质
CN110457580A (zh) * 2019-07-31 2019-11-15 百度时代网络技术(北京)有限公司 基于搜索的热点推荐方法及装置
CN110545233A (zh) * 2019-08-09 2019-12-06 五八有限公司 一种信息推送方法、装置、电子设备及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Habibi,Maryam等.Keyword exraction and clustering for document recommendation in converdation.《IEEE/ACM Transactions on Audio Speech and language proceeding》.2015,第23卷(第4期),746-759页. *
孙励 . 基于微博的热点话题发现.《中国优秀硕士学位论文全文数据库 信息科技辑》.2013,I139-275. *

Also Published As

Publication number Publication date
CN111444429A (zh) 2020-07-24

Similar Documents

Publication Publication Date Title
CN111444429B (zh) 信息推送方法、装置及服务器
CN107480158B (zh) 基于相似性得分评估内容项目与图像的匹配的方法和系统
WO2020156389A1 (zh) 信息推送方法和装置
CN105701254B (zh) 一种信息处理方法和装置、一种用于信息处理的装置
CN111858971B (zh) 多媒体资源推荐方法、装置、终端及服务器
CN107958042B (zh) 一种目标专题的推送方法及移动终端
CN108717432B (zh) 资源查询方法及装置
CN111428522B (zh) 翻译语料生成方法、装置、计算机设备及存储介质
CN103620637B (zh) 对于精简空间情境信息的音频呈现
CN111177180A (zh) 一种数据查询方法、装置以及电子设备
CN111563151B (zh) 一种信息采集的方法、会话配置的方法、装置及存储介质
CN108427761B (zh) 一种新闻事件处理的方法、终端、服务器及存储介质
CN111435377B (zh) 应用推荐方法、装置、电子设备以及存储介质
CN112464052A (zh) 反馈信息的处理方法、显示方法、装置及电子设备
CN114661811A (zh) 数据展示方法、装置、电子设备及存储介质
US20140297672A1 (en) Content service method and system
CN110895587B (zh) 用于确定目标用户的方法和装置
CN114328945A (zh) 知识图谱对齐方法、装置、设备以及存储介质
CN114281936A (zh) 分类方法、装置、计算机设备及存储介质
CN106850762B (zh) 一种消息推送方法、服务器及消息推送系统
CN110598067B (zh) 词语权重获取方法、装置及存储介质
CN111638819B (zh) 评论显示方法、装置、可读存储介质及系统
CN111428523B (zh) 翻译语料生成方法、装置、计算机设备及存储介质
CN114707075A (zh) 一种冷启动推荐方法和设备
CN112784201A (zh) 网页显示方法、装置、终端及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant