CN110188248A - 基于新闻问答交互系统的数据处理方法、装置及电子设备 - Google Patents
基于新闻问答交互系统的数据处理方法、装置及电子设备 Download PDFInfo
- Publication number
- CN110188248A CN110188248A CN201910453454.7A CN201910453454A CN110188248A CN 110188248 A CN110188248 A CN 110188248A CN 201910453454 A CN201910453454 A CN 201910453454A CN 110188248 A CN110188248 A CN 110188248A
- Authority
- CN
- China
- Prior art keywords
- news
- inquired
- read statement
- keyword
- query
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9032—Query formulation
- G06F16/90332—Natural language query formulation or dialogue systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请实施例提供了一种基于新闻问答交互系统的数据处理方法、装置及电子设备。该方法包括:获取针对新闻事件进行查询的输入语句;基于预构建的新闻知识图谱,查询与输入语句对应的第一查询结果;若依据新闻知识图谱未查找到输入语句对应的第一查询结果,则利用预设的推荐系统进行查询,得到输入语句对应的第二查询结果。本申请实施例采取将新闻知识图谱与推荐系统结合的方式,扩大了现有新闻问答交互系统的查询范围,解决了现有新闻问答交互系统查询效果差的问题,提高了用户的使用体验。
Description
技术领域
本申请涉及数据处理技术领域,具体而言,本申请涉及一种基于新闻问答交互系统的数据处理方法、装置及电子设备。
背景技术
随着信息时代的发展,每天都有形式各样的海量数据出现,但是数据质量不高,冗杂信息多的情况非常常见。为了提高网民快速获得查询结果的速度,问答交互系统应运产生。
现有的新闻问答交互系统主要是基于海量问题答案库的问答交互系统,即根据用户的输入从问题答案库(即QA库)中找到最相近的问题,并将对应的答案进行返回,从而完成问答交互的目的。因此,现有的新闻问答交互系统存在仅在海量问题答案库进行查询,导致查询范围窄,查询效果差,并且用户使用体验低的问题。
发明内容
本申请提供了一种基于新闻问答交互系统的数据处理方法、装置、电子设备及计算机可读存储介质,可以解决上述技术问题。所述技术方案如下:
第一方面,本申请提供了一种基于新闻问答交互系统的数据处理方法,该方法包括:
获取针对新闻事件进行查询的输入语句;
基于预构建的新闻知识图谱,查询与输入语句对应的第一查询结果;
若依据新闻知识图谱未查找到输入语句对应的第一查询结果,利用预设的推荐系统进行查询,得到输入语句对应的第二查询结果。
第二方面,本申请提供了一种基于新闻问答交互系统的数据处理装置,该装置包括:
数据获取模块,用于获取针对新闻事件进行查询的输入语句;
第一查询模块,用于基于预构建的新闻知识图谱,查询与输入语句对应的第一查询结果;
第二查询模块,用于若依据新闻知识图谱未查找到输入语句对应的第一查询结果,利用预设的推荐系统进行查询,得到输入语句对应的第二查询结果。
第三方面,本申请提供了一种电子设备,该电子设备包括:
一个或多个处理器;
存储器;
一个或多个应用程序,其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于:执行上述基于新闻问答交互系统的数据处理方法。
第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述基于新闻问答交互系统的数据处理方法。
本申请实施例提供的技术方案带来的有益效果是:获取针对新闻事件进行查询的输入语句,以便基于预构建的新闻知识图谱,查询与输入语句对应的第一查询结果,并在依据新闻知识图谱未查找到输入语句对应的第一查询结果的条件下,利用预设的推荐系统句进行查询,得到输入语句对应的第二查询结果,通过新闻知识图谱向用户提供精确的查询的目的,起到了提高现有新闻问答交互系统查询精确地的作用,又采取将新闻知识图谱与推荐系统结合的方式,扩大了现有新闻问答交互系统的查询范围,解决了现有新闻问答交互系统查询效果差的问题,提高了用户的使用体验。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对本申请实施例描述中所需要使用的附图作简单地介绍。
图1为本申请实施例提供的一种基于新闻问答交互系统的数据处理方法的流程示意图;
图2为本申请实施例提供的另一种基于新闻问答交互系统的数据处理方法中预处理的流程示意图;
图3为本申请实施例提供的又一种基于新闻问答交互系统的数据处理方法中依据新闻知识图谱进行查询的一个实施例的示意图;
图4为本申请实施例提供的一种基于新闻问答交互系统的数据处理装置的结构示意图;
图5为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能解释为对本申请的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本申请的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
首先对本申请涉及的几个名词进行介绍和解释:
新闻知识图谱是显示新闻知识(如事件或新闻内容)之间关联的图谱,用可视化技术描述新闻知识资源及其载体,挖掘、分析、构建、绘制和显示新闻知识及它们之间的相互联系。
推荐系统是指利用电子新闻网站向用户提供新闻查询信息和建议的系统,可以根据用户的输入(如浏览记录、点赞信息、评论信息等)以及近期的查询,并向用户推荐用户感兴趣的新闻。
使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
下面以具体地实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行描述。
实施例一
本申请实施例提供了一种基于新闻问答交互系统的数据处理方法,如图1所示,该方法包括:步骤S110、步骤S120和步骤S130。
步骤S110、获取针对新闻事件进行查询的输入语句。
本申请实施例中,服务器获取用户输入的针对新闻事件进行查询的输入语句,具体地,输入语句来自提供新闻信息查询功能的新闻问答交互系统,实际应用时,输入语句既可以是新闻问答交互系统接收到的文本数据,也可以是新闻问答交互系统接收到的语音数据。
步骤S120、基于预构建的新闻知识图谱,查询与输入语句对应的第一查询结果。
本申请实施例中,通过对新闻1至新闻N中各新闻事件进行抽取,得到各个新闻事件对应的事件(即关键词)及事件属性(即关键词属性),并建立各新闻事件对应的事件及事件属性的关联,形成图谱,得到新闻知识图谱,以便后续在查询新闻事件时,能够在对输入语句进行抽取处理后,利用抽取得到的内容在新闻知识图谱中进行查询。
实际应用时,本申请提供的新闻知识图谱中的数据来源可以是结构化数据、半结构化数据和非结构化数据。其中,非结构化数据大多为网页文本数据,经过实体识别和实体关系抽取后,存放在关系型数据库中。实际应用时,新闻知识图谱中的数据存储可以是资源描述框架RDF三元组(实体1、关系、实体2)的形式、也可以借助关系型图形数据库Neo4j以可视化图的方式展示。其中,RDF和Neo4j本质上是一种数据模型,用于存放结构化数据,RDF数据是元数据,即描述数据的数据,目的是让计算机可读而非向用户展示。RDF三元组可借助Neo4j转变为图数据,RDF数据的查询语言为SPARQL,Neo4j图数据的查询语言为描述性的图形查询语言Cyper。因此,本申请实施例提供的新闻知识图谱是语义网络,是基于有向图的数据结构,在新闻知识图谱的图中有节点(Nodes)和关系(Relationships),节点代表实体或概念,关系可以将节点连接起来,节点和关系都可以有对应的属性。
步骤S130、若依据新闻知识图谱未查找到输入语句对应的第一查询结果,则利用预设的推荐系统进行查询,得到输入语句对应的第二查询结果。
本申请实施例,获取针对新闻事件进行查询的输入语句,以便基于预构建的新闻知识图谱,查询与输入语句对应的第一查询结果,并在依据新闻知识图谱未查找到输入语句对应的第一查询结果的条件下,利用预设的推荐系统句进行查询,得到输入语句对应的第二查询结果,通过新闻知识图谱向用户提供精确的查询的目的,起到了提高现有新闻问答交互系统查询精确地的作用,又采取将新闻知识图谱与推荐系统结合的方式,扩大了现有新闻问答交互系统的查询范围,解决了现有新闻问答交互系统查询效果差的问题,提高了用户的使用体验。
实际应用时,可以预设接口实现利用的第三方提供的推荐系统,例如,通过预设接口将输入语句发送至XX推荐系统(即第三方提供的推荐系统),以便XX推荐系统进行查询。
在一个实现方式中,如图2所示,步骤S120,基于预构建的新闻知识图谱,查询与输入语句对应的第一查询结果,包括:
步骤S121、对输入语句进行分词,得到第一分词结果;
步骤S122、对第一分词结果进行抽取处理,得到第一关键词和第一关键词对应的属性信息,并依据第一关键词和第一关键词对应的属性信息,生成第一查询信息;
步骤S123、利用第一查询信息在新闻知识图谱中进行查询。
本申请实施例通过对输入语句的分词处理,得到第一分词结果,以便对第一分词结果进行抽取处理,得到第一关键词和第一关键词对应的属性特征,从而依据第一关键词和第一关键词对应的属性信息生成符合新闻知识图谱的输入要求的第一查询信息,保证能够利用新闻知识图谱中各个节点以及节点关系查询到第一查询信息对应的第一查询结果。
例如,假设输入语句为“美国的总统是谁”,对该输入语句分词并进行抽取处理后,得到第一关键词:“美国”、“总统”、“谁”,“美国”对应的属性信息为国家,“总统”对应的属性信息为职位,“谁”对应的属性信息为人物,再依据第一关键词:“美国”、“总统”、“谁”和这三个第一关键词分别对应的属性信息:国家、职位、人物,生成第一查询信息,以便根据第一查询信息在新闻知识图谱中进行查询,如在国家节点中查找到美国,在职位节点中查找到总统,在人物关系中查找到最终的结果。
实际应用时,可以采用多种方式对第一分词结果进行抽取,确定第一分词结果的第一关键字以及第一关键字对应的属性信息,如采用命名实体识别方式确定第一关键字对应的属性信息,如确定第一关键字“美国”对应的属性信息为国家;通过术语抽取方式确定第一关键字,如抽取分词结果中“DNA”为第一关键词;再如,通过关系抽取方式确定输入语句中各第一关键字的关系,如确定第一关键字A与第二关键字B的关系为父子关系。实际应用时,还可以选择利用正则表达式对第一分词结果进行抽取,抽取到第一关键词和第一关键词对应的属性信息。
在另一个实现方式中,如图3所示,步骤S130中利用预设的推荐系统进行查询,得到输入语句对应的第二查询结果,包括:
步骤S131、对输入语句进行分词,得到第二分词结果;
步骤S132、提取第二分词结果对应的第二关键词,并将第二关键词作为第二查询信息在推荐系统中进行查询。
例如,假设输入语句为“美国的总统是谁”,对该进行分词,得到的分词结果为“美国/的/总统/是/谁”,对该分词结果进行关键词提取,得到的第二关键词可能为:“美国”、“总统”,将第二关键词作为第二查询信息,以便在推荐系统中进行查询,得到第二查询结果。
实际应用时,可以利用专业的分词系统对输入语句进行分词;也可以利用通过预先存储的分词表对输入语句进行分词,例如,若分词表中存储有“DNA”这个词组,那么分词时,若输入语句中包括这个词组组合,则将这个词组组合划分为一个分词。
需要说明的是,实际应用时可以采用任意分词方法对输入语句进行分词,具体地,步骤S121采用的分词方法与步骤S131采用的分词方法可能相同,也可能不同。因此,若得到第一分词结果采用的分词方法与得到第二分词结果采用的分词方法一致,那么第一分词结果与第二分词结果则相同;若得到第一分词结果采用的分词方法与得到第二分词结果采用的分词方法不同,那么第一分词结果与第二分词结果可能不同。
在又一个实现方式中,如图3所示,步骤S132中将第二关键词作为第二查询信息在推荐系统中进行查询,包括:
步骤S1321(图中未示出)、在推荐系统提供的各个推荐模式中,确定所述第二查询信息对应的目标推荐模式,并依据目标推荐模式在推荐系统中进行查询。
本申请实施例中,推荐系统提供的推荐模式一般包括热点新闻推荐模式和用户行为推荐模式。具体地,热点新闻推荐模式是指推荐最新新闻的模式,例如,若输入语句为“今天的热点新闻”,根据该输入语句提取到的第二查询信息中包括关键词“热点”,因此,确定关键词“热点”对应的目标推荐模式为热点新闻推荐模式。具体地,用户行为推荐模式是指根据用户的行为(即某一段时间内用户对网页的操作行为,如用户在网页页面的浏览时间、点击次数、点赞等行为)进行推荐的模式,实际应用时,可以将用户行为推荐模式设置为默认的推荐模式,推荐系统直接以用户行为推荐模式进行查询。
在又一个实现方式中,步骤S1321中依据目标推荐模式在推荐系统中进行查询,包括:
若目标推荐模式为用户行为推荐模式,则获取该用户的历史查询记录,并依据历史查询记录确定该用户的兴趣点;
依据该用户的兴趣点在推荐系统的用户行为推荐中进行查询,得到兴趣点对应的推荐结果。
实际应用时,服务器可以通过日志数据库,获取该用户的历史查询记录,具体地,可以获取预定时间段的该用户的历史查询记录,如获取最近三天的该用户的历史查询记录,获取最近一个月的该用户的历史查询记录。实际应用时,预定时间段可以是默认的,也可以自定义设置。通过用户行为推荐模式的查询,起到快速提供用户感兴趣的新闻事件的作用,并且提高了新闻事件的点击率。
在又一个实现方式中,步骤S1321中依据目标推荐模式在推荐系统中进行查询,包括:
若目标推荐模式为用户行为推荐模式,则获取推荐系统对应的查询日志,并统计查询日志中各新闻事件对应的点击率;
依据各新闻事件对应的点击率,生成相应的热点新闻推荐列表,以进行推送。
本申请实施例通过点击率的统计,实现了确定各新闻事件被点击的次数与被显示次数之比的目的,以便快速筛选热点新闻,以推送至用户。实际应用时,服务器既可以在生成热点新闻类表后直接推送,也可以在接收到来自新闻问答交互系统发送的热点新闻获取请求后推送。
实际应用时,推荐系统提供的推荐模式还可以包括闲聊推荐模式、关键词推荐模式、热榜推荐模式、地点推荐模式等推荐模式。具体地,闲聊推荐模式是指根据用户的意图(如聊天)进行推荐的模式,例如,若输入语句为“嗨,XXX”,根据该输入语句提取到的第二查询信息中包括针对聊天的关键词“嗨”,可以确定目标推荐模式为闲聊推荐模式。具体地,热榜推荐模式是指将新闻事件按照其所属的榜单进行查询的推荐模式,具体地,热榜推荐模式可以有将新闻事件按照话题进行分类的话题榜进行推荐的模式、将新闻事件按照周划分的周榜进行推荐的模式、将新闻事件按照月划分的月榜进行推荐的模式等。例如,假设输入语句为“本周新闻事件有什么”,根据该输入语句提取到的第二查询信息中包括针对榜单的关键词“本周”,因此,确定的目标推荐模式为热榜推荐模式,并且可以确定为按照周榜进行推荐。具体地,地点推荐模式是指根据地点进行推荐的模式,地点推荐模式可以推荐旅游景点、游泳馆、餐馆等。例如,假设输入语句为“北京的景点有什么”,根据输入语句提取到的第二查询信息中包括针对景点的关键词“景点”和“北京”,因此,确定的目标推荐模式为地点推荐模式。具体地,关键词推荐模式是指根据关键词进行推荐的模式,例如,若根据输入语句提到的第二查询信息包括“黄金”、“价格”和“波动”三个关键词,这三个关键词均非是指向其他推荐模式的关键词,那么确定的目标推荐模式为关键词推荐模式。
实际应用时,本申请提供的推荐系统采用的推荐模式可以默认同时使用上述几个推荐模式,也可以根据用户需求进行调整。例如,用户选定热点新闻推荐模式为推荐系统的推荐模式。
实施例二
下面以应用本申请提供的方法的服务器为例对本申请进行详细说明。
将预构建的新闻类知识图谱以及预设的推荐系统应用至本申请实施例提供的服务器。应用时,假设服务器获取到的输入语句为“美国的总统是谁”,在利用新闻知识图谱进行查询的情形下,服务器首先对“美国的总统是谁”分词,得到第一分词结果,并对第一分词结果进行抽取处理,例如抽取到三个第一关键词,分别为“美国”、“总统”和“谁”,其中,“美国”对应的属性信息为国家,“总统”对应的属性信息为职位,“谁”对应的属性信息为人物,依据上述抽取到的第一关键词和第一关键词对应的属性信息,生成第一查询信息,将第一查询信息在新闻知识图谱中进行查询,从而实现利用预构建的新闻知识图谱进行查询的目的。若新闻知识图谱未查找到输入语句对应的第一查询结果,服务器则利用预设的推荐系统进行查询,即先对输入语句进行分词处理,得到第二分词结果,再提取第二分词结果对应的第二关键词,将提取到的第二关键词作为第二查询信息,以在推荐系统中进行查询。通过将新闻知识图谱和推荐系统结合的方式,既能利用新闻知识图谱为用户提供精确的查询,又保证了在新闻知识图谱无法查找到精确的查询结果的前提下,能够利用推荐系统实现向用户提供查询功能的目的,解决现有新闻问答交互系统的答复率低的问题。
服务器可以利用推荐系统对输入语句进行识别,判断对输入语句进行查询利用的推荐模式,即在推荐系统提供的各推荐模式中确定第二查询信息对应的目标推荐模式,缩小推荐系统的查询范围,以便实现快速查询的目的。例如,若目标推荐模式为用户行为推荐模式,那么获取当前用户的历史查询记录,并根据历史查询记录确定当前用户的兴趣点,以在用户行为推荐模式下进行查询,起到缩小推荐系统查询的范围的作用,实现快速查询,利用推荐系统向用户提供内容推荐的目的。再如,若目标推荐模式为热点新闻推荐模式,那么获取推荐系统对应的查询日志,并统计查询日志中各新闻事件对应的点击率;依据各新闻事件对应的点击率,生成相应的热点新闻推荐列表,以进行推送。
实施例三
本申请实施例提供了一种基于新闻问答交互系统的数据处理装置,如图4所示,该基于新闻问答交互系统的数据处理装置40可以包括:数据获取模块401、第一查询模块402以及第二查询模块403,其中,
数据获取模块401,用于获取针对新闻事件进行查询的输入语句;
第一查询模块402,用于基于预构建的新闻知识图谱,查询与输入语句对应的第一查询结果;
第二查询模块403,用于若依据新闻知识图谱未查找到输入语句对应的第一查询结果,则利用预设的推荐系统进行查询,得到输入语句对应的第二查询结果。
本申请实施例中,获取针对新闻事件进行查询的输入语句,以便基于预构建的新闻知识图谱,查询与输入语句对应的第一查询结果,并在依据新闻知识图谱未查找到输入语句对应的第一查询结果的条件下,利用预设的推荐系统句进行查询,得到输入语句对应的第二查询结果,通过新闻知识图谱向用户提供精确的查询的目的,起到了提高现有新闻问答交互系统查询精确地的作用,又采取将新闻知识图谱与推荐系统结合的方式,扩大了现有新闻问答交互系统的查询范围,解决了现有新闻问答交互系统查询效果差的问题,提高了用户的使用体验。
进一步地,第一查询模块用于:
对输入语句进行分词,得到第一分词结果;
对第一分词结果进行抽取处理,得到第一关键词和第一关键词对应的属性信息,并依据第一关键词和第一关键词对应的属性信息,生成第一查询信息;
利用第一查询信息在新闻知识图谱中进行查询。
进一步地,第二查询模块用于:
对输入语句进行分词,得到第二分词结果;
提取第二分词结果对应的第二关键词,并将第二关键词作为第二查询信息在推荐系统中进行查询。
进一步地,第二查询模块用于:
在推荐系统提供的各个推荐模式中确定第二查询信息对应的目标推荐模式,并依据目标推荐模式在推荐系统中进行查询。
更进一步地,第二查询模块用于:
若目标推荐模式为用户行为推荐模式,则获取该用户的历史查询记录,并依据历史查询记录确定该用户的兴趣点;
依据该用户的兴趣点在推荐系统中进行查询,得到兴趣点对应的推荐结果。
更进一步地,第二查询模块用于:
若目标推荐模式为热点新闻推荐模式,则获取推荐系统对应的查询日志,并统计查询日志中各新闻事件对应的点击率;
依据各新闻事件对应的点击率,生成相应的热点新闻推荐列表,以进行推送。
本实施例的基于新闻问答交互系统的数据处理装置可执行本申请实施例一提供的基于新闻问答交互系统的数据处理方法,其实现原理相类似,此处不再赘述。
实施例四
本申请实施例提供了一种电子设备,如图5所示,图5所示的电子设备500包括:处理器5001和存储器5003。其中,处理器5001和存储器5003相连,如通过总线5002相连。进一步地,电子设备500还可以包括收发器5004。需要说明的是,实际应用中收发器5004不限于一个,该电子设备500的结构并不构成对本申请实施例的限定。
处理器5001可以是CPU,通用处理器,DSP,ASIC,FPGA或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器5001也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等。
总线5002可包括一通路,在上述组件之间传送信息。总线5002可以是PCI总线或EISA总线等。总线5002可以分为地址总线、数据总线、控制总线等。为便于表示,图5中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
存储器5003可以是ROM或可存储静态信息和指令的其他类型的静态存储设备,RAM或者可存储信息和指令的其他类型的动态存储设备,也可以是EEPROM、CD-ROM或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。
存储器5003用于存储执行本申请方案的应用程序代码,并由处理器5001来控制执行。处理器5001用于执行存储器5003中存储的应用程序代码,以实现图4所示实施例提供的基于新闻问答交互系统的数据处理装置的动作。
本申请实施例中,获取针对新闻事件进行查询的输入语句,以便基于预构建的新闻知识图谱,查询与输入语句对应的第一查询结果,并在依据新闻知识图谱未查找到输入语句对应的第一查询结果的条件下,利用预设的推荐系统句进行查询,得到输入语句对应的第二查询结果,通过新闻知识图谱向用户提供精确的查询的目的,起到了提高现有新闻问答交互系统查询精确地的作用,又采取将新闻知识图谱与推荐系统结合的方式,扩大了现有新闻问答交互系统的查询范围,解决了现有新闻问答交互系统查询效果差的问题,提高了用户的使用体验。
实施例五
本申请实施例提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该程序被处理器执行时实现实施例一所示的方法。
本申请实施例提供了一种计算机可读存储介质,与现有技术相比,获取针对新闻事件进行查询的输入语句,以便基于预构建的新闻知识图谱,查询与输入语句对应的第一查询结果,并在依据新闻知识图谱未查找到输入语句对应的第一查询结果的条件下,利用预设的推荐系统句进行查询,得到输入语句对应的第二查询结果,通过新闻知识图谱向用户提供精确的查询的目的,起到了提高现有新闻问答交互系统查询精确地的作用,又采取将新闻知识图谱与推荐系统结合的方式,扩大了现有新闻问答交互系统的查询范围,解决了现有新闻问答交互系统查询效果差的问题,提高了用户的使用体验。
本申请实施例提供了一种计算机可读存储介质适用于上述方法实施例。在此不再赘述。
应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
以上所述仅是本申请的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。
Claims (10)
1.一种基于新闻问答交互系统的数据处理方法,其特征在于,包括:
获取针对新闻事件进行查询的输入语句;
基于预构建的新闻知识图谱,查询与所述输入语句对应的第一查询结果;
若依据所述新闻知识图谱未查找到所述输入语句对应的第一查询结果,则利用预设的推荐系统进行查询,得到所述输入语句对应的第二查询结果。
2.根据权利要求1所述的方法,其特征在于,所述基于预构建的新闻知识图谱,查询与所述输入语句对应的第一查询结果,包括:
对所述输入语句进行分词,得到第一分词结果;
对所述第一分词结果进行抽取处理,得到第一关键词和所述第一关键词对应的属性信息,并依据所述第一关键词和所述第一关键词对应的属性信息,生成第一查询信息;
利用所述第一查询信息在所述新闻知识图谱中进行查询。
3.根据权利要求1所述的方法,其特征在于,所述利用预设的推荐系统进行查询,包括:
对所述输入语句进行分词,得到第二分词结果;
提取所述第二分词结果对应的第二关键词,并将所述第二关键词作为第二查询信息在所述推荐系统中进行查询。
4.根据权利要求3所述的方法,其特征在于,所述将所述第二关键词作为第二查询信息在所述推荐系统中进行查询,包括:
在所述推荐系统提供的各个推荐模式中确定所述第二查询信息对应的目标推荐模式,并依据所述目标推荐模式在所述推荐系统中进行查询。
5.根据权利要求4所述的方法,其特征在于,所述依据所述目标推荐模式在所述推荐系统中进行查询,包括:
若所述目标推荐模式为用户行为推荐模式,则获取该用户的历史查询记录,并依据所述历史查询记录确定该用户的兴趣点;
依据该用户的兴趣点在所述推荐系统中进行查询,得到所述兴趣点对应的推荐结果。
6.根据权利要求4所述的方法,其特征在于,所述依据所述目标推荐模式在所述推荐系统中进行查询,包括:
若所述目标推荐模式为热点新闻推荐模式,则获取所述推荐系统对应的查询日志,并统计所述查询日志中各新闻事件对应的点击率;
依据各新闻事件对应的点击率,生成相应的热点新闻推荐列表,以进行推送。
7.一种基于新闻问答交互系统的数据处理装置,其特征在于,包括:
数据获取模块,用于获取针对新闻事件进行查询的输入语句;
第一查询模块,用于基于预构建的新闻知识图谱,查询与所述输入语句对应的第一查询结果;
第二查询模块,用于若依据所述新闻知识图谱未查找到所述输入语句对应的第一查询结果,利用预设的推荐系统进行查询,得到所述输入语句对应的第二查询结果。
8.根据权利要求7所述的装置,其特征在于,所述第一查询模块用于:
对所述输入语句进行分词,得到第一分词结果;
对所述第一分词结果进行抽取处理,得到第一关键词和所述第一关键词对应的属性信息,并依据所述第一关键词和所述第一关键词对应的属性信息,生成第一查询信息;
利用所述第一查询信息在所述新闻知识图谱中进行查询。
9.一种电子设备,其特征在于,其包括:
一个或多个处理器;
存储器;
一个或多个应用程序,其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于:执行根据权利要求1-6任一项所述的基于新闻问答交互系统的数据处理方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-6任一项所述的基于新闻问答交互系统的数据处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910453454.7A CN110188248A (zh) | 2019-05-28 | 2019-05-28 | 基于新闻问答交互系统的数据处理方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910453454.7A CN110188248A (zh) | 2019-05-28 | 2019-05-28 | 基于新闻问答交互系统的数据处理方法、装置及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110188248A true CN110188248A (zh) | 2019-08-30 |
Family
ID=67718366
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910453454.7A Pending CN110188248A (zh) | 2019-05-28 | 2019-05-28 | 基于新闻问答交互系统的数据处理方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110188248A (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110990527A (zh) * | 2019-11-26 | 2020-04-10 | 泰康保险集团股份有限公司 | 自动问答方法及装置、存储介质及电子设备 |
CN111177559A (zh) * | 2019-12-30 | 2020-05-19 | 中国联合网络通信集团有限公司 | 文旅服务推荐方法、装置、电子设备及存储介质 |
CN111506737A (zh) * | 2020-04-08 | 2020-08-07 | 北京百度网讯科技有限公司 | 图数据处理方法、检索方法、装置及电子设备 |
CN112035655A (zh) * | 2020-09-02 | 2020-12-04 | 中国银行股份有限公司 | 银行人力资源系统及工作方法 |
CN112527998A (zh) * | 2020-12-22 | 2021-03-19 | 深圳市优必选科技股份有限公司 | 一种答复推荐方法、答复推荐装置及智能设备 |
CN112711716A (zh) * | 2021-01-25 | 2021-04-27 | 广东工业大学 | 一种基于知识图谱的海洋产业新闻推送方法及系统 |
CN112732951A (zh) * | 2020-12-30 | 2021-04-30 | 青岛海信智慧生活科技股份有限公司 | 一种人机交互的方法及装置 |
CN113836284A (zh) * | 2021-09-26 | 2021-12-24 | 北京京东拓先科技有限公司 | 知识库构建、生成应答语句的方法和装置 |
CN114969383A (zh) * | 2022-08-02 | 2022-08-30 | 深圳易伙科技有限责任公司 | 一种基于零代码开发的应用处理方法和装置 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106250708A (zh) * | 2016-08-16 | 2016-12-21 | 广州比特软件科技有限公司 | 一种在线咨询方法及系统 |
CN107609101A (zh) * | 2017-09-11 | 2018-01-19 | 远光软件股份有限公司 | 智能交互方法、设备及存储介质 |
CN107688606A (zh) * | 2017-07-26 | 2018-02-13 | 北京三快在线科技有限公司 | 一种推荐信息的获取方法及装置,电子设备 |
CN108345663A (zh) * | 2018-02-02 | 2018-07-31 | 新华智云科技有限公司 | 一种新闻推送方法及设备 |
CN109388697A (zh) * | 2018-10-10 | 2019-02-26 | 成都小多科技有限公司 | 处理问答语料的方法、装置及电子终端 |
CN109446387A (zh) * | 2018-10-09 | 2019-03-08 | 众蚁(上海)信息技术有限公司 | 一种基于人工智能的业委会智能问答系统 |
CN109766422A (zh) * | 2018-12-29 | 2019-05-17 | 上海智臻智能网络科技股份有限公司 | 信息处理方法、装置及系统、存储介质、终端 |
-
2019
- 2019-05-28 CN CN201910453454.7A patent/CN110188248A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106250708A (zh) * | 2016-08-16 | 2016-12-21 | 广州比特软件科技有限公司 | 一种在线咨询方法及系统 |
CN107688606A (zh) * | 2017-07-26 | 2018-02-13 | 北京三快在线科技有限公司 | 一种推荐信息的获取方法及装置,电子设备 |
CN107609101A (zh) * | 2017-09-11 | 2018-01-19 | 远光软件股份有限公司 | 智能交互方法、设备及存储介质 |
CN108345663A (zh) * | 2018-02-02 | 2018-07-31 | 新华智云科技有限公司 | 一种新闻推送方法及设备 |
CN109446387A (zh) * | 2018-10-09 | 2019-03-08 | 众蚁(上海)信息技术有限公司 | 一种基于人工智能的业委会智能问答系统 |
CN109388697A (zh) * | 2018-10-10 | 2019-02-26 | 成都小多科技有限公司 | 处理问答语料的方法、装置及电子终端 |
CN109766422A (zh) * | 2018-12-29 | 2019-05-17 | 上海智臻智能网络科技股份有限公司 | 信息处理方法、装置及系统、存储介质、终端 |
Non-Patent Citations (1)
Title |
---|
杨秀臻: "《图书馆知识管理与服务研究》", 31 July 2018 * |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110990527A (zh) * | 2019-11-26 | 2020-04-10 | 泰康保险集团股份有限公司 | 自动问答方法及装置、存储介质及电子设备 |
CN111177559A (zh) * | 2019-12-30 | 2020-05-19 | 中国联合网络通信集团有限公司 | 文旅服务推荐方法、装置、电子设备及存储介质 |
CN111177559B (zh) * | 2019-12-30 | 2023-05-30 | 中国联合网络通信集团有限公司 | 文旅服务推荐方法、装置、电子设备及存储介质 |
CN111506737A (zh) * | 2020-04-08 | 2020-08-07 | 北京百度网讯科技有限公司 | 图数据处理方法、检索方法、装置及电子设备 |
CN111506737B (zh) * | 2020-04-08 | 2023-12-19 | 北京百度网讯科技有限公司 | 图数据处理方法、检索方法、装置及电子设备 |
CN112035655A (zh) * | 2020-09-02 | 2020-12-04 | 中国银行股份有限公司 | 银行人力资源系统及工作方法 |
CN112035655B (zh) * | 2020-09-02 | 2023-11-21 | 中国银行股份有限公司 | 银行人力资源系统及工作方法 |
CN112527998A (zh) * | 2020-12-22 | 2021-03-19 | 深圳市优必选科技股份有限公司 | 一种答复推荐方法、答复推荐装置及智能设备 |
CN112732951A (zh) * | 2020-12-30 | 2021-04-30 | 青岛海信智慧生活科技股份有限公司 | 一种人机交互的方法及装置 |
CN112711716A (zh) * | 2021-01-25 | 2021-04-27 | 广东工业大学 | 一种基于知识图谱的海洋产业新闻推送方法及系统 |
CN113836284A (zh) * | 2021-09-26 | 2021-12-24 | 北京京东拓先科技有限公司 | 知识库构建、生成应答语句的方法和装置 |
CN114969383A (zh) * | 2022-08-02 | 2022-08-30 | 深圳易伙科技有限责任公司 | 一种基于零代码开发的应用处理方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110188248A (zh) | 基于新闻问答交互系统的数据处理方法、装置及电子设备 | |
US11977568B2 (en) | Building dialogue structure by using communicative discourse trees | |
US11586827B2 (en) | Generating desired discourse structure from an arbitrary text | |
CN107220352B (zh) | 基于人工智能构建评论图谱的方法和装置 | |
US11122009B2 (en) | Systems and methods for identifying geographic locations of social media content collected over social networks | |
JP4465274B2 (ja) | 関連する単語のクラスタに基づいて、文書を特徴付けるための方法および装置 | |
US20120016661A1 (en) | System, method and device for intelligent textual conversation system | |
US20190370604A1 (en) | Automated building of expanded datasets for training of autonomous agents | |
US7925743B2 (en) | Method and system for qualifying user engagement with a website | |
US11720749B2 (en) | Constructing conclusive answers for autonomous agents | |
US20130297694A1 (en) | Systems and methods for interactive presentation and analysis of social media content collection over social networks | |
Piao et al. | A feasibility study on extracting twitter users' interests using nlp tools for serendipitous connections | |
US20100268716A1 (en) | System and methods of providing interactive expertized communications responses using single and multi-channel site-specific integration | |
Magnani et al. | Conversation retrieval for microblogging sites | |
Cvijikj et al. | Understanding the user generated content and interactions on a Facebook brand page | |
Costa et al. | Emotion-based recommender system for overcoming the problem of information overload | |
US20220210098A1 (en) | Providing responses in an event-related session | |
CN107688616A (zh) | 使实体的独特事实显现 | |
Çetinkaya et al. | Developing a Twitter bot that can join a discussion using state-of-the-art architectures | |
Jeong et al. | Improving response capability of chatbot using twitter | |
CN112507139A (zh) | 基于知识图谱的问答方法、系统、设备及存储介质 | |
JP2008158792A (ja) | ネットワークサーバ及び制御方法 | |
Baek et al. | Knowledge-augmented large language models for personalized contextual query suggestion | |
US20170124090A1 (en) | Method of discovering and exploring feature knowledge | |
Petry et al. | ICARE. A context-sensitive expert recommendation system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190830 |