CN109815482B - 一种新闻交互的方法、装置、设备和计算机存储介质 - Google Patents

一种新闻交互的方法、装置、设备和计算机存储介质 Download PDF

Info

Publication number
CN109815482B
CN109815482B CN201811541693.XA CN201811541693A CN109815482B CN 109815482 B CN109815482 B CN 109815482B CN 201811541693 A CN201811541693 A CN 201811541693A CN 109815482 B CN109815482 B CN 109815482B
Authority
CN
China
Prior art keywords
input information
news
information
question
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811541693.XA
Other languages
English (en)
Other versions
CN109815482A (zh
Inventor
黄硕
林加新
付志宏
詹金波
凌光
黄世维
周古月
周超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201811541693.XA priority Critical patent/CN109815482B/zh
Publication of CN109815482A publication Critical patent/CN109815482A/zh
Priority to US16/713,058 priority patent/US11397852B2/en
Application granted granted Critical
Publication of CN109815482B publication Critical patent/CN109815482B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/04Segmentation; Word boundary detection

Abstract

本发明提供了一种新闻交互的方法、装置、设备和计算机存储介质,所述方法包括:获取用户在阅读当前新闻内容时输入的输入信息;基于所述当前新闻内容获取所述输入信息的解析信息,所述解析信息包括输入信息的意图信息;根据所述输入信息的意图信息将所述输入信息分发至至少一个新闻交互服务子系统,并接收所述至少一个新闻交互服务子系统返回的返回结果;根据预设策略从所述返回结果中选取展示结果,将选取得到的展示结果提供给用户。本发明能够丰富当前新闻资讯应用的交互功能,满足用户多样的交互需求,向用户提供更为多样的返回结果。

Description

一种新闻交互的方法、装置、设备和计算机存储介质
【技术领域】
本发明涉及互联网技术领域,尤其涉及一种新闻交互的方法、装置、设备和计算机存储介质。
【背景技术】
现有的新闻资讯类应用通常仅具有以下功能:通过语音播报的形式单向地向用户推送新闻内容;支持语音控制,例如接收用户语音输入的“下一条”、“暂停”、“继续”或者“切换领域”等简单的控制指令,实现语音播报新闻的切换、语音播报新闻的暂停等。但是,现有的新闻资讯类应用无法满足用户对当前所阅读的新闻内容提出的相关交互需求,例如用户对当前新闻内容的提问。
【发明内容】
有鉴于此,本发明提供了一种新闻交互的方法、装置、设备和计算机存储介质,用于丰富当前新闻资讯应用的交互功能,满足用户多样的交互需求,向用户提供更为多样的返回结果。
本发明为解决技术问题所采用的技术方案是提供一种新闻交互的方法,所述方法包括:获取用户在阅读当前新闻内容时输入的输入信息;基于所述当前新闻内容获取所述输入信息的解析信息,所述解析信息包括输入信息的意图信息;根据所述输入信息的意图信息将所述输入信息分发至至少一个新闻交互服务子系统,并接收所述至少一个新闻交互服务子系统返回的返回结果;根据预设策略从所述返回结果中选取展示结果,将选取得到的展示结果提供给用户。
根据本发明一优选实施例,基于所述当前新闻内容获取输入信息的意图信息包括:分别获取在获取所述当前新闻内容时的用户意图以及所述输入信息的用户意图;若未能获取所述输入信息的用户意图,则将在获取当前新闻内容时的用户意图确定为所述输入信息的意图信息,否则将所述输入信息的用户意图确定为所述输入信息的意图信息。
根据本发明一优选实施例,所述输入信息的解析信息还包括所述输入信息的领域信息,基于所述当前新闻内容获取输入信息的领域信息包括:分别获取所述当前新闻内容以及所述输入信息所属的领域;若未能获取所述输入信息所属的领域,则将所述当前新闻内容所属的领域确定为输入信息的领域信息,否则将所述输入信息所属的领域确定为所述输入信息的领域信息。
根据本发明一优选实施例,所述基于所述当前新闻内容获取所述输入信息的解析信息包括:获取在获取所述当前新闻内容时用户输入的上文输入信息;基于所述上文输入信息对所述输入信息进行解析,获取所述输入信息的解析信息。
根据本发明一优选实施例,所述新闻交互服务子系统包括新闻推荐服务子系统、新闻问答服务子系统和新闻聊天服务子系统中的至少一种。
根据本发明一优选实施例,所述新闻问答服务子系统包括篇章精确问答模块、事件图谱问答模块以及问题检索问答模块中的至少一种;所述新闻问答服务子系统将所述输入信息分发至至少一个问答模块,并接收由所述至少一个问答模块返回的答案;对所述返回的答案进行筛选,将筛选得到的答案作为返回结果。
根据本发明一优选实施例,所述方法包括:所述篇章精确问答模块获取用户当前阅读的新闻内容;将所述新闻内容以及所述输入信息作为答案生成模型的输入,将答案生成模型的输出结果作为所述输入信息的答案;其中,所述答案生成模型是预先训练得到的。
根据本发明一优选实施例,所述方法包括:所述事件图谱问答模块对所述输入信息进行切词,将切词结果中预设词性的词语作为查询信息;获取所述输入信息的语义信息,并根据所述语义信息确定所述输入信息对应的事件;根据事件图谱,将所确定的事件中与所述查询信息相匹配的节点构成所述输入信息的答案。
根据本发明一优选实施例,所述方法还包括:所述事件图谱问答模块获取新闻内容,所获取的新闻内容包括用户当前阅读的新闻内容以及用户历史阅读的新闻内容中的至少一种;根据对应所述输入信息的事件,抽取所述新闻内容中与该事件相关的信息对所述查询信息进行补全;根据事件图谱,将所述事件中与补全结果相匹配的节点构成所述输入信息的答案。
根据本发明一优选实施例,所述方法包括:所述问题检索问答模块获取所述输入信息的语义信息;在问答对数据库中确定与所述输入信息的语义信息相匹配的问题;将问答数据库中与所确定的问题对应的答案作为所述输入信息的答案;其中,所述问答数据库中包含多个问题答案对。
根据本发明一优选实施例,所述问答数据库中的问题答案对通过以下方式获取:从网络上抓取新闻;将所抓取的新闻输入问答对生成模型,将所述问答对生成模型的输出结果作为问题答案对;将所获取的问题答案对存储到问答对数据库中;其中,所述问答对生成模型是预先训练得到的。
根据本发明一优选实施例,所述对所述至少一个问答模块返回的答案进行筛选包括:从多个答案中随机选取一个答案作为返回结果;或者根据各问答模块预设的置信度,将置信度最高的问答模块所获取的答案作为返回结果。
根据本发明一优选实施例,所述方法还包括:所述新闻推荐服务子系统获取所述输入信息的领域信息;从新闻数据库中获取满足所述领域信息的新闻;从所获取的新闻中选取满足所述输入信息的新闻作为候选新闻,将所述候选新闻作为返回结果。
根据本发明一优选实施例,所述方法还包括:所述新闻聊天服务子系统获取用户当前所阅读的新闻内容;获取所述用户当前所阅读的新闻内容对应的聊天语料,所述聊天语料包括所述用户当前阅读的新闻内容对应的用户评论、论坛帖子中的至少一种;将所述聊天语料以及所述输入信息作为聊天回复模型的输入,将聊天回复模型的输出结果作为所述输入信息的返回结果;其中,聊天回复模型是预先训练得到的。
根据本发明一优选实施例,所述根据预设策略从所述返回结果中选取展示结果包括:随机选取预设个数的返回结果作为展示结果;或者根据用户的历史输入信息对所述返回结果进行决策,以确定展示结果。
根据本发明一优选实施例,在将选取得到的展示结果提供给用户之后,还包括:在预设时间内未接收到用户输入的输入信息,向用户推送新闻内容;或者在预设时间内未接收到用户输入的输入信息,向用户发送提问信息以获取用户输入的输入信息。
本发明为解决技术问题所采用的技术方案是提供一种新闻交互的装置,所述装置包括:第一获取单元,用于获取用户在阅读当前新闻内容时输入的输入信息;第一解析单元,用于基于所述当前新闻内容获取所述输入信息的解析信息,所述解析信息包括输入信息的意图信息;第一处理单元,用于根据所述输入信息的意图信息将所述输入信息分发至至少一个新闻交互服务子系统,并接收所述至少一个新闻交互服务子系统返回的返回结果;第一展示单元,用于根据预设策略从所述返回结果中选取展示结果,将选取得到的展示结果提供给用户。
根据本发明一优选实施例,所述解析单元在基于所述当前新闻内容获取输入信息的意图信息时,具体执行:分别获取在获取所述当前新闻内容时的用户意图以及所述输入信息的用户意图;若未能获取所述输入信息的用户意图,则将在获取当前新闻内容时的用户意图确定为所述输入信息的意图信息,否则将所述输入信息的用户意图确定为所述输入信息的意图信息。
根据本发明一优选实施例,所述解析单元在基于所述当前新闻内容获取所述输入信息的解析信息时,具体执行:获取在获取所述当前新闻内容时用户输入的上文输入信息;基于所述上文输入信息对所述输入信息进行解析,获取所述输入信息的解析信息。
根据本发明一优选实施例,所述新闻交互服务子系统包括新闻推荐服务子系统、新闻问答服务子系统以及新闻聊天服务子系统中的至少一种。
根据本发明一优选实施例,所述新闻问答服务子系统包括篇章精确问答模块、事件图谱问答模块和问题检索问答模块中的至少一种;所述新闻问答服务子系统,具体包括;第二处理单元,用于将所述输入信息分发至至少一个问答模块,并接收由所述至少一个问答模块返回的答案;第一筛选单元,用于对所述返回的答案进行筛选,将筛选得到的答案作为返回结果返回至所述第一处理单元。
根据本发明一优选实施例,所述篇章精确问答模块,具体包括:第二获取单元,用于获取用户当前阅读的新闻内容;第一生成单元,用于将所述新闻内容以及所述输入信息作为答案生成模型的输入,将答案生成模型的输出结果作为所述输入信息的答案,并将其返回至所述第二处理单元;其中,所述答案生成模型是预先训练得到的。
根据本发明一优选实施例,所述事件图谱问答模块,具体包括:第一切词单元,用于对所述输入信息进行切词,将切词结果中预设词性的词语作为查询信息;事件确定单元,用于获取所述输入信息的语义信息,并根据所述语义信息确定所述输入信息对应的事件;第二生成单元,用于根据事件图谱,将所确定的事件中与所述查询信息相匹配的节点构成所述输入信息的答案,并将其返回至所述第二处理单元。
根据本发明一优选实施例,所述事件图谱问答模块还包括:第三获取单元,用于获取新闻内容,所获取的新闻内容包括用户当前阅读的新闻内容以及用户历史阅读的新闻内容中的至少一种;信息补全单元,用于根据对应所述输入信息的事件,抽取所述新闻内容中与该事件相关的信息对所述查询信息进行补全;所述第二生成单元根据事件图谱,将所述事件中与补全结果相匹配的节点构成所述输入信息的答案,并将其返回至所述第二处理单元。
根据本发明一优选实施例,所述问题检索问答模块,具体包括:第四获取单元,用于获取所述输入信息的语义信息;第一匹配单元,用于确定与所述输入信息的语义信息相匹配的问题;第三生成单元,用于将问答数据库中与所确定的问题对应的答案作为所述输入信息的答案,并将其返回至所述第二处理单元;其中,所述问答数据库中包含多个问题答案对。
根据本发明一优选实施例,所述第一筛选单元对所述至少一个问答模块返回的答案进行筛选时,具体执行:从多个答案中随机选取一个答案作为返回结果;或者根据各问答模块预设的置信度,将置信度最高的问答模块所获取的答案作为返回结果。
根据本发明一优选实施例,所述新闻推荐服务子系统,具体包括:第五获取单元,用于获取所述输入信息的领域信息;第三处理单元,用于从新闻数据库中获取满足所述领域信息的新闻;第一推荐单元,用于从所获取的新闻中选取满足所述输入信息的新闻作为候选新闻,将所述候选新闻作为返回结果返回至所述第一处理单元。
根据本发明一优选实施例,所述新闻聊天服务子系统,具体包括:第六获取单元,用于获取用户当前所阅读的新闻内容;第七获取单元,用于获取所述用户当前所阅读的新闻内容对应的聊天语料,所述聊天语料包括所述用户当前阅读的新闻内容对应的用户评论、论坛帖子中的至少一种;回复生成单元,用于将所述聊天语料以及所述输入信息作为聊天回复模型的输入,将聊天回复模型的输出结果作为所述输入信息的返回结果,并将其返回至所述第一处理单元;其中,聊天回复模型是预先训练得到的。
根据本发明一优选实施例,所述第一展示单元在根据预设策略从所述返回结果中选取展示结果时,具体执行:随机选取预设个数的返回结果作为展示结果;或者根据用户的历史输入信息对所述返回结果进行决策,以确定展示结果。
根据本发明一优选实施例,所述第一展示单元在将选取得到的展示结果提供给用户之后,还执行:在预设时间内未接收到用户输入的输入信息,向用户推送新闻内容;或者在预设时间内未接收到用户输入的输入信息,向用户发送提问信息以获取用户输入的输入信息。
由以上技术方案可以看出,本发明通过用户当前阅读的新闻内容对用户输入的输入信息进行解析,从而将输入信息分发至多个新闻服务子系统中,进而获取由新闻服务子系统所返回的返回结果,丰富了当前新闻应用的交互功能,满足了用户多样的交互需求,实现向用户提供更为多样的返回结果。
【附图说明】
图1为本发明一实施例提供的新闻交互的方法流程图;
图2为本发明一实施例提供的新闻交互的装置结构图;
图3为本发明一实施例提供的新闻推荐服务子系统的装置结构图;
图4为本发明一实施例提供的新闻问答服务子系统的装置结构图;
图5为本发明一实施例提供的篇章精确问答模块的装置结构图;
图6为本发明一实施例提供的事件图谱问答模块的装置结构图;
图7为本发明一实施例提供的问题检索问答模块的装置结构图;
图8为本发明一实施例提供的新闻聊天服务子系统的装置结构图;
图9为本发明一实施例提供的计算机系统/服务器的框图。
【具体实施方式】
为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发明进行详细描述。
在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。
图1为本发明一实施例提供的一种新闻交互的方法流程图,如图1中所示,所述方法包括:
在101中,获取用户在阅读当前新闻内容时输入的输入信息。
在本步骤中,获取用户在阅读当前新闻内容时所输入的输入信息。也就是说,本发明应用于新闻资讯类应用向用户展示新闻内容的场景,例如新闻资讯类应用通过语音播报的形式向用户展示新闻内容时,与用户之间的交互。
具体地,本步骤中所获取的输入信息可以为文本信息,也可以为语音信息。其中,若所获取的输入信息为语音信息,本步骤还需要将语音信息转化为文本信息。可以理解的是,在获取用户输入的输入信息后,可以以文本形式将所获取的输入信息上屏。
在102中,基于所述当前新闻内容获取所述输入信息的解析信息,所述解析信息包括输入信息的意图信息。
在本步骤中,基于用户当前阅读的新闻内容解析步骤101所获取的输入信息,从而得到对应输入信息的解析信息。其中,输入信息的解析信息包括输入信息的意图信息,还可以进一步包括输入信息的领域信息。
具体地,输入信息的意图信息为用户输入输入信息时所需求的新闻交互服务的种类,例如新闻推荐服务、新闻问答服务或者新闻聊天服务等;输入信息的领域信息为用户输入输入信息时所需求的新闻的所属领域,例如体育领域的新闻、军事领域的新闻或者娱乐领域的新闻等。
本步骤在基于当前新闻内容获取输入信息的意图信息时,可以将在获取当前新闻内容时的用户意图确定为输入信息的意图信息,例如用户当前阅读的新闻内容是根据之前用户输入的提问所得到的,则将新闻问答服务确定为输入信息的意图信息。
另外,本步骤在基于当前新闻内容获取输入信息的意图信息时,还可以采用以下方式:分别获取在获取当前新闻内容时的用户意图以及输入信息的用户意图;若未能获取输入信息的用户意图,则将在获取当前新闻内容时的用户意图确定为输入信息的意图信息,否则将输入信息的用户意图确定为输入信息的意图信息。本步骤可以根据输入信息的语义信息来获取用户意图,而根据文本的语义信息确定文本的用户意图属于现有技术,在此不进行赘述。
由于用户的输入信息一般与用户阅读的当前新闻内容相关,因此本步骤在基于当前新闻内容获取输入信息的领域信息时,可以直接将当前新闻内容所属的领域确定为输入信息的领域信息。
另外,本步骤在基于当前新闻内容获取输入信息的领域信息时,还可以采用以下方式:分别获取当前新闻内容以及输入信息所属的领域;若两者相同或者未能获取输入信息所属的领域,则将当前新闻内容所属的领域确定为输入信息的领域信息;若两者不同,则将输入信息所属的领域确定为输入信息的领域信息。同样地,本步骤可以根据新闻内容或者输入信息的语义信息来获取新闻内容或者输入信息的所属领域,而根据文本的语义信息确定文本所属的领域属于现有技术,在此不进行赘述。
可以理解的是,本步骤在基于当前新闻内容获取输入信息的解析信息时,还可以采用以下方式:获取在获取当前新闻内容时用户输入的上文输入信息,即获取当前输入信息之前用户所输入的输入信息;基于上文输入信息对输入信息进行解析,获取输入信息对应的解析信息。基于上文输入信息获取输入信息的解析信息的过程与上述基于当前新闻内容获取输入信息的解析信息的过程相同,在此不进行赘述。本步骤还可以基于当前阅读的新闻内容以及上文输入信息,共同对输入信息进行解析,以获取输入信息的解析信息。
因此,通过用户当前阅读的新闻内容来获取输入信息的解析信息的方法,能够使得所获取解析信息更加符合用户当前所阅读的新闻内容,从而实现获取更为符合用户实际需求的返回结果的目的。
在103中,根据所述输入信息的意图信息将所述输入信息分发至至少一个新闻交互服务子系统,并接收所述至少一个新闻交互服务子系统返回的返回结果。
在本步骤中,根据步骤102所得到的输入信息的意图信息将输入信息分发至至少一个新闻交互服务子系统,然后接收由至少一个新闻交互服务子系统所返回的返回结果。其中,新闻交互服务子系统包括新闻推荐服务子系统、新闻问答服务子系统以及新闻聊天服务子系统中的至少一种。
因此,以下将分为三个部分对不同的新闻交互服务子系统根据输入信息获取返回结果的过程进行描述。
1、新闻推荐服务子系统获取返回结果的过程。
若所得到的输入信息的意图信息为用户需求的是新闻推荐服务,即用户想要阅读其他的新闻内容,则将该输入信息发送至新闻推荐服务子系统,进而获取由新闻推荐服务子系统所返回的返回结果。
具体地,新闻推荐服务子系统在根据输入信息获取返回结果时,可以采用以下方式:获取输入信息的领域信息;从新闻数据库中获取满足输入信息的领域信息的新闻,例如从新闻数据库中获取“体育领域”的新闻;从所获取的新闻中选取满足输入信息的新闻作为候选新闻,将选取得到的候选新闻作为返回结果,例如从“体育领域”的新闻中选取满足用户输入信息中“英超”的候选新闻作为返回结果。
可以理解的是,当新闻推荐服务子系统同时获取了多个返回结果时,可以随机选取预设个数的返回结果向用户返回,例如随机选取一个返回结果向用户返回;也可以基于用户历史、新闻的热度、新闻所属站点等信息对多个返回结果进行个性化排序,进而选取排在前N位的返回结果向用户返回,其中N为大于等于1的正整数。本发明对返回结果的个数以及对返回结果进行排序的方法不进行限定。
2、新闻问答服务子系统获取返回结果的过程。
若所得到的输入信息的意图信息为用户需求的是新闻问答服务,即用户想要获取输入信息所对应的答案,则将该输入信息发送至新闻问答服务子系统,进而获取由新闻问答服务子系统返回的返回结果。
在本实施例中,新闻问答服务子系统中包含篇章精确问答模块、事件图谱问答模块以及问题检索问答模块中的至少一种。新闻问答服务子系统在接收到输入信息后,将所接收的输入信息分发至至少一个问答模块,在对至少一个问答模块返回的答案进行筛选后,将筛选得到的答案作为返回结果向用户返回。
(1)篇章精确问答模块在根据输入信息获取答案时,可以采用以下方式:
获取用户当前所阅读的新闻内容;将所获取的新闻内容以及输入信息作为答案生成模型的输入,将答案生成模型的输出结果作为对应输入信息的答案。其中,篇章精确问答模块中所使用的答案生成模型是预先训练得到的。也就是说,篇章精确问答模块能够直接将输入信息作为查询信息,在用户当前所阅读的新闻内容中获取对应查询信息的答案。
可以采用以下方式预先训练得到答案生成模型:获取新闻内容、对应各新闻内容的问题以及对应各问题的答案作为训练数据,其中训练数据中各问题对应的答案存在于相应的新闻内容中;将各新闻内容以及对应各新闻内容的问题作为输入,将问题对应的答案作为输出,训练学习模型,以得到答案生成模型。训练得到的答案生成模型能够根据所输入的新闻内容以及查询信息,从新闻内容中获取对应查询信息的答案。
(2)事件图谱问答模块在根据输入信息获取答案时,可以采用以下方式:
对输入信息进行切词,将切词结果中预设词性的词语作为查询信息,其中预设词性可以为名词以及代词;根据输入信息的语义信息确定输入信息对应的事件;根据事件图谱,将所确定的事件中与查询信息相匹配的节点构成对应输入信息的答案。
其中,事件图谱是基于从互联网中抓取的大量新闻而实时生成的,从而使得事件图谱能够满足用户对不同时间的新闻内容进行问答的需要。事件图谱中包含有多个事件,而每个事件中包含有多个节点。因此在确定输入信息的事件后,便能够从事件图谱的事件中查询与所得到的查询信息相匹配的节点,进而构成对应输入信息的答案。
由于不同领域的事件图谱中可能会包含相同的事件,为了进一步提升答案获取的准确度,可以以所属领域对事件图谱进行划分,例如将事件图谱划分为“体育领域”的事件图谱、“军事领域的”事件图谱、“娱乐领域”的事件图谱等。若将事件图谱按所属领域进行划分,则事件图谱问答模块在获取答案时,还需要根据输入信息的领域信息来确定对应领域的事件图谱,进而在确定领域的事件图谱中匹配节点,实现进一步提升获取答案的准确度的目的。
举例来说,“体育领域”的事件图谱中可以预先定义“进球”事件、“转会”事件等事件,其中“进球”事件中可以包含“球员姓名”、“球队名称”、“比赛场次”、“进球时间”等节点,“转会”事件中可以包含“球员名称”、“球队名称”、“转会金额”、“签约年限”等节点。
可以理解的是,若事件图谱问答模块根据输入信息无法获取答案,则可能是由于输入信息较为简单而无法得到具体的查询信息所导致,因此事件图谱问答模块还可以包括以下内容:获取新闻内容,所获取的新闻内容包括用户当前阅读的新闻内容以及用户历史阅读的新闻内容中的至少一种;根据输入信息所确定的事件,抽取所获取的新闻内容中与该事件相关的信息对查询信息进行补全;根据事件图谱,将所确定的事件中与补全结果相匹配的节点构成对应输入信息的答案。
举例来说,若输入信息为“第一个球是谁进的”,事件图谱问答模块将分词结果中的“第一个球”以及“谁”作为查询信息,并根据输入信息的语义信息得知该输入信息属于“进球”事件,但由于查询信息中没有包含是哪个比赛场次,因此事件图谱问答模块无法得到准确的答案。而用户通常都是基于所阅读的新闻内容进行当前的提问,因此事件图谱问答模块会通过用户所阅读的新闻内容来抽取查询信息中不包含的、“进球”事件所需的相关信息,例如“比赛场次”,例如用户当前阅读的是与“西甲第10轮球队A对阵球队B”相关的新闻内容,则可以将新闻内容中的“西甲第10轮球队A对阵球队B”添加到已获取的查询信息中,从而获取“西甲第10轮球队A对球队B中第一个进球是球员C打进”的答案。
(3)问题检索问答模块在根据输入信息获取答案时,可以采用以下方式:
获取输入信息的语义信息;在问答对数据库中确定与输入信息的语义信息相匹配的问题,例如输入信息与问题之间的语义相似度大于预设阈值的问题;将检索得到的问题所对应的答案作为对应输入信息的答案。
其中,问答对数据库中包含有大量的问题答案对。问题答案对可以通过以下方式获取:从互联网上抓取新闻;将所抓取的新闻输入问答对生成模型中,将问答对生成模型的输出结果作为问题答案对;将所获取的问题答案对存储到问答对数据库中。其中,问答对生成模型是预先训练得到的。本发明对问答对生成模型生成问题答案对的个数不进行限定。
在训练得到问答对生成模型时,可以采用以下方式:获取新闻及其对应的问题答案对;将各新闻作为输入,将各新闻对应的问题答案对作为输出,训练学习模型,得到问答对生成模型。利用训练得到的问答对生成模型,能够根据输入的新闻自动生成对应该新闻的多个问题答案对。
可以理解的是,新闻问答服务子系统根据输入信息可能会得到多个答案,当新闻问答服务子系统同时得到多个对应答案时,可以根据各问答模块预设的置信度,从中筛选出一个答案作为返回结果,例如选取所获取的答案中由预设置信度最高的问答模块所得到的答案作为返回结果;另外,由于本发明中的各问答模块均能够获取较为准确的答案,新闻问答服务子系统也可以从多个答案中随机选取一个作为返回结果。
3、新闻聊天服务子系统获取返回结果的具体过程。
若所得到的输入信息的意图信息为用户需求的是新闻聊天服务,即用户想要获取输入信息对应的聊天答复,则将该输入信息发送至新闻聊天服务子系统,进而获取由新闻聊天服务子系统返回的返回结果。
具体地,新闻聊天服务子系统在根据输入信息获取返回结果时,可以采用以下方式:获取用户当前所阅读的新闻内容;获取对应用户当前所阅读新闻内容的聊天语料,例如聊天语料可以为对应用户当前阅读的新闻内容的用户评论、回复、论坛帖子等内容;将所获取的聊天语料以及输入信息作为聊天回复模型的输入,将聊天回复模型的输出结果作为对应输入信息的返回结果。其中,聊天回复模型是预先训练得到的。
在训练聊天回复模型时,可以采用以下方式:获取聊天语料及其对应的聊天上下文信息;将各聊天语料及其对应的聊天上文信息作为输入,将与各聊天语料对应的聊天下文信息作为输出,训练学习模型,得到聊天回复模型。利用训练得到的聊天回复模型,能够根据输入的聊天语料以及输入信息生成对应输入信息的答复。
在104中,根据预设策略从所述返回结果中选取展示结果,将选取得到的展示结果提供给用户。
在本步骤中,若根据步骤103接收到由至少一个新闻服务子系统返回的多个返回结果时,则按照预设策略从多个返回结果中选取展示结果,并将选取得到的展示结果提供给用户。
其中,预设策略可以为随机选取预设个数的返回结果作为展示结果,例如随机选取一个返回结果作为展示结果;也可以根据用户的历史输入信息对返回结果进行决策以确定展示结果,例如用户当前的输入信息与上文输入信息相关,而上文输入信息对应的意图信息为新闻问答,则可以将由新闻问答服务子系统得到的返回结果作为展示结果。
本步骤在将选取得到的展示结果提供给用户时,可以仅将所得到的展示结果以文本形式进行上屏;还可以在上屏文本形式的展示结果时,播放对应展示结果的语音。
可以理解的是,本发明在将展示结果提供给用户之后,若在预设时间内未接收到用户输入的输入信息,则可以自动向用户推送新闻内容,以供用户阅读;也可以主动向用户发送提问信息,以再次获取用户输入的输入信息,进而根据用户输入的输入信息根据上述过程获取展示结果并提供给用户。
图2为本发明一实施例提供的一种新闻交互的装置结构图,如图2中所示,所述装置包括:第一获取单元21、第一解析单元22、第一处理单元23以及第一展示单元24。
第一获取单元21,用于获取用户在阅读当前新闻内容时输入的输入信息。
第一获取单元21获取用户在阅读当前新闻内容时所输入的输入信息。
具体地,第一获取单元21所获取的输入信息可以为文本信息,也可以为语音信息。其中,若所获取的输入信息为语音信息,第一获取单元21还需要将语音信息转化为文本信息。可以理解的是,在获取用户输入的输入信息后,第一获取单元21可以以文本形式将所获取的输入信息上屏。
第一解析单元22,用于基于所述当前新闻内容获取所述输入信息的解析信息,所述解析信息包括输入信息的意图信息。
第一解析单元22基于用户当前阅读的新闻内容解析第一获取单元21所获取的输入信息,从而得到对应输入信息的解析信息。其中,输入信息的解析信息包括输入信息的意图信息,还可以进一步包括输入信息的领域信息。
具体地,输入信息的意图信息为用户输入输入信息时所需求的新闻交互服务的种类,例如新闻推荐服务、新闻问答服务或者新闻聊天服务等;输入信息的领域信息为用户输入输入信息时所需求的新闻的所属领域,例如体育领域的新闻、军事领域的新闻或者娱乐领域的新闻等。
第一解析单元22在基于当前新闻内容获取输入信息的意图信息时,可以将在获取当前新闻内容时的用户意图确定为输入信息的意图信息。
另外,第一解析单元22在基于当前新闻内容获取输入信息的意图信息时,还可以采用以下方式:分别获取在获取当前新闻内容时的用户意图以及输入信息的用户意图;若未能获取输入信息的用户意图,则将在获取当前新闻内容时的用户意图确定为输入信息的意图信息,否则将输入信息的用户意图确定为输入信息的意图信息。
由于用户的输入信息一般与用户阅读的当前新闻内容相关,因此第一解析单元22在基于当前新闻内容获取输入信息的领域信息时,可以直接将当前新闻内容所属的领域确定为输入信息的领域信息。
另外,第一解析单元22在基于当前新闻内容获取输入信息的领域信息时,还可以采用以下方式:分别获取当前新闻内容以及输入信息所属的领域;若未能获取输入信息所属的领域,将当前新闻内容所属的领域确定为输入信息的领域信息,否则将输入信息所属的领域确定为输入信息的领域信息。
可以理解的是,第一解析单元22在基于当前新闻内容获取输入信息的解析信息时,还可以采用以下方式:获取在获取当前新闻内容时用户输入的上文输入信息,即获取当前输入信息之前用户所输入的输入信息;基于上文输入信息对输入信息进行解析,获取输入信息对应的解析信息。
第一解析单元22还可以基于当前阅读的新闻内容以及上文输入信息,共同对输入信息进行解析,以获取输入信息的解析信息。
因此,第一解析单元22通过用户当前阅读的新闻内容来获取输入信息的解析信息的方法,能够使得所获取解析信息更加符合用户当前所阅读的新闻内容,从而实现获取更为符合用户实际需求的返回结果的目的。
第一处理单元23,用于根据所述输入信息的意图信息将所述输入信息分发至至少一个新闻交互服务子系统,并接收所述至少一个新闻交互服务子系统返回的返回结果。
第一处理单元23根据第一解析单元22所得到的输入信息的意图信息将第一获取单元21所获取的输入信息分发至至少一个新闻交互服务子系统,然后接收由至少一个新闻交互服务子系统所返回的返回结果。其中,新闻交互服务子系统包括新闻推荐服务子系统、新闻问答服务子系统以及新闻聊天服务子系统中的至少一种。
第一展示单元24,用于根据预设策略从所述返回结果中选取展示结果,将选取得到的展示结果提供给用户。
若第一处理单元23接收到由至少一个新闻服务子系统返回的多个返回结果时,第一展示单元24则按照预设策略从多个返回结果中选取展示结果,并将选取得到的展示结果提供给用户。
其中,预设策略可以为随机选取预设个数的返回结果作为展示结果;也可以根据用户的历史输入信息对返回结果进行决策以确定展示结果。
第一展示单元24在将选取得到的展示结果提供给用户时,可以仅将所得到的展示结果以文本形式进行上屏;还可以在上屏文本形式的展示结果时,播放对应展示结果的语音。
可以理解的是,第一展示单元24在将展示结果提供给用户之后,还可以执行以下操作:若在预设时间内未接收到用户输入的输入信息,第一展示单元24可以自动向用户推送新闻内容,以供用户阅读;第一展示单元24也可以主动向用户发送提问信息,以再次获取用户输入的输入信息,进而根据用户输入的输入信息根据上述过程获取展示结果并提供给用户。
图3为本发明一实施例提供的新闻推荐服务子系统的装置结构图,如图3中所示,所述装置包括:第五获取单元31、第三处理单元32以及第一推荐单元33。
若第一解析单元22所得到的输入信息的意图信息为用户需求的是新闻推荐服务,则由第一处理单元23将该输入信息发送至新闻推荐服务子系统,进而获取由新闻推荐服务子系统所返回的返回结果。
在新闻推荐服务子系统中,具体包括:
第五获取单元31,用于获取输入信息的领域信息;第三处理单元32,用于从新闻数据库中获取满足输入信息的领域信息的新闻;第一推荐单元33,用于从所获取的新闻中选取满足输入信息的新闻作为候选新闻,将选取得到的候选新闻作为返回结果,并将其返回至第一处理单元23。
可以理解的是,当新闻推荐服务子系统的第一推荐单元33同时获取了多个返回结果时,可以随机选取预设个数的返回结果返回至第一处理单元23;也可以基于用户历史、新闻的热度、新闻所属站点等信息对多个返回结果进行个性化排序,进而选取排在前N位的返回结果返回至第一处理单元23,其中N为大于等于1的正整数。本发明对返回结果的个数以及对返回结果进行排序的方法不进行限定。
图4为本发明一实施例提供的新闻问答服务子系统的装置结构图,如图4中所示,所述装置包括:第二处理单元41以及第一筛选单元42。
若第一解析单元22所得到的输入信息的意图信息为用户需求的是新闻问答服务,则第一处理单元23将该输入信息发送至新闻问答服务子系统,进而获取由新闻问答服务子系统返回的返回结果。
在新闻问答服务子系统中,具体包括:
第二处理单元41,用于将输入信息分发至至少一个问答模块,并接收由至少一个问答模块返回的答案。
第一筛选单元42,用于对所返回的答案进行筛选,将筛选得到的答案作为返回结果返回至第一处理单元23。
可以理解的是,第二处理单元41根据输入信息可能会得到多个答案,第一筛选单元42在对返回的答案进行筛选时,可以采用以下方式:根据各问答模块预设的置信度,第一筛选单元42将置信度最高的问答模块所获取的答案作为返回结果;第一筛选单元42还可以从多个答案中随机选取一个作为返回结果。
其中,新闻问答服务子系统中包含篇章精确问答模块、事件图谱问答模块以及问题检索问答模块中的至少一种,接下来对三个问答模块的装置结构图分别进行描述。
图5为本发明一实施例提供的篇章精确问答模块的装置结构图,如图5中所示,所述装置包括:第二获取单元51以及第一生成单元52。
第二获取单元51,用于获取用户当前所阅读的新闻内容。
第一生成单元52,用于将所获取的新闻内容以及输入信息作为答案生成模型的输入,将答案生成模型的输出结果作为对应输入信息的答案,并将其返回至第二处理单元41。
其中,第一生成单元52中所使用的答案生成模型是预先训练得到的。
第一生成单元52可以采用以下方式预先训练得到答案生成模型:获取新闻内容、对应各新闻内容的问题以及对应各问题的答案作为训练数据,其中训练数据中各问题对应的答案存在于相应的新闻内容中;将各新闻内容以及对应各新闻内容的问题作为输入,将问题对应的答案作为输出,训练学习模型,以得到答案生成模型。训练得到的答案生成模型能够根据所输入的新闻内容以及查询信息,从新闻内容中获取对应查询信息的答案。
图6为本发明一实施例提供的事件图谱问答模块的装置结构图,如图6中所示,所述装置包括:第一切词单元61、事件确定单元62以及第二生成单元63、第三获取单元64以及信息补全单元65。
第一切词单元61,用于对输入信息进行切词,将切词结果中预设词性的词语作为查询信息,其中预设词性可以为名词以及代词。
事件确定单元62,用于根据输入信息的语义信息确定输入信息对应的事件。
第二生成单元63,用于根据事件图谱,将所确定的事件中与查询信息相匹配的节点构成对应输入信息的答案。
其中,第二生成单元63所使用的事件图谱是基于从互联网中抓取的大量新闻而实时生成的,从而使得事件图谱能够满足用户对不同时间的新闻内容进行问答的需要。事件图谱中包含有多个事件,而每个事件中包含有多个节点。因此在事件确定单元62确定输入信息的事件后,第二生成单元63便能够从事件图谱的事件中查询与所得到的查询信息相匹配的节点,进而构成对应输入信息的答案。
由于不同领域的事件图谱中可能会包含相同的事件,为了进一步提升答案获取的准确度,可以以所属领域对事件图谱进行划分。若将事件图谱按所属领域进行划分,则事件确定单元62还需要获取输入信息的领域信息来确定对应领域的事件图谱,进而在确定领域的事件图谱中确定事件,实现进一步提升获取答案的准确度的目的。
可以理解的是,若第二生成单元63根据输入信息无法获取答案,则可能是由于输入信息较为简单而无法得到具体的查询信息所导致,因此事件图谱问答模块还可以包括以下装置:
第三获取单元64,用于获取新闻内容,所获取的新闻内容包括用户当前阅读的新闻内容以及用户历史阅读的新闻内容中的至少一种。
信息补全单元65,用于根据输入信息所确定的事件,抽取所获取的新闻内容中与该事件相关的信息对查询信息进行补全。
第二生成单元63根据事件图谱,将所确定的事件中与信息补全单元65所得到的补全结果相匹配的节点构成对应输入信息的答案,并将其返回至第二处理单元41。
图7为本发明一实施例提供的问题检索问答模块的装置结构图,如图7中所示,所述装置包括:第四获取单元71、第一匹配单元72以及第三生成单元73。
第四获取单元71,用于获取输入信息的语义信息。
第一匹配单元72,用于在问答对数据库中确定与输入信息的语义信息相匹配的问题。
第三生成单元73,用于将问答数据库中与所确定的问题对应的答案作为对应输入信息的答案,并将其返回至第二处理单元41。
其中,问答对数据库中包含有大量的问题答案对。问题答案对可以通过以下方式获取:从网络上抓取新闻;将所抓取的新闻输入问答对生成模型中,将问答对生成模型的输出结果作为问题答案对;将所获取的问题答案对存储到问答对数据库中。其中,问答对生成模型是预先训练得到的。本发明对问答对生成模型生成问题答案对的个数不进行限定。
在训练得到问答对生成模型时,可以采用以下方式:获取新闻及其对应的问题答案对;将各新闻作为输入,将各新闻对应的问题答案对作为输出,训练学习模型,得到问答对生成模型。利用训练得到的问答对生成模型,能够根据输入的新闻自动生成对应该新闻的多个问题答案对。
图8为本发明一实施例提供的新闻聊天服务子系统的装置结构图,如图8中所示,所述装置包括:第六获取单元81、第七获取单元82以及回复生成单元83。
若第一解析单元22所得到的输入信息的意图信息为用户需求的是新闻聊天服务,则第一处理单元23将该输入信息发送至新闻聊天服务子系统,进而获取由新闻聊天服务子系统返回的返回结果。
在新闻聊天服务子系统中,具体包括
第六获取单元81,用于获取用户当前所阅读的新闻内容。
第七获取单元82,用于获取对应用户当前所阅读新闻内容的聊天语料,聊天语料可以为对应用户当前阅读的新闻内容的用户评论、论坛帖子中的至少一种。
回复生成单元83,用于将所获取的聊天语料以及输入信息作为聊天回复模型的输入,将聊天回复模型的输出结果作为对应输入信息的返回结果,并将其返回至第一处理单元23。
其中,回复生成单元83中所使用的聊天回复模型是预先训练得到的。回复生成单元83在训练聊天回复模型时,可以采用以下方式:获取聊天语料及其对应的聊天上下文信息;将各聊天语料及其对应的聊天上文信息作为输入,将与各聊天语料对应的聊天下文信息作为输出,训练学习模型,得到聊天回复模型。利用训练得到的聊天回复模型,能够根据输入的聊天语料以及输入信息生成对应输入信息的答复。
图9示出了适于用来实现本发明实施方式的示例性计算机系统/服务器012的框图。图9显示的计算机系统/服务器012仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图9所示,计算机系统/服务器012以通用计算设备的形式表现。计算机系统/服务器012的组件可以包括但不限于:一个或者多个处理器或者处理单元016,系统存储器028,连接不同系统组件(包括系统存储器028和处理单元016)的总线018。
总线018表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
计算机系统/服务器012典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机系统/服务器012访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器028可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)030和/或高速缓存存储器032。计算机系统/服务器012可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统034可以用于读写不可移动的、非易失性磁介质(图9未显示,通常称为“硬盘驱动器”)。尽管图9中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线018相连。存储器028可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块042的程序/实用工具040,可以存储在例如存储器028中,这样的程序模块042包括——但不限于——操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块042通常执行本发明所描述的实施例中的功能和/或方法。
计算机系统/服务器012也可以与一个或多个外部设备014(例如键盘、指向设备、显示器024等)通信,在本发明中,计算机系统/服务器012与外部雷达设备进行通信,还可与一个或者多个使得用户能与该计算机系统/服务器012交互的设备通信,和/或与使得该计算机系统/服务器012能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口022进行。并且,计算机系统/服务器012还可以通过网络适配器020与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器020通过总线018与计算机系统/服务器012的其它模块通信。应当明白,尽管图9中未示出,可以结合计算机系统/服务器012使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元016通过运行存储在系统存储器028中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的方法流程。
上述的计算机程序可以设置于计算机存储介质中,即该计算机存储介质被编码有计算机程序,该程序在被一个或多个计算机执行时,使得一个或多个计算机执行本发明上述实施例中所示的方法流程和/或装置操作。例如,被上述一个或多个处理器执行本发明实施例所提供的方法流程。
随着时间、技术的发展,介质含义越来越广泛,计算机程序的传播途径不再受限于有形介质,还可以直接从网络下载等。可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
利用本发明所提供的技术方案,通过用户当前阅读的新闻内容对用户输入的输入信息进行解析,从而将输入信息分发至多个新闻服务子系统中,进而获取由新闻服务子系统所返回的返回结果,丰富了当前新闻应用的交互功能,满足了用户多样的交互需求,实现向用户提供更为多样的返回结果。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (28)

1.一种新闻交互的方法,其特征在于,所述方法包括:
获取用户在阅读当前新闻内容时输入的输入信息;
基于所述当前新闻内容获取所述输入信息的解析信息,所述解析信息包括输入信息的意图信息;
根据所述输入信息的意图信息将所述输入信息分发至至少一个新闻交互服务子系统,并接收所述至少一个新闻交互服务子系统返回的返回结果;
根据预设策略从所述返回结果中选取展示结果,将选取得到的展示结果提供给用户;
所述新闻交互服务子系统包括新闻推荐服务子系统、新闻问答服务子系统和新闻聊天服务子系统中的至少一种;
所述方法还包括,所述新闻聊天服务子系统获取用户当前所阅读的新闻内容;
获取所述用户当前所阅读的新闻内容对应的聊天语料,所述聊天语料包括所述用户当前阅读的新闻内容对应的用户评论、论坛帖子中的至少一种;
将所述聊天语料以及所述输入信息作为聊天回复模型的输入,将聊天回复模型的输出结果作为所述输入信息的返回结果;
其中,聊天回复模型是预先训练得到的。
2.根据权利要求1所述的方法,其特征在于,基于所述当前新闻内容获取输入信息的意图信息包括:
分别获取在获取所述当前新闻内容时的用户意图以及所述输入信息的用户意图;
若未能获取所述输入信息的用户意图,则将在获取当前新闻内容时的用户意图确定为所述输入信息的意图信息,否则将所述输入信息的用户意图确定为所述输入信息的意图信息。
3.根据权利要求1所述的方法,其特征在于,所述输入信息的解析信息还包括所述输入信息的领域信息,基于所述当前新闻内容获取输入信息的领域信息包括:
分别获取所述当前新闻内容以及所述输入信息所属的领域;
若未能获取所述输入信息所属的领域,则将所述当前新闻内容所属的领域确定为输入信息的领域信息,否则将所述输入信息所属的领域确定为所述输入信息的领域信息。
4.根据权利要求1所述的方法,其特征在于,所述基于所述当前新闻内容获取所述输入信息的解析信息包括:
获取在获取所述当前新闻内容时用户输入的上文输入信息;
基于所述上文输入信息对所述输入信息进行解析,获取所述输入信息的解析信息。
5.根据权利要求1所述的方法,其特征在于,所述新闻问答服务子系统包括篇章精确问答模块、事件图谱问答模块以及问题检索问答模块中的至少一种;
所述新闻问答服务子系统将所述输入信息分发至至少一个问答模块,并接收由所述至少一个问答模块返回的答案;
对所述返回的答案进行筛选,将筛选得到的答案作为返回结果。
6.根据权利要求5所述的方法,其特征在于,所述方法包括:
所述篇章精确问答模块获取用户当前阅读的新闻内容;
将所述新闻内容以及所述输入信息作为答案生成模型的输入,将答案生成模型的输出结果作为所述输入信息的答案;
其中,所述答案生成模型是预先训练得到的。
7.根据权利要求5所述的方法,其特征在于,所述方法包括:
所述事件图谱问答模块对所述输入信息进行切词,将切词结果中预设词性的词语作为查询信息;
获取所述输入信息的语义信息,并根据所述语义信息确定所述输入信息对应的事件;
根据事件图谱,将所确定的事件中与所述查询信息相匹配的节点构成所述输入信息的答案。
8.根据权利要求7所述的方法,其特征在于,所述方法还包括:
所述事件图谱问答模块获取新闻内容,所获取的新闻内容包括用户当前阅读的新闻内容以及用户历史阅读的新闻内容中的至少一种;
根据对应所述输入信息的事件,抽取所述新闻内容中与该事件相关的信息对所述查询信息进行补全;
根据事件图谱,将所述事件中与补全结果相匹配的节点构成所述输入信息的答案。
9.根据权利要求5所述的方法,其特征在于,所述方法包括:
所述问题检索问答模块获取所述输入信息的语义信息;
在问答对数据库中确定与所述输入信息的语义信息相匹配的问题;
将问答数据库中与所确定的问题对应的答案作为所述输入信息的答案;
其中,所述问答数据库中包含多个问题答案对。
10.根据权利要求9所述的方法,其特征在于,所述问答数据库中的问题答案对通过以下方式获取:
从网络上抓取新闻;
将所抓取的新闻输入问答对生成模型,将所述问答对生成模型的输出结果作为问题答案对;
将所获取的问题答案对存储到问答对数据库中;
其中,所述问答对生成模型是预先训练得到的。
11.根据权利要求5所述的方法,其特征在于,所述对所述至少一个问答模块返回的答案进行筛选包括:
从多个答案中随机选取一个答案作为返回结果;或者
根据各问答模块预设的置信度,将置信度最高的问答模块所获取的答案作为返回结果。
12.根据权利要求1所述的方法,其特征在于,所述方法还包括:
所述新闻推荐服务子系统获取所述输入信息的领域信息;
从新闻数据库中获取满足所述领域信息的新闻;
从所获取的新闻中选取满足所述输入信息的新闻作为候选新闻,将所述候选新闻作为返回结果。
13.根据权利要求1所述的方法,其特征在于,所述根据预设策略从所述返回结果中选取展示结果包括:
随机选取预设个数的返回结果作为展示结果;或者
根据用户的历史输入信息对所述返回结果进行决策,以确定展示结果。
14.根据权利要求1所述的方法,其特征在于,在将选取得到的展示结果提供给用户之后,还包括:
在预设时间内未接收到用户输入的输入信息,向用户推送新闻内容;或者
在预设时间内未接收到用户输入的输入信息,向用户发送提问信息以获取用户输入的输入信息。
15.一种新闻交互的装置,其特征在于,所述装置包括:
第一获取单元,用于获取用户在阅读当前新闻内容时输入的输入信息;
第一解析单元,用于基于所述当前新闻内容获取所述输入信息的解析信息,所述解析信息包括输入信息的意图信息;
第一处理单元,用于根据所述输入信息的意图信息将所述输入信息分发至至少一个新闻交互服务子系统,并接收所述至少一个新闻交互服务子系统返回的返回结果;
第一展示单元,用于根据预设策略从所述返回结果中选取展示结果,将选取得到的展示结果提供给用户;
所述新闻交互服务子系统包括新闻推荐服务子系统、新闻问答服务子系统以及新闻聊天服务子系统中的至少一种;
所述新闻聊天服务子系统,具体包括:
第六获取单元,用于获取用户当前所阅读的新闻内容;
第七获取单元,用于获取所述用户当前所阅读的新闻内容对应的聊天语料,所述聊天语料包括所述用户当前阅读的新闻内容对应的用户评论、论坛帖子中的至少一种;
回复生成单元,用于将所述聊天语料以及所述输入信息作为聊天回复模型的输入,将聊天回复模型的输出结果作为所述输入信息的返回结果,并将其返回至所述第一处理单元;
其中,聊天回复模型是预先训练得到的。
16.根据权利要求15所述的装置,其特征在于,所述解析单元在基于所述当前新闻内容获取输入信息的意图信息时,具体执行:
分别获取在获取所述当前新闻内容时的用户意图以及所述输入信息的用户意图;
若未能获取所述输入信息的用户意图,则将在获取当前新闻内容时的用户意图确定为所述输入信息的意图信息,否则将所述输入信息的用户意图确定为所述输入信息的意图信息。
17.根据权利要求15所述的装置,其特征在于,所述解析单元在基于所述当前新闻内容获取所述输入信息的解析信息时,具体执行:
获取在获取所述当前新闻内容时用户输入的上文输入信息;
基于所述上文输入信息对所述输入信息进行解析,获取所述输入信息的解析信息。
18.根据权利要求15所述的装置,其特征在于,所述新闻问答服务子系统包括篇章精确问答模块、事件图谱问答模块和问题检索问答模块中的至少一种;
所述新闻问答服务子系统,具体包括;
第二处理单元,用于将所述输入信息分发至至少一个问答模块,并接收由所述至少一个问答模块返回的答案;
第一筛选单元,用于对所述返回的答案进行筛选,将筛选得到的答案作为返回结果返回至所述第一处理单元。
19.根据权利要求18所述的装置,其特征在于,所述篇章精确问答模块,具体包括:
第二获取单元,用于获取用户当前阅读的新闻内容;
第一生成单元,用于将所述新闻内容以及所述输入信息作为答案生成模型的输入,将答案生成模型的输出结果作为所述输入信息的答案,并将其返回至所述第二处理单元;
其中,所述答案生成模型是预先训练得到的。
20.根据权利要求18所述的装置,其特征在于,所述事件图谱问答模块,具体包括:
第一切词单元,用于对所述输入信息进行切词,将切词结果中预设词性的词语作为查询信息;
事件确定单元,用于获取所述输入信息的语义信息,并根据所述语义信息确定所述输入信息对应的事件;
第二生成单元,用于根据事件图谱,将所确定的事件中与所述查询信息相匹配的节点构成所述输入信息的答案,并将其返回至所述第二处理单元。
21.根据权利要求20所述的装置,其特征在于,所述事件图谱问答模块还包括:
第三获取单元,用于获取新闻内容,所获取的新闻内容包括用户当前阅读的新闻内容以及用户历史阅读的新闻内容中的至少一种;
信息补全单元,用于根据对应所述输入信息的事件,抽取所述新闻内容中与该事件相关的信息对所述查询信息进行补全;
所述第二生成单元根据事件图谱,将所述事件中与补全结果相匹配的节点构成所述输入信息的答案,并将其返回至所述第二处理单元。
22.根据权利要求18所述的装置,其特征在于,所述问题检索问答模块,具体包括:
第四获取单元,用于获取所述输入信息的语义信息;
第一匹配单元,用于确定与所述输入信息的语义信息相匹配的问题;
第三生成单元,用于将问答数据库中与所确定的问题对应的答案作为所述输入信息的答案,并将其返回至所述第二处理单元;
其中,所述问答数据库中包含多个问题答案对。
23.根据权利要求18所述的装置,其特征在于,所述第一筛选单元对所述至少一个问答模块返回的答案进行筛选时,具体执行:
从多个答案中随机选取一个答案作为返回结果;或者
根据各问答模块预设的置信度,将置信度最高的问答模块所获取的答案作为返回结果。
24.根据权利要求15所述的装置,其特征在于,所述新闻推荐服务子系统,具体包括:
第五获取单元,用于获取所述输入信息的领域信息;
第三处理单元,用于从新闻数据库中获取满足所述领域信息的新闻;
第一推荐单元,用于从所获取的新闻中选取满足所述输入信息的新闻作为候选新闻,将所述候选新闻作为返回结果返回至所述第一处理单元。
25.根据权利要求15所述的装置,其特征在于,所述第一展示单元在根据预设策略从所述返回结果中选取展示结果时,具体执行:
随机选取预设个数的返回结果作为展示结果;或者
根据用户的历史输入信息对所述返回结果进行决策,以确定展示结果。
26.根据权利要求15所述的装置,其特征在于,所述第一展示单元在将选取得到的展示结果提供给用户之后,还执行:
在预设时间内未接收到用户输入的输入信息,向用户推送新闻内容;或者
在预设时间内未接收到用户输入的输入信息,向用户发送提问信息以获取用户输入的输入信息。
27.一种计算机设备,其特征在于,所述计算机设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-14中任一所述的方法。
28.一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-14中任一所述的方法。
CN201811541693.XA 2018-12-17 2018-12-17 一种新闻交互的方法、装置、设备和计算机存储介质 Active CN109815482B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201811541693.XA CN109815482B (zh) 2018-12-17 2018-12-17 一种新闻交互的方法、装置、设备和计算机存储介质
US16/713,058 US11397852B2 (en) 2018-12-17 2019-12-13 News interaction method, apparatus, device and computer storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811541693.XA CN109815482B (zh) 2018-12-17 2018-12-17 一种新闻交互的方法、装置、设备和计算机存储介质

Publications (2)

Publication Number Publication Date
CN109815482A CN109815482A (zh) 2019-05-28
CN109815482B true CN109815482B (zh) 2023-05-23

Family

ID=66602048

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811541693.XA Active CN109815482B (zh) 2018-12-17 2018-12-17 一种新闻交互的方法、装置、设备和计算机存储介质

Country Status (2)

Country Link
US (1) US11397852B2 (zh)
CN (1) CN109815482B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111143540B (zh) * 2020-04-03 2020-07-21 腾讯科技(深圳)有限公司 智能问答方法、装置、设备及存储介质
CN111737577A (zh) * 2020-06-22 2020-10-02 平安医疗健康管理股份有限公司 一种基于业务平台的数据查询方法、装置、设备和介质
CN112100353A (zh) * 2020-09-15 2020-12-18 京东方科技集团股份有限公司 人机对话方法及系统、计算机设备及介质
CN112632255B (zh) * 2020-12-29 2023-07-14 海信视像科技股份有限公司 一种获取问答结果的方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104794154A (zh) * 2015-03-11 2015-07-22 南通天呈医流互联网技术有限公司 基于文本挖掘的医疗器械o2o服务质量评价模型
CN105159996A (zh) * 2015-09-07 2015-12-16 百度在线网络技术(北京)有限公司 基于人工智能的深度问答服务提供方法和装置
CN107220352A (zh) * 2017-05-31 2017-09-29 北京百度网讯科技有限公司 基于人工智能构建评论图谱的方法和装置
CN108228794A (zh) * 2017-12-29 2018-06-29 三角兽(北京)科技有限公司 信息管理装置、信息处理装置及自动回复/评论方法

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8473449B2 (en) * 2005-01-06 2013-06-25 Neuric Technologies, Llc Process of dialogue and discussion
BRPI0815826A2 (pt) * 2007-08-31 2015-02-18 Microsoft Corp Resolução de co-referência em um sistema de processamento linguagem natural sensível à ambiguidade
US20150271557A1 (en) * 2014-03-24 2015-09-24 Joseph Akwo Tabe Multimedia television system for interactive social media and social network
US9338493B2 (en) * 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
CN105068661B (zh) * 2015-09-07 2018-09-07 百度在线网络技术(北京)有限公司 基于人工智能的人机交互方法和系统
CN105183848A (zh) * 2015-09-07 2015-12-23 百度在线网络技术(北京)有限公司 基于人工智能的人机聊天方法和装置
CN106649345A (zh) * 2015-10-30 2017-05-10 微软技术许可有限责任公司 用于新闻的自动会话创建器
US20170300823A1 (en) * 2016-04-13 2017-10-19 International Business Machines Corporation Determining user influence by contextual relationship of isolated and non-isolated content
US20170308583A1 (en) * 2016-04-20 2017-10-26 Facebook, Inc. Suggested Queries Based on Interaction History on Online Social Networks
KR101873763B1 (ko) * 2016-08-09 2018-07-03 엘지전자 주식회사 디지털 디바이스 및 그 데이터 처리 방법
US10382367B2 (en) * 2016-11-23 2019-08-13 Oath Inc. Commentary generation
CN106951438A (zh) * 2017-02-13 2017-07-14 北京航空航天大学 一种面向开放域的事件抽取系统及方法
CN109314660B (zh) * 2017-03-31 2021-11-23 微软技术许可有限责任公司 在自动聊天中提供新闻推荐的方法和装置
US20180336275A1 (en) * 2017-05-16 2018-11-22 Apple Inc. Intelligent automated assistant for media exploration
US20180349472A1 (en) * 2017-06-02 2018-12-06 Apple Inc. Methods and systems for providing query suggestions
CN107273487A (zh) * 2017-06-13 2017-10-20 北京百度网讯科技有限公司 基于人工智能的聊天数据的生成方法、装置及计算机设备
CN107220380A (zh) * 2017-06-27 2017-09-29 北京百度网讯科技有限公司 基于人工智能的问答推荐方法、装置和计算机设备
CN107491547B (zh) * 2017-08-28 2020-11-10 北京百度网讯科技有限公司 基于人工智能的搜索方法和装置
CN107844586B (zh) * 2017-11-16 2022-05-06 百度在线网络技术(北京)有限公司 新闻推荐方法和装置
CN108345640B (zh) * 2018-01-12 2021-10-12 上海大学 一种基于神经网络语义分析的问答语料库构建方法
CN108287820B (zh) * 2018-01-12 2021-06-11 鼎富智能科技有限公司 一种文本表示的生成方法及装置
US11010179B2 (en) * 2018-04-20 2021-05-18 Facebook, Inc. Aggregating semantic information for improved understanding of users
CN108932289B (zh) * 2018-05-23 2021-10-15 北京华健蓝海医疗科技有限责任公司 一种基于信息抽取和深度学习的问题回答处理方法及系统
CN108921295B (zh) * 2018-06-28 2021-08-10 合肥中科加点智能科技有限公司 一种基于知识图谱技术的突发事件应急决策模型构建方法
CN108959559B (zh) * 2018-06-29 2021-02-26 北京百度网讯科技有限公司 问答对生成方法和装置
US10896295B1 (en) * 2018-08-21 2021-01-19 Facebook, Inc. Providing additional information for identified named-entities for assistant systems
US20200134449A1 (en) * 2018-10-26 2020-04-30 Naver Corporation Training of machine reading and comprehension systems

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104794154A (zh) * 2015-03-11 2015-07-22 南通天呈医流互联网技术有限公司 基于文本挖掘的医疗器械o2o服务质量评价模型
CN105159996A (zh) * 2015-09-07 2015-12-16 百度在线网络技术(北京)有限公司 基于人工智能的深度问答服务提供方法和装置
CN107220352A (zh) * 2017-05-31 2017-09-29 北京百度网讯科技有限公司 基于人工智能构建评论图谱的方法和装置
CN108228794A (zh) * 2017-12-29 2018-06-29 三角兽(北京)科技有限公司 信息管理装置、信息处理装置及自动回复/评论方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Investigating User Acceptance of a Screenshot-Based Interaction System in the Context of Advanced Computer Software Learning;Travis K.Huang;Hawaii International Conference on System Sciences;第1530页-1605页 *
中文情感知识库构建与应用;黄硕;中国优秀硕士学位论文全文数据库信息科技辑(第S2期);第I138-1769页 *
基于粗糙集和集成学习的聊天知识抽取算法;王功孝;吴渝;李伟生;;广西师范大学学报(自然科学版);第26卷(第03期);第88页-91页 *
面向LDA主题模型的文本分类研究进展与趋势;赵乐等;计算机系统应用;第27卷(第8期);第10页-18页 *

Also Published As

Publication number Publication date
US20200193089A1 (en) 2020-06-18
CN109815482A (zh) 2019-05-28
US11397852B2 (en) 2022-07-26

Similar Documents

Publication Publication Date Title
CN109815482B (zh) 一种新闻交互的方法、装置、设备和计算机存储介质
US11302337B2 (en) Voiceprint recognition method and apparatus
US11012386B2 (en) Non-transitory computer-readable recording medium, method, system, and apparatus for exchanging message
CN109657054B (zh) 摘要生成方法、装置、服务器及存储介质
CN106649780B (zh) 基于人工智能的信息提供方法及装置
AU2017408800B2 (en) Method and system of mining information, electronic device and readable storable medium
CN108932066B (zh) 输入法获取表情包的方法、装置、设备和计算机存储介质
KR20180105693A (ko) 디지털 미디어 컨텐츠 추출 및 자연어 프로세싱 시스템
US11372942B2 (en) Method, apparatus, computer device and storage medium for verifying community question answer data
CN110234018B (zh) 多媒体内容描述生成方法、训练方法、装置、设备及介质
CN109271509B (zh) 直播间话题的生成方法、装置、计算机设备和存储介质
RU2632656C2 (ru) Система и методика автоматического обучения языкам на основе частотности синтаксических моделей
CN108920649B (zh) 一种信息推荐方法、装置、设备和介质
CN110032734B (zh) 近义词扩展及生成对抗网络模型训练方法和装置
CN111259262A (zh) 一种信息检索方法、装置、设备及介质
CN111078892A (zh) 对抗样本生成方法、装置、电子设备及存储介质
CN112528001A (zh) 一种信息查询方法、装置及电子设备
CN112163560A (zh) 一种视频信息处理方法、装置、电子设备及存储介质
CN110430448B (zh) 一种弹幕处理方法、装置及电子设备
CN108268443B (zh) 确定话题点转移以及获取回复文本的方法、装置
CN109190116B (zh) 语义解析方法、系统、电子设备及存储介质
CN116402166B (zh) 一种预测模型的训练方法、装置、电子设备及存储介质
US20230306205A1 (en) System and method for personalized conversational agents travelling through space and time
CN116186244A (zh) 生成文本摘要的方法、训练摘要生成模型的方法及装置
CN111222328A (zh) 标签提取方法、装置和电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant