CN114090748A - 问答结果显示方法、装置、设备及存储介质 - Google Patents
问答结果显示方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN114090748A CN114090748A CN202111298143.1A CN202111298143A CN114090748A CN 114090748 A CN114090748 A CN 114090748A CN 202111298143 A CN202111298143 A CN 202111298143A CN 114090748 A CN114090748 A CN 114090748A
- Authority
- CN
- China
- Prior art keywords
- answer
- question
- information
- structured data
- entity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/288—Entity relationship models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/313—Selection or weighting of terms for indexing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/338—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
- G06F40/35—Discourse or dialogue representation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Human Computer Interaction (AREA)
- Probability & Statistics with Applications (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请实施例提供一种问答结果显示方法、装置、设备及存储介质,所述方法包括:接收用户提问的目标问题,生成所述目标问题对应的回答;对所述回答进行分词及关键词提取,若关键词命中目标,则对所述回答进行文本分析,生成结构化数据;根据所述结构化数据,生成可视化展示信息,用以显示所述目标问题对应的问答结果图像。本申请能够解决现有技术中无法提供直观、有效的问答结果,进而无法满足用户对所需要信息更直观、更高效展现的需求的问题。
Description
技术领域
本申请实施例涉及智能问答领域,尤其涉及一种问答结果显示方法、装置、设备及存储介质。
背景技术
伴随着人工智能的发展,当前有关智能问答技术的研发十分火热,且相关技术已广泛应用于各类智能设备中。目前,一般在智能电视、智能屏等智能设备上都已支持语音问答系统,当前主要功能为语音、文本交互,在使用最多的闲聊、检索式问答中,给用户返回的内容基本都是文本、语音回答,或者检索到的文本内容,如新闻、百科介绍等。
在当前信息化社会,信息的质量很大程度依赖于其表达方式。并且,当前研究基本集中致力于提升回答的准确度,且返回的答案多为句子或其他文本内容。因此,单纯以文本、语音方式向用户返回数据,特别是返回长文本,用户很难集中注意力长时间阅读,无法快速把握所需信息的重点,无法满足用户对所需要信息更直观、更高效展现的需求。
因此,现有技术无法提供直观、有效的问答结果,进而无法满足用户对所需要信息更直观、更高效展现的需求。
发明内容
本申请实施例提供一种问答结果显示方法、装置、设备及存储介质,以解决现有技术中无法提供直观、有效的问答结果,进而无法满足用户对所需要信息更直观、更高效展现的需求的问题。
第一方面,本申请实施例提供一种问答结果显示方法,包括:
接收用户提问的目标问题,生成所述目标问题对应的回答;
对所述回答进行分词及关键词提取,若关键词命中目标,则对所述回答进行文本分析,生成结构化数据;
根据所述结构化数据,生成可视化展示信息,用以显示所述目标问题对应的问答结果图像。
在一种可能的设计中,所述对所述回答进行文本分析,生成结构化数据,包括:
若所述回答中携带有与所述回答相关联的附加文本信息,则对所述回答以及所述附加文本信息分别进行词频统计、实体及关系抽取、事件抽取,生成所述结构化数据。
在一种可能的设计中,所述对所述回答以及所述附加文本信息分别进行词频统计、实体及关系抽取、事件抽取,生成所述结构化数据,包括:
对所述回答以及所述附加文本信息进行词频统计,得到词频统计结果;
对所述回答以及所述附加文本信息中主实体和客实体进行联合解码,得到实体对,并通过学习主实体到客实体之间的映射,确定主实体和客实体之间的关系;其中,所述实体对包括主实体和客实体;
对所述回答以及所述附加文本信息进行事件抽取,得到事件识别信息和/或论元角色分类信息;
根据词频统计结果、实体对、主实体和客实体之间的关系以及事件识别信息和/或论元角色分类信息,生成结构化数据。
在一种可能的设计中,所述方法还包括:
对所述回答、所述附加文本信息以及所述结构化数据中至少一项在数据中进行信息检索,若检索到结果,则将检索结果作为额外信息添加至所述结构化数据中,生成新的结构化数据。
在一种可能的设计中,所述根据所述结构化数据,生成可视化展示信息,包括:
对所述结构化数据匹配图片样式,生成可视化展示信息;其中,所述图片样式至少包括词云图、关系网络图、静/动态统计图、时间轴图、趋势图、地图、二维码图;
将可视化展示信息进行显示。
在一种可能的设计中,所述对所述回答进行分词及关键词提取,包括:
对所述回答以及所述附加文本信息进行分词处理,得到多个分词;
对所述多个分词进行关键词提取,得到多个关键词,所述多个分词及所述多个关键词用于提供词频统计。
第二方面,本申请实施例提供一种问答结果显示装置,所述装置包括:
第一处理模块,用于接收用户提问的目标问题,生成所述目标问题对应的回答;
第二处理模块,用于对所述回答进行分词及关键词提取,若关键词命中目标,则对所述回答进行文本分析,生成结构化数据;
显示模块,用于根据所述结构化数据,生成可视化展示信息,用以显示所述目标问题对应的问答结果图像。
第三方面,本申请实施例提供一种电子设备,包括:至少一个处理器和存储器;
所述存储器存储计算机执行指令;
所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如上述第一方面以及第一方面各种可能的设计所述的问答结果显示方法。
第四方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如上述第一方面以及第一方面各种可能的设计所述的问答结果显示方法的步骤。
第五方面,本申请实施例提供一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现如上述第一方面以及第一方面各种可能的设计所述的问答结果显示方法的步骤。
本实施例提供的问答结果显示方法、装置、设备、存储介质及计算机程序产品,首先接收用户提问的目标问题,生成所述目标问题对应的回答;然后对所述回答进行分词及关键词提取,若关键词命中目标,则对所述回答进行文本分析,生成结构化数据;在根据所述结构化数据,生成可视化展示信息,用以显示所述目标问题对应的问答结果图像。通过可视化技术,对用户需要的内容进行图形、图像化处理,将多样、复杂的文本信息以图形、图像进行可视化呈现,从而使用户能够更直观、更高效地查看所需内容,进而提高了用户体验。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请提供的问答结果显示方法的场景示意图;
图2为本申请实施例提供的问答结果显示方法的流程示意图;
图3为本申请再一实施例提供的问答结果显示方法的流程示意图;
图4为本申请实施例提供的结构化数据的示意图;
图5A-5F为本申请实施例提供的问答结果可视化展示的示意图;
图6为本申请另一实施例提供的问答结果显示方法的流程示意图;
图7为本申请实施例提供的问答结果显示装置的结构示意图;
图8为本申请实施例提供的电子设备的硬件结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请的保护的范围。
在智能电视、智能屏上,大多都已支持语音问答系统,当前主要功能为语音、文本交互,给用户返回的内容除特定功能可能包含视觉内容(如天气图等),在使用最多的闲聊、检索式问答中,基本都是向用户返回文本、语音回答,或者检索到的文本内容,如新闻、百科介绍等。在当前信息化社会,信息的质量很大程度依赖于其表达方式。单纯以文本、语音方式向用户返回数据,特别是返回长文本,用户很难集中注意力长时间阅读,无法快速把握所需信息的重点,无法满足用户对所需要信息更直观、更高效展现的需求。且目前智能问答技术主要致力于提升回答的准确度,且返回的答案多为句子或其他文本内容,对于答案的呈现方式缺少特定的关注和系统性优化。因此,现有技术无法提供直观、有效的问答结果,进而无法满足用户对所需要信息更直观、更高效展现的需求。
因此,为了解决上述问题,本申请的技术构思是通过可视化技术,对用户需要的内容进行图形、图像化处理,将多样、复杂的文本信息以图形、图像进行可视化呈现,从而使用户能够更直观、更高效地把握所需内容;此外,相比枯燥的文字回答,可视化交互更能提高用户对问答系统的使用兴趣,进而提高了用户体验。
在实际应用中,参见图1所示,图1为本申请提供的问答结果显示方法的场景示意图。本申请实施例的执行主体可以是显示设备,显示设备可以是智能电视、智能屏等智能设备。下述以智能电视10为例,问答结果显示的过程可以为:
首先用户对安装有问答系统的智能电视10中的语音助手进行呼叫,比如,呼叫小X。小X对此呼叫作出应答,(比如:您好,小X来啦)并显示问答窗口101。用户在小X作出应答后,提出想要问的问题(比如:人物A的家人),智能电视开始搜索该问题对应的回答,并通过对该回答进行关键词提取,若能提取关键词到,则对该回答进行文本分析,生成结构化数据,并基于结构化数据生成可视化展示信息,比如基于欧洲杯在哪举办的可视化图片,并在该显示问答窗口上显示。
具体地,结合图3所示,首先针对原始文本(比如回答、以及回答中携带的附加文本信息)进行文本信息挖掘,比如文本预处理、文本特征的抽取、文本特征的度量;再对挖掘后的文本信息进行视图绘制,比如图元设计、图元布局等,然后以图片的形式显示问答结果,反馈给用户,实现人机交互。通过文本分析以及可视化技术为用户提供直观、高效地问答结果,进而提高用户体验。
下面以具体地实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行描述。
图2为本申请实施例提供的问答结果显示方法的流程示意图。如图2所示,该方法可以包括:
S201:接收用户提问的目标问题,生成所述目标问题对应的回答。
本实施例中,用户提问经过问答系统,可生成回答。有时回答会附加文本信息,如相关百科、新闻等。
示例性的,用户提问“欧洲杯在哪举办”,生成的回答“今年欧洲杯举办地有:A地、B地、C地”。该回答可能还携带有其他的体育赛事作为附加文本信息。
S202、对所述回答进行分词及关键词提取,若关键词命中目标,则对所述回答进行文本分析,生成结构化数据。
本实施例中,对回答进行关键词的提取过程中,由于回答可能是文本形式,可以对回答进行分词处理,然后从分词中提取关键词。如果关键词命中目标,则进入可视化展示步骤,否则直接输出原回答(如问答系统直接返回兜底结果或返回非文本结果,直接输出原回答)。
在一种可能的设计中,本实施例在上述实施例的基础上,对如何进行关键词提取进行了详细说明。对所述回答进行分词及关键词提取,可以通过以下步骤实现:
步骤a1、对所述回答以及所述附加文本信息进行分词处理,得到多个分词;
步骤a2、对所述多个分词进行关键词提取,得到多个关键词,所述多个分词及所述多个关键词用于提供词频统计。
本实施例中,基于统计的分词,具体步骤为:动态规划查找最大概率路径,找出基于词频的最大切分组合,对于未登录词,采用基于汉字成词能力的HMM模型,如进行人名、地名、机构名等未登录名词的识别。并使用Viterbi算法重新计算最佳切分路径,用于结果文本的分词处理。然后基于分词结果,进行关键词提取。参见下述表1(以2020年欧洲杯在哪举办为例)。
表1
S203、根据所述结构化数据,生成可视化展示信息,用以显示所述目标问题对应的问答结果图像。
本实施例中,主要基于Python进行可视化生成,可视化样式涉及:wordnet词云、关系网络图、timeline(即时间轴)、趋势图、地图、treemap(树图)、二维码生成等。基于结构化数据,从可视化样式中查找较为匹配的图片样式,然后基于匹配到的图片样式,将结构化数据生成对应的问答结果图像。
本实施例提供的问答结果显示方法,首先接收用户提问的目标问题,生成所述目标问题对应的回答;然后对所述回答进行分词及关键词提取,若关键词命中目标,则对所述回答进行文本分析,生成结构化数据;在根据所述结构化数据,生成可视化展示信息,用以显示所述目标问题对应的问答结果图像。通过可视化技术,对用户需要的内容进行图形、图像化处理,将多样、复杂的文本信息以图形、图像进行可视化呈现,从而使用户能够更直观、更高效地查看所需内容,进而提高了用户体验。
在一种可能的设计中,本实施例在上述实施例的基础上,对S202进行了详细说明。对所述回答进行文本分析,生成结构化数据,可以通过以下步骤实现:
若所述回答中携带有与所述回答相关联的附加文本信息,则对所述回答以及所述附加文本信息分别进行词频统计、实体及关系抽取、事件抽取,生成所述结构化数据。
本实施例中,文本分析可以包含但不限于词频统计、实体及关系抽取、事件抽取、信息检索等模块(后续可根据实际业务需求添加新功能模块),用于将回答和附加文本信息处理并生成结构化数据。
其中,词频统计用于文本中的关键词统计,方法为[target word].count,如答案为长文本,则除关键词外,对文本分词后做整体词频统计;实体、关系、事件抽取结构化的三元组或多元组信息;信息检索模块是基于信息检索技术,使用关键词在数据库(ElasticSearch)中检索,如获取到结果,则将之作为附加信息加入。具体如下表2所示:
表2
在一种可能的设计中,生成结构化数据的过程为:
步骤b1、对所述回答以及所述附加文本信息进行词频统计,得到词频统计结果;
对所述回答以及所述附加文本信息中主实体和客实体进行联合解码,得到实体对,并通过学习主实体到客实体之间的映射,确定主实体和客实体之间的关系;其中,所述实体对包括主实体和客实体。
步骤b2、对所述回答以及所述附加文本信息进行事件抽取,得到事件识别信息和/或论元角色分类信息。
步骤b3、根据词频统计结果、实体对、主实体和客实体之间的关系以及事件识别信息和/或论元角色分类信息,生成结构化数据。
本实施例中,针对词频统计,基于上述实施例的提取的关键词,进行词频统计
针对信息抽取(information extraction)(用于问答结果文本的实体、关系及事件抽取),即从自然语言文本中,抽取出特定的事件或事实信息,帮助我们将海量内容自动分类、提取和重构。这些信息通常包括实体(entity)、关系(relation)、事件(event)。例如从新闻中抽取时间、地点、关键人物等。信息抽取主要包括三个子任务:a)实体抽取与链指:也就是命名实体识别;b)关系抽取:通常我们说的三元组(triple)抽取,主要用于抽取实体间的关系;c)事件抽取:相当于一种多元关系的抽取。
其中,针对实体及关系的联合抽取。命名实体识别(Named Entity Recognition,简称NER),又称作“专名识别”,是指识别文本中具有特定意义的实体,主要包括人名、地名、机构名、专有名词等。NER是深度查询理解(Deep Query Understanding,简称DQU)的底层基础信号,主要应用于搜索召回、用户意图识别、实体链接等环节。
此外,关系抽取通常在实体抽取与实体链指之后。在识别出句子中的关键实体后,还需要抽取两个实体或多个实体之间的语义关系。语义关系通常用于连接两个实体,并与实体一起表达文本的主要含义。常见的关系抽取结果可以用SPO结构的三元组来表示,即(Subject,Predication,Object)。
具体地,采用BERT做编码的CASREL(cascade binary tagging framework)模型来搭建三元组关系抽取算法框架。该算法通过对主实体和客实体的联合解码来实现实体对的抽取,同时通过学习主实体到客实体之间的映射来确定两者的关系。其中,算法的目标函数如下所示:
其中,D表示训练数据集,句子Xj∈D,Tj={(s,r,o)}表示Xj中的所有可能三元组;s表示subject(即主实体),r表示relation(即关系),o表示object(即客实体);pr表示在关系r中,对于给定的s,模型识别出o的概率,如果没有识别出o,则为空,用表示。
针对事件抽取,可以从非结构化信息中抽取出用户感兴趣的事件,并以结构化呈现给用户。事件抽取任务可分解为4个子任务:触发词识别、事件类型分类、论元识别和角色分类任务。其中,触发词识别和事件类型分类可合并成事件识别任务。事件识别判断句子中的每个单词归属的事件类型,是一个基于单词的多分类任务。论元识别和角色分类可合并成论元角色分类任务。角色分类任务则是一个基于词对的多分类任务,判断句子中任意一对触发词和实体之间的角色关系。
因此,事件抽取任务总体可以分为两个大类:元事件抽取和主题事件抽取。元事件表示一个动作的发生或状态的变化,往往由动词驱动,也可以由能表示动作的名词等其他词性的词来触发,它包括参与该动作行为的主要成分(如时间、地点、人物等)。主题事件包括一类核心事件或活动以及所有与之直接相关的事件和活动,可以由多个元事件片段组成。
本实施例中,主要基于面对元事件抽取方法,框架上同样采用BERT做编码的三元组关系抽取算法框架,但在数据格式上定义不同。
在一种可能的设计中,本实施例在上述实施例的基础上,对问答结果显示方法进行了详细说明。该方法还可以通过以下步骤实现:
对所述回答、所述附加文本信息以及所述结构化数据中至少一项在数据库中进行信息检索,若检索到结果,则将检索结果作为额外信息添加至所述结构化数据中,生成新的结构化数据。
本实施例中,信息检索(Information Retrieval)是用户进行信息查询和获取的主要方式。按照数据的分类,搜索也分为两种:a)对结构化数据的搜索:如对数据库或对元数据的搜索;b)对非结构化数据的搜索:如搜索文件内容,Linux下的grep命令,再如搜索引擎可以搜索大量内容数据。本实施例中主要基于对结构化数据,在数据库中进行检索,若检索到结果,作为额外信息加入(参见表2所示)。
在一种可能的设计中,如何根据所述结构化数据,生成可视化展示信息,可以通过以下步骤实现:
步骤c1、对所述结构化数据匹配图片样式,生成可视化展示信息;其中,所述图片样式至少包括词云图、关系网络图、静/动态统计图、时间轴图、趋势图、地图、二维码图;
步骤c2、将可视化展示信息进行显示。
本实施例中,使用生成的结构化数据((参见图4所示的结构化数据的示意图)),对输出样式进行匹配,并判断是否同时输出原文本回答。以上述欧洲杯在哪举办为例,匹配图片样式:map()类—world。生成可视化图即可视化展示信息,并向用户返回可视化结果即可视化展示信息。
示例性的,分类实例展示(参见图5A-5F提供的问答结果可视化展示的示意图):
a)Wordnet词云。结合表3中的祝福词生成祝福词云(结合图5A所示的词云图)
表3
其中,依据业务需要,还可以自定义关键词mask,如制定新年关键词mask为“福到”样式,生成特殊样式词云(结合图5B所示的词云图)。
b)关系网络图。基于表2中人物关系,生成关系网络图(结合图5C所示的关系网络图)。
表4
c)静/动态统计图。基于表5中往届奖牌信息,生成统计图(结合图5D所示的统计图,其中,M、P、Q代表奖牌得主所在地)。
表5
d)Timeline。基于表6中某一电影系列,生成是时间轴图(结合图5E所示的时间轴图)。
表6
e)Treemap。基于表7中某一品牌手机的直营店分布信息,生成是树形图(结合图5F所示的树形图)。
表7
针对地图以及二维码的展示在此不一一列举,生成过程可以参见上述实施例基于结构化数据生成可视化展示信息的过程,在此不再赘述。
在实际应用中,结合图6所示的问答结果显示方法的流程示意图。首先用户Query经过问答系统,可生成回答(有时回答会附加文本信息,如相关百科、新闻等)。对生成的信息进行分词处理及关键词抽取,如果关键词hit target(即命中目标),进入可视化展示步骤(基于结构化数据匹配输出样式,可视化展示生成,进而输出可视化+文本回答),否则直接输出原回答(如问答系统直接返回兜底结果或返回非文本结果,也直接输出原回答)。
对应于上文实施例的问答结果显示方法,图7为本申请实施例提供的问答结果显示装置的结构示意图。为了便于说明,仅示出了与本申请实施例相关的部分。如图7所示,问答结果显示装置70包括:第一处理模块701、第二处理模块702、显示模块703;第一处理模块701,用于接收用户提问的目标问题,生成所述目标问题对应的回答;第二处理模块702,用于对所述回答进行分词及关键词提取,若关键词命中目标若关键词命中目标,则对所述回答进行文本分析,生成结构化数据;显示模块703,用于根据所述结构化数据,生成可视化展示信息,用以显示所述目标问题对应的问答结果图像。
本实施例提供的问答结果显示装置,通过配置第一处理模块701、第二处理模块702、显示模块603,用于接收用户提问的目标问题,生成所述目标问题对应的回答;然后对所述回答进行分词及关键词提取,若关键词命中目标若关键词命中目标,则对所述回答进行文本分析,生成结构化数据;在根据所述结构化数据,生成可视化展示信息,用以显示所述目标问题对应的问答结果图像。通过可视化技术,对用户需要的内容进行图形、图像化处理,将多样、复杂的文本信息以图形、图像进行可视化呈现,从而使用户能够更直观、更高效地查看所需内容,进而提高了用户体验。
本申请实施例提供的装置,可用于执行上述方法实施例的技术方案,其实现原理和技术效果类似,本申请实施例此处不再赘述。
在一种可能的设计中,所述第二处理模块包括第一处理单元;第一处理单元,用于在所述回答中携带有与所述回答相关联的附加文本信息时,对所述回答以及所述附加文本信息分别进行词频统计、实体及关系抽取、事件抽取,生成所述结构化数据。
在一种可能的设计中,第一处理单元,具体用于:
对所述回答以及所述附加文本信息进行词频统计,得到词频统计结果;
对所述回答以及所述附加文本信息中主实体和客实体进行联合解码,得到实体对,并通过学习主实体到客实体之间的映射,确定主实体和客实体之间的关系;其中,所述实体对包括主实体和客实体;
对所述回答以及所述附加文本信息进行事件抽取,得到事件识别信息和/或论元角色分类信息;
根据词频统计结果、实体对、主实体和客实体之间的关系以及事件识别信息和/或论元角色分类信息,生成结构化数据。
在一种可能的设计中,所述问答结果显示装置还可以包括第三处理模块,所述第三处理模块,用于对所述回答、所述附加文本信息以及所述结构化数据中至少一项在数据库中进行信息检索,若检索到结果,则将检索结果作为额外信息添加至所述结构化数据中,生成新的结构化数据。
在一种可能的设计中,显示处理模块,具体用于:
对所述结构化数据匹配图片样式,生成可视化展示信息;其中,所述图片样式至少包括词云图、关系网络图、静/动态统计图、时间轴图、趋势图、地图、二维码图;
将可视化展示信息进行显示。
在一种可能的设计中,所述第二处理模块,还具体用于:
对所述回答以及所述附加文本信息进行分词处理,得到多个分词;
对所述多个分词进行关键词提取,得到多个关键词,所述多个分词及所述多个关键词用于提供词频统计。
图8为本申请实施例提供的电子设备的硬件结构示意图。如图8所示,本实施例提供的电子设备80包括:至少一个处理器801和存储器802。其中,处理器801、存储器802通过总线803连接。
在具体实现过程中,至少一个处理器801执行所述存储器802存储的计算机执行指令,使得至少一个处理器801执行上述方法实施例中的方法。
处理器801的具体实现过程可参见上述方法实施例,其实现原理和技术效果类似,本实施例此处不再赘述。
在上述的图8所示的实施例中,应理解,处理器可以是中央处理单元(英文:Central Processing Unit,简称:CPU),还可以是其他通用处理器、数字信号处理器(英文:Digital Signal Processor,简称:DSP)、专用集成电路(英文:Application SpecificIntegrated Circuit,简称:ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合发明所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
存储器可能包含高速RAM存储器,也可能还包括非易失性存储NVM,例如至少一个磁盘存储器。
总线可以是工业标准体系结构(Industry Standard Architecture,ISA)总线、外部设备互连(Peripheral Component Interconnect,PCI)总线或扩展工业标准体系结构(Extended Industry Standard Architecture,EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,本申请附图中的总线并不限定仅有一根总线或一种类型的总线。
本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现上述方法实施例的问答结果显示方法。
本申请实施例还提供一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述方法实施例的问答结果显示方法。
上述的计算机可读存储介质,上述可读存储介质可以是由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。可读存储介质可以是通用或专用计算机能够存取的任何可用介质。
一种示例性的可读存储介质耦合至处理器,从而使处理器能够从该可读存储介质读取信息,且可向该可读存储介质写入信息。当然,可读存储介质也可以是处理器的组成部分。处理器和可读存储介质可以位于专用集成电路(Application Specific IntegratedCircuits,简称:ASIC)中。当然,处理器和可读存储介质也可以作为分立组件存在于设备中。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述各实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。
Claims (10)
1.一种问答结果显示方法,其特征在于,所述方法包括:
接收用户提问的目标问题,生成所述目标问题对应的回答;
对所述回答进行分词及关键词提取,若关键词命中目标,则对所述回答进行文本分析,生成结构化数据;
根据所述结构化数据,生成可视化展示信息,用以显示所述目标问题对应的问答结果图像。
2.根据权利要求1所述的方法,其特征在于,所述对所述回答进行文本分析,生成结构化数据,包括:
若所述回答中携带有与所述回答相关联的附加文本信息,则对所述回答以及所述附加文本信息分别进行词频统计、实体及关系抽取、事件抽取,生成所述结构化数据。
3.根据权利要求2所述的方法,其特征在于,所述对所述回答以及所述附加文本信息分别进行词频统计、实体及关系抽取、事件抽取,生成所述结构化数据,包括:
对所述回答以及所述附加文本信息进行词频统计,得到词频统计结果;
对所述回答以及所述附加文本信息中主实体和客实体进行联合解码,得到实体对,并通过学习主实体到客实体之间的映射,确定主实体和客实体之间的关系;其中,所述实体对包括主实体和客实体;
对所述回答以及所述附加文本信息进行事件抽取,得到事件识别信息和/或论元角色分类信息;
根据词频统计结果、实体对、主实体和客实体之间的关系以及事件识别信息和/或论元角色分类信息,生成结构化数据。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
对所述回答、所述附加文本信息以及所述结构化数据中至少一项在数据库中进行信息检索,若检索到结果,则将检索结果作为额外信息添加至所述结构化数据中,生成新的结构化数据。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述根据所述结构化数据,生成可视化展示信息,包括:
对所述结构化数据匹配图片样式,生成可视化展示信息;其中,所述图片样式至少包括词云图、关系网络图、静/动态统计图、时间轴图、趋势图、地图、二维码图;
将可视化展示信息进行显示。
6.根据权利要求2所述的方法,其特征在于,所述对所述回答进行分词及关键词提取,包括:
对所述回答以及所述附加文本信息进行分词处理,得到多个分词;
对所述多个分词进行关键词提取,得到多个关键词,所述多个分词及所述多个关键词用于提供词频统计。
7.一种显示调节装置,其特征在于,所述装置包括:
第一处理模块,用于接收用户提问的目标问题,生成所述目标问题对应的回答;
第二处理模块,用于对所述回答进行分词及关键词提取,若关键词命中目标,则对所述回答进行文本分析,生成结构化数据;
显示模块,用于根据所述结构化数据,生成可视化展示信息,用以显示所述目标问题对应的问答结果图像。
8.一种电子设备,其特征在于,包括:至少一个处理器和存储器;
所述存储器存储计算机执行指令;
所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如权利要求1至6中任一项所述的问答结果显示方法。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如权利要求1至6任一项所述的问答结果显示方法。
10.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至6中任一项所述的问答结果显示方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111298143.1A CN114090748A (zh) | 2021-11-04 | 2021-11-04 | 问答结果显示方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111298143.1A CN114090748A (zh) | 2021-11-04 | 2021-11-04 | 问答结果显示方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114090748A true CN114090748A (zh) | 2022-02-25 |
Family
ID=80298862
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111298143.1A Pending CN114090748A (zh) | 2021-11-04 | 2021-11-04 | 问答结果显示方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114090748A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115455169A (zh) * | 2022-10-31 | 2022-12-09 | 杭州远传新业科技股份有限公司 | 一种基于词汇知识和语义依存的知识图谱问答方法和系统 |
-
2021
- 2021-11-04 CN CN202111298143.1A patent/CN114090748A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115455169A (zh) * | 2022-10-31 | 2022-12-09 | 杭州远传新业科技股份有限公司 | 一种基于词汇知识和语义依存的知识图谱问答方法和系统 |
CN115455169B (zh) * | 2022-10-31 | 2023-04-18 | 杭州远传新业科技股份有限公司 | 一种基于词汇知识和语义依存的知识图谱问答方法和系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11775760B2 (en) | Man-machine conversation method, electronic device, and computer-readable medium | |
US20220188521A1 (en) | Artificial intelligence-based named entity recognition method and apparatus, and electronic device | |
CN105824959B (zh) | 舆情监控方法及系统 | |
CN106649818B (zh) | 应用搜索意图的识别方法、装置、应用搜索方法和服务器 | |
CN110263248B (zh) | 一种信息推送方法、装置、存储介质和服务器 | |
CN110325986B (zh) | 文章处理方法、装置、服务器及存储介质 | |
Gupta et al. | A survey of text question answering techniques | |
US10198506B2 (en) | System and method of sentiment data generation | |
US20150081277A1 (en) | System and Method for Automatically Classifying Text using Discourse Analysis | |
US20130159277A1 (en) | Target based indexing of micro-blog content | |
CN111324771B (zh) | 视频标签的确定方法、装置、电子设备及存储介质 | |
US20220254507A1 (en) | Knowledge graph-based question answering method, computer device, and medium | |
US10311113B2 (en) | System and method of sentiment data use | |
CN107526846B (zh) | 频道排序模型的生成、排序方法、装置、服务器和介质 | |
CN110162768B (zh) | 实体关系的获取方法、装置、计算机可读介质及电子设备 | |
CN107967250B (zh) | 一种信息处理方法及装置 | |
US10417338B2 (en) | External resource identification | |
CN110287314B (zh) | 基于无监督聚类的长文本可信度评估方法及系统 | |
CN110032734B (zh) | 近义词扩展及生成对抗网络模型训练方法和装置 | |
CN112287090A (zh) | 一种基于知识图谱的金融问题反问方法及系统 | |
WO2021012958A1 (zh) | 原创文本甄别方法、装置、设备与计算机可读存储介质 | |
US20240104302A1 (en) | Minutes processing method and apparatus, device, and storage medium | |
Wu et al. | English vocabulary online teaching based on machine learning recognition and target visual detection | |
CN114090748A (zh) | 问答结果显示方法、装置、设备及存储介质 | |
CN116090450A (zh) | 一种文本处理方法及计算设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |