CN107357787B - 语义交互方法、装置及电子设备 - Google Patents
语义交互方法、装置及电子设备 Download PDFInfo
- Publication number
- CN107357787B CN107357787B CN201710620732.4A CN201710620732A CN107357787B CN 107357787 B CN107357787 B CN 107357787B CN 201710620732 A CN201710620732 A CN 201710620732A CN 107357787 B CN107357787 B CN 107357787B
- Authority
- CN
- China
- Prior art keywords
- response
- interactive content
- core elements
- content
- module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000003993 interaction Effects 0.000 title claims abstract description 65
- 238000000034 method Methods 0.000 title claims abstract description 41
- 230000002452 interceptive effect Effects 0.000 claims abstract description 221
- 230000004044 response Effects 0.000 claims abstract description 216
- 238000013145 classification model Methods 0.000 claims abstract description 42
- 239000013589 supplement Substances 0.000 claims abstract description 13
- 230000001502 supplementing effect Effects 0.000 claims abstract description 12
- 239000013598 vector Substances 0.000 claims description 14
- 238000002372 labelling Methods 0.000 claims description 13
- 238000000605 extraction Methods 0.000 claims description 10
- 238000007635 classification algorithm Methods 0.000 claims description 9
- 238000006243 chemical reaction Methods 0.000 claims description 8
- 238000012549 training Methods 0.000 claims description 6
- 238000010586 diagram Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 6
- 239000000047 product Substances 0.000 description 6
- 238000004422 calculation algorithm Methods 0.000 description 5
- 230000002093 peripheral effect Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000011218 segmentation Effects 0.000 description 3
- 230000000295 complement effect Effects 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/151—Transformation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Machine Translation (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本发明提供了一种语义交互方法、装置及电子设备,通过将用户输入的初始交互内容输入到预设的分类模型中以得到初始交互内容对应的应用场景,获取该应用场景对应的应答核心要素,判断初始交互内容是否包括全部的应答核心要素,在初始交互内容未包括全部应答核心要素时,生成补充缺失的应答核心要素的询问,接收用户响应询问的接续交互内容,直到接收到的接续交互内容补全应答核心要素时,根据应答核心要素的内容生成用户需要的应答。本发明通过分类模型将用户的初始交互内容分类到对应的应用场景,在特定的应用场景中进行交互,提高交互的准确性。此外,当交互内容不完整时,给出补充完整信息的询问,引导用户完善信息,应答更加准确、人性化。
Description
技术领域
本发明涉及语义交互领域,具体而言,涉及一种语义交互方法、装置及电子设备。
背景技术
现有的语义交互产品中,对于用户输入的语义内容,采用句法分析或者分词的方式来确定用户输入的交互内容为哪一领域,这种方式的弊端在于,对于用户输入某些语义内容可能包括多个属于不同领域的分词,或者语义内容中没有预设的目标分词,导致识别领域时出错,或者领域定位不准确,产生用户不需要的应答,用户体验感较差。
发明内容
有鉴于此,本发明实施例的目的在于提供一种语义交互方法、装置及电子设备,以改善上述的问题。
为了达到上述的目的,本发明实施例采用的技术方案如下所述:
第一方面,本发明实施例提供了一种语义交互方法,所述方法包括:获取用户输入的初始交互内容;将所述初始交互内容输入预设的分类模型,得到所述初始交互内容对应的应用场景;获取所述应用场景对应的应答核心要素;判断所述初始交互内容是否包括全部所述应答核心要素;当所述初始交互内容包括全部所述应答核心要素时,根据全部所述应答核心要素的内容生成用户需要的应答。
进一步地,所述方法还包括:当所述初始交互内容未包括全部所述应答核心要素时,生成补充缺失的应答核心要素的询问;接收用户响应所述询问的接续交互内容;当所述接续交互内容补全所述应答核心要素时,根据全部所述应答核心要素的内容生成用户需要的应答。
进一步地,所述方法还包括:当所述接续交互内容为用于补全所述应答核心要素的交互内容时,判断所述初始交互内容以及所述接续交互内容是否包括全部所述应答核心要素。
进一步地,所述方法还包括:当所述接续交互内容不是用于补全所述应答核心要素的交互内容时,将所述接续交互内容输入预设的分类模型,得到接续交互内容对应的应用场景并继续执行与所述接续交互内容对应的应用场景关联的应答。
进一步地,所述当所述接续交互内容补全所述应答核心要素时,根据所述应答核心要素的内容生成用户需要的应答的步骤包括:根据所述应答核心要素在所述应用场景对应的知识库中寻找相应的应答内容,根据全部所述应答内容生成用户需要的应答。
进一步地,所述分类模型通过以下步骤建立:获取人工标注数据,所述人工标注数据包括对话信息及与所述对话信息对应的分类信息;将所述人工标注数据中的对话信息转化为数值向量;通过分类算法对所述数值向量表示的对话信息和分类信息进行建模,训练所述分类模型。
第二方面,本发明实施例提供了一种语义交互装置,所述装置包括:获取模块、分类模块、提取模块、判断模块和应答模块。其中:获取模块用于获取用户输入的初始交互内容;分类模块用于将所述初始交互内容输入预设的分类模型,得到所述初始交互内容对应的应用场景;提取模块用于获取所述应用场景对应的应答核心要素;判断模块用于判断所述初始交互内容是否包括全部所述应答核心要素;应答模块用于当所述初始交互内容包括全部所述应答核心要素时,根据全部所述应答核心要素的内容生成用户需要的应答。
进一步地,所述应答模块还用于当所述初始交互内容未包括全部所述应答核心要素时,生成补充缺失的应答核心要素的询问;所述获取模块还用于接收用户响应所述询问的接续交互内容;所述应答模块还用于当所述接续交互内容补全所述应答核心要素时,根据全部所述应答核心要素的内容生成用户需要的应答。
进一步地,所述装置还包括内容判断模块,用于判断所述接续交互内容是否用于补全所述应答核心要素;当所述接续交互内容为用于补全所述应答核心要素的交互内容时,所述判断模块判断所述初始交互内容以及所述接续交互内容是否包括全部所述应答核心要素。
进一步地,所述装置还包括内容判断模块,用于判断所述接续交互内容是否用于补全所述应答核心要素;当所述接续交互内容为不是用于补全所述应答核心要素的交互内容时,所述分类模块将所述接续交互内容输入预设的分类模型,得到接续交互内容对应的应用场景并继续执行与所述接续交互内容对应的应用场景关联的应答。
进一步地,所述应答模块用于根据全部所述应答核心要素在所述应用场景对应的知识库中寻找相应的应答内容,根据所述应答内容生成用户需要的应答。
进一步地,所述语义交互装置还包括数据获取模块、数据转换模块和模型建立模块,用于构建分类模型。其中,数据获取模块用于获取人工标注数据,所述人工标注数据包括对话信息及与所述对话信息对应的分类信息;数据转换模块用于将所述人工标注数据中的对话信息转化为数值向量;模型建立模块用于通过分类算法对所述数值向量表示的对话信息和分类信息进行建模,训练所述分类模型。
第三方面,本发明实施例提供了一种电子设备,包括处理器、存储器、以及语义交互装置。所述语义交互装置安装于所述存储器中并包括一个或多个由所述处理器执行的软件功能模块,所述语义交互装置包括获取模块、分类模块、提取模块、判断模块和应答模块。其中,获取模块用于获取用户输入的初始交互内容;分类模块用于将所述初始交互内容输入预设的分类模型,得到所述初始交互内容对应的应用场景;提取模块用于获取所述应用场景对应的应答核心要素;判断模块用于判断所述初始交互内容是否包括全部所述应答核心要素;应答模块用于当所述初始交互内容包括全部所述应答核心要素时,根据全部所述应答核心要素的内容生成用户需要的应答。
本发明实施例提供的语义交互方法、装置及电子设备,通过将用户输入的初始交互内容输入到预设的分类模型中以得到初始交互内容对应的应用场景,获取该应用场景对应的应答核心要素,判断初始交互内容是否包括全部的应答核心要素,在初始交互内容未包括全部应答核心要素时,生成补充缺失的应答核心要素的询问,接收用户响应询问的接续交互内容,直到接收到的接续交互内容补全应答核心要素时,根据应答核心要素的内容生成用户需要的应答。本发明实施例提供的语义交互方法、装置及电子设备,通过分类模型将用户的初始交互内容分类到对应的应用场景,在特定的应用场景中进行交互,提高交互的准确性。
此外,当用户的交互内容不完整时,给出补充完整信息的询问,引导用户完善信息,应答更加准确、人性化,提高了用户的体验。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1是现有的语义交互产品的交互场景示意图。
图2是本发明实施例提供的语义交互方法的流程图。
图3是本发明实施例提供的分类模型建立的流程图。
图4-图5是本发明实施例提供的语义交互方法的应用场景示意图。
图6是本发明实施例提供的语义交互装置的功能模块架构示意图。
图7是本发明实施例提供的电子设备的方框示意图。
图标:300-语义交互装置;301-获取模块;302-分类模块;303-提取模块;304-判断模块;305-应答模块;306-内容判断模块;307-数据获取模块;308-数据转换模块;309-模型建立模块;400-电子设备;410-存储器;420-处理器;430-存储控制器;440-外设接口;450-显示单元;460-音频单元。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
请参照图1,是现有的语义交互产品与用户的交互场景示意图。用户输入的交互内容为“去北京的飞机”,由于语义交互产品不明白用户的交互内容或者理解错误,给出的应答为“火车托运还是飞机托运啊”,该应答明显与用户的需求不符。为了改善上述问题,本发明实施例提出了一种语义交互方法,请参照图2,是该语义交互方法的流程图,该语义交互方法包括以下步骤:
步骤S101,获取用户输入的初始交互内容。
该初始交互内容可以是用户通过语音或者文本输入的交互内容,在本实施例中,优选用户的交互内容为用户通过语音输入的交互内容。在本发明实施例中,初始交互内容指用户产生的一次新的需求交互中的第一句交互内容。
步骤S102,将初始交互内容输入预设的分类模型,得到初始交互内容对应的应用场景。
在获取到用户输入的初始交互内容后,将判断用户当前所输入的交互内容属于哪一应用场景,应用场景是指用户当前的初始交互内容属于哪一类需求,容易理解,应用场景可以为观影、听音乐、出行、导航、天气、出行等需求,例如,用户输入的初始交互内容为“天气怎么样”,则对应的应用场景为天气。将用户的初始交互内容对应到相应的应用场景中,信息噪音更少,能提高应答的准确性。
在本实施例中,通过将初始交互内容输入至一预先设定的分类模型中,通过该分类模型对初始交互内容进行分类,以得到初始交互内容对应的应用场景。请参照图3,是该分类模型的建立流程图,包括:
步骤S201,获取人工标注数据,该人工标注数据包括对话信息及与对话信息对应的分类信息。
对话信息为用户与语义交互产品产生的对话信息,例如用户与智能电视机对话产生的对话信息,与对话信息对应的分类信息为人工标注的分类信息,通过人工对对话信息进行标注,比如,对话信息为“上海明天会下雨吗”,人工标注该对话信息的应用场景为“天气”,对话信息为“我想看《人民的名义》第三集”,人工标注该对话信息的应用场景为“看视频”,对话信息为“我想听《小幸运》”,人工标注该对话信息的应用场景为“听音乐”等。获取的人工标注数据越多,训练的分类模型的分类准确率越高。例如,人工标注数据中,对于对话信息“明天会下雨吗”、“明天会出太阳吗”、“明天天气怎样”、“明天出门需要带伞吗”等多种询问天气的方式,均标注为“天气”的应用场景,同一应用场景的对话信息越多,针对该应用场景的训练越成熟,分类模型对该应用场景的分类更加准确。
步骤S202,将人工标注数据转化为数值向量。
为了更好的利用分类算法,需要将获取到的人工标注数据转化为数值向量,以便于计算机处理,在本实施例中,人工标注数据为文本,将文本转换为数值向量,可以采用文本表述算法实现,比如word2vec。
步骤S203,通过分类算法对数值向量表示的对话信息和分类信息进行建模,训练所述分类模型。
本发明实施例对分类算法不做限定,比如,该分类算法可以是支持向量机(SVM,Support Vector Machine)算法,决策树算法或神经网络算法。
分类模型训练好后,用户输入的初始交互内容输入至分类模型中,则分类模型自动输出该初始交互内容对应的应用场景。通过分类模型进行应用场景的分类能够得到准确的结果。
步骤S103,获取应用场景对应的应答核心要素。
在本发明实施例中,每个应用场景对应有应答核心要素,该应答核心要素为向用户产生准确应答所必要的条件,缺少必要的条件,将无法给出准确的应答甚至无法应答,比如,在“天气”的应用场景中,要为用户准确的关于天气的应答,需要的必要条件为时间、地点,如果用户输入的交互内容为“上海天气怎样”,则该交互内容缺乏应答核心要素“时间”,此时,无法向用户给出准确的关于天气的应答。
步骤S104,判断初始交互内容是否包括全部应答核心要素。当初始交互内容包括全部应答核心要素,执行步骤S109,当初始交互内容未包括全部应答核心要素时,执行步骤S105。
判断初始交互内容是否包括全部应答核心要素,可以通过分词或者句法分析算法,将初始交互内容中的文字进行识别提取,再判断提取出的内容是否包含全部的应答核心要素。例如,用户输入的初始交互内容为“去北京的机票”,经过分类模型计算判断应用场景为“机票预定”,“机票预订”的应用场景的应答核心要素包括“出行时间”、“出发地点”、“目的地”,对“去北京的机票”中的文字进行识别提取可得到“去北京”,即“目的地”,因此,该初始交互内容缺少“出发地点”和“出行时间”。
步骤S105,生成补充缺失的应答核心要素的询问。
如果初始交互内容缺少应答核心要素,则向用户询问缺少的应答核心要素是什么,例如,请参照图4,当用户输入的初始交互内容为“去北京的飞机”时,由于缺少“出发地点”和“出行时间”的应答核心要素,生成的补充缺失的应答核心要素的询问的内容为“请问您从哪儿出发”以询问用户应答核心要素“出发地点”,容易理解的,上述询问方式中,仅问了“出发地点”,待用户对“出发地点”响应后,再询问“出发时间”。可以想到,在其他实施方式中,可以同时询问“出发地点”和“出发时间”,本发明实施例对此不做限定。
步骤S106,接收用户响应询问的接续交互内容。
该接续交互内容为用户在被询问之后,给出的交互内容。
步骤S107,判断接续交互内容是否用于补全应答核心要素。当接续交互内容用于补全应答核心要素,执行步骤S108,当接续交互内容不用于补全应答核心要素,执行步骤S102。此处所述判断接续交互内容是否用于补全应答核心要素,即为判断接续交互内容与初始交互内容是否为相同轮次,具体指接续交互内容是否是针对用户被询问的内容进行的作答,及用户是否还停留在本次的交互中,比如,用户订机票是一个轮次,由于应答核心要素不全,用户被询问缺失的应答核心要素,如果用户输入的接续交互内容是与订机票相关的信息,则判断该接续交互内容是与初始交互内容为同一轮次,如果用户输入的接续交互内容是与订机票不相关的信息,则判断该接续交互内容与初始交互内容不是同一轮次,用户进入了另一应用场景,该接续交互内容为新的初始交互内容。例如,询问为“请问您从哪儿出发”,用户输入的接续交互内容为“上海”,则判断该接续交互内容与该订机票的初始交互内容为相同轮次,如果用户输入的交互内容为“我要看《人民的名义》”,则判断该接续交互内容与该订机票的初始交互内容为不同轮次,该接续交互内容为用户产生的新的初始交互内容,此时,执行步骤S102,重新判断新的初始交互内容对应的应用场景,并继续执行与该接续交互内容对应的应用场景关联的应答,即重复上述的各步骤。
本实施例对判断接续交互内容与初始交互内容是否为相同轮次的方式不做限定,比如可以将接续交互内容输入至分类模型中,如果能够对应一应用场景,则表明接续交互内容与初始交互内容为不同轮次,该接续交互内容为新的初始交互内容,如果不能对应应用场景,则表明接续交互内容与初始交互内容为相同轮次;或者采用分词或者句法分析的方式判断接续交互内容中是否包括缺失的应答核心要素,如果包括,则表明接续交互内容与初始交互内容为相同轮次。
步骤S108,判断接续交互内容是否补全应答核心要素。如果接续交互内容补全应答核心要素执行步骤S109,如果接续交互内容未补全应答核心要素,执行步骤S105。
需要说明的是,判断接续交互内容是否补全应答核心要素,是判断所有的接续交互内容加上初始交互内容后,判断是否包括全部的应答核心要素。例如,请参照图4,初始交互内容为“去北京的飞机”,包含的应答核心要素是“目的地”,缺失的应答核心要素是“出发地点”和“出发时间”,用户输入的第一次的接续交互内容为“上海”,补充了应答核心要素“出发地点”,此时该第一次接续交互内容未补全全部的应答核心要素,因此继续询问后,用户产生第二次接续交互内容“明天上午”,补充了应答核心要素“出发时间”,此时,初始交互内容加上两次接续交互内容补充的应答核心要素即包含了全部的应答核心要素。
步骤S109,根据应答核心要素的内容生成用户需要的应答。
每一个应用场景均对应有知识库,该知识库可以为预先构建的数据库,或者互联网信息,如果应答核心要素完整,则根据应答核心要素的内容在应用场景对应的知识库中寻找相应的应答内容,比如通过网络爬虫在互联网信息中抓取需要的信息。获取到需要的信息后,生成应答告知用户,比如,请参照图5,在订机票的应用场景中,应答核心要素完整的情况下,通过网络爬虫在互联网找到“明天上午上海到北京的机票”,生成应答“为您找到如下机票信息”及对应的机票信息。如果从知识库中没有找到对应的应答内容,可以向用户反馈‘我不知道’或者‘我没有听明白’等应答,需要知识库进行完善。
本发明提供的语义交互方法,通过将用户输入的初始交互内容输入到预设的分类模型中以得到初始交互内容对应的应用场景,获取该应用场景对应的应答核心要素,判断初始交互内容是否包括全部的应答核心要素,在初始交互内容未包括全部应答核心要素时,生成补充缺失的应答核心要素的询问,接收用户响应询问的接续交互内容,直到接收到的接续交互内容补全应答核心要素时,根据应答核心要素的内容生成用户需要的应答。本发明实施例提供的语义交互方法,通过分类模型将用户的初始交互内容分类到对应的应用场景,在特定的应用场景中进行交互,提高交互的准确性,当用户的交互内容不完整时,给出补充完整信息的询问,引导用户完善信息,应答更加准确、人性化,提高了用户的体验。
请参照图6,本发明实施例还提供了一种语义交互装置300,该语义交互装置300可应用于电子设备,该电子设备可以为智能电视机、智能手机、个人电脑(personalcomputer,PC)、平板电脑等。如图7,是该电子设备400的方框示意图,该电子设备400包括存储器410、处理器420、存储控制器430、外设接口440和显示单元450。
存储器410、处理器420、存储控制器430、外设接口440和显示单元450各元件相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。语义交互装置300包括至少一个可以软件或固件(firmware)的形式存储于存储器410中或固化在电子设备400的操作系统(operatingsystem,OS)中的软件功能模块。处理器420用于执行所述存储器410中存储的可执行模块,例如语义交互装置300所包括的软件功能模块及计算机程序等。
其中,存储器410可以是,但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-OnlyMemory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。其中,存储器410用于存储程序,处理器420在接收到执行指令后,执行该程序。处理器420以及其他可能的组件对存储器410的访问可在存储控制器430的控制下进行。
处理器420可能是一种集成电路芯片,具有信号的处理能力。上述的处理器420可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(NetworkProcessor,NP)等;还可以是数字信号处理器(DSP))、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
外设接口440将各种输入/输出装置(例如音频单元、显示单元)耦合至处理器420以及存储器410。在一些实施例中,外设接口440,处理器420以及存储控制器430可以在单个芯片中实现。在其他一些实例中,他们可以分别由独立的芯片实现。
在一些实施方式中,电子设备400还可以包括音频单元460,向用户提供音频接口,其可包括一个或多个麦克风、一个或者多个扬声器以及音频电路。
显示单元450在电子设备400与用户之间提供一个交互界面(例如用户操作界面)或用于显示图像数据。在本实施例中,显示单元450可以是液晶显示器或触控显示器。
语义交互装置300包括获取模块301、分类模块302、提取模块303、判断模块304、应答模块305、内容判断模块306、数据获取模块307、数据转换模块308及模型建立模块309。
其中,获取模块301用于获取用户输入的初始交互内容。
在本实施例中,步骤S101可以通过获取模块301执行。
分类模块302用于将初始交互内容输入预设的分类模型,得到初始交互内容对应的应用场景。
在本实施例中,步骤S102可以通过分类模块302执行。
提取模块303用于获取应用场景对应的应答核心要素。
在本实施例中,步骤S103可以通过提取模块303执行。
判断模块304用于判断初始交互内容是否包括全部应答核心要素。
在本实施例中,步骤S104可以通过判断模块304执行。
应答模块305用于当初始交互内容包括全部应答核心要素时,根据全部应答核心要素的内容生成用户需要的应答。
在本实施例中,步骤S109可以通过应答模块305执行。
应答模块305还用于当初始交互内容未包括全部应答核心要素时,生成补充缺失的应答核心要素的询问。
在本实施例中,步骤S105可以通过应答模块305执行。
获取模块301还用于接收用户响应询问的接续交互内容。
在本实施例中,步骤S106可以通过获取模块301执行。
应答模块305还用于当接续交互内容补全应答核心要素时,根据全部应答核心要素的内容生成用户需要的应答。
内容判断模块306用于判断接续交互内容是否用于补全所述应答核心要素。
在本实施例中,步骤S107可以通过内容判断模块306执行。
当接续交互内容为用于补全所述应答核心要素的交互内容时,判断模块304判断该轮次的初始交互内容以及接续交互内容是否包括全部应答核心要素。
在本实施例中,步骤S108可以通过判断模块304执行。
数据获取模块307、数据转换模块308及模型建立模块309用于构建分类模型,其中:
数据获取模块307用于获取人工标注数据,人工标注数据包括对话信息及与对话信息对应的分类信息。
在本实施中,步骤S201可以通过数据获取模块307执行。
数据转换模块308用于将人工标注数据转化为数值向量。
在本实施中,步骤S202可以通过数据转换模块308执行。
模型建立模块309用于通过分类算法对数值向量表示的对话信息和分类信息进行建模,训练分类模型。
在本实施中,步骤S203可以通过模型建立模块309执行。
由于语义交互装置300中各模块执行的方法在前述已经说明,此处不再赘述。
综上所述,本发明实施例提供了一种语义交互方法、装置及电子设备,通过将用户输入的初始交互内容输入到预设的分类模型中以得到初始交互内容对应的应用场景,获取该应用场景对应的应答核心要素,判断初始交互内容是否包括全部的应答核心要素,在初始交互内容未包括全部应答核心要素时,生成补充缺失的应答核心要素的询问,接收用户响应询问的接续交互内容,直到接收到的接续交互内容补全应答核心要素时,根据应答核心要素的内容生成用户需要的应答。本发明实施例提供的语义交互方法、装置及电子设备,通过分类模型将用户的初始交互内容分类到对应的应用场景,在特定的应用场景中进行交互,提高交互的准确性。此外,当用户的交互内容不完整时,给出补充完整信息的询问,引导用户完善信息,应答更加准确、人性化,提高了用户的体验。
在本申请所提供的实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
Claims (9)
1.一种语义交互方法,其特征在于,所述方法包括:
获取用户输入的初始交互内容;
将所述初始交互内容输入预设的分类模型,得到所述初始交互内容对应的应用场景;
获取所述应用场景对应的应答核心要素;
判断所述初始交互内容是否包括全部所述应答核心要素;
当所述初始交互内容包括全部所述应答核心要素时,根据全部所述应答核心要素的内容生成用户需要的应答;
所述方法还包括:
当所述初始交互内容未包括全部所述应答核心要素时,生成补充缺失的应答核心要素的询问;
接收用户响应所述询问的接续交互内容;
当所述接续交互内容补全所述应答核心要素时,根据全部所述应答核心要素的内容生成用户需要的应答;
所述方法还包括:
当所述接续交互内容为用于补全所述应答核心要素的交互内容时,判断所述初始交互内容以及所述接续交互内容是否包括全部所述应答核心要素。
2.根据权利要求1所述的语义交互方法,其特征在于,所述方法还包括:
当所述接续交互内容不是用于补全所述应答核心要素的交互内容时,将所述接续交互内容输入预设的分类模型,得到接续交互内容对应的应用场景并继续执行与所述接续交互内容对应的应用场景关联的应答。
3.根据权利要求1或2所述的语义交互方法,其特征在于,所述当所述接续交互内容补全所述应答核心要素时,根据全部所述应答核心要素的内容生成用户需要的应答的步骤包括:
根据全部所述应答核心要素在所述应用场景对应的知识库中寻找相应的应答内容,根据所述应答内容生成用户需要的应答。
4.根据权利要求3所述的语义交互方法,其特征在于,所述分类模型通过以下步骤建立:
获取人工标注数据,所述人工标注数据包括对话信息及与所述对话信息对应的分类信息;
将所述人工标注数据中的对话信息转化为数值向量;
通过分类算法对所述数值向量表示的对话信息和分类信息进行建模,训练所述分类模型。
5.一种语义交互装置,其特征在于,所述装置包括:
获取模块,用于获取用户输入的初始交互内容;
分类模块,用于将所述初始交互内容输入预设的分类模型,得到所述初始交互内容对应的应用场景;
提取模块,用于获取所述应用场景对应的应答核心要素;
判断模块,用于判断所述初始交互内容是否包括全部所述应答核心要素;
应答模块,用于当所述初始交互内容包括全部所述应答核心要素时,根据全部所述应答核心要素的内容生成用户需要的应答;
所述应答模块还用于当所述初始交互内容未包括全部所述应答核心要素时,生成补充缺失的应答核心要素的询问;
所述获取模块还用于接收用户响应所述询问的接续交互内容;
所述应答模块还用于当所述接续交互内容补全所述应答核心要素时,根据全部所述应答核心要素的内容生成用户需要的应答;
所述装置还包括内容判断模块,用于判断所述接续交互内容是否用于补全所述应答核心要素;
当所述接续交互内容为用于补全所述应答核心要素的交互内容时,所述判断模块判断所述初始交互内容以及所述接续交互内容是否包括全部所述应答核心要素。
6.根据权利要求5所述的语义交互装置,其特征在于,所述装置还包括内容判断模块,用于判断所述接续交互内容是否用于补全所述应答核心要素;
当所述接续交互内容为不是用于补全所述应答核心要素的交互内容时,所述分类模块将所述接续交互内容输入预设的分类模型,得到接续交互内容对应的应用场景并继续执行与所述接续交互内容对应的应用场景关联的应答。
7.根据权利要求5或6所述的语义交互装置,其特征在于,所述应答模块用于根据全部所述应答核心要素在所述应用场景对应的知识库中寻找相应的应答内容,根据所述应答内容生成用户需要的应答。
8.根据权利要求7所述的语义交互装置,其特征在于,还包括:
数据获取模块,用于获取人工标注数据,所述人工标注数据包括对话信息及与所述对话信息对应的分类信息;
数据转换模块,用于将所述人工标注数据中的对话信息转化为数值向量;
模型建立模块,用于通过分类算法对所述数值向量表示的对话信息和分类信息进行建模,训练所述分类模型。
9.一种电子设备,其特征在于,包括:
处理器;
存储器;以及
语义交互装置,所述语义交互装置安装于所述存储器中并包括一个或多个由所述处理器执行的软件功能模块,所述语义交互装置包括:
获取模块,用于获取用户输入的初始交互内容;
分类模块,用于将所述初始交互内容输入预设的分类模型,得到所述初始交互内容对应的应用场景;
提取模块,用于获取所述应用场景对应的应答核心要素;
判断模块,用于判断所述初始交互内容是否包括全部所述应答核心要素;
应答模块,用于当所述初始交互内容包括全部所述应答核心要素时,根据全部所述应答核心要素的内容生成用户需要的应答;
所述应答模块还用于当所述初始交互内容未包括全部所述应答核心要素时,生成补充缺失的应答核心要素的询问;
所述获取模块还用于接收用户响应所述询问的接续交互内容;
所述应答模块还用于当所述接续交互内容补全所述应答核心要素时,根据全部所述应答核心要素的内容生成用户需要的应答;
所述装置还包括内容判断模块,用于判断所述接续交互内容是否用于补全所述应答核心要素;
当所述接续交互内容为用于补全所述应答核心要素的交互内容时,所述判断模块判断所述初始交互内容以及所述接续交互内容是否包括全部所述应答核心要素。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710620732.4A CN107357787B (zh) | 2017-07-26 | 2017-07-26 | 语义交互方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710620732.4A CN107357787B (zh) | 2017-07-26 | 2017-07-26 | 语义交互方法、装置及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107357787A CN107357787A (zh) | 2017-11-17 |
CN107357787B true CN107357787B (zh) | 2021-04-02 |
Family
ID=60286473
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710620732.4A Active CN107357787B (zh) | 2017-07-26 | 2017-07-26 | 语义交互方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107357787B (zh) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109961780B (zh) * | 2017-12-22 | 2024-02-02 | 深圳市优必选科技有限公司 | 一种人机交互方法、装置、服务器和存储介质 |
CN108880961A (zh) * | 2018-07-19 | 2018-11-23 | 广东美的厨房电器制造有限公司 | 家电设备控制方法及装置、计算机设备和存储介质 |
CN108563637A (zh) * | 2018-04-13 | 2018-09-21 | 北京理工大学 | 一种融合三元组知识库的句子实体补全方法 |
CN110890090B (zh) * | 2018-09-11 | 2022-08-12 | 珠海希音医疗科技有限公司 | 基于上下文的辅助交互控制方法及系统 |
CN109597559A (zh) * | 2018-12-10 | 2019-04-09 | 联想(北京)有限公司 | 一种交互方法、装置及电子设备 |
CN109901810A (zh) * | 2019-02-01 | 2019-06-18 | 广州三星通信技术研究有限公司 | 一种用于智能终端设备的人机交互方法及装置 |
CN109871440B (zh) * | 2019-02-25 | 2022-11-11 | 京东方科技集团股份有限公司 | 基于语义分析的智能提示方法、装置及设备 |
CN110197055B (zh) * | 2019-05-31 | 2023-09-01 | 北京三快在线科技有限公司 | 管理信息的方法、装置、设备及存储介质 |
CN110837543A (zh) * | 2019-10-14 | 2020-02-25 | 深圳和而泰家居在线网络科技有限公司 | 一种对话交互方法、装置以及设备 |
CN112837159B (zh) * | 2021-02-24 | 2024-04-02 | 中国工商银行股份有限公司 | 基于场景要素的交易引导方法、装置、电子设备及介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103942575A (zh) * | 2014-04-02 | 2014-07-23 | 公安部第三研究所 | 基于场景和马尔科夫逻辑网的智能行为分析系统及方法 |
CN105512228A (zh) * | 2015-11-30 | 2016-04-20 | 北京光年无限科技有限公司 | 一种基于智能机器人的双向问答数据处理方法和系统 |
CN106528522A (zh) * | 2016-08-26 | 2017-03-22 | 南京威卡尔软件有限公司 | 场景化的语义理解与对话生成方法及系统 |
-
2017
- 2017-07-26 CN CN201710620732.4A patent/CN107357787B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103942575A (zh) * | 2014-04-02 | 2014-07-23 | 公安部第三研究所 | 基于场景和马尔科夫逻辑网的智能行为分析系统及方法 |
CN105512228A (zh) * | 2015-11-30 | 2016-04-20 | 北京光年无限科技有限公司 | 一种基于智能机器人的双向问答数据处理方法和系统 |
CN106528522A (zh) * | 2016-08-26 | 2017-03-22 | 南京威卡尔软件有限公司 | 场景化的语义理解与对话生成方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN107357787A (zh) | 2017-11-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107357787B (zh) | 语义交互方法、装置及电子设备 | |
CN110168535B (zh) | 一种信息处理方法及终端、计算机存储介质 | |
CN106406806B (zh) | 一种用于智能设备的控制方法及装置 | |
CN105677735B (zh) | 一种视频搜索方法及装置 | |
CN109348275B (zh) | 视频处理方法和装置 | |
US20170368683A1 (en) | User portrait based skill package recommendation device and method | |
CN108416003A (zh) | 一种图片分类方法和装置、终端、存储介质 | |
CN109145123A (zh) | 知识图谱模型的构建方法、智能交互方法、系统及电子设备 | |
CN110914872A (zh) | 用认知洞察力导航视频场景 | |
CN111277706A (zh) | 一种应用推荐方法、装置、存储介质及电子设备 | |
JP2017010517A (ja) | 人工知能によるヒューマン・マシン間の知能チャットの方法および装置 | |
CN110874534B (zh) | 数据处理方法和数据处理装置 | |
CN109271533A (zh) | 一种多媒体文件检索方法 | |
CN109165316A (zh) | 一种视频处理方法、视频索引方法、装置及终端设备 | |
CN110610698B (zh) | 一种语音标注方法及装置 | |
CN104866308A (zh) | 一种场景图像的生成方法及装置 | |
CN105095415A (zh) | 网络情绪的确定方法和装置 | |
US20190147104A1 (en) | Method and apparatus for constructing artificial intelligence application | |
CN105337998A (zh) | 一种多屏互动的系统 | |
CN105164669A (zh) | 信息处理设备、信息处理方法以及程序 | |
CN115273840A (zh) | 语音交互设备和语音交互方法 | |
CN110750626A (zh) | 一种基于场景的任务驱动的多轮对话方法及系统 | |
CN117407507A (zh) | 基于大语言模型的事件处理方法、装置、设备及介质 | |
CN116629236A (zh) | 一种待办事项提取方法、装置、设备及存储介质 | |
CN116978028A (zh) | 视频处理方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20240530 Address after: Room 212, Building 14, No. 350 Xianxia Road, Changning District, Shanghai, 200050 Patentee after: SHANGHAI ISMARTV NETWORK TECHNOLOGIES Co.,Ltd. Country or region after: China Address before: 201210 3rd floor, building e, Shangtou Shengyin building, 666 shengxia Road, Pudong New Area, Shanghai Patentee before: WHALEY TECHNOLOGY Co.,Ltd. Country or region before: China |
|
TR01 | Transfer of patent right |