CN111611350A - 基于健康知识的应答方法、装置及电子设备 - Google Patents
基于健康知识的应答方法、装置及电子设备 Download PDFInfo
- Publication number
- CN111611350A CN111611350A CN202010458321.1A CN202010458321A CN111611350A CN 111611350 A CN111611350 A CN 111611350A CN 202010458321 A CN202010458321 A CN 202010458321A CN 111611350 A CN111611350 A CN 111611350A
- Authority
- CN
- China
- Prior art keywords
- information
- intention
- entity
- user
- response
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000004044 response Effects 0.000 title claims abstract description 111
- 238000000034 method Methods 0.000 title claims abstract description 55
- 230000036541 health Effects 0.000 title claims abstract description 42
- 230000005802 health problem Effects 0.000 claims abstract description 20
- 238000012549 training Methods 0.000 claims description 29
- 238000000605 extraction Methods 0.000 claims description 18
- 238000004590 computer program Methods 0.000 claims description 11
- 241000220225 Malus Species 0.000 description 14
- 235000016709 nutrition Nutrition 0.000 description 10
- 230000035764 nutrition Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 7
- 235000005911 diet Nutrition 0.000 description 6
- 230000037213 diet Effects 0.000 description 6
- 102000002322 Egg Proteins Human genes 0.000 description 4
- 108010000912 Egg Proteins Proteins 0.000 description 4
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 238000013135 deep learning Methods 0.000 description 4
- 201000010099 disease Diseases 0.000 description 4
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 4
- 229940079593 drug Drugs 0.000 description 4
- 239000003814 drug Substances 0.000 description 4
- 102000004169 proteins and genes Human genes 0.000 description 4
- 108090000623 proteins and genes Proteins 0.000 description 4
- QCVGEOXPDFCNHA-UHFFFAOYSA-N 5,5-dimethyl-2,4-dioxo-1,3-oxazolidine-3-carboxamide Chemical compound CC1(C)OC(=O)N(C(N)=O)C1=O QCVGEOXPDFCNHA-UHFFFAOYSA-N 0.000 description 3
- 241000234295 Musa Species 0.000 description 3
- 235000018290 Musa x paradisiaca Nutrition 0.000 description 3
- 235000021016 apples Nutrition 0.000 description 3
- 238000013527 convolutional neural network Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 235000014103 egg white Nutrition 0.000 description 3
- 210000000969 egg white Anatomy 0.000 description 3
- 235000013601 eggs Nutrition 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000007958 sleep Effects 0.000 description 3
- 230000003860 sleep quality Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 229940088594 vitamin Drugs 0.000 description 3
- 229930003231 vitamin Natural products 0.000 description 3
- 235000013343 vitamin Nutrition 0.000 description 3
- 239000011782 vitamin Substances 0.000 description 3
- BJEPYKJPYRNKOW-REOHCLBHSA-N (S)-malic acid Chemical compound OC(=O)[C@@H](O)CC(O)=O BJEPYKJPYRNKOW-REOHCLBHSA-N 0.000 description 2
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 2
- 102000008186 Collagen Human genes 0.000 description 2
- 108010035532 Collagen Proteins 0.000 description 2
- 206010010774 Constipation Diseases 0.000 description 2
- BUGBHKTXTAQXES-UHFFFAOYSA-N Selenium Chemical compound [Se] BUGBHKTXTAQXES-UHFFFAOYSA-N 0.000 description 2
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 2
- BJEPYKJPYRNKOW-UHFFFAOYSA-N alpha-hydroxysuccinic acid Natural products OC(=O)C(O)CC(O)=O BJEPYKJPYRNKOW-UHFFFAOYSA-N 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000002457 bidirectional effect Effects 0.000 description 2
- 229910052791 calcium Inorganic materials 0.000 description 2
- 239000011575 calcium Substances 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 229920001436 collagen Polymers 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000006806 disease prevention Effects 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 229910052742 iron Inorganic materials 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 235000011090 malic acid Nutrition 0.000 description 2
- 239000001630 malic acid Substances 0.000 description 2
- 230000004630 mental health Effects 0.000 description 2
- 150000007524 organic acids Chemical class 0.000 description 2
- 239000011669 selenium Substances 0.000 description 2
- 229910052711 selenium Inorganic materials 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 150000003722 vitamin derivatives Chemical class 0.000 description 2
- 239000011701 zinc Substances 0.000 description 2
- 229910052725 zinc Inorganic materials 0.000 description 2
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 1
- 240000003768 Solanum lycopersicum Species 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 210000002969 egg yolk Anatomy 0.000 description 1
- 235000013345 egg yolk Nutrition 0.000 description 1
- 230000002996 emotional effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 239000012458 free base Substances 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 235000018102 proteins Nutrition 0.000 description 1
- 230000033764 rhythmic process Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
Abstract
本发明提供了一种基于健康知识的应答方法、装置及电子设备,涉及健康管理领域,包括获取用户输入信息;所述用户输入信息包括健康问题相关的语音信息或文本信息;对所述用户输入信息进行意图识别,确定用户意图信息;基于预先建立的知识图谱,确定针对所述用户意图信息的应答信息。本发明提升了针对健康问题应答的准确性,提升了用户体验。
Description
技术领域
本发明涉及健康管理领域,尤其是涉及一种基于健康知识的应答方法、装置及电子设备。
背景技术
随着生活节奏的加快以及生活水平的日益提高,人们对于饮食营养、锻炼健身、睡眠质量等健康方面的关注程度也日益增强。伴随着目前人工智能领域的迅速发展,通过智能设备进行提问并获取相应应答的方式,由于用户可以实时获取应答信息,提升了用户获取信息的便捷性,因此也越来越受到人们的欢迎。然而,目前通过智能设备进行应答的方式对于健康问题的布设并不全面,很难针对健康方面的问题进行详细的解答,应答准确性较低,用户体验较差。
发明内容
本发明的目的在于提供一种基于健康知识的应答方法、装置及电子设备,提升了针对健康问题应答的准确性,提升了用户体验。
第一方面,本发明实施例提供一种基于健康知识的应答方法,方法包括:获取用户输入信息;用户输入信息包括健康问题相关的语音信息或文本信息;对用户输入信息进行意图识别,确定用户意图信息;基于预先建立的知识图谱,确定针对用户意图信息的应答信息。
在可选的实施方式中,对用户输入信息进行意图识别,确定用户意图信息的步骤,包括:通过预先训练好的意图识别模型对用户输入信息进行识别,得到识别结果;对识别结果进行实体识别及关系抽取,并通过追踪器对经过实体识别及关系抽取的识别结果进行对话状态追踪,确定当前对话状态;通过预先训练好的策略模型及当前对话状态对识别结果进行策略判断,确定用户意图信息。
在可选的实施方式中,预先训练好的意图识别模型的训练方法包括:获取语料样本;将语料样本进行语料增强,得到增强后的训练样本;基于增强后的训练样本对意图识别模型进行训练,直至训练完成。
在可选的实施方式中,对识别结果进行实体识别及关系抽取,并通过追踪器对经过实体识别及关系抽取的识别结果进行对话状态追踪,确定当前对话状态的步骤,包括:对识别结果进行实体识别及关系抽取,得到实体信息及关系信息;针对实体信息进行词槽填充;词槽填充为对抽取到的实体信息进行标注;通过追踪器对经过词槽填充的实体信息及关系信息进行对话状态追踪,确定当前对话状态。
在可选的实施方式中,基于预先建立的知识图谱,确定针对用户意图信息的应答信息的步骤,包括:查找用户意图信息中相对应的实体信息及关系信息;基于预先建立的知识图谱,根据实体信息和关系信息确定针对用户意图的应答信息。
在可选的实施方式中,基于预先建立的知识图谱,根据实体信息和关系信息确定针对用户意图的应答信息的步骤,包括:基于预先建立的知识图谱训练应答模型;通过训练好的应答模型,根据实体信息和关系信息确定针对用户意图的应答信息。
在可选的实施方式中,基于预先建立的知识图谱,确定针对用户意图信息的应答信息的步骤,还包括:对用户意图信息中相对应的实体信息和属性信息进行识别;实体信息与属性信息之间的关系包括一对一、多对一、一对多以及多对多的关系;根据实体信息和属性信息之间的关系进行关系推理,得到推理结果;基于预先建立的知识图谱,根据推理结果确定针对用户意图的应答信息。
第二方面,本发明实施例提供一种基于健康知识的应答装置,装置包括:信息获取模块,用于获取用户输入信息;用户输入信息包括健康问题相关的语音信息或文本信息;意图确定模块,用于对用户输入信息进行意图识别,确定用户意图信息;应答模块,用于基于预先建立的知识图谱,确定针对用户意图信息的应答信息。
第三方面,本发明实施例提供一种电子设备,包括:处理器和存储装置;存储装置上存储有计算机程序,计算机程序在被处理器运行时执行如前述实施方式任一项的方法。
第四方面,本发明实施例提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器运行时执行上述前述实施方式任一项的方法的步骤。
本发明提供的基于健康知识的应答方法、装置及电子设备,该方法首先获取用户输入信息,用户输入信息包括健康问题相关的语音信息或文本信息,然后对用户输入信息进行意图识别,确定用户意图信息,最后基于预先建立的知识图谱,确定针对用户意图信息的应答信息。上述方式通过对健康问题相关的语音信息或文本信息进行意图识别,可以得到针对用户提出的健康问题的用户意图信息,从而更有针对性的进行识别,通过预先建立的知识图谱确定针对上述用户意图信息的应答信息,提升了针对健康问题进行应答的准确性,提升了用户体验。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种基于健康知识的应答方法的流程示意图;
图2为本发明实施例提供的一种知识图谱的示意图;
图3为本发明实施例提供的另一种基于健康知识的应答方法的流程示意图;
图4为本发明实施例提供的一种基于健康知识的应答装置的结构示意图;
图5为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
下面结合附图,对本发明的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。
随着深度学习的发展,人机对话系统取得了突飞猛进的发展,诸如基于知识图谱类的(比如Wikipedia,freebase)等的问答系统,基于文档阅读理解的医疗系统Wason,基于问答对的Seq2Seq模型等等,还有就是系统集成的对话系统,诸如现有的人机对话助手,均以本公司的软件生态为基础构建的开放式对话系统,在提供自身软件服务的同时(比如音乐,购买)还提供开放式的知识问答(百科知识等)。然而,在健康管理的垂直领域,诸如饮食、健身、睡眠等领域,目前的智能助手还不能满足日益增长的用户对于健康管理的需求。考虑到现有技术中存在针对健康方面的问题的解答不全面,应答准确性较低,用户体验较差的技术问题,为改善上述问题,本发明提供了一种基于健康知识的应答方法、装置及电子设备,提升了针对健康问题应答的准确性,提升了用户体验。
为便于理解,首先对本发明实施例提供的一种基于健康知识的应答方法进行详细介绍,参见图1所示的一种基于健康知识的应答方法的流程图,该方法主要包括如下步骤S102至步骤S106:
步骤S102,获取用户输入信息。
用户终端可以包括诸如智能手机、平板电脑、PC、机器人等智能设备,该用户输入信息包括健康问题相关的语音信息或文本信息,与健康问题相关的知识包括诸如饮食营养、运动健身、睡眠质量、疾病预防、心理健康、疾病知识、药品知识、健康自测等健康领域及其垂直领域的知识,该用户输入信息诸如可以是,“橘子的维生素含量是多少”、“持续多久的有氧运动可以瘦身”、“心情很压抑,陪我聊聊天”等(此处仅作示例,不作具体限制)。语音信息或文本信息为用户直接通过用户终端输入的信息,当用户输入信息为语音信息时,可以通过诸如自动语音识别技术(Automatic SpeechRecognition,ASR)将语音信息转换为文本信息,以便进行后续处理。
步骤S104,对用户输入信息进行意图识别,确定用户意图信息。
可以理解的是,意图识别也即对用户终端的用户输入信息进行文本分析,诸如可以采用规则、机器学习、深度学习等方法进行意图识别,并通过分类算法将用户输入信息相对应的句子划分到相应的意图种类。在一种实施方式中,意图识别可以采用双向编码器表征量(Bidirectional Encoder Representations from Transformers,BERT)模型,通过预先训练好的BERT模型对用户终端的用户输入信息进行意图识别,确定用户意图信息。
步骤S106,基于预先建立的知识图谱,确定针对用户意图信息的应答信息。
知识图谱主要包括实体及实体间的关系,为便于理解,参见图2所示的一种知识图谱的示意图(该图仅作示例),图中每个圆圈代表实体,实体与实体之间的关系通过线条连接,同时实体还具有若干属性,关系上也有若干属性,诸如,图中鸡蛋、番茄、碳水化合物、蛋白质为实体,鸡蛋与蛋白质之间的连线代表他们之间的关系,鸡蛋的属性可以定义为诸如蛋清、蛋黄,关系的属性可以定义为含量,则可以根据图谱可以组合出“鸡蛋中蛋清的蛋白质的含量”。预先建立的知识图谱为根据健康知识进行构建的知识图谱,该知识图谱中包括上述诸如饮食营养、运动健身、睡眠质量、疾病预防、心理健康、疾病知识、药品知识、健康自测等健康领域及其垂直领域的实体及关系。
在一种实施方式中,基于确定的用户意图信息,通过在预先建立的知识图谱中查找对应的实体及关系,可以确定针对该用户意图信息的应答信息,以上述“鸡蛋中蛋清的蛋白质的含量”为例,当在预先建立的知识图谱中查找到实体及对应的关系信息时,可以根据预先建立的知识图谱中的实体信息对应的属性信息及关系信息对应的属性信息确定针对用户意图信息的应答信息,从而基于该应答信息进行应答。
本发明实施例提供的基于健康知识的应答方法,通过对健康问题相关的语音信息或文本信息进行意图识别,可以得到针对用户提出的健康问题的用户意图信息,从而更有针对性的进行识别,通过预先建立的知识图谱确定针对上述用户意图信息的应答信息,提升了针对健康问题进行应答的准确性,提升了用户体验。
在一种实施方式中,上述对用户输入信息进行意图识别,确定用户意图信息的步骤,可以包括如下步骤1至步骤3:
步骤1,通过预先训练好的意图识别模型对用户输入信息进行识别,得到识别结果。意图识别模型可以采用传统机器学习算法,诸如支持向量机(Support VectorMachine,SVM),也可以采用基于深度学习算法,诸如卷积神经网络(Convolutional NeuralNetworks,CNN)、长短期记忆人工神经网络(Long-Short Term Memory,LSTM)、双向编码器表征量模型(Bidirectional Encoder Representations from Transformers,BERT)等。为了能够使预先训练好的意图识别模型识别准确率更高、识别效果更好,可以通过获取语料样本,并将语料样本进行语料增强,得到增强后的训练样本,基于增强后的训练样本对意图识别模型进行训练,直至训练完成,得到预先训练好的意图识别模型进行训练。在一种实施方式中,可以采用神经网络模型进行语料增强,生成与语料样本相关的训练样本,从而丰富训练样本,提升预先训练好的意图识别模型的识别准确率及识别效果。
步骤2,对识别结果进行实体识别及关系抽取,并通过追踪器对经过实体识别及关系抽取的识别结果进行对话状态追踪,确定当前对话状态。该步骤可以进一步包括步骤2.1至步骤2.3:
步骤2.1,对识别结果进行实体识别及关系抽取,得到实体信息及关系信息。在一种实施方式中,可以采用基于可迭代的空洞卷积神经网络模型(Iterated DilatedConvolutions Neural Network,ID-CNN)和条件随机场(conditional random field,CRF)进行实体识别及关系抽取,由于ID-CNN模型实际上相当于一个分类模型,因此通过ID-CNN模型进行分类得到的分类结果较好,优选的,可以在ID-CNN模型上增加CRF层,由于CRF层的主要目的在于学习一种约束能力,因此最终得到的实体信息及关系信息更加准确。
步骤2.2,针对实体信息进行词槽填充。词槽填充(也可以称为slot filling)为从大规模的语料库中抽取给定实体的被明确定义的属性的值,由于实体可以预先定义有属性,因此词槽填充也可以理解为对抽取到的实体信息进行标注,从而便于对用户输入信息进行更准确的识别。
步骤2.3,通过追踪器对经过词槽填充的实体信息及关系信息进行对话状态追踪,确定当前对话状态。为了能够提升上下文的连贯性,可以对经过词槽填充后的实体信息和关系信息进行对话状态跟踪,诸如可以根据追踪器(也即Tracker服务器)进行对话状态追踪,通过读取Tracker里的信息,确定当前对话状态。
步骤3,通过预先训练好的策略模型及当前对话状态对识别结果进行策略判断,确定用户意图信息。该预先训练好的策略模型用于决策针对当前用户输入信息选用哪个应答进行回复,对于单轮对话,采用一对一(也即1V 1)的方式进行策略判断;而在多轮对话中,需要考虑上下文的语境进行应答,为并非根据意图识别结果直接应答(也即上述1V 1应答)。为便于理解,参见下述的多轮应答举例:
User:吃苹果的好处是什么?
Robot:苹果含有很高的苹果酸、有机酸等,对身体机能大有益处,苹果还富含胶纤维,有治疗便秘的作用。
User:吃苹果的好处是什么?
Robot:苹果含有很高的苹果酸、有机酸等,对身体机能大有益处,苹果还富含胶纤维,有治疗便秘的作用。
User:吃苹果的好处是什么?
Robot:我都告诉你了呀!
通过上述举例可知,由于考虑上下文的语境,同一个输入在多轮场景中可能有不同的应答策略,因此通过策略模型也可以理解为通过大量对话上下文的问与答,学习其中意图和应答之间的关系,并根据上下文意图预测接下来应答置信度的学习模型。
在一种实施方式中,策略模型可以采用注意力策略模型,具体训练时,将用户输入(包括实体信息和意图信息)和对话上下文(包括实体信息和意图信息)以及词槽组成一个输入向量用于应答模型训练前的嵌入层(也即pre-transformer嵌入层),将向量传递至应答模型(也即transformer),经过训练后应答模型输出后连接一个密集层,对上下文进行嵌入(也即对话嵌入),在嵌入后再连接一个密集层,对后续的应答进行嵌入(也即应答嵌入),最后计算对话嵌入和应答嵌入之间的相似度,至此训练结束,得到训练好的策略模型。
为便于对上述步骤S106进行理解,本实施基于预先建立的知识图谱,确定针对用户意图信息的应答信息的步骤,可以包括如下步骤(1)至步骤(2):
步骤(1),查找用户意图信息中相对应的实体信息及关系信息。诸如,当用户输入信息为“苹果长什么样子”,可以通过对该输入进行意图识别,得到用户意图信息,并识别出该用户意图信息中的实体“苹果”,并根据该实体信息查找所有的相关信息,进而确定关系信息。
步骤(2),基于预先建立的知识图谱,根据实体信息和关系信息确定针对用户意图的应答信息。由于预先建立的知识图谱中设置有丰富的实体信息以及对应的关系信息,因此通过查找到实体信息及关系信息,可以确定针对用户意图的应答信息。
另外,上述基于预先建立的知识图谱,根据实体信息和关系信息确定针对用户意图的应答信息,也可以包括如下步骤1)和步骤2):
步骤1),基于预先建立的知识图谱训练应答模型。该应答模型由知识图谱中是实体和关系抽取成问答对,使用相似词替换的规则进行语料增强,并对该应答模型进行端对端的模型训练,由于实体和关系的表述来自于预先建立好的知识图谱,因此在进行策略判断后再通过应答模型进行应答可以提升应答的准确性。
步骤2),通过训练好的应答模型,根据实体信息和关系信息确定针对用户意图的应答信息。通过预先建立的知识图谱对应答模型进行训练,可以使训练好的应答模型针对用户意图的应答信息更加准确,实现更加细粒度的应答。
在实际应用时,用户的提问可能并不只有简单的实体与关系一一对应的情况,因此,上述基于预先建立的知识图谱,确定针对用户意图信息的应答信息的步骤,还可以通过如下步骤a至步骤c执行:
步骤a,对用户意图信息中相对应的实体信息和属性信息进行识别。实体信息与属性信息之间的关系包括一对一、多对一、一对多以及多对多的关系。诸如,当实体信息与属性信息之间的关系为一对一时,可以为“苹果的功效”、“橘子有什么营养”等,当实体信息与属性信息之间的关系为多对一时,可以为“苹果和橘子的功效”、“苹果和橘子有什么营养”等,当实体信息与属性信息之间的关系为一对多时,可以为“苹果的功效和营养”、“橘子有什么功效和营养”等,当实体信息与属性信息之间的关系为多对多时,可以为“苹果、橘子、香蕉的功效是什么,有什么营养”等。
步骤b,根据实体信息和属性信息之间的关系进行关系推理,得到推理结果。由于上述实体信息和属性信息之间的多种关系,因此需要进行关系推理,诸如,“苹果、香蕉、橘子的钙、铁、锌、硒、维生素的含量”,则进行关系推理,要分别得到“苹果”、“香蕉”、“橘子”、“钙”、“铁”、“锌”、“硒”、“维生素”这些实体两两之间的关系,并根据得到的两两实体间的关系得到推理结果。
步骤c,基于预先建立的知识图谱,根据推理结果确定针对用户意图的应答信息。由于预先建立的知识图谱可以全面、细粒度的包括有健康领域及其垂直领域的诸如疾病、药品、饮食,营养,睡眠,心理,运动,以及健康自测等方面的知识,因此通过该知识图谱以及上述确定的推理结果,可以准确的得到针对用户意图的应答信息,提升用户体验。
综上,为了便于理解,本实施例给出了一种基于健康知识的应答方法的整体流程图,参见图3所示的另一种基于健康知识的应答方法的流程示意图,该流程图示意出了本实施例在进行基于健康知识的应答时,首先获取用户输入信息,该用户输入信息与健康知识相关,包括语音信息或者文本信息,当输入信息为语音信息时,可以通过ASR将语音信息转换为文本信息,然后通过预先训练好的意图识别模型对用户输入信息进行意图判别,从而匹配最佳的意图,进而对用户输入信息进行实体识别及关系抽取,并针对识别到的实体信息进行词槽填充,进一步,为了提升上下文的连贯性,可以进行对话上下文管理,对话上下文管理可以对用户对话状态进行词槽及文本上下文进行管理,诸如采用上述tracker进行,此处不再赘述。经过对话上下文管理后的结果输入策略模型(也可以称为应答策略模型)进行决策,选择最佳的意图应答,最终进行针对用户输入信息及经过词槽填充后的实体信息以及关系信息进行应答。通过深度学习的方式进行意图判别、意图应答策略选择进行应答,在健康管理垂直领域提供基于语音交互的问答服务,很大的方便了用户在该领域关于疾病、药品、饮食,营养,睡眠,心理,运动等的知识需求,有助于在健康管理垂直领域内构建一个开放的细粒度的智能助手系统,以满足用户对于健康管理领域的需求。
对于上述基于健康知识的应答方法,本发明实施例提供了一种基于健康知识的应答装置,参见如图4所示的一种基于健康知识的应答装置的结构示意图,该装置主要包括以下部分:
信息获取模块402,用于获取用户输入信息;用户输入信息包括健康问题相关的语音信息或文本信息;
意图确定模块404,用于对用户输入信息进行意图识别,确定用户意图信息;
应答模块406,用于基于预先建立的知识图谱,确定针对用户意图信息的应答信息。
本发明实施例提供的基于健康知识的应答装置,通过对健康问题相关的语音信息或文本信息进行意图识别,可以得到针对用户提出的健康问题的用户意图信息,从而更有针对性的进行识别,通过预先建立的知识图谱确定针对上述用户意图信息的应答信息,提升了针对健康问题进行应答的准确性,提升了用户体验。
在一种实施方式中,上述意图确定模块404,进一步用于通过预先训练好的意图识别模型对用户输入信息进行识别,得到识别结果;对识别结果进行实体识别及关系抽取,并通过追踪器对经过实体识别及关系抽取的识别结果进行对话状态追踪,确定当前对话状态;通过预先训练好的策略模型及当前对话状态对识别结果进行策略判断,确定用户意图信息。
在一种实施方式中,上述装置还包括训练模块,用于获取语料样本;将语料样本进行语料增强,得到增强后的训练样本;基于增强后的训练样本对意图识别模型进行训练,直至训练完成。
在一种实施方式中,上述意图确定模块404,进一步用于对识别结果进行实体识别及关系抽取,得到实体信息及关系信息;针对实体信息进行词槽填充;词槽填充为对抽取到的实体信息进行标注;通过追踪器对经过词槽填充的实体信息及关系信息进行对话状态追踪,确定当前对话状态。
在一种实施方式中,上述应答模块406,进一步用于查找用户意图信息中相对应的实体信息及关系信息;基于预先建立的知识图谱,根据实体信息和关系信息确定针对用户意图的应答信息。
在一种实施方式中,上述应答模块406,进一步用于基于预先建立的知识图谱训练应答模型;通过训练好的应答模型,根据实体信息和关系信息确定针对用户意图的应答信息。
在一种实施方式中,上述应答模块406,进一步用于对用户意图信息中相对应的实体信息和属性信息进行识别;实体信息与属性信息之间的关系包括一对一、多对一、一对多以及多对多的关系;根据实体信息和属性信息之间的关系进行关系推理,得到推理结果;基于预先建立的知识图谱,根据推理结果确定针对用户意图的应答信息。
本发明实施例所提供的装置,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。
本实施例提供了一种电子设备,该电子设备诸如可以为服务器,具体的,该电子设备包括处理器和存储装置;存储装置上存储有计算机程序,计算机程序在被所述处理器运行时执行如上所述实施方式的任一项所述的方法。
图5为本发明实施例提供的一种电子设备的结构示意图,该电子设备100包括:处理器50,存储器51,总线52和通信接口53,所述处理器50、通信接口53和存储器51通过总线52连接;处理器50用于执行存储器51中存储的可执行模块,例如计算机程序。
其中,存储器51可能包含高速随机存取存储器(RAM,RandomAccessMemory),也可能还包括非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。通过至少一个通信接口53(可以是有线或者无线)实现该系统网元与至少一个其他网元之间的通信连接,可以使用互联网,广域网,本地网,城域网等。
总线52可以是ISA总线、PCI总线或EISA总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图5中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
其中,存储器51用于存储程序,所述处理器50在接收到执行指令后,执行所述程序,前述本发明实施例任一实施例揭示的流过程定义的装置所执行的方法可以应用于处理器50中,或者由处理器50实现。
处理器50可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器50中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器50可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital SignalProcessing,简称DSP)、专用集成电路(Application Specific Integrated Circuit,简称ASIC)、现成可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器51,处理器50读取存储器51中的信息,结合其硬件完成上述方法的步骤。
本发明实施例所提供的基于健康知识的应答方法、装置及电子设备的计算机程序产品,包括存储了处理器可执行的非易失的程序代码的计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行前面方法实施例中所述的方法,具体实现可参见方法实施例,在此不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统具体工作过程,可以参考前述实施例中的对应过程,在此不再赘述。
本发明实施例所提供的可读存储介质的计算机程序产品,包括存储了程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行前面方法实施例中所述的方法,具体实现可参见方法实施例,在此不再赘述。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (10)
1.一种基于健康知识的应答方法,其特征在于,所述方法包括:
获取用户输入信息;所述用户输入信息包括健康问题相关的语音信息或文本信息;
对所述用户输入信息进行意图识别,确定用户意图信息;
基于预先建立的知识图谱,确定针对所述用户意图信息的应答信息。
2.根据权利要求1所述的方法,其特征在于,所述对所述用户输入信息进行意图识别,确定用户意图信息的步骤,包括:
通过预先训练好的意图识别模型对所述用户输入信息进行识别,得到识别结果;
对所述识别结果进行实体识别及关系抽取,并通过追踪器对经过实体识别及关系抽取的所述识别结果进行对话状态追踪,确定当前对话状态;
通过预先训练好的策略模型及所述当前对话状态对所述识别结果进行策略判断,确定所述用户意图信息。
3.根据权利要求2所述的方法,其特征在于,所述预先训练好的意图识别模型的训练方法包括:
获取语料样本;
将所述语料样本进行语料增强,得到增强后的训练样本;
基于所述增强后的训练样本对意图识别模型进行训练,直至训练完成。
4.根据权利要求2所述的方法,其特征在于,对所述识别结果进行实体识别及关系抽取,并通过追踪器对经过实体识别及关系抽取的所述识别结果进行对话状态追踪,确定当前对话状态的步骤,包括:
对所述识别结果进行实体识别及关系抽取,得到实体信息及关系信息;
针对所述实体信息进行词槽填充;所述词槽填充为对抽取到的所述实体信息进行标注;
通过追踪器对经过词槽填充的实体信息及所述关系信息进行对话状态追踪,确定当前对话状态。
5.根据权利要求4所述的方法,其特征在于,所述基于预先建立的知识图谱,确定针对所述用户意图信息的应答信息的步骤,包括:
查找所述用户意图信息中相对应的所述实体信息及所述关系信息;
基于所述预先建立的知识图谱,根据所述实体信息和所述关系信息确定针对所述用户意图的应答信息。
6.根据权利要求5所述的方法,其特征在于,所述基于所述预先建立的知识图谱,根据所述实体信息和所述关系信息确定针对所述用户意图的应答信息的步骤,包括:
基于所述预先建立的知识图谱训练应答模型;
通过训练好的所述应答模型,根据所述实体信息和所述关系信息确定针对所述用户意图的应答信息。
7.根据权利要求1所述的方法,其特征在于,所述基于预先建立的知识图谱,确定针对所述用户意图信息的应答信息的步骤,还包括:
对所述用户意图信息中相对应的实体信息和属性信息进行识别;所述实体信息与属性信息之间的关系包括一对一、多对一、一对多以及多对多的关系;
根据所述实体信息和所述属性信息之间的关系进行关系推理,得到推理结果;
基于所述预先建立的知识图谱,根据所述推理结果确定针对所述用户意图的应答信息。
8.一种基于健康知识的应答装置,其特征在于,所述装置包括:
信息获取模块,用于获取用户输入信息;所述用户输入信息包括健康问题相关的语音信息或文本信息;
意图确定模块,用于对所述用户输入信息进行意图识别,确定用户意图信息;
应答模块,用于基于预先建立的知识图谱,确定针对所述用户意图信息的应答信息。
9.一种电子设备,其特征在于,包括:处理器和存储装置;
所述存储装置上存储有计算机程序,所述计算机程序在被所述处理器运行时执行如权利要求1至7任一项所述的方法。
10.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器运行时执行上述权利要求1至7任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010458321.1A CN111611350B (zh) | 2020-05-26 | 2020-05-26 | 基于健康知识的应答方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010458321.1A CN111611350B (zh) | 2020-05-26 | 2020-05-26 | 基于健康知识的应答方法、装置及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111611350A true CN111611350A (zh) | 2020-09-01 |
CN111611350B CN111611350B (zh) | 2024-04-09 |
Family
ID=72204931
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010458321.1A Active CN111611350B (zh) | 2020-05-26 | 2020-05-26 | 基于健康知识的应答方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111611350B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112163078A (zh) * | 2020-09-29 | 2021-01-01 | 彩讯科技股份有限公司 | 智能应答方法、装置、服务器及存储介质 |
CN112530422A (zh) * | 2020-11-04 | 2021-03-19 | 联想(北京)有限公司 | 一种应答处理方法、智能设备及存储介质 |
CN112820285A (zh) * | 2020-12-29 | 2021-05-18 | 北京搜狗科技发展有限公司 | 一种交互方法和耳机设备 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109686360A (zh) * | 2019-01-08 | 2019-04-26 | 哈尔滨理工大学 | 一种语音订餐机器人 |
CN109739995A (zh) * | 2018-12-21 | 2019-05-10 | 中国银联股份有限公司 | 一种信息处理方法及装置 |
KR20190068021A (ko) * | 2017-12-08 | 2019-06-18 | 전자부품연구원 | 감정 및 윤리 상태 모니터링 기반 사용자 적응형 대화 장치 및 이를 위한 방법 |
CN110046221A (zh) * | 2019-03-01 | 2019-07-23 | 平安科技(深圳)有限公司 | 一种机器对话方法、装置、计算机设备及存储介质 |
US20190228069A1 (en) * | 2017-08-04 | 2019-07-25 | Ping An Technology (Shenzhen) Co., Ltd. | Intention acquisition method, electronic device and computer-readable storage medium |
CN110659360A (zh) * | 2019-10-09 | 2020-01-07 | 初米网络科技(上海)有限公司 | 一种人机对话方法、装置和系统 |
CN110929016A (zh) * | 2019-12-10 | 2020-03-27 | 北京爱医生智慧医疗科技有限公司 | 一种基于知识图谱的智能问答方法及装置 |
US20200125967A1 (en) * | 2018-10-18 | 2020-04-23 | Samsung Electronics Co., Ltd. | Electronic device and method for controlling the electronic device |
CN111125309A (zh) * | 2019-12-23 | 2020-05-08 | 中电云脑(天津)科技有限公司 | 自然语言处理方法、装置及计算设备、存储介质 |
CN111161740A (zh) * | 2019-12-31 | 2020-05-15 | 中国建设银行股份有限公司 | 意图识别模型训练方法、意图识别方法以及相关装置 |
-
2020
- 2020-05-26 CN CN202010458321.1A patent/CN111611350B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190228069A1 (en) * | 2017-08-04 | 2019-07-25 | Ping An Technology (Shenzhen) Co., Ltd. | Intention acquisition method, electronic device and computer-readable storage medium |
KR20190068021A (ko) * | 2017-12-08 | 2019-06-18 | 전자부품연구원 | 감정 및 윤리 상태 모니터링 기반 사용자 적응형 대화 장치 및 이를 위한 방법 |
US20200125967A1 (en) * | 2018-10-18 | 2020-04-23 | Samsung Electronics Co., Ltd. | Electronic device and method for controlling the electronic device |
CN109739995A (zh) * | 2018-12-21 | 2019-05-10 | 中国银联股份有限公司 | 一种信息处理方法及装置 |
CN109686360A (zh) * | 2019-01-08 | 2019-04-26 | 哈尔滨理工大学 | 一种语音订餐机器人 |
CN110046221A (zh) * | 2019-03-01 | 2019-07-23 | 平安科技(深圳)有限公司 | 一种机器对话方法、装置、计算机设备及存储介质 |
CN110659360A (zh) * | 2019-10-09 | 2020-01-07 | 初米网络科技(上海)有限公司 | 一种人机对话方法、装置和系统 |
CN110929016A (zh) * | 2019-12-10 | 2020-03-27 | 北京爱医生智慧医疗科技有限公司 | 一种基于知识图谱的智能问答方法及装置 |
CN111125309A (zh) * | 2019-12-23 | 2020-05-08 | 中电云脑(天津)科技有限公司 | 自然语言处理方法、装置及计算设备、存储介质 |
CN111161740A (zh) * | 2019-12-31 | 2020-05-15 | 中国建设银行股份有限公司 | 意图识别模型训练方法、意图识别方法以及相关装置 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112163078A (zh) * | 2020-09-29 | 2021-01-01 | 彩讯科技股份有限公司 | 智能应答方法、装置、服务器及存储介质 |
CN112530422A (zh) * | 2020-11-04 | 2021-03-19 | 联想(北京)有限公司 | 一种应答处理方法、智能设备及存储介质 |
CN112820285A (zh) * | 2020-12-29 | 2021-05-18 | 北京搜狗科技发展有限公司 | 一种交互方法和耳机设备 |
Also Published As
Publication number | Publication date |
---|---|
CN111611350B (zh) | 2024-04-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112242187B (zh) | 基于知识图谱表征学习的医疗方案推荐系统及方法 | |
CN110427461B (zh) | 智能问答信息处理方法、电子设备及计算机可读存储介质 | |
CN111611350B (zh) | 基于健康知识的应答方法、装置及电子设备 | |
CN111081220B (zh) | 车载语音交互方法、全双工对话系统、服务器和存储介质 | |
CN112256828B (zh) | 医学实体关系抽取方法、装置、计算机设备及可读存储介质 | |
CN117149989B (zh) | 大语言模型训练方法、文本处理方法及装置 | |
CN106649739B (zh) | 多轮交互信息继承识别方法、装置以及交互系统 | |
CN107247751B (zh) | 基于lda主题模型的内容推荐方法 | |
CN112699686B (zh) | 基于任务型对话系统的语义理解方法、装置、设备及介质 | |
CN112307351A (zh) | 用户行为的模型训练、推荐方法、装置和设备 | |
CN111695354A (zh) | 基于命名实体的文本问答方法、装置及可读存储介质 | |
CN112528637A (zh) | 文本处理模型训练方法、装置、计算机设备和存储介质 | |
CN112287089A (zh) | 用于自动问答系统的分类模型训练、自动问答方法及装置 | |
CN110442859A (zh) | 标注语料生成方法、装置、设备及存储介质 | |
CN109726400B (zh) | 实体词识别结果评价方法、装置、设备及实体词提取系统 | |
CN112732872B (zh) | 面向生物医学文本的基于主题注意机制的多标签分类方法 | |
CN110852071B (zh) | 知识点检测方法、装置、设备及可读存储介质 | |
CN112800777B (zh) | 语义确定方法 | |
CN113761188A (zh) | 文本标签确定方法、装置、计算机设备和存储介质 | |
CN116072297B (zh) | 基于小说互动确定心理健康数据的方法及相关装置 | |
CN114372454A (zh) | 文本信息抽取方法、模型训练方法、装置及存储介质 | |
CN108959467B (zh) | 一种基于强化学习的问句和答案句相关度的计算方法 | |
CN115714030A (zh) | 一种基于疼痛感知和主动交互的医疗问答系统及方法 | |
Wang et al. | A text sentiment classification method based on LSTM-CNN | |
CN111831807A (zh) | 意图识别方法、营养知识的问答方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |