CN112256825B - 医疗领域多轮对话智能问答方法、装置和计算机设备 - Google Patents

医疗领域多轮对话智能问答方法、装置和计算机设备 Download PDF

Info

Publication number
CN112256825B
CN112256825B CN202011118109.7A CN202011118109A CN112256825B CN 112256825 B CN112256825 B CN 112256825B CN 202011118109 A CN202011118109 A CN 202011118109A CN 112256825 B CN112256825 B CN 112256825B
Authority
CN
China
Prior art keywords
information
nth
question
intention
dialogue
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011118109.7A
Other languages
English (en)
Other versions
CN112256825A (zh
Inventor
梁欣
周晓峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN202011118109.7A priority Critical patent/CN112256825B/zh
Priority to PCT/CN2020/132598 priority patent/WO2021189921A1/zh
Publication of CN112256825A publication Critical patent/CN112256825A/zh
Application granted granted Critical
Publication of CN112256825B publication Critical patent/CN112256825B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Human Computer Interaction (AREA)
  • Machine Translation (AREA)

Abstract

本申请涉及数字医疗领域,可以应用于远程医疗问诊或自助医疗服务等场景,揭示了一种医疗领域多轮对话智能问答方法包括:获取第N问题描述语句;将第N问题描述语句输入到自然语言理解模型,进行实体信息和意图信息抽取;若未抽取到实体信息或意图信息,则将第N‑1问题描述语句中的实体信息或意图信息作为实体信息或意图信息进行补全,得到补全问题描述语句,进行对话答复输出。本申请通过抽取上一轮对话的实体信息和意图信息,可以更好模拟人的交流,即便用户使用了指代词或者是隐去了一些实体或者意图,仍然能通过继承上下文语境,使对话更自然更流畅,用户体验更佳。本申请还涉及区块链技术,在区块链中实现所述医疗领域多轮对话智能问答方法。

Description

医疗领域多轮对话智能问答方法、装置和计算机设备
技术领域
本申请涉及到数字医疗领域,特别是涉及到一种医疗领域多轮对话智能问答方法、装置和计算机设备。
背景技术
近年来,互联网医疗兴起,患者获取相关医疗信息的方式,从原来的网页搜索改为向集成了更多更全面专业医疗知识和功能的产品获取资讯。因此市面上也出现了一些医疗领域的对话机器人帮助用户快速的定位问题以及解答问答。
这些对话产品大多都是单轮对话的形式,和人的交互是一问一答。但是真实场景中,人与人在交互时,有70%概率会通过指代甚至隐去相关信息的方式去交流沟通,只有30%左右的句子是完整的语义表示。举例说,A:“今天上海天气怎样”,B:“今天(上海)天气很好”,A:“那(上海)附近有什么可以游玩的吗?”B:“可以去滴水湖玩一玩”。在沟通过程中,人往往可以通过联系对话的上下文情景,合理推测,继续对话。
通用领域的对话系统由于领域与领域之间的差异性,所以相比垂直领域,较容易区分,比如天气领域与交通出行领域。然而在医疗领域,实体之间的耦合性较高,用户在询问药品时,往往也带有疾病或者症状等其他医疗实体的信息,如“二甲双胍能治疗糖尿病吗?”。如何合理且顺畅的切换实体领域,使得与用户进行多轮的对话即是亟待解决的问题。
发明内容
本申请的主要目的为提供一种医疗领域多轮对话智能问答方法、装置和计算机设备,旨在解决医疗领域多轮对话问答时,如何实现语境准确切换,提高问答准确率的技术问题。
为了实现上述发明目的,本申请提出一种医疗领域多轮对话智能问答方法,包括:
获取第N轮对话的第N问题描述语句,其中N为大于等于2的正整数;
将所述第N问题描述语句输入到预设的自然语言理解模型,进行第N实体信息和第N意图信息抽取,其中所述自然语言理解模型包括命名实体识别模块和意图分类模块;
若未抽取到所述第N实体信息或所述第N意图信息,则将第N-1轮对话的第N-1问题描述语句中的第N-1实体信息或第N-1意图信息作为所述第N实体信息或所述第N意图信息,利用预设的语句补全模型对所述第N问题描述语句进行补全,得到补全问题描述语句;
根据所述补全问题描述语句进行对话答复输出。
进一步地,所述获取第N轮对话的第N问题描述语句的步骤之前,包括:
获取第一轮对话的第一问题描述语句,根据第一问题描述语句进行对话答复输出;
将所述第一问题描述语句输入到所述自然语言理解模型,进行第一实体信息和第一意图信息抽取,得到第一实体信息和第一意图信息。
进一步地,所述将所述第一问题描述语句输入到所述自然语言理解模型,进行第一实体信息和第一意图信息抽取,得到第一实体信息和第一意图信息的步骤包括:
将所述第一问题描述语句输入所述命名实体识别模块进行实体抽取,得到所述第一实体信息;
将所述第一问题描述语句输入所述意图分类模块进行意图分类,得到所述第一意图信息。
进一步地,所述将所述第一问题描述语句输入所述命名实体识别模块进行实体抽取,得到所述第一实体信息的步骤包括:
将所述第一问题描述语句进行分词处理,将分词结果输入到预设的BERT模型进行语义编码,得到语义编码的词向量;
将所述语义编码结果输入到BILTSM模型,得到隐藏向量;
将所述隐藏向量输入到CRF模型进行解码,得到所述第一实体信息。
进一步地,所述将所述第一问题描述语句输入所述命名实体识别模块进行实体抽取,得到所述第一实体信息的步骤包括:
将所述第一问题描述语句进行分词处理,将分词结果输入到预设的双向GRU模型进行特征提取;
将所述特征提取结果输入到softmax层进行意图分类,得到所述第一意图信息。
所述利用预设的语句补全模型对所述第N问题描述语句进行补全,得到补全问题描述语句的步骤包括:
若所述第N问题描述语句缺少实体信息,则将所述第N-1实体信息作为所述第N实体信息,并利用所述语句补全模型对所述第N实体信息进行位置评分,根据所述位置评分的评分结果确定所述第N实体信息的位置,得到补全问题描述语句;
若所述第N问题描述语句缺少意图信息,则将所述第N-1意图信息作为所述第N意图信息,并利用所述语句补全模型对所述第N意图信息进行位置评分,根据所述位置评分的评分结果确定所述第N实体信息的位置,得到补全问题描述语句。
进一步地,所述获取第N轮对话的第N问题描述语句的步骤之后还包括:
判断N是否大于预设值或前N-1轮的对话时间是否大于指定值;
若N大于预设值或前N-1轮对话时间大于指定值,则将对话轮数重置;
若N不大于预设值或前N-1轮对话时间不大于指定值,则执行所述将所述第N问题描述语句输入到预设的自然语言理解模型,进行第N实体信息和第N意图信息抽取,其中所述自然语言理解模型包括命名实体识别模块和意图分类模块的步骤。
本申请实施例还提供一种医疗领域多轮对话智能问答装置,包括:
获取模块,用于获取第N轮对话的第N问题描述语句;
理解模块,用于将所述第N问题描述语句输入到预设的自然语言理解模型,进行第N实体信息和第N意图信息抽取;
补全模块,用于若未抽取到所述第N实体信息或所述第N意图信息,则将第N-1轮对话的第N-1问题描述语句中的第N-1实体信息或第N-1意图信息作为所述第N实体信息或所述第N意图信息,利用预设的语句补全模型对所述第N问题描述语句进行补全,得到补全问题描述语句;
答复模块,用于根据所述补全问题描述语句进行对话答复输出。
本申请还提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。
本申请还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的方法的步骤。
本申请的医疗领域多轮对话智能问答方法、装置和计算机设备,通过抽取上一轮对话的实体信息和意图信息,可以更好模拟人与人之间的交流,即便用户使用了指代词或者是隐去了一些实体或者意图,仍然能通过继承上下文语境,使得对话更自然更流畅,用户体验更佳。
附图说明
图1为本申请一实施例的医疗领域多轮对话智能问答方法的流程示意图;
图2为本申请另一实施例的医疗领域多轮对话智能问答方法的流程示意图;
图3为本申请另一实施例的医疗领域多轮对话智能问答方法的流程示意图;
图4为本申请另一实施例的医疗领域多轮对话智能问答方法的流程示意图;
图5为本申请另一实施例的医疗领域多轮对话智能问答方法的流程示意图;
图6为本申请另一实施例的医疗领域多轮对话智能问答方法的流程示意图;
图7为本申请另一实施例的医疗领域多轮对话智能问答方法的流程示意图;
图8为本申请一实施例的医疗领域多轮对话智能问答装置的结构示意框图;
图9为本申请一实施例的计算机设备的结构示意框图。
本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
参照图1,本申请实施例中提供一种医疗领域多轮对话智能问答方法,可以应用于远程医疗问诊或自助医疗服务等场景,包括步骤:
S1、获取第N轮对话的第N问题描述语句,其中N为大于等于2的正整数;
S2、将所述第N问题描述语句输入到预设的自然语言理解模型,进行第N实体信息和第N意图信息抽取,其中所述自然语言理解模型包括命名实体识别模块和意图分类模块;
S3、若未抽取到所述第N实体信息或所述第N意图信息,则将第N-1轮对话的第N-1问题描述语句中的第N-1实体信息或第N-1意图信息作为所述第N实体信息或所述第N意图信息,利用预设的语句补全模型对所述第N问题描述语句进行补全,得到补全问题描述语句;
S4、根据所述补全问题描述语句进行对话答复输出。
如上述步骤S1-S4所述,上述步骤是一个循环的过程,首先要获得第一轮的问题描述语句,然后根据上述步骤完成多轮问答。具体地,在获取到第N轮对话的第N(N≥2)问题描述语句时,将所述第N问题描述语句输入到预设的自然语言理解模型,进行第N实体信息和第N意图信息抽取,此处,N是指对话的轮数,一问一答为一轮对话,第N轮对话中的问题描述语句为第N描述语句,第N-1轮对话的问题描述语句为第N-1问题描述语句。其中所述自然语言理解模型包括命名实体识别模块和意图分类模块,所述命名实体识别模块用于对实心信息进行抽取,所述意图分类模块用于对意图信息进行抽取。
在真实对话场景中,用户常常会隐藏掉上一轮对话出现过的实体信息或意图信息。若上述信息抽取的过程中没有抽取到相关信息,则说明实体信息或意图信息被隐藏或指代了,此时,可以选择上一轮对话的实体信息或意图信息作为本轮对话的实体信息或意图信息,即若未抽取到所述第N实体信息或所述第N意图信息,则将第N-1轮对话的第N-1问题描述语句中的第N-1实体信息或第N-1意图信息作为所述第N实体信息或所述第N意图信息。然后利用预设的语句补全模型对所述第N问题描述语句进行补全,得到补全问题描述语句。上述“语句补全模型”通过训练,可以将含有指代或者隐藏信息的句子补全。
最后,根据补全问题描述语句在医疗问答语料库中进行问答查询,输出答案给用户。所述医疗问答语料库可以是医疗领域知识图谱,包含大量的医学知识。
上述的医疗领域多轮对话智能问答方法,可以应用于远程医疗问诊或自助医疗服务等场景,例如应用于移动终端例如手机等的自助医疗服务APP,移动终端接收用户输入的第N问题描述语句,移动终端可以于服务端通讯连接,后续步骤的处理过程可以在移动终端完成也可以在服务端完整,最终给出第N问题的答案。优选地,后续步骤在服务端完成,也就是说所述自然语言理解模型和语句补全模型储存于服务端,在服务端获取答案后再传输给移动终端展示给用户。
下面为了方便理解,以一个实际的案例举例说明。
例如,患者提问“糖尿病可不可以吃西瓜?”,自然语言理解模型抽取相应实体(疾病:糖尿病,食物:西瓜)和意图分类(意图:疾病饮食);系统通过搜索疾病知识库,给出问题的正确答案。此时,“糖尿病可不可以吃西瓜”的问题描述语句以及系统给出的正确答案组成第一轮对话,“糖尿病可不可以吃西瓜”即为第一问题描述语句。
若患者同时患有高血压,患者继续提问“那高血压呢?”。此时,即认为第二轮对话开始,患者的提问即可认为是第二轮对话的第二问题描述语句。上文中的实体信息“糖尿病和西瓜”,意图信息“疾病饮食”,以及当前用户的输入“那高血压呢?”,会作为“语句补全模型”的输入,模型补齐用户的完整提问为“高血压可不可以吃西瓜?”,然后再经过自然语言理解模型抽取实体(疾病:高血压,食物:西瓜)和意图分类(疾病饮食),继续在整个对话流程中传递上述实体信息和意图信息,系统通过搜索疾病知识库,给出问题的正确答案。
若患者继续提问“能注射多巴酚丁胺吗?”此时,即认为第三轮对话开始,患者的提问即可认为是第三轮对话的第三问题描述语句。根据传递的实体信息和意图信息和输入数据,语句补全模型补全用户的完整提问为“高血压能注射多巴酚丁胺吗?”,抽取实体结果为(疾病:高血压,药品:多巴酚丁胺),意图分类结果为(意图:药物禁忌);系统通过搜索药品知识库,给出禁忌关系,并继续传递实体信息和意图信息,直到N轮对话结束。
如图2所示,在一个实施例中,所述获取第N轮对话的第N问题描述语句的步骤之前,包括:
S01、获取第一轮对话的第一问题描述语句,根据第一问题描述语句进行对话答复输出;
S02、将所述第一问题描述语句输入到所述自然语言理解模型,进行第一实体信息和第一意图信息抽取,得到第一实体信息和第一意图信息。
如上所述,首先获取第一问题描述语句,所述第一问题描述语句是指用户进行多轮对话的第一轮对话的第一个问题语句,此时,所述第一问题描述语句一般是完整的,即不会有省略掉的实体信息或语境信息。然后通过所述自然语言理解模型对所述第一问题语句进行实体信息和意图信息的抽取得到第一实体信息和第一意图信息。如果通过模型的抽取,没有抽取到实体信息或意图信息,则可以要求用户补全相关信息,也可以通过自动判断的方式补全相关信息,并由用户确认。例如,可以通过查询用户历史的问答数据确定用户的常用问答实体信息或意图信息,作为第一实体信息或第一意图信息。
如图3所示,在一个实施例中,所述将所述第一问题描述语句输入到所述自然语言理解模型,进行第一实体信息和第一意图信息抽取,得到第一实体信息和第一意图信息的步骤包括:
S021、将所述第一问题描述语句输入所述命名实体识别模块进行实体抽取,得到所述第一实体信息;
S022、将所述第一问题描述语句输入所述意图分类模块进行意图分类,得到所述第一意图信息。
如上所述,在自然语言理解模型中包含命名实体识别模块和意图分类模块,其中命名实体模块用于实体抽取,意图分类模块用于意图分离。命名实体识别(Named EntityRecognition,NER)是NLP(Natural Language Processing,自然语言处理)里的一项很基础的任务,就是指从文本中识别出命名性指称项,为关系抽取等任务做铺垫。狭义上,是识别出人名、地名和组织机构名这三类命名实体(时间、货币名称等构成规律明显的实体类型可以用正则等方式识别)。当然,在特定领域中,会相应地定义领域内的各种实体类型。目前常用机器学习模型来实现NER,如LSTM(LongShortMemoryNetwork,长短期记忆网络)模型和CRF(Conditional Random Fields,条件随机场)模型等。意图分类也就是意图识别是通过分类的办法将句子或者我们常说的query分到相应的意图种类。常见的意图分类方法有基于规则的分类方法和基于模型的分类方法。
如图4所示,在一个具体的实施例中,所述将所述第一问题描述语句输入所述命名实体识别模块进行实体抽取,得到所述第一实体信息的步骤包括:
S0211、将所述第一问题描述语句进行分词处理,将分词结果输入到预设的BERT模型进行语义编码,得到语义编码的词向量;
S0212、将所述语义编码结果输入到BILTSM模型,得到隐藏向量;
S0213、将所述隐藏向量输入到CRF模型进行解码,得到所述第一实体信息。
如上所述,在本实施例中,使用了BERT+BILTSM+CRF进行命名实体识别。BERT(Bidirectional Encoder Representations from Transformers)模型是一个预训练的语言模型,在各种NLP任务上都有非常优异的表现。在应该过程中,需要使用医学问答预料对预训练的BERT模型进行微调。BERT+BILTSM+CRF模型相比于传统命名实体识别的BiLSTM+CRF模型,用BERT模型代替了原来的词嵌入部分,利用BERT来进行语义编码,BiLSTM+CRF进行解码。BERT模型的算法能较好地识别口语化症状,非常适用于医疗知识问答的实体识别,实体识别准确度高。
如图5所示,在一个具体的实施例中,所述将所述第一问题描述语句输入所述意图分类模块进行意图分类,得到所述第一意图信息的步骤包括:
S0221、将所述第一问题描述语句进行分词处理,将分词结果输入到预设的双向GRU模型进行特征提取;
S0222、将所述特征提取结果输入到softmax层进行意图分类,得到所述第一意图信息。
如上所述,在本实施例中,采取了双向GRU(Gated Recurrent Unit)模型来学习语句的高维度特征,然后利用softmax进行意图分类。采用双向GRU模型可以解决LSTM和GRU从左往右推进,后面的输入比前面更重要的问题,可以更加完整捕捉上下文信息,使意图分类的准确性更高。
如图6所示,在一个实施例中,所述利用预设的语句补全模型对所述第N问题描述语句进行补全,得到补全问题描述语句的步骤包括:
S31、若所述第N问题描述语句缺少实体信息,则将所述第N-1实体信息作为所述第N实体信息,并利用所述语句补全模型对所述第N实体信息进行位置评分,根据所述位置评分的评分结果确定所述第N实体信息的位置,得到补全问题描述语句;
S32、若所述第N问题描述语句缺少意图信息,则将所述第N-1意图信息作为所述第N意图信息,并利用所述语句补全模型对所述第N意图信息进行位置评分,根据所述位置评分的评分结果确定所述第N实体信息的位置,得到补全问题描述语句。
如上所述,在第N问题描述语句经过自然语言理解模型中处理后,若发现缺少实体信息或意图信息,则将上一轮问题描述语句的实体信息或意图信息作为本轮的问题描述语句的实体信息或意图信息。然后对实体信息或意图信息进行补全,可以利用预设的规则进行位置补全,也可以利用深度学习模型评分的方法进行补全,本实施例中采取了使用深度学习模型的对位置进行评分,选择评分最高的实体信息或意图信息位置来确定所述补全问题描述语句。具体地,模型选择transformer作为encoder(编码器)和decoder(解码器),encoder的输入为word embedding、position embedding和上述的实体信息和意图信息。在decoder模块中,设置了一个参数λ来控制语句是否需要改写。最后经过softmax层对解码结果进行归一化,得到包含实体或意图位置信息的置信度的评分,根据评分最高的实体信息或意图信息位置来确定所述补全问题描述语句。用户的输入在经过该模型后,再被送入自然语言理解模块,从而提高意图识别的召回率和准确率。
在一个实施例中,所述获取第N轮对话的第N问题描述语句的步骤之后还包括:
S11、判断N是否大于预设值或前N-1轮的对话时间是否大于指定值;
S12、若N大于预设值或前N-1轮对话时间大于指定值,则将对话轮数重置;
S13、若N不大于预设值或前N-1轮对话时间不大于指定值,则执行将所述第N问题描述语句输入到预设的自然语言理解模型,进行第N实体信息和第N意图信息抽取,其中所述自然语言理解模型包括命名实体识别模块和意图分类模块的步骤。
如上所述,为了模拟真实交流语境的对话记忆,在本实施例中设置了对话轮数重置的条件。在对话轮数大于预设值或者对话时间已经持续了指定时间时,可以将对话轮数重置,相当于系统认为从第一轮重新开始对话。之后用户输入的问题描述语句中如果缺少实体信息或者意图信息,可以提示用户进行主动补全。这样操作可以减少过多轮数的对话可能导致的实体或意图曲解,提高多轮对话整体的准确性,避免信息过多,产生对话混乱。在一个优选地实施例中,所述预设值为15,所述指定值为5min。即在对话轮数达到15轮或者对话已经持续了5分钟时,将对话轮数重置,认为从第一轮重新开始对话;当对话轮数N不大于预设值或前N-1轮对话时间不大于指定值时,则开始执行步骤S2。图7中示出了本实施例中基于以上逻辑的医疗领域多轮对话智能问答方法的完整步骤。
在一个实施例中,在所述根据所述补全问题描述语句进行对话答复输出的步骤之前还可以生成补全问题描述语句是否为用户本意的确认交互选项,如果接收到肯定意图的指令则执行步骤S4,如果接收到否定意图的指令,则提示用户主动补全问题描述语句,然后根据用户主动补全的问题描述语句进行答复输出。
在一个实施例中,所述自然语言理解模型和语句补全模型的的相关数据均可以存储与区块链中,在区块链网络中实现如上所述的医疗领域多轮对话智能问答方法。
如上所述,区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层。
区块链底层平台可以包括用户管理、基础服务、智能合约以及运营监控等处理模块。其中,用户管理模块负责所有区块链参与者的身份信息管理,包括维护公私钥生成(账户管理)、密钥管理以及用户真实身份和区块链地址对应关系维护(权限管理)等,并且在授权的情况下,监管和审计某些真实身份的交易情况,提供风险控制的规则配置(风控审计);基础服务模块部署在所有区块链节点设备上,用来验证业务请求的有效性,并对有效请求完成共识后记录到存储上,对于一个新的业务请求,基础服务先对接口适配解析和鉴权处理(接口适配),然后通过共识算法将业务信息加密(共识管理),在加密之后完整一致的传输至共享账本上(网络通信),并进行记录存储;智能合约模块负责合约的注册发行以及合约触发和合约执行,开发人员可以通过某种编程语言定义合约逻辑,发布到区块链上(合约注册),根据合约条款的逻辑,调用密钥或者其它的事件触发执行,完成合约逻辑,同时还提供对合约升级注销的功能;运营监控模块主要负责产品发布过程中的部署、配置的修改、合约设置、云适配以及产品运行中的实时状态的可视化输出,例如:告警、监控网络情况、监控节点设备健康状态等。
本申请实施例的医疗领域多轮对话智能问答方法,通过抽取上一轮对话的实体信息和意图信息,可以更好模拟人与人之间的交流,即便用户使用了指代词或者是隐去了一些实体或者意图,仍然能通过继承上下文语境,使得对话更自然更流畅,用户体验更佳。
参照图8,本申请实施例中还提供一种医疗领域多轮对话智能问答装置,包括:
获取模块1,用于获取第N轮对话的第N问题描述语句;
理解模块2,用于将所述第N问题描述语句输入到预设的自然语言理解模型,进行第N实体信息和第N意图信息抽取;
补全模块3,用于若未抽取到所述第N实体信息或所述第N意图信息,则将第N-1轮对话的第N-1问题描述语句中的第N-1实体信息或第N-1意图信息作为所述第N实体信息或所述第N意图信息,利用预设的语句补全模型对所述第N问题描述语句进行补全,得到补全问题描述语句;
答复模块4,用于根据所述补全问题描述语句进行对话答复输出。
在一个实施例中,所述理解模块2包括:
命名实体抽取模块,用于进行实体抽取,得到所述第一实体信息;
意图分类模块,用于进行意图分类,得到所述第一意图信息。
在一个具体的实施例中,所述命名实体抽取模块包括:
BERT单元,用于将所述第一问题描述语句进行分词处理,将分词结果输入到预设的BERT模型进行语义编码,得到语义编码的词向量;
BILTSM单元,用于将所述语义编码结果输入到BILTSM模型,得到隐藏向量;
CRF单元,用于将所述隐藏向量输入到CRF模型进行解码,得到所述第一实体信息。
在一个具体的实施例中,所述意图分类模块包括:
双向GRU单元,用于将所述第一问题描述语句进行分词处理,将分词结果输入到预设的双向GRU模型进行特征提取;
softmax单元,用于将所述第一问题描述语句进行分词处理,将分词结果输入到预设的双向GRU模型进行特征提取;
将所述特征提取结果输入到softmax层进行意图分类,得到所述第一意图信息。
在一个实施例中,所述补全模块3包括:
实体信息补全单元,用于若所述第N问题描述语句缺少实体信息,则将所述第N-1实体信息作为所述第N实体信息,并利用所述语句补全模型对所述第N实体信息可能在所述第N问题描述语句的位置进行评分判断,确定所述第N实体信息的位置,得到补全问题描述语句;
意图信息补全单元,用于若所述第N问题描述语句缺少意图信息,则将所述第N-1意图信息作为所述第N意图信息,并利用所述语句补全模型对所述第N意图信息可能在所述第N问题描述语句的位置进行评分判断,确定所述第N实体信息的位置,得到补全问题描述语句。
在一个实施例中,所述医疗领域多轮对话智能问答装置还包括:
判断模块,用于判断N是否大于预设值或前N-1轮的对话时间是否大于指定值;
重置模块,用于若N大于预设值或前N-1轮对话时间大于指定值,则将对话轮数重置。
如上所述,可以理解地,本申请中提出的所述医疗领域多轮对话智能问答装置的各组成部分可以实现如上所述医疗领域多轮对话智能问答方法任一项的功能,具体结构不再赘述。
参照图9,本申请实施例中还提供一种计算机设备,该计算机设备可以是服务器,其内部结构可以如图9所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于实体信息、意图信息等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种医疗领域多轮对话智能问答方法。
上述处理器执行上述的医疗领域多轮对话智能问答方法,包括:
获取第N轮对话的第N问题描述语句,其中N为大于等于2的正整数;
将所述第N问题描述语句输入到预设的自然语言理解模型,进行第N实体信息和第N意图信息抽取,其中所述自然语言理解模型包括命名实体识别模块和意图分类模块;
若未抽取到所述第N实体信息或所述第N意图信息,则将第N-1轮对话的第N-1问题描述语句中的第N-1实体信息或第N-1意图信息作为所述第N实体信息或所述第N意图信息,利用预设的语句补全模型对所述第N问题描述语句进行补全,得到补全问题描述语句;
根据所述补全问题描述语句进行对话答复输出。
本申请一实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现一种医疗领域多轮对话智能问答方法,包括步骤:
获取第N轮对话的第N问题描述语句,其中N为大于等于2的正整数;
将所述第N问题描述语句输入到预设的自然语言理解模型,进行第N实体信息和第N意图信息抽取,其中所述自然语言理解模型包括命名实体识别模块和意图分类模块;
若未抽取到所述第N实体信息或所述第N意图信息,则将第N-1轮对话的第N-1问题描述语句中的第N-1实体信息或第N-1意图信息作为所述第N实体信息或所述第N意图信息,利用预设的语句补全模型对所述第N问题描述语句进行补全,得到补全问题描述语句;
根据所述补全问题描述语句进行对话答复输出。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
以上所述仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。

Claims (9)

1.一种医疗领域多轮对话智能问答方法,其特征在于,包括:
获取第N轮对话的第N问题描述语句,其中N为大于等于2的正整数;
将所述第N问题描述语句输入到预设的自然语言理解模型,进行第N实体信息和第N意图信息抽取,其中所述自然语言理解模型包括命名实体识别模块和意图分类模块;所述命名实体识别模块包括BERT模型,使用医学问答预料对预训练的BERT模型进行微调;
若所述信息抽取没有抽取到实体信息或意图信息,则可以要求用户补全相关信息,也可以通过自动判断的方式补全相关信息,并由用户确认;
若未抽取到所述第N实体信息或所述第N意图信息,则将第N-1轮对话的第N-1问题描述语句中的第N-1实体信息或第N-1意图信息作为所述第N实体信息或所述第N意图信息,利用预设的语句补全模型对所述第N问题描述语句进行补全,得到补全问题描述语句;根据所述补全问题描述语句进行对话答复输出;
在所述根据所述补全问题描述语句进行对话答复输出的步骤之前,还包括:生成补全问题描述语句是否为用户本意的确认交互选项,如果接受到肯定意图的指令则根据所述补全问题描述语句进行对话答复输出;如果接收到否定意图的指令,则提示用户主动补全问题描述语句,然后根据用户主动补全的问题描述语句进行答复输出;
所述利用预设的语句补全模型对所述第N问题描述语句进行补全,得到补全问题描述语句的步骤包括:
若所述第N问题描述语句缺少实体信息,则将所述第N-1实体信息作为所述第N实体信息,并利用所述语句补全模型对所述第N实体信息进行位置评分,根据所述位置评分的评分结果确定所述第N实体信息的位置,得到补全问题描述语句;
若所述第N问题描述语句缺少意图信息,则将所述第N-1意图信息作为所述第N意图信息,并利用所述语句补全模型对所述第N意图信息进行位置评分,根据所述位置评分的评分结果确定所述第N实体信息的位置,得到补全问题描述语句;
所述语句补全模型选择transformer作为encoder和decoder,所述encoder的输入为word embedding、position embedding、所述的实体信息和所述意图信息;所述decoder设有参数控制所述语句是否需要改写。
2.根据权利要求1所述的医疗领域多轮对话智能问答方法,其特征在于,所述获取第N轮对话的第N问题描述语句的步骤之前,包括:
获取第一轮对话的第一问题描述语句,根据第一问题描述语句进行对话答复输出;
将所述第一问题描述语句输入到所述自然语言理解模型,进行第一实体信息和第一意图信息抽取,得到第一实体信息和第一意图信息。
3.根据权利要求2所述的医疗领域多轮对话智能问答方法,其特征在于,所述将所述第一问题描述语句输入到所述自然语言理解模型,进行第一实体信息和第一意图信息抽取,得到第一实体信息和第一意图信息的步骤包括:
将所述第一问题描述语句输入所述命名实体识别模块进行实体抽取,得到所述第一实体信息;
将所述第一问题描述语句输入所述意图分类模块进行意图分类,得到所述第一意图信息。
4.根据权利要求3所述的医疗领域多轮对话智能问答方法,其特征在于,所述将所述第一问题描述语句输入所述命名实体识别模块进行实体抽取,得到所述第一实体信息的步骤包括:
将所述第一问题描述语句进行分词处理,将分词结果输入到预设的BERT模型进行语义编码,得到语义编码的词向量;
将所述语义编码结果输入到BILTSM模型,得到隐藏向量;
将所述隐藏向量输入到CRF模型进行解码,得到所述第一实体信息。
5.根据权利要求3所述的医疗领域多轮对话智能问答方法,其特征在于,所述将所述第一问题描述语句输入所述意图分类模块进行意图分类,得到所述第一意图信息的步骤包括:
将所述第一问题描述语句进行分词处理,将分词结果输入到预设的双向GRU模型进行特征提取;
将所述特征提取结果输入到softmax层进行意图分类,得到所述第一意图信息。
6.根据权利要求1所述的医疗领域多轮对话智能问答方法,其特征在于,所述获取第N轮对话的第N问题描述语句的步骤之后还包括:
判断N是否大于预设值或前N-1轮的对话时间是否大于指定值;
若N大于预设值或前N-1轮对话时间大于指定值,则将对话轮数重置;
若N不大于预设值或前N-1轮对话时间不大于指定值,则执行所述将所述第N问题描述语句输入到预设的自然语言理解模型,进行第N实体信息和第N意图信息抽取,其中所述自然语言理解模型包括命名实体识别模块和意图分类模块的步骤。
7.一种医疗领域多轮对话智能问答装置,用于执行如权利要求1所述的医疗领域多轮对话智能问答方法,其特征在于,包括:
获取模块,用于获取第N轮对话的第N问题描述语句;
理解模块,用于将所述第N问题描述语句输入到预设的自然语言理解模型,进行第N实体信息和第N意图信息抽取;
补全模块,用于若未抽取到所述第N实体信息或所述第N意图信息,则将第N-1轮对话的第N-1问题描述语句中的第N-1实体信息或第N-1意图信息作为所述第N实体信息或所述第N意图信息,利用预设的语句补全模型对所述第N问题描述语句进行补全,得到补全问题描述语句;
答复模块,用于根据所述补全问题描述语句进行对话答复输出。
8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
CN202011118109.7A 2020-10-19 2020-10-19 医疗领域多轮对话智能问答方法、装置和计算机设备 Active CN112256825B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202011118109.7A CN112256825B (zh) 2020-10-19 2020-10-19 医疗领域多轮对话智能问答方法、装置和计算机设备
PCT/CN2020/132598 WO2021189921A1 (zh) 2020-10-19 2020-11-30 医疗领域多轮对话智能问答方法、装置和计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011118109.7A CN112256825B (zh) 2020-10-19 2020-10-19 医疗领域多轮对话智能问答方法、装置和计算机设备

Publications (2)

Publication Number Publication Date
CN112256825A CN112256825A (zh) 2021-01-22
CN112256825B true CN112256825B (zh) 2023-06-16

Family

ID=74244776

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011118109.7A Active CN112256825B (zh) 2020-10-19 2020-10-19 医疗领域多轮对话智能问答方法、装置和计算机设备

Country Status (2)

Country Link
CN (1) CN112256825B (zh)
WO (1) WO2021189921A1 (zh)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112989008A (zh) * 2021-04-21 2021-06-18 上海汽车集团股份有限公司 一种多轮对话改写方法、装置和电子设备
CN113420115B (zh) * 2021-06-22 2024-03-22 平安科技(深圳)有限公司 基于人机语音对话的信息处理方法及装置
CN113673256B (zh) * 2021-07-21 2024-08-27 杭州阿里云飞天信息技术有限公司 问询语句改写方法及装置
CN113657102B (zh) * 2021-08-17 2023-05-30 北京百度网讯科技有限公司 信息抽取方法、装置、设备及存储介质
CN113806508A (zh) * 2021-09-17 2021-12-17 平安普惠企业管理有限公司 基于人工智能的多轮对话方法、装置及存储介质
CN113934858A (zh) * 2021-09-22 2022-01-14 易联众智鼎(厦门)科技有限公司 基于医学知识图谱检索技术的健康咨询实现方法及装置
CN114003700A (zh) * 2021-10-27 2022-02-01 浙江诺诺网络科技有限公司 一种对话信息的处理方法、系统、电子设备及存储介质
CN114239602B (zh) * 2021-11-19 2024-10-25 中国建设银行股份有限公司 会话方法、装置和计算机程序产品
CN114048298B (zh) * 2021-11-23 2024-05-31 中国民用航空总局第二研究所 意图理解方法、装置、设备及介质
CN114238653B (zh) * 2021-12-08 2024-05-24 华东师范大学 一种编程教育知识图谱构建、补全与智能问答的方法
CN114548110A (zh) * 2021-12-29 2022-05-27 北京百度网讯科技有限公司 语义理解方法、装置、电子设备及存储介质
CN114090762B (zh) * 2022-01-21 2022-06-03 浙商期货有限公司 一种期货领域的自动问答方法和系统
CN114925678B (zh) * 2022-04-21 2023-05-26 电子科技大学 一种基于高层交互机制的药物实体和关系联合抽取方法
CN114840653B (zh) * 2022-04-26 2023-08-01 北京百度网讯科技有限公司 对话处理方法、装置、设备以及存储介质
CN115238101B (zh) * 2022-09-23 2023-01-03 中国电子科技集团公司第十研究所 一种面向多类型知识库的多引擎智能问答系统
CN116151273B (zh) * 2023-04-24 2023-06-30 湖南超能机器人技术有限公司 基于Transformer和知识图谱的智能交互方法
CN116913527B (zh) * 2023-09-14 2023-12-05 北京健康有益科技有限公司 一种基于多轮对话框架的高血压评测方法及系统
CN117421416B (zh) * 2023-12-19 2024-03-26 数据空间研究院 交互检索方法、装置和电子设备
CN118427307A (zh) * 2024-05-23 2024-08-02 中日友好医院(中日友好临床医学研究所) 基于知识图谱的甲状旁腺医学知识智能查询方法及装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110704641A (zh) * 2019-10-11 2020-01-17 零犀(北京)科技有限公司 一种万级意图分类方法、装置、存储介质及电子设备

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10262062B2 (en) * 2015-12-21 2019-04-16 Adobe Inc. Natural language system question classifier, semantic representations, and logical form templates
CN107193978A (zh) * 2017-05-26 2017-09-22 武汉泰迪智慧科技有限公司 一种基于深度学习的多轮自动聊天对话方法及系统
CN109727041B (zh) * 2018-07-03 2023-04-18 平安科技(深圳)有限公司 智能客服多轮问答方法、设备、存储介质及装置
CN110472022A (zh) * 2019-06-25 2019-11-19 南京邮电大学 基于深度学习的对话方法及装置、存储介质和终端
CN111191016B (zh) * 2019-12-27 2023-06-02 车智互联(北京)科技有限公司 一种多轮对话处理方法、装置及计算设备
CN111737411A (zh) * 2020-05-20 2020-10-02 华为技术有限公司 人机对话中的响应方法、对话系统及存储介质

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110704641A (zh) * 2019-10-11 2020-01-17 零犀(北京)科技有限公司 一种万级意图分类方法、装置、存储介质及电子设备

Also Published As

Publication number Publication date
WO2021189921A1 (zh) 2021-09-30
CN112256825A (zh) 2021-01-22

Similar Documents

Publication Publication Date Title
CN112256825B (zh) 医疗领域多轮对话智能问答方法、装置和计算机设备
US12067981B2 (en) Adversarial learning and generation of dialogue responses
US20200301954A1 (en) Reply information obtaining method and apparatus
CN117521675A (zh) 基于大语言模型的信息处理方法、装置、设备及存储介质
CN111046132A (zh) 一种检索多轮对话的客服问答处理方法及其系统
CN111883140B (zh) 基于知识图谱和声纹识别的认证方法、装置、设备及介质
CN110717514A (zh) 会话意图识别方法、装置、计算机设备和存储介质
CN111081220B (zh) 车载语音交互方法、全双工对话系统、服务器和存储介质
CN109597876A (zh) 一种基于强化学习的多轮对话答复选择模型及其方法
CN113672708A (zh) 语言模型训练方法、问答对生成方法、装置及设备
CN112925888B (zh) 一种问答响应及小样本文本匹配模型的训练方法和装置
CN112837669B (zh) 语音合成方法、装置及服务器
CN112650768A (zh) 对话信息的生成方法、装置及电子设备
CN112131364B (zh) 问答方法、装置、电子设备和存储介质
CN113821587A (zh) 文本相关性确定方法、模型训练方法、装置及存储介质
CN113051384A (zh) 基于对话的用户画像抽取方法及相关装置
Prakash et al. Chatterbot implementation using transfer learning and LSTM encoder-decoder architecture
CN116913278B (zh) 语音处理方法、装置、设备和存储介质
CN117520793A (zh) 意图槽位识别模型的生成方法、装置、及电子设备
CN116827591A (zh) 一种数据处理方法和装置
CN116776857A (zh) 客户通话关键信息提取方法、装置、计算机设备及介质
CN113849647B (zh) 对话身份识别方法、装置、设备及存储介质
CN113569867B (zh) 一种图像处理方法、装置、计算机设备及存储介质
CN108694939A (zh) 语音搜索优化方法、装置和系统
CN113836273A (zh) 基于复杂语境的法律咨询方法及相关设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant