CN112035620A - 医疗查询系统的问答管理方法、装置、设备及存储介质 - Google Patents

医疗查询系统的问答管理方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN112035620A
CN112035620A CN202010900018.2A CN202010900018A CN112035620A CN 112035620 A CN112035620 A CN 112035620A CN 202010900018 A CN202010900018 A CN 202010900018A CN 112035620 A CN112035620 A CN 112035620A
Authority
CN
China
Prior art keywords
sentences
sentence
similar
question
preset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010900018.2A
Other languages
English (en)
Other versions
CN112035620B (zh
Inventor
刘道云
柳恭
张建峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kangjian Information Technology Shenzhen Co Ltd
Original Assignee
Kangjian Information Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kangjian Information Technology Shenzhen Co Ltd filed Critical Kangjian Information Technology Shenzhen Co Ltd
Priority to CN202010900018.2A priority Critical patent/CN112035620B/zh
Publication of CN112035620A publication Critical patent/CN112035620A/zh
Application granted granted Critical
Publication of CN112035620B publication Critical patent/CN112035620B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Software Systems (AREA)
  • Human Computer Interaction (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及人工智能领域,应用于智慧医疗领域中,公开了一种医疗查询系统的问答管理方法、装置、设备及存储介质,用于解决利用医疗查询系统进行查询语句查询时,生成标准回答的准确率低下的问题。医疗查询系统的问答管理方法包括:根据聚类函数对用户输入的原始语句进行分类,得到分类规则库;利用预置的疑问句提取模型抽取查询语句中的疑问句语句,得到目标语句;采用预置的意图识别模型提取目标语句的分段词向量,确定目标语句对应的识别意图及相似语句;根据预置的答复模型中的答复语料生成相似语句对应的标准回答,并将标准回答显示在医疗查询系统上。此外,本发明还涉及区块链技术,分类规则库中的信息可存储于区块链中。

Description

医疗查询系统的问答管理方法、装置、设备及存储介质
技术领域
本发明涉及人工智能领域,尤其涉及一种医疗查询系统的问答管理方法、装置、设备及存储介质。
背景技术
随着计算机技术的不断发展,互联网应用在不同领域的行业中,在医疗场景下,现存在医疗查询系统用于令医疗患者查询病情,通过医疗患者在医疗查询系统的交互界面上输入查询语句,经过医疗查询系统对查询语句的分析,最终得到查询语句的标准回答。
但由于医疗患者在进行查询语句的输入时,往往输入的查询语句偏口语化,导致医疗查询系统不能准确通过查询语句生成标准回答,医疗查询系统生成标准回答的准确率低下。
发明内容
本发明的主要目的在于解决利用医疗查询系统进行查询语句查询时,生成标准回答的准确率低下的问题。
本发明第一方面提供了一种医疗查询系统的问答管理方法,包括:收集用户输入的原始语句,根据聚类函数对所述原始语句进行分类,得到分类规则库,将所述分类规则库设置在医疗查询系统中;获取所述用户输入至所述医疗查询系统中的查询语句,利用预置的疑问句提取模型抽取所述查询语句中的疑问句语句,得到目标语句;采用预置的意图识别模型提取所述目标语句的分段词向量,基于所述分段词向量以及所述分类规则库确定所述目标语句对应的识别意图,并通过所述目标语句的识别意图在所述分类规则库中确定相似语句;将所述相似语句输入到预置的预测答复模型中,根据所述预置的答复模型中的答复语料生成所述相似语句对应的标准回答,并将所述标准回答显示在所述医疗查询系统上。
可选的,在本发明第一方面的第一种实现方式中,所述收集用户输入的原始语句,根据聚类函数对所述原始语句进行分类,得到分类规则库,将所述分类规则库设置在医疗查询系统中包括:收集用户输入的原始语句,获取业务语句,利用相似度算法计算所述原始语句与所述业务语句之间的基础相关度,所述业务语句为医疗查询系统中常用的疑问句语句;整合所述基础相关度,得到相关度矩阵;通过聚类函数对所述相关度矩阵进行分类,得到划分矩阵;通过所述划分矩阵对相应的原始语句进行划分,得到分组语句,将所述分组语句录入分类规则库中,并将所述分类规则库设置在医疗查询系统中。
可选的,在本发明第一方面的第二种实现方式中,所述获取所述用户输入至所述医疗查询系统中的查询语句,利用预置的疑问句提取模型抽取所述查询语句中的疑问句语句,得到目标语句包括:获取所述用户输入至所述医疗查询系统中的查询语句;将所述查询语句输入至所述医疗查询系统中预置的疑问句提取模型中,利用深度学习算法对所述查询语句进行分词处理,得到分词语料;采用提取函数提取所述分词语料中的基础特征,计算所述基础特征与分类特征之间的基础相似度,所述分类特征用于指示所述业务语句中疑问句句式特征;若所述基础相似度的数值大于或等于标准分类阈值,则确定对应的查询语句为疑问句语句,并将所述对应的查询语句确定为目标语句。
可选的,在本发明第一方面的第三种实现方式中,所述采用预置的意图识别模型提取所述目标语句的分段词向量,基于所述分段词向量以及所述分类规则库确定所述目标语句对应的识别意图,并通过所述目标语句的识别意图在所述分类规则库中确定相似语句包括:将目标语句输入至预置的意图识别模型中,利用所述预置的意图识别模型中的序列函数对所述目标语句进行断句,得到分段语料;提取所述分段语料中的分段词向量,并计算所述分段词向量与分组语句中的分组词向量之间的基础匹配率,根据所述基础匹配率的数值确定目标语句的识别意图,通过所述识别意图在所述分类规则库中确定相似语句,所述分组词向量是设置在所述分类规则库中的,且每个分组语句对应一个标准意图。
可选的,在本发明第一方面的第四种实现方式中,所述提取所述分段语料中的分段词向量,并计算所述分段词向量与分组语句中的分组词向量之间的基础匹配率,根据所述基础匹配率的数值确定目标语句的识别意图,通过所述识别意图在所述分类规则库中确定相似语句,所述分组词向量是设置在所述分类规则库中的,且每个分组语句对应一个标准意图包括:提取所述分段语料中的分段词向量,并计算所述分段词向量与所述分组语句中的分组词向量之间的基础匹配率,所述分组词向量是设置在所述分类规则库中的,且每个分组语句对应一个标准意图;在所述基础匹配率中选取数值最大的目标匹配率,将计算所述目标匹配率的分组词向量对应的标准意图作为所述目标语句的识别意图,并将所述识别意图对应的分组语句确定为相似语句。
可选的,在本发明第一方面的第五种实现方式中,所述将所述相似语句输入到预置的预测答复模型中,根据所述预置的答复模型中的答复语料生成所述相似语句对应的标准回答,并将所述标准回答显示在所述医疗查询系统上包括:将所述相似语句输入到预置的预测答复模型中,在所述预置的答复模型中对所述相似语句进行处理,得到所述相似语句的相似语料,所述预置的答复模型中包括答复语料;将所述相似语句输入到预置的预测答复模型中,在所述预置的答复模型中对所述相似语句进行处理,得到所述相似语句的相似语料,所述预置的答复模型中包括答复语料;利用第一计算公式计算相似语料的最大化似然估计,所述第一计算公式为:
Figure BDA0002659569030000031
其中,L1(U)为相似语句中相似语料的最大似然估计,U为相似语料的集合,ui为第i个相似语料,i为正整数,ui-k为第i-k个相似语料,k为正整数且k=i-1,θ为分布参数;采用第二计算公式预测相似语料的初始回答,所述第二计算公式为:
Figure BDA0002659569030000032
其中,L2(C)为相似语句中相似语料的初始回答,C为预置的答复模型中答复语料的标签集合,x1为第一个序列的答复语料,xm为第m个序列的答复语料,m为预置的答复模型中答复语料的个数,且m为正整数,y为答复语料的标签;利用融合公式将所述相似语料的最大化似然估计与所述相似语料的初始回答进行融合,确定所述相似语句的标准答案,并将所述标准答案显示在所述医疗查询系统上,所述融合公式为:L3(C')=L2(C)+λL1(U),其中,L3(C')为相似语句的标准答案,L2(C)为相似语料的初始回答,L1(U)为相似语料的最大化似然估计,λ为调整系数。
本发明第二方面提供了一种医疗查询系统的问答管理装置,包括:分类模块,用于收集用户输入的原始语句,根据聚类函数对所述原始语句进行分类,得到分类规则库,将所述分类规则库设置在医疗查询系统中;抽取模块,用于获取所述用户输入至所述医疗查询系统中的查询语句,利用预置的疑问句提取模型抽取所述查询语句中的疑问句语句,得到目标语句;确定模块,用于采用预置的意图识别模型提取所述目标语句的分段词向量,基于所述分段词向量以及所述分类规则库确定所述目标语句对应的识别意图,并通过所述目标语句的识别意图在所述分类规则库中确定相似语句;生成模块,用于将所述相似语句输入到预置的预测答复模型中,根据所述预置的答复模型中的答复语料生成所述相似语句对应的标准回答,并将所述标准回答显示在所述医疗查询系统上。
可选的,在本发明第二方面的第一种实现方式中,所述分类模块具体用于:收集用户输入的原始语句,获取业务语句,利用相似度算法计算所述原始语句与所述业务语句之间的基础相关度,所述业务语句为医疗查询系统中常用的疑问句语句;整合所述基础相关度,得到相关度矩阵;通过聚类函数对所述相关度矩阵进行分类,得到划分矩阵;通过所述划分矩阵对相应的原始语句进行划分,得到分组语句,将所述分组语句录入分类规则库中,并将所述分类规则库设置在医疗查询系统中。
可选的,在本发明第二方面的第二种实现方式中,所述抽取模块具体用于:获取所述用户输入至所述医疗查询系统中的查询语句;将所述查询语句输入至所述医疗查询系统中预置的疑问句提取模型中,利用深度学习算法对所述查询语句进行分词处理,得到分词语料;采用提取函数提取所述分词语料中的基础特征,计算所述基础特征与分类特征之间的基础相似度,所述分类特征用于指示所述业务语句中疑问句句式特征;若所述基础相似度的数值大于或等于标准分类阈值,则确定对应的查询语句为疑问句语句,并将所述对应的查询语句确定为目标语句。
可选的,在本发明第二方面的第三种实现方式中,所述确定模块包括:断句单元,用于将目标语句输入至预置的意图识别模型中,利用所述预置的意图识别模型中的序列函数对所述目标语句进行断句,得到分段语料;确定单元,用于提取所述分段语料中的分段词向量,并计算所述分段词向量与分组语句中的分组词向量之间的基础匹配率,根据所述基础匹配率的数值确定目标语句的识别意图,通过所述识别意图在所述分类规则库中确定相似语句,所述分组词向量是设置在所述分类规则库中的,且每个分组语句对应一个标准意图。
可选的,在本发明第二方面的第四种实现方式中,所述确定单元具体用于:提取所述分段语料中的分段词向量,并计算所述分段词向量与所述分组语句中的分组词向量之间的基础匹配率,所述分组词向量是设置在所述分类规则库中的,且每个分组语句对应一个标准意图;在所述基础匹配率中选取数值最大的目标匹配率,将计算所述目标匹配率的分组词向量对应的标准意图作为所述目标语句的识别意图,并将所述识别意图对应的分组语句确定为相似语句。
可选的,在本发明第二方面的第五种实现方式中,所述生成模块具体用于:将所述相似语句输入到预置的预测答复模型中,在所述预置的答复模型中对所述相似语句进行处理,得到所述相似语句的相似语料,所述预置的答复模型中包括答复语料;利用第一计算公式计算相似语料的最大化似然估计,所述第一计算公式为:
Figure BDA0002659569030000051
其中,L1(U)为相似语句中相似语料的最大似然估计,U为相似语料的集合,ui为第i个相似语料,i为正整数,ui-k为第i-k个相似语料,k为正整数且k=i-1,θ为分布参数;采用第二计算公式预测相似语料的初始回答,所述第二计算公式为:
Figure BDA0002659569030000052
其中,L2(C)为相似语句中相似语料的初始回答,C为预置的答复模型中答复语料的标签集合,x1为第一个序列的答复语料,xm为第m个序列的答复语料,m为预置的答复模型中答复语料的个数,且m为正整数,y为答复语料的标签;利用融合公式将所述相似语料的最大化似然估计与所述相似语料的初始回答进行融合,确定所述相似语句的标准答案,并将所述标准答案显示在所述医疗查询系统上,所述融合公式为:L3(C')=L2(C)+λL1(U),其中,L3(C')为相似语句的标准答案,L2(C)为相似语料的初始回答,L1(U)为相似语料的最大化似然估计,λ为调整系数。
本发明第三方面提供了一种医疗查询系统的问答管理设备,包括:存储器和至少一个处理器,所述存储器中存储有指令;所述至少一个处理器调用所述存储器中的所述指令,以使得所述医疗查询系统的问答管理设备执行上述的医疗查询系统的问答管理方法。
本发明的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述的医疗查询系统的问答管理方法。
本发明提供的技术方案中,收集用户输入的原始语句,根据聚类函数对所述原始语句进行分类,得到分类规则库,将所述分类规则库设置在医疗查询系统中;获取所述用户输入至所述医疗查询系统中的查询语句,利用预置的疑问句提取模型抽取所述查询语句中的疑问句语句,得到目标语句;采用预置的意图识别模型提取所述目标语句的分段词向量,基于所述分段词向量以及所述分类规则库确定所述目标语句对应的识别意图,并通过所述目标语句的识别意图在所述分类规则库中确定相似语句;将所述相似语句输入到预置的预测答复模型中,根据所述预置的答复模型中的答复语料生成所述相似语句对应的标准回答,并将所述标准回答显示在所述医疗查询系统上。本发明实施例中,通过疑问句提取模型抽取查询语句中疑问句语句,得到目标语句,在针对目标语句对其依次进行断句、词向量的提取、基础置信度的计算准确识别目标语句的意图,并通过预置的答复模型中的答复语料生成目标语句的标准回答,将本方案应用于智慧医疗领域中,提高了利用医疗查询系统进行查询语句查询时,生成标准回答的准确率,从而推动智慧城市的建设。
附图说明
图1为本发明实施例中医疗查询系统的问答管理方法的一个实施例示意图;
图2为本发明实施例中医疗查询系统的问答管理方法的另一个实施例示意图;
图3为本发明实施例中医疗查询系统的问答管理装置的一个实施例示意图;
图4为本发明实施例中医疗查询系统的问答管理装置的另一个实施例示意图;
图5为本发明实施例中医疗查询系统的问答管理设备的一个实施例示意图。
具体实施方式
本发明实施例提供了一种医疗查询系统的问答管理方法、装置、设备及存储介质,通过疑问句提取模型抽取查询语句中疑问句语句,得到目标语句,在针对目标语句对其依次进行断句、词向量的提取、基础置信度的计算准确识别目标语句的意图,并通过预置的答复模型中的答复语料生成目标语句的标准回答,提高了利用医疗查询系统进行查询语句查询时,生成标准回答的准确率。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”或“具有”及其任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
为便于理解,下面对本发明实施例的具体流程进行描述,请参阅图1,本发明实施例中医疗查询系统的问答管理方法的一个实施例包括:
101、收集用户输入的原始语句,根据聚类函数对原始语句进行分类,得到分类规则库,将分类规则库设置在医疗查询系统中;
可以理解的是,本发明的执行主体可以为医疗查询系统的问答管理装置,还可以是终端或者服务器,具体此处不做限定。本发明实施例以服务器为执行主体为例进行说明。
服务器在判断用户输入的查询语句的意图时,由于用户输入的查询语句语句表达形式并不标准,因此在利用医疗查询系统进行查询之前,需要提前收集用户输入的原始语句,对大量的原始语句进行聚类分析,得到统一的分类规则库,这样当医疗查询系统进行查询数据的分析时,可以通过直接在分类规则库中进行比对,完成查询语句的意图识别。需要强调的是,为了进一步保证分类规则库中信息内容的安全性,分类规则库中的信息还可以存储于一区块链的节点中。
需要说明的是,这里的原始语句指的是大量用户在进行查询病情或住院情况时的常用语句,一般的,用户在利用医疗查询系统进行查询时,会利用疑问句句式进行查询,如:得了肺癌怎么办?因此在进行原始语句的收集时,原始语句的句式为疑问句句式。此外,原始语句的数量至少为100句,具体的原始语句的数量可以根据实际情况进行调整,在本申请中,并不对原始语句的数量进行限定。
102、获取用户输入至医疗查询系统中的查询语句,利用预置的疑问句提取模型抽取查询语句中的疑问句语句,得到目标语句;
服务器首先需要获取用户的查询语句,这里的查询语句的句式有很多种,可以为疑问句、陈述句、祈使句等,一般情况下,查询语句的句式为疑问句,因此服务器需要将查询语句中为疑问句的语句提取出来并作为目标语句,服务器将查询语句输入至预置的疑问句提取模型中,即可以完成疑问句语句的提取。需要说明的是,这里的查询语句的数量至少为一句,本申请中并不对查询语句的数量进行限定。
103、采用预置的意图识别模型提取目标语句的分段词向量,基于分段词向量以及分类规则库确定目标语句对应的识别意图,并通过目标语句的识别意图在分类规则库中确定相似语句;
服务器待得到目标语句后,需要利用预置的意图识别模型分析目标语句所表达的意图,只有准确识别到目标语句的识别意图,才能在医疗查询系统中进行标准回答的生成。
需要说明的是,分类规则库中存储有由原始语句进行聚类分析的结果,对原始语句进行分类分组之后,得到多个分组语句,其中,分类规则库中包括每个分组语句的对应的分组词向量及对应的标准意图,在步骤103与步骤104中会利用到分类规则库。
104、将相似语句输入到预置的预测答复模型中,根据预置的答复模型中的答复语料生成相似语句对应的标准回答,并将标准回答显示在医疗查询系统上。
服务器得到目标语句的识别意图后,直接将识别意图输入到预置的预测答复模型中。具体的,预置的答复模型是利用自然语言处理模型GPT-2和医疗查询系统中的问诊对话数据进行深度学习的微调而生成的答复模型,以用户的查询语句作为输入,利用预置的答复模型预测标答复。需要说明的是,预置的答复模型中提前设定有标准意图对应的答复语料,服务器通过一系列的计算,可以生成目标语句的标准回答,再将查询到的标准回答显示在医疗查询系统上,实现通过医疗查询系统回应用户的查询语句的目的。
本发明实施例中,通过疑问句提取模型抽取查询语句中疑问句语句,得到目标语句,在针对目标语句对其依次进行断句、词向量的提取、基础置信度的计算准确识别目标语句的意图,并通过预置的答复模型中的答复语料生成目标语句的标准回答,将本方案应用于智慧医疗领域中,提高了利用医疗查询系统进行查询语句查询时,生成标准回答的准确率,从而推动智慧城市的建设。
请参阅图2,本发明实施例中医疗查询系统的问答管理方法的另一个实施例包括:
201、收集用户输入的原始语句,根据聚类函数对原始语句进行分类,得到分类规则库,将分类规则库设置在医疗查询系统中;
具体的,服务器首先收集用户输入的原始语句,获取业务语句,利用相似度算法计算原始语句与业务语句之间的基础相关度,业务语句为医疗查询系统中常用的疑问句语句;其次服务器整合基础相关度,得到相关度矩阵;然后服务器通过聚类函数对相关度矩阵进行分类,得到划分矩阵;最后服务器通过划分矩阵对相应的原始语句进行划分,得到分组语句,将分组语句录入分类规则库中,并将分类规则库设置在医疗查询系统中。
服务器在收集完用户输入的原始语句之后,需要获取医疗场景下的业务语句,这里的业务语句指的是带有医疗场景词汇的规范疑问句,例如:用户输入的偏口语化的原始语句为:得了早期肺癌咋整?或有早期肺癌怎么弄?而对应规范的业务语句为:患有早期肺癌病症怎么办?服务器进一步计算原始语句与业务语句之间的基础相关度,以确认原始语句对应的标准业务语句。
需要说明的是,可能存在多个原始语句对应同一个业务语句,因此服务器需要利用聚类函数对原始语句进行分类。这里利用到聚类函数对多个相关度矩阵进行分类,聚类就是将数据集中的样本划分为若干个互不相交的子集,每个子集称为一个簇。通过这样的划分,每个簇可能对应于一些不同的类别,k值聚类函数基本思想是按照距离将样本聚成不同的簇,对于点来说:两个点的距离越近,其相似度就越大,以得到紧凑且独立的簇作为聚类目标。以聚类多个数据点为例:首先服务器在数据点集D中随机的选择k个对象(数据点),1<k<n,n为数据点集D中数据点的个数,每个对象代表一个簇的初始均值或中心;其次服务器计算剩余每个对象与各簇的初始均值的欧式距离,并将该对象分配至欧式距离的数值最小所对应的簇中,然后对于每个簇,服务器利用k-均值算法迭代改善内变差,通过上次迭代分配到该簇的对象计算每个簇新的均值;之后使用更新的均值作为新的簇中心,重新分配剩余对象;最后服务器继续迭代,直到分配稳定。
在聚类分类以后通过聚类分类得到的划分矩阵对原始语句进行划分,也就是说将划分矩阵内存在的多个相关度矩阵所对应的多个原始语句确定为同一分类下的分组语句,这样便得到了多个分组语句,服务器将多个分组语句记录至分类规则库中,并将分类规则库设置在医疗查询系统中,即完成了对原始语句的整合。需要强调的是,为了进一步保证分类规则库中信息内容的安全性,分类规则库中的信息还可以存储于一区块链的节点中。
202、获取用户输入至医疗查询系统中的查询语句,利用预置的疑问句提取模型抽取查询语句中的疑问句语句,得到目标语句;
具体的,服务器首先获取用户输入至医疗查询系统中的查询语句;其次服务器将查询语句输入至医疗查询系统中预置的疑问句提取模型中,利用深度学习算法对查询语句进行分词处理,得到分词语料;然后服务器采用提取函数提取分词语料中的基础特征,计算基础特征与分类特征之间的基础相似度,分类特征用于指示业务语句中疑问句句式特征;若基础相似度的数值大于或等于标准分类阈值,则最后服务器确定对应的查询语句为疑问句语句,并将对应的查询语句确定为目标语句。
服务器首先需要获取用户的查询语句,这里的查询语句的句式有很多种,可以为疑问句、陈述句、祈使句等,一般情况下,查询语句的句式为疑问句,因此服务器需要将查询语句中为疑问句的语句提取出来并作为目标语句,服务器将查询语句输入至预置的疑问句提取模型中,即可以完成疑问句语句的提取。需要说明的是,这里的查询语句的数量至少为一句,本申请中并不对查询语句的数量进行限定。
这里采用深度学习算法对查询语句进行分词处理,深度学习算法对查询语句进行分词处理的原理就是在查询语句中对字符进行标注,通过机器学习算法训练分类器对查询语句进行分词,在进行分词是往往利用到预置的标准分词词典,通过该方法可以将查询语句进行分词处理,得到分词语料。该分词处理方法为本领域常用技术手段,因此并不在此赘述。
待得到分词语料后,服务器提取分词语料中的基础特征,并计算基础特征与分类特征之间的基础相似度,可以理解的是,这里的分类特征指的是业务语句中的业务语句中疑问句句式的特征,若分词语料的基础特征与业务语料的分类特征之间的基础相似度的数值大于或等于标准分类阈值时,则确定该查询语句为疑问句语句,并将其确定为目标语句。
203、将目标语句输入至预置的意图识别模型中,利用预置的意图识别模型中的序列函数对目标语句进行断句,得到分段语料;
服务器待得到目标语句后,需要利用预置的意图识别模型分析目标语句所表达的意图,服务器将目标语句输入至预置的意图识别模型中,首先利用序列函数对目标语句进行断句,这里的断句即是在目标语句中定位分隔符的位置,通过分割分隔符两侧,实现对目标语句进行断句的目的,得到分段语料。可以理解的是,若目标语句中不存在分隔符或分隔符的位置设置在目标语句的末尾,则分段语料的数量仅为一个,即分段语料的数量至少为一个,在本申请中,并不对分段语料的数量进行限定。在此之后,服务器提取分段语料中的分段词向量,计算分段词向量与分组语句中的分组词向量之间的基础匹配率,由此确定目标语句对应的识别意图。
204、提取分段语料中的分段词向量,并计算分段词向量与分组语句中的分组词向量之间的基础匹配率,根据基础匹配率的数值确定目标语句的识别意图,通过识别意图在分类规则库中确定相似语句,分组词向量是设置在分类规则库中的,且每个分组语句对应一个标准意图;
具体的,服务器提取分段语料中的分段词向量,并计算分段词向量与分组语句中的分组词向量之间的基础匹配率,分组词向量是设置在分类规则库中的,且每个分组语句对应一个标准意图;服务器在基础匹配率中选取数值最大的目标匹配率,将计算目标匹配率的分组词向量对应的标准意图作为目标语句的识别意图,并将识别意图对应的分组语句确定为相似语句。
服务器计算分段词向量与分组词向量之间的基础匹配率,需要说明的是,分组词向量是提前设置在预置的分类规则库中的,分组词向量一般为医疗场景下的词向量,例如:癌症、糖尿病、住院等,且在预置的分类规则库中,一个分组语句中的分组词向量至少为一个,但每个分组语句仅对应一个标准意图,如:分组语句为:我妈妈感冒了怎么办?分组词向量为:我、妈妈、感冒,分组语句对应的意图为问病症解决办法。
需要说明的是,在分类规则库中,每个业务语句对应一个标准意图,标准意图用于指示业务语句的真实表达含义,如:业务语句为:感冒是怎么引起的?肺癌是怎么引起的?对应的标准意图均为:查询病因。
因此在计算基础匹配率时,依次将分段词向量与每个分组语句中的分组词向量进行基础匹配率的计算,得到的基础匹配率也是多个的,选择一个分组语句中的所有基础匹配率最大的目标匹配率,将计算目标匹配率的分组词向量对应的标准意图作为目标语句的识别意图,并将识别意图对应的分组语句确定为相似语句。这里的相似语句是意图与目标语句的意图相同的语句,但相似语句(业务语句)是已在预置的分类规则库中识别好意图的语句。
205、将相似语句输入到预置的预测答复模型中,根据预置的答复模型中的答复语料生成相似语句对应的标准回答,并将标准回答显示在医疗查询系统上。
具体的,服务器首先将相似语句输入到预置的预测答复模型中,在预置的答复模型中对相似语句进行处理,得到相似语句的相似语料,预置的答复模型中包括答复语料;其次服务器利用第一计算公式计算相似语料的最大化似然估计,第一计算公式为:
Figure BDA0002659569030000121
其中,L1(U)为相似语句中相似语料的最大似然估计,U为相似语料的集合,ui为第i个相似语料,i为正整数,ui-k为第i-k个相似语料,k为正整数且k=i-1,θ为分布参数;然后服务器采用第二计算公式预测相似语料的初始回答,第二计算公式为:
Figure BDA0002659569030000122
其中,L2(C)为相似语句中相似语料的初始回答,C为预置的答复模型中答复语料的标签集合,x1为第一个序列的答复语料,xm为第m个序列的答复语料,m为预置的答复模型中答复语料的个数,且m为正整数,y为答复语料的标签;最后服务器利用融合公式将相似语料的最大化似然估计与相似语料的初始回答进行融合,确定相似语句的标准答案,并将标准答案显示在医疗查询系统上,融合公式为:L3(C')=L2(C)+λL1(U),其中,L3(C')为相似语句的标准答案,L2(C)为相似语料的初始回答,L1(U)为相似语料的最大化似然估计,λ为调整系数。
服务器得到目标语句的相似语句后,直接将相似语句输入到预置的预测答复模型中,具体的,预置的答复模型是利用自然语言处理模型GPT-2和医疗查询系统中的问诊对话数据进行深度学习的微调而生成的答复模型,以用户的查询语句作为输入,利用预置的答复模型预测标答复。需要说明的是,预置的答复模型中提前设定有标准意图对应的答复语料,服务器在预置的答复模型中通过答复语料生成标准回答即可,再将查询到的标准回答显示在预置的医疗查询系统上,实现通过预置的医疗查询系统回应用户的查询语句的目的。
需要说明的是,预置的答复模型中包括答复语料,答复语料为按照一定序列排列的预置语料,预置语料是提前设置在预置的答复模型中的,预置语料记录了原始语句的回答方案;相似语料是相似语句中语料,通过将当前相似语料的查询向量与答复语料的键向量相乘,进而得到答复语料相对于当前相似语料的注意力得分,该注意力得分的分值越高,说明相似语料的标准回答是对应的答复语料的概率越大。相似语料在利用第二计算公式计算时,是通过答复语料的标签进行计算的,答复语料的标签为进行搜索答复语料时用来匹配的对象,服务器在计算过后,得到的是相似语料的初始回答,这里相似语料的初始回答用于指示答复相似语料的真实表征。以在档案柜中查找文件进行说明:相似预料可以理解为一张标记查询内容的便利贴,答复语料的标签可以理解为档案柜中文件夹上贴的标签,当查找到和便利贴上所写相匹配的文件夹时,文件夹里的东西便是相似语料的初始回答。进一步说明的是,服务器可能寻找到的并不是单一的初始回答,而是多个初始回答的混合,因此利用到了融合公式。
本发明实施例中,通过疑问句提取模型抽取查询语句中疑问句语句,得到目标语句,在针对目标语句对其依次进行断句、词向量的提取、基础置信度的计算准确识别目标语句的意图,并通过预置的答复模型中的答复语料生成目标语句的标准回答,将本方案应用于智慧医疗领域中,提高了利用医疗查询系统进行查询语句查询时,生成标准回答的准确率,从而推动智慧城市的建设。
上面对本发明实施例中医疗查询系统的问答管理方法进行了描述,下面对本发明实施例中医疗查询系统的问答管理装置进行描述,请参阅图3,本发明实施例中医疗查询系统的问答管理装置一个实施例包括:
分类模块301,用于收集用户输入的原始语句,根据聚类函数对所述原始语句进行分类,得到分类规则库,将所述分类规则库设置在医疗查询系统中;
抽取模块302,用于获取所述用户输入至所述医疗查询系统中的查询语句,利用预置的疑问句提取模型抽取所述查询语句中的疑问句语句,得到目标语句;
确定模块303,用于采用预置的意图识别模型提取所述目标语句的分段词向量,基于所述分段词向量以及所述分类规则库确定所述目标语句对应的识别意图,并通过所述目标语句的识别意图在所述分类规则库中确定相似语句;
生成模块304,用于将所述相似语句输入到预置的预测答复模型中,根据所述预置的答复模型中的答复语料生成所述相似语句对应的标准回答,并将所述标准回答显示在所述医疗查询系统上。
本发明实施例中,通过疑问句提取模型抽取查询语句中疑问句语句,得到目标语句,在针对目标语句对其依次进行断句、词向量的提取、基础置信度的计算准确识别目标语句的意图,并通过预置的答复模型中的答复语料生成目标语句的标准回答,将本方案应用于智慧医疗领域中,提高了利用医疗查询系统进行查询语句查询时,生成标准回答的准确率,从而推动智慧城市的建设。
请参阅图4,本发明实施例中医疗查询系统的问答管理装置的另一个实施例包括:
分类模块301,用于收集用户输入的原始语句,根据聚类函数对所述原始语句进行分类,得到分类规则库,将所述分类规则库设置在医疗查询系统中;
抽取模块302,用于获取所述用户输入至所述医疗查询系统中的查询语句,利用预置的疑问句提取模型抽取所述查询语句中的疑问句语句,得到目标语句;
确定模块303,用于采用预置的意图识别模型提取所述目标语句的分段词向量,基于所述分段词向量以及所述分类规则库确定所述目标语句对应的识别意图,并通过所述目标语句的识别意图在所述分类规则库中确定相似语句;
生成模块304,用于将所述相似语句输入到预置的预测答复模型中,根据所述预置的答复模型中的答复语料生成所述相似语句对应的标准回答,并将所述标准回答显示在所述医疗查询系统上。
可选的,分类模块301还可以具体用于:
收集用户输入的原始语句,获取业务语句,利用相似度算法计算所述原始语句与所述业务语句之间的基础相关度,所述业务语句为医疗查询系统中常用的疑问句语句;
整合所述基础相关度,得到相关度矩阵;
通过聚类函数对所述相关度矩阵进行分类,得到划分矩阵;
通过所述划分矩阵对相应的原始语句进行划分,得到分组语句,将所述分组语句录入分类规则库中,并将所述分类规则库设置在医疗查询系统中。
可选的,抽取模块302还可以具体用于:
获取所述用户输入至所述医疗查询系统中的查询语句;
将所述查询语句输入至所述医疗查询系统中预置的疑问句提取模型中,利用深度学习算法对所述查询语句进行分词处理,得到分词语料;
采用提取函数提取所述分词语料中的基础特征,计算所述基础特征与分类特征之间的基础相似度,所述分类特征用于指示所述业务语句中疑问句句式特征;
若所述基础相似度的数值大于或等于标准分类阈值,则确定对应的查询语句为疑问句语句,并将所述对应的查询语句确定为目标语句。
可选的,确定模块303包括:
断句单元3031,用于将目标语句输入至预置的意图识别模型中,利用所述预置的意图识别模型中的序列函数对所述目标语句进行断句,得到分段语料;
确定单元3021,用于提取所述分段语料中的分段词向量,并计算所述分段词向量与分组语句中的分组词向量之间的基础匹配率,根据所述基础匹配率的数值确定目标语句的识别意图,通过所述识别意图在所述分类规则库中确定相似语句,所述分组词向量是设置在所述分类规则库中的,且每个分组语句对应一个标准意图。
可选的,确定单元3021还可以具体用于:
提取所述分段语料中的分段词向量,并计算所述分段词向量与所述分组语句中的分组词向量之间的基础匹配率,所述分组词向量是设置在所述分类规则库中的,且每个分组语句对应一个标准意图;
在所述基础匹配率中选取数值最大的目标匹配率,将计算所述目标匹配率的分组词向量对应的标准意图作为所述目标语句的识别意图,并将所述识别意图对应的分组语句确定为相似语句。
可选的,生成模块304还可以具体用于:
将所述相似语句输入到预置的预测答复模型中,在所述预置的答复模型中对所述相似语句进行处理,得到所述相似语句的相似语料,所述预置的答复模型中包括答复语料;
利用第一计算公式计算相似语料的最大化似然估计,所述第一计算公式为:
Figure BDA0002659569030000161
其中,L1(U)为相似语句中相似语料的最大似然估计,U为相似语料的集合,ui为第i个相似语料,i为正整数,ui-k为第i-k个相似语料,k为正整数且k=i-1,θ为分布参数;
采用第二计算公式预测相似语料的初始回答,所述第二计算公式为:
Figure BDA0002659569030000162
其中,L2(C)为相似语句中相似语料的初始回答,C为预置的答复模型中答复语料的标签集合,x1为第一个序列的答复语料,xm为第m个序列的答复语料,m为预置的答复模型中答复语料的个数,且m为正整数,y为答复语料的标签;
利用融合公式将所述相似语料的最大化似然估计与所述相似语料的初始回答进行融合,确定所述相似语句的标准答案,并将所述标准答案显示在所述医疗查询系统上,所述融合公式为:L3(C')=L2(C)+λL1(U),其中,L3(C')为相似语句的标准答案,L2(C)为相似语料的初始回答,L1(U)为相似语料的最大化似然估计,λ为调整系数。
本发明实施例中,通过疑问句提取模型抽取查询语句中疑问句语句,得到目标语句,在针对目标语句对其依次进行断句、词向量的提取、基础置信度的计算准确识别目标语句的意图,并通过预置的答复模型中的答复语料生成目标语句的标准回答,将本方案应用于智慧医疗领域中,提高了利用医疗查询系统进行查询语句查询时,生成标准回答的准确率,从而推动智慧城市的建设。
上面图3和图4从模块化功能实体的角度对本发明实施例中的医疗查询系统的问答管理装置进行详细描述,下面从硬件处理的角度对本发明实施例中医疗查询系统的问答管理设备进行详细描述。
图5是本发明实施例提供的一种医疗查询系统的问答管理设备的结构示意图,该医疗查询系统的问答管理设备500可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processing units,CPU)510(例如,一个或一个以上处理器)和存储器520,一个或一个以上存储应用程序533或数据532的存储介质530(例如一个或一个以上海量存储设备)。其中,存储器520和存储介质530可以是短暂存储或持久存储。存储在存储介质530的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对医疗查询系统的问答管理设备500中的一系列指令操作。更进一步地,处理器510可以设置为与存储介质530通信,在医疗查询系统的问答管理设备500上执行存储介质530中的一系列指令操作。
医疗查询系统的问答管理设备500还可以包括一个或一个以上电源540,一个或一个以上有线或无线网络接口550,一个或一个以上输入输出接口560,和/或,一个或一个以上操作系统531,例如Windows Serve,Mac OS X,Unix,Linux,FreeBSD等等。本领域技术人员可以理解,图5示出的医疗查询系统的问答管理设备结构并不构成对医疗查询系统的问答管理设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
本发明还提供一种医疗查询系统的问答管理设备,所述计算机设备包括存储器和处理器,存储器中存储有计算机可读指令,计算机可读指令被处理器执行时,使得处理器执行上述各实施例中的所述医疗查询系统的问答管理方法的步骤。
进一步地,所述计算机可用存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。
本发明还提供一种计算机可读存储介质,该计算机可读存储介质可以为非易失性计算机可读存储介质,该计算机可读存储介质也可以为易失性计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在计算机上运行时,使得计算机执行所述医疗查询系统的问答管理方法的步骤。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种医疗查询系统的问答管理方法,其特征在于,所述医疗查询系统的问答管理方法包括:
收集用户输入的原始语句,根据聚类函数对所述原始语句进行分类,得到分类规则库,将所述分类规则库设置在医疗查询系统中;
获取所述用户输入至所述医疗查询系统中的查询语句,利用预置的疑问句提取模型抽取所述查询语句中的疑问句语句,得到目标语句;
采用预置的意图识别模型提取所述目标语句的分段词向量,基于所述分段词向量以及所述分类规则库确定所述目标语句对应的识别意图,并通过所述目标语句的识别意图在所述分类规则库中确定相似语句;
将所述相似语句输入到预置的预测答复模型中,根据所述预置的答复模型中的答复语料生成所述相似语句对应的标准回答,并将所述标准回答显示在所述医疗查询系统上。
2.根据权利要求1所述的医疗查询系统的问答管理方法,其特征在于,所述收集用户输入的原始语句,根据聚类函数对所述原始语句进行分类,得到分类规则库,将所述分类规则库设置在医疗查询系统中包括:
收集用户输入的原始语句,获取业务语句,利用相似度算法计算所述原始语句与所述业务语句之间的基础相关度,所述业务语句为医疗查询系统中常用的疑问句语句;
整合所述基础相关度,得到相关度矩阵;
通过聚类函数对所述相关度矩阵进行分类,得到划分矩阵;
通过所述划分矩阵对相应的原始语句进行划分,得到分组语句,将所述分组语句录入分类规则库中,并将所述分类规则库设置在医疗查询系统中。
3.根据权利要求2所述的医疗查询系统的问答管理方法,其特征在于,所述获取所述用户输入至所述医疗查询系统中的查询语句,利用预置的疑问句提取模型抽取所述查询语句中的疑问句语句,得到目标语句包括:
获取所述用户输入至所述医疗查询系统中的查询语句;
将所述查询语句输入至所述医疗查询系统中预置的疑问句提取模型中,利用深度学习算法对所述查询语句进行分词处理,得到分词语料;
采用提取函数提取所述分词语料中的基础特征,计算所述基础特征与分类特征之间的基础相似度,所述分类特征用于指示所述业务语句中疑问句句式特征;
若所述基础相似度的数值大于或等于标准分类阈值,则确定对应的查询语句为疑问句语句,并将所述对应的查询语句确定为目标语句。
4.根据权利要求2所述的医疗查询系统的问答管理方法,其特征在于,所述采用预置的意图识别模型提取所述目标语句的分段词向量,基于所述分段词向量以及所述分类规则库确定所述目标语句对应的识别意图,并通过所述目标语句的识别意图在所述分类规则库中确定相似语句包括:
将目标语句输入至预置的意图识别模型中,利用所述预置的意图识别模型中的序列函数对所述目标语句进行断句,得到分段语料;
提取所述分段语料中的分段词向量,并计算所述分段词向量与分组语句中的分组词向量之间的基础匹配率,根据所述基础匹配率的数值确定目标语句的识别意图,通过所述识别意图在所述分类规则库中确定相似语句,所述分组词向量是设置在所述分类规则库中的,且每个分组语句对应一个标准意图。
5.根据权利要求4所述的医疗查询系统的问答管理方法,其特征在于,所述提取所述分段语料中的分段词向量,并计算所述分段词向量与分组语句中的分组词向量之间的基础匹配率,根据所述基础匹配率的数值确定目标语句的识别意图,通过所述识别意图在所述分类规则库中确定相似语句,所述分组词向量是设置在所述分类规则库中的,且每个分组语句对应一个标准意图包括:
提取所述分段语料中的分段词向量,并计算所述分段词向量与所述分组语句中的分组词向量之间的基础匹配率,所述分组词向量是设置在所述分类规则库中的,且每个分组语句对应一个标准意图;
在所述基础匹配率中选取数值最大的目标匹配率,将计算所述目标匹配率的分组词向量对应的标准意图作为所述目标语句的识别意图,并将所述识别意图对应的分组语句确定为相似语句。
6.根据权利要求1-5中任一项所述的医疗查询系统的问答管理方法,其特征在于,所述将所述相似语句输入到预置的预测答复模型中,根据所述预置的答复模型中的答复语料生成所述相似语句对应的标准回答,并将所述标准回答显示在所述医疗查询系统上包括:
将所述相似语句输入到预置的预测答复模型中,在所述预置的答复模型中对所述相似语句进行处理,得到所述相似语句的相似语料,所述预置的答复模型中包括答复语料;
利用第一计算公式计算相似语料的最大化似然估计,所述第一计算公式为:
Figure FDA0002659569020000031
其中,L1(U)为相似语句中相似语料的最大似然估计,U为相似语料的集合,ui为第i个相似语料,i为正整数,ui-k为第i-k个相似语料,k为正整数且k=i-1,θ为分布参数;
采用第二计算公式预测相似语料的初始回答,所述第二计算公式为:
Figure FDA0002659569020000032
其中,L2(C)为相似语句中相似语料的初始回答,C为预置的答复模型中答复语料的标签集合,x1为第一个序列的答复语料,xm为第m个序列的答复语料,m为预置的答复模型中答复语料的个数,且m为正整数,y为答复语料的标签;
利用融合公式将所述相似语料的最大化似然估计与所述相似语料的初始回答进行融合,确定所述相似语句的标准答案,并将所述标准答案显示在所述医疗查询系统上,所述融合公式为:L3(C')=L2(C)+λL1(U),其中,L3(C')为相似语句的标准答案,L2(C)为相似语料的初始回答,L1(U)为相似语料的最大化似然估计,λ为调整系数。
7.一种医疗查询系统的问答管理装置,其特征在于,所述医疗查询系统的问答管理装置包括:
分类模块,用于收集用户输入的原始语句,根据聚类函数对所述原始语句进行分类,得到分类规则库,将所述分类规则库设置在医疗查询系统中;
抽取模块,用于获取所述用户输入至所述医疗查询系统中的查询语句,利用预置的疑问句提取模型抽取所述查询语句中的疑问句语句,得到目标语句;
确定模块,用于采用预置的意图识别模型提取所述目标语句的分段词向量,基于所述分段词向量以及所述分类规则库确定所述目标语句对应的识别意图,并通过所述目标语句的识别意图在所述分类规则库中确定相似语句;
生成模块,用于将所述相似语句输入到预置的预测答复模型中,根据所述预置的答复模型中的答复语料生成所述相似语句对应的标准回答,并将所述标准回答显示在所述医疗查询系统上。
8.根据权利要求7所述的医疗查询系统的问答管理装置,其特征在于,所述分类模块具体用于:
收集用户输入的原始语句,获取业务语句,利用相似度算法计算所述原始语句与所述业务语句之间的基础相关度,所述业务语句为医疗查询系统中常用的疑问句语句;
整合所述基础相关度,得到相关度矩阵;
通过聚类函数对所述相关度矩阵进行分类,得到划分矩阵;
通过所述划分矩阵对相应的原始语句进行划分,得到分组语句,将所述分组语句录入分类规则库中,并将所述分类规则库设置在医疗查询系统中。
9.一种医疗查询系统的问答管理设备,其特征在于,所述医疗查询系统的问答管理设备包括:存储器和至少一个处理器,所述存储器中存储有指令;
所述至少一个处理器调用所述存储器中的所述指令,以使得所述医疗查询系统的问答管理设备执行如权利要求1-6中任意一项所述的医疗查询系统的问答管理方法。
10.一种计算机可读存储介质,所述计算机可读存储介质上存储有指令,其特征在于,所述指令被处理器执行时实现如权利要求1-6中任一项所述医疗查询系统的问答管理方法。
CN202010900018.2A 2020-08-31 2020-08-31 医疗查询系统的问答管理方法、装置、设备及存储介质 Active CN112035620B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010900018.2A CN112035620B (zh) 2020-08-31 2020-08-31 医疗查询系统的问答管理方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010900018.2A CN112035620B (zh) 2020-08-31 2020-08-31 医疗查询系统的问答管理方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN112035620A true CN112035620A (zh) 2020-12-04
CN112035620B CN112035620B (zh) 2023-02-14

Family

ID=73586634

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010900018.2A Active CN112035620B (zh) 2020-08-31 2020-08-31 医疗查询系统的问答管理方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN112035620B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113407697A (zh) * 2021-06-28 2021-09-17 李蕊男 深度百科学习的中文医疗问句分类系统
CN113450902A (zh) * 2021-06-24 2021-09-28 湖南创星科技股份有限公司 一种基于hl7消息机制的医疗互联互通方法及系统
CN113779964A (zh) * 2021-09-02 2021-12-10 中联国智科技管理(北京)有限公司 一种语句分割方法及装置
CN115964471A (zh) * 2023-03-16 2023-04-14 成都安哲斯生物医药科技有限公司 医疗数据近似查询方法
CN116340365A (zh) * 2023-05-17 2023-06-27 北京创新乐知网络技术有限公司 一种缓存数据的匹配方法、匹配装置及终端设备

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090089044A1 (en) * 2006-08-14 2009-04-02 Inquira, Inc. Intent management tool
US20140024008A1 (en) * 2012-07-05 2014-01-23 Kumar R. Sathy Standards-based personalized learning assessments for school and home
US20180174020A1 (en) * 2016-12-21 2018-06-21 Microsoft Technology Licensing, Llc Systems and methods for an emotionally intelligent chat bot
CN108427722A (zh) * 2018-02-09 2018-08-21 卫盈联信息技术(深圳)有限公司 智能交互方法、电子装置及存储介质
CN109635098A (zh) * 2018-12-20 2019-04-16 东软集团股份有限公司 一种智能问答方法、装置、设备及介质
CN110110062A (zh) * 2019-04-30 2019-08-09 贝壳技术有限公司 机器智能问答方法、装置与电子设备
CN111177186A (zh) * 2019-12-20 2020-05-19 北京淇瑀信息科技有限公司 基于问题检索的单句意图识别方法、装置和系统
CN111444324A (zh) * 2020-03-05 2020-07-24 中国平安人寿保险股份有限公司 基于断句的多意图识别方法、装置、设备及存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090089044A1 (en) * 2006-08-14 2009-04-02 Inquira, Inc. Intent management tool
US20140024008A1 (en) * 2012-07-05 2014-01-23 Kumar R. Sathy Standards-based personalized learning assessments for school and home
US20180174020A1 (en) * 2016-12-21 2018-06-21 Microsoft Technology Licensing, Llc Systems and methods for an emotionally intelligent chat bot
CN108427722A (zh) * 2018-02-09 2018-08-21 卫盈联信息技术(深圳)有限公司 智能交互方法、电子装置及存储介质
CN109635098A (zh) * 2018-12-20 2019-04-16 东软集团股份有限公司 一种智能问答方法、装置、设备及介质
CN110110062A (zh) * 2019-04-30 2019-08-09 贝壳技术有限公司 机器智能问答方法、装置与电子设备
CN111177186A (zh) * 2019-12-20 2020-05-19 北京淇瑀信息科技有限公司 基于问题检索的单句意图识别方法、装置和系统
CN111444324A (zh) * 2020-03-05 2020-07-24 中国平安人寿保险股份有限公司 基于断句的多意图识别方法、装置、设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
刘家骅 等: "基于多篇章多答案的阅读理解系统", 《中文信息学报》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113450902A (zh) * 2021-06-24 2021-09-28 湖南创星科技股份有限公司 一种基于hl7消息机制的医疗互联互通方法及系统
CN113450902B (zh) * 2021-06-24 2022-05-27 湖南创星科技股份有限公司 一种基于hl7消息机制的医疗互联互通方法及系统
CN113407697A (zh) * 2021-06-28 2021-09-17 李蕊男 深度百科学习的中文医疗问句分类系统
CN113779964A (zh) * 2021-09-02 2021-12-10 中联国智科技管理(北京)有限公司 一种语句分割方法及装置
CN115964471A (zh) * 2023-03-16 2023-04-14 成都安哲斯生物医药科技有限公司 医疗数据近似查询方法
CN116340365A (zh) * 2023-05-17 2023-06-27 北京创新乐知网络技术有限公司 一种缓存数据的匹配方法、匹配装置及终端设备
CN116340365B (zh) * 2023-05-17 2023-09-08 北京创新乐知网络技术有限公司 一种缓存数据的匹配方法、匹配装置及终端设备

Also Published As

Publication number Publication date
CN112035620B (zh) 2023-02-14

Similar Documents

Publication Publication Date Title
CN112035620B (zh) 医疗查询系统的问答管理方法、装置、设备及存储介质
CN108804641B (zh) 一种文本相似度的计算方法、装置、设备和存储介质
CN107085585B (zh) 用于图像搜索的准确的标签相关性预测
EP3982275A1 (en) Image processing method and apparatus, and computer device
CN111400493A (zh) 基于槽位相似度的文本匹配方法、装置、设备及存储介质
CN111241839B (zh) 实体识别方法、装置、计算机可读存储介质和计算机设备
WO2020114100A1 (zh) 一种信息处理方法、装置和计算机存储介质
CN109189892B (zh) 一种基于文章评论的推荐方法及装置
CN111986792A (zh) 医疗机构评分方法、装置、设备及存储介质
CN113934830A (zh) 文本检索模型训练、问答检索方法、装置、设备及介质
CN113656547B (zh) 文本匹配方法、装置、设备及存储介质
CN110825894A (zh) 数据索引建立、数据检索方法、装置、设备和存储介质
CN112131876A (zh) 一种基于相似度确定标准问题的方法及系统
CN112528022A (zh) 主题类别对应的特征词提取和文本主题类别识别方法
CN115688760A (zh) 一种智能化导诊方法、装置、设备及存储介质
CN113486664A (zh) 文本数据可视化分析方法、装置、设备及存储介质
JP2002183171A (ja) 文書データ・クラスタリングシステム
CN115222443A (zh) 客户群体划分方法、装置、设备及存储介质
CN115168590A (zh) 文本特征提取方法、模型训练方法、装置、设备及介质
EP3114585A1 (en) Cross indexing with grouplets
Pengcheng et al. Fast Chinese calligraphic character recognition with large-scale data
CN116663536B (zh) 一种临床诊断标准词的匹配方法及装置
CN113569018A (zh) 问答对挖掘方法及装置
JP2016110256A (ja) 情報処理装置及び情報処理プログラム
CN113627186B (zh) 基于人工智能的实体关系检测方法及相关设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant