CN116595994A - 基于提示学习的矛盾信息预测方法、装置、设备及介质 - Google Patents
基于提示学习的矛盾信息预测方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN116595994A CN116595994A CN202310589069.1A CN202310589069A CN116595994A CN 116595994 A CN116595994 A CN 116595994A CN 202310589069 A CN202310589069 A CN 202310589069A CN 116595994 A CN116595994 A CN 116595994A
- Authority
- CN
- China
- Prior art keywords
- statement
- contradiction
- dialogue
- sentences
- contradictory
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 230000008094 contradictory effect Effects 0.000 title claims description 128
- 208000024891 symptom Diseases 0.000 claims abstract description 13
- 238000012549 training Methods 0.000 claims description 85
- 239000013598 vector Substances 0.000 claims description 50
- 238000004590 computer program Methods 0.000 claims description 15
- 238000004364 calculation method Methods 0.000 claims description 12
- 238000012937 correction Methods 0.000 claims description 8
- 238000010586 diagram Methods 0.000 description 12
- 208000011580 syndromic disease Diseases 0.000 description 10
- 206010036790 Productive cough Diseases 0.000 description 4
- 201000010099 disease Diseases 0.000 description 4
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 239000003814 drug Substances 0.000 description 3
- 230000002969 morbid Effects 0.000 description 3
- 208000024794 sputum Diseases 0.000 description 3
- 210000003802 sputum Anatomy 0.000 description 3
- 206010011224 Cough Diseases 0.000 description 2
- 208000024753 bloody sputum Diseases 0.000 description 2
- 230000004069 differentiation Effects 0.000 description 2
- 230000001717 pathogenic effect Effects 0.000 description 2
- 206010062717 Increased upper airway secretion Diseases 0.000 description 1
- 206010037660 Pyrexia Diseases 0.000 description 1
- 208000032023 Signs and Symptoms Diseases 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000003902 lesion Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000001575 pathological effect Effects 0.000 description 1
- 208000026435 phlegm Diseases 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
- G06F40/35—Discourse or dialogue representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H80/00—ICT specially adapted for facilitating communication between medical practitioners or patients, e.g. for collaborative diagnosis, therapy or health monitoring
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Medical Informatics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Probability & Statistics with Applications (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Biomedical Technology (AREA)
- Pathology (AREA)
- Epidemiology (AREA)
- Primary Health Care (AREA)
- Public Health (AREA)
- Machine Translation (AREA)
Abstract
本申请提供一种基于提示学习的矛盾信息预测方法、装置、设备及介质,该方法通过预测模型,将患者问诊对话语句中的当前判别语句和历史对话记录中各语句进行对比判断,计算当前判别语句与各历史对话语句之间的矛盾概率值,从而判断当前判别语句与历史对话记录是否存在矛盾,在存在矛盾概率值大于预设概率阈值时,则可以判别当前判别语句与历史对话记录存在矛盾,即患者对话语句中存在症状描述前后矛盾的症状语句。由此,可以实现对患者问诊对话的当前判别语句和历史对话记录中所有记录语句的矛盾判别,适用于任意问诊对话场景,从而使得语句判别的覆盖率更加广泛,提高机器人对话系统对于矛盾信息的判别精准度。
Description
技术领域
本申请涉及数字医疗领域,尤其涉及一种基于提示学习的矛盾信息预测方法、装置、设备及介质。
背景技术
在智慧中医领域,机器人辅助问诊是比较常见的一种业务场景,机器人通过和患者对话,代替人工专家收集患者信息。在会话过程中及时识别患者提供的信息是否自相矛盾是决定系统智能性和能否完成问诊任务的关键一步。
目前判断对话信息是否自相矛盾的方法完全是基于规则,通过人工专家提前构建矛盾规则表,在会话中,如果患者提供的信息整好匹配到规则表中的某条规则,则认定存在矛盾。基于规则的方法一方面需要专家投入大量的人力资源来编制规则,另一方面,当规则不能覆盖到某种问诊场景时则判断失效,无法判别对话是否存在矛盾,使得机器人对话系统对于矛盾话语的判别精确度降低。
因此,如何解决目前人机对话中的矛盾信息的判别精准度低成为了亟待解决的技术问题。
发明内容
本申请提供了一种基于提示学习的矛盾信息预测方法、装置、设备及介质,旨在提高机器人对话系统对于矛盾信息的判别精准度。
第一方面,本申请提供一种基于提示学习的矛盾信息预测方法,所述基于提示学习的矛盾信息预测方法包括以下步骤:
获取历史对话记录和至少一个当前判别语句;
基于预测模型,遍历所述历史对话记录,计算所述当前判别语句与所述历史对话记录中各语句的矛盾概率值;
在所述矛盾概率值大于预设概率阈值时,则确定所述当前判别语句与所述历史对话记录矛盾。
第二方面,本申请还提供一种基于提示学习的矛盾信息预测装置,所述基于提示学习的矛盾信息预测装置包括:
数据获取模块,用于获取历史对话记录和至少一个当前判别语句;
矛盾概率值计算模块,用于基于预测模型,遍历所述历史对话记录,计算所述当前判别语句与所述历史对话记录中各语句的矛盾概率值;
矛盾语句判别模块,用于在所述矛盾概率值大于预设概率阈值时,则确定所述当前判别语句与所述历史对话记录矛盾。
第三方面,本申请还提供一种计算机设备,所述计算机设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的计算机程序,其中所述计算机程序被所述处理器执行时,实现如上述的基于提示学习的矛盾信息预测方法的步骤。
第四方面,本申请还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其中所述计算机程序被处理器执行时,实现如上述的基于提示学习的矛盾信息预测方法的步骤。
本申请提供一种基于提示学习的矛盾信息预测方法、装置、设备及介质,本申请方法获取历史对话记录和至少一个当前判别语句;基于预测模型,遍历所述历史对话记录,计算所述当前判别语句与所述历史对话记录中各语句的矛盾概率值;在所述矛盾概率值大于预设概率阈值时,则确定所述当前判别语句与所述历史对话记录矛盾。通过上述方式,通过预测模型,将患者问诊对话语句中的当前判别语句和历史对话记录中各语句进行对比判断,计算当前判别语句与各历史对话语句之间的矛盾概率值,从而判断当前判别语句与历史对话记录是否存在矛盾,在存在矛盾概率值大于预设概率阈值时,则可以判别当前判别语句与历史对话记录存在矛盾,即患者对话语句中存在症状描述前后矛盾的症状语句。由此,可以实现对患者问诊对话的当前判别语句和历史对话记录中所有记录语句的矛盾判别,适用于任意问诊对话场景,从而使得语句判别的覆盖率更加广泛,提高机器人对话系统对于矛盾信息的判别精准度。
附图说明
为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请的实施例提供的一种基于提示学习的矛盾信息预测系统;
图2为本申请实施例提供的一种基于提示学习的矛盾信息预测方法第一实施例的流程示意图;
图3为本申请实施例提供的一种基于提示学习的矛盾信息预测方法第二实施例的流程示意图;
图4为本申请实施例提供的一种预测模型结构示意图;
图5为本申请实施例提供的一种预测模型输入层中的连续型提示参数结构示意图;
图6为本申请实施例提供的一种基于提示学习的矛盾信息预测方法第三实施例的流程示意图;
图7是本申请提供的一种基于提示学习的矛盾信息预测装置第一实施例的结构示意图;
图8是本申请实施例提供的一种计算机设备的结构示意性框图。
本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
附图中所示的流程图仅是示例说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解、组合或部分合并,因此实际执行的顺序有可能根据实际情况改变。
下面结合附图,对本申请的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。
本申请的实施例提供了一种基于提示学习的矛盾信息预测方法、装置、设备及存储介质,用于实现对当前判别语句和历史对话记录中所有记录语句的矛盾判别,适用于不同对话语义矛盾判别场景,从而使得语句判别的覆盖率更加广泛,提高机器人对话系统对于矛盾信息的判别精准度。
如图1所示,图1为本申请的实施例提供的一种基于提示学习的矛盾信息预测系统,该系统包括终端和服务器,所述终端和服务器通信连接。
其中,所述终端包括手机、平板电脑、笔记本电脑、台式电脑、个人数字助理和穿戴式设备等电子设备。
其中,所述服务器包括独立一台服务器,或者服务器集群。
以下,将基于该基于提示学习的矛盾信息预测系统对本申请的实施例提供的基于提示学习的矛盾信息预测方法进行详细介绍。
请参照图2,图2为本申请实施例提供的一种基于提示学习的矛盾信息预测方法第一实施例的流程示意图。该基于提示学习的矛盾信息预测方法可以用于基于提示学习的矛盾信息预测系统的服务器中。
如图2所示,该基于提示学习的矛盾信息预测方法包括步骤S101至步骤S103。
步骤S101、获取历史对话记录和至少一个当前判别语句;
在一实施例中,历史对话记录和当前判别语句可以是实时更新的,历史对话记录可以是用户与机器人的对话记录,当前判别语句可以是用户与机器人的当前对话语句。
比如,问诊对话如下:Robot:你好,请问您那里不舒服?User:我咳嗽好几天了,并带有黄痰。Robot:你有发烧的症状吗?User:没有。Robot:您痰量多吗?User:我不吐痰。
其中,当前判别语句是用户根据机器人系统的提问回答的症状描述语句,患者每一次回答都会作为当前判别语句进行判别,而历史对话记录即为患者在当前问诊中已经完成判别的对话记录。比如,上例中的“我不吐痰”为当前判别语句,而“我不吐痰”之前的问诊对话均为历史对话记录。
在一实施例中,历史对话记录和当前判别语句也可以是已完成对话的对话记录,历史对话记录为完整的对话记录,当前对话语句可以是历史对话记录中任一用户对话语句。
在一实施例中,机器人问诊系统前端可以执行和记录患者的问诊对话记录,然后在完成线上问诊之后,将问诊对话记录提交给后台进行逐句判别。对于用户的每一句对话语句均可以作为当前判别语句,可以与当前判别语句前的语句进行对比判别,也可以与问诊对话记录的所有对话语句进行对比判别。
步骤S102、基于预测模型,遍历所述历史对话记录,计算所述当前判别语句与所述历史对话记录中各语句的矛盾概率值;
本实施例中,通过预测模型,对当前判别语句进行矛盾判别,遍历历史对话记录中所有用户对话语句,从而完成当前判别语句与所有用户对话语句的矛盾判别,通过计算当前语句和历史对话记录中各语句的矛盾概率值进行表示。
在一实施例中,可以计算当前判别语句和历史对话记录中各语句的相似度表示矛盾概率值。
在一实施例中,可以计算当前判别语句与历史对话记录中的整体用户对话语句的矛盾概率值。
在一实施例中,可以根据应用领域的特点灵活调整预测模型的特征提取和比对方法,比如,在中医问诊对话矛盾判别领域,为提高模型识别速率,可以提取对话中的证素进行证素辩证,然后进行矛盾概率计算。证素是通过对证候(症状、体征等病理信息)的辨识而确定的病位和病性,是构成证名的基本要素。证素是根据证候而辨识的病变本质;证素主要指辨证所确定的病位和病性;证素的内容是根据中医学理论而确定的;证素是构成证名的要素;病性证素是对正邪相争的本质概括;证素为具体诊断单元而非分类纲领;证素有一定的组合规则;某些证素间可有重叠涵盖关系。其中,证素可以包括如病位证素(心、神、脑等)和病性证素(如风、寒、暑等)等证素特征。
步骤S103、在所述矛盾概率值大于预设概率阈值时,则确定所述当前判别语句与所述历史对话记录矛盾。
本实施例中,通过对比计算得到的矛盾概率值和预设概率阈值,判断当前判别语句和历史对话记录是否矛盾。
在一实施例中,可以设置矛盾概率阈值,比如85%,在计算得到的矛盾概率值小于该预设概率阈值时,则认为当前判别语句与历史对话记录不矛盾,反之,则认为当前判别语句与历史对话记录矛盾。
在一实施例中,在判别当前判别语句和历史对话记录不矛盾时,可以输出一个标签,比如“0”,在存在矛盾时,可以输出“1”,并标记出当前判别语句和历史对话记录中存在矛盾的语句,便于提醒或者人为二次判别。
本实施例提供了一种基于提示学习的矛盾信息预测方法,本实施例方法包括获取历史对话记录和至少一个当前判别语句;基于预测模型,遍历所述历史对话记录,计算所述当前判别语句与所述历史对话记录中各语句的矛盾概率值;在所述矛盾概率值大于预设概率阈值时,则确定所述当前判别语句与所述历史对话记录矛盾。通过预测模型,将当前判别语句和历史对话记录中各语句进行对比判断,计算当前判别语句与各历史对话语句之间的矛盾概率值,从而判断当前判别语句与历史对话记录是否存在矛盾,在存在矛盾概率值大于预设概率阈值时,则可以判别当前判别语句与历史对话记录存在矛盾,由此,可以实现对当前判别语句和历史对话记录中所有记录语句的矛盾判别,适用于任意对话场景,从而使得语句判别的覆盖率更加广泛,提高机器人对话系统对于矛盾信息的判别精准度。
请参照图3,图3为本申请实施例提供的一种基于提示学习的矛盾信息预测方法第二实施例的流程示意图。
本实施例中,基于上述图2所示实施例,所述步骤S102具体包括:
步骤S201、基于所述预测模型,将所述历史对话记录和所述当前判别语句向量化,获得当前判别向量和至少一个对话数据向量;
本实施例中,预测模型通过将输入数据向量化,在高维空间实现对输入数据的矛盾概率值的计算。
在一实施例中,把历史对话记录和当前判别语句输入预测模型,然后会得到一个句向量,这个句向量有很多处理方式,比如线性链crf或者归一化softmax平均,然后会把它送入一个全连接层,因为是二分类,所以全连接层的输出维度是二维的,然后做参数最大值索引或者归一化处理,然后得到概率最大的那个下标。
步骤S202、计算所述当前判别向量和各所述对话数据向量的矛盾概率值,确定所述当前判别语句与所述历史对话中各语句的矛盾概率值。
本实施例中,预测模型对当前判别向量和对话数据向量进行矛盾概率计算,判断当前判别语句和历史对话记录的矛盾概率,最后输出矛盾概率。
在一实施例中,当前判别向量可以依次与对话数据向量进行矛盾概率计算,也可以与历史对话数据的句向量整体进行矛盾概率计算。
在一实施例中,预测模型可以通过提取句向量中的特征向量进行计算,以减少计算量。
在一实施例中,在进行概率值计算之前,可以通过匹配的模式,搜索历史对话记录对应的各语句中与当前判别语句可能存在矛盾的对话语句,再进行矛盾概率计算。比如“痰中带有血丝”与“我不吐痰”即存在矛盾。
在一实施例中,所述计算所述当前判别向量和各所述对话数据向量的矛盾概率值,确定所述当前判别语句与所述历史对话中各语句的矛盾概率值之后,还包括:
获取至少一个提示参数,并将所述提示参数向量化,获得提示参数向量;
基于所述预设概率阈值,确定各所述矛盾概率值对应的矛盾等级;
基于各所述矛盾等级对应的所述提示参数向量,标记所述历史对话记录中各语句,输出所述历史对话记录中各语句对应的所述提示参数向量,以判别所述当前判别语句与所述历史对话记录中各语句是否矛盾。
在一实施例中,预训练语言模型是预训练一个多层网络结构,用以初始化下游任务模型的多层网络结构,可以同时学到浅层信息和深层信息。预训练语言模型是一种动态的文本表示方法,会根据当前上下文对文本表征进行动态调整,经过调整后的文本表征更能表达词语在该上下文中的具体含义,能有效处理一词多义的问题。比如“咳痰且痰中带血”则表示患者症状包括“咳嗽”、“有痰”以及“痰中带血”。
在一实施例中,如图4所示,图4为本申请实施例提供的一种预测模型结构示意图。其中,预测模型可以由三部分构成:输入层、12层transformer block网络以及顶层2层全连接网络。预测模型最后输出与历史会话矛盾预测概率。
在一实施例中,输入层用于历史对话记录、连续型提示参数和当前判别语句的输入;transformer block网络由12层transformer block构成,用以编码患者与系统(bot)的历史对话记录的文本、提示参数和当前判别语句;全连接网络由2层全连接网络构成,用以进一步融合三部分特征,并输出矛盾预测概率。
在一实施例中,如图5所示,图5为本申请实施例提供的一种预测模型输入层中的连续型提示参数结构示意图。其中,e(*)表示对句子的嵌入表示(embedding)。h_0—h_3是代表4个向量参数,维度和e(*)之后的向量维度相同,没有对应字符。通过训练学习,可以在隐向量空间学到类似“上下文是否存在矛盾”之类语义,在推理阶段,有一种提示或提醒模型的功能,又由于没有对应的字符,直接在向量空间学习,故称作“连续型提示学习”,即“continue prompt learning”。
请参照图6,图6为本申请实施例提供的一种基于提示学习的矛盾信息预测方法第三实施例的流程示意图。
本实施例中,基于上述图2所示实施例,所述步骤S101之前具体还包括:
步骤S301、获取历史问诊对话数据和至少一个目标判别语句;
步骤S302、基于所述历史问诊对话数据,训练预训练模型提取所述历史问诊对话数据中与所述目标判别语句存在矛盾的矛盾语句,获得所述预测模型。
本实施例中,获取至少一组历史问诊对话数据和目标判别语句作为训练数据,对预训练模型进行训练,训练预训练模型对于矛盾语句的判别能力。
在一实施例中,目标判别语句可以是历史问诊对话数据中的任一患者对话语句或者是人为编辑的训练语句。
在一实施例中,目标判别语句可以是与历史问诊对话数据中语句存在矛盾的语句。
在一实施例中,目标判别语句可以是与历史问诊对话数据存在不同矛盾程度的多个判别语句。
在一实施例中,基于上述图6所示实施例,所述步骤S302具体包括:
基于预训练模型,遍历所述历史问诊对话数据,提取所述历史问诊对话数据中与所述目标判别语句存在矛盾的矛盾语句;
基于所述矛盾语句和所述目标判别语句,确定所述预训练模型对于所述矛盾语句的判别准确率;
在所述判别准确率大于预设准确率时,确定所述预训练模型为所述预测模型。
在一实施例中,可以输入与历史问诊对话数据存在矛盾的当前判别语句,在预训练模型完成对矛盾语句的提取之后,对比参考的矛盾语句,即可确定预训练模型对于矛盾语句的判别准确率,在判别准确率达到预设标准时,即可将预训练模型作为预测模型,否则,对预训练模型进行重训练,直至准确率达到预设准确率要求为止。
在一实施例中,在所述判别准确率小于所述预设准确率时,标记所述矛盾语句中的真实矛盾语句和非矛盾语句;基于所述真实矛盾语句、所述非矛盾语句和所述历史问诊对话数据,重新训练所述预训练模型,直至所述预训练模型的判别准确率大于所述预设准确率,确定所述预训练模型为所述预测模型。
在一实施例中,在预训练模型对于矛盾语句的判别准确率小于预设准确率时,比如判别不完全或者判别语句中非矛盾语句较多,此时可以标记历史问诊对话数据中的真实矛盾语句或者标记预训练模型上一次训练提取的矛盾语句中的真实矛盾语句和非矛盾语句,然后对预训练模型重训练,如果重训练的预训练模型判别准确率仍然小于预设准确率,则继续对模型识别语句和历史问诊对话数据进行标记,再对预训练模型进行重训练,直至预训练模型的判别准确率大于预设准确率为止。
在一实施例中,基于上述图6所示实施例,所述步骤S302具体还包括:
基于所述历史问诊对话数据,训练所述预训练模型,提取所述历史问诊对话数据中与所述目标判别语句存在矛盾的矛盾语句;
基于预设纠正模块,标记所述矛盾语句中的真实矛盾语句和非矛盾语句;
基于所述历史问诊对话数据、所述真实矛盾语句和所述非矛盾语句,重新训练所述预训练模型,直至完成预设训练次数,获得所述预测模型。
本实施例中,设置预设纠正模块,通过预设纠正模块,对预训练模型提取的矛盾语句进行判别和标记,标记矛盾语句中的真实矛盾语句和非矛盾语句,再对预训练模型进行重训练,直至完成预设训练次数,此时预训练模型的判别准确率可以达到需求标准,可以作为预测模型。
在一实施例中,可以设置矛盾语句为当前判别语句,并且标记历史问诊对话数据中与当前判别语句矛盾的语句,然后预存至预设纠正模块,便于预设纠正模块对预训练模型识别的矛盾语句的精确标记。
请参阅图7,图7是本申请提供的一种基于提示学习的矛盾信息预测装置第一实施例的结构示意图,该基于提示学习的矛盾信息预测装置用于执行前述的基于提示学习的矛盾信息预测方法。其中,该基于提示学习的矛盾信息预测装置可以配置于服务器中。
如图7所示,该基于提示学习的矛盾信息预测装置300,包括:数据获取模块301、矛盾概率值计算模块302和矛盾语句判别模块303。
数据获取模块301,用于获取历史对话记录和至少一个当前判别语句;
矛盾概率值计算模块302,用于基于预测模型,遍历所述历史对话记录,计算所述当前判别语句与所述历史对话记录中各语句的矛盾概率值;
矛盾语句判别模块303,用于在所述矛盾概率值大于预设概率阈值时,则确定所述当前判别语句与所述历史对话记录矛盾。
在一实施例中,所述矛盾概率值计算模块302,还用于基于所述预测模型,将所述历史对话记录和所述当前判别语句向量化,获得当前判别向量和至少一个对话数据向量;计算所述当前判别向量和各所述对话数据向量的矛盾概率值,确定所述当前判别语句与所述历史对话中各语句的矛盾概率值。
在一实施例中,所述矛盾概率值计算模块302,还用于获取至少一个提示参数,并将所述提示参数向量化,获得提示参数向量;基于所述预设概率阈值,确定各所述矛盾概率值对应的矛盾等级;基于各所述矛盾等级对应的所述提示参数向量,标记所述历史对话记录中各语句,输出所述历史对话记录中各语句对应的所述提示参数向量,以判别所述当前判别语句与所述历史对话记录中各语句是否矛盾。
在一实施例中,所述基于提示学习的矛盾信息预测装置300还包括模型训练模块,用于获取历史问诊对话数据和至少一个目标判别语句;基于所述历史问诊对话数据,训练预训练模型提取所述历史问诊对话数据中与所述目标判别语句存在矛盾的矛盾语句,获得所述预测模型。
在一实施例中,所述模型训练模块,还用于基于预训练模型,遍历所述历史问诊对话数据,提取所述历史问诊对话数据中与所述目标判别语句存在矛盾的矛盾语句;基于所述矛盾语句和所述目标判别语句,确定所述预训练模型对于所述矛盾语句的判别准确率;在所述判别准确率大于预设准确率时,确定所述预训练模型为所述预测模型。
在一实施例中,所述模型训练模块,还用于在所述判别准确率小于所述预设准确率时,标记所述矛盾语句中的真实矛盾语句和非矛盾语句;基于所述真实矛盾语句、所述非矛盾语句和所述历史问诊对话数据,重新训练所述预训练模型,直至所述预训练模型的判别准确率大于所述预设准确率,确定所述预训练模型为所述预测模型。
在一实施例中,所述模型预训练模块,还用于基于所述历史问诊对话数据,训练所述预训练模型,提取所述历史问诊对话数据中与所述目标判别语句存在矛盾的矛盾语句;基于预设纠正模块,标记所述矛盾语句中的真实矛盾语句和非矛盾语句;基于所述历史问诊对话数据、所述真实矛盾语句和所述非矛盾语句,重新训练所述预训练模型,直至完成预设训练次数,获得所述预测模型。
需要说明的是,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的装置和各模块的具体工作过程,可以参考前述基于提示学习的矛盾信息预测方法实施例中的对应过程,在此不再赘述。
上述实施例提供的装置可以实现为一种计算机程序的形式,该计算机程序可以在如图8所示的计算机设备上运行。
请参阅图8,图8是本申请实施例提供的一种计算机设备的结构示意性框图。该计算机设备可以是服务器。
参阅图8,该计算机设备包括通过系统总线连接的处理器、存储器和网络接口,其中,存储器可以包括非易失性存储介质和内存储器。
非易失性存储介质可存储操作系统和计算机程序。该计算机程序包括程序指令,该程序指令被执行时,可使得处理器执行任意一种基于提示学习的矛盾信息预测方法。
处理器用于提供计算和控制能力,支撑整个计算机设备的运行。
内存储器为非易失性存储介质中的计算机程序的运行提供环境,该计算机程序被处理器执行时,可使得处理器执行任意一种基于提示学习的矛盾信息预测方法。
该网络接口用于进行网络通信,如发送分配的任务等。本领域技术人员可以理解,图8中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
应当理解的是,处理器可以是中央处理单元(Central Processing Unit,CPU),该处理器还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
其中,在一个实施例中,所述处理器用于运行存储在存储器中的计算机程序,以实现如下步骤:
获取历史对话记录和至少一个当前判别语句;
基于预测模型,遍历所述历史对话记录,计算所述当前判别语句与所述历史对话记录中各语句的矛盾概率值;
在所述矛盾概率值大于预设概率阈值时,则确定所述当前判别语句与所述历史对话记录矛盾。
在一实施例中,所述处理器在实现所述基于预测模型,遍历所述历史对话记录,计算所述当前判别语句与所述历史对话记录中各语句的矛盾概率值时,用于实现:
基于所述预测模型,将所述历史对话记录和所述当前判别语句向量化,获得当前判别向量和至少一个对话数据向量;
计算所述当前判别向量和各所述对话数据向量的矛盾概率值,确定所述当前判别语句与所述历史对话中各语句的矛盾概率值。
在一实施例中,所述处理器在实现所述计算所述当前判别向量和各所述对话数据向量的矛盾概率值,确定所述当前判别语句与所述历史对话中各语句的矛盾概率值之后,还用于实现:
获取至少一个提示参数,并将所述提示参数向量化,获得提示参数向量;
基于所述预设概率阈值,确定各所述矛盾概率值对应的矛盾等级;
基于各所述矛盾等级对应的所述提示参数向量,标记所述历史对话记录中各语句,输出所述历史对话记录中各语句对应的所述提示参数向量,以判别所述当前判别语句与所述历史对话记录中各语句是否矛盾。
在一实施例中,所述处理器在实现所述基于预测模型,遍历所述历史对话记录,计算所述当前判别语句与所述历史对话记录中各语句的矛盾概率值之前,还用于实现:
获取历史问诊对话数据和至少一个目标判别语句;
基于所述历史问诊对话数据,训练预训练模型提取所述历史问诊对话数据中与所述目标判别语句存在矛盾的矛盾语句,获得所述预测模型。
在一实施例中,所述处理器在实现所述基于所述历史问诊对话数据,训练预训练模型提取所述历史问诊对话数据中与所述目标判别语句存在矛盾的矛盾语句,获得所述预测模型时,用于实现:
基于预训练模型,遍历所述历史问诊对话数据,提取所述历史问诊对话数据中与所述目标判别语句存在矛盾的矛盾语句;
基于所述矛盾语句和所述目标判别语句,确定所述预训练模型对于所述矛盾语句的判别准确率;
在所述判别准确率大于预设准确率时,确定所述预训练模型为所述预测模型。
在一实施例中,所述处理器在实现所述基于所述矛盾语句和所述目标判别语句,确定所述预训练模型对于所述矛盾语句的判别准确率之后,还用于实现:
在所述判别准确率小于所述预设准确率时,标记所述矛盾语句中的真实矛盾语句和非矛盾语句;
基于所述真实矛盾语句、所述非矛盾语句和所述历史问诊对话数据,重新训练所述预训练模型,直至所述预训练模型的判别准确率大于所述预设准确率,确定所述预训练模型为所述预测模型。
在一实施例中,所述处理器在实现所述基于所述历史问诊对话数据,训练预训练模型提取所述历史问诊对话数据中与所述目标判别语句存在矛盾的矛盾语句,获得所述预测模型时,还用于实现:
基于所述历史问诊对话数据,训练所述预训练模型,提取所述历史问诊对话数据中与所述目标判别语句存在矛盾的矛盾语句;
基于预设纠正模块,标记所述矛盾语句中的真实矛盾语句和非矛盾语句;
基于所述历史问诊对话数据、所述真实矛盾语句和所述非矛盾语句,重新训练所述预训练模型,直至完成预设训练次数,获得所述预测模型。
本申请的实施例中还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序中包括程序指令,所述处理器执行所述程序指令,实现本申请实施例提供的任一种基于提示学习的矛盾信息预测方法。
其中,所述计算机可读存储介质可以是前述实施例所述的计算机设备的内部存储单元,例如所述计算机设备的硬盘或内存。所述计算机可读存储介质也可以是所述计算机设备的外部存储设备,例如所述计算机设备上配备的插接式硬盘,智能存储卡(SmartMedia Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种基于提示学习的矛盾信息预测方法,其特征在于,所述方法包括:
获取历史对话记录和至少一个当前判别语句;
基于预测模型,遍历所述历史对话记录,计算所述当前判别语句与所述历史对话记录中各语句的矛盾概率值;
在所述矛盾概率值大于预设概率阈值时,则确定所述当前判别语句与所述历史对话记录矛盾。
2.根据权利要求1所述的症状矛盾识别方法,其特征在于,所述基于预测模型,遍历所述历史对话记录,计算所述当前判别语句与所述历史对话记录中各语句的矛盾概率值,包括:
基于所述预测模型,将所述历史对话记录和所述当前判别语句向量化,获得当前判别向量和至少一个对话数据向量;
计算所述当前判别向量和各所述对话数据向量的矛盾概率值,确定所述当前判别语句与所述历史对话中各语句的矛盾概率值。
3.根据权利要求2所述的症状矛盾识别方法,其特征在于,所述计算所述当前判别向量和各所述对话数据向量的矛盾概率值,确定所述当前判别语句与所述历史对话中各语句的矛盾概率值之后,还包括:
获取至少一个提示参数,并将所述提示参数向量化,获得提示参数向量;
基于所述预设概率阈值,确定各所述矛盾概率值对应的矛盾等级;
基于各所述矛盾等级对应的所述提示参数向量,标记所述历史对话记录中各语句,输出所述历史对话记录中各语句对应的所述提示参数向量,以判别所述当前判别语句与所述历史对话记录中各语句是否矛盾。
4.根据权利要求1所述的症状矛盾识别方法,其特征在于,所述基于预测模型,遍历所述历史对话记录,计算所述当前判别语句与所述历史对话记录中各语句的矛盾概率值之前,还包括:
获取历史问诊对话数据和至少一个目标判别语句;
基于所述历史问诊对话数据,训练预训练模型提取所述历史问诊对话数据中与所述目标判别语句存在矛盾的矛盾语句,获得所述预测模型。
5.根据权利要求4所述的症状矛盾识别方法,其特征在于,所述基于所述历史问诊对话数据,训练预训练模型提取所述历史问诊对话数据中与所述目标判别语句存在矛盾的矛盾语句,获得所述预测模型,包括:
基于预训练模型,遍历所述历史问诊对话数据,提取所述历史问诊对话数据中与所述目标判别语句存在矛盾的矛盾语句;
基于所述矛盾语句和所述目标判别语句,确定所述预训练模型对于所述矛盾语句的判别准确率;
在所述判别准确率大于预设准确率时,确定所述预训练模型为所述预测模型。
6.根据权利要求5所述的症状矛盾识别方法,其特征在于,所述基于所述矛盾语句和所述目标判别语句,确定所述预训练模型对于所述矛盾语句的判别准确率之后,还包括:
在所述判别准确率小于所述预设准确率时,标记所述矛盾语句中的真实矛盾语句和非矛盾语句;
基于所述真实矛盾语句、所述非矛盾语句和所述历史问诊对话数据,重新训练所述预训练模型,直至所述预训练模型的判别准确率大于所述预设准确率,确定所述预训练模型为所述预测模型。
7.根据权利要求4所述的症状矛盾识别方法,其特征在于,所述基于所述历史问诊对话数据,训练预训练模型提取所述历史问诊对话数据中与所述目标判别语句存在矛盾的矛盾语句,获得所述预测模型,还包括:
基于所述历史问诊对话数据,训练所述预训练模型,提取所述历史问诊对话数据中与所述目标判别语句存在矛盾的矛盾语句;
基于预设纠正模块,标记所述矛盾语句中的真实矛盾语句和非矛盾语句;
基于所述历史问诊对话数据、所述真实矛盾语句和所述非矛盾语句,重新训练所述预训练模型,直至完成预设训练次数,获得所述预测模型。
8.一种基于提示学习的矛盾信息预测装置,其特征在于,包括:
数据获取模块,用于获取历史对话记录和至少一个当前判别语句;
矛盾概率值计算模块,用于基于预测模型,遍历所述历史对话记录,计算所述当前判别语句与所述历史对话记录中各语句的矛盾概率值;
矛盾语句判别模块,用于在所述矛盾概率值大于预设概率阈值时,则确定所述当前判别语句与所述历史对话记录矛盾。
9.一种计算机设备,其特征在于,所述计算机设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的计算机程序,其中所述计算机程序被所述处理器执行时,实现如权利要求1至7中任一项所述的基于提示学习的矛盾信息预测方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,其中所述计算机程序被处理器执行时,实现如权利要求1至7中任一项所述的基于提示学习的矛盾信息预测方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310589069.1A CN116595994A (zh) | 2023-05-23 | 2023-05-23 | 基于提示学习的矛盾信息预测方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310589069.1A CN116595994A (zh) | 2023-05-23 | 2023-05-23 | 基于提示学习的矛盾信息预测方法、装置、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116595994A true CN116595994A (zh) | 2023-08-15 |
Family
ID=87604250
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310589069.1A Pending CN116595994A (zh) | 2023-05-23 | 2023-05-23 | 基于提示学习的矛盾信息预测方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116595994A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117576982A (zh) * | 2024-01-16 | 2024-02-20 | 青岛培诺教育科技股份有限公司 | 一种基于ChatGPT的口语训练方法、装置、电子设备及介质 |
-
2023
- 2023-05-23 CN CN202310589069.1A patent/CN116595994A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117576982A (zh) * | 2024-01-16 | 2024-02-20 | 青岛培诺教育科技股份有限公司 | 一种基于ChatGPT的口语训练方法、装置、电子设备及介质 |
CN117576982B (zh) * | 2024-01-16 | 2024-04-02 | 青岛培诺教育科技股份有限公司 | 一种基于ChatGPT的口语训练方法、装置、电子设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2020261234A1 (en) | System and method for sequence labeling using hierarchical capsule based neural network | |
CN111602128A (zh) | 计算机实现的确定方法和系统 | |
CN111259111B (zh) | 基于病历的辅助决策方法、装置、电子设备和存储介质 | |
CN115599901B (zh) | 基于语义提示的机器问答方法、装置、设备及存储介质 | |
WO2023024422A1 (zh) | 基于问诊会话的辅助诊断方法、装置及计算机设备 | |
CN112257449A (zh) | 命名实体识别方法、装置、计算机设备和存储介质 | |
CN113128203A (zh) | 基于注意力机制的关系抽取方法、系统、设备及存储介质 | |
CN112800184B (zh) | 基于Target-Aspect-Opinion联合抽取的短文本评论情感分析方法 | |
CN112613322B (zh) | 文本处理方法、装置、设备及存储介质 | |
CN111984780A (zh) | 多意图识别模型训练方法和多意图识别方法及相关装置 | |
CN115274086B (zh) | 一种智能导诊方法及系统 | |
CN111145903A (zh) | 获取眩晕症问诊文本的方法、装置、电子设备及问诊系统 | |
CN115545041B (zh) | 一种增强医疗语句语义向量表示的模型构造方法及系统 | |
CN111742322A (zh) | 用于使用深度神经网络来进行独立于领域和语言的定义提取的系统和方法 | |
CN113689951A (zh) | 一种智能导诊方法、系统和计算机可读存储介质 | |
CN111180025A (zh) | 表示病历文本向量的方法、装置及问诊系统 | |
CN116595994A (zh) | 基于提示学习的矛盾信息预测方法、装置、设备及介质 | |
CN115964459B (zh) | 基于食品安全认知图谱的多跳推理问答方法及系统 | |
CN114238656A (zh) | 基于强化学习的事理图谱补全方法及其相关设备 | |
CN117877660A (zh) | 基于语音识别的医学报告获取方法及系统 | |
CN112749277A (zh) | 医学数据的处理方法、装置及存储介质 | |
CN115391494B (zh) | 中医症候智能识别方法及装置 | |
CN115114437A (zh) | 基于bert和双分支网络的胃镜文本分类系统 | |
CN114398482A (zh) | 一种词典构造方法、装置、电子设备及存储介质 | |
CN115171870A (zh) | 一种基于m-BERT预训练模型的就诊引导提示方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |