CN116756283A - 基于融合科室的对话问题生成方法及装置、介质、设备 - Google Patents
基于融合科室的对话问题生成方法及装置、介质、设备 Download PDFInfo
- Publication number
- CN116756283A CN116756283A CN202310727547.0A CN202310727547A CN116756283A CN 116756283 A CN116756283 A CN 116756283A CN 202310727547 A CN202310727547 A CN 202310727547A CN 116756283 A CN116756283 A CN 116756283A
- Authority
- CN
- China
- Prior art keywords
- coding
- sub
- model
- description text
- text information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 49
- 230000004927 fusion Effects 0.000 title claims abstract description 22
- 239000013598 vector Substances 0.000 claims abstract description 142
- 208000024891 symptom Diseases 0.000 claims abstract description 119
- 238000012545 processing Methods 0.000 claims abstract description 94
- 238000003058 natural language processing Methods 0.000 claims abstract description 26
- 230000011218 segmentation Effects 0.000 claims description 67
- 238000004891 communication Methods 0.000 claims description 21
- 239000003550 marker Substances 0.000 claims description 14
- 230000008569 process Effects 0.000 claims description 7
- 238000013473 artificial intelligence Methods 0.000 abstract description 10
- 230000000694 effects Effects 0.000 abstract description 8
- 238000005516 engineering process Methods 0.000 description 10
- 239000011159 matrix material Substances 0.000 description 10
- 206010011224 Cough Diseases 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 201000010099 disease Diseases 0.000 description 3
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 3
- 230000010365 information processing Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000000172 allergic effect Effects 0.000 description 1
- 208000010668 atopic eczema Diseases 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012905 input function Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000011022 operating instruction Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H80/00—ICT specially adapted for facilitating communication between medical practitioners or patients, e.g. for collaborative diagnosis, therapy or health monitoring
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Medical Informatics (AREA)
- Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Human Computer Interaction (AREA)
- Biomedical Technology (AREA)
- Databases & Information Systems (AREA)
- Pathology (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Public Health (AREA)
- Machine Translation (AREA)
Abstract
本申请公开了一种基于融合科室的对话问题生成方法及装置、介质、设备,本申请涉及人工智能技术领域以及医疗领域,主要目的在于改善现有由于各个科室之间的问诊逻辑存在差异性,极易导致问诊逻辑混乱,进而降低问诊效果的技术问题。包括:接收目标用户的基本信息以及症状描述文本信息;基于预设编码模型对基本信息以及症状描述文本信息进行编码处理,得到融合了基本信息以及症状描述文本信息的嵌入向量,预设编码模型是基于标记嵌入编码子模型、角色区分编码子模型、相对位置编码子模型以及科室区分编码子模型建立的;基于预设自然语言处理模型对嵌入向量进行下一句预测处理,生成与症状描述文本信息相匹配的下一句对话问题。
Description
技术领域
本申请涉及人工智能技术领域以及医疗领域,特别是涉及一种基于融合科室的对话问题生成方法及装置、介质、设备。
背景技术
作为人口大国,我国的医疗领域普遍存在医疗资源不足的情况,进而导致问诊排队耗时长、问诊难等问题。近年来,随着计算力和数据量的大幅度提升,人工智能技术得到了进一步的发展,应用人工智能解决中国医疗领域问题已成为了热点。
目前,已有采用人工智能辅助医生问诊的先例,当患者来到医疗机构进行就诊时,会首先和医疗机构的智能预问诊系统进行对话沟通,来收集患者的就诊信息,以帮助医生提前梳理患者的患病时间、患病诱因、疾病症状、以及患者的既往病史、过敏史等基本信息,并提醒患者提前做好相关检查,从而缩短患者就医路径,同时减少医生重复性的问诊工作。
然而,由于医疗机构通常情况下会包含多个科室,而各个科室之间的问诊逻辑存在差异性,极易导致智能预问诊系统的问诊逻辑混乱,进而降低问诊效果。
发明内容
有鉴于此,本申请提供一种基于融合科室的对话问题生成方法及装置、介质、设备,主要目的在于改善现有由于各个科室之间的问诊逻辑存在差异性,极易导致问诊逻辑混乱,进而降低问诊效果的技术问题。
依据本申请一个方面,提供了一种基于融合科室的对话问题生成方法,包括:
接收目标用户的基本信息以及症状描述文本信息;
基于预设编码模型对所述基本信息以及所述症状描述文本信息进行编码处理,得到融合了所述基本信息以及所述症状描述文本信息的嵌入向量,所述预设编码模型是基于标记嵌入编码子模型、角色区分编码子模型、相对位置编码子模型以及科室区分编码子模型建立的;
基于预设自然语言处理模型对所述嵌入向量进行下一句预测处理,生成与所述症状描述文本信息相匹配的下一句对话问题。
优选的,所述基于预设编码模型对所述基本信息以及所述症状描述文本信息进行编码处理,得到融合了所述基本信息以及所述症状描述文本信息的嵌入向量,具体包括:
基于所述标记嵌入编码子模型对所述基本信息以及所述症状描述文本信息进行标记嵌入编码处理,生成第一子向量;
基于所述角色区分编码子模型对所述基本信息以及所述症状描述文本信息进行角色区分编码处理,生成第二子向量;
基于所述相对位置编码子模型对所述基本信息以及所述症状描述文本信息进行相对位置编码处理,生成第三子向量;
基于所述科室区分编码子模型对所述基本信息以及所述症状描述文本信息进行科室区分编码处理,生成第四子向量;
将所述第一子向量、所述第二子向量、所述第三子向量以及所述第四子向量进行向量相加处理,生成融合了所述基本信息以及所述症状描述文本信息的嵌入向量。
优选的,所述基于所述标记嵌入编码子模型对所述基本信息以及所述症状描述文本信息进行标记嵌入编码处理,生成第一子向量,具体包括:
对所述基本信息以及所述症状描述文本信息进行切词处理,得到切词结果,所述切词结果中包含多个关键词;
基于预设标记词表对多个所述关键词进行标记嵌入编码处理,得到各个所述关键词的标记嵌入编码标识;
根据所述标记嵌入编码标识生成第一子向量。
优选的,所述基于所述角色区分编码子模型对所述基本信息以及所述症状描述文本信息进行角色区分编码处理,生成第二子向量,具体包括:
对所述基本信息以及所述症状描述文本信息进行切词处理,得到切词结果,所述切词结果中包含多个关键词;
基于预设角色词表对多个所述关键词进行角色区分编码处理,得到各个所述关键词的角色区分编码标识;
根据所述角色区分编码标识生成第二子向量。
优选的,所述基于所述相对位置编码子模型对所述基本信息以及所述症状描述文本信息进行相对位置编码处理,生成第三子向量,具体包括:
从所述基本信息以及所述症状描述文本信息串联后的文本信息的首位字符起,对所述串联后的文本信息所包含的全量字符进行相对位置编码处理,得到第三子向量。
优选的,所述基于所述科室区分编码子模型对所述基本信息以及所述症状描述文本信息进行科室区分编码处理,生成第四子向量,具体包括:
对所述基本信息以及所述症状描述文本信息进行切词处理,得到切词结果,所述切词结果中包含多个关键词;
基于预设科室词表对多个所述关键词进行科室区分编码处理,得到各个所述关键词的科室区分编码标识;
根据所述科室区分编码标识生成第四子向量。
优选的,所述基于预设自然语言处理模型对所述嵌入向量进行下一句预测处理,生成与所述症状描述文本信息相匹配的下一句对话问题,具体包括:
基于所述嵌入向量确定预设解码词表中各个字符的生成概率值,并选取最大概率值所对应的字符作为下一句对话问题所包含的第一字符;
基于所述第一字符以及所述嵌入向量相加后的向量再次确定所述预设解码词表中各个字符的生成概率值,并选取最大概率值所对应的字符作为下一句对话问题所包含的第二字符;
循环生成下一句对话问题所包含的多个字符;
若满足预设循环终止条件,则基于多个所述字符生成下一句对话问题。
依据本申请另一个方面,提供了一种基于融合科室的对话问题生成装置,包括:
接收模块,用于接收目标用户的基本信息以及症状描述文本信息;
编码模块,用于基于预设编码模型对所述基本信息以及所述症状描述文本信息进行编码处理,得到融合了所述基本信息以及所述症状描述文本信息的嵌入向量,所述预设编码模型是基于标记嵌入编码子模型、角色区分编码子模型、相对位置编码子模型以及科室区分编码子模型建立的;
生成模块,用于基于预设自然语言处理模型对所述嵌入向量进行下一句预测处理,生成与所述症状描述文本信息相匹配的下一句对话问题。
优选的,所述编码模块,具体包括:
第一编码单元,用于基于所述标记嵌入编码子模型对所述基本信息以及所述症状描述文本信息进行标记嵌入编码处理,生成第一子向量;
第二编码单元,用于基于所述角色区分编码子模型对所述基本信息以及所述症状描述文本信息进行角色区分编码处理,生成第二子向量;
第三编码单元,用于基于所述相对位置编码子模型对所述基本信息以及所述症状描述文本信息进行相对位置编码处理,生成第三子向量;
第四编码单元,用于基于所述科室区分编码子模型对所述基本信息以及所述症状描述文本信息进行科室区分编码处理,生成第四子向量;
相加单元,用于将所述第一子向量、所述第二子向量、所述第三子向量以及所述第四子向量进行向量相加处理,生成融合了所述基本信息以及所述症状描述文本信息的嵌入向量。
优选的,所述第一编码单元,具体包括:
第一切词子单元,用于对所述基本信息以及所述症状描述文本信息进行切词处理,得到切词结果,所述切词结果中包含多个关键词;
第一编码子单元,用于基于预设标记词表对多个所述关键词进行标记嵌入编码处理,得到各个所述关键词的标记嵌入编码标识;
第一生成子单元,用于根据所述标记嵌入编码标识生成第一子向量。
优选的,所述第二编码单元,具体包括:
第二切词子单元,用于对所述基本信息以及所述症状描述文本信息进行切词处理,得到切词结果,所述切词结果中包含多个关键词;
第二编码子单元,用于基于预设角色词表对多个所述关键词进行角色区分编码处理,得到各个所述关键词的角色区分编码标识;
第二生成子单元,用于根据所述角色区分编码标识生成第二子向量。
优选的,所述第三编码单元,具体用于:
从所述基本信息以及所述症状描述文本信息串联后的文本信息的首位字符起,对所述串联后的文本信息所包含的全量字符进行相对位置编码处理,得到第三子向量。
优选的,所述第四编码单元,具体包括:
第三切词子单元,用于对所述基本信息以及所述症状描述文本信息进行切词处理,得到切词结果,所述切词结果中包含多个关键词;
第三编码子单元,用于基于预设科室词表对多个所述关键词进行科室区分编码处理,得到各个所述关键词的科室区分编码标识;
第三生成子单元,用于根据所述科室区分编码标识生成第四子向量。
优选的,所述生成模块,具体用于:
基于所述嵌入向量确定预设解码词表中各个字符的生成概率值,并选取最大概率值所对应的字符作为下一句对话问题所包含的第一字符;
基于所述第一字符以及所述嵌入向量相加后的向量再次确定所述预设解码词表中各个字符的生成概率值,并选取最大概率值所对应的字符作为下一句对话问题所包含的第二字符;
循环生成下一句对话问题所包含的多个字符;
若满足预设循环终止条件,则基于多个所述字符生成下一句对话问题。
根据本申请的又一方面,提供了一种存储介质,所述存储介质中存储有至少一条可执行指令,所述可执行指令使处理器执行如上述基于融合科室的对话问题生成方法对应的操作。
根据本申请的再一方面,提供了一种计算机设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一条可执行指令,所述可执行指令使所述处理器执行上述基于融合科室的对话问题生成方法对应的操作。
借由上述技术方案,本申请实施例提供的技术方案至少具有下列优点:
本申请提供了一种基于融合科室的对话问题生成方法及装置、介质、设备,首先接收目标用户的基本信息以及症状描述文本信息;其次基于预设编码模型对所述基本信息以及所述症状描述文本信息进行编码处理,得到融合了所述基本信息以及所述症状描述文本信息的嵌入向量,所述预设编码模型是基于标记嵌入编码子模型、角色区分编码子模型、相对位置编码子模型以及科室区分编码子模型建立的;最后基于预设自然语言处理模型对所述嵌入向量进行下一句预测处理,生成与所述症状描述文本信息相匹配的下一句对话问题。与现有技术相比,本申请实施例首先基于标记嵌入编码子模型、角色区分编码子模型、相对位置编码子模型以及科室区分编码子模型建立预设编码模型,并基于该预设编码模型对用户的基本信息以及症状描述文本信息进行编码处理,通过科室区分编码子模型使得该用户的嵌入向量携带科室特征;进一步的,利用预设自然语言处理模型基于该携带科室特征的嵌入向量生成下一句对话问题,通过将问诊范围控制在对应的科室内,从而避免了问诊逻辑混乱的问题,保证了问诊效果。
上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本申请的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本申请实施例提供的一种基于融合科室的对话问题生成方法流程图;
图2示出了本申请实施例提供的信息编码方法流程图;
图3示出了本申请实施例提供的另一种基于融合科室的对话问题生成方法流程图;
图4示出了本申请实施例提供的一种基于融合科室的对话问题生成装置组成框图;
图5示出了本申请实施例提供的一种计算机设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
基于此,在一个实施例中,如图1所示,提供了一种基于融合科室的对话问题生成方法,以该方法应用于服务器等计算机设备为例进行说明,其中,服务器可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器,如智能医疗系统、数字医疗平台等。上述方法包括以下步骤:
101、接收目标用户的基本信息以及症状描述文本信息。
其中,基本信息可以包括但不限于用户的年龄、性别等;症状描述文本信息用于表征用户对自身身体状况的描述信息,例如,“感冒了”、“我咳嗽3天了”等,需要说明的是,该文本信息可以是用户通过文本输入设备(如键盘,手写输入设备等)直接输入的文本信息,也可以是通过具有语音录入功能的设备(如录音设备、摄像头等)对用户的语音信息进行录入,再将语音内容转换为文本信息,本申请实施例不做具体限定。本申请实施例中,当前执行端可以是医疗机构辅助问诊系统,通过接收用户(包括患者或使用该辅助问诊系统的用户)的基本信息以及症状描述信息。
102、基于预设编码模型对基本信息以及症状描述文本信息进行编码处理,得到融合了基本信息以及症状描述文本信息的嵌入向量。
其中,预设编码模型是基于标记嵌入编码子模型、角色区分编码子模型、相对位置编码子模型以及科室区分编码子模型建立的;标记嵌入编码子模型可以用于对语义进行编码;角色区分编码子模型可以用于区分对话的角色,以使等生成的对话问题更加符合对应的角色特征,例如,患者角色、医生角色等;相对位置编码子模型可以用于对文本中的字符进行相对位置进行编码,以学习字符在文本中出现位置不同所表示的不同含义;科室区分编码子模型可以用于对科室信息进行区分,以将问诊范围控制在对应的科室内,从而避免了问诊逻辑混乱的问题,保证了问诊效果。本申请实施例中,基于上述四个子模型对基本信息以及症状描述文本信息分别进行编码处理,得到四个子向量,再将四个子向量进行相加,从而得到携带了四类特征的嵌入向量。
103、基于预设自然语言处理模型对嵌入向量进行下一句预测处理,生成与症状描述文本信息相匹配的下一句对话问题。
其中,预设自然语言处理模型可以采用具有双向编码器-译码器结构的BART自然语言处理模型,也可以采用具有庞大语料库的GPT自然语言处理模型,本申请实施例中不做具体限定。本申请实施例中,可以将实施例步骤102中得到的携带四类特征的嵌入向量输入至预设自然语言处理模型中,进行下一句预测处理,以生成与症状描述文本信息相匹配的下一句对话问题,从而完成辅助问诊过程。
与现有技术相比,本申请实施例首先基于标记嵌入编码子模型、角色区分编码子模型、相对位置编码子模型以及科室区分编码子模型建立预设编码模型,并基于该预设编码模型对用户的基本信息以及症状描述文本信息进行编码处理,通过科室区分编码子模型使得该用户的嵌入向量携带科室特征;进一步的,利用预设自然语言处理模型基于该携带科室特征的嵌入向量生成下一句对话问题,通过将问诊范围控制在对应的科室内,从而避免了问诊逻辑混乱的问题,保证了问诊效果。
在一个本申请实施例中,为了进一步限定及说明,如图2所示,实施例步骤102基于预设编码模型对基本信息以及症状描述文本信息进行编码处理,得到融合了基本信息以及症状描述文本信息的嵌入向量,具体包括:
201、基于标记嵌入编码子模型对基本信息以及症状描述文本信息进行标记嵌入编码处理,生成第一子向量。
本申请实施例中,首先对对基本信息以及症状描述文本信息进行切词处理,得到切词结果,例如,将“孩子咳嗽三天”进行切词处理,得到切词结果[“孩”,“子”,“咳”,“嗽”,“三”,“天”];再根据预设标记词表对上述切词结果进行标记嵌入编码处理,得到切词结果中所包含的各个关键词的标记嵌入编码标识[23,12,24,553,34,67],其中数字代表该关键词在预设标记词表中的索引index;最后根据上述标记嵌入编码标识从词embedding嵌入矩阵中取出对应的embedding嵌入向量,生成第一子向量,需要说明的是,若预设标记词表为5000维度,隐层维度为768,则词embedding嵌入矩阵大小即为5000*768的矩阵。
相应的,实施例步骤201具体包括:对基本信息以及症状描述文本信息进行切词处理,得到切词结果,切词结果中包含多个关键词;基于预设标记词表对多个关键词进行标记嵌入编码处理,得到各个关键词的标记嵌入编码标识;根据标记嵌入编码标识生成第一子向量。
202、基于角色区分编码子模型对基本信息以及症状描述文本信息进行角色区分编码处理,生成第二子向量。
本申请实施例中,可以使用说话者标识Speaker ID对不同的说话者进行区分,示例性的,可以使用S1表示用户角色,S2表示医生角色,另外,还可以使用P表示个人信息、D表示科室,并以此创建包含上述4个维度预设角色词表。进一步的,同理,在对基本信息以及症状描述文本信息进行切词处理,得到切词结果后根据预设角色词表对上述切词结果进行角色区分编码处理,得到切词结果中所包含的各个关键词的角色区分编码标识;最后根据该角色区分编码标识从词embedding嵌入矩阵中取出对应的embedding嵌入向量,生成第二子向量,需要说明的是,预设角色词表为4维度,隐层维度为768,则词embedding嵌入矩阵大小即为4*768的矩阵。
相应的,实施例步骤202具体包括:对基本信息以及症状描述文本信息进行切词处理,得到切词结果,切词结果中包含多个关键词;基于预设角色词表对多个关键词进行角色区分编码处理,得到各个关键词的角色区分编码标识;根据角色区分编码标识生成第二子向量。
203、基于相对位置编码子模型对基本信息以及症状描述文本信息进行相对位置编码处理,生成第三子向量。
本申请实施例中,可以先将基本信息以及症状描述文本信息串联,再从串联后的文本信息的首位字符起开始编码,例如,[“孩”,“子”,“咳”,“嗽”,“三”,“天”],对应的相对位置编码标识则为[1,2,3,4,5,6],同理,从相对位置
根据该相对位置编码标识从位置embedding嵌入矩阵中获取对应位置的embedding嵌入向量,生成第三子向量。
相应的,实施例步骤203具体包括:从基本信息以及症状描述文本信息串联后的文本信息的首位字符起,对串联后的文本信息所包含的全量字符进行相对位置编码处理,得到第三子向量。
204、基于科室区分编码子模型对基本信息以及症状描述文本信息进行科室区分编码处理,生成第四子向量。
本申请实施例中,可以通过科室嵌入向量embedding来对科室信息进行区分从而实现使用一个模型来完成多科室的问诊任务。示例性的,假设有18个科室,可以创建包含18个科室维度预设科室词表。进一步的,同理,在对基本信息以及症状描述文本信息进行切词处理,得到切词结果后根据预设科室词表对上述切词结果进行科室区分编码处理,得到切词结果中所包含的各个关键词的科室区分编码标识;最后根据该科室区分编码标识从词embedding嵌入矩阵中取出对应的embedding嵌入向量,生成第四子向量,需要说明的是,预设科室词表为18维度,隐层维度为768,则词embedding嵌入矩阵大小即为18*768的矩阵。
除此之外,还需要在输入数据头部加入科室信息,例如,“儿科”,则在每条训练样本前加入前缀“儿科”;同时为了区分用户的性别、年龄等基本信息,可以在科室前缀后相邻加入用户的基本信息。
相应的,实施例步骤204具体包括:对基本信息以及症状描述文本信息进行切词处理,得到切词结果,所切词结果中包含多个关键词;基于预设科室词表对多个关键词进行科室区分编码处理,得到各个关键词的科室区分编码标识;根据科室区分编码标识生成第四子向量。
205、将第一子向量、第二子向量、第三子向量以及第四子向量进行向量相加处理,生成融合了基本信息以及症状描述文本信息的嵌入向量。
本申请实施例中,将上述四个子向量进行向量相加处理,得到携带了标记嵌入特征、角色特征、相对位置特征以及科室特征的嵌入向量。
在一个本申请实施例中,为了进一步限定及说明,如图3所示,实施例步骤103基于预设自然语言处理模型对嵌入向量进行下一句预测处理,生成与症状描述文本信息相匹配的下一句对话问题,具体包括:
301、基于嵌入向量确定预设解码词表中各个字符的生成概率值,并选取最大概率值所对应的字符作为下一句对话问题所包含的第一字符。
302、基于第一字符以及嵌入向量相加后的向量再次确定预设解码词表中各个字符的生成概率值,并选取最大概率值所对应的字符作为下一句对话问题所包含的第二字符。
303、循环生成下一句对话问题所包含的多个字符。
304、若满足预设循环终止条件,则基于多个字符生成下一句对话问题。
本申请实施例中,优先的,采用GPT自然语言处理模型,首先将实施例步骤205得到的嵌入向量输入至GPT自然语言处理模型,得到第一输出向量,再对第一输出模型进行解码,以确定预设解码词表中各个字符的生成概率值,并选取最大概率值所对应的字符作为下一句对话问题所包含的第一字符,例如,该第一字符为“有”;进一步的,则将“有”与实施例步骤205得到的嵌入向量同时输入至GPT自然语言处理模型,得到第二输出向量,再对第二输出模型进行解码,以确定预设解码词表中各个字符的生成概率值,并选取最大概率值所对应的字符作为下一句对话问题所包含的第二字符,例如,该第一字符为“什”;以此类推,可以生成多个字符,直至满足循环终止条件(例如,到达循环次数阈值或已生成的多个字符组成的语义可识别)时,停止循环生成的步骤,并根据已生成的多个字符生成下一句对话问题。
本申请提供了一种基于融合科室的对话问题生成方法,首先接收目标用户的基本信息以及症状描述文本信息;其次基于预设编码模型对所述基本信息以及所述症状描述文本信息进行编码处理,得到融合了所述基本信息以及所述症状描述文本信息的嵌入向量,所述预设编码模型是基于标记嵌入编码子模型、角色区分编码子模型、相对位置编码子模型以及科室区分编码子模型建立的;最后基于预设自然语言处理模型对所述嵌入向量进行下一句预测处理,生成与所述症状描述文本信息相匹配的下一句对话问题。与现有技术相比,本申请实施例首先基于标记嵌入编码子模型、角色区分编码子模型、相对位置编码子模型以及科室区分编码子模型建立预设编码模型,并基于该预设编码模型对用户的基本信息以及症状描述文本信息进行编码处理,通过科室区分编码子模型使得该用户的嵌入向量携带科室特征;进一步的,利用预设自然语言处理模型基于该携带科室特征的嵌入向量生成下一句对话问题,通过将问诊范围控制在对应的科室内,从而避免了问诊逻辑混乱的问题,保证了问诊效果。
进一步的,作为对上述图1所示方法的实现,本申请实施例提供了一种基于融合科室的对话问题生成装置,如图4所示,该装置包括:
接收模块41,编码模块42,生成模块43。
接收模块41,用于接收目标用户的基本信息以及症状描述文本信息;
编码模块42,用于基于预设编码模型对所述基本信息以及所述症状描述文本信息进行编码处理,得到融合了所述基本信息以及所述症状描述文本信息的嵌入向量,所述预设编码模型是基于标记嵌入编码子模型、角色区分编码子模型、相对位置编码子模型以及科室区分编码子模型建立的;
生成模块43,用于基于预设自然语言处理模型对所述嵌入向量进行下一句预测处理,生成与所述症状描述文本信息相匹配的下一句对话问题。
在具体的应用场景中,所述编码模块,具体包括:
第一编码单元,用于基于所述标记嵌入编码子模型对所述基本信息以及所述症状描述文本信息进行标记嵌入编码处理,生成第一子向量;
第二编码单元,用于基于所述角色区分编码子模型对所述基本信息以及所述症状描述文本信息进行角色区分编码处理,生成第二子向量;
第三编码单元,用于基于所述相对位置编码子模型对所述基本信息以及所述症状描述文本信息进行相对位置编码处理,生成第三子向量;
第四编码单元,用于基于所述科室区分编码子模型对所述基本信息以及所述症状描述文本信息进行科室区分编码处理,生成第四子向量;
相加单元,用于将所述第一子向量、所述第二子向量、所述第三子向量以及所述第四子向量进行向量相加处理,生成融合了所述基本信息以及所述症状描述文本信息的嵌入向量。
在具体的应用场景中,所述第一编码单元,具体包括:
第一切词子单元,用于对所述基本信息以及所述症状描述文本信息进行切词处理,得到切词结果,所述切词结果中包含多个关键词;
第一编码子单元,用于基于预设标记词表对多个所述关键词进行标记嵌入编码处理,得到各个所述关键词的标记嵌入编码标识;
第一生成子单元,用于根据所述标记嵌入编码标识生成第一子向量。
在具体的应用场景中,所述第二编码单元,具体包括:
第二切词子单元,用于对所述基本信息以及所述症状描述文本信息进行切词处理,得到切词结果,所述切词结果中包含多个关键词;
第二编码子单元,用于基于预设角色词表对多个所述关键词进行角色区分编码处理,得到各个所述关键词的角色区分编码标识;
第二生成子单元,用于根据所述角色区分编码标识生成第二子向量。
在具体的应用场景中,所述第三编码单元,具体用于:
从所述基本信息以及所述症状描述文本信息串联后的文本信息的首位字符起,对所述串联后的文本信息所包含的全量字符进行相对位置编码处理,得到第三子向量。
在具体的应用场景中,所述第四编码单元,具体包括:
第三切词子单元,用于对所述基本信息以及所述症状描述文本信息进行切词处理,得到切词结果,所述切词结果中包含多个关键词;
第三编码子单元,用于基于预设科室词表对多个所述关键词进行科室区分编码处理,得到各个所述关键词的科室区分编码标识;
第三生成子单元,用于根据所述科室区分编码标识生成第四子向量。
在具体的应用场景中,所述生成模块,具体用于:
基于所述嵌入向量确定预设解码词表中各个字符的生成概率值,并选取最大概率值所对应的字符作为下一句对话问题所包含的第一字符;
基于所述第一字符以及所述嵌入向量相加后的向量再次确定所述预设解码词表中各个字符的生成概率值,并选取最大概率值所对应的字符作为下一句对话问题所包含的第二字符;
循环生成多个下一句对话问题所包含的字符;
若满足预设循环终止条件,则基于多个所述字符生成下一句对话问题。
本申请提供了一种基于融合科室的对话问题生成装置,首先接收目标用户的基本信息以及症状描述文本信息;其次基于预设编码模型对所述基本信息以及所述症状描述文本信息进行编码处理,得到融合了所述基本信息以及所述症状描述文本信息的嵌入向量,所述预设编码模型是基于标记嵌入编码子模型、角色区分编码子模型、相对位置编码子模型以及科室区分编码子模型建立的;最后基于预设自然语言处理模型对所述嵌入向量进行下一句预测处理,生成与所述症状描述文本信息相匹配的下一句对话问题。与现有技术相比,本申请实施例首先基于标记嵌入编码子模型、角色区分编码子模型、相对位置编码子模型以及科室区分编码子模型建立预设编码模型,并基于该预设编码模型对用户的基本信息以及症状描述文本信息进行编码处理,通过科室区分编码子模型使得该用户的嵌入向量携带科室特征;进一步的,利用预设自然语言处理模型基于该携带科室特征的嵌入向量生成下一句对话问题,通过将问诊范围控制在对应的科室内,从而避免了问诊逻辑混乱的问题,保证了问诊效果。
根据本申请一个实施例提供了一种存储介质,所述存储介质存储有至少一条可执行指令,该计算机可执行指令可执行上述任意方法实施例中的基于融合科室的对话问题生成方法。
基于这样的理解,本申请的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施场景所述的方法。
图5示出了根据本申请一个实施例提供的一种计算机设备的结构示意图,本申请具体实施例并不对计算机设备的具体实现做限定。
如图5所示,该计算机设备可以包括:处理器(processor)502、通信接口(Communications Interface)504、存储器(memory)506、以及通信总线508。
其中:处理器502、通信接口504、以及存储器506通过通信总线508完成相互间的通信。
通信接口504,用于与其它设备比如客户端或其它服务器等的网元通信。
处理器502,用于执行程序510,具体可以执行上述基于融合科室的对话问题生成方法实施例中的相关步骤。
具体地,程序510可以包括程序代码,该程序代码包括计算机操作指令。
处理器502可能是中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本申请实施例的一个或多个集成电路。计算机设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。
存储器506,用于存放程序510。存储器506可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
程序510具体可以用于使得处理器502执行以下操作:
接收目标用户的基本信息以及症状描述文本信息;
基于预设编码模型对所述基本信息以及所述症状描述文本信息进行编码处理,得到融合了所述基本信息以及所述症状描述文本信息的嵌入向量,所述预设编码模型是基于标记嵌入编码子模型、角色区分编码子模型、相对位置编码子模型以及科室区分编码子模型建立的;
基于预设自然语言处理模型对所述嵌入向量进行下一句预测处理,生成与所述症状描述文本信息相匹配的下一句对话问题。
存储介质中还可以包括操作系统、网络通信模块。操作系统是管理上述基于融合科室的对话问题生成的实体设备硬件和软件资源的程序,支持信息处理程序以及其它软件和/或程序的运行。网络通信模块用于实现存储介质内部各组件之间的通信,以及与信息处理实体设备中其它硬件和软件之间通信。
本说明书中各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似的部分相互参见即可。对于系统实施例而言,由于其与方法实施例基本对应,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
可能以许多方式来实现本申请的方法和系统。例如,可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本申请的方法和系统。用于所述方法的步骤的上述顺序仅是为了进行说明,本申请的方法的步骤不限于以上具体描述的顺序,除非以其它方式特别说明。此外,在一些实施例中,还可将本申请实施为记录在记录介质中的程序,这些程序包括用于实现根据本申请的方法的机器可读指令。因而,本申请还覆盖存储用于执行根据本申请的方法的程序的记录介质。
显然,本领域的技术人员应该明白,上述的本申请的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本申请不限制于任何特定的硬件和软件结合。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包括在本申请的保护范围之内。
Claims (10)
1.一种基于融合科室的对话问题生成方法,其特征在于,包括:
接收目标用户的基本信息以及症状描述文本信息;
基于预设编码模型对所述基本信息以及所述症状描述文本信息进行编码处理,得到融合了所述基本信息以及所述症状描述文本信息的嵌入向量,所述预设编码模型是基于标记嵌入编码子模型、角色区分编码子模型、相对位置编码子模型以及科室区分编码子模型建立的;
基于预设自然语言处理模型对所述嵌入向量进行下一句预测处理,生成与所述症状描述文本信息相匹配的下一句对话问题。
2.根据权利要求1所述的方法,其特征在于,所述基于预设编码模型对所述基本信息以及所述症状描述文本信息进行编码处理,得到融合了所述基本信息以及所述症状描述文本信息的嵌入向量,具体包括:
基于所述标记嵌入编码子模型对所述基本信息以及所述症状描述文本信息进行标记嵌入编码处理,生成第一子向量;
基于所述角色区分编码子模型对所述基本信息以及所述症状描述文本信息进行角色区分编码处理,生成第二子向量;
基于所述相对位置编码子模型对所述基本信息以及所述症状描述文本信息进行相对位置编码处理,生成第三子向量;
基于所述科室区分编码子模型对所述基本信息以及所述症状描述文本信息进行科室区分编码处理,生成第四子向量;
将所述第一子向量、所述第二子向量、所述第三子向量以及所述第四子向量进行向量相加处理,生成融合了所述基本信息以及所述症状描述文本信息的嵌入向量。
3.根据权利要求2所述的方法,其特征在于,所述基于所述标记嵌入编码子模型对所述基本信息以及所述症状描述文本信息进行标记嵌入编码处理,生成第一子向量,具体包括:
对所述基本信息以及所述症状描述文本信息进行切词处理,得到切词结果,所述切词结果中包含多个关键词;
基于预设标记词表对多个所述关键词进行标记嵌入编码处理,得到各个所述关键词的标记嵌入编码标识;
根据所述标记嵌入编码标识生成第一子向量。
4.根据权利要求2所述的方法,其特征在于,所述基于所述角色区分编码子模型对所述基本信息以及所述症状描述文本信息进行角色区分编码处理,生成第二子向量,具体包括:
对所述基本信息以及所述症状描述文本信息进行切词处理,得到切词结果,所述切词结果中包含多个关键词;
基于预设角色词表对多个所述关键词进行角色区分编码处理,得到各个所述关键词的角色区分编码标识;
根据所述角色区分编码标识生成第二子向量。
5.根据权利要求2所述的方法,其特征在于,所述基于所述相对位置编码子模型对所述基本信息以及所述症状描述文本信息进行相对位置编码处理,生成第三子向量,具体包括:
从所述基本信息以及所述症状描述文本信息串联后的文本信息的首位字符起,对所述串联后的文本信息所包含的全量字符进行相对位置编码处理,得到第三子向量。
6.根据权利要求2所述的方法,其特征在于,所述基于所述科室区分编码子模型对所述基本信息以及所述症状描述文本信息进行科室区分编码处理,生成第四子向量,具体包括:
对所述基本信息以及所述症状描述文本信息进行切词处理,得到切词结果,所述切词结果中包含多个关键词;
基于预设科室词表对多个所述关键词进行科室区分编码处理,得到各个所述关键词的科室区分编码标识;
根据所述科室区分编码标识生成第四子向量。
7.根据权利要求1所述的方法,其特征在于,所述基于预设自然语言处理模型对所述嵌入向量进行下一句预测处理,生成与所述症状描述文本信息相匹配的下一句对话问题,具体包括:
基于所述嵌入向量确定预设解码词表中各个字符的生成概率值,并选取最大概率值所对应的字符作为下一句对话问题所包含的第一字符;
基于所述第一字符以及所述嵌入向量相加后的向量再次确定所述预设解码词表中各个字符的生成概率值,并选取最大概率值所对应的字符作为下一句对话问题所包含的第二字符;
循环生成下一句对话问题所包含的多个字符;
若满足预设循环终止条件,则基于多个所述字符生成下一句对话问题。
8.一种基于融合科室的对话问题生成装置,其特征在于,包括:
接收模块,用于接收目标用户的基本信息以及症状描述文本信息;
编码模块,用于基于预设编码模型对所述基本信息以及所述症状描述文本信息进行编码处理,得到融合了所述基本信息以及所述症状描述文本信息的嵌入向量,所述预设编码模型是基于标记嵌入编码子模型、角色区分编码子模型、相对位置编码子模型以及科室区分编码子模型建立的;
生成模块,用于基于预设自然语言处理模型对所述嵌入向量进行下一句预测处理,生成与所述症状描述文本信息相匹配的下一句对话问题。
9.一种存储介质,所述存储介质中存储有至少一条可执行指令,其特征在于,所述可执行指令使处理器执行如权利要求1-7中任一项所述的基于融合科室的对话问题生成方法对应的操作。
10.一种计算机设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一条可执行指令,其特征在于,所述可执行指令使所述处理器执行如权利要求1-7中任一项所述的基于融合科室的对话问题生成方法对应的操作。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310727547.0A CN116756283A (zh) | 2023-06-19 | 2023-06-19 | 基于融合科室的对话问题生成方法及装置、介质、设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310727547.0A CN116756283A (zh) | 2023-06-19 | 2023-06-19 | 基于融合科室的对话问题生成方法及装置、介质、设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116756283A true CN116756283A (zh) | 2023-09-15 |
Family
ID=87958472
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310727547.0A Pending CN116756283A (zh) | 2023-06-19 | 2023-06-19 | 基于融合科室的对话问题生成方法及装置、介质、设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116756283A (zh) |
-
2023
- 2023-06-19 CN CN202310727547.0A patent/CN116756283A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109918680B (zh) | 实体识别方法、装置及计算机设备 | |
CN110288980A (zh) | 语音识别方法、模型的训练方法、装置、设备及存储介质 | |
CN111460807A (zh) | 序列标注方法、装置、计算机设备和存储介质 | |
CN109241330A (zh) | 用于识别音频中的关键短语的方法、装置、设备和介质 | |
CN111598979B (zh) | 虚拟角色的面部动画生成方法、装置、设备及存储介质 | |
CN111914076B (zh) | 一种基于人机对话的用户画像构建方法、系统、终端及存储介质 | |
CN112131368B (zh) | 对话生成方法、装置、电子设备及存储介质 | |
CN112632244A (zh) | 一种人机通话的优化方法、装置、计算机设备及存储介质 | |
CN112463942A (zh) | 文本处理方法、装置、电子设备及计算机可读存储介质 | |
CN111814479B (zh) | 一种企业简称生成及其模型的训练方法及装置 | |
CN114360502A (zh) | 语音识别模型的处理方法、语音识别方法及装置 | |
CN112199502A (zh) | 基于情感的诗句生成方法及装置、电子设备和存储介质 | |
CN109933773A (zh) | 一种多重语义语句解析系统及方法 | |
CN111159394A (zh) | 一种文本摘要生成方法和装置 | |
CN111368066B (zh) | 获取对话摘要的方法、装置和计算机可读存储介质 | |
CN114020886A (zh) | 语音意图识别方法、装置、设备及存储介质 | |
CN110909174B (zh) | 一种基于知识图谱的简单问答中实体链接的改进方法 | |
CN114372454A (zh) | 文本信息抽取方法、模型训练方法、装置及存储介质 | |
CN114611529B (zh) | 意图识别方法和装置、电子设备及存储介质 | |
CN114417891B (zh) | 基于粗糙语义的回复语句确定方法、装置及电子设备 | |
CN112686059B (zh) | 文本翻译方法、装置、电子设备和存储介质 | |
CN111401069A (zh) | 会话文本的意图识别方法、意图识别装置及终端 | |
CN115048102A (zh) | 代码生成方法、装置、设备和存储介质 | |
CN116756283A (zh) | 基于融合科室的对话问题生成方法及装置、介质、设备 | |
CN114330701A (zh) | 模型训练方法、装置、计算机设备、存储介质及程序产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |