CN114491072A - 一种中医数据处理系统、方法、存储介质及终端 - Google Patents

一种中医数据处理系统、方法、存储介质及终端 Download PDF

Info

Publication number
CN114491072A
CN114491072A CN202210104415.8A CN202210104415A CN114491072A CN 114491072 A CN114491072 A CN 114491072A CN 202210104415 A CN202210104415 A CN 202210104415A CN 114491072 A CN114491072 A CN 114491072A
Authority
CN
China
Prior art keywords
chinese medicine
questionnaire
data
information
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210104415.8A
Other languages
English (en)
Inventor
贾声声
张刚强
王元福
赵旭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai National Group Health Technology Co ltd
Original Assignee
Shanghai National Group Health Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai National Group Health Technology Co ltd filed Critical Shanghai National Group Health Technology Co ltd
Priority to CN202210104415.8A priority Critical patent/CN114491072A/zh
Publication of CN114491072A publication Critical patent/CN114491072A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/20ICT specially adapted for the handling or processing of patient-related medical or healthcare data for electronic clinical trials or questionnaires
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/90ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to alternative medicines, e.g. homeopathy or oriental medicines

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Data Mining & Analysis (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Human Computer Interaction (AREA)
  • Alternative & Traditional Medicine (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明提供一种中医数据处理系统、方法、存储介质及终端,所述系统包括:问卷生成模块,用于基于预设规则模板和中医知识图谱生成患者动态问卷;数据转化模块,用于对所述动态问卷采集的第一数据进行结构化处理以获取第二数据;预测模块,用于基于构建的预测模型对所述第二数据进行预测处理以生成预测结果。本发明通过患者动态问卷采集患者信息,动态问卷基于患者的作答信息实时更新,更具有专业性和针对性,使得预测结果更加准确;并且所获得的预测结果可有效辅助医生进行疾病和证型的诊断,提高诊断的准确性以及诊断效率。

Description

一种中医数据处理系统、方法、存储介质及终端
技术领域
本发明涉及医疗数据处理技术领域,特别是涉及一种中医数据处理系统、方法、存储介质及终端。
背景技术
目前,中医临床诊断依赖于医生所掌握的理论知识和临床经验,医疗诊断方式多为医护人员诊断,很大程度上受限于医生本人医疗水平。医生大量重复采集患者基础信息,导致诊疗时间过久,加大工作量的同时带来了问诊效率低下的问题。并且,问诊过程受主观因素影响较明显,遇到患者信息描述不完整或受到就医情绪影响不配合的情况,医生推断的准确率和患者就医体验将大打折扣。
发明内容
鉴于以上所述现有技术的缺点,本发明的目的在于提供一种中医数据处理系统、方法、存储介质及终端,以解决现有问诊过程主观性强且问诊效率低下的问题。
为实现上述目的及其它相关目的,本发明的第一方面提供一种中医数据处理系统,包括:问卷生成模块,用于基于预设规则模板和中医知识图谱生成患者动态问卷;数据转化模块,用于对所述动态问卷采集的第一数据进行结构化处理以获取第二数据;预测模块,用于基于构建的预测模型对所述第二数据进行预测处理以生成预测结果。
于本发明的第一方面的一些实施例中,所述问卷生成模块包括:中医知识图谱构建子模块,用于获取中医数据,并对其进行实体抽取、实体关系抽取和实体对齐操作以构建中医知识图谱;第一问卷生成子模块,用于基于所述中医知识图谱获取疾病与证型的相关条件信息,并结合所述预设规则模板构建初始化问卷;第二问卷生成子模块,用于基于所述初始化问卷的作答信息结合所述中医知识图谱实时更新问卷内容直至所述系统获得满足预设条件的预测结果。
于本发明的第一方面的一些实施例中,所述问卷生成模块还包括:用户输入子模块,用于供用户输入开放文本;识别子模块,用于对所述开放文本进行实体抽取和意图识别以获得识别结果以供所述第一问卷生成子模块构建初始化问卷。
于本发明的第一方面的一些实施例中,所述预测模块包括:Transformer多标签预测模块。
于本发明的第一方面的一些实施例中,所述Transformer多标签预测模块包括:输入向量生成子模块,用于基于多源融合信息生成Transformer多标签预测模型的输入向量;所述多元融合信息包括:问卷结构化信息、用户输入开放文本信息和中医知识图谱信息。
于本发明的第一方面的一些实施例中,所述Transformer多标签预测模块包括:Transformer多标签预测模型构建子模块,用于基于大量预处理的中医文本数据训练获得中医词向量模型;基于所述中医知识图谱信息训练所述中医词向量模型以构建所述Transformer多标签预测模型供提取所述动态问卷的作答信息的词向量特征。
于本发明的第一方面的一些实施例中,所述数据转化模块对所述动态问卷的作答信息进行结构化处理与分析,通过数据表征方法将所述作答信息表示为计算机可理解的数值形式。
为实现上述目的及其它相关目的,本发明的第二方面提供一种中医数据处理方法,包括:基于预设规则模板和中医知识图谱生成患者动态问卷;对所述动态问卷采集的第一数据进行结构化处理以获取第二数据;基于构建的预测模型对所述第二数据进行预测处理以生成预测结果。
为实现上述目的及其它相关目的,本发明的第三方面提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现所述中医数据处理方法。
为实现上述目的及其它相关目的,本发明的第四方面提供一种电子终端,包括:处理器及存储器;所述存储器用于存储计算机程序,所述处理器用于执行所述存储器存储的计算机程序,以使所述终端执行所述中医数据处理方法。
如上所述,本发明提供一种中医数据处理系统、方法、存储介质及终端,具有以下有益效果:通过患者动态问卷采集患者的作答信息,动态问卷基于患者的作答信息实时更新,更具有专业性和针对性,使得预测结果更加准确;并且所获得的预测结果可有效辅助医生进行疾病和证型的诊断,提高诊断的准确性以及诊断效率;进一步地,基于所构建的中医知识图谱获取疾病与证型的相关条件信息,并结合预设规则模板生成问卷,进一步提高问卷内容的关联性和中医领域的适用性;可选择地采集用户的开放文本信息,用户更具有选择自主性,提高用户的使用体验,照顾到存在就医情绪或可能文本描述能力优先的用户;中医知识图谱不仅应用于问卷生成模块以提高问卷的专业性,还应用于预测模块以提高预测的准确性;尤其是通过Transformer多标签预测模块基于Attention机制捕捉中医数据的各基础特征间的关联信息,组合性更加强悍,并且基于深度模型增加参数空间,具有较强的拟合能力,尤其适用于提高问卷内容的专业性和预测的准确性。
附图说明
图1显示为本发明一实施例中一种中医数据处理系统的结构示意图。
图2显示为本发明一实施例中一种自动化动态生成个性化问卷的流程示意图。
图3显示为本发明一实施例中一种中医数据处理方法的流程示意图。
图4显示为本发明一实施例中一种电子终端的结构示意图。
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其它优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
需要说明的是,在下述描述中,参考附图,附图描述了本发明的若干实施例。应当理解,还可使用其它实施例,并且可以在不背离本发明的精神和范围的情况下进行操作上的改变。下面的详细描述不应该被认为是限制性的,并且本发明的实施例的范围仅由公布的专利的权利要求书所限定。这里使用的术语仅是为了描述特定实施例,而并非旨在限制本发明。
再者,如同在本文中所使用的,单数形式“一”、“一个”和“该”旨在也包括复数形式,除非上下文中有相反的指示。应当进一步理解,术语“包含”、“包括”表明存在所述的特征、操作、元件、组件、项目、种类、和/或组,但不排除一个或多个其它特征、操作、元件、组件、项目、种类、和/或组的存在、出现或添加。此处使用的术语“或”和“和/或”被解释为包括性的,或意味着任一个或任何组合。因此,“A、B或C”或者“A、B和/或C”意味着“以下任一个:A;B;C;A和B;A和C;B和C;A、B和C”。仅当元件、功能或操作的组合在某些方式下内在地互相排斥时,才会出现该定义的例外。
本发明的目的在于提供一种中医数据处理系统、方法、存储介质及终端,以解决现有问诊过程主观性强且问诊效率低下的问题。
为了使本发明的目的、技术方案及优点更加清楚明白,通过下述实施例并结合附图,对本发明实施例中的技术方案进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
实施例一
如图1所示,本发明实施例提出一种中医数据处理系统的结构示意图。该中医数据处理系统包括:
问卷生成模块11,用于基于预设规则模板和中医知识图谱生成患者动态问卷。优选的,预设规则模板可以基于患者的基本信息进行分别设计,如基于患者的年龄、性别、身高体重指数等,或基于患者就诊的季节、区域气候等,基于患者基本信息获取不同的疾病概率、疾病与证型的关联关系,为患者提供更具针对性的动态问卷。该动态问卷将被推送到患者端以收集患者的作答信息。患者端可以是专用的患者操作平台,也可以是手机、平板、智能穿戴装置等移动终端。
数据转化模块12,用于对所述动态问卷采集的第一数据进行结构化处理以获取第二数据。具体的,所述数据转化模块对所述动态问卷的作答信息进行结构化处理与分析,通过数据表征方法将所述作答信息表示为计算机可理解的数值形式,例如,将中医医学基础知识以及患者问答信息特征化。
预测模块13,用于基于构建的预测模型对所述第二数据进行预测处理以生成预测结果。例如,通过构建基于Transformer的多标签中医疾病与证型预测模型,将所述第二数据输入以获取疾病与证型预测结果,从而为医生提供中医疾病与证型辅助决策信息。预测模块13的预测结果将被推送至医生端供医生参考决策。进一步地,所述系统可接收医生对预测结果的反馈信息不断优化模型,从而为用户提供更好的使用体验。
在本实施例较佳实施方式,所述问卷生成模块11包括:中医知识图谱构建子模块,用于获取中医数据,并对其进行实体抽取、实体关系抽取和实体对齐操作以构建中医知识图谱;第一问卷生成子模块,用于基于所述中医知识图谱获取疾病与证型的相关条件信息,并结合所述预设规则模板构建初始化问卷;第二问卷生成子模块,用于基于所述初始化问卷的作答信息结合所述中医知识图谱实时更新问卷内容直至所述系统获得满足预设条件的预测结果。
所述中医数据包括中医疾病、症状、治法、证型、方剂、中药材等数据,可通过书籍、中医病案、现有的中医知识库数据等途径收集整理。并且,基于所述中医数据构建的所述中医知识图谱不仅可用于问卷的动态生成,还可用于向预测模块提供中医疾病和证型预测的基础知识。
进一步地,所述问卷生成模块11还包括:用户输入子模块,用于供用户输入开放文本;识别子模块,用于对所述开放文本(如自我描述内容)进行实体抽取和意图识别以获得识别结果以供所述第一问卷生成子模块构建初始化问卷。
举例,如图2所示,本发明实施例提出一种自动化动态生成个性化问卷的流程示意图,首先,获取用户开放性输入的症状自我描述内容,并通过实体抽取、意图识别等技术识别用户最大概率存在的疾病和证型;其次,根据所构建的中医知识图谱可获取疾病与证型的必要前提相关条件(如症状描述);然后,根据查询结果结合问卷模板与知识图谱结构生成少部分问题初始化问卷调查内容;最后,根据用户的作答实时计算,产生新的问卷内容,最终可完成全流程的个性化问卷生成。需说明的是,用户的开放性输入为可选操作,当用户不填入任何信息时,系统可随机初始化少量问卷内容。
值得说明的是,本发明实施例提出的动态问卷与现有的问卷相比具有以下有益效果:首先,现有的问卷内容对于每个人都是固定的,而动态生成问卷的内容是根据每个人填写的内容以及结合用户回答问题的答案动态生成的;其次,现有的问卷内容收集的信息是大众化的,动态生成问卷的内容基于每一步用户收集的信息动态预测疾病和证型,根据倾向性疾病和证型综合生成具有专业性针对性的问卷内容,收集的信息更加专业化;再次,现有生成问卷的内容收集的信息对医生有用的信息较少需要医生进行信息过滤,医生耗费时间较多,而动态生成的信息是模拟医生诊断过程而预测生成的,医生会得到更多有用信息,提高医生效率。因此,本发明实施例一方面可以精炼问题的数量,避免以往让用户回答对于医生诊断无效的问题,提高问卷收集的质量与效率;另一方面可以对病情模糊的用户动态增加问题,补充可用于疾病或证型判别的内容。
为便于理解本发明动态问卷的优势,进一步举例说明如下:针对“感冒”问卷,现有问卷内容固定,如,第一题:咳嗽情况(A,B,C,D),第二题:头痛情况(A,B,C,D)等等,用户需要对每一题进行回答。相对地,本发明的问卷生成模块:首先获取用户的开放文本信息,比如发热、头痛、不咳嗽等,进而通过NLP抽取技术预测获得最大概率疾病预测结果为感冒,则问卷内容不会出现第一题内容,而会反查中医知识图谱中其它感冒相关内容并动态生成个性化问卷。
在本实施例较佳实施方式,所述预测模块包括:Transformer多标签预测模块。该Transformer多标签预测模块基于Attention机制捕捉中医数据的各基础特征间的关联信息,组合性更加强悍,并且基于深度模型增加参数空间,具有较强的拟合能力。
在一些示例中,所述Transformer多标签预测模块包括:输入向量生成子模块,用于基于多源融合信息生成Transformer多标签预测模型的输入向量;所述多元融合信息包括:问卷结构化信息、用户输入开放文本信息、中医知识图谱信息等等。本示例中,Transformer多标签预测模块针对所处理数据的改进在于多源信息融合,其主要包括用户填写的文本、收集的问卷结构化信息,并且引入中医知识图谱信息来丰富特征,采用“开放输入文本——问题结构化QA——知识图谱三元组”结合的方式提取文本融合信息,将非结构化信息与结构化信息融合生成模型的输入向量。
在另一些示例中,所述Transformer多标签预测模块包括:Transformer多标签预测模型构建子模块,用于基于大量预处理的中医文本数据训练获得中医词向量模型;基于所述中医知识图谱信息训练所述中医词向量模型以构建所述Transformer多标签预测模型供提取所述动态问卷的作答信息的词向量特征。
该Transformer多标签预测模型包括向量化文本语料模块,结合具体的中医领域知识,采用大规模中医语料文本预训练的词向量模型,并且引入中医医疗知识图谱结构化信息,融合结构化与非结构化信息,因此,模型具有较高的拟合能力和预测精度。
在一些示例中,Transformer多标签预测模型应用于疾病与证型预测,其具体实现方法流程表述如下:首先,收集大量的中医文本信息并进行预处理,基于预处理后的大规模中医医疗文本数据训练词向量模型;其次,基于中医词向量模型训练收集整理的中医疾病与证型分类数据集;然后,通过预训练的中医词向量模型获取问卷信息的词向量特征,最终完成多标签预测。
需要说明的是,应理解以上系统的各个模块的划分仅仅是一种逻辑功能的划分,实际实现时可以全部或部分集成到一个物理实体上,也可以物理上分开。且这些模块可以全部以软件通过处理元件调用的形式实现;也可以全部以硬件的形式实现;还可以部分模块通过处理元件调用软件的形式实现,部分模块通过硬件的形式实现。例如,问卷生成模块11可以为单独设立的处理元件,也可以集成在上述装置的某一个芯片中实现,此外,也可以以程序代码的形式存储于上述装置的存储器中,由上述装置的某一个处理元件调用并执行以上问卷生成模块11的功能。其它模块的实现与之类似。此外这些模块全部或部分可以集成在一起,也可以独立实现。这里所述的处理元件可以是一种集成电路,具有信号的处理能力。在实现过程中,上述方法的各步骤或以上各个模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。
例如,以上这些模块可以是被配置成实施以上方法的一个或多个集成电路,例如:一个或多个特定集成电路(Application Specific Integrated Circuit,简称ASIC),或,一个或多个微处理器(digital signal processor,简称DSP),或,一个或者多个现场可编程门阵列(Field Programmable Gate Array,简称FPGA)等。再如,当以上某个模块通过处理元件调度程序代码的形式实现时,该处理元件可以是通用处理器,例如中央处理器(Central Processing Unit,简称CPU)或其它可以调用程序代码的处理器。再如,这些模块可以集成在一起,以片上系统(system-on-a-chip,简称SOC)的形式实现。
实施例二
如图3所示,本发明实施例提出一种中医数据处理方法的流程示意图。该中医数据处理方法具体包括如下步骤:
步骤S31.基于预设规则模板和中医知识图谱生成患者动态问卷。具体的,获取中医数据,并对其进行实体抽取、实体关系抽取和实体对齐操作以构建中医知识图谱;基于所述中医知识图谱获取疾病与证型的相关条件信息,并结合所述预设规则模板构建初始化问卷;基于所述初始化问卷的作答信息结合所述中医知识图谱实时更新问卷内容直至所述系统获得满足预设条件的预测结果。
优选的,获取用户输入开放文本(自我描述内容);对所述自我描述内容进行实体抽取和意图识别以获得识别结果以供所述第一问卷生成子模块构建初始化问卷。
步骤S32.对所述动态问卷采集的第一数据进行结构化处理以获取第二数据。例如,对患者作答信息进行结构化处理与分析,通过数据表征方法将收集的问卷内容表示为计算机可理解的数值形式。
步骤S33.基于构建的预测模型对所述第二数据进行预测处理以生成预测结果。例如,通过构建Transformer多标签预测模型进行预测:基于大量预处理的中医文本数据训练获得中医词向量模型;基于所述中医知识图谱信息训练所述中医词向量模型以构建所述Transformer多标签预测模型供提取所述动态问卷的作答信息的词向量特征。
该Transformer多标签预测模型包括向量化文本语料模块,结合具体的中医领域知识,采用大规模中医语料文本预训练的词向量模型,并且引入中医医疗知识图谱结构化信息,融合结构化与非结构化信息,因此,模型具有较高的拟合能力和预测精度。
在一些示例中,Transformer多标签预测模型应用于疾病与证型预测,其具体实现方法流程表述如下:首先,收集大量的中医文本信息并进行预处理,基于预处理后的大规模中医医疗文本数据训练词向量模型;其次,基于中医词向量模型训练收集整理的中医疾病与证型分类数据集;然后,通过预训练的中医词向量模型获取问卷信息的词向量特征,最终完成多标签预测。
需要说明的是,本实施例提供的方法与上文中提供的系统、模块类似,故不再赘述。在一些实施方式中,所述方法可应用于控制器,所述电控单元例如为ARM(AdvancedRISC Machines)控制器、FPGA(Field Programmable Gate Array)控制器、SoC(System onChip)控制器、DSP(Digital Signal Processing)控制器、或者MCU(MicrocontrollerUnit)控制器等等。在一些实施方式中,所述方法也可应用于包括存储器、存储控制器、一个或多个处理单元(CPU)、外设接口、RF电路、音频电路、扬声器、麦克风、输入/输出(I/O)子系统、显示屏、其它输出或控制设备,以及外部端口等组件的计算机;所述计算机包括但不限于如台式电脑、笔记本电脑、平板电脑、智能手机、智能电视、个人数字助理(PersonalDigital Assistant,简称PDA)等个人电脑。在另一些实施方式中,所述方法还可应用于服务器,所述服务器可以根据功能、负载等多种因素布置在一个或多个实体服务器上,也可以由分布的或集中的服务器集群构成。
实施例三
如图4所示,本发明实施例提供一种电子终端的结构示意图。本实施例提供的电子终端,包括:处理器41、存储器42、通信器43;存储器42通过系统总线与处理器41和通信器43连接并完成相互间的通信,存储器42用于存储计算机程序,通信器43用于和其它设备进行通信,处理器41用于运行计算机程序,使电子终端执行如上中医数据处理方法的各个步骤。
上述提到的系统总线可以是外设部件互连标准(Peripheral ComponentInterconnect,简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,简称EISA)总线等。该系统总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。通信接口用于实现数据库访问装置与其它设备(例如客户端、读写库和只读库)之间的通信。存储器可能包含随机存取存储器(Random Access Memory,简称RAM),也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
实施例四
本发明实施例提出一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现所述的中医数据处理方法。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过计算机程序相关的硬件来完成。前述的计算机程序可以存储于一计算机可读存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
综上所述,本发明提供一种中医数据处理系统、方法、存储介质及终端,通过患者动态问卷采集患者信息,动态问卷基于患者的作答信息实时更新,更具有专业性和针对性,使得预测结果更加准确;并且所获得的预测结果可有效辅助医生进行疾病和证型的诊断,提高诊断的准确性以及诊断效率;进一步地,基于所构建的中医知识图谱获取疾病与证型的相关条件信息,并结合预设规则模板生成问卷,进一步提高问卷内容的关联性和中医领域的适用性;可选择地采集用户的开放文本信息,用户更具有选择自主性,提高用户的使用体验,照顾到存在就医情绪或可能文本描述能力优先的用户;中医知识图谱不仅应用于问卷生成模块以提高问卷的专业性,还应用于预测模块以提高预测的准确性;尤其是通过Transformer多标签预测模块基于Attention机制捕捉中医数据的各基础特征间的关联信息,组合性更加强悍,并且基于深度模型增加参数空间,具有较强的拟合能力,尤其适用于提高问卷内容的专业性和预测的准确性。所以,本发明有效克服了现有技术中的种种缺点而具有高度产业利用价值。
上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。

Claims (10)

1.一种中医数据处理系统,其特征在于,包括:
问卷生成模块,用于基于预设规则模板和中医知识图谱生成患者动态问卷;
数据转化模块,用于对所述动态问卷采集的第一数据进行结构化处理以获取第二数据;
预测模块,用于基于构建的预测模型对所述第二数据进行预测处理以生成预测结果。
2.根据权利要求1所述的中医数据处理系统,其特征在于,所述问卷生成模块包括:
中医知识图谱构建子模块,用于获取中医数据,并对其进行实体抽取、实体关系抽取和实体对齐操作以构建中医知识图谱;
第一问卷生成子模块,用于基于所述中医知识图谱获取疾病与证型的相关条件信息,并结合所述预设规则模板构建初始化问卷;
第二问卷生成子模块,用于基于所述初始化问卷的作答信息结合所述中医知识图谱实时更新问卷内容直至所述系统获得满足预设条件的预测结果。
3.根据权利要求2所述的中医数据处理系统,其特征在于,所述问卷生成模块还包括:
用户输入子模块,用于供用户输入开放文本;
识别子模块,用于对所述开放文本进行实体抽取和意图识别以获得识别结果以供所述第一问卷生成子模块构建初始化问卷。
4.根据权利要求1所述的中医数据处理系统,其特征在于,所述预测模块包括:Transformer多标签预测模块。
5.根据权利要求4所述的中医数据处理系统,其特征在于,所述Transformer多标签预测模块包括:
输入向量生成子模块,用于基于多源融合信息生成Transformer多标签预测模型的输入向量;所述多元融合信息包括:问卷结构化信息、用户输入开放文本信息和中医知识图谱信息。
6.根据权利要求4所述的中医数据处理系统,其特征在于,所述Transformer多标签预测模块包括:
Transformer多标签预测模型构建子模块,用于基于大量预处理的中医文本数据训练获得中医词向量模型;基于所述中医知识图谱信息训练所述中医词向量模型以构建所述Transformer多标签预测模型供提取所述动态问卷的作答信息的词向量特征。
7.根据权利要求5所述的中医数据处理系统,其特征在于,所述数据转化模块对所述动态问卷的作答信息进行结构化处理与分析,通过数据表征方法将所述作答信息表示为计算机可理解的数值形式。
8.一种中医数据处理方法,其特征在于,包括:
基于预设规则模板和中医知识图谱生成患者动态问卷;
对所述动态问卷采集的第一数据进行结构化处理以获取第二数据;
基于构建的预测模型对所述第二数据进行预测处理以生成预测结果。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求8所述的中医数据处理方法。
10.一种电子终端,其特征在于,包括:处理器及存储器;
所述存储器用于存储计算机程序,所述处理器用于执行所述存储器存储的计算机程序,以使所述终端执行如权利要求8所述的中医数据处理方法。
CN202210104415.8A 2022-01-28 2022-01-28 一种中医数据处理系统、方法、存储介质及终端 Pending CN114491072A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210104415.8A CN114491072A (zh) 2022-01-28 2022-01-28 一种中医数据处理系统、方法、存储介质及终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210104415.8A CN114491072A (zh) 2022-01-28 2022-01-28 一种中医数据处理系统、方法、存储介质及终端

Publications (1)

Publication Number Publication Date
CN114491072A true CN114491072A (zh) 2022-05-13

Family

ID=81477037

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210104415.8A Pending CN114491072A (zh) 2022-01-28 2022-01-28 一种中医数据处理系统、方法、存储介质及终端

Country Status (1)

Country Link
CN (1) CN114491072A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115083628A (zh) * 2022-08-19 2022-09-20 成都中医药大学 一种基于中医望诊客观化的医教协同系统
CN115762690A (zh) * 2022-11-17 2023-03-07 昭阳健康(广州)科技有限公司 基于多科室配置的智能诊疗问卷实现方法及装置
CN116525100A (zh) * 2023-04-26 2023-08-01 脉景(杭州)健康管理有限公司 一种基于标签系统的中医开方反向校验方法及系统
CN118039088A (zh) * 2024-04-15 2024-05-14 达州爱迦飞诗特科技有限公司 一种人工智能辅助诊断数据处理系统

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115083628A (zh) * 2022-08-19 2022-09-20 成都中医药大学 一种基于中医望诊客观化的医教协同系统
CN115083628B (zh) * 2022-08-19 2022-10-28 成都中医药大学 一种基于中医望诊客观化的医教协同系统
CN115762690A (zh) * 2022-11-17 2023-03-07 昭阳健康(广州)科技有限公司 基于多科室配置的智能诊疗问卷实现方法及装置
CN116525100A (zh) * 2023-04-26 2023-08-01 脉景(杭州)健康管理有限公司 一种基于标签系统的中医开方反向校验方法及系统
CN118039088A (zh) * 2024-04-15 2024-05-14 达州爱迦飞诗特科技有限公司 一种人工智能辅助诊断数据处理系统
CN118039088B (zh) * 2024-04-15 2024-06-07 达州爱迦飞诗特科技有限公司 一种人工智能辅助诊断数据处理系统

Similar Documents

Publication Publication Date Title
CN111414393B (zh) 一种基于医学知识图谱的语义相似病例检索方法及设备
CN114491072A (zh) 一种中医数据处理系统、方法、存储介质及终端
US11232365B2 (en) Digital assistant platform
CN116756579B (zh) 大语言模型的训练方法及基于大语言模型的文本处理方法
CN113707297B (zh) 医疗数据的处理方法、装置、设备及存储介质
Chattopadhyay et al. A Case‐Based Reasoning system for complex medical diagnosis
CN112131393A (zh) 一种基于bert和相似度算法的医疗知识图谱问答系统构建方法
KR102328154B1 (ko) 머신러닝에 기반한 의료데이터 수집 및 분석 서비스 제공 방법 및 시스템
WO2021169842A1 (zh) 数据更新方法、装置、电子设备及计算机可读存储介质
JP7357614B2 (ja) 機械支援対話システム、ならびに病状問診装置およびその方法
Xu et al. Forecasting medical device demand with online search queries: a big data and machine learning approach
WO2017180475A1 (en) Query optimizer for combined structured and unstructured data records
CN111696661A (zh) 患者分群模型构建方法、患者分群方法及相关设备
CN116805002A (zh) 问答方法、问答装置、设备及存储介质
CN110752027B (zh) 电子病历数据推送方法、装置、计算机设备和存储介质
CN116680401A (zh) 文档处理方法、文档处理装置、设备及存储介质
CN116910201A (zh) 一种对话数据生成方法及其相关设备
WO2023124837A1 (zh) 问诊处理方法、装置、设备及存储介质
JP7213890B2 (ja) 高速化された大規模な類似度計算
CN116861875A (zh) 基于人工智能的文本处理方法、装置、设备及存储介质
CN111353302A (zh) 医学词义识别方法、装置、计算机设备和存储介质
CN116230220A (zh) 健康评估方法、装置、计算机设备及存储介质
US10846616B1 (en) System and method for enhanced characterization of structured data for machine learning
CN111816276B (zh) 患教教程推荐方法、装置、计算机设备和存储介质
CN114496231A (zh) 基于知识图谱的体质识别方法、装置、设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination