CN116992861A - 基于数据处理的医疗服务智慧处理方法及系统 - Google Patents
基于数据处理的医疗服务智慧处理方法及系统 Download PDFInfo
- Publication number
- CN116992861A CN116992861A CN202311235614.3A CN202311235614A CN116992861A CN 116992861 A CN116992861 A CN 116992861A CN 202311235614 A CN202311235614 A CN 202311235614A CN 116992861 A CN116992861 A CN 116992861A
- Authority
- CN
- China
- Prior art keywords
- text
- semantic
- medical service
- intelligent medical
- processed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012545 processing Methods 0.000 title claims description 157
- 238000003672 processing method Methods 0.000 title claims description 14
- 238000004458 analytical method Methods 0.000 claims abstract description 180
- 238000005065 mining Methods 0.000 claims abstract description 120
- 230000003993 interaction Effects 0.000 claims abstract description 108
- 238000000034 method Methods 0.000 claims abstract description 104
- 238000000605 extraction Methods 0.000 claims abstract description 57
- 230000008569 process Effects 0.000 claims description 57
- 238000012549 training Methods 0.000 claims description 51
- 239000013598 vector Substances 0.000 claims description 43
- 235000019580 granularity Nutrition 0.000 claims description 42
- 230000002776 aggregation Effects 0.000 claims description 17
- 238000004220 aggregation Methods 0.000 claims description 17
- 238000011144 upstream manufacturing Methods 0.000 claims description 17
- 230000002452 interceptive effect Effects 0.000 claims description 15
- 238000004590 computer program Methods 0.000 claims description 6
- 238000001212 derivatisation Methods 0.000 claims description 4
- 238000011068 loading method Methods 0.000 claims description 4
- 230000009191 jumping Effects 0.000 claims description 3
- 230000004931 aggregating effect Effects 0.000 claims description 2
- 208000024891 symptom Diseases 0.000 description 32
- 239000011159 matrix material Substances 0.000 description 26
- 206010008479 Chest Pain Diseases 0.000 description 18
- 208000000059 Dyspnea Diseases 0.000 description 15
- 206010013975 Dyspnoeas Diseases 0.000 description 15
- 238000013461 design Methods 0.000 description 12
- 208000019622 heart disease Diseases 0.000 description 12
- 230000009286 beneficial effect Effects 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 238000005457 optimization Methods 0.000 description 8
- 238000011156 evaluation Methods 0.000 description 7
- 208000013738 Sleep Initiation and Maintenance disease Diseases 0.000 description 6
- 238000012790 confirmation Methods 0.000 description 6
- 206010061428 decreased appetite Diseases 0.000 description 6
- 206010022437 insomnia Diseases 0.000 description 6
- 206010008469 Chest discomfort Diseases 0.000 description 5
- 206010013082 Discomfort Diseases 0.000 description 5
- 206010033557 Palpitations Diseases 0.000 description 5
- 206010037660 Pyrexia Diseases 0.000 description 5
- 210000000748 cardiovascular system Anatomy 0.000 description 5
- 238000009795 derivation Methods 0.000 description 5
- 208000035474 group of disease Diseases 0.000 description 5
- 208000013220 shortness of breath Diseases 0.000 description 5
- 208000002193 Pain Diseases 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000002372 labelling Methods 0.000 description 4
- 238000003860 storage Methods 0.000 description 4
- 238000010200 validation analysis Methods 0.000 description 4
- 238000012795 verification Methods 0.000 description 4
- 206010019233 Headaches Diseases 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 231100000869 headache Toxicity 0.000 description 3
- 230000036541 health Effects 0.000 description 3
- 238000007781 pre-processing Methods 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 206010040007 Sense of oppression Diseases 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 230000035807 sensation Effects 0.000 description 2
- 235000019615 sensations Nutrition 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 206010063385 Intellectualisation Diseases 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000003759 clinical diagnosis Methods 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000002059 diagnostic imaging Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000011049 filling Methods 0.000 description 1
- 230000008570 general process Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000029058 respiratory gaseous exchange Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
- G06F40/35—Discourse or dialogue representation
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Mathematical Physics (AREA)
- Human Computer Interaction (AREA)
- Machine Translation (AREA)
Abstract
本发明涉及智慧医疗技术领域,具体提供一种基于数据处理的医疗服务智慧处理方法及系统,基于目标对话文本单元集能够确定与目标智慧医疗服务项目对应的项目文本抽取内容,能从待处理智慧医疗服务交互文本记录中准确抽取出目标项目所需的关键信息,实现了智慧医疗服务交互文本记录的全面分析和语义解析以准确抽取出目标项目所需的信息,为后续处理和分析提供了可靠基础。通过使用文本语义挖掘和解析方法可以快速有效地处理智慧医疗服务交互文本记录,能以较高的时效性将原始文本转化为会话文本语义矩阵并对文本进行深入理解,通过基于目标对话文本单元集确定与目标项目对应的项目文本抽取内容能快速获取与目标智慧医疗服务项目相关的关键信息。
Description
技术领域
本发明涉及智慧医疗技术领域,特别涉及一种基于数据处理的医疗服务智慧处理方法及系统。
背景技术
智慧医疗是指应用先进的信息技术和人工智能等技术手段,将智能化和数字化应用于医疗领域,以改善医疗服务的质量、效率和可访问性。它涵盖了多个方面,包括医疗数据的数字化、电子病历管理、远程医疗、医疗影像诊断、健康监测和预测、医疗机器人、基因组学和精准医学等。
智慧医疗借助信息技术和人工智能的发展,可以实现医疗数据的高效存储、共享和分析,提升医生和医疗机构的决策支持能力,改善临床诊断和治疗效果。同时,智慧医疗还可以提供更便捷的医疗服务,如远程医疗技术可以使患者不受地理限制地获取医疗咨询和诊断,减少患者的就医负担。
在智慧医疗的应用过程中,对智慧医疗服务的大数据分析至关重要,而如何基于文本层面准确高效地对智慧医疗服务进行关键内容抽取,则是现目前需要攻克的一个技术难题。
发明内容
为改善相关技术中存在的技术问题,本发明提供了一种基于数据处理的医疗服务智慧处理方法及系统。
第一方面,本发明实施例提供了一种基于数据处理的医疗服务智慧处理方法,应用于AI交互处理系统,所述方法包括:该方法至少包括:
对待处理智慧医疗服务交互文本记录进行文本语义挖掘处理,得到若干个不同文本细粒度的会话文本语义矩;
依据所述若干个不同文本细粒度的会话文本语义矩进行第一语义解析处理,得到已标注智慧医疗服务交互文本记录,所述已标注智慧医疗服务交互文本记录用于在文本特征维度下从所述待处理智慧医疗服务交互文本记录中抽取得到目标智慧医疗服务项目;
依据所述若干个不同文本细粒度的会话文本语义矩和所述已标注智慧医疗服务交互文本记录进行第二语义解析处理,得到若干个不同词句状态的拟处理对话文本单元集;
通过各拟处理对话文本单元集中包括的目标智慧医疗服务项目和非项目文本单元集之间的区分关键词向量,对所述若干个不同词句状态的拟处理对话文本单元集进行优化处理,得到目标对话文本单元集;
基于所述目标对话文本单元集确定与所述目标智慧医疗服务项目对应的项目文本抽取内容。
在一些示例下,所述方法通过深度结构化语义网络DSSN实施,所述深度结构化语义网络DSSN包括由若干个文本语义挖掘模块组成的语义挖掘分支、由若干个第一文本语义解析模块组成的第一语义解析分支、由若干个第二文本语义解析模块组成的第二语义解析分支;其中,所述语义挖掘分支用于对待处理智慧医疗服务交互文本记录进行文本语义挖掘处理,所述第一语义解析分支用于进行第一语义解析处理,所述第二语义解析分支用于进行第二语义解析处理。
在一些示例下,所述对待处理智慧医疗服务交互文本记录进行文本语义挖掘处理,得到若干个不同文本细粒度的会话文本语义矩,包括:
获取待处理智慧医疗服务交互文本记录,并将所述待处理智慧医疗服务交互文本记录加载到语义挖掘分支中;
通过所述语义挖掘分支中的若干个文本语义挖掘模块依次依据所述文本语义挖掘模块各自对应的待挖掘文本信息进行文本语义挖掘处理,得到各个文本语义挖掘模块分别生成的会话文本语义矩;
其中,下游的文本语义挖掘模块的待挖掘文本信息中包括有上游的文本语义挖掘模块生成的会话文本语义矩,所述语义挖掘分支中首个文本语义挖掘模块的待挖掘文本信息为所述待处理智慧医疗服务交互文本记录,所述语义挖掘分支中不同文本语义挖掘模块生成的会话文本语义矩的文本细粒度存在差异。
在一些示例下,所述依据所述若干个不同文本细粒度的会话文本语义矩进行第一语义解析处理,得到已标注智慧医疗服务交互文本记录,包括:
依据所述若干个不同文本细粒度的会话文本语义矩,并通过第一语义解析分支中的若干个第一文本语义解析模块依次依据所述第一文本语义解析模块各自对应的待挖掘文本信息进行第一语义解析处理,直到依据末尾的第一文本语义解析模块生成已标注智慧医疗服务交互文本记录;
其中,对于所述第一语义解析分支中的当前的第一文本语义解析模块的待挖掘文本信息,包括有上游的第一文本语义解析模块对应的语义解析结果,以及与所述当前的第一文本语义解析模块相对应的文本语义挖掘模块生成的会话文本语义矩,所述当前的第一文本语义解析模块对应的语义解析结果用于生成下游的第一文本语义解析模块的待挖掘文本信息。
在一些示例下,所述依据所述若干个不同文本细粒度的会话文本语义矩和所述已标注智慧医疗服务交互文本记录进行第二语义解析处理,得到若干个不同词句状态的拟处理对话文本单元集,包括:
确定所述第二语义解析分支中每个第二文本语义解析模块各自对应的待挖掘文本信息,其中,所述第二文本语义解析模块所对应的待挖掘文本信息包括相对应的文本语义挖掘模块生成的会话文本语义矩、以及顺序优先级大于所述第二文本语义解析模块的上游第二文本语义解析模块生成的拟处理对话文本单元集,并且,至少一部分的第二文本语义解析模块所对应的待挖掘文本信息中还包括所述已标注智慧医疗服务交互文本记录;
通过所述第二语义解析分支中的若干个第二文本语义解析模块依次依据所述第二文本语义解析模块各自对应的待挖掘文本信息进行第二语义解析处理,得到各个第二文本语义解析模块分别生成的拟处理对话文本单元集,其中,各所述第二文本语义解析模块生成的拟处理对话文本单元集的词句状态不同。
在一些示例下,所述通过各拟处理对话文本单元集中包括的目标智慧医疗服务项目和非项目文本单元集之间的区分关键词向量,对所述若干个不同词句状态的拟处理对话文本单元集进行优化处理,得到目标对话文本单元集,包括:
将当前词句状态的拟处理对话文本单元集扩展到与连续的后一个词句状态的拟处理对话文本单元集相同的文本细粒度,得到完成扩展的拟处理对话文本单元集;
提取所述完成扩展的拟处理对话文本单元集中目标智慧医疗服务项目与非项目文本单元集之间的区分性文本段落,所述区分性文本段落中包括区分关键词向量;
依据所述区分性文本段落和所述连续的后一个词句状态的拟处理对话文本单元集进行聚合处理,得到已优化对话文本单元集;
将所述已优化对话文本单元集作为后一循环中的当前词句状态的拟处理对话文本单元集,跳转至所述将当前词句状态的拟处理对话文本单元集扩展到与连续的后一个词句状态的拟处理对话文本单元集相同的文本细粒度的步骤,直到获得最后一级词句状态的拟处理对话文本单元集所对应的已优化对话文本单元集时终止;
将所述最后一级词句状态的拟处理对话文本单元集所对应的已优化对话文本单元集作为目标对话文本单元集。
在一些示例下,所述依据所述区分性文本段落和所述连续的后一个词句状态的拟处理对话文本单元集进行聚合处理,得到已优化对话文本单元集,包括:
对所述区分性文本段落进行文本重构操作,得到重构区分性文本段落,所述文本重构操作包括文本模糊和文本衍生中的至少一种;
将所述重构区分性文本段落和所述连续的后一个词句状态的拟处理对话文本单元集进行聚合处理,得到已优化对话文本单元集。
在一些示例下,所述方法还包括:依据所述若干个不同文本细粒度的会话文本语义矩和所述已标注智慧医疗服务交互文本记录进行第二语义解析处理,得到包括所述目标智慧医疗服务项目的关键交互文本;
所述基于所述目标对话文本单元集确定与所述目标智慧医疗服务项目对应的项目文本抽取内容,包括:将所述关键交互文本和所述目标对话文本单元集进行聚合处理,得到与所述目标智慧医疗服务项目对应的项目文本抽取内容。
在一些示例下,所述方法通过深度结构化语义网络DSSN实施,所述深度结构化语义网络DSSN通过网络调试所得,该网络调试的方法包括:
获取第一训练智慧医疗服务咨询文本集和第二训练智慧医疗服务咨询文本集,所述第一训练智慧医疗服务咨询文本集中包括有第一训练智慧医疗服务咨询文本、以及与所述第一训练智慧医疗服务咨询文本对应的先验拆解注释,所述第二训练智慧医疗服务咨询文本集中包括有第二训练智慧医疗服务咨询文本、以及与所述第二训练智慧医疗服务咨询文本对应的先验抽取注释;
确定待调试的深度结构化语义网络DSSN,所述待调试的深度结构化语义网络DSSN包括通用语义挖掘分支、通用第一语义解析分支和通用第二语义解析分支;
通过所述第一训练智慧医疗服务咨询文本集对所述通用语义挖掘分支和通用第一语义解析分支进行第一调试,直到符合第一终止要求时终止,得到完成调试的语义挖掘分支和第一语义解析分支;
通过所述第二训练智慧医疗服务咨询文本集,并基于完成调试的语义挖掘分支和第一语义解析分支对所述通用第二语义解析分支进行第二调试,直到符合第二终止要求时终止,得到完成调试的第二语义解析分支,以获得完成调试的深度结构化语义网络DSSN;
其中,所述完成调试的深度结构化语义网络DSSN用于确定与待处理智慧医疗服务交互文本记录中的目标智慧医疗服务项目对应的项目文本抽取内容。
第二方面,本发明还提供了一种AI交互处理系统,包括处理器和存储器;所述处理器和所述存储器通信连接,所述处理器用于从所述存储器中读取计算机程序并执行,以实现上述的方法。
第三方面,本发明还提供了一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现上述的方法。
本发明实施例提出的基于数据处理的医疗服务智慧处理方法及系统,通过文本语义挖掘处理,能够将待处理的智慧医疗服务交互文本记录转化为会话文本语义矩阵,这有助于更全面地理解对话中的语义信息。随后,利用第一语义解析处理,可以将会话文本语义矩阵进一步转换为已标注的智慧医疗服务交互文本记录,这个步骤使能够准确地识别出症状、问题和信息等与目标项目相关的内容。借助第二语义解析处理,能够根据不同词句状态生成拟处理对话文本单元集,这一过程有助于深入理解对话中的意图和信息流动,为后续处理提供更准确的基础。通过区分关键词向量,能够将目标智慧医疗服务项目和非项目文本单元集进行区分,从而更精确地确定与目标项目相关的内容。经过优化处理拟处理对话文本单元集,得到了目标对话文本单元集,这一步骤确保了目标智慧医疗服务项目的文本单元被准确提取和整理,为后续处理提供了更清晰的数据。最终,基于目标对话文本单元集,能够确定与目标智慧医疗服务项目对应的项目文本抽取内容,能够从待处理智慧医疗服务交互文本记录中准确抽取出目标项目所需的关键信息。可见,本发明实施例的有益效果在于实现了智慧医疗服务交互文本记录的全面分析和语义解析,准确抽取出目标项目所需的信息,为进一步的处理和分析提供了可靠的基础。
进一步地,通过使用文本语义挖掘和解析方法,可以快速有效地处理智慧医疗服务交互文本记录,这种方法能够以较高的时效性将原始文本转化为会话文本语义矩阵,并对文本进行深入理解。使用第一语义解析处理,能够快速标注已标注的智慧医疗服务交互文本记录,识别出与目标项目相关的内容,这有助于减少人工标注的时间和精力成本,提高整体处理效率。第二语义解析处理可以帮助在不同词句状态下生成拟处理对话文本单元集,这个步骤的快速实施使得后续处理更加高效,减少了额外的计算开销。利用区分关键词向量进行优化处理,能够快速而准确地区分目标智慧医疗服务项目和非项目内容,这种高效区分有助于精确确定目标对话文本单元集,节约了进一步处理所需的时间和计算资源。最终,通过基于目标对话文本单元集确定与目标项目对应的项目文本抽取内容,能够快速获取与目标智慧医疗服务项目相关的关键信息,这有助于快速了解用户需求,并进行相应的响应和处理,节省了处理时间和计算开销。可见,这种处理方法从时效性和运算开销的角度来看,能够高效地分析和处理智慧医疗服务交互文本记录,提高处理效率并节约时间和资源成本。
附图说明
图1是本发明实施例提供的一种基于数据处理的医疗服务智慧处理方法的流程示意图。
图2是本发明实施例提供的一种基于数据处理的医疗服务智慧处理系统的通信架构示意图。
附图标记:
10-AI交互处理系统;
20-智慧医疗服务器;
30-基于数据处理的医疗服务智慧处理系统。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
本发明实施例所提供的方法实施例可以在AI交互处理系统、计算机设备或者类似的运算装置中执行。以运行在AI交互处理系统上为例,AI交互处理系统可以包括一个或多个处理器(处理器可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)和用于存储数据的存储器,可选地,上述AI交互处理系统还可以包括用于通信功能的传输装置。本领域普通技术人员可以理解,上述结构仅为示意,其并不对上述AI交互处理系统的结构造成限定。例如,AI交互处理系统还可包括比上述所示更多或者更少的组件,或者具有与上述所示不同的配置。
存储器可用于存储计算机程序,例如,应用软件的软件程序以及模块,如本发明实施例中的一种基于数据处理的医疗服务智慧处理方法对应的计算机程序,处理器通过运行存储在存储器内的计算机程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器可进一步包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至AI交互处理系统。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置用于经由一个网络接收或者发送数据。上述的网络具体实例可包括AI交互处理系统的通信供应商提供的无线网络。在一个实例中,传输装置包括一个网络适配器(Network Interface Controller,简称为NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置可以为射频(Radio Frequency,简称为RF)模块,其用于通过无线方式与互联网进行通讯。
基于此,请参阅图1,图1是本发明实施例所提供的一种基于数据处理的医疗服务智慧处理方法的流程示意图,该方法应用于AI交互处理系统,进一步可以包括步骤101-步骤105。
步骤101、对待处理智慧医疗服务交互文本记录进行文本语义挖掘处理,得到若干个不同文本细粒度的会话文本语义矩。
步骤102、依据所述若干个不同文本细粒度的会话文本语义矩进行第一语义解析处理,得到已标注智慧医疗服务交互文本记录,所述已标注智慧医疗服务交互文本记录用于在文本特征维度下从所述待处理智慧医疗服务交互文本记录中抽取得到目标智慧医疗服务项目。
步骤103、依据所述若干个不同文本细粒度的会话文本语义矩和所述已标注智慧医疗服务交互文本记录进行第二语义解析处理,得到若干个不同词句状态的拟处理对话文本单元集。
步骤104、通过各拟处理对话文本单元集中包括的目标智慧医疗服务项目和非项目文本单元集之间的区分关键词向量,对所述若干个不同词句状态的拟处理对话文本单元集进行优化处理,得到目标对话文本单元集。
步骤105、基于所述目标对话文本单元集确定与所述目标智慧医疗服务项目对应的项目文本抽取内容。
针对上述步骤101-步骤105,首先以一个完整的示例进行说明,一段智慧医疗服务交互文本记录示例如下:
“
智慧医疗用户:我最近总是感到疲劳乏力。
智慧医疗AI chat robot:请问您是否出现其他症状?
智慧医疗用户:我也有失眠和食欲不振的问题。
智慧医疗AI chat robot:这些症状可能与多种原因有关。建议您咨询医生进行进一步评估。
智慧医疗用户:好的,我会尽快预约医生。还想了解一下关于心脏病的相关信息。
智慧医疗AI chat robot:心脏病是一类心血管系统疾病的统称。常见症状包括胸闷、气短、心悸等。如需详细了解,请咨询专业医生。
智慧医疗用户:谢谢你的建议。
”
在上述示例中,将依次进行处理。
(1)进行文本语义挖掘处理,生成会话文本语义矩阵(也即会话文本语义特征集)。
(2)进行第一语义解析处理,标注文本记录为以下形式:
“
智慧医疗用户:[症状] 我最近总是感到疲劳乏力。
智慧医疗AI chat robot:[问题] 请问您是否出现其他症状?
智慧医疗用户:[症状] 我也有失眠和食欲不振的问题。
智慧医疗AI chat robot:[建议] 这些症状可能与多种原因有关。建议您咨询医生进行进一步评估。
智慧医疗用户:[确认] 好的,我会尽快预约医生。还想了解一下关于心脏病的相关信息。
智慧医疗AI chat robot:[信息] 心脏病是一类心血管系统疾病的统称。常见症状包括胸闷、气短、心悸等。如需详细了解,请咨询专业医生。
智慧医疗用户:[结束] 谢谢你的建议。
”
(3)从已标注的文本记录中提取目标智慧医疗服务项目,确定为症状和信息。
(4)进行第二语义解析处理,生成拟处理对话文本单元集。
拟处理对话文本单元集1:
[症状] 我最近总是感到疲劳乏力。
[问题] 请问您是否出现其他症状?
拟处理对话文本单元集2:
[症状] 我也有失眠和食欲不振的问题。
[建议] 这些症状可能与多种原因有关。建议您咨询医生进行进一步评估。
拟处理对话文本单元集3:
[确认] 好的,我会尽快预约医生。还想了解一下关于心脏病的相关信息。
[信息] 心脏病是一类心血管系统疾病的统称。常见症状包括胸闷、气短、心悸等。如需详细了解,请咨询专业医生。
(5)通过区分关键词向量,将目标智慧医疗服务项目和非项目文本单元集进行区分。在这个示例中,症状、问题和信息属于目标项目。
(6)经过优化处理,得到目标对话文本单元集
目标对话文本单元集1:
[症状] 我最近总是感到疲劳乏力。
[问题] 请问您是否出现其他症状?
目标对话文本单元集2:
[症状] 我也有失眠和食欲不振的问题。
目标对话文本单元集3:
[确认] 好的,我会尽快预约医生。还想了解一下关于心脏病的相关信息。
[信息] 心脏病是一类心血管系统疾病的统称。常见症状包括胸闷、气短、心悸等。如需详细了解,请咨询专业医生。
(7)根据目标对话文本单元集中的每个文本单元,进行项目文本抽取。根据示例对话,可以确定以下项目文本抽取内容:
“
目标对话文本单元集1:
症状:我最近总是感到疲劳乏力。
问题:请问您是否出现其他症状?
目标对话文本单元集2:
症状:我也有失眠和食欲不振的问题。
目标对话文本单元集3:
确认:好的,我会尽快预约医生。还想了解一下关于心脏病的相关信息。
信息:心脏病是一类心血管系统疾病的统称。常见症状包括胸闷、气短、心悸等。如需详细了解,请咨询专业医生。
”
通过提取目标对话文本单元集中的关键内容,得到了与目标智慧医疗服务项目对应的项目文本抽取内容。
可见,通过文本语义挖掘处理,能够将待处理的智慧医疗服务交互文本记录转化为会话文本语义矩阵,这有助于更全面地理解对话中的语义信息。随后,利用第一语义解析处理,可以将会话文本语义矩阵进一步转换为已标注的智慧医疗服务交互文本记录,这个步骤使能够准确地识别出症状、问题和信息等与目标项目相关的内容。借助第二语义解析处理,能够根据不同词句状态生成拟处理对话文本单元集,这一过程有助于深入理解对话中的意图和信息流动,为后续处理提供更准确的基础。通过区分关键词向量,能够将目标智慧医疗服务项目和非项目文本单元集进行区分,从而更精确地确定与目标项目相关的内容。经过优化处理拟处理对话文本单元集,得到了目标对话文本单元集,这一步骤确保了目标智慧医疗服务项目的文本单元被准确提取和整理,为后续处理提供了更清晰的数据。最终,基于目标对话文本单元集,能够确定与目标智慧医疗服务项目对应的项目文本抽取内容,能够从待处理智慧医疗服务交互文本记录中准确抽取出目标项目所需的关键信息。可见,本发明实施例的有益效果在于实现了智慧医疗服务交互文本记录的全面分析和语义解析,准确抽取出目标项目所需的信息,为进一步的处理和分析提供了可靠的基础。
进一步地,通过使用文本语义挖掘和解析方法,可以快速有效地处理智慧医疗服务交互文本记录,这种方法能够以较高的时效性将原始文本转化为会话文本语义矩阵,并对文本进行深入理解。使用第一语义解析处理,能够快速标注已标注的智慧医疗服务交互文本记录,识别出与目标项目相关的内容,这有助于减少人工标注的时间和精力成本,提高整体处理效率。第二语义解析处理可以帮助在不同词句状态下生成拟处理对话文本单元集,这个步骤的快速实施使得后续处理更加高效,减少了额外的计算开销。利用区分关键词向量进行优化处理,能够快速而准确地区分目标智慧医疗服务项目和非项目内容,这种高效区分有助于精确确定目标对话文本单元集,节约了进一步处理所需的时间和计算资源。最终,通过基于目标对话文本单元集确定与目标项目对应的项目文本抽取内容,能够快速获取与目标智慧医疗服务项目相关的关键信息,这有助于快速了解用户需求,并进行相应的响应和处理,节省了处理时间和计算开销。可见,这种处理方法从时效性和运算开销的角度来看,能够高效地分析和处理智慧医疗服务交互文本记录,提高处理效率并节约时间和资源成本。
在一些可能的实施例中,文本语义挖掘处理是指对待处理的智慧医疗服务交互文本记录进行处理,通过自然语言处理技术来理解和抽取文本中的语义信息。
在一些可能的实施例中,不同文本细粒度的会话文本语义矩阵是指在文本语义挖掘处理过程中,将待处理的智慧医疗服务交互文本记录转化为会话文本语义矩阵。这个会话文本语义矩阵以不同的文本细粒度(尺度)来表示对话中的语义信息,包括发言者、对话内容、意图和实体等。
在一些可能的实施例中,文本特征维度是指在处理智慧医疗服务交互文本记录时,根据文本语义挖掘和语义解析的结果,对文本进行标注和分类,并基于这些标注和分类进行进一步的优化处理,通过文本特征维度的处理,可以从原始文本中提取出与目标智慧医疗服务项目相关的信息。在步骤102中,在进行第一语义解析处理时,文本记录被标注为不同的类别或类型,这些类别包括症状、问题、建议、信息和确认等,这样的标注可以帮助识别出文本中的关键信息,并将其用于后续的处理,因此第一语义解析处理还可以理解为基于标注的语义解码处理。在步骤104中,通过区分关键词向量,对拟处理对话文本单元集进行优化处理。这意味着根据关键词向量的差异,将拟处理对话文本单元集中的目标智慧医疗服务项目和非项目文本单元集进行区分,这样的处理有助于更准确地提取出与目标项目相关的文本内容。
因此,文本特征维度的优化处理可以帮助识别和提取出与目标智慧医疗服务项目相关的信息,从而生成目标对话文本单元集和项目文本抽取内容,这样的处理过程可以帮助实现智慧医疗服务的自动化和个性化,在交互中提供更准确和有针对性的建议和信息。
在一些可能的实施例中,词句状态指的是拟处理对话文本单元集中的每个文本单元所表达的语义状态或功能。在步骤103中,通过第二语义解析处理,生成了不同词句状态的拟处理对话文本单元集。在示例中,拟处理对话文本单元集1包含了症状和问题两个词句状态。拟处理对话文本单元集2包含了症状和建议两个词句状态。拟处理对话文本单元集3包含了确认和信息两个词句状态。这些词句状态反映了对话中的不同意图或目的。例如,症状表示用户提到自己感到疲劳乏力、失眠和食欲不振的问题。问题表示AI chat robot询问是否出现其他症状。建议表示AI chat robot给出建议,提示用户咨询医生进行进一步评估。确认表示用户确认自己会尽快预约医生,并提出关于心脏病的相关信息的需求。信息表示AI chat robot提供了关于心脏病的相关信息。通过识别和理解这些词句状态,可以更好地分析和处理对话文本,进而生成目标对话文本单元集和项目文本抽取内容,为智慧医疗服务提供有针对性的回应和建议。
在步骤104中,区分关键词向量和优化处理起着重要作用。区分关键词向量是一组特定的词汇或短语,用于识别目标智慧医疗服务项目和非项目文本单元集之间的差异,这些关键词向量被设计为与目标项目相关的词汇,可以是症状、问题、建议等方面的关键词,通过比较拟处理对话文本单元集中包含的关键词向量与区分关键词向量,可以确定哪些文本单元属于目标项目,哪些不属于。优化处理是对拟处理对话文本单元集进行改进和提炼,以获得更准确和有针对性的目标对话文本单元集,这一步骤主要通过剔除非项目文本单元和保留与目标项目相关的文本单元来实现。根据区分关键词向量的结果,可以将不属于目标项目的文本单元排除,只保留与目标项目相关的内容。通过优化处理,得到的目标对话文本单元集更加精炼和具体,符合要提取的目标智慧医疗服务项目。综合来说,区分关键词向量用于识别目标智慧医疗服务项目和非项目文本单元集之间的差异,而优化处理则通过使用区分关键词向量的结果,对拟处理对话文本单元集进行筛选和改进,以得到最终的目标对话文本单元集。这样做可以确保提取的项目文本抽取内容与目标智慧医疗服务项目一致,提高了精度和准确性。
在另外一些可选的实施例中,所述方法通过深度结构化语义网络DSSN实施,所述深度结构化语义网络DSSN包括由若干个文本语义挖掘模块组成的语义挖掘分支、由若干个第一文本语义解析模块组成的第一语义解析分支、由若干个第二文本语义解析模块组成的第二语义解析分支。进一步地,所述语义挖掘分支用于对待处理智慧医疗服务交互文本记录进行文本语义挖掘处理,所述第一语义解析分支用于进行第一语义解析处理,所述第二语义解析分支用于进行第二语义解析处理。
在本发明实施例中,基于本发明实施例构建的深度结构化语义网络(DeepStructured Semantic Network,DSSN)是一个包含多个模块的系统,用于处理智慧医疗服务交互文本记录的语义分析任务。它主要由三个分支组成:语义挖掘分支、第一语义解析分支和第二语义解析分支。
(1)语义挖掘分支是用于对待处理的智慧医疗服务交互文本记录进行文本语义挖掘处理的部分。它利用文本挖掘技术,从文本中提取出有意义的信息和语义,并将其转化为结构化的形式,以便后续处理和分析。
(2)第一语义解析分支是用于进行第一层次的语义解析处理的部分。它使用一系列的文本语义解析模块,对输入的文本进行解析,以获取更加准确和详细的语义信息。这些模块可能包括词性标注、句法分析、命名实体识别等技术,用于理解文本中的词汇、句法结构和实体信息。
(3)第二语义解析分支是用于进行第二层次的语义解析处理的部分。它也由多个文本语义解析模块组成,但与第一语义解析分支不同的是,第二语义解析分支更加关注语义的深层次理解和推理。这些模块可能包括语义角色标注、语义依存分析、逻辑推理等技术,用于进一步抽取文本中的语义关系、逻辑结构和推理链条。
综合来看,DSSN利用多个模块组成的不同分支,通过语义挖掘和语义解析的过程,对智慧医疗服务交互文本记录进行结构化和深度的语义理解。这种网络结构能够提供更准确、全面和高级别的语义表达,为智慧医疗领域的自动化处理和决策提供强有力的支持。
在一些优选的设计思路下,步骤101中的对待处理智慧医疗服务交互文本记录进行文本语义挖掘处理,得到若干个不同文本细粒度的会话文本语义矩,包括步骤1011和步骤1012。
步骤1011、获取待处理智慧医疗服务交互文本记录,并将所述待处理智慧医疗服务交互文本记录加载到语义挖掘分支中。
步骤1012、通过所述语义挖掘分支中的若干个文本语义挖掘模块依次依据所述文本语义挖掘模块各自对应的待挖掘文本信息进行文本语义挖掘处理,得到各个文本语义挖掘模块分别生成的会话文本语义矩。
在该设计思路中,下游的文本语义挖掘模块的待挖掘文本信息中包括有上游的文本语义挖掘模块生成的会话文本语义矩,所述语义挖掘分支中首个文本语义挖掘模块的待挖掘文本信息为所述待处理智慧医疗服务交互文本记录,所述语义挖掘分支中不同文本语义挖掘模块生成的会话文本语义矩的文本细粒度存在差异。进一步地,上游的文本语义挖掘模块可以理解为在前的文本语义挖掘模块,下游的文本语义挖掘模块可以理解为在后的文本语义挖掘模块。
在这个设计思路中,假设有一个智慧医疗服务系统,需要对用户的交互文本记录进行语义挖掘处理。下面是具体的步骤:获取待处理的智慧医疗服务交互文本记录,并将这些文本加载到语义挖掘分支中作为输入;通过语义挖掘分支中的多个文本语义挖掘模块对待挖掘文本信息进行处理,生成不同细粒度的会话文本语义矩阵。
首先,第一个文本语义挖掘模块接收待处理的交互文本记录作为输入,进行语义挖掘处理,生成第一个会话文本语义矩阵。然后,第二个文本语义挖掘模块使用第一个会话文本语义矩阵作为输入,进行进一步的语义挖掘处理,生成第二个会话文本语义矩阵。同样地,接下来的文本语义挖掘模块依次使用上一个会话文本语义矩阵作为输入,进行语义挖掘处理,得到相应的会话文本语义矩阵。
这样,通过逐步处理,得到了多个不同细粒度的会话文本语义矩阵。需要注意的是,每个下游的文本语义挖掘模块的待挖掘文本信息中包括上游的文本语义挖掘模块生成的会话文本语义矩阵。而语义挖掘分支的第一个文本语义挖掘模块的待挖掘文本信息是最初的待处理交互文本记录。此外,不同的文本语义挖掘模块生成的会话文本语义矩阵在文本细粒度上可能存在差异。总之,这个设计思路通过逐层的文本语义挖掘处理,生成了多个不同细粒度的会话文本语义矩阵,以便进行进一步的处理和分析。
上述设计思路的有益效果包括以下几点:
1)细粒度的语义信息:通过逐层的文本语义挖掘处理,每个文本语义挖掘模块生成的会话文本语义矩阵都包含不同细粒度的语义信息。这使得系统能够更全面地理解用户的交互文本记录,并提供更准确、个性化的智慧医疗服务;
2)上下文关联:下游的文本语义挖掘模块的待挖掘文本信息中包括上游文本语义挖掘模块生成的会话文本语义矩阵。这样的设计让后续的语义挖掘模块能够利用前面已经提取的语义信息,从而建立起上下文关联,进一步深化对用户意图和需求的理解。
3)多层次特征提取:由于不同文本语义挖掘模块生成的会话文本语义矩阵在文本细粒度上存在差异,系统可以从不同层次上提取特征。上游模块可能关注基本的症状和问题,而下游模块则能够分析原因、给出建议等更高级的信息。这样的多层次特征提取有助于系统提供更全面、深入的智慧医疗服务。
4)灵活性和可扩展性:通过将文本语义挖掘处理划分为多个模块,系统具备了灵活性和可扩展性。可以根据需要添加、替换或调整不同的文本语义挖掘模块,以满足不同的应用场景和需求。
综上所述,上述设计思路的有益效果包括提供细粒度的语义信息、建立上下文关联、实现多层次特征提取,并具备灵活性和可扩展性,从而增强了智慧医疗服务系统的功能和性能。
在另一些优选的设计思路下,步骤102中的依据所述若干个不同文本细粒度的会话文本语义矩进行第一语义解析处理,得到已标注智慧医疗服务交互文本记录,包括:依据所述若干个不同文本细粒度的会话文本语义矩,并通过第一语义解析分支中的若干个第一文本语义解析模块依次依据所述第一文本语义解析模块各自对应的待挖掘文本信息进行第一语义解析处理,直到依据末尾的第一文本语义解析模块生成已标注智慧医疗服务交互文本记录。
其中,对于所述第一语义解析分支中的当前的第一文本语义解析模块的待挖掘文本信息,包括有上游的第一文本语义解析模块对应的语义解析结果,以及与所述当前的第一文本语义解析模块相对应的文本语义挖掘模块生成的会话文本语义矩,所述当前的第一文本语义解析模块对应的语义解析结果用于生成下游的第一文本语义解析模块的待挖掘文本信息。
在一些可能的示例下已得到了会话文本语义矩阵1、会话文本语义矩阵2和会话文本语义矩阵3。现在要进行第一语义解析处理,生成已标注的智慧医疗服务交互文本记录,也即,依据若干个不同文本细粒度的会话文本语义矩进行第一语义解析处理。
a.第一个第一文本语义解析模块(上游)接收会话文本语义矩阵1作为待挖掘文本信息,进行第一语义解析处理,生成第一个已标注的智慧医疗服务交互文本记录:已标注的智慧医疗服务交互文本记录1:“头痛”,“发烧”。
b.第二个第一文本语义解析模块(下游)使用已标注的智慧医疗服务交互文本记录1和会话文本语义矩阵2作为待挖掘文本信息,进行第一语义解析处理,生成第二个已标注的智慧医疗服务交互文本记录:已标注的智慧医疗服务交互文本记录2:“头痛且发烧”,“可能是发烧引起的”。
c.假设还有一个第三个第一文本语义解析模块(下游),使用已标注的智慧医疗服务交互文本记录2和会话文本语义矩阵3作为待挖掘文本信息,进行第一语义解析处理,生成最终的已标注的智慧医疗服务交互文本记录:最终的已标注的智慧医疗服务交互文本记录:“头痛且发烧”,“可能是发烧引起的”,“需要注意休息”,“喝水”。
通过这个示例,展示了如何使用第一语义解析分支对会话文本语义矩阵进行处理,生成已标注的智慧医疗服务交互文本记录。每个第一文本语义解析模块的待挖掘文本信息包括上游的语义解析结果和与当前模块相对应的会话文本语义矩阵。这样的设计使得后续的解析模块能够利用前面已经解析的信息,并根据不同细粒度的语义矩阵生成更加详细和准确的智慧医疗服务交互文本记录。
在又一些优选的实施例中,步骤103中的依据所述若干个不同文本细粒度的会话文本语义矩和所述已标注智慧医疗服务交互文本记录进行第二语义解析处理,得到若干个不同词句状态的拟处理对话文本单元集,包括步骤1031和步骤1032。
步骤1031、确定所述第二语义解析分支中每个第二文本语义解析模块各自对应的待挖掘文本信息,其中,所述第二文本语义解析模块所对应的待挖掘文本信息包括相对应的文本语义挖掘模块生成的会话文本语义矩、以及顺序优先级大于所述第二文本语义解析模块的上游第二文本语义解析模块生成的拟处理对话文本单元集,并且,至少一部分的第二文本语义解析模块所对应的待挖掘文本信息中还包括所述已标注智慧医疗服务交互文本记录。
步骤1032、通过所述第二语义解析分支中的若干个第二文本语义解析模块依次依据所述第二文本语义解析模块各自对应的待挖掘文本信息进行第二语义解析处理,得到各个第二文本语义解析模块分别生成的拟处理对话文本单元集,其中,各所述第二文本语义解析模块生成的拟处理对话文本单元集的词句状态不同。
在已经生成了已标注的智慧医疗服务交互文本记录的基础上,使用该文本记录作为输入进行第二语义解析处理,生成拟处理对话文本单元集。
对于步骤1031而言,确定每个第二文本语义解析模块的待挖掘文本信息。
第一个第二文本语义解析模块所对应的待挖掘文本信息包括会话文本语义矩阵和已标注的智慧医疗服务交互文本记录。
第二个第二文本语义解析模块所对应的待挖掘文本信息包括会话文本语义矩阵、上游第二文本语义解析模块生成的拟处理对话文本单元集和已标注的智慧医疗服务交互文本记录。
对于步骤1032而言,通过每个第二文本语义解析模块依次使用其对应的待挖掘文本信息进行第二语义解析处理,生成拟处理对话文本单元集。
第一个第二文本语义解析模块根据其对应的待挖掘文本信息,进行第二语义解析处理,生成第一个拟处理对话文本单元集。拟处理对话文本单元集可能包含症状描述和初步的检查建议等信息。
第二个第二文本语义解析模块根据其对应的待挖掘文本信息,进行第二语义解析处理,生成第二个拟处理对话文本单元集。拟处理对话文本单元集可能涉及进一步的诊断推理、治疗建议和随访计划等不同词句状态的信息。
通过这个示例,展示了如何使用第二语义解析分支对已标注的智慧医疗服务交互文本记录进行进一步的解析处理。每个第二文本语义解析模块的待挖掘文本信息可以包括会话文本语义矩阵、上游模块生成的拟处理对话文本单元集以及已标注的智慧医疗服务交互文本记录。这样的设计使得后续的解析模块能够基于不同的信息层次进行语义解析处理,并生成具有不同词句状态的拟处理对话文本单元集。这些拟处理对话文本单元集可用作候选的对话文本单元集,可以在后续的对话交互过程中用于进一步的决策和处理。
需要注意的是,上述示例旨在说明如何使用第二语义解析分支对已标注的智慧医疗服务交互文本记录进行进一步的解析处理,以生成拟处理对话文本单元集。该示例并未涉及特定的疾病诊断和治疗方法,并且仅描述了一个通用的过程框架。
在一些可选的实施例中,步骤104中的通过各拟处理对话文本单元集中包括的目标智慧医疗服务项目和非项目文本单元集之间的区分关键词向量,对所述若干个不同词句状态的拟处理对话文本单元集进行优化处理,得到目标对话文本单元集,包括步骤1041-步骤1045。
步骤1041、将当前词句状态的拟处理对话文本单元集扩展到与连续的后一个词句状态的拟处理对话文本单元集相同的文本细粒度,得到完成扩展的拟处理对话文本单元集。
步骤1042、提取所述完成扩展的拟处理对话文本单元集中目标智慧医疗服务项目与非项目文本单元集之间的区分性文本段落,所述区分性文本段落中包括区分关键词向量。
步骤1043、依据所述区分性文本段落和所述连续的后一个词句状态的拟处理对话文本单元集进行聚合处理,得到已优化对话文本单元集。
步骤1044、将所述已优化对话文本单元集作为后一循环中的当前词句状态的拟处理对话文本单元集,跳转至所述将当前词句状态的拟处理对话文本单元集扩展到与连续的后一个词句状态的拟处理对话文本单元集相同的文本细粒度的步骤,直到获得最后一级词句状态的拟处理对话文本单元集所对应的已优化对话文本单元集时终止。
步骤1045、将所述最后一级词句状态的拟处理对话文本单元集所对应的已优化对话文本单元集作为目标对话文本单元集。
下面结合步骤101-步骤105的示例,对步骤1041-步骤1045进行进一步介绍。
(1)提取区分性文本段落和关键词向量:
区分性文本段落1:“胸口闷痛,呼吸困难”;
关键词向量1:[“胸口闷痛”,“呼吸困难”];
区分性文本段落2:“其他不适”;
关键词向量2:[“其他不适”]。
(2)聚合处理并得到已优化的对话文本单元集:
已优化的对话文本单元1:“胸口闷痛,呼吸困难。请问您还有其他不适吗?”
已优化的对话文本单元2:“没有其他不适,只是胸口不舒服。”
(3)将已优化的对话文本单元集作为下一个循环的拟处理对话文本单元集,并继续迭代。
这样,通过步骤1041-步骤1045的优化处理过程,从原始对话文本单元集中提取了区分性文本段落(如胸口闷痛、呼吸困难、其他不适等)和关键词向量,并将其聚合为已优化的对话文本单元集,从而优化了对话内容的组织结构和信息表达。
进一步地,步骤1043中的依据所述区分性文本段落和所述连续的后一个词句状态的拟处理对话文本单元集进行聚合处理,得到已优化对话文本单元集,包括:对所述区分性文本段落进行文本重构操作,得到重构区分性文本段落,所述文本重构操作包括文本模糊和文本衍生中的至少一种;将所述重构区分性文本段落和所述连续的后一个词句状态的拟处理对话文本单元集进行聚合处理,得到已优化对话文本单元集。
在步骤1043中,根据所述区分性文本段落和连续的后一个词句状态的拟处理对话文本单元集进行聚合处理,并得到已优化对话文本单元集。这一过程包括对区分性文本段落进行文本重构操作,以生成重构区分性文本段落。文本重构操作可以采用文本模糊或文本衍生等方式之一。
举例来说,假设拟处理对话文本单元集如下:
拟处理对话文本单元1:“我最近感觉胸口闷痛,呼吸有些困难。”
拟处理对话文本单元2:“请问您还有其他不适吗?”
拟处理对话文本单元3:“没有其他不适,只是胸口不舒服。”
提取的区分性文本段落如下:
区分性文本段落1:“胸口闷痛,呼吸困难”
关键词向量1:[“胸口闷痛”,“呼吸困难”]
接下来进行文本重构操作,可以选择文本模糊或文本衍生中的一种方式。例如,采用文本模糊,将区分性文本段落重构为:“身体不适"。
然后,将重构区分性文本段落和连续的后一个词句状态的拟处理对话文本单元集进行聚合处理,得到已优化对话文本单元集:
已优化的对话文本单元1:“身体不适。请问您还有其他不适吗?”
已优化的对话文本单元2:“没有其他不适,只是胸口不舒服。”
通过步骤1043中的依据所述区分性文本段落和连续的后一个词句状态的拟处理对话文本单元集进行聚合处理的过程,使用文本重构操作(如文本模糊)对区分性文本段落进行处理,然后将重构区分性文本段落与连续的后一个词句状态的拟处理对话文本单元集进行聚合,最终得到了已优化的对话文本单元集。
当采用文本衍生作为文本重构操作时,可以将区分性文本段落进行进一步扩展或推导,以生成重构区分性文本段落。以下是一个示例:
假设拟处理对话文本单元集如下:
拟处理对话文本单元1:“我最近感觉胸口闷痛,呼吸有些困难。”
拟处理对话文本单元2:“请问您还有其他不适吗?”
拟处理对话文本单元3:“没有其他不适,只是胸口不舒服。”
提取的区分性文本段落如下:
区分性文本段落1:“胸口闷痛,呼吸困难”
关键词向量1:[“胸口闷痛”,“呼吸困难”]
然后进行文本衍生操作,可以使用同义词替换或相关词推导来扩展区分性文本段落。例如,将“胸口闷痛,呼吸困难”衍生为“胸部压迫感,呼吸不畅”。
接下来,将重构区分性文本段落和连续的后一个词句状态的拟处理对话文本单元集进行聚合处理,得到已优化对话文本单元集:
已优化的对话文本单元1:“胸部压迫感,呼吸不畅。请问您还有其他不适吗?”
已优化的对话文本单元2:“没有其他不适,只是胸口不舒服。”
通过采用文本衍生作为文本重构操作,并将重构区分性文本段落与连续的后一个词句状态的拟处理对话文本单元集进行聚合处理,得到了已优化的对话文本单元集。这样的处理过程可以进一步扩展和推导区分性文本段落,以增强对话内容的表达和准确性。
在另外的实施例中,所述方法还包括:依据所述若干个不同文本细粒度的会话文本语义矩和所述已标注智慧医疗服务交互文本记录进行第二语义解析处理,得到包括所述目标智慧医疗服务项目的关键交互文本。基于此,步骤105中的基于所述目标对话文本单元集确定与所述目标智慧医疗服务项目对应的项目文本抽取内容,包括:将所述关键交互文本和所述目标对话文本单元集进行聚合处理,得到与所述目标智慧医疗服务项目对应的项目文本抽取内容。
在另外的实施例中,该方法还包括以下步骤:依据多个不同文本细粒度的会话文本语义矩和已标注的智慧医疗服务交互文本记录进行第二语义解析处理。这一步骤旨在对会话文本进行深层次的语义分析,以获得更加准确和全面的信息。第二语义解析处理结果将包括与目标智慧医疗服务项目相关的关键交互文本。通过对语义解析处理后的结果进行筛选和提取,可以确定与所需智慧医疗服务项目直接相关的关键交互文本。
在步骤105中,根据目标对话文本单元集,确定与目标智慧医疗服务项目对应的项目文本抽取内容。这一步骤利用目标对话文本单元集中的信息,识别并提取与目标智慧医疗服务项目相关的文本内容。
将关键交互文本和目标对话文本单元集进行聚合处理,得到与目标智慧医疗服务项目对应的项目文本抽取内容。通过将关键交互文本与目标对话文本单元集合并为一个整体,生成了针对目标智慧医疗服务项目的文本抽取内容。
可见,该方法通过第二语义解析处理、关键交互文本的提取和目标对话文本单元集的聚合处理,实现了针对目标智慧医疗服务项目的项目文本抽取内容的生成。这样可以更准确地获取与目标服务项目相关的信息,提升智慧医疗服务的效果和质量。
在一些示例下,所述方法通过深度结构化语义网络DSSN实施,所述深度结构化语义网络DSSN通过网络调试所得,该网络调试的方法包括步骤201-步骤204。
步骤201、获取第一训练智慧医疗服务咨询文本集和第二训练智慧医疗服务咨询文本集,所述第一训练智慧医疗服务咨询文本集中包括有第一训练智慧医疗服务咨询文本、以及与所述第一训练智慧医疗服务咨询文本对应的先验拆解注释,所述第二训练智慧医疗服务咨询文本集中包括有第二训练智慧医疗服务咨询文本、以及与所述第二训练智慧医疗服务咨询文本对应的先验抽取注释。
步骤202、确定待调试的深度结构化语义网络DSSN,所述待调试的深度结构化语义网络DSSN包括通用语义挖掘分支、通用第一语义解析分支和通用第二语义解析分支。
步骤203、通过所述第一训练智慧医疗服务咨询文本集对所述通用语义挖掘分支和通用第一语义解析分支进行第一调试,直到符合第一终止要求时终止,得到完成调试的语义挖掘分支和第一语义解析分支。
步骤204、通过所述第二训练智慧医疗服务咨询文本集,并基于完成调试的语义挖掘分支和第一语义解析分支对所述通用第二语义解析分支进行第二调试,直到符合第二终止要求时终止,得到完成调试的第二语义解析分支,以获得完成调试的深度结构化语义网络DSSN。
其中,所述完成调试的深度结构化语义网络DSSN用于确定与待处理智慧医疗服务交互文本记录中的目标智慧医疗服务项目对应的项目文本抽取内容。
在一些示例下,下面是一个更详细完整的网络训练过程。
(1)数据准备
收集并整理样本智慧医疗服务咨询文本集,包括用户提问和回答。
根据每个智慧医疗服务咨询文本,生成对应的拆解标签,用于指示文本中涉及的语义拆解结构。
根据每个智慧医疗服务咨询文本,生成对应的抽取标签,用于指示需要从文本中提取的关键信息。
(2)网络架构设计
设计深度结构化语义网络DSSN,包括通用语义挖掘分支、通用第一语义解析分支和通用第二语义解析分支。这些分支可以采用适当的神经网络结构,如循环神经网络(RNN)或变换器(Transformer)等。
(3)数据预处理
将样本智慧医疗服务咨询文本集进行分词、编码等预处理操作,以便输入到网络中。
(4)网络训练
使用已预处理的样本智慧医疗服务咨询文本集作为训练数据,以及对应的拆解标签和抽取标签作为目标值。将训练数据输入到深度结构化语义网络DSSN中,通过前向传播计算输出结果。根据输出结果与目标值进行比较,并使用适当的损失函数(例如交叉熵损失)计算网络的损失。使用反向传播算法更新网络参数,以最小化损失函数。
(5)调试网络
对已训练的深度结构化语义网络DSSN进行调试,以优化其性能。使用第一训练智慧医疗服务咨询文本集对通用语义挖掘分支和通用第一语义解析分支进行第一次调试。这可能涉及参数微调、超参数调整等操作,直到满足第一终止要求为止。使用第二训练智慧医疗服务咨询文本集,并基于完成调试的语义挖掘分支和第一语义解析分支对通用第二语义解析分支进行第二次调试,直到满足第二终止要求为止。
(6)完成训练:
当深度结构化语义网络DSSN经过调试并且在验证集上表现良好时,可以认为训练过程完成。此时,已经得到了完成调试的深度结构化语义网络DSSN,可用于确定与待处理智慧医疗服务交互文本记录中的目标智慧医疗服务项目对应的项目文本抽取内容。
通过以上详细的网络训练过程,可以训练出一个适用于智慧医疗服务的深度结构化语义网络,该网络能够根据输入的智慧医疗服务咨询文本,准确地拆解语义结构并抽取关键信息,为后续的智慧医疗服务提供支持。
在另外的一些示例下,以下更详细地描述了网络训练过程的各个步骤和细节。
(1)数据准备
收集并整理大量的样本智慧医疗服务咨询文本集,包括用户的提问和医生的回答。为每个智慧医疗服务咨询文本生成相应的拆解标签,指示文本中涉及的语义拆解结构。例如,可以使用IOB(Inside-Outside-Beginning)或BIO(Beginning-Inside-Outside)编码方案进行标注。为每个智慧医疗服务咨询文本生成相应的抽取标签,指示需要从文本中提取的关键信息。这些标签可以是二进制的,表示是否存在某种实体或关键词。
(2)网络架构设计
设计深度结构化语义网络DSSN的具体架构。可以采用端到端的神经网络架构,如循环神经网络(RNN)、变换器(Transformer)或卷积神经网络(CNN),以便处理序列型数据。在网络中定义通用语义挖掘分支、通用第一语义解析分支和通用第二语义解析分支,用于不同层次的语义理解任务。
(3)数据预处理
对样本智慧医疗服务咨询文本集进行预处理,包括分词、编码和填充等操作,以便输入到网络中。可以使用常见的自然语言处理工具库(如NLTK或spaCy)进行处理。
(4)网络训练
将预处理后的样本数据输入到深度结构化语义网络DSSN中。通过前向传播计算网络输出结果,并将其与对应的拆解标签和抽取标签进行比较。使用适当的损失函数(如交叉熵损失)计算网络的损失,反映网络输出与目标标签的差异。
使用反向传播算法更新网络参数,以最小化损失函数。可以使用优化器(如Adam或SGD)来调整学习率并优化网络的训练过程。
(5)调试网络
使用第一训练智慧医疗服务咨询文本集对通用语义挖掘分支和通用第一语义解析分支进行第一次调试。可以尝试不同的超参数设置、正则化技术或其他优化策略,以提高网络性能。根据调试结果,微调网络参数和架构,直到满足第一终止要求,如达到预定的性能指标或收敛性要求。
(6)第二次调试
使用第二训练智慧医疗服务咨询文本集,并基于已完成调试的语义挖掘分支和第一语义解析分支对通用第二语义解析分支进行第二次调试。继续微调网络参数和架构,直到满足第二终止要求,如进一步提高性能或最小化损失函数值。
(7)完成训练
当深度结构化语义网络DSSN经过调试并在验证集上表现良好时,可以认为训练过程完成。已经得到了完成调试的深度结构化语义网络DSSN,它可以准确地拆解语义结构并抽取关键信息。
(8)验证和评估
使用独立于训练集的验证集对已调试的深度结构化语义网络DSSN进行验证和评估。在验证集上进行推理和预测,评估网络在拆解准确性和关键信息抽取准确性方面的性能。可以使用常见的评估指标,如准确率、召回率、F1分数等,来衡量网络的性能。
(9)超参数调优
对网络的超参数进行调优,以进一步提高性能。这些超参数包括学习率、批量大小、隐藏单元数、层数等。可以使用交叉验证或网格搜索等技术来尝试不同的超参数组合,并选择表现最佳的组合。
(10)迭代训练
如果验证结果不理想,可以进行进一步的迭代训练,重复步骤4到步骤9,直到达到期望的性能水平。在每个迭代中,可以根据验证集的性能调整网络架构、数据处理方法或其他相关因素。
(11)测试集评估
最终,使用测试集对已训练的深度结构化语义网络DSSN进行最终评估。在测试集上进行推理和预测,评估网络的拆解准确性和关键信息抽取准确性。这将提供对训练过程中网络性能的最终评估结果。
通过以上详细的网络训练过程,可以逐步优化深度结构化语义网络DSSN的性能,并为智慧医疗服务提供准确的语义理解和关键信息抽取。需要注意的是,具体的实现细节可能因应用需求、数据特征和算法选择而有所不同。
在一些可独立的实施例中,在步骤105所描述的基于所述目标对话文本单元集确定与所述目标智慧医疗服务项目对应的项目文本抽取内容之后,该方法还包括步骤106。
步骤106、响应于针对所述项目文本抽取内容的共享请求,对所述项目文本抽取内容的个体隐私匿名处理,得到已匿名服务项目文本;将所述已匿名服务项目文本下发给所述共享请求对应的智慧医疗服务器。
应用步骤106,通过对项目文本抽取内容进行个体隐私匿名处理,可以获得已匿名服务的项目文本,这种处理方法可确保在共享请求过程中保护用户的隐私和敏感信息。而针对步骤106,至少包括如下有益效果。
一、隐私保护:个体隐私匿名处理可以确保在数据共享过程中保护参与者的个人隐私。通过去除或替换敏感信息,如姓名、身份证号码等,可以避免潜在的隐私泄露风险。
二、数据共享促进:通过提供已匿名服务的项目文本,可以鼓励更多的数据共享和合作。参与方会感到更加放心,因为他们的个人身份和敏感信息已得到保护,并且只有必要的匿名信息被共享。
三、智慧医疗进展:将已匿名的项目文本下发给智慧医疗服务器可以推动医疗领域的创新和进步。智慧医疗服务器可以利用这些数据来进行分析、建模和预测,以提供更好的医疗服务和决策支持。
四、数据安全性:个体隐私匿名处理也有助于增强数据的安全性。通过匿名化处理,敏感信息的替代值可以减少数据被非法访问或不当使用的风险。
五、法规遵从:个体隐私匿名处理符合许多数据保护和隐私保密法规的要求。这种方法可确保数据共享过程中的合规性,并减少可能涉及的法律风险。
在一些可独立的实施例中,步骤106中的对所述项目文本抽取内容的个体隐私匿名处理,得到已匿名服务项目文本,包括:获取项目文本抽取内容的第一敏感字段向量和第一上下文推演向量,以及获取历史服务项目文本的第二敏感字段向量和第二上下文推演向量;根据所述第一敏感字段向量和所述第二敏感字段向量,确定所述项目文本抽取内容的隐私要素和所述历史服务项目文本的隐私要素是否满足共性要求,以及根据所述第一上下文推演向量和所述第二上下文推演向量,确定所述项目文本抽取内容的语义逻辑和所述历史服务项目文本的语义逻辑是否满足共性要求;如果所述项目文本抽取内容的隐私要素和所述历史服务项目文本的隐私要素满足共性要求且所述项目文本抽取内容的语义逻辑和所述历史服务项目文本的语义逻辑满足共性要求,确定所述项目文本抽取内容和所述历史服务项目文本满足共性要求;根据所述历史服务项目文本的个体隐私匿名策略,对项目文本抽取内容进行个体隐私匿名处理,得到已匿名服务项目文本。
这样一来,能够以历史服务项目文本作为参考,从敏感字段向量和上下文推演向量两个角度分析项目文本抽取内容和历史服务项目文本的相似度,从而在项目文本抽取内容和历史服务项目文本相似的前提下利用历史服务项目文本的个体隐私匿名策略实现项目文本抽取内容的个体隐私匿名处理,从而快速、准确地获得已匿名服务项目文本。
通过基于敏感字段向量和上下文推演向量的共性要求分析,利用历史服务项目文本作为参考,可以带来以下有益效果。
一、敏感字段保护:通过对第一和第二敏感字段向量的比较,可以确定项目文本抽取内容和历史服务项目文本之间的敏感字段是否具有相似性。这有助于识别和保护共性敏感字段,确保在个体隐私匿名处理过程中不泄露重要敏感信息。
二、上下文一致性:通过分析第一和第二上下文推演向量的共性要求,可以验证项目文本抽取内容和历史服务项目文本在语义逻辑上的一致性和相关性。这有助于提高数据的可靠性和准确性,并支持正确的语义理解和推断。
三、快速匿名处理:根据历史服务项目文本的个体隐私匿名策略,可以将其应用于项目文本抽取内容,进行个体隐私匿名处理。通过借鉴历史服务项目文本的匿名策略,可以快速实现项目文本抽取内容的个体隐私保护,减少额外的隐私分析和处理工作。
四、数据整合与分析:已匿名服务的项目文本可以与其他已匿名的历史服务项目文本进行整合和分析。这可以促进更广泛的数据使用和共享,从而提供更全面和准确的信息基础,支持决策制定、研究和创新。
五、合规性和可信度:通过满足共性要求,可以确保个体隐私匿名处理的合规性。这有助于提升数据处理过程的可信度,符合相关法律法规,降低隐私风险,并增强数据主体的信任感。
综上所述,基于敏感字段向量和上下文推演向量的共性要求分析,结合历史服务项目文本作为参考和个体隐私匿名策略,可以实现快速、准确地对项目文本抽取内容进行个体隐私匿名处理,从而带来敏感字段保护、一致性验证、快速处理、数据整合与分析以及合规性和可信度等有益效果。
基于上述相同或相似的发明构思,请结合参阅图2,还提供了一种基于数据处理的医疗服务智慧处理系统30的架构示意图,包括互相之间通信的AI交互处理系统10和智慧医疗服务器20,AI交互处理系统10和智慧医疗服务器20在运行时实现或者部分实现上述方法实施例所描述的技术方案。
进一步地,还提供了一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现上述的方法。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于数据处理的医疗服务智慧处理方法,其特征在于,应用于AI交互处理系统,所述方法包括:
对待处理智慧医疗服务交互文本记录进行文本语义挖掘处理,得到若干个不同文本细粒度的会话文本语义矩;
依据所述若干个不同文本细粒度的会话文本语义矩进行第一语义解析处理,得到已标注智慧医疗服务交互文本记录,所述已标注智慧医疗服务交互文本记录用于在文本特征维度下从所述待处理智慧医疗服务交互文本记录中抽取得到目标智慧医疗服务项目;
依据所述若干个不同文本细粒度的会话文本语义矩和所述已标注智慧医疗服务交互文本记录进行第二语义解析处理,得到若干个不同词句状态的拟处理对话文本单元集;
通过各拟处理对话文本单元集中包括的目标智慧医疗服务项目和非项目文本单元集之间的区分关键词向量,对所述若干个不同词句状态的拟处理对话文本单元集进行优化处理,得到目标对话文本单元集;
基于所述目标对话文本单元集确定与所述目标智慧医疗服务项目对应的项目文本抽取内容。
2.如权利要求1所述的方法,其特征在于,所述方法通过深度结构化语义网络DSSN实施,所述深度结构化语义网络DSSN包括由若干个文本语义挖掘模块组成的语义挖掘分支、由若干个第一文本语义解析模块组成的第一语义解析分支、由若干个第二文本语义解析模块组成的第二语义解析分支;其中,所述语义挖掘分支用于对待处理智慧医疗服务交互文本记录进行文本语义挖掘处理,所述第一语义解析分支用于进行第一语义解析处理,所述第二语义解析分支用于进行第二语义解析处理。
3.如权利要求2所述的方法,其特征在于,所述对待处理智慧医疗服务交互文本记录进行文本语义挖掘处理,得到若干个不同文本细粒度的会话文本语义矩,包括:
获取待处理智慧医疗服务交互文本记录,并将所述待处理智慧医疗服务交互文本记录加载到语义挖掘分支中;
通过所述语义挖掘分支中的若干个文本语义挖掘模块依次依据所述文本语义挖掘模块各自对应的待挖掘文本信息进行文本语义挖掘处理,得到各个文本语义挖掘模块分别生成的会话文本语义矩;
其中,下游的文本语义挖掘模块的待挖掘文本信息中包括有上游的文本语义挖掘模块生成的会话文本语义矩,所述语义挖掘分支中首个文本语义挖掘模块的待挖掘文本信息为所述待处理智慧医疗服务交互文本记录,所述语义挖掘分支中不同文本语义挖掘模块生成的会话文本语义矩的文本细粒度存在差异。
4.如权利要求2所述的方法,其特征在于,所述依据所述若干个不同文本细粒度的会话文本语义矩进行第一语义解析处理,得到已标注智慧医疗服务交互文本记录,包括:
依据所述若干个不同文本细粒度的会话文本语义矩,并通过第一语义解析分支中的若干个第一文本语义解析模块依次依据所述第一文本语义解析模块各自对应的待挖掘文本信息进行第一语义解析处理,直到依据末尾的第一文本语义解析模块生成已标注智慧医疗服务交互文本记录;
其中,对于所述第一语义解析分支中的当前的第一文本语义解析模块的待挖掘文本信息,包括有上游的第一文本语义解析模块对应的语义解析结果,以及与所述当前的第一文本语义解析模块相对应的文本语义挖掘模块生成的会话文本语义矩,所述当前的第一文本语义解析模块对应的语义解析结果用于生成下游的第一文本语义解析模块的待挖掘文本信息。
5.如权利要求2所述的方法,其特征在于,所述依据所述若干个不同文本细粒度的会话文本语义矩和所述已标注智慧医疗服务交互文本记录进行第二语义解析处理,得到若干个不同词句状态的拟处理对话文本单元集,包括:
确定所述第二语义解析分支中每个第二文本语义解析模块各自对应的待挖掘文本信息,其中,所述第二文本语义解析模块所对应的待挖掘文本信息包括相对应的文本语义挖掘模块生成的会话文本语义矩、以及顺序优先级大于所述第二文本语义解析模块的上游第二文本语义解析模块生成的拟处理对话文本单元集,并且,至少一部分的第二文本语义解析模块所对应的待挖掘文本信息中还包括所述已标注智慧医疗服务交互文本记录;
通过所述第二语义解析分支中的若干个第二文本语义解析模块依次依据所述第二文本语义解析模块各自对应的待挖掘文本信息进行第二语义解析处理,得到各个第二文本语义解析模块分别生成的拟处理对话文本单元集,其中,各所述第二文本语义解析模块生成的拟处理对话文本单元集的词句状态不同。
6.如权利要求1所述的方法,其特征在于,所述通过各拟处理对话文本单元集中包括的目标智慧医疗服务项目和非项目文本单元集之间的区分关键词向量,对所述若干个不同词句状态的拟处理对话文本单元集进行优化处理,得到目标对话文本单元集,包括:
将当前词句状态的拟处理对话文本单元集扩展到与连续的后一个词句状态的拟处理对话文本单元集相同的文本细粒度,得到完成扩展的拟处理对话文本单元集;
提取所述完成扩展的拟处理对话文本单元集中目标智慧医疗服务项目与非项目文本单元集之间的区分性文本段落,所述区分性文本段落中包括区分关键词向量;
依据所述区分性文本段落和所述连续的后一个词句状态的拟处理对话文本单元集进行聚合处理,得到已优化对话文本单元集;
将所述已优化对话文本单元集作为后一循环中的当前词句状态的拟处理对话文本单元集,跳转至所述将当前词句状态的拟处理对话文本单元集扩展到与连续的后一个词句状态的拟处理对话文本单元集相同的文本细粒度的步骤,直到获得最后一级词句状态的拟处理对话文本单元集所对应的已优化对话文本单元集时终止;
将所述最后一级词句状态的拟处理对话文本单元集所对应的已优化对话文本单元集作为目标对话文本单元集。
7.如权利要求6所述的方法,其特征在于,所述依据所述区分性文本段落和所述连续的后一个词句状态的拟处理对话文本单元集进行聚合处理,得到已优化对话文本单元集,包括:
对所述区分性文本段落进行文本重构操作,得到重构区分性文本段落,所述文本重构操作包括文本模糊和文本衍生中的至少一种;
将所述重构区分性文本段落和所述连续的后一个词句状态的拟处理对话文本单元集进行聚合处理,得到已优化对话文本单元集。
8.如权利要求1所述的方法,其特征在于,所述方法还包括:依据所述若干个不同文本细粒度的会话文本语义矩和所述已标注智慧医疗服务交互文本记录进行第二语义解析处理,得到包括所述目标智慧医疗服务项目的关键交互文本;
所述基于所述目标对话文本单元集确定与所述目标智慧医疗服务项目对应的项目文本抽取内容,包括:将所述关键交互文本和所述目标对话文本单元集进行聚合处理,得到与所述目标智慧医疗服务项目对应的项目文本抽取内容。
9.如权利要求1-8任一所述的方法,其特征在于,所述方法通过深度结构化语义网络DSSN实施,所述深度结构化语义网络DSSN通过网络调试所得,该网络调试的方法包括:
获取第一训练智慧医疗服务咨询文本集和第二训练智慧医疗服务咨询文本集,所述第一训练智慧医疗服务咨询文本集中包括有第一训练智慧医疗服务咨询文本、以及与所述第一训练智慧医疗服务咨询文本对应的先验拆解注释,所述第二训练智慧医疗服务咨询文本集中包括有第二训练智慧医疗服务咨询文本、以及与所述第二训练智慧医疗服务咨询文本对应的先验抽取注释;
确定待调试的深度结构化语义网络DSSN,所述待调试的深度结构化语义网络DSSN包括通用语义挖掘分支、通用第一语义解析分支和通用第二语义解析分支;
通过所述第一训练智慧医疗服务咨询文本集对所述通用语义挖掘分支和通用第一语义解析分支进行第一调试,直到符合第一终止要求时终止,得到完成调试的语义挖掘分支和第一语义解析分支;
通过所述第二训练智慧医疗服务咨询文本集,并基于完成调试的语义挖掘分支和第一语义解析分支对所述通用第二语义解析分支进行第二调试,直到符合第二终止要求时终止,得到完成调试的第二语义解析分支,以获得完成调试的深度结构化语义网络DSSN;
其中,所述完成调试的深度结构化语义网络DSSN用于确定与待处理智慧医疗服务交互文本记录中的目标智慧医疗服务项目对应的项目文本抽取内容。
10.一种AI交互处理系统,其特征在于,包括处理器和存储器;所述处理器和所述存储器通信连接,所述处理器用于从所述存储器中读取计算机程序并执行,以实现权利要求1-9任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311235614.3A CN116992861B (zh) | 2023-09-25 | 2023-09-25 | 基于数据处理的医疗服务智慧处理方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311235614.3A CN116992861B (zh) | 2023-09-25 | 2023-09-25 | 基于数据处理的医疗服务智慧处理方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116992861A true CN116992861A (zh) | 2023-11-03 |
CN116992861B CN116992861B (zh) | 2023-12-08 |
Family
ID=88525058
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311235614.3A Active CN116992861B (zh) | 2023-09-25 | 2023-09-25 | 基于数据处理的医疗服务智慧处理方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116992861B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118210910A (zh) * | 2024-05-21 | 2024-06-18 | 北京中科金有限元技术有限公司 | 基于智能培训的ai交互会话处理方法及系统 |
Citations (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20190096304A (ko) * | 2019-07-29 | 2019-08-19 | 엘지전자 주식회사 | 대화 내용에 대한 요약문 생성 장치 및 방법 |
JP2019144755A (ja) * | 2018-02-19 | 2019-08-29 | Arithmer株式会社 | 対話管理サーバ、対話管理方法、及びプログラム |
CN111324708A (zh) * | 2020-02-07 | 2020-06-23 | 普强时代(珠海横琴)信息技术有限公司 | 一种基于人机交互的自然语言处理系统 |
CN111949745A (zh) * | 2020-08-14 | 2020-11-17 | 长春理工大学 | 一种多维度业务数据管理方法及系统 |
CN111966796A (zh) * | 2020-07-21 | 2020-11-20 | 福建升腾资讯有限公司 | 问答对提取方法、装置、设备及可读存储介质 |
CN112035635A (zh) * | 2020-08-28 | 2020-12-04 | 康键信息技术(深圳)有限公司 | 医疗领域意图识别方法、装置、设备及存储介质 |
CN112035619A (zh) * | 2020-08-31 | 2020-12-04 | 康键信息技术(深圳)有限公司 | 基于人工智能的医疗问诊单筛选方法、装置、设备和介质 |
CN112183101A (zh) * | 2020-10-13 | 2021-01-05 | 深圳壹账通智能科技有限公司 | 文本意图识别方法、装置、电子设备及存储介质 |
JP2021056641A (ja) * | 2019-09-27 | 2021-04-08 | TXP Medical株式会社 | 医療情報管理装置及び医療レポートのメタデータ付加方法 |
CN113420552A (zh) * | 2021-07-13 | 2021-09-21 | 华中师范大学 | 一种基于强化学习的生物医学多事件抽取方法 |
US20210391046A1 (en) * | 2018-10-16 | 2021-12-16 | Koninklijke Philips N.V. | A system and method for medical visit documentation automation and billing code suggestion in controlled environments |
CN114817687A (zh) * | 2022-04-15 | 2022-07-29 | 浙大城市学院 | 一种物联网实体服务的高效发现方法 |
CN115376668A (zh) * | 2022-08-30 | 2022-11-22 | 温州城市智慧健康有限公司 | 一种应用于智慧医疗的大数据业务分析方法及系统 |
WO2023024422A1 (zh) * | 2021-08-27 | 2023-03-02 | 平安科技(深圳)有限公司 | 基于问诊会话的辅助诊断方法、装置及计算机设备 |
CN116362261A (zh) * | 2023-04-10 | 2023-06-30 | 昆明谐善科技有限公司 | 应对数字化服务项目的用户会话信息解析方法及软件产品 |
CN116431769A (zh) * | 2023-05-06 | 2023-07-14 | 天津壹慧软件科技有限公司 | 基于定制化ai云平台服务的交互数据分析方法及软件产品 |
CN116702776A (zh) * | 2023-05-29 | 2023-09-05 | 平安科技(深圳)有限公司 | 基于跨中西医的多任务语义划分方法、装置、设备及介质 |
CN116738985A (zh) * | 2023-08-11 | 2023-09-12 | 北京亚信数据有限公司 | 医学文本的标准化处理方法及装置 |
CN116738998A (zh) * | 2023-04-26 | 2023-09-12 | 中国科学院信息工程研究所 | 一种基于Web的医疗对话多粒度语义标注系统和方法 |
-
2023
- 2023-09-25 CN CN202311235614.3A patent/CN116992861B/zh active Active
Patent Citations (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019144755A (ja) * | 2018-02-19 | 2019-08-29 | Arithmer株式会社 | 対話管理サーバ、対話管理方法、及びプログラム |
US20210391046A1 (en) * | 2018-10-16 | 2021-12-16 | Koninklijke Philips N.V. | A system and method for medical visit documentation automation and billing code suggestion in controlled environments |
KR20190096304A (ko) * | 2019-07-29 | 2019-08-19 | 엘지전자 주식회사 | 대화 내용에 대한 요약문 생성 장치 및 방법 |
JP2021056641A (ja) * | 2019-09-27 | 2021-04-08 | TXP Medical株式会社 | 医療情報管理装置及び医療レポートのメタデータ付加方法 |
CN111324708A (zh) * | 2020-02-07 | 2020-06-23 | 普强时代(珠海横琴)信息技术有限公司 | 一种基于人机交互的自然语言处理系统 |
CN111966796A (zh) * | 2020-07-21 | 2020-11-20 | 福建升腾资讯有限公司 | 问答对提取方法、装置、设备及可读存储介质 |
CN111949745A (zh) * | 2020-08-14 | 2020-11-17 | 长春理工大学 | 一种多维度业务数据管理方法及系统 |
CN112035635A (zh) * | 2020-08-28 | 2020-12-04 | 康键信息技术(深圳)有限公司 | 医疗领域意图识别方法、装置、设备及存储介质 |
WO2022041730A1 (zh) * | 2020-08-28 | 2022-03-03 | 康键信息技术(深圳)有限公司 | 医疗领域意图识别方法、装置、设备及存储介质 |
CN112035619A (zh) * | 2020-08-31 | 2020-12-04 | 康键信息技术(深圳)有限公司 | 基于人工智能的医疗问诊单筛选方法、装置、设备和介质 |
CN112183101A (zh) * | 2020-10-13 | 2021-01-05 | 深圳壹账通智能科技有限公司 | 文本意图识别方法、装置、电子设备及存储介质 |
CN113420552A (zh) * | 2021-07-13 | 2021-09-21 | 华中师范大学 | 一种基于强化学习的生物医学多事件抽取方法 |
WO2023024422A1 (zh) * | 2021-08-27 | 2023-03-02 | 平安科技(深圳)有限公司 | 基于问诊会话的辅助诊断方法、装置及计算机设备 |
CN114817687A (zh) * | 2022-04-15 | 2022-07-29 | 浙大城市学院 | 一种物联网实体服务的高效发现方法 |
CN115376668A (zh) * | 2022-08-30 | 2022-11-22 | 温州城市智慧健康有限公司 | 一种应用于智慧医疗的大数据业务分析方法及系统 |
CN116362261A (zh) * | 2023-04-10 | 2023-06-30 | 昆明谐善科技有限公司 | 应对数字化服务项目的用户会话信息解析方法及软件产品 |
CN116738998A (zh) * | 2023-04-26 | 2023-09-12 | 中国科学院信息工程研究所 | 一种基于Web的医疗对话多粒度语义标注系统和方法 |
CN116431769A (zh) * | 2023-05-06 | 2023-07-14 | 天津壹慧软件科技有限公司 | 基于定制化ai云平台服务的交互数据分析方法及软件产品 |
CN116702776A (zh) * | 2023-05-29 | 2023-09-05 | 平安科技(深圳)有限公司 | 基于跨中西医的多任务语义划分方法、装置、设备及介质 |
CN116738985A (zh) * | 2023-08-11 | 2023-09-12 | 北京亚信数据有限公司 | 医学文本的标准化处理方法及装置 |
Non-Patent Citations (6)
Title |
---|
DAOJIAN ZENG ET AL: "CSDM: A context-sensitive deep matching model for medical dialogue information extraction", CSDM: A CONTEXT-SENSITIVE DEEP MATCHING MODEL FOR MEDICAL DIALOGUE INFORMATION EXTRACTION, vol. 607, pages 727 - 738, XP087142836, DOI: 10.1016/j.ins.2022.05.099 * |
RUI LIN ET AL: "Multi-Aspect Understanding with Cooperative Graph Attention Networks for Medical Dialogue Information Extraction", ACM TRANSACTIONS ON INTELLIGENT SYSTEMS AND TECHNOLOGY, pages 1 - 18 * |
XINSHI WANG ET AL: "Automatically Extracting Information in Medical Dialogue: Expert System and Attention for Labelling", W3PHAI 2023: ARTIFICIAL INTELLIGENCE FOR PERSONALIZED MEDICINE, pages 151 * |
于占胜: "基于Spark的实时医疗数据挖掘系统的研究与实现", 中国优秀硕士学位论文全文数据库医药卫生科技辑, no. 5, pages 054 - 42 * |
唐代: "基于深度学习和知识图谱的医疗文本应用研究", 中国优秀硕士学位论文全文数据库医药卫生科技辑, no. 4, pages 080 - 56 * |
陈德鑫: "基于深度学习的在线医疗信息抽取研究", 中国博士学位论文全文数据库信息科技辑, no. 6, pages 138 - 97 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118210910A (zh) * | 2024-05-21 | 2024-06-18 | 北京中科金有限元技术有限公司 | 基于智能培训的ai交互会话处理方法及系统 |
CN118210910B (zh) * | 2024-05-21 | 2024-07-26 | 北京中科金有限元技术有限公司 | 基于智能培训的ai交互会话处理方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN116992861B (zh) | 2023-12-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112015917A (zh) | 基于知识图谱的数据处理方法、装置及计算机设备 | |
CN112016295B (zh) | 症状数据处理方法、装置、计算机设备及存储介质 | |
CN107644011A (zh) | 用于细粒度医疗实体提取的系统和方法 | |
CN111128391B (zh) | 一种信息处理设备、方法和存储介质 | |
CN112201359B (zh) | 基于人工智能的重症问诊数据识别方法及装置 | |
CN114628001B (zh) | 基于神经网络的处方推荐方法、系统、设备及存储介质 | |
CN116992861B (zh) | 基于数据处理的医疗服务智慧处理方法及系统 | |
CN113223735B (zh) | 基于对话表征的分诊方法、装置、设备及存储介质 | |
Chen et al. | DxFormer: a decoupled automatic diagnostic system based on decoder–encoder transformer with dense symptom representations | |
CN114708976A (zh) | 辅助诊断技术的方法、装置、设备及存储介质 | |
CN113012774B (zh) | 病案自动编码方法、装置、电子设备及存储介质 | |
Han et al. | Fusemoe: Mixture-of-experts transformers for fleximodal fusion | |
CN113722507B (zh) | 基于知识图谱的住院费用预测方法、装置及计算机设备 | |
CN116469547A (zh) | 一种基于在线问诊人机交互的患者需求分析方法及系统 | |
Sun et al. | Similar modality completion-based multimodal sentiment analysis under uncertain missing modalities | |
CN115862862A (zh) | 疾病预测方法、装置及计算机可读存储介质 | |
Hoxha et al. | Leveraging dialog systems research to assist biomedical researchers’ interrogation of Big Clinical Data | |
Wang et al. | End-to-end pre-trained dialogue system for automatic diagnosis | |
Sun et al. | Multi-strategy fusion for medical named entity recognition | |
zhi | Multi-modal Medical Q&A System | |
Abdul et al. | Improving preliminary clinical diagnosis accuracy through knowledge filtering techniques in consultation dialogues | |
CN117216230B (zh) | 一种ai心理医生对话交互处理方法、系统、终端及介质 | |
Liu et al. | Research on Medical Dialogue Generation based on Pre-trained Models | |
Zhang et al. | TS-DDD: A Two-Stage Training Strategy for Dialogue-based Disease Diagnosis | |
Lee | Enhancing Medication Recommendation with LLM Text Representation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |