CN116741333B - 一种医药营销管理系统 - Google Patents
一种医药营销管理系统 Download PDFInfo
- Publication number
- CN116741333B CN116741333B CN202310815923.1A CN202310815923A CN116741333B CN 116741333 B CN116741333 B CN 116741333B CN 202310815923 A CN202310815923 A CN 202310815923A CN 116741333 B CN116741333 B CN 116741333B
- Authority
- CN
- China
- Prior art keywords
- patient
- medicine
- sequence
- data
- standard
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000003814 drug Substances 0.000 title claims abstract description 395
- 229940079593 drug Drugs 0.000 title claims description 166
- 230000011218 segmentation Effects 0.000 claims abstract description 66
- 238000000034 method Methods 0.000 claims abstract description 45
- 238000001514 detection method Methods 0.000 claims abstract description 38
- 238000006243 chemical reaction Methods 0.000 claims abstract description 35
- 238000007726 management method Methods 0.000 claims abstract description 26
- 230000003993 interaction Effects 0.000 claims abstract description 21
- 238000012545 processing Methods 0.000 claims abstract description 17
- 238000012546 transfer Methods 0.000 claims description 21
- 238000004422 calculation algorithm Methods 0.000 claims description 19
- 206010013710 Drug interaction Diseases 0.000 claims description 18
- 238000007637 random forest analysis Methods 0.000 claims description 18
- 230000008569 process Effects 0.000 claims description 15
- 239000013598 vector Substances 0.000 claims description 14
- 238000012482 interaction analysis Methods 0.000 claims description 11
- 239000000126 substance Substances 0.000 claims description 11
- 206010067484 Adverse reaction Diseases 0.000 claims description 10
- 230000006838 adverse reaction Effects 0.000 claims description 10
- 238000002372 labelling Methods 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 claims description 8
- 208000024891 symptom Diseases 0.000 claims description 8
- 230000002411 adverse Effects 0.000 claims description 7
- 238000013479 data entry Methods 0.000 claims description 7
- 230000000172 allergic effect Effects 0.000 claims description 6
- 208000010668 atopic eczema Diseases 0.000 claims description 6
- 238000012216 screening Methods 0.000 claims description 6
- 238000012163 sequencing technique Methods 0.000 claims description 4
- 208000030453 Drug-Related Side Effects and Adverse reaction Diseases 0.000 claims description 3
- 239000004615 ingredient Substances 0.000 claims description 3
- 239000011159 matrix material Substances 0.000 claims description 3
- 238000013523 data management Methods 0.000 abstract description 2
- 230000006870 function Effects 0.000 description 31
- 238000012549 training Methods 0.000 description 20
- 238000003066 decision tree Methods 0.000 description 10
- 238000012360 testing method Methods 0.000 description 10
- 150000001875 compounds Chemical class 0.000 description 7
- 238000011156 evaluation Methods 0.000 description 7
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 6
- 201000010099 disease Diseases 0.000 description 5
- 230000002452 interceptive effect Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 2
- 230000001225 therapeutic effect Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 208000035475 disorder Diseases 0.000 description 1
- 239000000890 drug combination Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000002483 medication Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000013439 planning Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000011524 similarity measure Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000002195 synergetic effect Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 229940043263 traditional drug Drugs 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H20/00—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
- G16H20/10—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to drugs or medications, e.g. for ensuring correct administration to patients
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3346—Query execution using probabilistic model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
- G06F18/24155—Bayesian classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/60—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H70/00—ICT specially adapted for the handling or processing of medical references
- G16H70/40—ICT specially adapted for the handling or processing of medical references relating to drugs, e.g. their side effects or intended usage
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Probability & Statistics with Applications (AREA)
- Public Health (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Primary Health Care (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Epidemiology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Medicinal Chemistry (AREA)
- Chemical & Material Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Mathematics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Toxicology (AREA)
- Evolutionary Biology (AREA)
- Pharmacology & Pharmacy (AREA)
- Algebra (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明涉及数据管理技术领域,更进一步地,涉及一种医药营销管理系统。所述系统包括:数据录入和转换部分,关键字检测部分、药品推荐部分和合规性检测部分;所述数据录入和转换部分,配置用于录入药品数据和患者数据,每个患者对应一份患者数据,每份患者数据中包含多条患者子数据;每种药品对应一份药品数据,每种药品中包含多条药品子数据,将录入的药品数据和患者数据进行数据统一格式转换,得到统一的中文编码的标准药品数据和标准患者数据,对标准药品数据和标准患者数据进行分词处理,将每个分词作为序列元素,以得到药品文本序列和患者文本序列。它实现了数据录入和转换的自动化,提供了个性化的药品推荐和药物相互作用的合规性检测。
Description
技术领域
本发明属于数据管理技术领域,具体涉及一种医药营销管理系统。
背景技术
随着医疗行业的不断发展和信息化的推进,医药营销管理系统成为了医药企业和医疗机构重要的管理工具之一。这样的系统能够帮助企业有效管理和分析药品数据、患者数据,实现精准的药品推荐和合规性检测,从而提高医药营销的效率和质量。
然而,在现有技术中,仍然存在一些问题和挑战。首先,对于药品和患者数据的录入和转换过程存在一定的复杂性和繁琐性。药品数据和患者数据通常以不同的格式和编码进行存储,需要进行数据统一格式转换,以便能够对其进行后续的处理和分析。这样的数据转换过程往往需要耗费大量的时间和人力资源,容易出现错误和数据不一致的问题。
其次,传统的药品推荐方法往往只基于药品和患者的基本信息,缺乏对药品和患者之间语义关联的深入挖掘。现有的推荐系统往往依赖于简单的规则或基于统计的方法,无法充分考虑药品和患者之间的复杂关系。这导致药品推荐的准确性和个性化程度有限,不能满足患者的实际需求。
此外,现有的药品推荐系统在合规性检测方面存在一定的局限性。药品推荐结果可能存在药物相互作用或不良反应的风险,而现有系统往往无法充分考虑药品之间的相互作用,缺乏合规性的全面性和准确性。这给患者的用药安全带来一定的风险。
综上所述,现有技术中的医药营销管理系统在数据转换、药品推荐和合规性检测方面仍然存在一些问题。为了解决这些问题,需要开发一种更高效、准确和个性化的医药营销管理系统。该系统应该具备数据录入和转换的自动化能力,能够深入挖掘药品和患者之间的语义关联,并能够全面考虑药品之间的相互作用和不良反应,以提供更精准和安全的药品推荐结果。
发明内容
本发明的主要目的在于提供一种医药营销管理系统,它实现了数据录入和转换的自动化,提供了个性化的药品推荐和药物相互作用的合规性检测,为医药行业带来了更高效、精准和安全的管理和服务。
为了解决上述问题,本发明的技术方案是这样实现的:
一种医药营销管理系统,所述系统包括:数据录入和转换部分,关键字检测部分、药品推荐部分和合规性检测部分;所述数据录入和转换部分,配置用于录入药品数据和患者数据,每个患者对应一份患者数据,每份患者数据中包含多条患者子数据;每种药品对应一份药品数据,每种药品中包含多条药品子数据,将录入的药品数据和患者数据进行数据统一格式转换,得到统一的中文编码的标准药品数据和标准患者数据,对标准药品数据和标准患者数据进行分词处理,将每个分词作为序列元素,以得到药品文本序列和患者文本序列;关键字检测部分,配置用于对药品文本序列和患者文本序列中的序列元素进行关键字检测,保留关键字分词,去除非关键字分词,得到标准药品文本序列和标准患者文本序列;药品推荐部分,配置用于基于标准药品文本序列和标准患者文本序列为患者筛选出与患者病症相适应的药品,作为药品推荐结果;合规性检测部分,配置用于对药品推荐结果进行合规性检测,具体包括:对药品推荐结果中的药品进行药物相互作用分析,以判断药品推荐结果中是否存在不良的药物相互作用,若是,则对存在不良反应的药物的标准药品文本序列中添加一个附加序列,附加序列中每个序列元素为与自身药物存在不良反应的其他药物的主键信息,并发送指令至药品推荐部分重新基于标准药品文本序列和标准患者文本序列为患者筛选出与患者病症相适应的药品,作为新的药品推荐结果,直到药品推荐结果中的药品彼此之间不存在不良的药物相互作用。
进一步的,所述药品数据为药品说明书;所述患者数据为患者病历;所述药品数据中的药品子数据至少包括:药品序列号、药品名称、药品成分、药品价格、药品生产商、药品副作用、药品适应症和药品禁忌症;其中,所述药品序列号作为主键信息;所述患者数据中的患者子数据至少包括:患者姓名、患者唯一身份标识码、患者性别、患者年龄、患者过敏药物名称和患者病症;其中,患者唯一身份标识码为主键信息。
进一步的,所述数据录入和转换部分将录入的药品数据和患者数据进行数据统一格式转换,得到统一的中文编码的标准药品数据和标准患者数据的方法包括:将药品数据和患者数据的中文字符进行全角转半角处理,然后将药品数据和患者数据的文档编码转换为UTF-8或GBK;所述药品数据和患者数据的文档编码格式一致。
进一步的,所述数据录入和转换部分对标准药品数据和标准患者数据进行分词处理,将每个分词作为序列元素,以得到药品文本序列和患者文本序列的方法包括:对文档编码为UTF-8或GBK的药品数据和患者数据分别进行汉字、数字、通用单位、及标点符号的标注,根据标注结果将相邻数字的组合视为一个分词,将通用单位视为一个分词,将单个标点符号视为一个分词,以及将单个汉字视为一个分词,其中,所述通用单位包括中文单位、英文单位、化学单位、以及医用单位。
进一步的,所述关键字检测部分,配置用于对药品文本序列和患者文本序列中的序列元素进行关键字检测,保留关键字分词,去除非关键字分词,得到标准药品文本序列和标准患者文本序列的方法包括:创建一个分词表,包含所有药品文本序列或患者文本序列中出现的分词;对每个药品文本序列或患者文本序列,统计每个分词在药品文本序列或患者文本序列中的出现频率;对于每个分词,使用朴素贝叶斯分类器,计算其在分词表中出现的概率;将药品文本序列或患者文本序列中的序列元素划分为两个类别:关键字分词和非关键字分词;使用朴素贝叶斯分类器,估计关键字分词和非关键字分词的先验概率;对于每个分词,计算其在关键字分词下的条件概率和非关键字分词下的条件概率;使用贝叶斯公式计算每个分词属于关键字分词的后验概率,并按照后验概率对分词进行排序;选择后验概率高于设定阈值的分词作为关键字分词。
进一步的,所述药品推荐部分,基于标准药品文本序列和标准患者文本序列为患
者筛选出与患者病症相适应的药品,作为药品推荐结果的方法包括:首先基于标准患者文
本序列中的患者过敏药物名称,筛除掉对应的标准药品文本序列;假设输入的标准药品文
本序列为,标准患者文本序列为;其中,表示
标准药品文本序列中的第个序列元素,其中,1,表示标准患者文本序列中的第个序列元素,其中,1;;对于每个标准药品文本序列和标准患者文本序列中的序
列元素,提取相应的特征,得到提取的特征为;对于给定的标准药品文本序列和标准
患者文本序列,计算得分,表示给定的标准药品文本序列和标准患者文本序列组成
的标签序列的得分;采用维特比算法进行解码,找到得分最高的标签序列,即最可能的药品
推荐结果。
进一步的,所述对于给定的标准药品文本序列和标准患者文本序列,计算得分的公式如下:
;
其中,是CRF模型学习得到的权重参数,是特征函数,表示在标准药品
文本序列中的第个序列元素和标准患者文本序列中的第个序列元素上的特征函数值,是转移特征函数,表示标准患者文本序列中第个序列元素和第个序列
元素之间的转移特征函数值;为标准药品文本序列中的序列元素的个数;为标准患者
文本序列中的序列元素的个数。
进一步的,所述维特比算法通过动态规划的方式,逐步计算得分最高的标签序列;
具体包括:维护一个矩阵,其中表示以标准患者文本序列的第个序列元素为结
尾,且预测的标签为的序列的得分;动态规划包括:令,其中表示标签序列
的起始位置;对于每个标准患者文本序列的序列元素,使用如下公式计算的值,其
中表示标签序列的可能标签:
;
其中,表示在标准药品文本序列的第个序列元素和标准患者文本
序列的第个序列元素上的特征函数值,表示标准患者文本序列的第个序列元素和第个序列元素之间的转移特征函数值;选择最后一个位置的最大得
分,即,其中表示标签序列的结束位置;从最后一个位置开始,根据动态规
划过程中的选择最大得分的标签,逐步回溯到第一个位置,形成最可能的标签序列作为药
品推荐结果;为相邻序列元素之间转移特征函数值。
进一步的,所述对于每个标准药品文本序列和标准患者文本序列中的序列元素,
提取相应的特征,得到提取的特征为的方法包括:对于标准药品文本序列中的每个
序列元素,遍历标准患者文本序列中的所有序列元素,计算相似度值,将标准药品文本序列
中的序列元素和在标准患者文本序列中与其相似度值最高的序列元素作为特征;所述计算
相似度值的方法使用词向量余弦相似度计算方法。
进一步的,所述合规性检测部分,对药品推荐结果中的药品进行药物相互作用分析的方法包括:获取药品推荐结果中药品的药品成分,使用基于分子指纹和随机森林算法的方法基于药品成分进行相互作用分析。
本发明的一种医药营销管理系统,具有以下有益效果:
数据录入和转换的自动化:本发明的医药营销管理系统通过数据录入和转换部分的自动化处理,实现了药品数据和患者数据的统一格式转换。相比传统的手动处理,自动化的数据处理节省了大量的时间和人力资源,并减少了数据转换中出错的可能性。这有助于提高数据录入和转换的效率和准确性,为后续的分析和应用提供了可靠的数据基础。
个性化药品推荐:本发明的药品推荐部分利用标准药品文本序列和标准患者文本序列之间的语义关联,实现了个性化的药品推荐。通过分析和比较药品和患者文本序列的特征,系统能够根据患者的病症和需求,筛选出最适合的药品。这种个性化的推荐不仅能够帮助医生针对患者的需求推荐更多的适合的药品或药品组合,使得一些新上市的药品能够快速地应用,且可以帮助医生做出更全面的诊断和治疗方案,还能够提高患者的满意度和治疗效果,使得药品推荐更加精准和符合患者的实际需求。
药物相互作用的合规性检测:本发明的合规性检测部分考虑了药物相互作用的风险,并采用药物相互作用分析的方法进行检测。系统能够分析药品推荐结果中药品之间的相互作用,判断是否存在不良的药物相互作用。如果存在不良反应,系统会对药品文本序列进行调整,并重新进行药品推荐,直到推荐结果中的药品彼此之间不存在不良的药物相互作用。这样的合规性检测能够提高患者用药的安全性和可靠性,避免不良反应的发生。
附图说明
图1为本发明实施例提供的一种医药营销管理系统的系统结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
参考图1,一种医药营销管理系统,所述系统包括:数据录入和转换部分,关键字检测部分、药品推荐部分和合规性检测部分;所述数据录入和转换部分,配置用于录入药品数据和患者数据,每个患者对应一份患者数据,每份患者数据中包含多条患者子数据;每种药品对应一份药品数据,每种药品中包含多条药品子数据,将录入的药品数据和患者数据进行数据统一格式转换,得到统一的中文编码的标准药品数据和标准患者数据,对标准药品数据和标准患者数据进行分词处理,将每个分词作为序列元素,以得到药品文本序列和患者文本序列;关键字检测部分,配置用于对药品文本序列和患者文本序列中的序列元素进行关键字检测,保留关键字分词,去除非关键字分词,得到标准药品文本序列和标准患者文本序列;药品推荐部分,配置用于基于标准药品文本序列和标准患者文本序列为患者筛选出与患者病症相适应的药品,作为药品推荐结果;合规性检测部分,配置用于对药品推荐结果进行合规性检测,具体包括:对药品推荐结果中的药品进行药物相互作用分析,以判断药品推荐结果中是否存在不良的药物相互作用,若是,则对存在不良反应的药物的标准药品文本序列中添加一个附加序列,附加序列中每个序列元素为与自身药物存在不良反应的其他药物的主键信息,并发送指令至药品推荐部分重新基于标准药品文本序列和标准患者文本序列为患者筛选出与患者病症相适应的药品,作为新的药品推荐结果,直到药品推荐结果中的药品彼此之间不存在不良的药物相互作用。
具体的,系统首先通过数据录入和转换部分,将药品数据和患者数据进行统一的格式转换,得到标准的药品文本序列和患者文本序列。这样做的目的是为了能够对这些文本数据进行进一步的处理和分析。
接下来,通过关键字检测部分,系统对药品文本序列和患者文本序列中的每个序列元素进行关键字检测。这意味着系统能够确定哪些词汇是关键的,与疾病、病症相关,而哪些词汇不是关键的,可以被过滤掉。这一步骤的目的是提取出标准的药品文本序列和患者文本序列,这些序列只包含与病症相关的信息。在药品推荐部分,系统利用标准的药品文本序列和患者文本序列,根据患者的病症,筛选出与其相适应的药品。这种基于文本序列的匹配能够帮助医药营销人员更准确地向患者推荐适合的药品。
然后,系统进行合规性检测部分。这部分的核心是药物相互作用分析。系统对药品推荐结果中的药品进行分析,以确定是否存在不良的药物相互作用。如果发现存在不良反应的药物,系统会修改标准药品文本序列,在其中添加一个附加序列,包含与这些药物存在不良反应的其他药物的信息。然后,系统再次进行药品推荐,生成新的药品推荐结果。这个过程会反复进行,直到药品推荐结果中的药品之间没有不良的药物相互作用为止。
优选地,所述药品数据为药品说明书;所述患者数据为患者病历;所述药品数据中的药品子数据至少包括:药品序列号、药品名称、药品成分、药品价格、药品生产商、药品副作用、药品适应症和药品禁忌症;其中,所述药品序列号作为主键信息;所述患者数据中的患者子数据至少包括:患者姓名、患者唯一身份标识码、患者性别、患者年龄、患者过敏药物名称和患者病症;其中,患者唯一身份标识码为主键信息。
优选地,所述数据录入和转换部分将录入的药品数据和患者数据进行数据统一格式转换,得到统一的中文编码的标准药品数据和标准患者数据的方法包括:将药品数据和患者数据的中文字符进行全角转半角处理,然后将药品数据和患者数据的文档编码转换为UTF-8或GBK;所述药品数据和患者数据的文档编码格式一致。
对于药品数据和患者数据中的中文字符,将其进行全角转半角处理。全角字符是指占用两个字节的字符,而半角字符是指占用一个字节的字符。通过将中文字符从全角转换为半角,可以使得数据在编码和处理时更加统一。将药品数据和患者数据的文档编码格式进行转换,以确保一致性。常见的文档编码格式包括UTF-8和GBK。UTF-8是一种通用的编码格式,支持全球各种语言的字符表示,而GBK是中文字符编码的一种标准。通过将药品数据和患者数据的文档编码转换为统一的UTF-8或GBK格式,可以确保数据的编码一致性。
优选地,所述数据录入和转换部分对标准药品数据和标准患者数据进行分词处理,将每个分词作为序列元素,以得到药品文本序列和患者文本序列的方法包括:对文档编码为UTF-8或GBK的药品数据和患者数据分别进行汉字、数字、通用单位、及标点符号的标注,根据标注结果将相邻数字的组合视为一个分词,将通用单位视为一个分词,将单个标点符号视为一个分词,以及将单个汉字视为一个分词,其中,所述通用单位包括中文单位、英文单位、化学单位、以及医用单位。
具体的,标注处理:对文档编码为UTF-8或GBK的药品数据和患者数据进行标注。这个步骤旨在识别出汉字、数字、通用单位和标点符号等不同类型的字符。
数字分词:根据标注结果,将相邻的数字组合视为一个分词。例如,对于连续的数字字符"1234",将其视为一个分词。
通用单位分词:将通用单位视为一个分词。通用单位包括中文单位、英文单位、化学单位和医用单位。例如,对于"毫克"、"mg"、"mol"、"IU"等通用单位,将其视为一个分词。
标点符号分词:将单个标点符号视为一个分词。例如,逗号、句号、感叹号等标点符号都视为一个独立的分词。
汉字分词:将单个汉字视为一个分词。这样可以将每个汉字都视为一个独立的元素。
本发明的医药营销管理系统在运行时,提供给医生使用,在使用时,医生可以获取患者的病历信息。如果患者为首次就诊,则医生通过问诊,开具患者的病历。如果患者在就诊途中更换了医生或者医院,则患者可以提供自己的病历信息。当然,如果不同的医院具备相同的数据库管理系统,则本发明的系统可以自动从这些系统中获取患者的病历信息。本发明的系统仅提供给医生或者医院使用,患者由于不具备医疗知识和经验,无法使用本系统。在使用过程中,由于现有技术中针对同一种病,有多种药物可以进行治疗,而同一种病往往需要多种药物的协同作用共同来治疗。对于某些新药和较为冷门的药物,即便是经验异常丰富的医生也不可能都知晓。因此利用本发明提供的系统,医生可以在系统中获取可能的药物组合。且由于这些药物组合经过了本发明的系统的推荐算法的处理和合规性检测,可以保证推荐的准确率。同时,医生也可以根据推荐的结果进行自主处理。
优选地,所述关键字检测部分,配置用于对药品文本序列和患者文本序列中的序列元素进行关键字检测,保留关键字分词,去除非关键字分词,得到标准药品文本序列和标准患者文本序列的方法包括:创建一个分词表,包含所有药品文本序列或患者文本序列中出现的分词;对每个药品文本序列或患者文本序列,统计每个分词在药品文本序列或患者文本序列中的出现频率;对于每个分词,使用朴素贝叶斯分类器,计算其在分词表中出现的概率;将药品文本序列或患者文本序列中的序列元素划分为两个类别:关键字分词和非关键字分词;使用朴素贝叶斯分类器,估计关键字分词和非关键字分词的先验概率;对于每个分词,计算其在关键字分词下的条件概率和非关键字分词下的条件概率;使用贝叶斯公式计算每个分词属于关键字分词的后验概率,并按照后验概率对分词进行排序;选择后验概率高于设定阈值的分词作为关键字分词。
具体的,创建分词表:为了对药品文本序列和患者文本序列进行关键字检测,首先需要创建一个分词表。该表包含了所有药品文本序列或患者文本序列中出现的分词。这个分词表可以作为参考,用于判断哪些分词是关键字。
统计分词频率:对于每个药品文本序列或患者文本序列,需要统计每个分词在文本序列中的出现频率。这样可以了解每个分词在文本序列中的重要性和使用频率。
朴素贝叶斯分类器:使用朴素贝叶斯分类器对每个分词在分词表中出现的概率进行计算。朴素贝叶斯分类器是一种基于概率的分类算法,用于估计一个分词属于关键字分词或非关键字分词的概率。
划分类别:根据朴素贝叶斯分类器估计的关键字分词和非关键字分词的先验概率,将药品文本序列或患者文本序列中的序列元素划分为关键字分词和非关键字分词两个类别。
计算条件概率:对于每个分词,计算它在关键字分词和非关键字分词两个类别下的条件概率。这样可以衡量一个分词在不同类别下的重要性和影响力。
计算后验概率:使用贝叶斯公式,计算每个分词属于关键字分词的后验概率,并根据后验概率对分词进行排序。后验概率高于设定阈值的分词被选择为关键字分词。
优选地,所述药品推荐部分,基于标准药品文本序列和标准患者文本序列为患者
筛选出与患者病症相适应的药品,作为药品推荐结果的方法包括:首先基于标准患者文本
序列中的患者过敏药物名称,筛除掉对应的标准药品文本序列;假设输入的标准药品文本
序列为,标准患者文本序列为;其中,表示标
准药品文本序列中的第个序列元素,1,表示标准患者文本序列中的第个序列
元素,1;对于每个标准药品文本序列和标准患者文本序列中的序列元素,提取相
应的特征,得到提取的特征为;对于给定的标准药品文本序列和标准患者文本序列,
计算得分,表示给定的标准药品文本序列和标准患者文本序列组成的标签序列的得
分;采用维特比算法进行解码,找到得分最高的标签序列,即最可能的药品推荐结果。
具体的,基于药品文本序列和患者文本序列之间的匹配和评分机制,通过提取特征、计算得分和选择最高得分的药品,实现了对患者病症的药品推荐。通过这种方式,可以根据患者的特定病症和药品的特性,提供个性化、准确的药品推荐,以优化患者的治疗效果和满足其特定需求。
优选地,所述对于给定的标准药品文本序列和标准患者文本序列,计算得分的公式如下:
;
其中,是CRF模型学习得到的权重参数,是特征函数,表示在标准药品
文本序列中的第个序列元素和标准患者文本序列中的第个序列元素上的特征函数值,是转移特征函数,表示标准患者文本序列中第个序列元素和第个序列
元素之间的转移特征函数值;为标准药品文本序列中的序列元素的个数;为标准患者
文本序列中的序列元素的个数。
具体的,序列数据建模:将标准药品文本序列和标准患者文本序列视为一个序列数据。在这个序列中,标准药品文本序列和标准患者文本序列的元素按照顺序排列,并且彼此之间存在依赖关系。
特征函数:特征函数用于描述标准药品文本序列和标准患者文本序列中的元素以及它们之间的关系。特征函数可以是对元素的某种属性进行判断和计算得到的值,也可以是对元素之间关系的判断和计算得到的值。例如,特征函数可以衡量药品和患者之间的匹配程度、相关性和关联度。
转移特征函数:转移特征函数用于描述标准患者文本序列中相邻元素之间的转移关系。它可以衡量序列中元素之间的连续性和关联性。例如,转移特征函数可以判断某个症状是否在前一个症状的基础上发展而来。
权重参数:CRF模型学习得到一组权重参数,用于衡量特征函数和转移特征函数在计算得分时的重要性和影响力。这些权重参数可以通过训练数据进行学习和优化,使得模型能够根据特征函数和转移特征函数的值来计算得分。
得分计算:根据特征函数和转移特征函数的值以及相应的权重参数,计算给定标准药品文本序列和标准患者文本序列组成的标签序列的得分。得分表示了标签序列的匹配程度和适应度。
解码和推荐:利用维特比算法,在标注序列中找到得分最高的路径,即最可能的药品推荐结果。维特比算法是一种动态规划算法,用于在序列中找到概率最大的路径。通过解码得到的标签序列,即可确定最适合患者病症的药品推荐。
优选地,所述维特比算法通过动态规划的方式,逐步计算得分最高的标签序列;具
体包括:维护一个矩阵,其中表示以标准患者文本序列的第个序列元素为结尾,
且预测的标签为的序列的得分;所述动态规划过程包括:令,其中表示标签
序列的起始位置;对于每个标准患者文本序列的序列元素,使用如下公式计算的
值,其中表示标签序列的可能标签:
;
其中,表示在标准药品文本序列的第个序列元素和标准患者文本
序列的第个序列元素上的特征函数值,表示标准患者文本序列的第个序列元素和第个序列元素之间的转移特征函数值;选择最后一个位置的最大得
分,即,其中表示标签序列的结束位置;从最后一个位置开始,根据动态规
划过程中的选择最大得分的标签,逐步回溯到第一个位置,形成最可能的标签序列作为药
品推荐结果;为相邻序列元素之间转移特征函数值。
具体的,维特比算法通过动态规划的方式,逐步计算得分最高的标签序列。在药品推荐系统中,这意味着通过计算得分,可以找到最可能与患者病症相适应的药品序列。这样,系统可以选择最优的药品推荐结果,提供给患者。
维特比算法的动态规划过程能够利用之前计算的结果,避免重复计算,提高计算效率。在药品推荐系统中,维特比算法可以根据已计算的得分,通过比较和选择最大得分的标签,逐步构建出最可能的药品推荐序列。这样的优化能够在大规模数据和复杂特征情况下,高效地实现药品推荐。
维特比算法中的得分计算依赖于特征函数和转移特征函数的权重参数。通过对特征函数和转移特征函数的权重参数进行学习和调整,可以使系统根据不同特征的重要性和影响,更准确地计算得分,从而选择最合适的药品推荐。这样的调整能够使药品推荐系统更加灵活和个性化,适应不同的患者需求。
优选地,所述对于每个标准药品文本序列和标准患者文本序列中的序列元素,提
取相应的特征,得到提取的特征为的方法包括:对于标准药品文本序列中的每个序
列元素,遍历标准患者文本序列中的所有序列元素,计算相似度值,将标准药品文本序列中
的序列元素和在标准患者文本序列中与其相似度值最高的序列元素作为特征;所述计算相
似度值的方法使用词向量余弦相似度计算方法。
具体的,通过计算标准药品文本序列元素与标准患者文本序列元素之间的相似度值,可以度量药品和患者之间的匹配程度。相似度值越高,表示药品和患者在语义上越相关,说明药品更适合患者的病症。这有助于系统根据匹配程度来评估和选择合适的药品推荐结果。通过将标准药品文本序列元素与与其相似度值最高的标准患者文本序列元素作为特征,可以实现个性化的药品推荐。系统可以根据患者的具体病症和需求,找到最匹配的药品,并将其推荐给患者。这样的个性化推荐能够提高患者满意度和治疗效果。通过提取特征并计算相似度值,可以捕捉到药品和患者之间的语义关联和相关性。这些特征可以作为模型的输入,用于建模药品和患者之间的关系。通过学习这些特征的权重和影响,系统可以更好地理解药品和患者之间的关联,从而更准确地进行药品推荐。实现这种作用的方式是通过计算词向量余弦相似度来量化标准药品文本序列元素和标准患者文本序列元素之间的语义相似度。词向量模型将词语映射到高维空间中的向量表示,使得具有相似语义的词语在向量空间中距离较近。
计算余弦相似度可以度量两个向量之间的夹角,进而表示它们在语义上的相似程度。通过计算相似度值并选择最相似的患者文本序列元素作为特征,药品推荐系统可以根据患者的病症和需求,匹配最合适的药品。这样的特征提取和匹配过程能够实现个性化推荐、匹配度量和特征关联性建模,提升药品推荐的准确性和个性化程度。
优选地,所述合规性检测部分,对药品推荐结果中的药品进行药物相互作用分析的方法包括:获取药品推荐结果中药品的药品成分,使用基于分子指纹和随机森林算法的方法基于药品成分进行相互作用分析。
具体的,这一过程包括:数据收集:从公开数据库(如DrugBank、PubChem等)或文献中获取已知的药物相互作用数据。这些数据应包括药物化学结构和相互作用标签(例如相互作用或非相互作用)。
分子指纹生成:对每个药物化学结构生成分子指纹。常见的分子指纹包括MACCS键(Molecular ACCess System),ECFP(Extended-Connectivity Fingerprints)等。分子指纹将化学结构转化为二进制或稀疏向量,表示不同的结构特征。
特征选择:根据分子指纹的维度和相关性,进行特征选择,以减少特征的数量和去除冗余信息。这可以提高模型的效率和准确性。
训练集和测试集划分:将数据集划分为训练集和测试集。通常,大部分数据用于训练,而小部分用于评估和验证算法的性能。
随机森林模型训练:使用训练集的分子指纹和相互作用标签,训练一个随机森林分类模型。随机森林是一种集成学习方法,通过构建多个决策树并综合它们的预测结果来进行分类。
相互作用预测:使用训练好的随机森林模型对测试集中的药物进行相互作用预测。对于每对药物,根据其分子指纹,模型将输出一个相互作用的概率或类别标签。
模型评估:根据测试集的真实标签和模型的预测结果,计算模型的准确率、召回率、F1分数等评价指标,以评估模型的性能和预测能力。
结果解释:根据模型预测的结果,提供有关药物相互作用的信息和解释,如可能的作用机制、药物相互作用的临床意义等。
获取药品成分:首先,从药品推荐结果中获取药品A和B的药品成分信息。假设药品A的主要成分是化合物A1,药品B的主要成分是化合物B1。
分子指纹生成,包括:
步骤1:使用分子指纹生成算法,将化合物A1和化合物B1转化为数值向量表示。这些分子指纹向量捕捉了每个化合物的结构和化学特征。具体过程包括:选择一个分子指纹的半径(通常为2或3),它决定了分子指纹中包含的原子和键的范围。
步骤2:对于每个原子,考虑其周围半径范围内的原子和键。例如,对于半径为2的分子指纹,考虑每个原子的直接邻居和直接连接到邻居的键。
步骤3:构建一个空白的位向量(比特串),长度为固定值,每个位表示一种结构特征或化学性质。
步骤4:遍历每个原子和相应的键,根据其结构和化学特征,将相应的位设置为1或保持为0。例如,可以考虑原子的化学符号、键的类型(单键、双键、三键等)等。
步骤5:重复步骤3和步骤4,直到遍历了分子的所有原子和键。最终得到一个二进制向量,表示了分子的分子指纹。
构建训练集和测试集:需要一个带有已知药物相互作用标签的训练集来训练模型,并使用一个测试集来评估模型的性能。假设从药物相互作用数据库中获得了一组已知的药物相互作用数据,其中包括药物A和药物B的相互作用标签。
特征工程:在这个阶段,对分子指纹进行一些特征工程操作,例如选择重要的特征、标准化数据等。
随机森林模型训练和评估:使用训练集,训练一个随机森林分类器模型。在训练过程中,每个决策树都基于随机选择的训练样本和特征子集进行训练。然后,使用测试集评估模型的性能,比较模型的预测结果与实际标签之间的一致性。
药物相互作用预测:一旦模型训练完成并通过测试集验证,使用该模型来预测药物A和药物B之间的相互作用。将药品A和药品B的分子指纹作为输入,通过随机森林模型进行预测。模型将输出一个相互作用的概率或标签,表示药物A和药物B是否可能相互作用。
随机森林模型是现有技术中常用的预测模型,在本发明中,其执行过程包括:
数据准备:将训练集数据和对应的标签准备好。对于每个样本,特征可以是经过分子指纹生成的化合物A1和化合物B1的分子指纹向量,标签可以是对应的药物相互作用标签(如相互作用/非相互作用)。
构建随机森林模型:选择随机森林模型的参数,例如决策树数量、每个决策树的最大深度等。然后使用训练集数据拟合随机森林模型。
随机选择样本和特征子集:在每个决策树的训练过程中,随机从训练集中选择样本和特征子集。这种随机选择有助于增加模型的多样性和泛化能力。
训练决策树:对于每个决策树,使用随机选择的样本和特征子集进行训练。决策树根据特征的不纯度(如信息增益)进行分裂,逐步构建决策规则。
预测和投票:当需要对一个新样本进行预测时,每个决策树会对其进行独立预测,并投票确定最终预测结果。对于分类问题,投票结果可能是多数表决;对于回归问题,可能是平均值。
模型评估:使用测试集数据评估随机森林模型的性能。将测试集中的样本的分子指纹作为输入,通过随机森林模型进行预测,与实际标签进行比较,计算评估指标(如准确率、召回率、F1分数等)来衡量模型的性能。
参数调优(可选):根据评估结果,可以调整随机森林模型的参数来进一步提高性能。例如,增加决策树数量、调整最大深度等。
模型应用:一旦通过评估验证了模型的性能,可以将该模型应用于预测未知样本的标签。将未知样本的分子指纹作为输入,通过训练好的随机森林模型进行预测。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种医药营销管理系统,其特征在于,所述系统包括:数据录入和转换部分,关键字检测部分、药品推荐部分和合规性检测部分;所述数据录入和转换部分,配置用于录入药品数据和患者数据,每个患者对应一份患者数据,每份患者数据中包含多条患者子数据;每种药品对应一份药品数据,每种药品中包含多条药品子数据,将录入的药品数据和患者数据进行数据统一格式转换,得到统一的中文编码的标准药品数据和标准患者数据,对标准药品数据和标准患者数据进行分词处理,将每个分词作为序列元素,以得到药品文本序列和患者文本序列;关键字检测部分,配置用于对药品文本序列和患者文本序列中的序列元素进行关键字检测,保留关键字分词,去除非关键字分词,得到标准药品文本序列和标准患者文本序列;药品推荐部分,配置用于基于标准药品文本序列和标准患者文本序列为患者筛选出与患者病症相适应的药品,作为药品推荐结果;合规性检测部分,配置用于对药品推荐结果进行合规性检测,具体包括:对药品推荐结果中的药品进行药物相互作用分析,以判断药品推荐结果中是否存在不良的药物相互作用,若是,则对存在不良反应的药物的标准药品文本序列中添加一个附加序列,附加序列中每个序列元素为与自身药物存在不良反应的其他药物的主键信息,并发送指令至药品推荐部分重新基于标准药品文本序列和标准患者文本序列为患者筛选出与患者病症相适应的药品,作为新的药品推荐结果,直到药品推荐结果中的药品彼此之间不存在不良的药物相互作用。
2.如权利要求1所述的医药营销管理系统,其特征在于,所述药品数据为药品说明书;所述患者数据为患者病历;所述药品数据中的药品子数据至少包括:药品序列号、药品名称、药品成分、药品价格、药品生产商、药品副作用、药品适应症和药品禁忌症;其中,所述药品序列号作为主键信息;所述患者数据中的患者子数据至少包括:患者姓名、患者唯一身份标识码、患者性别、患者年龄、患者过敏药物名称和患者病症;其中,患者唯一身份标识码为主键信息。
3.如权利要求2所述的医药营销管理系统,其特征在于,所述数据录入和转换部分将录入的药品数据和患者数据进行数据统一格式转换,得到统一的中文编码的标准药品数据和标准患者数据的方法包括:将药品数据和患者数据的中文字符进行全角转半角处理,然后将药品数据和患者数据的文档编码转换为UTF-8或GBK;所述药品数据和患者数据的文档编码格式一致。
4.如权利要求3所述的医药营销管理系统,其特征在于,所述数据录入和转换部分对标准药品数据和标准患者数据进行分词处理,将每个分词作为序列元素,以得到药品文本序列和患者文本序列的方法包括:对文档编码为UTF-8或GBK的药品数据和患者数据分别进行汉字、数字、通用单位、及标点符号的标注,根据标注结果将相邻数字的组合视为一个分词,将通用单位视为一个分词,将单个标点符号视为一个分词,以及将单个汉字视为一个分词,其中,所述通用单位包括中文单位、英文单位、化学单位、以及医用单位。
5.如权利要求4所述的医药营销管理系统,其特征在于,所述关键字检测部分,配置用于对药品文本序列和患者文本序列中的序列元素进行关键字检测,保留关键字分词,去除非关键字分词,得到标准药品文本序列和标准患者文本序列的方法包括:创建一个分词表,包含所有药品文本序列或患者文本序列中出现的分词;对每个药品文本序列或患者文本序列,统计每个分词在药品文本序列或患者文本序列中的出现频率;对于每个分词,使用朴素贝叶斯分类器,计算其在分词表中出现的概率;将药品文本序列或患者文本序列中的序列元素划分为两个类别:关键字分词和非关键字分词;使用朴素贝叶斯分类器,估计关键字分词和非关键字分词的先验概率;对于每个分词,计算其在关键字分词下的条件概率和非关键字分词下的条件概率;使用贝叶斯公式计算每个分词属于关键字分词的后验概率,并按照后验概率对分词进行排序;选择后验概率高于设定阈值的分词作为关键字分词。
6.如权利要求5所述的医药营销管理系统,其特征在于,所述药品推荐部分,基于标准药品文本序列和标准患者文本序列为患者筛选出与患者病症相适应的药品,作为药品推荐结果的方法包括:首先基于标准患者文本序列中的患者过敏药物名称,筛除掉对应的标准药品文本序列;假设输入的标准药品文本序列为,标准患者文本序列为/>;其中,/>表示标准药品文本序列中的第/>个序列元素,其中,1,/>表示标准患者文本序列中的第/>个序列元素,其中,1/>;对于每个标准药品文本序列和标准患者文本序列中的序列元素,提取相应的特征,得到提取的特征为;对于给定的标准药品文本序列和标准患者文本序列,计算得分/>,表示给定的标准药品文本序列和标准患者文本序列组成的标签序列的得分;采用维特比算法进行解码,找到得分最高的标签序列,即最可能的药品推荐结果。
7.如权利要求6所述的医药营销管理系统,其特征在于,所述对于给定的标准药品文本序列和标准患者文本序列,计算得分的公式如下:
;
其中,是CRF模型学习得到的权重参数,/>是特征函数,表示在标准药品文本序列中的第/>个序列元素和标准患者文本序列中的第/>个序列元素上的特征函数值,是转移特征函数,表示标准患者文本序列中第/>个序列元素和第/>个序列元素之间的转移特征函数值;/>为标准药品文本序列中的序列元素的个数;/>为标准患者文本序列中的序列元素的个数。
8.如权利要求7所述的医药营销管理系统,其特征在于,所述维特比算法通过动态规划的方式,逐步计算得分最高的标签序列;具体包括:维护一个矩阵,其中/>表示以标准患者文本序列的第/>个序列元素为结尾,且预测的标签为/>的序列的得分;所述动态规划包括:令/>,其中/>表示标签序列的起始位置;对于每个标准患者文本序列的序列元素/>,使用如下公式计算/>的值,其中/>表示标签序列的可能标签:
;
其中,表示在标准药品文本序列的第/>个序列元素和标准患者文本序列的第/>个序列元素上的特征函数值,/>表示标准患者文本序列的第/>个序列元素和第/>个序列元素之间的转移特征函数值;选择最后一个位置的最大得分,即,其中/>表示标签序列的结束位置;从最后一个位置开始,根据动态规划过程中的选择最大得分的标签,逐步回溯到第一个位置,形成最可能的标签序列作为药品推荐结果;/>为相邻序列元素之间转移特征函数值。
9.如权利要求8所述的医药营销管理系统,其特征在于,所述对于每个标准药品文本序列和标准患者文本序列中的序列元素,提取相应的特征,得到提取的特征为的方法包括:对于标准药品文本序列中的每个序列元素,遍历标准患者文本序列中的所有序列元素,计算相似度值,将标准药品文本序列中的序列元素和在标准患者文本序列中与其相似度值最高的序列元素作为特征;所述计算相似度值的方法使用词向量余弦相似度计算方法。
10.如权利要求9所述的医药营销管理系统,其特征在于,所述合规性检测部分,对药品推荐结果中的药品进行药物相互作用分析的方法包括:获取药品推荐结果中药品的药品成分,使用基于分子指纹和随机森林算法的方法基于药品成分进行相互作用分析。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310815923.1A CN116741333B (zh) | 2023-07-05 | 2023-07-05 | 一种医药营销管理系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310815923.1A CN116741333B (zh) | 2023-07-05 | 2023-07-05 | 一种医药营销管理系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116741333A CN116741333A (zh) | 2023-09-12 |
CN116741333B true CN116741333B (zh) | 2024-04-30 |
Family
ID=87911480
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310815923.1A Active CN116741333B (zh) | 2023-07-05 | 2023-07-05 | 一种医药营销管理系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116741333B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117334292B (zh) * | 2023-10-10 | 2024-04-05 | 山东百康云网络科技有限公司 | 一种药品销售管理系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112116978A (zh) * | 2020-09-17 | 2020-12-22 | 陕西师范大学 | 一种风湿免疫药物推荐方法、系统及装置 |
CN113707261A (zh) * | 2021-08-30 | 2021-11-26 | 平安国际智慧城市科技股份有限公司 | 基于人工智能的药品推荐方法、装置及相关设备 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11176330B2 (en) * | 2019-07-22 | 2021-11-16 | Advanced New Technologies Co., Ltd. | Generating recommendation information |
-
2023
- 2023-07-05 CN CN202310815923.1A patent/CN116741333B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112116978A (zh) * | 2020-09-17 | 2020-12-22 | 陕西师范大学 | 一种风湿免疫药物推荐方法、系统及装置 |
CN113707261A (zh) * | 2021-08-30 | 2021-11-26 | 平安国际智慧城市科技股份有限公司 | 基于人工智能的药品推荐方法、装置及相关设备 |
Also Published As
Publication number | Publication date |
---|---|
CN116741333A (zh) | 2023-09-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US12080429B2 (en) | Methods and apparatus for providing guidance to medical professionals | |
US11610678B2 (en) | Medical diagnostic aid and method | |
US20140181128A1 (en) | Systems and Methods for Processing Patient Data History | |
Gangavarapu et al. | FarSight: long-term disease prediction using unstructured clinical nursing notes | |
Friedlin et al. | A natural language processing system to extract and code concepts relating to congestive heart failure from chest radiology reports | |
US20220382784A1 (en) | Determining an association rule | |
Chiu et al. | Word embeddings for biomedical natural language processing: A survey | |
US11157822B2 (en) | Methods and systems for classification using expert data | |
Chen et al. | Modified bidirectional encoder representations from transformers extractive summarization model for hospital information systems based on character-level tokens (AlphaBERT): development and performance evaluation | |
CN116741333B (zh) | 一种医药营销管理系统 | |
CN113450905A (zh) | 医疗辅助诊断系统、方法及计算机可读存储介质 | |
Zhao | Clinical data extraction and normalization of cyrillic electronic health records via deep-learning natural language processing | |
Falissard et al. | Neural translation and automated recognition of ICD-10 medical entities from natural language: Model development and performance assessment | |
Yogarajan et al. | Seeing the whole patient: using multi-label medical text classification techniques to enhance predictions of medical codes | |
Memarzadeh et al. | A study into patient similarity through representation learning from medical records | |
Teng et al. | Few-shot ICD coding with knowledge transfer and evidence representation | |
Kaur et al. | Analysing effectiveness of multi-label classification in clinical coding | |
Moya-Carvajal et al. | ML models for severity classification and length-of-stay forecasting in emergency units | |
US11783244B2 (en) | Methods and systems for holistic medical student and medical residency matching | |
Wunnava et al. | One Size Does Not Fit All: An Ensemble Approach Towards Information Extraction from Adverse Drug Event Narratives. | |
Weissenbacher et al. | Detecting goals of care conversations in clinical notes with active learning | |
Walsh et al. | Scalable incident detection via natural language processing and probabilistic language models | |
Hameed et al. | An NLP-Enhanced Approach to Test Comorbidities Risk Scoring Based on Unstructured Health Data for Hospital Readmissions Prediction. | |
US20230351256A1 (en) | Methods and systems for causative chaining of prognostic label classifications | |
Moya-Carvajal et al. | Machine Learning Models for Severity Classification and Length-of-Stay Forecasting in Emergency Units |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |