CN108647236A - 一种基于词共现的中药处方向量空间模型方法及装置 - Google Patents
一种基于词共现的中药处方向量空间模型方法及装置 Download PDFInfo
- Publication number
- CN108647236A CN108647236A CN201810288330.3A CN201810288330A CN108647236A CN 108647236 A CN108647236 A CN 108647236A CN 201810288330 A CN201810288330 A CN 201810288330A CN 108647236 A CN108647236 A CN 108647236A
- Authority
- CN
- China
- Prior art keywords
- medicine
- occurrence
- chinese medicine
- prescriptions
- term
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 239000003814 drug Substances 0.000 title claims abstract description 218
- 238000000034 method Methods 0.000 title claims abstract description 51
- 230000000717 retained effect Effects 0.000 claims abstract description 8
- 239000003795 chemical substances by application Substances 0.000 claims description 3
- 229940079593 drug Drugs 0.000 claims description 2
- 230000000694 effects Effects 0.000 abstract description 7
- 230000006870 function Effects 0.000 description 13
- 238000012545 processing Methods 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 238000000605 extraction Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 230000007812 deficiency Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明公开了一种基于词共现的中药处方向量空间模型方法及装置,该方法包括:预处理中药处方数据,保留药方与相应证型对应关系,构建药方事务集;扫描整个药方事务集,计算各个中药频率以及药对的词共现频率,并根据此计算药对词共现的支持度和置信度;当药对词共现的支持度和置信度大于对应预设阈值时,将该药对加入共现词集合,直至遍历事务集;将共现词集合中属于中药处方药对库的药对构建语义向量空间模型。本发明有效表示中药处方潜在语义信息,从而提高中药处方聚类效果。
Description
技术领域
本发明属于中药处方聚类的技术领域,尤其是涉及一种基于词共现的中药处方向量空间模型方法及装置。
背景技术
中医文献作为中医学的主要知识资源,信息量非常庞大,文献工作者们在进行研究时,往往需要人工对这些资料进行收集、分类、加工、检索、统计和推理,劳动强度大,效率低。计算机技术的发展给中医文献研究提供了新思路和新方法。利用计算机技术来辅助人们完成对中医文献的部分整理工作,将能在很大程度减轻人们的负担,更好的促进中医药的研究和发展。
中医药信息的数字化工作开始于20世纪80年代,经过二十多年的发展已经取得了初步的成果。到目前为止已经有数十个中医药大学、学院及研究所建设了各种规模不同的中医药信息数据库近百个,初步实现了中医药信息数字化。现有的中药处方数据库的存在的主要不足是:对中药处方的核心信息处方中的药物及其用量信息没有细化,这给方剂数据的进一步利用造成了很大困难。目前专门讨论中药处方分类聚类方面的研究相对比较少。文本分类(Text Categorization)是利用计算机实现文本自动分类的技术。文本分类中常常采用向量空间模型(Vector Space Mode)来表示文档,并且已经有了比较成熟的分类器算法。可以利用文本分类技术对中医方剂进行自动分类,从而更好地组织和管理方剂。
然而,现有基于向量空间模型的中药处方分类方法存在如下问题:
由于向量空间模型忽略了词间的关联性,在中药处方研究中仅仅以单个中药为基础表示,不能很好地表示潜在语义信息,因此中药处方的聚类效果得不到有效地提高。
综上所述,现有技术中如何表示中药处方潜在语义信息从而提高中药处方聚类效果的问题,尚缺乏行之有效的解决方案。
发明内容
针对现有技术中存在的不足,解决现有技术中如何表示中药处方潜在语义信息从而提高中药处方聚类效果的问题,本发明提出了一种基于词共现的中药处方向量空间模型方法及装置,具体涉及到中医药方中共现词的抽取,中药药对与共现词的关联性,及处方的功能主治与词共现的关联性,设计了权值计算方法,通过基于词共现的中医药方向量空间模型,有效表示中药处方潜在语义信息,从而提高中药处方聚类效果。
本发明的第一目的是提供一种基于词共现的中药处方向量空间模型方法。
为了实现上述目的,本发明采用如下一种技术方案:
一种基于词共现的中药处方向量空间模型方法,该方法包括:
预处理中药处方数据,保留药方与相应证型对应关系,构建药方事务集;
扫描整个药方事务集,计算各个中药频率以及药对的词共现频率,并根据此计算药对词共现的支持度和置信度;
当药对词共现的支持度和置信度大于对应预设阈值时,将该药对加入共现词集合,直至遍历事务集;
将共现词集合中属于中药处方药对库的药对构建语义向量空间模型。
作为进一步的优选方案,所述预处理中药处方数据包括:对中药处方数据中的同义词、近义词和错别字进行修订。
作为进一步的优选方案,在本方法中,根据预处理中药处方数据中药方与相应证型对应关系,构建中药方剂药对,并根据中药方剂药对构建药方事务集。
作为进一步的优选方案,在本方法中,分别计算药方事务集中各个中药方剂药对的词共现频率以及中药方剂药对中单个中药的出现频率。
作为进一步的优选方案,在本方法中,所述药对词共现的支持度为药对在整个事务集中共同出现频率。
作为进一步的优选方案,在本方法中,所述药对词共现的置信度为药对的词共现频率的平方与中药方剂药对中单个中药的出现频率乘积的比。
作为进一步的优选方案,在本方法中,构建所述共现词集合的具体方法为:
分别判断药对词共现的支持度和置信度与其对应预设阈值的大小关系;
当药对词共现的支持度和置信度大于对应预设阈值时,将该药对加入共现词集合;否则,继续遍历事务集;直至整个药方事务集遍历完毕;
构建共现词集合。
作为进一步的优选方案,在本方法中,将共现词集合中属于中药处方药对库的药对构建语义向量空间模型的具体方法为:
将共现词集合中的共现词与中药处方药对库的药对进行比对;
若共现词集合中的共现词属于中药处方药对库,则将药对的修正权值置1,否则置0;
根据药对的修正权值、置信度、频率和逆文本频率的函数计算共现词的权值,并根据共现词权值,构建语义向量空间模型。
本发明的第二目的是提供一种计算机可读存储介质。
为了实现上述目的,本发明采用如下一种技术方案:
一种计算机可读存储介质,其中存储有多条指令,所述指令适于由终端设备设备的处理器加载并执行以下处理:
预处理中药处方数据,保留药方与相应证型对应关系,构建药方事务集;
扫描整个药方事务集,计算各个中药频率以及药对的词共现频率,并根据此计算药对词共现的支持度和置信度;
当药对词共现的支持度和置信度大于对应预设阈值时,将该药对加入共现词集合,直至遍历事务集;
将共现词集合中属于中药处方药对库的药对构建语义向量空间模型。
本发明的第三目的是提供一种基于词共现的中药处方向量空间模型装置。
为了实现上述目的,本发明采用如下一种技术方案:
一种基于词共现的中药处方向量空间模型装置,包括处理器和计算机可读存储介质,处理器用于实现各指令;计算机可读存储介质用于存储多条指令,所述指令适于由处理器加载并执行以下处理:
预处理中药处方数据,保留药方与相应证型对应关系,构建药方事务集;
扫描整个药方事务集,计算各个中药频率以及药对的词共现频率,并根据此计算药对词共现的支持度和置信度;
当药对词共现的支持度和置信度大于对应预设阈值时,将该药对加入共现词集合,直至遍历事务集;
将共现词集合中属于中药处方药对库的药对构建语义向量空间模型。
本发明的有益效果:
本发明所述的一种基于词共现的中药处方向量空间模型方法及装置,通过中医药方中共现词的抽取,中药药对与共现词的关联性,及处方的功能主治与词共现的关联性,设计了权值计算方法,构建基于词共现的中医药方向量空间模型,有效表示中药处方潜在语义信息,从而提高中药处方聚类效果。
附图说明
构成本申请的一部分的说明书附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。
图1是本发明的基于词共现的中药处方向量空间模型方法流程图。
具体实施方式:
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应该指出,以下详细说明都是例示性的,旨在对本申请提供进一步的说明。除非另有指明,本实施例使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
需要注意的是,附图中的流程图和框图示出了根据本公开的各种实施例的方法和系统的可能实现的体系架构、功能和操作。应当注意,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,所述模块、程序段、或代码的一部分可以包括一个或多个用于实现各个实施例中所规定的逻辑功能的可执行指令。也应当注意,在有些作为备选的实现中,方框中所标注的功能也可以按照不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,或者它们有时也可以按照相反的顺序执行,这取决于所涉及的功能。同样应当注意的是,流程图和/或框图中的每个方框、以及流程图和/或框图中的方框的组合,可以使用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以使用专用硬件与计算机指令的组合来实现。
在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合下面结合附图与实施例对本发明作进一步说明。
实施例1:
本实施例1的目的是提供一种基于词共现的中药处方向量空间模型方法。
为了实现上述目的,本发明采用如下一种技术方案:
如图1所示,
一种基于词共现的中药处方向量空间模型方法,该方法包括:
步骤(1):预处理中药处方数据,保留药方与相应证型对应关系,构建药方事务集;
步骤(2):扫描整个药方事务集,计算各个中药频率以及药对的词共现频率,并根据此计算药对词共现的支持度和置信度;
步骤(3):当药对词共现的支持度和置信度大于对应预设阈值时,将该药对加入共现词集合,直至遍历事务集;
步骤(4):将共现词集合中属于中药处方药对库的药对构建语义向量空间模型。
在本实施例的步骤(1)中,
步骤(1-1):预处理中药处方数据;所述预处理中药处方数据包括:对中药处方数据中的同义词、近义词和错别字进行修订。
步骤(1-2):构建药方事务集;所述构建药方事务集包括:根据预处理中药处方数据中药方与相应证型对应关系,构建中药方剂药对S,并根据中药方剂药对构建药方事务集。
在本实施例的步骤(2)中,
步骤(2-1):分别计算药方事务集中各个中药方剂药对的词共现频率以及中药方剂药对中单个中药的出现频率;扫描整个事务集,分别计算P(ti)、P(tj)和P(ti,tj)其中,p(ti)和p(tj)分别表示中药ti和tj的频率;p(ti,tj)表示词共现(ti,tj)的频率;
步骤(2-2):计算药对词共现的支持度和置信度。所述药对词共现的支持度为药对在整个事务集中共同出现频率。所述药对词共现的置信度为药对的词共现频率的平方与中药方剂药对中单个中药的出现频率乘积的比。
计算支持度support(ti,tj)和置信度confidence(ti,tj);support(ti,tj)表示(ti,tj)在文本集中共同出现频率,confidence(ti,tj)定义如下:
在本实施例的步骤(3)中,
构建所述共现词集合的具体方法为:
步骤(3-1):分别判断药对词共现的支持度和置信度与其对应预设阈值的大小关系;预设支持度阈值为γ,预设置信度阈值为Ω;
若药对词共现的支持度小于预设支持度阈值γ或药对词共现的置信度小于预设置信度阈值Ω,则返回步骤(2);
若药对词共现的支持度大于预设支持度阈值γ并且药对词共现的置信度大于预设置信度阈值Ω,将该药对(ti,tj)加入共现词集合R;并返回步骤(2);
当整个药方事务集遍历完毕,构建出共现词集合,执行步骤(4)。
在本实施例的步骤(4)中,
将共现词集合中属于中药处方药对库的药对构建语义向量空间模型的具体方法为:
步骤(4-1):将共现词集合R={r1,r2,...,rm}中的共现词与中药处方药对库T的药对进行比对;
若共现词集合中的共现词属于中药处方药对库,则将药对的修正权值置1,否则置0;例如r2∈T,则药对r2的修正权值置1;
步骤(4-2):根据药对的修正权值、置信度、频率和逆文本频率的函数计算共现词的权值,并根据共现词权值,构建语义向量空间模型。
中医药方语料库D={d1,d2,...,dn}包含n个药方,在D在抽取出的词共现集合为R={r1,r2,...,rm},其中rm为抽取出的第m个词共现,则中医药方语料空间可以表示成一个m×n矩阵,其中行向量di={dri1,dri2,...,drim}代表一个药方,矩阵中的元素drij表示词共现的分布情况,如出现则相应的权值为drij,drij定义如公式6所示;如不出现,则相应的权值为为0。
药对的修正权值、置信度、频率和逆文本频率的函数为:
dri=TF×IDF×MI(ti,tj)×δ
其中,TF表示词共现的词频,IDF表示词共现的逆文本频率,MI(ti,tj)为confidence(ti,tj)。
实施例2:
本实施例2的目的是提供一种计算机可读存储介质。
为了实现上述目的,本发明采用如下一种技术方案:
一种计算机可读存储介质,其中存储有多条指令,所述指令适于由终端设备设备的处理器加载并执行以下处理:
步骤(1):预处理中药处方数据,保留药方与相应证型对应关系,构建药方事务集;
步骤(2):扫描整个药方事务集,计算各个中药频率以及药对的词共现频率,并根据此计算药对词共现的支持度和置信度;
步骤(3):当药对词共现的支持度和置信度大于对应预设阈值时,将该药对加入共现词集合,直至遍历事务集;
步骤(4):将共现词集合中属于中药处方药对库的药对构建语义向量空间模型。
实施例3:
本实施例3的目的是提供一种基于词共现的中药处方向量空间模型装置。
为了实现上述目的,本发明采用如下一种技术方案:
一种基于词共现的中药处方向量空间模型装置,包括处理器和计算机可读存储介质,处理器用于实现各指令;计算机可读存储介质用于存储多条指令,所述指令适于由处理器加载并执行以下处理:
步骤(1):预处理中药处方数据,保留药方与相应证型对应关系,构建药方事务集;
步骤(2):扫描整个药方事务集,计算各个中药频率以及药对的词共现频率,并根据此计算药对词共现的支持度和置信度;
步骤(3):当药对词共现的支持度和置信度大于对应预设阈值时,将该药对加入共现词集合,直至遍历事务集;
步骤(4):将共现词集合中属于中药处方药对库的药对构建语义向量空间模型。
这些计算机可执行指令在设备中运行时使得该设备执行根据本公开中的各个实施例所描述的方法或过程。
在本实施例中,计算机程序产品可以包括计算机可读存储介质,其上载有用于执行本公开的各个方面的计算机可读程序指令。计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
本文所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本公开内容操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如C++等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本公开内容的各个方面。
应当注意,尽管在上文的详细描述中提及了设备的若干模块或子模块,但是这种划分仅仅是示例性而非强制性的。实际上,根据本公开的实施例,上文描述的两个或更多模块的特征和功能可以在一个模块中具体化。反之,上文描述的一个模块的特征和功能可以进一步划分为由多个模块来具体化。
本发明的有益效果:
本发明所述的一种基于词共现的中药处方向量空间模型方法及装置,通过中医药方中共现词的抽取,中药药对与共现词的关联性,及处方的功能主治与词共现的关联性,设计了权值计算方法,构建基于词共现的中医药方向量空间模型,有效表示中药处方潜在语义信息,从而提高中药处方聚类效果。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (10)
1.一种基于词共现的中药处方向量空间模型方法,其特征在于,该方法包括:
预处理中药处方数据,保留药方与相应证型对应关系,构建药方事务集;
扫描整个药方事务集,计算各个中药频率以及药对的词共现频率,并根据此计算药对词共现的支持度和置信度;
当药对词共现的支持度和置信度大于对应预设阈值时,将该药对加入共现词集合,直至遍历事务集;
将共现词集合中属于中药处方药对库的药对构建语义向量空间模型。
2.如权利要求1所述的方法,其特征在于,所述预处理中药处方数据包括:对中药处方数据中的同义词、近义词和错别字进行修订。
3.如权利要求1所述的方法,其特征在于,在本方法中,根据预处理中药处方数据中药方与相应证型对应关系,构建中药方剂药对,并根据中药方剂药对构建药方事务集。
4.如权利要求1所述的方法,其特征在于,在本方法中,分别计算药方事务集中各个中药方剂药对的词共现频率以及中药方剂药对中单个中药的出现频率。
5.如权利要求1所述的方法,其特征在于,在本方法中,所述药对词共现的支持度为药对在整个事务集中共同出现频率。
6.如权利要求1所述的方法,其特征在于,在本方法中,所述药对词共现的置信度为药对的词共现频率的平方与中药方剂药对中单个中药的出现频率乘积的比。
7.如权利要求1所述的方法,其特征在于,在本方法中,构建所述共现词集合的具体方法为:
分别判断药对词共现的支持度和置信度与其对应预设阈值的大小关系;
当药对词共现的支持度和置信度大于对应预设阈值时,将该药对加入共现词集合;否则,继续遍历事务集;直至整个药方事务集遍历完毕;
构建共现词集合。
8.如权利要求1所述的方法,其特征在于,在本方法中,将共现词集合中属于中药处方药对库的药对构建语义向量空间模型的具体方法为:
将共现词集合中的共现词与中药处方药对库的药对进行比对;
若共现词集合中的共现词属于中药处方药对库,则将药对的修正权值置1,否则置0;
根据药对的修正权值、置信度、频率和逆文本频率的函数计算共现词的权值,并根据共现词权值,构建语义向量空间模型。
9.一种计算机可读存储介质,其中存储有多条指令,其特征在于,所述指令适于由终端设备设备的处理器加载并执行根据权利要求1-8中任一项所述的方法。
10.一种终端设备,包括处理器和计算机可读存储介质,处理器用于实现各指令;计算机可读存储介质用于存储多条指令,其特征在于,所述指令用于执行根据权利要求1-8中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810288330.3A CN108647236B (zh) | 2018-03-30 | 2018-03-30 | 一种基于词共现的中药处方向量空间模型方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810288330.3A CN108647236B (zh) | 2018-03-30 | 2018-03-30 | 一种基于词共现的中药处方向量空间模型方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108647236A true CN108647236A (zh) | 2018-10-12 |
CN108647236B CN108647236B (zh) | 2021-07-13 |
Family
ID=63745510
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810288330.3A Active CN108647236B (zh) | 2018-03-30 | 2018-03-30 | 一种基于词共现的中药处方向量空间模型方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108647236B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110010251A (zh) * | 2019-02-01 | 2019-07-12 | 华南师范大学 | 一种中药社团信息生成方法、系统、装置和存储介质 |
CN110660482A (zh) * | 2019-09-29 | 2020-01-07 | 北京一药良心信息科技有限公司 | 一种基于大数据的中医处方智能推荐系统及其控制方法 |
CN114386528A (zh) * | 2022-01-18 | 2022-04-22 | 平安科技(深圳)有限公司 | 模型的训练方法和装置、计算机设备、存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130060575A1 (en) * | 2011-09-02 | 2013-03-07 | Christopher Nee | Interactive web-based prescription system and method |
CN103365978A (zh) * | 2013-07-01 | 2013-10-23 | 浙江大学 | 基于lda主题模型的中医药数据挖掘方法 |
CN104978347A (zh) * | 2014-04-11 | 2015-10-14 | 中国中医科学院中医临床基础医学研究所 | 中文生物医学文献数据库中敏感关键词的数据挖掘方法和系统 |
CN106650225A (zh) * | 2016-10-25 | 2017-05-10 | 康美药业股份有限公司 | 基于fp增长算法模型的中药配方数据挖掘方法及系统 |
CN106708969A (zh) * | 2016-12-02 | 2017-05-24 | 山西大学 | 文献资源主题聚类共现潜在语义向量空间模型语义核方法 |
CN106777165A (zh) * | 2016-12-21 | 2017-05-31 | 广东技术师范学院 | 一种基于网络爬虫的药品信息库构建方法 |
US20170186093A1 (en) * | 2015-12-23 | 2017-06-29 | Aetna Inc. | Resource allocation |
-
2018
- 2018-03-30 CN CN201810288330.3A patent/CN108647236B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130060575A1 (en) * | 2011-09-02 | 2013-03-07 | Christopher Nee | Interactive web-based prescription system and method |
CN103365978A (zh) * | 2013-07-01 | 2013-10-23 | 浙江大学 | 基于lda主题模型的中医药数据挖掘方法 |
CN104978347A (zh) * | 2014-04-11 | 2015-10-14 | 中国中医科学院中医临床基础医学研究所 | 中文生物医学文献数据库中敏感关键词的数据挖掘方法和系统 |
US20170186093A1 (en) * | 2015-12-23 | 2017-06-29 | Aetna Inc. | Resource allocation |
CN106650225A (zh) * | 2016-10-25 | 2017-05-10 | 康美药业股份有限公司 | 基于fp增长算法模型的中药配方数据挖掘方法及系统 |
CN106708969A (zh) * | 2016-12-02 | 2017-05-24 | 山西大学 | 文献资源主题聚类共现潜在语义向量空间模型语义核方法 |
CN106777165A (zh) * | 2016-12-21 | 2017-05-31 | 广东技术师范学院 | 一种基于网络爬虫的药品信息库构建方法 |
Non-Patent Citations (3)
Title |
---|
CHENGHE SHI等: "《Applying complex system entropy cluster algorithm to mining principle of herbal combinations in traditional Chinese medicine》", 《ACM》 * |
孟红梅: "《基于数据挖掘的中医方剂分析技术研究》", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
袁锋: "中医医案文本挖掘的若干关键技术研究", 《中国博士学位论文全文数据库信息科技辑》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110010251A (zh) * | 2019-02-01 | 2019-07-12 | 华南师范大学 | 一种中药社团信息生成方法、系统、装置和存储介质 |
CN110010251B (zh) * | 2019-02-01 | 2022-04-15 | 华南师范大学 | 一种中药社团信息生成方法、系统、装置和存储介质 |
CN110660482A (zh) * | 2019-09-29 | 2020-01-07 | 北京一药良心信息科技有限公司 | 一种基于大数据的中医处方智能推荐系统及其控制方法 |
CN114386528A (zh) * | 2022-01-18 | 2022-04-22 | 平安科技(深圳)有限公司 | 模型的训练方法和装置、计算机设备、存储介质 |
CN114386528B (zh) * | 2022-01-18 | 2024-05-14 | 平安科技(深圳)有限公司 | 模型的训练方法和装置、计算机设备、存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN108647236B (zh) | 2021-07-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10489438B2 (en) | Method and system for data processing for text classification of a target domain | |
WO2022141861A1 (zh) | 情感分类方法、装置、电子设备及存储介质 | |
CN109739978A (zh) | 一种文本聚类方法、文本聚类装置及终端设备 | |
US20190295187A1 (en) | Calculating expertise confidence based on content and social proximity | |
CN107767259A (zh) | 贷款风险控制方法、电子装置及可读存储介质 | |
CN105653559A (zh) | 用于在数据库中进行搜索的方法和装置 | |
CN108647236A (zh) | 一种基于词共现的中药处方向量空间模型方法及装置 | |
CN109492222A (zh) | 基于概念树的意图识别方法、装置及计算机设备 | |
US9588819B2 (en) | System and method of assigning requests to resources using constraint programming | |
CN108153853A (zh) | 基于Wikipedia链接结构的中文概念向量生成方法和装置 | |
CN110232487A (zh) | 一种任务分派方法和装置 | |
CN105701160A (zh) | 一种监察规则引擎及其实现监察的方法 | |
US11354297B2 (en) | Detecting positivity violations in multidimensional data | |
CN109657044A (zh) | 数据检索方法、数据排序方法、装置、终端以及存储介质 | |
CN103577455A (zh) | 用于数据库聚集操作的数据处理方法和系统 | |
CN109885831A (zh) | 关键术语抽取方法、装置、设备及计算机可读存储介质 | |
CN111582645B (zh) | 基于因子分解机的app风险评估方法、装置和电子设备 | |
CN111340601B (zh) | 商品信息的推荐方法和装置、电子设备和存储介质 | |
CN109784407A (zh) | 确定表字段的类型的方法和装置 | |
CN109558887A (zh) | 一种预测行为的方法和装置 | |
CN107451212A (zh) | 基于相关搜索的同义挖掘方法和装置 | |
CN104166581B (zh) | 一种面向增量制造设备的虚拟化方法 | |
CN110215703A (zh) | 游戏应用的选择方法、装置及系统 | |
CN110489667A (zh) | 基于用户画像的智能公文流转技术 | |
CN107454456A (zh) | 一种浮层元素的管理控制方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20240319 Address after: No. 4567 Tangye Middle Road, Licheng District, Jinan City, Shandong Province, 250109, Shandong Province, China. Lu Shang Fenghuang Plaza 1-502-2 Patentee after: Shandong BeiSen Hospital Management Consulting Co.,Ltd. Country or region after: Zhong Guo Address before: No.60, sangyuan Road, Jinan City, Shandong Province Patentee before: SHANDONG MANAGEMENT University Country or region before: Zhong Guo |
|
TR01 | Transfer of patent right |