CN110838343B - 一种基于多模态指纹图谱的中药药性识别方法及系统 - Google Patents

一种基于多模态指纹图谱的中药药性识别方法及系统 Download PDF

Info

Publication number
CN110838343B
CN110838343B CN201911119179.1A CN201911119179A CN110838343B CN 110838343 B CN110838343 B CN 110838343B CN 201911119179 A CN201911119179 A CN 201911119179A CN 110838343 B CN110838343 B CN 110838343B
Authority
CN
China
Prior art keywords
traditional chinese
chinese medicine
property
similarity
probability
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911119179.1A
Other languages
English (en)
Other versions
CN110838343A (zh
Inventor
魏国辉
邱敏
王振国
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong University of Traditional Chinese Medicine
Original Assignee
Shandong University of Traditional Chinese Medicine
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong University of Traditional Chinese Medicine filed Critical Shandong University of Traditional Chinese Medicine
Priority to CN201911119179.1A priority Critical patent/CN110838343B/zh
Publication of CN110838343A publication Critical patent/CN110838343A/zh
Application granted granted Critical
Publication of CN110838343B publication Critical patent/CN110838343B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/30Prediction of properties of chemical compounds, compositions or mixtures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • Medical Informatics (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Biology (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)
  • Medicines Containing Plant Substances (AREA)

Abstract

本公开提出了一种基于多模态指纹图谱的中药药性识别方法及系统,先由红外图谱在中药图谱数据库中进行中药红外图谱的相似性筛选,排除掉红外图谱不相似的中药,然后在筛选的中药数据库中,由紫外图谱进行紫外图谱的相似性筛选,采用多模态数据有利于提取中药的全部成分,有利于中药药性的准确判断和整体分析。获取紫外图谱相似的中药图谱数据集,根据获得的红外和紫外图谱联合相似数据集进行识别判断,最终通过集成学习方法判断待测中药的药性,识别准确并且识别效率高。

Description

一种基于多模态指纹图谱的中药药性识别方法及系统
技术领域
本公开涉及中药相关技术领域,具体的说,是涉及一种基于多模态指纹图谱的中药药性识别方法及系统。
背景技术
本部分的陈述仅仅是提供了与本公开相关的背景技术信息,并不必然构成在先技术。
中药药性理论即是研究中药的性质、性能及其运用规律的理论。中药药性理论是中医药理论的核心,主要包括四气、五味、归经、升降沉浮、有毒无毒等。四气,就是寒热温凉四种不同的药性,又称四性。它反映了药物对人体阴阳盛衰、寒热变化的作用倾向,为药性理论重要组成部分,是说明药物作用的主要理论依据之一。
发明人发现,现有的判断中药药性四气的方法单一,如采用单溶剂的方法不能提取中药的全部成分,不利于提取中药的整体成分,不利于中药药性的准确判断和整体分析,特别对于新开发的中药材,不利于后期的使用,并且药性判断不准确会造成严重后果。
发明内容
本公开为了解决上述问题,提出了一种基于多模态指纹图谱的中药药性识别方法,先由红外图谱在中药图谱数据库中进行中药红外图谱的相似性筛选,排除红外图谱不相似的中药,然后在筛选的红外图谱相似的中药数据库中,进行紫外图谱的相似性筛选,获取紫外图谱相似的中药图谱数据集,根据获得的红外和紫外图谱联合相似数据集进行识别判断,确定未知中药的寒热药性,提高识别的准确性。
为了实现上述目的,本公开采用如下技术方案:
一个或多个实施例提供了一种基于多模态指纹图谱的中药药性识别方法,包括如下步骤:
获取待识别中药的多种模态指纹图谱数据;
红外图谱相似性筛选:选取已知寒热药性中药的红外图谱,计算待测中药红外图谱与已知中药相同模态下的红外图谱的相似性度量,筛选出相似度较高的设定阈值数量M的中药;
紫外图谱相似性筛选:在筛选出的红外图谱相似度较高的M味中药中,计算待测中药紫外图谱与已知中药相同模态下的紫外图谱数据的相似性度量;
根据紫外图谱数据相似性度量排序,获得相似性数值较大的前N个已知中药,根据N个已知中药的药性计算待测中药寒性概率和热性概率;
根据每个模态下待测中药的寒性概率和热性概率采用集成学习算法,识别中药的药性是寒性还是热性。
一个或多个实施例提供了一种基于多模态指纹图谱的中药药性识别系统,包括:
用于获取待识别中药的多种模态指纹图谱数据的模块;
红外图谱相似性筛选模块:选取已知寒热药性中药的红外图谱,计算待测中药红外图谱与已知中药相同模态下的红外图谱的相似性度量,筛选出相似度较高的设定阈值数量M的中药;
紫外图谱相似性筛选模块:在筛选出的红外图谱相似度较高的M味中药中,计算待测中药紫外图谱与已知中药相同模态下的紫外图谱数据的相似性度量;
概率计算模块:用于根据紫外图谱数据相似性度量排序,获得相似性数值较大的前N个已知中药,根据N个已知中药的药性计算待测中药寒性概率和热性概率;
识别模块:用于根据每个模态下待测中药的寒性概率和热性概率采用集成学习算法,识别中药的药性是寒性还是热性。
本公开还提供了一种电子设备,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成上述方法所述的步骤。
本公开还提供了一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成上述方法所述的步骤。
与现有技术相比,本公开的有益效果为:
本公开采用多种溶剂下的红外和紫外指纹图谱技术建立多模态的中药指纹图谱数据集,此方法有利于提取中药的全部成分,有利于中药药性的准确判断和整体分析。本公开提出一种基于多模态图谱联合的中药药性识别方法,首先由红外图谱筛选相似中药,然后由紫外图谱筛选相似中药,最后得到红外和紫外图谱都比较相似的中药,根据相似中药的药性判断未知中药的药性。提高了中药药性识别的准确性。
根据得到红外图谱和紫外图谱都比较相似的中药的药性,计算每一种模态下待测中药的寒性概率和热性概率,采用集成学习方法计算多模态融合的待测中药寒性概率,判断待测中药的药性,识别准确并且识别效率高。
附图说明
构成本公开的一部分的说明书附图用来提供对本公开的进一步理解,本公开的示意性实施例及其说明用于解释本公开,并不构成对本公开的限定。
图1是本公开实施例1的方法流程图;
图2是本公开实施例2的系统框图。
具体实施方式:
下面结合附图与实施例对本公开作进一步说明。
应该指出,以下详细说明都是示例性的,旨在对本公开提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本公开所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本公开的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。需要说明的是,在不冲突的情况下,本公开中的各个实施例及实施例中的特征可以相互组合。下面将结合附图对实施例进行详细描述。
技术术语解释:
模态:每一种信息的来源或者形式,都可以称为一种模态。本实施例中采用多种溶剂获得了多组模态数据。
实施例1
在一个或多个实施方式中公开的技术方案中,如图1所示,一种多模态指纹图谱联合的中药药性识别方法,包括如下步骤:
步骤1、获取待识别中药的多种模态指纹图谱数据。
步骤2、红外图谱相似性筛选:选取已知寒热药性中药的红外图谱,计算待测中药红外图谱与已知中药相同模态下的红外图谱的相似性度量,筛选出相似度较高的设定阈值数量M的中药;
步骤3、紫外图谱相似性筛选:在筛选出的红外图谱相似度较高的M味中药中,计算待测中药紫外图谱与已知中药相同模态下的紫外图谱数据的相似性度量;
步骤4、根据紫外图谱数据相似性度量排序,获得相似性数值较大的前N个已知中药,根据N个已知中药的药性计算待测中药寒性概率和热性概率;
步骤5、根据每个模态下待测中药的寒性概率和热性概率采用集成学习算法,识别中药的药性是寒性还是热性。
所述步骤1中多种模态指纹图谱数据包括:至少两种溶剂的紫外指纹图谱数据和红外图谱数据,所述溶剂可以为氯仿、石油醚和蒸馏水等。采用每一种溶剂获得的指纹图谱数据为一种模态数据,如本实施例可以具体的采用三种溶剂(氯仿、石油醚和蒸馏水)的紫外指纹图谱数据和两种溶剂(氯仿、蒸馏水)的红外图谱数据,为五种模态指纹图谱数据。
紫外光谱是分子中某些价电子吸收了一定波长的电子波,由低能级跃进到高能级而产生的一种光谱,也称为电子光谱,目前使用的紫外光谱仪的波长范围为200-800nm,紫外光谱仪检测的紫外光谱图中包含了峰位置、峰个数分别用于表示化学成分的个数和相对位置,峰高或者峰面积用于表示各化学成分的含量。紫外光谱数据包括紫外波长与各个波长的光的吸收度。
红外光谱是当一束具有连续波长的红外光通过物质,物质分子中某个基团的振动频率或转动频率和红外光的频率一样时,分子就吸收能量由原来的基态振(转)动能级跃迁到能量较高的振(转)动能级,分子吸收红外辐射后发生振动和转动能级的跃迁,该处波长的光就被物质吸收。所以,红外光谱法实质上是一种根据分子内部原子间的相对振动和分子转动等信息来确定物质分子结构和鉴别化合物的分析方法。将分子吸收红外光的情况用仪器记录下来,就得到红外光谱图。红外光谱图通常用波长(λ)或波数(σ)为横坐标,表示吸收峰的位置,用透光率(T%)或者吸光度(A)为纵坐标,表示吸收强度。红外光谱是红外波长以及对各个波长的吸收度。
不同的中药成分对光谱的吸收度不同,采用单一的光谱不能提取中药的全部成分,并且成分的提取跟溶剂的选择也有很大关系,中药的成分不同,最适宜的溶剂和最适宜的数据采集方法也不同。本实例采用多种溶剂获得指纹图谱数据有利于提取中药的全部成分,有利于中药药性的准确判断和整体分析。
步骤2中红外图谱相似性筛选:选取已知中药寒热药性识别的红外图谱,计算待测中药红外图谱与已知中药相同模态下的红外图谱数据的相似性度量,筛选出相似度较高的设定阈值数量M的中药,设定阈值数量M可以根据数据的处理速度或识别精度进行设置,如本实施例M设置为20,可以筛选最相似的20味中药。方法具体为:
21设定阈值数量M,选取已知中药寒热药性识别的蒸馏水溶剂红外图谱。
22根据待测中药红外图谱,计算待测中药红外图谱与已知中药相同模态下的红外图谱数据的马氏距离作为相似性度量。
23、根据相似性度量的从大到小进行排序,选取相似度较高的设定阈值数量M的中药。
所述步骤3中紫外图谱相似性筛选:经步骤2筛选后的M个已知药性的中药中,计算待测中药紫外图谱与M个已知中药药性在相同模态下的紫外图谱指纹数据的相似性度量。
所述步骤1之前还包括建立已知药性中药数据集的步骤,具体包括如下步骤:
步骤1)、获取已知药性的中药的多种模态指纹图谱数据。
步骤2)、将指纹图谱数据映射到核空间,获得指纹图谱数据的高维数据集。其中将将指纹图谱数据映射到核空间具体的核函数如下:
k(xi,xj)=exp(-τ||xi-xj||2) (1)
Figure BDA0002274945570000071
其中,xi是获取的指纹图谱数据中的波长数据,xj是获取的指纹图谱数据中对应波长的吸收度数据,n是数据的个数。
所述步骤3中紫外图谱相似性筛选中计算待测中药与已知中药相同模态下的指纹数据的高维数据集的相似度度量,与步骤2中计算待测中药红外图谱与已知中药相同模态下的红外图谱数据的相似性度量的方法相同,可以采用计算图谱数据集的马氏距离,具体为:
(1)将指纹图谱数据映射到核空间获得数据对应的核矩阵Kx,具体通过公式(1)和公式(2)计算。
(2)通过微分散射判别准则计算投影矩阵A,具体可以如下:
A=argmin(tr(ATKWA)-ρtr(ATKBA))
=argmin tr(AT(KW-ρKB)A)
s.t.ATKXA=I (3)
ρ为均衡参数,为设定值;tr(·)是矩阵的秩,I是单位矩阵,KW为类内核协方差矩阵,KB为类间核协方差矩阵,Kx为核矩阵;
(3)根据获得的投影矩阵A计在核空间计算待测中药与已知中药相同模态下的指纹数据的高维数据集的马氏距离,计算公式如下:
Figure BDA0002274945570000081
其中,xi和xj分别为第i和第j个样本,Ki和Kj分别为核矩阵的第i列和第j列。
步骤4中根据相似度数值排序,可以为按照与待测中药的相似度数值的大小从大到小排列,设定提取的数量N,将相似度大的前N个已知药性的中药提取,马氏距离越大相似度越小,马氏距离越小相似度越大。
根据已知中药的药性计算待测中药寒性概率和热性概率的方法具体为:
(41)统计相似度大的前N个已知药性的中药中寒性中药和热性中药的数量。
(42)待测中药的寒性概率为N个已知药性的中药中寒性中药数量C与N的比值,待测中药的热性概率为N个已知药性的中药中热性中药数量H与N的比值。
统计N个已知中药药性的中药中,假设其中已知为寒性中药的数量为C,已知为热性中药的数量为H,则寒性概率h1(x)和热性概率h2(x)计算公式如下:
Figure BDA0002274945570000091
Figure BDA0002274945570000092
其中,C+H=N。
步骤5、根据每个模态下待测中药的寒性概率和热性概率采用集成学习算法,识别中药的药性是寒性还是热性的方法,具体采用多数投票算法,识别中药的药性是寒性还是热性,具体为:
步骤1、计算第i模态指纹图谱计算得到中药的寒性概率
Figure BDA0002274945570000094
和热性概率
Figure BDA0002274945570000095
步骤2、该中药寒热药性标签计算如下:
Figure BDA0002274945570000093
其中0寒性;1热性,i是模态i,n=2表示寒热两类,m是模态的总数量。本实施例中m=3表示三种模态。
本实施例采用集成学习算法,可以快速高效的辨别重要的药性,根据得到红外和紫外图谱都比较相似的中药,采用集成学习方法判断待测中药的药性,识别准确并且识别效率高。
实施例2
本实施例提供一种基于多模态指纹图谱的中药药性识别系统,如图2所示,包括:
用于获取待识别中药的多种模态指纹图谱数据的模块。
红外图谱相似性筛选模块:选取已知中药寒热药性的红外图谱,计算待测中药红外图谱与已知中药相同模态下的红外图谱的相似性度量,筛选出相似度较高的设定阈值数量M的中药;
紫外图谱相似性筛选模块:在筛选出的红外图谱相似度较高的M味中药中,计算待测中药紫外图谱与已知中药相同模态下的紫外图谱数据的相似性度量;
概率计算模块:用于根据紫外图谱数据相似性度量排序,获得相似性数值较大的前N个已知中药,根据N个已知中药的药性计算待测中药寒性概率和热性概率;
识别模块:用于根据每个模态下待测中药的寒性概率和热性概率采用集成学习算法,识别中药的药性是寒性还是热性。
实施例3
本实施例提供一种电子设备,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成实施例1的方法所述的步骤。
实施例4
本实施例一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成实施例1的方法所述的步骤。
本公开所提出的电子设备可以是移动终端以及非移动终端,非移动终端包括台式计算机,移动终端包括智能手机(Smart Phone,如Android手机、IOS手机等)、智能眼镜、智能手表、智能手环、平板电脑、笔记本电脑、个人数字助理等可以进行无线通信的移动互联网设备。
应理解,在本公开中,该处理器可以是中央处理单元CPU,该处理器还可以是其他通用处理器、数字信号处理器DSP、专用集成电路ASIC,现成可编程门阵列FPGA或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
该存储器可以包括只读存储器和随机存取存储器,并向处理器提供指令和数据、存储器的一部分还可以包括非易失性随机存储器。例如,存储器还可以存储设备类型的信息。
在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。结合本公开所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器、闪存、只读存储器、可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。为避免重复,这里不再详细描述。本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元即算法步骤,能够以电子硬件或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本公开的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本公开所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其他的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能的划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外一点,所显示或讨论的相互之间的耦合或者直接耦合或者通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性、机械或其它的形式。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本公开的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器或者网络设备等)执行本公开各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本公开的优选实施例而已,并不用于限制本公开,对于本领域的技术人员来说,本公开可以有各种更改和变化。凡在本公开的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本公开的保护范围之内。
上述虽然结合附图对本公开的具体实施方式进行了描述,但并非对本公开保护范围的限制,所属领域技术人员应该明白,在本公开的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本公开的保护范围以内。

Claims (10)

1.一种基于多模态指纹图谱的中药药性识别方法,其特征是,包括如下步骤:
获取待识别中药的多种模态指纹图谱数据;
红外图谱相似性筛选:选取已知寒热药性中药的红外图谱,计算待测中药红外图谱与已知中药相同模态下的红外图谱的相似性度量,筛选出相似度较高的设定阈值数量M的中药;
紫外图谱相似性筛选:在筛选出的红外图谱相似度较高的M味中药中,计算待测中药紫外图谱与已知中药相同模态下的紫外图谱数据的相似性度量;
根据紫外图谱数据相似性度量排序,获得相似性数值较大的前N个已知中药,根据N个已知中药的药性计算待测中药寒性概率和热性概率;
根据每个模态下待测中药的寒性概率和热性概率采用集成学习算法,识别中药的药性是寒性还是热性。
2.如权利要求1所述的一种基于多模态指纹图谱的中药药性识别方法,其特征是:多种模态指纹图谱数据包括至少两种溶剂的紫外指纹图谱数据,以及中药蒸馏水溶剂的红外图谱数据。
3.如权利要求2所述的一种基于多模态指纹图谱的中药药性识别方法,其特征是:获取紫外指纹图谱数据的所述溶剂为氯仿、石油醚或无水乙醇。
4.如权利要求1所述的一种基于多模态指纹图谱的中药药性识别方法,其特征是,紫外图谱相似性筛选中计算待测中药与已知中药相同模态下的指纹数据的高维数据集的相似度度量,与计算待测中药红外图谱与已知中药相同模态下的红外图谱数据的相似性度量的方法相同,都采用计算图谱数据集的马氏距离,具体为:
将指纹图谱数据映射到核空间获得数据对应的核矩阵Kx
通过微分散射判别准则计算投影矩阵A;
根据获得的投影矩阵A计算 在核空间计算待测中药与已知中药相同模态下的指纹数据的高维数据集的马氏距离,计算公式如下:
Figure FDA0002274945560000021
其中,xi和xj分别为第i和第j个样本,Ki和Kj分别为核矩阵Kx的第i列和第j列。
5.如权利要求4所述的一种基于多模态指纹图谱的中药药性识别方法,其特征是,所述投影矩阵A为:
A=argmin(tr(ATKWA)-ρtr(ATKBA))
=argmintr(AT(KW-ρKB)A)
s.t.ATKXA=I
其中,ρ为均衡参数,为设定值;tr(·)是矩阵的秩,I是单位矩阵,KW为类内核协方差矩阵,KB为类间核协方差矩阵,Kx为核矩阵。
6.如权利要求1所述的一种基于多模态指纹图谱的中药药性识别方法,其特征是:根据已知中药的药性计算待测中药寒性概率和热性概率的方法具体为:
统计相似度大的前N个已知药性的中药中寒性中药和热性中药的数量;
待测中药的寒性概率为N个已知药性的中药中寒性中药数量与N的比值,待测中药的热性概率为N个已知药性的中药中热性中药数量与N的比值。
7.如权利要求1所述的一种基于多模态指纹图谱的中药药性识别方法,其特征是:所述根据每个模态下待测中药的寒性概率和热性概率采用集成学习算法,识别中药的药性是寒性还是热性的步骤中具体采用集成学习中的多数投票算法。
8.一种基于多模态指纹图谱的中药药性识别系统,其特征是,包括:
用于获取待识别中药的多种模态指纹图谱数据的模块;
红外图谱相似性筛选模块:选取已知中药寒热药性的红外图谱,计算待测中药红外图谱与已知中药相同模态下的红外图谱的相似性度量,筛选出相似度较高的设定阈值数量M的中药;
紫外图谱相似性筛选模块:在筛选出的红外图谱相似度较高的M味中药中,计算待测中药紫外图谱与已知中药相同模态下的紫外图谱数据的相似性度量;
概率计算模块:用于根据紫外图谱数据相似性度量排序,获得相似性数值较大的前N个已知中药,根据N个已知中药的药性计算待测中药寒性概率和热性概率;
识别模块:用于根据每个模态下待测中药的寒性概率和热性概率采用集成学习算法,识别中药的药性是寒性还是热性。
9.一种电子设备,其特征是,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成权利要求1-7任一项方法所述的步骤。
10.一种计算机可读存储介质,其特征是,用于存储计算机指令,所述计算机指令被处理器执行时,完成权利要求1-7任一项方法所述的步骤。
CN201911119179.1A 2019-11-15 2019-11-15 一种基于多模态指纹图谱的中药药性识别方法及系统 Active CN110838343B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911119179.1A CN110838343B (zh) 2019-11-15 2019-11-15 一种基于多模态指纹图谱的中药药性识别方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911119179.1A CN110838343B (zh) 2019-11-15 2019-11-15 一种基于多模态指纹图谱的中药药性识别方法及系统

Publications (2)

Publication Number Publication Date
CN110838343A CN110838343A (zh) 2020-02-25
CN110838343B true CN110838343B (zh) 2022-03-01

Family

ID=69576510

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911119179.1A Active CN110838343B (zh) 2019-11-15 2019-11-15 一种基于多模态指纹图谱的中药药性识别方法及系统

Country Status (1)

Country Link
CN (1) CN110838343B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113567587A (zh) * 2021-07-29 2021-10-29 山东中医药大学 基于挥发油成分特征的中药寒热药性识别方法
CN116908138B (zh) * 2023-07-13 2024-02-06 中南民族大学 植物类中药的四气量化表征方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1472226A (zh) * 2003-06-20 2004-02-04 宁波泰康红豆杉生物工程有限公司 一种红豆杉枝叶中的提取物及提取方法
CN106525821A (zh) * 2016-10-31 2017-03-22 山东省医药生物技术研究中心 一种检测中药药性的方法及装置
CN106990214A (zh) * 2017-05-08 2017-07-28 云南民族大学 一种评价中药材质量的方法
CN107491531A (zh) * 2017-08-18 2017-12-19 华南师范大学 基于集成学习框架的中文网络评论情感分类方法
CN107784192A (zh) * 2017-09-15 2018-03-09 山东大学 指纹图谱相似度计算方法、装置和样品质量评价系统
CN207798657U (zh) * 2017-12-29 2018-08-31 北京农业智能装备技术研究中心 手持式杂草抗药性识别传感装置
CN109342631A (zh) * 2018-12-19 2019-02-15 吉林修正药业新药开发有限公司 中药组合物的hplc指纹图谱的构建方法及中药组合物的质量检测方法
CN109668850A (zh) * 2019-02-28 2019-04-23 山东中医药大学 基于紫外指纹图谱的中药药性识别方法及系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030207270A1 (en) * 2001-03-09 2003-11-06 Kung Patrick C. Phytomics: a genomic-based approach to herbal compositions
CN1938586B (zh) * 2004-01-28 2015-05-13 科学与工业研究委员会 使用活动色谱指纹图谱的食品和药物的化学及治疗价值的标准化方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1472226A (zh) * 2003-06-20 2004-02-04 宁波泰康红豆杉生物工程有限公司 一种红豆杉枝叶中的提取物及提取方法
CN106525821A (zh) * 2016-10-31 2017-03-22 山东省医药生物技术研究中心 一种检测中药药性的方法及装置
CN106990214A (zh) * 2017-05-08 2017-07-28 云南民族大学 一种评价中药材质量的方法
CN107491531A (zh) * 2017-08-18 2017-12-19 华南师范大学 基于集成学习框架的中文网络评论情感分类方法
CN107784192A (zh) * 2017-09-15 2018-03-09 山东大学 指纹图谱相似度计算方法、装置和样品质量评价系统
CN207798657U (zh) * 2017-12-29 2018-08-31 北京农业智能装备技术研究中心 手持式杂草抗药性识别传感装置
CN109342631A (zh) * 2018-12-19 2019-02-15 吉林修正药业新药开发有限公司 中药组合物的hplc指纹图谱的构建方法及中药组合物的质量检测方法
CN109668850A (zh) * 2019-02-28 2019-04-23 山东中医药大学 基于紫外指纹图谱的中药药性识别方法及系统

Non-Patent Citations (10)

* Cited by examiner, † Cited by third party
Title
60种植物类中药提取物的红外光谱分析及其与寒热药性相关性的模式识别评价研究;王鹏等;《光谱学与光谱分析》;20140131;第34卷(第1期);第58-63页 *
A Comprehensive Strategy to Quantify the Complex System by Ultraviolet and Infrared Spectra Analyses Coupled with Combustion Heat for Recognizing the Quality Consistency of San-Huang Tablets;Yan Wang等;《American Journal of Analytical Chemistry》;20171030;第8卷;第668-680页 *
Metabolomics coupled with similarity analysis advances the elucidation of the cold/hot properties of traditional Chinese medicines;JIA Yan等;《Chinese Journal of Natural Medicines》;20170820;第15卷(第8期);第631-640页 *
一种基于集成学习的科研合作者潜力预测分类方法;艾科等;《计算机研究与发展》;20181231;第56卷(第9期);第1383-1395页 *
化学计量学在某些中药或食品指纹图谱中的应用;梅明华;《中国优秀博硕士学位论文全文数据库(硕士) 工程科技Ⅰ辑》;20120415(第04期);第B024-46页 *
基于多维多息指纹图谱的中药药性特征标记模式识别研究;张新新;《万方在线》;20121130;第1-109页 *
基于红外光谱数据的中药药性识别研究;刘进等;《时珍国医国药》;20101231;第21卷(第3期);第561-563页 *
大叶藜指纹图谱研究及相似度分析;武芸等;《化学试剂》;20141231;第40卷(第12期);第1165-1168页 *
穷举建模策略用于中药药性特征标记的统计模式识别模型研究;刘文慧;《中国优秀硕士学位论文全文数据库 医药卫生科技辑》;20130215(第02期);第E057-201页 *
紫外-可见-短波近红外光谱技术快速鉴别中药材的研究;吴柄桦等;《2014年中国药学大会暨第十四届中国药师周论文集》;20141025;第1-7页 *

Also Published As

Publication number Publication date
CN110838343A (zh) 2020-02-25

Similar Documents

Publication Publication Date Title
Szymańska et al. Chemometrics and qualitative analysis have a vibrant relationship
Borba et al. Use of Raman spectroscopy and chemometrics to distinguish blue ballpoint pen inks
Cao et al. Identifying mangrove species using field close-range snapshot hyperspectral imaging and machine-learning techniques
CN105574474A (zh) 一种基于质谱信息的生物特征图像识别方法
CN110838343B (zh) 一种基于多模态指纹图谱的中药药性识别方法及系统
CN109858477A (zh) 用深度森林在复杂环境中识别目标物的拉曼光谱分析方法
CN110097127A (zh) 基于核主成分分析的黄芪谱图特征提取与产地鉴别方法
Long et al. Fast identification of the geographical origin of Gastrodia elata using excitation-emission matrix fluorescence and chemometric methods
Guo et al. Comparison of two exploratory data analysis methods for classification of Phyllanthus chemical fingerprint: unsupervised vs. supervised pattern recognition technologies
Guan et al. Pathological leucocyte segmentation algorithm based on hyperspectral imaging technique
CN110110789A (zh) 一种基于多谱图信息融合技术的中草药品质鉴别方法
Kharyuk et al. Employing fingerprinting of medicinal plants by means of LC-MS and machine learning for species identification task
CN103115973B (zh) 一种用于中药批次一致性的判断方法
Wang et al. Geographical authentication of Gentiana rigescens by high-performance liquid chromatography and infrared spectroscopy
US20140156201A1 (en) Peak assigning method, assigning program and assigning device
Liu et al. Chemometric analysis based on HPLC multi-wavelength fingerprints for prediction of antioxidant components in Turpiniae Folium
Teng et al. Predictive data clustering of laser-induced breakdown spectroscopy for brain tumor analysis
Zhvansky et al. High-resolution mass spectra processing for the identification of different pathological tissue types of brain tumors
Teng et al. Pathological identification of brain tumors based on the characteristics of molecular fragments generated by laser ablation combined with a spiking neural network
Pilario et al. Geographical discrimination of propolis using dynamic time warping kernel principal components analysis
Anzanello et al. Wavelength selection framework for classifying food and pharmaceutical samples into multiple classes
Hernadi et al. HPLC fingerprinting coupled with linear discriminant analysis for the detection of adulteration in Orthosiphon aristatus
Huang et al. Rapid determination of tannin in Danshen and Guanxinning injections using UV spectrophotometry for quality control
Chen et al. High-throughput chemotyping of cannabis and hemp extracts using an ultraviolet microplate reader and multivariate classifiers
Ni et al. A high performance liquid chromatography and electrospray ionization mass spectrometry method for the analysis of the natural medicine, Forsythia Suspensa

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant