CN107944460A - 一种应用于生物信息学中类别不平衡分类方法 - Google Patents

一种应用于生物信息学中类别不平衡分类方法 Download PDF

Info

Publication number
CN107944460A
CN107944460A CN201610887824.4A CN201610887824A CN107944460A CN 107944460 A CN107944460 A CN 107944460A CN 201610887824 A CN201610887824 A CN 201610887824A CN 107944460 A CN107944460 A CN 107944460A
Authority
CN
China
Prior art keywords
sample
cluster
class
several classes
data set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610887824.4A
Other languages
English (en)
Inventor
魏霖静
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Gansu Agricultural University
Original Assignee
Gansu Agricultural University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Gansu Agricultural University filed Critical Gansu Agricultural University
Priority to CN201610887824.4A priority Critical patent/CN107944460A/zh
Publication of CN107944460A publication Critical patent/CN107944460A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明公开了一种应用于生物信息学中类别不平衡分类方法,首先利用有效的聚类融合方法对数据集进行多次聚类,产生多个聚类结果,称为聚类成员,并将各个聚类成员的簇标记进行匹配,接着计算各样本的“聚类一致性系数”,根据样本“聚类一致性系数”的高低找出处于少数类边界区域的样本和处于多数类中心区域的样本,并分别对少数类边界区域和多数类中心区域的样本进行过抽样和欠抽样处理,最后,利用传统的分类学习方法对重抽样后的数据集进行分类学习,生成相应的分类模型,能够有效发现少数类边界区域和多数类中心区域的样本,有针对性地进行过抽样和欠抽样处理,避免出现分类器过于拟合或丢失多数类中重要信息等现象。

Description

一种应用于生物信息学中类别不平衡分类方法
技术领域
本发明涉及生物信息学技术领域,具体涉及一种应用于生物信息学中类别不平衡分类方法。
背景技术
分类问题是机器学习领域研究的重要课题之一,目前主要的机器学习方法处理的数据大都是各类样本数目相差不悬殊,如果训练集中的正反例样本数目相差悬殊,则会使得分类器的性能下降,通常会出现把整个样本空间都划为大类的情况,因此类别不平衡学习正受到越来越广泛的关注;
类别不平衡问题存在于许多领域,如金融欺诈检测、石油勘探、反垃圾邮件等,普通机器学习的分类方法无法直接应用于这些领域,在生物信息学研究中,存在大量类别不平衡的分类问题,由于大多数问题中的正例来自于实验验证,而反例通常不需要实验验证,因此获取反例的成本低、正例的成本高,从而在训练集中通常出现反例远远多于正例的情况,比如:非编码RNA基因挖掘,尤其是microRNA挖掘,此外,在SNP位点判别、microArray数据分析中也经常遇到这类问题。
在处理类别不平衡学习问题上,最早是使用随机采样的办法来更改训练集的样本,从而使训练集达到平衡,最简单的两种方法是随机过采样(oversampling)和随机降采样(under-sampling),前者通过复制一些小类别的样本使数据集达到平衡,后者则随机选取大类中的一个子集以达到同样的目的,研究表明随机过采样的方法通常会带来时间开销大、过拟合等问题,因此目前主要采取的都是降采样的办法,但是降采样方法只使用了大类的一个子集,并没有充分利用已有的信息,在经历随机采样方法之后,出现了许多人工采样的方法,SMOTE发展了过采样的思想,虽然也是增加小样本的数量,但是其增加的手段是通过人工生成,而不是直接随机选择复制,从而避免了过拟合问题,但有可能会引入噪声,类似地,也有通过人工手段进行降采样,从而有选择性地去除大类样本,达到类别平衡。
除了采样策略外,还有一些其他的策略也被应用于处理类别不平衡数据,如集成学习中的Boosting方法、代价敏感学习算法、单类学习方法(oneclasslearning)、级联的神经网络、聚类方法和支持向量机等,目前的Boosting方法由于反复训练而加大时间开销,无法应用于大规模数据处理,而代价敏感学习方法和单类学习方法都被证明等价于采样方法,与其类似的还有在自然语言理解领域获得了良好效果的基于聚类和支持向量机的方法,级联的神经网络虽然在UCI的部分数据集上取得了成功,但神经网络固有的随机性决定了其无法应用于更广泛的领域。
与其他应用领域不同,生物信息分类问题的属性通常全部是连续的,而且大部分是只有2类的判别问题,当分类属性连续的样本时,支持向量机(supportvectormachine,SVM)效果通常好于决策树等分类方法,另外,通用软件LibSVM具有使用简单、执行效率高等特点因此被广泛地应用于生物信息学的分类问题中,然而LibSVM的参数调整主要依据准确率是否提高,因此LibSVM在类别不平衡样本的分类中,通常会把所有的测试样本全部划分为反例,目前的相关研究一般是在测试样本的反例中随机降采样,以达到正反例平衡,这种做法丢失了大部分反例样本信息,从而降低了分类器的性能,针对以上问题,提出了一种新方法处理类别不平衡的分类问题。
发明内容
针对以上问题,本发明提供了一种应用于生物信息学中类别不平衡分类方法,可以有效解决背景技术中的问题。
为了实现上述目的,本发明采用的技术方案如下:一种应用于生物信息学中类别不平衡分类方法,首先利用有效的聚类融合方法对数据集进行多次聚类,产生多个聚类结果,称为聚类成员,并将各个聚类成员的簇标记进行匹配,接着计算各样本的“聚类一致性系数”,根据样本“聚类一致性系数”的高低找出处于少数类边界区域的样本和处于多数类中心区域的样本,并分别对少数类边界区域和多数类中心区域的样本进行过抽样和欠抽样处理,最后,利用传统的分类学习方法对重抽样后的数据集进行分类学习,生成相应的分类模型;其算法如下:
定义训练集S={(x1,y1),(x2,y2),…,(xnum,ynum)},
num为训练集中样本的总个数,令X={x1,x2,…,xnum},样本xi∈Xd,i=1,2,…,num是d维特征向量,类标记yi∈{P,N},其中,P对应少数类,N对应多数类;
输入训练集S,过抽样率n,欠抽样率m,最近邻个数k,聚类次数h,聚类一致性系数CI的阈值α;
输出分类模型H,其生成方法步骤如下:
step1:fort=1toh//并行执行多次聚类;
step1.1:在原特征空间中,随机选择第t次聚类的特征子空间Ft;
step1.2:在数据集X中,随机选择k个初始簇中心;
step1.3:更新初始簇中心,在特征子空间Ft下,利用k-means算法对数据集X进行聚类,产生聚类成员πt;
step2:匹配h个聚类成员的簇标记;
step3:分别计算少数类和多数类中各个样本的聚类一致性系数CI;
step4:将少数类中CI小于阈值α的样本加入少数类边界区域样本的集合P-Boundary,将多数类中CI大于阈值α的样本加入多数类中心区域样本的集合N-Safe,并将所有的少数类样本以及多数类中CI小于阈值α的样本加入数据集NewDataSet中;
step5:根据过抽样率n,利用SMOTE方法对集合P-Boundary中的样本进行过抽样处理,生成新的合成样本,并将新生成的样本加入数据集NewDataSet中;
step6:对集合N-Safe的样本进行欠抽样处理,即根据欠抽样率m,随机删除集合N-Safe中的样本,并将集合N-Safe中剩余的样本加入数据集NewDataSet中;
step7:利用分类学习方法,对重抽样后的训练集NewDataSet进行学习,生成分类模型H。
优选的,聚类一致性系数CI是数据对象被分配到多数簇的次数与聚类次数h的比值,定义某一样本x的聚类一致性系数CI(x)如下:
CI(x)=1hmax∑hi=1{δ(πi(x),C)}C∈clusterlabels,
其中πi(x)表示样本x在聚类成员πi中的簇标记。
本发明的有益效果:
本发明提出一种基于聚类融合的类别不平衡数据分类方法,通过利用聚类融合技术对数据集进行多次聚类,并对各个聚类成员的簇标记进行匹配,接着通过引入“聚类一致性系数”的概念,计算各样本的“聚类一致性系数”,从而找出处于少数类边界区域和处于多数类中心区域的样本,引入聚类融合技术,能够有效发现少数类边界区域和多数类中心区域的样本,有针对性地进行过抽样和欠抽样处理,避免出现分类器过于拟合或丢失多数类中重要信息等现象。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
实施例
一种应用于生物信息学中类别不平衡分类方法,首先利用有效的聚类融合方法对数据集进行多次聚类,产生多个聚类结果,称为聚类成员,并将各个聚类成员的簇标记进行匹配,接着计算各样本的“聚类一致性系数”,根据样本“聚类一致性系数”的高低找出处于少数类边界区域的样本和处于多数类中心区域的样本,并分别对少数类边界区域和多数类中心区域的样本进行过抽样和欠抽样处理,最后,利用传统的分类学习方法对重抽样后的数据集进行分类学习,生成相应的分类模型;其算法如下:
定义训练集S={(x1,y1),(x2,y2),…,(xnum,ynum)},
num为训练集中样本的总个数,令X={x1,x2,…,xnum},样本xi∈Xd,i=1,2,…,num是d维特征向量,类标记yi∈{P,N},其中,P对应少数类,N对应多数类;
输入训练集S,过抽样率n,欠抽样率m,最近邻个数k,聚类次数h,聚类一致性系数CI的阈值α;
输出分类模型H,其生成方法步骤如下:
step1:fort=1toh//并行执行多次聚类;
step1.1:在原特征空间中,随机选择第t次聚类的特征子空间Ft;
step1.2:在数据集X中,随机选择k个初始簇中心;
step1.3:更新初始簇中心,在特征子空间Ft下,利用k-means算法对数据集X进行聚类,产生聚类成员πt;
step2:匹配h个聚类成员的簇标记;
step3:分别计算少数类和多数类中各个样本的聚类一致性系数CI;聚类一致性系数CI是数据对象被分配到多数簇的次数与聚类次数h的比值,定义某一样本x的聚类一致性系数CI(x)如下:
CI(x)=1hmax∑hi=1{δ(πi(x),C)}C∈clusterlabels,
其中πi(x)表示样本x在聚类成员πi中的簇标记。
由上式可知,如果在多次聚类中,样本频繁地改变其所在的簇,则其聚类一致性系数较低,反之,如果样本被稳定地分配到相同的簇,则其聚类一致性系数较高.聚类一致性系数较低的样本一般位于簇的边界区域,而聚类一致性系数较高的样本一般位于簇的中心区域.本文分别计算各个样本的聚类一致性系数,将少数类中CI小于阈值α的样本加入少数类边界区域样本的集合P-Boundary,将多数类中CI大于阈值α的样本加入多数类中心区域样本的集合N-Safe,再分别针对处于簇边界区域的少数类样本和处于簇中心区域的多数类样本进行过抽样和欠抽样处理。
step4:将少数类中CI小于阈值α的样本加入少数类边界区域样本的集合P-Boundary,将多数类中CI大于阈值α的样本加入多数类中心区域样本的集合N-Safe,并将所有的少数类样本以及多数类中CI小于阈值α的样本加入数据集NewDataSet中;
step5:根据过抽样率n,利用SMOTE方法对集合P-Boundary中的样本进行过抽样处理,生成新的合成样本,并将新生成的样本加入数据集NewDataSet中;
step6:对集合N-Safe的样本进行欠抽样处理,即根据欠抽样率m,随机删除集合N-Safe中的样本,并将集合N-Safe中剩余的样本加入数据集NewDataSet中;
step7:利用分类学习方法,对重抽样后的训练集NewDataSet进行学习,生成分类模型H。
SMOTE方法:该方法对每个少数类样本,根据过抽样率,从它的k个(一般取5个)最近邻中随机选出若干个近邻,并对样本的属性空间进行操作,在该样本和其被选的近邻之间插入新的合成样本.SMOTE方法是对所有的少数类样本进行过抽样处理,可使少数类具有更大的泛化空间,但也可能导致分类器过于拟合。
过抽样和欠抽样技术:利用SMOTE方法,对集合P-Boundary中的每个少数类样本,根据过抽样率,从它的k个少数类近邻中随机选择若干个近邻,并在该样本和其被选的近邻之间插入新的合成样本,SMOTE方法是在属性空间进行操作,因此在计算该样本与其每个被选近邻所生成的合成样本的各个属性值时,若某属性为连续型属性,则计算该样本和其被选近邻的属性的差值dif,并将该差值dif乘以一个[0,1]区间的随机数,然后加上该样本的属性值即为新样本的属性值,如果为类别属性,则新样本的属性值为该样本和被选近邻属性值的多数投票.经过上述处理,可以加强分类器对少数类边界区域样本的学习。
本发明提出一种基于聚类融合的类别不平衡数据分类方法,通过利用聚类融合技术对数据集进行多次聚类,并对各个聚类成员的簇标记进行匹配,接着通过引入“聚类一致性系数”的概念,计算各样本的“聚类一致性系数”,从而找出处于少数类边界区域和处于多数类中心区域的样本,引入聚类融合技术,能够有效发现少数类边界区域和多数类中心区域的样本,有针对性地进行过抽样和欠抽样处理,避免出现分类器过于拟合或丢失多数类中重要信息等现象。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (3)

1.一种应用于生物信息学中类别不平衡分类方法,其特征在于,首先利用有效的聚类融合方法对数据集进行多次聚类,产生多个聚类结果,称为聚类成员,并将各个聚类成员的簇标记进行匹配,接着计算各样本的“聚类一致性系数”,根据样本“聚类一致性系数”的高低找出处于少数类边界区域的样本和处于多数类中心区域的样本,并分别对少数类边界区域和多数类中心区域的样本进行过抽样和欠抽样处理,最后,利用传统的分类学习方法对重抽样后的数据集进行分类学习,生成相应的分类模型;其算法如下:
定义训练集S={(x1,y1),(x2,y2),…,(xnum,ynum)},
num为训练集中样本的总个数,令X={x1,x2,…,xnum},样本xi∈Xd,i=1,2,…,num是d维特征向量,类标记yi∈{P,N},其中,P对应少数类,N对应多数类;
输入训练集S,过抽样率n,欠抽样率m,最近邻个数k,聚类次数h,聚类一致性系数CI的阈值α;
输出分类模型H。
2.根据权利要求1所述的一种应用于生物信息学中类别不平衡分类方法,其特征在于,所述分类模型H的生成方法步骤如下:
step1:fort=1toh//并行执行多次聚类;
step1.1:在原特征空间中,随机选择第t次聚类的特征子空间Ft;
step1.2:在数据集X中,随机选择k个初始簇中心;
step1.3:更新初始簇中心,在特征子空间Ft下,利用k-means算法对数据集X进行聚类,产生聚类成员πt;
step2:匹配h个聚类成员的簇标记;
step3:分别计算少数类和多数类中各个样本的聚类一致性系数CI;
step4:将少数类中CI小于阈值α的样本加入少数类边界区域样本的集合P-Boundary,将多数类中CI大于阈值α的样本加入多数类中心区域样本的集合N-Safe,并将所有的少数类样本以及多数类中CI小于阈值α的样本加入数据集NewDataSet中;
step5:根据过抽样率n,利用SMOTE方法对集合P-Boundary中的样本进行过抽样处理,生成新的合成样本,并将新生成的样本加入数据集NewDataSet中;
step6:对集合N-Safe的样本进行欠抽样处理,即根据欠抽样率m,随机删除集合N-Safe中的样本,并将集合N-Safe中剩余的样本加入数据集NewDataSet中;
step7:利用分类学习方法,对重抽样后的训练集NewDataSet进行学习,生成分类模型H。
3.根据权利要求2所述的一种应用于生物信息学中类别不平衡分类方法,其特征在于,聚类一致性系数CI是数据对象被分配到多数簇的次数与聚类次数h的比值,定义某一样本x的聚类一致性系数CI(x)如下:
CI(x)=1hmax∑hi=1{δ(πi(x),C)}C∈clusterlabels,
其中πi(x)表示样本x在聚类成员πi中的簇标记。
CN201610887824.4A 2016-10-12 2016-10-12 一种应用于生物信息学中类别不平衡分类方法 Pending CN107944460A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610887824.4A CN107944460A (zh) 2016-10-12 2016-10-12 一种应用于生物信息学中类别不平衡分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610887824.4A CN107944460A (zh) 2016-10-12 2016-10-12 一种应用于生物信息学中类别不平衡分类方法

Publications (1)

Publication Number Publication Date
CN107944460A true CN107944460A (zh) 2018-04-20

Family

ID=61928702

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610887824.4A Pending CN107944460A (zh) 2016-10-12 2016-10-12 一种应用于生物信息学中类别不平衡分类方法

Country Status (1)

Country Link
CN (1) CN107944460A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108960561A (zh) * 2018-05-04 2018-12-07 阿里巴巴集团控股有限公司 一种基于不平衡数据的风控模型处理方法、装置及设备
CN109086412A (zh) * 2018-08-03 2018-12-25 北京邮电大学 一种基于自适应加权Bagging-GBDT的不平衡数据分类方法
CN109635839A (zh) * 2018-11-12 2019-04-16 国家电网有限公司 一种基于机器学习的非平衡数据集的处理方法和装置
CN109754281A (zh) * 2018-11-22 2019-05-14 筑客网络技术(上海)有限公司 一种供应商流失预测方法
CN110275910A (zh) * 2019-06-20 2019-09-24 东北大学 一种不平衡数据集的过采样方法
CN113094567A (zh) * 2021-03-31 2021-07-09 四川新网银行股份有限公司 一种基于文本聚类的恶意投诉识别方法及系统
CN113434401A (zh) * 2021-06-24 2021-09-24 杭州电子科技大学 基于样本分布特征和spy算法的软件缺陷预测方法
CN114974431A (zh) * 2022-06-01 2022-08-30 湖南工商大学 基于最优多类平衡采样的生物信息学数据分类方法及系统
CN115965245A (zh) * 2023-03-13 2023-04-14 华东交通大学 一种基于机器学习的山地果园冻害风险预测方法

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108960561A (zh) * 2018-05-04 2018-12-07 阿里巴巴集团控股有限公司 一种基于不平衡数据的风控模型处理方法、装置及设备
CN109086412A (zh) * 2018-08-03 2018-12-25 北京邮电大学 一种基于自适应加权Bagging-GBDT的不平衡数据分类方法
CN109635839A (zh) * 2018-11-12 2019-04-16 国家电网有限公司 一种基于机器学习的非平衡数据集的处理方法和装置
CN109635839B (zh) * 2018-11-12 2020-07-14 国家电网有限公司 一种基于机器学习的非平衡数据集的处理方法和装置
CN109754281A (zh) * 2018-11-22 2019-05-14 筑客网络技术(上海)有限公司 一种供应商流失预测方法
CN109754281B (zh) * 2018-11-22 2021-11-19 筑客网络技术(上海)有限公司 一种供应商流失预测方法
CN110275910A (zh) * 2019-06-20 2019-09-24 东北大学 一种不平衡数据集的过采样方法
CN113094567A (zh) * 2021-03-31 2021-07-09 四川新网银行股份有限公司 一种基于文本聚类的恶意投诉识别方法及系统
CN113434401A (zh) * 2021-06-24 2021-09-24 杭州电子科技大学 基于样本分布特征和spy算法的软件缺陷预测方法
CN114974431A (zh) * 2022-06-01 2022-08-30 湖南工商大学 基于最优多类平衡采样的生物信息学数据分类方法及系统
CN115965245A (zh) * 2023-03-13 2023-04-14 华东交通大学 一种基于机器学习的山地果园冻害风险预测方法

Similar Documents

Publication Publication Date Title
CN107944460A (zh) 一种应用于生物信息学中类别不平衡分类方法
Shi et al. A link clustering based overlapping community detection algorithm
Oyelade et al. Application of k Means Clustering algorithm for prediction of Students Academic Performance
CN109492765A (zh) 一种基于迁移模型的图像增量学习方法
CN102521656B (zh) 非平衡样本分类的集成迁移学习方法
CN104330721B (zh) 集成电路硬件木马检测方法和系统
CN108351985A (zh) 用于大规模机器学习的方法和装置
CN108399431A (zh) 分类模型训练方法以及分类方法
CN103716204A (zh) 一种基于维纳过程的异常入侵检测集成学习方法及装置
CN105868775A (zh) 基于pso算法的不平衡样本分类方法
Lin et al. Machine learning templates for QCD factorization in the search for physics beyond the standard model
CN104809476B (zh) 一种基于分解的多目标进化模糊规则分类方法
Williams et al. Plant microRNA prediction by supervised machine learning using C5. 0 decision trees
CN104091038A (zh) 基于大间隔分类准则的多示例学习特征加权方法
CN106445908A (zh) 文本识别方法和装置
CN110493262A (zh) 一种改进分类的网络攻击检测方法及系统
Shi et al. Over-sampling strategy in feature space for graphs based class-imbalanced bot detection
Jie et al. Naive Bayesian classifier based on genetic simulated annealing algorithm
CN110135846A (zh) 一种区块链节点的行为序列自动分类方法
Wang et al. Server-initiated federated unlearning to eliminate impacts of low-quality data
CN108229507A (zh) 数据分类方法以及装置
CN105488413A (zh) 一种基于信息增益的恶意代码检测方法及系统
WO2009015069A1 (en) Methods and systems of evaluating forest management and harvesting schemes
Bui et al. A clustering-based shrink autoencoder for detecting anomalies in intrusion detection systems
CN109492746A (zh) 基于ga-pso杂交算法的深度信念网络参数优化方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180420

RJ01 Rejection of invention patent application after publication