CN111835720B - 基于特征增强的vpn流量web指纹识别方法 - Google Patents

基于特征增强的vpn流量web指纹识别方法 Download PDF

Info

Publication number
CN111835720B
CN111835720B CN202010521565.XA CN202010521565A CN111835720B CN 111835720 B CN111835720 B CN 111835720B CN 202010521565 A CN202010521565 A CN 202010521565A CN 111835720 B CN111835720 B CN 111835720B
Authority
CN
China
Prior art keywords
flow
fingerprint identification
lightgbm
surge
flow information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010521565.XA
Other languages
English (en)
Other versions
CN111835720A (zh
Inventor
陈丹伟
王晶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Posts and Telecommunications
Original Assignee
Nanjing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Posts and Telecommunications filed Critical Nanjing University of Posts and Telecommunications
Priority to CN202010521565.XA priority Critical patent/CN111835720B/zh
Publication of CN111835720A publication Critical patent/CN111835720A/zh
Application granted granted Critical
Publication of CN111835720B publication Critical patent/CN111835720B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/02Network architectures or network communication protocols for network security for separating internal from external traffic, e.g. firewalls
    • H04L63/0272Virtual private networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/02Network architectures or network communication protocols for network security for separating internal from external traffic, e.g. firewalls
    • H04L63/0227Filtering policies
    • H04L63/0263Rule management
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/14Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
    • H04L63/1408Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic by monitoring network traffic
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/50Reducing energy consumption in communication networks in wire-line communication networks, e.g. low power modes or reduced link rate

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computer Hardware Design (AREA)
  • Signal Processing (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Business, Economics & Management (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Biology (AREA)
  • Mathematical Physics (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Collating Specific Patterns (AREA)

Abstract

本发明揭示了一种基于特征增强的VPN流量WEB指纹识别方法,包括如下步骤:S1、抓取SSL/TLS隧道内的流量信息并加以保存;S2、对所抓取的流量信息进行预处理,设置过滤规则、删除不符合过滤规则的流量信息;S3、根据流量密度完成激增周期特征提取;S4、利用LightGBM算法、结合经过预处理的流量信息及所提取的激增周期特征,建立并训练识别模型;S5、将所得到的、经过训练的识别模型应用于WEB指纹识别过程中,最终完成WEB指纹识别。本发明通过使用新的分类特征流量激增周期,在特征增强的基础上有效地提高了指纹识别对加密流量的识别性能。

Description

基于特征增强的VPN流量WEB指纹识别方法
技术领域
本发明为一种识别方法,具体涉及一种适用于动态网络页面识别的基于特征增强的VPN流量WEB指纹识别方法,属于网络安全技术领域。
背景技术
近年来,随着互联网技术的不断发展,网络规模以及网络用户量的不断扩大、网络流量的多样性也随之不断增加。据中国互联网协会发布的《中国互联网发展报告2019》显示,截至2019年6月,全球网民的总数突破50亿,互联网普及率超过50%。在网民规模和网络普及率逐年递增、网络用户对于安全隐私等问题的关注度不断提升的大背景下,整个网络环境对于网络安全、数据保护方面的需求也越来越强烈。为了保护用户的隐私、满足网络安全的需求,通信过程中需要对网络流量进行加密。
同时,再加上现代企事业单位业务的多样化发展和单位本身在网络方面的各项需求也在不断增长,单位总部与分部之间、单位内人员与出差人员之间的联系日趋紧密。在上述需求的催生下,相关技术开始陆续出现并逐步发展。
VPN(Virtual Private Network,虚拟专用网络)技术可以在公共互联网建立一个安全的、专用的网络以实现单位、员工之间的信息交流和信息共享。VPN技术使用安全的隧道将网络流量进行传输,传输的信息和源/目标地址会在隧道的两端进行加密。因此,这项技术不仅能够从根本上满足企事业用户的低通信费和高灵活性双重需求,而且还可以提供与专线相媲美的通信安全保障。
总体而言,VPN技术是一种低成本、安全、灵活的远程网络接入解决方案。但是在实际的技术应用中,加密流量也给恶意网路攻击提供了可乘之机,因此,出于有效改善服务质量、进一步提升网络管理水平的考虑,加密流量识别技术的开发就显得尤为重要。
Web指纹识别技术是一种通过流量分析来识别数据流目标网址的数据挖掘技术,其应用非常广泛。例如在企业网络管理中,企业的系统管理员会使用该技术阻止外部人员访问某些内部网站。但当通信过程被加密时,客户端会使用VPN隧道技术或代理服务器来隐藏目标网站的信息,由于数据流在加密过程中会隐藏相应数据,指纹识别的难度会因此增加。
综上所述,如何基于上述研究现状,设计出一种全新的、VPN流量WEB指纹识别方法,在增强特征的基础上提高WEB指纹识别技术在网页流量中的识别率,克服现有技术中所存在的诸多不足,也就成为了本领域内技术人员所共同关注的问题。
发明内容
鉴于现有技术存在上述缺陷,本发明的目的是提出一种适用于动态网络页面识别的基于特征增强的VPN流量WEB指纹识别方法,具体如下。
一种基于特征增强的VPN流量WEB指纹识别方法,包括如下步骤:
S1、抓取SSL / TLS隧道内的流量信息并加以保存;
S2、对所抓取的流量信息进行预处理,设置过滤规则、删除不符合过滤规则的流量信息;
S3、根据流量密度完成激增周期特征提取;
S4、利用LightGBM算法、结合经过预处理的流量信息及所提取的激增周期特征,建立并训练识别模型;
S5、将所得到的、经过训练的识别模型应用于WEB指纹识别过程中,最终完成WEB指纹识别。
优选地,S1具体包括如下步骤:使用流量抓包软件WireShark在出口路由器上抓取SSL / TLS隧道内的流量信息,将所抓取的流量信息以pcap格式逐一保存为数据包,随后将全部数据包进行汇总、得到原始数据集。
优选地,S2具体包括如下步骤:使用WireShark对所述原始数据集内的数据包进行处理,设置过滤规则、按照所述过滤规则对不符合条件的数据包进行删除、得到经过预处理后的原始数据集。
优选地,所述过滤规则包括:删除所述原始数据集内的非TCP数据包及纯ACK数据包。
优选地,S3具体包括如下步骤:
S31、将所述原始数据集内的数据包转换为时间戳序列,所述时间戳序列内包含若干成对数据,所述成对数据包括一一对应的时间及数据包大小;
S32、将所述时间戳序列转换为在100ms非重叠窗口中计算出的比特率时间序列;
S33、以自适应的方法寻找特定阈值,从所述比特率时间序列中提取高于特定阈值的连续时间序列,将结果作为激增周期并加以输出。
优选地,S33中所述以自适应的方法寻找特定阈值,具体包括如下步骤:从可能的最大值开始、降序寻找阈值,直至寻找到某一阈值可以使突发周期覆盖80%以上的已传输流量信息。
优选地,在所述激增周期中,连续时间序列按照其时序降序排列;所述激增周期中传输的流量信息的字节总数为该激增周期的大小,所述激增周期的大小的矢量用作表示样本的特征。
优选地,S4具体包括如下步骤:
S41、将经过预处理后的原始数据集划分为训练集和测试集;
S42、将LightGBM分类器的参数设置为默认值,将所述训练集作为LightGBM算法的数据对所述LightGBM分类器进行训练;
S43、调整所述LightGBM分类器的参数,再次将所述训练集作为LightGBM算法的数据对所述LightGBM分类器进行训练,循环操作直至所述LightGBM分类器对所述训练集的应用类型识别效果达到预设值;
S44、使用测试集对所述LightGBM分类器的识别效果进行测试,若测试合格则结束流程,将所述LightGBM分类器作为识别模型;若测试不合格则返回S43,重复执行前序流程。
优选地,在S41中,将经过预处理后的原始数据集按比例划分为训练集和测试集,划分比例为训练集∶测试集=2∶1。
本发明的优点主要体现在以下几个方面:
本发明采用有监督学习的机器学习算法,提出了一种基于特征增强的VPN流量WEB指纹识别方法,并取得了较为理想的实验结果。本发明通过使用新的分类特征流量激增周期,在特征增强的基础上有效地提高了指纹识别对加密流量的识别性能。
与现有的网页流量识别方法相比,本发明提出的方法能够更加精确地感知动态网页流量的变化、增加流量识别的敏感度,进而得到更为准确的识别结果。
此外,本发明还为WEB指纹识别技术的相关研究和应用提供了一种全新的思路,为同领域内的其他相关问题提供了参考,可以以此为依据进行拓展延伸和深入研究,行业应用前景广阔。
以下便结合实施例附图,对本发明的具体实施方式作进一步的详述,以使本发明技术方案更易于理解、掌握。
附图说明
图1为本发明的方法整体流程示意图;
图2为本发明的方法中激增周期特征提取部分的流程示意图。
具体实施方式
本发明揭示了一种基于特征增强的VPN流量WEB指纹识别方法,特别适用于动态网络页面识别,具体方案如下。
如图1所示,一种基于特征增强的VPN流量WEB指纹识别方法,包括如下步骤。
S1、抓取SSL / TLS隧道内的流量信息并加以保存。
在这一操作中,具体包括:使用流量抓包软件WireShark在出口路由器上抓取SSL/ TLS隧道内的流量信息,将所抓取的流量信息以pcap格式逐一保存为数据包,随后将全部数据包进行汇总、得到原始数据集。
S2、对所抓取的流量信息进行预处理,设置过滤规则、删除不符合过滤规则的流量信息。
在这一操作中,具体包括:使用WireShark对所述原始数据集内的数据包进行处理,设置过滤规则、按照所述过滤规则对不符合条件的数据包进行删除、得到经过预处理后的原始数据集。
所述过滤规则包括:删除所述原始数据集内的非TCP数据包及纯ACK数据包。
S3、根据流量密度完成激增周期特征提取。
在这一操作中,具体包括:
S31、将所述原始数据集内的数据包转换为时间戳序列,所述时间戳序列内包含若干成对数据,所述成对数据包括一一对应的时间及数据包大小;
S32、将所述时间戳序列转换为在100ms非重叠窗口中计算出的比特率时间序列;
S33、以自适应的方法寻找特定阈值,从所述比特率时间序列中提取高于特定阈值的连续时间序列,将结果作为激增周期并加以输出。
此处所述以自适应的方法寻找特定阈值,具体为,从可能的最大值开始、降序寻找阈值,直至寻找到某一阈值可以使突发周期覆盖80%以上的已传输流量信息。
选择最大的N个周期,其中N任意取值。在所述激增周期中,连续时间序列按照其时序降序排列;所述激增周期中传输的流量信息的字节总数为该激增周期的大小,所述激增周期的大小的矢量用作表示样本的特征。
S4、利用LightGBM算法、结合经过预处理的流量信息及所提取的激增周期特征,建立并训练识别模型,实现对动态网页加密数据流的识别分析。
在这一操作中,具体包括:
S41、将经过预处理后的原始数据集按照2:1的比例划分为训练集和测试集;
S42、将LightGBM分类器的参数设置为默认值,将所述训练集作为LightGBM算法的数据对所述LightGBM分类器进行训练;
S43、调整所述LightGBM分类器的参数,再次将所述训练集作为LightGBM算法的数据对所述LightGBM分类器进行训练,循环操作直至所述LightGBM分类器对所述训练集的应用类型识别效果达到预设值;
S44、使用测试集对所述LightGBM分类器的识别效果进行测试,若测试合格则结束流程,将所述LightGBM分类器作为识别模型;若测试不合格则返回S43,重复执行前序流程。
S5、将所得到的、经过训练的识别模型应用于WEB指纹识别过程中,最终完成WEB指纹识别。
综上所述,本发明提出了一种基于特征增强的VPN流量WEB指纹识别方法,面对动态网页流量密度大、变化快的问题,根据流量密度的激增时间定义了一个新的特征流量激增周期,使用LightGBM算法,降低了建模时间,提高了动态网页流量识别率。
本发明采用有监督学习的机器学习算法,提出了一种基于特征增强的VPN流量WEB指纹识别方法,并取得了较为理想的实验结果。本发明通过使用新的分类特征流量激增周期,在特征增强的基础上有效地提高了指纹识别对加密流量的识别性能。
与现有的网页流量识别方法相比,本发明提出的方法能够更加精确地感知动态网页流量的变化、增加流量识别的敏感度,进而得到更为准确的识别结果。
此外,本发明还为WEB指纹识别技术的相关研究和应用提供了一种全新的思路,为同领域内的其他相关问题提供了参考,可以以此为依据进行拓展延伸和深入研究,行业应用前景广阔。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神和基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。
最后,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。

Claims (5)

1.一种基于特征增强的VPN流量WEB指纹识别方法,其特征在于,包括如下步骤:
S1、抓取SSL/TLS隧道内的流量信息并加以保存;
S2、对所抓取的流量信息进行预处理,设置过滤规则、删除不符合过滤规则的流量信息,包括如下步骤:
使用流量抓包软件WireShark对原始数据集内的数据包进行处理,设置过滤规则、按照所述过滤规则对不符合条件的数据包进行删除、得到经过预处理后的原始数据集;
S3、根据流量密度完成激增周期特征提取,具体包括如下步骤:
S31、将所述原始数据集内的数据包转换为时间戳序列,所述时间戳序列内包含若干成对数据,所述成对数据包括一一对应的时间及数据包大小;
S32、将所述时间戳序列转换为在100ms非重叠窗口中计算出的比特率时间序列;
S33、以自适应的方法寻找特定阈值Ith,从所述比特率时间序列中提取高于特定阈值Ith的连续时间序列,将结果作为激增周期并加以输出;
S4、利用LightGBM算法、结合经过预处理的流量信息及所提取的激增周期特征,建立并训练识别模型,具体包括如下步骤:
S41、将经过预处理后的原始数据集按照2:1的比例划分为训练集和测试集;
S42、将LightGBM分类器的参数设置为默认值,将所述训练集作为LightGBM算法的数据对所述LightGBM分类器进行训练;
S43、调整所述LightGBM分类器的参数,再次将所述训练集作为LightGBM 算法的数据对所述LightGBM分类器进行训练,循环操作直至所述LightGBM分类器对所述训练集的应用类型识别效果达到预设值;
S44、使用测试集对所述LightGBM分类器的识别效果进行测试,若测试合格则结束流程,将所述LightGBM分类器作为识别模型;若测试不合格则返回S43,重复执行前序流程;
S5、将所得到的、经过训练的识别模型应用于WEB指纹识别过程中,最终完成WEB指纹识别。
2.根据权利要求1所述的基于特征增强的VPN流量WEB指纹识别方法,其特征在于,S1具体包括如下步骤:使用流量抓包软件WireShark在出口路由器上抓取SSL/TLS隧道内的流量信息,将所抓取的流量信息以pcap格式逐一保存为数据包,随后将全部数据包进行汇总、得到原始数据集。
3.根据权利要求1所述的基于特征增强的VPN流量WEB指纹识别方法,其特征在于,所述过滤规则包括:删除所述原始数据集内的非TCP数据包及纯ACK数据包。
4.根据权利要求1所述的基于特征增强的VPN流量WEB指纹识别方法,其特征在于,S33中所述以自适应的方法寻找特定阈值Ith,具体包括如下步骤:从可能的最大值开始、降序寻找阈值,直至寻找到某一阈值可以使突发周期覆盖80%以上的已传输流量信息。
5.根据权利要求1所述的基于特征增强的VPN流量WEB指纹识别方法,其特征在于:在所述激增周期中,连续时间序列按照其时序降序排列;所述激增周期中传输的字节总数为该激增周期的大小,所述激增周期的大小的矢量用作表示样本的特征。
CN202010521565.XA 2020-06-10 2020-06-10 基于特征增强的vpn流量web指纹识别方法 Active CN111835720B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010521565.XA CN111835720B (zh) 2020-06-10 2020-06-10 基于特征增强的vpn流量web指纹识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010521565.XA CN111835720B (zh) 2020-06-10 2020-06-10 基于特征增强的vpn流量web指纹识别方法

Publications (2)

Publication Number Publication Date
CN111835720A CN111835720A (zh) 2020-10-27
CN111835720B true CN111835720B (zh) 2023-04-07

Family

ID=72899084

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010521565.XA Active CN111835720B (zh) 2020-06-10 2020-06-10 基于特征增强的vpn流量web指纹识别方法

Country Status (1)

Country Link
CN (1) CN111835720B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114430335A (zh) * 2021-12-16 2022-05-03 奇安信科技集团股份有限公司 web指纹匹配方法及装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105281973A (zh) * 2015-08-07 2016-01-27 南京邮电大学 一种针对特定网站类别的网页指纹识别方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110247930B (zh) * 2019-07-01 2020-05-12 北京理工大学 一种基于深度神经网络的加密网络流量识别方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105281973A (zh) * 2015-08-07 2016-01-27 南京邮电大学 一种针对特定网站类别的网页指纹识别方法

Also Published As

Publication number Publication date
CN111835720A (zh) 2020-10-27

Similar Documents

Publication Publication Date Title
Shen et al. Webpage fingerprinting using only packet length information
CN110417729A (zh) 一种加密流量的服务与应用分类方法及系统
CN107370752B (zh) 一种高效的远控木马检测方法
Lingyu et al. A hierarchical classification approach for tor anonymous traffic
US20240064107A1 (en) System for classifying encrypted traffic based on data packet
Shen et al. Efficient fine-grained website fingerprinting via encrypted traffic analysis with deep learning
CN114239737A (zh) 一种基于时空特征与双层注意力的加密恶意流量检测方法
Hejun et al. Encrypted network behaviors identification based on dynamic time warping and k-nearest neighbor
Pham et al. Lightweight Convolutional Neural Network Based Intrusion Detection System.
Wu et al. Tdae: Autoencoder-based automatic feature learning method for the detection of dns tunnel
Wang et al. 2ch-TCN: a website fingerprinting attack over tor using 2-channel temporal convolutional networks
CN114629718A (zh) 一种基于多模型融合的隐匿恶意行为检测方法
CN116915450A (zh) 基于多步网络攻击识别和场景重构的拓扑剪枝优化方法
CN111835720B (zh) 基于特征增强的vpn流量web指纹识别方法
Han et al. An effective encrypted traffic classification method based on pruning convolutional neural networks for cloud platform
Zheng et al. Detecting malicious tls network traffic based on communication channel features
CN113726561A (zh) 利用联邦学习训练卷积神经网络的业务类型识别方法
Liu et al. Spatial-temporal feature with dual-attention mechanism for encrypted malicious traffic detection
Dener et al. Rfse-gru: Data balanced classification model for mobile encrypted traffic in big data environment
CN114124551B (zh) 一种WireGuard协议下基于多粒度特征提取的恶意加密流量识别的方法
CN108040052A (zh) 一种基于Netflow日志数据的网络安全威胁分析方法及系统
CN115021986A (zh) 一种用于物联网设备识别可部署模型的构建方法与装置
Zhou et al. IoT unbalanced traffic classification system based on Focal_Attention_LSTM
Shi et al. Spbiseq: An early-stage fingerprint generation method with high robustness for encrypted mobile application traffic
CN114362988A (zh) 网络流量的识别方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant