CN113254104A - 一种用于基因分析的加速器及加速方法 - Google Patents

一种用于基因分析的加速器及加速方法 Download PDF

Info

Publication number
CN113254104A
CN113254104A CN202110633617.7A CN202110633617A CN113254104A CN 113254104 A CN113254104 A CN 113254104A CN 202110633617 A CN202110633617 A CN 202110633617A CN 113254104 A CN113254104 A CN 113254104A
Authority
CN
China
Prior art keywords
data
calculation
accelerator
module
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110633617.7A
Other languages
English (en)
Other versions
CN113254104B (zh
Inventor
谭光明
李叶文
高睿昊
臧大伟
刘万奇
康宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Western Research Institute Of China Science And Technology Computing Technology
Original Assignee
Western Research Institute Of China Science And Technology Computing Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Western Research Institute Of China Science And Technology Computing Technology filed Critical Western Research Institute Of China Science And Technology Computing Technology
Priority to CN202110633617.7A priority Critical patent/CN113254104B/zh
Publication of CN113254104A publication Critical patent/CN113254104A/zh
Application granted granted Critical
Publication of CN113254104B publication Critical patent/CN113254104B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/445Program loading or initiating
    • G06F9/44505Configuring for program initiating, e.g. using registry, configuration files
    • G06F9/4451User profiles; Roaming
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Chemical & Material Sciences (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及基因分析技术领域,具体公开了一种用于基因分析的加速器及加速方法,其中,加速器包括加速器阵列模块和粒度配置模块;加速器阵列模块包括m个计算单元,粒度配置模块用于将n个计算单元整合为加速核,其中n小于或等于m;粒度配置模块还用于获取指令信息,加速核用于根据指令信息进行加速计算;指令信息包括数据指令、参数指令和计算指令中的一种或多种。采用本发明的技术方案能够提高基因分析的速度。

Description

一种用于基因分析的加速器及加速方法
技术领域
本发明涉及基因分析技术领域,特别涉及一种用于基因分析的加速器及加速方法。
背景技术
基因分析技术作为探索生命奥秘的重要手段,正成为生物信息学研究的重要分支,在物种鉴别、基因检测、疾病诊断等方面有着广泛的应用,基因分析技术的飞速发展为精准医疗奠定了坚实的基础,也使得临床诊断前景更加光明。近年来,随着第二代测序技术的高速发展,测序成本的下降速率已经远远超过摩尔定律的下降速率,呈爆炸式增长的基因数据量对现有处理器的处理能力提出了新的挑战。
在基因分析流程中,动态规划算法、成对隐马尔可夫模型等步骤必不可少且相当耗时,已经成为目前基因分析流程中重要的性能瓶颈。
目前主流的通用处理器如Intel,AMD,ARM,PowerPC均是商用处理器,未开放处理器的源代码。在没有开源代码的情况下,无法实现在芯片内部定制加速器模块,而且,主流的通用处理器采用的指令集为X86,ARM和Power等。这些指令集也不支持用户去定义调用特定加速器模块的指令。由于以上两点限制,所以目前主流的通用处理器仅仅能完成通用的计算功能。无法根据基因的特点进行自适应的加速,导致计算速度慢。
为此,需要一种能提高计算速度的用于基因分析的加速器及加速方法。
发明内容
本发明提供了一种用于基因分析的加速器及加速方法,能够提高基因分析的速度。
为了解决上述技术问题,本申请提供如下技术方案:
本发明的目的之一是提供一种用于基因分析的加速器,包括加速器阵列模块和粒度配置模块;
加速器阵列模块包括m个计算单元,粒度配置模块用于将n个计算单元整合为加速核,其中n小于或等于m;
粒度配置模块还用于获取指令信息,加速核用于根据指令信息进行加速计算;
指令信息包括数据指令、参数指令和计算指令中的一种或多种。
基础方案原理及有益效果如下:
由于基因读段的长度因测序技术和公司而各不相同,单一的计算单元无法对不同长度的读段进行计算,影响计算效率。本方案中,未采用已有的商用处理器,而且进行了重新设计,设置了包括m个计算单元的加速器阵列模块,还设置了粒度配置模块。粒度配置模块可以将其中n个计算单元整合为加速器,实现了粗细粒度的调整,可以对不同长度的读段序列进行计算。换句话说,通过粒度配置模块来对加速器阵列模块的粒度进行配置,将多个小的计算单元整合成大的计算单元来完成更长读段的计算。可以有效提高运算速度,缩短运算的时间。
通过引入特定的指令信息,可以针对加速器的指令进行定制形成自定义指令即数据指令、参数指令和计算指令中的一种或多种。通过指令信息可以将加速器阵列模块执行计算需要的数据、参数等进行提前配置,加速器阵列模块在此基础上直接调用计算,效率更高。
综上,本方案能够提高基因分析的速度。
进一步,还包括输入缓存序列和输入缓冲序列,用于为加速器阵列模块提供加速计算需要的数据。
便于加速器阵列模块直接从输入缓存序列和输入缓冲序列调取数据进行加速计算,与从计算机的内存中调用数据相比,无需借助PCIe和SerDes等接口进行数据传输,不会出现由于PCIe和SerDes等接口带宽远低于访存设备的带宽,造成交互损耗的问题,从而降低了交互损耗。
进一步,所述计算单元包括数据选择器、数据缓存队列、第一计算模块、结果暂存队列、结果选择器和第二计算模块;第一计算模块和结果暂存队列的数量有若干个,且第一计算模块与结果暂存队列一一对应;
数据选择器用于对输入数据和数据缓存队列中缓存的上一轮计算完成的数据,进行数据选择;
数据缓存队列用于存储第一计算模块的结果;
第一计算模块用于对数据选择器选择的数据进行第一次计算,并将计算结果输入到对应的结果暂存队列;
所述结果暂存队列用于存储对应第一计算模块的计算结果;
所述结果选择器用于为第二计算模块提供数据;
所述第二计算模块用于提取结果暂存队列的数据进行第二次计算,将计算完成的数据输入数据缓存队列。
通过设置数据选择器、数据缓存队列、第一计算模块、结果暂存队列、结果选择器和第二计算模块,可以实现多种基因分析步骤的加速。第一计算模块和结果暂存队列的数量有若干个,且第一计算模块与结果暂存队列一一对应,可以实现并行计算,提高计算速度。
进一步,所述加速计算包括动态规划计算,
动态规划计算中,输入缓存序列提供读段序列,输入缓冲序列提供参考序列;
数据选择器用于对输入的参考序列和数据缓存队列中的上一轮计算完成的对比序列;进行数据选择;
第一计算模块用于将读段序列与数据选择器输入的参考序列或对比序列进行比较,将比较结果存储在结果暂存队列中;
第二计算模块用于提取结果暂存队列中的比较结果进行动态规划的反向回溯,得到比对序列,将对比序列输入数据缓存队列中。
本优选方案可以有效支持动态规划计算,第一计算模块将读段序列与对比序列进行比较,有效地利用了动态规划算法中数据重用性的特点。
进一步,所述加速计算还包括成对隐马尔可夫模型计算,
成对隐马尔可夫模型计算中,输入缓存序列提供读段序列,输入缓冲序列提供单体型碱基序列;
数据选择器用于对单体型碱基序列和数据缓存队列中缓存的上一轮计算完成的数据进行数据选择;
数据缓存队列用于存储第一计算模块的计算结果;
第一计算模块用于对数据选择器选择的数据与读段序列进行初始化计算或迭代计算,并将计算结果输入到对应的结果暂存队列;
第二计算模块用于提取结果暂存队列的数据进行相似得分计算,得到相似得分。
本优选方案可以有效支持成对隐马尔可夫模型计算。
进一步,所述粒度配置模块整合的每个加速核的大小为:
kernel_size/(read_length+edit_distance)
其中kernel_size为单个计算单元支持的数据计算长度,read_length为当前的读段序列长度,edit_distance为允许的最长的编辑距离。
使得加速器支持的数据计算长度与当前的读段序列长度相匹配,可以提高计算速度,缩短计算的时间。
进一步,所述数据指令用于配置加速器阵列模块计算的数据地址,单个数据大小和数据总长度;
参数指令用于配置加速器阵列模块加速计算的参数;
计算指令用于在数据准备完成后,启动加速器阵列模块对数据执行加速计算,将计算结果写回数据指令配置的数据地址。
通过数据指令、参数指令和计算指令可以实现对加速器阵列模块进行精确的控制。
进一步,所述m个计算单元组成脉动阵列。
采用脉动阵列,计算时,数据在阵列结构的各计算单元之间沿各自方向同步前进,吞吐量大,计算速度快。
进一步,所述指令信息还包括辅助指令,辅助指令用于检测加速器阵列模块的行为。
例如判断当前加速核是否计算完成等,可以对加速器阵列模块的加速过程进行监控。
本发明的目的之二是提供一种用于基因分析的加速方法,使用上述加速器,实现对基因分析的加速。
由于基因读段的长度因测序技术和公司而各不相同,单一的计算单元无法对不同长度的读段进行计算,影响计算效率。本方案中,粒度配置模块将n个计算单元整合为加速器,实现了粗细粒度的调整,可以对不同长度的读段序列进行计算。换句话说,对加速器阵列模块的粒度进行配置,将多个小的计算单元整合成大的计算单元来完成更长读段的计算。可以有效提高运算速度,缩短运算的时间。
通过引入特定的指令信息,可以针对加速器的指令进行定制形成自定义指令即数据指令、参数指令和计算指令中的一种或多种。通过指令信息可以将加速器阵列模块执行计算需要的数据、参数等进行提前配置,加速器阵列模块在此基础上直接调用计算,效率更高。
综上,本方案能够提高基因分析的速度。
附图说明
图1为实施例一用于基因分析的加速器的逻辑框图;
图2为实施例一用于基因分析的加速器中计算单元的逻辑框图;
图3为实施例一中动态规划算法的示意图;
图4为实施例二中成对隐马尔可夫模型的示意图;
图5为实施例二中成对隐马尔可夫模型的执行特征图。
具体实施方式
下面通过具体实施方式进一步详细说明:
实施例一
本实施例针对动态规划算法的应用对用于基因分析的加速器进行介绍。如图1所示,加速核包括加速器阵列模块、粒度配置模块、输入缓存序列和输入缓冲序列。
输入缓存序列和输入缓冲序列,用于为加速器阵列模块提供加速计算需要的数据。本实施例中,输入缓存序列用于提供读段序列、输入缓冲序列用于提供参考序列。
加速器阵列模块包括m个计算单元。m个计算单元组成矩形阵列,本实施例中,计算单元的数量为9个,组成3x3的矩形阵列,具体为脉动阵列。
粒度配置模块还用于将n个计算单元整合为加速核,实现对阵列的粒度进行配置,其中n小于或等于m。由于读段序列的长度因测序技术和公司而各不相同,单一的计算单元无法对不同长度的读段序列进行计算,将多个小的计算单元整合为加速核可以完成更长读段序列的计算。粒度配置模块还用于获取指令信息,加速核用于根据指令信息进行加速计算。
本实施例中,具体使用RISC-V支持的RoCC协议,以及RISC-V支持的指令信息。指令信息包括数据指令、参数指令和计算指令中的一种或多种,本实施例中包括上述全部。在其他实施例中,还可以包括辅助指令。
数据指令,用于配置加速器阵列模块计算需要的数据地址,单个数据大小和数据总长度,其调用次数取决于计算需要哪几类数据。
参数指令,用于配置加速器阵列模块动态规划计算的参数,通常只调用一次。
计算指令,用于在数据准备完成后,启动加速器阵列模块对数据执行动态规划计算,并兼顾将计算结果写回数据指令配置的数据地址。
辅助指令,用于检测加速器阵列模块的行为,例如判断当前加速核是否计算完成等。
如图2所示,计算单元包括数据选择器、第一计算模块、结果暂存队列、结果选择器、第二计算模块和数据缓存队列。
第一计算模块有若干个,结果暂存队列的数量与第一计算模块的数量一致,且与第一计算模块一一对应。
数据选择器用于接收参考序列和数据缓存队列中的上一轮计算完成的对比序列;进行数据选择;本实施例中,数据选择根据第一计算模块的需求确定,换句话说第一计算模块需要的计算数据是上一轮的比对序列还是输入的参考序列。
第一计算模块为核心的计算模块,第一计算模块用于将读段序列与数据选择器输入的参考序列或对比序列进行比较,将比较结果存储在结果暂存队列中。例如本实施例中的四个第一计算模块会完成读段序列中的四个数据的比较计算。也就是说,每一轮迭代都会比较计算四个数据,若干次比较计算直至读段序列全部完成。
当完成读段序列与参考序列或对比序列的比较计算后,结果选择器用于为第二计算模块提供提取结果暂存队列中的比较结果;
第二计算模块用于比较结果来进行动态规划的反向回溯,得到比对序列,将对比序列存储在数据缓存队列中,供下一轮计算使用。
如图3所示的基因分析领域广泛采用的动态规划算法:史密斯-沃特曼(Smith-Waterman)算法,该算法可以分为两步:
根据置换矩阵等参数来对序列GGTTGACTA和TGTTACGG进行前向运算过程,计算得分矩阵,即图中的Matrix Fill阶段;
从最高得分点进行反向回溯的过程,并得到序列的最优局部匹配情况,即GTT-AC匹配GTTGAC。
故,基于本实施例的加速装置进行基因分析时,包括如下步骤:
(1)读取参考序列,读取读段序列,读取动态规划过程需要的参数;
(2)执行动态规划算法的前向运算和反向回溯阶段;
(3)读取计算完成的数据。
本实施例还提供一种用于基因分析的加速方法,使用上述用于基因分析的加速器。
实施例二
本实施例和实施例一的区别在于,本实施例中针对成对隐马尔可夫模型的应用对用于基因分析的加速器进行介绍。
本实施例中,输入缓存序列和输入缓冲序列,两个模块的作用是提供基因分析中的成对隐马尔可夫模型的计算需要两组数据,一组是读段序列(存储在输入左上的输入缓存序列中),一组是单体型碱基序列数据(存储于右下的输入缓冲序列中)。
数据选择器用于对输入数据和数据缓存队列中缓存的上一轮计算完成的数据进行数据选择;其中数据选择取决于第一计算模块需要的计算数据是输入数据,还是数据缓存队列中缓存的上一轮计算完成的数据;
数据缓存队列,用于存储第一计算模块计算的结果;
第一计算模块,用于对数据选择器选择的数据进行初始化计算或迭代计算,并将计算结果输入到对应的结果暂存队列;
结果暂存队列,用于存储对应第一计算模块的计算结果;
结果选择器,用于为第二计算模块提供数据;
第二计算模块,用于提取结果暂存队列的数据进行相似得分计算,得到最终的相似得分。
本实施例中,加速器包含四个串联第一计算模块,串联的第一计算模块中第一个第一计算模块与数据选择器连接,串联的第一计算模块中最后一个第一计算模块与数据缓存队列连接,每一第一计算模块连接有一个结果暂存队列,所有结果暂存队列均与结果选择器连接,结果选择器与第二计算模块连接,第二计算模块连接与数据缓存队列直接可以进行信息交互。
上述初始化计算、迭代计算和相似得分计算为对成对隐马尔可夫模型的算法流程,具体为:
如图4,基因分析领域广泛采用的成对隐马尔可夫模型的示意图,图4中A)给出了成对隐马尔可夫模型的状态转移图,定义M状态(表示匹配)到Y状态(表示删除)的转移概率为δ,定义M状态到X状态(表示插入)的转移概率为ι,定义X状态到X状态的转移概率和Y状态转移到Y状态的转移概率为ε,定义Qd,Qi和Qg为删除、插入和空位的连续得分。
上述变量之间的关系为:
Figure BDA0003104698330000081
状态矩阵的计算为:
a)如图4中B)所示,单体型碱基序列为GATCA,待比对的读段序列为ATT。
b)对M,X和Y的状态值进行初始化计算:
Figure BDA0003104698330000082
其中,重要的初始化值为M0,0=0,X0,0=0,Y0,0=0,IC为一个用于防止计算下溢的大初始值,若在Java实现中取21020
c)采用迭代计算,对Mi,j,Xi,j和Yi,j的状态值进行更新,如图5所示,迭代特点为当前需要更新的状态值和上边,左边以及左上角的值有关,因此迭代计算为:
i=0,…,|read|-1,j=0,…,|hap|-1 except(i=0,j=0)
Figure BDA0003104698330000083
Figure BDA0003104698330000084
其中,Qb为对应比对碱基的质量分数。
d)完成所有迭代之后,进行相似得分计算:
Figure BDA0003104698330000085
其中,L的值越大则表示两个序列更加相近。
从上述算法的计算流程中,分析算法运行时的计算特征:如图5所示,第三个当前计算单元依赖于上方(在上一次迭代计算完成),右方(在上一次计算完成),右上方(在上上次计算完成),同理可得,所有当前计算单元的依赖关系。从上述计算特征来看,可以通过加速核对算法进行加速,对比动态规划算法,本实施例的区别在于,成对隐马尔可夫模型引入了浮点计算,加速核进行浮点计算。
本实施例还提供一种用于基因分析的加速方法,使用上述用于基因分析的加速器。
以上的仅是本发明的实施例,该发明不限于此实施案例涉及的领域,方案中公知的具体结构及特性等常识在此未作过多描述,所属领域普通技术人员知晓申请日或者优先权日之前发明所属技术领域所有的普通技术知识,能够获知该领域中所有的现有技术,并且具有应用该日期之前常规实验手段的能力,所属领域普通技术人员可以在本申请给出的启示下,结合自身能力完善并实施本方案,一些典型的公知结构或者公知方法不应当成为所属领域普通技术人员实施本申请的障碍。应当指出,对于本领域的技术人员来说,在不脱离本发明结构的前提下,还可以作出若干变形和改进,这些也应该视为本发明的保护范围,这些都不会影响本发明实施的效果和专利的实用性。本申请要求的保护范围应当以其权利要求的内容为准,说明书中的具体实施方式等记载可以用于解释权利要求的内容。

Claims (10)

1.一种用于基因分析的加速器,其特征在于,包括加速器阵列模块和粒度配置模块;
加速器阵列模块包括m个计算单元,粒度配置模块用于将n个计算单元整合为加速核,其中n小于或等于m;
粒度配置模块还用于获取指令信息,加速核用于根据指令信息进行加速计算;
指令信息包括数据指令、参数指令和计算指令中的一种或多种。
2.根据权利要求1所述的用于基因分析的加速器,其特征在于:还包括输入缓存序列和输入缓冲序列,用于为加速器阵列模块提供加速计算需要的数据。
3.根据权利要求2所述的用于基因分析的加速器,其特征在于:所述计算单元包括数据选择器、数据缓存队列、第一计算模块、结果暂存队列、结果选择器和第二计算模块;第一计算模块和结果暂存队列的数量有若干个,且第一计算模块与结果暂存队列一一对应;
数据选择器用于对输入数据和数据缓存队列中缓存的上一轮计算完成的数据,进行数据选择;
数据缓存队列用于存储第一计算模块的结果;
第一计算模块用于对数据选择器选择的数据进行第一次计算,并将计算结果输入到对应的结果暂存队列;
所述结果暂存队列用于存储对应第一计算模块的计算结果;
所述结果选择器用于为第二计算模块提供数据;
所述第二计算模块用于提取结果暂存队列的数据进行第二次计算,将计算完成的数据输入数据缓存队列。
4.根据权利要求3所述的用于基因分析的加速器,其特征在于:所述加速计算包括动态规划计算,
动态规划计算中,输入缓存序列提供读段序列,输入缓冲序列提供参考序列;
数据选择器用于对输入的参考序列和数据缓存队列中的上一轮计算完成的对比序列;进行数据选择;
第一计算模块用于将读段序列与数据选择器输入的参考序列或对比序列进行比较,将比较结果存储在结果暂存队列中;
第二计算模块用于提取结果暂存队列中的比较结果进行动态规划的反向回溯,得到比对序列,将对比序列输入数据缓存队列中。
5.根据权利要求3所述的用于基因分析的加速器,其特征在于:所述加速计算还包括成对隐马尔可夫模型计算,
成对隐马尔可夫模型计算中,输入缓存序列提供读段序列,输入缓冲序列提供单体型碱基序列;
数据选择器用于对单体型碱基序列和数据缓存队列中缓存的上一轮计算完成的数据进行数据选择;
数据缓存队列用于存储第一计算模块的计算结果;
第一计算模块用于对数据选择器选择的数据与读段序列进行初始化计算或迭代计算,并将计算结果输入到对应的结果暂存队列;
第二计算模块用于提取结果暂存队列的数据进行相似得分计算,得到相似得分。
6.根据权利要求5所述的用于基因分析的加速器,其特征在于:所述粒度配置模块整合的每个加速核的大小为:
kernel_size/(read_length+edit_distance)
其中kernel_size为单个计算单元支持的数据计算长度,read_length为当前的读段序列长度,edit_distance为允许的最长的编辑距离。
7.根据权利要求1所述的用于基因分析的加速器,其特征在于:所述数据指令用于配置加速器阵列模块计算的数据地址,单个数据大小和数据总长度;
参数指令用于配置加速器阵列模块加速计算的参数;
计算指令用于在数据准备完成后,启动加速器阵列模块对数据执行加速计算,将计算结果写回数据指令配置的数据地址。
8.根据权利要求1所述的用于基因分析的加速器,其特征在于:所述m个计算单元组成脉动阵列。
9.根据权利要求1所述的用于基因分析的加速器,其特征在于:所述指令信息还包括辅助指令,辅助指令用于检测加速器阵列模块的行为。
10.一种用于基因分析的加速方法,其特征在于,使用权利要求1-9任一项所述的加速器,实现对基因分析的加速。
CN202110633617.7A 2021-06-07 2021-06-07 一种用于基因分析的加速器及加速方法 Active CN113254104B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110633617.7A CN113254104B (zh) 2021-06-07 2021-06-07 一种用于基因分析的加速器及加速方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110633617.7A CN113254104B (zh) 2021-06-07 2021-06-07 一种用于基因分析的加速器及加速方法

Publications (2)

Publication Number Publication Date
CN113254104A true CN113254104A (zh) 2021-08-13
CN113254104B CN113254104B (zh) 2022-06-21

Family

ID=77186832

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110633617.7A Active CN113254104B (zh) 2021-06-07 2021-06-07 一种用于基因分析的加速器及加速方法

Country Status (1)

Country Link
CN (1) CN113254104B (zh)

Citations (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101717817A (zh) * 2009-07-17 2010-06-02 中国人民解放军国防科学技术大学 对基于随机上下文无关文法的rna二级结构预测进行加速的方法
CN102789551A (zh) * 2011-05-16 2012-11-21 中国科学院上海生命科学研究院 用图形处理单元加速元基因组的物种分析的方法和系统
US20140066724A1 (en) * 2011-02-18 2014-03-06 Matias Zanartu System and Methods for Evaluating Vocal Function Using an Impedance-Based Inverse Filtering of Neck Surface Acceleration
US20140070753A1 (en) * 2012-09-12 2014-03-13 Brian T. Concannon System and method for control and analysis of a prime mover in an electrical machine using calculated torque
US20140080118A1 (en) * 2012-09-14 2014-03-20 International Business Machines Corporation Sample assembly with an electromagnetic field to accelerate the bonding of target antigens and nanoparticles
CN105046109A (zh) * 2015-06-26 2015-11-11 四川云合创智科技有限公司 一种用于生物信息序列分析的加速平台
US20160035154A1 (en) * 2014-07-29 2016-02-04 Jose Octavio Lejarza Bus Monitoring System to Detect Driver Alertness and Enhance Passenger Safety
CN106897582A (zh) * 2017-01-25 2017-06-27 人和未来生物科技(长沙)有限公司 一种面向基因数据解读的异构平台
CN107066802A (zh) * 2017-01-25 2017-08-18 人和未来生物科技(长沙)有限公司 一种面向基因数据计算的异构平台
CN107194204A (zh) * 2017-05-22 2017-09-22 人和未来生物科技(长沙)有限公司 一种全基因组测序数据计算解读方法
US20170337325A1 (en) * 2013-03-15 2017-11-23 Micron Technology, Inc. Hardware Acceleration of Short Read Mapping for Genomic and Other Types of Analyses
CN107704728A (zh) * 2017-09-26 2018-02-16 华南理工大学 一种基因序列比对的云计算加速方法
US20180052708A1 (en) * 2016-08-19 2018-02-22 Oracle International Corporation Resource Efficient Acceleration of Datastream Analytics Processing Using an Analytics Accelerator
CN108197705A (zh) * 2017-12-29 2018-06-22 国民技术股份有限公司 卷积神经网络硬件加速装置及卷积计算方法及存储介质
CN108563923A (zh) * 2017-12-05 2018-09-21 华南理工大学 一种基因变异数据分布式存储方法及架构
CN108595917A (zh) * 2018-06-29 2018-09-28 中国科学技术大学苏州研究院 基于fpga的面向基因测序串匹配算法的加速平台及设计方法
CN109785905A (zh) * 2018-12-18 2019-05-21 中国科学院计算技术研究所 一种面向基因比对算法的加速装置
CN110021345A (zh) * 2017-12-08 2019-07-16 北京哲源科技有限责任公司 基于spark平台的基因数据分析方法
CN110211641A (zh) * 2019-06-13 2019-09-06 纪震 一种基因表达数据的聚类分析方法及终端设备
CN110427262A (zh) * 2019-09-26 2019-11-08 深圳华大基因科技服务有限公司 一种基因数据分析方法及异构调度平台
CN110990063A (zh) * 2019-11-28 2020-04-10 中国科学院计算技术研究所 一种用于基因相似性分析的加速装置、方法和计算机设备
CN111653318A (zh) * 2019-05-24 2020-09-11 北京哲源科技有限责任公司 一种用于基因比对的加速方法、装置、存储介质与服务器
CN111863139A (zh) * 2020-04-10 2020-10-30 中国科学院计算技术研究所 一种基于近内存计算结构的基因比对加速方法和系统

Patent Citations (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101717817A (zh) * 2009-07-17 2010-06-02 中国人民解放军国防科学技术大学 对基于随机上下文无关文法的rna二级结构预测进行加速的方法
US20140066724A1 (en) * 2011-02-18 2014-03-06 Matias Zanartu System and Methods for Evaluating Vocal Function Using an Impedance-Based Inverse Filtering of Neck Surface Acceleration
CN102789551A (zh) * 2011-05-16 2012-11-21 中国科学院上海生命科学研究院 用图形处理单元加速元基因组的物种分析的方法和系统
US20140070753A1 (en) * 2012-09-12 2014-03-13 Brian T. Concannon System and method for control and analysis of a prime mover in an electrical machine using calculated torque
US20140080118A1 (en) * 2012-09-14 2014-03-20 International Business Machines Corporation Sample assembly with an electromagnetic field to accelerate the bonding of target antigens and nanoparticles
US20170337325A1 (en) * 2013-03-15 2017-11-23 Micron Technology, Inc. Hardware Acceleration of Short Read Mapping for Genomic and Other Types of Analyses
US20160035154A1 (en) * 2014-07-29 2016-02-04 Jose Octavio Lejarza Bus Monitoring System to Detect Driver Alertness and Enhance Passenger Safety
CN105046109A (zh) * 2015-06-26 2015-11-11 四川云合创智科技有限公司 一种用于生物信息序列分析的加速平台
US20180052708A1 (en) * 2016-08-19 2018-02-22 Oracle International Corporation Resource Efficient Acceleration of Datastream Analytics Processing Using an Analytics Accelerator
CN107066802A (zh) * 2017-01-25 2017-08-18 人和未来生物科技(长沙)有限公司 一种面向基因数据计算的异构平台
CN106897582A (zh) * 2017-01-25 2017-06-27 人和未来生物科技(长沙)有限公司 一种面向基因数据解读的异构平台
CN107194204A (zh) * 2017-05-22 2017-09-22 人和未来生物科技(长沙)有限公司 一种全基因组测序数据计算解读方法
CN107704728A (zh) * 2017-09-26 2018-02-16 华南理工大学 一种基因序列比对的云计算加速方法
CN108563923A (zh) * 2017-12-05 2018-09-21 华南理工大学 一种基因变异数据分布式存储方法及架构
CN110021345A (zh) * 2017-12-08 2019-07-16 北京哲源科技有限责任公司 基于spark平台的基因数据分析方法
CN108197705A (zh) * 2017-12-29 2018-06-22 国民技术股份有限公司 卷积神经网络硬件加速装置及卷积计算方法及存储介质
CN108595917A (zh) * 2018-06-29 2018-09-28 中国科学技术大学苏州研究院 基于fpga的面向基因测序串匹配算法的加速平台及设计方法
CN109785905A (zh) * 2018-12-18 2019-05-21 中国科学院计算技术研究所 一种面向基因比对算法的加速装置
CN111653318A (zh) * 2019-05-24 2020-09-11 北京哲源科技有限责任公司 一种用于基因比对的加速方法、装置、存储介质与服务器
CN110211641A (zh) * 2019-06-13 2019-09-06 纪震 一种基因表达数据的聚类分析方法及终端设备
CN110427262A (zh) * 2019-09-26 2019-11-08 深圳华大基因科技服务有限公司 一种基因数据分析方法及异构调度平台
CN110990063A (zh) * 2019-11-28 2020-04-10 中国科学院计算技术研究所 一种用于基因相似性分析的加速装置、方法和计算机设备
CN111863139A (zh) * 2020-04-10 2020-10-30 中国科学院计算技术研究所 一种基于近内存计算结构的基因比对加速方法和系统

Also Published As

Publication number Publication date
CN113254104B (zh) 2022-06-21

Similar Documents

Publication Publication Date Title
US20220415452A1 (en) Method and apparatus for determining drug molecule property, and storage medium
Shi et al. A parallel algorithm for error correction in high-throughput short-read data on CUDA-enabled graphics hardware
CN103999035B (zh) 用于状态机中的数据分析的方法及系统
CN104067282B (zh) 状态机晶格中的计数器操作
CN104471552B (zh) 用于处置状态机引擎所接收的数据的方法及系统
Chen et al. Accelerating the next generation long read mapping with the FPGA-based system
CN108133270A (zh) 卷积神经网络加速方法及装置
EP2932426B1 (en) Parallel local sequence alignment
Jacob et al. Mercury BLASTP: Accelerating protein sequence alignment
CN110334357A (zh) 一种命名实体识别的方法、装置、存储介质及电子设备
CN107256156A (zh) 用于状态机中的检测的方法及系统
Yang et al. An efficient parallel algorithm for longest common subsequence problem on gpus
US11941534B2 (en) Genome sequence alignment system and method
Chen et al. A high-throughput FPGA accelerator for short-read mapping of the whole human genome
CN113268270B (zh) 一种针对成对隐马尔可夫模型的加速方法、系统及装置
Ng et al. Acceleration of short read alignment with runtime reconfiguration
CN113254104B (zh) 一种用于基因分析的加速器及加速方法
Shi et al. Quality-score guided error correction for short-read sequencing data using CUDA
Shi et al. Accelerating error correction in high-throughput short-read DNA sequencing data with CUDA
US10769099B2 (en) Devices for time division multiplexing of state machine engine signals
CN113268269B (zh) 一种针对动态规划算法的加速方法、系统及装置
CN112802556B (zh) 一种针对测序数据的多标记序列并行识别的加速器装置
EP3539038B1 (en) Reduced memory nucleotide sequence comparison
Alachiotis et al. Accelerated inference of positive selection on whole genomes
Kieu-Do-Nguyen et al. High-Performance FPGA-Based BWA-MEM Accelerator

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant