CN110879782B - 一种基因比对软件的测试方法、装置、设备及介质 - Google Patents

一种基因比对软件的测试方法、装置、设备及介质 Download PDF

Info

Publication number
CN110879782B
CN110879782B CN201911089914.9A CN201911089914A CN110879782B CN 110879782 B CN110879782 B CN 110879782B CN 201911089914 A CN201911089914 A CN 201911089914A CN 110879782 B CN110879782 B CN 110879782B
Authority
CN
China
Prior art keywords
gene
gene sequence
target
sequence
tested
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911089914.9A
Other languages
English (en)
Other versions
CN110879782A (zh
Inventor
崔星辰
史宏志
赵健
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Electronic Information Industry Co Ltd
Original Assignee
Inspur Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Electronic Information Industry Co Ltd filed Critical Inspur Electronic Information Industry Co Ltd
Priority to CN201911089914.9A priority Critical patent/CN110879782B/zh
Publication of CN110879782A publication Critical patent/CN110879782A/zh
Application granted granted Critical
Publication of CN110879782B publication Critical patent/CN110879782B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/36Preventing errors by testing or debugging software
    • G06F11/3668Software testing
    • G06F11/3672Test management
    • G06F11/3688Test management for test execution, e.g. scheduling of test suites

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

本申请公开了一种基因比对软件的测试方法、装置、设备及介质,包括:从已知基因序列中截取多个基因序列,得到第一基因序列;在第一基因序列中选取预设数量的基因序列,得到第二基因序列;在第二基因序列中植入变异点,得到第三基因序列;利用第三基因序列和第四基因序列构建目标fastQ文件;将目标fastQ文件输入至待测基因比对软件,以对待测基因比对软件测试结果的准确性进行验证。因为目标fastQ文件是一个已知的fastQ文件,所以,通过该文件就可以预知到正确的基因比对结果,因此,只需要将待测基因比对软件的测试结果与正确的基因比对结果进行比较,即可判断出待测基因比对软件的测试结果是否正确。

Description

一种基因比对软件的测试方法、装置、设备及介质
技术领域
本发明涉及基因检测技术领域,特别涉及一种基因比对软件的测试方法、装置、设备及介质。
背景技术
随着生物技术的不断发展,人们通过基因比对技术可以预测自己罹患各种疾病的风险,所以,基因检测技术成为当下的一个研究热点。目前,在人类基因库中大概存在有30亿个碱基对,如果是利用通用的计算机软件平台来对一个人的基因序列进行比对,通常需要花费几天的时间,因此,传统的计算机软件平台已经无法满足人们对于基因比对结果快速与实时的需要。在此技术背景下,设计人员就开发了一些基因比对软件来辅助计算机软件平台对基因比对的过程,但是,在现有技术当中,还没有一种能够验证基因比对软件的基因比对结果是否正确的方法。针对这一技术问题,现在还没有较为有效的解决办法。
所以,如何验证待测基因比对软件的基因比对结果是否正确,是本领域技术人员亟待解决的技术问题。
发明内容
有鉴于此,本发明的目的在于提供一种基因比对软件的测试方法、装置、设备及介质,以对待测基因比对软件的基因比对结果是否正确进行验证。其具体方案如下:
一种基因比对软件的测试方法,包括:
从已知基因序列中截取多个基因序列,得到第一基因序列;
在所述第一基因序列中选取预设数量的基因序列,得到第二基因序列;
在所述第二基因序列中植入变异点,得到第三基因序列;
利用所述第三基因序列和第四基因序列构建目标fastQ文件;其中,所述第四基因序列为所述第一基因序列中除去所述第二基因序列之外的基因序列;
将所述目标fastQ文件输入至待测基因比对软件,以对所述待测基因比对软件测试结果的准确性进行验证。
优选的,所述从已知基因序列中截取多个基因序列,得到第一基因序列的过程,包括:
从所述已知基因序列中目标染色体的任意位置截取多个基因序列,得到所述第一基因序列。
优选的,所述从所述已知基因序列中目标染色体的任意位置截取多个基因序列,得到所述第一基因序列的过程,包括:
从所述已知基因序列中所述目标染色体的任意位置截取长度相等或长度不等的多个基因序列,得到所述第一基因序列。
优选的,所述在所述第二基因序列中植入变异点,得到第三基因序列的过程,包括:
在所述第二基因序列中插入碱基对和/或删除碱基对和/或变异碱基对,得到所述第三基因序列。
优选的,所述将所述目标fastQ文件输入至待测基因比对软件,以对所述待测基因比对软件测试结果的准确性进行验证的过程,包括:
将所述目标fastQ文件输入至所述待测基因比对软件,获取所述待测基因比对软件的基因比对结果;
判断所述基因比对结果的输出结果是否为一个;
若否,则继续判断所述基因比对结果中是否存在与所述第一基因序列相一致的基因序列;
若存在,则判定所述待测基因比对软件的测试结果为正确。
优选的,当判定所述基因比对结果的输出结果为一个的过程之后,还包括:
判断输入至所述待测基因比对软件的目标基因序列是否含有变异点;其中,所述目标基因序列为所述目标fastQ文件中的任意一个基因序列;
若是,则继续判断所述基因比对结果是否能够正确识别出所述目标基因序列中的变异点;
若否,则继续判断所述目标基因序列是否与所述第四基因序列相一致;
若能够识别出所述目标基因序列中的变异点,则执行所述判定所述待测基因比对软件的测试结果为正确的步骤;
若所述目标基因序列与所述第四基因序列相一致,则执行所述判定所述待测基因比对软件的测试结果为正确的步骤。
相应的,本发明还公开了一种基因比对软件的测试装置,包括:
基因截取模块,用于从已知基因序列中截取多个基因序列,得到第一基因序列;
基因选取模块,用于在所述第一基因序列中选取预设数量的基因序列,得到第二基因序列;
变异点植入模块,用于在所述第二基因序列中植入变异点,得到第三基因序列;
文件构建模块,用于利用所述第三基因序列和第四基因序列构建目标fastQ文件;其中,所述第四基因序列为所述第一基因序列中除去所述第二基因序列之外的基因序列;
结果验证模块,用于将所述目标fastQ文件输入至待测基因比对软件,以对所述待测基因比对软件测试结果的准确性进行验证。
相应的,本发明还公开了一种基因比对软件的测试设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如前述公开的一种基因比对软件的测试方法的步骤。
相应的,本发明还公开了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如前述公开的一种基因比对软件的测试方法的步骤。
可见,在本发明中,首先是从已知基因序列中截取多个基因序列,得到第一基因序列,并在第一基因序列中选取预设数量的基因序列,得到第二基因序列;然后,在第二基因序列中植入变异点,得到第三基因序列,并根据第三基因序列和第一基因序列中除去第二基因序列之外的第四基因序列构建目标fastQ文件;最后,将目标fastQ文件输入至待测基因比对软件当中,以对待测基因比对软件测试结果的正确性进行验证。显然,通过本发明所构建的目标fastQ文件相当于是一个已知的fastQ文件,那么,通过目标fastQ文件就可以提前预知到正确的基因比对结果,所以,当将目标fastQ文件输入至待测基因比对软件时,只需要将待测基因比对软件的测试结果与正确的基因比对结果进行比较,即可判断出待测基因比对软件的测试结果是否正确。相应的,本发明所提供的一种基因比对软件的测试装置、设备及介质,同样具有上述有益效果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例所提供的一种基因比对软件的测试方法的流程图;
图2为本发明实施例所提供的另一种基因比对软件的测试方法的流程图;
图3为本发明实施例所提供的一种基因比对软件的测试装置的结构图;
图4为本发明实施例所提供的一种基因比对软件的测试设备的结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参照图1,图1为本发明实施例所提供的一种基因比对软件的测试方法的流程图,该测试方法包括:
步骤S11:从已知基因序列中截取多个基因序列,得到第一基因序列;
步骤S12:在第一基因序列中选取预设数量的基因序列,得到第二基因序列;
步骤S13:在第二基因序列中植入变异点,得到第三基因序列;
在本实施例中,是提供了一种基因比对软件的测试方法,通过该基因比对软件的测试方法可以检验出待测基因比对软件的测试结果是否正确。具体的,在该测试方法中,首先是从已知基因序列中截取多个基因序列,得到第一基因序列,并从第一基因序列中选取预设数量的基因序列,得到第二基因序列;然后,在第二基因序列中植入变异点,得到第三基因序列。显然,从第一基因序列中选取预设数量的第二基因序列,并在第二基因序列中植入变异点的目的是为了使得后续构建的目标fastQ文件能够更加符合实际情况,并使得待测基因比对软件的测试结果更具有可信度。需要说明的是,预设数量既可以是一个,也可以是多个,只要是小于第一基因序列的基因序列个数即可。
步骤S14:利用第三基因序列和第四基因序列构建目标fastQ文件;
其中,第四基因序列为第一基因序列中除去第二基因序列之外的基因序列;
步骤S15:将目标fastQ文件输入至待测基因比对软件,以对待测基因比对软件测试结果的准确性进行验证。
当在第二基因序列中植入变异点,得到第三基因序列之后,则按照fastQ文件的构建标准,利用第三基因序列和第四基因序列构建目标fastQ文件,也即,利用第三基因序列和第一基因序列中除去第二基因序列之外的基因序列来构建目标fastQ文件。
可以理解的是,因为fastQ文件是一种存储了核苷酸序列以及相应质量评价的文本格式,所以,当利用第三基因序列和第四基因序列构建得到目标fastQ文件时,就可以将第三基因序列和第四基因序列变换成为待测基因比对软件可以识别的文本格式,并使得待测基因比对软件可以对由第三基因序列和第四基因序列所构建的目标fastQ文件进行测试与比对。
而且,因为第三基因序列和第四基因序列均为已知的基因序列,所以,利用第三基因序列和第四基因序列所构建得到的目标fastQ文件也是一个已知的fastQ文件,那么,与目标fastQ文件相对应的基因比对结果也就可以预先知晓,所以,在对待测基因比对软件测试结果进行验证的过程中,只需要将待测基因比对软件的输出结果与目标fastQ文件相对应的基因比对结果进行比对,即可判断出待测基因比对软件的测试结果是否正确。
可见,在本实施例中,首先是从已知基因序列中截取多个基因序列,得到第一基因序列,并在第一基因序列中选取预设数量的基因序列,得到第二基因序列;然后,在第二基因序列中植入变异点,得到第三基因序列,并根据第三基因序列和第一基因序列中除去第二基因序列之外的第四基因序列构建目标fastQ文件;最后,将目标fastQ文件输入至待测基因比对软件当中,以对待测基因比对软件测试结果的正确性进行验证。显然,通过本实施例所构建的目标fastQ文件相当于是一个已知的fastQ文件,那么,通过目标fastQ文件就可以提前预知到正确的基因比对结果,所以,当将目标fastQ文件输入至待测基因比对软件时,只需要将待测基因比对软件的测试结果与正确的基因比对结果进行比较,即可判断出待测基因比对软件的测试结果是否正确。
基于上述实施例,本实施例对技术方案作进一步的说明与优化,具体的,上述步骤S11:从已知基因序列中截取多个基因序列,得到第一基因序列的过程,包括:
从已知基因序列中目标染色体的任意位置截取多个基因序列,得到第一基因序列。
在本实施例中,在从已知基因序列中截取第一基因序列的过程中,是从已知基因序列中目标染色体的任意位置处截取多个基因序列。其中,目标染色体是指已知基因序列中的任意一个染色体。
可以理解的是,如果是待测基因比对软件从已知基因序列中不同染色体上截取多个基因序列时,那么,截取得到的多个基因序列所代表就是不同染色体中所蕴含的基因内容,这样就会使得截取得到的第一基因序列没有实际比对意义;如果是待测基因比对软件从已知基因序列中目标染色体的相同位置或者是连续位置截取多个基因序列时,那么,截取得到的多个基因序列就无法全面的表征出已知基因序列的基因内容,所以,在本实施例中,是从已知基因序列中目标染色体的任意位置截取多个基因序列,由此就能够使得第一基因序列可以更为全面、准确地表征出已知基因序列的基因内容。
作为一种优选的实施方式,上述步骤:从已知基因序列中目标染色体的任意位置截取多个基因序列,得到第一基因序列的过程,包括:
从已知基因序列中目标染色体的任意位置截取长度相等或长度不等的多个基因序列,得到第一基因序列。
具体的,在本实施例中,从已知基因序列中目标染色体的任意位置截取多个基因序列时,既可以是从目标染色体的任意位置处截取长度相同的多个基因序列,也可以是从目标染色体的任意位置处截取不同长度的多个基因序列。
也即,在实际操作过程中,既可以在确定好预设长度后,随机的在已知基因序列中的任意一个染色体上截取多个基因序列;也可以是在已知基因序列的任意一个染色体上截取相同长度的基因序列。
显然,通过本实施例所提供的技术方案,可以使得第一基因序列的截取方式更加灵活与多样。
基于上述实施例,本实施例对技术方案作进一步的说明与优化,具体的,上述步骤S13:在第二基因序列中植入变异点,得到第三基因序列的过程,包括:
在第二基因序列中插入碱基对和/或删除碱基对和/或变异碱基对,得到第三基因序列。
可以理解的是,当基因序列中出现了新增的碱基对,或者是基因序列中缺少了碱基对,或者是基因序列中的某一个或某几个碱基对发生了改变时,则可以认为该基因序列发生了变异。所以,在本实施例中,为了得到变异的基因序列,是通过在第二基因序列中插入碱基对和/或删除碱基对和/或变异碱基对来得到变异的基因序列,也即,第三基因序列。
可见,通过本实施例所提供的技术方案,可以使得变异点的植入过程更加可靠与可信。
基于上述实施例,本实施例对技术方案作进一步的说明与优化,请参见图2,图2为本发明实施例所提供的另一种基因比对软件的测试方法的流程图;具体的,上述步骤S15:将目标fastQ文件输入至待测基因比对软件,以对待测基因比对软件测试结果的准确性进行验证的过程,包括:
步骤S151:将目标fastQ文件输入至待测基因比对软件,获取待测基因比对软件的基因比对结果;
步骤S152:判断基因比对结果的输出结果是否为一个;若否,则执行步骤S153;
步骤S153:继续判断基因比对结果中是否存在与第一基因序列相一致的基因序列;若存在,则执行步骤S154;
步骤S154:判定待测基因比对软件的测试结果为正确。
可以理解的是,目标fastQ文件中既包括含有变异点的基因序列,也包括不含有变异点的基因序列,所以,在对待测基因比对软件的测试结果进行判断的过程中,需要根据输入至待测基因比对软件中目标基因序列的具体类型来制定不同的判定标准,来判断待测基因比对软件的测试结果是否正确。
在实际应用中,待测基因比对软件的基因比对结果会有两种形式,也即,待测基因比对软件的基因比对结果会输出一个输出结果,或者是多个输出结果,此操作为本领域技术人员所熟知的内容,而本实施例的重点在于对待测基因比对软件测试结果的检测,所以,在本实施例中对于此部分内容不作详细赘述。
如果待测基因比对软件的基因比对结果有多个输出时,此时,则需要判断基因比对结果中是否存在与第一基因序列相一致的基因序列,如果基因比对结果中存在与第一基因序列相一致的基因序列,则说明待测基因比对软件的测试结果为正确。
具体的,当判定基因比对结果的输出结果为一个的过程之后,还包括:
步骤S155:继续判断输入至待测基因比对软件的目标基因序列是否含有变异点;若是,则执行步骤S156;若否,则执行步骤S157;
其中,目标基因序列为目标fastQ文件中的任意一个基因序列;
步骤S156:继续判断基因比对结果是否能够正确识别出目标基因序列中的变异点;若能够识别出目标基因序列中的变异点,则执行步骤S154:判定待测基因比对软件的测试结果为正确;
如果待测基因比对软件的输出结果为一个时,则需要根据输入至待测基因比对软件中目标基因序列中是否含有变异点来判断待测基因比对软件的测试结果是否正确。
具体的,当输入至待测基因比对软件的目标基因序列中含有变异点时,此时,则需要利用另外的判断标准来判断待测基因比对软件的测试结果是否正确,也即,需要判断基因比对结果是否能够正确识别出目标基因序列中的变异点,如果基因比对结果能够正确识别出目标基因序列中的变异点,那么,则说明待测基因比对软件的测试结果就是正确的。
需要注意的是,如果基因比对结果不能正确识别出目标基因序列中的变异点,此时,则需要按照以下两种情况来进行具体分析。如果是待测基因比对软件所检测到的变异点多于目标基因序列中的变异点时,则可以判定待测基因比对软件的测试结果不准确;如果是待测基因比对软件所检测到的变异点少于目标基因序列中的变异点,或者是待测基因比对软件没有检测到变异点时,则可能是待测基因比对软件在截取第一基因序列的过程中,由于偶然因素将植入的变异点完全匹配到已知基因序列中的其它位置,如果是这种情况,则不能直接认为是待测基因比对软件不准确,此时,则需要将待测基因比对软件的基因比对结果作为检测工具的输入,然后,利用检测工具来检测是否是将变异点植入到已知基因序列中的其它位置,并以此来对待测基因比对软件的测试精度进行再次验证。此处,通过一个具体的例子进行说明。
假设在已知基因序列的染色体chr1上截取起始位置为231的基因序列ACTGCCA,然后,在基因序列ACTGCCA中植入变异点,也即,将基因序列ACTGCCA变异为基因序列ACTGCTA。如果待测基因比对软件的基因比对结果正确,那么,待测基因比对软件会检测到染色体chr1的231位置的第六个碱基对存在变异,但是,如果待测基因比对软件的基因比对结果是在染色体chr2上,起始位置为345,而且,不存在变异点。
在此情况下,则说明有可能是由于基因序列ACTGCCA的长度比较短,在基因序列ACTGCCA中植入变异点时产生巧合,并使得待测基因比对软件刚好完全比对到染色体chr2上,在此情况下,则需要将染色体chr2,起始位置为345作为待测基因比对软件的输入,然后,再检测待测基因比对软件的基因比对结果是否为基因序列ACTGCTA,如果是,则可以认为是在基因序列ACTGCCA中植入变异点的位置不够理想,如果不是,则可以判定为待测基因比对软件的测试结果不准确。
步骤S157:继续判断目标基因序列是否与第四基因序列相一致;若目标基因序列与第四基因序列相一致,则执行步骤S154:判定待测基因比对软件的测试结果为正确。
如果输入至待测基因比对软件的目标基因序列中不含有变异点,则判断目标基因序列是否与第一基因序列中除去第二基因序列的第四基因序列相一致,来判断待测基因比对软件的测试结果是否正确,如果目标基因序列与第四基因序列相一致,则说明待测基因比对软件的测试结果正确。
由此可见,通过本实施例所提供的技术方案,不仅保证了待测基因比对结果的准确性,而且,也保证了待测基因比对软件测试结果的全面性。
请参见图3,图3为本发明实施例所提供的一种基因比对软件的测试装置的结构图,该测试装置包括:
基因截取模块21,用于从已知基因序列中截取多个基因序列,得到第一基因序列;
基因选取模块22,用于在第一基因序列中选取预设数量的基因序列,得到第二基因序列;
变异点植入模块23,用于在第二基因序列中植入变异点,得到第三基因序列;
文件构建模块24,用于利用第三基因序列和第四基因序列构建目标fastQ文件;其中,第四基因序列为第一基因序列中除去第二基因序列之外的基因序列;
结果验证模块25,用于将目标fastQ文件输入至待测基因比对软件,以对待测基因比对软件测试结果的准确性进行验证。
本发明实施例所提供的一种基因比对软件的测试装置,具有前述所公开的一种基因比对软件的测试方法所具有的有益效果。
请参见图4,图4为本发明实施例所提供的一种基因比对软件的测试设备的结构图,该测试设备包括:
存储器31,用于存储计算机程序;
处理器32,用于执行计算机程序时实现如前述所公开的一种基因比对软件的测试方法的步骤。
本发明实施例所提供的一种基因比对软件的测试设备,具有前述所公开的一种基因比对软件的测试方法所具有的有益效果。
相应的,本发明实施例还公开了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现如前述所公开的一种基因比对软件的测试方法的步骤。
本发明实施例所提供的一种计算机可读存储介质,具有前述所公开的一种基因比对软件的测试方法所具有的有益效果。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上对本发明所提供的一种基因比对软件的测试方法、装置、设备及介质进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (7)

1.一种基因比对软件的测试方法,其特征在于,包括:
从已知基因序列中截取多个基因序列,得到第一基因序列;
在所述第一基因序列中选取预设数量的基因序列,得到第二基因序列;
在所述第二基因序列中植入变异点,得到第三基因序列;
利用所述第三基因序列和第四基因序列构建目标fastQ文件;其中,所述第四基因序列为所述第一基因序列中除去所述第二基因序列之外的基因序列;
将所述目标fastQ文件输入至待测基因比对软件,以对所述待测基因比对软件测试结果的准确性进行验证;
所述将所述目标fastQ文件输入至待测基因比对软件,以对所述待测基因比对软件测试结果的准确性进行验证的过程,包括:
将所述目标fastQ文件输入至所述待测基因比对软件,获取所述待测基因比对软件的基因比对结果;
判断所述基因比对结果的输出结果是否为一个;
若否,则继续判断所述基因比对结果中是否存在与所述第一基因序列相一致的基因序列;
若存在,则判定所述待测基因比对软件的测试结果为正确;
当判定所述基因比对结果的输出结果为一个的过程之后,还包括:
判断输入至所述待测基因比对软件的目标基因序列是否含有变异点;其中,所述目标基因序列为所述目标fastQ文件中的任意一个基因序列;
若是,则继续判断所述基因比对结果是否能够正确识别出所述目标基因序列中的变异点;
若否,则继续判断所述目标基因序列是否与所述第四基因序列相一致;
若能够识别出所述目标基因序列中的变异点,则执行所述判定所述待测基因比对软件的测试结果为正确的步骤;
若所述目标基因序列与所述第四基因序列相一致,则执行所述判定所述待测基因比对软件的测试结果为正确的步骤。
2.根据权利要求1所述的测试方法,其特征在于,所述从已知基因序列中截取多个基因序列,得到第一基因序列的过程,包括:
从所述已知基因序列中目标染色体的任意位置截取多个基因序列,得到所述第一基因序列。
3.根据权利要求2所述的测试方法,其特征在于,所述从所述已知基因序列中目标染色体的任意位置截取多个基因序列,得到所述第一基因序列的过程,包括:
从所述已知基因序列中所述目标染色体的任意位置截取长度相等或长度不等的多个基因序列,得到所述第一基因序列。
4.根据权利要求1所述的测试方法,其特征在于,所述在所述第二基因序列中植入变异点,得到第三基因序列的过程,包括:
在所述第二基因序列中插入碱基对和/或删除碱基对和/或变异碱基对,得到所述第三基因序列。
5.一种基因比对软件的测试装置,其特征在于,包括:
基因截取模块,用于从已知基因序列中截取多个基因序列,得到第一基因序列;
基因选取模块,用于在所述第一基因序列中选取预设数量的基因序列,得到第二基因序列;
变异点植入模块,用于在所述第二基因序列中植入变异点,得到第三基因序列;
文件构建模块,用于利用所述第三基因序列和第四基因序列构建目标fastQ文件;其中,所述第四基因序列为所述第一基因序列中除去所述第二基因序列之外的基因序列;
结果验证模块,用于将所述目标fastQ文件输入至待测基因比对软件,以对所述待测基因比对软件测试结果的准确性进行验证;
所述将所述目标fastQ文件输入至待测基因比对软件,以对所述待测基因比对软件测试结果的准确性进行验证的过程,包括:
将所述目标fastQ文件输入至所述待测基因比对软件,获取所述待测基因比对软件的基因比对结果;
判断所述基因比对结果的输出结果是否为一个;
若否,则继续判断所述基因比对结果中是否存在与所述第一基因序列相一致的基因序列;
若存在,则判定所述待测基因比对软件的测试结果为正确;
当判定所述基因比对结果的输出结果为一个的过程之后,还包括:
判断输入至所述待测基因比对软件的目标基因序列是否含有变异点;其中,所述目标基因序列为所述目标fastQ文件中的任意一个基因序列;
若是,则继续判断所述基因比对结果是否能够正确识别出所述目标基因序列中的变异点;
若否,则继续判断所述目标基因序列是否与所述第四基因序列相一致;
若能够识别出所述目标基因序列中的变异点,则执行所述判定所述待测基因比对软件的测试结果为正确的步骤;
若所述目标基因序列与所述第四基因序列相一致,则执行所述判定所述待测基因比对软件的测试结果为正确的步骤。
6.一种基因比对软件的测试设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至4任一项所述的一种基因比对软件的测试方法的步骤。
7.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至4任一项所述的一种基因比对软件的测试方法的步骤。
CN201911089914.9A 2019-11-08 2019-11-08 一种基因比对软件的测试方法、装置、设备及介质 Active CN110879782B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911089914.9A CN110879782B (zh) 2019-11-08 2019-11-08 一种基因比对软件的测试方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911089914.9A CN110879782B (zh) 2019-11-08 2019-11-08 一种基因比对软件的测试方法、装置、设备及介质

Publications (2)

Publication Number Publication Date
CN110879782A CN110879782A (zh) 2020-03-13
CN110879782B true CN110879782B (zh) 2022-06-17

Family

ID=69729310

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911089914.9A Active CN110879782B (zh) 2019-11-08 2019-11-08 一种基因比对软件的测试方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN110879782B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105302719A (zh) * 2015-10-26 2016-02-03 北京科技大学 一种变异测试方法及装置
CN107480466A (zh) * 2017-07-06 2017-12-15 北京荣之联科技股份有限公司 基因组数据存储方法及电子设备
CN107844684A (zh) * 2016-09-18 2018-03-27 深圳华大基因研究院 基因序列比对方法和装置
CN110265086A (zh) * 2019-07-04 2019-09-20 北京肿瘤医院(北京大学肿瘤医院) 一种基因检测方法和装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1495419A2 (en) * 2002-04-01 2005-01-12 Phase-1 Molecular Toxicology Inc. Liver necrosis predictive genes

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105302719A (zh) * 2015-10-26 2016-02-03 北京科技大学 一种变异测试方法及装置
CN107844684A (zh) * 2016-09-18 2018-03-27 深圳华大基因研究院 基因序列比对方法和装置
CN107480466A (zh) * 2017-07-06 2017-12-15 北京荣之联科技股份有限公司 基因组数据存储方法及电子设备
CN110265086A (zh) * 2019-07-04 2019-09-20 北京肿瘤医院(北京大学肿瘤医院) 一种基因检测方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于软件基因的Android恶意软件检测与分类;韩金等;《计算机应用研究》;20180408(第06期);全文 *

Also Published As

Publication number Publication date
CN110879782A (zh) 2020-03-13

Similar Documents

Publication Publication Date Title
Edgar UCHIME2: improved chimera prediction for amplicon sequencing
CN109062809B (zh) 一种线上测试用例生成方法、装置及电子设备
CN110413506A (zh) 测试用例推荐方法、装置、设备及存储介质
CN109542761B (zh) 软件质量评估方法、装置及存储介质
CN111177005A (zh) 业务应用的测试方法、装置、服务器和存储介质
US11721229B2 (en) Question correction method, device, electronic equipment and storage medium for oral calculation questions
WO2021051872A1 (zh) 实体识别方法、装置、设备及计算机可读存储介质
CN108733555A (zh) 一种应用测试方法及装置
Kann et al. Optimization of a new score function for the detection of remote homologs
CN108664593A (zh) 数据一致性校验方法、装置、存储介质及电子设备
CN110879782B (zh) 一种基因比对软件的测试方法、装置、设备及介质
US20150309982A1 (en) Grammatical error correcting system and grammatical error correcting method using the same
CN113312258A (zh) 一种接口测试方法、装置、设备及存储介质
CN110888809B (zh) 一种测试任务的风险预测方法及装置
CN111179670B (zh) 物理电学实验结果的量化方法、装置、终端和存储介质
CN107402883B (zh) 一种数据测试处理方法和装置
CN110716859A (zh) 自动为修改的代码推送测试用例的方法及相关装置
CN106599312B (zh) 知识库的检验方法、装置及终端
KR20160118845A (ko) 사용자 학습 등급에 따라 단어 학습 내용을 제공하는 방법과 시스템 및 기록 매체
CN109145609A (zh) 一种数据处理方法和装置
CN112613263B (zh) 仿真验证方法、装置、电子设备和计算机可读存储介质
KR102138166B1 (ko) 인공지능 기반 게놈 빅데이터를 이용한 자기개선 유전자 검사 서비스 제공 방법
KR20100098277A (ko) 단어 실력 검지 방법
US20130332225A1 (en) Risk-profile generation device
CN114155412A (zh) 深度学习模型迭代方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant