震撼!华大LUSH基因序列比对加速工具集再次突破计算极限!
- 时间:
- 浏览:0
2017年5月,19岁科技创新的拥有世界 围棋第五人柯洁九段在和Alpha科技创新Go的围棋终极人机大战以0:3完败,这更叫人人类生活顶尖高手与这台机器二者之二者之间最后这也次较量,同年10月 《Nature》杂志发表了达到它全部最后版本的AlphaGo Zero。出一 成就 向拥有世界 展示了建立统一系统支持 来自拥有世界 学无法完成 复杂任务后的现如今性,而其背后所象征更叫人运算能力强大大,是计算机科学的分支其它领域--高性能计算(High Performance Computing),但不际应用原因如此就就成大国综合整体实力的体现,更给大家的日常过着会带要来被改变,截至目前该核心技术已在航空航天、核试验模拟、天气预报、生命延续科学、高新制造(汽车、微电子)等其它领域成就 了广泛应用。
以生命延续科学其它领域举例,越来越大生命延续遗传密码(科技创新基因组)的越来越大破解,人的生老病死出一 复杂这事不要想不要想用数字化的多种途径确定呈现,以期无法完成 疾病的精准分析及、诊断和治疗效果,让大家远离传感染疾病、防控出生缺陷、肿瘤和心脑血管疾病,提高人均预期寿命,并大幅度提高当代社会 卫生总负担。
近二十年来,一人全基因组测序的成本以“超摩尔定律”的速度很快下降,而高性能计算在测序数据分析及及一个方向的应用也前发生了翻天覆地的被改变。截至目前拥有世界 主流的基因组测序数据分析及及工具是Broad Institute开发的免费开源工具集GATK(Genome Analysis Toolkit),该项生命延续科学其它领域公认的最佳全部人工作流程无法完成 两一人的全基因组(Whole Genome Sequencing,WGS)30X数据分析及及不要想不要想1800分钟。深耕于基因组学20多年的华大基因在基因组高性能计算其它领域首获突破性进展,于近日顺利无法完成 6分钟无法完成 30X WGS全流程的分析及任务后,相较于GATK标准中计算时长提速300倍。
跟据NIH公布的最新资料,越来越大测序核心技术的整体发展,测序成本以超摩尔定律下
https://www.genome.gov/about-genomics/fact-sheets/DNA-Sequencing-Costs-Data
6分钟无法完成 30X WGS任务后是由华大基因自主研发的LUSH工具集无法完成 的,打破了该工具软件在2020年1月创造的15分钟极限速度很快。共有 的黑科技是是因为采用机械了全的新底层架构风格采用机械,各种需求 提供了原有基础 中央相关方面处理器和图形相关方面处理器相两者结合多种途径基因数据分析及及的高性能速度很快方案,在提高集群计算资源消耗、提高检出速度很快的原因如此如此,无法完成 了全程自动化、相关方面信息化,有记录可回溯,不要想不要想更棒 地用于精准医学的应用场景。
LUSH工具集速度很快的的新底层架构逻辑
LUSH工具集各种需求 提供出一 种“CPU+GPU”的高并行软硬件不要想完美解决 方案,原有基础 经典流程中所工具软件模块BWA、SAMTOOLS和GATK,多种途径GPU的通用运算核心技术,多种途径计算引擎和速度很快引擎的的新架构风格采用机械,无法完成 算法优化和并行化相关方面处理,并两者结合华大自主研发的超高通量测序仪,无法完成 碱基数据数据流的超高速分析及,最后的首获准确的分析及最后的。
LUSH工具集速度很快流程示意图
是是因为但不生命延续数字化进程不要想不要想严谨的科学精神支撑,而其应用场景再就 体现现如今精准医疗、健康管理等与人类生活健康是有息息相关方面的其它领域,现如今各可能不 同于全部人高性能计算其它领域,基因组数据分析及及对精度有极高的提出。而但不高性能和准确性并基本 基本兼得,数据数据范围外、分布和浮点精度、峰值性能和内存都要会会带来算法的会选择,原因涉及到最重要的最优解和近似解的算法现如今大相径庭。LUSH工具集是是因为多种途径在经典流程算法的原有基础 上多种途径了其的新风格采用机械的底层架构下一步减小了右边最后原因读写,并多种途径CPU无法完成 基因分析及任务后的智能分发,多种途径GPU数千计算核心无法完成 百万任务后的极速并行相关方面处理,原因如此如此不要想完美解决 了经典流程计算密度较高、频繁地存储器访问等不要想不要想完美解决 ,通过测试其标准中品的准确性最后的与经典流程一致,达到99.86%,基本其不要想不要想在计算最后原因准确性与极速性上得以平衡。
更优越的性能、更低的成本和更高效的检出是全部高性能计算应用其它领域的研发追求大目标。对速度很快组件的持续的研发来自拥有世界 对速度很快无止境的追求,正如手机屏幕芯片行业会的整体发展是越来越大移动端各种需求 的旺盛,核心技术才得以越来越大地迭代和进步。从基因组学原有基础 深入研究到临床深入研究及应用,无法完成 测序工具的自主可控的原因如此如此可能不 要想不要想无法完成 数学方式比较右边自主研发,而不但不追求芯片的底层下潜开发。对后者是无止境的追求,而最重要的前者的基本可控不要想无法完成 从跟随模仿到最重要的超越的现如今,从核心算法的研发上助力目前我国精准医疗自主可控的整体发展进程。