如何在本地资源有限的情况下,提高虚拟筛选规模和质量,把漫长的药物研发周期缩短一点/strong>
我们用实证给你一个答案。
与前两次实证不同,本次生信实证有两大特点:
1. 任务数量多,云上同一地区某种类型机型可能不足,因此会涉及到多区域资源调度;
2. 可根据用户偏好匹配合适的资源调度策略,满足用户不同需求。
实证背景信息
某大型药企在本地建设有机房,计算资源总计为104核。
使用AutoDock Vina进行小分子对接:
当设定exhaustiveness=8时,筛选56643个原始分子共需90小时;
当设定exhaustiveness=1时,耗时需18小时。
研发负责人认为这么长的时间周期是无法接受的,其本地现有IT架构和资源完全无法满足研发需求。
实证目标
1、AutoDock Vina任务能否在云端有效运行/strong>
2、fastone平台能否大幅度缩短任务运行时间/strong>
3、fastone平台能否有效控制任务运行成本/strong>
4、针对AutoDock Vina任务小,数量大的特点,fastone平台是否有针对性策略/strong>
实证参数
平台:
fastone企业版产品
应用:
AutoDock Vina
适用场景:
分子对接,研究配体(药物分子)与其受体(已知的靶蛋白或活性位点)之间的详细相互作用,预测其结合模式及亲合力,还可以用来发现并优化药物先导物分子,进而实现基于结构的药物设计
云端硬件配置:
AutoDock Vina在运行时需要对接海量分子,对计算性能要求较高,因此平台为用户推荐选择了匹配其应用特点的计算优化型实例机型。
技术架构图:
实证过程:
1、云端调度36核计算资源对接10000分子,采用时间优先策略需耗时527分钟;
2、云端调度80核计算资源对接10000分子,采用时间优先策略需耗时314分钟;
3、云端调度144核计算资源对接10000分子,采用时间优先策略需耗时215分钟;
4、云端调度288核计算资源对接10000分子,采用时间优先策略需耗时98分钟;
5、云端调度540核计算资源对接10000分子,采用时间优先策略需耗时52分钟;
6、云端调度1080核计算资源对接10000分子,采用时间优先策略需耗时20分钟。
结论二:在云端调度不同核数的计算资源对接10000分子,当用户选择成本优先策略时,fastone平台以SPOT实例为主要资源选择,确保成本为第一优先级。
比时间优先策略,成本降幅最多可达67%-90%。
计算资源越多,运算时间越短。
在满足用户时间要求的前提下,可通过尽可能抢占SPOT实例来帮助用户优化成本。
当所需的计算资源达到十万核这个数量级以后,单个区域内我们的目标类型资源可能会瞬间告罄,造成任务排队,从而大大拖慢运算时间。
我们需要通过fastone平台的Auto-Scale功能自动调度本区域及其他区域的目标类型或相似类型SPOT实例资源,以最快速地完成任务。
OD按需实例价格通常为SPOT实例的3-10倍。
可参考:《云资源中的低成本战斗机——竞价实例,AWS、阿里云等六家云厂商完全用户使用指南》
当便宜且随时可能被抢占中断的SPOT实例遇到迷你却海量的分子对接任务,简直就是天造地设的一对。
1、常规分子对接任务几分钟即可算完,特别适合SPOT这种分分钟可能被抢走的状态;
2、fastone平台具备自动重试功能,一个任务被中断可以自动重新提交,任务之间互相不影响,重新提交单个任务影响很小。
fastone平台会按以下顺序依次进行自动化调度:
1、同一区域目标类型的SPOT实例;
2、同一区域其他类型的SPOT实例;
3、其他区域目标类型的SPOT实例;
4、其他区域其他类型的SPOT实例;
5、同一区域目标类型的OD实例;
6、同一区域其他类型的OD实例;
7、其他区域目标类型的OD实例;
8、其他区域其他类型的OD实例。
更多电子书
欢迎扫码关注小F(ID:imfastone)获取
文章知识点与官方知识档案匹配,可进一步学习相关知识Java技能树首页概览91958 人正在系统学习中
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!