近几年机器学习在计算化学,计算材料学方面的应用突飞猛进是有目共睹。庚子计算最近也推出GPU机器学习专用服务器,专为深度势能函数训练而生,并且提供一系列的软件安装和使用指导。需要云服务的同学可以选择DP官方的平台。
机器主推配置
CPU:Intel 铂金48核2.5GHz
GPU:4卡RTX3080/RTX3080Ti/RTX3090
内存:192GB到1TB
硬盘:按需选配
机器主推软件
CPU版本用户指定程序
GPU版本DeePMD-kit,DP-GEN等
GPU版本Lammps,Gromacs等
GPU版本VASP,QE等
注:商业软件需要用户提供安装包和版权安装
软件指导
这款CPU+GPU版服务器,专门为了机器学习势能函数训练而生。熟悉DP软件的朋友都知道训练势能函数,要进行多步骤的复杂的计算。
00.train步骤训练4卡GPU训练4个势能函数。
01.model_devi步骤GPU跑lmp轨迹。
02.fp步骤CPU计算DFT单点能。
庚子计算会给每个用户配置好出厂软件,并且提供计算案例的param.json,machine.json等文件,并且设计好GPU+CPU队列系统,专门为了势能函数训练配置一套完美的并行方案。并且与DP官方举办训练营,邀请用户参与训练营。
常见问题
问:为什么用4张GPU?
答:因为4张卡是最适合DP-GEN训练的配置,在train步需要同时训练4个势能函数,是效率最高的配置方式。如果预算不足,用2张或1张卡也是完全可以的。
问:为什么用单精度卡,不用A100,V100等专业卡?
答:机器学习训练势能函数单精度就足够了,诸如RTX3080Ti和RTX3090的单精度卡速度几乎和顶级A100一样,价格却只有A100的20%,模拟计算结果也一样。机器学习用双精度卡血亏。
问:GPU卡可以并行吗?
答:双精度专业卡可以加NVLink & NVSwitch,单精度卡里只有RTX3090可以通过加装NVLink实现两两并行。实测训练或MD并行效果其实比单卡提升并不大。
问:GPU卡计算VASP会比CPU快吗?
答:同价位比较,CPU快。
看比较对象是什么?Nvidia官 上有极具误导性的对比图,Nvidia为了卖卡,用十几万的GPU(4卡P100)和一千元的CPU(2698v3)比,当然GPU快。
实际把同价位的顶级配置比较RTX3080Tiv.s.8375C。用最新VASP6.3.0 OpenACC编译。CPU速度还是比GPU快一倍,用老版本的VASP,GPU速度更慢。
问:GPU卡计算Lammps,Gromacs会比CPU快吗?
答:同价位比较,GPU快。这个是没有争议的,很多人都对比过。
问:GPU卡训练DeePMD-kit会比CPU快吗?
答:同价位比较,GPU快。这个也是没有争议的,很多人都对比过。
问:我没有基础可以用吗?
答:任何人都是从零基础成长起来的。机器学习要求使用者 掌握第一性原理+MD+DP 多种软件组合。我们给每位购买服务器的用户赠送学习课程,帮助大家一起快速成长。
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!