庚子机器学习专用服务器＋教学

近几年机器学习在计算化学，计算材料学方面的应用突飞猛进是有目共睹。庚子计算最近也推出GPU机器学习专用服务器，专为深度势能函数训练而生，并且提供一系列的软件安装和使用指导。需要云服务的同学可以选择DP官方的平台。

机器主推配置

CPU:Intel 铂金48核2.5GHz

GPU:4卡RTX3080/RTX3080Ti/RTX3090

内存：192GB到1TB

硬盘:按需选配

机器主推软件

CPU版本用户指定程序

GPU版本DeePMD-kit，DP-GEN等

GPU版本Lammps，Gromacs等

GPU版本VASP，QE等

注：商业软件需要用户提供安装包和版权安装

软件指导

这款CPU+GPU版服务器，专门为了机器学习势能函数训练而生。熟悉DP软件的朋友都知道训练势能函数，要进行多步骤的复杂的计算。

00.train步骤训练4卡GPU训练4个势能函数。

01.model_devi步骤GPU跑lmp轨迹。

02.fp步骤CPU计算DFT单点能。

庚子计算会给每个用户配置好出厂软件，并且提供计算案例的param.json，machine.json等文件，并且设计好GPU+CPU队列系统，专门为了势能函数训练配置一套完美的并行方案。并且与DP官方举办训练营，邀请用户参与训练营。

常见问题

问：为什么用4张GPU？

答：因为4张卡是最适合DP-GEN训练的配置，在train步需要同时训练4个势能函数，是效率最高的配置方式。如果预算不足，用2张或1张卡也是完全可以的。

问：为什么用单精度卡，不用A100，V100等专业卡？

答：机器学习训练势能函数单精度就足够了，诸如RTX3080Ti和RTX3090的单精度卡速度几乎和顶级A100一样，价格却只有A100的20%，模拟计算结果也一样。机器学习用双精度卡血亏。

问：GPU卡可以并行吗？

答：双精度专业卡可以加NVLink & NVSwitch，单精度卡里只有RTX3090可以通过加装NVLink实现两两并行。实测训练或MD并行效果其实比单卡提升并不大。

问：GPU卡计算VASP会比CPU快吗？

答：同价位比较，CPU快。

看比较对象是什么？Nvidia官上有极具误导性的对比图，Nvidia为了卖卡，用十几万的GPU(4卡P100)和一千元的CPU(2698v3)比，当然GPU快。

实际把同价位的顶级配置比较RTX3080Tiv.s.8375C。用最新VASP6.3.0 OpenACC编译。CPU速度还是比GPU快一倍，用老版本的VASP，GPU速度更慢。

问：GPU卡计算Lammps，Gromacs会比CPU快吗？

答：同价位比较，GPU快。这个是没有争议的，很多人都对比过。

问：GPU卡训练DeePMD-kit会比CPU快吗？

答：同价位比较，GPU快。这个也是没有争议的，很多人都对比过。

问：我没有基础可以用吗？

答：任何人都是从零基础成长起来的。机器学习要求使用者掌握第一性原理+MD+DP 多种软件组合。我们给每位购买服务器的用户赠送学习课程，帮助大家一起快速成长。

声明：本站部分文章及图片源自用户投稿，如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢！