中国科大江俊团队|集成化学合成、表征与测试全流程的机器化学家

集成化学合成、表征与测试全流程的机器化学家

■ 肖恒宇, 张飞, 朱青, 赵路远, 张旭春, 宋涛, 汤新胜, 李想, 何果, 崇宝辰, 周俊亦, 张百成, 曹嘉祺, 罗蔓, 叶桂林, 张皖军, 陈忻, 尚伟伟, 江俊, 罗毅

1

引言

化学研究的对象日益复杂化、高维化, 给科学研究带来挑战. 现行的主流研究范式依赖于试错和变量降维等降低复杂度的传统手段, 其局限性和低效问题日益严重(图1). 人工智能擅长从高维度、高复杂度的数据中探索关联性, 带来了数据驱动的新范式. 借助人工智能, 人们已初步实现了蛋白质结构的机器学习预测和机器人自动化学合成. 开发智能的机器化学家, 将极大地释放化学学科的研究潜能.

图1实际应用的复杂性需要借力机器智能

近年来, 数据驱动的研究范式快速发展. 2018年, 上海大学Waller等[1]利用神经 络指导的蒙特卡罗树搜索算法, 规划得到的合成路径已能够有效帮助化学家的设计. 2019年, 伊利诺伊大学厄巴纳-香槟分校Denmark团队[2]采用向量机和深度神经 络准确地预测了高选择性手性催化剂. 2020年, 波兰科学院有机所和韩国蔚山国立科学技术研究所的Grzybowski等[3]利用数据驱动的人工智能方法成功预测并验证了复杂天然产物的合成方法.

数据驱动的研究范式离不开实验数据的支撑, 而其预测结果的有效性也依赖实验的验证. 智能化、自动化的实验平台因其可重复性、高效性逐渐受到化学研究者的关注. 2018年, 格拉斯哥大学Long和Cronin团队[4]开发了有机合成机器人, 实现了对1000种反应组合的反应性预测. 2019年, Jamison和Jensen等[5]设计开发了机械臂结合模块化设备的有机合成机器人平台, 实现了多种均相/非均相催化反应的合成、分离、优化等自动化流程. 利物浦大学Cooper团队[6]于2020年设计制造了由移动机器人与实验设备组成的机器化学家, 在无人类干预的情况下, 8天进行了688次实验, 将原有催化剂的反应活性提升了6倍.

2

机器化学家平台设计

为构建自动化实验平台, 一个专门的实验室被规划用于运行移动机器人与多个工作站. 如图2所示, 实验室内按照化学工作站功能划分为化学合成区、性能测试区和样品表征区, 共计三个功能区域. 每台工作站均负责该区域对应功能的单元操作, 多台工作站的操作组合形成了完整的工作流. 工作站均被设计成能针对同一型 西林瓶(以下称为标准样品瓶)进行实验操作, 实现了工作流中各个环节的容器的共享和流通. 一台机器人由移动平台和六轴柔性机械臂组成, 可在所有功能区域中移动并操作所有设备. 一款调度系统软件负责实时协调机器人与实验设备的交互操作, 并统管机器人和各个工作站设备之间的通讯. 所有通讯均基于TCP/IP通讯协议制定. 在实验过程中, 实验设备和机器人均会实时反馈其状态数据. 工作流结束后, 合成区域设备向服务器反馈原料与操作数据, 性能测试区域设备反馈测试数据文件, 表征区域设备反馈表征结果数据. 服务器收集整理实验数据, 进行分析并产生绘图数据.

图2机器化学家平台模块设计

实验室内机器人和工作站作为一个整体系统, 接收数字化的实验方案文件和开始实验的指令后, 即可自动执行实验方案. 研究人员只需要设计实验方案并启动实验, 即可实时查看实验进度与各硬件状态, 实验结束后, 实验结果可通过界面进行搜索查看. 此外, 实验室内部署了一套监控系统, 研究者可以通过监控画面直观地全局查看实验室状态.

2.1 化学合成区

合成区域负责化学物质的合成. 目前支持固体粉末、溶液原料的精确进样和搅拌等操作. 合成区域中设备包括液体进样工作站、固体进样工作站和磁力搅拌工作站.

液体进样工作站为一台自主研发设备, 由控制芯片(MEGA2560)控制12台蠕动泵(创锐BJ100M/YZ1515X)不同液体的注入功能, 并加装了无线通信模块(ESP8266)支持 络通信协议. 每个泵的输出管路安装在加样头(3D打印制造)的不同位置. 该工作站通过自主搭建的移动平台(使用57HBP76AL4-TFA步进电机为动力源)调节加样位, 配合泵体控制来切换液体加样通道. 加样位下方装有万分位电子天平(力辰科技FA124)以反馈加样质量. PID算法接收实时反馈的质量数据, 从而控制蠕动泵调节加样速度, 使加样精度达到3?mg (图3a).

图3化学合成区工作站. (a) 液体进样工作站; (b) 固体进样工作站; (c) 磁力搅拌工作站

固体进样工作站由商业设备改造而成. 其主体为一台自动进样天平(梅特勒·托利多XPR204/A), 能以1?mg精度将粉末状固体原料加入标准样品瓶. 其防风门被改造为开关可自动控制的配件, 以在保证精度的前提下允许机器人对样品瓶进行放入/取出操作. 制造商提供了基于SOAP协议的 络服务接口. 一款自主开发的通讯软件对固体进样天平进行实时控制, 可完成的操作包括状态检测、称重、加样、设置允许误差等(图3b).

磁力搅拌工作站是一台商业设备(CJB-S智能磁力搅拌器). 其主体为一台磁力搅拌器. 一片限位槽板被放置在搅拌平台上, 用以限定机器人的放置位置. 该工作站能够对放在其操作平台的多个标准样品瓶进行搅拌操作. 该工作站被改装以自动控制其启动与关闭. 基于改装, 该工作站增加了定时开启、定时关闭、反馈搅拌用时功能, 实现了搅拌时间的毫秒级精确控制(图3c).

自动化合成操作遵循实验方案的指定顺序完成固体/液体进样、搅拌等操作, 获得产物粉末样品, 也可以对现成样品配置反应环境, 如添加溶剂、制样等操作, 以备后续的测试表征工作.

2.2 样品表征区

样品表征区设备用于对样品进行谱学表征, 目前包括紫外光谱工作站和气相色谱工作站.

紫外光谱工作站包括一台商业紫外光谱分析仪(岛津UV-2600i, 日本)、一台改造后的自动进样器(岛津ASC-5)以及一台计算机. 该工作站可自动连续测量紫外光谱. 该工作站搭载了加装无线模块(ESP8266)的自动进样器, 实现了通过 络接受指令, 完全自动化进样. 一款自主研发的软件通过模拟鼠标键盘输入, 控制仪器配套软件完成表征操作. 该软件可以自主获取光谱数据进行初步分析并形成绘图, 传输至工作站服务器中(图4a).

图4样品表征区工作站. (a) 气相色谱工作站; (b) 紫外光谱工作站

气相色谱工作站包括一台商业气相色谱分析仪(岛津GC-2014C)、一台顶空进样器(岛津HS-10)以及一台计算机. 顶空进样器能连续采样20个标准样品瓶, 并送至气相色谱分析仪进行测量. 配套仪器软件自主研发. 该软件基于与紫外光谱工作站软件类似的技术研发, 可对谱学数据进行初步分析, 生成绘图数据, 传输至工作站服务器(图4b).

2.3 性能测试区

性能测试区负责反应产物的检测, 收集其性能指标数据. 目前可支持光催化性能测试. 该区域中设备包括真空封装工作站和光催化工作站.

光催化工作站主体包括光反应池、电源和冷却水箱三个部件. 该工作站可同时对20个标准样品瓶进行光照反应测试. 通过加装无线通讯模块(ESP8266)对该设备进行远程开关控制. 实现了光照反应时间的毫秒级精确控制(图5a).

图5性能测试区工作站. (a) 光催化工作站; (b) 封装工作站

如图5b所示, 封装工作站是一台自主研发的工作站, 用于对装有反应物的样品瓶进行抽真空、补氮气和密封操作. 工作站结构包括振动盘、直线导轨用于瓶盖移动, 密封室用于抽真空和补氮气. 工作站利用自动化工控设备PLC对整体工作流程进行控制. 装有反应物的样品瓶接受封装操作, 之后送至光催化工作进行光照反应.

2.4 移动实验操作机器人

实验操作机器人如图6所示, 采用Clearpath Robotics公司的Ridgeback全向移动平台和Universal Robots公司UR5e机械臂, 搭载Intel RealSense D435i深度相机与大寰公司PGI-140二指夹持器. 基于自主研发的控制系统软件, 机器人实现了全局移动定位误差小于10?mm, 物体抓取误差小于0.1?mm. 控制系统软件基于ROS平台开发, 主要包含定位建图与导航规划、视觉感知与测量、机械臂抓取操作、操作任务管理与决策以及实验任务管理等模块, 系统内部采用UDP通信协议, 与化学实验工作站以及后台控制系统之间采用TCP通信协议.

图6移动实验操作机器人

机器人使用同步定位与建图算法获取自身定位信息与实验室环境地图, 以供导航规划模块使用. 机器人融合HOKUYO双激光雷达点云信息, 能够360°全方位检测周围环境信息, 使用基于图优化的Karto SLAM算法快速构建实验室的二维栅格地图. 此外, 结合所建立的地图, 采用自适应蒙特卡罗定位算法融合全向移动平台的里程计信息, 获取机器人当前的全局位姿. 实验过程中, 结合机器人当前全局位姿与目标工作站位置, 设计两阶段规划方法实现不同实验工作站间的平稳运动: 第一阶段是机器人当前位姿到目标工作站的路径规划, 使机器人能够到达目标工作站进行实验操作; 第二阶段是根据全向移动平台的运动学模型设计S型速度规划, 确保机器人运动的平稳性. 同时, 根据激光雷达点云数据实时检测机器人周边的障碍物信息, 实现自主安全避障.

机器人的深度相机包含左右两个成像器、一个IR(红外)投影仪和一个RGB相机模块, 深度信息分辨率为1280×720, RGB相机分辨率为1920×1080. 考虑到实验操作中对夹持器的定位精度要求较高, 这里采用ArUco标签[7]构建结构化的实验室场景. 针对图2中包括起始样品架在内的8个工作站, 给每个工作站内仪器设备分配独立ID的ArUco标签, 这8个标签构成一个“字典”. 对相机采集的图像进行二值化、轮廓提取和滤波等处理, 得到候选的正方形标签外轮廓. 将这些轮廓内的局部区域与“字典”进行模板匹配, 获得当前图像上的标签ID, 并由标签轮廓和PnP算法计算标签位姿. 预先标定待操作目标与固定标签之间的相对位姿关系, 机器人在工作过程中通过识别标签位姿就可以检测出待操作目标(包括仪器按键、西林瓶、试管架等)的位姿, 从而完成按下按键、抓取西林瓶、抓取试管架等实验操作.

2.5 机器化学家软件系统

人类利用自然语言书写的实验方案, 可进行数字化操作, 传输到机器化学家实验平台得以执行. 针对研究目标, 机器化学家平台中构建了一套自然语言理解(NLP)模型. 采用成熟的数据库检索技术获得大量文献专利, 机器人调用已有的自然语言处理算法和化学命名实体的手段对其进行统一处理. 最后基于统计分析的结果, 生成推荐的实验方案, 在未来将借助人工智能开发实验方案推荐算法. 如图7所示, 基于语法规则、领域词典和机器学习技术, 建立了科学文本数据挖掘系统. 该系统基于科学文本, 执行定位重要区域、抽取科学实体、进行语法分析、挖掘实体关系、实现指代消解和纠错矫正等操作, 最终将文献专利等科学文本转化为结构化的数据库, 为实验方案的智能推荐构筑数据基础.

图7科学领域自然语言的数据挖掘流程

机器人的操作系统与工作站服务器调度系统存在差异, 实验方案分为两份, 由两个模块分别独立执行. 本平台中, 实验方案被算法整理为两份xml格式文件, 并分别由机器人系统和工作站系统进行解析和执行.

机器人接受到的xml文件中包含了一系列任务节点, 节点规定机器人在该任务中需要将携带的样品瓶从节点指定的工作站, 转移至节点指定的工作站, 以及此任务在工作流中的应被执行的次序(节点). 实验中, 机器人依次完成任务, 而无需关注工作站中所用的实验参数.

工作站服务器接受到的xml文件中同样包含一系列节点, 节点指定了该任务中需要被启用进行实验操作的工作站(节点), 以及该工作站用到的实验参数(节点)和实验原料(节点). 实验参数信息包含了工作站的运行参数, 如搅拌时长、光照时长等, 而实验原料对应了实验室中的物料通道. 二者组合, 实现了对实验参数的数字化管理. 实验中, 工作站无需关注实验进度与工作流顺序, 只需保证各单元操作准确无误.

由此可见, 工作站与机器人需要交替完成实验操作, 以推进实验进程. 因此, 一套自定义通讯协议被制定出来, 用于协调机器人与工作站进行实验. 在各个节点中, 规定了节点和节点, 其内容为一串字符. 当机器人执行某一任务结束, 发送该任务节点中值到工作站服务器, 工作站服务器查询该值对应的工作站任务, 并启动该工作站, 按既定参数进行实验操作. 操作结束后, 机器人取走样品瓶, 并将值发送给工作站服务器, 以通知该工作站内无滞留样品瓶. 多次循环上述操作, 便实现了机器人与工作站的协调实验工作(图8).

图8工作站(左)与机器人(右) xml文件中的协调节点(红色节点为对应关系, 绿色节点为独立信息)

实验结束后, 工作站反馈实验数据至工作站管理系统. 系统软件统一收集整理数据并进行初步分析. 基于谱学表征和性能测试的数据生成自定义的绘图数据文件, 并传输至用户界面进行图表显示. 此外, 软件也能对性能测试数据进行初步计算, 得到性能指标值.

3

机器化学家的应用

机器化学家平台包含一套完善的用户交互界面. 研究者可以通过界面设计并启动实验方案, 监控实验流程以及获取实验结果. 此外, 用户界面也整合了实验设备、原料和监控设备的管理功能.

如图9所示, 研究人员可操作用户界面, 进行拖拽和连接工作站模块的操纵, 绘制直观的实验流程图. 点击实验流程图中的工作站, 可对加样原料、搅拌时长、光照时长等实验参数进行设置. 所有设置完成后, 可以将流程图保存为模板供下次调取.

图9机器化学家平台实验流程设计页面

在用户界面处点击“开始实验”, 流程图将被转换为两份xml文件, 分别交给机器人与工作站系统执行. 实验结束后, 机器人将实验样品放回样品架以待回收. 工作站服务器收集整理各个实验设备的数据, 按一定标准生成绘图数据供用户界面解析并绘制. 实验的流程配置信息合数据结果信息被存储在数据库中统一管理和查看.

在重复性测试中, 机器化学家进行了连续3天的光催化实验流程. 机器化学家使用固体和液体进样站, 依次添加0.1?g商业MoO3粉末, 15?mL浓度为4?mol/L的盐酸溶液, 搅拌分散后, 再次使用固体进样站, 依次添加金属铜Cu粉末0, 0.01?g和0.1?g, 用于金属-酸溶液原位联合处理方法实现在温和条件下的半导体MoO3材料的可控加氢, 即实现了“半导体→半金属→准金属”的可控拓扑相变, 从而大幅提升材料中的自由电子浓度, 赋予材料优异的光催化活性.

上述反应原料在连续搅拌8?h后, 使用离心工作站进行固液分离, 随后机器人将反应瓶放回液体进样站, 依次添加5?mL牺牲剂三乙醇胺(TEOA) (20 vol%)和5?mL光敏剂曙红Y (Eosin-Y, 1.2?mmol/L), 随后转移至真空封装工作站, 把反应器内的空气抽干后, 补充惰性保护气氛氩气. 封装好的反应器被机器实验员放入光催化工作站进行模拟太阳光谱的照射, 在照射1?h后, 取出放入气相色谱顶空进样站, 导入预先写好的测试方法文件, 进行产物中氢气H2含量的分析测试.

合成得到的3种不同属性的催化剂材料如图10a所示, 其外观随着掺氢量的增加呈现出透明(宽能带带隙)、蓝色(窄带隙)、黑色(无带隙)的变化. 图10b中的可见光吸收光谱也表明吸光能力随着氢的增加而大幅度提升, 表明其属性发生了从半导体→半金属→准金属的转变. 对应的光解水体系产H2性能依次为4.1、11.9和23.4?μL, 证实了氢化处理半导体材料可以提升材料的光催化性能. 机器化学家对上述实验结果进行了连续3天共计9组实验的重复测试, 证实系统的相对标准偏差(relative standard deviation, RSD)小于5% (图10c).

图10光催化性能与重复性测试. (a) 机械臂操作样品实验组一、实验组二和实验组三(从左到右). (b) 样品的紫外-可见吸收谱图. (c) 实验结果误差棒图

4

总结与展望

本系统实现了基于移动机器人, 集成合成、表征、测试的全化学流程操作的机器化学家. 通过调整7个工作站的流程组合和实验参数配置, 机器化学家系统能够实现复杂的实验方案, 如常见的无机催化剂合成工作. 该系统连接标准化的科学数据库, 可自动阅读文献生成实验方案推荐, 配备易于使用的用户交互界面. 系统制定了不同模块、层级的多个通用标准, 具有极高的拓展性, 提供了多机器人协作、多实验并行以及多种类实验的基础平台. 在高通量的化学实验中, 机器化学家能够精确高效地执行指定的实验参数, 并准确无误地收集实验结果数据, 节省人类研究者的大量精力. 同时能灵活组合出复杂的实验方案, 适用于多种化学研究工作(表1).

表1机器化学家系统特性表

实验能达到的复杂度取决于工作站的种类数量和精度. 工作站种类越多, 功能越全面, 精度越高, 能实现的实验越复杂, 可探究的化学搜索空间则越广阔. 目前的系统实现了化学工作站的统一标准接口规范, 新的实验仪器设备经过改装即可纳入实验体系. 在未来的研究中, 更多的智能化学工作站将被引入. 尤其是引入各类自动化表征工作站, 如XRD工作站、拉曼光谱工作站、红外光谱工作站等. 这将极大地提升机器人支持的实验复杂度. 机器人也将能够完成更高复杂度的实验, 对多个维度、多种参数的实验进行精确高效的处理. 而这一系列的工作往往会消耗人类实验人员的大量精力. 实验迭代次数越多, 实验方案越复杂, 机器人在效率和高精准重复性上的优势就会越明显. 同时机器人的实验方案可被切分为各个工作站的任务, 能够进行模块化管理规划, 以实现对高复杂度任务的精细操作.

未来成熟的机器化学家产品将拥有稳定的软硬件架构与大型物料库, 能支持高通量的化学实验工作. 目前的样机系统距离商业化还存在一些问题. 首先, 多个设备的实时交互通信是机器人系统协同作业的基础, 成熟的通信系统需要考虑应对各种突发状况, 如 络断线、设备故障、实验室停电等. 其次, 工作站中的实验原料种类和储量均有限, 是制约高通量实验的瓶颈. 商业化的原料供给系统应当在充分的安全保障下, 建立大型物料库, 自动供给工作站所需的化学品. 这类系统具备广阔的市场前景, 可打造为标准化、通用化的标准产品, 进行产业化推广, 在智能化学教育产业、化工产业、新材料产业中起到重要作用.

基于信息化、自动化、可扩展的机器化学家平台, 结合高速发展的人工智能与大数据技术, 能够建立实验、理论、模拟之间的闭环反馈, 推动数据驱动的化学研究范式发展. 具有智慧“大脑”的机器化学家, 将能够在循环迭代中不断学习、实践, 从而进化成为有着“科研智慧”的机器科学家乃至智慧化学实验室(图11), 解放人类创造力并助力精准调控, 赋能合成机器人自适应优化、功能材料逆向设计、生物医学精准控制等重要化学研究领域.

图11基于机器化学家的智能化学实验室

【参考文献】

[1] Segler MHS, Preuss M, Waller MP. Nature, 2018, 555: 604 -610

[2] Zahrt AF, Henle JJ, Rose BT, Wang Y, Darrow WT, Denmark SE. Science, 2019, 363: aau5631

[3] Mikulak-Klucznik B, Go??biowska P, Bayly AA, Popik O, Klucznik T, Szymku? S, Gajewska EP, Dittwald P, Staszewska-Krajewska O, Beker W, Badowski T, Scheidt KA, Molga K, Mlynarski J, Mrksich M, Grzybowski BA. Nature, 2020, 588: 83 -88

[4] Granda JM, Donina L, Dragone V, Long DL, Cronin L. Nature, 2018, 559: 377 -381

[5] Coley CW, Thomas Iii DA, Lummiss JAM, Jaworski JN, Breen CP, Schultz V, Hart T, Fishman JS, Rogers L, Gao H, Hicklin RW, Plehiers PP, Byington J, Piotti JS, Green WH, Hart AJ, Jamison TF, Jensen KF. Science, 2019, 365: aax1566

[6] Burger B, Maffettone PM, Gusev VV, Aitchison CM, Bai Y, Wang X, Li X, Alston BM, Li B, Clowes R, Rankin N, Harris B, Sprick RS, Cooper AI. Nature, 2020, 583: 237 -241

[7] Garrido-Jurado S, Mu?oz-Salinas R, Madrid-Cuevas FJ, Marín-Jiménez MJ. Pattern Recognition, 2014, 47: 2280 -2292

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2022年9月11日
下一篇 2022年9月11日

相关推荐