澜舟科技开源轻量级中文语言预训练模型——孟子模型

每天给你送来NLP技术干货!


来自:澜舟科技

今年七月,澜舟科技推出的孟子模型以十亿参数刷新了此前百亿、千亿级别参数模型轮番霸榜的中文语言理解权威评测基准 CLUE 榜单。为了促进自然语言处理技术在更广泛实际场景中的应用,澜舟科技近日开源了轻量级中文预训练语言模型——孟子模型。孟子模型基于轻量级、高效训练研究路线,有利于快速、低成本地落地现实业务场景。

轻量级孟子模型

近年来,预训练模型(PLM)的热度逐年升高,其发展极大提升了 NLP 任务的性能,促进了 NLP 技术向更实际的应用场景发展。而如今预训练模型有向更大模型、更多数据发展的趋势,同时也意味着它的时间成本和资源成本更加高昂。这制约了 NLP 应用于更广泛的实际场景。在实际的业务场景中,受硬件、软件、人力等方面的成本制约,十亿乃至百亿的模型在软硬件成本、研发周期等问题上是很难接受的。因此,我们迫切需要一个规模适中但功能同样强大的模型。

孟子有云:“以力服人者,非心服也,力不赡也”;“权,然后知轻重;度,然后知长短”。这两句话恰好体现了 NLP、AI 技术广泛使用带来的认知智能从“相关”到“认知”的转变。基于语言学信息融入和训练加速等方法,澜舟科技研发了孟子系列模型。由于与 BERT 保持一致的模型结构,孟子模型可以快速替换现有的预训练模型。基于孟子通用模型,澜舟科技本次共开源了四个模型,分别适用于不同的任务场景。

金融领域任务

与相同规模甚至更大规模的模型相比,孟子模型表现出了显著的性能提升。由于与 BERT 保持一致的模型结构,孟子模型可以被视为现有 PLM 强有力的替换方案。


投稿或交流学习,备注:昵称-学校(公司)-方向,进入DL&NLP交流群。

方向有很多:机器学习、深度学习,python,情感分析、意见挖掘、句法分析、机器翻译、人机对话、知识图谱、语音识别等。

cf3c854ea070b36b259ac9e6003518fc.png

记得备注呦

文章知识点与官方知识档案匹配,可进一步学习相关知识OpenCV技能树首页概览11605 人正在系统学习中

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2021年9月15日
下一篇 2021年9月15日

相关推荐