凌云时刻
近日,达摩院发布全球最大规模的
中文文本预训练语言模型——PLUG
PLUG的参数规模达270亿
它集语言理解与生成能力于一身
在小说创作、诗歌生成、
智能问答等领域表现突出
还以80.614分刷新了CLUE分类榜单纪录
排名仅次于“人类”组
原文(上)
黛玉只就宝玉手中看了一看,便问道:“还是单送我一人的,还是别的姑娘们都有呢周瑞家的道:“各位都有了,这两支是姑娘的了。”
AI续写(下)
黛玉却想道:“我如今是个孤女,他们送的那些东西,还有什么可看的。”因此自己心下不乐,只是独自一个人在那里摆弄那些物事。
原文(下)
黛玉再看了一看,冷笑道:“我就知道,别人不挑剩下的,也不给我。替我道谢罢!”周瑞家的听了,一声儿不言语。
《水浒传》仿写
原文(上)
孔乙己一到店,所有喝酒的人便都看着他笑,有的叫道,“孔乙己,你脸上又添上新伤疤了!”他不回答,对柜里说,“温两碗酒,要一碟茴香豆。”便排出九文大钱。他们又故意的高声嚷道,“你一定又偷了人家的东西了!”
AI续写(下)
孔乙己也不回答,也不管他们的笑骂。有几个看他不顺眼的,故意叫道,“孔乙己,你又不是小偷,你不至于上当的。我们这儿的人,可从来不把偷字挂着,你又何必怕人家笑你!”其余的人哈哈的大笑。但孔乙己只是吃喝自如,不言不动。
原文(下)
孔乙己睁大眼睛说,“你怎么这样凭空污人清白……”“什么清白前天亲眼见你偷了何家的书,吊着打。”孔乙己便涨红了脸,额上的青筋条条绽出,争辩道,“窃书不能算偷……窃书!……读书人的事,能算偷么
《背影》仿写
原来,PLUG集成了达摩院自研的语言理解及语言生成双模型,并通过构建输入文本双向理解能力显著提升输出文本的相关性。
PLUG采用了1TB以上中文文本训练数据,涵盖新闻、小说、诗歌、问答等领域。未来,PLUG还将扩大参数规模至2000亿级,进一步提升文本生成质量。
文学创作,只是PLUG的能力之一。之后它有望广泛应用于文本生成领域,成为“万能写作神器”。更重要的是,PLUG等超大规模语言模型,对提升中文NLP技术表现有重要作用。
达摩院语言技术实验室负责人司罗表示:
“将进一步攻克自然语言处理领域科研难题,完善中文及跨语言人工智能基础设施,让AI没有难懂的语言,探索通用人工智能之路。”
END
长按扫描二维码关注凌云时刻
每日收获前沿技术与科技洞见
投稿及合作请联系邮箱:lingyunshike@163.com
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!