概述
3)失误无法避免,会带来巨大风险点。
4)可能涉及到各类扫描件、证照等,难以至于获取信息。
二、构建智能合同审阅系统改变传统工作方式
1. 合同附件OCR识别
对于扫描件或者照片等格式的附件我们需要利用OCR技术将其转化成电子文本,在这里我们可以直接使用一些第三方的OCR能力(例如阿里云、百度、腾讯优图等),我们可以根据具体的样本或者文本需要选择不同的OCR服务。当然并非所有的OCR需求均可以使用通用能力完成,部门特殊样本或证照的识别可能需要根据具体需求及样本进行模型。
阿里读光
2. 合同信息智能抽取
我们可以基于规则+模型结合的方式实现问文本信息智能抽取。对于合同模板十分固定或者上下文明确的合同模板,我们可以直接通过规则提取:对于并非十分固定的合同模板我们则需要利用NLP的一些算法训练抽取模型。
(1)模型提取
利用NLP技术中的分词、命名实体识别等技术直接抽取合同中涉及到甲方、乙方、地名、金额、标的物、实体信息。但是对于一些比较特殊的实体,比如具体的标的物、付款方式、违约条款等我们需要根据实际需求进行数据标注及模型训练。开始中文档上传输出熟机质核规则制定模型训验化模型.
(2)规则提取
可以通过正则表达式或者通过系统前段实现一些文本锚点配置工具,便于使用者快速的进行提取。
(3)基于位置信息的模板抽
比如金额、利息、合同标的物、付款方式等是否满足企业的法务、财务等规定。
(4)文档智能纠错
自动纠正合同中的文字错误及与语法错误,目前我们常见的各类输入法以及文本办公软件都具有文本纠错功能或服务,但是其大多是针对通用场景,如果我们需要其针对某一特殊领域的合同进行智能纠错,还需要根据特定的合同预料进行训练。
(5)版本智能对比
RPA主要指机器人流程自动化,通过模拟人工键盘、鼠标操作实现点击、输入、复制、粘贴等操作。通过预设固定规则及流程,可以协助人工完成大量固定及重复性较高的工作。
在合同等文档进行审阅的过程中,可能存在巨大数量的合同进行审阅,及时利用A技术也需要耗费极大的人力成本。
前国外比较知名PRA服务上例如Uipath、Automation Anywhere等,国内则有云扩、来也、弘玑等。
未来展望
题图来自 Unsplash,基于 CC0 协议
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!