ai多维人工智能:AI首次击败人类法律翻译
ai多维人工智能:AI首次击败人类法律翻译人机对抗环节的赛题之一在人机对抗环节中,经过三份合同条款翻译(中译英)的较量,「秘塔MT」(辅以一位大学生选手修正机翻结果)最终以88.33 vs 79.22的比分战胜「人类精英」队。采访、撰文 | 微胖坦白讲,4月12日之前,我从来没听说过哪家创业公司在做法律翻译AI,直到那天下午在北京大学法学院模拟法庭观摩了中国第一场法律翻译人机对抗赛。第一轮比赛中,清华大学、人民大学以及对外经贸大学,从八所北京顶尖高校(其他几所包括北京大学、外交学院、北京外国语大学、中国政法大学以及北京师范大学)队伍中脱颖而出,获得组成「人类精英」团队、迎战上海秘塔网络科技有限公司(以下简称秘塔科技)推出的法律翻译AI(「秘塔 MT」)的资格。
在查理·芒格口中巨头唯恐避之不及,但他们很喜欢的法律科技创新领域,又多了一家新的AI公司秘塔科技。上周这家成立仅一年的公司推出了两款初步成型的法律AI产品。
其中,法律翻译AI(「秘塔 MT」)最让人意外,在此之前几乎没人听说这类产品。在良好的数据清理、结构化与算法设计的基础上,AI有望彻底变革当前法律翻译市场高收费、低效率的现状。另一款法律搜索产品,则完全在意料之中,毕竟,合同文本处理和搜索工具是目前最为硬核的法律科技创业方向。
不过,这款工具的独特之处不仅在于能够揣摩用户搜索意图,它还将律师经常用到的数据源集中在一个平台上,实现一站式搜索,提升搜索效率。
然而,任何法律科技创新都不可能一步而就,惊艳业界,而需要生态关注与支持。虽举步维艰,所幸的是,律师界正逐步形成一个共识:除了体制与管理改革,人机耦合是否成功也将是律所在未来竞争中胜出的关键因素。
采访、撰文 | 微胖
坦白讲,4月12日之前,我从来没听说过哪家创业公司在做法律翻译AI,直到那天下午在北京大学法学院模拟法庭观摩了中国第一场法律翻译人机对抗赛。
第一轮比赛中,清华大学、人民大学以及对外经贸大学,从八所北京顶尖高校(其他几所包括北京大学、外交学院、北京外国语大学、中国政法大学以及北京师范大学)队伍中脱颖而出,获得组成「人类精英」团队、迎战上海秘塔网络科技有限公司(以下简称秘塔科技)推出的法律翻译AI(「秘塔 MT」)的资格。
在人机对抗环节中,经过三份合同条款翻译(中译英)的较量,「秘塔MT」(辅以一位大学生选手修正机翻结果)最终以88.33 vs 79.22的比分战胜「人类精英」队。
人机对抗环节的赛题之一
你能分辨出哪一个是「秘塔MT」战队的翻译吗?
距离我不远处的北京外国语大学法学院国际法教师赵理智在整个赛程中都显得很兴奋。
「没想到国内的人工智能技术水平已经到了如此水平,」他说道。比赛结果出来后,他更放言人类「要从狼嘴里抢肉」了。
据公司CEO闵可锐介绍,「秘塔 MT」训练用数据包括两大类,通用领域高质量翻译数据和法律领域的数据。
不过,和我们的直觉相反,通用数据体量最大,大约千万级别,而法律特定领域数据仅几万、十万左右。
「90%不是法律领域的数据。」闵可锐告诉我们,「我们在算法上花了一番功夫,使用了迁移学习,对两个领域的数据同时加以了利用。」
「其实,纯粹使用法律数据,训练效果并不好,通用领域的高质量翻译数据同样不可或缺。」他补充解释道。
公司CEO 闵可锐
和赵理智不同,我本人并未对这个结果感到特别意外。
AI与律师的较量已经不是第一次了,而且每次都是AI获胜。比如,京东法律咨询机器人、阿里的合同审查AI以及以色列创业公司LawGeex的合同审查AI。
既然机器翻译是成绩最为斐然的NLP领域之一,那么,机器在法律翻译方面取得的效果,应该会比合同审查、法律咨询的结果更好。
但问题在于,为什么之前很多人没有留意到这块市场?
公司COO 王益为(左)与北大法宝总经理赵晓海(右)
法律翻译:从90%到10%
传统行业在享受技术红利上存在周期。
「拼技术的公司,会首先将先进技术集成到自己产品中。」 闵可锐说,「最新技术通常也首先倾向于规模最大、最容易用得上的领域。」
这也是为什么互联网巨头同时也是最强人工智能公司的原因。从这个角度来看,传统法律服务行业并非一眼看上去就能产生变革的领域。
不过,这位深度参与过猎户星空智能语音技术研发的前首席科学家对一度白热化的智能音箱和语音技术市场,有着自己的判断。在他看来,这类产品在未来可能会收敛到这样一种状态:
所有产品会做到70到80分之间。低于这个区间的产品显然不合格,但要做到超出80分,也会非常困难。
但是,法律翻译领域不会出现这样的情况。
秘塔团队在机器翻译方面一直有着比较强的技术积累。根据他们对最近两年翻译技术的理解,「机器翻译法律文本的准确性完全可以倒过来」 :
现阶段律师需要修改基于谷歌翻译初稿90%的内容,如果使用AI,初稿可用率可达90%,也就是说,人类律师仅需在这个基础上修正余下的那10%。
「做好数据清洗、结构化和算法,法律翻译质量会产生巨大飞跃。」 闵可锐说,「不过,做到90%并不容易,谷歌、DeepMind并没有这方面现成算法,必须自研。」比如,法律合同中一句话超过四百个字的情况比较常见,这个长度已经超过新闻类口语长度,给算法设计提出了挑战。
但这也正是法律领域吸引闵可锐的重要原因,它「是一块典型的纯技术洼地。」
一年前,这位前猎豹移动首席科学家离开东家,成立秘塔科技。
技术洼地,仅仅是锁定市场的一个方面。法律翻译市场本身也具有高频、需求量大、高价值的特点。
目前,中国法律翻译市场主要包括两大类用户群:法律翻译公司和好的律所。
法律翻译公司一般从事一些格式法律文书的翻译,比如合同、章程、证明、法规等。
除了服务律所之外,他们也服务很多其他市场主体。比如,商业银行、投资银行、VC/PE基金、对冲基金、担保公司、资产管理公司、房地产公司、以及大型跨国公司的法务和财务部门等。
由于法律文本,特别是合同对翻译准确性要求非常高,客户需要支付每千字300到1200元,也是收费最高的一类服务。
「这个市场貌似小是因为非常分散。比如一些法律翻译公司,一年翻译一亿字的公司就算比较大的,但这样的公司有很多,比从事涉外事务的律所多多了。」王益为说。
律所,特别是业务比较复杂的优秀律所,是另外一个非常重要的用户群体。
这些律所业务大多涉及公司法、外商投资、境内企业对外投资、并购、合规、尽职调查、企业上市、知识产权等常见的非诉讼法律业务,法律翻译是工作不可或缺的一部分。
一位资深律师告诉我们,中国「红圈所」(一个对应英国魔圈所的提法,指中国最顶级的律所,比如金杜、君合、中伦、方达、环球等八家)一到三年的初级律师的很多时间都是在做翻译。
无论招实习生还是全职,绝大多数顶尖律所笔试的第一题都是翻译,后面还会有英文撰写起草合同部分。可以说,法律英语的掌握程度关系着是否能拿到这些律所的offer。
笔者也发现,君合在自己的网站中明确写道,「已在海内外拥有......一支由220多位合伙人和顾问、510多位受雇律师和法律翻译组成的逾730人的专业团队」。
「方达,中伦也有专门的翻译团队。」王益为说。创业之前,他已经在红圈所从事并购、境外上市等业务十多年。
这些律师事务所服务的客户比较高端(以财富500强为主),这些客户愿意给高质量的法律翻译服务支付较高的价格,因此,翻译文件报价在每小时上千人民币,法律翻译也成为许多外资所和大型内资所的分支收入来源之一。这也是为什么他们一般会设置全职法律翻译职位。
通常,初级律师会花费50到60个小时(约为一周的时间)来处理一份长度约为70页的合同。如果使用AI,效率有望提升5到6倍。也就是说,处理70页合同所需时间,将由50个小时缩减到约20小时(一天的时间)。
一位从事法律翻译的业内人士告诉我们,由于法律行业的高度专业性以及八股性,一般做了5年的翻译,基本上可以做到一个合同拿出来,50%以上的内容都是耳熟能详的。尤其是碰到长期客户和大型项目,雷同率非常高,这也意味着用机翻提升效率的可能性很高。
更为重要的是,律师的工作性质从劳动密集型升格到更考验知识技能的文件修改和起草,同时,初级律师也有更多时间和精力从事更加创造性工作,律所维系翻译团队的运营成本也大大降低。
亚马逊上海人工智能研究院院长张峥曾在人机对抗赛现场讲话中,将法律领域比喻成一条裂缝。
不同应用场景就像地面上不同的裂缝,人工智能技术就像水。
「(法律翻译)这条裂缝,水渗透的速度会特别快,」张峥说。
「会对既有工作模式的颠覆。」闵可锐说,这是一个有付费意愿的真正需求。
法律检索:所见即所需
半年前,笔者曾采访过LegalZoom联合创始人Brian Liu ,这位伯克利毕业的法律高材生曾妙喻法学教育:本质上就是告诉你如何在那么多文本中,准确定位到你需所需的信息。
闵可锐做了一个简单分析。
中国法律法规数据体量已达180万量级,这个数字已经超过人脑可以记忆的数量。这意味着律师提供法律服务的核心服务,很大程度上是信息搜索、整理和加工。
实践中,这些工作通常会被交给初年级律师。「一个低年级律师的30%时间都是在做legal research。」王益为说。
问题在于,这个时间花得值吗?
假设一位客户希望了解自己公司推行「996」工作制是否触犯劳动法。
在某法律数据库搜索栏中输入「996」,律师发现,排在列表第一位的是1996年发布的谋份法律文书。显然,这仅仅是字符串意义上的相似,与满足律师所需还差很远。
然后,这位律师会转战谷歌,输入「996」后,这位律师会得到关于「996工作制」的百度百科。
「他会根据这个搜索结果,找到合适的法律关键词,再回头进入数据库查询。」王益为说。整个过程需要往返于不同信息源,不仅大费周章,也对关键词的斟酌,提出了很高要求。
秘塔的搜索引擎,展示了新的可能性。
输入「996」,系统会自动推出劳动法。系统已经揣测到这位律师可能是想搞清楚某家公司如果实行996,是否存在法律问题,所以推荐了劳动法。
再比如,输入「范冰冰」,系统会将涉及偷税、漏税的法律规定置于首位。显然,系统推测用户是想了解迫使范冰冰淡出人们视线的「阴阳合同」所涉及的相关法律问题。
这种可以揣摩用户意图的检索,叫做预测性检索,采用了秘塔自主研发的异构非结构化分析引擎。
秘塔的技术团队有着比较强的分词技术,也将语义联想、实体识别等知识图谱相关技术应用到了分析引擎中。
除了这些通用领域比较常见的先进技术,王益为还强调了生成式摘要技术和 Learn to rank 技术。
和抽取式摘要技术不同,使用了深度神经网络的生成式摘要技术,更接近人类思维方式:
先理解,在提取概要。系统在理解文本的基础上(比如只关注知识,对其他内容选择性忽视),重新生成更有针对性的摘要。
这种基于查询(Query)的自动文本摘要技术会帮助用户尽快找到目标内容。
而「我们的 Learn to rank技术可以让系统自动学习更合理的排序。」王益为说。由于记录了每次使用的点击情况,学习使用者的习惯,系统会自动提升排序质量。
目前,预测性检索技术应用到了分析引擎的所有模块中。不过,仅对法律法规、知识经验模块做了优化。
针对笔者感兴趣的类案推送的优化,闵可锐表示,因为「不同数据源,排名优化细节存在差异,这要留待接下来的工作。」
其实,除了搜索体验的与众不同,律师一眼便会看出这款搜索产品的另一个不同:
一站式服务,除了诸如法律法规、案例、办事指南等常规模块,还包括诸如资讯和知识经验等内容。
根据王益为多年的红圈所经验,律所所需信息源通常有好几个。
比如,中国法律法规,大多使用的是北大法宝;案例搜索,会用无讼和裁判文书网;政策规章,会去不同政府网站搜索。
但是,王益为特别强调了知识经验对律师行业的重要性。
「律师经常会针对热门法律问题写些文章,或者就自己处理某类案件的经验写篇文章,这是做市场推广的一个重要手段。」王益为说,「对于同行来说,也是很宝贵的参考资料,同时也是业务捷径。」
然而出乎意料的是,尽管有些律师会去知乎等公号搜索这类同行见解,但也有不少律师甚至连可以搜索微信公众号文章都不清楚。
因此,秘塔尝试将所有这些重要数据来源整合到一起,实现一站式搜索,提升律师工作效率。
「一个账号500元包年」
当问及最为关心的产品定价时,王益为给出一串并不令人咂舌的数字:
今年的产品定价是,法律搜索一个账号,一年500元;法律翻译,每千字30块。
「希望今年可以拓展五万律师和公司法务的用户,有了这些对业务要求非常严格的用户背书,我们就能继续去做更大、更复杂的产品。」
如果秘塔能在小范围内证明方案的有效,其他律所可能会被迫紧跟趋势。与此同时,通过产品在实际场景中的应用,反哺得到更多的数据,形成商业闭环,也有助于公司进一步打磨产品,实现技术迭代。
不过就在一周前,一组最新数据透露出过去五年法律创新领域的惨淡:
过去五年中,法律行业至少涌现出159家创新公司(广义上创新,不止于AI技术创新),其中,28家已经宣告失败。
法律大数据公司华宇元典即将推出一份过去五年法律创新行业的报告。相关数据来自这份尚未完全公开的报告。
来源同上。
中国的法律服务市场规模,约为一千亿人民币,并以每年20%的增长。但是,法律科技投入不到其中的1%。相比之下,美国律所对法律科技投入大概在7%左右。
「律所很关心如何将自己做大做强,但他们主要是考虑走精品所还是大所道路、如何规模化或者提升管理效率,很少有律师关注法律科技。」王益为说。
由于目前面向消费者群体的法律咨询服务的标准化和产品化还比较遥远,因此,从事法律科技创新的公司大多服务B、G端客户。这意味着,这个领域短期内不会出现类似消费者应用场景下的那种爆发性增长,这也多少导致资本的兴趣索然。
尽管如此,仍有不少业内人士看好这个市场。
2019年 Daily Journal 年会上,查理·芒格谈到了这家公司的法律自动化服务业务线:
「我们做的这种软件生意,IT 巨头们避之唯恐不及。」
「这个生意就是这样,根本快不起来,而且还很磨人。我们倒是一直很喜欢这生意,因为能做这个生意的公司必须有钱、有决心、能坚持下去。」
最近,美国创业公司 Pare 联合创始人 Dave Lu 在《如何让你的创业项目估值10亿美元》一文中,特别提及了法律创新项目的潜力。同时,也一针见血地指出了这个领域的棘手之处:
「与经年累积的商业模式竞争,并非易事。如果你还不是业内人士,则难上加难。」
因此,对于市场新生力量来说,如何将点子化作产品落入目标用户群,这一点至关重要。
就秘塔团队来说,一方面,王益为是一位非常资深的法律圈内人。从北大法学院本科毕业后,他继续在伦敦大学与哥伦比亚大学深造,获得硕士学位后进入红圈所。
正如 Dave Lu 在文章中建议的,「积极寻求拥有广泛资源及良好信用的业内专家合作,比较容易获得行业信任,赢得关键用户。」
另一方面,闵可锐认为,圈内人的口碑相传也是一个很重要的销售渠道。
「法律群体对新的知识和产品会比较有好奇心,也有比较好的消费能力,这是有利的地方。而且,律师之间的信息互通做的比较好,有利于形成口碑相传。」他说。前提就是,对自己技术和产品的自信。
法律创新至今举步维艰,甚至有人说2019年会是未来五年最好的一年。所幸的是,就笔者获取到的信息来看,经过这几年的市场教育,至少那些优秀的律师和律所正逐渐趋于一个共识:
除了规模化与管理效率提升,人机耦合是否成功也将是未来竞争中胜出的关键因素。至于中国市场,查理·芒格说了这样一句话,「中国的水可以。有些聪明人已经蹚进去了。时候到了,更多人会进场。」
这也是今年他在Daily Journal 上发言中,在法律业界流传最广的一句。