美国加州用AI来清理案底,“突破性算法”被reddit网友群嘲

计算
美国加州用AI来清理案底,“突破性算法”被reddit网友群嘲
麻省理工科技评论 2019-05-03

2019-05-03

亚马逊用 AI 来选择解雇哪些工人,而加州公检司法系统则宣布用 AI 来帮助那些有大麻前科的人清理案底。
人工智能
亚马逊用 AI 来选择解雇哪些工人,而加州公检司法系统则宣布用 AI 来帮助那些有大麻前科的人清理案底。

亚马逊用 AI 来选择解雇哪些工人,而加州公检司法系统则宣布用 AI 来帮助那些有大麻前科的人清理案底。

美国加州公检司法系统最近迎来了一次”大”升级,工作人员再也不用对着上千万条案件找出大麻犯罪者,再一个个删除记录了。

据 BBC 报道,背后的技术团队只用了几行代码就搞定了这次升级,法院检察官非常满意。在他们的传统观念里,政府技术中的任何东西都是要花费很多年时间和数百万美元才能完成的。

“这是一套‘突破性’算法,我们用 AI 处理了政府堆积已久的工作。”一位法官说到。

美国加州用AI来清理案底,“突破性算法”被reddit网友群嘲

(来源:BBC)

加州在 2016 年通过了 64 号提案将与大麻有关的定罪去除,使大麻在加州合法化。作为新法的一部分,之前有大麻前科的人都可以申请删掉罪名。

据估计,加州过去有超过 100 万人做过跟大麻有关的工作,对于那些有犯罪记录的人来说,如果不清除掉犯罪记录,会有 4 万个”附带后果”——超过一半与就业有关。此外,住房、医疗、购物等这些与生活密切相关的刚性需求,对有大麻犯罪记录的人来说都是麻烦,这将会导致他们陷入贫困死循环。

然而,在新法生效后,申请清除记录的人却不到预计的 3%,究其原因才发现,一些人是被繁琐的申请流程吓到了,另一些人则根本不知道去找什么组织办理申请。

不仅仅是那些想去除罪名的人感到无从下手,公检法的工作人员在开始手动处理这件事时,也很快意识到这是一项耗时耗力的大工程。清除几十万条大麻犯罪记录成了加州政府公检机构急需解决的问题。

这项工作预计需要耗费巨大人力、物力,耗时数月才能完成。于是刑事司法系统找来一家非营利组织 Code for America , 该组织主要业务是为政府陈旧落后的信息系统提供高效便捷的改进服务。他们推出了一个"Clear My Record"的软件解决方案。

据介绍,"Clear My Record"能分析法庭文件中的案件文本,可以用字符识别来扫描文件,对任何涉及暴力犯罪的记录都会标记不合格,对剩下的案件可以自动填写文本。也就是说,该工具可以替代政府工作人员手动筛选大麻犯罪记录。

根据数据库的原始文件,"Clear My Record" 花了几分钟识别出了 8132 个合格的犯罪记录(有 1230 个是之前已经手动标注过)。这比人工处理快多了。

于是,在 4 月 3 日,旧金山法官 Samuel K Feng 与 Code for America 组织签订了合作协议。

美国加州用AI来清理案底,“突破性算法”被reddit网友群嘲

图 | BBC 网站报道 Code for America 帮助分析法庭文件(来源:BBC)

reddit 网友群嘲


批量删除数据这种骚操作也能被称为”突破性”算法?

BBC 报道后,"ClearMy Record" 在 reddit 上被大家集体群嘲了。

大多数人的看法是,这根本不是什么突破性算法,甚至连”突破”的边儿都沾不上,唯一的突破是政府终于摆脱他们的懒惰,开始寻求新技术来改善办事效率。

有网友直接扔出自己编的一行代码秒杀同行码农。

美国加州用AI来清理案底,“突破性算法”被reddit网友群嘲

reddit 上网友指出,"ClearMy Record"和 AI 没半点关系,简单点说,相当于 if 语句加上一个 Excel 宏,没有一点技术含量,清除的可能只是一组相当基本的 SQL 脚本。

美国加州用AI来清理案底,“突破性算法”被reddit网友群嘲

为了证实这一点,有人扒出该项目的 Ruby 代码库,发现并没有执行所谓的文本挖掘,没有用到自然语言处理(NLP),在查看分析法院文件时,有可能是非常简单的关键字匹配。

美国加州用AI来清理案底,“突破性算法”被reddit网友群嘲

一个曾经从事过处理法院记录的程序员说道,大家以为政府信息系统是一个十年前的程序员设计的,而现实是由几百年前的哲学家和律师设计的,构建它是为了让纸质文件和在不同地理位置的法院协同工作,适应的也是 50 年前非常笨拙的计算机系统。

美国加州用AI来清理案底,“突破性算法”被reddit网友群嘲

“数据库没有'犯罪'变量,因为获取这些信息需要自然语言处理才能理解案件文本中的意图。我敢打赌,在系统中擦除大麻犯罪记录绝对要比想象中困难。”

也有网友表示,给多少钱,做多少活。几年前,一个程序员看到法律系统的低效,于是他去读了法学院,毕业后设计了一套程序,可以快速阅读和分析常见的法律文件,律师们经常用它来协助办案,这个程序员因此变得非常富有。

美国加州用AI来清理案底,“突破性算法”被reddit网友群嘲

私营企业倾向于通过砸钱来提升效率,而依赖公共资金的政府部门习惯于不断减少前端开发成本来维持运营,长期来看,结果会非常糟糕。

“免费的才是最贵的”。为高质量的解决方案付费,虽然支出似乎更高,但以正确的方式做事会产生更好、更便宜的长期结果。虽然目前的制度允许政府通过相关公司签订合同来解决问题,但并不是一开始就提供有竞争力的薪酬来吸引人才。因此才造成这么多因短视和自私而落后的系统。

不过,也有网友保持理性客观的态度,"Clear MyRecord"只是来辅助工作人员办公,更重要还是得配合政府信息处理流程,要有决策人员来处理筛选后的信息。

你怎么看?

此外,如果你对这个非营利组织提供的"Clear MyRecord"方案感兴趣,可以在 GitHub 查看源代码,链接奉上:

https://github.com/codeforamerica/autoclearance


麻省理工科技评论

From Tech to Deeptech