第四范式创始人、CEO戴文渊:降低AI门槛,让教计算机学习将像训小狗一样简单

再次回到上海,戴文渊觉得这座城市还是和从前一样亲切。

成为AI技术公司第四范式的创始人兼CEO之前,戴文渊最为人所知的名号之一,是百度最年轻的高级科学家,他设计了百度最早的AI系统“凤巢”的机器学习系统,4年内帮助百度将其变现能力提升了8倍。

再早一些,在戴文渊还在上海交大念书的2005年,他曾凭借着在ACM大赛中摘得桂冠,在全球计算机领域一举成名。ACM大赛是由美国计算机协会主办、被成为计算机届的奥林匹克大赛,在当年那场比赛中,被戴文渊击败的诸多对手日后都成为了全球AI领域的翘楚,其中包括在Facebook做过CTO的Adam D'Angelo。

十几年前,戴文渊的AI学术生涯在上海起步。如今,以科学家和企业家的身份再回到上海,参加2018世界人工智能大会,他要用自己更为深刻和落地的见解,和两款让普通业务员也能运用AI的产品——AI Prophet AutoML平台与AI Prophet AutoCV平台,来回报这座正在打造AI高地的城市。

在AI大会上,戴文渊接受了新闻晨报/周到记者的采访,指出了当前AI发展遭遇的障碍,并且从产业、学术与技术的角度,深度解析当前AI落地新突破,为企业布局AI转型提供全新的战略方向。

AI创造更多价值,但高门槛将小场景拒之门外

“只有当AI被广泛的开发者在开发的时候,AI才是能够像今天的APP那样爆发。”

AI,人工智能,到底是要更像人,还是更像机器?

关于这个议题,2018世界人工智能大会的演讲嘉宾给出了不同见解。在戴文渊看来,人和机器的逻辑其实是相似的,和人一样,机器也是在数据里面去发现规律,把它提炼出来变成规则

比如,在百度上搜“干洗”用户,95%以上会选择干洗店,而不是买一台干洗机回家。根据这个发现,可以编写一条给搜“干洗”的用户看干洗店而不是干洗器的规则。

当然,这种规则还可以做的更精细一点。如果某位用户在搜“干洗”之前,还搜过诸如“电影院”和“吃饭”之类的关键词,得到的结果可能是干洗店;但如果此前搜过“店铺租赁”,屏幕上显示的将会是干洗机。

机器相比于人,规则可以做的更加精细,能够写出更多的规则数量。

人工规则通常在几条到几千条,最大的可能我见过的上万条。但因为人精力的局限,写1万条规则已经非常非常辛苦。而机器可以很轻松的去写上千万条以上的规则。如果我们要做到千人千面,从每个人身上提取出不同的规则,这个数量肯定是按亿来计。那这就不是人能做的,需要交给机器来完成。

如果规则数量太少,系统给搜索过“店铺租赁”的用户推荐了干洗店而不是干洗机,这批用户可能会因为需求未被满足而白白流失。当规则更加精细,有了“千人千面”的精准推荐,不仅能够留住用户,还会有更多的服务空间。

这几年,AI给企业、行业和产业创造的价值已在越来越多的落地项目中变得更为清晰。但是,AI目前的门槛太高,将很多有大量需求的场景挡在门外,没有真正参与到这场变革中来。

AI从业者门槛高,生产效率提不上去

尽管数亿条规则可以由机器来写,但要真正实现与各种场景深入融合,还是要回到设置机器的人身上——他们不仅要了解算法和技术,还要懂业务,要能够对场景进行深度定制

从2009年加入百度开始,戴文渊就开始做深度定制的工作。作为一个技术人员,他花了长时间了解广告业务,直现在还能和很多广告从业者对答如流。尽管这种全面发展的路径让他在AI学术和落地方面硕果累累,但随着时间的推移,戴文渊越来越清晰地认识到了一个问题——生产效率是提不上去

在戴文渊看来,要让一个人同时具备AI科学家、业务员和工程师三种能力,是一件很难并且耗费时间的事情:

科学和业务对人的需求不一样。既能做好科学,又能做好业务的人就很少,再加上大数据又要求他做好工程,就更难了。业务人员是需要有更多感性的思考;科学家要对未知的世界有更多的好奇,要去发现规律;工程师要非常的理性,甚至有的时候要有点保守,因为如果你太过大胆,可能你的工程就不牢靠。

当下,AI人才紧缺,复合型AI人才更是少之又少,这就让本该更多领域集体爆发的一场AI变革,迟迟没有到来,因为需求还在“排着队等待被解决”。

AI拓展速度太慢,很多场景未被覆盖

戴文渊认为,AI的应用推广,大体遵循这样一个趋势:从数据获取和犯错误代价从低的到高得不断的去拓展

我只要给你看一条广告,就获取一条数据,它的获取代价比较低,犯错误代价也低。广告完了以后,紧接着就是新闻客户端。再往后面是金融,金融的获取数据的代价就有点高,因为我们要放一笔贷款出去。犯错误的代价也是比较高的,因为会损失一笔钱。再往后像医疗,获取数据的代价也是高的,犯错误的代价就更高了。金融犯错误的代价,就是能够用金钱来度量,医疗犯错误的代价是没有办法用金钱度量的。包括像无人车也是一样的,一旦犯错误它的代价不太可度量。

在戴文渊眼中,这个先后次序没有太大问题,但是速度太慢,有很多场景没有人被覆盖到。AI之所以能够在无人车这种大场景中爆发,是因为大场景养得起贵的人,比如顶尖的科学家等。可类似金融机构票据录入等小场景却没有人做,没有享受到AI技术去提升效率的福利。

我们今天其实希望说把这个门槛降低,能让更多的人进来去开发应用。比方,为什么会有那么移动APP?是因为有大量的开发者。今天做AI有一个很有意思的说法,叫做你要做AI,你要请一个科学家。但是做个APP谁会请科学家呢?这说明AI的门槛太高,科学家一定是小众,不会是大众的。只有当AI被广泛的开发者在开发的时候,AI才是能够像今天的APP那样爆发。

为了让AI像APP一样爆发,戴文渊开始研究怎么去降低人工智能的落地的门槛,怎么能够让一个人不需要去理解什么叫深度学习,不需要去理解大数据,只需要去知道他要做什么,就能够去教计算机去学习。

让教计算机像教小狗一样简单

“就像小狗一样,其实小狗就是深度学习,只是小狗没有告诉你,我的大脑的构造是什么样的,他只是告诉你,我又做了一件事。”

谈及如何让普通人教计算机学习,戴文渊拿小狗举了个例子。

让小狗学会捡球其实不难。把球扔过去,让小狗去捡,如果它捡回来了,就给它一块骨头吃,如果没捡回来就拍它一下。如果把计算机当成一个小狗,如何让小狗像今日头条一样个性化推荐文章?刚开始,这只小狗可能完全不知道怎么推送。但只要它推的文章读者不看,就打它一下,如果推的文章看了,就给它一个骨头,如此反复,它就能学会推送。

我们今天教计算机有两个关键的动作,一个叫行动,一个叫反馈。比方说对于新闻内容分发,给推一个文章就叫行动。反馈是什么呢?就是如果推的文章看了就是好,没看就是不好。我们发现,绝大多数的普通开发人员、业务人员,都是可以理解的这种交互的,并且他能够去掌控整个过程,然后去各行各业产出新的解决方案。

根据这种理念,在2017年12月的世界互联网大会上,戴文渊曾提出“机器学习圈”理论。

“机器学习圈”理论认为,现阶段存在普通业务人员可以使用的AI技术,其核心在于机器能够自动地在不同行业里学习历史上的决策与反馈,并以此为基础制定和运行业务规则。

在此次世界人工智能大会上,第四范式发布了基于“机器学习圈”理论的最新产品化成果——AI Prophet AutoML平台与AI Prophet AutoCV平台

AI Prophet AutoML

先来看看AutoML平台的界面。↓

从交互界面便可以看出,这是一款应用门槛被大大降低的AI平台。无需深入理解算法原理及完成大量编码工作,业务员想成为AI开发者、完成AI应用,并让AI的开发周期从以半年为单位、缩短至周级别,只需要4步:

❶收集行为数据;

❷收集反馈数据;

❸模型训练;

❹模型应用;

目前,在精准营销、互联网推荐、金融风控、广告推荐、疾病预测等数十个业务场景中,企业的业务人员基于AutoML平台做出了接近甚至超过数据科学家的模型效果,决策精准度超过人类专家规则数倍。

此前,在京东金融组织的全国反欺诈大赛中,某银行风控业务团队使用AutoML平台所开发的反欺诈模型获得了第二名,超过了很多专业做反欺诈的AI技术公司。

AI Prophet AutoCV

同样,AutoCV也是一款低门槛、低成本的平台,能够让企业自主可控、高效率的智能视觉构建能力。

按照过去智能视觉应用构建流程,企业构建一个智能视觉应用需要历经9个必要过程,花费20人专家团队近60天时间;而采用AutoCV平台后,只需耗费1名业务人员1天的时间,不仅生产效率提升120倍,TCO成本(Total Cost of Ownership,即总拥有成本,包括产品采购到后期使用、维护的成本)也呈现数量级下降。

如今,AutoCV平台已经在金融、制造、零售、医疗、保险等多个行业取得成功落地实践,众多企业基于该平台构建了票据分类、VIP识别、合规检测、异常识别、机件识别、客流分析、用户画像、病理切割等多个智能视觉长尾业务应用,解决了存在已久的“零散”需求。

有了AI Prophet AutoML和AI Prophet AutoCV平台,企业使用AI服务的门槛将大大被降低。

过去,深度学习所有需要人去定义的参数或者调整调优的这些参数,包括各种各样的设置,网络的结构等。现在,所有的事情都有了计算机来完成,用户只需要不断给计算机反馈,这个计算机就会变得越来越聪明。

就像小狗一样,其实小狗就是深度学习,只是小狗没有告诉你,我的大脑的构造是什么样的,他只是告诉你,我又做了一件事。

未来,当AI应用的门槛逐渐降低,普通人也能像训练小狗一样训练AI平台的时候,更多场景和产业才能享受到AI春风吹来的福利。只有等到那个时候,AI才能真正引来全面爆发。

来源:周到上海       作者:章姝敏