Facebook正在以我们的数据去打造全球最佳的人工智慧实验

发布时间:2020-06-07

Facebook正在以我们的数据去打造全球最佳的人工智慧实验

是时候停止把 Facebook 当作纯粹的社群媒体公司来看了。它用无人机提供网路连接服务,为了发展虚拟现实而收购 Oculus ,努力不懈追求人工智慧, Facebook 已经迅速成为世界上最先进的技术研究中心之一了。

无独有偶, Google 甚至 IBM 之类的公司也有类似的计划,总的来说,人工智慧领域的发展已经提速到无疑会影响到人机互动的节点了。事实上,这已经发生了,不过是悄悄地在幕后进行。每月为 15 亿用户提供服务的 Facebook 对人工智慧技术兴趣浓厚。 Facebook 解决的是模拟一般智力的问题——即让计算机日渐脱离线性逻辑的机器的思考方式,而是像我们自由形态的人类以多管齐下的方式来思考。 Facebook 人工智慧研究室致力于解决广义的人工智慧的问题,而语言技术项目组和 Facebook M这类规模稍小的项目组则致力于开发用户操作中会用到的实际功能。

Facebook 人工智慧研究室的诞生

一切始于 2013 年, Facebook 创始人兼 CEO Mark Zuckerberg 、 CTO Mike Schroepfer 和其他公

司高层在评估公司上线十年以来的成就,并思考在接下来的十年、二十年如何长盛不衰。

Facebook 已经将机器学习运用到其流行的社群网络中,比如说决定用户会在 News Feeds 中看到什幺内容。不过相比起当时的神经网络成果,这不过是小儿科。

一些 Facebook 工程师也一直在尝试卷积神经网络,这是一种非常强大的机器学习,现在普遍被用于图像识别。即便人工智慧还处于发展初期, Zuckerberg 对它的潜力非常看好,因此他从 Google Brain 挖了一位叫做 Marc Aurelio Ranzato 的工程师。然后他追本溯源找到了卷积神经网络的发明者—— Yann LeCun。

Facebook 人工智慧实验室负责人 Yann LeCun 是

人工智慧界的一个传奇。他最早在 1988 年在贝尔实验室担任研究员开始他的研究,然后在 AT&T 实验室担任部门主管直到 2003 年。那之后他开始在纽约大学任教。现代的积神神经网络是 LeCun 职业生涯的巅峰之作。你是否曾经好奇过 ATM 怎幺能识别你的支票?这就得益于 LeCun 负责的「SN」的神经网路模拟器的早期研究,于 1996 年被採用。

「我开始和 Schroepfer 和 Mark 接洽,我想他们也许喜欢我向他们讲述的东西」, LeCun 在接受《Popular Science》採访中说道:「他们试图说服我来运作这个实验室……当像 Mark 那样的人跑过来和你说:『好吧,你基本上接受了全权委託。你能组建世界一流的研究室,我希望你建立起全世界最好的人工智慧研究实验室』。我的回答将会是:『嗯,相当有意思的挑战。』」

关于世界顶级的研究室是什幺样子, Yann 有自己的想法。如果你想要吸引顶尖人才,你得有一个雄心勃勃的研究室,有着雄心勃勃的长期目标。然后你还得给他们工作上的自由权,同时对你的研究你必须持有非常开放的态度。「这和 Facebook 的信念有几分吻合, Facebook 秉持着开放的理念。」LeCun 说。

组建团队

这个肩负着 Facebook 的未来的团队规模很小,由大约 30 个研究科学家和 15 名工程师组成。团队有三个分支: Facebook 人工智慧研究组的主要办公室位于纽约市的 Astor Place ,由 LeCun 管理着一个由 20 名工程师和研究人员组成的团队。 Menlo Park 的是一个同等规模的分支。六月, FAIR 又在巴黎设立了一个更小的 5 人组,与 INRIA合作。还有很多在 Facebook 其他部门一起合作致力于人工智慧发展的团队,例如语言技术团队; FAIR 只是主要的研究部门。

这些研究人员和工程师来自科技领域的各个层面,同时当中很多人都曾与 Lecun 合作过。高等人工智慧研究并非是一个庞大的领域,而且 Lecun 的很多学生都创建了人工智慧方面的新创公司,它们一般会被像 Twitter 这样更大的企业收购。

Lecun 曾经告诉《连线》杂誌,「深度学习实际上是 Geofff Hinton ,我,还有蒙特利尔大学的 Yoshua Bengio 之间的一个阴谋。」Hinton 在 Google 研发人工智慧, Bengio 奔波于蒙特利尔大学和数据挖掘公司 Apstat 之间,而 LeCun 也与其他行业内的着名企业有千丝万缕的关联。

「当我第一次在贝尔实验室做到部门主管时,我的老闆对我说,你需要记住两点:首先,永远不要让自己陷入团队内部的竞争。第二,只僱佣那些比你更聪明的人,」LeCun 说。

负责领导语言研究子群的 Leon Bottou ,是 LeCun 的一个老同事。他们一同研发了神经网络模拟器, 1987 年的 AmigaOS 就是他们的第一个作品。 Bottou 2015 年 3 月加入的 FAIR ,此前他在为微软研究组工作的同时,还致力于机器学习和机器推理的探索。

Facebook正在以我们的数据去打造全球最佳的人工智慧实验
从左数起, Leon Bottou , Yann LeCun , 还有 Rob Fergus,在 Facebook 的纽约办公室里工作

2014 年 11 月,LeCun 请来 Vladimir Vapnik 作为他们的团队顾问。 Vapnik 和 LeCun 曾一起在贝尔实验室工作,发表了关于机器学习的形成性研究,其中包括一项测量机器学习能力的技术。 Vapnik 是统计学习理论之父,统计学习理论即基于既定数据的预测。预测,对人类来说似乎是一个简单的任务,实际上却需要关于预先形成的概念和对世界的观察巨量讯息。 Vapnik ,这一领域的先驱,基于他在知识传播上的兴趣,继续着这一领域的工作,并把师生互动时的线索运用在机器学习当中。

目标

团队的规模和科研力量允许 Facebook 拥有雄心勃勃的长期目标,绝不会达不到被 LeCun 称为「明确的智慧」的标準。

「迄今,最好的人工智慧係统也是愚钝的,因为它们没有常识。」LeCun 说道。他用一种情况举例,比如我拿起一个瓶子,然后离开房间。人类的大脑不难想像出一个人拿起瓶子然后离开房间这幺个简单的场景,但对一台机器来说,仅这个前提就会导致大量的讯息缺失。

Yann 一边说,我一边在心中想像这个场景:「你很可能站起来,即使我在语句中没有提到,你也很可能走动;你打开门,走进去,也许还会关上门;瓶子不在房间里。由于知道真实世界的情况和界限,你可以藉由判断。因此我并不需要告诉你所有的细节。」

现在对于机器如何学习该水平的推理,人工智慧领域的专家知道得并不多。在向这个目标迈进途中, Facebook 正致力于製造能足够好地学习已知世界的机器。

LeCun 说:「最大的障碍是自助式学习。」现在机器主要通过一两种方式进行学习,即他助式学习——在系统中,向机器展示成千上万的狗的图片,直到机器了解了狗的特徵。 Google 的 DeepDream 以研究者反转流程以揭示出其有效性对这一方法进行了阐释。

另一种方式是增强学习,即机器对给出的讯息以是或否的二择一的方式进行选择,以给出一个答案。这种学习耗费的时间稍长,但是机器被强制由自身做出内在的抉择。当这两种学习方式结合起来时,就会产生强大结果。。自助式学习不需要回馈或者输入, LeCun 表示这就是人类的学习方式。我们发现、得出结论,并将其加入到人类的知识库存之中。这,被证明是一项艰鉅的任务。

LeCun 笑着说:「我们甚至没有一个用以发展人工智慧的基本指导原则,很明显,我们在努力寻找。我们有很多点子,只是目前没一个奏效罢了。」

真正人工智慧的早期探索

但是这并不是说以前的探索没有成果。现在让 LeCun 激动的是关于「记忆网络」的工作,其可以被整合进卷积神经网络,并使它们获得记忆保持的能力。 LeCun 把这个新的记忆模型比作大脑中的分别由海马体和大脑皮层控制的短期记忆和长期记忆。

记忆单元允许研究者向该「记忆网络」讲说一个故事,随后使该网络回答关于这个故事的问题。

故事选自《魔戒》一书。我们不把全书而是书中主要情节的简短概述讲给「记忆网络」,当被问及在书中某一具体情节中魔戒在哪里,这个「记忆网络」能做出简短正确的回答。 Facebook 的 Mike Schroepfer 说这意味着它理解书中事物与时间的关係。

「通过搭建能理解世界的本质、了解你所想要的是什幺的系统,我们就能帮助你。」Schroepfer 在三月的一个开发者报告会上说道:「我们能搭建出一个系统,确保让所有人可以把时间花在他们真正关心的事情上。」

FAIR 团队正在围绕这个目标开发一个被称为「嵌入世界」的项目。在该项目中,为了帮助机器更好的理解现实, FAIR 团队正在教它们用向量表示所有事物之间的关係,如:图像,帖子,评论,相片及影片等之间的关係。神经网络也在构建一个包含了能组合媒体内容、不同个体之间的距离等错综複杂内容的体系。

嵌入世界

Lecun 说通过使用这一系统能让我们开始「用代数替换原因」。这表示着让人难以置信的强大。在嵌入世界项目中开发的人工神经网络能够根据视觉相似性将在同一地点拍摄的两张不同照片连接起来,并能指出文字描述是否符合场景。它重建了现实的一种虚拟记忆,并将之在其他地方和事件的背景下进行聚类。它甚至能根据一个人之前的喜好,兴趣以及数字经历「虚拟地表示这个人」。虽然这还只是带有实验性质的,但是对 Facebook 的新闻流呈现具有很大的影响,在跟踪标籤上也进行了一定的使用。

有很多关于长期目标的演说,但恰恰是小的胜利让 Facebook 不断前行。在 2014 年 6 月,他们发表了一篇名为《DeepFace:缩小人类表现与人脸识别间差距》的文章,该文宣称在 Facebook 的这项技术在人脸识别中已达到 97% 的準确率。 Lecun 说:他相信 Facebook 的人脸识别技术已达到世界第一,这也是 Facebook 与学术研究机构的一个关键性的区别。现在, DeepFace 是 Facebook 自动标记照片背后的驱动力。

「如果我们有一个切实有效的想法,我们就能让它在一个月内出现在 15 亿人面前。」LeCun 说,「让我们把目光聚焦在我们的长期目标的高度上,但是,在这个过程中会有很多我们将要去实现的会在短期具有实用性质的事。」

Facebook正在以我们的数据去打造全球最佳的人工智慧实验
作为 FAIR 的研究成员之一的 Rob Fergus,正在纽约办公室处理有关人工智慧虚拟方面的工作

作为在 NYU 和 MIT 计算机科学和人工智慧实验室工作过的老手, Rob Fergus 领导着有关计算机视觉的 AI 团队。他们的工作已经在自动标记相片上得到使用,接下来将被用于标记影片。大量影片因为缺乏原数据,或者没有任何描述性文本,而被「淹没」于噪声中。 AI 将会能够「观看」影片,并将它们大致分类。

这对 Facebook 阻止那些不想被上传到他们服务器上的内容具有巨大的意义—例如色情照片,版权问题或者其他违反他们使用条款的任何内容。它也能鉴别新闻事件,对不同类型的影片进行管理。 Facebook 之前一直将这些任务划分给外包公司,当这项技术稳定后, Facebook 就能降低这部分的人工成本。

在目前的测试中,人工智慧表现得很有希望。给它播放一段正在进行的体育影片,比如冰球、篮球或乒乓球,人工智慧能够準确地识别出这个体育项目。并且还可以区分垒球和棒球,漂流和皮划艇,以及篮球和街球这些类似的运动。

Facebook 背后的人工智慧

Facebook 有一个叫做语言科技的独立小组,主要负责开发翻译,语言辨识和自然语言理解。 LeCun 所在的部门, Facebook 人工智慧研究室是 Facebook 人工智慧战略研究的主力,而语言科技是实际进行软体开发的地方。

他们与 FAIR 合作,但独立进行开发和实践,并且已经开发了 493 种广泛使用的翻译方向。

本着让世界更开放更连通的宗旨,语言服务是 Facebook 的一条必经之路。超过一半以上的 Facebook 用户不说英语,然而 Facebook 上大部分的内容都是通过英语呈现的,语言科技小组的负责人 Alan Packer 说道。

约有三亿三千万用户经常点击「翻译」按钮使用这些翻译服务。

如果你是第一个点击翻译按钮的人,恭喜,你已经操作了人工智慧了。首次点击会向服务器发出翻译请求,之后该请求将储存起来供其他用户使用。 Packer 说,夏奇拉发布的内容总是很快就翻译出来了。语言科技小组还推出了本地内容翻译,通过点击「见原文」按钮可以体验这项服务。

人工智慧是这项任务里一个必要的环节,因为「傻瓜」翻译对于人们彼此之间相互沟通作用不大,还会生成不正确的语法,误读的习语,俚语也无从参考。这就是过去 Google 翻译那种直接逐词翻译的缺陷。

Packer 说,修辞尤其难翻译,但人工智慧可以把握一些语义层面的含义。

「如果把『热狗』这个词组按字面翻译成法语,是说不通的。『Chaud chien』对法国人来说没有任何意义,」Packer 说道。「同样如果你拿着一幅我滑雪的照片,我说,『我今天秀了一下滑雪技巧,』这就变得很难理解,因为这里的 hot dogging 是炫耀的意思。」

儘管这种理解并不算太多,但早期的结果预示着这个任务很难处理。 Packer 说,人工智慧的妙处在于它不会去理解比喻或习语,但仍会在不理解的同时认识到这一点。

人工智慧本身俱有适应性,经过训练后便可以很快掌握俚语。语言科技小组最近发现法国球迷在用一个新俚语表达「wow」,人工智慧在接受那部分公用数据的神经网络训练以后,现在能够可靠地将文本翻译出来。他们通过每天对人工智慧进行新数据的训练扩展 Facebook 的词库,不过所有语言的词库正在按月更新。

Facebook M

我们已经习惯于个人数字助理,比如 Siri , Cortana ,以及 Google Now 。但 Facebook 选择了一条不同的道路,其名为「M」的新型个人 AI 助理拥有超越手机界限处理複杂事物的能力。 Siri 可以发短信,而 M 可以预定航班或製定旅行计划。在开发过程中,一位 Facebook 的僱员甚至让 M 安排了一个找搬家公司到家中进行评估的行程。

Facebook正在以我们的数据去打造全球最佳的人工智慧实验

在三年内, M 有可能能够给有线电视公司或者车辆管理部门打电话,并帮用户线上等待,直到对方的接线员接过电话。

事实上, Facebook M 的主干来自于今年早些时候收购的一家创业公司: Wit.ia 。他们加入了 Messenger 的小组,受 VP David Marcus 的管理,并在本月早些时候首次发布了 M 。

Alex LeBrun 在 Facebook 内部领导 Wit.ai 小组,他说人工智慧不仅帮助 M 更好地完成一般的任务,也能完成有一些特殊情况的任务,如带一个小婴儿旅游,或在灯火管制日的时候旅行。这也意味着 M 的能力随着人工智慧的发展而发展。他乐观地认为,在三年内, M 就可能有能力呼叫有线电视公司或者车辆管理部门,并帮助用户在线等待,直到有人接过电话。

「M 这样的服务最大的附加值在于它能够完全满足你的需求,甚至在你的需求比较特殊或比较奇怪的情况下,」LeBrun 说,「在任务比较複杂或并非常理情况的时候,它也能完成任务。」

随着 M 的运行,它能够不断学习。现在,它还没有能力独自运行。一个被称为「AI 训练者」的小组跟 M 一起工作,如果出现 M 不懂的任务,小组会接管过来。随后 M 可以从人类训练者身上学到应该怎幺做,并应用到之后的任务中。在程序中还内嵌了一种随机机制, Lebrun 说是为了让它更像人类学习的过程。

「AI 训练者」是个新的职位, Facebook 本身也在对这个职位的探索中。他们说,这并不是一个给研究员或者工程师的职位,而是为那些拥有客户服务经验的人準备的。 Facebook 将能够评估哪些任务需要人类的干预,但最后,他们希望在未来完成这些任务将不需要任何人类干预。

但在开发过程中,这个职位是必须的,因为他们的工作主要有两部分:一是保证服务品质的最后一道关卡,二是训练 AI 。

有人类智慧做看门人, M 可以在 FAIR 进行开发时当做 SandBox 来用。「如果有什幺东西需要测试,就会在 M 中显现,因为在我们的训练和督导下,这个过程是没有风险的。」Lebrun 说。

M 平台是完全建立在 Wit.ai 的平台之上的 ,但 FAIR 也会对用户和个人 AI 助理的交互过程产生的数据用作深度学习。

Facebook 在人工智慧团体中的角色

「我们的研究项目都是完全公开的。几乎我们做的每件事都会发布,大部分的程式码也都是开源的」LeCun 说道

。你可以在 Facebook 的研究网站上和 ArXiv ——一个收纳电脑科学、数学及物理研究的图书馆,找到这些出版物。

大多人工智慧团体都是这样不隐秘的。 LeCun 已成为发展 Torch的领导人物。 LeCun 带领他的团队,还有 Twitter 和 Google 的 DeepMind 的研究人员合作,共同发展 Torch 。许多现今在这个领域的专家都曾是 LeCun 的学生。

任何他们可能出版的资料,从与医学成像相关的资料到无人驾驶车,也都是公开以促进未来发展的, LeCun 说道。 Facebook 的研究固然对他们的用户很重要,但它的核心价值更佳体现在让人类对如何更好地用机器来模仿智慧的知识。

这是为什幺 Facebook 是人工智慧社区中重要的一部分,也是为什幺这个社区本身是如此重要。

「那些你在好莱坞电影里看到的情节,譬如一个在阿拉斯加与世隔绝的人研究出了完美运作,并在当下无人能及的人工智慧系统,是完全不可能的」。 LeCun 说,「这是当代最大最複杂的科学挑战之一,没有任何一个人,甚至一个大公司能够凭他们自己解决。解决它需要整个研究发展社区的集体力量」。

上一篇: 下一篇:

相关搜索