但每一次“找规律”之后,都会由人类或某种游戏规则作为“老师”来判断对错。计算机会记住那些正确的规律,然后尝试在下一次题目中套用。如果不能套用,就继续猜答案。

这种方法就是“试错法”。通过不断尝试新做法、排除错误猜测,最后留下最接近正确答案的那一个“规律”或者“模型”。这就是“模式识别”。

它不仅是AI学习的基础,也是人类探索新领域的常见做法。

而所谓“深度学习”,就是在识别出现象的浅层“模式”之后,再把“模式”作为现象来归纳更深一层的“模式中的模式”。

以此类推,就会有“模式中的模式中的模式”,以及“模式中的模式中模式中的模式”……

识别的“模式”的层次越多,学习的“深度”就越深。这样人工智能程序才能从更加复杂的现象中总结出规律来。

但是学习网络的深度每增加一层,它所需要的原始数据就会以指数级别暴增。

假如一层学习只需要一百个样本。那么两层的学习就需要一万个样本,三层的学习需要一百万个,四层的学习就需要一亿个样本……

如果学习的深度达到十层,需要的样本数量将是……一万亿亿个。相当于世界上每个人都要给它提供一百亿个样本数据。

而随着样本数量的增加,深度学习对计算能力的需求也急剧增加。所以计算能力和样本数据多少是人工智能发展的两个主要制约因素。

所以当陈枫问列克星敦需要什么时,她毫不犹豫地回答“需要更多的数据”。

“我们的数据还不够吗?”陈枫有些吃惊,“我们每天都记录了几万人的工作和活动数据。这些还不够吗?”

陈枫所说的“几万人”是指他目前直接掌握的劳工、军队、和学生的数量。

他要求所有在他这里工作学习的人都必须佩戴有记录和上传功能的智能设备。而他给工人提供的工程机械,和给士兵提供的所有武器装备,都具备同样的记录和上传功能。

这些人的所见所闻、所做所说都会被传输到这个数据中心。

数据中心的处理器会分析这些数据,从中学习人类是如何识别物体、如何听懂语言、如何规划路线、如何驾驶车辆、如何使用武器、如何相互配合等等。

事实上在陈枫的心目中,这些人无论表面上干的是什么活,其实都同时兼了另一份工作——AI训练师。

陈枫最关心的并不是工人们本身工作产生的价值,而是他们将要训练出来的、未来将取代他们工作的智能机器人的价值。

无论他们工作如何努力,他们在这些简单劳动中创造的价值都不可能超过未来海量的AI工人大军。

这才是占领马萨岛给陈枫带来的最大收益——岛上一百多万居民带来的人口红利。

然而列克星敦却斩钉截铁地说:“不够。这还远远、远远、远远不够。按照我的研究计划,收集数据的速度至少要增加一万倍。”

听到这话,陈枫顿时哭笑不得:“列克星敦啊,我从哪里找来那么多数据给你?难道你要我先去占领全世界?”

一百万人乘以一万倍,可不就需要一百亿人来提供吗?刚好是这个世界的人口总数。

本章已完 m.3qdu.com