作为一个喜欢历史的工程师,我觉得人类的历史,其实是一部人和机器共同进步的历史。人类和猴子的区别在于会不会使用工具,有了手中的骨片、石片这样的工具,人类才开始被称为人类;成百上千年过去,人类手中的工具从石器变成青铜器、铁器、合金,再到如今的电器、未来大家畅想的智能机器人。一万年前的猴子会想,“嗯,我把这个石片绑在木棒上,砍树会快很多,这样就能腾出时间去打猎了”。而一万年后的谷歌工程师会想,“嗯,我把这个自动驾驶汽车的智能写好,坐车不用开了,这样就能腾出时间去看书写代码了。” 因此不管工具怎么变化,“人使用工具提高生产力”这件事始终是人类进化的第一目标。
如果把我们手头所有人造出来的物品,都看做是提高生产力的工具,那么纵观人类的历史,我们在用工具开发自然的同时,其实也是在把人和自然隔绝。现在社会的人和五百年前,或者五千年前的人相比,对自然的了解肯定是差了很多。因为我们的祖先风餐露宿,必须熟知天气和周围环境的特点才不会死掉;封建时代的人虽然形成了农耕或者放牧的文明,但是食物和饮水的质量常常还是要靠自然赐予,农民掌握着丰富的自然知识以保证粮食的生产,就算不做苦工的王侯将相,也需要根据气候和季节的特性安排国家大事;而现代文明社会中的人则可以整天坐在写字楼里,使用各种工业化生产的工具制造、运输生命补给品,不用担心食物和水是从什么地方生产出来的,任何时候都能吃到任何季节和地区生产的蔬果。我想用下面的图片来表示这一变化:
我想用这个图感性地表达,随着工具和人类的一同进步,人和自然的接触(粉色和蓝色的边界)会越来越少。按照这个趋势发展下去,未来的人类根本不会直接去接触自然的风、雨、阳光、植物和绿色动物,而是全部通过机器和其他工具把自然的原材料加工成生活必需品。那个时候人类是怎样一种生活状态?是工具在服务我们,还是工具在抚养我们?黑客帝国里说的人类生活状态,不就是这个样子的吗?我现在常常想,一地铁上人都盯着手机一言不发的场景;大家到了什么地方都先找wifi的场景;几个号称工程师的人交谈的时候没人知道小麦和谷子有什么区别的场景……都在预示着这样的未来。然而让我稍稍宽慰一些的推断是,正因为人有了工具才被称为人,工具离开人也不会被称为工具。就像在黑客帝国里说的那样,机器统治世界以后,依然在费劲心机地研究怎么能培养一个稳定的人类精神社会,不然机器的运转也会出现问题。所以人类不会彻底灭亡,而是与机器继续共生,虽然可能不是处在主宰的地位。但是因为我们和机器必须相生相伴,所以还是有很多谈判的权力嘛,嘿嘿。
这种对社会发展的抽象和预测,其实不是我自己臆想出来的。在众多的科幻小说、机器人学和人工智能学相关的书籍文章中,大家都多多少少表露了这个观点的一部分。我只是做个总结。一旦接受了这种设定,感觉还挺科学的。在《文明5:超越地球》这款地球人殖民外星的策略游戏里,玩家可以选择三种方式发展自己的文明并且达到胜利:
【和谐】和外星生命和谐相处,发展出共生的文明
【纯正】保持地球人纯正的血统,在外星也要保持和地球一样的文明
【至高】和自己制造出来的机器共生,进化成生命-机械混合体我每次都选择第三种方式,因为觉得放弃自己的人类形态、和机器共生,肯定是大势所趋嘛。而且我可是一个机器人学家,我的工作就是推动人类进入这种状态。一旦接受了这种设定,那么就有几个问题要问了:
人和工具(或者说人和机器)从现在怎么变到未来那样的状态?
什么样的工具可以说是把人类和自然彻底隔绝开了?
如何制造这样的工具?虽然我们并不能一下制造出这样的工具,但是根据上面对于社会发展的分析、人与自然关系的推理,这种工具有以下的特点:
可以代表人类与自然交互
必须与人类相生相伴
所以说回题主的问题,其实这种工具就是破铜烂铁当中运行的人工智能,也就是机器人。一言以蔽之,一个能够代表人类与自然交互、和人相生相伴的机器,肯定是需要具备相当丰富的人和自然交互的知识,才能够做好它的工作。这些“人和自然交互的知识”其实就是机器人学和人工智能领域大家谈到的“perception”(感知环境),“planning”(规划推理),以及“control”(运动控制)。机器人学家和人工智能学家干的事情,其实就是把人类对自然的知识变成数学工具和程序而已。
2011年我去麻省理工学院的CSAIL实验室参观Daniela Rus的机器人研究组,赫然看到一堆机器人正在一些种植西红柿的温室里忙碌。编程的博士学生告诉我说,因为要搞自动种植机器人,他现在已经很熟悉种西红柿过程中的各种农业知识了。我想,如果不是为了教机器人学会种西红柿,现代文明社会中的大部分人根本不需要自己去研究怎么种西红柿。而近年来大部分的机器人研究,比如叠毛巾、上楼梯、开车……无一不是在期望把人类对自然的知识变成稳定跑在CPU上的程序。未来的很多年里,我们会见到越来越多的工程师和科学家为了让机器人学会挖矿、检修水管、产线生产等等技能,自己先去做一阵子矿工、水管工和工厂工人。如果不是为了研究机器人和人工智能,他们根本不需要自己去做这些工作。
那么具体一点来说,我们可以透过把人类对自然的知识变成数学工具和程序这个过程怎么更好地认识人类自己呢。这个问题太大了,我只想挑一个比较小的点去说说我自己的见解。把人类对自然的知识变成数学工具和程序中最重要的一个环节,也是过去几十年中人工智能学界争论不休的问题:常识知识的表达(common knowledge representation)。大部分读者可能已经很熟悉人工智能的历史了,早期人们设计了逻辑系统和专家系统,不太有效;后来设计了神经网络,不太会用;再后来发现了机器学习这种统计学技术,回头发现了神经网络的一些特性,觉得哇神器啊,于是神经网络迅猛发展。
尤其是在物体和人脸识别的领域。识别物体和人脸就是一个几十年来非常困难的“常识知识的表达”的问题。给定一张人脸的照片,怎么判断是人脸?我们需要表达“一个物体是人脸”这样一个对人来说轻而易举,但是对机器来说非常困难的问题,就需要把是不是人脸这个问题量化出来,变成机器可以识别的数字。神经网络是一个量化的机制,给定一张人脸的照片,神经网络会输出这个照片里“物体是人脸”这件事情的概率,用一个确定的数值来表示。从一个照片变成一个数字,这其中付出了无数科学家和工程师的心血。相似的问题和解决方案出现在其他各个学科的方方面面,人类无时无刻不在给周围的物体寻找量化的方式。长度、重量、距离……人类发明了各种工具去量化周围的物体,以及人类自身:血压不可直接测量,于是人类发明了工具把血压转换成血压计的数值;人类的力量不可直接测量,于是人类发明了各种健身器材把人的力量转换成器材的重物数值。神经网络,虽然高大神奇,但是也只是一种量化的工具,量化一个物体是不是具有某种特定的属性,更重要的是,把人类的感觉判断的过程用一层层的数学模型量化出来。
这两年机器人学的各种主要研究热点,也都是量化环境的工具。为了准确知道物体的姿态,我们发明了IMU、后来又发明了多传感器融合系统。为了准确知道机器人关节的角度,我们发明了码盘、磁反馈传感器等等不同的传感器,这些机器人设备变成能够辅助人的可穿戴设备之后,还要增加更多的传感器。量化环境的传感器的研究和制造,是一个历久弥新的工业领域,也是人工智能和机器人学的主要研究热点。借用我司技术扛把子大哥的说法:“最牛逼的工程师,都是在搞传感器。”人类很有意思,人类智能的本身没有量化的属性,但是人类有对量化的渴求。人类身上的一切生物传感器都只有“感觉”的反馈,而没有数值的反馈。你不知道自己的脑电波有多强,不知道自己胳膊转动了多少度;但是你看到那些能够量化你的设备(比如微软的hololens和Google的Project Tango,可以记录你在空间中的精确位置;比如各种外骨骼装备,可以画出你胳膊在空间的运动轨迹),你会觉得很新奇。
一个人第一次拿起project tango,看到自己走过的轨迹被精确画出来的的喜悦心情,很可能和几百年前第一次带着六分仪驶向大海、通过六分仪记录下自己精确航线的船长的喜悦心情是类似的。
所以人类追求对周围世界的量化表达,如果不能够量化表达世界,人类会对自然有恐惧感。再借用一个类似航海的例子:想象一下把你突然丢在地球上某个陌生的角落,你会不会非常慌,即使你是一个像贝爷那样的生存高手?但是如果再告诉你一个GPS的坐标,这一个数字就可以减少很多的恐惧感,特别是如果这个坐标是某个富裕安定的国家。而量化表达世界的能力人类本身不具备,所以人类通过制造更加智能的工具去获取这种能力。我们的工具越智能,对自然的量化程度越高,因此人类面对自然的时候,更加相信我们的智能工具给出的量化判断,而不是人类本身感官的感觉判断。所以,人类对“量化信息”的渴求,决定了人对智能工具的渴求,也决定了人会和自然不断割裂。
最后,再举一些从上面的思考中反过来印证的人类的特点:我们看一个人是不是有权力,看他的“级别”,一个量化的参数;我们看一个人是不是有钱,看他身家财产的数值,又是量化的参数;我们比哪个孩子学习好,看他的考试成绩,还是量化的参数。而互联网时代,连人的谈吐和见识也都可以量化了(社交网站的关注度、活跃度、知乎的赞数和粉数……嗯好像混进了奇怪的东西)。我们对人的感觉判断,无时无刻不会被各种量化的判断所改变。综上所述,人类有对量化世界的渴求,这样的渴求带动了机器人学、人工智能学以及很多学科的发展,并且让人类社会不可逆转地走向一个和机器共生的时代。
关注72变,关注智能生活
微信号www72byte
原文地址:https://www.72byte.com/special/201608154587