【致敬40年】沈向洋:被计算机改变的人生
改革开放40年,不仅仅是中国经济腾飞的40年,更是科技高速发展的40年,以计算机为核心的云计算、大数据、物联网、人工智能更是彻底地改变了人们的生产和生活方式,人工智能开启了蓬勃发展的黄金时代。科技作为第一生产力的强大势能爆发无遗,这背后是一群辛勤工作,无惧失败,不断尝试的科学工作者,用汗水和心血才铸就了今天科技界的盛世繁华!更是因此,他们的生命与科技相融,人生从此不同。回首40年往事,他们也是最可爱可敬之人。
记得填报高考志愿前的一天,我父亲拿了一份《参考消息》走进家门,兴冲冲地对我说:你应该报计算机专业,报纸上说计算机这个东西不得了!
那年我只有13岁,像大多数人一样,我从没听说过计算机为何物,连计算器都没见过。当然更不会想到,在接下来的几十年里,计算机竟彻底改变了我的人生,也给整个世界带来了翻天覆地的改变。
1991年,我有幸考进了美国计算机专业排名第一的卡内基梅隆大学计算机学院, 师从著名计算机专家拉吉·瑞迪(Raj Reddy)教授,研读人工智能和机器人专业。
卡内基梅隆大学有着当时全世界第一个机器人学的博士专业。多年来我一直很喜欢机器人这个方向,就是奔着机器人学专业去的,所以非常幸运。拉吉·瑞迪是国际上的语音专家,但是他非常支持我从事计算机视觉方面的研究,后来我的研究方向是机器人视觉。
以前我在卡内基梅隆接触到做科研的风格,是团队协作的风格。同学跟我讲,麻省理工大学和卡内基梅隆大学最大的区别是:麻省理工大学每个人都是一头虎,而卡内基梅隆大学出来的都是一群狼。我们很少单打独斗,都是一个团队一起做一个大项目,卡内基梅隆大学最出名的都是大项目。所以卡内基梅隆大学成功的地方是培养了很多大的IT公司CTO级别的人物,很多学生在工业界更加成功。
也是在这一年,比尔·盖茨先生在西雅图创立了微软研究院,当时他的愿望,是让计算机能听会讲,能看会想。因此微软研究院最早成立的其中三个研究组是计算机语音、计算机视觉和自然语言处理——正是这些基础性的研究,为今天的人工智能奠定了坚实的基础。
1996年,我作为研究员加入微软研究院,从事计算机视觉研究。对我而言,加入微软研究院,确是一种幸运,让我有机会与世界顶尖的天才为伍。直到今天,我仍清楚地记得,刚到微软研究院的那个星期,我发现自己离计算机图形学领域的传奇人物吉姆·布林[Jim Blinn,美国计算机科学家,曾经在美国宇航局的喷气推进实验室(JPL)工作]只隔着4个办公室,我难以抑制心中的兴奋,抓起电话,语无伦次地把这个发现骄傲地分享给我太太。
人工智能事实上是相对于人类智能而言的。我对它的理解主要有两个方面:一个是“感知”,另外一个就是“认知”。
为什么人类有智能?第一,我们可以感受这个世界,主要是通过语音的方式和视觉的方式,所以对应的人工智能感知方面最主要技术就是语音和视觉方面的技术。第二,我们还有认知,认知就是人类不仅仅能感受到这个世界,而且还能理解这个世界。而理解这个世界就包括理解真正的物理世界,以及理解你身边的人,甚至是最最重要的——理解自己。所以,在认知方面,有两类技术就格外重要了,一个是语言、自然语言,另外一个就是知识。这是这么多年来,我对人工智能的理解和定义。
我加入微软研究院的时候,正值人工智能的“寒冬期”——现实世界中的基础性研究枯燥乏味、进展缓慢,与之前人们所想象的“未来科技”相去甚远,行业内悲观失望的情绪,让当时的很多投资人和研究机构都对人工智能研究避之唯恐不及。
为什么发展如此迅猛呢?主要是三个方面:大数据、大计算、精准算法。在丰富的大数据资源,强大的云计算平台,以及先进的机器学习算法的支持下,人工智能开启了蓬勃发展的黄金时代。
以云计算、大数据、物联网、人工智能为代表的第四次工业正在到来,这一轮以技术创新为代表的数字化转型,正在给全球的企业带来巨大的挑战和机遇,也给企业业务、商业应用、产品和服务等方面带来了巨大的冲击。目前人工智能的主要方仍是基于大数据、大计算模式。拥有大量数据积累和分析需求的行业更适合通过人工智能技术实现转型。
以医疗行业为例,在癌症早期筛查领域,存在大量读取医疗影像并作出判断的需求。若是传统人工读片,效率较低,且正确率不高。加之医疗资源有限,很难做到每一个影像都能有效读取。而人工智能技术应用能够很好地提高读片效率,且通过计算和比对,有效提高正确率。这是一个典型的案例。
1997年,微软公司在剑桥成立了研究院,之后决定把第二个海外科研机构放在北京。我觉得这是一个非常难得的机会,在中国进行这么一次研发“创业”,也是公司内部的创新。公司包括院里的一些老领导都鼓励我,就把握住这样一个机会。
1998年我回到中国,开始参与中国微软研究院的建立。1999年1月15日正式转到中国,成为了第一个研究员,到现在差不多快20年了。我还记得,当时的第一份工作,是让我来选地毯的颜色。
以前念书的时候,我对国内的关注不是太多。不过我觉得,在传统的人工智能研发方面,中国一直有非常深厚的基础。中国在传统的模式识别这一个领域,包括手写体识别等方面,都做得相当不错,在国际上非常领先。我了解的很多国内高校的老师,较早开始做传统的模式识别研究。回国跟同行交流更多之后,我就开始关注这个领域的发展。
现在在中国,人工智能技术的蓬勃发展非常激动人心。这里有很多机会,在基础科研方面也已经取得很多了不起的成果。比如,在计算机视觉方面,已经有很多本土公司,很多科研院校、院所,做了大量工作,推进这一技术的发展。我相信,中国有更多的机会,也将让更多的应用场景落地。中国的确有很多的优势。
近几年,中国的经济、技术都在快速发展。中国不仅拥有庞大的消费市场,更已成为全球创新的重要力量。很多国内的IT企业以及初创公司都不同程度在人工智能领域有所作为。中国的优秀人才也不断涌出。
从市场发展来看,创业、投资的趋势正趋于理性发展和价值投资。但是相信由技术创新驱动的创新、创业、产业升级仍将保持强劲的发展势头。今后技术创新不再是噱头,而是要与现实的应用场景、行业应用相互结合,真正解决企业运营或者人们生活中遇到的问题,提高生产效率、改善生活品质。
从技术发展的趋势来看,混合现实、人工智能、量子计算,将是未来技术发展的三个主要方向。国家发布了“新一代人工智能发展规划”并且列出了首批四个重点人工智能平台的发展规划,近期来看,人工智能仍将是市场发展的一个热点。
人工智能快速推进的同时,仍有些问题值得我们停下来想想。目前,人工智能发展主要面临以下几方面的限制:
第一,人工智能技术对大数据和大计算的依赖较大。这和人类智能有很大的差异,因为人们多数时候是用小样本的方式在学习,很容易举一反三。这个方是需要思辨的。
第二,绝大多数的人工智能算法都是黑箱算法,包含有大量参数,形成了一个复杂的网络。这样复杂的算法是可以推演的,还是只是函数的递进,这也是我们需要深思的问题,也是下一步人工智能发展要解决的后续的问题。
第三,人工智能领域不仅过于重视数据,而且重视的是数据的表象。很多时候,人工智能技术是在用复杂解释复杂,为了拟合数据结果,而做出一个更加复杂的模型。这是与科学认知有悖的。在自然科学领域,人们应当是通过复杂的现象抽象出一个简单的本质。因此从这个角度而言,人工智能技术还有待探索和发展。
第四,人工智能技术现在遇到一个很大的问题就是偏见。例如用网络搜索引擎搜索CEO会发现,出来的结果基本上没有女性,亚洲人面孔也很少。这些都是随着人工智能的发展出现的伦理问题。这不仅是科研的问题,也是整个行业的问题,整个行业和全社会都必须认识到这个问题的重要性,携手合作,探索解决之道。
作为一个从事人工智能研究将近30年的从业者,在为技术突破感到兴奋的同时,我也开始认真思索,人工智能技术之于整个人类的未来的影响,以及科学家在技术发展和应用中应当承担的角色与社会责任。
第一,人工智能创造的主体,不仅仅是具有IQ,而是兼具IQ与EQ的综合体。人工智能时代的基础架构,最终将是一种IQ和EQ完美融合的状态。而在这个过程中,需要去分别发展IQ和EQ两个维度。
第二,人工智能创造的产物,须能成为具有独立知识产权的作品,而不仅仅是某种技术中间状态的成果。
第三,人工智能创造的过程,须对应人类某种富有创造力的行为,而不是对人类劳动的简单替代(如工业机械臂那样的“人工智能制造“)。
人工智能本质上还是一门技术,是由人来开发和控制的。技术本身没有好坏之分。因此,我们需要客观看待这个问题。我们支持技术的发展和演进,同时也希望国际组织、各个国家、整个社会一起努力,对技术利用从道德和法律上加以引导,防止技术成为坏人作恶的工具。我们在工作中有一系列核心的原则:人工智能是用以增强人类能力的(AI must be designed to augment humans)、人工智能技术应该是透明的、人工智能应当在不伤害人类尊严的前提下最大限度地提高效率、为意外情况筹备智能隐私和问责机制、防范偏见。
免责声明:本站所有信息均搜集自互联网,并不代表本站观点,本站不对其真实合法性负责。如有信息侵犯了您的权益,请告知,本站将立刻处理。联系QQ:1640731186