自从 Google 的人工智能 AlphaGO 成为围棋界的百胜将军开始,AI(Artificial Intelligence,人工智能)这两个英文字,刹那间成为科技业最热门的关键字之一。而就在2017年初,早在 AI 领域打下深厚底子的 IBM Watson,除了打进一些数据服务公司、科技公司外,甚至进军医疗领域,能够依照病患资料判定青光眼,准确率高达95%。我们现在已经迈入了AI与机器人逐渐取代人类工作的年代,在不知不觉间,AI的相关技术已经开始渗透每个人生活的角落,从Google与Facebook依照兴趣投放的广告、可以帮你找资料设定日历的语音助理Siri,背后都含有AI的概念与技术。未来的生活无论是投资、交通、医疗、学习、生产,将无处不是AI的踪影,这个技术也将彻底改变人们的生活模式。
AI其实是个庞大而复杂的概念,但大都奠基于一项基础的关键技术,这个技术叫做“机器学习 Machine Learning”。机器学习技术,就是让机械拥有自主学习的能力,说起来很简单,但在1950年代技术萌芽期间,演算法和硬体条件都不够成熟,是直到近年来日益优异的演算法,与强劲的硬体运算能力,才让机器学习的能力有突破性进展,而其中带进展最为快速的一项关键技术,就是大家最耳熟能详的──“深度学习”。我们来看看这个数据:2015年机器学习的周边市场规模约3.6亿美元,至2020年预估将突破29亿美元,并在AI整体市场的50亿美元中占了约六成比重,可以说机器学习的技术突破,就是AI市场发展的原动力。既然机器学习重要,那么它究竟是什么?为何能进展神速?
“大数据”提高了深度学习精准度:演算法及硬件条件的大幅跃进提供了机器学习发展的优良条件,再加上数字化联网的蓬勃下带来的“大数据”,便引爆了科技大厂争相投入深度学习技术的浪潮。目前不管是NVIDIA这类的芯片商,或擅长演算法的Google、Facebook等软件商,最常提到从事的机器学习的主流技术,就是深度学习。举个例子描述深度学习如何进行。想像一下,要让一台搭载深度学习能力的车辆进行自动驾驶,面对陌生的路线、随时有行人冲出马路的危险路况,机器怎么判断?透过深度学习,你可先一次提供机器海量的数据资讯,包含路标、号志、路树、行人、等,让它学会辨识环境中的物体为何,学会了,便有助于它在行进过程中快速而精准地避开障碍、找出最佳路径,并顺利抵达目的地。只要数据越丰富完整,机器就越能够提高一切辨识的精准度,以加强判断能力。这么说来,要能让AI靠“深度学习”发展思考能力,很大程度是依赖大数据所赐,不过,这时候我们就会面临一个问题:没有大数据,深度学习就毫无用武之地了吗?“小数据”的机器学习方案也蓄势待发:大数据带给深度学习强而有力的判断能力,但其实机器若要做到“学习”这件事,深度学习并不是唯一方法。回到自动驾驶的例子,倘若这次我们先不将海量的数据提供给机器,而是只告诉他“目的地”、“禁止碰撞”两项指令,然后任凭他不断的Trial & Error,在失败中汲取“经验”以达到学习的效果,最终也能抵达目的地(前提当然是没有遭遇严重车祸影响行进能力)。这样在初始阶段不仰赖大数据的学习方式,可以归类为“强化学习”。强化学习的方法能补足机器在突发状况下的应变能力,AlphaGO 的开发商 DeepMind 也深谙这项方法的优点,因此让 AlphaGO 也借着深度学习与强化学习的组合,在对手下出意料之外的棋步时,随即建立新的经验,以做为未来在相同局势下能克敌制胜的判断依据。