主页 > B最生活 >会作弊的AI拥有如生命体般的创造力(上) >

会作弊的AI拥有如生命体般的创造力(上)


會作弊的AI擁有如生命體般的創造力(上)

你有想过AI居然会在游戏中作弊吗?而让他们能有这个能力的原因竟是原先人们认为只会发生在生物中的「演化」。古猿经历的千万年演化出人类,地球上现存的近千万物种也是经过演化的漫漫长路而来,使得物种间充满各式惊奇可能性,总会找到出路的生命往往展现千奇百怪的创造力。然而,以演化算法开发人工智慧竟可以拥有生物演化的能力,不论是在游戏中耍奥步、找出系统漏洞、执行新决策,甚至是艺术创作「它」都可以做到。或许人类会因此对AI的力量感到畏惧,但若能了解它们的运作方式,我们将可以与之合作,带领整个系统一起排除万难。

什幺是演化

查尔斯·达尔文在1859年发表了《物种起源》奠定演化论基础,以融合演变与进化概念的「演化(evolution)」一词来解释生物在世代与世代间的发展具有变异之现象,一个物种可能是由其他物种演化而来,或是从原始简单生物进化成爲複杂有智慧的物种。儘管此理论在当年不受主流宗教文化所接受,但作为现今生物遗传学的基础,可以用来解释地球上百万种物种的起源与分化。单一物种族群中的基因具有多元变异,当面对环境改变时,只有具特定特徵的个体能够适应环境的考验,适者生存不适者淘汰,优势者则可靠繁殖将优势基因传到下个世代,并随时间性状特徵逐渐越差越大而形成新物种。在一连串的过程中,生物演化出各式各样特殊的性徵,好比身为自营生物的植物具有叶绿体可行光合作用,自己产生能量,而植物会拥有叶绿体则是远古真核生物吞下带有叶绿素的蓝绿菌演化而来;生物除了发展出特殊特徵外也可能产生趋同演化,像是植物受攻击时由钙离子传递类似人类痛觉的反应,这可能是动物的神经系统机制的起源。或是鸟类、昆虫、蝙蝠等亲缘差异大但却同样有翅膀可飞翔。物种可能因为演化而差异变大,但也可能因此而具备相似功能,生物演化变化万千,但都是因为一个共通目标—为了适应环境并生存下来。

数码演化与演化算法

在机器人工智慧发展蓬勃的现代,机器学习中的神经网络模仿真实生物神经网络结构与功能,来做多元的计算处理。以数位模仿生物,那会不会因而出现数位的生物现象呢?Uber的人工智慧研究员Jeff Clune説「这些被我们创造出来的机器系统远比我们想像中的更能适应环境变化,而且能做出我们意想不到的事情。」

21世纪,演化不再只会发生于生命体,电脑计算系统也会产生相同现象,称之「数码演化(digital evolution)」。生物演化是透过繁殖、变异、竞争、选择来达成,而有一种演算法称作「演化算法(evolutionary algorithm, EA)」则靠着选择、重组、变异创造问题的最佳化解法。近期Clune合着的一篇论文探讨演化算法形成数码演化现象,并列出人工智慧系统富有惊人创造性的真实研究案例。演化算法包括遗传算法(genetic algorithm)、遗传编程(genetic programming)、演化编程(evolutionary programming)、演化策略(evolution strategy)等算法,而最核心也最普遍使用的是以达尔文的进化论为概念的遗传算法,从完全随机个体的族群开始,根据该世代整个族群和个体的适应度(fitness)随机选择数个父母本,通过选择和繁殖(包含交配及突变)产生新的生命子代,该子代在下一代中成为初始的品种族群,逐渐演化出多个世代。对演化算法来说,个体即为最佳化问题的解,并以称作染色体的变数序列表示,经过多代数码演化来找出能满足最佳值的个体。

从研究中发现以演化算法开发的系统具备类似生物演化的数码演化特性,会利用开发者创造的环境及训练条件发展出我们从未想过的事情,如同生物一般,可以突破环境的盲点漏洞找出生存方式,也可以依据环境演化出类似真实生物的行为模式,甚至未来可能作为生物演化的模拟系统。

会作弊的AI拥有如生命体般的创造力(上)

图一、遗传算法的运作模式(McCabism blog)

演化后会作弊的AI机器人!?

今年初德国弗莱堡大学研究团队发表一篇文献关于演化机器人玩Atari系列游戏Qbert时执行的策略,融合强化学习与演化算法中的演化策略反覆训练机器人,意外发展出人类玩家从未使用过的玩法。早年街机游戏盛行时Qbert是其中一个经典,近年则推出掌上型游戏机、电脑的单机游戏版本。这是一款动作过关小游戏,由玩家控制Q精灵在方格上移动,躲避毒蛇及巨石的攻击,并踏遍所有的小方块使其颜色一致,才可过关进到下一个关卡。看似一个单纯的破关游戏,但机器人前所未见的玩法发现游戏原始设定的两个漏洞。游戏原始设定若得分超过99999的话,分数会归零重新计算,但机器人发现以特定方法破第一关后,在全部方块平台发亮时若继续停留于原关卡能够不受威胁来回跳上跳下于平台间,并破坏游戏规则获得超越人类历史纪录的近百万高分。第二种情况更惊为天人,机器人让Q精灵跳下平台自杀诱使追赶而来的毒蛇同归于尽,因为游戏认为玩家成功清除敌人,因此可额外得到一条命及积分,零风险的玩法对机器人来说无疑是最佳游戏策略。

会作弊的AI拥有如生命体般的创造力(上)

图二、机器人玩Qbert游戏的画面,机器人控制Q精灵诱使敌人毒蛇同归于尽(上)。机器人不断在平台来回移动刷高分数(下)。(Lehman et al, 2018)

从这样的情况中,有些人称之为「作弊」,人类认为AI不是真的会玩游戏,而是藉由游戏系统缺陷来让自己能更轻鬆获得高分、获取奖励。大多数的人工智慧研究员都努力避免上述状况,认为是训练方式有误导致的不良结果,仅有少数学者找寻看似错误演化的成因,运用出错的AI来解决现存问题。Jeff Clune説未来的工程师应该是与这些机器合作并指导系统,善用AI的创造力可以更有效地做出最佳决策。

编译来源

Tom Simonite, “When Bots Teach Themselves to Cheat“, WIRED, 2018.

参考资料



上一篇: 下一篇:

远离都市尘嚣 来趟亲山之旅享受森林芬多精

远离4大危险因子,避免肺癌找上门

远航澎湖马拉松15日登场

远行的你,细腻笔触的他 – 观看刘致宏的绘画

远观质子火箭爆炸,十秒后…玻璃震碎

远视也会得老花眼!医曝「懒配眼镜」小心这些后遗症上门

申博太阳城_万利游戏注册送38元|各方面新闻信息网|收集最全面衣食住行|网站地图 申博官网备用网址_金沙赌船贵宾77777 申博官网备用网址_申博体育现金网