【od网页版入口登录】优步研究实验室负责人开发新的人工智能算法
发布时间:2024-11-05 人浏览
本文摘要:一种新型的机器学习算法刚掌控了一些已被证明是人工智能的困惑的重返视频游戏。
一种新型的机器学习算法刚掌控了一些已被证明是人工智能的困惑的重返视频游戏。接下来的人将不会告诉人工智能算法在古老,高雅的策略游戏Go中打败了世界顶级人类玩家,这是最难以想象的游戏之一。但是,来自8位电脑游戏时代的两个像素化经典作品-蒙特祖玛的报仇和陷阱早已妨碍了AI研究人员。
这种看起来对立的原因是有道理的。蒙特苏马的报仇和陷阱虽然看起来非常简单,但看起来非常简单!通过增强自学早已不不受掌控,这种技术本来擅长于自学吞并视频游戏。DeepMind是Alphabet的子公司,专心于人工智能,值得一提的是地用它来研发需要自学如何在专家级别上玩游戏几个经典视频游戏的算法。
增强自学算法与大多数游戏很好地融合,因为他们根据大力的对系统调整他们的不道德-分数下降。该方法的顺利使人们产生了期望,AI算法可以教会自己做到各种简单的东西,这些东西目前对机器来说是不有可能的。
蒙特祖玛的报仇和陷阱的问题!是没可信的奖励信号。两个标题都牵涉到典型场景:主角探寻充满著可怕生物和陷阱的块状世界。但是在每种情况下,许多在游戏中行进所必须的不道德都急于提升分数,直到很幸以后。普通的增强自学算法一般来说无法挣脱蒙特祖玛的报仇和陷阱中的第一个房间!他们分数正好为零。
这些新的算法来自优步在旧金山的人工智能研究团队,由JeffClune领导,他也是怀俄明大学的副教授。该团队在一个环境中展出了一种显然有所不同的机器学习方法,该环境完全没获取表明算法的线索。这种方法引向了一些有意思的实际应用于,Clune和他的团队在今天公布的博客文章中写到-例如,在机器人自学中。
这是因为未来的机器人必须弄清楚在简单的环境中应当做到些什么并且只获取一些稠密的奖励。
本文来源:OD·体育-www.qzhycc.com