·Google DeepMind首席执行官德米斯·哈萨比斯称,Gemini将AlphaGo背后的技术与大语言模型相结合,目标是让系统具有新的能力,如规划或解决问题,比OpenAI的GPT-4能力更强。
(资料图)
Google DeepMind首席执行官德米斯·哈萨比斯。不久前强强合并而成的人工智能巨头Google DeepMind终于向ChatGPT发出实质性挑战。在上个月的谷歌(Google) I/O开发者大会上,谷歌公司首次透露了其正在开发的大型语言模型Gemini。据《连线》6月26日报道,DeepMind联合创始人兼Google DeepMind首席执行官德米斯·哈萨比斯(Demis Hassabis)最近在采访中进一步透露了Gemini的细节:该系统将AlphaGo背后的技术与大语言模型相结合,目标是让系统具有新的能力,如规划或解决问题,比OpenAI的GPT-4能力更强。
2016年,DeepMind开发的AlphaGo曾击败围棋高手创造历史。“你可以认为Gemini结合了AlphaGo系统的一些优势和大模型的惊人语言能力。”哈萨比斯说,“我们也有一些新的创新,这些创新将非常有趣。”
可能会尝试新想法
AlphaGo是基于DeepMind开创的一种叫做强化学习的技术,在这种技术中,软件通过反复尝试并接受关于其表现的反馈,学会选择采取何种行动以处理棘手的问题,比如围棋或视频游戏。它还使用了一种叫做树状搜索(tree search)的方法来探索和记忆棋盘上的可能动作。语言模型的下一个大飞跃,可能涉及让这种技术在互联网和计算机上执行更多任务。
哈萨比斯说,Gemini仍在开发中,这个过程将需要数月时间,可能花费数千或数亿美元。OpenAI首席执行官山姆·奥特曼(Sam Altman)曾在4月透露,创建GPT-4的成本超过1亿美元。
训练像GPT-4这样的大型语言模型,需要将来自书籍、网页和其他来源的大量文本输入被称为Transformer(谷歌开发的一种深度学习模型,OpenAI在此基础上开发了GPT)的机器学习软件。它利用训练数据中的规律,熟练地预测一段文本后面的字母和单词,这种简单的机制在回答问题和生成文本或代码方面被证明是非常强大的。
要开发ChatGPT和类似能力的语言模型,需要一个重要的额外步骤:使用基于人类反馈的强化学习来完善其性能。DeepMind在强化学习方面的深厚经验可以让其研究人员赋予Gemini新的能力。
哈萨比斯和他的团队也可能尝试用人工智能其他领域的想法来加强大型语言模型技术。DeepMind的研究人员涵盖了从机器人到神经科学等各个领域,本周,该公司展示了一种算法,能够学习用各种不同的机器人手臂执行操纵任务。
谷歌DeepMind的研究人员最近将人工智能与一款名为RoboCat的机器人结合起来,预计将在自我训练机器人方面实现一大跃进。人们普遍认为,像人类和动物那样从世界的物理经验中学习,对于使人工智能更有能力非常重要。一些人工智能专家认为,语言模型通过文本间接地学习世界,是一个主要的限制。
谷歌高层十分重视Gemini
Gemini是DeepMind迄今为止在该领域最有野心的项目。国外科技网站The Information在3月报道称,受谷歌聊天机器人项目巴德(Bard)失败的刺激,为了跟上ChatGPT的步伐,谷歌高层直接参与Gemini的研发,包括该公司最高级的人工智能研究主管杰夫·迪恩(Jeff Dean)。
Gemini的开发完成,可能会让谷歌在与ChatGPT等生成式人工智能技术的竞争中占据优势。尽管谷歌开创了许多技术,并催生了最近的人工智能创新,但它选择了谨慎地开发和部署产品。而到了4月,为了应对越来越激烈的竞争,谷歌将其“谷歌大脑”实验室与哈萨比斯领导的DeepMind合并为Google DeepMind。
哈萨比斯说,新团队将结合两个强大的人工智能团队。“如果你看看我们在人工智能领域的地位,我会说80%或90%的创新来自这两者之一。”哈萨比斯说。“过去十年里,这两个组织都取得了一些杰出的成就。”
哈萨比斯自己曾引发过一场人工智能狂热。2014年,DeepMind被谷歌收购。在接下来的几年里,DeepMind展示了AI如何做到曾经看起来只有人类才能做到的事情。当AlphaGo在2016年击败围棋冠军李世石时,许多人工智能专家都惊呆了,因为他们曾认为,机器要想熟练掌握如此复杂的游戏,还需要几十年。
值得注意的是,Gemini并不是DeepMind进入语言模型领域的第一次尝试。去年,该公司推出了聊天机器人Sparrow,声称它比其他语言模型更不可能给出“不安全”或“不恰当”的答案。哈萨比斯今年1月在接受《时代》采访时说,DeepMind将考虑在今年某个时候发布Sparrow的私人测试版,目前还不清楚这些计划是否仍在进行中。
(本文来自澎湃新闻,更多原创资讯请下载“澎湃新闻”APP)
标签: