谷歌的人工智能天气预报模型相当不错
2015 年内布拉斯加州彭德附近的一场龙卷风。照片:NOAA 2015 年天气焦点摄影大赛 | Brent Koops
明天太阳还会照常升起,你不再需要孤注一掷地相信它。谷歌的 DeepMind 团队本周发布了最新的天气预报模型,在绝大多数测试中,该模型的表现都优于领先的传统天气预报模型。
该生成式人工智能模型被称为 GenCast,它是一种扩散模型,类似于 Midjourney、DALL·E 3 和 Stable Diffusion 等流行人工智能工具所依赖的模型。根据该团队的测试,GenCast 在预测极端天气、热带风暴的移动以及地球广阔土地上阵风的强度方面表现更佳。该团队对 GenCast 性能的讨论于本周在《自然》杂志上发表。
GenCast 与其他扩散模型的不同之处在于,它(显然)以天气为中心,并且“适应地球的球形几何”,正如该论文的几位合著者在DeepMind 博客文章中所描述的那样。
GenCast 的输入不是诸如“以萨尔瓦多达利的风格画一幅腊肠犬的画”这样的书面提示,而是最新的天气状况,然后模型会使用该输入来生成未来天气情景的概率分布。
传统天气预报模型,如欧洲中期天气预报中心领先的模型ENS ,通过求解物理方程来进行预报。
谷歌 DeepMind 高级研究员、该团队最新研究成果的主要作者 Ilan Price 在给 Gizmodo 的一封电子邮件中表示:“这些传统模型的一个局限性是,它们解决的方程仅仅是大气动力学的近似值。”
GenCast 的第一批种子于 2022 年种下,但本周发布的模型包括架构变化和改进的扩散设置,使得模型能够更好地预测地球天气,包括极端天气事件,最长可达 15 天。
“GenCast 并不局限于学习那些确切已知并可以写成方程式的动态/模式,”Price 补充道。“相反,它有机会直接从数据中学习更复杂的关系和动态,这使得 GenCast 的表现优于传统模型。”
谷歌一直在研究天气预报,近年来,在使用人工智能方法进行更精确的预报方面取得了一些实质性的进展。
去年,DeepMind 的科学家(其中一些人是这篇新论文的合著者)发布了 GraphCast,这是一种基于机器学习的方法,在 90% 的测试目标上,其表现优于当前的中期天气预报模型。就在五个月前,一个主要由 DeepMind 研究人员组成的团队发布了NeuralGCM,这是一种混合天气预报模型,将传统的基于物理的天气预报器与机器学习组件相结合。该团队发现,“端到端深度学习与传统 [模型] 执行的任务兼容,并且可以增强对理解和预测地球系统至关重要的大规模物理模拟。”
GenCast 实现的分辨率大约是 NeuralGCM 的六倍,但这是意料之中的。“NeuralGCM 被设计为一种通用大气模型,主要用于支持气候建模,而 GenCast 的更高分辨率通常用于中期预报模型,这是 GenCast 的特定目标用例,”Price 补充道。“这也是我们强调广泛评估的原因,这些评估是中期预报的关键用例,例如预测极端天气。”
飓风米尔顿登陆佛罗里达州东部,雷暴单体造成严重破坏。图片来源:NOAA / CIRA
在最近的工作中,该团队利用 2018 年的历史天气数据对 GenCast 进行了训练,然后测试了该模型预测 2019 年天气模式的能力。使用不同的天气变量,在天气事件发生前的预测时间各不相同,GenCast 在 97.2% 的目标上的表现优于 ENS;当预测时间超过 36 小时时,GenCast 在 99.8% 的目标上比 ENS 更准确。
该团队还测试了 GenCast 预测热带气旋路径的能力,特别是 2019 年 10 月袭击日本的台风哈吉比斯,这是 2019 年造成损失最大的热带气旋。GenCast 的预测在七天的预测时间内非常不确定,但在更短的预测时间内变得更加准确。随着极端天气产生更潮湿、更大的降雨,飓风的加剧速度和形成季节的早期都创下了纪录,准确预测风暴路径对于减轻其财政和人员损失至关重要。
但这还不是全部。在研究中描述的原理验证实验中,DeepMind 团队发现,GenCast 在预测全球发电厂数据库中 5,000 多个风力发电场的总风力发电量方面比 ENS 更准确。GenCast 的预测比 ENS 好约 20%,提前时间为两天或更短,并且在长达一周的时间内仍保持统计上显著的改进。换句话说,该模型不仅在减轻灾害方面具有价值——它还可以告诉我们在哪里以及如何部署能源基础设施。
ECMWF 发言人在发给 Gizmodo 的电子邮件声明中表示:“机器学习天气预报 (MLWP) 模型 GenCast 的开发标志着天气预报发展的一个重要里程碑,正如最近的 Google DeepMind 论文所强调的那样。”“GenCast 是来自世界各地的一系列关于 MLWP 的备受瞩目的科学论文中评论的最新机器学习模型之一,这些论文强调了天气预报的持续 (r) 演变。”
ECMWF 声明指出,GenCast 论文还将模型的性能与 ENS 11 英里(18 公里)分辨率进行了比较。五年后的今天,ENS 的分辨率为 5.6 英里(9 公里)。“GenCast 论文从机器学习的角度展示了创新科学,但这些改进必须经过测试,以了解它们在极端天气事件中的表现,才能充分认识到它们的价值,”声明总结道。
所有这些对你来说意味着什么,你只是偶尔关注气候吗?好吧,DeepMind 团队已经将 GenCast 代码开源,并将模型用于非商业用途,因此如果你好奇的话,你可以随意使用。该团队还致力于发布历史和当前天气预报的档案。
“这将使更广泛的研究和气象界能够参与、测试、运行和巩固我们的工作,从而加速该领域的进一步发展,”普莱斯说。“我们已经对 GenCast 进行了微调,以便能够接受操作输入,因此该模型可以开始纳入操作设置。”
目前尚无关于 GenCast 和其他模型何时投入运行的时间表,但 DeepMind 博客指出这些模型“开始为 Google 搜索和地图上的用户体验提供支持”。
无论您来这里是为了天气还是 AI 应用,GenCast 和更广泛的 DeepMind 预测模型套件都有很多值得欣赏的地方。此类工具的准确性对于预测极端天气事件至关重要,并有足够的提前量来保护处于危险中的人们,无论是阿巴拉契亚山脉的洪水还是佛罗里达的龙卷风。