IBM 和开源 AI 平台 Hugging Face 宣布,IBM 的 watsonx.ai 地理空间基础模型——使用 NASA 的卫星数据构建——现在将在 Hugging Face 上公开提供。它将成为 Hugging Face 上规模最大的地理空间基础模型,也是与 NASA 合作建立的首个开源 AI 基础模型。
在气候科学中,获取最新数据仍然是一个重大挑战,因为环境条件几乎每天都在发生变化。尽管数据量不断增长——NASA 的估计显示,到 2024 年,科学家将从新任务中获得 250,000 个 TB 的数据 —— 但科学家和研究人员在分析这些大型数据集方面仍面临障碍。
作为与 NASA 签订的《Space Act Agreement》的一部分,IBM 今年早些时候着手构建了一个用于地理空间数据的 AI 基础模型。通过 Hugging Face 提供地理空间基础模型——这是一个公认的开源领导者,也是所有 Transformer 模型的知名仓库——努力可以推进 AI 的开放性访问和应用,并在气候和地球科学中产生新的创新。
IBM Research AI 副总裁 Sriram Raghavan 表示:「开源技术在加速气候变化等关键领域的发现中所起到的重要作用从未如此清晰。」「通过将 IBM 旨在创建灵活、可重用的 AI 系统的基础模型工作与 NASA 的地球卫星数据仓库相结合,并在领先的开源 AI 平台 Hugging Face 上提供,我们可以利用协作的力量来实施更快捷、更有影响力的解决方案,改善我们的星球。」
Hugging Face 的产品和增长负责人 Jeff Boudier 表示:「AI 仍然是一个以科学为驱动的领域,而科学只能通过信息共享和合作取得进展。」「这就是为什么开源 AI 和模型和数据集的开放发行对于 AI 的持续进展非常重要,以确保技术能够惠及尽可能多的人。」
NASA 首席科学数据官 Kevin Murphy 表示:「我们相信基础模型有潜力改变观测数据分析的方法,并帮助我们更好地了解地球。」「通过开源这些模型并使它们对世界开放,我们希望能够放大它们的影响力。」
这个模型是由 IBM 和 NASA 共同在一年时间内使用 Harmonized Landsat Sentinel-2 卫星数据(HLS)进行联合训练,并在对洪水和烧伤瘢痕制图进行标注的数据上进行了精细调整。与使用一半标注数据的最先进技术相比,该模型迄今为止已经表现出 15% 的改进。通过进一步的精细调整,基础模型可以用于跟踪森林砍伐、预测农作物产量或检测和监测温室气体等任务。IBM 和 NASA 的研究人员还在与克拉克大学合作,将该模型调整为用于时间序列分割和相似性研究等应用。
该模型利用了 IBM 基础模型技术的优势,是 IBM 努力创建和训练可用于不同任务、并且可以将信息从一种情况应用到另一种情况的 AI 模型的一部分。
今年 7 月,IBM 宣布提供 watsonx,一种 AI 和数据平台,允许企业通过可信赖的数据来扩大和加速最先进的 AI 的影响力。IBM watsonx 的地理空间模型的商业版本将于今年晚些时候通过 IBM Environmental Intelligence Suite(EIS)提供。
IBM 和 NASA 在 Hugging Face 上的地理空间 AI 模型:
https://huggingface.co/ibm-nasa-geospatial
评论列表 (条)