学术中心
AgriBench:多模态大型语言模型的分层农业基准
发布时间:
2025-02-28
来源:
作者:
本文介绍了农业基准(AgriBench),这是首个为评估农业应用中的多模态大型语言模型(MM-LLMs)而设计的农业基准。为了进一步解决基于农业知识的数据集限制问题,我们提出了MM-LUCAS,这是一个多模态农业数据集,包括1,784幅景观图像、分割掩膜、深度图和详细注释(地理位置、国家、日期、土地覆被和土地利用分类详情、质量评分、美学评分等),该数据集基于土地利用/覆被区域框架调查(LUCAS)数据集,其中包含欧盟(EU)领土上土地利用和土地覆被的可比统计数据。这项工作提出了推进农业MM-LLMs的开创性观点,目前仍在进行中,为基于特定专家知识的MM-LLMs的未来发展和创新提供了宝贵的见解。













来源
Zhou Y, Ryo M. AgriBench: A Hierarchical Agriculture Benchmark for Multimodal Large Language Models. arXiv preprint arXiv:2412.00465, 2024.
编辑
王三三
推荐新闻
本期石时之约,我们将对话慧诺瑞德(北京)科技有限公司总经理、国际植物表型学会(IPPN)执委会委员/工业分会副主席韩志国,一起从表型数据的科学角度,去读懂农作物的喜怒哀乐和前世今生。
让我们“慧聚”在一起,为“慧科研、慧育种、慧种田”赋能。
育种,是在给定的环境条件下,选择各种表型指标(产量、品质、抗性)最优的基因型材料的过程(AI育种,从这里起步)。育种工作中大约70%的工作量来自表型观察测量和筛选,是最耗人力物力的过程。
生理表型测量的核心在于“早、快”,要在肉眼可见之前就能测量并预判出变化趋势,才是这个技术的核心价值。叶绿素荧光成像,恰好满足了这个要求。
视频展示