Ready, Steady, Go AI:人工智能及其在表型组学中应用的实用教程


发布时间:

2021-09-17

来源:

本站

作者:

PhenoTrait

  基于图像的高通量技术现在被广泛应用于快速发展的数字表型组学领域,并产生越来越多的数据量和多样性。人工智能(AI)正在改变游戏规则,将浩瀚的数据海洋转变为有价值的预测和见解。然而,这需要专业的编程技能和对机器学习、深度学习和集成学习算法的深入理解。

 

  本教程(Ready, Steady, Go AI)旨在介绍在基于图像的数据分析(图1)中介绍AI和可解释人工智能(explainable AI,X-AI)算法的基本原理,使用PlantVillage数据集作为案例研究,准确识别和分类番茄叶部病害和叶螨,并解释使用哪些视觉症状进行预测,如图3。

 

  图1 植物数据科学社区的实用人工智能教程

 

  本互动在线教程为学生和早期职业研究人员提供了帮助,通过易于遵循的四步工作流程,有效地学习从成像数据和基础解释中提取具有生物学意义的信息(图2),教程链接到多个AI资源,并提供开放Jupyter notebooks资源。

 

  本教程涵盖的主题包括

     1. 植物数据科学界可用的工具、技术和服务;

     2. 如何自动化叶片检测、裁剪和分割;

     3. 如何通过欠采样和过采样来平衡数据集;

     4. 如何将叶片图像分类为健康、患病或受损害的叶螨;

     5. 如何验证模型;

     6.  如何生成解释。

 

  本教程还总结了可用开源软件框架、开源软件库的代表性列表。

 

  图2 从选择到预处理、分析和解释,针对典型数字表型组学实验提出的基于X-AI的图像分析工作流的示意图概述

  

图3 在提出的基于X-AI的图像分析工作流的每一步中,教程输出的可视化

 

  Ready, Steady, Go AI不仅仅是一种培训和学习工具,用于推动正在进行的和可能的未来生物技术创新;它也有助于激励研究生和早期职业研究人员参与共同制作的研究,创造空间与有共同兴趣的人一起工作。

 

  本教程的代码在可在Google Colab上运行并保存在GitHub上,链接地址:

  https://github.com/HarfoucheLab/Ready-Steady-Go-AI

 

  原始PlantVillage数据集链接地址:https://doi.org/10.17632/tywbtsjrjv

 

  经过处理的数据,包括裁剪和分割的图像,以及经过训练的人工智能模型链接地址:

  https://doi.org/10.17632/4g7k9wptyd

 

  上述链接可下载的内容包括:

  •   数据集的随机拆分版本(80% 训练、10% 验证和 10% 测试)。
  •   1000 个带边界框的带注释的图像,用于在裁剪叶子图像上训练 YOLOv3。
  •   150 个带分割掩码的带注释的图像,用于在分割叶图像上训练 SegNet。
  •   分割数据集的裁剪版本。
  •   裁剪和分割数据集的分段版本。
  •   分割、裁剪和分割数据集的平衡版本,每类平衡到大约1500 张图像。
  •   训练好的 YOLO、SegNet、DCGAN、RF、DCNN 和预训练的 Densenet-161 DCNN 模型。

 

  来源: Nakhle F, Harfouche AL. Ready, Steady, Go AI: A practical tutorial on fundamentals of artificial intelligence and its applications in phenomics image analysis. Patterns 2021, 2(9):100323.

 

  编辑: 王春颖

推荐新闻

石时之约|韩志国:透过表型数据,看见植物的喜怒哀乐!

本期石时之约,我们将对话慧诺瑞德(北京)科技有限公司总经理、国际植物表型学会(IPPN)执委会委员/工业分会副主席韩志国,一起从表型数据的科学角度,去读懂农作物的喜怒哀乐和前世今生。

慧科研、慧育种、慧种田——慧聚改变的力量

让我们“慧聚”在一起,为“慧科研、慧育种、慧种田”赋能。

高通量植物表型平台建设注意事项

育种,是在给定的环境条件下,选择各种表型指标(产量、品质、抗性)最优的基因型材料的过程(AI育种,从这里起步)。育种工作中大约70%的工作量来自表型观察测量和筛选,是最耗人力物力的过程。

作物生理表型测量基础原理

生理表型测量的核心在于“早、快”,要在肉眼可见之前就能测量并预判出变化趋势,才是这个技术的核心价值。叶绿素荧光成像,恰好满足了这个要求。