学术中心
从基因型到表型:从植物的角度看当前数据管理与数据公开的发展
发布时间:
2022-05-25
来源:
本站
作者:
PhenoTrait
在传统研究中,基因库数据主要为种质数据和表型观测值提供依据,而数字信息技术的发展使整合领域的数据成为可能。综合生物信息学旨在将不同来源的数据信息结合起来从而实现跨领域分析。运用这种方法能够解决单领域分析不可能解决的一些问题。例如,分析基因型特征与表型特征在相同环境背景下的关系。实现这种方法的基本先决条件是数据的有效管理。数据管理是发展数据生命周期概念的核心。在数据生命周期中包含了规划、采集、处理、分析、保存、共享和再利用等不同阶段。在各个阶段中均必须与数据管理进行有序结合。本文以现代植物研究应用为基础,讨论了数据生命周期各阶段与植物信息生物学的关系。研究重点主要在于基因型、表型和环境三个主要的数据类别。内容涵盖了本地数据集管理与公开数据集管理。研究表明,各个不同的基因库数据的互联成为趋势,但创建链接不同信息系统的一致的语义互连标识是未来的主要挑战。为了提高研究效率,开发可重复使用的通用软件以交互式地呈现与可视化数据也是重要发展方向之一。

图1数据周期示意图

图2 基于web的信息系统的抽象架构

图3基因库信息系统的体系结构

图4 不同的数据公开方法

图5 基因组学实验框架下不同数据库的可视化互连
来源:Arend D, Beier S, König P, et al. From Genotypes to Phenotypes: A Plant Perspective on Current Developments in Data Management and Data Publication[M]. Integrative Bioinformatics. Springer, Singapore, 2022: 11-43.
编辑:张金诺
推荐新闻
视频展示