不管是靶向代谢组学还是非靶向代谢组学,在代谢组学中都应用十分广泛,对临床医学而言都有着极为重要的意义,在进行检测的时候,需要按照一定的流程对数据进行处理,本文将以非靶向代谢组学为例来为大家介绍处理数据的基本流程。

1、数据前处理
数据的前处理要从QC样本的检测开始,通过对QC样本的检测来评价系统的稳定性,同时帮助研究者筛选数据。QC样本通常混合等量的所有样本来配制非靶向代谢组学,或样本中添加已知的标准品来充当靶向代谢组学,不能满足要求的变量将会从数据集中排除。
2、对缺失值进行评价
在非靶向代谢组学研究中,由于技术以及样本的原因可能会包含大约20%的缺失值,大量缺失值的存在以及不同的缺失值填充的方法已被证明会对接下来的统计分析产生影响。因此需要对缺失值进行评价,常用的缺失值过滤方法为“80%规则”。
3、统计分析
首先,要做非监督多元统计分析,通常采用主成分分析方法,从而达到直观的观察被分析样本有无天然的分组、检查异常样本在置信区间之外的点、揭示非靶向代谢组学研究中存在的隐藏偏向性的目的,同时,进行统计分析还具备展示样本分类细节信息的作用。
以上就是对非靶向代谢组学数据分析的常用流程所做出的介绍。在实践过程中,有许多实验室会在标记物通过监督分析之后检查所选标记物的差异,看其有无统计学意义。而且,关于标记物的筛选,实验室也可以根据具体的情况使用其他方法,此外,代谢物的鉴定和标记既可以在数据分析结束之后进行也可以在数据分析之前进行。