近日,分子生态学领域国际权威学术期刊《Molecular Ecology Resources》发表了北师大虎豹团队的最新研究成果,关于如何利用高通量测序的序列数反映动物的食性偏好。
动物的食性组成和偏好是生态系统物质和能量循环的基础,也是濒危动物保护的重要背景资料。近年来,利用动物粪便、借助高通量测序和宏条形码技术被越来越多的应用于野生动物的食性分析中,然而高通量测序所获得的各食物物种的序列数在多大程度上能反映动物真实的食性偏好,以及如何校准序列数中的偏差,仍然是目前分子食性研究中悬而未决的问题。在本文,作者通过模拟的植物群落以及已知食物比例的饲喂实验,探讨了如何利用序列数反映动物的食性偏好。
该研究以东北虎豹国家公园重要的大型食草动物梅花鹿为实验对象,饲喂实验在东北虎豹生物多样性国家野外科学观测研究站的里化基地进行。通过饲喂13种已知进食比例的植物,采集其粪便,利用常规的分子食性分析流程获取每个进食物种的序列数,我们发现序列数和初始进食比例具有显著的相关性,且序列数比分子食性分析中的另外一个常用指标——序列发生频率(Frequency of occurrence, FOO)相关性更高(图1)。这说明序列数比FOO更适合反映像梅花鹿这种食性广泛物种的食性偏好。然而即使是序列数反映的进食比例,其和真实进食比例仍存在偏差,如何校准序列数和真实进食比例的偏差呢?
图1 a,c分别代表在粪便样品中的进食预期比例与发生频率(FOO)、序列数之间的相关性;
很多因素可以造成序列数和真实进食比例间的偏差,主要包括食物物种间的组织差异(组织内DNA含量、条形码基因的拷贝数、引物匹配程度、其他组织化学组成差异的影响等)和消化差异(不同物种经过动物消化道后的消化程度差异)等。由于消化差异的校正需要组织偏差校正信息,所以本研究重点探讨如何校正序列数中的组织偏差。在既往少有的建议中,一般采取使用某一种组织差异指标进行校正,比如细菌中16s rDNA的拷贝数。2016年,Deagle提出一种综合的组织偏差校正指标RCF,反映不同物种间从DNA含量、PCR过程到生物信息分析过程产生序列数能力的差异。显然RCF比单一指标能更准确的反映物种间的综合差异,然而RCF能应用多广,以及分子实验过程中的物种间相互作用如何影响校正却未知。为了探讨什么样的指标更适合进行组织偏差校正,以及物种间相互作用如何影响组织偏差校正,本研究设计了4种不同大小的模拟群落,分别是群落中只含1个(MC1)、2个(MC2)、3个(MC3)、5个(MC5)物种,并提出了两类综合的组织偏差校正指标——单位组织序列数(SCN)和其比值形式(SCN ratio),Deagle提出的RCF是SCN ratio的一种特殊情况。
因为MC1在分子实验过程中只有一个物种,不存在物种间相互作用,所以SCN-MC1,SCN ratio-MC1反映的是物种间的纯组织差异。我们发现尽管SCN、SCN ratio值方差较大,物种间的差异可能是相对稳定的,尤其是产生序列数比较少的物种,其SCN、SCN ratio值较为稳定,而且这种差异与植物的中性水洗纤维含量和钙离子含量具有显著的相关性。尽管从MC1得到的SCN-MC1,SCN ratio-MC1反映的是物种间的纯组织差异,物种间的数值差异较小,且其在校正MC3,MC5以及粪便群落的组织偏差效果一般(图2)。
图2 a-c分别代表预期群落与MC3、MC5和粪便样品群落之间的欧氏距离。包括利用不同大小的模拟群落计算出的指标进行校正和未校正的结果。红、绿、黑线分别表示校正后欧氏距离的增加、减少和不变。 “*”表示校正前后欧氏距离变化显著。(p < 0.05)。
反观从MC2,MC3,MC5中得到的各物种的SCN、SCN ratio值, 在存在物种相互作用的情况下,各物种间序列数差异明显变大,这反映物种相互作用可以增强物种间的组织差异,而这种增强在组织偏差校正中是一把双刃剑。一方面,当待校正群落和形成校正指数的群落间物种相互作用相似时,校正效果较好,这既表现在MC2校正MC3,MC5校正粪便的总体表现上(图2 a,c),降低了待校正群落和期望值间的差异;也表现在MC2校正MC3的62个不同物种组合群落时,MC2和MC3的群落距离越小,MC2校正MC3的效果越好,而且这种关系在MC2和MC3的群落距离小于1时更明显(图3 c,d,g,h)。另一方面,当待校正群落和形成校正指数的群落间物种相互作用差异较大时,校正效果可能会放大待校正群落和期望值间的差异。此外,因为SCN ratio计算时,需要控制物种的信息,因此SCN ratio校正比SCN更容易受到待校正群落和形成校正指数的群落距离的影响,当群落距离较大时,SCN ratio有更高概率得到极差的校正效果。
图 3 利用MC1、MC2生成的SCN、SCN ratio指数校正目标群落MC3后,MC1、MC2与MC3的群落差异与校正效果之间的关系。“All”为基于所有数据点计算相关性,“<1”为基于群落差异小于1的数据点计算相关性。n表示所用数据点的数量。“*”和粗体表示相关性显著(p<0.05)。群落差异是指目标群落与形成指数的群落的SCN ratio经对数转换后的绝对平均差。标准化校正效果的负值表示校正后的欧氏距离减小,正值表示校正后的欧氏距离增大。标准化校正效果的负值越小,校正效果越好。同样,正值越大,校正效果越差。
根据本研究结果,我们给未来的组织偏差校正以下建议:
(1) 可以利用MC1模拟群落评估物种间的纯组织差异大小,进而评估利用纯组织差异进行组织校正的可能效果;
(2) 对大部分类群而言,建立一个和待校正群落更相似的模拟群落,从其中获得校正指数是一个更好的策略。SCN和SCN ratio这两类校正指数并无绝对的优劣,SCN ratio可能在相似群落中有更好的表现,但是SCN更稳定;
(3) 实验过程中,尤其是早期样品混合、DNA提取和PCR过程中随机作用较大,因此应在早期步骤中增加样本量。
该研究于近日正式发表在中科院一区Top刊物《Molecular Ecology Resources》上(2022年影响因子8.678)。bat365官网登录入口体育生态学博士研究生朱頔为该论文的第一作者,王红芳副教授为通讯作者。该研究得到了国家科技基础资源调查专项 (2019FY101700)、国家自然科学基金项目(32071494,31770410)的支持。
文章链接:https://onlinelibrary.wiley.com/doi/epdf/10.1111/1755-0998.13700?saml_referrer