生物基因特征图(人类发育细胞图谱的路线图)
生物基因特征图(人类发育细胞图谱的路线图)尽管如此,支持人类发展研究的资源(例如英国的人类发展生物学资源 (HDBR) 25)为研究人员提供了材料。不在英国的 HBDR 组织接受者在接收材料之前需要他们自己的项目特定的伦理批准。HDBR 提供受孕后 4 至 20 周的胚胎和胎儿样本,其中包含核型信息,并且越来越多地提供匿名的母体 DNA 和临床病史。也可以使用来自患有产前诊断出的疾病的胎儿的材料。法国人类发育细胞图谱 (HuDeCA) ( https://hudeca.genouest.org ) 最近成立,旨在构建一个全面的欧洲人类胚胎或早期胎儿样本资源。获取人类发育样本受到一般和特定地域的伦理和法律挑战的限制。其中包括与捐赠、获取和研究使用合法定义的人体组织材料、监管审批流程和文化敏感性相关的问题。欧洲和国家法规支持对人类胚胎和胎儿的研究,例如英国国家研究伦理服务 (NRES) 和法国生物医学机构。在英国,人类受精和胚胎学管理
抽象的人类发育细胞图谱 (HDCA) 计划是人类细胞图谱的一部分,旨在创建发育过程中细胞的综合参考图。这对于理解正常的器官发生、突变、环境因素和传染因子对人类发育、先天性和儿童疾病的影响以及衰老、癌症和再生医学的细胞基础至关重要。在这里,我们概述了 HDCA 计划以及使用最先进的技术绘制和模拟人类发展以创建跨妊娠参考图谱的挑战。与人类基因组计划类似,HDCA 将把越来越多的科学家的成果整合到一个统一的图谱中。我们描述了已实现的早期里程碑,以及使用人类干细胞衍生的培养物、类器官和动物模型为 HDCA 提供信息,特别是对于难以获得的产前组织。最后,我们提供了一个完整的人类发展地图集的路线图。
主要的大多数现代发育生物学研究历来都集中在模式生物上。由于实际挑战,人类发育——从受精卵到出生时完全成形的胎儿——仍然是一个知之甚少的“黑匣子”。人类发育细胞图谱为理解人类发展的影响是深远的,因为许多先天性疾病和儿童癌症可以在发展的敏感窗口源于1,2,3。该图谱的临床相关性延伸至成年期,适用于衰老、癌症以及再生医学和干细胞疗法的应用4 5 6。此外,胚胎和胎儿干细胞7,8和发展轨迹提供一种必要的参考和引导工程人类干细胞来源模型9,10,11,12,13,类器官14和细胞疗法。
人类发育始于受精卵母细胞,该母细胞通过植入前、胚胎和胎儿阶段进行分裂和分化(图1)。早期研究开始于人类胚胎的形态测量和定性评估,导致卡内基分期系统15(图1)的发展。成像、细胞计数和基因组学技术的进步为器官发生过程中复杂的时空变化提供了进一步的见解16。单细胞分析技术的最新进展彻底改变了我们以前所未有的分辨率研究人类发展的能力17. 利用这些进展以细胞分辨率构建人类发育(从受精卵母细胞到出生)的综合图谱是一项雄心勃勃的努力,其规模与人类基因组计划相似,后者需要来自不同领域的多学科科学专业知识共同协作。这样的社区来自全球研究人员的基层大会,他们作为人类细胞图谱 (HCA) 18计划的一部分工作。与人类基因组计划一样,HCA 将成为基础科学资源,由多种数据类型组成,可通过可浏览和可搜索的门户网站免费获取,这些门户网站将细胞在解剖空间和发育时间上可视化。
HDCA 是 HCA 19的战略重点,由来自各个实验室以及大型国家和国际研究联盟的科学家所追求(补充表1);HDCA 向所有坚持其使命和开放科学价值观的人开放20。HDCA 旨在在科学参与和人体组织样本的代表性方面实现公平、包容和多样性。我们鼓励任何感兴趣的研究人员成为会员、参与、注册他们的研究并将他们的数据和出版物贡献给 HDCA 和 HCA 21。
构建发育细胞图谱HDCA的成功构建在实验测量技术、计算分析和可视化算法方面提出了巨大的科学挑战(图2)。特别是,妊娠的动态性质给设计采样策略带来了挑战,尤其是在前八周捕捉瞬态形态变化。HDCA 的一项主要工作是开发概念和计算框架,以捕捉细胞和形态变化方面的发展。HDCA 通过与 HCA 类器官网络22协调,将整合来自体外培养模型和类器官系统的数据23谨慎推断受孕后 7 天至 4 周之间的发育(样本难以获得的时期)(图1b、c)。
a,“如何构建地图集”模块,包括跨学科团队(生物学科、临床专业、计算科学家和技术工程师)、多模式技术和跨平台数据集成。乙 HDCA 的主要特点。跨三维空间(连同时间的第四维)的单细胞测量允许捕获动态发育过程,包括细胞增殖、迁移和调节。空间扩展捕捉细胞增殖(器官大小和形状的变化),以及形态发生的感知和控制;时空事件包括细胞分化和复制,以及细胞组成和基因表达的变化。排列和变异概述了细胞分化的空间决定因素、机械粘附反馈和配体的异细胞信号传导。时间序列轨迹揭示了偏向命运的迁移祖细胞、谱系规范和细胞迁移。CHDCA 的效用和应用:对整个胚胎器官发育协调的细胞和分子生物学见解(左)用于推进再生医学、组织工程和治疗策略(右)。
HDCA 的成功交付将利用人类基因组计划发起的对大型科学项目的资助、实施、协调和共享方式的重组(基于劳德代尔堡原则24),这构成了 HCA、其委员会(例如、计算和伦理)和“生物网络” 20. 这种组织框架使研究人员能够形成跨技术和生物学科的大规模协同合作:发育生物学、胚胎学、遗传学和模型系统、计算生物学、临床专业(包括体外受精)、临床遗传学和病理学,以及协调与资助者。与相关生物网络的合作伙伴关系,包括类器官和儿科地图集项目,将促进临床应用。
道德、资源和数据共享获取人类发育样本受到一般和特定地域的伦理和法律挑战的限制。其中包括与捐赠、获取和研究使用合法定义的人体组织材料、监管审批流程和文化敏感性相关的问题。欧洲和国家法规支持对人类胚胎和胎儿的研究,例如英国国家研究伦理服务 (NRES) 和法国生物医学机构。在英国,人类受精和胚胎学管理局和研究伦理委员会(如 NRES)负责对人类胚胎植入前(受孕后最多 14 天)的研究。然而,在美国,在过去的二十年里,对捐赠的人类胚胎和胎儿材料的研究越来越受到限制,
尽管如此,支持人类发展研究的资源(例如英国的人类发展生物学资源 (HDBR) 25)为研究人员提供了材料。不在英国的 HBDR 组织接受者在接收材料之前需要他们自己的项目特定的伦理批准。HDBR 提供受孕后 4 至 20 周的胚胎和胎儿样本,其中包含核型信息,并且越来越多地提供匿名的母体 DNA 和临床病史。也可以使用来自患有产前诊断出的疾病的胎儿的材料。法国人类发育细胞图谱 (HuDeCA) ( https://hudeca.genouest.org ) 最近成立,旨在构建一个全面的欧洲人类胚胎或早期胎儿样本资源。
来自产前或儿科组织样本的基因组测序和临床数据的国际共享受数据保护法规的约束,该法规考虑了生者与死者的状态、研究数据使用的同意和保密性。来自活体捐赠者的数据在适当的访问控制下共享。HCA 伦理工作组正在开发工具、指导说明26、胚胎、胎儿和儿科组织材料的同意书模板和采样信息,以及 HDCA 的国际数据共享指南。
绘制跨越时空的发展图发展在三个空间维度和孕育时间中错综复杂地编排。人类胚胎发生不能很容易地在体内27高分辨率评估。延时研究仅限于体外植入前胚胎。将高通量基因组学技术应用于原位解离细胞和组织切片,开始提供前所未有的分辨率数据(图3,表1)。
基于 RNA、染色质可及性、甲基化或特定蛋白质特征的单细胞分子图谱使细胞类型和状态的定义更加细致入微。支持这些定义的数据越来越多地来自单细胞 RNA 测序 (scRNA-seq)、条形码抗体和分离细胞的可访问染色质测序28 29. 全长 scRNA-seq 有助于以高粒度解析细胞类型和轨迹,但主要通过分析大量细胞来执行。细胞类型的定义目前由模型生物和成体细胞谱的现有知识指导,这些知识可能无法忠实地反映产前细胞类型、仅在发育和分化过渡状态期间存在的瞬态细胞类型。
为了克服这些挑战,需要分析许多时间点,并且需要随着时间的推移将定义的细胞状态映射回其 3D 空间并进行功能表征。复用的高层次可以以合理的成本达到这一级别的粒度的一个完整的人类发育细胞图谱30,31。分子概况、形态、功能评估和其他特征可以反映细胞的多方面状态。例如,转录组反映了细胞的现在和潜在的未来;蛋白质表达捕捉细胞的过去和现在的状态;染色质图谱揭示了其不变的类型和未来分化的潜力;个体发育揭示了它的历史。
发育生物学领域传统上利用个体发生关系来定义细胞类型,但这对于将信息作为整个妊娠期的快照捕获的人类来说具有挑战性。CRISPR疤痕仅适用于干细胞,类器官系统和短期外植体32,33。体细胞突变的跟踪是确定个体发育的唯一可用技术,但受到其当前缺乏可扩展性的限制34 35。最近依赖于同时测量线粒体 DNA 和 RNA、转录组和开放染色质的方法可能会克服这一挑战36 37. 我们预计该领域将朝着一致的细胞本体发展,该本体整合了多模式单细胞分析数据以及胚胎细胞类型定义的遗留知识,这些知识由来自不同动物模型的信息增强。
在 2D 和 3D 中映射单元格测量组织切片中 RNA 的空间基因组学方法通常提供一种权衡:高分辨率(单细胞和亚细胞)方法,通常在多细胞水平上测量数百个转录本或整个转录组谱38 39。这种权衡可以通过与来自解离细胞的单细胞图谱整合来减轻,通过预测未测量基因的空间表达来扩大基因组覆盖范围或通过多细胞测量的解卷积提高分辨率。使器官透明的组织清除方法40,结合整体蛋白免疫染色和 RNA 单分子荧光原位杂交 (FISH) 41 42,现在可以提供3D在使用光片显微镜细胞或亚细胞分辨率分子谱43,44,45。提高复用能力和使用人工智能和机器学习算法来克服数据分析挑战接下来的纸巾清理已成功部署到图像全有机体的脉管系统46,47。
生物物理方法和实时成像来自果蝇和其他模型的越来越多的证据表明,机械力在发育过程和组织形态发生48 中具有关键作用。可以在植入前小鼠胚胎49 的单个细胞中测量表面张力和压力。将这些技术应用于人类植入前胚胎和基于干细胞的胚胎模型50可以构建时空机械图谱。
发展中的地标人体位置的标准坐标系(通用坐标框架 (CCF))对于 HCA 和 HDCA 51至关重要. 有两种类型的系统很有用:绝对(类似于邮政编码或邮政编码地址)和相对(类似于基于地标的地址系统)。CCF 解剖“邮政编码”能够整合不同空间和纵向分辨率的多模态数据集。Allen Mouse Brain Reference Atlas 版本 3 提供了按层次结构分组的 3D 解剖特征和局部特征的 CCF,以促进对小鼠大脑的多级分析。目前正在努力在国家卫生机构 (NIH) 的人类生物分子图谱计划内为成人器官建立 CCF。HDCA 将需要在现有的人类胚胎宏观 3D 坐标(例如 HDBR 图集)的基础上,开发一个 CCF,该 CCF 包含空间和时间,以及器官发生过程中的细胞运动和模式。http://hdbratlas.org/)和透明人类胚胎(https://transparent-human-embryo.com/))。
计算和数据可视化将数据整合到发育图谱中的关键算法挑战包括 (1) 与成人对应物相比,绘制具有更多中间状态的细胞;(2) 推断时间顺序和谱系关系,包括分支谱系和收敛于同一结果的多条路径;(3) 推断细胞的空间运动;(4) 构建 CCF 的时间序列,每个作为时间窗口的概率模型以及它们沿空间和时间的变形模型52; (5) 跨模式和时间点的映射(例如,将一个时间窗口中的染色质状态映射到另一个时间窗口的 RNA 和蛋白质水平);(6) 细胞内和细胞间的调控和分子网络推断。需要来自多个领域的理论和见解来模拟支持组织形成和生长的机制。使用跨学科方法很可能会发现细胞及其生态系统的其他新兴特性。这些将需要理解新的词汇表、本体论和建模方法。HDCA 社区还必须应用 FAIR(可查找性、可访问性、互操作性和可重用性)原则来帮助确保可重复性和数据可访问性53。
多组数据的计算集成,用于类似于 Google Maps 的可视化,例如开放显微镜环境 ( https://www.openmicroscopy.org/ ),将能够从大体积组织放大到单细胞水平看法。额外的复杂性将结合来自成像和测序数据的可视化。以发展性 CCF 为基础的原始数据的复杂抽象和跨模式的整合将是必不可少的。与临床相关性和应用的链接将增强图谱的实用性。
人类发育的新兴细胞图谱与以谱系为中心的分析相比,全组织或器官分析的优势包括全面的细胞分析和新兴生物学特性的发现。例如,发育中的肝脏在妊娠早期起到造血器官的作用,直到中期妊娠中期,然后它在功能上转变为类似于成人肝脏的代谢器官54。为了满足开发过程中红细胞生成的高要求,对人体皮肤和肾上腺也可以在第一孕期支持红细胞成熟54,55。
与我们在陆地上的出生后生活相反,人类胚胎和胎儿存在于水生环境中:我们的肺、肠道和皮肤暴露在羊水中。与出生后的肺相反,发育中的肺不执行氧气转移或通过肺静脉接收相同体积的血液。这些生理因素对个体组织的影响以及胎盘和母体蜕膜在支持人类胚胎发生和胎儿生命中的作用正在显现56 57。
当前大脑、肠道、心脏、肝脏、肾脏、胎盘、胸腺和皮肤的器官图谱(表1)强调了研究人类样本的重要性,并揭示了人类发育的独特方面,这些方面在动物模型系统中是不保守的58、59、60,61。这些包括在妊娠期间发展时间表,细胞类型标记和小鼠和人的器官之间的转录因子的表达模式62,63。
功能组织生态位的规范发生在产前和产后生活。对胎儿肠道的研究强调了上皮和间充质区室之间相互作用对绒毛形成的重要性,并且已经确定了在患有小儿克罗恩病的个体中异常激活的胎儿肠道转录因子64。发育中和成人肾脏之间的比较表明,建立了专门的空间分区模式,可以防止出生后尿路致病细菌的挑战61 65。生殖细胞在发育过程中的单细胞转录组学为控制其分化的主要途径提供了重要的见解66,67,正在进行的研究侧重于探索性别决定的调节机制( https://hugodeca-project.eu)。
早期大脑发育研究都集中在人和灵长类动物皮质发育68,69,70。发育中的人类和啮齿动物中脑,其中包含在帕金森病个体中丢失的临床相关多巴胺能细胞群,也得到了广泛的研究63 71 72,以及发育中的小鼠脊髓和小脑73 74、下丘脑。弓状核和间脑75 .
分布式系统(例如免疫系统)的地图集已经启动,详细描述了造血器官,例如卵黄囊76、77和肝脏54,淋巴组织(例如胸腺(T 细胞在其中分化)78和非淋巴组织,例如皮肤和肾脏,免疫细胞驻留在其中。这些研究揭示了造血干祖细胞的分化潜能随妊娠时间的内在变化,以及局部组织微环境对血液和免疫细胞发育的重要性。
模式生物和培养系统我们对人类发展的理解很大程度上是从动物模型系统的研究中推断出来的,这些系统在物种79中并不总是保守的(图1)。最近的两项研究对比了人类和小鼠之间的发育动力学,强调在解释异种特异性移植研究和非灵长类临床前模型的发现时需要谨慎80 81。然而,使用动物模型和培养系统进行扰动和深入机制研究的可行性提供了一个有价值的支架并补充了 HDCA,特别是在植入后的几周内,在此期间无法获得人体样本。
单细胞分子谱已经改变了所有主要模式生物的发育生物学研究的许多方面82 83 84 85 86,提供了对基本生物过程(包括胚层的早期规范和早期心血管细胞的多样化)的机械见解。29 87. 比较生物学有可能为细胞本体论做出重大贡献。平行人类和模型物种数据的可用性将支持扩展的跨物种分析。计算分析可以对齐跨物种的细胞和推断的谱系,以推断非灵长类动物模型的发现,并有助于优化正常和病理人类发育的动物模型。从计算的角度来看,开发工具以更好地注释动物模型数据的 3' 和 5' 非翻译区域非常重要,因为大多数 scRNA-seq 技术仅捕获这些区域。需要开发计算工具,以稳健地绘制跨物种的发育轨迹,并可以解释物种内和物种之间细胞类型之间的不同发育动力学。人类和小鼠植入前和原肠胚形成的比较研究揭示了保守和不同的转录程序。例如,在人类中未观察到Klf2在小鼠胚胎命运的外胚层祖细胞中的表达;相比之下,KLF17富含人类外胚层,而非小鼠外胚层88。
人胚胎组织的自组织可以从最早的时刻在体外被捕获50,89,并延伸到原肠胚形成,前-后胚胎模式形成和体节形成的早期阶段11。最近的人类原肠胚形成数据集将作为基准提供信息,以进一步完善人类细胞的体外定向分化,包括原肠胚模型11。器官发生过程中的其他过程也可以被监测,包括体节分割的时钟控制90 91,肝胆胰器官出芽过程中的边界形成92和神经管的图案化。现在建立了协议来模拟不同人体组织的发育,这些组织表现出发育中的人体组织的形态和生理功能。这些类器官系统包括有毛发的皮肤93;具有隐窝-绒毛轴94 的小肠;区域特异性95和多区域96脑组织,模拟神经发生、神经迁移和突触形成;具有光感受反应的多层神经视网膜97;和血管发育过程中的动静脉规格98。
人类发育过程中存在的细胞类型和状态的综合参考图谱对于基准干细胞衍生的类器官至关重要。这种路线图比较将突出相似性69和缺陷99,并定义改进类器官疾病建模的策略。未来,高保真人类干细胞衍生的人类类器官和单细胞多组学模式将成为了解控制人类器官发生机制的有力工具。
临床相关性和应用导致表型的基因型和环境的相互作用是发育障碍的基础。一系列儿童和成人疾病起源于产前生活(图4)。这些包括结构性出生缺陷100、神经发育障碍(包括精神分裂症)101、儿童癌症2、65、先天性免疫缺陷102、不孕症和性别发育差异103,以及许多儿科疾病104 。. 数以千计的罕见遗传病在出生时都会出现一系列发育不良后遗症,有时即使归类为相同的疾病或病症,其医学表现也有很大差异105。例如,唐氏综合征(21 三体)106和 22q11.2 缺失综合征107分别为从青春期开始的精神分裂症、阿尔茨海默病和甲状腺功能减退症108带来了巨大的风险。由于我们对人类正常发育的了解有限,因此无法确定发育障碍的病因以及母体基因型、父亲年龄和其他外部风险因素(如饮食、酒精、毒素、内分泌干扰物和病原体)的影响。
发育图谱也揭示了儿童癌症的发病机制(图4)。儿科和在早期阶段的成人脑肿瘤经常出现在肿瘤细胞内受损的发展计划109,110。将肿瘤细胞的表达谱与 HDCA 进行比较可以确定癌细胞的起源及其致癌途径。例如,发育中的小鼠小脑的单细胞图谱已被用于研究人类成神经管细胞瘤(一种儿科脑肿瘤)的亚型2、111,并且肾发生过程中的细胞状态揭示了维尔姆斯肿瘤的发育细胞起源65. 发育中的免疫细胞的高分辨率图谱将为儿童白血病和原发性免疫缺陷的疾病表型的分子基础和程度提供信息。
许多成人癌症也概括了人类发育程序的失调版本112。早期发育分子程序的获得是恶性病理学的特征,并且是以前未被识别的免疫疾病和癌症免疫环境的标志113 114。HDCA 数据还通过检查病毒进入受体和蛋白酶在广泛器官中的表达,帮助我们了解成人和产前细胞对 SARS-CoV-2 的不同易感性115。
用于临床治疗和再生医学的细胞和组织工程是 HDCA 直接应用潜力巨大的领域。源自人类多能干细胞的细胞疗法现在正在进入早期临床试验,用于治疗帕金森病116,所使用的方案在中脑多巴胺能神经元72的发育研究的基础上进行了改进。正在采用类似的方法开发一系列其他干细胞产品用于人体试验117. 造血干细胞移植是许多血液病和越来越多的非血液病的成熟和广泛使用的治疗方法。利用胎儿造血干细胞的效力因素可以为接受造血干细胞移植的患者带来实质性益处。
走向完整的胚胎图谱最初的 HCA 白皮书强调了人体内 12 个不同的器官系统,并强调了发育细胞图谱的重要性。综合多器官分析将提供对塑造常驻上皮、基质和免疫细胞的组织微环境以及支配血管、淋巴管和周围神经的细胞异质性的洞察。最终,这可能会阐明整个生物体的系统级谱系发育和细胞命运决定。基于人类发育器官的分析数据集对于解释最近的多器官发育图谱55、118至关重要。
HDCA 研究人员正在进行几项大规模的基于器官的研究。其中包括 NIH“通过推进创新神经技术进行大脑研究”(BRAIN) 计划(包括 BRAIN 计划细胞普查网络 (BICCN) 联盟),专注于发展中的人类皮层;瑞典人类细胞图谱联盟进行大规模 scRNA-seq,使用测序 (ATAC-seq) 分析转座酶可及的染色质,并在头三个月对发育中的人类大脑、心脏119和肺进行空间组学分析;法国 HuDeCA 联盟使用 3D 成像和 scRNA-seq 绘制了八个孕早期人体器官;欧盟 (EU) Horizon 2020 资助的开发大脑 (Braintime) 和性腺 (HUGODECA) 项目;NIH 发育基因型-组织表达 (dGTEx)120个项目;以及由 Wellcome Trust 和医学研究委员会资助的英国财团。合乎逻辑的下一步将是协调这些努力并扩展当前的方法,以将所有器官的不同细胞谱系的发展置于情境中。
然而,多器官方法不允许将分布式组织网络作为来自单个供体样本的连续体进行分析。全胚胎分析仅限于非常早期的植入前样本88、121、122和一个原肠胚形成阶段的胚胎123. 位于英国的 HDCA 研究人员正在对受孕后 6 到 7 周从整个人类胚胎进行解剖学解剖单位进行多组学悬浮和空间基因组学分析。我们预计将在未来两年内进行第一个完整的人类胚胎分析。基于现有的 HDCA 数据和早期发育过程中的快速变化,我们建议每个生物学相关的妊娠期(例如,从受孕后六周开始的每周)至少进行三个重复。全球研究界(正式注册或未在 HCA 注册)产生和共享的所有此类数据都为 HDCA 做出了贡献。为这些数据定义一个通用的组织框架将使它们能够统一到一个完整的图谱中,这将成为研究和临床社区的变革性资源。