引言
我们对细胞内部运作机制的理解正在经历一场前所未有的维度跃升。如果将细胞核内长达两米的DNA分子比作一本生命密码的说明书,那么传统的基因测序技术仅仅是读取了这本说明书上的文字。然而,真实的生命并非是一维的线性字符。DNA在微米级的细胞核内发生了高度的折叠与缠绕,这种三维空间的物理拓扑结构,直接决定了哪些基因被激活,哪些基因被沉默。
长久以来,要在同一个微小的单细胞内,同时捕捉基因表达的产物、染色质的开放状态以及DNA在三维空间的折叠构象,被认为是极具挑战性的技术巅峰。
2月19日,《Nature Biotechnology》的研究报道“Trimodal single-cell profiling of transcriptome, epigenome and 3D genome in complex tissues with scHiCAR”,在这项研究中,研究人员开发了一种名为scHiCAR的新型单细胞多组学技术。该技术以前所未有的通量和极低的成本,在同一个单细胞内实现了转录组(transcriptome)、表观基因组(epigenome)和三维基因组(3D genome)的同时精细分析。更令人震撼的是,研究团队将该技术应用于多达162万个小鼠大脑细胞,并追踪了骨骼肌再生过程中的动态细胞命运转变,为我们揭示了三维基因组重排在转录控制中具有特定基因座依赖性的时间调控规律。
突破三体困境:单细胞内多重信息的同时捕获
在了解这项技术的颠覆性之前,我们先来看看当前生命科学领域面临的一个核心痛点。在多细胞生物的复杂组织中,细胞与细胞之间存在着巨大的异质性。即便是同一组织内的相邻细胞,其功能和状态也可能天差地别。因此,单细胞分辨率的分子图谱成为了解析复杂生理和病理过程的刚需。
单细胞RNA测序(scRNA-seq)可以告诉我们细胞正在表达哪些基因;
单细胞ATAC测序(scATAC-seq)能够揭示候选顺式作用元件(candidate cis-regulatory elements, cCREs)等染色质开放区域的位置,这些区域往往是基因调控发生的“开关”;
染色体构象捕获(chromosome conformation capture, 3C)技术,如Hi-C,则负责描绘基因组的三维折叠图谱,包括A/B区室(A/B compartments)、拓扑结构域(topologically associating domains, TADs)和染色质环(chromatin loops)。
然而,现有的研究大多是分别在不同的细胞群体中测量这三种模态,随后依赖复杂的计算生物学算法将数据“强行”对齐和整合。这种缺乏“同一细胞基准真实性(ground truth)”的整合方式往往伴随着巨大的偏差。因为组织固有的异质性会导致某些细胞亚群在一种检测中被发现,而在另一种检测中由于灵敏度或采样偏差而丢失。此外,越来越多的证据表明,表观基因组和三维基因组的变化并不总是与转录组的变化绝对同步。因此,我们迫切需要一种能够在同一个真实细胞内同时捕获这三个关键维度的技术。
虽然近期出现了一些如ChAIR等尝试实现单细胞三模态分析的液滴法(droplet-based)技术,但它们在复杂组织(如小鼠大脑)中的表现却不尽如人意。这些技术不仅通量有限,而且单细胞水平的分子捕获效率极低,尤其是在富集具有调控功能的远距离顺式相互作用(long-range cis-interactions)时显得力不从心。面对三维染色质接触的高度复杂性,开发一种高效、经济且高通量的单细胞三模态技术,成为了生命科学界亟待跨越的技术鸿沟。巧妙的条形码迷宫:scHiCAR技术
为了打破上述僵局,研究人员巧妙地设计了scHiCAR技术(single-cell Hi-C with assay for transposase-accessible chromatin and RNA sequencing)。这是一种基于孔板的组合条形码(plate-based combinatorial barcoding)方案,无需依赖昂贵的微流控专用设备,一名研究人员在3到4天内即可完成全套流程,展现出了极高的可扩展性和普及潜力。
深入探究其分子工程学设计,我们可以看到一种对实验步骤近乎苛刻的优化。整个流程从将交联固定的细胞核分配至96孔板开始。在第一步中,细胞核同时接受Tn5转座酶介导的开放染色质片段化,以及使用寡聚胸腺嘧啶(oligo dT)和随机六聚体(random hexamer)引物进行的逆转录。在这个孔板中,Tn5接头和逆转录引物都带有该孔独有的第一级条形码(Barcode 1, BC1)。
随后,细胞核经历两轮“混合-拆分(pool-split)”的组合条形码标记过程,将第二级和第三级条形码(BC2和BC3)分别添加至Tn5接头和互补DNA(cDNA)上。在这几轮标记之后,一项至关重要的物理分离步骤登场了。研究人员使用0.5%的SDS(十二烷基硫酸钠)处理细胞核,这一浓度的洗涤剂能够适度增加细胞核的通透性,使带有条形码的cDNA释放到上清液中,以进行后续的单细胞RNA测序文库构建及第四级条形码(BC4)的添加,其原理类似于SMART-seq技术。
与此同时,保留在沉淀中的核组分则进入DNA文库的制备阶段。这些包含在细胞核内的基因组DNA首先被四碱基限制性内切酶CviQI消化,然后在原位进行连接,使得带有条形码的Tn5接头与其在三维空间上物理邻近的基因组DNA片段连接起来。在经历类似于4C-seq的文库制备流程后,DNA被另一种四碱基内切酶NlaIII进一步消化并自我环化。最终,锚定在Tn5接头和已连接的BC1-BC3序列上的PCR引物,能够特异性地扩增出那些既具有开放染色质特征(带有Tn5接头标记)又正确环化连接的DNA片段。
这种设计的核心优势在于,它极大地富集了那些锚定在开放候选顺式作用元件(cCREs)上的远距离顺式染色质接触。理论上,这种四级组合条形码的设计能够产生高达8490万个独特的单细胞条形码,使得在一次实验中以极低的成本分析数百万个细胞成为可能。严苛的性能大考:在细胞系中验证技术的极限灵敏度
研究人员首先选取了H1人类胚胎干细胞(H1 hES cells)、人类淋巴母细胞系GM12878以及小鼠胚胎干细胞(mES cells)这三种特征明确的细胞系,对scHiCAR的性能进行了系统性的验证。
在这个实验中,每种细胞被单独分配到96孔板的特定孔中,这意味着每一个细胞所携带的第一级条形码(BC1)直接成为了其真实身份的“物理身份证”。随后,所有的细胞被混合在一起进行后续处理。深度测序的数据表明,在1607个人类细胞和849个小鼠细胞的混合体系中,细胞条形码的碰撞率仅为2.69%,这一极低的数据有力地证实了该技术在单核分离上的卓越表现。
更令人振奋的是,当我们仅仅依靠转录组数据对细胞进行聚类和身份注释时,其结果与基于BC1确定的物理真实身份达到了惊人的100%一致。即使是使用开放染色质读取(ATAC)或原位连接的嵌合DNA读取进行单独聚类,细胞类型注释的准确率也依然高达97%到99%。这种跨越不同分子模态的高度一致性,证明了scHiCAR在捕捉细胞本质特征上的极高保真度。
与现有的单细胞三维基因组技术相比,scHiCAR的优势在数据层面上体现得淋漓尽致。Dip-C和LiMCA是目前领域内两种公认的单细胞3C方案,它们的设计初衷是无偏差地捕获所有染色质接触(包含开放和封闭区域)。虽然这使得它们每个细胞的总接触数量可观,但其中具有重要调控意义的远距离(大于20 kb)顺式相互作用的比例分别只有可怜的约6%和约10%。
与之形成鲜明对比的是,由于scHiCAR在分子层面上特异性地扩增了原位连接的开放染色质片段及其互作区域,其捕获的染色质接触中有高达48%属于远距离顺式相互作用。通过观察从1 kb到10 Mb不同基因组线性距离上的接触概率衰减曲线,scHiCAR在GM12878细胞中展现出了与传统的宏基因组(bulk)HiCAR以及金标准in situ Hi-C相当的接触捕获效率,并且远远将Dip-C和LiMCA甩在了身后。
数据的可靠性不仅仅体现在广度上,更体现在微观结构的精准刻画上。无论是在刻画A/B区室特征的特征向量(eigenvector)还是衡量拓扑结构域边界的绝缘分数(insulation scores)上,scHiCAR的数据与宏基因组HiCAR数据都表现出了极高的正相关性,皮尔逊相关系数(Pearson correlation coefficients, PCCs)分布在0.89到0.98之间。尤其在鉴定与cCRE相关的染色质环(chromatin loops)时,scHiCAR在5 kb和10 kb的高分辨率下,与宏基因组数据保持了高度的重叠率。这些坚实的数据说明:scHiCAR并非只是简单地增加了一个测量维度,而是在保证数据高质量的前提下,实现了一次技术架构的深度整合。绘制162万细胞的大脑图谱:解析复杂组织的终极挑战
在体外培养的单一细胞系中取得成功只是第一步,真正的考验在于面对体内复杂且高度异质性的真实组织环境。小鼠的额叶皮层(frontal cortex)由于其细胞类型的极度多样性以及现有高质量单细胞参考数据集的完备性,成为了测试scHiCAR极限性能的绝佳战场。
在这项极具野心的探索中,研究人员通过四批次的大规模实验,总共分析了高达162万个小鼠大脑额叶皮层细胞,并在单个细胞层面成功匹配了RNA和DNA的条形码信息。据统计,这也是迄今为止细胞通量最大的单细胞三维基因组数据集,甚至超越了著名的脑计划细胞普查网络(BICCN)通过snm3C技术产生的包含约17万个脑核的庞大数据集。更为关键的是,由于采用孔板组合条形码技术,这项分析将单细胞的综合检测成本压缩到了不可思议的约0.04美元每细胞(包含深度测序费用)。
基于捕获的高质量转录组数据,研究团队精准地注释出了22种主要的大脑细胞类型,每一种细胞都清晰地表达着其经典的标记基因。scHiCAR不仅能够区分星形胶质细胞(astrocytes)、少突胶质细胞(oligodendrocytes)、小胶质细胞(microglia)等非神经元群体,还能进一步在兴奋性谷氨酸能神经元(glutamatergic neurons)中细分出诸如L4-L5层端脑内(IT)神经元等具有不同空间分布和功能特性的亚群。
在评估每个细胞的分子捕获效率时,scHiCAR展现出了令人信服的硬实力:
▶ 转录组层面:平均能够捕获约18,957个单分子唯一标识符(UMI),这远远超过了商业化的10x Genomics多组学平台(仅为3,284 UMI)以及ChAIR技术(2,634 UMI)。检测到约3,433个基因。
▶ 染色质开放性:平均产生了约24,455个ATAC片段,是ChAIR技术的惊人的12.5倍。
▶ 染色质接触:同样是针对开放染色质设计的技术,scHiCAR每个细胞平均捕获约19,622个染色质接触,捕获效率是ChAIR(约385个)的51倍。
当我们把目光聚焦在技术难度最高的三维基因组接触数据上时,数据背后的逻辑更加引人深思。scHiCAR每个细胞平均捕获了约19,622个染色质接触。初看之下,这个数字低于旨在进行全基因组无偏差捕获的HiRES(292,164个接触)和GAGE-seq(178,226个接触)。然而,这是由技术的底层设计逻辑决定的。scHiCAR(以及ChAIR)被专门设计用于富集那些锚定在开放染色质区域的相互作用,而这些具有高度活跃调控功能的开放染色质区域仅仅占整个基因组序列的1%到5%。因此,虽然总接触数量看似较少,但这近两万个接触中浓缩的都是基因调控的“精华”部分。
进一步的分析证实,在小鼠大脑组织中,scHiCAR(40%)在捕获远距离(大于20 kb)顺式染色质接触的比例上,同样显著优于HiRES(13%)和GAGE-seq(28%)。值得注意的是,由于捕获深度的严重不足,ChAIR研究所获得的染色质接触数据甚至无法独立完成脑细胞类型的解析与聚类。
在这个庞大的162万细胞数据集中,研究人员整合22种脑细胞类型的ATAC数据,共识别出了554,946个开放染色质峰,其中包含了260,781个独特的候选顺式作用元件(cCREs)。这些cCREs展现出了极其高度的细胞类型特异性,并且有70%的峰与BICCN基于全脑snATAC-seq数据识别的cCREs完美重叠,同时在局部区域的信号强度上保持了高达0.73的平均斯皮尔曼相关系数(SCC)。为了进一步验证三维结构数据的严谨性,研究人员还针对小鼠原代星形胶质细胞和Pvalb神经元进行了流式分选,并进行了极其深度的宏基因组HiCAR测序。结果再次确认,无论是表观开放状态还是三维区室化特征,scHiCAR在对应的假混合(pseudobulk)水平上都展现出了与原代大样本测序无可挑剔的一致性。引入人工智能:scDeepLUCIA如何解决稀疏数据下的染色质环鉴定难题
掌握了海量的数据,随之而来的挑战是如何从这些充满生物学噪声和单细胞固有的“信号稀疏性”数据中,准确地挖掘出控制基因表达的高分辨率染色质环(chromatin loops)。
传统的染色质环鉴定算法,例如HiCCUPS、Peakachu、MAPS等,其性能极其依赖于输入接触矩阵中的测序读取深度。这种依赖性导致了一个致命的问题:在复杂的组织中,那些数量庞大、占比高的主要细胞类型能够得到较好的鉴定结果,而那些占比极低、捕获细胞数量较少的稀有细胞类型,其染色质环信息则会被传统的算法完全淹没。
为了攻克这一计算生物学难题,研究团队专门开发了一套名为scDeepLUCIA的新型深度学习算法。这套算法在之前已有的DeepLUCIA框架基础上进行了深度的定制化升级,特别是引入了对染色质可及性(开放状态)特征的学习模块,并优化了算法在低分辨率染色质接触图谱上的特征提取能力。
在测试阶段,scDeepLUCIA表现出了惊人的鲁棒性。研究人员在星形胶质细胞的降采样(downsampled)数据集上测试,发现其受试者工作特征曲线下的面积(AUROC)达到了极高的0.9494。更为关键的是,无论输入数据的来源是人类细胞系还是小鼠原代细胞,也不论是采用HiCAR、scHiCAR还是HiChIP平台产生的数据,scDeepLUCIA在跨物种、跨平台的从头(de novo)染色质环预测中都保持着卓越的性能,这证明了模型真正学习到了染色质相互作用的底层生物学规律,而不是单纯地“死记硬背”特定的基因组位置。
为了评估该算法在稀有细胞类型中的极限表现,研究人员将三种主要的脑细胞类型(L23IT-1神经元、少突胶质细胞和Pvalb神经元)的接触数据进行了极端的降采样,减少至仅仅5000个细胞。这个数量级大概对应于在整个162万单细胞脑谱图中占比仅约0.32%的Meis2罕见细胞群。令人惊叹的是,在细胞数量锐减至5000个的极端恶劣条件下,scDeepLUCIA依然能够稳定地识别出与完整数据集数量相当的相互作用环,其对原始高深度数据集中染色质环的恢复率依然保持在75%以上。而那些我们熟知的传统算法在面对如此稀疏的数据时,检测到的染色质环数量已经断崖式下跌,几乎完全失效。
在这个深度学习算法的加持下,研究人员在22种小鼠大脑细胞类型中,以5 kb的高分辨率精准地锁定了294,395个独特的染色质相互作用。深入分析这些结构,有超过98%的相互作用至少有一个锚点(anchor)落在开放的染色质峰上。同时,基于染色质环挤压模型(loop extrusion model)的经典理论,我们知道起隔离和绝缘作用的CTCF蛋白往往会在染色质环的锚点处富集。通过将这些预测结果与已知的高质量CTCF ChIP-seq数据进行比对,发现约60%的scDeepLUCIA预测相互作用在两个锚点上都有CTCF的结合,并且其结合基序(motif)呈现出标志性的收敛取向(convergent motif orientations)。
在这近三十万个相互作用中,只有极其微小的1.75%(5,141个)是所有细胞类型所共享的管家结构。约57.48%(169,212个)的结构在至少两种但不全包含的细胞类型中共享,而高达40.77%(120,032个)的染色质相互作用是特定细胞类型所独有的。当我们完全摒弃转录组信息,仅仅使用这些由scDeepLUCIA鉴定出的独特染色质环来进行层次聚类时,细胞能够被精准地划分为非神经元、兴奋性谷氨酸能神经元和抑制性GABA能神经元三大阵营。这种极其精细的特异性在关键谱系标记基因的周围尤为明显。例如,在Pvalb神经元特异性表达的Erbb4基因附近、在L56NP细胞的Mmp16基因附近,以及在少突胶质细胞的Car2基因附近,都充斥着大量只有在这些细胞类型中才特异性形成的复杂三维染色质互作网络。绘制增强子调控网络:在浩瀚基因组中寻找精准的靶标
明确了三维空间上的物理接触后,我们便获得了解码非编码调控元件功能的“空间密码”。人类和小鼠基因组中包含了数以百万计的增强子(enhancers),但确定这些增强子究竟控制着远在几十甚至数百千碱基之外的哪个基因,一直是困扰分子生物学的核心难题。
首先,研究人员将scHiCAR基于物理接触鉴定出的440,710个调控元件与基因(CRE-gene)的配对,与此前BICCN基于snATAC-seq共开放性(coaccessibility)预测的配对结果进行了严格对比。拓扑结构域(TAD)是染色质在三维空间中的基本结构单元,通常情况下,增强子很难跨越TAD的边界去激活相邻结构域内的基因。统计表明,在snATAC-seq基于相关性预测的配对中,有约15%的组合跨越了TAD的严格物理边界;而在基于scHiCAR物理互作数据鉴定出的配对中,这一比例骤降至仅仅5%。这从侧面有力地证实了,基于共开放性的推测往往伴随较高的假阳性,而scHiCAR基于物理结构的测定则更为严谨和真实。
为了进一步确认这些配对的生物学功能,研究人员利用VISTA增强子数据库(该数据库收录了大量经过体内实验验证的功能性增强子)进行了基准测试。在单细胞基因组学领域,ABC模型(activity-by-contact model)长期以来是预测增强子活性的常用标准算法。然而,对比结果显示,包含43,290个候选对象的scHiCAR相互作用环在预测真实功能增强子方面的表现(优势比为1.78),明显超越了传统的ABC模型(包含47,332个候选对象,优势比为1.57)。
让我们来看一个具体的案例。在L23IT-1兴奋性神经元中,研究人员在距离Kcnk9基因启动子上游足足474 kb的遥远距离外,发现了一个具有强烈染色质开放特征的候选元件。凭借scHiCAR的高分辨率接触矩阵,研究人员清晰地看到了一条从该元件直接跨越漫长线性距离,“折叠”并锚定在Kcnk9基因启动子上的染色质环。不仅如此,这个遥远的元件正是VISTA数据库中被确认为在小鼠胚胎前脑中具有极高活性的mm1679增强子。类似地,在星形胶质细胞中,一个已知活性的增强子(mm1451.0)也被清晰地捕捉到与Grk3基因形成了强烈的物理相互作用。
在整合了22种脑细胞类型中来自同一细胞的转录组、表观基因组和三维互作信息后,研究团队最终提炼出了一份包含20,270对极高置信度(FDR < 0.05)的候选增强子-靶基因配对图谱。这份图谱涵盖了16,681个独特的cCREs和3,576个靶基因。
对这16,681个增强子序列内部的转录因子结合基序(TF motifs)进行深度的挖掘和富集分析,为我们展现了一幅细胞身份建立的分子蓝图。正如预期,起到维持三维结构作用的CTCF基序在所有细胞类型的增强子中都广泛存在。而在维持结构的基础之上,各种具有特定命运决定功能的转录因子则在不同细胞的增强子中展现出强烈的富集。例如:▪ 抑制性神经元中富集的Dlx家族基序▪ 兴奋性神经元中主导的Fosl2和Bach2基序▪ 星形胶质细胞中活跃的Lhx2▪ 内皮细胞依赖的Foxo1▪ 少突胶质细胞特有的Sox10▪ 小胶质细胞中的Irf1
此外,Atoh1作为一种控制神经系统多个区域神经祖细胞发育的关键转录因子,已知会受到转录抑制因子Hic1的调控。分析清晰地显示,Hic1和Atoh1的基序在小脑之外的大多数大脑皮层细胞类型中都高度富集。而肌细胞增强子因子2(MEF2C)家族成员则在大脑发育中控制着早期神经元的关键分化,缺失该因子的神经祖细胞会导致神经元成熟障碍并引发异常行为,这与该基因在特定神经元亚群增强子上的基序富集结果完美契合。这些详尽的分子细节,不仅证明了scHiCAR具有极高的准确性,更揭示了驱动大脑复杂皮层细胞多样性的核心转录因子调控网络。引入时间的维度:在肌肉再生轨迹中解构三模态的时序演变
如果说绘制大脑图谱展示了scHiCAR处理海量空间静态异质性的卓越能力,那么接下来针对骨骼肌再生的研究,则向我们展示了该技术在追踪生命随时间推移进行动态重塑时的无穷潜力。
成年小鼠的骨骼肌在静息状态下是高度稳定的,但在遭遇损伤后,会启动一场极为复杂且精确的组织修复交响乐。研究人员使用氯化钡(BaCl2)诱导了小鼠骨骼肌的急性损伤,并分别在未受损的第0天、再生活跃的第5天和第7天采集了组织样本。通过对获取的41,578个肌肉细胞进行分析,所有的三种模态(RNA、ATAC和染色质接触)都高度一致地解析出了8种主要的细胞类型。
在这场修复过程中,居于核心地位的是肌肉干细胞(MuSCs)。它们平时处于深度的静止状态,在感知到损伤信号后被迅速激活,经历复杂的命运转变转化为成肌细胞(myoblasts),并最终分化融合形成新的肌细胞(myocytes)。研究人员将这19,255个参与再生的MuSCs及其后代细胞单独提取出来,基于转录组数据构建了伪时间(pseudotime)轨迹,试图还原这条分化之路上的分子历史。
在全基因组宏观水平上,基因的转录表达与其启动子区域的染色质开放程度确实保持着约0.5的平均皮尔逊正相关系数(PCC)。这似乎符合我们传统的认知:染色质敞开大门,转录机器随之进入,基因开始表达。然而,当研究人员利用scHiCAR赋予的独特“上帝视角”,在单细胞层面对关键基因进行逐一审视时,却发现生命运行的逻辑远比简单的“线性因果”要精微得多。
以控制早期和晚期肌生成分化的经典标记基因Myog(肌细胞生成素)和Myh1(肌球蛋白重链1)为例。在沿着伪时间的轨迹中,研究人员清晰地观察到,在MuSCs正式启动这些基因的转录表达之前,其对应的染色质区域早已提前开启了“开放”进程。这种在物理层面上提前进行的表观遗传改变,被完美地诠释为决定细胞命运转变的“染色质潜能(chromatin potential)”。
真正颠覆认知的发现来自于对三维基因组A/B区室评分(scA/B compartment scores)的动态追踪。在全基因组范围内,研究人员追踪了980个在再生过程中特异性表达的基因,在众多驱动肌肉发育的核心基因上,转录、表观和三维结构的“时序错位”表现得尤为明显:
[同步发生] Ncam1基因在肌肉再生轨迹上表现出了高度的同步性。随着时间的推移,它的scA/B评分增加,紧接着染色质开放度增加,同时转录被迅速激活。
[三维先导] 当我们观察Myog基因时,却发现其scA/B评分(三维构象活跃度)的增加发生在其染色质物理开放以及mRNA大规模表达之前。这暗示在某些关键发育节点上,三维基因组的大规模空间重置充当了基因激活的最先头部队。
[转录先导] Myh3则展现了完全相反的时序逻辑。其转录激活和染色质开放率先发生,在此之后,其scA/B评分才开始缓慢且持续地攀升,并且在单细胞接触矩阵的局部微观尺度上,其局部的接触频率在转录强烈激活期间反而在持续下降。
为了在最直观的层面上确认这种错位,研究人员直接重构了沿发育轨迹上处于早期、中期和晚期三个代表性单细胞(每个细胞具有约15,000个独特接触)的局部接触图谱。在Myh3基因座周围,即使基因表达量正在激增,三维空间上的物理接触频率却呈现出明显的渐进性降低。而与之形成对比的是,Agbll基因展示了接触频率的稳步增加,Ncam1和Myog则展示了在此过程中转瞬即逝的三维接触增强现象。
这些高度动态、针对特定基因座的单细胞级异质性规律告诉我们一个深刻的道理:转录组、表观基因组和三维基因组并不总是步调一致的绑定体。三维空间的物理重塑,既可以作为转录激活的“先导条件”,也可以作为转录发生后的“结构巩固”,甚至可能在某些基因调控中与转录解耦。如果不是scHiCAR技术在同一个真实细胞内捕获了这三种模态,这种微观时序上的精妙错位,将永远被不同细胞群体的平均数据所掩盖。在三维宇宙中重新定义生命
当我们凝视细胞核时,我们看到的不再仅仅是一团杂乱无章的聚合物,而是一座有着极高动态秩序的物理建筑。在这座建筑中,DNA折叠的每一个弯曲、每一个环状结构的形成与解离,都在无声地指挥着决定我们生老病死的生化反应。
scHiCAR技术的出现及其搭载的scDeepLUCIA人工智能算法,不仅突破了现有的技术瓶颈,实现了在数百万细胞规模上以极低成本对转录组、表观组和三维基因组的同时探测,更是在哲学层面上重塑了我们的认知——它为整合分子生物学提供了一个绝对真实的“单细胞锚点”。从复杂的大脑异质性网络,到肌肉干细胞分化过程中的第四维度动态演变,这种对生命最基本单元进行多维拆解的能力,无疑将为遗传疾病的发病机制、肿瘤的异质性演化以及组织再生医学开辟出一条充满无限可能的新航道。
生命科学的魅力,不仅在于发现新的组成部分,更在于理解这些部分如何在浩瀚的空间与流淌的时间中,交织出一曲宏大而有序的交响。
参考文献
Wei X, Xu Y, Yang D, Kim K, Yi L, Luo W, Lin X, Xiang Y, Williams AB, Wang X, Srivas S, Tan C, Zhang K, Li W, Li YE, Yue F, Huang ZJ, Jung I, Diao Y. Trimodal single-cell profiling of transcriptome, epigenome and 3D genome in complex tissues with scHiCAR. Nat Biotechnol. 2026 Feb 19. doi: 10.1038/s41587-026-03013-7. Epub ahead of print. PMID: 41714417.
声明:本文仅用于分享,不代表平台立场,如涉及版权等问题,请尽快联系我们,我们第一时间更正,谢谢!
往期热文:
Nature | 破解基因组的“句法结构”:当深度学习读懂了启动子的深层语言
Cell | 命运的骰子:癌症免疫治疗的成败,竟由一群不到2%的“火花”T细胞决定?
Nature | 只有 1% 在工作,其余都是“自私的过客”:解密精子发生中的 piRNA 悖论
Nature | 肿瘤的“反间计”:肺腺癌如何劫持迷走-交感反射弧以压制抗肿瘤免疫?
Cell | 当神经系统成为免疫的“遥控器”:皮肤抗癌防线的隐秘开关
Nature | 告别AI幻觉!OpenScholar如何用4500万篇论文重塑科研综述?
Science | FoldMason 如何在“后 AlphaFold 时代”重绘生命演化树
Nature Genetics | 头骨之下的背叛:儿童脑肿瘤如何“策反”颅骨骨髓,重写免疫法则
Nature Biotechnology | 首创“组装-比对图”(AAG)与对比学习,PlasMAAG重塑宏基因组质粒重建范式
Cell | 突破 AAV 装载极限:一种革命性的 DNA 重组策略如何改写基因疗法版图