文献信息
标题:Characterizing single extracellular vesicles by droplet barcode sequencing for protein analysis
DOI(url): https://isevjournals.onlinelibrary.wiley.com/doi/10.1002/jev2.12277
日期及杂志:2022 Nov, J Extracell Vesicles
作者及单位:Mahsan Banijamali
文献概述(这篇文献的结论是什么?)
近年来,小细胞外囊泡(Small extracellular vesicles, sEV)已发展成为疾病诊断和治疗随访的生物标志物来源。来自多细胞生物的sEV样品显示出高度异质性的囊泡库,这是目前基于集成测量的方法无法捕获的。在这项工作中,我们提出了用于蛋白质分析的液滴条形码测序(DBS-Pro)来分析单个sEV的表面蛋白,从而促进样品内和样品间sEV亚型的鉴定。该方法允许通过使用DNA条形码亲和试剂和测序作为readout分析多种蛋白质。高通量单囊泡分析是通过在乳化液液滴中对单个sEV进行区隔,然后通过PCR对液滴进行条形码分析实现的。在这个概念验证研究中,我们证明了DBS-Pro允许分析单个sEV,混合率低于2%。从非小细胞肺癌细胞系和非小细胞肺癌患者的恶性胸腔积液(MPE)液中获得的总共超过120,000个sEV根据其表面蛋白进行了分析。该方法实现了单囊泡表面蛋白图谱和sev亚型的扩展表征,这对于在异质样本中识别囊泡的细胞起源至关重要。
文献结果(每个结果的图片详细解读)
1、蛋白分析液滴条形码测序(DBS-Pro)法原理
图1描述了用于蛋白质分析的液滴条形码测序(DBS-Pro)的概念,以及sEV在单囊泡分辨率下的定量蛋白质分析。囊泡用含有抗体特异性条形码(antibody-specific barcode, ABC)和UMI的寡核苷酸偶联抗体进行标记。用霍乱毒素亚基B (CTB)覆盖的磁珠捕获带有抗体标记的囊泡,进行洗涤,然后被封装在含有独特的液滴条形码(DBC)序列的乳化液液滴中。在每个液滴中,ABC和DBC通过重叠延伸被放大和连接。对所得文库进行测序,并对单个囊泡的表面蛋白进行鉴定和定量。
Fig1
2、单囊泡检测的验证
为了研究和验证DBS-Pro法对单个囊泡的检测(图1),本文使用从NSCLC细胞系H1975的细胞培养基中收集的sEV进行了一系列hashing experiments(图2A)。两组不同的条形码寡核苷酸被用来标记CD9和EGFR抗体。在bead hashing中,囊泡与两组在不同的反应管中孵育,并分别捕获,并在形成液滴之前混合。在EV hashing中,囊泡与两组在不同的反应管中孵育,但在它们被捕获之前进行混合。(图2B)显示了bead hashing(n = 2)和EV hashing(n = 3)的Single set和混合速率。如果95%或更多的UMI只属于一个集的ABC,则认为液滴是Single set的。(图2C)显示基于每个单个囊泡的UMI计数的Single set和混合液滴。hashing experiments清楚地表明,DBS-Pro在至少98%的液滴中以单个囊泡分辨率生成数据。
Fig2
3、DBS-Pro用于非小细胞肺癌细胞系sEV多重蛋白分析的验证
为了研究该技术分析单个sEV上多个目标蛋白的潜力,本文使用11种蛋白进行了一系列DBS-Pro实验。在培养的非小细胞肺癌H1975细胞株H1975_1、H1975_2和H1975_3三个时间点的培养基中分离sev进行平行实验。测序结果显示,H1975_1、H1975_2和H1975_3的单囊泡分别为8943个、10054个和30350个。(图3A)热图显示基于log2转换后UMI总数的数据。(图3B)热图显示含有液滴的比例。(图3C)小提琴图显示了每个液滴的UMI计数分布。(图4D)表示含有至少三个蛋白的液滴前两个主成分(PCs)散点图,沿各轴表示相对样本密度,表明样本之间有很好的重叠。
Fig3
4、非小细胞肺癌患者恶性胸腔积液单个囊泡的表面蛋白谱分析
在确定DBS-Pro能够对单个sev的表面蛋白进行多重检测后,本文应用该方法对从不同肿瘤基因组改变的晚期NSCLC患者(PE002、PE009和PE011)的MPE液中收集的单个sev进行蛋白谱分析。DBS-Pro法在PE002、PE009和PE011样品中分别检测到9064、11920和4565个单囊泡。(图4A)中的热图显示了每个蛋白在DBC总数中的比例。结果表明,来自所有三种MPE样品的sEV具有相对较高的CD9表达。(图4B)显示前30个蛋白组合占条形码总数的比例。(图4C)表示所有样品的单个囊泡的UMAP降维结果,被分为了6个cluster。(图4D)堆叠柱状图显示了每个MPE样本中sEV的相对比例。(图4E) PE002、PE009和PE011样品单个囊泡的UMAP图,显示每个样品的密度。(图4F)热图显示了每个蛋白的相对表达。每一列代表一个液滴(即一个囊泡)。
Fig4
文献方法(使用的生物信息学方法)
测序FASTQs使用DBS-Pro pipeline(https://github.com/FrickTobias/DBS-Pro, v0.3)处理。从读取的每个序列中,分别使用cutadapt提取DBC和ABC+UMI组合。DBC序列通过starcode聚类进行纠错,编辑距离为2(参数' -d 2 ')。利用cutadapt与样品中使用的已知ABC序列进行比较,从每个ABC+UMI组合中确定目标(ABC)。对于每个校正的DBC和已识别的ABC,使用UMI-tools校正UMI序列。最后,对每个校正后的DBC、ABC和UMI组合的read count进行汇总。
数据过滤。首先,为了去除背景和嵌合产物,只保留有一个以上读取的UMI,过滤掉只有一个UMI的DBC。为了去除携带多个DBC的液滴,使用Jaccard索引比较了UMI序列的成对重叠。任何Jaccard索引大于0.5的DBC对都被删除。对于来自H1975细胞培养基和MPE样本的sEV,也去除了含有超过25个UMIs的DBC。从过滤的数据中生成一个计数矩阵,其中包含每个DBC和ABC的UMI数量。
使用python包matplotlib, pandas, numpy, and seaborn画图。UMAP和PCA 使用scanpy。首先,对液滴进行过滤,只保留有3个或更多蛋白的液滴。然后使用蛋白水平上的中心对数比(CLR)变换对每个样本的技术矩阵进行归一化。UMAP参数n_neighbors = 100, min_dist = 0.9, 分辨率0.6。
文章亮点(这篇文献的优点在哪?)
本文作为概念验证研究逻辑非常清晰,首先验证该方法是否能够得到单个囊泡水平的数据,然后验证了该方法在单个囊泡水平上能够分析多个表面蛋白,最后分析了非小细胞肺癌患者恶性胸腔积液的单囊泡表面蛋白谱作为例子
这个方法可以进行更多蛋白的良好扩展
我的疑问(这篇文献的不足在哪?)
- 缺乏和同类型技术的比较
和我相关(我从这篇文献里学到了什么?)
可以通过图4B以及其他进一步的研究进一步探寻常见的蛋白组合模式
本文的原理与PBA类似,实验方法上与PBA略有不同,使用emPCR相较于PBA的滚环复制,暂时没有看到具体的数据,根据这个数据过滤情况判断,感觉这篇文章产生的数据要比PBA好一点