已关闭
收藏CRISPR-Cas9系统源自细菌及古生菌的获得性免疫系统,由于操作简单高效而成为一种强大的基因编辑工具。自2013年初发现CRISPR/Cas9在细胞内实现DNA精确编辑开始,近年来呈现井喷式发展。相对于ZFN、TALEN等基因编辑技术来说,其更加简单、经济、容易操作,是迄今为止最为有效、低廉和容易的一种基因编辑方法。但在其广泛应用的背后,CRISPR/Cas9系统有一个致命的缺点——容易脱靶,即在预期靶点以外的位点上产生额外的DNA剪切或编辑。脱靶可引起非预期的基因突变,甚至导致癌变发生,限制了CRISPR基因编辑的临床应用。现有多种实验技术用于在全基因组范围进行脱靶位点检测,可大致分为两类:1.基于细胞转染技术的体内脱靶检测,包括GUIDE-seq1、BLISS2、HTGTS3、DISCOVER-seq4等;2.不依赖细胞的体外脱靶检测,包括Digenome-seq5、SITE-seq6、CIRCLE-seq7和CHANGE-seq8(CIRCLE-seq的改进版),但每种技术均有其局限性。如体内脱靶检测GUIDE-seq需要细胞电转,对于不易转染的细胞系缺乏可操作性。体外脱靶检测技术虽然敏感,但是存在不可忽视的假阳性问题。
我司经过多年不懈努力,开发了一种新型的高通量脱靶检测方法AID-seq9,与现有的脱靶检测方法相比,其敏感性和特异性均更胜一筹。更重要的是,我们提出了高通量sgRNA筛选策略,可一次性检测上百条sgRNA的在靶/脱靶情况,并基于大量的数据建立新型CRISPR蛋白的脱靶预测模型。
我们进一步使用PR曲线和ROC曲线来可视化不同脱靶检测方法的灵敏度和特异性。如图1所示,与SITE-seq、CIRCLE-seq和CHANGE-seq相比,AID-seq在三个测试中的AUPRC和AUROC得分最高。说明AID-seq无论是在敏感性还是在特异性上,都略胜一筹。

首先,我们使用了7个之前GUIDE-seq、SITE-seq、CIRCLE-seq和CHANGE-seq文献已充分检测脱靶的sgRNA位点,包括VEGFA site 1、VEGFA site 2、VEGFA site 3、EMX1、FANCF、HEK293 site 4和PAPSS2。与SITE-seq、CIRCLE-seq和CHANGE-seq相比,AID-seq可以检测到更多的GUIDE-seq脱靶(表1)。注:GUIDE-seq体内脱靶检测方法能反应细胞内真实切割情况,因此用GUIDE-seq检测到的脱靶位点作为评价指标。

Cas12a产生粘性末端并具有非特异性切割活动的特性。为确定AID-seq是否可用于检测Cas12a的脱靶,我们选择了GUIDE-seq文献中的7个位点。如图2所示。AID-seq可以检测多个GUIDE-seq遗漏的位点,并且AID-seq检测到的这些位点进一步在细胞水平通过扩增子的方法验证为真阳性脱靶位点。因此,AID-seq可作为全面、准确检测Cas12a脱靶位点的可靠工具。

目前的on-/off-target检测策略采用单个gRNA的形式,成本高且通量低。为了确定AID-seq是否可用于一次检测多个gRNA的脱靶情况,我们分别对16个sgRNA和66个sgRNA的两个不同大小的sgRNA文库进行了AID-seq。两个sgRNA文库都包含表1中7个文献sgRNA作为阳性对照。结果表明,pooled AID-seq的生物学复孔可重复性高(图3A)。并且,大部分的GUIDE-seq脱靶位点都可以被pooled AID-seq检测到,与单个AID-seq一样敏感(图3B和3C)。

另外,我们去年5月发现了一种新的高保真CRISPR—FrCas910,相关文章发表于Nature Communications。但是,亟需建立一个脱靶预测模型以促进FrCas9的应用。然而,这是一项耗时耗力的工作,因为需要大量准确的脱靶数据。为了解决这个问题,我们使用pooled AID-seq策略来表征FrCas9在2,069个sgRNA中的切割效率和脱靶效应,每个sgRNA文库中约有500个sgRNA。结果表明,每个文库的在靶率≥95%,并且一半以上的sgRNA没有检测到脱靶,这与我们之前的研究一致,再次验证了FrCas9的高靶点切割活性及低脱靶效应(Cas-Designer网站已上线FrCas9 sgRNA在线设计http://www.rgenome.net/cas-designer/)。通过分析AID-seq产生的大量的脱靶数据,我们建立了准确FrCas9脱靶预测模型(AUROC=0.97,AUPRC=0.29)。

AID-seq是一种新型准确且高通量的方法,用于检测不同类型CRISPR(包括Cas9和Cas12a)的靶向活性和脱靶效应。相对于以往的体内外脱靶检测方法,AID-seq具有以下几个优点。首先,作为一种体外脱靶检测方法,其应用范围更广,不受不同物种(人、动物、植物、细菌、真菌等)1,4、不同细胞类型(细胞系、原代细胞、非分裂细胞等)和转染效率的影响。其次,AID-seq不需要提取完整的高分子量DNA,DNA起始入量也很小(5ug),因此对DNA制备难度大的实验更加友好。第三,AID-seq可以检测更多的低频和真正的脱靶,这对基因治疗至关重要。因为即使是少数具有脱靶编辑的细胞也可能因克隆扩增而导致癌症。
更重要的是,我们提出了pooled AID-seq策略来同时检测数百个gRNA的on-/off-target,这可能会大大提高CRISPR on-/off-target检测的通量和效率。在该研究中,sgRNA文库大小从几条sgRNA到数百条不等,可以适应以下不同的应用场景。首先,通过pooled AID-seq策略可以筛选出切割效率最高、脱靶效应最低的sgRNA进行基因编辑和治疗。其次是用于CRISPR文库优化:CRISPR文库常用于识别药物敏感性和耐药性的基因11,12,然而,文库可能包含性能不佳的sgRNA,增加了不必要的文库大小并导致强烈的混杂效应13。因此,有必要使用pooled AID-seq策略针对全基因组或一类特殊目标筛选最佳sgRNA减少文库大小和提高文库性能。最后,AID-seq可用作通用工具,以大规模并行方式表征新发现的CRISPR的特性14,15,如切割效率、脱靶效应和PAM偏好,并基于这些大量的数据构建脱靶预测模型。原文链接:https://www.cell.com/med/pdf/S2666-6340(23)00163-0.pdf。