1987年:Yoshizumi Ishino等人在研究大肠杆菌碱性磷酸酶同工酶时,首次在iap基因3'端发现"不寻常"的29bp直接重复序列(DR),这被视为CRISPR的雏形。
2000年:Francisco Mojica等人将这些序列正式表征为短规律间隔重复序列(SRSRs),发现其广泛存在于细菌和古菌中。
2002年:Ruud Jansen等人创造了CRISPR这一术语,并首次鉴定出4个CRISPR相关基因(Cas1–Cas4),同时发现300–500bp的先导序列(leader sequence)。
2005年:Mojica、Bolotin和Pourcel三个团队同时发现间隔序列(spacer)与外源噬菌体或质粒DNA高度同源,提出CRISPR可能是原核生物对抗外源基因的"记忆"系统。
2006年:Eugene Koonin和Kira Makarova提出假说,认为CRISPR/Cas是原核生物的RNA干扰(RNAi)适应性免疫系统。
2007年:Rodolphe Barrangou和Philippe Horvath在Streptococcus thermophilus中实验证实了CRISPR介导的获得性免疫。
2012年(诺贝尔奖工作):Jennifer Doudna和Emmanuelle Charpentier揭示了Cas9的可编程性,证明通过tracrRNA:crRNA双RNA系统(后发展为单链sgRNA)可引导Cas9在特定PAM序列上游切割双链DNA。这一发现为她们赢得了2020年诺贝尔化学奖。
2013年:Feng Zhang团队首次将Type II CRISPR-Cas9系统应用于真核细胞(人和小鼠),证明其可进行多重基因组编辑;Stanley Qi团队开发了CRISPRi(干扰)系统,利用失活的dCas9调控基因表达。
2016年:David Liu团队开发了碱基编辑(Base Editing)技术,将Cas9与胞苷脱氨酶融合,在不切断DNA双链的情况下实现C→T(或G→A)的精准点突变。
位于CRISPR阵列上游,AT富集,长度从47bp到数百bp不等。
分为核心先导区(保守,靠近阵列,含启动子和新间隔序列整合必需区域)和扩展先导区。
功能:驱动CRISPR阵列转录,并为适应阶段的新间隔序列整合提供信号。
由重复序列(Repeat, R)和间隔序列(Spacer, S)交替排列组成:
重复序列:21–47bp(平均约32bp),具有回文结构,可形成稳定的茎环二级结构。不同物种的重复序列可被聚类为33个簇。
间隔序列:20–72bp,序列高度多样,来源于外源噬菌体或质粒,是免疫记忆的分子基础。新间隔序列总是整合在靠近先导序列的一端,形成时间顺序排列(S5最新,S1最古老)。
通常位于CRISPR阵列附近(约530bp距离),以头尾相连方式排列,似乎共转录。
目前已鉴定出13个核心Cas蛋白家族(Cas1–Cas13),各自具有独特的酶学活性。
分类层级 | Class 1(Class I) | Class 2(Class II) |
效应复合物 | 多亚基效应复合物 | 单蛋白效应复合物 |
包含类型 | Type I, III, IV | Type II, V, VI |
分布 | 细菌和古菌 | 主要为细菌 |
占比 | 约90% | 约10% |
基因编辑应用 | 较复杂,应用较少 | 结构简单,应用广泛 |
标志性蛋白 | Cas3 | Cas9 (Type II), Cas12 (Type V), Cas13 (Type VI) |
Class 1:Type I(7个亚型:I-A至I-G)、Type III(6个亚型:III-A至III-F)、Type IV(3个亚型)
Class 2:Type II(3个亚型)、Type V(10个亚型)、Type VI(4个亚型,靶向RNA)
关键结论:Class 2系统因仅依赖单一效应蛋白(如Cas9),操作简便,因此在基因工程和遗传筛选中应用远超Class 1。
核心参与者:Cas1–Cas2异六聚体复合物(两个Cas1二聚体+一个Cas2二聚体)。
过程:识别入侵DNA上的原间隔序列邻近基序(PAM,2–6nt),Cas1切割邻近区域(原间隔序列,protospacer),将其整合到CRISPR阵列的先导序列末端,同时重复序列发生复制。
注意:PAM序列不会被整合,这是防止自身免疫(切割自身DNA)的关键策略。
CRISPR阵列被转录为长的前体crRNA(pre-crRNA)。
Type I:Cas6家族(或Cas5d)在重复区内切割pre-crRNA。
Type II:tracrRNA与pre-crRNA重复区配对形成双链RNA,招募宿主RNase III在Cas9存在下进行切割;随后经过第二次修剪产生成熟的crRNA。
Type III:Cas6切割后,crRNA被加载到Csm/Cmr复合物中,3'端进一步被修剪。
成熟crRNA与Cas蛋白组装成crRNA-效应复合物(crRNP),在细胞内巡逻。
Type I:Cascade复合物识别靶DNA并招募Cas3(解旋酶-核酸酶),进行单向降解。
Type II:sgRNA引导Cas9识别PAM和12nt的"种子序列",形成R-loop后切割双链DNA,产生平末端。
Type III:不依赖PAM,而是通过crRNA 5'端标签与宿主CRISPR位点重复序列的碱基配对实现"自我失活",避免误伤自身。
除抗病毒免疫外,CRISPR-Cas系统还参与:
基因组重排:重复序列促进同源重组。
DNA修复:Cas1具有针对霍利迪连接体和复制叉的核酸酶活性。
毒力调节:如Francisella novicida利用CRISPR/Cas抑制宿主免疫应答。
群体行为调控:影响生物膜形成和群游运动。
Koonin和Makarova的"转座子起源假说":
Cas1可能是从古老的casposons(自合成DNA转座子,类似整合酶)演化而来。
Class 2效应蛋白(如Cas9、Cas12)与IS605等转座子编码的TnpB蛋白具有同源性,提示它们可能通过水平基因转移从可移动遗传元件中"招募"而来。
Type III系统的逆转录酶可能与II类内含子的逆转录酶同源,使系统能够获取RNA病毒来源的间隔序列。
参考文献:
Ganger S, Harale G, Majumdar P. 规律成簇间隔短回文重复序列 / CRISPR 相关系统:发现、结构、分类与通用机制 [M]//Pandita D, Pandita A. CRISPR/Cas 介导的植物基因组编辑。佛罗里达州博卡拉顿:CRC 出版社,2023: 65-97.