周大新论文研究

发布时间：2023-03-11 23:58

周大新论文研究

从简单地剪切致病基因，到开发出不再传播疾病的工程动物，基因编辑技术已经释放出巨大的潜力。随着研究的深入，科学界还发现，除了编辑具有遗传讯息的DNA片段，编辑RNA可以在不改变基因组的情况下，帮助调整基因表达方式，此外，RNA的寿命是相对短暂的，这也意味着它的变化是可以逆转的，从而避免基因工程中的巨大风险。

2017年10月，来自Broad研究所的张锋研究团队在《自然》期刊上发表了题为“RNA targeting with CRISPR-Cas13”的文章，首次将CRISPR-Cas13系统公之于众，证实了CRISPR-Cas13可以靶向哺乳动物细胞中的RNA。仅仅时隔三周，又一篇名为“RNA editing with CRISPR-Cas13”的力作发表于《科学》期刊。在该研究中，张锋研究团队再次展示了这一RNA编辑系统，能有效地对RNA中的腺嘌呤进行编辑。

在CRISPR出现之前，RNAi是调节基因表达的理想方法。但是Cas13a酶一大优势在于更强的特异性，而且这种本身来自细菌的系统对哺乳动物细胞来说，并不是内源性的，因此不太可能干扰细胞中天然的转录。相反，RNAi利用内源性机制进行基因敲除，对本身的影响较大。但CRISPR-Cas13系统还有一个重要的问题，Cas13a酶本质上是一种相对较大的蛋白质，因此很难被包装到靶组织中，这也可能成为RNA编辑技术临床应用的一大障碍。

2018年3月16日，一项发表在《细胞》期刊的重磅成果为RNA编辑技术带来一大步飞跃，来自美国Salk研究所的科学家利用全新的CRISPR家族酶扩展了RNA编辑能力，并将这个新系统命名为“CasRx”。

CasRx（品红色）在人类细胞核中靶向RNA（灰色），Salk研究所

“生物工程师就像自然界的侦探一样，在DNA模式中寻找线索来帮助解决遗传疾病。CRISPR彻底改变了基因工程，我们希望将编辑工具从DNA扩展到RNA。”研究领导者Patrick Hsu博士表示，“RNA信息是许多生物过程的关键介质。在许多疾病中，这些RNA信息失去了平衡，因此直接靶向RNA的技术将成为DNA编辑的重要补充。”

除了高效性且无明显脱靶效应，新系统的一个关键特征是其依赖于一种比以前研究中物理尺寸更小的酶。这对RNA编辑技术至关重要，这使得该编辑工具能够更容易被包装到病毒载体，并进入细胞进行RNA编辑。来自东京大学的科学家Hiroshi Nishimasu并未参与这项研究，他表示：“在这项研究中，研究人员发现了一种较Cas13d更加‘紧凑’的酶CasRx。从基础研究到治疗应用，我认为CasRx将成为非常有用的工具。”

此外，在这项研究中，研究人员还展示了利用这种新型RNA编辑系统来纠正RNA过程的能力。他们将CasRx包装到病毒载体中，并将其递送到利用额颞叶痴呆（FTD）患者干细胞中培养的神经细胞，最终使tau蛋白水平恢复到健康水平上，有效率达到80%。

Patrick Hsu博士最后说道：“基因编辑技术通过对DNA的切割带来基因序列的改变。在经过基因编辑的细胞中，其效果是永久的。虽然基因编辑技术能够很好地将基因完全关闭，但对调节基因的表达上并不那么优秀。展望未来，这一最新工具将在RNA生物学研究中发挥重要作用，并有望在未来凭借该技术对RNA相关疾病进行治疗。”

该研究探索了Cas13d家族蛋白CasRx敲低目的基因的最佳sgRNA组合，通过尾静脉注射质粒的方式，将CasRx系统和靶向Pten基因的sgRNA导入到小鼠肝脏细胞中，成功在小鼠肝脏中实现了Pten的高效沉默。

3月18日，《蛋白质与细胞》期刊在线发表了《Cas13d介导的肝脏基因表达下调对代谢功能的调控》的研究论文，该研究由中科院脑科学与智能技术卓越创新中心（神经科学研究所）、上海脑科学与类脑研究中心、神经科学国家重点实验室杨辉研究组和上海科技大学生命科学与技术学院黄鹏羽研究组合作完成。该研究探索了Cas13d家族蛋白CasRx敲低目的基因的最佳sgRNA组合，通过尾静脉注射质粒的方式，将CasRx系统和靶向Pten基因的sgRNA导入到小鼠肝脏细胞中，成功在小鼠肝脏中实现了Pten的高效沉默，证实了CasRx系统在成体动物体内也具有靶向沉默RNA的活性，通过增强下游蛋白AKT的磷酸化，影响了糖脂代谢相关基因的表达。同时，利用AAV递送CasRx和靶向Pscsk9的sgRNA到小鼠肝脏，有效降低了肝脏中PCSK9的蛋白表达，以及小鼠血液中的胆固醇水平。这为治疗后天性的代谢疾病提供了新方案。

同时，杨辉研究组与上海交通大学医学院附属上海第一人民医院孙晓东研究组合作，也探究了CasRx预防严重的眼部疾病——年龄相关性黄斑变性（AMD）的可能性，研究人员发现在体内使用CasRx敲低Vegfa的mRNA可以显著减少AMD小鼠模型中脉络膜新血管形成（CNV）的面积，验证了将RNA靶向的CRISPR系统用于治疗应用的潜力。相关研究论文《CasRx介导的RNA靶向策略可防止年龄相关的黄斑变性的小鼠模型中的脉络膜新生血管形成》3月3日在《国家科学评论》在线发表。

近年来，CRISPR/Cas9技术因其强大且便捷的DNA编辑能力而受到广泛关注。2016年，张锋实验室发现了一种新的Cas蛋白Cas13a，可以靶向RNA进行切割。之后人们又陆续发现了靶向RNA的Cas13b, Cas13c。由于Cas13家族蛋白靶向RNA的特点，理论上在一些特定疾病的检测和治疗上具有独特优势，因而成为近年来的研究热点。2018年，加州大学伯克利分校Patrick Hsu实验室发现了Cas13d家族。他们发现与RNA干扰技术相比，Cas13d介导的基因沉默具有更高的特异性（与数百个shRNA脱靶相比，Cas13d没有脱靶）和敲除效率（Cas13d达到96％，shRNA达到65％）。而与Cas9介导的基因敲除技术相比，Cas13d介导的基因沉默不会改变基因组DNA，因此这种基因沉默是可逆的，从而对一些后天性疾病（如因不良生活习惯导致的高血脂等后天代谢性疾病）的治疗更有优势。其中Cas13d家族的CasRx蛋白由于体积小，效率高，被认为是在未来应用中最具有优势的Cas13蛋白。

此前的工作都在细胞水平证明了CasRx的高效性和特异性，杨辉研究组的这两篇文章则更进一步在动物体内证明了CasRx的活性，为临床提供了可能性。为证明CasRx在动物体内的活性，研究人员分别针对目的基因进行了sgRNA的体外筛选，然后采用尾静脉注射敲低Pten的质粒、尾静脉注射敲低Pcsk9的AAV8病毒、眼部注射敲低Vegfa的AAV病毒。对注射后的小鼠进行相应分析，分别得到Pten基因下调及其下游蛋白AKT的磷酸化上调，Pcsk9下调造成血清胆固醇下调；Vegfa下调显著减少AMD小鼠模型中脉络膜新血管形成（CNV）的面积。

2020年3月18日，《蛋白质与细胞》期刊在线发表了《Cas13d介导的肝脏基因表达下调对代谢功能的调控》的研究论文，该研究由中科院脑科学与智能技术卓越创新中心（神经科学研究所）、上海脑科学与类脑研究中心、神经科学国家重点实验室杨辉研究组和上海科技大学生命科学与技术学院黄鹏羽研究组合作完成。该研究探索了Cas13d家族蛋白CasRx敲低目的基因的最佳sgRNA组合，通过尾静脉注射质粒的方式，将CasRx系统和靶向 Pten 基因的sgRNA导入到小鼠肝脏细胞中，成功在小鼠肝脏中实现了 Pten 的高效沉默，证实了CasRx系统在成体动物体内也具有靶向沉默RNA的活性，通过增强下游蛋白AKT的磷酸化，影响了糖脂代谢相关基因的表达。同时，利用AAV递送CasRx和靶向 Pscsk9 的sgRNA到小鼠肝脏，有效降低了肝脏中PCSK9的蛋白表达，以及小鼠血液中的胆固醇水平。这为治疗后天性的代谢疾病提供了新方案。

同时，杨辉研究组与上海交通大学医学院附属上海第一人民医院孙晓东研究组合作，也探究了CasRx预防严重的眼部疾病——年龄相关性黄斑变性（AMD）的可能性，研究人员发现在体内使用CasRx敲低 Vegfa的mRNA可以显著减少AMD小鼠模型中脉络膜新血管形成（CNV）的面积**，验证了将RNA靶向的CRISPR系统用于治疗应用的潜力。相关研究论文《CasRx介导的RNA靶向策略可防止年龄相关的黄斑变性的小鼠模型中的脉络膜新生血管形成》3月3日在《国家科学评论》在线发表。

近年来，CRISPR/Cas9技术因其强大且便捷的DNA编辑能力而受到广泛关注。2016年，张锋实验室发现了一种新的Cas蛋白Cas13a，可以靶向RNA进行切割。之后人们又陆续发现了靶向RNA的Cas13b, Cas13c。由于Cas13家族蛋白靶向RNA的特点，理论上在一些特定疾病的检测和治疗上具有独特优势，因而成为近年来的研究热点。2018年，加州大学伯克利分校Patrick Hsu实验室发现了Cas13d家族。他们发现与RNA干扰技术相比，Cas13d介导的基因沉默具有更高的特异性（与数百个shRNA脱靶相比， Cas13d没有脱靶）和敲除效率（Cas13d达到96％，shRNA达到65％）。而与Cas9介导的基因敲除技术相比， Cas13d介导的基因沉默不会改变基因组DNA，因此这种基因沉默是可逆的，从而对一些后天性疾病（如因不良生活习惯导致的高血脂等后天代谢性疾病）的治疗更有优势。其中Cas13d家族的CasRx蛋白由于体积小，效率高，被认为是在未来应用中最具有优势的Cas13蛋白。

此前的工作都在细胞水平证明了CasRx的高效性和特异性，杨辉研究组的这两篇文章则更进一步在动物体内证明了CasRx的活性，为临床提供了可能性。为证明CasRx在动物体内的活性，研究人员分别针对目的基因进行了sgRNA的体外筛选，然后采用尾静脉注射敲低 Pten 的质粒、尾静脉注射敲低 Pcsk9 的AAV8病毒、眼部注射敲低 Vegfa 的AAV病毒。对注射后的小鼠进行相应分析，分别得到 Pten 基因下调及其下游蛋白AKT的磷酸化上调， Pcsk9 下调造成血清胆固醇下调； Vegfa 下调显著减少AMD小鼠模型中脉络膜新血管形成（CNV）的面积。

图1 CasRx介导的 Pten 体内体外的下调（ Protein & Cell ）

A.质粒示意图；B.N2a细胞中 Pten 的下调；n检测PTEN及AKT的表达；与shRNA脱靶比较；E.尾静脉注射质粒示意图；F.G.H.免疫荧光，qPCR，western分别检测 Pten 及p-AKT的表达

图2 血清胆固醇的调节以及 Pcsk9 的可逆调控（ Protein & Cell ）

A.针对 Pcsk9 的AAV8病毒注射示意图；B.肝组织中 Pcsk9 的表达量；C.血清 PCSK9 的表达量；D.血清胆固醇水平；E.F.血清ALT和AST的测定；G.可逆调节注射示意图； H. Pcsk9 的动态调控。

图3 AAV介导CasRx减少了AMD小鼠模型中CNV的面积（National Science Review）

A.小鼠和人序列比较以及sgRNA示意图；B.C.在293T和N2a细胞中敲低 Vegfa ；蛋白的表达；病毒质粒示意图；F.实验流程图；的mRNA表达水平；H.I.激光烧伤之前或之后7天的 Vegfa mRNA水平；诱导3天后的VEGFA蛋白水平；K.激光烧伤7天后，用PBS或AAV-CasRx- Vegfa 注射的代表性CNV图像；面积统计。

2020 年 4 月 8 日， Cell 期刊在线发表了题为《Glia-to-Neuron Conversion by CRISPR-CasRx Alleviates Symptoms of Neurological Disease in Mice》的研究论文，该研究由中国科学院脑科学与智能技术卓越创新中心（神经科学研究所）、上海脑科学与类脑研究中心、神经科学国家重点实验室杨辉研究组完成。

该项研究通过运用最新开发的 RNA 靶向 CRISPR 系统 CasRx 特异性地在视网膜穆勒胶质细胞中敲低 Ptbp1 基因的表达，首次在成体中实现了视神经节细胞的再生，并且恢复了永久性视力损伤模型小鼠的视力。同时，该研究还证明了这项技术可以非常高效且特异地将纹状体内的星形胶质细胞转分化成多巴胺神经元，并且基本消除了帕金森疾病的症状。该研究将为未来众多神经退行性疾病的治疗提供一个新的途径。

人类的神经系统包含成百上千种不同类型的神经元细胞。在成熟的神经系统中，神经元一般不会再生，一旦死亡，就是永久性的。神经元的死亡会导致不同的神经退行性疾病，常见的有阿尔兹海默症和帕金森症。此类疾病的病因尚不明确且没有根治的方法，因此对人类的健康造成巨大威胁。据统计，目前全球大约有 1 亿多的人患有神经退行性疾病，而且随着老龄化的加剧，神经退行性疾病患者数量也将逐渐增多。

在常见的神经性疾病中，视神经节细胞死亡导致的永久性失明和多巴胺神经元死亡导致的帕金森疾病是尤为特殊的两类，它们都是由于特殊类型的神经元死亡导致。我们之所以能看到外界绚烂多彩的世界，是因为我们的眼睛和大脑中存在一套完整的视觉通路，而连接眼睛和大脑的神经元就是视神经节细胞。

作为眼睛和大脑的唯一一座桥梁，视神经节细胞对外界的不良刺激非常敏感。研究发现很多眼疾都可以导致视神经节细胞的死亡，急性的如缺血性视网膜病，慢性的如青光眼。视神经节细胞一旦死亡就会导致永久性失明。据统计，仅青光眼致盲的人数在全球就超过一千万人。

帕金森疾病是一种常见的老年神经退行性疾病。它的发生是由于脑内黑质区域中一种叫做多巴胺神经元的死亡，从而导致黑质多巴胺神经元不能通过黑质-纹状体通路将多巴胺运输到大脑的另一个区域纹状体。目前，全球有将近一千万人患有此病，我国尤为严重，占了大约一半的病人。如何在成体中再生出以上两种特异类型的神经元，一直是全世界众多科学家努力的方向。

该研究中，研究人员首先在体外细胞系中筛选了高效抑制 Ptbp1 表达的 gRNA，设计了特异性标记穆勒胶质细胞和在穆勒胶质细胞中表达 CasRx 的系统。所有元件以双质粒系统的形式被包装在 AAV 中并且通过视网膜下注射，特异性地在成年小鼠的穆勒胶质细胞中下调 Ptbp1 基因的表达。

大约一个月后，研究人员在视网膜视神经节细胞层发现了由穆勒胶质细胞转分化而来的视神经节细胞，并且转分化而来的视神经节细胞可以像正常的细胞那样对光刺激产生相应的电信号。

研究人员进一步发现，转分化而来的视神经节细胞可以通过视神经和大脑中正确的脑区建立功能性的联系，并且将视觉信号传输到大脑。在视神经节细胞损伤的小鼠模型中，研究人员发现转分化的视神经细胞可以让永久性视力损伤的小鼠重新建立对光的敏感性。

为进一步发掘 Ptbp1 介导的胶质细胞向神经元转分化的治疗潜能，研究人员证明了该策略还能特异性地将纹状体中的星形胶质细胞非常高效的转分化为多巴胺神经元，并且证明了转分化而来的多巴胺神经元能够展现出和黑质中多巴胺神经元相似的特性。

在行为学测试中，研究人员发现这些转分化而来的多巴胺神经元可以弥补黑质中缺失的多巴胺神经元的功能，从而将帕金森模型小鼠的运动障碍逆转到接近正常小鼠的水平。

需要指出的是，虽然科学家们在实验室里取得了重要进展，但是要将研究成果真正应用于人类疾病的治疗，还有很多工作要做：人类的视神经节细胞能否再生？帕金森患者是否能通过该方法被治愈？这些问题有待全世界的科研工作者共同努力去寻找答案。

（上）CasRx 通过靶向的降解 Ptbp1 mRNA 从而实现 Ptbp1 基因表达的下调。

（中）视网膜下注射 AAV-GFAP-CasRx-Ptbp1 可以特异性的将视网膜穆勒胶质细胞转分化为视神经节细胞，转分化而来视神经节细胞可以和正确的脑区建立功能性的联系，并且提高永久性视力损伤模型小鼠的视力。

（下）在纹状体中注射 AAV-GFAP-CasRx-Ptbp1 可以特异性的将星形胶质细胞转分化为多巴胺神经元，从而基本消除了帕金森疾病模型小鼠的运动症状。

RNA-editing Cas13 enzymes have taken the CRISPR world by storm. Like RNA interference, these enzymes can knock down RNA without altering the genome , but Cas13s have higher on-target specificity. New work from Konermann et al. and Yan et al. describes new Cas13d enzymes that average only 2.8 kb in size and are easy to package in low-capacity vectors! These small, but mighty type VI-D enzymes are the latest tools in the transcriptome engineering toolbox.

Microbial CRISPR diversity is impressive, and researchers are just beginning to tap the wealth of CRISPR possibilities. To identify Cas13d, both groups used very general bioinformatic screens that looked for a CRISPR repeat array near a putative effector nuclease. The Cas13d proteins they identified have little sequence similarity to previously identified Cas13a-c orthologs, but they do include HEPN nuclease domains characteristic of the Cas13 superfamily. Yan et al. proceeded to study orthologs from Eubacterium siraeum (EsCas13d) and Ruminococcus sp. (RspCas13d), while Konermann et al. characterized orthologs from “Anaerobic digester metagenome” (AdmCas13d) and Ruminococcus flavefaciens (nicknamed CasRx), as well as EsCas13d.

Like other Cas13 enzymes, the Cas13d orthologs described in these papers can independently process their own CRISPR arrays into guide RNAs. crRNA cleavage is retained in dCas13d and is thus HEPN-independent. These enzymes also do not require a protospacer flanking sequence, so you can target virtually any RNA sequence ! In bacteria, Cas13d-mediated cleavage promotes collateral cleavage of other RNAs. As with other Cas13s, this collateral cleavage does not occur when Cas13d is expressed in a mammalian system.

Since Cas13d is functionally similar to previously discovered Cas13 enzymes - what makes these orthologs so special? The first property is size - Cas13d enzymes have a median length of ~930aa - making them 17-26% smaller than other Cas13s and a whopping 33% smaller than Cas9! Their small size makes then easy to package in low-capacity vectors like AAV, a popular vector due to its low immunogenicity. But these studies also identified other advantages, including Cas13d-specific regulatory proteins and high targeting efficiency, both of which are described below.

The majority of Type VI-D loci contain accessory proteins with WYL domains (named for the three conserved amino acids in the domain). Yan et al. from Arbor Biotechnologies found that RspCas13d accessory protein RspWYL1 increases both targeted and collateral RNA degradation by RspCas13d. RspWYL1 also increased EsCas13d activity, indicating that WYL domain-containing proteins may be broader regulators of Cas13d activity. This property makes WYL proteins an intriguing counterpart to anti-CRISPR proteins that negatively modulate the activity of Cas enzymes, some of which are also functional in multiple species (read Arbor Biotechnologies' press release about their Cas13d deposit here ).

Not all Cas13d proteins are functional in mammalian cells, but Konermann et al. saw great results with CasRx and AdmCas13d fused to a nuclear localization signal (NLS). In a HEK293 mCherry reporter assay, CasRx and AdmCas13d produced 92% and 87% mCherry protein knockdown measured by flow cytometry, respectively. Cas13d CRISPR array processing is robust, with CasRx and either an unprocessed or processed gRNA array (22 nt spacer with 30 nt direct repeat) mediating potent knockdown. Multiplexing from the CRISPR array yielded >90% knockdown by CasRx for each of four targets, including two mRNAs and two nuclear long non-coding RNAs.

One interesting twist to Cas13d enzymes is their cleavage pattern: EsCas13d produced very similar cleavage products even when guides were tiled across a target RNA, indicating that this enzyme does not cleave at a predictable distance from the targeted region. Konermann et al. show that EsCas13d favors cleavage at uracils, but a more detailed exploration of this cleavage pattern is necessary.

Konermann et al. compared CasRx to multiple RNA regulating methods: small hairpin RNA interference, dCas9-mediated transcriptional inhibition (CRISPRi), and Cas13a/Cas13b RNA knockdown. CasRx was the clear winner with median knockdown of 96% compared to 65% for shRNA, 53% for CRISPRi, and 66-80% for other Cas13a and Cas13b effectors. Like previously characterized Cas13 enzymes, CasRx also displays very high on-target efficiency; where shRNA treatment produced 500-900 significant off-targets, CasRx displayed zero. Unlike Cas9, for which efficiency varies widely across guide RNAs, each guide tested with CasRx yielded >80% knockdown. It seems that CasRx may make it possible to target essentially any RNA in a cell.

Since catalytically dead dCasRx maintains its RNA-binding properties, Konermann et al. tested its ability to manipulate RNA species through exon skipping. Previous CRISPR exon-skipping approaches used two guide RNAs to remove a given exon from the genome, and showed success in models of muscular dystrophy . In this case, Konermann et al. targeted MAPT , the gene encoding dementia-associated tau, delivering dCasRx and a 3-spacer array targeting the MAPT exon 10 splice acceptor and two putative splice enhancers. After AAV-mediated delivery to iPS-derived cortical neurons, dCasRx-mediated exon skipping improved the ratio of pathogenic to non-pathogenic tau by nearly 50%, showing proof-of-concept for pre-clinical and clinical applications of dCasRx.

The identification of Type VI Cas13d enzymes is another win for bioinformatic data mining. As we continue to harness the natural diversity of CRISPR systems, only time will tell how large the genome and transcriptome engineering toolbox will be. It is, however, certain that the impact of CRISPR scientific sharing will continue to grow, and we at Addgene appreciate our depositors for making their tools available to the broader community.

References

Konermann, Silvana, et al. “Transcriptome Engineering with RNA-Targeting Type VI-D CRISPR Effectors.” Cell (2018) pii: S0092-8674(18)30207-1. PubMed PMID: 29551272

Yan, Winston X., et al. “Cas13d Is a Compact RNA-Targeting Type VI CRISPR Effector Positively Modulated by a WYL-Domain-Containing Accessory Protein.” Mol Cell. (2018) pii: S1097-2765(18)30173-4. PubMed PMID: 29551514

\1. Transcriptome Engineering with RNA-Targeting Type VI-D CRISPR Effectors

\2. CRISPR genetic editing takes another big step forward, targeting RNA

\3. How Editing RNA—Not DNA—Could Cure Disease in the Future

[ ](

新能源汽车专业毕业论文参考文献

列出论文参考文献的目的是让读者了解论文研究命题的来龙去脉，便于查找，同时也是尊重前人劳动，对自己的工作有准确的定位。因此这里既有技术问题，也有科学道德问题。如下是我为大家收集的新能源汽车专业毕业论文参考文献，欢迎阅读！

[1]徐枭，王巧凤，周荣，新能源汽车发展主要障碍及其解决方案[J]，上海汽车，2009，（5）：7—10

[2]杨婕，消费者对电动汽车购买意愿实证研究—基于政府产业政策理论[J]，特区经济，2012，（2）：302—304

[3]李光，影响我国电动汽车产业发展的关键因素研究[J]，武汉理工大学学报，2011，（6）：14—18

[4]霍风利，我国发展电动汽车产业的'可行性及对策研究[D]，中国海洋大学硕士学位论文，2010：23—27

[5]田萍，新能源汽车是新的经济增长点[J]，资源与人居环境，2009，（9）：74—76

[6]方海洲，胡研，促进新能源汽车快速发展的税收优惠政策影响分析[J]，汽车科技，2009，（3）：7—10

[7]国家863电动汽车重大科技专项办公室，全球氢能研发及相关政策调查报告[R]，2004

[8]德勤全球制造组，电动车现状与消费者期望之比较[J]，全球视角，2011，（1）

[9]曾耀明，史忠良，中外新能源汽车产业政策对比分析[J]，企业经济，2011，（2）：107—109

[10]李东卫，我国新能源汽车产业的挑战及对策[J]，广东经济，2011，（2）

[11]迈克尔·波特，竞争优势[M]，北京：华夏出版社，1997：280—317

[12]李大元，低碳经济背景下我国新能源汽车产业发展的对策研究[J]，经济纵横，2011

[13]罗少文，我国新能源汽车产业发展战略研究[D]，复旦大学硕士学位论文，2008

[14]杨海霞，新能源汽车技术路线落定，中国投资[J]，2012，（11）

[15]张海波，我国新能源汽车产业技术路线图研究[D]，武汉理工大学硕士学位论文，2012

[16]刘浩华，程杨，中国新能源汽车需求风险关键因素研究[J]，科技管理研究，2014，（19）

[17]章荣武，“钻石模型”及其应用：中国船舶工业产业竞争优势分析[D]，厦门大学硕士学位，2006

[18]赵亮，BYD公司新能源汽车发展战略研究[D]，山东大学硕士学位论文，2013

[19]张坤，安徽汽车产业国际竞争力分析[D]，安徽大学硕士学位论文，2011

[20]赵斌，比亚迪新能源汽车消费的影响因素分析[D]，中南大学硕士学位论文，2010

[21]顾瑞兰，促进我国新能源汽车产业发展的财税政策研究[D]，财政部财政科学研究所博士学位论文，2013

[22]王慧，促进我国新能源汽车产业发展的财税政策研究[D]，江西财经大学硕士学位论文，2010

[23]温岳中，基于产业生命周期理论的新能源汽车产业支持政策研究[D]，北京交通大学硕士学位论文，2012

[24]方玲，基于成本—效益分析视角的我国新能源汽车产业发展策略研究[D]，中南大学商学院硕士学位论文，2013

[25]文凯，借鉴国际经验发展我国新能源汽车产业研究[D]，东北财经大学硕士学位论文，2010

[26]陈柳钦，美日欧新能源汽车产业发展的政策支持[J]，汽车工程师，2010，（10）：22—25

[27]孙浩然，日本新能源汽车产业发展分析[D]，吉林大学硕士学位论文，2011

[28]金永花，日本新能源汽车市场推广策略对我国的借鉴[J]，东北亚论坛，2012，（3）：105—112

[29]高飞，我国电动汽车研发战略联盟模式选择研究[D]，河北师范大学硕士学位论文，2012

[30]韩怀玉，我国新能源汽车产业发展的国际比较研究[D]，陕西师范大学硕士学位论文，2012

【论文阅读】存储在SPDK与新硬件设备的探索汇总

穷则软件优化，达的硬件堆积，本文主要介绍存储领域在硬件方向的一些探索。硬件方向的探索又分为大体两块，对现有硬件的性能压榨，以及新硬件设备的创新。对现有硬件的压榨主要是 SPDK RDMA，通过by pass驱动层来最大限度利用硬件的性能。新硬件的探索则包含了傲腾持久化内存和KV-SSD两块。其中持久化内存目前有些云厂商已经投入了使用，KV-SSD 则目前主要还是在学术理论阶段，业界未看到大规模的使用。以下几篇论文分别介绍了在 SPDK KV-SSD方向的一些研究。 SpanDB: A Fast, Cost-Effective LSM-tree Based KV Store on Hybrid Storage 介绍了在SPDK的探索。 Towards Building a High-Performance, Scale-In Key-Value Storage System 是三星发布的介绍了他们最新的产品KV-SSD的论文，介绍了KVSSD 这种新型存储在kv的应用。 PinK: High-speed In-storage Key-value Store with Bounded Tails 则针对现在一些KVSSD实现的缺点做了优化，提出了一种针对KVSSD 优化的变种LSM 实现。下文将非常对这三篇论文进行展开做详细的介绍。

本文主要介绍了如何基于 SPDK 构建LSM-tree Based KV Store。传统的kv实现需要通过调用文件系统层最后才会达到磁盘，对于 Nvme SSD 这种高性能设备，传统的io链路无法完全发挥硬件的性能，通过SPDK ByPass驱动层直接操作裸盘则可以将硬件性能发挥到极致。

使用SPDK对WAL进行并发写入，可以大大提升写入性能，支持异步请求处理，减少线程切换的开销。测试表明，对于小value写入，绕过ext4文件系统直接通过SPDK进行写入可以降低6.8-12.4倍的延时。由于WAL 处于关键路径上，这会对写入带来严重的性能开销导致性能瓶颈。其次，现在的kv架构都是假设磁盘设备速度较慢，因此设计上通常都嵌入了较高的软件开销，如果基于轮训的机制则会比较浪费cpu周期。本文基于rocksdb做了如下的优化:

多线程排队写入，有队列头部的线程直接获取当前的写入任务进行提交，可以做写入io合并，提升写入性能。如果写请求已经被提交，队列中部的请求发现已经完成写请求后直接返回，无需在进行io操作，通过group write，将大量的小io转化成顺序大io。

随着io设备性能的提升，linux io协议栈的开销变得不可忽视，通过SPDK将驱动移动用户态，减少了系统调用并且支持zore copy，通过poll的方式而不是中断的方式进行io操作，减少了内核态的切换和io路径锁争用。同时这个章节对 Optane P4800x和P4610 两种设备进行了压测对比，简单列下压测结果。

图3的N 表示 P4610 0表示Optane 3-N 表示3个线程写入，CR=2 表示每个线程同时提交2个请求

可以看出使用多线程的SPDK 可以大大发挥磁盘性能

一旦进程绑定了SPDK，该磁盘就不能被其他进程访问，无论是通过io栈还是spdk。此外绑定cpu核心可以降低io的性能开销。加上polling-based io机制，导致后台的flush和compact线程不适合使用spdk进行读写，因为如果不绑核，会导致 io变慢，如果绑核了，则难以释放cpu空闲资源。

对于rocksdb和leveldb，前台的client写入通常都是同步的，用户同步提交读写请求然后等待io操作完成后返回，这种操作通常会受限于io的延时导致吞吐的不足，为了提高吞吐，用户通常会设置超过cpu核心数的线程来进行并发的操作。但是对于使用了SPDK 的高速nvme，线程间的同步唤醒往往开销比io请求本身还大，超线程机制会带来额外的开销和降低了cpu的使用率。（好比redis 内存处理足够快，不需要多线程进行处理，多线程主要带来额外的开销争用）

对于一个n-core的机器，spandb配置Nc和线程数用于处理用户请求同时进行了绑核，剩下的n-Nc个核心则用于处理内部的io请求，分为loggers和workers。loggers用于处理wal的写入，workers用于处理后台的flush和compaction以及memtable的读取和更新操作。

后台线程使用Qflush和Qcompact队列进行flush和compact操作，继承于rocksdb的实现，只是改为了直接操作SPDK 使用Qread队列来处理读请求，写请求则被拆分为Qprolog Qlog和Qepilog三个队列

基准压测表明，少数的几个核通过批量提交请求就可以充分利用磁盘的io，因此spandb默认使用了一个logger线程进行wal的写入，该线程数量可以动态在1-3之间调整，根据队列的长度和处理耗时动态调整线程数。对于前后台线程，优先保证前台线程的调度，同时会监控后台队列的长度，以便在高负载写入的时候即使进行flush和compact。

为了减少对rocksdb本身的改动，抽象了一个TopFS 来管理spdk的相关操作。sst的数据布局与wal类似，也是通过metadata page管理，metadata page为hashtable，key为文件名，内容为文件对应的逻辑页起止id。

传统是kv存储实现，通常是存储引擎暴露kv接口，用户通过kv接口写入数据，key和value通过一定的数据结构被存储到文件里面，从用户调用接口到数据最终落到磁盘的整个流程可以用下图的左边部分来描述。

kv接口将数据写入文件系统，文件系统通过块设备驱动将数据写入磁盘，为了屏蔽磁盘的内部物理结构，文件系统到磁盘其实是通过LBA进行逻辑地址映射的，磁盘内部通过FTL将LBA转化为PBA，同时FTL还承担了磁盘的COW GC功能。可以看到从写入到落盘中间经历了非常多的环节。那么是否可以通过减少这些环节来进行写入流程的优化呢。比如上面提到的SPDK 通过bypaas文件系统少掉了一层文件系统的开销，那么是否还能更近一步呢。这篇论文正是基于这样想法，直接将kv的操作下层到设备层，由设备直接暴露了kv interface，直接bypass了设备层以及LBA到PBA的映射。通过设备内部的FTL ，直接实现了key到NAND location的映射。

设备暴露了put get delete iterate接口，kv请求通过pipeline的流程处理kv请求，固件驱动从磁盘io队列获取请求，然后传递给request handle，request handle再讲请求传递给index manager，index manager先将变长的key散列成定长的key缓存到local hashtable，最后在合并到全局的hashtable完成到磁盘位置offset的映射。同时index manager还会根据key的前4B进行分桶，通过将相同前缀的数据放在一起来实现迭代操作。local hashtable主要是为了提高写入并发减少全局hashtable的锁竞争。

垃圾回收时，垃圾回收器扫描flash中kv数据，然后和全局hashtable做对比来判断数据的有效性，丢失已经被删除和更新的数据

性能测试部门主要测试了kvssd的cpu开销，在同样的ssd下，kvssd只需要一个线程就能达到与普通ssd8线程一样的io吞吐，同时，随着单机磁盘数量的提升，kvssd拥有更好的线性拓展能力。对于普通的ssd，单机的吞吐受限于cpu无法随着磁盘数量程线性增长，而kvssd由于极低的cpu开销可以提供更高的单机吞吐能力，对于昂贵的机柜资源，如果能在单机插更多的磁盘提供更高的吞吐显然是更经济的。

其实kvssd之所以需要更低的cpu开销，除了bypass了很多层，更重要的部分是他的固件模块其实已经有点类似于一个小型的cpu了，通过把cpu的工作offload到固件本身的做法在业界由来已久，比如将网络包的解析的bypass 内核offload到网卡直接进行。

虽然使用KV-SSD可以带来延迟的降低和吞吐的上升，但是这个降低只是针对平均值，目前现在大多数的KV-SSD的实现都存在一个长尾的问题。最常见的KV-SSD的实现包括hash-based KV-SSD 和LSM-tree Based KV-SSD，但是这两种实现都存在长尾的问题。

此外，控制器内部的DRAM和FLASH 的发展速度也不一样，平均每年DRAM增长1.13倍但是FLASH则增长了1.43倍，随着DRAM的增长，FLASH的需求将越来难以满足使用，因此设计一个减少FLASH使用的数据结果是势在必行的

总体架构的实现如下图，由于pink是LSM 的改进版本，此处会将pink的数据结构和rocksdb进行比较。pink的存储结构可以分为4部分，分别是 SkipList、 levelList 、meta segment 和data segment。

上面提到skiplist和levellist都存在FLASH 当中，那么FLASH 是否有足够的容量容纳这些levellist呢？对于一块4T 的磁盘，假设key value大小分别为32B和1KB，page的大小为16KB，那么对于一个16KB的meta segment，可以容纳的pair数量为398个，对于4T的磁盘总共可以存储2^32个1KB大小的数据，也就是总共需要10.8M个meta segment，那么对于levelist来说需要占用的DRAM空间则为（32B+8B）* 10.8M = 432M 的内存空间。显然控制器的DRAM是够用的。

写入流程很简单，用户写入的数据会直接写入到skiplist中，熟悉LSM的人可能发现了，传统的LSM 写入为了保证数据的可靠性，都会先写入WAL 然后在写入内存memtable，但是此处并没有WAL而是直接写入skiplist会不会有问题呢。这个主要得益于磁盘控制器的自带的电容器，通过电容器可以保证断电数据不丢失，因此可以省掉一次的WAL写入

相比写入，读取流程则显得比较繁琐，以下图的查询key(39)为例。

从上面的读流程可以看到，对于极端的情况，一次的查询可能涉及非常多次的FLASH读取，比如上面的流程就需要读取metaPage0 metaPage2以及最终value所在的datapage12。对于level更多的场景需要读取FLASH 的次数将更多。 level Pinning的思路很简单，就是把meta segment尽可能的放在FLASH，这样就可以减少FLASH的读取了。那么问题来了，FLASH能放的下这么多的meta segment么。同样直接对数据进行分析计算，由于LSM 的指数分层存储机制，每个Ln+1 层的数据都是Ln层的T倍，对于4T的磁盘，实际数据表明总共需要的存储层级为5级，对与L1到L4的层级分别需要的meta segment为0.91MB 50.86MB 2.83GB 161.3GB.由于一块4T的SSD 通常有4G的FLASH，那么显然是可以把L1到L3的meta segment放到FLASH里面的。把metasegment放到了FLASH里面还带来了一个额外的好处，就是compaction的开销也随之降低的。因为L1到L3的meta 都在FLASH，可以大幅减少compact时meta更新带来的开销。

优化查找路径使用了级联的方法，简单说就是每一层的kv额外存储指向下一层的指针，其实就是类似skiplist的实现。通过级联的方法，当查询一个key的时候可以缩小每次二分查找的边界。查询Ln层的时候，先找到这个key的上下边界，如果Ln不满足，则根据上下边界直接定位到Ln+1 的上下边界，而无需对整个Ln+1进行二分查找。

级联需要额外的8字节指针开销，由于最后一层不需要存储级联指针，因此总共增加的级联指针开销为43.9M， FLASH 依然是够用的。不过这里有一个问题论文里没说清楚，当Ln+1由于compaction更新以后，如何去更新Ln的级联指针，考虑到由于levellist都在FLASH中，这里去更新上层的级联指针的开销是可以接受的。

简单概括就是硬件加速，把计算逻辑offload到FPGA来实现硬件加速，达则堆积硬件。

gc优化包含meta segment的GC以及data segmetn的GC。

通过metapage的start从levelList中查询是否还有指针指向page，如果没有则直接回收，否则将数据迁移到空闲的page，然后修改levelList中的指针。由于上层的meta可以通过DRAM直接进行复制更新，因此开销是很低的

遍历需要回收的page逐条读取kv信息，根据key查询判断该数据是否还有效，如果失效了直接忽略，否则则需要对该value进行rewrite。对于rewrite，最简单的实现是参考wisckey，直接更新meta 中的value指针，如果meta segment是保存在DRAM中的那没有任何问题，但是如果meta page是在FLASH中的，由于越底层的数据都是旧数据，因此一个data segment的数据在meta 中往往很离散，这时更新meta的指针会带来meta segment的写放大，为了避免这个问题，pink对于存在FLASH的meta segment使用了延时更新，compact的时候直接把kv写入到L0进行覆盖，对于该kv由于读取是从上往下的，因此读取流程不会存在任何问题，metasegment的数据则可以等待meta指针失效的时候进行删除。

新硬件探索，硬件加速是今后存储发展的一个重要方向，同时随着新硬件的出现，现有的数据结构可能并不适合新硬件的的特性。从HDD 到SDD再到NVMe，硬盘性能不断升级，业界也针对SSD做了大量的存储优化。英特尔最新推出的PMEM则对存储又是一次大的革新，对于PMEM现在的文件系统其实已经不太合适了，因此也有针对该方面的优化 Rethinking File Mapping for Persistent Memory 。至于KVSSD，在该几篇论文后目前则又有了一些新的进展，NVMe 2.0 规范已经将KVSSD的指令集规范为NVMe-KV 指令集，因此KV-NVMe应该也不远了。

Reference:

Rethinking File Mapping for Persistent Memory SpanDB: A Fast, Cost-Effective LSM-tree Based KV Store on Hybrid Storage Towards Building a High-Performance, Scale-In Key-Value Storage System PinK: High-speed In-storage Key-value Store with Bounded Tails

上一篇：论文范文汽车

下一篇：论文答辩线上模板

周大新论文研究