• 回答数

    3

  • 浏览数

    282

王小金Fighting
首页 > 职称论文 > 生信分析文章模板

3个回答 默认排序
  • 默认排序
  • 按时间排序

super船长

已采纳

肺腺癌(ADC)是肺癌中最普遍的亚型,占所有病例的46%以上。在分子层面上,ADC的特征是具有复杂的基因组格局。最近的研究集中在深入了解基因组和表观基因组改变的后果以及肿瘤异质性在治疗反应和治疗抵抗中的作用。ADC组织病理学生长模式的分析显示广泛的肿瘤内异质性(ITH)。值得注意的是,尽管在许多情况下发现了多种组织学,但主要的组织形态学生长模式(鳞状,腺泡,乳头状,微乳头状,实体状)具有很高的预后性和预测性。在分子水平上,研究发现驱动程序突变等位基因频率与组织学生长模式之间具有高度相关性。在表观基因组水平上,第一项研究报道了肺ADC中DNA甲基化模式的高肿瘤内异质性。但是,到目前为止,尚未进行ADC中表观基因组学和形态学ITH的比较空间分析。 那么今天我为大家带来这篇文章作者系统地评估了来自七个主要ADC的122个肿瘤的形态生长模式,以评估组织学亚型的空间分布。 (1)患者和样本:作者根据2015年WHO肺癌分类标准(表1),对7位II至IV期ADC患者的肿瘤(n = 27)和非肿瘤(n = 7)组织标本进行了评估。对其中四名患者的六个淋巴结转移进行了类似的评估。病理学家将最大直径的肿瘤切片分为5 x 5 mm的区域并在连续的H&E染色切片上确定每个节段的主要组织学生长模式(定义为百分比最高的模式)。在这七名患者​​中,四名携带KRAS基因突变,三名携带TP53(其中两个是双重突变)。 (2)DNA提取和定量:将来自每个片段的六个连续的未染色的10 µm组织切片去石蜡并用蛋白酶K消化。使用LEV DNA纯化试剂盒进行DNA提取。使用Qubit HS DNA分析确定DNA浓度。 (3)Digital PCR:使用Quantstudio 3D Digital PCR系统利用20 ng模板DNA分析了患者4淋巴结中激活的KRAS G12S突变的存在,并验证了TaqMan SNP基因分型分析。 (4)全局甲基化谱:应用Infinium MethylationEPIC BeadChip 来评估> 866,000 CpG位点的全基因组DNA甲基化水平。在DKFZ基因组学和蛋白质组学核心设施中,对来自恶性和正常肺FFPE组织样本的500ng基因组DNA进行亚硫酸氢盐转化并进行甲基化分析。 (5)DNA甲基化数据分析:使用“minfi”R包处理原始甲基化数据。正常样本的甲基化定义为七个匹配的非肿瘤性肺组织样品的平均甲基化。 (6)基因组注释:通过标准的Illumina Infinium甲基化EPIC BeadChip标准进行CpG注释。 (7)无监督分层聚类:使用肿瘤内甲基化差异最大的10,000个探针的β值,进行甲基化水平的无监督分层聚类。聚类采用欧氏距离和平均连锁作为聚类方法。 (8)拷贝数分析:使用R包“conumee”从甲基化和未甲基化的探针信号强度值得出拷贝数分布图。 (9)系统发生树重建:根据肿瘤内甲基化变异的距离矩阵来推断系统发生的关系。使用具有最大肿瘤内甲基化差异的10,000个探针的Beta值来计算DNA甲基化欧几里德距离矩阵。最后使用R包“ape”来构建系统发生树。 (10)差异甲基化分析:使用线性模型来评估肿瘤和肺肿瘤组织中的甲基化差异。使用PANTHER分类系统对差异甲基化基因进行了GO和KEGG分析。 (11)相关性分析:应用Pearson相关系数来估计基于甲基化的距离。 1.  ADC的组织学和表观基因组分析: 为了对组织病理学肿瘤内异质性进行系统表征,作者将7位ADC患者的中央肿瘤切片(表1)解剖为122个肿瘤和34个5 x 5 mm的非肿瘤部分。靠近转录起始位点(TSSs)的DNA甲基化影响基因活性。为了确定TSS活性,作者将active 和 passive的TSS的甲基化水平与正常肺组织的H3 K4Me3标记进行了比较。结果显示具有K4Me3标记的潜在passive TSS在其TSS周围的1kb区域显示甲基化水平降低,而没有K4Me3标记的位点显示甲基化水平较高(图1 A)。 并且与passive TSS相比,活性(active)位点总体上甲基化水平较低(图1 B):具有K4Me3标记的active TSS处的CpGs显示平均甲基化水平为至,而没有激活组蛋白标记的passive TSS显示平均甲基化水平> 。接下来作者比较了非肿瘤组织的平均甲基化水平与患者2的两个腺泡,鳞状,乳头状和实心部分的甲基化。揭示了肿瘤内和组织内的异质性(图1C)。 2.  DNA甲基化分析揭示了广泛的肿瘤内异质性: 在这一部分作者对不同节段和淋巴结转移之间的DNA甲基化模式进行单独评估,发现DNA甲基化具有广泛的肿瘤内异质性,并通过无监督分层聚类来显示结果(图2A)。此外,对患者所有节段的分析进一步说明了同一肿瘤各节段之间的强烈变异性(图2 B)。 为了将异质性程度放在更广泛的背景下,作者对来自TCGA肺腺癌的33个肿瘤区段的启动子区域和369例患者(366个肿瘤和38个正常样品)的相应位点进行了12601个位点的无监督分层聚类。结果显示这些样本没有形成单独的群集,并且个体内的区段彼此之间的相似性仍然不与来自不同个体的区段相似(图3)。 3.  拷贝数变异的异质性: 为了更深入地了解拷贝数变异(CNV)的空间分布,作者基于EPIC阵列数据确定了每个区段的CNV分布图。结果在33个肿瘤区段中的32个中鉴定了具有体细胞拷贝数增减的CNV(图4A)。总体而言,CNV图谱在肿瘤内部比在肿瘤之间更相似。仅患者4的淋巴结转移未显示出具有与匹配的非肿瘤组织相似的特征的CNV。接下来作者基于TCGA数据进一步确定了在肺ADC和潜在的肿瘤驱动CNVs中被鉴定为反复扩增或缺失的基因的拷贝数状态。这项分析表明尽管所有片段均携带至少一个重复扩增或缺失的基因的CNV,却发现了克隆和亚克隆拷贝数得失的片段之间的空间异质性(图4 B)。 4.  基于CNV和DNA甲基化数据的生长模式的克隆进化: 为了深入了解ADC的克隆进化并探索淋巴结转移的组织学起源,作者根据DNA甲基化变化和CNV得出的距离矩阵对40个多区域片段进行了系统发育重建。结果作者在表观遗传水平上观察到ADC的分支进化,在原发肿瘤的生长模式之间具有广泛的克隆多样性(图5 A)。甚至同一增长模式的各个部分也显示出分支演化,表明同一模式在不同区域或不同时间点独立出现(图4 B)。为了进一步探索不同肿瘤区域之间的亚克隆关系不受选择性限制或生态位适应的影响,作者对远离调控元件的基因组位点(n = 83,756)进行了相关分析。相关性证实了肿瘤内的亚克隆关系和广泛变化(图5B)。 为了重建组织形态学模式的克隆进化,本研究对27个原发性肿瘤区域,7个匹配的正常组织和7个ADC病例的6个淋巴结转移进行了整体DNA甲基化分析。结果表明,表观基因组特征的广泛变化有助于原发性ADC和淋巴结转移的分子和表型异质性。 16-IF4+:非肿瘤的疾病挖掘 利用WGCNA分析挖掘孕前BMI和新生儿体重的关键基因 18-IF6+:纯生信分析甲基化和基因表达整合鉴定三阴性乳腺癌的预后标志物和药物靶标 19-干细胞、分子靶向治疗和EMT生物过程联合构建多发性脑瘤预后模型 20-基于全基因组分析探索MAPK失调与免疫应答的关系

111 评论

Q糖奶爸

一个星期左右。

如果学习操作时间足够,而且是基于别人写好的分析流程,估计几天就可以完成了,例如我们以细胞焦亡的纯生信分析为例:

1、数据下载与整理。

2、差异分析。

3、进行肿瘤分型,并且进行生存分析。

4、构建模型,计算risk score, risk score结合临床因素分析。

5、根据risk score分组做差异分析,并且用得到的差异基因做GO、KEGG富集分析。

6、进行免疫相关的分析。

做上面的分析就可以对着参考范文写文章了,到底做完上面的分析需要多久呢?如果是基于别人写好的操作流程,并且有人指导的话,及时解决代码报错的话。

零基础的人可以三天内完成这些操作;如果是熟练操作的话,估计不用一个上午就可以完成这些分析,一个星期左右就可以出文章。

如果你是零基础的话,又不是基于别人弄好的操作流程进行操作的话,可能安装软件或者数据下载都要好几个月,把所有的分析流程都弄好,估计要一年半载都不行。一般一个研究热点经过一两年肯定烂大街了,后面的人想发就变得非常困难。

148 评论

汤糖躺烫湯

就有人问,生信的文章能发到多少分?如果你是像华科薛宇教授一样的大牛,弄一套算法,编一个生信分析工具,十几分妥妥的,引用量杠杠的。但是,那是大牛,一般来说,按「常规套路」出牌的这种生信分析文章分值在 0-2 分之间。但也有些不做实验的生信分析文章能发到个 4-5 分,那么生信分析的文章怎么样能达到一个比较高的层次呢?这里,我们给大家分享两篇文章来说一说一些进阶的文章思路,一篇是发表在我们的老朋友「Oncotarget」上的,另一篇是发表在「Journal of Proteome Research」(IF = )上的。先看 Oncotarget 这篇「Genomic expression differences between cutaneous cells from red hair color individuals and black hair color individuals based on bioinformatic analysis」,文章是做的黑色素瘤的两种不同表型的个体的差异基因的生信分析。Abstract 里说到 MC1R 这个基因的突变会导致高患癌率的 RHC 表型两种不同的表型,其中 RHC 表型会增加皮肤癌的发生率,那么 MC1R 的突变究竟影响了哪些基因?文章通过 PPI 网络分析,分别对比分析两个不同表型(RHC 和 BHC)的正常皮肤细胞和癌细胞中的差异基因。结果表明,在癌细胞的对比中没有差异,而在正常皮肤细胞中筛选出 23 个 hub 基因,并且其中 8 个基因异常表达,这一结果提示这 8 个基因的异常表达可能是 RHC 表型患癌风险提高的重要原因。这篇文章利用了 3 个数据包进行综合分析,从而得到了一个 novel 的结论,文章利用 GSE44805 中的差异基因构建 PPI 网络筛选 hub 基因,再利用别的数据包中的测序结果验证这些基因确实存在异常表达,多方验证说明自己生信分析结果是可靠的。虽然作者一点实验也没有做,但是从数据量还有可靠性上来说,可能比自己辛辛苦苦地做小样本量测序还要靠谱。文章中的分析方法(差异基因以及 PPI 分析)都是我们非常熟悉的。筛选出差异基因,将上调和下调的基因分别构建 PPI 网络,得到文中的 4 张图(不管怎么说,这图的颜值比上一期套路中分析的文章要高得多)。这张图的构建方法这里不再赘述小结这篇文章的方法完全是可以借鉴和复制的,难点在于找到足够多的具有相似性和可比性的数据结果,以及找到一个合适的切入点得到一个相对 novel 的结论。下面看 Journal of Proteome Research 上的这篇文章「Weighted Protein Interaction Network Analysis of Frontotemporal Dementia」。一看这流程图就觉得这文章是生信专业的人做的文章。(本宫上学的时候,就觉得我们生命学院的学生都是码农,生物信息专业、生物医疗工程、生物科学这些专业的人天天都在编代码,完全感受不出生物专业的气息。)这文章讲得啥咧,就是先选出 13 个种子基因,然后根据 PPI 数据库中蛋白质互作关系构建这 13 个种子基因的第一层网络结构。再以第一层网络为种子构建第二层网络结构(然后电脑就死机了)。然后分析第二层网络的拓扑学结构,从中筛选出 hub 基因(图中绿点表示最初的 13 个种子基因,蓝点表示第一层的基因)。在构建过程中,随着基因数量的不断增加,最先选出的 13 个种子基因未必就是后来的 hub 基因。文中还设置了对照组,并详细讲述了这 13 个种子基因的筛选方法。因为整个分析过程都是建立在生信分析的基础上,属于完全架空的,所以整个研究过程十分讲究逻辑上的严谨性。小结之所向大家介绍这篇文章,是觉得这种思路在生信分析的文章中可以借鉴,种子基因的选择可以通过临床上疾病中基因突变的概率来进行筛选,然后构建两层 PPI 网络,进行 GO,KEGG 分析,从而预测新的未知的疾病相关基因,如果后续能从别的数据包中得到表达量的验证或者是自己在临床样本中进行验证,那么整个文章的内容将会更加丰富。局限性:PPI 数据库中其实很多蛋白质互作结果是没有意义的,因为在实际生物体中很多蛋白质互作情况是不可能发生的,只有在实验人为干预情况下才会发生。

190 评论

相关问答

  • 论文正文分析模板

    数学建模论文模板论文通常要包括哪些内容? 我去年就参加了全国大学生数学建模竞赛,这些资料是我去年暑假整理的论文模板,如果资料不足的话,再联系我………………

    笨丫头19868 4人参与回答 2023-12-07
  • 分析性论文模板

    SPSS软件是“统计产品与服务解决方案”软件,是数据统计分析的一个重要的工具。下文是我为大家整理的关于spss统计分析论文的 范文 ,欢迎大家阅读参考! 统

    崽崽龙08 4人参与回答 2023-12-12
  • 信息系统论文的分析报告模板

    问题一:一篇论文需要写那些内容? 首先,写开题报告,格式为 一、立论依据,选题来源、背景 研究目的、意义 (1)意义在于: (2)目的:

    馋佬胚祖宗 3人参与回答 2023-12-12
  • 分析型论文模板

    1500字论文格式模板(通用5篇) 无论是在学习还是在工作中,大家最不陌生的就是论文了吧,通过论文写作可以培养我们独立思考和创新的能力。相信许多人会觉得论文很难

    我的大BABY 2人参与回答 2023-12-07
  • 研究生论文分析模板

    研究生小论文模板 研究生小论文模板怎么写呢,大家需要参考一下具体的模板吗?下面就由我为你分享一下研究生小论文模板吧! 论文题目:空一行,2黑,一般不超过20字,

    哇塞小熊 2人参与回答 2023-12-11