宝,在吗送你个分子分型的绝招,包

中医治疗白癜风好吗 http://m.39.net/pf/a_7549893.html

探索生信之美,解构每段代码后的故事

大家好呀,我是风间琉璃。今天给大家介绍一个实用的R包——psSubpathway。这个包提供了全新的方法筛选并验证在肿瘤领域中与亚型特异性或者阶段特异性明显的子通路。子通路是什么意思呢?是指与在经典KEGG通路中的一部分基因子网络,并在既往的研究中报道中与肿瘤的发生、发展以及预后明显相关。关于psSubpathway包的文章“psSubpathway:asoftwarpackagforflxiblidntificationofphnotyp-spcificsubpathwaysincancrprogrssion.”于年发表在《Bioinformatics》杂志上。大家如果发文章的时候别忘了引用喔~

psSubpathway包主要包括四个部分:

1.从经典通路中提取出子通路。作者使用社交网络分析中k-cliqu方法提取子通路,并且去除重叠度大于80%的子通路。

2.通过基因集富集方法(ssGSEA和GSVA)的方法推断每个样本的子通路的活性。

3.验证亚型特异性的子通路。作者使用SubtypStEnrichmntAnalysis(SubSEA)方法验证亚型特异性的子通路。

4.验证子通路的动态变化过程。作者构建出DynamicChangdSubpathwayAnalysis(DCSA)方法进行找到与疾病,尤其时肿瘤发展的不同阶段明显相关的子通路。

一、SubSEA:验证亚型特异性子通路

这个功能能够在多个肿瘤亚型中筛选出与某一个亚型明显相关的子通路。具体的原理是对于每个子通路,作者通过计算通路活性从而将数据集中的样本进行降序排列。针对每个样本所在的亚型,如果某个亚型的样本主要集中在序列的顶端或者底端,那么这个亚型就显著与这个子通路明显相关。而作者使用samplEnrichmntscor(SES)这个值来量化不同样本与子通路的相关性,接下来在排序列表中按照顺序进行加减,如果是该亚型的样本则增加,如果不是则减少。类似与我们GESA分析中的NES。讲完大致原理,我们再来讲一下这个功能所需要的数据要求:

(1)基因表达数据;

(2)样本的表型数据(CLS格式);

(3)子通路的基因列表(这个我们也可以自定义)。

这里示例数据是TCGA的乳腺数据,分型数据是PM50所定义的四种肿瘤亚型(Hr+、Basal、LumA、LumB)。我们直接开始把~

#下载包#install.packags("psSubpathway")#加载包library(psSubpathway)rquir(GSVA)rquir(paralll)#获取乳腺癌数据的基因表达数据型Brgnmatrix-gt("Subgnmatrix")#获取样本的表型信息Subtyplabls-systm.fil("xtdata","Sublabls.cls",packag="psSubpathway")#开始运行SubSEA功能SubSEArsult-SubSEA(Brgnmatrix,input.cls=Subtyplabls,nprm=5,#迭代的次数fdr.th=0.01,#设置阈值paralll.sz=8)#设置处理器数量#查看数据结构str(SubSEArsult)##Listof5##Basal:data.fram:obs.of6variabls:##..SubpathwayID:chr[1:]"_6""_1""_9""_11"...##..PathwayNam:chr[1:]"Glycolysis/Gluconognsis""Primarybilacidbiosynthsis""Primarybilacidbiosynthsis""Primarybilacidbiosynthsis"...##..SubpathwayGn:chr[1:]"ALDOAALDOBALDOCENO1ENO2ENO3ENO4PGAM4PGAM1PGAM2BPGMGAPDHGAPDHSTPI1PGK1PGK2MINPP1""CYP46A1CYP7B1CYP7A1AKR1D1CH25HCYP27A1HSD3B7CYP8B1CYP39A1""AMACRACOX2HSD17B4SCP2""SCP2SLC27A5BAATACOX2HSD17B4ACOT8"...##..SES:num[1:]0..-0.-0.78-0....##..Pvalu:num[1:]...##..FDR:num[1:]...##Hr2:data.fram:obs.of6variabls:##..SubpathwayID:chr[1:]"_5""_6""_4""_2"...##..PathwayNam:chr[1:]"Glycolysis/Gluconognsis""Glycolysis/Gluconognsis""Citratcycl(TCAcycl)""Pntosphosphatpathway"...##..SubpathwayGn:chr[1:]"PDHA1PDHA2PDHBLDHAL6ALDHALDHBLDHCLDHAL6BPKLRPKMENO1ENO2ENO3ENO4PGAM4PGAM1PGAM2BPGMPGK1PGK2PCK1PCK2MINPP1""ALDOAALDOBALDOCENO1ENO2ENO3ENO4PGAM4PGAM1PGAM2BPGMGAPDHGAPDHSTPI1PGK1PGK2MINPP1""OGDHOGDHLIDH1IDH2IDH3AIDH3BIDH3GACLYACO1ACO2CS""GPIDERAPRPS1L1PRPS1PRPS2PGM2RBKSTKTTKTL1TKTL2RPIARPERPEL1ALDOAALDOBALDOCPFKLPFKMPFKPFBP1FBP"

__truncatd__...##..SES:num[1:]0........##..Pvalu:num[1:]...##..FDR:num[1:]...##LumA:data.fram:obs.of6variabls:##..SubpathwayID:chr[1:]"_1""_6""_2""_3"...##..PathwayNam:chr[1:]"Glycolysis/Gluconognsis""Glycolysis/Gluconognsis""Pntosphosphatpathway""Pntosandglucuronatintrconvrsions"...##..SubpathwayGn:chr[1:]"ALDOAALDOBALDOCGAPDHGAPDHSTPI1PFKLPFKMPFKPFBP1FBP2GPIPGM1PGM2HK1HK2HK3HKDC1GCKG6PCG6PC2G6PC3ADPGK""ALDOAALDOBALDOCENO1ENO2ENO3ENO4PGAM4PGAM1PGAM2BPGMGAPDHGAPDHSTPI1PGK1PGK2MINPP1""GPIDERAPRPS1L1PRPS1PRPS2PGM2RBKSTKTTKTL1TKTL2RPIARPERPEL1ALDOAALDOBALDOCPFKLPFKMPFKPFBP1FBP"

__truncatd__"RPERPEL1XYLBDCXRAKR1B1AKR1B10DHDHSORD"...##..SES:num[1:]-0.-0.-0.-0.-0....##..Pvalu:num[1:]...##..FDR:num[1:]...##LumB:data.fram:obs.of6variabls:##..SubpathwayID:chr[1:]"_6""_1""_1""_6"...##..PathwayNam:chr[1:]"Stroidbiosynthsis""Primarybilacidbiosynthsis""Caffinmtabolism""Cystinandmthioninmtabolism"...##..SubpathwayGn:chr[1:]"DHCR24LSSTM7SF2MSMO1CYP51A1SQLE""CYP46A1CYP7B1CYP7A1AKR1D1CH25HCYP27A1HSD3B7CYP8B1CYP39A1""CYP1A2XDHNAT2NAT1CYP2A6""TATCTHCBSMTRBHMTMAT2BMAT1AMAT2AAHCYL1AHCYAHCYL2DNMT1DNMT3ADNMT3BIL4I1BHMT2CDO1GOT1GOT2BCAT1BCAT2AGXT2"...##..SES:num[1:]0.-0.4......##..Pvalu:num[1:]...##..FDR:num[1:]...##spwmatrix:num[1:,1:67]0........##..-attr(*,"dimnams")=Listof2##....:chr[1:]"_1""_2""_5""_6"...##....:chr[1:67]"Hr2""LumA""LumB""LumA"...#查看某个亚型的数据had(SubSEArsultBasal)##SubpathwayIDPathwayNam##_6_6Glycolysis/Gluconognsis##_1_1Primarybilacidbiosynthsis##_9_9Primarybilacidbiosynthsis##_11_11Primarybilacidbiosynthsis##_19_19Primarybilacidbiosynthsis##_1_1Purinmtabolism##SESPvaluFDR##_60.##_10.##_9-0.8846##_11-0.##_19-0.0##_10.

二、DCSA:筛选与表型明显相关动态改变的子通路

该功能需要加载依赖包-mpmi。

所需要的数据要求为:

(1)基因表达数据;

(2)样本的阶段信息(CLS格式);

(3)子通路的基因列表(这个我们也可以自定义)。

这里使用肾上腺皮质肿瘤的基因表达数据和肿瘤的分级信息(stagI-IV)进行分析筛选与肾上腺皮质肿瘤stag相关的通路变化。

#加载依赖包rquir(mpmi)#获得基因表达数据ACCgnmatrix-gt("DCgnmatrix")#获得肿瘤的stag信息Staglabls-systm.fil("xtdata","DClabs.cls",packag="psSubpathway")#运行DCSA功能DCSArsult-DCSA(ACCgnmatrix,input.cls=Staglabls,nprm=5,#迭代的次数fdr.th=0.01,#设置阈值paralll.sz=8)#设置处理器数量#查看数据结构DCSArsult-gt("DCspwrsult")str(DCSArsult)##Listof2##DCSA:data.fram:13obs.of6variabls:##..SubpahwayID:Factorw/13lvls"_2","_2",..:...##..PahwayNam:Factorw/12lvls"Aminosugarandnuclotidsugarmtabolism",..:5...##..SubpathwayGn:Factorw/13lvls"CDK1CCNB2ANAPC10CDC26ANAPC13ANAPC2ANAPC4ANAPC5ANAPC7ANAPC11ANAPC1CDC23CDC16CDC27CDC20PTTG2PTTG1"

__truncatd__,..:3...##..D(M):num[1:13]0..0......##..Pvalu:num[1:13]...##..FDR:num[1:13]...##spwmatrix:num[1:,1:77]-0.-0.-0.-0.-0....##..-attr(*,"dimnams")=Listof2##....:chr[1:]"_1""_2""_5""_6"...##....:chr[1:77]"StagI""StagI""StagI""StagI"...#查看结构内容had(DCSArsultDCSA)##SubpahwayIDPahwayNam##_220_2Argininbiosynthsis##_520_2Aminosugarandnuclotidsugarmtabolism##_982_2Drugmtabolism-cytochromP##_2_2RNAtransport##_10_10HIF-1signalingpathway##_6_6Cllcycl##SubpathwayGn##_2GLS2GLSGLULCPS1OTCASS1ARG1ARG2NAGSACY1NOS1NOS2NOS3GLUD1GLUD2GOT1GOT2GPTGPT2##_2NAGKPGM3UAP1UAP1L1GNEGNPDA1GNPDA2AMDHD2GFPT1GFPT2GNPNAT1NANSRENBPHEXAHEXBCHIT1CHIANPLHK1HK2HK3HKDC1##_2FMO1FMO2FMO3FMO4FMO5CYP3A4CYP2D6CYP2C9##_2RANXPO1NCBP2NCBP1PHAXNXF1NXF5NXF3NXF2NXF2BNUPNUP88NUP42##_10EGLN2EGLN3EGLN1PIK3CAPIK3CBPIK3CDPIK3R1PIK3R2PIK3R3AKT3AKT1AKT2MTORPLCG1PLCG2PRKCAPRKCBPRKCGEIF4EBP1RPS6KB1RPS6KB2RPS6MAPK1MAPK3##_6FZR1ANAPC10CDC26ANAPC13ANAPC2ANAPC4ANAPC5ANAPC7ANAPC11ANAPC1CDC23CDC16CDC27CDK1PLK1CDC14BCDC14AYWHAQYWHABYWHAEYWHAGYWHAHYWHAZSFNCHEK1CHEK2PKMYT1WEE2WEE1GADD45GGADD45AGADD45BTP53CDC20CDC25BCDC25CCCNB3CCNB1CCNB2##D(M)PvaluFDR##_20.##_20.##_20.##_20.191303##_.##_60.179

三、可视化

psSubpathway包提供了多个功能进行可视化。包括plotSubSEScurv,plotSpwACmap,plotSpwNtmapandplothatmap等等功能,我们一个一个来说。

01

plotSubSEScurv

plotSubSEScurv功能能够绘制不同亚型的的samplEnrichmntscor(SES)曲线,根据不同亚型曲线的不同从而鉴别亚型特异性的子通路。

#绘制subpathway_9在四个乳腺癌亚型中的nrichmntcurvplotSubSEScurv(Subspwrsult,spwid="_9",#子通路的idphnotyp="all")#绘制哪个亚型

我们可以看到唯一在basal这个亚型中subpathway_9是低表达的。进一步查看basal亚型。

plotSubSEScurv(Subspwrsult,spwid="_9",phnotyp="Basal")

02

plotSpwACamp

plotSpwACamp功能可以绘制某个子通路在疾病发展不同阶段活性动态变化。包括箱式图和热图。我们来看看吧~。以subpathway_9为例。

#绘制SubSEA功能得到的结果plotSpwACmap(Subspwrsult,spwid="_9")

#同样可以绘制DCSA功能得到的结果plotSpwACmap(DCspwrsult,spwid="_2")

03

plothatmap

plothatmap功能能够绘制子通路的热图形式,从而直接查看哪些子通路在哪一个亚型明显上调,在哪一个亚型明显下调。

#加载依赖包rquir(phatmap)#绘制显著上调的亚型特异性通路的热图,子通路为为行,样本为列plothatmap(Subspwrsult,fdr.th=0.01,#通路的筛选阈值plotSubSEA=TRUE,#表明输入数据来自于SubSEA分析的结果SES="positiv",#获取SES是正的特异性子通路phnotyp="all")#所有亚型

#绘制相助下调的亚型特异性通路的热图plothatmap(Subspwrsult,plotSubSEA=TRUE,fdr.th=0.01,SES="ngativ",#获取SES是负的特异性子通路phnotyp="all")

为了方便查看我们同样可以绘制与某一个亚型显著相关的通路热图。

#绘制与Basal亚型相关的子通路plothatmap(Subspwrsult,plotSubSEA=TRUE,fdr.th=0.01,SES="all",phnotyp="Basal")

#对于DCSA功能同样适用plothatmap(DCspwrsult,plotSubSEA=FALSE,fdr.th=0.01)

04

plotSpwPShatmap

plotSpwPShatmap功能能够以热图的形式展示不同亚型间子通路的活性T检验的P值。里面的值越低,那么代表差异越大。我们同样以subpathway_9为例。

#获得subSEA运行后的结果Subspwrsult-gt("Subspwrsult")#绘制差异任曦的热图plotSpwPShatmap(Subspwrsult,spwid="_9")

#获得DCSA运行后的结果DCspwrsult-gt("DCspwrsult")#绘制差异任曦的热图plotSpwPShatmap(DCspwrsult,spwid="_2")

05

plotSpwNtmap

plotSpwNtmap能够让我们绘制每个子通路的网络图。

#加载依赖包library(igraph)#绘制子通路_2的ntwork图plotSpwNtmap("_2")

好啦~我们大致了解了psSubpathway包的分析流程啦,对于学习肿瘤的同学来说是一大福音。在我们SCI写作中可以适用这个技能,一定能让审稿人眼前一亮我是风间琉璃,咱们下周见~

往期传送门

手把手教你甲基化生信分析——甲基化minfi包的使用(一)

手把手教你甲基化生信分析—甲基化minfi包的使用(二)

手把手教你甲基化分析——甲基化CHAMP包的使用(一)

五分钟学会甲基化芯片处理,快上车!!!

一首歌的时间,我就掌握了这个生信技能

解锁高阶甲基化分析流程?你的SCI又多了一张图

年了!!这样的文章也能发近5分!

甲基化分析实战,将你的数据用在刀刃上!

小白都能学会的基因组可视化,不来看看吗?

万字长文教你入门biocondutor基石,小白都能看懂~

进阶!!!biocondutor基石的熟练应用

顶刊青睐的生信套路,小白都能学会,你不掌握下吗?

原来高分文章的图是这么做的?真简单!!!!

什么?UCSCgnbrowsr美图R也能画?新年送美图,牛年红红火火

IF14+非肿瘤的顶刊单细胞套路,亮点在这里!

年,加上转录因子还能发3+分!!

转录因子+LncRNA=6+分?

掌握这个技能,探针注释再也不是问题!!!

震惊!甲基化和转录因子可以这样结合?

这个R包,学会省你半年的实验时间!别再傻傻用实验验证甲基化和转录因子结合了!

太香了!10+顶刊里都爱的美图,一刻钟教你学会!瞬间变高级!(附代码)

不容错过!CNS级别的多组学Circos图是怎么做的?简单又实用,这个美图技能你必须gt!

实用又美观!频频登上高分生信期刊,这个图,让你脱颖而出!(附美图代码)

甲基化最常用的分析!没有之一!

多组学分析工具一键式搞定?高分文章的秘诀,学会能给你的SCI加分!

秀到飞起!生信中高逼格的多组学分析怎么做的?半小时轻松教你搞定!(附代码)

好东西啊!审稿人直呼内行!多组学,多平台分析终极解决方案!不学你就out了!

—END—撰文丨风间琉璃排版丨四金兄主编丨小雪球

欢迎大家

转载请注明:http://www.sonphie.com/jbby/14370.html

  • 上一篇文章:
  • 下一篇文章:
  • 网站简介| 发布优势| 服务条款| 隐私保护| 广告合作| 网站地图| 版权申明

    当前时间: