微科盟磷酸化修饰蛋白质组结题报告

一、概述

  DNA转录成RNA要再翻译成具有特定氨基酸序列的蛋白质才能在体内发挥功能,其中大部分蛋白质往往还需要经过化学修饰才能具备真正的活性,这种修饰称为翻译后修饰(PTM, post- translational modification),在众多的PTM类型中,磷酸化修饰(Phosphorylation modification)的蛋白占到了所有蛋白质约三分之一,是最普遍的修饰类型之一。磷酸化的过程就是在激酶的催化作用下,将ATP的磷酸根基团,转移到底物蛋白质氨基酸残基(Ser、Thr、Tyr)上,ATP随之变为ADP。对于大部分蛋白质来说,磷酸化修饰是一种可逆的短暂性修饰,当某一蛋白的某一位点帮助蛋白完成了任务,蛋白质又会在磷酸酶的作用下发生去磷酸化,只有少数磷酸化是永久性的修饰。蛋白质磷酸化(Phosphorylation)是生物体内一种普通的调节方式,在细胞信号转导、调控细胞增殖、发育、分化、凋亡过程中起重要作用,是调节和控制蛋白质活力和功能的最基本、最普遍,也是最重要的机制。

图 1.1.1 磷酸化修饰
图 1.1.1 磷酸化修饰

二、实验流程

  从组织样品到最终数据获得的过程中,蛋白的提取、定量、检测、酶切与除盐1、馏分分离和质谱检测2每一个环节都会对数据质量和数量产生影响,而数据质量又会直接影响后续信息分析的结果。为了从源头上保证测序数据的准确性、可靠性,微科盟对每一个实验步骤都严格把控,从根本上确保了高质量数据的产出,流程图如下:

图 2.1.1 定量原理图
图 2.1.1 定量原理图

三、分析流程

  磷酸化修饰蛋白质组分析云流程是微科盟针对磷酸化修饰蛋白质组的特点设计的生信分析云流程,该流程突破了磷酸化修饰蛋白质组学分析物种限制,支持人,小鼠,番茄,玉米,猪,羊等物种的磷酸化修饰位点定量并进行功能分析,同时支持拟南芥,秀丽隐杆线虫,黑腹果蝇,人,小鼠,大鼠,粟酒裂殖酵母,酿酒酵母8个物种进行激酶分析。磷酸化修饰蛋白质组云流程基于DESeq2,Anova方差分析,WGCNA三大分析模块研究样本间差异表达的磷酸化修饰位点,并提供基于3大分析模块的功能富集,PPI网络分析,磷酸化修饰位点理化性质分析等下游分析内容。

图 3.1.1 磷酸化修饰蛋白质组生信分析流程图
图 3.1.1 磷酸化修饰蛋白质组生信分析流程图

四、功能注释

点击打开文件夹

点击查看文件夹结构
## ./0.Functional_annotation
## └── emapper.csv

  eggnog-mapper3是一种用于对未知序列进行快速功能注释的工具。它使用eggNOG数据库中预先计算好的直系同源基因组和系统发育树,根据其进化关系推断他们的功能信息。使用直系同源预测功能注释的方法比传统的序列相似性搜索(BLAST搜索)具有更高的精度,因为它会避免从旁系同源进行注释。磷酸化修饰蛋白质组云流程使用eggnog-mapper对蛋白质序列数据进行功能注释,并用于后续功能富集分析。对于stringdb数据库没有收录的物种我们还会根据注释结果中的COG注释结果(同源蛋白注释)进行COG-PPI网络分析。

五、结构域注释

点击打开文件夹

点击查看文件夹结构
## ./1.Domain_annotation
## ├── interpro.svg
## ├── interpro_summary.csv
## └── interproscan_result.csv

  结构域是蛋白质结构、功能和进化的单位。结构域通过复制和组合可以形成新的蛋白质,不同结构域间的组合分布并不符合随机模型,而是表现出有些结构域组合能力非常强,有些却很少与其他结构域组合的模式。研究蛋白质的结构域对于理解蛋白质的生物学功能及其进化具有重要的意义。Interproscan4是蛋白质结构域和功能注释最常用的软件,是由EBI开发的一个集成了蛋白质家族、结构域和功能位点的非冗余数据库。为了能更全面的进行结构域的注释,Interproscan整合了一些使用最普及的结构域数据库,包括Pfam,ProDom,SMART等结构域的数据库,利用模式结构或特征进行功能未知蛋白的结构域注释。

  我们将搜库时所用的物种蛋白质fasta序列作为输入,使用Interproscan进行结构域注释得到以上注释结果(表2.1),并使用R语言对注释结果进行处理,去除了注释结果中含有空值的行然后分类汇总:

图 5.1.1 蛋白结构域注释柱状图
图 5.1.1 蛋白结构域注释柱状图

六、Motif基序分析

点击打开文件夹

点击查看文件夹结构
## ./2.Modification_motifs
## ├── momo.html
## ├── momo.tsv
## ├── momo.txt
## ├── xxxRxx_S79.9_xxxxxx.png
## ├── xxxxxx_S79.9_Dxxxxx.png
## ├── xxxxxx_S79.9_PxxxxT.png
## ├── xxxxxx_S79.9_Pxxxxx.png
## ├── xxxxxx_T79.9_Pxxxxx.png
## └── 修饰肽段原始丰度表.txt

  蛋白质翻译后修饰是调节蛋白质生物学功能的关键步骤之一,是蛋白质动态反应和相互作用的一个重要分子基础,同时也是细胞信号网络调控的重要靶点。蛋白质翻译后修饰一般需要通过上游的酶去识别底物特定的motif来完成,因此,识别和研究修饰蛋白质的保守motif对于蛋白质翻译后修饰和修饰位点的预测,以及细胞信号通路的发现具有重要意义。

  我们利用MEME软件的蛋白质翻译后修饰位点motif基序发现模块MoMo对磷酸化修饰位点进行了motif预测5。预测结果如表6.1.2所示,分析过程所使用的修饰肽段原始丰度表如表6.1.1所示。

注:
    1. Peptide_label 磷酸化修饰位点标签,由4部分组成:肽段序号(每一个定量肽段都用peptide+数字的形式做唯一标记),蛋白名(通常为Uniprot Accession),基因名,修饰位置(修饰氨基酸缩写加修饰位点)
    2. Accession 蛋白名
    3. Description 蛋白描述信息
    4. Gene.Name 基因名
    5. Sequence 肽段序列
    6. Position.in.protein 修饰位点在蛋白序列中的位置,通常由修饰氨基酸缩写+修饰位置的形式表示
    7. Modified.sequence 磷酸化修饰位点,发生了磷酸化修饰的氨基酸上共价连接分子量79.9 Da 的磷酸基团
    8. Position.in.peptide 修饰位点在肽段序列中的位置

磷酸化修饰位点motif报告
注:
    1. 运行参数:momo motifx -oc . –verbosity 1 –sequence-column ‘Modified sequence’ –width 13 –protein-database 蛋白质序列FASTA文件 –eliminate-repeats 13 –min-occurrences 20 –score-threshold 1.0E-6 修饰肽段原始丰度表.tsv
    2. motifx是momo进行修饰肽段motif分析的方法
    3. –protein-database 表示背景序列
    4. –eliminate-repeats 13 表示motif宽度设置为13(包含修饰位点及前后6个氨基酸)
    5. –min-occurrences 20 表示motif基序出现的最小次数 (6)–score-threshold 1.0E-6 表示motif-x的阈值

七、定量分析

点击打开文件夹

点击查看文件夹结构
## ./3.Basic_statistics
## └── Category1
##     ├── boxplot
##     ├── heatmap
##     ├── pca
##     └── violin

7.1 数据标准化

  为展示各个样本的磷酸化修饰位点表达量的整体的分布情况,我们对所有样本的磷酸化修饰位点丰度值,用R4.3语言程序作“箱线图”和“小提琴图”。为避免图中数据点的跨度太大,我们对磷酸化修饰位点定量值,做了log2(定量值+1)的缩小变换处理。

图 7.1.1 磷酸化修饰位点定量值分布
图 7.1.1 磷酸化修饰位点定量值分布

注:X轴表示样本名,Y轴表示定量值进行log2计算,本项目实现了近5个数量级定量值跨度的设别;颜色表示不同样本;距离箱图较远的点表示离群值。

图 7.1.2 磷酸化修饰位点小提琴图
图 7.1.2 磷酸化修饰位点小提琴图

注:小提图琴是个密度图,越宽的地方说明对应于纵轴表达量的磷酸化修饰位点数量越多。

7.2 PCA 分析

  主成分分析(PCA)也常用来评估组间差异及组内样本重复情况,PCA采用线性代数的计算方法,对数以万计的磷酸化修饰位点变量进行降维及主成分提取。我们对所有样本的磷酸化修饰位点定量值进行PCA分析,如下图所示。理想条件下,PCA图中,组间样本应该分散,组内样本应该聚在一起。

图 7.2.1 样品分组PCA分析二维平面图
图 7.2.1 样品分组PCA分析二维平面图

注:图中横坐标为第一主成分,纵坐标为第二主成分,不同的颜色表示不同的分组。样本点之间的距离近似于样本之间各磷酸化修饰位点丰度差异的总和。百分数:表示成分的贡献率。

图 7.2.2 样品分组PCA分析三维立体图
图 7.2.2 样品分组PCA分析三维立体图

注:图中X坐标为第一主成分,Y坐标为第二主成分,Z坐标为第三主成分,不同的颜色表示不同的分组。样本点之间的距离近似于样本之间各磷酸化修饰位点丰度差异的总和。百分数:表示成分的贡献率

7.3 层次聚类

  利用Pearson相关系数反映样本间磷酸化修饰位点表达量的相关性,并采用欧式距离进行层次聚类分析(图 7.3.1),该图能够直接反映每个样本之间的关系。

图 7.3.1 样本层次聚类
图 7.3.1 样本层次聚类

注:热图中的单元格颜色越深,表示对应的两个样本之间的相关性系数越高。同一个小组内的样本应该具有较高的相关性系数。

八、差异表达分析

点击打开文件夹

点击查看文件夹结构
## ./4.Differential_expression
## ├── Category1_M.vs.C
## │   ├── Category1_M.vs.C_All.xls
## │   ├── Category1_M.vs.C_DEG.xls
## │   ├── Category1_M.vs.C_Volcano.svg
## │   ├── Category1_M.vs.C_deeseq-density.png
## │   ├── heatmap.svg
## │   ├── input.xls
## │   └── table.xls
## ├── Category1_M.vs.T
## │   ├── Category1_M.vs.T_All.xls
## │   ├── Category1_M.vs.T_DEG.xls
## │   ├── Category1_M.vs.T_Volcano.svg
## │   ├── Category1_M.vs.T_deeseq-density.png
## │   ├── heatmap.svg
## │   ├── input.xls
## │   └── table.xls
## ├── Category1_T.vs.C
## │   ├── Category1_T.vs.C_All.xls
## │   ├── Category1_T.vs.C_DEG.xls
## │   ├── Category1_T.vs.C_Volcano.svg
## │   ├── Category1_T.vs.C_deeseq-density.png
## │   ├── heatmap.svg
## │   ├── input.xls
## │   └── table.xls
## └── Vennupset
##     ├── venn1
##     ├── venn2
##     └── venn3

8.1 差异蛋白筛选

  磷酸化修饰位点差异性分析能够极大地推动发现新的生物标志物,提升生物标志物鉴定的精准度,对分子作用机理、生物标志物、疾病早诊、分子分型、预后以及临床诊断等均具有重要价值。磷酸化修饰位点差异表达的输入数据为磷酸化修饰位点表达丰度数据。分析时我们采用基于负二项分布的DESeq2进行分析6,具体使用基于BiocManager,getopt,ggplot2,DESeq2等R包的R语言脚本;对各个样本分组进行两两之间的比较,找到在不同分组中表达差异的磷酸化修饰位点。 差异磷酸化修饰位点的筛选标准是非常重要的,我们给出的标准|log 2 (FoldChange)| > 1 & p值 < 0.05是常用的经验值,也是我们分析流程的默认值。在实际项目中可以根据情况灵活选择,例如,差异倍数可以选择1.5倍,也可以选择3倍,p值常用的阈值包括0.01、0.05、0.1等。若按照以上标准筛选得到的差异磷酸化修饰位点过少,很有可能导致后续功能富集分析没有显著性结果。若项目实验只关注某几个磷酸化修饰位点的表达情况,不在意富集结果,从下面的差异分析表格中筛选关注的那几个差异磷酸化修饰位点即可。反之, 如果得到的差异修饰位点数目过多,不利于后续目标位点的筛选,这个时候可使用更严格的阈值标准进行筛选。生科云的云流程提供了调整筛选阈值的途径。磷酸化修饰位点表达差异分析结果见下表 8.1.1。差异蛋白火山图见下图8.1.1,差异倍数密度图见下图8.1.2。

注:
    1. Features: 磷酸化修饰位点标签,默认使用肽段唯一标记(peptide+数字)+ 蛋白名 的形式表示。
    2. baseMean: 样本标准化counts的均值
    3. log2FoldChange: 处理组与对照组磷酸化修饰位点表达水平的比值,再经过差异分析软件收缩模型处理,最后以2为底取对数
    4. IfcSE: 标准误,标准误越小,样本均值和总体均值差距越小;标准误越大,样本均值和总体均值差距越大
    5. stat: wald检验的统计量,它实际上是logFC除以lfcse
    6. pvalue: p值
    7. padj: BH方法校正后的p值

图 8.1.1 差异蛋白火山图
图 8.1.1 差异蛋白火山图
注:
    1. 横坐标表示两个分组之间的差异倍数,其绝对值越大说明某修饰位点在两组之间的表达差异也越大。该值为正时,表示差异上调;该值为负时,表示差异下调
    2. 纵坐标代表磷酸化修饰位点表达量变化的统计学显著程度
    3. 图中的散点代表各个磷酸化修饰位点,灰色圆点表示无显著性差异的磷酸化修饰位点,红色圆点表示显著上调的差异磷酸化修饰位点,绿色圆点表示显著下调的差异磷酸化修饰位点

图 8.1.2 差异倍数密度图
图 8.1.2 差异倍数密度图

注: X轴为log2(FC),Y轴表示磷酸化修饰位点在组间的倍数密度,即该差异倍数下的磷酸化修饰位点数与总数的比例。理论上绝大部分磷酸化修饰位点是不显著差异,所以FC峰值位置应位于0附近,并呈现正态分布。

图 8.1.3 差异磷酸化修饰位点聚类热图
图 8.1.3 差异磷酸化修饰位点聚类热图

注: 图中用颜色代表表达量,越红表示磷酸化修饰位点表达量越高,越蓝表示表达量越低,数据跨度太大会导致差异无法区分,我们对表达量进行标准化处理(减去平均值,除以标准差);聚类到一起的样本表达模式比较接近。

8.2 差异磷酸化修饰位点韦恩图

  差异磷酸化修饰位点韦恩图是对差异分析结果进行进一步分析展示,summary_up_down.svg(图8.2.1)汇总了各差异磷酸化修饰位点集上调(处理组表达量高于对照组),下调数目(处理组表达量低于对照组)。如果有多个比较方案,多个差异磷酸化修饰位点集,我们将用Venn图和UpSet图(DEG_venn.svg|图8.2.2,DEG_upset.svg|图8.2.3)展示各个差异集之间的交集大小(共有的差异磷酸化修饰位点数目),以及各个差异集特有的磷酸化修饰位点。Venn图和UpSet图表达的信息是一样的,只是用了不同的数据可视化形式。Venn图最多能展示五个差异集的关系,而UpSet图能展示的差异集个数能够更多。 该部分计算并绘制了所选分组所有差异分析结果两两组合的结果,如需3个及以上差异结果的venn图,可在分步骤中操作获取。如您的数据只包含一个对照组一个试验组,则将只输出summary_up_down.svg(各差异磷酸化修饰位点集上调,下调数目汇总柱形图)。

图 8.2.1 各差异磷酸化修饰位点集上调,下调数目汇总柱形图
图 8.2.1 各差异磷酸化修饰位点集上调,下调数目汇总柱形图

注: 图中红色表示表达量上调的磷酸化修饰位点(处理组表达量高于对照组),绿色表示表达量下调的磷酸化修饰位点。

点击查看差异蛋白韦恩图和Upset图(当输入包含多个Category时,才输出该部分的结果)
图 8.2.2 差异磷酸化修饰位点韦恩图
图 8.2.2 差异磷酸化修饰位点韦恩图

注: 图中每个圈代表一个组间的差异磷酸化修饰位点,重叠部分代表多个组间共同的差异磷酸化修饰位点,非重叠部分代表相应组间特异性的差异磷酸化修饰位点。

图 8.2.3 各差异磷酸化修饰位点集之间的UpSet图
图 8.2.3 各差异磷酸化修饰位点集之间的UpSet图
注: 图中柱形图表示差异磷酸化修饰位点的数量,下面的黑点,一个表示该差异集特有的磷酸化修饰位点(补集中该组特有的磷酸化修饰位点),两个点表示两个差异集共有的磷酸化修饰位点数(交集)。

九、ANOVA单因素方差分析

点击打开文件夹

点击查看文件夹结构
## ./5.Anova_analysis
## └── Category1
##     ├── ANOVA_bar_of_peptide1 A0A087WPF7 Auts2 S1235.svg
##     ├── ANOVA_bar_of_peptide10 A2A4P0 Dhx8 Y27.svg
##     ├── ANOVA_bar_of_peptide100 A2AAJ9 Obscn S2941.svg
##     ├── ANOVA_bar_of_peptide1000 A2ASS6 Ttn Y23811.svg
##     ├── ANOVA_bar_of_peptide1002 A2ASS6 Ttn Y9172.svg
##     ├── ANOVA_bar_of_peptide1003 A2ASS6 Ttn Y32428.svg
##     ├── ANOVA_bar_of_peptide1004 A2ASS6 Ttn T23603.svg
##     ├── ANOVA_bar_of_peptide1009 A2ASS6 Ttn T27776.svg
##     ├── ANOVA_bar_of_peptide1014 A2ASS6 Ttn Y32427.svg
##     ├── ANOVA_bar_of_peptide1015 A2ASS6 Ttn Y30102.svg
##     ├── ANOVA_bar_of_peptide1016 A2ASS6 Ttn T15614.svg
##     ├── ANOVA_bar_of_peptide1017 A2ASS6 Ttn T22413.svg
##     ├── ANOVA_bar_of_peptide1018 A2ASS6 Ttn T21672.svg
##     ├── ANOVA_bar_of_peptide1019 A2ASS6 Ttn T23699.svg
##     ├── ANOVA_bar_of_peptide102 A2AAJ9 Obscn S7798.svg
##     ├── ANOVA_bar_of_peptide1020 A2ASS6 Ttn T8500.svg
##     ├── ANOVA_bar_of_peptide1022 A2ASS6 Ttn T21339.svg
##     ├── ANOVA_bar_of_peptide1023 A2AUC9 Klhl41 S55.svg
##     ├── ANOVA_bar_of_peptide1024 A2AUC9 Klhl41 Y57.svg
##     ├── ANOVA_bar_of_peptide1027 A2AX52 Col6a4 S2100.svg
##     ├── ANOVA_bar_of_peptide103 A2AAJ9 Obscn S7777.svg
##     ├── ANOVA_bar_of_peptide1032 A2RSQ0 Dennd5b S178.svg
##     ├── ANOVA_bar_of_peptide1038 A6H5Z3 Exoc6b S199.svg
##     ├── ANOVA_bar_of_peptide104 A2AAJ9 Obscn S5753.svg
##     ├── ANOVA_bar_of_peptide1040 A6H630 Armt1 S4.svg
##     ├── ANOVA_bar_of_peptide1045 A6H8H2 Dennd4c S971.svg
##     ├── ANOVA_bar_of_peptide1050 A6X8Z5 Arhgap31 S667.svg
##     ├── ANOVA_bar_of_peptide1052 A6X8Z5 Arhgap31 S1093.svg
##     ├── ANOVA_bar_of_peptide1055 A6X919 Dpy19l1 S22.svg
##     ├── ANOVA_bar_of_peptide1067 B1AXH1 Nhsl2 S1055.svg
##     ├── ANOVA_bar_of_peptide1068 B1AY10 Nfx1 S147.svg
##     ├── ANOVA_bar_of_peptide1070 B1AY13 Usp24 S1135.svg
##     ├── ANOVA_bar_of_peptide1071 B1AY13 Usp24 T2556.svg
##     ├── ANOVA_bar_of_peptide1073 B1AY13 Usp24 S2558.svg
##     ├── ANOVA_bar_of_peptide1074 B1AY13 Usp24 S1138.svg
##     ├── ANOVA_bar_of_peptide1080 B1AZI6 Thoc2 S1516.svg
##     ├── ANOVA_bar_of_peptide1087 B2RQC6 Cad T1824.svg
##     ├── ANOVA_bar_of_peptide1093 B2RRE7 Otud4 S1000.svg
##     ├── ANOVA_bar_of_peptide1098 B2RUJ5 Apba1 S573.svg
##     ├── ANOVA_bar_of_peptide1099 B2RUJ5 Apba1 S317.svg
##     ├── ANOVA_bar_of_peptide11 A2A5R2 Arfgef2 T224.svg
##     ├── ANOVA_bar_of_peptide110 A2ABU4 Myom3 S6.svg
##     ├── ANOVA_bar_of_peptide1102 B2RUR8 Otud7b S467.svg
##     ├── ANOVA_bar_of_peptide1104 B2RUR8 Otud7b S471.svg
##     ├── ANOVA_bar_of_peptide111 A2ABU4 Myom3 S551.svg
##     ├── ANOVA_bar_of_peptide1110 B2RY56 Rbm25 S672.svg
##     ├── ANOVA_bar_of_peptide1112 B9EJ80 Pdzd8 S973.svg
##     ├── ANOVA_bar_of_peptide1115 B9EKI3 Tmf1 S397.svg
##     ├── ANOVA_bar_of_peptide1117 C0HKD9 Mfap1b S118.svg
##     ├── ANOVA_bar_of_peptide1123 D3YVE8 Slc35g2 S409.svg
##     ├── ANOVA_bar_of_peptide1124 D3YXK1 Samd1 S150.svg
##     ├── ANOVA_bar_of_peptide1125 D3YXK2 Safb S366.svg
##     ├── ANOVA_bar_of_peptide1129 D3YXK2 Safb T26.svg
##     ├── ANOVA_bar_of_peptide113 A2ABU4 Myom3 S349.svg
##     ├── ANOVA_bar_of_peptide1130 D3YXK2 Safb S227.svg
##     ├── ANOVA_bar_of_peptide1133 D3YXK2 Safb S24.svg
##     ├── ANOVA_bar_of_peptide1136 D3YY23 Lonrf1 S757.svg
##     ├── ANOVA_bar_of_peptide1139 D3YZP9 Ccdc6 S412.svg
##     ├── ANOVA_bar_of_peptide1141 D3YZP9 Ccdc6 S233.svg
##     ├── ANOVA_bar_of_peptide1143 D3YZP9 Ccdc6 S344.svg
##     ├── ANOVA_bar_of_peptide1145 D3Z1D3 CEFIP S252.svg
##     ├── ANOVA_bar_of_peptide115 A2ABU4 Myom3 T478.svg
##     ├── ANOVA_bar_of_peptide1151 D3Z1D3 CEFIP T516.svg
##     ├── ANOVA_bar_of_peptide1156 D3Z1D3 CEFIP S518.svg
##     ├── ANOVA_bar_of_peptide1161 D3Z6Q9 Bin2 S430.svg
##     ├── ANOVA_bar_of_peptide1170 E1U8D0 Soga1 S1015.svg
##     ├── ANOVA_bar_of_peptide1171 E2JF22 Piezo1 S1646.svg
##     ├── ANOVA_bar_of_peptide1175 E9PV82 Fam53a S119.svg
##     ├── ANOVA_bar_of_peptide1177 E9PVX6 Mki67 S2333.svg
##     ├── ANOVA_bar_of_peptide1181 E9PVX6 Mki67 S2392.svg
##     ├── ANOVA_bar_of_peptide1182 E9PVX6 Mki67 S2649.svg
##     ├── ANOVA_bar_of_peptide1187 E9PYH6 Setd1a S569.svg
##     ├── ANOVA_bar_of_peptide119 A2ABU4 Myom3 S477.svg
##     ├── ANOVA_bar_of_peptide1191 E9PYH6 Setd1a T567.svg
##     ├── ANOVA_bar_of_peptide1193 E9PYH6 Setd1a S1160.svg
##     ├── ANOVA_bar_of_peptide1194 E9PYK3 Parp4 S1683.svg
##     ├── ANOVA_bar_of_peptide1196 E9PYL2 Prr12 S648.svg
##     ├── ANOVA_bar_of_peptide1197 E9PYL2 Prr12 S1562.svg
##     ├── ANOVA_bar_of_peptide1198 E9PYL2 Prr12 S21.svg
##     ├── ANOVA_bar_of_peptide12 A2A5R2 Arfgef2 S218.svg
##     ├── ANOVA_bar_of_peptide1200 E9PYL2 Prr12 T1555.svg
##     ├── ANOVA_bar_of_peptide1201 E9PYL2 Prr12 S1373.svg
##     ├── ANOVA_bar_of_peptide1218 E9Q0S6 Tns1 S930.svg
##     ├── ANOVA_bar_of_peptide1219 E9Q0S6 Tns1 S1081.svg
##     ├── ANOVA_bar_of_peptide1220 E9Q0S6 Tns1 S545.svg
##     ├── ANOVA_bar_of_peptide1224 E9Q0S6 Tns1 S1535.svg
##     ├── ANOVA_bar_of_peptide1225 E9Q0S6 Tns1 S1423.svg
##     ├── ANOVA_bar_of_peptide1226 E9Q0S6 Tns1 S974.svg
##     ├── ANOVA_bar_of_peptide1229 E9Q0S6 Tns1 S509.svg
##     ├── ANOVA_bar_of_peptide123 A2AG50 Map7d2 S699.svg
##     ├── ANOVA_bar_of_peptide1231 E9Q0S6 Tns1 S971.svg
##     ├── ANOVA_bar_of_peptide1232 E9Q0S6 Tns1 S899.svg
##     ├── ANOVA_bar_of_peptide1233 E9Q0S6 Tns1 S1075.svg
##     ├── ANOVA_bar_of_peptide1235 E9Q0S6 Tns1 S984.svg
##     ├── ANOVA_bar_of_peptide1236 E9Q0S6 Tns1 T1015.svg
##     ├── ANOVA_bar_of_peptide1238 E9Q0S6 Tns1 S1118.svg
##     ├── ANOVA_bar_of_peptide1242 E9Q0S6 Tns1 S897.svg
##     ├── ANOVA_bar_of_peptide1243 E9Q0S6 Tns1 S975.svg
##     ├── ANOVA_bar_of_peptide1244 E9Q0S6 Tns1 S156.svg
##     ├── ANOVA_bar_of_peptide1247 E9Q0S6 Tns1 S1070.svg
##     ├── ANOVA_bar_of_peptide1251 E9Q0S6 Tns1 S154.svg
##     ├── ANOVA_bar_of_peptide1253 E9Q1P8 Irf2bp2 S254.svg
##     ├── ANOVA_bar_of_peptide1260 E9Q236 Abcc4 T648.svg
##     ├── ANOVA_bar_of_peptide1261 E9Q236 Abcc4 S664.svg
##     ├── ANOVA_bar_of_peptide1267 E9Q309 Cep350 S2221.svg
##     ├── ANOVA_bar_of_peptide127 A2AHC3 Camsap1 T559.svg
##     ├── ANOVA_bar_of_peptide1272 E9Q3C1 C2cd2 S581.svg
##     ├── ANOVA_bar_of_peptide1274 E9Q3L2 Pi4ka S260.svg
##     ├── ANOVA_bar_of_peptide1276 E9Q4N7 Arid1b S1818.svg
##     ├── ANOVA_bar_of_peptide1277 E9Q4N7 Arid1b S1819.svg
##     ├── ANOVA_bar_of_peptide128 A2AHC3 Camsap1 S560.svg
##     ├── ANOVA_bar_of_peptide1283 E9Q5F9 Setd2 S614.svg
##     ├── ANOVA_bar_of_peptide1288 E9Q5K9 Ythdc1 S309.svg
##     ├── ANOVA_bar_of_peptide1289 E9Q5K9 Ythdc1 S425.svg
##     ├── ANOVA_bar_of_peptide1290 E9Q6J5 Bod1l S480.svg
##     ├── ANOVA_bar_of_peptide1291 E9Q6J5 Bod1l S2001.svg
##     ├── ANOVA_bar_of_peptide1295 E9Q6P5 Ttc7b S159.svg
##     ├── ANOVA_bar_of_peptide1297 E9Q6P5 Ttc7b S682.svg
##     ├── ANOVA_bar_of_peptide1298 E9Q6P5 Ttc7b S678.svg
##     ├── ANOVA_bar_of_peptide13 A2A5R2 Arfgef2 T623.svg
##     ├── ANOVA_bar_of_peptide1301 E9Q784 Zc3h13 S1069.svg
##     ├── ANOVA_bar_of_peptide1303 E9Q784 Zc3h13 S265.svg
##     ├── ANOVA_bar_of_peptide1304 E9Q784 Zc3h13 S1144.svg
##     ├── ANOVA_bar_of_peptide1305 E9Q784 Zc3h13 S953.svg
##     ├── ANOVA_bar_of_peptide1307 E9Q784 Zc3h13 T263.svg
##     ├── ANOVA_bar_of_peptide1309 E9Q7G0 Numa1 S1739.svg
##     ├── ANOVA_bar_of_peptide131 A2AIV2 Virma S138.svg
##     ├── ANOVA_bar_of_peptide1310 E9Q7G0 Numa1 S398.svg
##     ├── ANOVA_bar_of_peptide1311 E9Q7G0 Numa1 S167.svg
##     ├── ANOVA_bar_of_peptide1314 E9Q8I9 Fry S2376.svg
##     ├── ANOVA_bar_of_peptide1315 E9Q8I9 Fry T2377.svg
##     ├── ANOVA_bar_of_peptide1316 E9Q8I9 Fry S2373.svg
##     ├── ANOVA_bar_of_peptide1318 E9Q942 Smim13 S61.svg
##     ├── ANOVA_bar_of_peptide132 A2AIV8 Card9 S430.svg
##     ├── ANOVA_bar_of_peptide1320 E9Q942 Smim13 S59.svg
##     ├── ANOVA_bar_of_peptide1322 E9Q9K5 Trdn S598.svg
##     ├── ANOVA_bar_of_peptide133 A2AIV8 Card9 S461.svg
##     ├── ANOVA_bar_of_peptide1330 E9QAT4 Sec16a S1245.svg
##     ├── ANOVA_bar_of_peptide1331 E9QAT4 Sec16a S2101.svg
##     ├── ANOVA_bar_of_peptide1333 F6ZDS4 Tpr S719.svg
##     ├── ANOVA_bar_of_peptide1336 F6ZDS4 Tpr T724.svg
##     ├── ANOVA_bar_of_peptide1337 F6ZDS4 Tpr S2141.svg
##     ├── ANOVA_bar_of_peptide134 A2AIV8 Card9 S2.svg
##     ├── ANOVA_bar_of_peptide1342 F6ZDS4 Tpr S1259.svg
##     ├── ANOVA_bar_of_peptide1344 F8VPU2 Farp1 S875.svg
##     ├── ANOVA_bar_of_peptide1347 G3X9J0 Sipa1l3 S166.svg
##     ├── ANOVA_bar_of_peptide135 A2AIV8 Card9 S431.svg
##     ├── ANOVA_bar_of_peptide1352 G5E829 Atp2b1 S1177.svg
##     ├── ANOVA_bar_of_peptide1355 G5E829 Atp2b1 Y11.svg
##     ├── ANOVA_bar_of_peptide1357 G5E870 Trip12 S1024.svg
##     ├── ANOVA_bar_of_peptide1361 G5E870 Trip12 S975.svg
##     ├── ANOVA_bar_of_peptide1364 G5E8K5 Ank3 S1883.svg
##     ├── ANOVA_bar_of_peptide1365 G5E8K5 Ank3 S958.svg
##     ├── ANOVA_bar_of_peptide1367 G5E8K5 Ank3 S1629.svg
##     ├── ANOVA_bar_of_peptide1368 G5E8K5 Ank3 T1935.svg
##     ├── ANOVA_bar_of_peptide1370 G5E8K5 Ank3 S960.svg
##     ├── ANOVA_bar_of_peptide1371 G5E8K5 Ank3 T1627.svg
##     ├── ANOVA_bar_of_peptide1373 G5E8P1 Brd1 S128.svg
##     ├── ANOVA_bar_of_peptide1374 G5E8V9 Arfip1 S39.svg
##     ├── ANOVA_bar_of_peptide1377 O08539 Bin1 S304.svg
##     ├── ANOVA_bar_of_peptide1381 O08539 Bin1 T531.svg
##     ├── ANOVA_bar_of_peptide1385 O08547 Sec22b S137.svg
##     ├── ANOVA_bar_of_peptide1389 O08553 Dpysl2 T514.svg
##     ├── ANOVA_bar_of_peptide1390 O08553 Dpysl2 T509.svg
##     ├── ANOVA_bar_of_peptide1391 O08553 Dpysl2 S517.svg
##     ├── ANOVA_bar_of_peptide1394 O08576 Rundc3a T215.svg
##     ├── ANOVA_bar_of_peptide1396 O08582 Gtpbp1 S24.svg
##     ├── ANOVA_bar_of_peptide1397 O08582 Gtpbp1 S6.svg
##     ├── ANOVA_bar_of_peptide1398 O08582 Gtpbp1 S47.svg
##     ├── ANOVA_bar_of_peptide140 A2AJI0 Map7d1 S544.svg
##     ├── ANOVA_bar_of_peptide1402 O08599 Stxbp1 Y358.svg
##     ├── ANOVA_bar_of_peptide1405 O08638 Myh11 S1367.svg
##     ├── ANOVA_bar_of_peptide1408 O08648 Map3k4 S1241.svg
##     ├── ANOVA_bar_of_peptide141 A2AJI0 Map7d1 S115.svg
##     ├── ANOVA_bar_of_peptide1411 O08664 Bcl7c T128.svg
##     ├── ANOVA_bar_of_peptide1412 O08664 Bcl7c S122.svg
##     ├── ANOVA_bar_of_peptide1414 O08664 Bcl7c S114.svg
##     ├── ANOVA_bar_of_peptide1416 O08715 Akap1 S395.svg
##     ├── ANOVA_bar_of_peptide1417 O08715 Akap1 S378.svg
##     ├── ANOVA_bar_of_peptide1419 O08715 Akap1 S433.svg
##     ├── ANOVA_bar_of_peptide1424 O08736 Casp12 S104.svg
##     ├── ANOVA_bar_of_peptide1427 O08749 Dld S297.svg
##     ├── ANOVA_bar_of_peptide1428 O08750 Nfil3 S285.svg
##     ├── ANOVA_bar_of_peptide1429 O08750 Nfil3 S286.svg
##     ├── ANOVA_bar_of_peptide1430 O08784 Tcof1 S794.svg
##     ├── ANOVA_bar_of_peptide1436 O08784 Tcof1 S1191.svg
##     ├── ANOVA_bar_of_peptide1438 O08784 Tcof1 S1126.svg
##     ├── ANOVA_bar_of_peptide1440 O08784 Tcof1 S169.svg
##     ├── ANOVA_bar_of_peptide1441 O08784 Tcof1 S1127.svg
##     ├── ANOVA_bar_of_peptide1444 O08784 Tcof1 S1128.svg
##     ├── ANOVA_bar_of_peptide1446 O08810 Eftud2 S19.svg
##     ├── ANOVA_bar_of_peptide1447 O08856 Ell S300.svg
##     ├── ANOVA_bar_of_peptide1451 O08919 Numbl T269.svg
##     ├── ANOVA_bar_of_peptide1452 O08919 Numbl T265.svg
##     ├── ANOVA_bar_of_peptide1453 O08919 Numbl S270.svg
##     ├── ANOVA_bar_of_peptide1455 O08919 Numbl S263.svg
##     ├── ANOVA_bar_of_peptide1456 O08992 Sdcbp S6.svg
##     ├── ANOVA_bar_of_peptide1460 O09044 Snap23 S110.svg
##     ├── ANOVA_bar_of_peptide147 A2AJI0 Map7d1 S496.svg
##     ├── ANOVA_bar_of_peptide149 A2AJI0 Map7d1 S552.svg
##     ├── ANOVA_bar_of_peptide151 A2AJT4 Pnisr S290.svg
##     ├── ANOVA_bar_of_peptide152 A2AJT4 Pnisr S211.svg
##     ├── ANOVA_bar_of_peptide155 A2ALS5 Rap1gap S542.svg
##     ├── ANOVA_bar_of_peptide158 A2AMM0 Cavin4 S42.svg
##     ├── ANOVA_bar_of_peptide159 A2AMM0 Cavin4 T334.svg
##     ├── ANOVA_bar_of_peptide16 A2A5R2 Arfgef2 S621.svg
##     ├── ANOVA_bar_of_peptide160 A2AMM0 Cavin4 T22.svg
##     ├── ANOVA_bar_of_peptide161 A2AMM0 Cavin4 S171.svg
##     ├── ANOVA_bar_of_peptide166 A2AN08 Ubr4 T360.svg
##     ├── ANOVA_bar_of_peptide167 A2AN08 Ubr4 T1920.svg
##     ├── ANOVA_bar_of_peptide170 A2AN08 Ubr4 S208.svg
##     ├── ANOVA_bar_of_peptide172 A2AN08 Ubr4 S2716.svg
##     ├── ANOVA_bar_of_peptide173 A2AN08 Ubr4 S2882.svg
##     ├── ANOVA_bar_of_peptide175 A2AN08 Ubr4 S2715.svg
##     ├── ANOVA_bar_of_peptide181 A2AN08 Ubr4 S620.svg
##     ├── ANOVA_bar_of_peptide183 A2APB8 Tpx2 S737.svg
##     ├── ANOVA_bar_of_peptide198 A2ASS6 Ttn S14320.svg
##     ├── ANOVA_bar_of_peptide2 A0A087WPF7 Auts2 T1228.svg
##     ├── ANOVA_bar_of_peptide20 A2A791 Zmym4 S121.svg
##     ├── ANOVA_bar_of_peptide205 A2ASS6 Ttn S23533.svg
##     ├── ANOVA_bar_of_peptide21 A2A7S8 Kiaa1522 S402.svg
##     ├── ANOVA_bar_of_peptide211 A2ASS6 Ttn S2099.svg
##     ├── ANOVA_bar_of_peptide212 A2ASS6 Ttn S7501.svg
##     ├── ANOVA_bar_of_peptide221 A2ASS6 Ttn S11866.svg
##     ├── ANOVA_bar_of_peptide222 A2ASS6 Ttn S25920.svg
##     ├── ANOVA_bar_of_peptide225 A2ASS6 Ttn S11645.svg
##     ├── ANOVA_bar_of_peptide226 A2ASS6 Ttn S17333.svg
##     ├── ANOVA_bar_of_peptide227 A2ASS6 Ttn S7446.svg
##     ├── ANOVA_bar_of_peptide23 A2A863 Itgb4 S1787.svg
##     ├── ANOVA_bar_of_peptide235 A2ASS6 Ttn S20545.svg
##     ├── ANOVA_bar_of_peptide237 A2ASS6 Ttn S11717.svg
##     ├── ANOVA_bar_of_peptide243 A2ASS6 Ttn S33918.svg
##     ├── ANOVA_bar_of_peptide245 A2ASS6 Ttn S15681.svg
##     ├── ANOVA_bar_of_peptide262 A2ASS6 Ttn S3030.svg
##     ├── ANOVA_bar_of_peptide266 A2ASS6 Ttn S18428.svg
##     ├── ANOVA_bar_of_peptide267 A2ASS6 Ttn S1100.svg
##     ├── ANOVA_bar_of_peptide27 A2A8Z1 Osbpl9 S325.svg
##     ├── ANOVA_bar_of_peptide271 A2ASS6 Ttn S33708.svg
##     ├── ANOVA_bar_of_peptide273 A2ASS6 Ttn S27960.svg
##     ├── ANOVA_bar_of_peptide274 A2ASS6 Ttn S12871.svg
##     ├── ANOVA_bar_of_peptide276 A2ASS6 Ttn S1420.svg
##     ├── ANOVA_bar_of_peptide279 A2ASS6 Ttn S33286.svg
##     ├── ANOVA_bar_of_peptide280 A2ASS6 Ttn S20136.svg
##     ├── ANOVA_bar_of_peptide283 A2ASS6 Ttn S26482.svg
##     ├── ANOVA_bar_of_peptide286 A2ASS6 Ttn S27563.svg
##     ├── ANOVA_bar_of_peptide287 A2ASS6 Ttn S25397.svg
##     ├── ANOVA_bar_of_peptide288 A2ASS6 Ttn S25399.svg
##     ├── ANOVA_bar_of_peptide29 A2AAE1 Bltp1 T2757.svg
##     ├── ANOVA_bar_of_peptide306 A2ASS6 Ttn S18104.svg
##     ├── ANOVA_bar_of_peptide31 A2AAE1 Bltp1 S1355.svg
##     ├── ANOVA_bar_of_peptide311 A2ASS6 Ttn S8914.svg
##     ├── ANOVA_bar_of_peptide32 A2AAE1 Bltp1 S2755.svg
##     ├── ANOVA_bar_of_peptide320 A2ASS6 Ttn S22078.svg
##     ├── ANOVA_bar_of_peptide321 A2ASS6 Ttn S24243.svg
##     ├── ANOVA_bar_of_peptide324 A2ASS6 Ttn S34097.svg
##     ├── ANOVA_bar_of_peptide328 A2ASS6 Ttn S30541.svg
##     ├── ANOVA_bar_of_peptide33 A2AAJ9 Obscn S6335.svg
##     ├── ANOVA_bar_of_peptide332 A2ASS6 Ttn S12678.svg
##     ├── ANOVA_bar_of_peptide333 A2ASS6 Ttn S28923.svg
##     ├── ANOVA_bar_of_peptide335 A2ASS6 Ttn S283.svg
##     ├── ANOVA_bar_of_peptide336 A2ASS6 Ttn S22992.svg
##     ├── ANOVA_bar_of_peptide338 A2ASS6 Ttn S22390.svg
##     ├── ANOVA_bar_of_peptide34 A2AAJ9 Obscn S5699.svg
##     ├── ANOVA_bar_of_peptide341 A2ASS6 Ttn S33861.svg
##     ├── ANOVA_bar_of_peptide343 A2ASS6 Ttn S17995.svg
##     ├── ANOVA_bar_of_peptide344 A2ASS6 Ttn S15545.svg
##     ├── ANOVA_bar_of_peptide349 A2ASS6 Ttn S5731.svg
##     ├── ANOVA_bar_of_peptide35 A2AAJ9 Obscn S5983.svg
##     ├── ANOVA_bar_of_peptide351 A2ASS6 Ttn S5739.svg
##     ├── ANOVA_bar_of_peptide357 A2ASS6 Ttn S27877.svg
##     ├── ANOVA_bar_of_peptide36 A2AAJ9 Obscn S236.svg
##     ├── ANOVA_bar_of_peptide368 A2ASS6 Ttn S27992.svg
##     ├── ANOVA_bar_of_peptide37 A2AAJ9 Obscn S7765.svg
##     ├── ANOVA_bar_of_peptide375 A2ASS6 Ttn S13871.svg
##     ├── ANOVA_bar_of_peptide377 A2ASS6 Ttn S301.svg
##     ├── ANOVA_bar_of_peptide38 A2AAJ9 Obscn S3089.svg
##     ├── ANOVA_bar_of_peptide380 A2ASS6 Ttn S6485.svg
##     ├── ANOVA_bar_of_peptide384 A2ASS6 Ttn S9920.svg
##     ├── ANOVA_bar_of_peptide387 A2ASS6 Ttn S23700.svg
##     ├── ANOVA_bar_of_peptide388 A2ASS6 Ttn S23701.svg
##     ├── ANOVA_bar_of_peptide389 A2ASS6 Ttn S15616.svg
##     ├── ANOVA_bar_of_peptide391 A2ASS6 Ttn S22291.svg
##     ├── ANOVA_bar_of_peptide398 A2ASS6 Ttn S17892.svg
##     ├── ANOVA_bar_of_peptide40 A2AAJ9 Obscn S6702.svg
##     ├── ANOVA_bar_of_peptide400 A2ASS6 Ttn S16208.svg
##     ├── ANOVA_bar_of_peptide406 A2ASS6 Ttn S2618.svg
##     ├── ANOVA_bar_of_peptide408 A2ASS6 Ttn S5717.svg
##     ├── ANOVA_bar_of_peptide409 A2ASS6 Ttn S26497.svg
##     ├── ANOVA_bar_of_peptide41 A2AAJ9 Obscn S5021.svg
##     ├── ANOVA_bar_of_peptide411 A2ASS6 Ttn S4480.svg
##     ├── ANOVA_bar_of_peptide414 A2ASS6 Ttn S15110.svg
##     ├── ANOVA_bar_of_peptide415 A2ASS6 Ttn S19228.svg
##     ├── ANOVA_bar_of_peptide416 A2ASS6 Ttn S15902.svg
##     ├── ANOVA_bar_of_peptide42 A2AAJ9 Obscn S393.svg
##     ├── ANOVA_bar_of_peptide421 A2ASS6 Ttn S27185.svg
##     ├── ANOVA_bar_of_peptide423 A2ASS6 Ttn S12932.svg
##     ├── ANOVA_bar_of_peptide428 A2ASS6 Ttn S25027.svg
##     ├── ANOVA_bar_of_peptide429 A2ASS6 Ttn S25029.svg
##     ├── ANOVA_bar_of_peptide43 A2AAJ9 Obscn S6701.svg
##     ├── ANOVA_bar_of_peptide431 A2ASS6 Ttn S32232.svg
##     ├── ANOVA_bar_of_peptide432 A2ASS6 Ttn S21591.svg
##     ├── ANOVA_bar_of_peptide433 A2ASS6 Ttn S8838.svg
##     ├── ANOVA_bar_of_peptide435 A2ASS6 Ttn S32639.svg
##     ├── ANOVA_bar_of_peptide439 A2ASS6 Ttn S21165.svg
##     ├── ANOVA_bar_of_peptide44 A2AAJ9 Obscn T5762.svg
##     ├── ANOVA_bar_of_peptide447 A2ASS6 Ttn S20766.svg
##     ├── ANOVA_bar_of_peptide451 A2ASS6 Ttn S27793.svg
##     ├── ANOVA_bar_of_peptide458 A2ASS6 Ttn S32940.svg
##     ├── ANOVA_bar_of_peptide46 A2AAJ9 Obscn S5971.svg
##     ├── ANOVA_bar_of_peptide461 A2ASS6 Ttn S19375.svg
##     ├── ANOVA_bar_of_peptide469 A2ASS6 Ttn S33735.svg
##     ├── ANOVA_bar_of_peptide47 A2AAJ9 Obscn S7756.svg
##     ├── ANOVA_bar_of_peptide472 A2ASS6 Ttn S1529.svg
##     ├── ANOVA_bar_of_peptide473 A2ASS6 Ttn S10611.svg
##     ├── ANOVA_bar_of_peptide474 A2ASS6 Ttn S3286.svg
##     ├── ANOVA_bar_of_peptide475 A2ASS6 Ttn S10281.svg
##     ├── ANOVA_bar_of_peptide477 A2ASS6 Ttn S33963.svg
##     ├── ANOVA_bar_of_peptide48 A2AAJ9 Obscn S6904.svg
##     ├── ANOVA_bar_of_peptide483 A2ASS6 Ttn S33086.svg
##     ├── ANOVA_bar_of_peptide488 A2ASS6 Ttn S5139.svg
##     ├── ANOVA_bar_of_peptide489 A2ASS6 Ttn S25224.svg
##     ├── ANOVA_bar_of_peptide49 A2AAJ9 Obscn S6618.svg
##     ├── ANOVA_bar_of_peptide497 A2ASS6 Ttn S30583.svg
##     ├── ANOVA_bar_of_peptide499 A2ASS6 Ttn S26634.svg
##     ├── ANOVA_bar_of_peptide50 A2AAJ9 Obscn S7760.svg
##     ├── ANOVA_bar_of_peptide500 A2ASS6 Ttn S26637.svg
##     ├── ANOVA_bar_of_peptide503 A2ASS6 Ttn S21235.svg
##     ├── ANOVA_bar_of_peptide504 A2ASS6 Ttn S28407.svg
##     ├── ANOVA_bar_of_peptide505 A2ASS6 Ttn S27320.svg
##     ├── ANOVA_bar_of_peptide507 A2ASS6 Ttn S33928.svg
##     ├── ANOVA_bar_of_peptide508 A2ASS6 Ttn S17086.svg
##     ├── ANOVA_bar_of_peptide509 A2ASS6 Ttn S31705.svg
##     ├── ANOVA_bar_of_peptide511 A2ASS6 Ttn S22370.svg
##     ├── ANOVA_bar_of_peptide513 A2ASS6 Ttn S23506.svg
##     ├── ANOVA_bar_of_peptide514 A2ASS6 Ttn S26760.svg
##     ├── ANOVA_bar_of_peptide516 A2ASS6 Ttn S20731.svg
##     ├── ANOVA_bar_of_peptide522 A2ASS6 Ttn S9108.svg
##     ├── ANOVA_bar_of_peptide527 A2ASS6 Ttn S28008.svg
##     ├── ANOVA_bar_of_peptide530 A2ASS6 Ttn S30820.svg
##     ├── ANOVA_bar_of_peptide533 A2ASS6 Ttn S8700.svg
##     ├── ANOVA_bar_of_peptide535 A2ASS6 Ttn S19447.svg
##     ├── ANOVA_bar_of_peptide542 A2ASS6 Ttn S2668.svg
##     ├── ANOVA_bar_of_peptide545 A2ASS6 Ttn S290.svg
##     ├── ANOVA_bar_of_peptide551 A2ASS6 Ttn S35128.svg
##     ├── ANOVA_bar_of_peptide553 A2ASS6 Ttn S2080.svg
##     ├── ANOVA_bar_of_peptide554 A2ASS6 Ttn S8220.svg
##     ├── ANOVA_bar_of_peptide558 A2ASS6 Ttn S8541.svg
##     ├── ANOVA_bar_of_peptide56 A2AAJ9 Obscn S6512.svg
##     ├── ANOVA_bar_of_peptide560 A2ASS6 Ttn T18556.svg
##     ├── ANOVA_bar_of_peptide562 A2ASS6 Ttn T33772.svg
##     ├── ANOVA_bar_of_peptide566 A2ASS6 Ttn T29656.svg
##     ├── ANOVA_bar_of_peptide567 A2ASS6 Ttn T16540.svg
##     ├── ANOVA_bar_of_peptide568 A2ASS6 Ttn T9762.svg
##     ├── ANOVA_bar_of_peptide571 A2ASS6 Ttn T19845.svg
##     ├── ANOVA_bar_of_peptide574 A2ASS6 Ttn T1615.svg
##     ├── ANOVA_bar_of_peptide576 A2ASS6 Ttn T32204.svg
##     ├── ANOVA_bar_of_peptide581 A2ASS6 Ttn T30888.svg
##     ├── ANOVA_bar_of_peptide585 A2ASS6 Ttn T23637.svg
##     ├── ANOVA_bar_of_peptide587 A2ASS6 Ttn T8387.svg
##     ├── ANOVA_bar_of_peptide588 A2ASS6 Ttn T11745.svg
##     ├── ANOVA_bar_of_peptide589 A2ASS6 Ttn T12051.svg
##     ├── ANOVA_bar_of_peptide590 A2ASS6 Ttn T20544.svg
##     ├── ANOVA_bar_of_peptide591 A2ASS6 Ttn T17141.svg
##     ├── ANOVA_bar_of_peptide593 A2ASS6 Ttn T16258.svg
##     ├── ANOVA_bar_of_peptide594 A2ASS6 Ttn T13938.svg
##     ├── ANOVA_bar_of_peptide597 A2ASS6 Ttn T24182.svg
##     ├── ANOVA_bar_of_peptide598 A2ASS6 Ttn T28464.svg
##     ├── ANOVA_bar_of_peptide599 A2ASS6 Ttn T25670.svg
##     ├── ANOVA_bar_of_peptide6 A0JLY1 Cfap210 Y438.svg
##     ├── ANOVA_bar_of_peptide60 A2AAJ9 Obscn S7921.svg
##     ├── ANOVA_bar_of_peptide600 A2ASS6 Ttn T32317.svg
##     ├── ANOVA_bar_of_peptide604 A2ASS6 Ttn T20134.svg
##     ├── ANOVA_bar_of_peptide612 A2ASS6 Ttn T24322.svg
##     ├── ANOVA_bar_of_peptide613 A2ASS6 Ttn T28854.svg
##     ├── ANOVA_bar_of_peptide615 A2ASS6 Ttn T18113.svg
##     ├── ANOVA_bar_of_peptide62 A2AAJ9 Obscn T7790.svg
##     ├── ANOVA_bar_of_peptide620 A2ASS6 Ttn T34099.svg
##     ├── ANOVA_bar_of_peptide623 A2ASS6 Ttn T28917.svg
##     ├── ANOVA_bar_of_peptide629 A2ASS6 Ttn T33859.svg
##     ├── ANOVA_bar_of_peptide63 A2AAJ9 Obscn S4775.svg
##     ├── ANOVA_bar_of_peptide630 A2ASS6 Ttn T17980.svg
##     ├── ANOVA_bar_of_peptide633 A2ASS6 Ttn T34481.svg
##     ├── ANOVA_bar_of_peptide637 A2ASS6 Ttn T266.svg
##     ├── ANOVA_bar_of_peptide640 A2ASS6 Ttn T20938.svg
##     ├── ANOVA_bar_of_peptide646 A2ASS6 Ttn T6937.svg
##     ├── ANOVA_bar_of_peptide647 A2ASS6 Ttn T27637.svg
##     ├── ANOVA_bar_of_peptide65 A2AAJ9 Obscn S3325.svg
##     ├── ANOVA_bar_of_peptide650 A2ASS6 Ttn T17099.svg
##     ├── ANOVA_bar_of_peptide655 A2ASS6 Ttn T23755.svg
##     ├── ANOVA_bar_of_peptide660 A2ASS6 Ttn T27860.svg
##     ├── ANOVA_bar_of_peptide663 A2ASS6 Ttn T23357.svg
##     ├── ANOVA_bar_of_peptide664 A2ASS6 Ttn T25521.svg
##     ├── ANOVA_bar_of_peptide667 A2ASS6 Ttn T25992.svg
##     ├── ANOVA_bar_of_peptide668 A2ASS6 Ttn T23988.svg
##     ├── ANOVA_bar_of_peptide67 A2AAJ9 Obscn T6747.svg
##     ├── ANOVA_bar_of_peptide670 A2ASS6 Ttn T11913.svg
##     ├── ANOVA_bar_of_peptide672 A2ASS6 Ttn T23053.svg
##     ├── ANOVA_bar_of_peptide673 A2ASS6 Ttn T21754.svg
##     ├── ANOVA_bar_of_peptide677 A2ASS6 Ttn T22718.svg
##     ├── ANOVA_bar_of_peptide683 A2ASS6 Ttn T30103.svg
##     ├── ANOVA_bar_of_peptide686 A2ASS6 Ttn S209.svg
##     ├── ANOVA_bar_of_peptide689 A2ASS6 Ttn S27145.svg
##     ├── ANOVA_bar_of_peptide692 A2ASS6 Ttn S31837.svg
##     ├── ANOVA_bar_of_peptide696 A2ASS6 Ttn S23798.svg
##     ├── ANOVA_bar_of_peptide699 A2ASS6 Ttn S29202.svg
##     ├── ANOVA_bar_of_peptide701 A2ASS6 Ttn S6714.svg
##     ├── ANOVA_bar_of_peptide702 A2ASS6 Ttn S6715.svg
##     ├── ANOVA_bar_of_peptide703 A2ASS6 Ttn S27925.svg
##     ├── ANOVA_bar_of_peptide704 A2ASS6 Ttn S26062.svg
##     ├── ANOVA_bar_of_peptide705 A2ASS6 Ttn S26065.svg
##     ├── ANOVA_bar_of_peptide707 A2ASS6 Ttn S7973.svg
##     ├── ANOVA_bar_of_peptide71 A2AAJ9 Obscn T6516.svg
##     ├── ANOVA_bar_of_peptide713 A2ASS6 Ttn S34334.svg
##     ├── ANOVA_bar_of_peptide719 A2ASS6 Ttn S32710.svg
##     ├── ANOVA_bar_of_peptide722 A2ASS6 Ttn S18377.svg
##     ├── ANOVA_bar_of_peptide723 A2ASS6 Ttn S34608.svg
##     ├── ANOVA_bar_of_peptide724 A2ASS6 Ttn S34609.svg
##     ├── ANOVA_bar_of_peptide725 A2ASS6 Ttn S15264.svg
##     ├── ANOVA_bar_of_peptide729 A2ASS6 Ttn S34808.svg
##     ├── ANOVA_bar_of_peptide73 A2AAJ9 Obscn S5947.svg
##     ├── ANOVA_bar_of_peptide731 A2ASS6 Ttn S33875.svg
##     ├── ANOVA_bar_of_peptide733 A2ASS6 Ttn S9010.svg
##     ├── ANOVA_bar_of_peptide735 A2ASS6 Ttn S9025.svg
##     ├── ANOVA_bar_of_peptide736 A2ASS6 Ttn S9027.svg
##     ├── ANOVA_bar_of_peptide738 A2ASS6 Ttn S21724.svg
##     ├── ANOVA_bar_of_peptide74 A2AAJ9 Obscn T7918.svg
##     ├── ANOVA_bar_of_peptide743 A2ASS6 Ttn S1415.svg
##     ├── ANOVA_bar_of_peptide744 A2ASS6 Ttn S34464.svg
##     ├── ANOVA_bar_of_peptide745 A2ASS6 Ttn S34470.svg
##     ├── ANOVA_bar_of_peptide753 A2ASS6 Ttn S34931.svg
##     ├── ANOVA_bar_of_peptide756 A2ASS6 Ttn S5966.svg
##     ├── ANOVA_bar_of_peptide76 A2AAJ9 Obscn S8182.svg
##     ├── ANOVA_bar_of_peptide760 A2ASS6 Ttn S31716.svg
##     ├── ANOVA_bar_of_peptide761 A2ASS6 Ttn S31717.svg
##     ├── ANOVA_bar_of_peptide769 A2ASS6 Ttn S18224.svg
##     ├── ANOVA_bar_of_peptide773 A2ASS6 Ttn S26807.svg
##     ├── ANOVA_bar_of_peptide774 A2ASS6 Ttn S32140.svg
##     ├── ANOVA_bar_of_peptide781 A2ASS6 Ttn S20937.svg
##     ├── ANOVA_bar_of_peptide782 A2ASS6 Ttn S26277.svg
##     ├── ANOVA_bar_of_peptide784 A2ASS6 Ttn S30749.svg
##     ├── ANOVA_bar_of_peptide786 A2ASS6 Ttn S322.svg
##     ├── ANOVA_bar_of_peptide788 A2ASS6 Ttn S21621.svg
##     ├── ANOVA_bar_of_peptide789 A2ASS6 Ttn S21623.svg
##     ├── ANOVA_bar_of_peptide790 A2ASS6 Ttn S21630.svg
##     ├── ANOVA_bar_of_peptide791 A2ASS6 Ttn S24880.svg
##     ├── ANOVA_bar_of_peptide794 A2ASS6 Ttn S814.svg
##     ├── ANOVA_bar_of_peptide795 A2ASS6 Ttn S6935.svg
##     ├── ANOVA_bar_of_peptide799 A2ASS6 Ttn S17252.svg
##     ├── ANOVA_bar_of_peptide8 A2A432 Cul4b S147.svg
##     ├── ANOVA_bar_of_peptide80 A2AAJ9 Obscn S6746.svg
##     ├── ANOVA_bar_of_peptide801 A2ASS6 Ttn S1250.svg
##     ├── ANOVA_bar_of_peptide802 A2ASS6 Ttn S1251.svg
##     ├── ANOVA_bar_of_peptide809 A2ASS6 Ttn S26987.svg
##     ├── ANOVA_bar_of_peptide81 A2AAJ9 Obscn T5752.svg
##     ├── ANOVA_bar_of_peptide812 A2ASS6 Ttn S29598.svg
##     ├── ANOVA_bar_of_peptide814 A2ASS6 Ttn S16898.svg
##     ├── ANOVA_bar_of_peptide816 A2ASS6 Ttn T5383.svg
##     ├── ANOVA_bar_of_peptide819 A2ASS6 Ttn S8564.svg
##     ├── ANOVA_bar_of_peptide828 A2ASS6 Ttn S8498.svg
##     ├── ANOVA_bar_of_peptide83 A2AAJ9 Obscn S3453.svg
##     ├── ANOVA_bar_of_peptide830 A2ASS6 Ttn S29625.svg
##     ├── ANOVA_bar_of_peptide831 A2ASS6 Ttn S29629.svg
##     ├── ANOVA_bar_of_peptide835 A2ASS6 Ttn S19581.svg
##     ├── ANOVA_bar_of_peptide838 A2ASS6 Ttn S25797.svg
##     ├── ANOVA_bar_of_peptide839 A2ASS6 Ttn S14969.svg
##     ├── ANOVA_bar_of_peptide84 A2AAJ9 Obscn T5703.svg
##     ├── ANOVA_bar_of_peptide842 A2ASS6 Ttn S20044.svg
##     ├── ANOVA_bar_of_peptide843 A2ASS6 Ttn S24974.svg
##     ├── ANOVA_bar_of_peptide845 A2ASS6 Ttn S23831.svg
##     ├── ANOVA_bar_of_peptide848 A2ASS6 Ttn S23726.svg
##     ├── ANOVA_bar_of_peptide851 A2ASS6 Ttn S29116.svg
##     ├── ANOVA_bar_of_peptide857 A2ASS6 Ttn S32433.svg
##     ├── ANOVA_bar_of_peptide858 A2ASS6 Ttn T24072.svg
##     ├── ANOVA_bar_of_peptide860 A2ASS6 Ttn T19150.svg
##     ├── ANOVA_bar_of_peptide862 A2ASS6 Ttn T1072.svg
##     ├── ANOVA_bar_of_peptide867 A2ASS6 Ttn T25217.svg
##     ├── ANOVA_bar_of_peptide873 A2ASS6 Ttn S16620.svg
##     ├── ANOVA_bar_of_peptide875 A2ASS6 Ttn S18535.svg
##     ├── ANOVA_bar_of_peptide878 A2ASS6 Ttn S28343.svg
##     ├── ANOVA_bar_of_peptide88 A2AAJ9 Obscn T8181.svg
##     ├── ANOVA_bar_of_peptide886 A2ASS6 Ttn Y29398.svg
##     ├── ANOVA_bar_of_peptide89 A2AAJ9 Obscn T5969.svg
##     ├── ANOVA_bar_of_peptide891 A2ASS6 Ttn Y15871.svg
##     ├── ANOVA_bar_of_peptide892 A2ASS6 Ttn Y26650.svg
##     ├── ANOVA_bar_of_peptide893 A2ASS6 Ttn Y13198.svg
##     ├── ANOVA_bar_of_peptide894 A2ASS6 Ttn Y29652.svg
##     ├── ANOVA_bar_of_peptide895 A2ASS6 Ttn Y8173.svg
##     ├── ANOVA_bar_of_peptide896 A2ASS6 Ttn S16973.svg
##     ├── ANOVA_bar_of_peptide9 A2A432 Cul4b S149.svg
##     ├── ANOVA_bar_of_peptide901 A2ASS6 Ttn Y16353.svg
##     ├── ANOVA_bar_of_peptide903 A2ASS6 Ttn Y18940.svg
##     ├── ANOVA_bar_of_peptide904 A2ASS6 Ttn Y15210.svg
##     ├── ANOVA_bar_of_peptide907 A2ASS6 Ttn Y13808.svg
##     ├── ANOVA_bar_of_peptide91 A2AAJ9 Obscn S5923.svg
##     ├── ANOVA_bar_of_peptide910 A2ASS6 Ttn Y17284.svg
##     ├── ANOVA_bar_of_peptide912 A2ASS6 Ttn Y33864.svg
##     ├── ANOVA_bar_of_peptide913 A2ASS6 Ttn T26639.svg
##     ├── ANOVA_bar_of_peptide915 A2ASS6 Ttn T27318.svg
##     ├── ANOVA_bar_of_peptide917 A2ASS6 Ttn T27321.svg
##     ├── ANOVA_bar_of_peptide918 A2ASS6 Ttn T27322.svg
##     ├── ANOVA_bar_of_peptide923 A2ASS6 Ttn Y21370.svg
##     ├── ANOVA_bar_of_peptide924 A2ASS6 Ttn Y6020.svg
##     ├── ANOVA_bar_of_peptide928 A2ASS6 Ttn Y13453.svg
##     ├── ANOVA_bar_of_peptide930 A2ASS6 Ttn Y30689.svg
##     ├── ANOVA_bar_of_peptide932 A2ASS6 Ttn Y25699.svg
##     ├── ANOVA_bar_of_peptide933 A2ASS6 Ttn Y25700.svg
##     ├── ANOVA_bar_of_peptide939 A2ASS6 Ttn Y28136.svg
##     ├── ANOVA_bar_of_peptide941 A2ASS6 Ttn Y33442.svg
##     ├── ANOVA_bar_of_peptide942 A2ASS6 Ttn Y27451.svg
##     ├── ANOVA_bar_of_peptide945 A2ASS6 Ttn Y31324.svg
##     ├── ANOVA_bar_of_peptide946 A2ASS6 Ttn Y1902.svg
##     ├── ANOVA_bar_of_peptide948 A2ASS6 Ttn Y26671.svg
##     ├── ANOVA_bar_of_peptide95 A2AAJ9 Obscn S3705.svg
##     ├── ANOVA_bar_of_peptide950 A2ASS6 Ttn Y28835.svg
##     ├── ANOVA_bar_of_peptide953 A2ASS6 Ttn Y28981.svg
##     ├── ANOVA_bar_of_peptide957 A2ASS6 Ttn Y33490.svg
##     ├── ANOVA_bar_of_peptide958 A2ASS6 Ttn Y32065.svg
##     ├── ANOVA_bar_of_peptide960 A2ASS6 Ttn Y31288.svg
##     ├── ANOVA_bar_of_peptide961 A2ASS6 Ttn Y19860.svg
##     ├── ANOVA_bar_of_peptide965 A2ASS6 Ttn Y21655.svg
##     ├── ANOVA_bar_of_peptide966 A2ASS6 Ttn T12785.svg
##     ├── ANOVA_bar_of_peptide968 A2ASS6 Ttn T18453.svg
##     ├── ANOVA_bar_of_peptide970 A2ASS6 Ttn T32707.svg
##     ├── ANOVA_bar_of_peptide975 A2ASS6 Ttn T25315.svg
##     ├── ANOVA_bar_of_peptide977 A2ASS6 Ttn T20761.svg
##     ├── ANOVA_bar_of_peptide978 A2ASS6 Ttn T20770.svg
##     ├── ANOVA_bar_of_peptide98 A2AAJ9 Obscn S7807.svg
##     ├── ANOVA_bar_of_peptide983 A2ASS6 Ttn T26842.svg
##     ├── ANOVA_bar_of_peptide984 A2ASS6 Ttn T5737.svg
##     ├── ANOVA_bar_of_peptide987 A2ASS6 Ttn T14831.svg
##     ├── ANOVA_bar_of_peptide99 A2AAJ9 Obscn T6201.svg
##     ├── ANOVA_bar_of_peptide993 A2ASS6 Ttn Y21257.svg
##     ├── ANOVA_bar_of_peptide994 A2ASS6 Ttn Y21945.svg
##     ├── ANOVA_bar_of_peptide995 A2ASS6 Ttn T6041.svg
##     ├── ANOVA_bar_of_peptide999 A2ASS6 Ttn Y23810.svg
##     ├── Category1_all_feature_anova_results.xls
##     ├── Category1_all_significant_feature_barplot_of_duncan.svg
##     ├── Category1_all_significant_feature_duncan_results.xls
##     ├── Category1_anova_deg_result.xls
##     ├── Category1_anova_deg_sig.xls
##     ├── Enrichment
##     ├── Heatmap
##     ├── PPI_network
##     ├── Physicochemical
##     └── final_data_for_anova.xls

  ANOVA单因素方差分析用于分析单一控制变量影响下的多组样本的均值是否存在显著性差异。通常用于单个分组样本数大于30,具有两组即两组以上分组的比较。ANOVA单因素方差分析要求数据符合正态分布,分析前默认使用scale(center=T,scale=T)(软件版本:R4.2)对蛋白质丰度数据进行正态转换。分析结果使用阈值padj<0.05进行筛选后绘制磷酸化修饰位点差异表格柱状图,差异磷酸化修饰位点GO、KEGG富集分析、PPI网络分析、理化性质分析等下游结果详见结果文件夹(如有需要也可在云流程分步骤中挑选任意磷酸化修饰位点,作为差异磷酸化修饰位点)。

图 9.1.1 单指标多重比较柱状图
图 9.1.1 单指标多重比较柱状图
注:
    1. Group: 分组名
    2. Mean 纵坐标: 磷酸化修饰位点平均表达量,为分析过程中的因变量
    3. facter(Group)横坐标: 分组,因子变量,又称自变量
    4. 上图为一个磷酸化修饰位点的分析结果,如需查看更多内容可打开5.Anova_analysis

十、WGCNA分析

点击打开文件夹

点击查看文件夹结构
## ./6.WGCNA_analysis
## └── Category1
##     ├── All_hub_peptides.csv
##     ├── darkgrey_hub_peptides.csv
##     ├── dimgrey_hub_peptides.csv
##     ├── figures
##     ├── gainsboro_hub_peptides.csv
##     ├── indianred_hub_peptides.csv
##     ├── lightcoral_hub_peptides.csv
##     ├── lightgrey_hub_peptides.csv
##     ├── sample_info.csv
##     ├── silver_hub_peptides.csv
##     ├── tpm.csv
##     ├── whitesmoke_hub_peptides.csv
##     └── 模块表达量矩阵.csv

  加权基因共表达网络分析 (WGCNA, Weighted correlation network analysis)是用来描述不同样品之间基因关联模式的系统生物学方法,可以用来鉴定高度协同变化的基因集, 并根据基因集的内连性和基因集与表型之间的关联鉴定候补生物标记基因或治疗靶点。

  相比于只关注差异表达的基因,WGCNA利用全部基因的信息识别感兴趣的基因集,并与表型进行显著性关联分析。一是充分利用了信息,二是把数千个基因与表型的关联转换为数个基因集与表型的关联,免去了多重假设检验校正的问题。

  共表达网络定义为加权基因网络。点代表基因,边代表基因表达相关性。加权是指对相关性值进行幂次运算(幂次的值也就是软阈值 (power, model_fit.svg展示了确定合适的power的过程))。无符号(unsigned)网络的边属性计算方式为abs(cor(genex, geney)) ^ power;有符号(signed)网络的边属性计算方式为(1+cor(genex, geney)/2) ^ power; sign hybrid的边属性计算方式为cor(genex, geney)^power if cor>0 else 0。这种处理方式强化了强相关,弱化了弱相关或负相关,使得相关性数值更符合无标度网络特征,更具有生物意义。

  WGCNA分析将共表达网络转换为TOM拓扑重叠矩阵 (Topological overlap matrix),以降低噪音和假相关,获得的新距离矩阵。当两个基因在共表达网络中拥有较多相同的”邻居”时,我们说这两个基因拓扑重叠

  WGCNA分析利用TOM拓扑重叠矩阵对基因进行聚类,将拓扑重叠的基因聚为一个模块。Module(模块)指的是高度內连的基因集。在无符号(unsigned)网络中,模块内是高度相关的基因。在有符号网络中,模块内是高度正相关的基因。WGCNA的分析过程可参考图10.1.1。

图 10.1.1 WGCNA分析流程示意图
图 10.1.1 WGCNA分析流程示意图

10.1 鉴定模块

  WGNCA分析使用Python的PyWGCNA模块进行7,默认使用蛋白质表达量丰度数据protein_count.txt作为输入。数据通过sklearn包的preprocessing.MinMaxScaler()函数进行标准化。通过WGCNA流程对基因进行聚类:1.选择软阈值2.计算邻接矩阵3.计算TOM相似矩阵4.对dissTOM的基因进行聚类5.动态合并相似聚类。

  图10.1.2展示了不同power(幂次)下,WGCNA拓扑模型的拟合度,拟合度绝对值高于0.9时的power作为最终加权幂次,以及不同power(幂次)下,加权共表达网络中基因的平均连接度。连接度太高,不利于模块的区分,可能导致最终结果里只有一个模块,发生这种现象的原因主要有三个:

  (1) 有离群样本

  (2) 各分组间样本差异太大(批次效应)

  (3) 样本数太少。样本少时,基因之间倾向于有较高的相关系数值。举个极端例子,当只有两个样本时,任意两个基因之间的相关系数都是1,无论怎么分,只可能有一个模块。通常样本数多于15个时,才能有较好的模块鉴定结果。

图 10.1.2 不同power下拓扑模型的拟合度和基因平均连接度
图 10.1.2 不同power下拓扑模型的拟合度和基因平均连接度

  图10.1.3展示了各个模块基因根据TOM拓扑重叠矩阵聚类的结果。只有高度差(近似’1-拓扑重叠指数’得到的距离)在高度阈值(默认0.2)以内的基因,才有可能被归为一个模块。grey是无法归类到任何模块的基因的集合。

图 10.1.3 模块基因聚类树
图 10.1.3 模块基因聚类树

  基于给定模块中的连通性,查找前10个枢纽基因作为核心基因,(云流程中可以调整作为核心基因的数量,如需查看各模块全部结果可将阈值设置为蛋白质总数),如表10.1所示。并通过网络图来展示它们的连接关系,如图10.1.4所示。默认只会显示连接度在100以上的蛋白,如需要调整可使用云流程分步骤进行。

图 10.1.4 Hub核心基因(蛋白)网络图

10.2 模块关联表型

  我们将老师提供的分组变量作为表型因素(如年龄0到20一组,20到40一组,40到60一组,且要求分组数量大于等于3,否则图10.2.3将不会展示各分组名称),我们可以将模块的Module eigengene E(同上表10.1)与表型数据做相关分析,从而推断模块影响的表型。注意:该分析部分使用是属于某模块的全部基因(蛋白),而不是Hub基因(蛋白),请注意区分。

  图10.2.1用柱状图的形式展示了模块本征基因(属于该模块的基因,在本分析中为属于该模块的蛋白)在不同分组中的表达量。

图 10.2.1 模块征基因柱状图
图 10.2.1 模块征基因柱状图
注:
    1. 图例: 分组情况
    2. 纵坐标: 模块本征基因(蛋白质)表达量的平均值(经过标准化处理)
    3. 横坐标: 分组名

  图10.2.2用热图的形式展示了模块本征基因(属于该模块的基因,在本分析中为属于该模块的蛋白)在不同分组中的表达量。相较于柱状图,可以看到模块本征基因(蛋白)在各组间的表达模式。理想状态下同一分组下同一模块的本征基因(蛋白)的表达模式(即热图的颜色分布情况)应该是相似的,同一模块的本征基因在不同分组的表达模式相对而言是具有较大差异的(和实验设计,组间差异程度,以及模块的选择有关)。

图 10.2.2 模块征基因热图
图 10.2.2 模块征基因热图
注:
    1. 图例: 分组情况
    2. 纵坐标: 模块本征基因(蛋白质)表达量的平均值(经过标准化处理)
    3. 横坐标: 样本
    4. 热图中颜色越红代表该基因(蛋白)的表达量越高,越黑表达量越低。

  图10.2.3展示的是模型-表型相关性热图。用于推断模块对表型的影响。要查看各样本与模块的原始相关性矩阵可查看文件夹中“模块表达量矩阵.csv”文件。

图 10.2.3 模型-表型相关性热图
图 10.2.3 模型-表型相关性热图
注:
    1. 图例: 相关性范围值,蓝色表示负相关,红色表示正相关
    2. 纵坐标: 分组名(分组小于3组是会显示category名称)
    3. 横坐标: 模块名称,括号中的数字表示该模块包含的基因(蛋白)数量
    4. 热图中数字表示相关性系数(pearson),括号中的数字表示对应的P值。

十一、差异修饰位点功能富集分析

点击打开文件夹

点击查看文件夹结构
## ./7.Enrichment_analysis
## ├── GO
## │   ├── Category1_M.vs.C
## │   ├── Category1_M.vs.T
## │   └── Category1_T.vs.C
## └── KEGG
##     ├── Category1_M.vs.C
##     ├── Category1_M.vs.T
##     └── Category1_T.vs.C

  对差异修饰位点对应的蛋白,我们进行了GO、KEGG富集分析,目的是检测差异表达修饰位点是否在某些功能类型上有显著性的富集趋势。

11.1 差异修饰位点 GO 富集分析

11.1.1 GO 富集分析结果

  GO 功能显著性富集分析给出与所有鉴定到的蛋白质背景相比,差异蛋白质中显著富集的GO功能条目,从而给出差异蛋白质与哪些生物学功能显著相关。GO分为分子功能(Molecular function)、细胞组分(Cellular component)和生物过程(Biological process)三个部分。该分析首先把所有差异蛋白质向Gene Ontology数据库 (https://www.geneontology.org/)的各个term映射,计算每个term的蛋白质数目,然后应用超几何检验,找出与所有蛋白质背景相比,在差异蛋白质中显著富集的GO条目89。其计算公式:

p _ v a l u e = 1 j = 0 x 1 ( M j ) ( N M n j ) ( N n )

其中N为所有蛋白中具有GO注释信息的蛋白数目,n为N中差异蛋白的数目,M为所有蛋白中注释到某个GO条目的蛋白数目,x为注释到某个GO条目的差异蛋白数目。计算得到p值,以p值小于0.05为阈值,满足此条件的GO term定义为在差异蛋白质中显著富集的GO term。通过GO显著性分析能确定差异蛋白行使的主要生物学功能。差异蛋白GO富集结果见下表。

注:
    1. GO ID: Gene Ontology数据库中唯一的标号信息
    2. Description: Gene Ontology功能的描述信息
    3. GeneRatio: 差异基因中与该Term相关的基因数与整个差异基因总数的比值
    4. BgRatio: 背景基因中与该Term相关的基因数与所有基因的比值
    5. pvalue: 富集分析统计学显著水平,一般情况下,p值小于0.05时该功能为显著富集项
    6. padjust: 校正后的p值
    7. qvalue: 对p值进行统计学检验的q值
    8. Count: 差异基因中与该Term相关的基因数

图 11.1.1 候选蛋白GO富集柱状图
图 11.1.1 候选蛋白GO富集柱状图

注: 图中显示的是p值极显著的前10个子功能,纵坐标是GO三个大类的下一层级的GO term,横坐标为注释到该term下(包括该term的子term)的候选蛋白个数。

图 11.1.2 候选蛋白GO富集气泡图
图 11.1.2 候选蛋白GO富集气泡图
注:
    1. geneRatio,是通过计算我们的目标基因富集到目的通路基因个数占目标基因总数(包含基因集总基因)的比值。
    2. 纵坐标轴是细胞生物学过程或者是一些发挥功能的通路。表示基因所对应的生物学过程或者分子功能是什么。
    3. Count是基因的个数,圈越大说明基因数目越多,反之越少。

图 11.1.3 候选蛋白GO cnetplot网络图
图 11.1.3 候选蛋白GO cnetplot网络图

注: 灰色的点代表蛋白,灰点下的字母数字表示该蛋白的Uniprot Accession(Uniprot上的蛋白编号,或者其他蛋白编号),黄色的点代表富集到的GO terms,默认画top5富集到的GO terms,GO节点的大小对应富集到的蛋白个数

图 11.1.4 候选蛋白GO富集分析VENN图
图 11.1.4 候选蛋白GO富集分析VENN图

注: 红色表示有多少个上调蛋白富集到该通路,蓝色表示有多少个下调蛋白富集到该通路。需要注意的重要一点是,饼图不显示冗余信息。因此,如果您比较三个数据集,则所有数据集共享的基因(中间的饼图)不包括在其他饼图中。

图 11.1.5 候选蛋白富集分析圈图
注:
    1. 外圈为term的名称。
    2. 中圈为差异情况(up和down),表示富集到该通路有多少上调蛋白多少下调蛋白。
    3. 内圈为z-score,计算方法(up基因数-down基因数)/sqrt(基因数))。指示这个term更可能是降低(负值)还是升高(正值)。

图 11.1.6 候选蛋白富集分析圈图
注:
    1. 内圈是根据差异蛋白logFC做的聚类。
    2. 外圈是GO term的堆积图。

图 11.1.7 候选蛋白GO富集分析弦图
注:
    1. 富集分析弦图展示蛋白和go term之间的关系。
    2. 左侧蛋白方块的颜色表示蛋白上调(红棕色)或下调(蓝色)。

图 11.1.8 候选蛋白富集分析热图
注:
    1. 富集分析热图展示蛋白和go term之间的关系。
    2. 纵坐标是term的描述信息。
    3. 横坐标是蛋白名称。
    4. 方块的颜色表示该蛋白是上调蛋白(红棕色)还是下调蛋白(蓝色)。

图 11.1.9 候选蛋白富集分析GO term层次结构
注:
    1. 本分析使用两种有向无环可视化方式展示差异蛋白富集GO term的层次结构。
    2. 有向无环图(Directed acyclic graph, DAG)中,从上至下依次有包含关系,只有从上往下的箭头,这个箭头代表包含关系,即有向。只有从上往下的箭头,方向是确定的,所以不会形成闭环,即无环。
    3. 在有向无环图中,矩形代表富集到的top10个GO Terms,颜色从黄到红,对应p值从大到小。
    4. 分支代表包含关系,从上至下所定义的功能描述范围越来越具体。
    5. 箭头代表包含关系,即该节点的所有基因同样注释到其上级节点中。
    6. 每个方框(或椭圆)内给出了该GO节点的内容描述和富集显著性值(上图)。
    7. idagplot(下图),是用文字简易描述的GO terms层次关系。方便快速查看各GO term富集的显著性,和它们直接的层次关系。(当文件较大发生重叠时可使用云流程 (svg编辑器)拖拽放大进行查看。

11.2 差异修饰位点KEGG富集分析

  在生物体内,不同基因相互协调行使其生物学功能,通过Pathway显著性富集能确定候选蛋白参与的最主要生化代谢途径和信号转导途径。KEGG(Kyoto Encyclopedia of Genesand Genomes)是有关Pathway的主要公共数据库10。Pathway显著性富集分析以KEGG Pathway为单位,应用超几何检验,找出与整个基因组背景相比,在候选蛋白中显著性富集的Pathway。该分析的计算公式11

p = 1 j = 0 m 1 ( M j ) ( N M n j ) ( N n ) m

11.2.1 KEGG 富集分析结果

注:
    1. ID: KEGG 数据库中通路唯一的编号信息。
    2. Description: Gene Ontology功能的描述信息
    3. GeneRatio: 差异基因中与该Term相关的基因数与整个差异基因总数的比值
    4. BgRatio: 背景基因中与该ID相关的基因数与所有基因的比值
    5. pvalue: 富集分析统计学显著水平,一般情况下,p值小于0.05时,该功能为富集项
    6. padjust: 校正后的p值
    7. qvalue: 对p值进行统计学检验的q值
    8. Count: 差异基因中与该Term相关的基因数

图 11.2.1 候选蛋白KEGG富集柱状图
图 11.2.1 候选蛋白KEGG富集柱状图

注: 图中显示的是p值极显著的前10个KEGG通路(颜色越红p值越小,越蓝p值越大),纵坐标是通路的描述,横坐标为注释到该通路下的候选蛋白个数。

图 11.2.2 候选蛋白KEGG富集散点图
图 11.2.2 候选蛋白KEGG富集散点图

注: 在此图中,KEGG富集程度通过Gene Ratio、padjust和富集到此通路上的基因个数来衡量。其中Gene Ratio指差异表达的基因中位于该Pathway条目的基因数目与差异基因中具有KEGG注释的基因总数的比值,Count表示富集到该通路的差异基因数量。Gene Ratio越大,表示富集的程度越大。padjust是校正后的p值。我们挑选了富集前10位的Pathway条目在该图中进行展示,若富集的Pathway条目不足10条,则全部展示。

图 11.2.3 候选蛋白KEGG富集cnetplot网络图
图 11.2.3 候选蛋白KEGG富集cnetplot网络图

注: 灰色的点代表蛋白,灰点下的字母数字表示该蛋白的Uniprot Accession(Uniprot上的蛋白编号,或者其他蛋白编号),黄色的点代表富集到的KEGG pathway,默认画top5富集到的KEGG pathway,黄色节点的大小对应富集到的蛋白个数

图 11.2.4 候选蛋白KEGG富集弦图
图 11.2.4 候选蛋白KEGG富集弦图

注: (1) 富集分析弦图展示蛋白和KEGG pathway之间的关系。 (2) 左侧蛋白方块的颜色表示蛋白上调(红棕色)或下调(蓝色)。

图 11.2.5 候选蛋白KEGG富集分析通路图
图 11.2.5 候选蛋白KEGG富集分析通路图

(结题报告篇幅有限,仅展示一个通路的代谢图,其余代谢图见附件)

注:
    1. K+num(基因ID号,表示在所有同源物种中具有相似结构或功能的一类同源蛋白)。如K01012=>生物素合成酶(备注:K建议大写)
    2. ko+num(代谢通路名称,表示一个特定的生物路径)如:ko0078=>生物素代谢 通路(备注:ko小写)
    3. M + num(模块名称)M00123=>生物素合成模块 C+num(化合物名)
    4. E -.-.-.-(酶名)EC2.1.1.116=>生物素合成酶(其实也就是k01012)
    5. R+num(反应名)
    6. RC+num(反应类型)
    7. RP+num(反应物质对)
    8. 图中红色表示根据log2FC计算得到的上调基因,蓝色表示下调基因
    9. 图中符号的详细解释参照KEGG官网https://www.genome.jp/kegg/document/help_pathway.html

十二、差异修饰位点互作分析

点击打开文件夹

点击查看文件夹结构
## ./8.PPI_network
## ├── Category1_M.vs.C
## │   ├── cog_annotation.csv
## │   ├── cog_ppi.csv
## │   ├── cog_ppi.html
## │   ├── deg_result.csv
## │   ├── ppi.csv
## │   ├── ppi.html
## │   └── up_down_ppi.html
## ├── Category1_M.vs.T
## │   ├── cog_annotation.csv
## │   ├── cog_ppi.csv
## │   ├── cog_ppi.html
## │   ├── deg_result.csv
## │   ├── ppi.csv
## │   ├── ppi.html
## │   └── up_down_ppi.html
## └── Category1_T.vs.C
##     ├── cog_annotation.csv
##     ├── cog_ppi.csv
##     ├── cog_ppi.html
##     ├── deg_result.csv
##     ├── ppi.csv
##     ├── ppi.html
##     └── up_down_ppi.html

  蛋白质互作网络是由蛋白通过彼此之间的相互作用构成,来参与生物信号传递、基因表达调节、能量和物质代谢及细胞周期调控等生命过程的各个环节。

  系统分析大量蛋白在生物系统中的相互作用关系,对了解生物系统中蛋白质的工作原理,了解疾病等特殊生理状态下生物信号和能量物质代谢的反应机制,以及了解蛋白之间的功能联系都有重要意义。

  利用 StringDB12蛋白质互作数据库 (https://string-db.org/)对筛选的差异蛋白进行互作分析。在数据库中找到相应的物种,默认相互作用得分(combined)设置为400,得出相应的互作信息后,对分析结果进行网络图构建。差异蛋白互作结果见下表及下图。如果物种未被stringdb数据库收录将只返回蛋白对应的COG_PPI网络分析图。 ppi网络分析的动态显示涉及到浏览器渲染,请耐心等待,并尽可能将差异蛋白数量控制在200个以下避免图形过于复杂。

  COG,即Clusters of Orthologous Groups of proteins(同源蛋白簇)。是由NCBI创建并维护的蛋白数据库,根据细菌、藻类和真核生物完整基因组的编码蛋白系统进化关系分类构建而成。通过比对可以将某个蛋白序列注释到某一个COG中,每一簇COG由直系同源序列构成,从而可以推测该序列的功能。我们根据蛋白序列进行COG注释,使用差异分析结果进行筛选,然后映射到Stringdb数据库中COG互作网络中。

注:
    1. group1: 互作蛋白1
    2. group2: 互作蛋白2
    3. combined_score: 数据库中COG互作关系得分

点击查看差异蛋白COG注释信息
图 12.1.1 差异蛋白同源蛋白簇(COG)互作网络
点击查看PPI网络分析结果(Stringdb收录的物种有该部分结果)
注:
    1. from: 互作蛋白1
    2. to: 互作蛋白2
    3. combined_score: 数据库中通过实验方式证明互作关系得分

图 12.1.2 差异蛋白互作网络

注:当需要使用力导向图,或者调整网络图到窗口中部时可勾选右侧编辑栏中的enabled。

  将差异分析结果导入蛋白质互作网络分析中近一步得到蛋白质上下调互作网络:

图 12.1.3 差异蛋白上下调互作网络
注:图中红色圈表示表达量显著上调的蛋白,绿色表示显著下调的蛋白。

十三、差异修饰位点理化性质分析

点击打开文件夹

点击查看文件夹结构
## ./9.Physicochemical_analysis
## ├── Category1_M.vs.C
## │   ├── Physicochemical_properties.csv
## │   ├── java_echart
## │   └── peptides_sequence.csv
## ├── Category1_M.vs.T
## │   ├── Physicochemical_properties.csv
## │   ├── java_echart
## │   └── peptides_sequence.csv
## └── Category1_T.vs.C
##     ├── Physicochemical_properties.csv
##     ├── java_echart
##     └── peptides_sequence.csv

  根据差异分析挑选差异磷酸化修饰位点并获得其序列数据。然后使用R语言包:Peptides基于序列数据进行理化性质预测。理化性质分析结果包括4个方面的内容:序列长度lengthpep,分子量mw,疏水性hydrophobicity,和等电点pI。分析结果以交互式散点图进行展示。

图 13.1.1 差异磷酸化修饰位点理化性质分析

十四、差异磷酸化修饰位点激酶分析

点击打开文件夹

点击查看文件夹结构
## ./10.Kinase_analysis
## ├── Category1_M.vs.C
## │   ├── KSEA Kinase Scores.csv
## │   ├── Kinase-Substrate Links.csv
## │   ├── kinase_bar.svg
## │   └── up_down_ppi.html
## ├── Category1_M.vs.T
## │   ├── KSEA Kinase Scores.csv
## │   ├── Kinase-Substrate Links.csv
## │   ├── kinase_bar.svg
## │   └── up_down_ppi.html
## └── Category1_T.vs.C
##     ├── KSEA Kinase Scores.csv
##     ├── Kinase-Substrate Links.csv
##     ├── kinase_bar.svg
##     └── up_down_ppi.html

  激酶是能够催化高能供体分子将磷酸基团转移到特定底物的酶,通过调节蛋白质的磷酸化,直接影响这些蛋白质的结构和功能,从而调节了细胞内的各种生物学过程。目前已发现的蛋白激酶约500多种,依据序列相似性、进化保守性和功能等多方面信息,可以将蛋白激酶分为9大家族: CK1、AGC、CAMK、CMGC、 GYC、TK、 TKL、STE和Atypical。其中大部分激酶为丝氨酸/苏氨酸激酶,只有TK家族和TKL家族的部分成员为酪氨酸激酶。

14.1 激酶-底物富集分析KSEA

  激酶-底物富集分析KSEA(Kinase-Substrate Enrichment Analysis)根据差异磷酸化修饰位点,分析其上游可能存在的调控激酶,进而对激酶活性进行打分13。评分计算方法: s c o r e = ( s ¯ p ¯ ) m δ

14.1.1 KSEA 富集分析结果

注:
    1. KinaseGene:激酶的HUGO基因名,是激酶在人类基因命名委员会中的标准名称,用于唯一标识一个激酶,方便在文献和数据库中查找和引用该激酶的相关信息。
    2. mS:该激酶所有已鉴定底物的平均log2FC值,FC即为倍数变化,log2FC是对FC取以2为底的对数,通过计算平均值可以反映该激酶底物整体的表达变化趋势,数值越大,说明底物整体表达上调越明显,反之则下调越明显。
    3. Enrichment:富集得分,用于衡量激酶底物在数据中的富集程度。该得分越高,表明该激酶的底物在分析的磷酸化蛋白质组数据中越富集,暗示该激酶可能在当前生物学过程中发挥了重要作用。
    4. m:实验鉴定到的注释为该激酶的底物数量,数量越多,说明该激酶在分析的数据中涉及的底物越多,其潜在的生物学功能可能越复杂和重要。
    5. z.score:标准化的激酶得分,通过将激酶得分进行标准化处理,使其符合标准正态分布,便于进行统计学分析和比较不同激酶得分的显著性。
    6. p.value:激酶得分的统计学评估值,用于判断该激酶得分的显著性,p值越小,说明该激酶得分显著性越高,即该激酶在当前分析中表现出的活性差异越可能是真实的,而不是由随机误差导致的。

图 14.1.1 KSEA富集柱状图
图 14.1.1 KSEA富集柱状图

注: 该图是使用柱状图展示差异磷酸化修饰位点KSEA富集分析结果,柱状图颜色越红表示标准化的激酶得分越高,得分越高说明激酶在当前生物学过程中可能发挥了重要的调控作用

14.2 激酶-底物调控网络

  通过检索PhosphoSitePlus14,GPS 6.015等数据库,我们获得了激酶-底物链接信息,并通过网络图的方式进行展示。通过查看激酶-底物调控网络可以快速的找到调控某个磷酸化修饰位点的激酶是什么,以及这个修饰位点表达量上调或下调的情况。

14.2.1 激酶-底物调控网络分析结果

注:
    1. KinaseGene:激酶的HUGO基因名,是激酶在人类基因命名委员会中的标准名称,用于唯一标识一个激酶,方便在文献和数据库中查找和引用该激酶的相关信息。
    2. Substrate.Gene:底物(差异磷酸化修饰位点)的Gene Symbol。
    3. Substrate.Mod:发生修饰的位置。
    4. Source:数据来源。
    5. log2FC:差异磷酸化修饰位点表达量。

注: 红色表示表达量上调的磷酸化修饰位点,绿色表示下调。蓝色表示激酶。

  如果分析物种为Homo sapiens,可使用 (KINMAP交互式可视化工具)编辑并展示激酶调控树。如果有多个分组并想比较它们的激酶调控活性可使用云流程分步骤中:激酶分析-激酶活性热图。

分析所用软件版本

  分析用到的软件和数据库版本如下表所示:

软件 版本
emapper 2.0.1
InterProScan 5.46-81.0
MEME 5.0.2
DESeq2 1.40.0
R 4.3
python 3.8

参考文献


  1. Wu J, An Y, Pu H, Shan Y, Ren X, An M, Wang Q, Wei S, Ji J. Enrichment ofserum low-molecular-weight proteins using C18 absorbent under urea/dithiothreitoldenatured environment. Anal Biochem. 2010 Mar 1;398(1):34-44.↩︎

  2. Wu J, Xie X, Liu Y, He J, Benitez R, Buckanovich RJ, Lubman DM.Identification and confirmation of differentially expressed fucosylated glycoproteinsin the serum of ovarian cancer patients using a lectin array and LC-MS/MS. JProteome Res. 2012 Sep 7;11(9):4541-52.↩︎

  3. Cantalapiedra, Carlos P et al. “eggNOG-mapper v2: Functional Annotation, Orthology Assignments, and Domain Prediction at the Metagenomic Scale.” Molecular biology and evolution vol. 38,12 (2021): 5825-5829. doi:10.1093/molbev/msab293↩︎

  4. InterProScan 5: genome-scale protein function classification Philip Jones, David Binns, Hsin-Yu Chang, Matthew Fraser, Weizhong Li, Craig McAnulla, Hamish McWilliam, John Maslen, Alex Mitchell, Gift Nuka, Sebastien Pesseat, Antony F. Quinn, Amaia Sangrador-Vegas, Maxim Scheremetjew, Siew-Yit Yong, Rodrigo Lopez, Sarah Hunter Bioinformatics (2014), PMID: 24451626↩︎

  5. Alice Cheng, Charles Grant, Timothy L. Bailey and William Noble, “MoMo: Discovery of statistically significant post-translational modification motifs”, Bioinformatics, 35(16):2774-2782, 2018.↩︎

  6. Love, M. I. , Huber, W. , & Anders, S. . (2014). Moderated estimation of fold change and dispersion for rna-seq data with deseq2. Genome Biology, 15(12), 550.↩︎

  7. Narges Rezaie, Farilie Reese, Ali Mortazavi, PyWGCNA: a Python package for weighted gene co-expression network analysis, Bioinformatics, Volume 39, Issue 7, July 2023, btad415, https://doi.org/10.1093/bioinformatics/btad415.↩︎

  8. Ashburner et al. Gene ontology: tool for the unification of biology. Nat Genet. 2000 May;25(1):25-9. DOI: 10.1038/75556↩︎

  9. The Gene Ontology Consortium. The Gene Ontology knowledgebase in 2023. Genetics. 2023 May 4;224(1):iyad031. DOI: 10.1093/genetics/iyad031↩︎

  10. Smyth, G. K. . (2010). edgeR: a bioconductor package for differential expression analysis of digital gene expression data. Bioinformatics, 26(1), 139.↩︎

  11. Kanehisa M, Goto S, Kawashima S, Okuno Y, Hattori M. The KEGG resourcefor deciphering the genome. Nucleic Acids Res. 2004 Jan 1;32(Databaseissue):D277-80.↩︎

  12. Damian, S. , Andrea, F. , Stefan, W. , Kristoffer, F. , Davide, H. , & Jaime, H. C. , et al. (2015). String v10: protein–protein interaction networks, integrated over the tree of life. Nucleic Acids Research, 43(D1). Nucleic Acids Res. 2014 Jan;42(Database issue):D222-30.↩︎

  13. Wiredja D.D., Koyutürk M., Chance M.R. (2017) The KSEA App: a web-based tool for kinase activity inference from quantitative phosphoproteomics. Submitted for review.↩︎

  14. Hornbeck P.V., et al. (2015) PhosphoSitePlus, 2014: mutations, PTMs and recalibrations. Nucleic Acids Res. 43:D512-20↩︎

  15. Chen M, Zhang W, Gou Y, Xu D, Wei Y, Liu D, Han C, Huang X, Li C, Ning W, Peng D, Xue Y. GPS 6.0: an updated server for prediction of kinase-specific phosphorylation sites in proteins. Nucleic Acids Res. 2023 Jul 5;51(W1):W243-W250. doi: 10.1093/nar/gkad383. PMID: 37158278; PMCID: PMC10320111.↩︎