最近关注到一篇文献,发表了一个针对MeRIP Seq数据分析的整合流程,并将全部代码开源发布到了GitHub上,一起来看下这个资源,并进行步骤拆解。
文献信息
- 标题:MeRIPseqPipe: an integrated analysis pipeline for MeRIP-seq data based on Nextflow
- Doi:https://doi.org/10.1093/bioinformatics/btac025
- 发表杂志:Bioinformatics
- 发表时间:12 January 2022
- 作者:[Zhixiang Zuo](javascript:;) 华南肿瘤学国家重点实验室,肿瘤中心,肿瘤医学协作创新中心,中山大学
代码:https://github.com/canceromics/MeRIPseqPipe,
流程基于Nextflow and Docker开发
我这次把其中的核心分析代码提取出来,转化为sh脚本
简单介绍:
MeRIPseqPipe是一个集成的自动pipline,可以为用户提供一个友好的解决方案来执行MeRIP-seq数据的深入挖掘。它集成了许多功能分析模块,范围从基本处理到下游分析。所有的过程都嵌入到带有文档支持的Nextflow中,这确保了分析的高重现性和可伸缩性。MeRIPseqPipe特别适合用一个简单的命令一次分析大量的样本。最终的输出目录是基于每个步骤和工具来构建的。并且,包含各种表和绘图的可视化报告以HTML文件的形式提供。
分析流程:
image-20220310143058511
包括了:
- 质控
- rRNA去除
- 比对
- Peak识别
- Peak合并
- Peak注释
- Motif分析
- 单位点的m6A分析
- 甲基化定量
- 差异甲基化分析
- 基因表达定量
- 差异表达基因分析