Skip to content

Find differentially methylated regions using python or perl

Notifications You must be signed in to change notification settings

dxkeac/DNA_methylation

Repository files navigation

  • 这些代码用来检测拟南芥野生型和突变体差异甲基化区域。

  • 准备:

python3环境,用pip或者conda安装biopython。

(拟南芥5条染色体fa文件、2个表型甲基化位点文件都存放在testdata)

  • 流程:

第一步:使用biopython从fa文件得出各条染色体长度;

第二步:将总的基因组分成间隔相等的bin;

第三步:将两个表型的bismark软件coverage2cytosine命令生成的文件合并;

第四步:用第三步合并的文件和第二步生成的bin文件求差异甲基化区域。

python3 Calchrlength_v.py Chr1 Chr2 Chr3 Chr4 Chr5 TAIR10_chr1.fa TAIR10_chr2.fa TAIR10_chr3.fa TAIR10_chr4.fa TAIR10_chr5.fa arabid_chr_length.txt

python3 ChrBin_v.py --chrlenfile arabid_chr_length.txt  --bin 1000 --step 500 -o arabin.txt

python3 CombineBisGenome_v.py --fn1 col0_Chr1_1000row_genome --fn2 linc3-7_Chr1_1000row_genome -o col0_lin3-7_Chr1.txt

python3 ChrBinFindDmr_v.py --fn1 col0_lin3-7_Chr1.txt --fn2 arabin.txt --Ctype CG --depth 4 --mCnum 5 --diff 0.3 --pval 0.01 -o col0_linc3-7_Chr1_CG_DMR
  • 1.python3 Calchrlength_v.py

输入文件格式:

输出文件格式:

  • 2.python3 ChrBin_v.py -h

输入文件格式:

输出文件格式:

  • 3.python3 CombineBisGenome_v.py -h

输入文件格式:(另一个输入文件格式相同)

输出文件格式:

  • 4.python3 ChrBinFindDmr_v.py -h

输入文件格式如下:

输出文件格式如下:

染色体 起始区间 结束区间 1甲基化水平 2甲基化水平 甲基化水平差值 P值

About

Find differentially methylated regions using python or perl

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published