XPEHH参见: https://mp.weixin.qq.com/s/1IM6KSCGIq0cUJhKKXVcIw
XPCLR参见: https://mp.weixin.qq.com/s?__biz=MzU1NDkzOTk2MQ==&mid=2247486984&idx=1&sn=fe2ba6c33bf3323230b45ed8aff408a9&chksm=fbdaad5eccad244888ace45f2d620b8855167fb33aa099866bcfce0b14cfffe242d6d833cac8&scene=178&cur_album_id=1891572197685575683#rd
- 对vcf做beagle分型、填充
1.对SNP进行命名
即ID这一列, 命令为 "第一列.第二列" , eg: Chr1.144; Chr5.823122
vcf文件只保留两个群体, 目标群体和参考群体.
目标群体单独一个vcf文件, 参考群体单独一个vcf文件; 目标群体(相对于参考群体)的受选择信号.vcf按染色体拆分
4.map文件的制备, 第一列是染色体名, 第二列是SNP的ID, 第三列是物理位置 x 0.000554779412, 第四列是物理位置
遗传距离是选择的小鼠的, ref: 10.1101/gr.1970304
#比如
Chr26 Chr26.98278 54.5226 98278
Chr26 Chr26.98389 54.5842 98389
软件的路径/data/01/user158/kuangzhuoran/software/selscan-2.0.0/bin/linux/
./selscan --xpehh --vcf target.Chr1.vcf --vcf-ref ref.vcf --map Chr1.map --out Chr1
./selscan --xpnsl --vcf target.Chr1.vcf --vcf-ref ref.vcf --map Chr1.map --out Chr1
./selscan --ihs --vcf target.Chr1.vcf --map Chr1.map --out Chr1
切换到相应的输出目录下, 运行
./norm --xpehh --filesChr*.out.xpehh.out --bp-win --winsize 50000
./norm --xpnsl --files Chr*.xpnsl.out --bp-win --winsize 50000;
./norm --ihs --files Chr*.ihs.out --bp-win --winsize 50000
生成对应的Chr*.ihs.out.norm,多了两列,其中一列就是标准化的值
--bp-win --winsize 50000表示滑窗统计, 因为这三个参数是一个SNP算一个值
但是画图还是用一个SNP算一个值来画
XP-CLR 一个vcf文件即可,该vcf文件包含目标群体和参考群体总计两个群体
conda install xpclr
xpclr --out Chr1 --format vcf --input input.vcf --samplesA ref.pop.1col --samplesB target.pop.1col --phased --size 50000 --step 50000 --chr Chr1
#pop文件只有1列即个体名