2014年11月3日月曜日

BEDファイルのソート

BEDファイルがでたらめにソートしていると、
chr1
chr10
chr11
chr12
…
chr19
chr2
chr20
chr21
chr22
chrX
chrY
という感じになっている。つまり、chr~ごと文字として認識しているから。
sort -k 1,1 -k2,2n hoge.bed 

#とすれば、以下のように理想的な形にソートされる。
chr1
chr2
chr3
…
chr21
chr22
chrX
chrY