chr1 chr10 chr11 chr12 … chr19 chr2 chr20 chr21 chr22 chrX chrYという感じになっている。つまり、chr~ごと文字として認識しているから。
sort -k 1,1 -k2,2n hoge.bed #とすれば、以下のように理想的な形にソートされる。 chr1 chr2 chr3 … chr21 chr22 chrX chrY
chr1 chr10 chr11 chr12 … chr19 chr2 chr20 chr21 chr22 chrX chrYという感じになっている。つまり、chr~ごと文字として認識しているから。
sort -k 1,1 -k2,2n hoge.bed #とすれば、以下のように理想的な形にソートされる。 chr1 chr2 chr3 … chr21 chr22 chrX chrY
#変換したいファイルがbedなら(chr1 1000099 1000200) liftOver Oct4_mm8.bed mm8ToMm10.over.chain Oct4_mm10.bed unmapped.txt Oct4_mm10.bed>>変換されたbed unmapped.txt>>変換できなかったもの #変換したいファイルがpositionなら(chr1:1000100-1000200) liftOver -positions Oct4_mm8.txt mm8ToMm10.over.chain Oct4_mm10.txt unmapped.txt Oct4_mm10.txt>>変換されたposition unmapped.txt>>変換できなかったのもの liftOver_XXXXXX.bed>>変換前のbedファイル liftOver_XXXXXX.bedmapped>>変換後のbedファイルpositionでもliftover出来て、そのbedを得られるのは便利
sshfs ユーザー名@サーバー名(hoge.co.jp):/home/ユーザー名/PATH/TO/指定ディレクトリ /Users/ユーザー名/Desktop/hoge指定ディレクトリ以下にディレクトリがあってもアクセスできる。
maskFastaFromBed -fi [マスクかけたいfasta ファイル] -bed [位置を指定した bedファイル] -fo [ 出力fa staファイル名] -mc N(Nでマスクする)マスクかけたいfasta ファイルはmulti fastaでOK bedも複数行でOK 例として
test.fa >chr1 TCTCATGCTAATCAGGATCTGGGGCACAGTACAAACCTCAAATGCTGTAGTTGAG >chr2 GCTATTTCAGCCCTAGTGGAAGGGGGTGGGGCGGCACTAGGGCAGCAGCCCGTGCCCGCTGCACTTCCCTTATCGGATTACTGCTTAACTCCCACCCCCTCCTAGGTCCAAAAAGTATACTAATTACATGGA >chr3 GCAGTACATTCCACAGCATCCTTAGGTGTTGCTCAGAGTCTACCTAACACCTAAGTACAAAAATGAAGCCCTAGGGCAGCCCTAAATGGTTTGTTTCCGCAAAATAGTGATCAACTCAAGTAAACAAGGGTT >chr4 CATAAGACACATTGAAGACACCGCCACAGAACTTTACTGCCCTCAAGAGTCTTCTCTCATCTCTGGGATGCCTGTGAGGC test.bed chr1 5 10 chr2 10 20 chr2 21 23 chr5 10 20 maskFastaFromBed -fi test.fa -bed test.bed -fo out.fa -mc N out.fa >chr1 TCTCANNNNNATCAGGATCTGGGGCACAGTACAAACCTCAAATGCTGTAGTTGAG >chr2 GCTATTTCAGNNNNNNNNNNANNGGGTGGGGCGGCACTAGGGCAGCAGCCCGTGCCCGCTGCACTTCCCTTATCGGATTACTGCTTAACTCCCACCCCCTCCTAGGTCCAAAAAGTATACTAATTACATGGA >chr3 GCAGTACATTCCACAGCATCCTTAGGTGTTGCTCAGAGTCTACCTAACACCTAAGTACAAAAATGAAGCCCTAGGGCAGCCCTAAATGGTTTGTTTCCGCAAAATAGTGATCAACTCAAGTAAACAAGGGTT >chr4 CATAAGACACATTGAAGACACCGCCACAGAACTTTACTGCCCTCAAGAGTCTTCTCTCATCTCTGGGATGCCTGTGAGGCとなるはず。 bedは定義がstartの数字を含まないので5と書いてあれば6文字目を示しendは10と書いてあれば10文字目を示す事に注意する。
135582741 reads; of these: 135582741 (100.00%) were unpaired; of these: 22383842 (16.51%) aligned 0 times 61518065 (45.37%) aligned exactly 1 time 51680834 (38.12%) aligned >1 times 83.49% overall alignment rate
基本的にフラグが立っているのでそれを利用する。 #reads; of these:これはfastQCした結果のhtmlを見るかbowtieにかける前のfastqをwc -lして4で割れば良い。 #aligned 0 times:マップされなかったリード数の表示は samtools view -cf 4 filename.bam #マップされたリード数の表示は samtools view -cF 4 filename.bam #aligned >1 times:マルチマップされたリード数の表示は grep 'XS:' ./filename.sam | wc -l #aligned exactly 1 time:ユニークにマップされたリード数の表示は マップされたリード数からマルチマップされたリード数を引くか sed '/XS:/d' Enh1.sam | wc -lとして、全リード数からマルチマップのリードをsamから取り除いた行カウントを行う。その値からsamのheaderのライン数とマップされなかったリード数を引く。ちなみに、pairをきちんと組んでいるものを抽出するには この組み合わせ
samtools view -S -f 99 -S filename.sam > ./filename.99.sam samtools view -S -f 147 -S filename.sam > ./filename.147.samこの組み合わせ
samtools view -S -f 83 -S filename.sam > ./filename.83.sam samtools view -S -f 163 -S filename.sam > ./filename.163.samhttp://ppotato.wordpress.com/2010/08/25/samtool-bitwise-flag-paired-reads/がわかりやすい。
>TruSeq_v1v2_Index12Adapter GATCGGAAGAGCACACGTCTGAACTCCAGTCACCTTGTAATCTCGTATGCCGTCTTCTGCTTG TruSeq_v1v2_UniversalAdapter AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCTというファイルを作って、以下のコマンドを叩く。
java -jar Trimmomatic-0.32/trimmomatic-0.32.jar SE \ -threads 8 -phred33 \ -trimlog ./DNseqE14.log.txt \ ./DNseqE14.fastq \ ./trimmomatic/DNseqE14.trim.fastq \ ILLUMINACLIP:../../../../../local/Trimmomatic-0.32/adapters/TruSeq4-SE.fa:2:40:15 \ LEADING:3 TRAILING:3 SLIDINGWINDOW:4:15 MINLEN:20ILLUMINACLIP自体がアダプタートリム。その他はクオリティ値でトリム。 ペアエンドの時は少し書き方が異なるがhttp://www.usadellab.org/cms/?page=trimmomaticに参考例の記載がある。
mart1 = useMart(biomart="ensembl") listDatasets(mart1)とするとリストがでてくる。
sacCer3= useMart(biomart="ensembl", datset="scerevisiae_gene_ensembl") TSS.scerevisiae.sacCer3 = getAnnotation(mart=sacCer3, featureType="TSS")として、
mart1 TSS.mouse.sacCer3 sacCer3となるので
rm('mart1') rm('sacCer3')として、TSS.mouse.sacCer3のみの状態にしてから
save(list=ls(), file = "./TSS.scerevisiae.sacCer3.rda")Rを終了させて、カレントディレクトリでlsするとTSS.scerevisiae.sacCer3.rdaがあるのでこれを
/PATH/TO/R-version/library/data/以下にコピーすれば、デフォルトに入っているマウスやヒトのデータを扱うのと同じように扱えるようになる。
vim SRA_download.shとしてファイルを作る。
#!/bin/sh # 全てのSRX Number srx_list=({263794..263817}) # 全てのSRA Accussion Number sra_list=({824704..824727}) # ダウンロードする FTP サイトの共通部分までのパス base_url=ftp://ftp-trace.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByExp/sra/SRX%2FSRX263/ for i in {0..23} do echo "wget ${base_url}/SRX${srx_list[i]}/SRR${sra_list[i]}/SRR${sra_list[i]}.sra" #sleep 10m doneと記述して上書きする(esc :wq)
./SRA_download.shとすると確認が出来るので出てきたURLからftp://以下から.sraの一つ上流までをコピーしてブラウザーで確認する。chromeでftp://ftp-trace.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByExp/sra/SRX%2FSRX263/SRX263809/SRR824719とすれば、先ほどのリンクにたどれる。
#!/bin/sh # 全てのSRX Number srx_list=({263794..263817}) # 全てのSRA Accussion Number sra_list=({824704..824727}) # ダウンロードする FTP サイトの共通部分までのパス base_url=ftp://ftp-trace.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByExp/sra/SRX%2FSRX263/ for i in {0..23} do wget ${base_url}/SRX${srx_list[i]}/SRR${sra_list[i]}/SRR${sra_list[i]}.sra sleep 10m doneとecho" "と#を取り払って、上書きする(esc :wq)
./SRA_download.shでダウンロードが始まる。
#!/bin/sh---シェルスクリプトのおまじない # 全てのSRX Number srx_list=({263794..263817})先に調べておいたSRXの番号のリスト # 全てのSRA Accussion Number sra_list=({824704..824727})先に調べておいたSRRの番号のリスト # ダウンロードする FTP サイトの共通部分までのパス base_url=ftp://ftp-trace.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByExp/sra/SRX%2FSRX263/ #全データが24個あるので24回ループさせる。(1番目は0らしい。) for i in {0..23} #なんかやらせる時-do do #URL共通部分/SRX+番号(リストのi番目)/SRA+番号(リストのi番目)/SRA+番号(リストのi番目).sraってこと ${base_url}/SRX${srx_list[i]}/SRR${sra_list[i]}/SRR${sra_list[i]}.sra #ftpって色々制限あったりするらしいのでダウンロード終わってから10分待ってから次のダウンロード始める。 sleep 10m #やらせるの終わったら-done done
cd local/work mkdir R cd R Rとすると以下のようになる。
R version 3.1.0 (2014-04-10) -- "Spring Dance" Copyright (C) 2014 The R Foundation for Statistical Computing Platform: x86_64-unknown-linux-gnu (64-bit) R は、自由なソフトウェアであり、「完全に無保証」です。 一定の条件に従えば、自由にこれを再配布することができます。 配布条件の詳細に関しては、'license()' あるいは 'licence()' と入力してください。 R は多くの貢献者による共同プロジェクトです。 詳しくは 'contributors()' と入力してください。 また、R や R のパッケージを出版物で引用する際の形式については 'citation()' と入力してください。 'demo()' と入力すればデモをみることができます。 'help()' とすればオンラインヘルプが出ます。 'help.start()' で HTML ブラウザによるヘルプがみられます。 'q()' と入力すれば R を終了します。 >となってRが使えるようになる。Rが起動している時は>が左についている状態にある。簡単なコマンドについてはググれば色々出てくる。計算や変数への代入などにある程度慣れてから、bioconductorをインストールしてみた。とりあえず書いてある通りやってみる。
>source("http://bioconductor.org/biocLite.R") URL 'http://www.bioconductor.org/packages/2.14/bioc/src/contrib/BiocInstaller_1.13.3.tar.gz' を試しています Content type 'application/x-gzip' length 14185 bytes (13 Kb) 開かれた URL ================================================== downloaded 13 Kb * installing *source* package ‘BiocInstaller’ ... ** R ** inst ** preparing package for lazy loading ** help *** installing help indices ** building package indices ** testing if installed package can be loaded Bioconductor version 2.14 (BiocInstaller 1.13.3), ?biocLite for help * DONE (BiocInstaller) The downloaded source packages are in ‘/tmp/RtmpIpHodt/downloaded_packages’ Updating HTML index of packages in '.Library' Making 'packages.html' ... done Bioconductor version 2.14 (BiocInstaller 1.13.3), ?biocLite for help >となる。数分かかる。ChIPpeakAnnoというパッケージをダウンロードする。
>biocLite("ChIPpeakAnno") BioC_mirror: http://bioconductor.org Using Bioconductor version 2.14 (BiocInstaller 1.13.3), R version 3.1.0. Installing package(s) 'ChIPpeakAnno’ 以下色々続く結構かかる5分くらい。つぎにChIPpeakAnnoを使うにはRを起動するたびに以下のコマンドを叩く必要があるらしい
>library("ChIPpeakAnno") 要求されたパッケージ biomaRt をロード中です 要求されたパッケージ IRanges をロード中です 要求されたパッケージ Biostrings をロード中です 要求されたパッケージ XVector をロード中です10秒くらいでおわる。
>SoxDay0.df <- read.table("../SoxDay0_peaks.bed", header= FALSE) > head(SoxDay0.df) V1 V2 V3 V4 V5 1 chr1 3062864 3063136 MACS_peak_1 81.45 2 chr1 3482902 3483152 MACS_peak_2 65.14 3 chr1 4150841 4151273 MACS_peak_3 222.85 4 chr1 4660129 4660269 MACS_peak_4 53.63 5 chr1 4802472 4802926 MACS_peak_5 193.69 6 chr1 4855364 4855775 MACS_peak_6 270.83 > SoxDay0.gr <- BED2RangedData(SoxDay0.df, header= FALSE)どんな中身かを少しだけ見るにはhead()とする。
>head(SoxDay0.gr) RangedData with 6 rows and 2 value columns across 23 spaces space ranges | strand score <factor> <IRanges> | <character> <numeric> MACS_peak_1 1 [3062864, 3063136] | + 81.45 MACS_peak_2 1 [3482902, 3483152] | + 65.14 MACS_peak_3 1 [4150841, 4151273] | + 222.85 MACS_peak_4 1 [4660129, 4660269] | + 53.63 MACS_peak_5 1 [4802472, 4802926] | + 193.69 MACS_peak_6 1 [4855364, 4855775] | + 270.83このフォーマットにしておくと今後色んな解析を行うのに便利らしい。ここまでのデータをセーブしておく。(save())
>save(list=ls(), file = "./bed2rangedData.rdat”)次にTSSのデータがパッケージ内に入っているのでdata()としてそれを読み込む。annotatePeakInBatchを使ってそのTSSデータと先ほど作成したRangedDataを結びつけてEnsEMBL Gene ID、遺伝子までの距離、上流・下流の情報をアノテーションする。
>data(TSS.mouse.GRCm38) >SoxDay0.anno <- annotatePeakInBatch(RangedData(SoxDay0.gr), AnnotationData = TSS.mouse.GRCm38,output="both") >head(SoxDay0.anno) RangedData with 6 rows and 9 value columns across 23 spaces space ranges | peak <factor> <IRanges> | <character> MACS_peak_1 ENSMUSG00000090025 1 [ 3062864, 3063136] | MACS_peak_1 MACS_peak_10 ENSMUSG00000033740 1 [ 6458167, 6458317] | MACS_peak_10 MACS_peak_100 ENSMUSG00000089964 1 [74824905, 74825354] | MACS_peak_100 MACS_peak_101 ENSMUSG00000082012 1 [76036406, 76036593] | MACS_peak_101 MACS_peak_106 ENSMUSG00000094946 1 [83844615, 83844958] | MACS_peak_106 MACS_peak_107 ENSMUSG00000062590 1 [86187886, 86188233] | MACS_peak_107 strand feature start_position <character> <character> <numeric> MACS_peak_1 ENSMUSG00000090025 + ENSMUSG00000090025 3054233 MACS_peak_10 ENSMUSG00000033740 + ENSMUSG00000033740 6487231 MACS_peak_100 ENSMUSG00000089964 + ENSMUSG00000089964 74850895 MACS_peak_101 ENSMUSG00000082012 + ENSMUSG00000082012 75636390 MACS_peak_106 ENSMUSG00000094946 + ENSMUSG00000094946 83795912 MACS_peak_107 ENSMUSG00000062590 + ENSMUSG00000062590 86154780 end_position insideFeature distancetoFeature <numeric> <character> <numeric> MACS_peak_1 ENSMUSG00000090025 3054733 downstream 8631 MACS_peak_10 ENSMUSG00000033740 6860940 upstream -29064 MACS_peak_100 ENSMUSG00000089964 74879953 upstream -25990 MACS_peak_101 ENSMUSG00000082012 75637179 downstream 400016 MACS_peak_106 ENSMUSG00000094946 83796032 downstream 48703 MACS_peak_107 ENSMUSG00000062590 86278284 inside 33106 shortestDistance fromOverlappingOrNearest <numeric> <character> MACS_peak_1 ENSMUSG00000090025 8131 NearestStart MACS_peak_10 ENSMUSG00000033740 28914 NearestStart MACS_peak_100 ENSMUSG00000089964 25541 NearestStart MACS_peak_101 ENSMUSG00000082012 399227 NearestStart MACS_peak_106 ENSMUSG00000094946 48583 NearestStart MACS_peak_107 ENSMUSG00000062590 33106 NearestStart上流や下流の情報でまとめたテーブルを作ってみる。
>SoxDay0.anno.table <- table(as.data.frame(SoxDay0.anno)$insideFeature) >head(SoxDay0.anno.table) downstream includeFeature inside overlapEnd overlapStart 1197 1 1228 14 14 upstream 1209これを画像として出力させるには以下のようにする。
>png("SoxDay0.anno.barplot.png") >barplot(SoxDay0.anno.table) >dev.off()ちょっと待つ
null device 1とでる。local/work/R内にSoxDay0.anno.barplot.pngが出来てる これをscpでPCに転送
scp kosugi@サーバー名:/home/kosugi/local/work/R/SoxDay0.anno.barplot.png /Users/TK/Analysis/ChIPpeakAnno/などとすれば見れる。こんな感じ。
fastqc -t 8 Sox2_ChIP-seq_Oct3_4_KODay0.fastq -o ./しばらく待つと、Sox2_ChIP-seq_Oct3_4_KODay0.fastqcというディレクトリとそのzipファイルが出来る。それをディレクトリごとローカルに転送する。ローカル側から
scp -r kosugi@サーバーアカウント:/home/kosugi/local/work/Sox2_ChIP-seq_Oct3_4_KODay0.fastqc.zip /Users/TK/fastqc/すると指定した場所にディレクトリごと転送される。その中にfastqc_report.htmlがあるのでブラウザーにドラッグアンドドロップする。
fastq_quality_trimmer -t 20 -l 30 -Q 33 -i Sox2_ChIP-seq_Oct3_4_KODay0.fastq | fastq_quality_filter -q 20 -p 80 -Q 33 -o ./Sox2_ChIP-seq_Oct3_4_KODay0.clean.fastqこのfastqファイルを先ほどと同様にfastqcしてfastqc_report.htmlをみる。
wc -l Sox2_ChIP-seq_Oct3_4_KODay0.fastq 62931980 Sox2_ChIP-seq_Oct3_4_KODay0.fastq wc -l Sox2_ChIP-seq_Oct3_4_KODay0.clean.fastq 59910120 Sox2_ChIP-seq_Oct3_4_KODay0.clean.fastqfastqは4行で1readなので大体0.8M read程除去されたことがわかる。
bowtie2 -t -p 8 -x ../bowtie2-2.2.1/indexes/mm10 -U Sox2_ChIP-seq_Oct3_4_KODay0.clean.fastq -S SoxDay0.sam
samtools view -Sb SoxDay0.sam > SoxDay0.bam[samopen] SAM header is present: 66 sequences.等と出て、数分待つ。 オプションの意味は
samtools sort SoxDay0.bam SoxDay0.sortedすると、SoxDay0.sorted.bamというのがつくられる。次にindexを作る。
samtools index SoxDay0.sorted.bam数分待つとSoxDay0.sorted.bam.baiファイルが出来る。今回はigvでマップされたものを確認しない。次にマップ率を出す。flagstatを使う。
samtools flagstat SoxDay0.sorted.bam > SoxDay0.sorted.bam.summary.txt less SoxDay0.sorted.bam.summary.txt 14977530 + 0 in total (QC-passed reads + QC-failed reads) 0 + 0 duplicates 14529891 + 0 mapped (97.01%:-nan%) 0 + 0 paired in sequencing 0 + 0 read1 0 + 0 read2 0 + 0 properly paired (-nan%:-nan%) 0 + 0 with itself and mate mapped 0 + 0 singletons (-nan%:-nan%) 0 + 0 with mate mapped to a different chr 0 + 0 with mate mapped to a different chr (mapQ>=5)
scp /Users/TK/Downloads/repeats_mm10.bed kosugi@サーバー名:/home/kosugi/local/share以下がrepeat regionを除去するコマンド。
intersectBed -abam SoxDay0.sorted.bam -b ../share/repeats_mm10.bed -v > SoxDay0.rmRepeat.bamこれで除去できた。 6のMACSによるピークコール コントロールのサンプルについても同様の作業を行って、bamファイルが2つある状況にする。準備ができたら以下のコマンドを叩く。数分待つ。
macs14 -t SoxDay0.sorted.bam -c SoxKODay2.sorted.bam -f bam -g mm -n SoxDay0オプションの意味は -t:sampleファイル -c:controlファイル -f:ファイル形式 -g:ゲノムサイズ -n:出力名 終わると、色んなファイルが出力される。
head SoxDay0_peaks.bed chr1 3062864 3063136 MACS_peak_1 81.45 chr1 3482902 3483152 MACS_peak_2 65.14 chr1 4150841 4151273 MACS_peak_3 222.85 chr1 4660129 4660269 MACS_peak_4 53.63 chr1 4802472 4802926 MACS_peak_5 193.69 chr1 4855364 4855775 MACS_peak_6 270.83 chr1 4972272 4972486 MACS_peak_7 71.27 chr1 4972497 4972701 MACS_peak_8 84.01 chr1 6448821 6449289 MACS_peak_9 126.84 chr1 6458167 6458317 MACS_peak_10 62.50以下のように、ローカル側からxlsファイルを転送すればエクセルで見られる。3000ヶ所くらいピークが見つかった。
scp kosugi@サーバー名:/home/kosugi/local/work/SoxDay0_peaks.xls /Users/TK/MACS/wiggleファイルが欲しい場合はMACSを実行する時に -wとオプションをつける。(結構時間がかかる数十分)
cd src/ wget "http://cran.ism.ac.jp/src/base/R-3/R-3.1.0.tar.gz"次に解凍。.tar.gzなのでtar zxvfで解凍。-Cで解凍先にlocalを指定する。
tar zxvf R-3.1.0.tar.gz -C ../local/localのR-3.1.0に移動してREADMEやINSTALL、doc/manual/R-admin.texiをみてもなんかいまいちわからない。なのでここを参照する。
./configure --prefix=/home/kosugi/local --with-x=nomakeする。
makemakeに結構時間かかる。5分くらい。そのご以下のコマンドを叩く。
make check make installこれが終わると、R-3.1.0/bin以下に様々なプログラムがある事がわかる。 なのでパスを通す。
export PATH=/home/kosugi/local/R-3.1.0/bin/:$PATHR -hと叩くと
R -h Usage: R [options] [< infile] [> outfile] or: R CMD command [arguments] Start R, a system for statistical computation and graphics, with the specified options, or invoke an R tool via the 'R CMD' interface. Options: 以下オプションの説明となったので問題なく使えそう。vimで.bashrcにパスを記述しておく。ファイルが開いたらiを押すと書き込める。以下を一番下に追記する。追記したらescキーを押して:wq
vim ~/.bashrc ##R export PATH=/home/kosugi/local/R-3.1.0/bin/:$PATH再ログインして
echo $PATH /home/kosugi/local/R-3.1.0/bin/:~その他のパスとなる。R -hとコマンドを叩くと先ほどと同様にusageがでるのでこれでRが使えるようになったぽい。他のツールと同様でprefixでどうにかなるが、画面無しのオプション--with-x=noこれをつける事がエラーを出さないポイントか・・・。 ただ全然使い方わからない。統合TVで検索したらR+Bioconductorを使ったNGS解析1やR+Bioconductorを使ったNGS解析2というものが動画でUPされていてここで紹介されている二階堂さんのLearning Rのページが非常に参考になる。まずはこれを参考にしてRというツールを使う事に慣れて、ChIP-seqのピーク検出後の高次解析を行えるようにする。
cd src/ wget "https://github.com/arq5x/bedtools2/releases/download/v2.19.1/bedtools-2.19.1.tar.gz"localに解凍する。.tar.gzなのでtar zxvfで解凍。-Cで解凍先を指定する。
tar zxvf bedtools-2.19.1.tar.gz -C ../local/
make clean make allとすればよいらしい
make clean * Cleaning-up BamTools API * Cleaning up.となって
make all Building BEDTools: ========================================================= DETECTED_VERSION = v2.19.1 CURRENT_VERSION = v2.19.0-15-g733c84b Updating version file. * Creating BamTools API ...以下100行ぐらいコンパイルが続くこれが終わると、bedtools-2.19.1/bin以下に様々なプログラムがある事がわかる。 なのでパスを通す。
export PATH=/home/kosugi/local/bedtools2-2.19.1/bin/:$PATHintersectBedと叩くと
intersectBed Tool: bedtools intersect (aka intersectBed) Version: v2.19.1 Summary: Report overlaps between two feature files. Usage: bedtools intersect [OPTIONS] -aとなったので問題なく使えそう。vimで.bashrcにパスを記述しておく。ファイルが開いたらiを押すと書き込める。以下を一番下に追記する。追記したらescキーを押して:wq-b 以下オプションの説明
vim ~/.bashrc ##bedtools export PATH=/home/kosugi/local/bedtools2-2.19.1/bin/:$PATH再ログインして
echo $PATH /home/kosugi/local/bedtools2-2.19.1/bin/:~その他のパスとなっているので問題なくつかえそうだ。
cd src/ wget "https://github.com/agordon/fastx_toolkit/releases/download/0.0.14/fastx_toolkit-0.0.14.tar.bz2"localに解凍する。
tar zxvf libgtextutils-0.7.tar.gz -C ../local/ディレクトリを移動して、INSTALLファイルを見るとIt is recommended to use the following options: ./configure --prefix=/boot/common といった記述が有るので、./configureとコンパイル、インストールをする。
./configure --prefix=/home/kosugi/local/ make make installとすると/local/lib以下にlibgtextutils-0.7関連のファイルの存在が確認できる。これでいいのだろうか・・・ とりあえず、本題の最新のfastx_toolkit-0.0.14.tar.bz2をダウンロードして、localに解凍する。
wget "https://github.com/agordon/fastx_toolkit/releases/download/0.0.14/fastx_toolkit-0.0.14.tar.bz2" tar jxvf fastx_toolkit-0.0.14.tar.bz2 -C ../local/localにできたディレクトリに移動して./configureとコンパイル、インストールをする。
./configure --prefix=/home/kosugi/local/とすると
checking for GTEXTUTILS... configure: error: Package requirements (gtextutils) were not met: No package 'gtextutils' found Consider adjusting the PKG_CONFIG_PATH environment variable if you installed software in a non-standard prefix. Alternatively, you may set the environment variables GTEXTUTILS_CFLAGS and GTEXTUTILS_LIBS to avoid the need to call pkg-config. See the pkg-config man page for more details.と怒られる。どうやらさきほど出来た/home/kosugi/local/lib/にpkgconfigディレクトリがあるのでそれにPKG_CONFIG_PATHのパスを通せという事のようだ。 vimで.bashrcに記述。ファイルが開いたらiを押すと書き込める。以下を一番下に追記する。追記したらescキーを押して:wq
vim ~/.bashrc export PKG_CONFIG_PATH=/home/kosugi/local/lib/pkgconfig/:$PKG_CONFIG_PATH一度ターミナルを切って再接続して確認する。
echo $PKG_CONFIG_PATH /home/kosugi/local/lib/pkgconfig/:多分これでよいはず。fastx_toolkit-0.0.14ディレクトリにもどって
./configure --prefix=/home/kosugi/local/ make make installとすると、local/bin以下にたくさんのツールが有る事が確認できる。すでに、/home/kosugi/local/binにはパスが通っているので、たとえばホームディレクトリで
fastq_quality_trimmer -h usage: fastq_quality_trimmer [-h] [-v] [-t N] [-l N] [-z] [-i INFILE] [-o OUTFILE] Part of FASTX Toolkit 0.0.14 by A. Gordon (assafgordon@gmail.com) 以下オプションの説明無事インストールがすんだ。./configure時に特にprefixする必要が無い状況であれば大して困らないと思うがroot権限が無いような状況でもなんとかインストールできる事がわかった。
lftp ftp://ftp.ddbj.nig.ac.jp/ddbj_database/dra/fastq/SRA035/SRA035367/SRX057755とすると
cd 成功、cwd=/ddbj_database/dra/fastq/SRA035/SRA035367/SRX057755 lftp ftp.ddbj.nig.ac.jp:/ddbj_database/dra/fastq/SRA035/SRA035367/SRX057755>となるのでlsで中身を確認する。
lftp ftp.ddbj.nig.ac.jp:/ddbj_database/dra/fastq/SRA035/SRA035367/SRX057755>ls -rw-r--r-- 1 51005 51005 723342854 Nov 1 05:09 SRR185892.fastq.bz2fastqファイルが見つかったのでこれを転送する。
lftp ftp.ddbj.nig.ac.jp:/ddbj_database/dra/fastq/SRA035/SRA035367/SRX057755>get SRR185892.fastq.bz2とすると転送が始まる。wgetでは無い事に注意。転送がおわったらexitすればftpから戻って来れる。 あとは解凍するだけ。~/local/shareというディレクトリを作成してここに解凍する事にする。だけど、bunzip2で解凍先を指定する方法がわからなかったので、とりあえずsrcで解凍ほんで~/local/shareにコピーしてSox2_ChIP-seq_Oct3_4_KODay0.fastqにリネーム
cd src/ bunzip2 -d SRR185892.fastq.bz2 cp ../local/share cd ../local/share/ mv SRR185892.fastq Sox2_ChIP-seq_Oct3_4_KODay0.fastq ls Sox2_ChIP-seq_Oct3_4_KODay0.fastq同様のステップをSox2 ChIP-seq, Sox2KO Day2のデータも行った。 これでfastqcにかけられるところまできた。
cd src/ wget "http://ftp-trace.ncbi.nlm.nih.gov/sra/sdk/2.3.5/sratoolkit.2.3.5-centos_linux64.tar.gz" --2014-04-06 17:13:46-- http://ftp-trace.ncbi.nlm.nih.gov/sra/sdk/2.3.5/sratoolkit.2.3.5-centos_linux64.tar.gz ftp-trace.ncbi.nlm.nih.gov をDNSに問いあわせています... 130.14.250.13, 2607:f220:41e:250::12 ftp-trace.ncbi.nlm.nih.gov|130.14.250.13|:80 に接続しています... 接続しました。 HTTP による接続要求を送信しました、応答を待っています... 200 OK 長さ: 64933999 (62M) [application/x-gzip] `sratoolkit.2.3.5-centos_linux64.tar.gz' に保存中 100%[=================================================>] 64,933,999 3.74M/s 時間 17s 2014-04-06 17:14:06 (3.56 MB/s) - `sratoolkit.2.3.5-centos_linux64.tar.gz' へ保存完了 [64933999/64933999]次に解凍 .tar.gzなのでtar zxvfで解凍。-Cで解凍先を指定する。
tar zxvf sratoolkit.2.3.5-centos_linux64.tar.gz -C ../local/解凍されたsratoolkit.2.3.5-centos_linux64ディレクトリのbin以下に実行ファイルが入っている。その中のfastq-dumpが目的の実行ファイル。あとは/home/kosugi/local/sratoolkit.2.3.5-centos_linux64/binにパスを通す。
export PATH=/home/kosugi/local/sratoolkit.2.3.5-centos_linux64/bin/:$PATHほんで、home ディレクトリに戻ってfastq-dumpでうまくいくか確認
fastq-dump Usage: fastq-dump [options]あとは同じ事を./bashrcに記述して再ログインしてもホームディレクトリで実行できるか確認する。[ ...] fastq-dump [options] Use option --help for more information fastq-dump : 2.3.5
vim .bashrcファイルが開いたらiを押すと書き込める。以下を一番下に追記する。追記したらescキーを押して:wq
## sratoolkit export PATH=/home/kosugi/local/sratoolkit.2.3.5-centos_linux64/bin/:$PATH :$PATHを後ろに持ってくると今まで書かれたパスの前に記述という事らしい。念のため再ログインしてwhichでどのパスでプログラムが実行されている確認する。
which fastq-dump ~/local/sratoolkit.2.3.5-centos_linux64/bin/fastq-dumpこれでSRAからダウンロードしたファイルをfastqファイルに変換できる。
cd src/ wget "https://github.com/downloads/taoliu/MACS/MACS-1.4.2-1.tar.gz" --2014-04-06 13:55:08-- https://github.com/downloads/taoliu/MACS/MACS-1.4.2-1.tar.gz github.com をDNSに問いあわせています... 192.30.252.128 github.com|192.30.252.128|:443 に接続しています... 接続しました。 HTTP による接続要求を送信しました、応答を待っています... 302 Found 場所: http://cloud.github.com/downloads/taoliu/MACS/MACS-1.4.2-1.tar.gz [続く] --2014-04-06 13:55:09-- http://cloud.github.com/downloads/taoliu/MACS/MACS-1.4.2-1.tar.gz cloud.github.com をDNSに問いあわせています... 54.230.27.179, 205.251.209.90, 205.251.209.218, ... cloud.github.com|54.230.27.179|:80 に接続しています... 接続しました。 HTTP による接続要求を送信しました、応答を待っています... 200 OK 長さ: 66569 (65K) [application/gzip] `MACS-1.4.2-1.tar.gz' に保存中 100%[======================================>] 66,569 66.4K/s 時間 1.0s 2014-04-06 13:55:11 (66.4 KB/s) - `MACS-1.4.2-1.tar.gz' へ保存完了 [66569/66569]次に解凍 .tar.gzなのでtar jxvfで解凍。-Cで解凍先を指定する。
tar zxvf MACS-1.4.2-1.tar.gz -C ../local/解凍されたMACS-1.4.2-1ディレクトリに移動して、INSTALLファイルをみる
cd ../local/MACS-1.4.2-1 less INSTALL * Prerequisite Python version must be equal to 2.6 or 2.7 to run MACS. We recommend using the version 2.6.5. * Install under Debian or Ubuntu Linux system The most convenient way to install MACS is through Debian APT system, so that it can be perfectly integrated in the Python environment of your operation system. You can easily manage the package, and the uninstall is much easier. Download the deb package from MACS download page, and type this in the commend line: $ dpkg -i macs_1.4.0.deb To uninstall, type: $ dpkg -r macs_1.4.0 MACS uses Python's distutils tools for source installations. To install a source distribution of MACS, unpack the distribution tarball and open up a command terminal. Go to the directory where you unpacked MACS, and simply run the install script : $ python setup.py install By default, the script will install python library and executable codes globally, which means you need to be root or administrator of the machine so as to complete the installation. Please contact the administrator of that machine if you want their help. If you need to provide a nonstandard install prefix, or any other nonstandard options, you can provide many command line options to the install script. Use the –help option to see a brief list of available options: $ python setup.py --help For example, if I want to install everything under my own HOME directory, use this command: $ python setup.py install --prefix /home/taoliu/ようするにpython2.6か2.7が必要。Debian or Ubuntu Linux systemではdpkgというコマンドが使えるようだが、今の環境はCentOSなのでpython setup.py installを使う。prefixを使えば指定先にインストールできる。という事らしい。
python --version Python 2.7.3となったので問題ないかな。
python setup.py install --prefix /home/kosugi/localと叩くと以下のようになり、Python2.7を使っているという事がわかる。
/usr/local/Python-2.7.3/lib/python2.7/distutils/dist.py:267: UserWarning: Unknown distribution option: 'console' warnings.warn(msg) /usr/local/Python-2.7.3/lib/python2.7/distutils/dist.py:267: UserWarning: Unknown distribution option: 'app' warnings.warn(msg) running install running build running build_py creating build creating build/lib creating build/lib/MACS14 copying lib/__init__.py -> build/lib/MACS14 copying lib/Constants.py -> build/lib/MACS14 copying lib/OptValidator.py -> build/lib/MACS14 copying lib/OutputWriter.py -> build/lib/MACS14 copying lib/PeakDetect.py -> build/lib/MACS14 copying lib/PeakModel.py -> build/lib/MACS14 copying lib/Prob.py -> build/lib/MACS14 creating build/lib/MACS14/IO copying lib/IO/__init__.py -> build/lib/MACS14/IO copying lib/IO/bedGraphIO.py -> build/lib/MACS14/IO copying lib/IO/BinKeeper.py -> build/lib/MACS14/IO copying lib/IO/FeatIO.py -> build/lib/MACS14/IO copying lib/IO/Parser.py -> build/lib/MACS14/IO copying lib/IO/WiggleIO.py -> build/lib/MACS14/IO running build_scripts creating build/scripts-2.7 copying and adjusting bin/macs14 -> build/scripts-2.7 copying and adjusting bin/elandmulti2bed -> build/scripts-2.7 copying and adjusting bin/elandresult2bed -> build/scripts-2.7 copying and adjusting bin/elandexport2bed -> build/scripts-2.7 copying and adjusting bin/sam2bed -> build/scripts-2.7 copying and adjusting bin/wignorm -> build/scripts-2.7 changing mode of build/scripts-2.7/macs14 from 644 to 755 changing mode of build/scripts-2.7/elandmulti2bed from 644 to 755 changing mode of build/scripts-2.7/elandresult2bed from 644 to 755 changing mode of build/scripts-2.7/elandexport2bed from 644 to 755 changing mode of build/scripts-2.7/sam2bed from 644 to 755 changing mode of build/scripts-2.7/wignorm from 644 to 755 running install_lib creating /home/kosugi/local/lib creating /home/kosugi/local/lib/python2.7 creating /home/kosugi/local/lib/python2.7/site-packages creating /home/kosugi/local/lib/python2.7/site-packages/MACS14 copying build/lib/MACS14/__init__.py -> /home/kosugi/local/lib/python2.7/site-packages/MACS14 copying build/lib/MACS14/Constants.py -> /home/kosugi/local/lib/python2.7/site-packages/MACS14 copying build/lib/MACS14/OptValidator.py -> /home/kosugi/local/lib/python2.7/site-packages/MACS14 copying build/lib/MACS14/OutputWriter.py -> /home/kosugi/local/lib/python2.7/site-packages/MACS14 copying build/lib/MACS14/PeakDetect.py -> /home/kosugi/local/lib/python2.7/site-packages/MACS14 copying build/lib/MACS14/PeakModel.py -> /home/kosugi/local/lib/python2.7/site-packages/MACS14 copying build/lib/MACS14/Prob.py -> /home/kosugi/local/lib/python2.7/site-packages/MACS14 creating /home/kosugi/local/lib/python2.7/site-packages/MACS14/IO copying build/lib/MACS14/IO/__init__.py -> /home/kosugi/local/lib/python2.7/site-packages/MACS14/IO copying build/lib/MACS14/IO/bedGraphIO.py -> /home/kosugi/local/lib/python2.7/site-packages/MACS14/IO copying build/lib/MACS14/IO/BinKeeper.py -> /home/kosugi/local/lib/python2.7/site-packages/MACS14/IO copying build/lib/MACS14/IO/FeatIO.py -> /home/kosugi/local/lib/python2.7/site-packages/MACS14/IO copying build/lib/MACS14/IO/Parser.py -> /home/kosugi/local/lib/python2.7/site-packages/MACS14/IO copying build/lib/MACS14/IO/WiggleIO.py -> /home/kosugi/local/lib/python2.7/site-packages/MACS14/IO byte-compiling /home/kosugi/local/lib/python2.7/site-packages/MACS14/__init__.py to __init__.pyc byte-compiling /home/kosugi/local/lib/python2.7/site-packages/MACS14/Constants.py to Constants.pyc byte-compiling /home/kosugi/local/lib/python2.7/site-packages/MACS14/OptValidator.py to OptValidator.pyc byte-compiling /home/kosugi/local/lib/python2.7/site-packages/MACS14/OutputWriter.py to OutputWriter.pyc byte-compiling /home/kosugi/local/lib/python2.7/site-packages/MACS14/PeakDetect.py to PeakDetect.pyc byte-compiling /home/kosugi/local/lib/python2.7/site-packages/MACS14/PeakModel.py to PeakModel.pyc byte-compiling /home/kosugi/local/lib/python2.7/site-packages/MACS14/Prob.py to Prob.pyc byte-compiling /home/kosugi/local/lib/python2.7/site-packages/MACS14/IO/__init__.py to __init__.pyc byte-compiling /home/kosugi/local/lib/python2.7/site-packages/MACS14/IO/bedGraphIO.py to bedGraphIO.pyc byte-compiling /home/kosugi/local/lib/python2.7/site-packages/MACS14/IO/BinKeeper.py to BinKeeper.pyc byte-compiling /home/kosugi/local/lib/python2.7/site-packages/MACS14/IO/FeatIO.py to FeatIO.pyc byte-compiling /home/kosugi/local/lib/python2.7/site-packages/MACS14/IO/Parser.py to Parser.pyc byte-compiling /home/kosugi/local/lib/python2.7/site-packages/MACS14/IO/WiggleIO.py to WiggleIO.pyc running install_scripts copying build/scripts-2.7/macs14 -> /home/kosugi/local/bin copying build/scripts-2.7/elandmulti2bed -> /home/kosugi/local/bin copying build/scripts-2.7/elandresult2bed -> /home/kosugi/local/bin copying build/scripts-2.7/elandexport2bed -> /home/kosugi/local/bin copying build/scripts-2.7/sam2bed -> /home/kosugi/local/bin copying build/scripts-2.7/wignorm -> /home/kosugi/local/bin changing mode of /home/kosugi/local/bin/macs14 to 755 changing mode of /home/kosugi/local/bin/elandmulti2bed to 755 changing mode of /home/kosugi/local/bin/elandresult2bed to 755 changing mode of /home/kosugi/local/bin/elandexport2bed to 755 changing mode of /home/kosugi/local/bin/sam2bed to 755 changing mode of /home/kosugi/local/bin/wignorm to 755 running install_egg_info Writing /home/kosugi/local/lib/python2.7/site-packages/MACS-1.4.2-py2.7.egg-info今回は、/home/kosugi/local/binにemacs14という実行ファイルとその他の実行ファイルが作られている。
elandexport2bed elandmulti2bed elandresult2bed macs14 sam2bed wignormINSTALLファイルにはOn Linux, using bash, I include the new value in my PYTHONPATH by adding this line to my ~/.bashrc となっているので
export PYTHONPATH=/home/kosugi/local/lib/python2.7/site-packages:$PYTHONPATHと記述し再ログインして、macs14とコマンドを叩くと
Usage: macs14 <-t data-blogger-escaped-tfile=""> [-n name] [-g genomesize] [options] Example: macs14 -t ChIP.bam -c Control.bam -f BAM -g h -n test -w --call-subpeaks macs14 -- Model-based Analysis for ChIP-Sequencing Options: 以下オプションの説明となったのでインストール出来た。ヽ(゚∀゚)メ(゚∀゚)メ(゚∀゚)ノ 今回は、インストール先を自分の好きな場所にする事が出来た。--prefix 指定先とすると自動的にbinとlibというディレクトリが作られるようだ。 前もってbinを作ってPATHも通しておいた(ディレクトリの作成)ので、順調に進んだかな。ちゃんとreadmeやinstallといったファイルを見ながら確認してやれば結構敷居低いと感じた。これでChIP-seqの解析できるかな
cd src/ wget "http://sourceforge.net/projects/samtools/files/samtools/0.1.19/samtools-0.1.19.tar.bz2" --2014-04-05 17:03:23-- http://sourceforge.net/projects/samtools/files/samtools/0.1.19/samtools-0.1.19.tar.bz2 sourceforge.net をDNSに問いあわせています... 216.34.181.60 sourceforge.net|216.34.181.60|:80 に接続しています... 接続しました。 HTTP による接続要求を送信しました、応答を待っています... 302 Found 場所: http://sourceforge.net/projects/samtools/files/samtools/0.1.19/samtools-0.1.19.tar.bz2/download [続く] --2014-04-05 17:03:24-- http://sourceforge.net/projects/samtools/files/samtools/0.1.19/samtools-0.1.19.tar.bz2/download sourceforge.net|216.34.181.60|:80 に接続しています... 接続しました。 HTTP による接続要求を送信しました、応答を待っています... 302 Found 場所: http://downloads.sourceforge.net/project/samtools/samtools/0.1.19/samtools-0.1.19.tar.bz2?r=&ts=1396685026&use_mirror=cznic [続く] --2014-04-05 17:03:24-- http://downloads.sourceforge.net/project/samtools/samtools/0.1.19/samtools-0.1.19.tar.bz2?r=&ts=1396685026&use_mirror=cznic downloads.sourceforge.net をDNSに問いあわせています... 216.34.181.59 downloads.sourceforge.net|216.34.181.59|:80 に接続しています... 接続しました。 HTTP による接続要求を送信しました、応答を待っています... 302 Found 場所: http://cznic.dl.sourceforge.net/project/samtools/samtools/0.1.19/samtools-0.1.19.tar.bz2 [続く] --2014-04-05 17:03:25-- http://cznic.dl.sourceforge.net/project/samtools/samtools/0.1.19/samtools-0.1.19.tar.bz2 cznic.dl.sourceforge.net をDNSに問いあわせています... 217.31.202.30, 2001:1488:ffff::30 cznic.dl.sourceforge.net|217.31.202.30|:80 に接続しています... 接続しました。 HTTP による接続要求を送信しました、応答を待っています... 200 OK 長さ: 514507 (502K) [application/octet-stream] `samtools-0.1.19.tar.bz2' に保存中 100%[======================================>] 514,507 108K/s 時間 4.6s 2014-04-05 17:03:30 (108 KB/s) - `samtools-0.1.19.tar.bz2' へ保存完了 [514507/514507]次に解凍 .tar.bz2なのでtar jxvfで解凍。-Cで解凍先を指定する。
tar jxvf samtools-0.1.19.tar.bz2 -C ../local解凍されたsamtools-0.1.19ディレクトリに移動。
cd ../local/samtools-0.1.19lsで確認するといろんな種類のファイルが入っている。INSTALLファイルを見るとSAMtools depends on the zlib library
rpm -qa | grep libRPMのパッケージについてインストールされているものを確認できるらしい・・・| grep libはその中でlibを含んでいるものを抽出という意味。
jzlib-1.0.7-7.5.el6.x86_64 zlib-devel-1.2.3-29.el6.x86_64 jzlib-javadoc-1.0.7-7.5.el6.x86_64 zlib-1.2.3-29.el6.x86_64 jzlib-demo-1.0.7-7.5.el6.x86_64 zlib-static-1.2.3-29.el6.x86_64 zlib-1.2.3-29.el6.i686となるので要求のものはインストールされている模様。とりあえずINSTALLをみるとmakeってコマンド打てばいいみたい。
makelsでみると、さらにファイルが増えていて、samtoolsという実行権限がついたファイルを確認できる。samtoolsは-hとしても意味わからんと怒られるので 単純にsamtoolsと叩く
samtools Program: samtools (Tools for alignments in the SAM format) Version: 0.1.19-44428cd Usage: samtools後はパスを指定する。[options] 以下オプションの説明
export PATH=/home/kosugi/local/samtools-0.1.19/:$PATHとしてディレクトリ移動してもコマンドが動く事を確認できた。 あとは.bashrcに記述。
vim .bashrcファイルが開いたらiを押すと書き込める。以下を一番下に追記する。追記したらescキーを押して:wq
##Samtools export PATH=/home/kosugi/local/samtools-0.1.19/:$PATH :$PATHを後ろに持ってくると今まで書かれたパスの前に記述という事らしい。念のため再ログインしてwhichでどのパスでプログラムが実行されている確認する。
which samtools ~/local/samtools-0.1.19/samtoolsコンパイルが必要なパターンで初めてのmake・・・エラー起きなくてよかった。
cd ../local/bowtie2-2.2.1 mkdir indexes早速ダウンロード H. sapiens, UCSC hg19をクリックするとPCにダウンロードされるので、ターミナルにリンク先をコピペする。ターミナルへのリンクのコピペはリンクをドラッグアンドドロップすればできる。
cd src/ wget "ftp://ftp.ccb.jhu.edu/pub/data/bowtie2_indexes/hg19.zip"次に解凍。zipなのでunzipを使う。 localに解凍する -dで解凍先に../local/bowtie2-2.2.1を指定
unzip hg19.zip -d ../local/bowtie2-2.2.1/indexes/mm10も同様に行う。
wget "ftp://ftp.ccb.jhu.edu/pub/data/bowtie2_indexes/mm10.zip"次に解凍。zipなのでunzipを使う。 localに解凍する -dで解凍先に../local/bowtie2-2.2.1を指定
unzip mm10.zip -d ../local/bowtie2-2.2.1/indexes/一応indexesディレクトリがどうなったか確認すると以下のようになっている。
ls -1 ../local/bowtie2-2.2.1/indexes/ hg19.1.bt2 hg19.2.bt2 hg19.3.bt2 hg19.4.bt2 hg19.rev.1.bt2 hg19.rev.2.bt2 make_hg19.sh make_mm10.sh mm10.1.bt2 mm10.2.bt2 mm10.3.bt2 mm10.4.bt2 mm10.rev.1.bt2 mm10.rev.2.bt2一つのゲノムファイルに付き6つの.bt2ファイルがある。.shファイルは何に使うか不明。ひとまずこれでOK。fasta形式のゲノムファイルのみが手元に有る場合は、bowtie2のbowtie-buildというコマンドでindexを作る事ができるらしい。そういう機会がでてきたらusageで使い方を確認して行ってみる
cd src/ wget "http://sourceforge.net/projects/bowtie-bio/files/bowtie2/2.2.1/bowtie2-2.2.1-linux-x86_64.zip" --2014-04-04 11:36:17-- http://sourceforge.net/projects/bowtie-bio/files/bowtie2/2.2.1/bowtie2-2.2.1-linux-x86_64.zip sourceforge.net をDNSに問いあわせています... 216.34.181.60 sourceforge.net|216.34.181.60|:80 に接続しています... 接続しました。 HTTP による接続要求を送信しました、応答を待っています... 302 Found 場所: http://sourceforge.net/projects/bowtie-bio/files/bowtie2/2.2.1/bowtie2-2.2.1-linux-x86_64.zip/download [続く] --2014-04-04 11:36:17-- http://sourceforge.net/projects/bowtie-bio/files/bowtie2/2.2.1/bowtie2-2.2.1-linux-x86_64.zip/download sourceforge.net|216.34.181.60|:80 に接続しています... 接続しました。 HTTP による接続要求を送信しました、応答を待っています... 302 Found 場所: http://downloads.sourceforge.net/project/bowtie-bio/bowtie2/2.2.1/bowtie2-2.2.1-linux-x86_64.zip?r=&ts=1396579000&use_mirror=jaist [続く] --2014-04-04 11:36:18-- http://downloads.sourceforge.net/project/bowtie-bio/bowtie2/2.2.1/bowtie2-2.2.1-linux-x86_64.zip?r=&ts=1396579000&use_mirror=jaist downloads.sourceforge.net をDNSに問いあわせています... 216.34.181.59 downloads.sourceforge.net|216.34.181.59|:80 に接続しています... 接続しました。 HTTP による接続要求を送信しました、応答を待っています... 302 Found 場所: http://jaist.dl.sourceforge.net/project/bowtie-bio/bowtie2/2.2.1/bowtie2-2.2.1-linux-x86_64.zip [続く] --2014-04-04 11:36:18-- http://jaist.dl.sourceforge.net/project/bowtie-bio/bowtie2/2.2.1/bowtie2-2.2.1-linux-x86_64.zip jaist.dl.sourceforge.net をDNSに問いあわせています... 150.65.7.130, 2001:df0:2ed:feed::feed jaist.dl.sourceforge.net|150.65.7.130|:80 に接続しています... 接続しました。 HTTP による接続要求を送信しました、応答を待っています... 200 OK 長さ: 26374304 (25M) [application/octet-stream] `bowtie2-2.2.1-linux-x86_64.zip' に保存中 100%[======================================>] 26,374,304 2.43M/s 時間 10s 2014-04-04 11:36:29 (2.41 MB/s) - `bowtie2-2.2.1-linux-x86_64.zip' へ保存完了 [26374304/26374304]次に解凍。zipなのでunzipを使う。 localに解凍する -dで解凍先を指定 ちなみにコマンドやファイル名はtabキーで補完されるので使うと便利
unzip bowtie2-2.2.1-linux-x86_64.zip -d ../local/解凍すると、bowtie2-2.2.1ディレクトリができる。先ほどのHPのPATHのところにBy adding your new Bowtie 2 directory to your PATH environment variable, you ensure that whenever you run bowtie2, bowtie2-build or bowtie2-inspect from the command line, you will get the version you just installed without having to specify the entire path. This is recommended for most users. To do this, follow your operating system's instructions for adding the directory to your PATH.と記述されているので適当にパスを通す。
export PATH=/home/kosugi/local/bowtie2-2.2.1:$PATHほんで、home ディレクトリに戻ってbowtie2 -hでusageがでるか確認
bowtie2 -h Bowtie 2 version 2.2.1 by Ben Langmead (langmea@cs.jhu.edu, www.cs.jhu.edu/~langmea) 以下Usage動いた!これで場所を選ばず実行できる。
vim .bashrcファイルが開いたらiを押すと書き込める。以下を一番下に追記する。追記したらescキーを押して:wq
## bowtie2 export PATH=/home/kosugi/local/bowtie2-2.2.1:$PATH :$PATHを後ろに持ってくると今まで書かれたパスの前に記述という事らしい。念のため再ログインしてwhichでどのパスでプログラムが実行されている確認する。
which bowtie2 ~/local/bowtie2-2.2.1/bowtie2順調順調^^
cd src/ wget "http://www.bioinformatics.babraham.ac.uk/projects/fastqc/fastqc_v0.10.1.zip" --2014-04-03 23:36:07-- http://www.bioinformatics.babraham.ac.uk/projects/fastqc/fastqc_v0.10.1.zip www.bioinformatics.babraham.ac.uk をDNSに問いあわせています... 149.155.132.143 www.bioinformatics.babraham.ac.uk|149.155.132.143|:80 に接続しています... 接続しました。 HTTP による接続要求を送信しました、応答を待っています... 200 OK 長さ: 596632 (583K) [application/zip] `fastqc_v0.10.1.zip' に保存中 100%[======================================>] 596,632 103K/s 時間 5.9s 2014-04-03 23:36:14 (99.2 KB/s) - `fastqc_v0.10.1.zip' へ保存完了 [596632/596632]次に解凍。zipなのでunzipを使う。 localに解凍する -dで解凍先を指定 ちなみにコマンドやファイル名はtabキーで補完されるので使うと便利
unzip unzip fastqc_v0.10.1.zip ../local解凍すると、FastQCディレクトリができるので移動してInstall.txtを見るとActually installing FastQC is as simple as unzipping the zip file it comes in into a suitable location. That's it. Once unzipped it's ready to go.fastqcとなっているのでそのまま使えるらしい。実際にやってみると実行権限が与えられていないのでfastqcファイルに実行権限を与える。与えたら-hでusageがでるか確認
cd FastQC/ chmod +x fastqc fastqc -hversionやoptionの説明がでればOK /home/kosugi/local/FastQCにパスを通す。
export PATH=/home/kosugi/local/FastQC:$PATHほんで、home ディレクトリに戻ってfastqc -hでうまくいくか確認
[kosugi@~]$ fastqc -h FastQC - A high throughput sequence QC analysis tool~ 〜以下usage〜動いた!これで場所を選ばず実行できる。
vim .bashrcファイルが開いたらiを押すと書き込める。以下を一番下に追記する。追記したらescキーを押して:wq
## FastQC export PATH=/home/kosugi/local/FastQC:$PATH :$PATHを後ろに持ってくると今まで書かれたパスの前に記述という事らしい。念のため再ログインしてwhichでどのパスでプログラムが実行されている確認する。
which fastqc ~/local/FastQC/fastqcとりあえず、これでいいのかな・・・
<link href='http://alexgorbatchev.com/pub/sh/current/styles/shCore.css' rel='stylesheet' type='text/css'/>一番下から二行目のSyntaxHighlighter.all();の上に以下を追加すると右上にでる、はてなマーク消える。
SyntaxHighlighter.defaults['toolbar'] = false;次にcss shCore.css
margin: 0 !important; outline: 0 !important; overflow: visible !important; padding: 2px !important;//0から2pxに変更と
.syntaxhighlighter.ie { font-size: .9em !important; padding: 1px 0 20px 0 !important; // 1px->20pxに変更 }これをBloggerのテンプレート>カスタマイズ>上級者向け>cssにコピペ-適用する 使い方はHTML編集でコマンドのところをpreでくくる感じ
<pre class="brush:言語名(コマンドならbash HTMLならhtml)"> //コマンド </pre>コマンドだとこんな感じになる
mkdir hoge hogeディレクトリを作る cd ../ 一つ上のディレクトリへ移動 less hoge hogeの中身を見る ls -la ディレクトリの中身確認 wget "URL" ダウンロードwgetの色変わらんのね。なんでやろ。 NGSの解析とは全く関係ないところにやや時間を費やしてしまった・・・。
[kosugi@~]$ ls src work [kosugi@~]$ rmdir work [kosugi@~]$ mkdir local [kosugi@~]$ ls local src [kosugi@]$ cd local [kosugi@local]$ mkdir work [kosugi@local]$ mkdir bin [kosugi@local]$ ls bin workとりあえずこれでOK。
export PATH=/home/kosugi/local/bin:$PATHとすれば通るはず。
echo $PATH /home/kosugi/local/bin:/他の色んなパス/usr/local/bin:/bin:/usr/bin:/usr/local/sbin:/usr/sbin:/sbinと言う事で通った。 ただこのままだと、ログオフしたら消える。
echo $PATH /他の色んなパス/usr/local/bin:/bin:/usr/bin:/usr/local/sbin:/usr/sbin:/sbinなので毎回打ち直す必要が有るが、そんなめんどくさい事していられないのでひとまず.bashrcに書き込むといいらしい。するとこのログインした時の初期化問題が解決する。書き込むにはvimというコマンドを使うようだ。(emacsというのもあるらしい。)書き込むにはi 保存終了はescキーを押して:wqと打ち込む
vim .bashrc ファイルが開いたら書き込める。以下を適当な位置に追加する。 ## 自分のlocal/binにパスを通す。 export PATH=/home/kosugi/local/bin:$PATH :$PATHを後ろに持ってくると今まで書かれたパスの前に記述という事らしい。と書いて終了。ログインし直しても
echo $PATH /home/kosugi/local/bin:/他の色んなパス/usr/local/bin:/bin:/usr/bin:/usr/local/sbin:/usr/sbin:/sbin先頭に/home/kosugi/local/binのパスが通っている。よかったよかった。