Coder Social home page Coder Social logo

ngsdat2_epigenome_chipseq's People

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar  avatar  avatar

ngsdat2_epigenome_chipseq's Issues

MACS2(python 3版)のインストールについて

DRY解析教本にて勉強させて頂いております。ご質問させていただきます。
改訂版第2版 P116のMACS2のインストールのところで、

$ git checkout remotes/origin/macs2python3
のところで以下のエラーが出ました。

error: pathspec 'remotes/origin/macs2python3' did not match any file(s) known to git

https://trsasasusu.com/blog/93/
を参考に
$ git fetch
のコードを試しましたが、うまくいきませんでした。

ご教授いただけますと幸いです。

Bowtie 2によるリードのゲノムへのマッピングでエラーが出る

環境はLinux CentOSです。

(base) [chipseq]$ bowtie2 -p 2 -x data/external/bowtie2_index/mm10
-U BRD4_ChIP_IFNy.R1.trim.fastq.gz > bowtie2/BRD4_ChIP_IFNy.trim.sam
(ERR): "data/external/bowtie2_index/mm10" does not exist or is not a Bowtie 2 index
Exiting now ...

Macでの操作でないため -p 2 は除外して、homeディレクトリの直下であるため data/external/を抜いて行いましたが、下記のエラーが出ます。

(base) [chipseq]$ bowtie2 -x ~/bowtie2_index/mm10 -U BRD4_ChIP_IFNy.R1.trim.fastq.gz > bowtie2/BRD4_ChIP_I
FNy.trim.sam
stat: Bad file descriptor
Warning: Could not open read file "BRD4_ChIP_IFNy.R1.trim.fastq.gz" for reading; skipping...
Error: No input read files were valid
(ERR): bowtie2-align exited with value 1

117ページRStudioのインストールについて

brew cask install rstudio
と入力すると、
Error: Unknown command: cask
というエラーメッセージがでます。

調べたところ、brew caskの使い方がかわったらしく、
brew install rstudio --cask
にすれば大丈夫なようです。

[確認]SAMファイルからBAMへの変換について

 同様に、残りのSAMファイルについてもBAMへの変換を行う。

$ cd ~/chipseq
$ samtools view -bhS -F 0x4 -q 42 bowtie2/IRF1_ChIP_IFNy.trim.sam | samtools sort -T bowtie2/IRF1_ChIP_IFNy.trim - > bowtie2/Input_DNA.trim.uniq.bam

この部分の出力は
IRF1_ChIP_IFNy.trim.uniq.bam
にしなくても良いのでしょうか

こちらの出力結果と同じなのでしょうか↓
$ samtools view -bhS -F 0x4 -q 42 bowtie2/Input_DNA.trim.sam | samtools sort -T bowtie2/Input_DNA.trim - > bowtie2/Input_DNA.trim.uniq.bam

P125 bowtie2 の bowtie2_index ディレクトリについて

P125の上から二番目のコードが私のPC(mac M1搭載)では通らなかったので報告いたします。
Indexのディレクトリの位置が教本通りにしたがっていれば
~/bowtie2-indexにあるので、以下のようにコードを書き換えるとコードが通りました。
chipseq % bowtie2 -p 8 -x ~/bowtie2_index/mm10 \ -U fastp/BRD4_ChIP_IFNy.R1.trim.fastq.gz > bowtie2/BRD4_ChIP_IFNy.trim.sam
======結果======================
19709457 reads; of these:
19709457 (100.00%) were unpaired; of these:
1163507 (5.90%) aligned 0 times
13206029 (67.00%) aligned exactly 1 time
5339921 (27.09%) aligned >1 times
94.10% overall alignment rate
その後、確認しても正しく作動していたことがわかりました。
chipseq % ls bowtie2
BRD4_ChIP_IFNy.trim.sam
他の方で困られている方がいらっしゃれば参考になればと思います

tar.gz fileの解凍について

DRY解析教本にて勉強させています。ご質問させていただきます。
改定第2版P115のヒトリファレンスゲノム配列(hg38)用のpre-built index fileのダウンロードは可能でしたが(ファイルサイズ3.93GB)、以下のコマンドでは解凍できません。以下のようなエラーがでます。

tar xvzf GCA_000001405.15_GRCh38_no_alt_analysis_set.fna.bowtie_index.tar.gz
x GCA_000001405.15_GRCh38_no_alt_analysis_set.fna.bowtie_index.1.bt2: gzip decompression failed
tar: Error exit delayed from previous errors.

また、GCA_000001405.15_GRCh38_no_alt_analysis_set.fna.bowtie_index.tar.gzと同じディレクトリ内に
GCA_000001405.15_GRCh38_no_alt_analysis_set.fna.bowtie_index.1.bt2が作成されています。

上記事象について、いかがでしょうか?

[確認]deepToolsによるChIP-seqのリードのシグナルの分布の可視化に ついて

次に以下のコマンドで、BRD4 ChIP-seqのリードの分布 (deeptools/BRD4_ChIP_IFNy.trim.uniq.bw)がIRF1 ChIP-seqのピーク (macs2/IRF1_ChIP_IFNy_summits.bed) を中心としたときにゲノム全体としてどうなっているかをaggregation plotとして描くための準備をする。computeMatrixコマンドの”reference-point”というモードを使用する。

$ cd ~/  → $ cd ~/chipseq
こちらに変更でしょうか。

さらに、以下のように--scoreFileName に複数のbigWigファイルを指定することで、複数のChIP-seqデータにおけるリードの分布を同時に可視化することができる。plotHeatmapで--kmeans でクラスタ数を指定することで、k-meansアルゴリズムでゲノム領域をクラスタリングして表示させることもできる。

$ computeMatrix scale-regions
--regionsFileName ../data/gencode/gencode.vM20.annotation.gtf
--scoreFileName deeptools/BRD4_ChIP_IFNy.trim.uniq.bw
deeptools/IRF1_ChIP_IFNy.trim.uniq.bw
--outFileName deeptools/chipseq_matrix_gencode_vM20_gene.txt.gz
--upstream 1000 --downstream 1000
--skipZeros

/data こちら不要でしょうか。
確認をお願い致します。

P145のRstudioのコマンドについて

P145の一番上のコマンドについて
gr1 <- toGRanges("macs2/BRD4_ChIP_IFNy_peaks.narrowPeak", format="narrowPeak", header=FALSE)
ではファイル
'macs2/BRD4_ChIp_IFNy_peaks.narrowPeak' を開くことができません: No such file or directory
とのエラーメッセージが出てきました。(Rstudioを開けた際のターミナル画面のカレントディレクトリは~/chipseqとなっていました)
そのため
gr1 <- toGRanges("~/chipseq/macs2/BRD4_ChIP_IFNy_peaks.narrowPeak", format="narrowPeak", header=FALSE)
このようなコマンドに書き換えさせていただくとパスが通り、その後の動作も問題なく進みました。
同様のエラーが出てきた方の参考になればと思いご報告させていただきました。

125ページのゲノムへのマッピングについて

bowtie2 -p 2 -x /Volumes/DATA/bowtie2_index/mm10 -U fastp/BRD4_ChIP_IFNy.R1.trim.fastq.gz > bowtie2/BRD4_ChIP_IFNy.trim.sam
と入力したところ(システムドライブの容量の問題で、DATAドライブで作業しております)、
(ERR): Description of arguments failed!
Exiting now ...
というエラメッセージが出てしまいました。
どのように対処すればよろしいでしょうか。

お忙しいとは存じますが、回答いただければ幸いです。

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.