1、ENA Browser (ebi.ac.uk) 网站根据RPJ号查
2、打开EBI数据库(https://www.ebi.ac.uk/),检索RPJ号,点击进入即可看到具体信息。点开Show Column Selection
,在下拉框中勾选fastq_aspera
和sra_aspera
,即可在下载的tsv文件中包含两列下载地址信息。推荐直接下载fastq格式以供下游直接分析。
只下载fastq_aspera
的tsv文件,提取信息:
awk 'NR == 1 {next} {print $2}' 文件名_tsv.txt | awk -F ';' '{print $1}' > fastq_1.txt
awk 'NR == 1 {next} {print $2}' 文件名_tsv.txt | awk -F ';' '{print $2}' > fastq_2.txt
批量下载脚本:
awk '{print "ascp -k1 -QT -l 300M -P33001 -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh era-fasp@" $1 " ./"}' fastq_1.txt > fastq_1.sh
awk '{print "ascp -k1 -QT -l 300M -P33001 -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh era-fasp@" $1 " ./"}' fastq_2.txt > fastq_2.sh
# 合并
cat *.sh > download_fq.sh
# 批量下载
nohup sh download_fq.sh &
- -k: 断点续传,一般设置为1
- -v: 实时查看程序运行步骤
- -Q: Enable fair transfer policy
- -T: 禁止加密
- -i: 秘钥地址,即asperaweb_id_dsa.openssh 文件的路径
- -l: 最大传输速率
- -P: 提供SSH port,一般是33001
- SRC: 源文件地址
- DEST: 保存地址