aspera下载SRA/fastq原始数据

591次阅读
没有评论

1、ENA Browser (ebi.ac.uk) 网站根据RPJ号查

2、打开EBI数据库(https://www.ebi.ac.uk/),检索RPJ号,点击进入即可看到具体信息。点开Show Column Selection,在下拉框中勾选fastq_asperasra_aspera,即可在下载的tsv文件中包含两列下载地址信息。推荐直接下载fastq格式以供下游直接分析。

只下载fastq_aspera的tsv文件,提取信息:

awk 'NR == 1 {next} {print $2}' 文件名_tsv.txt | awk -F ';' '{print $1}' > fastq_1.txt
awk 'NR == 1 {next} {print $2}' 文件名_tsv.txt | awk -F ';' '{print $2}' > fastq_2.txt

批量下载脚本:

awk '{print "ascp -k1 -QT -l 300M -P33001 -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh era-fasp@" $1 " ./"}' fastq_1.txt > fastq_1.sh
awk '{print "ascp -k1 -QT -l 300M -P33001 -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh era-fasp@" $1 " ./"}' fastq_2.txt > fastq_2.sh
# 合并
cat *.sh > download_fq.sh
# 批量下载
nohup sh download_fq.sh &
  • -k: 断点续传,一般设置为1
  • -v: 实时查看程序运行步骤
  • -Q: Enable fair transfer policy
  • -T: 禁止加密
  • -i: 秘钥地址,即asperaweb_id_dsa.openssh 文件的路径
  • -l: 最大传输速率
  • -P: 提供SSH port,一般是33001
  • SRC: 源文件地址
  • DEST: 保存地址
sheep
版权声明:本站原创文章,由 sheep 2023-02-19发表,共计798字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
评论(没有评论)