怎么根据TCGA官方的API下载数据?简单几句命令轻轻松松下载想要的TCGA大数据

下载文件

GDC API使用和端点实现文件下载功能(说白了,就是想下载哪个文件直接根据该文件连接地址,请求下载就好了,那了每个文件连接地址是什么呢具体看下面教程)。 数据端点允许用户通过指定文件UUID来下载存储在GDC中的文件。 清单端点生成下载清单文件,该文件可与GDC数据传输工具一起使用以传输大量数据。

注意:下载受控访问数据需要使用身份验证令牌。 有关详细信息,请参阅 Getting Started: Authentication

注意:从GDC Legacy Archive下载数据的请求必须定向到旧版/数据。 有关详细信息,请参阅 Getting Started: Legacy Archive

Data端点

要下载文件,用户可以将UUID传递到 Data端点。 如果提供单个UUID,API将返回关联文件。 如果提供了以逗号分隔的UUID列表,则API将返回包含所请求文件的存档文件。

Data端点支持GET和POST请求,如以下示例所示。

相关文件

如果指定了参数,则GDC API将在下载包中包含以下相关文件(如果可用):

  • BAM index files (BAI files)
  • Metadata files (such as SRA XML or MAGE-TAB files)

例如,此请求将下载旧版拷贝编号分段文件及其关联的MAGE-TAB元数据文件:(你可以点开下面的连接,这个就是TCGA的一个文件,TCGA上每一个文件都有一个连接,我们可以直接根据连接下载文件。仔细看看这个连接有什么特点吗错,就是TCGA数据仓库网址加上文件的标签UUID,说白了就是前面 不变,后面加上文件的UUID号 就行了,我别的文章有讲怎么使用脚本下载TCGA数据,有兴趣可以看一看。)

使用GET下载单个文件

此示例演示如何从GDC下载单个文件。 在这里,我们使用GET请求将文件的UUID传递给数据端点。
shell 脚本

输出样例

使用GET下载多个文件

此示例演示如何使用GET请求从GDC下载多个文件。 GDC API返回包含下载文件的.tar.gz存档。
shell 脚本

输出样例

注意:此方法支持一次下载有限数量的文件。 要下载大量文件,请使用POST。

下载未受压缩的文件组

如果为数据端点下载查询指定了参数,则下载字符串中请求的所有文件将捆绑在单个tar文件中,而不是作为默认行为的tar.gz文件。
shell 脚本

使用POST下载多个文件

以下两个示例演示如何使用POST请求从GDC下载多个文件,该请求包含两种格式之一的有效负载:百分比编码表单数据或JSON。 GDC API返回包含下载文件的.tar.gz存档。

如上所述,和端点都接受POST请求。

请求表单数据PAYLOAD

携带百分比编码表单数据的payload的POST请求必须包含HTTP标头。

payload 是以下格式的字符串:

其中UUID#对应于要下载的文件的UUID。

在此示例中,我们使用curl从GDC Legacy Archive下载一组文件。payload存储在名为Payload的纯文本文件中; curl默认包含。

Payload

shell 脚本

输出样例

使用JSON PAYLOAD发布请求

携带JSON有效负载的POST请求必须包含HTTP标头。

payload是以下格式的字符串:

其中UUID#对应于要下载的文件的UUID。

在这个例子中,我们使用curl从GDC Legacy Archive下载一组文件; 有效负载存储在名为的纯文本文件中。
Payload

shell 脚本

输出样例

下载受控访问文件

要下载受控访问文件,必须使用 HTTP标头将有效的身份验证令牌传递给GDC API:
shell 脚本

输出样例

来源:Mr番茄蛋

声明:本站部分文章及图片转载于互联网,内容版权归原作者所有,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2018年6月2日
下一篇 2018年6月2日

相关推荐