如何快速掌握TCGA数据库?

发布网友 发布时间:2022-04-21 19:12

我来回答

3个回答

热心网友 时间:2023-06-23 05:25

‍‍

在proportional里面搜你感兴趣的肿瘤,然后就会出现很多研究,在每个研究后面都有summary,你点击进去就有临床数据,有的还有变异和拷贝数变化的数据。目前个人感觉临床数据这块还是proportional这儿比较方便,其他的例如基因表达的数据cancer browser还是可能会好些,各种各样的都可以试试,不过原始的TCGA数据还是觉得一般是高手才去弄,新手还是多学习,站在巨人的肩膀上再去。The Cancer Genome Atlas,TCGA, 数据库。TCGA数据源大部分都是公开的。目前来能够从TCGA数据库中提取数据的处理工具有proportional。

‍‍

热心网友 时间:2023-06-23 05:25

‍‍

随着大数据时代的到来,各种生物类公共数据库井喷,其中就包括癌症领域熟为人知的癌症基因图谱The Cancer Genome Atlas (TCGA)数据库。TCGA由NCI牵头,作为美国攻克癌计划的一个大项目,投入了巨大的人力和物力,系统提供了癌症多组学测序和芯片数据,包括Gene expression, DNA lamentation, Copy Number Variation, Mutation等结果,同时也附有相应各测序样本的完整临床资料。TCGA为肿瘤基础医学和转化医学研究者提供了海量的基因组数据和与其关联的临床数据,这为挖掘有意义的基因组变化和发现影响肿瘤起始、发展、分化、转移等生物学机制提供了海量数据基础。然而传统的基础医学和转化医学研究者缺乏信息学基础来处理大规模癌症数据,因而在面对这些极其有价值的基因组数据时,往往心有余而力不足。作为医学信息领域研究者,我们需要将信息学和统计学知识运用到癌症基因组学数据分析的研究当中,作为连接大数据与基础医学研究者之间的一个纽带,帮助研究者去更好地挖掘探索这些数据。TCGA各组学数据下载。差异表达基因鉴定、共表达分析及聚类。差异甲基化区域鉴定及分析。基于TCGA数据挖掘癌症预后相关的甲基化位点和基因。使用TCGA下载单个癌症的Nasser数据,Miranda表达数据,甲基化数据,突变数据和临床数据,并对数据进行相应合并,整合。了解R基本数据结构,各种软件包下载和安装:R语言简介:R语言的由来和发展,优缺点;R的数据结构:向量;因子;数组;矩阵;数据框;列表。R编程:R编程基础及语句判断,R实践:读写文本文件及利用TCGA的文件进行二级分析。

‍‍

热心网友 时间:2023-06-23 05:26

‍‍

参加培训班——最快速的方法。有些生物信息公司会针对高校教师和医师开生信培训班,我导师带着我上过几次,有TCGA、Combined和R的。缺点是价格贵,一次一天两三千,优点是上手快,而且会有后续服务,比如课上完后你在Bq群里提问,一般公司技术人员都会给你解决。另外再推荐一本中文教材,可以做补充用。优点是浅显易懂,缺点是不够深入且作者态度傲娇,但书还可以,《R语言与Bio conctor-生物信息学应用》,天津出版。一般性的要求,用UCSC的Cancer Browser就好了。TCGA上的数据,自己处理起来还是比较麻烦的。  

‍‍

声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com