泛癌的基因表达量一般可以用TCGA和GTEx实现,而肿瘤细胞系一般用CCLE数据库. 临床生信之家是一个很好的在线工具,目前上架了CCLE的功能,出的图见下,可以实现单基因在泛癌和单病种的可视化,但是这个网址什么都好,就是有次数限制,后面使用要加钱,而且价钱不菲,学生党望而却步。。。
会R语言,当然可以省掉这笔巨款,而且可以DIY,乐趣无穷 首先去CCLE官网下载数据,目前网页更新了,功能也多了 比如TP53,访问这个网址TP53 DepMap Gene Summary就行,在Characterization里Expression 21Q2 Public右边有个下载标志,基因单位是Log2(TPM+1),很科学
CCLE2021年的更新了很多,比以前好看多了,也科学多了啊…
下载后的数据默认命名是: [TP53 Expression 21Q2 Public.csv`] (https://depmap.org/portal/partials/entity_summary/download?entity_id=38037&dep_enum_name=expression&size_biom_enum_name=none&color=none)
不过这里最大的问题就是国内访问的速度真的是很随机啊,想快有时候根本快不了,如果电脑一直打不开,就用手机打开再传到电脑上吧,当然你也可以去hiplot.com.cn上去下载数据,虽然不是最新的,然而至少网速很快,但是需要二次处理一下数据
首先把数据读进R里面
library(readr) TP53_Expression_21Q2_Public <- read_csv("~/Desktop/TP53 Expression 21Q2 Public.csv") ## Rows: 1378 Columns: 6 ## ─ Column specification ──────────────────────────── ## Delimiter: "," ## chr (5): Depmap ID, Cell Line Name, Primary Disease, Lineage, Lineage Subtype ## dbl (1): Expression 21Q2 Public ## ## ℹ Use `spec()` to retrieve the full column specification for this data.