教程

利用RStudio给自己做一个漂亮的简历
很早的时候,我给自己做过一个个人简历的网站并上传到Github上了,但是由于Github很不稳定,所以我又导到码云上,不得不说码云确实很快,至少很多github的包可以无缝导入gitee安装了。 目前RStudio已经更新到1.4版了,最让人惊喜的是有了对markdown编辑可视化的界面了,这极大方便了我这种不喜欢代码的懒人,其实我们现在的静态网站基本都是基于markdwon,尽管已经有很多软件可视化,不过能把所有需要的功能集中在一起不是更好吗?所以先给RStudio点个大赞。 以前的我建个人简历是基于Y叔的一个教程,可以很好的作出效果,我的那个简历也是如此,主要原理是把一个csv的表格的内容嵌入进来,然后用R markdown自动生成html,然后你就可以浏览了,其实所有的一切都要感谢yihui大神的Rmarkdwon,而他又开发了各种包让我们可以做博客、可以写书、写论文,设置还能写幻灯片,所有的一切都是Rmd下的模板而已,而个人简历也是一个模版。 RStduio已经高度集成了Rmarkdown,所以你不用安装软件,这里只需要安装一个包,这个包就是’rticles’,听发音就已经知道了,article,就是专门给学术开发的一个包,这里面包括了几十种流行杂志的模板,也就是说,用这个包,你其实还可以用来写SCI!!! 好了,铺垫写完了,我们就开始正题,首先需要安装这个包,很经典,因为这个包就在CRAN上,所以直接点击Packages-Install,输入名字安装即可,当然也可以代码安装,而且安装完以后你也不需要运行,其实只是相当于给RStudio多一个插件。 # install.packages('rticles') ##如果代码安装的话,把前面那个#去掉 那么,怎么最快的找到这个插件呢,其实就在右上角的第一个➕号上面,点击选择R Markdwon,然后这里就会多一个From Template,里面又很多很多模板,我们拉到HTML Resume,设置一个工作目录,命名,然后OK,这样就会多一个Untitled.Rmd的文件了,里面有很多代码和字母。 如何看效果呢,直接直接点Knit,弹出一个文件夹保存好,就可以渲染看到效果了,结果1.4版本的可视化编辑,会方便很多 Knit在🔍边上 这就是我们看到的效果 渲染简历效果 剩下的就是自己改细节了,记得不是保存以后就可以看到效果,每次修改完以后都要点Knit渲染
ROnmine处理oncomine数据
基本介绍 oncomine是一个很好的肿瘤数据库,功能很强大,也有可视化的操作,但是最大的问题是数据不能很好的获得,,而且自带的图很丑(而且只是png),关于oncomine的教程有很多,比较经典有解螺旋的教程,比如下面这个,基本涵盖了常用的功能: 麦子陪你做作业(三):肿瘤经典数据库Oncomine实训操作 然而,大神yikeshu0611默默的为我们付出,之前开发了一个R包叫ROncomine可以很方便的获得数据,并且再次出图,不过最近又更新为oncomineR了,新版的我还没研究,这里我们还是先说老版的ROncomine 这个包以前托管在Github上(由于众所皆知的原因,国内访问Github很困难),但是目前已经删除了,好在我之前已经导入到了我的码云上了,所以也可以很快的安装。 以前其实还有一个教程破解oncomine无法免费下载数据,学员开发了一款R语言包,但是目前也被删除了,估计这个还是有版权的,所以我还是悄悄的写个自己看的教程 首先需要安装devtools,然后调用install_git函数就可以直接安装,之后就方便了 install.packages(‘devtools’) devtools::install_git(’https://gitee.com/swcyo/oncomineR’)) 其实每一个oncomine的数据都可以使用浏览器获得,用chrome浏览器登录,随便一个地方鼠标右击找到检查元素,就可以看到代码区,使用Crtl+F查找<map,我们需要的代码全都在<map那一片,右击复制然后新建一个文本文档保存起来 oncomineR的原理只是是把检查元素里<map那串代码二次处理,从而简化工作,然后调用ploty作图,当然你也可以用ggplot2再次画图 单基因在基本中的总结(Gene Summary) 按照解螺旋的教程,比如搜索CXCL8基因,实际上基因名为IL8,然后我们可以在右边看到这样的一个热图: 我们复制<map那一串代码,保存为heatmap.txt文件,我们可以用Oncomine_heatmap_DiseaseSummaryfor_SomeGene处理 library(ROncomine) heat<-Oncomine_heatmap_DiseaseSummaryfor_SomeGene('/Users/mac/Documents/GitHub/myblog/content/post/2021-08-19-oncomine/heatmap.
如何准确的使用R进行两独立样本的显著性检验,T检验?非参数检验?
在科研工作中,使用较多的应该就是两独立样本的显著性检验,也就是我们常说的比较两个组有没有统计学差异,比方说我们收集了身高数据,想比较男性和女性的身高有没有差别,这就是两独立样本的显著性检验,而最让人耳熟能详的就是t检验,然而有时候(我认为更多的适合)却又有一个非参数检验,其实统计学不那么严谨的话,基本都是用t检验,然而这样暴力的选择并不科学,那么到底该如何选择才是最科学的呢? 目前常用的统计软件有SPSS和GraphPad,不过这两个都是收费软件,虽然有破解版,然而总归是没有版权的,而R作为开源软件,又附带N多的包,功能什么强大,反正免费就是王道。。。 有两个参考网站可以供学习 R-两独立样本t检验 R-两独样本Wilcoxon检验 一、假设检验的前提是什么? 1. 两个样本是否独立? 如果两个样本不是独立样本,而是配对样本,那么就不能用独立样本的t检验,而应该是配对样本的t检验。 独立样本就是说两组样本没有什么关联,比如说男女的身高差,男的就跟女的没有任何关联 配对样本是其实是一种样本,不过经历了某种干预,比方说没有用药的时候是A组,然后给A组的成员用了药就变成了B组;又比方说同一个病人标本取了癌组织和癌旁组织,那么所有取了癌组织和癌旁组织标本的患者就是配对样本。 2. 两组中每组的数据是否服从正态分布? 在进行假设检验前,首先就要看是不是正态分布,也就是说要进行正态检验,一般有Shapiro-Wilk test(S-W检验)和Kolmogorov-Smirnov test(K-S检验),两种方法都有人用,但是一般选择S-W检验。这里我们一般不需要过分纠结选哪种,K-S检验适合用于大数据样本的正态性检验,我们主流还是选择S-W检验(shapiro.test())。 只有符合正态分布的才可以使用t检验 如果数据不是正态分布的,可以尝试先进行数值转换,如log2处理,如果满足正态分布,可以选择t检验