鸭梨山大痕
医学生有必要学r语言。
R语言是用于统计分析、绘图的语言和操作环境。R是一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。
诸位大概都知道,统计分析领域常用的语言包括SPSS、SAS、Stata,因素,它们统称为统计分析软件。R语言也是一种数据分析工具。
R是统计领域广泛使用的诞生于1980年左右的S语言的一个分支。可以认为R是S语言的一种交互式实现。
它是完全免费,开放源代码的。可以在它的网站及其镜像中下载任何有关的安装程序、源代码、程序包及其源代码、文档资料。
R是一种可编程的语言。作为一个开放的统计编程环境,语法通俗易懂,很容易学会和掌握语言的语法。
R语言其实就是一种环境平台。它提供平台,而统计分析研究和计算机研究人员可以将各自通过编程形成的统计分析方法以打包(package)的方式放在R语言平台上,供一般的统计分析者直接使用。
我们可以不懂统计分析原理,但是我们可以通过写一句命令就可以让软件调用统计分析包帮我执行某一个统计分析。
R语言的开放性, 它的更新速度比一般统计软件,如,SPSS,SAS等快得多。最新的统计分析方法,最复杂的方法都能在R语言上发现。
由于它比SPSS、SAS、Stata,注重于编程,相对来说学习起来具有一定难度,但它属于傻瓜式的编程。你能想到的所有统计相关的工作,R都可以非常简洁的用几行命令帮你完成。
doubledennis
转自医学方
2019-07-4 Alexander
流行病学或者医学论文中,对研究对象基本情况的描述通常以表格的形式进行,并且放在结果部分的开头,即Table 1,主要内容是研究对象一般情况和研究变量或协变量的分组展示。
前几天文章修回过程中,花了两天时间分析数据,修改文章,其中有近1天的时间都在手动录入数据(从R studio里把分析结果整理到Excel或者word),这样除了花费时间外,还非常容易出错。之前一直想找时间通过R markdown把制作表格的过程程序化,可是效果并不理想。
这次痛定思痛,先从table 1开始,发现了几个不错的方法。其中一种个人觉得可读性和可编辑性都比较强,于是学习了一下,作为一个非常实用的工具分享给大家。
这里主要参考一篇博客Fast-track publishing using knitr: table mania,对细节进行了加工和注释。
1 数据的准备
数据主要来自于boot包的melanoma。加载后,看下数据的基本结构。
接下来对数据进行简单的整理,为后续分析做准备;
将分类变量定义为因子型并设置标签(这里建议设置一个新的变量,仅用于table 1的制作,不影响后续的分析);
2 安装和加载R包 Gmisc
后面两个包是加载“Gmisc”时要求加载的。
3 自定义函数、制作表格
根据已有函数自定义函数,并制作表格。定义一个函数,输入数据集的变量并得到该变量的统计结果:
函数定义完成后,建立一个空的列表,以储存每个变量的分析结果,并进行分析,将结果储存在列表中:
将所有结果merge到一个矩阵中,并建立rgroup(table1第一列的变量名) 和 (table 1第一列每个变量的行数):
结果如下:
当然,有些情况下,需要多加一个分组标题栏(column spanner),该怎么加呢?
如下:
结果如下:
4 导出结果
在R studio viewer窗口点击白色按钮,即可在浏览器中打开,然后复制粘贴到word可以进一步加工修饰。
是不是很刺激呢。 应该还有其他的导出方法,不过这个已经很方便了。
拓展功能选
⒈ 二分类变量只显示一个(比如男性和女性)。只要在getDescriptionStatsBy的"show_all_values"参数设置为FALSE即可;
⒉ 显示缺失值。getDescriptionStatsBy的"useNA"参数设置为"ifany",表示如果有缺失值就显示缺失值情况;如设置为“no”,表示始终不显示缺失值情况;“always”则表示无论是否有缺失值都显示缺失值情况;
⒊ Total一列是可以去掉的,getDescriptionStatsBy的"add_total_col"参数设置为FALSE即可。
不足之处
⒈ 差异性检验是采用非参的方法,虽然没有错,但是一般符合参数检验条件的数据还是要使用参数检验的方法,这里可以自行检验后再修改P-value;
⒉ Mean (SD)的展示形式有个括号感觉有点别扭,还不知道怎么去掉,有方法的小伙伴欢迎分享交流。
另外有一些其他的制作table 1的R包,比如table 1(R包的名字)包,tableone包,还有其他生成表格的R包(plyr等),个人浏览下来感觉这个最容易理解和掌握,其他包的功能有兴趣的可以再自行挖掘对比。
原文链接:
r语言在生物医学领域的应用如下: R语言在医学科学研究中应用广泛,典型的应用包括:机器学习技术可以帮助研究人员构建和改进机器学习模型,建立影响治疗效果的变量;统
医学论文格式及写作方法医学论文写作是一项严肃、意义重大的工作、是交流经验,传播科技成果,不断提高临床诊治和科研水平的重要组成部分。只有不断的总结,才能在总结的基
数据准备 统计概念学习。 (1)当观测值为奇数时,(n+1)/2位置的观测值即为中位数。 (2)当观测值个数为偶数时,n/2和n/2 + 1位置的两个观测值的平
转自医学方 2019-07-4 Alexander 流行病学或者医学论文中,对研究对象基本情况的描述通常以表格的形式进行,并且放在结果部分的开头,即Table
这要看你的数据量,如果巨大,可能是要用SPSS。如果数据量不是很大,EXCEL也是可以的,只是要自己运用函数额处理。