百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 软件资讯 > 正文

数据可视化——R语言为ggplot图形添加P值和显著性水平

ninehua 2025-04-11 03:32 91 浏览

很久很久没有写原创文章了,今天给大家写一个大家发论文都用的到的操作--------为ggplot图形添加P值和显著性水平。建议先点收藏,再点关注,因为本文很长。掌握了本文,用R语言画下面这种图就不求人了。


概述:本系列文章介绍如何轻松地(注意不是本文,本文写不了这么多):

  • 比较两组或多组的均值
  • 自动地将P值和显著性水平添加到ggplot图形中,如箱形图,点图,条形图和折线图等

使用工具: R语言中的ggplot2包和ggpubr包,包的安装下载部分默认略过,不然文章太长。


示例数据

示例数据集:ToothGrowth

data("ToothGrowth")
head(ToothGrowth)

示例数据如下:

##    len supp dose
## 1  4.2   VC  0.5
## 2 11.5   VC  0.5
## 3  7.3   VC  0.5
## 4  5.8   VC  0.5
## 5  6.4   VC  0.5
## 6 10.0   VC  0.5

均值比较的方法

R中用于两组或多组间均值比较的标准统计方法之后有时间会一个一个的给大家写。这儿先给个大概表格。

均值比较的常见方法:

用于添加P值的R函数

这两个函数都是ggpubr包中的函数:

  • compare_means():用于执行均值比较
  • stat_compare_means():用于在ggplot图形中自动添加P值和显著性水平

下面一个一个看

compare_means()

该函数用于执行均值比较。该函数与标准的R函数相比,灵活性更强。

形式如下:

compare_means(formula, data, method = "wilcox.test", paired = FALSE,
  group.by = NULL, ref.group = NULL, ...)
  • formula:指定一个公式,公式形式为x ~ group,其中,x表示一个数值型变量,group表示一个因子型变量,包含一个或多个水平。例如,一个示例公式为formula = TP53 ~ cancer_group,表示在cancer_group对应的各水平间比较TP53的表达水平;也可以同时指定多个响应变量,如formula = c(TP53, PTEN) ~ cancer_group。
  • data:指定一个数据框(data.frame),数据框需包含formula中的变量。
  • method:指定统计检验的方法。默认为“wilcox.test”,即Wilcoxon检验(非参数检验);也可指定其他统计方法:“t.test”,即T检验(参数检验)。“t.test”和“wilcox.test”用于两组样本间的比较。当超过两组时,将会执行两两比较(pairwise comparison)。“anova”(参数检验)或“kruskal.test”(非参数检验),用于执行多组间的单因素方差分析。
  • paired:指定一个逻辑变量,表示是否需要执行配对检验,仅适用于t.test和wilcox.test。
  • group.by:指定一个分组变量的字符名,用于在统计检验之前对数据进行分组。当存在group.by指定的变量时,均值比较将在不同水平的各个子集数据中执行。
  • ref.group:指定一个组别的字符名,作为对照组(reference group)。如果指定,各个分组水平将与对照组水平进行比较。也可指定ref.group为“.all.”,表示每个分组水平将所有分组水平(如base-mean)进行比较。

stat_compare_means()

该函数是对ggplot2的扩展,可将均值比较后的P值添加到ggplot图形中,如箱形图、点图、条形图和折线图等。

简化形式如下:

stat_compare_means(mapping = NULL, comparisons = NULL hide.ns = FALSE,
                   label = NULL,  label.x = NULL, label.y = NULL,  ...)
  • mapping:通过aes()设置绘图时的aesthetic,aesthetic是个啥?Color、size、shape这三都叫做aesthetic。
  • comparisons:指定一个列表(list),每个列表元素需为长度等于2的向量。向量的内容可以为X轴的两个组别名(字符型),也可以是两个感兴趣组的组别索引(整数值),表示采用指定的两个组别进行比较。
  • hide.ns:逻辑变量,如果设为TRUE,显示显著性水平时将隐藏ns字样,即组间差异不显著时不显示ns字样。
  • label:指定一个字符串,表示标签类型。可为:“p.signif”(显示显著性水平),“p.format”(显示格式化的P值)。
  • label.x, label.y:指定一个数值,表示显示标签的绝对坐标位置。
  • :传递给函数compare_means()的参数,如method、paired、ref.group。

独立双样本组间比较

这个部分就直接是实际操作的例子了,大家可以复制代码自己跑,有问题请留言:

执行统计检验

compare_means(len ~ supp, data = ToothGrowth)

示例结果如下图:



method默认为“wilcox.test”(非参数检验),可指定method = “t.test”,表示T检验(参数检验)

返回值为具有以下列的数据框:

  • .y.:用于统计检验的数值变量
  • p:P值
  • p.adj:调整后的P值,调整P值的默认方法为p.adjust.method = “holm”
  • p.format :格式化的P值
  • p.signif:显著性水平,即用不同数量的*表示显著性水平
  • method:用于组间比较的统计方法

好了做完统计,重点来了

创建添加P值的箱形图,代码如下:

p <- ggboxplot(ToothGrowth, x = "supp", y = "len",
          color = "supp", palette = "jco",
          add = "jitter")
#  添加P值
p + stat_compare_means()
# 改变统计方法
p + stat_compare_means(method = "t.test")

运行代码,然后我们可以直接出图:

建议大家自己动手操作一番,因为写的挺详细的了,还有,注意:显示P值的标签位置可以通过如下参数来调整:label.x, label.y, hjust和vjust

显示P值的标签默认为compare_means()返回值中的methodp的组合。也可以通过aes()函数指定为其他显示形式。例如:

aes(label = ..p.format..) 或 aes(label = paste0(“p =”, ..p.format..))
表示只显示格式化的P值,而不显示method

aes(label = ..p.signif..)
表示展示显著性水平

aes(label = paste0(..method.., “\n”, “p =”, ..p.format..))
表示在method名和P值之添加换行(“\n”)

直接再上一个例子吧,运行下面的代码,就是只有p值了:

p + stat_compare_means( aes(label = ..p.format..), 
                        label.x = 1.5, label.y = 40)


小结

今天文章有点长,但是不难,强烈建议大家自己试一试,注意这个文章我其实还没写完,太长了,等下一篇吧,感谢大家耐心看完。发表这些东西的主要目的就是督促自己,希望大家关注评论指出不足,一起进步。内容我都会写的很细,用到的数据集也会在原文中给出链接,你只要按照文章中的代码自己也可以做出一样的结果,一个目的就是零基础也能懂,因为自己就是什么基础没有从零学Python和R的,加油。

(站外链接发不了,请关注后私信回复“数据链接”获取本头条号所有使用数据)

往期内容:

R数据分析:著名的“三门问题”的R语言模拟

R可视化:如何用R做一个让别人一目了然的图(二)

R数据分析:贝叶斯定理的R语言模拟

R可视化:如何用R做一个让别人一目了然的图

R语言:利用caret的dummyVars函数设置虚拟变量

相关推荐

美国国防把360列为榜首,网友:你可以说360坏,但不能说3

刷到是缘分,感谢大家的阅读,希望您能动动小手帮忙点赞,关注,评论。你的支持和鼓励是我前进的动力。在此祝福大家天天快乐,日日开心!0102就好比你们村的流子,平时在村里嚣张跋扈,但其他村的流子想进来撒泼...

无法定位程序输入点怎么解决 教你6招搞定!

电脑的使用过程中,用户可能会遇到“无法定位程序输入点”的错误提示。这个问题通常与动态链接库(DLL)文件有关,可能会阻止程序正常运行。导致这个故障问题的原因有很多,例如系统配置、软件安装或动态链接库(...

网络打印机安装指南,让你轻松搞定【详解】

关注创盛电脑弱电知识每日获取最新行业干货和资料以下是针对各类电脑问题的解决方案,按问题类型分类整理:一、准备工作确保打印机支持有线或无线(Wi-Fi)网络连接。连接打印机到网络有线连接:用网线将打印机...

如何在银河麒麟操作系统上查找并下载软硬件驱动?

银河麒麟卓面操作系统如何查找并下载软硬件驱动?后台有些小伙伴都在问怎么下载驱动?实际上麒麟软件官网提供了软硬件驱动下载链接,如何获取?接下来给大家演示如何查找并下载软硬件驱动。·进入麒麟软件官网,点击...

Wi-Fi总掉线,这个设置要修改!(wi-fi总是掉线)

01关闭网卡的省电模式,这是最常见的Wi-Fi掉线元凶,默认开启,操作步骤Win+X→设备管理器,找到“网络适配器”(也可以像下图这样直接搜索打开)→找到你的无线网卡(名称通常带Wir...

WiFi出现感叹号上不了网怎么办 轻松恢复网络

在日常生活中,WiFi已成为不可或缺的一部分。然而,有时我们会遇到WiFi图标上出现了感叹号,无法上网。无论是办公、学习还是娱乐,这种情况都会严重影响体验。这种情况该怎么解决呢?本期驱动哥就给各位介绍...

摩尔线程发布图形显卡驱动v300.110

IT之家5月20日消息,摩尔线程今日发布版本号为v300.110的图形显卡驱动程序,为游戏玩家和专业用户带来全方位的性能优化与体验提升,特别在3DMark基准测试工具SteelNo...

怎么更新电脑网卡驱动 图文教程分享

网络连接在现代生活中扮演着重要的角色,而网卡驱动是保证稳定网络连接的关键组成部分。随着技术的不断发展,更新网卡驱动已经成为了一个必要的操作。本文将为您介绍常见的网卡驱动更新方法,帮助您成功解决网卡驱动...

柯达Kodak扫描仪i2600驱动及扫描软件下载与安装方法

柯达扫描仪I2600驱动及扫描软件的下载与安装方法!有很多的扫描仪我们找驱动的时候不好找,在打印机驱动网里边下载的话也是比较方便的,可以搜索到柯达I2600,我们往下选,这里边也提供了官方的驱动下载,...

推荐几款免费驱动软件(免费的驱动)

以下是一些免费且值得推荐的驱动程序更新工具,这些软件可以帮助你检测、下载和更新电脑上的驱动程序,确保硬件设备正常运行并保持最新状态:1.360驱动大师轻巧版特点:360安全卫士旗下的产品,界面简洁...

适用产品:电脑产品 目录 一、驱动 2 1、电池

适用产品:电脑产品目录一、驱动21、电池/电源驱动22、键盘驱动23、摄像头驱动24、触摸板驱动25、快捷键驱动26、USB驱动37、Type-C电源驱动38、其他驱动3二、软件4...

手把手教你如何使用免费自动化工具——Appium(安卓版)

上次在上传了一篇Appium后,有人来问我有没有Andriod版的安装教程,这个当然有,抱着负责任的心,在上班摸鱼小半天之后,可算是把教程编辑好了准备环境JDKPythonAndriodSDKNod...

常见电脑USB遇到故障问题处理方法

#什么方法可以改变命运#大家电脑在使用USB存储器的过程中总是会出现这个故障或者那个故障问题,有时候出现无法读取,有时候设备的数据消失了,遇到这个问题是不是非常着急啊,今天教大家自己尝试查看遇到常见u...

无法识别的USB设备?怎么解决?(无法识别的usb设备怎么解决代码43)

大家有没有遇到过这种问题,就是当你把自己的U盘或者其他USB设备插到电脑上的时候,桌面右下角会弹出一个“无法识别的USB设备”的提示?这会导致该USB设备无法正常使用。如何解决无法识别的USB设备问题...

如何调鼠标的灵敏度 快速调节超简单

鼠标灵敏度是指鼠标在移动时,指针在屏幕上移动的速度。适当的鼠标灵敏度不仅能够提高工作效率,还能减少手部疲劳,优化游戏体验。那么不同的使用场景,鼠标灵敏度怎么调呢?本文将详细探讨如何调整鼠标灵敏度,以及...