python 一组数据 正态分布散点图_如何在SPSS、Python、R中用Q-Q图检验数据是否服从正态分布?...-程序员宅基地

技术标签: python画成绩正态分布图  python判断无向图是否有环  python 一组数据 正态分布散点图  python 检验两个样本均值是否相同  

24432550fed8cbb3b3c242ddc6124c97.png

正态分布广泛存在于自然现象、生产、生活的方方面面,例如试卷命题难度,产品的使用寿命、农作物产量、气温、降水量、工资收入、人类的身高体重肺活量,甚至颜值……

关于正态分布的数学定义及各种性质,不在此赘述。简单理解,就是“两头小,中间大”,比如长相奇丑无比和倾国倾城的人都是少数,绝大多数人都属于大众脸。

很多时候,在进行数据分析工作时,首先要看的就是数据是服从何种概率分布,而正态分布则是最重要的一种概率分布,而且有一些数据分析方法的前提是要求数据整体服从正态分布,所以有必要了解如何检验数据是否服从正态分布。

有很多方法可以进行正态性检验,比如计算数据分布的偏度系数、峰度系数,再进行U检验;或者进行非参数检验,包括Kolmogorov-Smirnov检验(D检验)和Shapiro- Wilk (W 检验);还有最直观的图示法,包括Q-Q图、P-P图、直方图。

强烈推荐使用Q-Q图,简单直观。Q-Q图是一个散点图,以样本的分位数作为横坐标,以按照正态分布计算的相应分位点作为纵坐标。如果数据服从正态分布,则数据样本点近似的围绕在对角线附近。

一、SPSS软件

8b1331273fa84e9e336b3e2f979cfa69.png
依次选择【分析——描述统计——Q-Q图】

59a60996382a826fb3c93c8edcea8815.png
将要检验的变量移动到右侧变量选框,并确保检测分布是【正态】,然后点击确定

6e8ca71d8604ce019f32fbced775080a.png
搞定!

二、Python语言

在Python中有很多强大的科学计算库,可以方便的绘制Q-Q图。

#导入依赖库

ccabd51b804f93954895131e6b1e40fc.png
散点近似的分布在对角线上,基本可以判断为服从正态分布

三、R语言

R语言绘制Q-Q图也很方便,就是默认格式的图有点丑,看个人习惯吧。

#加载依赖库
library(qqman)

#加载本地数据
data <- read_excel("normal.xlsx", sheet = "Sheet1")

#绘制Q-Q图
qqnorm(data$变量, main="Q-Q plot: 变量")

#添加对角线
qqline(data$变量)

#绘制Q-Q图
qqnorm(log(data$变量), main="Q-Q plot: log(变量)")

3eefd6167a13d2942d4abd6426fcf6af.png

060f9784146a8efb8cf321163ba4455d.png

e656e629a47ee7da215f25f7d0ba22d3.png

17a56a64285eafc0ed5e7394a4641cca.png

不管是用哪种方法,本质都是一样的,没有最优的,只有最合适的,结合自己使用时的数据处理流程选用就好。

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/weixin_39956443/article/details/110230459

智能推荐

Python可视化matplotlib&seborn14-普通热力图heatmap_python matplotlib 热力图浅色-程序员宅基地

文章浏览阅读2.1k次,点赞2次,收藏21次。详细介绍python seaborn绘制热图。_python matplotlib 热力图浅色

最好的产品经理社区或者讨论圈有哪几个?_软件产品经理交流社区-程序员宅基地

文章浏览阅读1.8k次。本文将从社区、公众号(产品分析、深度互联网评论)、大佬博客、科技媒体、豆瓣书单等多个方面来阐述目前国内产品经理最好的一些讨论圈和内容,欢迎收藏~产品社区人人都是产品经理官网: http://www.woshipm.com“人人都是产品经理”应该是产品经理日常逛得最多的垂直社区,它里面的内容也主要以产品和运营为主,很多知名的产品经理KOL都会在上面发布文章。职景的学员也经常会把自己的产品分析报告上传发布到“人人都是产品经理”上。这中间也有一些有趣的事,比如两个人上传同一篇文章,只是因为排版格式的_软件产品经理交流社区

西门子PLC与IFIX软件以太网通讯_ifix与西门子plc连接-程序员宅基地

文章浏览阅读4.9k次,点赞2次,收藏16次。摘要IFX组态监控软件与西门子S7-200、S7-300系列PLC通讯,通常采用以太网通讯方式,IFIX软件中,采用S7A驱动的S7TCP/IP的通讯方式。西门子PLC采用第三方工业通讯桥接器实现以太网通讯。方案实施介绍本文以S7 TCP驱动(S7A)连接1台S7300,1台S7200为例:一、配置以太网通讯桥接器的参数用西门子S7TCP驱动来通讯,需要注意参数“S7TCP目标PLC地址”,需要填入PLC的站地址。例:S7-300,IP地址:192...._ifix与西门子plc连接

linux jstack 分析,使用top和jstack分析高CPU问题-程序员宅基地

文章浏览阅读431次。通常我们所说的 CPU 使用率过高,这里面其实隐含着一个用来比较高与低的基准值,比如 JVM 在峰值负载下的平均 CPU 利用率为 40%,如果 CPU 使用率飙到 80% 就可以被认为是不正常的。典型的 JVM 进程包含多个 Java 线程,其中一些在等待工作,另一些则正在执行任务。在单个 Java 程序的情况下,线程数可以非常低,而对于处理大量并发事务的互联网后台来说,线程数可能会比较高。对于..._对于 cpu 的问题,最重要的是要找到是哪些线程在消耗 cpu,通过线程栈定位到问题代

TypeScript手册翻译系列1-基础类型-程序员宅基地

文章浏览阅读111次。为什么80%的码农都做不了架构师?>>> ..._typescript 文档翻译

基于Jenkins的DevOps流水线实践教程|2020全新制作|端到端研发效能提升-程序员宅基地

文章浏览阅读319次。讲师介绍课程寄语我认为Jenkins是对我这些年运维经验的总结,起初我们运维同学都是编写脚本完成一些自动化的操作。而有了Jenkins我们可以将我们的运维经验与Jenkins设计理念融合..._基于jenkins的devops工程实践

随便推点

window下编译lua源码,编译lua的库文件,编译lua解释器,编译lua编译器_lua库和源码一起编译-程序员宅基地

文章浏览阅读448次。网上有很多博客讲如何在windows下编译lua源文件。两上大概是有两种方案:一种是用VS来编译,一种是自己写批处理文件,直接编译。附上以上两种方法的博客:借助VS开发在src文件夹下写批处理_lua库和源码一起编译

国内外优秀的计算机视觉团队汇总_知乎 大连理工大学李培华-程序员宅基地

文章浏览阅读2.1k次。本帖还在更新中,国内外优秀的计算机视觉团队有很多,我这里只是列举了自己从知乎、CSDN等网站上收集到的,排名不分先后,如有遗漏,还请谅解。同时欢迎小伙伴回帖补充,我会更新到本帖,谢谢~感谢极市平台微信公众号的粉丝Alan、Andy、陈、蓝色格调、亚辉、邵帅、城邑、SuperMAN和知乎好友:Shihua Huang的补充贡献最后更新于2020/7/22,已累计更新 10次国内高校研究团队北京清华大学:龙明盛,黄高,艾海舟,张长水(Big eyes laboratory 大眼睛实验室),._知乎 大连理工大学李培华

IntelliJ IDEA 无法预览 Markdown 文件的解决思路_idea markdown预览-程序员宅基地

文章浏览阅读1.4w次,点赞8次,收藏2次。文章目录一、问题描述二、解决思路一、问题描述  在项目开发中,一般情况都需要写一个 readme.md 来介绍项目的整体情况。但是有些同事的 IntelliJ IDEA 确无法显示 Markdown 的文件内容预览,无疑为团队开发交流形成了阻碍。二、解决思路确认 IntelliJ IDEA 是否关联了 .md 文件设置面板 Editor File Types Markdown 查看是否以及注册了 .markdown 或者 .md 的文件格式,如果没有请加上查看 Mark_idea markdown预览

IDL学习——处理自带经纬度文件的遥感影像,以哨兵5P数据为例_envi_glt_doit-程序员宅基地

文章浏览阅读2.7k次,点赞7次,收藏31次。@TOC欢迎使用Markdown编辑器你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Markdown编辑器, 可以仔细阅读这篇文章,了解一下Markdown的基本语法知识。新的改变我们对Markdown编辑器进行了一些功能拓展与语法支持,除了标准的Markdown编辑器功能,我们增加了如下几点新功能,帮助你用它写博客:全新的界面设计 ,将会带来全新的写作体验;在创作中心设置你喜爱的代码高亮样式,Markdown 将代码片显示选择的高亮样式 进行展示;增_envi_glt_doit

MySQL date_format()日期格式_date_format可以使用的日期格式-程序员宅基地

文章浏览阅读2k次。DATE_FORMAT() 函数用于以不同的格式显示日期/时间数据。DATE_FORMAT(date,format) format参数的格式有%a 缩写星期名%b 缩写月名%c 月,数值%D 带有英文前缀的月中的天%d 月的天,数值(00-31)%e 月的天,数值(0-31)%f 微秒%H 小时 (00-23)%h 小时 (01-12)%I 小时 (01-12)%i 分..._date_format可以使用的日期格式

shell中条件判断if中的-a到-z的意思_shellif -z是什么-程序员宅基地

文章浏览阅读8.7k次。[-a file] 如果file存在则为真 [-b file] 如果file存在且是一个块特殊文件则为真 [-c file] 如果file存在且是一个字特殊文件则为真 [-d file] 如果file文件存在且是一个目录则为真 -d前的!是逻辑非 例如: if [ ! -d $lcd_path/$par_date ] 表示后面的那个目录不存在,则执行后面的then操作 [-e fil_shellif -z是什么

推荐文章

热门文章

相关标签