您现在的位置:   首页 >> 新闻中心 >> 数据分析

一文读懂假设检验怎么做

发布人:www.yunke.ai 发布时间:2021-01-01 146 次浏览

我们在生活中经常会遇到对一个总体数据进行评估的问题,但我们又不能直接统计全部数据,这时就需要从总体中抽出一部分样本,用样本来估计总体情况。作者详细阐述了如何进行假设检验,分享给大家。

我们为什么要假设检验?

我们在生活中经常会遇到对一个总体数据进行评估的问题,但我们又不能直接统计全部数据,这时就需要从总体中抽出一部分样本,用样本来估计总体情况。

举一个简单的例子:

学而思网校App进行了改版迭代,现在有以下两个版本:

  • 版本1:首页为一屏课程列表 ;
  • 版本2:首页为信息流。

如果我们想区分两个版本,哪个版本用户更喜欢,转化率会更高。

我们就需要对总体(全部用户)进行评估,但是并不是全部存量用户都会访问App,并且每天还会新增很多用户,所以我们无法对总体(全部用户)进行评估,我们只能从总体的用户中随机抽取样本(访问App)的用户进行分析,用样本数据表现情况来充当总体数据表现情况,以此来评估哪个版本转化率更高。

假设检验定义

假设检验是先对总体参数提出一个假设值,然后利用样本信息判断这一假设是否成立。

假设检验的假设

由定义可知,我们需要对结果进行假设,然后拿样本数据去验证这个假设。

所以做假设检验时会设置两个假设:

一种叫原假设,也叫零假设,用H0表示。原假设一般是统计者想要拒绝的假设。原假设的设置一般为:等于=、大于等于>=、小于等于<=。

另外一种叫备择假设,用H1表示。备则假设是统计者想要接受的假设。备择假设的设置一般为:不等于、大于>、小于<。

例子在进行假设检验时,我们希望接受版本2的假设,想拒绝接受版本1的假设。所以我们的假设设置为:H0 :μ版本1 >= μ版本2 ,H1 : μ版本1 < μ版本2。

为什么统计者想要拒绝的假设放在原假设呢?

因为原假设备被拒绝如果出错的话,只能犯第I类错误,而犯第I类错误的概率已经被规定的显著性水平所控制。

有点看不懂哈?没关系,我们讲一下假设检验中的两种错误和显著性水平就清楚了。