两 独立样本t检验原理及软件实现

理论解释
关于假设检验的原理,参见如下文章,直接点击蓝色字体即可跳转至相应文章 。
案例说明
表1 中记录的是两个公司的部分员工的月收入数据,问:这两个公司的员工月收入是否有显著差异 。
公司133223456378631983789公司237323623354838744123公司130422990304530163088公司230883042299030453016公司133523645432940904012公司231983789364543294090公司130883888388736673564公司230164897467845324400公司136454329409040123088公司249995089432940904012公司129993456378932103343公司230883888388760193786公司130883042299030453016公司240123088304229903045公司137213732362335483874公司239994487449051393667表1 两个公司员工月收入数据
SPSS实现
在SPSS中导入或者录入数据,然后依次点击分析<均值比较<独立样本t检验,如下图所示,将月收入选入“检验变量” , 将公司选入“分组变量”,并点击“定义组”按钮,输入两个公司的代号 。如果分组变量是连续型变量,比如年龄,可以将40岁作为一个分割点 , 40岁以下算青年,40岁以上中年(职场上一般只有20到60岁的人) 。输入完毕后,点击确定

两 独立样本t检验原理及软件实现

得到结果中 , 同样包含描述性统计量,此处不再解释 。直接来看独立样本t检验的结果 。如表2所示,置信区间已经截去,只保留了t检验部分 。在SPSS中,进行独立样本t检验时 , 首先会进行方差齐性的检验,如果方差相等采用一种方法计算t统计量 , 如果方差不相等,则采用另外一种方法计算t统计量 。方差齐性检验的原假设与备择假设分别是:
两 独立样本t检验原理及软件实现

来看表2中的方差齐性检验的sig值,sig=0.004<0.05,因此拒绝原假设,认为方差不齐,选择第二行来查看t检验结果 , sig=0.004<0.05,也拒绝了t检验的原假设(两个公司员工月收入相等),所以认为两个公司月收入差异显著 。
两 独立样本t检验原理及软件实现

表2 独立样本t检验结果
R语言实现
下面给出该案例的R语言实现 。当使用这段代码时 , 只需要将数据文件的地址改成自己的数据文件地址,并修改变量名称即可 。
t_test03<-read.csv(file="D:/两独立样本t检验salary.csv",
header=TRUE)
t.test(t_test03$公司1月收入,t_test03$公司2月收入,
alternative=c("less"), #将“less”改成“two.side”即可做双侧检验
#可以根据具体的检验结果改这个参数的值
mu=0,paired=FALSE,
var.equal=TRUE,
conf.level=0.95
)
分析结果:
Two Sample t-test
data:t_test03$公司1月收入 and t_test03$公司2月收入
t=-2.9898, df=78, p-value=0.001866
alternative hypothesis:true differenceinmeans is less than 0
95 percent confidence interval:
-Inf-176.2655
sample estimates:
mean of x mean of y
3497.350 3895.025
【两 独立样本t检验原理及软件实现】p-value=0.001866<0.05拒绝原假设,选择备择假设:alternative hypothesis:true differenceinmeans is less than 0 。结论是公司1的员工月收入显著低于公司2 。

相关经验推荐