浅论统计研究中的统计数据及其获得方法0

减小字体 增大字体 作者:王天宝  来源:www.zhonghualunwen.com  发布时间:2010-11-29 19:13:21

1数据的类型

在研究一个总体时.所要研究的每个特征(指标或变量),在每个个体上,都有一个反映该特征的具体描述(数字或文字),这些特征的具体描述被称为指标值(变量值)或数据。数据可以是定量的.例如工资收入,也可以是定性的,例如性别,还可以是半定量的,如受教育程度。定量数据和定性数据是对数据的一种分类,详细划分如下。

1.l刻度级数据

这是数据的最高级,该级别的数据.只能用数字来表示,是具有一定单位的实际测量值。它又可分为两个子级别:比率级和间距级。

比率级是数据的最高级的测度级别.这类数据可以做加减运算,也可以作乘除运算,间距级的数据可以做加减运算.但不能够做乘除运算,例如采用摄氏温度时.不能说10度是5度的2倍,因为将这两个摄氏温度换算为热力学温度后.这两个温度便不再是2倍的关系。

1.2序次级数据

这是数据的中间级,该级别的数据,可以用数字来表示,也可以用字母来表示。例如受教育程度就是序次级数据.它可以采用数字编码表示不同的类型,小学学历=1.初中学历=2;高中或中专=3;本科学历=4;研究生学历=5,各编码的序值.代表了受教育程度的高低差异。当然,也可以倒过来表示不同的学历等级,信息也不会有损失。这类数据虽然不能准确描述这一差别的大小,但是可以确定其顺序.如例子中如果知道了研究生学历高于本科学历,则能够推出本科学历高于高中学历。

1.3名义级数据

这是数据的最低级,该级别的数据.可以用数字来表示也可以用字母来表示。它仅仅是一种标志,用以区分数据的不同值,但没有序次的关系。例如,性别就是一个名义级的数据,可以用0表示男性.1表示女性:也可以用0表示女性.1表示男性:或是可以用任意两个不同的数码.或者文字表示类别。不论上述哪一种编码,变量所包含的信息都没有任何损失。

2不同类型的数据的用途

数据的不同类型,其实也是变量的不同类型。在统计分析中,不同测度类型的数据.扮演着不同的角色,起着不同的作用。一般来说,数据的等级越高,应用范围越广泛:等级越低,应用范围越受损。

2.1作为统计对象直接进入统计处理

首先.不同测度类型的数据都可以作为被统计对象直接进入统计处理。例如.刻度级中的比率级数据可以用来做回归分析,可以计算普通相关系数;区间级以上的数据可以用来计算均值:次序级数据可以用来计算等级的相关系数:名义级数据可以用来做相应变量的独立性分析。例如,当我们获得不同文化程度的顾客对不同包装的偏爱数据后.我们可以用统计方法来分析两个变量(文化程度、喜爱的包装类型)是否相关。这里“文化程度”是次序级变量,“包装类型”是名义级变量。需要注意的是,在不同的统计处理中,对数据的测度类型的最低要求是不同的。

2.2作为样本分类的依据

首先.名义级变量的数据,通常是样本分类(分组)的依据,即名义级变量通常作为分类变量来使用。例如,“性别”把被调查的数据分为男女两组,在获得某单位的职工的工资数据后,要看男职工的平均工资与女职工的平均工资有无显著差别,就要用性别变量对职工分类.以便统计不同组的平均工资值。

其次,序次级数据也可作为分类变量来使用。例如,“受教育程度”就可以作为分类的依据,如小学以上文化程度组、中学文化程度组、本科文化程度组。

再次.刻度级的数据也可以作为分类依据。例如,把被调查男生的身高分为若干段.1,6m以下为一段;1.6—1.7m为一段:1.7—1.8m为一段:1.8m以上为一段.这样就把被调查者男生分成了4组。

3利用SPSS进行数据处理的案例分析

SPSS是社会科学统计软件包的缩写.其应用领域非常广泛。在宏观经济管理领域、企业经营管理领域、行业管理与特征分析、社会学、民族学、人类学、医学、农学、工学、军事学领域都发挥重要作用。下面利用SPSS统计分析软件,对数据处理进行简要分析。

案例:某班级的学生的身高数据,如表1所示,现在要求如下:

(1)利用SPSS对这一班级所有的身高进行排名次.

(2)将这个班级的同学分为男女两组后,再分别对身高进行排序。

3.1利用SPSS对这一班级所有的身高进行排名次的操作

利用sPss读人表1数据后.从主菜单的Transform开始.依次点击Transform-Rank case,这时候会弹出一个窗口如图1给数据排名次的数据窗口,要求你所左边框中的变量清单中.选取所要排序的变量.因为是对班级所有成员的身高进行排名次.因此选择“身高”,接下来,用窗口中间的位置较高的箭头,把选中的变量送入右边的Variable的框中(下面的By:用于分组排序,将在要求(2)中用到),一切准备好后,点击OK。

点击OK后,SPSS会在原变量前面,加一个R作为排序结果的变量名.编辑窗口也会显出所选中变量的排名情况.如图2所示,SPSS会自动赋予排序结果的变量名R身高,R身高就是重新排名的情况。需要说明的是,如果有两个第一名,SPSS就会假设其中一个是1,一个是2,然后把这两个名次加起来,再除以同名次的个体个数,于是这两个排名都是1.5名.如图2中姓名为“7”和“9”的两个人.如果有两个第一名.接下去的就只能是排在第三名而不是第二名。以后的名次,都此次类推。在本例中.会有3个第9名.也就是说第8、9、10名是并列的。

[1] [2]  下一页

Tags:

作者:王天宝
  • 好的评价 如果您觉得此文章好,就请您
      0%(0)
  • 差的评价 如果您觉得此文章差,就请您
      0%(0)

文章评论评论内容只代表网友观点,与本站立场无关!

   评论摘要(共 0 条,得分 0 分,平均 0 分) 查看完整评论