SPSS软件的学习心得提会范文
本学期是我在大学学习的最后一个学期。在这个学期里,学校根据我系专业特点开设了一些专业应用性课程,其中有一门课程便是SPSS。
SPSS的中文名称是社会科学统计软件包,是世界上最早的统计软件。我们学期学习所使用的软件为英文版,起初接触时由于我英语水平问题,SPSS软件的操作让我很是头疼。但是通过对这门课程的学习,我了解到SPSS具有完整的数据输入、编辑、统计分析、报表、图形制作等功能。在日常的工作与学习中,我所接触到的数据比较多,但是我想从中获得有用的数据却很难,通过SPSS软件应用,使我处理数据的时间大幅度的缩短,另外也能客观直接的对我所需要的数据进行简单分析。
在我平日课下进行统计调查技能培训的时候,我起初分析数据所用的软件是Excel。虽然使用Excel可以对数据进行透视、分类、筛选以及计算相关系数等,但是这些操作都需要自己每一步每一步的进行手动操作,而使用SPSS软件在对数据进行整理时,只需对软件某选项内设置变量条件,系统便自动的进行整理。而且,在学习与应用SPSS过程中,我了解到应用SPSS软件只要了解统计分析的原理无需知晓统计方法的各种算法就能得到自己所需要的统计分析结果。另外对于常见的统计方法,SPSS的命令语句、子命令及选择项的选择绝大部分在软件内的对话框操作完成,我们无需花费大量的时间记忆大量的命令和选择项。在这方面,SPSS软件的应用可以使我们节省大量时间,而且软件操作比较容易上手,在当今这个时间就是金钱的社会上,我们掌握SPSS软件的应用,也就是为自己赚取了不少金钱。
另外在与SPSS的接触中,我逐渐了解到SPSS软件的强大与方便。SPSS提供了从简单的统计描述到复杂的多因素统计分析方法,其中有数据的统计分析、统计描述、交叉表分析、二维相关、方差分析、多元回归、因子分析、聚类分析、降维等分析方法。利用这些方法可以得出计算数据和统计图形,看出数据的离散程度、集中趋势和分散程度,单变量的比重,还有对数据进行标准化处理。利用这个软件对问卷数据进行分析是极好的。虽然,这些方法大部分我还是不会使用,能够让我利用并成功分析的方法只有寥寥几种,但是这种简单便捷的操作让我对SPSS的兴趣却是越来越浓。
这门课程是我们这学期从始至终一直开设的课程,在课堂上我们的导师马杰老师针对各种案例对我们进行讲解,让我们了解SPSS的各种应用,在课下系内陈主任对我进行指点,让我能够利用多种SPSS的方法进行数据处理与数据分析。
现在,学期即将结束,同样的这门课程也到了尾期,在这学期学到了很多,并且还有很多没有学到。我们学习时所操作的软件是英文版,这对英语基础不好的我来说是个考验。同时,由于我们所学专业并非必须拥有计算机,导致我们平时能够练习的机会比较少,造成了掌握不牢固,前学后忘现象比较严重。现在呢,很是希望能够把SPSS的应用熟练操作,并且能把它变为自己的一种本能,使自己在今后的工作与学习中,可以轻松运用。
一、什么是SPSS?为什么要学习SPSS?
新学期开始时,在信息化教育测量与评价的课程中第一次接触
到SPSS这个软件,作为本科是计算机专业出身的我,当时只知道SPSS是一套统计软件,就是一套根据统计学原理所编写出来的统计分析软件,至于统计什么?分析什么?我一无所知,尤其是看到老师推荐的《SPSS在教育统计中的应用》这本书的时候,就简单的把它理解为用SPSS软件来统计、分析与教育相关的数据,最终得出想要的结论而已,而现在看来,我当初的想法未免有点简单与无知。下面就来让我们了解一下SPSS。SPSS软件是一组专业的、通用的统计软件包,同时它也是一个组合式软件包,兼有数据管理、统计分析、统计绘图和统计报表功能。它广泛用于教育、心理、医学、市场、人口、保险等研究领域,也用于产品质量控制、人事档案管理和日常统计报表等。SPSS软件对计算机硬件系统的要求较低;对运行的软件环境要求宽松,有各种版本可运行在WINDOWS XP、WIN7系统环境下, SPSS统计软件采用电子表格的方式输入与管理数据,能方便地从其他数据库中读入数据(如Dbase,Excel,Lotus等)。
我为什么要学习SPSS呢?其实很简单,一方面,做为一名
研究生,要具备一定的科研能力,如今量化研究的方法大行其道,一切要以事实说话、要以数据说话,有了数据支持的研究才能更容易被认可、被推论。另一方面,根据对AECT94定义的理解,教育技术
学研究的对象是学习过程和学习资源,包含大量的偶然现象和非精确现象。因此,要深入研究教育技术现象及其规律,必须运用统计描述、统计分析方法和模糊数学分析方法,才可能使这门学科达到真正完善的地步。教育技术学研究的现象多数是偶然的现象,其变化发展往往具有几种不同的可能性,究竟出现哪一种结果,那是带有偶然性的,是随机的。这类偶然现象是遵循统计规律的,当随机现象是由大量的成份组成,或者随机现象出现大量的次数时,就能体现统计平均规律。我们只有对数据资料作统计处理,才可能可以发现它们的内在规律,掌握现象的特征,检验研究的假设,才能得出准确的、可靠的研究结果。
二、对本SPSS各章节学习的心得
新课程老师带领下,采取一种新的学习方式,老师讲解了基础部分后,全班同学采取小组分工、协作学习,然后对全班同学进行讲解学习内容,教师进行当堂指导,这种方法改变了同学们的学习态度,同学们不再是课前不预习,课下不复习的.状态,每组都有自己的任务,课前有一定的压力,同学间的讨论也明显的增多,例如:一次课下同学们在一起吃饭,有几位同学还在调侃说“两个菜之间用SPSS进行分析后得出的结果不接受H0假设,也就是两个菜之间不相关”,虽然这只是一个课下的玩笑,但是这也可以体现出对学习的态度的转变。下面就本学期的所学SPSS的各章节做一下归纳,这些归纳也是基于本人平时在课前预习,课上及课后的一些所思所想,也许会有一些理解上的偏颇在内,但这仅限于心得而已。本学期学习各个章节及分工如下表:
章节名称
1.SPSS的认识
及数据文件的
处理
2.数据清理与
基本统计及测
量质量分析
3.T检验
4.方差分析
1、 2人 3人 7.聚类分析 8.统计图形 2人 1人 2人 6.卡方检验 3人 2人 5.相关分析 3人 分工人数 章节名称 分工人数
可能是由于是同学们第一次讲,万事开头难,压力很大,在大家认为最为简单的内容讲解上,两位同学并没有完全展现出二人实际水平,大家在这一节课上都感觉到很压抑,总的感觉是这节内容很简单,但是内容又很松散,可讲的东西太多,讲的东西多就没有突出重点和难点,所以听过之后就有种无数的碎片漂浮在脑海中一样,很难将知识系统化,课后总结一下无非就是两块,一块是了解SPSS软件的历史及基本功能,还有一块就是SPSS软件当中一个模块叫做数据文件的处理,在认识SPSS软件当中了解到它是一组社会科学统计软件包,诞生于1968年,当时美国的3位大学生开发出了它,经过这么多年的后续开发,SPSS已经有了很多的版本,具有了更的兼容性、和更友好的操作界面,也在很多的学科领域得到了应用,而在教育中的应用
只是它的一个分支。此外它对硬件的要求也很低,当前一般的电脑都能安装它,安装的过程中也没有什么特殊的方法,傻瓜式的安装方式完全就可以满足。在数据文件的处理方面,主要是要学会定义变量、处理变量两方面;定义变量是要注意根据自己实际采集的数据来定义变量,例如是数值型的变量还是文本型的变量及变量的长度,小数点保留尾数等,总之就是一句话,根据实际调查的数据要求来定义相应变量。变量定义只有只要细心的将实际调查的数据录入到SPSS当中即可,当然也可以在SPSS软件之外进行数据编制,可以通过EXECEL等编辑后可以直接导入到SPSS中。在处理变量模块当中,可以对变量进行添加、删除、拆分与合并等操作,只要根据实际调查数据,细心调整变量,使操作更加简便和明了。
2、 数据清理与基本统计及测量质量分析的心得体会
数据的清理与基本统计及测量质量分析由两名同学进行讲解,由于吸取了上节课两名同学的经验,本节讲授的明显好于上节课,这里我也是把它分为两块进行学习,一块是数据的清理,另一块是相关统计理论的学习。在数据清理方面主要学习了奇异数据的检查与清理,在这里本人觉得非常有必要进行数据清理,在实际的调查数据时难免会出现错误或者碰到极为特殊的典型案例,所以这些数据很难符合大众规律,在统计、分析过程中可能会造成分析结果异常,从而直接影响最终的结论。所以觉得非常有必要进行数据检查与清理。而我认为本节的难点不是怎样熟练运用SPSS软件,而是在第二块中的,相关统计理论的学习,学习这些理论需要一定的数学基础,只有明确这些
理(论如均值、标准误差、中数、众数、全距、四分位等)原理,知其然,知其所以然,这才是关键,在SPSS中想要实现对数据进行以上分析只需要轻轻点击一下按钮就可以是轻松实现,但是如果不清楚到底用它们来做什么就无从谈起做数据分析了,所以本节内容知道分析原理的重要性要远远大用SPSS对数据做出相关分析的重要性。总结为一句话“知道它们是做什么的后才会让它们去做该做的工作”。
3、 T检验的心得体会
T检验由两名同学讲解,在学习T检验时,首先要明确什么样的数据适合T检验,T检验的结果要说明什么问题?经过学习可以知道,T检验是对两组数据间的平均水平或均数的比较,通过比较可以得出两组数据间的显著性水平,而这两组数据都要符合正态分布,方差具有齐同性,T检验由两种情况,一种配对提检验,要求两组数据不可以独立颠倒顺序,如果颠倒顺序就会改变问题的性质,这种T检验称为配对T检验;另一种情况下的T检验是两组数据可以任意颠倒顺的检验称为独立样本的T检验。但是这两种情况都必须符合最先的要求,即都是符合正态分布,方差都具有齐同性。通过SPSS的相关操作可以轻松完成检验,但是在检验的过程中必须设置置信区间,一般设置为95%,在设置置信区间时必须要考虑到所做分析的数据,如果像要得到显著性差异的结果则可尽量将置信区间设置小些,如果想要得到不显著差异就要将置信区间甚至大些,本人的理解为若置信区间小,则可以理解为在小范围内是可以相信的,但如果将分析结果的置信区间值调大则说明在很大的范围内这个结果可信,反之则不可信。