SPSS 13.0是一款非常好用的统计分析软件,集分析运算、数据挖掘、预测分析和决策一体。它可以根据实际需要和计算机的功能选择模块,导入相应数据库文件,对数据进行排序、筛选、分组、统计等操作,使用Windows的窗口方式展示各种管理和分析数据方法的功能。SPSS 13.0具有通用线性模型 (GLM) 和混合模型程序,包括广义线性模型 (GENLIN),包括广泛使用的统计模型,例如针对正态分布响应的线性回归、针对二元数据的逻辑模型,以及针对计数数据的对数线性模型。此外,它还包含广义估计方程 (GEE) 程序扩展了广义线性模型的能力,使它们能使用关联的纵向数据和聚类数据。SPSS 13.0还具有非线性模型功能,可将较为复杂的模型应用于数据。多项式逻辑回归 (MLR) 可预测具有两个以上类别的分类结果。二元逻辑回归可将数据分为两个组。非线性回归 (NLR) 和受限非线性回归 (CNLR) 可估算非线性模型的参数。SPSS 13.0还支持地理空间分析技术,可帮助揭示地理空间数据中隐藏的关系和趋势。Statistics Premium 中的地理空间分析技术可使线性模型适应 2D 和 3D 空间内位置随时间推移进行的度量,支持用户预测这些领域的长期变化趋势。SPSS 13.0还具有模拟功能,可以帮助分析人员自动模拟许多可能的结果(输入不确定时),同时改进风险分析和决策制定。蒙特卡罗模拟方法可以帮助您在现有数据不充分的情况下,根据现有的数据和/或已知的参数创建模拟数据集。可对非数值型变量(如“男”和“女”)进行模拟,无需将其记录为数值变量。
现有的预测模型和数据可以作为模拟分析的起点,包括从Automated Linear Modeling (ALM)和IBM SPSS Modeler导出的模型。在生成输入数据时,系统会自动确定并使用分类输入之间的关联。通过使用一组不同的随机值,反复计算结果,可以生成可能结果值的分布,从而使用户能够选择最优值。
SPSS Statistics工具可用于分析模拟结果,以直观的形式呈现结果以及为决策者推荐的行动。用户可以使用定制表功能来轻松理解其数据,并针对不同受众以不同风格快速汇总结果。当包含推论性统计信息时,可以根据人口统计组、客户群、时间段或其他分类变量进行平均值或比例比较。该软件可创建汇总统计信息(从针对分类变量的简单计数到离差测定),并按照使用的任何汇总统计信息对类别进行排序。它包括三种主要的测试:独立性卡方测试、列平均值比较(t 测试)和列比例比较(z 测试)。
交互式的表构建器提供拖放功能来创建数据透视表。它会排除特定类别,能显示缺少值的单元格,并将小计添加到表中。表可实时预览并在创建时进行修改。表可导出至Microsoft Word、Excel、PowerPoint或HTML,以便在报表中使用。
若要导入数据,请打开SPSS 13.0软件并进入SPSS图形操作界面。点击左上角的“文件”,在菜单中找到“打开”,然后选择“数据”。接下来在文件管理界面中选择所需的数据库文件类型。如果您要导入的是最常见的Excel文件,请在“查找范围”中选择存放Excel数据文件的文件夹,然后在下面的文件类型中选择Excel文件类型。完成这些步骤后,单击右侧的“打开”按钮即可打开Excel文件。在弹出的消息框中选择“确定”以打开文件。打开文件后,您就可以按照需求操作各种变量值了。这样一来,我们就成功地利用SPSS处理了Excel数据文件。
如果需要进行排序操作,可以根据排序变量的数量分为“单值排序”和“多重排序”。在多重排序中,第一个指定的排序变量为主排序变量,依次为第二个排序变量、第三个排序变量等,先以主排序变量为依据。调出相应的窗口后,选择“排序个案”,一行数据就是一个个案。第一个图片是原始的数据,即还没有排序的。
如何进行排序:
1. 选择相关变量作为“排序变量”。如果需要进行“多重排序”,只需选择多个变量即可,第一个变量即为“主排序变量”,第二个则是“第二排序变量”。
2. 在这里演示的是“单值排序”,即仅选择一个变量作为“排序变量”,并按照“升序”排列。最终呈现的数据将根据你的设定进行排列。
分组操作步骤:
第一步,数据录入
在Excel中创建一个新的数据文档,并将数据复制到SPSS软件中。设定好变量名称,如下图所示:
注意将【PV】这个变量定义为【数值型】,并选择【逗号】表示用千分位区分。
第二步,进入编码功能
点击【转换】-【重新编码为不同变量】。
第三步,选择编码变量
在这里选择【页面PV】,然后点击红圈中的箭头,将其选入右侧的变量框。
第四步,定义输出变量
新变量名为【PV_G】,标签为【PV分组】。
第五步,设定旧值和新值
输入口位于上图中的【旧值和新值】,进入后,会看到下面的界面,分为左右两大部分。左边是原有的旧值设定,右边是编码后产生的新值。开始编码,编码标准按照之前的分类。
指定旧值范围:第一组是0-10万,大于等于0且小于10万。因此,旧值部分是从最小值到99999。
注意:输出变量名称应为【0-10万】,勾选【输出变量为字符串】,并指定宽度(默认为8),我们将其设为12。原因是后面的结果需要更多的空间显示。
定义完成后,点击【添加】,依次为每个分组定义新的旧值和新值。最后一组通常定义为【范围,从最高值到无穷大】,以避免遗漏数据。正如第一组一样,我们需要将其定义为【范围,从最低值】。
定义好旧值和新值后,点击【继续】,返回设定页面。此时,【确定】按钮已激活,点击后即可完成编码。