标准偏差(SD)是数据集中的数据如何变化的量度。 在数学上,它测量每个值与数据集的平均值的距离或接近程度。 接近0的标准偏差值表示数据点趋向于非常接近数据集的平均值,并且高标准偏差表示数据点在更宽的值范围上展开。
在SAS中,使用PROC MEAN以及PROC SURVEYMEANS测量SD值。
要使用proc测量SD,我们在PROC步骤中选择STD选项。 它为数据集中存在的每个数字变量输出SD值。
在SAS计算标准偏差的基本语法是:
PROC means DATA = dataset STD;
以下是所使用的参数的说明:
在下面的示例中,我们从SASHELP库中的CARS数据集创建数据集CARS1。 我们选择带有PROC平均值步骤的STD选项。
PROC SQL; create table CARS1 as SELECT make,type,invoice,horsepower,length,weight FROM SASHELP.CARS WHERE make in ('Audi','BMW') ; RUN; proc means data=CARS1 STD; run;
当我们执行上面的代码它提供了以下的输出:
该程序还用于测量SD以及一些先进的特征,例如测量分类变量的SD以及提供方差的估计。
使用PROC SURVEYMEANS的语法是:
PROC SURVEYMEANS options statistic-keywords ; BY variables ; CLASS variables ; VAR variables ;
以下是使用的参数的描述:
下面的示例描述了使用class选项为类变量中的每个值创建统计信息。
proc surveymeans data=CARS1 STD; class type; var type horsepower; ods output statistics=rectangle; run; proc print data=rectangle; run;
当我们执行上面的代码它提供了以下的输出:
下面的代码给出了BY选项的示例。 在其中,结果按BY选项的每个值分组。
proc surveymeans data=CARS1 STD; var horsepower; BY make; ods output statistics=rectangle; run; proc print data=rectangle; run;
当我们执行上面的代码它提供了以下的输出: