综合评价方法及其医学应用(第2版)
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

第二章 评价指标选择与权重估计

第一节 评价指标的选择

一、评价指标选择的原则

在对事物进行评价时,通常要综合考察诸多因素的影响,确定评价的指标体系是基础。指标是根据研究目的和研究对象特征选取的,是能够表征研究对象某一方面特征的依据。评价指标体系是指由表征评价对象各方面特性及其相互联系的多个指标所构成的具有内在结构的有机整体。它能够综合反映研究对象根据研究目的确定的各个方面特征。指标体系的建立,要根据具体的研究目的和研究问题来确定。只有建立科学合理的评价指标体系,才有可能得出科学公正的综合评价结论。建立评价指标体系时,以下几条原则可供参考:

1.指标应具有简约性

指标宜简不宜繁。评价指标并非多多益善,过于冗长的指标体系,会增加评价的时间和成本,也可能会降低评价质量。

2.指标应具有独立性

指标要内涵清晰、相对独立。同一级别的各指标之间应尽量不相互重叠,不具相关性。

3.指标应具有代表性

指标应能很好地反映研究对象某方面的特征。研究对象通常包含若干特征,每一个特征可能由若干指标来表征。指标应对其所属特征具有较好的代表性。

4.指标应具有可比性

指标应能反映不同特征研究对象之间的差异。评价指标和评价标准的制定要能够体现不同特征对象的差异,便于比较。

5.指标应具有可行性

指标应具有可测性、可获得性。指标收集应易于操作和测量。评价指标含义要明确,数据要规范,资料收集要简便易行。

二、评价指标选择的方法

选择评价指标的方法有很多,大致分为主观选择法和客观选择法,本章介绍以下几种常见方法。

(一)凭经验选择评价指标

即根据有关的理论和实践知识,来分析各个指标对评价结果的影响,“系统分析法”是一种常用的凭经验挑选指标的方法,这种方法从整体出发,将与评价结果有关的诸指标按系统(或属性、类别)划分,在对各系统的指标进行分析的基础上,通过座谈的方法或填写调查表的方法获得各指标的专家评分,确定其主次,再从各系统内挑选主要的指标作为评价指标。在缺乏有关历史资料,或指标难于数量化时,此法可较简便地确定评价指标集。此外,尚可采用“文献资料分析优选法”,即全面查阅有关评价指标设置的文献资料,分析各指标的优缺点并加以取舍。

(二)用单因素分析法挑选评价指标

在掌握有关历史资料的基础上,对所有可能的指标逐个进行单因素分析,依据可能的评价结果进行分组,并逐个进行单因子的假设检验,挑选那些在某一概率水准上有统计学意义的指标作为评价指标。或者将各指标与可能的评价结果进行简单相关分析,挑选那些与所属概念相关性较好的指标作为评价指标。该法较为直观简便,但缺乏对所有影响因子的全盘考虑,忽略了评价指标间的相互作用,因此最好结合其他方法使用。

(三)用多元相关分析法挑选评价指标

即所谓相关度分析。在掌握有关历史资料的基础上,以全体可能的评价指标作为自变量,以可能的评价结果作为应变量进行多元线性相关分析,计算各指标的标准化偏回归系数。一方面,可根据偏相关系数的绝对值大小将各指标排序,另一方面,可逐个对这些偏相关系数进行假设检验,挑选那些偏相关系数在某一概率水准上有统计学意义的影响因子作为评价因子。这种方法既考虑到各影响因素的单独作用,又考虑到各影响因素间的相互关系,无疑是一种效率较高的指标选择方法。

(四)用多元回归与逐步回归方法挑选评价指标

在掌握有关历史资料的基础上,以全体可能的评价指标作为自变量,以可能的评价结果作为应变量进行多元线性回归分析,计算诸影响指标的标准化偏回归系数,依据其绝对值大小,可将诸影响指标排序;或对计算出的偏回归系数逐个进行假设检验,在某一概率水准上挑选那些对评价结果作用显著的指标作为评价指标。逐步回归是多元回归的发展和深化。它是在考虑对回归平方和贡献大小的基础上,逐个选入或剔除自变量,在最终建立的回归方程中,只包含那些对应变量作用显著的自变量,因而本方法有自动挑选主要影响指标的功能,是目前最常用的指标挑选方法。

(五)用岭回归方法挑选评价指标

所谓多重共线性是指一些自变量之间存在较强的线性关系,这种情况在实际应用中非常普遍,如研究高血压与年龄、吸烟年限、饮白酒年限等因素的关系,这些自变量通常是相关的,如果这种相关程度非常高,使用最小二乘法建立回归方程就有可能失效,引起下列一些不良后果:参数估计值的标准误变得很大,从而t值变得很小;回归方程不稳定,增加或减少某几个观察值,参数估计值可能会发生很大的变化;t检验结果不准确,误将应保留在方程中的重要变量舍弃;估计值的正负符号与客观实际不一致。在这种情况下,岭回归方法将是进行数据处理的较为理想的方法。

多重共线性是一种近似的线性相关现象,假定存在不全为零的常数Cii=1,2,…,m),使得公式(2-1)成立:

则称变量X1X2,…,Xm具有多重共线性。

对于成对变量的共线性,可用简单相关系数来考察,当简单相关系数值高达0.70以上时,就有共线性的可能;但多个变量的共线性,却不宜用此法识别,因为在任何两个变量间的简单相关系数都不大的情况下,仍有可能存在多重共线现象。检测数据中是否存在多重共线性的一般方法是,先求解自变量相关矩阵的特征值。如果出现特别小的特征值,例如比0.01还小,或者所有特征值倒数之和为自变量数的5倍以上时,就表明存在多重共线性。一个基于特征值的常用量称为条件数k,定义为(最大特征值/最小特征值)1/2,大的k值示意共线性,例如k≥30时,认为有共线性。此时不宜采用基于最小二乘法的回归分析,而应采用岭回归分析。

简单说来,岭回归就是用“1.0+K”(K>0)代替自变量相关矩阵中的主对角线元素“1.0”,以降低多元共线现象的影响。只要K值选择得当,岭回归不仅能减小多元共线性效应,而且岭估计比最小二乘估计可能更接近于真实的回归系数。

(六)用AIC信息量准则挑选评价指标

这是20世纪70年代初期提出的一种选择模型的方法,这个方法基于所谓AIC统计量:

所谓“模型最大似然值”,理解为Supfθxθ),此处fxθ)表示模型参数为θ时,观察结果x的密度函数。不同模型的选择,意味着θ的形状不同,因而Supfθxθ)也不同。式中第二项对模型中参数个数起约束作用,在“模型最大似然度”接近时,参数个数越少越好。

对满足正态假定的线性回归模型而言,上式经变换可得到:

式中n为观测次数或样品数;RSSp为模型中含p个自变量时的剩余平方和;p为模型中包含的自变量个数。

AIC准则归结为:选择评价指标子集p,使(2-3)式达到最小值。或者说,在各种自变量的组合中,挑选使AIC为最小的那个组合作为挑选的评价指标子集。

(七)用指标聚类法挑选评价指标

在存在众多指标的情况下,可将相近指标聚成类,然后每类找一个典型指标作为该类指标的代表,从而用少量几个典型指标作为评价指标代替原来众多的指标建立评价模型。具体实施步骤请参考有关专著。

在实际工作中,我们往往综合使用多种方法进行指标筛选,在获得较为满意的专业解释的基础上,优先考虑那些被多种方法同时选入的指标。