优质实用课件推选气候统计判别分析与聚类分析.ppt
《优质实用课件推选气候统计判别分析与聚类分析.ppt》由会员分享,可在线阅读,更多相关《优质实用课件推选气候统计判别分析与聚类分析.ppt(64页珍藏版)》请在启牛文库网上搜索。
1、判别分析与聚类分析判别分析与聚类分析执教教师:XXX 在多元统计分析中,广泛使用一种统计应用方法,在多元统计分析中,广泛使用一种统计应用方法,即根据表征某一事物或现象类型的随机变量的取值即根据表征某一事物或现象类型的随机变量的取值样本分布,将事物或现象划分为若干类型。例如,样本分布,将事物或现象划分为若干类型。例如,在气候分析中,需将气候划分成若干类型,干旱气在气候分析中,需将气候划分成若干类型,干旱气候,湿润气候,半干旱气候等,究竟划分几类?选候,湿润气候,半干旱气候等,究竟划分几类?选择湿度、相对湿度、降水量、蒸发量等气候要素为择湿度、相对湿度、降水量、蒸发量等气候要素为指标,根据样品的相
2、近程度,划分为若干种类型,指标,根据样品的相近程度,划分为若干种类型,这称为这称为聚类分析;聚类分析;数量统计上,数量统计上,即分析众多的样本即分析众多的样本 划分确认来自几个不同的总体划分确认来自几个不同的总体。 另外,气候分析中,类型分类已知,介于两者之另外,气候分析中,类型分类已知,介于两者之间的某站,则需根据两种类型(总体)的特征和该间的某站,则需根据两种类型(总体)的特征和该站要素(样本)来判断该站的属类;在天气预报中,站要素(样本)来判断该站的属类;在天气预报中,有时需要根据前期的样本观测值来判断哪种现象有时需要根据前期的样本观测值来判断哪种现象(晴,阴,雨)或现象等级(火险等级(
3、晴,阴,雨)或现象等级(火险等级1、2.5)将)将出现,则称为出现,则称为判别分析判别分析,也称为,也称为统计分辨法统计分辨法。 判别分析与聚类分析均属数字分类。判别分析与聚类分析均属数字分类。 3.1 3.1 费歇(费歇(FisherFisher)判别准则与分)判别准则与分析析一、一、Fisher判别准则判别准则 判别分析是已知有两个或更多的总体(类型),并且获得判别分析是已知有两个或更多的总体(类型),并且获得每个总体中的若干样本,根据这些总体中的样本特征去建立一每个总体中的若干样本,根据这些总体中的样本特征去建立一种判别规则,使我们能将某个种判别规则,使我们能将某个新的个体新的个体归属正
4、确的归属正确的总体总体,而事,而事先并不知道该个体来自哪个总体。先并不知道该个体来自哪个总体。 若需要判别的对象有两种可能的结局,则若需要判别的对象有两种可能的结局,则称为称为二级判别二级判别;有两种以上可能结局,则称;有两种以上可能结局,则称为多级判别。二级判别又称为多级判别。二级判别又称简单判别简单判别。 设设x x为与天气状况有关的变量,而天气状况为与天气状况有关的变量,而天气状况分为分为A A与与B B两种状况(晴,阴雨)两种状况(晴,阴雨),x,x的样本空间的样本空间由有利由有利A A的样本集合与有利的样本集合与有利B B的样本集合组成。的样本集合组成。 越大时,判别效果越好,错判率
5、越低。越大时,判别效果越好,错判率越低。作为判别指标,作为判别指标,而而取决于下列因素取决于下列因素1 1、指标、指标x x在两总体的期望值差异在两总体的期望值差异 越大,则越大,则越大,判别时,错判概率越小越大,判别时,错判概率越小2、x的离散程度越小,的离散程度越小,x来自两不同总体的概率差来自两不同总体的概率差 越大。越大。 综上所述,综上所述,离散程度小,期望值差异大,表明两离散程度小,期望值差异大,表明两总体样本重叠部分少,总体样本重叠部分少,x出现时事件(类型)的出现出现时事件(类型)的出现概率差就大,以指标判别类型时,错判率自然小,概率差就大,以指标判别类型时,错判率自然小,即两
6、总体最大分离的原则,这就是费歇判别准则即两总体最大分离的原则,这就是费歇判别准则: 希望用一个综合指标希望用一个综合指标y,它在两总体中方差最它在两总体中方差最小,而条件期望值差异最大小,而条件期望值差异最大。 影响因子是复杂的,单个气象要素指标效果不佳影响因子是复杂的,单个气象要素指标效果不佳,可采用多个,可采用多个的要素线性组合成一个综合指标:的要素线性组合成一个综合指标: 称为称为Fisher判别函数判别函数,称为判别系数。称为判别系数。利用历史资料,根据利用历史资料,根据Fisher准则,推断判别系准则,推断判别系数。数。以以为例,说明其几何意义为例,说明其几何意义1、2两总体均存在较
7、大重叠部分,若将样本投两总体均存在较大重叠部分,若将样本投影到直线影到直线l上,则两总体重叠部分显著减少,上,则两总体重叠部分显著减少,能相对最大分离。能相对最大分离。 在两总体的样本空间寻找一个最在两总体的样本空间寻找一个最佳投影方向,将样本在该方向投影佳投影方向,将样本在该方向投影后,两总体能够最大分离。后,两总体能够最大分离。二、线性二、线性Fisher判别方程的建立判别方程的建立设有设有A出现条件下,出现条件下,X1xm的的N1次观测值,次观测值, B出现条件下,出现条件下, X1xm的的N2次观测值次观测值构造判别方程构造判别方程按照按照Fisher准则,应有:准则,应有:将代入代入
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 优质 实用 课件 推选 气候 统计 判别分析 聚类分析