1、 考点二十考点二十 统计与统计案例统计与统计案例 一、选择题 1对四组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,正确的是( ) Ar2r40r3r1 Br4r20r1r3 Cr4r20r3r1 Dr2r40r1r3 答案 A 解析 易知题中图(1)和图(3)是正相关,图(2)与图(4)是负相关,且图(1)与图(2)中的样本点集中分布在一条直线附近,则 r2r40r36.635 可知,我们有 99%以上的把握认为“爱好该项运动与性别有关” 7(多选)(2020 山东泰安五模)在疫情防控阻击战之外,另一条战线也日渐清晰恢复经济正常运行国人万众一心,众志成城,防控疫情、复工复产,某企
2、业对本企业 1644 名职工关于复工的态度进行调查, 调查结果如图所示, 则下列说法正确的是( ) Ax0.384 B从该企业中任取一名职工,该职工是倾向于在家办公的概率为 0.178 C不到 80 名职工倾向于继续申请休假 D倾向于复工后在家办公或在公司办公的职工超过 986 名 答案 BD 解析 对于 A,x1005.117.842.334.8,A 错误;对于 B,倾向于在家办公的人员占比为 17.8%,故对应概率为 0.178,B 正确;对于 C,倾向于继续 申请休假人数为 16445.1%84,C 错误;对于 D,倾向于在家办公或在公司办公的职工人数为 1644(17.8%42.3%)
3、988,D 正确故选 BD. 8(多选)(2020 山东滨州三模)2020 年 3 月 12 日,国务院新闻办公室发布会重点介绍了改革开放 40 年, 特别是党的十八大以来我国脱贫攻坚、 精准扶贫取得的显著成绩,这些成绩为全面脱贫初步建成小康社会奠定了坚实的基础下图是统计局公布的 20102019 年年底的贫困人口和贫困发生率统计图 则下面结论正确的是( ) 年底贫困人口的线性回归方程为y1609.9x15768(其中 x年份2009), 贫困发生率的线性回归方程为y1.6729x16.348(其中 x年份2009) A20102019 年十年间脱贫人口逐年减少,贫困发生率逐年下降 B2012
4、2019 年连续八年每年减贫超过 1000 万,且 2019 年贫困发生率最低 C20102019 年十年间超过 1.65 亿人脱贫,其中 2015 年贫困发生率低于6% D根据图中趋势线可以预测,到 2020 年底我国将实现全面脱贫 答案 BD 解析 每年脱贫的人口如下表所示: 期初 期末 脱贫人口 2009 年年底至 2010 年年底 16566 2010 年年底至 2011 年年底 16566 12238 4328 2011 年年底至 2012 年年底 12238 9899 2339 2012 年年底至 2013 年年底 9899 8249 1650 2013 年年底至 2014 年年底
5、 8249 7017 1232 2014 年年底至 2015 年年底 7017 5575 1442 2015 年年底至 2016 年年底 5575 4335 1240 2016 年年底至 2017 年年底 4335 3046 1289 2017 年年底至 2018 年年底 3046 1660 1386 2018 年年底至 2019 年年底 1660 551 1109 由于缺少 2009 年年底数据,故无法统计十年间脱贫人口的数据,故 A,C 错误;根据上表可知,20122019 年连续八年每年减贫超过 1000 万,且 2019 年贫困发生率最低,故 B 正确;根据上表可知,20122019
6、年连续八年每年减贫超过1000 万,2019 年年底,贫困人口 551 万,故预计到 2020 年年底我国将实现全面脱贫,故 D 正确综上所述,正确的为 BD. 二、填空题 9(2020 江苏高考)已知一组数据 4,2a,3a,5,6 的平均数为 4,则 a 的值是_ 答案 2 解析 数据 4,2a,3a,5,6 的平均数为 4, 42a3a5620,解得 a2. 10总体由编号为 01,02,19,20 的个体组成,利用下面的随机数表选取7 个个体,选取方法是从随机数表第 1 行的第 3 列和第 4 列数字开始由左到右依次选取两个数,则选出的第 7 个个体的编号为_ 7816 6572 08
7、02 6314 0702 4369 9728 01983204 9234 4935 8200 8623 4869 6938 7481 答案 04 解析 由随机数表可看出所选的数字依次为 16,08,02,14,07,02,01,04,去掉重复数字 02,则第 7 个个体的编号为 04. 11(2020 宁夏吴忠模拟)随着养生观念的深入,国民对餐饮卫生条件和健康营养要求提高,吃烧烤的人数日益减少,烧烤店也日益减少某市对 2015 年到2019 年五年间全市烧烤店盈利店铺的个数进行了统计,具体统计数据如表: 年份 2015 2016 2017 2018 2019 年份代号(t) 1 2 3 4 5
8、 盈利店铺的个数(y) 260 240 215 200 180 根据所给数据,得出 y 关于 t 的回归方程y b t273,估计该市 2020 年盈利烧烤店铺的个数为_ 答案 165 解析 t 1234553, y2602402152001805219, 样本点的中心坐标为(3,219),代入ybt273, 得 2193b273,得b18. 线性回归方程为y18t273, 取 t6,得y186273165. 估计该市 2020 年盈利烧烤店铺的个数为 165. 12(2020 安徽蚌埠三模)某企业为了调查其产品在国内和国际市场的发展情况,随机抽取国内、国外各 100 名客户代表,了解他们对该
9、企业产品的发展前景所持的态度,得到如图所示的等高条形图,则_(填“能”或“不能”)有99%以上的把握认为是否持乐观态度与国内外差异有关 P(K2k0) 0.050 0.010 0.005 0.001 k0 3.841 6.635 7.879 10.828 附:K2n(adbc)2(ab)(cd)(ac)(bd). 答案 能 解析 根据题目所给数据得到如下 22 的列联表: 乐观 不乐观 总计 国内代表 60 40 100 国外代表 40 60 100 总计 100 100 200 则 K2200(60604040)210010010010086.635, 所以有 99%的把握认为是否持乐观态度
10、与国内外差异有关 三、解答题 13(2020 全国卷)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加为调查该地区某种野生动物的数量,将其分成面积相近的 200个地块, 从这些地块中用简单随机抽样的方法抽取 20 个作为样区, 调查得到样本数据(xi,yi)(i1,2,20),其中 xi和 yi分别表示第 i 个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得20i1xi60,20i1yi1200,20i1 (xi x)280,20i1 (yi y)29000,20i1 (xi x) (yi y)800. (1)求该地区这种野生动物数量的估计值(这种野生动物数量的估
11、计值等于样区这种野生动物数量的平均数乘以地块数); (2)求样本(xi,yi)(i1,2,20)的相关系数(精确到 0.01); (3)根据现有统计资料,各地块间植物覆盖面积差异很大为提高样本的代表 性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由 附:相关系数, 21.414. 解 (1)每个样区野生动物平均数为12020i1yi120120060,地块数为 200,所以该地区这种野生动物数量的估计值为 2006012000. (2)样本(xi,yi)的相关系数为 r20i1 (xi x)(yi y)20i1 (xi x)220i1 (yi y)280
12、08090002 230.94. (3)由于各地块间植物覆盖面积差异较大,为提高样本数据的代表性,应采用分层抽样, 先将植物覆盖面积按优、中、差分成三层, 在各层内按比例抽取样本, 在每层内用简单随机抽样法抽取样本即可 14(2020 山东泰安四模)某工厂为了提高生产效率,对生产设备进行了技术改造, 为了对比技术改造后的效果, 采集了技术改造前后各 20 次连续正常运行的时间长度(单位:天)数据,整理如下: 改造前:19,31,22,26,34,15,22,25,40,35,18,16,28,23,34,15,26,20,24,21 改造后:32,29,41,18,26,33,42,34,37
13、,39,33,22,42,35,43,27,41,37,38,36 (1)完成下面的列联表, 并判断能否有 99%的把握认为技术改造前后的连续正常运行时间有差异? 超过 30 不超过 30 改造前 改造后 (2)工厂的生产设备的运行需要进行维护,工厂对生产设备的生产维护费用包括正常维护费、保障维护费两种对生产设备设定维护周期为 T 天(即从开工运行 到第 kT 天,kN*)进行维护生产设备在一个生产周期内设置几个维护周期,每个维护周期相互独立在一个维护周期内,若生产设备能连续运行,则只产生一次正常维护费,而不会产生保障维护费;若生产设备不能连续运行,则除产生一次正常维护费外,还产生保障维护费经
14、测算,正常维护费为 0.5 万元/次;保障维护费第一次为 0.2 万元/周期,此后每增加一次则保障维护费增加 0.2 万元现制定生产设备一个生产周期(以 120 天计)内的维护方案:T30,k1,2,3,4.以生产设备在技术改造后一个维护周期内能连续正常运行的频率作为概率,求一个生产周期内生产维护费的分布列及均值 附:K2n(adbc)2(ab)(cd)(ac)(bd) P(K2k0) 0.050 0.010 0.001 k0 3.841 6.635 10.828 解 (1)列联表为: 超过 30 不超过 30 改造前 5 15 改造后 15 5 K240(551515)22020202010
15、6.635, 有 99%的把握认为技术改造前后的连续正常运行时间有差异 (2)由题知,生产周期内有 4 个维护周期,一个维护周期为 30 天,一个维护周期内,生产线需保障维护的概率为 P14. 设一个生产周期内需保障维护的次数为 ,则 B4,14;一个生产周期内的正常维护费为 0.542 万元,保障维护费为0.2(1)2(0.120.1)万元 一个生产周期内需保障维护 次时的生产维护费为(0.120.12)万元 设一个生产周期内的生产维护费为 X, 则 X 的所有可能取值为 2,2.2,2.6,3.2,4. P(X2)114481256, P(X2.2)C141143142764, P(X2.
16、6)C24114214227128, P(X3.2)C34114 143364, P(X4)1441256. 一个生产周期内生产维护费的分布列为 X 2 2.2 2.6 3.2 4 P 81256 2764 27128 364 1256 E(X) 281256 2.22764 2.627128 3.2364 41256162237.6140.438.44256582.42562.275. 一个生产周期内生产维护费的均值为 2.275 万元 一、选择题 1某公司有员工 15 名,其中包含经理一名,保洁一名为了调查该公司员工的工资情况,有两种方案,方案一:调查全部 15 名员工的工资情况;方案二:收入最高的经理和收入最低的保洁工资不纳入调查范围, 只调查其他 13 名员工的工资这两种调查方案得到的数据,一定相同的是( ) A中位数 B平均数 C方差 D极差 答案 A 解析 将 15 名员工的工资从低到高排列时, 处在中间位置的数据与去掉一个最高和一个最低数后中间位置的数据一定是同一个,故一定相同的是中位数,而平均数,方差和极差均可能不相同,故选 A. 2为比较甲、乙两名学生的数学素养,对课