数据的分析同步练习
课前小练:
1. 在学校开展的“争做最优秀中学生”的一次演讲比赛中,编号1,2,3,4,5的五位同学最后的成绩如下表所示:
参赛者编号 1 2 3 4 5
成绩/分 96 88 86 93 86
那么这五位同学演讲成绩的众数是__________,中位数是___________。
2. 甲、乙两名同学进行射击训练,在相同的条件下各射靶5次,成绩统计如下:
命中环数 7 8 9 10
甲命中相应环数的次数 2 2 0 1
乙命中相应环数的次数 1 3 1 0
(1)分别计算甲、乙两人5次射击环数的平均数;
(2)分别计算甲、乙两人5次射击环数的方差;
(3)如果要选一名成绩稳定的同学进行省级比赛,请问你会选择谁?
知识点回顾:
知识点一:平均数
算术平均数
一般地,对于个数,我们把叫做这个数的算数平均数,简称平均数,记作,即。算数平均数反映了一组数据的_________,是描述一组数据的__________的量。
【提示】:
(1)一组数据的平均数是唯一的,与数据的排列顺序无关;另外平均数的单位与原数据的单位一致。
(2)已知一组数据的平均数是,则的平均数是。
(3)平均数、数据的个数以及所有数据的总和这三个量中,已知任意两个就能求出第三个:
(4)总体中所有个体的平均数叫做总体平均数,样本中所有个体的平均数叫做样本平均数,通常用样本平均数去估计总体平均数。
2. 平均数的计算方法
(1)定义法:如果有个数,那么
(2)新数据法:当所给的数据大部分在某一常数(通常取接近于这组数据的平均数的较“整”的数)上下波动时,可计算各数据与的差:,,,... ,,则
加权平均数
一般地,在个数据中,如果数据出现的次数分别是,其中,那么这个数据的平均数为_______________,这个平均数叫做这组数据的_______________,数据分别出现的次数分别叫做数据的_______________,即_____________.
【提示】:
加权平均数中的“权”表示各个数据的比重不同,反应了各个数据在这组数据中的重要程度不一样,权数越大,数据越重要。
(2)求算数平均数时,各项的权相等;求加权平均数时,各项的权一般不相等。
(3)在具体的实际问题中,权的表现形式通常有三种,①各个数据出现的次数;②比例的形式;③百分数的形式。
4. 平均数的性质
若一组数据的平均数是,则:
(1)一组数据的平均数是(是常数)
(2)一组数据的平均数是(是常数)
(3)一组数据的平均数是(是常数)
算数平均数和加权平均数的异同
算数平均数是加权平均数的一种特殊情况(即各项的权相等),在实际问题中各项权不相等时,计算平均数就要采用________________;当各项权相等时,计算平均数就要采用________________;两者不可混淆。
例1:某单位欲从内部招聘管理员一名,对甲、乙、丙三名候选人进行了笔试和面试两项测试,三人的测试成绩如下:
测试项目 测试成绩
甲 乙 丙
笔试 75 80 90
面试 93 70 68
根据录用程序,组织200名员工对三人进行民主评议,三人得票数(没有弃权票,每位职工只能推荐一人)如图所示,每得一票记作1分。
请分别计算这三个人的民主评议得分;
如果根据三项测试的平均成绩确定录用人选,那么谁将被录用?(精确到0.01)
根据实际需要,单位将笔试、面试、民主评议三项测试得分按照4:3:3的比例确定个人的成绩,那么谁将被录用?
知识点二:中位数与众数
中位数:一般地,个数据按照大小顺序排列,处于正中间位置的一个数据(或正中间两个数据的平均数)叫做这组数据的___________________。
中位数的求法
一组数据的中位数是___________的,求中位数时,一定要将这组数据按从小到大(或____________)的顺序排列,如果一组数据的个数为________,则排序后___________的一个数据就是这组数据的中位数;如果一组数据的个数为________,则排序后最中间的___________就是这组数据的中位数。
【提示】:
(1)中位数在一组数据中是唯一的,可能是这组数据中的数据,也可能不是这组数据中的数据。
(2)中位数的单位与数据的单位相同。
(3)当一组数据中的个别数据变动较大时,可用中位数来描述这组数据的集中趋势。
3. 众数
一般地,一组数据中出现次数__________的那个数据叫做这组数据的众数。
【提示】:
(1)如果一组数据中有两个或两个以上的数据出现的次数并列最多,我们就说这些数据都是众数,但各个数据的重复次数大致相等时,众数往往就没有意义了。
(2)众数是一组数据中的某个或几个数据,其单位与数据的单位相同。
(3)众数是描述一组数据集中趋势的统计量,众数反映的是一组数据中各数据出现的频数。
4. 众数、中位数、平均数的区别与联系
联系:它们都反映了一组数据的______________。
区别:(1)___________的大小与这组数据里每个数据均有关系,任一数据变动都会引起它的变动。
(2)____________主要研究各数据出现的次数,其大小只与这组数据中的某些数据有关,当一组数据中某些数据__________出现时,我们往往关心众数。
(3)__________仅与数据的排列位置有关,某些数据的变动对它的中位数没有影响,当一组数据中的个别数据变动较大时,可用它来描述其集中趋势。
例2:甲、乙、丙三家个家电厂家在广告中都声称,他们的某种电子产品在正常情况下的使用寿命都是8年,经质量检测部门对这三家销售的产品的使用寿命进行跟踪调查,统计结果如下:(单位:年)
甲厂:4,5,5,5,5,7,9,12,13,15
乙厂:6,6,8,8,8,9,10,12,14,15
丙厂:4,4,4,6,7,9,13,15,16,16
请回答下列问题:
(1)分别求出以上三组数据的平均数、众数、中位数;
(2)这三个厂家的销售广告分别利用了哪一种表示集中趋势的特征数;
(3)如果你是顾客,宜选购哪家工厂的产品?为什么?
知识点三:从统计图分析数据的集中趋势
1. 统计图的分类
一般来讲,我们常接触的统计图:____________、____________、_____________、____________。
2. 描述数据集中趋势的量
____________、_____________、_____________都是描述数据集中趋势的统计量。其中以平均数最为重要,其应用也最为广泛。
3. 从统计图中读取中位数、众数、平均数
从条形统计图中读取 从扇形统计图中读取
众数 最高的长方形所对的横轴上的数就是众数 多占比例最大的部分对应的数,就是众数
中位数 确定中间位置的数是第个数,按从左往右的顺序依次计算纵轴对应的个数和,和为时对应的横轴上的数就是中位数(若处于中间位置的数有两个,则求这两个数的平均数) 按从小到大顺序计算所占百分比之和,和为50%和51%时对应部分的平均数是中位数
平均数 从统计图中读处各类数据,按平均数的计算公式计算即可
【提示】:
(1)条形统计图能清楚地表示处每个项目的具体数目,直条越高,对应的具体数目就越多。
(2)扇形统计图中,圆中的各个扇形代表总体中的不同部分,因此可直观地认为扇形大,则对应的部分就大,扇形小,则对应的部分就小。
(3)计算统计图中数据的平均数,大多计算的是加权平均数,对应的纵轴上的个数与扇形所占的百分比就是“权”
例3:为了了解学生的课外阅读情况,李老师随机调查了一部分学生,得到了他们上周双休日课外阅读时间(记为,单位:)的一组样本数据,其部分条形图和扇形图如下:
请补全条形图和扇形图;
试确定这组样本数据里的中位数和众数
估计全班学生上周双休日的平均课外阅读时间。
知识点四:数据的离散程度
1. 极差
①定义:极差是指一组数据中________________________________________________________.
②作用:极差是刻画数据离散程度(波动状况)的一个统计量。
一般而言,极差小,各个数据的波动也就_____,它们的平均数对这组数据一般水平的代表性也就____;极差大,各个数据的波动就_____,平均数的代表性也就____________。
③优缺点:极差计算简便,易于了解,但它的值是由数据中的两个极端值决定的,当个别极端值远离其他数据时,极差往往不能充分地反应全体数据的实际离散程度。
2. 方差与标准差
①方差是_________________________________________________________________________________,即,其中,是,,... ,的平均数,是方差。
②标准差就是方差的算数平方根,即:
③作用:一般而言,一组数据的方差或标准差越________,这组数据的平均数的代表性就越________,这组数据越稳定。
【提示】:
极差、方差、标准差都有单位,其中极差、标准差的单位与已知数据的单位相同,使用时应当注明单位;方差的单位是已知数据单位的平方,使用时可以不标注单位。
3. “三差”的应用
极差、方差、标准差都是刻画一组数据离散程度的统计量。
一般而言,一组数据的极差、方差或标准差越_______。这组数据就越_______;方差和标准差较极差更为精细地刻画了数据的波动状况。但这并不是绝对的,有时多数数据相对集中,整体波动水平较小,但个别数据的偏离仍可能极大地影响极差、方差或标准差的值,从而导致这些量度数值较大。因此在实际应用中应根据具体问题情景进行具体分析,选用适当的量度刻画数据的波动状况。
4. 有关方差、标准差的规律
若一组数据,,... ,的方差为,标准差为(为常数),则
(1)新数据,,... ,的方差为,标准差为
(2)新数据,,... ,的方差为,标准差为
(3)新数据,,... ,的方差为,标准差为
例4:市射击队为从甲、乙两名运动员中选拔一人参加省比赛,对他们进行了六次测试,测试成绩如下表(单位:环):
第一次 第二次 第三次 第四次 第五次 第六次
甲 10 8 9 8 10 9
乙 10 7 10 10 9 8
(1)根据表格中的数据,分别计算甲、乙的平均成绩;
(2)分别计算甲、乙六次测试成绩的方差;
(3)根据(1),(2)计算结果,你认为推荐谁去参加省比赛更合适,请说明理由。
达标测评:
已知小华上学期语文、数学、英语三科平均分为92分,他记得语文得了88分,英语得了95分,但是他把数学成绩忘记了,你能告诉他应该是一下哪个分数吗?( )
A. 93 B. 95 C. 94 D. 96
若一组数据2,3,4,5,的平均数与中位数相同,则实数的值不可能的是( )
A. 6 B. 3.5 C. 2.5 D. 1
“十年树木,百年树人”,教师的素养关系到国家的未来,某区招聘音乐教师采用笔试、专业技能测试、说课三种形式进行选拔,这三项的成绩满分均为100分,并按2:3:5的比例折合纳入总分,最后,按照成绩的排序从高到低依次录取,该区要招聘两名音乐教师,通过笔试、专业技能测试筛选出前6名选手进入说课环节,这6名选手的各项成绩见表:
序号 1 2 3 4 5 6
笔试成绩 66 90 86 64 66 84
专业技能测试成绩 95 92 93 80 88 92
说课成绩 85 78 86 88 94 85
笔试成绩的平均数是_____________;
写出说课成绩的中位数:__________众数:____________;
分别按比例核算这六位选手的总成绩,判断应该录取几号?为什么?
课后作业:
将一组数据中的每个数减去40后,所得新的一组数据的平均数是2,那么原来这组数据的平均数是( )
A. 40 B. 42 C. 38 D. 2
下列说法中,错误的是( )
A.“伊利”纯牛奶消费者服务热线是400-816-9999,该十个数的中位数是7
B. 服装店老板最关心的是卖出服装的众数
C. 要了解全市初三近4万名学生2023年中考数学成绩情况,适宜采用全面调查
D. 条形统计图能够显示每组中的具体数据,易于比较数据间的差别
已知一组数据:18,17,13,15,17,16,14,17,则这组数据中的中位数与众数分别是_____,_____。
某射击队为从甲、乙两名运动员中选拔一人参加全国比赛,对他们进行了8次测试,测试成绩(单位:环)如下表:
第一次 第二次 第三次 第四次 第五次 第六次 第七次 第八次
甲 10 8 9 8 10 9 10 8
乙 10 7 10 10 9 8 8 10
根据表格中的数据,计算出甲的平均成绩是________环,乙的平均成绩是_______环。
分别计算甲、乙两名运动员8次测试成绩的方差;
根据(1),(2)计算结果,你认为推荐谁参加全国比赛更合适,并说明理由。