當前位置:才華齋>範例>校園>

大學聯考理科數學統計案例的第一輪總複習

校園 閱讀(1.43W)

考試要求重難點選命題展望

大學聯考理科數學統計案例的第一輪總複習

1.理解隨機抽樣的必要性和重要性,會用簡單隨機抽樣方法從總體中抽取樣本,瞭解分層抽樣和系統抽樣方法.

2.瞭解分佈的意義和作用,會列頻率分佈表,會畫頻率分佈直方圖、莖葉圖,理解它們各自的特點,理解樣本資料標準差的意義和作用,會計算資料標準差,能從樣本資料中提取基本的數字特徵(如平均數、標準差),並作出合理的解釋,會用樣本的頻率分佈估計總體分佈,會用樣本的基本數字特徵估計總體的基本數字特徵,理解用樣本估計總體的思想,會用隨機抽樣的基本方法和樣本估計總體 的思想解決一些簡單的實際問題.

3.會作兩個有關聯變數的散點圖,會利用散點圖認識變數間的相關關係,瞭解最小二乘法的思想,能根據給出的線性迴歸方程係數公式建立線性迴歸方程,瞭解迴歸的基本思想、方法及其簡單應用.

4.瞭解獨立性檢驗(只要求2×2列聯表)的基本思想、方法及其簡單應用. 本章重點:1.三種抽樣方法的區別、聯絡及操作步驟.2.樣本頻率分佈直方圖和莖葉圖.3.用樣本估計總體的思想.

本章難點:迴歸直線方程與獨立性檢驗. 統計多數以選擇題和填空題形式考查,大題只在個別省的考題中出現過.難度屬於基礎 題和中檔題.考點往往集中體現在抽樣方法、頻率分佈圖表這兩個方面.另外,應注意統計題反映出來的綜合性與應用性,如與數列、概率等的綜合,用統計方法提供決策、制定方案等,以此考查學生蒐集處理資訊及分析解決問題的能力.

知識網路

13.1 抽樣方法與用樣本估計總體

典例精析

題型一 抽樣方法

【例1】某校有教師200人,男學生1 200人,女學生1 000人,用分層抽樣的方法從所有師生中抽取一個容量為n的樣本,已知女學生抽取的人數為80人,則n的值為 .

【解析】根據分層抽樣的意義,

n200+1 200+1 000=801 000,解得n=192.

【點撥】現實中正確的分層抽樣一般有三個步驟:首先,辨明突出的統計特徵和分類.其次,確定每個分層在總體上的比例.利用這個比例,可計算出樣本中每組(層)應抽取的人數.最後,必須從每層中抽取獨立簡單隨機樣本.

【變式訓練1】從某廠生產的802輛轎車中隨機抽取80輛測試某項效能.請合理選擇抽樣方法進行抽樣,並寫出抽樣過程.

【解析】第一步,將802輛轎車用隨機方式編號.

第二步,從總體中剔除2輛(剔除方法可用隨機數表法),將剩餘的800輛轎車重新編號(分別為001,002,003,…,800),並分成80段.

第三步,在第一段001,002,…,010這十個編號中用簡單隨機抽樣抽出一個(如005)作為起始號碼.

第四步,將編號為005,015,025,…,795的個體抽出,組成樣本.

題型二 頻率分佈直方圖

【例2】(2 010湖南)如圖是某城市通過抽樣得到的居民某年的月均用水量(單位:噸)的頻率分佈直方圖.

(1)求直方圖中x的值;

(2)若將頻率視為概率,從這個城市隨機抽取3位居民(看作有放回的抽樣),求月均用水量在3至4噸的居民數X的分佈列和數學期望.

【解析】(1)依題意及頻率分佈直方圖知0 .02+0.1+x+0.37+0.39=1,解得x=0.12.

(2)由題意知X~B(3,0.1),因此

P(X=0)=C03×0.93=0.729,

P(X=1)=C13×0.1×0.92=0.243,

P(X=2)=C23×0.12×0.9 =0.027,

P(X=3)=C33×0.13=0.001,

故隨機變數X的分佈列為

X0123

P0.7290.2430.0270. 001

X的數學期望為E(X)=3×0.1=0.3.

(或E(X)=1×0.243+2×0.027+3×0.001=0.3)

【點撥】從頻率分佈直方圖讀取資料時,要特別重視組距,縱座標是頻率除以組距,故長方形的面積之和為1.

【變式訓練2】如圖是容量為100的樣本的頻率分佈直方圖,試根據資料填空:

(1)樣本資料落在[10,14)內的頻數為 ;

(2)樣本資料落在[6,10)內的頻率為 ;

(3)總體落在[2,6)內的頻率為 .

【解析】(1)樣本落在[10,14)內的頻數為0.09×4×100=36.

(2)樣本落在[6,10)內的'頻率為0.08×4=0.32.

(3)樣本落在[2,6)內的頻率為0.02×4=0.08,所以總體落在[2,6)內的頻率約為0.08.

題型三 平均數、方差的計算

【例3】甲、乙兩人在相同條件下各射靶10次,每次命中環數如下:

甲 4 7 10 9 5 6 8 6 8 8

乙 7 8 6 8 6 7 8 7 5 9

試 問誰10次射靶的情況較穩定?

【解析】本題要計算兩樣本的方差,當樣本平均數不是整數,且樣本資料不大時,可用簡化公式計算方差.

=110(4+7+…+8)=7.1,

=110(7+8+…+9)=7.1,

s2甲=110(42+72+…+82-10×7.12)=3.09,

s2乙=110(72+82+…+92-10×7.12)=1.29,

因為s2甲>s2乙,所以乙10次射靶比甲10次射靶情況穩定.

【點撥】平均數反映了資料取值的平均水平;標準差、方差描述了一組資料圍繞平均數波動的大小,標準差、方差越大,資料的離散程度就越大,越不穩定;標準差、方差越小,資料的離散程度越小,越穩定.

【變式訓練3】(2010北京市東城區)在一次數學統考後,某班隨機抽取10名同學的成績進行樣本分析,獲得成績資料的莖葉圖如右圖.

(1)計算此樣本的平均成績及方差;

(2)現從此樣本中隨機抽出2名學生的成績,設抽出分數為90分以上的人數為X,求隨機變數X的分佈列和均值.

【解析】(1)樣本的平均成績 =80;

方差為s2=110[(92-80)2+(98-80)2+(98-80)2+(85-80)2+(85-80)2+(74-80)2+(74-80)2+(74-80)2 +(60-80)2+(60-80)2]=175.

(2)由題意,隨機變數X=0,1,2.

P(X=0)=C27C210=715,P(X=1)=C13C17C210=715,P(X=2)=115.

隨機變數X的分佈列為

X012

P

E(X)=0×715+1×715+2×115=35.

總結提高

1.統計的基本思想是用樣本估計總體.這就 要求樣本具有很好的代表性,而樣本良好客觀的代表性,則完全依賴抽樣方法.

2.三種抽樣方法中簡單隨機抽樣是最基本的抽樣方法,是其他兩種方法的基礎,它們的共同點都是等概率抽樣.適用範圍不同,要根據總體的具體情況 選用不同的方法.

3.對於總體分佈,總是用樣本的頻率分佈對它進行估計.

4.用樣本估計總體,一般分成以下幾個步驟:

先求樣本資料中的最大值和最小值(稱為極值),再確定合適的組數和組距,確定分點(每個分點只屬於一組,故一般採用半開半閉區間),然後列出頻率分佈表(準確,查資料容易),畫頻率 分佈直方圖.

13.2 兩變數間的相關性、迴歸分析和獨立性檢驗

典例精析

題型一 求迴歸直線方程

【例1】下表是關於某裝置的使用年限(年)和所需要的維修費用(萬元)的幾組統計資料:

x23456

(1)若y對x呈線性相關關係,求出y關於x的線性迴歸方程y= x+ ;

(2)估計使用年限為10年時,維修費用為多少?

【解析】(1)因為 xiyi=112.3, x2i=4+9+16+25+36=90,且 =4, =5,n=5,

所以 =112.3-5×4×590-5×16=12.310=1.23, =5-1.23×4=0.08,

所以迴歸直線方程為y=1.23x+0.08.

(2)當x=10時,y=1.23×10+0.08=12.38,

所以估計當使用10年時,維修費用約為12.38萬元.

【點撥】當x與y呈線性相關關係時,可直接求出迴歸直線方程,再利用迴歸直線方程進行計算和預測.

【變式訓練1】某工廠經過技術改造後,生產某種產品的產量(噸)與相應的生產能耗(噸標準煤)有如下幾組樣本資料.

x3456

y2.5344.5

據相關性檢驗,y與x具有線性相關關係,通過線性迴歸分析,求得迴歸直線的斜率為0.7,那麼y關於x的迴歸直線方程是 .

【解析】先求得 =4.5, =3.5,由 =0.7x+a過點( , ),則a=0.35,所以迴歸直線方程是 =0.7x+0.35.

題型二 獨立性檢驗

【例2】研究小麥種子經滅菌與否跟發生黑穗病的關係,經試驗觀察,得到資料如下表所示:

種子滅菌種子未滅菌合計

黑穗病26184210

無黑穗病50200250

合計76384460

試按照原試驗目的作統計分析推斷.

【解析】由列聯表得:

a=26,b=1 84,c=50,d=200,a+b=210,c+d=250,a+c=76,b+d=384,n=460.

所以K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)=460×(26×200-184×50)2210×250×76×384≈4.804,

由於K2≈4.804>3.841,

所以有95%的把握認為種子滅菌與否與小麥發生黑穗病是有關係的.

【變式訓練2】(2010東北三 省三校模擬)某 研究小組為了研究中學生的身體發育情況,在某學校隨機抽出20名15至16週歲的男生,將他們的身高和體重製成2×2的列聯表,根據列聯表的資料,可以有 %的把握認為該學校15至16週歲的男生的身高和體重之間有關係.

超重不超重合計

偏高415

不偏高31215

合計71320

附:獨立性檢驗臨界值表

P(K2≥k0)0.0250.0100.0050.001

k05.0246.6357.87910.828

(獨立性檢驗隨機變數K2值的計算公式:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d))

【解析】由表可得a+b=5,c+d=1 5,a+c=7,b+d=13,ad=48,bc=3,n=20,運用獨立性檢驗隨機變數K2值的計算公式得K2=20×(48-3)25×15×7×13=54091≈5.934,

由於K2≈5.934>5.024,所以有97.5%的把握認為該學校15至16週歲的男生的身高和體重之間有關係.

總結提高

1.在研究兩個變數之間是否存在某種關係時,必須從散點圖入手.