《統(tǒng)計》復習
1、本章內(nèi)容是初中《統(tǒng)計初步》與高中《概率》內(nèi)容的深入和擴展,對數(shù)理統(tǒng)計中要研究的兩個基本問題;如何從總體中抽取樣本以及如何通過對所抽取的樣本進行計算和分析,從而對總體的相應情況作出推斷,作了初步的介紹。
幾個基本名詞:在統(tǒng)計中,考察對象的全體稱為總體,總體中的每一個對象稱為個體。
若記總體中N個個體取值分別為x1,x2,…,xN,則稱為總體平均數(shù)(μ為N個個體的算術平均數(shù))
若記,則稱2為總體方差,稱為總體標準差。
初中《統(tǒng)計初步》的主要內(nèi)容
2、抽樣方法的分類:按照抽取樣本時總體中的每個個體被抽取的概率是否相等
本章只研究等概率抽樣
等概率抽樣
常用的三種抽樣方法的比較:
類 別 |
共同點 |
不同點 |
聯(lián) 系 |
適用范圍 |
簡單隨 機抽樣 |
抽樣過程中每個個體被抽取的概率相等 |
從總體中逐個抽取 |
是后兩種方法的基礎 |
總體個數(shù)較少 |
系統(tǒng) 抽樣 |
將總體均分成幾部分,按事先確定的規(guī)則在各部分抽取 |
在超始部分抽樣時用簡單隨機抽樣 |
總體個數(shù)較多 |
|
分層 抽樣 |
將總體分成幾層,分層進行抽取 |
各層抽樣時采用簡單隨機抽樣或系統(tǒng)抽樣 |
總體由差異明顯的幾部分組成 |
3、用樣本的頻率分布估計總體分布,分兩種情況:
(1)當總體中的個數(shù)體取不同數(shù)值很少時,其頻率分布表由所取樣本的不同數(shù)值及其相應的頻率來表示,其幾何表示就是相應的條形圖。例如射擊的環(huán)數(shù),擲單粒骰子時出現(xiàn)的點數(shù)等;
(2)當總體中的個體取不同值較多甚至無限時,此時需要對樣本數(shù)據(jù)進行整理,其頻率分布表列出的是在各個不同區(qū)間內(nèi)取值的頻率,相應的直方圖是用圖形面積的大小來表示在各個區(qū)間內(nèi)取值的頻率。
畫第二種情況頻率分布圖的步驟是:
①計算最大值與最小值的差;
②決定組距與組數(shù);
③決定分點,通常使分點比數(shù)據(jù)多一位小數(shù),并且把第一小組的起點稍微減小一點;
④列出頻率分布表;
⑤畫出頻率分布直方圖
頻率分布將隨著樣本容量的增大而更加接近總體分布,當樣本容量無限增大且分組的組距無限縮小時,頻率分布直方圖就會演變成一條光滑曲線--反映總體分布的概率密度曲線。正因為頻率分布與相應的總體分布的關系,通常是從總體中抽取一個樣本,用樣本的頻率分布去估計相應的總體分布。
4、概率密度曲線是某一函數(shù)的圖象,其中最重要最常見的是正態(tài)分布函數(shù)。
正態(tài)分布函數(shù)的解析式:,x∈(-∞,+∞),其中μ,(>0)分別表示總體的平均數(shù)與標準差,可簡記為x-N(μ,2)。此時曲線稱為正態(tài)曲線:
當μ=0,=1時,稱為標準正態(tài)分布,簡記為x-N(0,1),分布密度函數(shù)用(x)表示,即,-∞<x<∞。
一般正態(tài)分布的問題可以轉化為標準正態(tài)變量來處理;若ξ-N(μ, 2),作代換(ξ-μ)/,則ξ-N(0,1)。
6、通過本章的學習,要強化理論聯(lián)系實際,運用數(shù)學知識建立實際問題的模型的能力,熟悉運動思想,用有限代替無限的思想。
例1、寫出抽樣過程:從擁有500個分數(shù)的總體中用簡單隨機抽樣方法抽取一個容量為30的樣本。
解:①將總體的500個分數(shù)從001開始編號,一直至500號;
②從隨機數(shù)表第1頁第0行至第2頁第4列的758號開始使用該表;
③抄錄入樣號碼如下:335,044,386,446,027,420,045,094,382,215,342,148,407,349,322,027,002,323,141,052,177,001,456,491,261,036,240,115,143,402;
④按以上編號從總體中將相應數(shù)取出組成樣本,即可。
例2、求正態(tài)總體在下面區(qū)間取值的概率。
(1)已知:x-N(0,1),求P(-1<x<2),P(x>2);
(2)已知x-N(),求F(μ-1.96,μ+1.96)。
解:(1)P(-1<x<-2)=(2)-(-1)=(2)-[1-(1)]=(2)+(1)-1
=0.9773+0.8413-1=0.8186
P(x>2)=1-(2)=1-0.9773=0.227
(2)∵ F(μ+1.96)=()=(1.96)
F(μ-1.96)= =(1.96)=1-(1.96)
∴ F(μ-1.96,μ+19.6)=2(-1.96)-1=0.95
例3、某年級的一次信息技術測試成績近似服從正態(tài)分布N(70,100),如果規(guī)定低于60分為不及格,不低于85分為優(yōu)秀,那么:
(1)成績不及格的學生約占多少?
(2)成績優(yōu)秀的學生約占多少?
解:依題意,求題得分少于60分的學生的比為F(60),少于85分的學生的比為F(85)
(1)F(60)=(=(-1)=1-(1)=1-0.8413=0.1587
(2)F(85)= =(1.5)=0.9332
∴ 1-F(85)=1-0.9332=0.0668
∴ 成績優(yōu)秀的同學約占6.68%
(一)選擇題
1、為了調(diào)查全國人口的壽命,抽查了十一個省市的2500名城鎮(zhèn)居民,則該問題中的2500名城鎮(zhèn)居民是:
A、總體 B、個體 C、樣本 D、樣本容量
2、一個容量為100的樣本分成若干組,已知某組的頻率為0.4,則該組的頻數(shù)是:
A、4 B、40 C、10 D、400
3、利用簡單隨機抽樣從含有6個個體的總體中抽取一個容量為3的樣本,則總體中每個個體被抽到的概率是:
A、 B、 C、 D、
4、如果x-N(μ,2),則( )-N(0,1):
A、 B、 C、 D、1
5、如果提出統(tǒng)計假設,某學生數(shù)學成績x服從正態(tài)分布N(。下列哪種情況下可以說假設不成立:
A、 B、
C、 D、
6、如圖是一批產(chǎn)品中抽樣得數(shù)據(jù)在頻率分布圖,從圖中可以看出數(shù)據(jù)所落在范圍的頻率最大的是:
A、(8.1,8.3) B、(8.2,8.4) C、(8.4,8.5) D、(8.5,8.7)
7、一個容量為20的樣本,分組后,組距與頻數(shù)如下:
組距 |
(10,20) |
(20,30) |
(30,40) |
(40,50) |
(50.60) |
(60,70) |
頻數(shù) |
2 |
3 |
4 |
5 |
4 |
2 |
則樣本在區(qū)間(-∞,50)上頻率為:
A、5% B、25% C、50% D、70%
8、三條正態(tài)曲線對應的標準差分別為1,2,3,如圖,則:
A、1>2>1>3 B、1>2=1>3
C、3>2>1>1 D、3>2=1>1
9、如圖是正態(tài)分布N(0,1)的正態(tài)曲線圖,下面4個式子中,能表示圖中陰影部分面積的個數(shù)為:
①-(-a) ②(-a)
③(a)- ④[(a)-(-a)]
A、1個 B、2個 C、3個 D、4個
10、利用隨機抽樣從含有12個個體的總體中抽取一個容量為4的樣本,設個體a被抽到的概率為P1,個體a沒有在第二次抽到的概率為P2,則P1與P2的大小關系是:
A、P1>P2 B、P1=P2 C、P1<P2 D、不確定
(二)填空題(每小題6分,共30分)
11、正態(tài)曲線(>0,-∞<x<+∞)的對稱軸是____________。
12、從1000件新產(chǎn)品中抽取20件檢查,采用系統(tǒng)抽樣的方式,應將總體分成______部分。
13、正態(tài)總體N(μ,2)在區(qū)間(μ-3,μ+3)內(nèi)取值的概率是________。
14、一個容量為n的樣本分成若干組,已知某組的頻數(shù)和頻率分別為80和0.125,則n=__________。
15、一個工作有若干個車間,今采用分層抽樣的方法從全廠某天的2048件產(chǎn)品中抽取一個容量為128的樣本進行質(zhì)量檢驗,若某一車間這一天生產(chǎn)256件產(chǎn)品,則從車間抽取的產(chǎn)品件數(shù)為________。
16、(14分)某校參加高考學生1500人,該次考試服從平均數(shù)為65,標準差為15的正態(tài)分布,試問在60分以下的有多少人?
17、(14分)一個總體中的1000個個體編號為0,1,2,…,999,并依次將其分為10個小組,組號為0,1,2,…,9,要用系統(tǒng)抽樣方法抽取一個容量為10的樣本,規(guī)定如果在第0組隨機抽取的號碼為x,那么依次錯位地得到后面各組的號碼,即第k組抽取的號碼的后兩位數(shù)是x+33k的后兩位數(shù)。
(1)當x=24時,寫出所抽樣本的10個號碼;
(2)若所抽取樣本的10個號碼中有一個的后兩位是87,求x的取值范圍。
18、(14分)某市奧林匹克學校招收新生300人,報名參加考試的有2500人,抽樣統(tǒng)計考試成績服從正態(tài)分布N(75,64),估計錄取分數(shù)線約為多少分?(試卷滿分100分),(0.84)=0.7995,(0.851)=0.8023
19、(14分)已知一組數(shù)據(jù)為
xi’ |
-1 |
0 |
1 |
2 |
yi’ |
0 |
0 |
1 |
4 |
試求y關于x的線性回歸方程。
20、(14分)已知函數(shù)是正態(tài)分布密度函數(shù),g(x)=[f(x)]x,求證g(x)在(1,+∞)上是減函數(shù)。
第十一講 復習統(tǒng)計參考答案
參考答案
(一)選擇題:
1、C 2、B 3、C 4、B 5、B 6、D 7、D 8、D 9、C 10、C
(二)填空題:
11、x=μ 12、20 13、0.997 14、640 15、16
(三) 解答題:
16、F(60)==(-)=1-()=0.37
∵ 0.37×1500=556
∴ 低于60分的人數(shù)為556
17、(1)當x=24時,所抽取樣本的10個號碼依次為:24,157,290,323,486,589,622,755,888,921;
(2)當k=0,1,2,…,9時,33k的值依據(jù)為0,33,60,99,132,165,198,231,264,297
又抽取樣本的10個號碼中有一個的后兩位是87,從而x可以為87,54,21,88,55,22,89,56,23,90
∴ x∈{21,22,23,54,55,56,87,88,89,90}
18、設錄取系數(shù)為x分,則P(ξ≥x)==0.2
∵ ξ-N(75,64)
∴ (ξ-75)/8 -N(0,1)
1- P[(ξ-75)/8 <(x-75)/8]=0.2
即
∴ x≈82
19、設y關于x的線性回歸方程為=bx+a,則
Q=[0-(a-b)]2+(0-a)2+(1-a-b)2+(4-2b-a)2=4a2+4ab+6b2-10a-18b+17
=4[a-()]2+5(b-)2+最小
∴
∴
∴ 所求線性回歸方程為=1.3x+0.6
20、
令
用定義可證明h(x)在(1,+∞)上是減函數(shù)
設x2>x1>1,則h(x2)<h(x1)
∴
又
∴ g(x1)>g(x2) ∴ g(x)在(1,+∞)上是減函數(shù)。