Intervale de încredere pentru frecvențe și proporții. Interval de încredere. Probabilitatea de încredere Definiția probabilității de încredere

Calculul intervalului de încredere se bazează pe eroarea medie a parametrului corespunzător. Interval de încredere arată în ce limite cu probabilitate (1-a) este valoarea adevărată a parametrului estimat. Aici a este nivelul de semnificație, (1-a) se mai numește și nivelul de încredere.

În primul capitol, am arătat că, de exemplu, pentru media aritmetică, adevărata medie a populației se află în 2 erori medii ale mediei aproximativ 95% din timp. Astfel, limitele intervalului de încredere de 95% pentru medie vor fi de la media eșantionului de două ori mai mare decât eroarea medie a mediei, i.e. înmulțim eroarea medie a mediei cu un factor care depinde de nivelul de încredere. Pentru medie și diferența de medii se ia coeficientul Student (valoarea critică a criteriului Student), pentru ponderea și diferența cotelor, valoarea critică a criteriului z. Produsul coeficientului și eroarea medie poate fi numit eroarea marginală a acestui parametru, i.e. maximul pe care îl putem obține atunci când îl evaluăm.

Interval de încredere pentru medie aritmetică : .

Iată media eșantionului;

Eroarea medie a mediei aritmetice;

s- abaterea standard a probei;

n

f = n-1 (Coeficientul elevului).

Interval de încredere pentru diferența de medii aritmetice :

Aici este diferența dintre mediile eșantionului;

- eroarea medie a diferenţei de medii aritmetice;

s 1 ,s 2 - abateri standard ale probei;

n1,n2

Valoarea critică a criteriului Studentului pentru un anumit nivel de semnificație a și numărul de grade de libertate f=n1 +n2-2 (Coeficientul elevului).

Interval de încredere pentru acțiuni :

.

Aici d este cota eșantionului;

– eroare medie de cotă;

n– dimensiunea eșantionului (mărimea grupului);

Interval de încredere pentru împărtășește diferențele :

Iată diferența dintre acțiunile eșantionului;

este eroarea medie a diferenței dintre mediile aritmetice;

n1,n2– dimensiunile eșantionului (număr de grupuri);

Valoarea critică a criteriului z la un nivel de semnificație dat a ( , , ).

Calculând intervalele de încredere pentru diferența de indicatori, în primul rând, vedem direct valorile posibile ale efectului, și nu doar estimarea punctuală a acestuia. În al doilea rând, putem trage o concluzie despre acceptarea sau infirmarea ipotezei nule și, în al treilea rând, putem trage o concluzie despre puterea criteriului.

La testarea ipotezelor folosind intervale de încredere, trebuie respectată următoarea regulă:

Dacă intervalul de încredere de 100(1-a)-procent al diferenței medii nu conține zero, atunci diferențele sunt semnificative statistic la nivelul de semnificație; dimpotrivă, dacă acest interval conține zero, atunci diferențele nu sunt semnificative statistic.

Într-adevăr, dacă acest interval conține zero, atunci înseamnă că indicatorul comparat poate fi fie mai mult, fie mai puțin într-unul dintre grupuri comparativ cu celălalt, adică. diferențele observate sunt aleatorii.

După locul în care se află zero în intervalul de încredere, se poate judeca puterea criteriului. Dacă zero este aproape de limita inferioară sau superioară a intervalului, atunci poate cu un număr mai mare de grupuri comparate, diferențele ar ajunge la semnificație statistică. Dacă zero este aproape de mijlocul intervalului, înseamnă că atât creșterea, cât și scăderea indicatorului în grupul experimental sunt la fel de probabile și, probabil, chiar nu există diferențe.

Exemple:

Pentru a compara letalitatea operațională atunci când se utilizează două tipuri diferite de anestezie: 61 de persoane au fost operate folosind primul tip de anestezie, 8 au murit, folosind al doilea - 67 de persoane, 10 au murit.

d 1 \u003d 8/61 \u003d 0,131; d 2 \u003d 10/67 \u003d 0,149; d1-d2 = - 0,018.

Diferența de letalitate a metodelor comparate va fi în intervalul (-0,018 - 0,122; -0,018 + 0,122) sau (-0,14; 0,104) cu o probabilitate de 100(1-a) = 95%. Intervalul conține zero, adică. nu poate fi respinsă ipoteza aceleiaşi letalităţi cu două tipuri diferite de anestezie.

Astfel, mortalitatea poate și va scădea la 14% și crește la 10,4% cu o probabilitate de 95%, adică. zero este aproximativ la mijlocul intervalului, deci se poate susține că, cel mai probabil, aceste două metode nu diferă cu adevărat în letalitate.

În exemplul considerat mai devreme, timpul mediu de atingere a fost comparat în patru grupuri de studenți care diferă în ceea ce privește scorurile la examen. Să calculăm intervalele de încredere ale timpului mediu de apăsare pentru studenții care au promovat examenul pentru 2 și 5 și intervalul de încredere pentru diferența dintre aceste medii.

Coeficienții lui Student se regăsesc din tabelele de distribuție a lui Student (vezi Anexa): pentru prima grupă: = t(0,05;48) = 2,011; pentru a doua grupă: = t(0,05;61) = 2,000. Astfel, intervale de încredere pentru primul grup: = (162,19-2,011 * 2,18; 162,19 + 2,011 * 2,18) = (157,8; 166,6) , pentru al doilea grup (156,55- 2,000*2,000*1,88..; 8 = 1,88..; 8) ; 160,3). Deci, pentru cei care au promovat examenul pentru 2, timpul mediu de apăsare variază de la 157,8 ms la 166,6 ms cu o probabilitate de 95%, pentru cei care au promovat examenul pentru 5 - de la 152,8 ms la 160,3 ms cu o probabilitate de 95% .

De asemenea, puteți testa ipoteza nulă folosind intervale de încredere pentru medii și nu doar pentru diferența dintre medii. De exemplu, ca și în cazul nostru, dacă intervalele de încredere pentru medii se suprapun, atunci ipoteza nulă nu poate fi respinsă. Pentru a respinge o ipoteză la un nivel de semnificație ales, intervalele de încredere corespunzătoare nu trebuie să se suprapună.

Să aflăm intervalul de încredere pentru diferența în timpul mediu de presare în grupele care au promovat examenul pentru 2 și 5. Diferența în medii: 162,19 - 156,55 = 5,64. Coeficientul studentului: \u003d t (0,05; 49 + 62-2) \u003d t (0,05; 109) \u003d 1,982. Abaterile standard de grup vor fi egale cu: ; . Se calculează eroarea medie a diferenței dintre medii: . Interval de încredere: \u003d (5,64-1,982 * 2,87; 5,64 + 1,982 * 2,87) \u003d (-0,044; 11,33).

Așadar, diferența de timp mediu de presare în grupele care au promovat examenul la 2 și la 5 va fi în intervalul de la -0,044 ms la 11,33 ms. Acest interval include zero, adică timpul mediu de presare pentru cei care au promovat examenul cu rezultate excelente poate să crească și să scadă în comparație cu cei care au promovat examenul nesatisfăcător, adică. ipoteza nulă nu poate fi respinsă. Dar zero este foarte aproape de limita inferioară, timpul de apăsare este mult mai probabil să scadă pentru trecătorii excelenți. Astfel, putem concluziona că există încă diferențe în timpul mediu de clic între cei care au trecut cu 2 și cu 5, pur și simplu nu le-am putut detecta pentru o anumită modificare a timpului mediu, a răspândirii timpului mediu și a dimensiunilor eșantionului.

Puterea testului este probabilitatea respingerii unei ipoteze nule incorecte, i.e. găsiți diferențele acolo unde sunt cu adevărat.

Puterea testului este determinată pe baza nivelului de semnificație, a mărimii diferențelor dintre grupuri, a răspândirii valorilor în grupuri și a mărimii eșantionului.

Pentru testul t Student și analiza varianței, puteți utiliza diagrame de sensibilitate.

Puterea criteriului poate fi utilizată în determinarea preliminară a numărului necesar de grupuri.

Intervalul de încredere arată în ce limite se află valoarea adevărată a parametrului estimat cu o probabilitate dată.

Cu ajutorul intervalelor de încredere, puteți testa ipoteze statistice și puteți trage concluzii despre sensibilitatea criteriilor.

LITERATURĂ.

Glantz S. - Capitolul 6.7.

Rebrova O.Yu. - p.112-114, p.171-173, p.234-238.

Sidorenko E. V. - p. 32-33.

Întrebări pentru autoexaminarea studenților.

1. Care este puterea criteriului?

2. În ce cazuri este necesară evaluarea puterii criteriilor?

3. Metode de calcul al puterii.

6. Cum se testează o ipoteză statistică folosind un interval de încredere?

7. Ce se poate spune despre puterea criteriului la calcularea intervalului de încredere?

Sarcini.

Pentru marea majoritate a măsurătorilor simple, așa-numita lege normală a erorilor aleatoare este satisfăcută destul de bine ( legea Gauss), derivat din următoarele prevederi empirice.

1) erorile de măsurare pot lua o serie continuă de valori;

2) cu un număr mare de măsurători, erori de aceeași amploare, dar de semn diferit, apar la fel de des,

3) cu cât eroarea aleatorie este mai mare, cu atât probabilitatea de apariție a acesteia este mai mică.

Graficul distribuției gaussiene normale este prezentat în Fig.1. Ecuația curbei are forma

unde este funcția de distribuție a erorilor aleatoare (erori), care caracterizează probabilitatea unei erori, σ este eroarea pătratică medie.

Valoarea σ nu este o variabilă aleatoare și caracterizează procesul de măsurare. Dacă condițiile de măsurare nu se schimbă, atunci σ rămâne constantă. Pătratul acestei mărimi se numește dispersia măsurătorilor. Cu cât dispersia este mai mică, cu atât răspândirea valorilor individuale este mai mică și precizia măsurării este mai mare.

Valoarea exactă a erorii pătratice medie σ, precum și valoarea adevărată a mărimii măsurate, sunt necunoscute. Există o așa-numită estimare statistică a acestui parametru, conform căreia eroarea pătratică medie este egală cu eroarea pătratică medie a mediei aritmetice. A cărui valoare este determinată de formula

unde este rezultatul i-a dimensiune; - media aritmetică a valorilor obţinute; n este numărul de măsurători.

Cu cât numărul de măsurători este mai mare, cu atât este mai mic și se apropie mai mult de σ. Dacă valoarea adevărată a valorii măsurate μ, valoarea medie aritmetică a acesteia obținută ca rezultat al măsurătorilor și eroarea absolută aleatorie, atunci rezultatul măsurării va fi scris ca .

Intervalul de valori de la până la , în care se încadrează adevărata valoare a mărimii măsurate μ, se numește interval de încredere. Deoarece este o variabilă aleatoare, valoarea adevărată se încadrează în intervalul de încredere cu o probabilitate α, care se numește probabilitatea de încredere, sau fiabilitate măsurători. Această valoare este numeric egală cu aria trapezului curbiliniu umbrit. (vezi poza.)

Toate acestea sunt valabile pentru un număr suficient de mare de măsurători, când este aproape de σ. Pentru a găsi intervalul de încredere și nivelul de încredere pentru un număr mic de măsurători, de care ne ocupăm în timpul lucrului de laborator, folosim Distribuția de probabilitate a elevului. Aceasta este distribuția de probabilitate a unei variabile aleatorii numite Coeficientul elevului, dă valoarea intervalului de încredere în fracții din eroarea pătratică medie a mediei aritmetice.


Distribuția de probabilitate a acestei mărimi nu depinde de σ 2 , ci depinde în esență de numărul de experimente n. Cu o creștere a numărului de experimente n Distribuția lui Student tinde spre o distribuție gaussiană.

Funcția de distribuție este tabelată (Tabelul 1). Valoarea coeficientului Student se află la intersecția dreptei corespunzătoare numărului de măsurători n, iar coloana corespunzătoare nivelului de încredere α

Din acest articol veți învăța:

    Ce s-a întâmplat interval de încredere?

    Care este scopul regulile 3 sigma?

    Cum pot fi puse în practică aceste cunoștințe?

În zilele noastre, datorită unei supraabundențe de informații asociate cu o gamă largă de produse, direcții de vânzare, angajați, activități etc., este greu să alegi principalul, care, în primul rând, merită să-i acordăm atenție și să depunem eforturi pentru a-l gestiona. Definiție interval de încredereși analiza depășirii limitelor valorilor reale - o tehnică care vă ajută să identificați situațiile, influențarea tendințelor. Veți putea dezvolta factori pozitivi și reduce influența celor negativi. Această tehnologie este utilizată în multe companii mondiale binecunoscute.

Există așa-zise alerte", care informează managerii afirmând că următoarea valoare într-o anumită direcție a trecut dincolo interval de încredere. Ce inseamna asta? Acesta este un semnal că a avut loc un eveniment nestandard, care poate schimba tendința existentă în această direcție. Acesta este semnalul la asta pentru a o rezolvaîn situație și înțelegeți ce a influențat-o.

De exemplu, luați în considerare mai multe situații. Am calculat prognoza vânzărilor cu limitele prognozate pentru 100 de articole de mărfuri pentru 2011 pe luni și vânzările reale în martie:

  1. Pentru „Uleiul de floarea soarelui” au depășit limita superioară a prognozei și nu au intrat în intervalul de încredere.
  2. Pentru „Drojdie uscată” a depășit limita inferioară a prognozei.
  3. Pe „Teci de ovăz” a depășit limita superioară.

Pentru restul mărfurilor, vânzările efective s-au încadrat în limitele prognozate specificate. Acestea. vânzările lor au fost în conformitate cu așteptările. Așadar, am identificat 3 produse care au depășit granițele și am început să ne dăm seama ce a influențat trecerea dincolo de granițe:

  1. Cu uleiul de floarea soarelui, am intrat într-o nouă rețea de tranzacționare, care ne-a oferit un volum suplimentar de vânzări, ceea ce a dus la depășirea limitei superioare. Pentru acest produs, merită să recalculăm prognoza până la sfârșitul anului, ținând cont de prognoza de vânzări către acest lanț.
  2. Pentru Dry Yeast, mașina a rămas blocată la vamă, iar în 5 zile a existat un deficit, ceea ce a afectat scăderea vânzărilor și depășirea frontierei inferioare. Ar putea fi util să vă dați seama ce a cauzat cauza și să încercați să nu repetați această situație.
  3. Pentru Oatmeal a fost lansată o promoție de vânzări, care a avut ca rezultat o creștere semnificativă a vânzărilor și a dus la o depășire a prognozei.

Am identificat 3 factori care au influențat depășirea prognozei. Pot fi mult mai multe în viață.Pentru a îmbunătăți acuratețea prognozei și a planificării, factorii care duc la faptul că vânzările efective pot depăși prognoza, merită să evidențiem și să construim previziuni și planuri pentru ele separat. Și apoi luați în considerare impactul lor asupra prognozei principale de vânzări. De asemenea, puteți evalua în mod regulat impactul acestor factori și puteți schimba situația în bine prin reducerea influenței factorilor negativi și creșterea influenței factorilor pozitivi.

Cu un interval de încredere, putem:

  1. Evidențiați destinațiile, cărora merită să le acordați atenție, pentru că în aceste zone au avut loc evenimente care pot afecta schimbare de tendință.
  2. Determinați factorii care chiar fac diferența.
  3. A accepta decizie ponderată(de exemplu, despre achiziții, când planificați etc.).

Acum să ne uităm la ce este un interval de încredere și cum să-l calculăm în Excel folosind un exemplu.

Ce este un interval de încredere?

Intervalul de încredere reprezintă limitele de prognoză (superioare și inferioare), în cadrul cărora cu o probabilitate dată (sigma) obțineți valorile reale.

Acestea. calculăm prognoza - acesta este principalul nostru reper, dar înțelegem că este puțin probabil ca valorile reale să fie 100% egale cu prognoza noastră. Și se pune întrebarea în ce măsură poate obține valori reale, dacă tendința actuală continuă? Și această întrebare ne va ajuta să răspundem calculul intervalului de încredere, adică - limitele superioare și inferioare ale prognozei.

Ce este o probabilitate sigma dată?

La calcul interval de încredere putem probabilitate stabilită lovituri valori reale în limitele de prognoză date. Cum să o facă? Pentru a face acest lucru, setăm valoarea lui sigma și, dacă sigma este egal cu:

    3 sigma- atunci, probabilitatea de a atinge următoarea valoare reală în intervalul de încredere va fi de 99,7%, sau 300 la 1, sau există o probabilitate de 0,3% de a depăși limitele.

    2 sigma- atunci, probabilitatea de a atinge următoarea valoare în limite este ≈ 95,5%, i.e. șansele sunt de aproximativ 20 la 1 sau există o șansă de 4,5% să ieși din limite.

    1 sigma- atunci, probabilitatea este ≈ 68,3%, i.e. șansele sunt de aproximativ 2 la 1, sau există o șansă de 31,7% ca următoarea valoare să cadă în afara intervalului de încredere.

Noi am formulat Regula 3 Sigma,care spune că probabilitatea de lovire o altă valoare aleatorie în intervalul de încredere cu o valoare dată trei sigma este 99,7%.

Marele matematician rus Cebyshev a demonstrat o teoremă conform căreia există o șansă de 10% de a depăși granițele unei prognoze cu o valoare dată de trei sigma. Acestea. probabilitatea de a se încadra în intervalul de încredere de 3 sigma va fi de cel puțin 90%, în timp ce o încercare de a calcula prognoza și limitele acesteia „cu ochi” este plină de erori mult mai semnificative.

Cum se calculează independent intervalul de încredere în Excel?

Să luăm în considerare calculul intervalului de încredere în Excel (adică limitele superioare și inferioare ale prognozei) folosind un exemplu. Avem o serie de timp - vânzări pe luni timp de 5 ani. Vezi fisierul atasat.

Pentru a calcula limitele prognozei, calculăm:

  1. Prognoza de vânzări().
  2. Sigma - abatere standard modele de prognoză din valori reale.
  3. Trei sigma.
  4. Interval de încredere.

1. Prognoza vânzărilor.

=(RC[-14] (date în serii de timp)-RC[-1] (valoarea modelului))^2(pătrat)


3. Însumați pentru fiecare lună valorile abaterii de la etapa 8 Sum((Xi-Ximod)^2), adică Să însumăm ianuarie, februarie... pentru fiecare an.

Pentru a face acest lucru, utilizați formula =SUMIF()

SUMIF(matrice cu numere de perioade din interiorul ciclului (pentru luni de la 1 la 12); referință la numărul perioadei din ciclu; referință la o matrice cu pătrate ale diferenței dintre datele inițiale și valorile perioade)


4. Calculați abaterea standard pentru fiecare perioadă din ciclu de la 1 la 12 (etapa 10 in fisierul atasat).

Pentru a face acest lucru, din valoarea calculată la etapa 9, extragem rădăcina și împărțim la numărul de perioade din acest ciclu minus 1 = ROOT((Suma(Xi-Ximod)^2/(n-1))

Să folosim formule în Excel =ROOT(R8 (referire la (Suma(Xi-Ximod)^2)/(COUNTIF($O$8:$O$67 (referință la o matrice cu numere de ciclu); O8 (referință la un anumit număr de ciclu, pe care îl considerăm în matrice))-1))

Folosind formula Excel = COUNTIF numărăm numărul n


Prin calcularea abaterii standard a datelor reale de la modelul de prognoză, am obținut valoarea sigma pentru fiecare lună - etapa 10 in fisierul atasat.

3. Calculați 3 sigma.

La etapa 11, setăm numărul de sigma - în exemplul nostru, „3” (etapa 11 in fisierul atasat):

De asemenea, valori practice sigma:

1,64 sigma - 10% sanse de a depasi limita (1 sansa din 10);

1,96 sigma - 5% șanse de a ieși din limite (1 șansă din 20);

2,6 sigma - 1% șansă de a ieși din limite (1 șansă din 100).

5) Calculăm trei sigma, pentru aceasta înmulțim valorile „sigma” pentru fiecare lună cu „3”.

3. Determinați intervalul de încredere.

  1. Limită superioară de prognoză- previziunea vanzarilor tinand cont de crestere si sezonalitate + (plus) 3 sigma;
  2. Limită inferioară de prognoză- prognoza vânzărilor ținând cont de creștere și sezonalitate - (minus) 3 sigma;

Pentru comoditatea calculării intervalului de încredere pentru o perioadă lungă (vezi fișierul atașat), folosim formula Excel =Y8+CĂUTAREV(W8;8$U$:19$V$;2;0), Unde

Y8- Prognoza de vânzări;

W8- numarul lunii pentru care vom lua valoarea de 3 sigma;

Acestea. Limită superioară de prognoză= „prognoza vânzărilor” + „3 sigma” (în exemplu, CĂUTARE V (numărul lunii; tabel cu valori 3 sigma; coloană din care extragem valoarea sigma egală cu numărul lunii din rândul corespunzător; 0)).

Limită inferioară de prognoză= „prognoza vânzărilor” minus „3 sigma”.

Deci, am calculat intervalul de încredere în Excel.

Acum avem o prognoză și un interval cu limite în care valorile reale vor cădea cu o anumită probabilitate sigma.

În acest articol, am analizat ce sunt sigma și regula trei sigma, cum să determinați un interval de încredere și pentru ce puteți folosi această tehnică în practică.

Prognoze precise și succes pentru tine!

Cum Forecast4AC PRO vă poate ajutala calcularea intervalului de încredere?:

    Forecast4AC PRO va calcula automat limitele superioare sau inferioare de prognoză pentru mai mult de 1000 de serii temporale în același timp;

    Capacitatea de a analiza limitele prognozei în comparație cu prognoza, tendința și vânzările reale pe diagramă cu o singură apăsare de tastă;

În programul Forcast4AC PRO, este posibil să setați valoarea sigma de la 1 la 3.

Alăturați-ne!

Descărcați aplicații gratuite de prognoză și Business Intelligence:


  • Novo Forecast Lite- automată calculul prognozei v excela.
  • 4analitica- Analiza ABC-XYZși analiza emisiilor în Excela.
  • Qlik Sense Desktop și QlikViewPersonal Edition - sisteme BI pentru analiza și vizualizarea datelor.

Testați caracteristicile soluțiilor plătite:

  • Novo Forecast PRO- prognoza in Excel pentru matrice mari de date.

Probabilități, recunoscute ca fiind suficiente pentru a aprecia cu încredere parametrii generali pe baza caracteristicilor eșantionului, sunt numite fiduciar .

De obicei, valorile de 0,95 sunt alese ca probabilități de încredere; 0,99; 0,999 (de obicei sunt exprimate ca procent - 95%, 99%, 99,9%). Cu cât este mai mare măsura responsabilității, cu atât este mai mare nivelul de încredere: 99% sau 99,9%.

Un nivel de încredere de 0,95 (95%) este considerat suficient în cercetarea științifică din domeniul culturii fizice și sportului.

Intervalul în care se găsește media aritmetică a eșantionului a populației generale cu o probabilitate de încredere dată se numește interval de încredere .

Nivelul de semnificație al evaluării este un număr mic α, a cărui valoare implică probabilitatea ca acesta să fie în afara intervalului de încredere. În conformitate cu probabilitățile de încredere: α 1 = (1-0,95) = 0,05; α 2 \u003d (1 - 0,99) \u003d 0,01 etc.

Interval de încredere pentru medie (așteptări) A distributie normala:

,

unde este fiabilitatea (probabilitatea de încredere) a estimării; - medie eșantionului; s - abaterea standard corectată; n este dimensiunea eșantionului; t γ este valoarea determinată din tabelul de distribuție a lui Student (vezi Anexa, Tabelul 1) pentru n și γ dat.

Pentru a găsi limitele intervalului de încredere a valorii medii a populației generale, este necesar:

1. Calculați și s.

2. Este necesar să se stabilească probabilitatea de încredere (fiabilitatea) γ a estimării 0,95 (95%) sau nivelul de semnificație α 0,05 (5%)

3. Conform tabelului t - Distribuțiile lui Student (Anexă, Tabelul 1) găsiți valorile la limită ale lui t γ .

Deoarece distribuția t este simetrică față de punctul zero, este suficient să cunoaștem doar valoarea pozitivă a lui t. De exemplu, dacă dimensiunea eșantionului este n=16, atunci numărul de grade de libertate (grade de libertate, df) t– distribuții df=16 - 1=15 . Conform tabelului 1 aplicare t 0,05 = 2,13 .

4. Găsim limitele intervalului de încredere pentru α = 0,05 și n=16:

Limitele încrederii:

Pentru dimensiuni mari ale eșantionului (n ≥ 30) t – Distribuția elevului devine normală. Prin urmare, intervalul de încredere pentru pentru n ≥ 30 se poate scrie după cum urmează:

Unde u sunt punctele procentuale ale distribuției normale normalizate.

Pentru probabilitățile standard de încredere (95%, 99%; 99,9%) și nivelurile de semnificație valori α ( u) sunt date în tabelul 8.

Tabelul 8

Valori pentru nivelurile de încredere standard α

α u
0,05 1,96
0,01 2,58
0,001 3,28

Pe baza datelor din exemplul 1, definim limitele celor 95% interval de încredere (α = 0,05) pentru rezultatul mediu al săriturii în sus de la fața locului.În exemplul nostru, dimensiunea eșantionului este n = 65, apoi recomandările pentru o dimensiune mare a eșantionului pot fi utilizate pentru a determina limitele intervalului de încredere.

Interval de încredere sunt valorile limită ale unei mărimi statistice care, cu o probabilitate de încredere dată γ, va fi în acest interval cu o dimensiune a eșantionului mai mare. Notat cu P(θ - ε . În practică, probabilitatea de încredere γ este aleasă dintre valorile γ = 0,9 , γ = 0,95 , γ = 0,99 suficient de aproape de unitate.

Atribuirea serviciului. Acest serviciu definește:

  • interval de încredere pentru media generală, interval de încredere pentru varianță;
  • interval de încredere pentru abaterea standard, interval de încredere pentru fracția generală;
Soluția rezultată este salvată într-un fișier Word. Mai jos este o instrucțiune video despre cum să completați datele inițiale.

Exemplul #1. Într-o fermă colectivă, dintr-un efectiv total de 1.000 de oi, 100 de oi au fost supuse tunderii cu control selectiv. Ca urmare, s-a stabilit o forfecare medie a lânii de 4,2 kg per oaie. Determinați cu o probabilitate de 0,99 eroarea standard a eșantionului în determinarea forfecării medii a lânii per oaie și limitele în care se află valoarea forfecării dacă varianța este 2,5. Eșantionul este nerepetitiv.
Exemplul #2. Din lotul de produse importate de la postul Vămii de Nord Moscova, au fost prelevate 20 de mostre de produs „A” în ordinea reeșantionării aleatorii. În urma verificării, a fost stabilit conținutul mediu de umiditate al produsului „A” din probă, care s-a dovedit a fi de 6%, cu o abatere standard de 1%.
Determinați cu o probabilitate de 0,683 limitele conținutului mediu de umiditate al produsului în întregul lot de produse importate.
Exemplul #3. Un sondaj efectuat pe 36 de studenți a arătat că numărul mediu de manuale citite de aceștia pe an universitar s-a dovedit a fi 6. Presupunând că numărul de manuale citite de un student pe semestru are o lege de distribuție normală cu o abatere standard egală cu 6, găsiți : A) cu o fiabilitate de 0,99 estimare de interval pentru așteptarea matematică a acestei variabile aleatoare; B) cu ce probabilitate se poate susține că numărul mediu de manuale citite de un student pe semestru, calculat pentru acest eșantion, se abate de la așteptarea matematică în valoare absolută cu cel mult 2.

Clasificarea intervalelor de încredere

După tipul de parametru evaluat:

După tipul de eșantion:

  1. Interval de încredere pentru eșantionare infinită;
  2. Interval de încredere pentru eșantionul final;
Eșantionarea se numește reeșantionare, dacă obiectul selectat este returnat populației generale înainte de a-l alege pe următorul. Eșantionul se numește nerepetitiv. dacă obiectul selectat nu este returnat populației generale. În practică, se ocupă de obicei cu mostre care nu se repetă.

Calculul erorii medii de eșantionare pentru selecția aleatorie

Discrepanța dintre valorile indicatorilor obținuți din eșantion și parametrii corespunzători ai populației generale se numește eroare de reprezentativitate.
Desemnări ale parametrilor principali ai populației generale și eșantionului.
Exemple de formule de eroare medie
reselectareselecție nerepetitivă
pentru mijlocpentru împărțirepentru mijlocpentru împărțire
Raportul dintre limita erorii de eșantionare (Δ) garantat cu o oarecare probabilitate P(t), iar eroarea medie de eșantionare are forma: sau Δ = t μ, unde t– coeficient de încredere, determinat în funcție de nivelul de probabilitate Р(t) conform tabelului funcției integrale Laplace .

Formule pentru calcularea mărimii eșantionului cu o metodă adecvată de selecție aleatorie

Metoda de selecțieFormule pentru mărimea eșantionului
pentru mijlocpentru împărțire
Se repetă
nerepetată
Puteți găsi dimensiunea eșantionului folosind un calculator.

Metoda intervalului de încredere

Algoritmul pentru găsirea intervalului de încredere include următorii pași:
  1. este dată probabilitatea de încredere γ (fiabilitatea).
  2. din eşantion se determină estimarea parametrului a.
  3. din relaţia P(α 1 se calculează intervalul de încredere (a - ε ; a + ε).

Exemplul #1. La verificarea adecvării unui lot de tablete (250 de bucăți), s-a dovedit că greutatea medie a unei tablete este de 0,3 g, iar abaterea standard a greutății este de 0,01 g. Găsiți intervalul de încredere în care se încadrează norma de greutate a tabletei. cu o probabilitate de 90%.
Soluţie.

Exemplu. Pe baza rezultatelor observării eșantionului (anexa eșantionului B), calculați estimările imparțiale ale mediei, varianței și abaterii standard ale populației.
Descărcați soluția

Exemplu. Găsiți intervalele de încredere pentru estimarea mediei și a abaterii standard a populațiilor la un nivel de încredere y, dacă B și y sunt eșantionate din populații.
Descărcați soluția

Exemplu.

1. Folosind rezultatele calculelor efectuate în sarcina nr. 2 și presupunând că aceste date au fost obținute folosind selecția corespunzătoare aleatorie nerepetitivă de 10%, determinați:
a) limitele dincolo de care, cu o probabilitate de încredere de 0,954, nu va depăși valoarea medie a atributului calculată pentru populația generală;
b) cum se modifică dimensiunea eșantionului pentru a reduce eroarea marginală a mediei cu 50%.
2. Folosind rezultatele calculelor efectuate în sarcina nr. 2 și presupunând că aceste date au fost obținute prin selecție repetată, determinați:
a) limitele dincolo de care valoarea ponderii întreprinderilor în care valorile individuale ale atributului depășesc modul cu probabilitate de încredere de 0,954 nu va depăși în populația generală;
b) cum se modifică dimensiunea eșantionului pentru a reduce eroarea cotei marginale cu 20%.
Instrucțiuni

Exercițiu. Linia de producție pentru producerea aceluiași tip de piese a fost supusă reconstrucției Au fost date două mostre care arată procentul de rebuturi în loturi de piese produse pe această linie înainte și după reconstrucție. Se poate afirma cu încredere că după reconstrucție procentul de rebuturi în loturi de piese a scăzut?

Exemplu. Mai jos sunt date despre costurile de foraj (c.u.) pentru 49 de sonde ale bazei petroliere din Siberia de Vest a Rusiei:

129 142 132 61 96 96 142 17 135 32
77 58 37 132 79 15 145 64 83 120
11 54 48 100 43 25 67 25 140 130
48 124 29 107 135 101 93 147 112 121
89 97 60 84 46 139 43 145 29
În scopul estimării costului forării unui puț nou:
  1. să conducă o probă într-un mod aleatoriu adecvat cu un volum de n=5;
  2. determinați valorile de interval ale mediei populației generale (X) conform indicatorilor eșantionului calculati (X, s 2) folosind funcția de distribuție t a lui Student la un nivel de semnificație de α=0,05;
  3. determinați valoarea punctuală a mediei populației generale (X) conform datelor inițiale;
  4. evaluați corectitudinea calculelor intervalului prin compararea valorii punctului (X) cu valoarea intervalului calculată din probă;
Soluţie folosind acest calculator:

1. Selectați 5 valori din tabel. Fie coloana 3: 132, 37, 48, 29, 60.
În capitolul „Tipul seriei statistice” alege Discrete Series. Introduceți 5 în câmpul Număr de linii.

2. Introduceți datele inițiale.

În câmpul Număr de grupuri, selectați „ nu grupați».

Câmpul „Interval de încredere al mediei generale, varianței și abaterii standard” Indicați valoarea γ = 0,95 (care corespunde cu α=0,05).

În câmpul „Eșantionare”, specificați valoarea 10 (deoarece au fost alese 5 din 49 de valori, ceea ce corespunde cu 10,2% (5 / 49x100%)).

În capitolul „Ieșiri de raportat” marcați primul articol „Interval de încredere pentru media generală”.

3. Soluția rezultată este salvată în format Word (descărcare).
Înainte de calcule, se creează un tabel preliminar în care se calculează numărul de repetări ale valorilor X.

X(x - x sr) 2
29 1036.84
37 585.64
48 174.24
60 1.44
132 5012.64
306 6810.8
În acest caz, toate valorile lui X apar exact o dată. Valorile de interval ale mediei populației sunt calculate în secțiunea „ Estimarea pe intervale a centrului populației”.
Notă: în acest caz, calculul utilizează Estimarea abaterii standard.

Sarcina numărul 2: Pentru a studia timpul petrecut la fabricarea unei piese, muncitorii din fabrică au efectuat un eșantion aleator nerepetitiv de 10%, care a rezultat în distribuția pieselor în funcție de timpul petrecut, prezentat în App. B.
Pe baza acestor date, calculați:
a) timpul mediu petrecut la fabricarea unei piese;
b) abaterile pătrate medii (dispersie) și abaterea standard;
c) coeficientul de variaţie;
d) cu o probabilitate de 0,954, eroarea marginală a mediei eșantionului și limitele posibile în cadrul cărora se așteaptă timpul mediu petrecut pentru fabricarea unei piese în fabrică;
e) cu o probabilitate de 0,954, eroarea marginală a fracției de probă și limitele greutății specifice ale numărului de piese cu timp minim petrecut la fabricarea acestora. Înainte de a face calcule, este necesar să scrieți condițiile problemei și să completați tabelul. 2.1

Soluţie.
Pentru a obține o soluție, specificați următorii parametri:

  • Tip de serie statistică: Se dă o serie discretă;
  • Număr de grupuri: nu grupați;
  • Pentru a construi un interval de încredere pentru media generală, varianța și abaterea standard: y= 0,954 ;
  • Pentru a construi intervalul de încredere al fracției generale: y= 0,954 ;
  • Proba: 10 ;
  • Rezultatele raportului: Interval de încredere pentru media generală, Interval de încredere pentru cota generală;

Sarcina numărul 3: Folosind rezultatele calculelor efectuate în sarcina nr. 2 și presupunând că aceste date au fost obținute prin selecție repetată, determinați:

b) cum se modifică dimensiunea eșantionului pentru a reduce eroarea cotei marginale cu 20%.

Soluţie.
Folosind rezultatele calculelor efectuate în sarcina nr. 2 și presupunând că aceste date au fost obținute prin selecție repetată, determinați:
a) limitele dincolo de care valoarea ponderii întreprinderilor în care valorile individuale ale atributului depășesc modul cu probabilitate de încredere de 0,954 nu va depăși în populația generală;
b) cum se modifică dimensiunea eșantionului pentru a reduce eroarea cotei marginale cu 20%.

Sarcina numărul 4: O probă nerepetitivă aleatorie de 20% a fost prelevată dintr-un lot de becuri pentru a determina greutatea medie a bobinei. Rezultatele eșantionării sunt după cum urmează. Greutate, mg: 38-40; 40-42; 42-44; 44-46. Număr de spirale: 15; 30; 45; 10. Determinați cu o probabilitate de 0,95 limitele de încredere în care se află greutatea medie a bobinei pentru întregul lot de lămpi electrice.

Soluţie.
Introduceți următorii parametri:

  • Tip de serie statistică: Se specifică o serie de intervale;
  • Pentru a construi un interval de încredere pentru media generală, varianța și abaterea standard: y = 0,95 ;
  • Proba: 20 ;
  • Raport: Interval de încredere pentru media generală.

Sarcina numărul 5: La fabrica de lămpi electrice dintr-un lot de produse în valoare de 16.000 buc. lămpi prelevate pe o probă de 1600 de bucăți. (selecție aleatorie, nerepetitivă), din care 40 buc. s-a dovedit a fi căsătorit. Determinați cu o probabilitate de 0,997 limitele în care procentul de refuzuri va fi pentru întregul lot de produse.

Soluţie.
Aici N = 16000 , n = 1600 , w = d / n = 40/1600 = 0,025.

 

Ar putea fi util să citiți: