Analiza factorilor de date. Analiza factorială, tipurile și metodele acesteia. Analiza factorială prin metoda substituțiilor de lanț

Analiza factorială a profitului vă permite să evaluați impactul fiecărui factor separat asupra rezultatului financiar în ansamblu. Citiți cum să o desfășurați și, de asemenea, descărcați metodologia.

Esența analizei factoriale

Esența metodei factoriale este de a determina influența fiecărui factor individual asupra rezultatului în ansamblu. Acest lucru este destul de dificil de făcut, deoarece factorii se influențează reciproc, iar dacă factorul nu este cantitativ (de exemplu, un serviciu), atunci ponderea sa este estimată de un expert, ceea ce lasă o amprentă de subiectivitate asupra întregii analize. În plus, atunci când există prea mulți factori care influențează rezultatul, atunci datele nu pot fi procesate și calculate fără programe speciale de modelare matematică.


Unul dintre cei mai importanți indicatori financiari ai unei întreprinderi este profitul. În cadrul analizei factorilor, este mai bine să analizați profitul în marjă, unde costuri fixe absent sau profit din vânzări.

Aflați motivele modificărilor folosind modelul Excel

Descărcați modelul finit în Excel. Vă va ajuta să aflați cum volumul vânzărilor, prețul și structura vânzărilor au influențat veniturile.

Analiza factorială prin metoda substituțiilor de lanț

În analiza factorială, economiștii folosesc de obicei metoda substituțiilor în lanț, totuși, din punct de vedere matematic, această metodă este incorectă și produce rezultate foarte distorsionate, care diferă semnificativ în funcție de care variabile sunt înlocuite prima și care după (de exemplu, în Tabelul 1).

tabelul 1... Analiza veniturilor in functie de pretul si cantitatea produselor vandute

Anul de baza

Anul acesta

Creșterea veniturilor

Venituri
B 0

Venituri
B 0

În detrimentul
preturi
În p

Datorita cantitatii
În q

Opțiunea 1

P 1 Q 0 - P 0 Q 0

P 1 Q 1 - P 1 Q 0

B1-B0

Opțiunea 2

P 1 Q 1 -P 0 Q 1

P 0 Q 1 - P 0 Q 0

B1-B0

În prima variantă, veniturile datorate prețului au crescut cu 500 de ruble, iar în a doua cu 600 de ruble; venitul datorat sumei din primul a crescut cu 300 de ruble, iar în al doilea cu doar 200 de ruble. Astfel, rezultatele variază semnificativ în funcție de ordinea substituției. ...

Puteți distribui mai corect factorii care influențează rezultatul final în funcție de marjă (Nat) și numărul de vânzări (Qty) (vezi Figura 1).

Poza 1

Formula pentru creșterea profitului datorită marjei: P nat = ∆ Nat * (Număr (tehnologie) + Număr (bază)) / 2

Formula pentru creșterea profitului datorită cantității: P count = ∆ Cant. * (Nat (tehnologie) + Nat (bază)) / 2

Un exemplu de analiză cu doi factori

Luați în considerare un exemplu din tabelul 2.

masa 2... Exemplu de analiză în doi factori a veniturilor

Anul de baza

Anul acesta

Creșterea veniturilor

Venituri
B 0

Venituri
B 0

Datorită marjei
În p

cantitate
În q

∆ P (Q 1 + Q 0) / 2

∆ Q (P 1 + P 0) / 2

B1-B0

Produsul „A”

Am obținut valorile medii între variantele de substituții de lanț (a se vedea tabelul 1).

Model cu trei factori pentru analiza profitului

Modelul cu trei factori este mult mai complicat decât modelul cu doi factori (Figura 2).

Poza 2


Formula utilizată pentru a determina influența fiecărui factor într-un model cu 3 factori (de exemplu, marcaj, cantitate, nomenclatură) asupra rezultatului general este similară cu formula dintr-un model cu doi factori, dar mai complicată.

P nat = ∆Nat * ((Număr (tehn.) * Nom (tehn.) + Număr (bază) * Nom (bază)) / 2 - ∆Kol * ∆Nom / 6)

P count = ∆Col * ((Nat (tehn.) * Nom (tehn.) + Nat (bază) * Nom (bază)) / 2 - ∆Nat * ∆Nom / 6)

P nom = ∆Nom * ((Nat (tehn.) * Kol (tehn.) + Nat (bază) * Kol (bază)) / 2 - ∆Nat * ∆Col / 6)

Exemplu de analiză

În tabel, am dat un exemplu de utilizare a modelului cu trei factori.

Tabelul 3... Un exemplu de calcul al veniturilor folosind un model cu trei factori

Anul trecut

Anul acesta

Factori de venituri

Nomenclatură

∆ Q ((N 1 P 1 + N 0 P 0) / 2 -
- ∆ N ∆ P / 6)

∆ P ((N 1 Q 1 + N 0 Q 0) / 2 -
- ∆ N ∆ Q / 6)

∆ N ((Q 1 P 1 + Q 0 P 0) / 2 -
- ∆ Q ∆ P / 6)

Dacă ne uităm la rezultatele analizei veniturilor prin metoda factorilor, atunci cea mai mare creștere a veniturilor a avut loc datorită creșterii prețurilor. Prețurile au crescut cu (15/10 - 1) * 100% = 50%, următoarea ca importanță a fost creșterea în intervalul de la 3 la 4 unități - rata de creștere (4/3 - 1) * 100% = 33% și pe ultimul loc „cantitatea”, care a crescut doar cu (120 / 100-1) * 100% = 20%. Astfel, factorii afectează profitul proporțional cu rata de creștere.

Model cu patru factori

Din păcate, pentru o funcție de forma Pr = Kol av * Nom * (Preț - Seb), nu există formule simple pentru calcularea influenței fiecărui factor individual asupra indicatorului.

Pr - profit;

Col av - cantitatea medie pe unitate de articol;

Nom - numărul de articole din stoc;

Pret - pret;

.

Există o metodă de calcul bazată pe teorema Lagrange cu increment finit, folosind calcul diferențial și integral, dar este atât de complexă și consumatoare de timp încât practic nu este aplicabilă în viața reală.

Prin urmare, pentru a izola fiecare factor individual, mai întâi sunt calculați factori mai generali folosind modelul obișnuit cu doi factori, iar apoi componentele lor în același mod.

Formula generală a profitului: Pr = Qty * Nat (Nat - markup pe o unitate de produse). În consecință, determinăm influența a doi factori: cantitatea și marja. La rândul său, numărul de produse vândute depinde de nomenclatură și de numărul de vânzări pe articol în medie.

Se obține Cantitate = Kol av * Nom. Iar marja depinde de preț și cost, adică. Nat = Pret - Seb. La rândul său, influența prețului de cost asupra modificării profitului depinde de cantitatea de produse vândute și de modificarea prețului de cost în sine.

Astfel, trebuie să determinăm separat influența a 4 factori asupra modificării profitului: Cantitate, Preț, Seb, Nom, folosind 4 ecuații:

  1. Pr = Număr * Nat
  2. Cantitate = Kol av * Nom
  3. Zatr = Cantitate * Seb.
  4. Exp = Cantitate * Preț

Un exemplu de analiză a modelului cu patru factori

Să ne uităm la un exemplu. Date inițiale și calcule în tabel

Tabelul 4... Un exemplu de analiză a profitului folosind un model cu 4 factori

Anul trecut

Numărătoare (miercuri)
Q (miercuri 0)

Profit
P 0

Q 0 * (P 0 -C 0)

∑Q 0 P 0 / ∑Q 0

∑Q 0 P 0 / ∑Q 0

Anul acesta

Numărătoare (miercuri)
Q (miercuri 1)

Q 1 * (P 1 -C 1)

Totaluri și medii ponderate

∑Q 1 P 1 / ∑Q 1

∑Q 1 P 1 / ∑Q 1

Influența factorului asupra modificării profitului

Nom
N ∆

Număr
Q ∆

Numărătoare (miercuri)
Q (cf) ∆

Preț
P ∆

Nat
H ∆

∆N * (Q (av 0) + Q (av 1)) / 2
* (H1 + H0) / 2

∆Q * (H 1 + H 0) / 2

∆Q (cf.) * (N 1 + N 0) / 2

* (H1 + H0) / 2

∆P * (Q 1 + Q 0) / 2

∆С * (Q 1 + Q 0) / 2

∆H * (Q 1 + Q 0) / 2

Totaluri și medii ponderate

Notă: numerele din tabelul Excel pot diferi cu câteva unități de datele din descrierea textului, deoarece sunt rotunjite la zecimi în tabel.

1. În primul rând, folosind modelul cu doi factori (descris chiar la început), descompunem modificarea profitului într-un factor cantitativ și un factor de marjă. Aceștia sunt factori de prim ordin.

Pr = Număr * Nat

Număr ∆ = ∆Q * (H 1 + H 0) / 2 = (220 - 180) * (3,9 + 4,7) / 2 = 172

Nat ∆ = ∆H * (Q 1 + Q 0) / 2 = (4,7 - 3,9) * (220 + 180) / 2 = 168

Verificați: ∆Пр = Kol ∆ + Nat ∆ = 172 + 168 = 340

2. Calculăm dependența de parametrul costului. Pentru a face acest lucru, împărțim costurile în cantitate și cost după aceeași formulă, dar cu semnul minus, deoarece costul reduce profitul.

Cost = Cantitate * Seb

Ceb∆ = - ∆C * (Q1 + Q0) / 2 = - (7,2 - 6,4) * (180 + 220) / 2 = -147

3. Calculăm dependența de preț. Pentru a face acest lucru, împărțim veniturile în cantitate și preț folosind aceeași formulă.

Exp = Cantitate * Preț

Preț∆ = ∆P * (Q1 + Q0) / 2 = (11,9 - 10,3) * (220 + 180) / 2 = 315

Verificați: Nat∆ = Preț∆ - Seb∆ = 315 - 147 = 168

4. Calculăm impactul articolului asupra profitului. Pentru a face acest lucru, descompunem numărul de produse vândute după numărul de unități din gamă și cantitatea medie pe unitatea din gamă. Deci vom determina raportul dintre factorul de cantitate și nomenclatura în natură. După aceea, înmulțim datele obținute cu marcajul mediu anual și le convertim în ruble.

Cantitate = Nom * Cantitate (miercuri)

Nom ∆ = ∆N * (Q (medie 0) + Q (medie 1)) / 2 * (H 1 + H 0) / 2 = (3 - 2) (73 + 90) / 2 * (4,7 + 3,9) = 352

Număr (medie) = ∆Q (medie) * (N 1 + N 0) / 2 * (H 1 + H 0) / 2 = (73 - 90) * (2 + 3) / 2 * (4,7 + 3,9) = -180

Verificați: Cant. ∆ = Nom ∆ + Cant. (cf.) = 352-180 = 172

Analiza în patru factori de mai sus a arătat că profitul a crescut comparativ cu anul trecut din cauza:

  • creșterea prețurilor cu 315 mii de ruble;
  • modificări ale nomenclaturii cu 352 mii de ruble.

Și a scăzut din cauza:

  • creșterea costurilor cu 147 mii de ruble;
  • scăderea numărului de vânzări cu 180 de mii de ruble.

S-ar părea un paradox: numărul total de unități vândute în anul curent față de anul precedent a crescut cu 40 de unități, dar factorul cantitativ arată un rezultat negativ. Aceasta deoarece creșterea vânzărilor s-a datorat creșterii articolelor din nomenclatură. Dacă anul trecut au fost doar 2, atunci anul acesta a mai fost adăugat unul. Totodată, din punct de vedere cantitativ, bunurile „B” au fost vândute în anul de raportare pentru 20 de unităţi. mai putin decat in precedenta.

Aceasta sugerează că produsul „C” introdus în noul an a înlocuit parțial produsul „B”, dar a atras noi cumpărători, pe care produsul „B” nu i-a avut. Dacă anul viitor produsul „B” continuă să-și piardă poziția, atunci acesta poate fi eliminat din sortiment.

În ceea ce privește prețurile, creșterea acestora cu (11,9 / 10,3 - 1) * 100% = 15,5% nu a afectat foarte mult vânzările în general. Judecând după produsul „A”, care nu a fost afectat de modificările structurale ale sortimentului, atunci vânzările sale au crescut cu 20%, în ciuda creșterii prețului cu 33%. Aceasta înseamnă că creșterea prețurilor nu este critică pentru firmă.

Totul este clar cu prețul de cost: a crescut și profitul a scăzut.

Analiza factorială a profitului vânzărilor

Evgeny Shagin, CFO Compania de management RusCherMet

Pentru a efectua analiza factorială, trebuie să:

  • alege o bază de analiză - venituri din vânzări, profit;
  • selectați factorii a căror influență trebuie evaluată. În funcție de baza de analiză aleasă, acestea pot fi: volumul vânzărilor, prețul de cost, cheltuielile de exploatare, veniturile neexploatare, dobânda la un împrumut, impozite;
  • evaluați influența fiecărui factor asupra indicatorului final. În calculul de bază pentru perioada anterioară, înlocuiți valoarea factorului selectat din perioada de raportare și ajustați indicatorul final ținând cont de aceste modificări;
  • determina influenta factorului. Scădeți din valoarea intermediară obținută a indicatorului estimat valoarea reală a acestuia pentru perioada anterioară. Dacă cifra este pozitivă, modificarea factorului a avut un impact pozitiv, negativ - negativ.

Exemplu de analiză factorială a profitului vânzărilor

Să ne uităm la un exemplu. Raportul asupra rezultate financiare Să înlocuim valoarea volumului vânzărilor pentru perioada curentă (571.513.512 ruble în loc de 488.473.087 ruble) pentru compania Alfa pentru perioada anterioară, toți ceilalți indicatori vor rămâne la fel (a se vedea tabelul 5). Drept urmare, profitul net a crescut cu 83.040.425 de ruble. (116.049.828 RUB - 33.009.403 RUB). Aceasta înseamnă că, dacă în perioada anterioară compania ar fi reușit să vândă produse pentru aceeași sumă ca în aceasta, atunci profitul său net ar fi crescut cu doar aceste 83.040.425 de ruble.

Tabelul 5... Analiza factorială a profitului în funcție de volumul vânzărilor

Index

Perioada anterioară, frecați.

cu înlocuire
sens
factor din
curent
perioadă

Volumul vânzărilor

Profit brut

Costuri de operare

Profit operational

Dobândă

Profit înainte de impozitare

Profit net

1 Valoarea volumului vânzărilor pentru perioada curentă.

2 Indicatorul este recalculat luând în considerare ajustarea volumului vânzărilor.

Folosind o schemă similară, puteți evalua influența fiecărui factor și recalculați profitul net și rezumați rezultatele finale într-un singur tabel (a se vedea tabelul 6).

Tabelul 6... Influența factorilor asupra profitului, ruble

Volumul vânzărilor

Pretul produsele vândute, Servicii

Costuri de operare

Venituri/cheltuieli neexploatare

Dobândă

Total

32 244 671

După cum se poate observa din tabelul 6, cel mai mare impact în perioada analizată l-a avut creșterea vânzărilor (83.040.425 de ruble). Suma influenței tuturor factorilor coincide cu modificarea reală a profitului pentru perioada trecută. Prin urmare, putem concluziona că rezultatele analizei sunt corecte.

Concluzie

În concluzie, aș dori să înțeleg: cu ce aveți nevoie pentru a compara profitul în analiza factorială? Cu ultimul an, cu anul de bază, cu concurenții, cu planul? Cum să înțelegeți dacă o întreprindere a funcționat bine în acest an sau nu? De exemplu, o întreprindere și-a dublat profitul pentru anul în curs, s-ar părea că acesta este un rezultat excelent! Dar în acest moment, concurenții au efectuat reechiparea tehnică a întreprinderii și de anul viitor îi vor alunga pe norocoși de pe piață. Și dacă compari cu concurenții, atunci veniturile lor sunt mai mici, pentru că în loc, să zicem, să facă publicitate sau să extindă gama, au investit în modernizare. Astfel, totul depinde de obiectivele și planurile întreprinderii. Din care rezultă că profitul efectiv trebuie comparat, în primul rând, cu cel planificat.

ANALIZA FACTORILOR

Ideea analizei factoriale

Când se studiază obiecte, fenomene, sisteme complexe, factorii care determină proprietățile acestor obiecte sunt foarte adesea imposibil de măsurat direct și uneori chiar și numărul și semnificația lor sunt necunoscute. Dar alte cantități pot fi disponibile pentru măsurare, într-un fel sau altul în funcție de factorii care ne interesează. Mai mult, atunci când influența unui factor necunoscut care ne interesează se manifestă în mai multe trăsături sau proprietăți măsurabile ale unui obiect, aceste caracteristici pot dezvălui o relație strânsă între ele, iar numărul total de factori poate fi mult mai mic decât numărul măsurat. variabile.

Pentru a identifica factorii care determină caracteristicile măsurate ale obiectelor, se folosesc metode de analiză factorială.

Ca exemplu de aplicare a analizei factoriale, se poate indica studiul trăsăturilor de personalitate bazate pe teste psihologice... Trăsăturile de personalitate nu se pretează la măsurarea directă. Ele pot fi judecate doar după comportamentul unei persoane sau după natura răspunsurilor la întrebări. Pentru a explica rezultatele experimentelor, acestea sunt supuse unei analize factoriale, care ne permite să identificăm acele proprietăți personale care afectează comportamentul unui individ.
În inima metode diferite analiza factorială se bazează pe următoarea ipoteză: parametrii observați sau măsurați sunt doar caracteristici indirecte ale obiectului studiat, în realitate există parametri și proprietăți interni (ascunși, latenți, neobservați direct), al căror număr este mic și care determinați valorile parametrilor observați. Acești parametri interni sunt de obicei numiți factori.

Scopul analizei factorilor este de a concentra informațiile inițiale, exprimând un număr mare de caracteristici luate în considerare printr-un număr mai mic de elemente mai încăpătoare. caracteristici interne fenomene care însă nu sunt direct măsurabile

S-a stabilit că izolarea și observarea ulterioară a nivelului factorilor comuni face posibilă detectarea stărilor pre-defecțiuni ale unui obiect în stadii foarte timpurii de dezvoltare a defectului. Analiza factorială vă permite să urmăriți stabilitatea corelațiilor dintre parametrii individuali. Corelațiile dintre parametri, precum și între parametrii și factorii generali sunt cele care conțin principalele informații de diagnostic despre procese. Utilizarea instrumentelor pachetului Statistica atunci când se efectuează analiza factorială elimină nevoia de instrumente de calcul suplimentare și face analiza clară și ușor de înțeles pentru utilizator.

Rezultatele analizei factoriale vor avea succes dacă este posibilă interpretarea factorilor identificați pe baza semnificației indicatorilor care caracterizează acești factori. Această etapă a muncii este foarte responsabilă; necesită o înțelegere clară a sensului semnificativ al indicatorilor care sunt implicați în analiză și pe baza cărora sunt identificați factorii. Prin urmare, în selecția preliminară atentă a indicatorilor pentru analiza factorială, trebuie să ne ghidăm după semnificația acestora, și nu după dorința de a include în analiză cât mai mulți dintre ei.

Esența analizei factoriale

Iată câteva dintre principalele prevederi ale analizei factoriale. Lăsați pentru matrice NS parametrii măsurați ai obiectului există o matrice de covarianță (corelație). C, Unde R- numărul de parametri, n- numarul de observatii. Prin transformare liniară X=QY+U puteți reduce dimensiunea spațiului factor original NS a nivela Y, în care R"<<R... Aceasta corespunde transformării punctului care caracterizează starea obiectului în j-spațiu dimensional, într-un nou spațiu de dimensiuni cu o dimensiune inferioară R„. Evident, proximitatea geometrică a două sau a unui set de puncte în noul spațiu factorial înseamnă stabilitatea stării obiectului.

Matrice Y conține factori neobservabili, care sunt în esență hiperparametri care caracterizează cele mai generale proprietăți ale obiectului analizat. Factorii comuni sunt aleși cel mai adesea pentru a fi independenți din punct de vedere statistic, ceea ce facilitează interpretarea lor fizică. Vector de semne observate NS are sens asupra consecinței modificării acestor hiperparametri.

Matrice U constă din factori reziduali, care includ în principal erori de măsurare X(i). Matrice dreptunghiulară Q conţine incarcari de factori determinarea relaţiei liniare dintre caracteristici şi hiperparametri.
Încărcările factoriale sunt valorile coeficienților de corelare a fiecăreia dintre caracteristicile inițiale cu fiecare dintre factorii identificați. Cu cât relația dintre această caracteristică este mai strânsă și factorul luat în considerare, cu atât valoarea încărcării factorilor este mai mare. Un semn pozitiv al încărcării factorilor indică o relație directă (și un semn negativ - invers) a acestei trăsături cu un factor.

Astfel, datele privind încărcările factorilor fac posibilă formularea concluziilor despre setul de caracteristici inițiale care reflectă un anumit factor și despre ponderea relativă a unei caracteristici individuale în structura fiecărui factor.

Modelul de analiză factorială este similar cu modelele de regresie multivariată și de analiză a varianței. Diferența fundamentală dintre modelul de analiză factorială este că vectorul Y este factori neobservabili, în timp ce în analiza de regresie aceștia sunt parametri înregistrați. În partea dreaptă a ecuației (8.1), necunoscutele sunt matricea sarcinilor de factori Q și matricea valorilor factorilor comuni Y.

Pentru a găsi matricea încărcărilor factorilor, utilizați ecuația QQ t = S – V, unde Q t este matricea transpusă Q, V este matricea de covarianță a factorilor reziduali U, adică. ... Ecuația este rezolvată prin iterații în timp ce se specifică o aproximare zero a matricei de covarianță V (0). După găsirea matricei de încărcări de factori Q, factorii generali (hiperparametrii) sunt calculați folosind ecuația
Y = (Q t V -1) Q -1 Q t V -1 X

Pachetul de analiză statistică Statistica permite în modul interactiv să se calculeze matricea încărcărilor factorilor, precum și valorile mai multor factori principali predefiniti, cel mai adesea doi - conform primelor două componente principale ale matricei originale de parametri.

Analiza factorială în sistemul Statistica

Să luăm în considerare succesiunea efectuării analizei factorilor utilizând exemplul de prelucrare a rezultatelor unui chestionar al angajaților unei întreprinderi. Este necesar să se identifice principalii factori care determină calitatea vieții în muncă.

În prima etapă, este necesară selectarea variabilelor pentru analiza factorială. Folosind analiza de corelație, cercetătorul încearcă să identifice relația dintre caracteristicile studiate, ceea ce, la rândul său, îi oferă posibilitatea de a selecta un set complet și neredundant de caracteristici prin combinarea caracteristicilor puternic corelate.

Dacă analiza factorială este efectuată pentru toate variabilele, atunci rezultatele pot să nu fie în întregime obiective, deoarece unele variabile sunt determinate de alte date și nu pot fi reglementate de către angajații organizației în cauză.

Pentru a înțelege ce indicatori ar trebui excluși, vom construi o matrice a coeficienților de corelație în Statistica pe baza datelor disponibile: Statistică / Statistică de bază / Matrice de corelație / Ok. În fereastra de pornire a acestei proceduri produs-moment și corelații parțiale (Fig. 4.3), butonul Lista unei variabile este utilizat pentru a calcula matricea pătrată. Selectați toate variabilele (selectați toate), Ok, Rezumat. Obținem matricea de corelație.

Dacă coeficientul de corelație se modifică în intervalul de la 0,7 la 1, atunci aceasta înseamnă o corelație puternică a indicatorilor. În acest caz, o variabilă foarte corelată poate fi exclusă. În schimb, dacă coeficientul de corelație este mic, puteți exclude variabila deoarece nu adaugă nimic la total. În cazul nostru, nu există o corelație puternică între nicio variabilă, iar analiza factorială va fi efectuată pentru setul complet de variabile.

Pentru a rula analiza factorială, trebuie să apelați modulul Statistică / Tehnici exploratorii multivariate (metode de cercetare multivariate) / Analiză factorială (analiza factorială). Fereastra modulului de analiză factorială va apărea pe ecran.



Pentru analiză, selectați toate variabilele foii de calcul; Variabile: selectați tot, Ok. Linia Fișier de intrare indică Date brute. Există două tipuri de date sursă disponibile în modul - Date brute și Matrice de corelație - o matrice de corelație.

Secțiunea de ștergere MD specifică modul în care se gestionează valorile lipsă:
* Casewise - o modalitate de a exclude valorile lipsă (în mod implicit);
* Pairwise - o modalitate în pereche de a exclude valorile lipsă;
* Înlocuirea medie - înlocuirea mediei în locul valorilor lipsă.
Modul Casewise este că într-o foaie de calcul care conține date, toate rândurile care au cel puțin o valoare lipsă sunt ignorate. Acest lucru se aplică tuturor variabilelor. Metoda Pairwise ignoră valorile lipsă nu pentru toate variabilele, ci numai pentru perechea selectată.

Să alegem o modalitate de a gestiona valorile lipsă, în caz de caz.

Statistica va procesa valorile lipsă în modul specificat, va calcula matricea de corelație și va oferi o alegere între mai multe metode de analiză factorială.

După ce faceți clic pe butonul Ok, apare fereastra Definiți metoda de extracție a factorilor.

Partea de sus a ferestrei are caracter informativ. Se spune că valorile lipsă au fost tratate prin metoda Casewise. Au fost procesate 17 observații și au fost acceptate 17 observații pentru calcule ulterioare. Matricea de corelație este calculată pentru 7 variabile. Partea de jos a ferestrei conține 3 file: Rapid, Avansat, Descriptive.

Fila Descriptive are două butoane:
1- vizualizați corelații, medii și abateri standard;
2- construiți regresia multiplă.

Făcând clic pe primul buton, puteți vedea media și abaterile standard, corelațiile, covarianța, puteți construi diverse grafice și histograme.

În fila Avansat, din stânga, selectați Metoda de extracție de analiză factorială: Componente principale. În partea dreaptă, selectați numărul maxim de factori (2). Se setează fie numărul maxim de factori (Nr. maxim de factori), fie valoarea proprie minimă: 1 (valoarea proprie).

Faceți clic pe Ok și Statistica va face calculele rapid. Apare fereastra Rezultate analiză factorială. După cum sa menționat mai devreme, rezultatele analizei factoriale sunt exprimate printr-un set de încărcări de factori. Prin urmare, vom lucra în continuare cu fila Încărcări.

Partea de sus a ferestrei este informativă:
Număr de variabile: 7;
Metoda (metoda de identificare a factorilor): Componente principale;
Log (10) determinant al matricei de corelație: –1,6248;
Număr de factori extrași: 2;
Valori proprii: 3,39786 și 1,19130.
În partea de jos a ferestrei există butoane funcționale care vă permit să vizualizați cuprinzător rezultatele analizei, numeric și grafic.
Rotația factorilor - rotația factorilor, în această fereastră derulantă puteți selecta diferite rotații ale axelor. Prin rotirea sistemului de coordonate se poate obține un set de soluții din care este necesar să se aleagă o soluție interpretată.

Există diferite metode de rotire a coordonatelor spațiului. Statistica oferă opt astfel de metode, prezentate în Modulul de Analiză Factorială. Deci, de exemplu, metoda varimax corespunde unei transformări de coordonate: o rotație care maximizează varianța. În metoda varimax, se obține o descriere simplificată a coloanelor matricei factorilor, reducând toate valorile la 1 sau 0. În acest caz, se ia în considerare varianța pătratelor încărcărilor factorilor. Matricea factorială obținută prin metoda rotației varimax este mai invariantă în ceea ce privește alegerea diferitelor seturi de variabile.

Rotația prin metoda quartimax vizează o simplificare similară doar în raport cu rândurile matricei factorilor. Equimax ocupa o pozitie intermediara? rotația factorilor prin această metodă încearcă simultan să simplifice atât coloanele, cât și rândurile. Metodele de rotație luate în considerare se referă la rotații ortogonale, adică. rezultatul sunt factori necorelați. Metodele de rotație directă oblimină și promax se referă la rotații oblice, care au ca rezultat factori corelați. Termenul normalizat? în numele metodelor indică faptul că sarcinile factorilor sunt normalizate, adică sunt împărțite la rădăcina pătrată a varianței corespunzătoare.

Dintre toate metodele propuse, ne vom uita mai întâi la rezultatul analizei fără a roti sistemul de coordonate - Nerotat. Dacă rezultatul obținut se dovedește a fi interpretabil și ni se potrivește, atunci ne putem opri la asta. Dacă nu, puteți roti axele și puteți vedea alte soluții.

Faceți clic pe butonul „Încărcare factor” și priviți numeric încărcările factorilor.



Reamintim că încărcările factorilor sunt valorile coeficienților de corelație ai fiecărei variabile cu fiecare dintre factorii identificați.

Valoarea sarcinii factorului mai mare de 0,7 arată că acest semn sau variabilă este strâns legată de factorul luat în considerare. Cu cât relația dintre această caracteristică este mai strânsă și factorul luat în considerare, cu atât valoarea încărcării factorilor este mai mare. Un semn pozitiv al încărcării factorilor indică o relație directă (și un semn negativ - invers) a acestei trăsături cu un factor.
Deci, din tabelul de încărcări factoriale au fost identificați doi factori. Primul definește RSD - un sentiment de bunăstare socială. Restul variabilelor se datorează celui de-al doilea factor.

Linia Expl. Var (Fig. 8.5) arată varianța pentru un anumit factor. Linia Prp. Totl arată proporția de varianță atribuită primului și celui de-al doilea factor. În consecință, primul factor reprezintă 48,5% din varianța totală, iar al doilea factor - 17,0% din varianța totală, totul cade pe alți factori necontabiliați. Ca rezultat, doi factori identificați explică 65,5% din variația totală.



Aici vedem și două grupe de factori - OSB și restul setului de variabile, dintre care ZSR-ul iese în evidență - dorința de a schimba locul de muncă. Aparent, are sens să investighezi această dorință mai amănunțit pe baza colectării de date suplimentare.

Selectarea și rafinarea numărului de factori

Odată ce știți cât de multă variație a identificat fiecare factor, puteți reveni la întrebarea câți factori ar trebui păstrați. Prin însăși natura sa, această decizie este arbitrară. Dar există câteva linii directoare comune și, în practică, respectarea lor oferă cele mai bune rezultate.

Numărul de factori comuni (hiperparametri) este determinat prin calcularea valorilor proprii (Fig. 8.7) ale matricei X în modulul de analiză factorială. Pentru a face acest lucru, în fila Variante explicată (Fig. 8.4), faceți clic pe butonul Scree plot.


Numărul maxim de factori comuni poate fi egal cu numărul de valori proprii ale matricei parametrilor. Dar odată cu creșterea numărului de factori, dificultățile de interpretare fizică a acestora cresc semnificativ.

În primul rând, puteți selecta doar factori cu valori proprii mai mari decât 1. În esență, aceasta înseamnă că, dacă un factor nu selectează o varianță echivalentă cu cel puțin varianța unei variabile, atunci este omis. Acesta este cel mai utilizat criteriu. În exemplul de mai sus, pe baza acestui criteriu, ar trebui păstrați doar 2 factori (două componente principale).

Puteți găsi un loc pe diagramă în care scăderea valorilor proprii de la stânga la dreapta încetinește cât mai mult posibil. Se presupune că doar „talusul factorial” este situat în dreapta acestui punct. În conformitate cu acest criteriu, 2 sau 3 factori pot fi lăsați în exemplu.
Smochin. se poate observa că al treilea factor măreşte nesemnificativ ponderea varianţei totale.

Analiza factorială a parametrilor face posibilă detectarea într-un stadiu incipient a unei încălcări a procesului de lucru (apariția unui defect) în diferite obiecte, care este adesea imposibil de observat prin observarea directă a parametrilor. Acest lucru se explică prin faptul că încălcarea corelațiilor dintre parametri are loc mult mai devreme decât modificarea unui parametru. O astfel de denaturare a corelațiilor face posibilă detectarea analizei factorilor a parametrilor în timp util. Pentru a face acest lucru, este suficient să aveți matrice de parametri înregistrați.

Este posibil să se ofere recomandări generale cu privire la utilizarea analizei factoriale, indiferent de domeniul de studiu.
* Fiecare factor trebuie să aibă cel puțin doi parametri măsurați.
* Numărul de măsurători ale parametrilor trebuie să fie mai mare decât numărul de variabile.
* Numărul de factori ar trebui justificat pe baza interpretării fizice a procesului.
* Ar trebui să vă străduiți întotdeauna să vă asigurați că numărul de factori este mult mai mic decât numărul de variabile.

Criteriul Kaiser reține uneori prea mulți factori, în timp ce criteriul scree reține uneori prea puțini factori. Cu toate acestea, ambele criterii sunt destul de bune în condiții normale când există relativ puțini factori și multe variabile. În practică, întrebarea mai importantă este când poate fi interpretată soluția rezultată. Prin urmare, de obicei sunt investigate mai multe soluții cu mai mulți sau mai puțini factori, iar apoi este selectată una dintre cele mai semnificative.

Spațiul caracteristicilor originale ar trebui prezentat în scale de măsurare omogene, deoarece acest lucru permite utilizarea matricelor de corelație în calcul. În caz contrar, se pune problema „greutăților” diverșilor parametri, ceea ce duce la necesitatea folosirii matricelor de covarianță în calcul. Prin urmare, o problemă suplimentară de repetabilitate a rezultatelor analizei factorilor poate apărea atunci când se modifică numărul de caracteristici. Trebuie remarcat faptul că această problemă este pur și simplu rezolvată în pachetul Statistica prin trecerea la o formă standardizată de reprezentare a parametrilor. În acest caz, toți parametrii devin echivalenti în gradul de legătură cu procesele din obiectul de cercetare.

Matrici prost conditionate

Dacă în setul de date inițial există variabile redundante și nu au fost eliminate prin analiza de corelație, atunci matricea inversă (8.3) nu poate fi calculată. De exemplu, dacă o variabilă este suma a altor două variabile selectate pentru această analiză, atunci matricea de corelație pentru acel set de variabile nu poate fi inversată, iar analiza factorială nu poate fi efectuată în mod fundamental. În practică, acest lucru se întâmplă atunci când se încearcă aplicarea analizei factoriale unui set de variabile extrem de dependente, ceea ce se întâmplă uneori, de exemplu, în procesarea chestionarelor. Apoi puteți reduce artificial toate corelațiile din matrice adăugând o constantă mică la elementele diagonale ale matricei și apoi să o standardizați. Această procedură are ca rezultat, de obicei, o matrice care poate fi inversată și, prin urmare, i se poate aplica analiza factorială. Mai mult, această procedură nu afectează setul de factori, dar estimările sunt mai puțin precise.

Modelarea factorială și de regresie a sistemelor variabile de stare

Un sistem cu stări variabile (SPS) este un sistem al cărui răspuns depinde nu numai de acțiunea de intrare, ci și de o constantă generalizată în timp, care determină starea. Amplificator variabil sau atenuator? acesta este un exemplu de cel mai simplu PCA, în care coeficientul de transmisie poate fi modificat discret sau fără probleme conform unor legi. Studiul SPS este de obicei efectuat pentru modele liniarizate în care procesul tranzitoriu asociat cu o modificare a parametrului de stare este considerat complet.

Cele mai răspândite sunt atenuatoarele realizate pe baza conexiunilor în formă de L, T și U în serie și în paralel diode conectate. Rezistența diodelor sub influența curentului de control poate varia într-o gamă largă, ceea ce face posibilă modificarea răspunsului în frecvență și a atenuării în cale. Independența defazării la reglarea amortizarii în astfel de atenuatoare se realizează folosind circuite reactive incluse în structura de bază. Evident, cu un raport diferit al rezistențelor diodelor paralele și serie, se poate obține același nivel de atenuare de inserție. Dar schimbarea defazării va fi diferită.

Să investigăm posibilitatea simplificării proiectării automate a atenuatoarelor, ceea ce exclude dubla optimizare a circuitelor de corectare și a parametrilor elementelor controlate. Vom folosi un atenuator controlat electric ca PCA studiat, al cărui circuit echivalent este prezentat în Fig. 8.8. Nivelul minim de atenuare este asigurat în cazul unui element de rezistență Rs scăzut și al unei rezistențe de element mare Rp. Pe măsură ce rezistența elementului Rs crește și rezistența elementului Rp scade, atenuarea introdusă crește.

Dependența modificării defazării de frecvență și atenuare pentru circuitul fără corecție și cu corecție sunt prezentate în Fig. 8.9 și, respectiv, 8.10. În atenuatorul corectat în domeniul de atenuare de 1,3-7,7 dB și în banda de frecvență de 0,01-4,0 GHz, s-a realizat o schimbare a defazajului de cel mult 0,2 °. Într-un atenuator fără corecție, schimbarea defazării în aceeași bandă de frecvență și domeniu de atenuare ajunge la 3 °. Astfel, defazarea este redusă de aproape 15 ori datorită corecției.


Vom considera parametrii de corecție și control ca variabile sau factori independenți care influențează atenuarea și modificarea defazajului. Acest lucru face posibilă, folosind sistemul Statistica, efectuarea analizei factoriale și de regresie a SPS pentru a stabili regularități fizice între parametrii circuitului și caracteristicile individuale, precum și pentru a simplifica căutarea parametrilor optimi ai circuitului.

Datele inițiale au fost formate după cum urmează. Pentru parametrii de corecție și rezistențele de control diferite de cele optime în sus și în jos pe o grilă de frecvență de 0,01--4 GHz s-a calculat atenuarea de inserție și modificarea defazajului.

Metodele de modelare statistică, în special analiza factorială și de regresie, care nu au fost utilizate anterior pentru proiectarea dispozitivelor discrete cu stări variabile, ne permit să identificăm modelele fizice ale funcționării elementelor sistemului. Aceasta contribuie la crearea structurii dispozitivului pe baza unui criteriu dat de optimitate. În special, această secțiune a considerat un atenuator invariant de fază ca un exemplu tipic de sistem cu variabile de stare. Identificarea și interpretarea încărcărilor factorilor care afectează diferite caracteristici studiate face posibilă modificarea metodologiei tradiționale și simplifica semnificativ căutarea parametrilor de corecție și a parametrilor de control.

S-a stabilit că utilizarea unei abordări statistice a proiectării unor astfel de dispozitive este justificată atât pentru evaluarea fizicii funcționării acestora, cât și pentru fundamentarea schemelor de circuite. Modelarea statistică poate reduce semnificativ volumul cercetării experimentale.

rezultate

  • Observarea factorilor comuni și a încărcărilor de factori corespunzătoare este o identificare necesară a tiparelor interne ale proceselor.
  • Pentru a determina valorile critice ale distanțelor controlate dintre sarcinile factorilor, este necesar să se acumuleze și să generalizeze rezultatele analizei factoriale pentru procese de același tip.
  • Aplicarea analizei factoriale nu se limitează la caracteristicile fizice ale proceselor. Analiza factorială este atât o metodă puternică de monitorizare a proceselor, cât și este aplicabilă proiectării sistemelor pentru o mare varietate de scopuri.

Analiza factorială este unul dintre cele mai puternice instrumente statistice pentru analiza datelor. Se bazează pe procedura de combinare a grupurilor de variabile care se corelează între ele („pleiade de corelare” sau „noduri de corelare”) în mai mulți factori.

Cu alte cuvinte, scopul analizei factoriale este concentrarea informațiilor inițiale, exprimând un număr mare de trăsături considerate printr-un număr mai mic de caracteristici interne mai încăpătoare, care însă nu pot fi măsurate direct (și în acest sens sunt latente).

De exemplu, să ne imaginăm ipotetic o legislatură regională cu 100 de deputați. Dintre diversele probleme de pe ordinea de zi, se supun la vot: a) un proiect de lege prin care se propune restaurarea monumentului lui V.I. Lenin pe piața centrală a orașului - centrul administrativ al regiunii; b) un apel către președintele Federației Ruse cu cererea de a reveni toate industriile strategice în proprietatea statului. Matricea de contingență arată următoarea distribuție a voturilor deputaților:

Monumentul lui Lenin (pentru) Monumentul lui Lenin (împotriva)
Apel la Președinte (pentru) 49 4
Apel la Președinte (împotrivă) 6 41

Evident, voturile sunt legate statistic: majoritatea covârșitoare a deputaților care susțin ideea refacerii monumentului lui Lenin susțin și revenirea întreprinderilor strategice în proprietatea statului. La fel, cei mai mulți oponenți ai restaurării monumentului sunt în același timp și oponenți ai revenirii întreprinderilor în proprietatea statului. În același timp, tematic, votul nu are nicio legătură între ele.

Este logic să presupunem că relația statistică revelată se datorează existenței unui factor ascuns (latent). Legiuitorii, care își formulează punctul de vedere cu privire la o mare varietate de probleme, sunt ghidați de un set restrâns și restrâns de poziții politice. În acest caz, putem presupune prezența unei scindări ascunse în deputați după criteriul de susținere/respingere a valorilor conservator-socialiste. Se remarcă un grup de „conservatori” (conform tabelului nostru de urgență - 49 de deputați) și adversarii acestora (41 de deputați). Prin identificarea unor astfel de diviziuni, vom putea descrie un număr mare de voturi separate printr-un număr mic de factori latenți în sensul că nu le putem detecta direct: în ipoteticul nostru parlament, nu a existat niciodată un vot în care parlamentarii. au fost rugați să-și determine atitudinea față de valorile socialiste conservatoare. Detectăm prezența acestui factor pe baza unei analize semnificative a relațiilor cantitative dintre variabile. Mai mult decât atât, dacă în exemplul nostru sunt luate în mod deliberat variabilele nominale - susținerea facturii cu categoriile „pentru” (1) și „împotrivă” (0), atunci, în realitate, analiza factorială prelucrează în mod eficient datele de interval.

Analiza factorială este utilizată foarte activ atât în ​​știința politică, cât și în sociologia și psihologia „vecinate”. Unul dintre motivele importante pentru cererea mare pentru această metodă este varietatea de sarcini care pot fi rezolvate cu ajutorul ei. Astfel, există cel puțin trei obiective „tipice” ale analizei factoriale:

· Reducerea dimensiunii (reducerea) datelor. Analiza factorială, evidențiind nodurile trăsăturilor interconectate și reducându-le la unii factori generalizați, reduce baza inițială a caracteristicilor descrierii. Soluția la această problemă este importantă într-o situație în care obiectele sunt măsurate printr-un număr mare de variabile și cercetătorul caută o modalitate de a le grupa în funcție de caracteristicile semantice. Trecerea de la multe variabile la mai mulți factori vă permite să faceți descrierea mai compactă, să scăpați de variabilele neinformative și duplicate;

Dezvăluirea structurii obiectelor sau a caracteristicilor (clasificare). Această sarcină este apropiată de cea care este rezolvată prin metoda analizei cluster. Dar dacă analiza cluster ia valorile mai multor variabile pentru „coordonatele” obiectelor, atunci analiza factorială determină poziția obiectului în raport cu factorii (grupuri de variabile înrudite). Cu alte cuvinte, folosind analiza factorială, este posibil să se evalueze asemănarea și diferența obiectelor în spațiul corelațiilor lor, sau în spațiul factorilor. Variabilele latente obținute sunt axele de coordonate ale spațiului factorilor, obiectele luate în considerare sunt proiectate pe aceste axe, ceea ce vă permite să creați o reprezentare geometrică vizuală a datelor studiate, convenabilă pentru o interpretare semnificativă;

Măsurare indirectă. Factorii, fiind latenți (neobservabili empiric), nu pot fi măsurați direct. Cu toate acestea, analiza factorială face posibilă nu numai identificarea variabilelor latente, ci și cuantificarea valorii acestora pentru fiecare obiect.

Să luăm în considerare algoritmul și interpretarea statisticilor de analiză factorială folosind exemplul de date privind rezultatele alegerilor parlamentare din Regiunea Ryazan 1999 (districtul federal). Pentru a simplifica exemplul, să luăm statisticile electorale doar pentru acele partide care au depășit pragul de 5%. Datele sunt preluate în contextul comisiilor electorale teritoriale (pe orașe și raioane ale regiunii).

Primul pas este standardizarea datelor prin conversia lor în puncte standard (așa-numitele puncte L, calculate folosind funcția de distribuție normală).

TEAK

(comisie electorală teritorială)

"Măr" "Unitate" bloc

Jirinovski

OVR petrecere comunista THX
Ermishinskaya 1,49 35,19 6,12 5,35 31,41 2,80
Zaharovskaia 2,74 18,33 7,41 11,41 31,59 l b 3"
Kadomskaya 1,09 29,61 8,36 5,53 35,87 1,94
Kasimovskaia 1,30 39,56 5,92 5,28 29,96 2,37
Orașul Kasimovskaya 3,28 39,41 5,65 6,14 24,66 4,61
Același lucru în punctele standardizate (punctele g)
Ermishinskaya -0,83 1,58 -0,25 -0,91 -0,17 -0,74
Zaharovskaia -0,22 -1,16 0,97 0,44 -0,14 0,43
Kadomskaya -1,03 0,67 1,88 -0,87 0,59 -1,10
Kasimovskaia -0,93 2,29 -0,44 -0,92 -0,42 -0,92
Orașul Kasimovskaya 0,04 2,26 -0,70 -0,73 -1,32 0,01
etc. (32 de cazuri în total)
"Măr" "Unitate" BZ OVR petrecere comunista THX
"Măr"
"Unitate" -0,55
BZ -0,47 0,27
OVR 0,60 -0,72 -0,47
petrecere comunista -0,61 0,01 0,10 -0,48
THX 0,94 -0,45 -0,39 0,52 -0,67

Chiar și o analiză vizuală a matricei de corelații perechi face posibilă formularea de presupuneri cu privire la compoziția și natura pleiadelor de corelație. De exemplu, se găsesc corelații pozitive pentru Uniunea Forțelor Dreapte, Yabloko și blocul Patria-Toată Rusia (perechile Yabloko-OVR, Yabloko-SPS și OVR-SPS). În același timp, aceste trei variabile se corelează negativ cu KPRF (suport pentru KPRF), într-o măsură mai mică cu „Unitate” (suport pentru „Unitate”) și cu atât mai puțin cu variabila BZ (suport pentru „Blocul Zhirinovsky” ). Astfel, probabil, avem două constelații de corelație pronunțate:

("Yabloko" + OVR + SPS) - Partidul Comunist;

("Yabloko" + OVR + SPS) - "Unitate".

Acestea sunt două constelații diferite și nu una, deoarece nu există nicio legătură între Unitate și Partidul Comunist al Federației Ruse (0,01). Este mai dificil de făcut o presupunere în ceea ce privește variabila BZ, aici corelațiile sunt mai puțin pronunțate.

Pentru a testa ipotezele noastre, este necesar să CALCULĂM valorile proprii, scorurile factorilor și încărcările factorilor pentru fiecare variabilă. Astfel de calcule sunt destul de complicate, necesită abilități serioase în lucrul cu matrice, așa că aici nu vom lua în considerare aspectul computațional. Să spunem doar că aceste calcule se pot face în două moduri: metoda componentelor principale și metoda factorilor principali. Analiza componentelor principale este mai frecventă; programele statistice o folosesc implicit.

Să ne oprim asupra interpretării valorilor proprii, a valorilor factorilor și a încărcărilor factorilor.

Valorile proprii ale factorilor pentru cazul nostru sunt următoarele:

bgcolor = alb> 5
Factor Valoare proprie % variație totală
1 3,52 58,75
2 1,14 19,08
3 0,76 12,64
4 0,49 S.22
0,05 0.80
6 0,03 0,51
Total 6 100%

Cu cât valoarea proprie a unui factor este mai mare, cu atât puterea explicativă a acestuia este mai mare (valoarea maximă este egală cu numărul de variabile, în cazul nostru 6). Unul dintre elementele cheie ale statisticilor de analiză factorială este indicatorul „% variație totală”. Arată cât de mult din variația (variabilitatea) variabilelor este explicată de factorul extras. În cazul nostru, ponderea primului factor depășește ponderea tuturor celorlalți factori combinați: explică aproape 59% din variația totală. Al doilea factor explică 19% din variație, al treilea explică 12,6% etc. Descendentă.

Având valorile proprii ale factorilor, putem începe să rezolvăm problema reducerii dimensiunii datelor. Reducerea se va produce datorită excluderii din model a factorilor cu cea mai mică putere explicativă. Și aici întrebarea cheie este câți factori să lăsați în model și după ce criterii să vă ghidați. Astfel, factorii 5 și 6 sunt în mod clar redundanți, care împreună explică puțin peste 1% din variația totală. Dar soarta factorilor 3 și 4 nu mai este atât de evidentă.

De regulă, modelul conține factori ale căror valori proprii depășesc unul (criteriul Kaiser). În cazul nostru, aceștia sunt factorii 1 și 2. Cu toate acestea, este util să verificați corectitudinea eliminării a patru factori folosind alte criterii. Una dintre cele mai utilizate metode este analiza scree plot. Pentru cazul nostru, arată astfel:

Graficul și-a primit numele de la asemănarea cu un versant de munte. „Rabla” este un termen geologic pentru resturi stânci acumulându-se la fundul versantului stâncos. "Rock" este cu adevărat factori influenți, "talus" este zgomot statistic. Figurat vorbind, trebuie să găsiți un loc pe grafic unde „stânca” se termină și începe „șapul” (unde scăderea valorilor proprii de la stânga la dreapta încetinește foarte mult). În cazul nostru, alegerea trebuie făcută din prima și a doua inflexiune corespunzătoare la doi și patru factori. Lăsând patru factori, obținem o precizie foarte mare a modelului (mai mult de 98% din variația totală), dar îl facem destul de complex. Lăsând doi factori, vom avea o parte semnificativă neexplicată a variației (aproximativ 22%), dar modelul va deveni concis și ușor de analizat (în special, vizual). Astfel, în acest caz, este mai bine să sacrifici un anumit grad de precizie în favoarea compactității, lăsând primul și al doilea factor.

Puteți verifica caracterul adecvat al modelului rezultat folosind matrici speciale de corelații reproduse și corelații reziduale. Matricea corelațiilor reproduse conține coeficienții care au fost restaurați pentru cei doi factori rămași în model. De o importanță deosebită în ea este diagonala principală, pe care sunt situate comunitățile de variabile (în tabel sunt italice), care arată cât de exact modelul reproduce corelația unei variabile cu aceeași variabilă, care ar trebui să fie una.

Matricea coeficienților reziduali conține diferența dintre coeficienții originali și cei reproduși. De exemplu, corelația reprodusă între variabilele ATP și Yabloko este 0,88, cea inițială este 0,94. Rest = 0,94 - 0,88 = 0,06. Cu cât valorile reziduale sunt mai mici, cu atât calitatea modelului este mai mare.

Corelații reproduse
"Măr" "Unitate" BZ OVR petrecere comunista THX
"Măr" 0,89
"Unitate" -0,53 0,80
BZ -0,47 0,59 0,44
OVR 0,73 -0,72 -0,56 0,76
petrecere comunista -0,70 0,01 0,12 -0,34 0,89
THX 0,88 -0,43 -0,40 0,66 -0,77 0,88
Coeficienți reziduali
"Măr" "Unitate" BZ OVR petrecere comunista THX
"Măr" 0,11
"Unitate" -0,02 0,20
BZ 0,00 -0,31 0,56
OVR -0,13 -0,01 0,09 0,24
petrecere comunista 0,09 0,00 -0,02 -0,14 0,11
THX 0,06 -0,03 0,01 -0,14 0,10 0,12

După cum se poate observa din matrice, modelul cu doi factori, deși este în general adecvat, explică slab relațiile individuale. Deci, comunitatea variabilei BZ este foarte scăzută (doar 0,56), valoarea coeficientului rezidual de conexiune dintre BZ și „Unitate” este prea mare (-0,31).

Acum este necesar să se decidă cât de important este ca acest studiu special să reprezinte în mod adecvat variabila BZ. Dacă importanța este mare (de exemplu, dacă studiul este dedicat analizei electoratului acestui partid), este corect să revenim la modelul cu patru factori. Dacă nu, se pot lăsa doi factori.
Ținând cont de natura educațională a sarcinilor noastre, vom părăsi modelul mai simplu.

Încărcările factorilor pot fi reprezentate ca coeficienți de corelație ai fiecărei variabile cu fiecare dintre factorii identificați 1, deoarece, corelația dintre valorile primei variabile factor și valorile variabilei Yabloko este -0,93. Toate încărcările factorilor sunt date în matricea de afișare a factorilor -

Cu cât relația dintre variabilă și factorul luat în considerare este mai strânsă, cu atât valoarea încărcării factorilor este mai mare. Semnul pozitiv al încărcării factorilor indică linia dreaptă, iar semnul negativ indică relația inversă a variabilei cu factorul.

Având în vedere valorile încărcărilor factoriale, putem construi o reprezentare geometrică a rezultatelor analizei factoriale. Pe axa X vom amâna încărcările de variabile cu factorul 1, pe axa Y - încărcările de variabile cu factorul 2 și vom obține un spațiu factorial bidimensional.

Înainte de a continua cu o analiză semnificativă a rezultatelor obținute, vom mai efectua o operațiune - rotația. Importanţa acestei operaţii este dictată de faptul că nu există una, ci multe variante ale matricei de încărcări factoriale, explicând în egală măsură relaţia variabilelor (matricea de intercorelaţie). Este necesar să alegeți o soluție care să fie mai ușor de interpretat în mod semnificativ. Aceasta este matricea sarcinilor, în care valorile fiecărei variabile pentru fiecare factor sunt maximizate sau minimizate (aproape de unu sau de zero).

Să luăm în considerare un exemplu schematic. Există patru obiecte situate în spațiul factorial, după cum urmează:

Încărcările asupra ambilor factori pentru toate obiectele sunt semnificativ diferite de zero și suntem forțați să folosim ambii factori pentru a interpreta poziția obiectelor. Dar dacă „rotim” întreaga structură în sensul acelor de ceasornic în jurul intersecției axelor de coordonate, obținem următoarea imagine:

În acest caz, sarcinile pe factorul 1 vor fi aproape de zero, iar sarcinile pe factorul 2 vor fi aproape de unu (principiul unei structuri simple). În consecință, pentru interpretarea semnificativă a poziției obiectelor, vom folosi un singur factor - factorul 2.

Există destul de multe metode pentru factorii rotativi. Deci, grupul de metode de rotație ortogonală păstrează întotdeauna unghiul drept între axele de coordonate. Acestea includ vanmax (minimizează numărul de variabile cu încărcări mari de factori), quartimax (minimizează numărul de factori necesari pentru a explica o variabilă), equamax (o combinație a celor două metode anterioare). Metodele de rotație oblică nu păstrează neapărat unghiurile drepte între axe (de exemplu, obiimin direct). Metoda promax este o combinație de metode de rotație ortogonală și oblică. În cele mai multe cazuri, este utilizată metoda vanmax, care dă rezultate bune pentru majoritatea sarcinilor de cercetare a politicilor. De asemenea, ca și în cazul multor alte metode, este o idee bună să experimentați diverși tehnicieni rotație.

În exemplul nostru, după rotirea prin metoda varimax, obținem următoarea matrice de încărcări factoriale:

În consecință, reprezentarea geometrică a spațiului factorilor va arăta astfel:


Acum puteți începe interpretarea semnificativă a rezultatelor. Opoziția-cheie - scindarea electorală - conform primului factor este formată de Partidul Comunist al Federației Ruse, pe de o parte, și Iabloko și Uniunea Forțelor Dreapte (în mai mică măsură, OVR), pe de altă parte. În mod substanțial – pe baza specificului atitudinilor ideologice ale subiecților numiți ai procesului electoral – putem interpreta această delimitare ca o scindare „stânga-dreapta”, care este „clasică” pentru știința politică.

Opoziția pe factorul 2 este formată din OVR și Unity. Acesta din urmă este învecinat cu „blocul Zhirinovsky”, dar nu putem judeca în mod fiabil poziția sa în spațiul factorilor din cauza particularităților modelului, care explică prost conexiunile acestei variabile particulare. Pentru a explica această configurație, este necesar să amintim realitățile politice din campania electorală din 1999. La acea vreme, lupta din cadrul elitei politice a dus la formarea a două eșaloane ale „partidului puterii” - Unitatea și Patria - Toate. blocurile Rusiei. Diferența dintre ele nu era de natură ideologică: de fapt, populației i s-a cerut să aleagă nu dintre două platforme ideologice, ci dintre două grupuri de elită, fiecare având resurse semnificative de putere și sprijin regional. Astfel, această scindare poate fi interpretată ca „putere-elite” (sau, simplificând oarecum, „putere-opoziție”).

În general, obținem o reprezentare geometrică a unui anumit spațiu electoral din regiunea Ryazan pentru aceste alegeri, dacă înțelegem spațiul electoral ca un spațiu pentru alegerea electorală, structura alternativelor politice cheie („divizări”). Combinația acestor două diviziuni a fost foarte tipică pentru alegerile parlamentare din 1999.

Comparând rezultatele analizei factoriale pentru aceeași regiune la diferite alegeri, putem aprecia prezența continuității în configurația spațiului de alegere electorală a teritoriului. De exemplu, analiza factorială a alegerilor parlamentare federale (1995, 1999 și 2003), care au avut loc în Tatarstan, a arătat o configurație stabilă a spațiului electoral. Pentru alegerile din 1999, în model a rămas un singur factor cu o putere explicativă de 83% a variației, ceea ce a făcut imposibilă trasarea unei diagrame bidimensionale. Încărcările factorilor sunt date în coloana corespunzătoare.

Dacă te uiți cu atenție la aceste rezultate, vei observa că în republică, de la alegeri la alegeri, se reproduce aceeași scindare de bază: „partidul puterii” - toate celelalte.” „Partidul puterii” în 1995 era cel bloc“ Casa noastră - Rusia „(PDR), în 1999 - OVR, în 2003 - „Rusia Unită. „De-a lungul timpului, doar” detaliile „se schimbă – numele „partidului aflat la putere”.

Încheiem acest capitol cu ​​un sfat practic. În general, succesul stăpânirii metodelor statistice este posibil doar cu intensiv munca practica cu programe speciale (deja menționate în repetate rânduri SPSS, Statistica sau cel puțin Microsoft Excel). Nu este o coincidență că prezentarea tehnicilor statistice este realizată de noi în modul algoritmilor de lucru: acest lucru permite elevului să parcurgă în mod independent toate etapele analizei, stând la computer. Fără încercări de analiză practică a datelor reale, ideea posibilităților metodelor statistice în analiza politică va rămâne inevitabil generală și abstractă. Și astăzi capacitatea de a aplica statistici pentru a rezolva atât teoretice, cât și sarcini aplicate- o componentă fundamentală a modelului de politolog.

Controlați întrebările și sarcinile

1. Ce niveluri de măsurare corespund valorilor medii - mod, mediană, medie aritmetică? Ce măsuri de variație sunt caracteristice pentru fiecare dintre ele?

2. Din ce motive este necesar să se țină cont de forma distribuției variabilelor?

3. Ce înseamnă afirmația „Există o relație statistică între două variabile”?

4. Ce informații utile despre relațiile dintre variabile pot fi obținute din analiza tabelelor de contingență?

5. Ce puteți învăța despre relația dintre variabile, pe baza valorilor testelor statistice chi-pătrat și lambda?

6. Dați o definiție a conceptului de „eroare” în cercetarea statistică. Cum poate fi utilizat acest indicator pentru a evalua calitatea modelului statistic construit?

7. Care este scopul principal al analizei de corelație? Ce caracteristici ale relației statistice relevă această metodă?

8. Cum se interpretează valoarea coeficientului de corelație Pearson?

9. Descrieți metoda de analiză a varianței. Ce alte metode statistice folosesc statisticile ANOVA și de ce?

10. Explicați semnificația conceptului de „ipoteză nulă”.

11. Ce este o dreaptă de regresie, ce metodă se folosește pentru a construi?

12. Ce arată coeficientul R în statisticile finale ale analizei de regresie?

13. Explicați termenul „metodă de clasificare multivariată”.

14. Explicați principalele diferențe dintre clustering prin analiza cluster ierarhică și K-means.

15. Cum poate fi utilizată analiza clusterului pentru a studia imaginea liderilor politici?

16. Care este sarcina principală rezolvată prin analiza discriminantă? Dați definiția funcției discriminante.

17. Numiți trei clase de probleme care pot fi rezolvate folosind analiza factorială. Concretizează conceptul de „factor”.

18. Descrieți cele trei metode principale de verificare a calității unui model în analiza factorială (criteriul Kaiser, criteriul „scree”, matricea corelațiilor reproduse).

  • Migrația internațională a resurselor financiare în contextul analizei factoriale
  • 25. J.-B. Say a intrat în istoria economiei ca autor al teoriei factorilor valorii. Care sunt punctele principale ale acestei teorii?
  • Studiu de fezabilitate a unui proiect de construcție și analiza garanțiilor pentru creditul de construcție solicitat
  • Ministerul Agriculturii al Federației Ruse

    Instituția de învățământ de stat federală

    Studii profesionale superioare

    Universitatea de Stat de Management Funciar

    Departament teorie economică si management

    Lucru de curs

    La disciplina „Analiza și diagnosticarea activităților financiare ale întreprinderii”

    Pe tema: „Analiza factorială a elementelor de producție”.

    Efectuat:

    elev din grupa a 34-a

    Maksimova N.S.

    Verificat:

    Chirkova L.L.

    Moscova 2009

    Introducere ………………………………………………………………………………… ..... 3

    Capitolul 1. Analiza factorială a elementelor de producție …………………………………………………………………… ..4

    1.1. Analiza factorială, tipurile și sarcinile acesteia ………………………………………………………………………………… ..4

    1.2. Analiza factorială deterministă. Cerințe de modelare ………………………………………………………………………………… ..8

    1.3 Metode și tipuri de analiză factorială deterministă ………………… ..10

    capitolul 2 . Partea practică ……………………………………………………… ..14

    2.1. Metode de măsurare a influenței factorilor în analiză activitate economică………………………………………………………………………….14

    2.2. Analiza factorilor starea financiara companie de camioane SA „Întreprinderea 1564” ……………………………………………………….… .20

    Concluzie ……………………………………………………………………… …… ..24

    Lista literaturii utilizate …………………………………………… ......... 25

    Anexe ……………………………………………………………………… ..26

    Introducere

    Analiza factorilor- un set de metode de analiză statistică multivariată utilizată pentru a studia relația dintre valorile variabilelor. Cu ajutorul analizei factoriale este posibil să se identifice factorii variabili ascunși (latenți) responsabili de prezența relațiilor (corelații) statistice liniare între variabilele observate.

    Obiectivele analizei factoriale:

    • reducerea numărului de variabile;
    • determinarea relaţiilor dintre variabile, clasificarea acestora.

    Analiza factorială a apărut la începutul secolului al XX-lea, dezvoltată inițial în sarcinile psihologiei. Charles Spearman și Raymond Cattel au avut o mare contribuție la dezvoltarea analizei factoriale.

    Metode de analiză factorială:

    • Analiza componentelor principale
    • analiza corelației
    • metoda cu maxima probabilitate

    Analiza factorială – determinarea influenței factorilor asupra rezultatului – este una dintre cele mai puternice decizii metodologice în analiza activităților economice ale companiilor pentru luarea deciziilor. Pentru lideri - un argument suplimentar, un „unghi de vedere” suplimentar.

    Cu toate acestea, în practică, este rareori utilizat din mai multe motive:

    1) implementarea acestei metode necesită un efort și un instrument specific ( produs software);

    2) companiile au alte priorități „eterne”.

    Capitolul 1. Analiza factorială a elementelor de producție

    1.1 Analiza factorială, tipurile și sarcinile acesteia.

    Analiza factorială este înțeleasă ca o metodă de studiu și măsurare complexă și sistemică a impactului factorilor asupra valorii indicatorilor eficienți.

    În general, se pot distinge următoarele etape principale ale analizei factoriale:

    1. Enunțarea scopului analizei.

    2. Selectarea factorilor care determină indicatorii de performanță investigați.

    3. Clasificarea și sistematizarea factorilor pentru a oferi o abordare integrată și sistematică a studiului impactului acestora asupra rezultatelor activității economice.

    4. Determinarea formei de dependenţă între factori şi indicatorul efectiv.

    5. Modelarea relaţiei dintre indicatorii de performanţă şi factori.

    6. Calculul influenței factorilor și evaluarea rolului fiecăruia dintre aceștia în modificarea valorii indicatorului efectiv.

    7. Lucrul cu un model factorial (utilizarea sa practică pentru gestionarea proceselor economice).

    Selecția factorilor pentru analiza unui anumit indicator se realizează pe baza cunoștințelor teoretice și practice dintr-o anumită industrie. În acest caz, de obicei pornesc de la principiul: cu cât complexul de factori este investigat mai mare, cu atât rezultatele analizei vor fi mai precise. Totodată, trebuie avut în vedere că dacă acest complex de factori este considerat ca o sumă mecanică, fără a ține cont de interacțiunea lor, fără a evidenția pe cei principali, determinanți, atunci concluziile pot fi eronate. În analiza activității economice (ACA), prin sistematizarea acestora se realizează un studiu interconectat al influenței factorilor asupra valorii indicatorilor eficienți, care este una dintre principalele probleme metodologice ale acestei științe.

    Important problema metodologicaîn analiza factorială, este definirea formei de dependenţă între factori şi indicatorii de performanţă: este funcţională sau stocastică, directă sau inversă, rectilinie sau curbilinie. Se folosește teoretic și experienta practica, precum și modalități de comparare a seriilor paralele și dinamice, grupări analitice de informații inițiale, grafice etc.

    Modelare indicatori economici prezintă, de asemenea, o problemă complexă în analiza factorială, a cărei rezolvare necesită cunoștințe și abilități speciale.

    Calculul influenței factorilor este principalul aspect metodologic în AHD. Pentru a determina influența factorilor asupra indicatorilor finali, se folosesc multe metode, care vor fi discutate mai detaliat mai jos.

    Ultima etapă a analizei factoriale este utilizarea practică a modelului factorial pentru calcularea rezervelor pentru creșterea indicatorului efectiv, pentru planificarea și prognoza valorii acestuia atunci când situația se schimbă.

    În funcție de tipul de model factorial, există două tipuri principale de analiză factorială - deterministă și stocastică.

    Analiza factorială deterministă este o tehnică de studiere a influenței factorilor, a cărei legătură cu indicatorul efectiv este de natură funcțională, adică atunci când indicatorul efectiv al modelului factorial este prezentat sub forma unui produs, a unui coeficient, sau o sumă algebrică de factori.

    Această vedere analiza factorială este cea mai comună, deoarece, fiind destul de simplă de utilizat (în comparație cu analiza stocastică), vă permite să înțelegeți logica funcționării principalelor factori ai dezvoltării întreprinderii, să cuantificați influența acestora, să înțelegeți ce factori și în ce proporție poate și ar trebui să fie modificată pentru a îmbunătăți eficiența producției... Vom analiza în detaliu analiza factorială deterministă într-un capitol separat.

    Analiza stocastică este o tehnică de studiu a factorilor, a căror legătură cu indicatorul efectiv, spre deosebire de cel funcțional, este incompletă, probabilistă (corelație). Dacă, cu o dependență funcțională (completă) cu o modificare a argumentului, are loc întotdeauna o modificare corespunzătoare a funcției, atunci cu o conexiune de corelare, o modificare a argumentului poate da mai multe valori ale creșterii funcției, în funcție de pe o combinaţie de alţi factori care determină acest indicator. De exemplu, productivitatea muncii la același nivel al raportului capital-muncă poate să nu fie aceeași la diferite întreprinderi. Depinde de combinația optimă a altor factori care afectează acest indicator.

    Modelarea stocastică este, într-o anumită măsură, o adăugare și o aprofundare a analizei factoriale deterministe. În analiza factorială, aceste modele sunt utilizate din trei motive principale:

      este necesar să se studieze influența factorilor pentru care este imposibil să se construiască un model de factori rigid determinist (de exemplu, nivelul de levier financiar);
    • este necesar să se studieze influența factorilor complecși care nu pot fi combinați în același model rigid determinat;
    • este necesar să se studieze influența factorilor complecși care nu pot fi exprimați printr-un singur indicator cantitativ (de exemplu, nivelul progresului științific și tehnologic).

    Spre deosebire de abordarea stocastică rigid deterministă, implementarea necesită o serie de condiții prealabile:

    a) prezența totalității;

    b) un număr suficient de observații;

    c) aleatorietatea și independența observațiilor;

    d) uniformitate;

    e) prezenţa unei distribuţii a semnelor apropiate de normal;

    f) prezenţa unui aparat matematic special.

    Construcția unui model stocastic se realizează în mai multe etape:

    • analiza calitativă (stabilirea scopului analizei, determinarea populației, determinarea indicatorilor efectivi și factoriali, alegerea perioadei pentru care se efectuează analiza, alegerea metodei de analiză);
    • analiza preliminară a populației simulate (verificarea omogenității populației, excluderea observațiilor anormale, clarificarea dimensiunii eșantionului necesar, stabilirea legilor de distribuție a indicatorilor studiați);
    • construirea unui model stocastic (de regresie) (clarificarea listei de factori, calculul estimărilor parametrilor ecuației de regresie, enumerarea variantelor concurente ale modelelor);
    • evaluarea adecvării modelului (verificarea semnificației statistice a ecuației în ansamblu și a parametrilor ei individuali, verificarea corespondenței proprietăților formale ale estimărilor cu sarcinile de cercetare);
    • interpretarea economică și utilizarea practică a modelului (determinarea stabilității spațio-temporale a dependenței construite, evaluarea proprietăților practice ale modelului).

    Pe lângă împărțirea în deterministă și stocastică, se disting următoarele tipuri de analiză factorială:

    • înainte și înapoi;
    • cu o singură etapă și cu mai multe etape;
    • static și dinamic;
    • retrospectiv și prospectiv (predictiv).

    În analiza factorială directă, cercetarea se desfășoară într-un mod deductiv - de la general la particular. Analiza factorială inversă realizează studiul relațiilor cauză-efect prin intermediul inducției logice - de la factori particulari, individuali, la cei generalizatori.

    Analiza factorială poate fi într-o singură etapă sau în mai multe etape. Primul tip este folosit pentru a studia factorii de un singur nivel (un singur nivel) de subordonare fără a detalia părțile lor componente. De exemplu, . În analiza factorilor în mai multe etape, factorii a și b sunt detaliați în elementele lor constitutive pentru a studia comportamentul lor. Detalierea factorilor poate fi continuată în continuare. În acest caz, se studiază influența factorilor de diferite niveluri de subordonare.

    De asemenea, este necesar să se facă distincția între analiza factorilor statică și dinamică. Primul tip este utilizat atunci când se studiază influența factorilor asupra indicatorilor de performanță la data corespunzătoare. Un alt tip este o tehnică pentru studierea relațiilor cauzale în dinamică.

    Și, în sfârșit, analiza factorială poate fi retrospectivă, care studiază motivele creșterii indicatorilor de performanță în perioadele trecute, și promițătoare, care examinează comportamentul factorilor și indicatorilor de performanță în viitor.

    1.2 Analiza factorială deterministă. Cerințe de modelare.

    Determinism(din lat. determino - definesc) - doctrina condiționalității obiective, regulate și cauzale a tuturor fenomenelor. Determinarea se bazează pe prevederea existenței cauzalității, adică pe o astfel de legătură între fenomene, în care un fenomen (cauză), în condiții bine definite, dă naștere unui altul (efect). )

     

    Ar putea fi util să citiți: