Revizuirea metodelor de analiză cluster și evaluarea aplicabilității acestora la rezolvarea problemei segmentării pieței consumatorilor. Metode și instrumente pentru segmentarea consumatorilor Metoda de segmentare a clusterelor

Lucrez în industria de marketing prin e-mail pentru un site numit MailChimp.com. Ajutăm clienții să creeze un buletin informativ pentru publicul lor publicitar. De fiecare dată când cineva numește munca noastră „umplutură prin poștă”, simt o răceală neplăcută în inima mea.

De ce? Deoarece adresele de e-mail nu mai sunt cutii negre pe care le bombardați cu mesaje precum grenade. Nu, în marketingul prin e-mail (ca și în cazul altor forme de contact online, inclusiv tweet-uri, postări pe Facebook și campanii Pinterest), afacerea câștigă informații despre modul în care publicul se implică la nivel individual prin urmărirea clicurilor, comenzi online, răspândirea statutelor pe rețelele sociale etc. Aceste date nu sunt doar interferențe. Ele vă caracterizează publicul. Dar pentru cei neinițiați, aceste operațiuni sunt asemănătoare cu înțelepciunea limbii grecești. Sau Esperanto.

Cum colectați date despre tranzacțiile cu clienții dvs. (utilizatori, abonați etc.) și folosiți aceste date pentru a vă înțelege mai bine publicul? Când aveți de-a face cu mulți oameni, poate fi dificil să studiați fiecare client individual, mai ales dacă toți comunică cu dvs. în moduri diferite. Chiar dacă teoretic ați putea ajunge la toată lumea, în practică acest lucru este greu de realizat.

Trebuie să vă luați baza de clienți și să găsiți un punct intermediar între bombardarea aleatorie și marketingul personalizat pentru fiecare client. O modalitate de a atinge acest echilibru este de a utiliza clusterizarea pentru a segmenta piața clienților dvs., astfel încât să puteți viza diferite segmente ale bazei dvs. de clienți cu conținut, oferte și multe altele.

Analiza cluster este colectarea diferitelor obiecte și împărțirea lor în grupuri de felul lor. Lucrând cu aceste grupuri - identificând ce au în comun membrii lor și ce le face diferite - puteți afla multe despre datele dezordonate pe care le aveți. Aceste cunoștințe vă vor ajuta să luați cele mai bune decizii și la un nivel mai granular decât înainte.

În acest context, clusterizarea se numește explorare de date exploratorie, deoarece aceste tehnici ajută la „extragerea” informațiilor despre relațiile din seturi de date imense care nu pot fi captate vizual. Și găsirea conexiunilor în grupurile sociale este utilă în orice industrie - pentru recomandarea de filme bazate pe obiceiurile publicului țintă, pentru identificarea centrelor criminale ale orașului sau justificarea investițiilor financiare.

Una dintre utilizările mele preferate pentru clusterizare este gruparea de imagini: adunarea fișierelor de imagine care „arată la fel” la computer. De exemplu, în serviciile de găzduire de imagini precum Flickr, utilizatorii produc mult conținut și o navigare simplă devine imposibilă din cauza numărului mare de fotografii. Dar folosind tehnici de clusterizare, puteți combina imagini similare, permițând utilizatorului să navigheze între aceste grupuri înainte de a le sorta în detaliu.

Învățare automată supravegheată sau nesupravegheată?

În explorarea datelor de explorare, prin definiție, nu știți din timp ce tip de date căutați. Ești cercetător. Puteți explica clar când doi clienți arată similar și când arată diferit, dar nu știți cel mai bun mod de a vă segmenta baza de clienți. Prin urmare, „a cere” computerului să vă segmenteze baza de clienți se numește învățare automată nesupravegheată, deoarece nu aveți control asupra nimicului - nu dictați computerului cum să-și facă treaba.

Spre deosebire de acest proces, există învățarea automată supravegheată, care apare de obicei atunci când inteligența artificială ajunge pe prima pagină. Dacă știu că vreau să împart clienții în două grupuri - să spunem, „cel mai probabil să cumpăr” și „puțin probabil să cumpăr” - și să furnizez computerului exemple istorice ale unor astfel de clienți, aplicând toate inovațiile la unul dintre aceste grupuri, atunci acesta este controlul.

Dacă, în schimb, spun: „Asta știu despre clienții mei și iată cum să vă spun dacă sunt diferiți sau la fel. Spune-mi ceva interesant ”- aceasta este o lipsă de control.

Acest capitol discută cea mai simplă metodă de grupare numită metoda k-means, care datează din anii 50 și a devenit de atunci o datorie DOB (DKD) în toate industriile și guvernele.

Metoda k-means nu este cea mai precisă din punct de vedere matematic dintre toate metodele. A fost creat în principal din motive de practicitate și bun simț - cum ar fi bucătăria afro-americană. Nu are un pedigree atât de șic precum francezii, dar deseori se ocupă de capriciile noastre gastronomice. K-Means Cluster Analysis, așa cum veți vedea în curând, face parte din matematică și parte din istorie (despre trecutul companiei, dacă comparația se referă la metodele de învățare a managementului). Avantajul său fără îndoială este simplitatea sa intuitivă.

Să vedem cum funcționează această metodă cu un exemplu simplu.

Fetele dansează cu fete, băieții se scarpină în cap

Scopul grupării k-înseamnă este selectarea mai multor puncte din spațiu și transformarea lor în k grupuri (unde k este orice număr pe care îl alegeți). Fiecare grup este identificat printr-un punct din centru, ca un steag înfipt în lună și care semnalează: „Hei, acesta este centrul grupului meu! Alăturați-vă dacă sunteți mai aproape de acest steag decât de ceilalți! " Acest centru al grupului (cu numele oficial cluster cluster) este mijlocul denumirii metodei k-means.

Să ne amintim, de exemplu, de dansurile școlare. Dacă ați reușit să ștergeți din memoria groazei acestui „divertisment”, îmi pare foarte rău că am adus aminte atât de dureroase.

Eroii exemplului nostru - elevii de la liceul Macacne, care au venit la o seară de dans sub titlul romantic „Bal la fundul mării” - sunt împrăștiați în sala de adunări, așa cum se arată în fig. 1. Am pictat chiar și pe parchetul din Photoshop pentru a face mai ușoară imaginația situației.

Figura: 1. Elevii liceului Macacne s-au stabilit în sala de adunări

Iată câteva exemple de melodii pe care acești tineri lideri ai lumii libere le vor dansa stingher (dacă vrei brusc muzică, de exemplu, pe Spotify):

  • Styx: Come Sail Away
  • Totul în afară de fată: lipsește
  • Asul bazei: tot ce vrea
  • Soft Cell: Tainted Love
  • Montell Jordan: Așa o facem
  • Eiffel 65: Albastru

Acum, gruparea prin mijloace k depinde de numărul de clustere prin care doriți să împărțiți publicul. Să începem cu trei clustere (vom analiza alegerea lui k mai târziu în acest capitol). Algoritmul plasează trei steaguri pe podeaua sălii de adunare într-un mod acceptabil, așa cum se arată în Fig. 2 unde vedeți 3 steaguri de start distribuite pe podea și marcate cu cercuri negre.

Figura: 2. Plasarea centrelor inițiale de cluster

În gruparea k-înseamnă, dansatorii sunt legați de cel mai apropiat centru de cluster, astfel încât o linie de demarcație poate fi trasată între oricare două centre de pe podea. Astfel, dacă un dansator se află pe o parte a liniei, el aparține unui grup, dacă este pe cealaltă parte, apoi celuilalt (ca în Fig. 3).

Figura: 3. Liniile marchează limitele clusterelor

Folosind aceste linii de delimitare, împărțiți dansatorii în grupuri și colorați-le în consecință, ca în fig. 4. Această diagramă, împărțind spațiul în poligoane, determinată de apropierea de un anumit centru de cluster, se numește diagramă Voronoi.

Figura: 4. Gruparea pe clustere marcate cu diferite modele de fundal într-o diagramă Voronoi

Să aruncăm o privire asupra diviziei noastre inițiale. Ceva nu este în regulă, nu-i așa? Spațiul este împărțit într-un mod destul de ciudat: grupul din stânga jos rămâne gol, în timp ce la marginea grupului din dreapta sus, dimpotrivă, există mulți oameni.

Algoritmul de grupare k-înseamnă mută centrele de cluster pe podea până când obține cel mai bun rezultat.

Cum se determină „cel mai bun rezultat”? Fiecare persoană prezentă se află la o anumită distanță de centrul clusterului. Cu cât este mai mică distanța medie de la participanți la centrul grupului lor, cu atât rezultatul este mai bun.

Acum introducem cuvântul „minimizare” - vă va fi foarte util în optimizarea modelului pentru o locație mai bună a centrelor de cluster. În acest capitol, veți forța Solverul să mute centrele clusterului de nenumărate ori. Modul în care Solution Seeker îl folosește pentru a găsi cea mai bună locație pentru centrele de cluster este de a le muta încet iterativ pe suprafață, fixând cele mai bune rezultate găsite și combinându-le (literalmente împerecherea ca de cai de curse) pentru a găsi cea mai bună poziție.

Deci, dacă diagrama din fig. 4 arată destul de palid, „Găsirea unei soluții” poate aranja brusc centre ca în fig. 5. Astfel, distanța medie între fiecare dansator și centrul său va scădea ușor.

Figura: cinci. Deplasând ușor centrele

Evident, mai devreme sau mai târziu, „Căutarea unei soluții” va realiza că centrele ar trebui plasate în mijlocul fiecărui grup de dansatori, așa cum se arată în fig. 6.

Figura: 6. Clusterare optimă la dansurile școlare

Excelent! Așa arată clusterizarea ideală. Centrele de cluster sunt situate în centrul fiecărui grup de dansatori, minimizând distanța medie dintre dansator și cel mai apropiat centru. Acum că clusterizarea este completă, este timpul să trecem la partea distractivă, care încearcă să înțeleagă ce înseamnă aceste clustere.

Dacă știți culoarea părului dansatorilor, preferințele lor politice sau când au trecut distanța de 100 de metri, atunci gruparea nu are prea mult sens.

Dar odată ce vă decideți să determinați vârsta și sexul celor prezenți, veți începe să vedeți câteva tendințe generale. Grupul mic din partea de jos este vârstnicii, cel mai probabil însoțesc oamenii. Grupul din stânga este cu toții băieți, iar grupul din dreapta este cu toate fetele. Și tuturor le este foarte teamă să danseze unul cu celălalt.

Astfel, metoda k-means v-a permis să împărțiți mulțimea participanților la dans în grupuri și să corelați caracteristicile fiecărui participant cu apartenența la un anumit grup pentru a înțelege motivul împărțirii.

Acum probabil că îți spui: „Haide, ce prostie. Știam deja răspunsul înainte de început. " Ai dreptate. În acest exemplu, da. Am dat în mod deliberat acest exemplu de „jucărie”, fiind sigur că îl poți rezolva doar uitându-te la puncte. Acțiunea are loc într-un spațiu bidimensional, în care gruparea se realizează elementar cu ajutorul ochilor.

Dar dacă ai un magazin care vinde mii de produse? Unii cumpărători au făcut una sau două achiziții în ultimii doi ani. Alții sunt zeci. Și fiecare a cumpărat ceva al său.

Cum le grupezi pe un astfel de „ring de dans”? Pentru început, acest ring de dans nu este bidimensional și nici măcar tridimensional. Acesta este un spațiu de o mie de dimensiuni pentru vânzarea de bunuri, în care cumpărătorul a cumpărat sau nu achiziționat bunurile din fiecare dimensiune. Vedeți cât de repede începe problema clusterizării să depășească capacitățile „globului ocular de gradul I”, așa cum le place să spună prietenii mei militari.

Viața reală: k-înseamnă clustering în e-mail marketing

Să trecem la un caz mai de fond. Lucrez în marketing prin e-mail, deci iată un exemplu din viața Mailchimp.com unde lucrez. Același exemplu va funcționa pentru datele de vânzare cu amănuntul, conversiile publicitare, rețelele de socializare și așa mai departe. Acesta interacționează cu practic orice tip de date de mesagerie publicitară și vă aleg în mod necondiționat.

Joey Bag O "Donuts 'Wholesale Wine Empire

Imaginați-vă pentru o clipă că locuiți în New Jersey, unde conduceți Joey Bag O "Donuts 'Wholesale Wine Empire. Este o afacere de import și export care își propune să livreze cantități uriașe de vin din străinătate și să îl vândă magazinelor de băuturi alcoolice desemnate din toată țara. Această afacere funcționează în așa fel încât Joey să călătorească peste tot în lume în căutarea unor oferte incredibile cu cantități mari de vin. El îl trimite în Jersey și este îngrijorarea ta să-l adaugi în magazine și să obții profit.

Găsiți cumpărători într-o varietate de moduri: pagina Facebook, contul Twitter, uneori chiar și poșta directă - până la urmă, e-mailurile „promovează” majoritatea tipurilor de afaceri. Anul trecut, ați trimis un e-mail pe lună. De obicei, fiecare literă descrie două sau trei tranzacții, să zicem, una cu șampanie și cealaltă cu malbec. Unele oferte sunt pur și simplu uimitoare - reducerea este de 80% sau mai mult. Drept urmare, ați încheiat aproximativ 32 de oferte într-un an și toate au mers mai mult sau mai puțin ușor.

Dar doar pentru că lucrurile merg bine nu înseamnă că nu pot merge mai bine. Ar fi util să înțelegeți motivele clienților dvs. un pic mai adânc. Desigur, privind o anumită comandă, vedeți că un anume Adams a cumpărat niște vin spumant în iulie cu o reducere de 50%, dar nu puteți stabili ce l-a determinat să cumpere. I-a plăcut cantitatea minimă de comandă a unei cutii de șase sticle sau prețul care nu a crescut încă la maximum?

Ar fi frumos să puteți împărți lista de clienți în grupuri de interese. Apoi, puteți edita literele către fiecare grup separat și, probabil, puteți promova afacerea și mai mult. Orice ofertă adecvată acestui grup ar putea deveni subiectul scrisorii și ar putea intra în primul paragraf al textului. Acest tip de corespondență vizată poate crea o explozie imensă de vânzări!

Este posibil să lăsați computerul să facă treaba pentru dvs. Folosind gruparea k-means, puteți găsi cea mai bună grupare și apoi încercați să înțelegeți de ce este cea mai bună.

Set de date original

Documentul Excel pe care îl vom analiza în acest capitol se află pe site-ul web al registrului de lucru. Conține toate datele brute în cazul în care doriți să lucrați cu ea. Sau puteți urmări doar textul privind pe restul documentului.

În primul rând, aveți două surse de date interesante:

  • metadatele pentru fiecare comandă sunt stocate într-o foaie de calcul, incluzând varietatea, cantitatea minimă a comenzii, reducerea cu amănuntul, limita de preț și țara de origine. Aceste date sunt plasate într-o filă numită OfferInformation, așa cum se arată în Figura 4. 7;
  • știind care client comandă ce, puteți scutura aceste informații din MailChimp și puteți alimenta foaia de calcul cu metadate a ofertei în fila Tranzacții. Acestea sunt date variabile prezentate așa cum se arată în Fig. 8, foarte simplu: cumpărătorul și comanda sa.

Figura: 7. Detalii despre ultimele 32 de comenzi

Figura: 8. Lista cantității comenzii de către client

Determinați subiectul măsurătorilor

Iată provocarea. În problema dansului școlar, măsurarea distanței dintre cei prezenți și identificarea centrelor cluster nu a fost dificilă, nu-i așa? Găsirea benzii de măsurare potrivită este suficientă! Dar ce să faci acum?

Știți că anul trecut au existat 32 de oferte de oferte și aveți o listă de 324 de comenzi într-o filă separată, defalcate în funcție de cumpărător. Dar pentru a măsura distanța de la fiecare client la centrul de cluster, trebuie să le așezați în acest spațiu de 32 de tranzacții. Cu alte cuvinte, trebuie să înțelegeți ce tranzacții nu au finalizat și să creați o matrice de tranzacții de către cumpărător, în care fiecare client primește propria coloană cu 32 de celule de tranzacții, completate cu unele dacă tranzacțiile au fost făcute și zerouri dacă nu.

Cu alte cuvinte, trebuie să luați acest tabel de oferte orientat pe rând și să îl transformați într-o matrice în care clienții sunt aranjați vertical și ofertele sunt aranjate orizontal. Cel mai bun mod de a-l crea este cu tabelele pivot.

Algoritmul acțiunii: pe foaia cu date variabile, selectați coloanele A și B, apoi introduceți un tabel pivot. Folosind Expertul pentru tabelul pivot, selectați pur și simplu Oferte ca antet rând și Cumpărători ca antet coloană și completați tabelul. Celula va conține 1 dacă există perechea client-deal și 0 dacă nu (în acest caz, 0 este afișat ca o celulă goală). Rezultatul este tabelul prezentat în Fig. nouă.

Figura: nouă. Tabelul pivot „acord cu clienții”

Acum, că aveți informații despre comandă în format matricial, copiați foaia de informații despre ofertă și denumiți-o Matrix. În această nouă foaie, lipiți valorile din tabelul pivot (nu este nevoie să copiați și să inserați numărul ofertei, deoarece este deja conținut în informațiile despre comandă), începând cu coloana H. Ca urmare, ar trebui să aveți o versiune extinsă a matricei, completată cu informații despre comandă, ca în fig. zece.

Figura: zece. Descrierea tranzacțiilor și a datelor comenzilor îmbinate într-o singură matrice

Standardizarea datelor

În acest capitol, fiecare dimensiune a datelor dvs. este prezentată în același mod, ca informații de ordine binară. Dar în multe situații de grupare, nu putem face acest lucru. Imaginați-vă un scenariu în care oamenii sunt grupați în funcție de înălțime, greutate și salariu. Toate cele trei tipuri de date au dimensiuni diferite. Înălțimea poate varia de la 1,5 la 2 metri, în timp ce greutatea este de la 50 la 150 kg.

În acest context, măsurarea distanței dintre clienți (ca între dansatorii dintr-un auditoriu) devine o afacere confuză. Prin urmare, este obișnuit să se standardizeze fiecare coloană de date scăzând media și apoi împărțind una câte una printr-o măsură de dispersie numită deviație standard. Astfel, toate coloanele sunt reduse la o singură valoare, variind cantitativ în jurul valorii de 0.

Să începem cu patru clustere

Ei bine, acum toate datele dvs. au fost reduse la un singur format convenabil. Pentru a începe clusterizarea, trebuie să alegeți k - numărul de clustere din algoritmul k-înseamnă. Adesea metoda k-means este folosită astfel: luați un set de k diferite și testați-le pe rând (vă voi explica cum să le alegeți mai târziu), dar abia începem - deci vom alege doar unul.

Veți avea nevoie de o serie de clustere care sunt aproximativ potrivite pentru ceea ce doriți să faceți. În mod clar, nu intenționați să creați 50 de clustere și să trimiteți 50 de e-mailuri promoționale direcționate către câțiva tipi din fiecare grup. Acest lucru ne face instantaneu exercițiul fără sens. În cazul nostru, avem nevoie de ceva mic. Începeți acest exemplu cu 4 - într-o lume ideală, probabil că ați împărți lista de clienți în 4 grupuri ușor de înțeles de câte 25 de persoane (ceea ce în realitate este puțin probabil).

Deci, dacă trebuie să vă împărțiți clienții în 4 grupuri, care este cel mai bun mod de a-i potrivi?

În loc să încurcați frumoasa foaie Matrix, copiați datele într-o foaie nouă și denumiți-o 4MC. Acum puteți introduce 4 coloane după cea mai înaltă din coloanele H până la K, care vor fi centrele de cluster. (Pentru a insera o coloană, faceți clic dreapta pe coloana H și selectați „Inserați”. Coloana va apărea în stânga.) Denumiți aceste clustere Cluster 1 la Cluster 4. Puteți aplica și formatarea condiționată și oricând le setați, puteți vedea cât de diferiți sunt.

Foaia 4MC va apărea așa cum se arată în fig. unsprezece.

Figura: unsprezece. Centre de cluster goale plasate pe o foaie de 4MC

În acest caz, toate centrele de cluster sunt zerouri. Dar, din punct de vedere tehnic, pot fi orice îți place și, ceea ce îți va plăcea mai ales - ca la dansurile școlare, sunt distribuite în așa fel încât să minimizeze distanța dintre fiecare client și centrul său de cluster.

Evident, atunci aceste centre vor avea valori de la 0 la 1 pentru fiecare tranzacție, deoarece toți vectorii clienți sunt binari.

Dar ce înseamnă „măsurarea distanței dintre centrul clusterului și client”?

Distanța euclidiană: măsurarea distanțelor off-road

Aveți o coloană separată pentru fiecare client. Cum poți măsura distanța dintre ele? În geometrie, aceasta se numește „cea mai scurtă cale”, iar distanța rezultată se numește distanța euclidiană.

Să ne întoarcem o dată la sala de adunări și să încercăm să ne dăm seama cum să ne rezolvăm problema acolo.

Așezați axele de coordonate pe podea și în fig. 12 vom vedea că la punctul (8.2) avem un dansator, iar la (4.4) - un centru de cluster. Pentru a calcula distanța euclidiană dintre ele, va trebui să vă amintiți teorema lui Pitagora, cu care sunteți familiarizați de la școală.

Figura: 12. Dansator la punctul (8.2) și centrul grupului la (4.4)

Aceste două puncte sunt la distanță de 8 - 4 \u003d 4 metri pe verticală și 4 - 2 \u003d 2 metri pe orizontală. Conform teoremei lui Pitagora, pătratul distanței dintre două puncte este egal cu 4L2 + 2L2 \u003d 20 de metri. De aici calculăm distanța însăși, care va fi egală cu rădăcina pătrată a lui 20, care este de aproximativ 4,47 m (ca în Fig. 13).

Figura: treisprezece. Distanța euclidiană este egală cu rădăcina pătrată a sumei distanțelor în fiecare direcție

În contextul abonaților la newsletter, aveți mai mult de două dimensiuni, dar se aplică același concept. Distanța dintre cumpărător și centrul clusterului este calculată prin determinarea diferenței dintre cele două puncte pentru fiecare tranzacție, pătratul acestora, adăugarea și luarea rădăcinii pătrate. De exemplu, pe foaia 4MC, doriți să cunoașteți distanța euclidiană între centrul clusterului 1 din coloana H și comenzile clientului Adams din coloana L.

În celula L34, sub ordinele lui Adams, puteți calcula diferența dintre vectorul Adams și centrul clusterului, îl puteți păstra, adăuga și apoi îl puteți rădăcini folosind următoarea formulă pentru tablouri (verificați referințele absolute care vă permit să trageți această formulă spre dreapta sau în jos fără a modifica la centrul clusterului):


(\u003d ROOT (SUM (L $ 2: L $ 33- $ H $ 2: $ H $ 33) A2)))

Formula matricei (introduceți formula și apăsați Ctrl + Shift + Enter sau Cmd + Return pe MacOS, așa cum este descris în capitolul 1) ar trebui utilizată deoarece partea (L2: L33-H2: H33) ^ 2 a acesteia trebuie să „știe” unde rândul său, pentru a calcula diferențele și pătrate-le, pas cu pas. Cu toate acestea, rezultatul final este un singur număr, în cazul nostru 1.732 (ca în Figura 14). Are următoarea semnificație: Adams a făcut trei tranzacții, dar din moment ce centrele inițiale ale clusterului sunt zero, răspunsul va fi egal cu rădăcina pătrată a lui 3, și anume 1.732.

Figura: paisprezece. Distanța dintre centrul unui cluster și Adams

În foaia de calcul din Fig. 2-14, am ancorat rândul superior (vezi capitolul 1) între coloanele G și H și am numit rândul 34 în celula G34 Distanța până la clusterul 1, doar pentru a vedea unde se află în timp ce derulez pagina.

Distanță și apartenență la cluster pentru toată lumea!

Acum știi cum să calculezi distanța dintre vectorul de comandă și centrul clusterului.

Este timpul să adăugați calculul distanței Adams la restul centrelor clusterului trăgând celula L34 în jos la L37 și apoi schimbând manual referința centrului clusterului din coloana H în coloana I, J și K din celulele de mai jos. Rezultatul ar trebui să fie următoarele 4 formule din L34: L37:

(\u003d SQRT (SUM ((L $ 2: L $ 33- $ H $ 2: $ H $ 33) A2)))
(\u003d SQRT (SUM ((L $ 2: L $ 33- $ I $ 2: $ I $ 33) A2)))
(\u003d SQRT (SUM ((L $ 2: L $ 33- $ J $ 2: $ J $ 33) A2)))
(\u003d SQRT (SUM ((L $ 2: L $ 33- $ K $ 2: $ K $ 33) A2)))
(\u003d ROOT (SUM ((L $ 2: L $ 33- $ H $ 2: $ H $ 33) A2)))
(\u003d ROOT (SUMA ((L $ 2: L $ 33- $ I $ 2: $ I $ 33) A2)))
(\u003d ROOT (SUMĂ ((L $ 2: L $ 33- $ J $ 2: $ J $ 33) A2)))
(\u003d ROOT (SUM ((L $ 2: L $ 33- $ K $ 2: $ K $ 33) A2)))

Deoarece ați utilizat referințe absolute pentru centrele de cluster (ceea ce înseamnă semnul $ din formule, așa cum s-a discutat în capitolul 1), puteți trage L34: L37 în DG34: DG37 pentru a calcula distanța de la fiecare client la toate cele patru centre de cluster. Conduceți rândurile din coloana G din celulele 35 până la 37, Distanța până la grupul 2 și așa mai departe. Distanțele nou calculate sunt prezentate în Fig. cincisprezece.

Figura: cincisprezece. Calculul distanțelor de la fiecare client la toate centrele de cluster

Acum știți distanța fiecărui client de toate cele patru centre de cluster. Distribuția lor în grupuri se face în funcție de cea mai mică distanță în doi pași, după cum urmează.

Mai întâi, reveniți la Adams în coloana L și calculați distanța minimă până la centrul clusterului în celula L38. E simplu:

Min (L34: L37)
\u003d min (L34: L37)

Pentru calcul, folosim formula potrivire / căutare (mai multe în capitolul 1). Plasându-l în L39, puteți vedea numărul celulei din intervalul L34: L37 (le număr fiecare în ordine de la 1), care se află la distanța minimă:

Potrivire (L38, L34: L37.0) \u003d poziția de căutare (L38, L34: L37.0)

În acest caz, distanța este aceeași pentru toate cele patru clustere, deci formula îl selectează pe primul (L34) și returnează 1 (Figura 16).

Figura: şaisprezece. Adăugarea legărilor de cluster la o foaie

De asemenea, puteți trage și plasa aceste două formule pe DG38: DG39. Pentru a menține lucrurile organizate, adăugați numele liniilor 38 și 39 la celulele 38 și 39 din coloana G „Distanța minimă a clusterului” și „Clusterul atribuit”.

Găsirea soluțiilor pentru centrele de cluster

Foaia dvs. de calcul a fost actualizată cu calcule la distanță și grupare. Acum, pentru a determina cea mai bună poziție a centrelor de cluster, trebuie să găsiți acele valori în coloanele de la H la K care minimizează distanța totală dintre clienți și centrele de cluster la care sunt legate, indicate în rândul 39 pentru fiecare client.

Când auziți cuvântul „minimizați”: începe etapa de optimizare, iar optimizarea se realizează folosind „Căutați o soluție”.

Pentru a utiliza Solution Finder, aveți nevoie de o celulă de rezultate, așa că în A36 rezumăm toate distanțele dintre clienți și centrele de cluster ale acestora:

SUMA (L38: DG38)
\u003d CUMMA (L3 8: DG3 8)

Această sumă de distanțe de la clienți la cele mai apropiate centre de cluster este exact funcția obiectivă pe care am întâlnit-o mai devreme când am grupat sala de adunare a liceului Macacne. Dar distanța euclidiană, cu puterile și rădăcinile pătrate, este o funcție monstruos neliniară, deci trebuie să utilizați o soluție evolutivă în locul metodei simplex.

Ați folosit deja această metodă în capitolul 1. Algoritmul simplex, dacă poate fi aplicat, funcționează mai repede decât altele, dar nu poate fi folosit pentru a calcula rădăcini, pătrate și alte funcții neliniare. În același mod, OpenSolver este inutil, care folosește un algoritm simplex, chiar dacă se pare că a luat steroizi.

În cazul nostru, algoritmul evolutiv încorporat în Căutarea unei soluții folosește o combinație de căutare aleatorie și o soluție excelentă de încrucișare pentru, ca evoluția într-un context biologic, să găsească soluții eficiente.

Aveți tot ce aveți nevoie pentru a seta problema înainte de „Căutați o soluție”:

  • obiectiv: reducerea la minimum a distanței totale de la cumpărători la centrele lor de cluster (A36);
  • variabile: vectorul fiecărei tranzacții în raport cu centrul clusterului (Н2: К33);
  • condiții: centrele de cluster trebuie să aibă valori cuprinse între 0 și 1.

Este recomandat să aveți „Căutați o soluție” și un ciocan. Am stabilit problema „Căutați o soluție”: pentru a minimiza A36 schimbând valorile H2: K33 cu condiția H2: K33<=1, как и все векторы сделок. Убедитесь, что переменные отмечены как положительные и выбран эволюционный алгоритм (рис. 17).

Figura: 17. Setări Căutare soluții pentru clustere în 4 centre

Însă afirmația problemei nu este totul. Va trebui să transpiri puțin, alegând opțiunile necesare pentru algoritmul evolutiv, făcând clic pe butonul „Opțiuni” din fereastra „Căutați o soluție” și accesați fereastra de setări. Vă sfătuiesc să setați timpul maxim pentru încă 30 de secunde, în funcție de cât timp sunteți dispus să așteptați ca „Căutare soluții” să facă față sarcinii sale. În fig. Pe 18 l-am pus pe al meu pe 600 de secunde (10 minute). În acest fel, pot să conduc Solver și să merg la prânz. Și dacă doriți să-l întrerupeți devreme, apăsați pe Escape și ieșiți cu cea mai bună soluție pe care a găsit-o.

Figura: optsprezece. Parametrii algoritmului evolutiv

Faceți clic pe „Rulați” și urmăriți cum Excel își face treaba până converge algoritmul evolutiv.

Semnificația rezultatelor

Odată ce Solvement vă găsește cele mai bune centre de cluster, începe distracția. Să trecem la grupurile de studiu! În fig. 19 putem vedea că Solver a găsit o distanță totală optimă de 140,7 și toate cele patru centre de cluster - datorită formatării condiționate! - arată complet diferit.

Figura: 19. Patru centre de cluster optime

Rețineți că centrele de cluster pot diferi de cele prezentate în carte, deoarece algoritmul evolutiv folosește numere aleatorii, iar răspunsul este diferit de fiecare dată. Clusterele pot fi complet diferite sau mai probabil într-o ordine diferită (de exemplu, clusterul meu 1 poate fi foarte aproape de clusterul 4 etc.).

De când ați creat foaia, ați introdus descrieri ale tranzacțiilor în coloanele de la B la G, acum puteți citi detaliile din Fig. 19, care este important pentru înțelegerea ideii de centre de cluster.

Pentru clusterul 1 din coloana H, formatarea condiționată selectează tranzacțiile 24, 26, 17 și, într-o măsură mai mică, 2. După ce citiți descrierea acestor tranzacții, puteți înțelege ce au în comun: toate au fost încheiate în pinot noir.

Privind coloana I, puteți vedea că toate celulele verzi au un minim scăzut. Aceștia sunt cumpărători care nu doresc să cumpere cantități uriașe în cursul tranzacției.

Dar, sincer, celelalte două centre de cluster sunt greu de interpretat. În loc să interpreteze centrele de cluster, ce zici de studierea cumpărătorilor din cluster și de stabilirea ofertelor care le plac? Acest lucru ar putea clarifica problema.

Evaluarea cluster a ofertelor

În loc să ne dăm seama ce distanțe față de care centru de cluster sunt mai apropiate de 1, să verificăm cine este legat de ce cluster și ce oferte preferă.

Pentru a face acest lucru, să începem prin a copia foaia de informații despre ofertă. Să numim copia 4MC - TopDealsByCluster. Numărați coloanele H până la K pe această nouă foaie de la 1 la 4 (ca în Figura 20).

Figura: 20. Creați o foaie de tabel pentru calcularea popularității ofertelor folosind clustere

În foaia 4MC, ați avut legături de cluster de la 1 la 4 pe linia 39. Tot ce trebuie să faceți pentru a număra tranzacțiile pe cluster este să vă uitați la numele coloanelor de la H la K de pe foaia 4MC - TopDealsByCluster, vedeți care dintre foaia 4MC a fost legată de acest cluster pe linia 39, apoi a adăugat numărul tranzacțiilor lor în fiecare linie. Astfel, vom obține numărul total de cumpărători din acest cluster care au făcut oferte.

Să începem cu celula H2, care conține numărul de cumpărători din grupul 1 care au acceptat oferta # 1, respectiv malbecul din ianuarie. Este necesar să adăugați valorile celulelor intervalului L2: DG2 pe foaia de 4MC, dar numai clienții dintr-un cluster, care este un exemplu clasic de utilizare a formei sumif / summes. Arată așa:

SUMIF ("4MC"! $ L $ 39: $ DG $ 39, "4MC - TopDealsByCluster"! H $ 1, "4MC"! $ L2: $ DG2)
\u003d CyMMEOra ("4MC"! $ L $ 39: $ DG $ 39, "4MC - TopDealsByCluster"! H $ 1, "4MC"! $ L2: $ DG2)

Această formulă funcționează astfel: o furnizați cu unele condiționale, pe care le verifică în prima parte a „4MC”! $ L $ 39: $ DG $ 39, „4MC, apoi se compară cu 1 în antetul coloanei („ 4MC - TopDealsByCluster ”! H $ 1 ), apoi la fiecare meci, adaugă acea valoare la linia 2 din partea a treia a formulei „4MC”! $ L2: $ DG2.

Observați că ați utilizat referințe absolute ($ în formulă) înainte de tot ceea ce privește legarea clusterului, numărul rândurilor din anteturile coloanei și litera coloanei pentru tranzacții. După ce ați făcut aceste legături absolute, puteți trage formula oriunde din H2: K33 pentru a calcula numărul de oferte pentru alte centre de cluster și combinații de oferte, ca în Fig. 21. Pentru a face aceste coloane mai lizibile, le puteți aplica și formatarea condițională.

Figura: 21. Numărul total de tranzacții pentru fiecare ofertă, defalcat pe grupuri

Evidențiind coloanele de la A la K și aplicând filtrarea automată, puteți sorta aceste date. Sortând coloana H de la cea mai mică la cea mai mare, veți vedea care meserii sunt cele mai populare în grupul 1 (Figura 22).

Figura: 22. Sortează un cluster 1. Pinot, pinot, pinot!

După cum am menționat mai devreme, cele mai mari patru tranzacții pentru acest cluster sunt Pinos. Acești tipi abuzează în mod clar de filmul Sideways. Dacă sortați grupul 2, devine clar că sunt angrosiști \u200b\u200bmici (Figura 23).

Dar când sortați grupul 3, nu este atât de ușor de înțeles. Ofertele mari pot fi numărate pe de o parte, iar diferența dintre ele și restul nu este atât de evidentă. Cu toate acestea, cele mai populare oferte au ceva în comun - reduceri destul de bune, 5 dintre cele mai mari 6 oferte sunt pentru vin spumant, iar Franța este producătorul produsului pentru 3 din 4 dintre ele. Cu toate acestea, aceste ipoteze sunt ambigue.

În ceea ce privește grupul 4, acestor tipi, dintr-un anumit motiv, le-a plăcut în mod clar oferta din august pentru șampanie. De asemenea, 5 dintre cele mai mari 6 oferte sunt pentru vinul francez, iar 9 din cele mai mari 10 oferte sunt pentru volum mare. Poate că acesta este un mare grup en-gros care se ocupă de vinurile franceze? Intersecția grupurilor 3 și 4 este, de asemenea, îngrijorătoare.

Mai mult, luăm în considerare segmentarea elevilor în funcție de caracteristicile subiective (a se vedea secțiunea 14.1) și de beneficiile (a se vedea secțiunea 14.4) care beneficiază de studii superioare în educație cu normă întreagă. Pentru segmentare, se utilizează o tehnică bazată pe analiza cluster utilizând scalarea multidimensională pentru o analiză suplimentară, mai completă.

Variabile de segmentare - proprietăți și beneficii - ar trebui să fie punctate cantitativ. La rezolvarea unei probleme specifice, s-au folosit nouă parametri. Pentru aplicarea scalei Likert pentru fiecare parametru, sunt formulate enunțurile corespunzătoare.

  • 1. Acesta este cel mai bun mod de a dobândi cunoștințe profunde.
  • 2. Aceasta este o oportunitate de a comunica pe deplin și de a face prieteni.
  • 3. Aceasta este o oportunitate valoroasă de a comunica cu profesorul.
  • 4. Acesta este un pas important în începerea unei cariere.
  • 5. Studenția este o perioadă minunată în viață.
  • 6. Costurile materiale ale antrenamentului de zi sunt ridicate.
  • 7. Timpul petrecut la antrenamentele de zi este mare.
  • 8. Dezvoltă gândirea în specialitate.
  • 9. Educația în timpul zilei este prestigioasă.

Setul de parametri care pot fi utilizați poate fi mult mai larg. Studenții din chestionarele lor indică adesea următoarele avantaje sau dezavantaje ale studiilor de zi la universitate: posibilitatea de a-și lărgi orizontul, posibilitatea de amânare, posibilitatea de a învăța auto-disciplina și auto-organizarea, dificultatea de a combina studiul și munca, o perioadă importantă în viață, lipsa de practică, capacitatea de a obține o cantitate mare de informații pentru continuarea progresului în muncă, apariția în viitor a oportunității de a determina alegerea corectă a profesiei, participarea la viața universității.

Colectare de date

Colectarea datelor se realizează printr-o metodă de chestionar. Întrebările sunt formulate utilizând scara Likert (vezi subsecțiunea 8.3). De exemplu, elevii au fost întrebați cu privire la gradul lor de acord-dezacord cu afirmații pe o scară cu cinci gradații. În literatură, o scară de șapte puncte este utilizată pe scară largă, dar adesea respondentului îi este greu să dea răspunsuri cu un număr mare de gradații.

Un fragment al chestionarului are forma prezentată în Fig. 24.2.

Figura: 24.2.

Respondentului i se cere doar să bifeze caseta, iar digitalizarea se efectuează de către interogator. S-a aplicat o scară de cinci puncte cu niveluri de la 1 la 5 (1 - foarte dezacord, ..., 5 - foarte de acord). 19 respondenți au răspuns la chestionar - toți elevii din același grup, ceea ce, desigur, nu este suficient.

24.7. Segmentarea pe proprietăți pe exemplul unui produs educațional 381

Calcule prin metoda analizei cluster

Analiza clusterelor (a se vedea secțiunea 23.7) este utilizată pe scară largă în segmentarea în funcție de proprietățile produsului (a se vedea secțiunea 24.3). Segmentarea analizei cluster este uneori numită ierarhic. Pe baza scorurilor primite, distanța dintre scorurile fiecărui elev este calculată cu fiecare. Bazat pe pachetul software statistic științific Statistica. În primul rând, este compilată o matrice de distanțe euclidiene (distanțele euclidiene). Pentru formarea clusterelor, procedura de unificare (aglomerativă) a fost aplicată în conformitate cu metoda vecinului îndepărtat (legătură completă). Rezultatele sunt prezentate schematic în Fig. 24.3.

Figura: 24.3. Dendrogramă (PPP Statistica)

Axa verticală este distanța de legătură între clustere. Pe axa orizontală, elevii sunt listați cu numere de la C_1 la C19. După cum urmează din dendrogramă, există 19 clustere la primul pas. Primul și al doilea pas combină punctele 3 cu 5 și 9 cu 11. În al treilea pas, sunt combinate punctele 8 și 13. Apoi procesul de combinare continuă.

Atunci când alegem pasul final și, în consecință, numărul de clustere, folosim planul de aglomerare (Fig. 24.4). Pasul este făcut ca versiunea finală, după care distanța dintre clusterele care se unesc (Linkage Distance) crește brusc.

Figura: 24.4.

Să alegem rezultatul partiției în conformitate cu recomandările din sec. 23.7. După cum urmează din planul de aglomerare, o creștere relativ bruscă a distanței dintre grupurile atașate are loc la treptele 13 și 17 (Etapa din Fig. 24.4). Prin urmare, trebuie făcută o alegere între pașii 12 și 16. Pentru o alegere fără echivoc a etapei finale în conformitate cu aceleași recomandări din sec. 23.7 să trecem la scalarea multidimensională.

Rezultate de segmentare a scalării multidimensionale

În plus, pentru a selecta versiunea finală a clasificării, o imagine a poziției relative a punctelor este luată în considerare prin metoda scalării multidimensionale din Fig. 24.5, care a fost obținut ca urmare a colaborării cu RFP Statistica. Axelor li se oferă două dimensiuni - Dimensiunea 1 și Dimensiunea 2.

Clusterele au o formă convexă doar la etapa a 16-a a analizei clusterului, care poate fi văzută din rezultatele trasării limitelor intergrupuri pe baza scalării multidimensionale. Aceste rezultate sunt acceptate ca finale. S-au format trei clustere și, de fapt, segmente. Primul grup include nouă puncte, al doilea trei și al treilea șapte.

Figura: 24.5.

Caracteristicile segmentului

Segmentele pot fi caracterizate prin valorile medii pentru fiecare variabilă, iar rezultatele segmentării pot fi prezentate grafic sub formă de profiluri prin valorile medii pentru fiecare variabilă (Fig. 24.6).

Pentru o descriere laconică semnificativă a segmentului, i se dă un nume, un motto. Caracterizarea completă a clusterului rezultă din profilul său. Numele segmentului se poate baza pe variabilele pentru care se obțin cele mai mari și cele mai mici scoruri, după cum se poate observa din examinarea profilurilor. Compararea profilurilor vă permite să identificați caracteristicile fiecărui segment, „poziționați-l” pe fundalul celorlalte.

Să formulăm numele fiecărui segment rezultat și să oferim un motto. Primul segment - pozitivisti: „Costurile nu sunt principalul lucru”, al doilea - iubitorii de viață. "Gândește-te la prezent. Noi

Figura: 24.6.

aici nu pentru prestigiu și carieră ", al treilea - intenționat: „Prestige dă roade”. Următoarea tehnologie a fost utilizată pentru a obține numele segmentului.

Într-adevăr, în conformitate cu Fig. 24.6:

  • pentru primul cluster caracterizată prin note mari pentru semnele (4) „Studenți - o perioadă minunată în viață” și (8) „Dezvoltă gândirea în specialitate”. În același timp, afirmațiile (6) „Costurile materiale sunt mari” și (7) „Costurile de timp sunt ridicate” au primit note mici;
  • al doilea cluster - note mari pentru afirmații (1) „Capacitatea de a comunica pe deplin și de a face prieteni” și (4) „Studenți - o perioadă minunată în viață”. Au fost obținute note mici pentru declarațiile (3) „Un pas important într-o carieră” și (9) „Educația de zi este prestigioasă”;
  • al treilea grup - scoruri ridicate pentru afirmații (6) „Costurile materiale sunt ridicate” și (9) „Educația în timpul zilei este prestigioasă”, în timp ce relativ scăzută pentru (4) „Studenții sunt o perioadă minunată în viață”.
  • Beneficiile aici sunt înțelese în mod convenabil ca fiind motivele pentru obținerea unei astfel de educații.
  • PPP este un pachet de programe aplicate.
  • Teoria metodei este prezentată în Sec. 23.6.
  • Pentru o vizualizare a profilului mai familiară, aceasta trebuie rotită cu 90 ° în sensul acelor de ceasornic.

10 martie 2015

Ieșind cu un produs pe orice piață - consumator, industrial - un producător trebuie să înțeleagă că nu poate servi toți clienții săi, chiar dacă există o capacitate de producție suficientă. La urma urmei, cumpărătorii folosesc acest produs în moduri diferite și, cel mai important, îl cumpără, ghidați de diferite motive. Prin urmare, lucrul obișnuit este să împărțim cumpărătorii (segmentarea) în funcție de aceste motive și alte caracteristici și să oferim abia apoi bunuri realizate cu atenția maximă pentru aceste caracteristici. Abordarea ideală pentru planificarea activităților de marketing din punctul de vedere al satisfacerii nevoilor consumatorilor, fără exagerare, poate fi considerată adaptarea produselor și serviciilor la cerințele fiecărui consumator individual.

Până în 1960, conform teoriei și practicii afacerilor, a predominat o orientare către piața de masă agregată. Acest lucru s-a datorat faptului că, concentrându-se pe piața comună, nealocată, firma producătoare a reușit să producă un număr mare de bunuri și să obțină efectul economiilor de scară. Dar din anii '60. Tendința către necesitatea de a distinge specificul cererii consumatorilor, care se reflectă în segmentarea pieței de vânzări, a început să intre în vigoare.

În condițiile moderne de creștere a concurenței pe piețele de vânzări, problema nevoii de creștere a competitivității produselor industriale interne pe piețele interne și externe devine din ce în ce mai urgentă. În aceste condiții, problema cheie este căutarea rezervelor pentru a reduce costurile, care este baza economică a prețurilor și a profitului. Drept urmare, un număr semnificativ de întreprinderi industriale urmăresc o strategie low-cost, concentrându-se pe diferite moduri de implementare a acesteia: refuzul de la servicii conexe costisitoare; economii de costuri datorate creării de modele de produse mai ieftine pentru producție și altele asemenea. Dar costurile directe sunt în mare măsură determinate de tehnologia de producție, de nivelul de utilizare al întreprinderii producătoare și de oportunitățile de reducere a costurilor de management pe baza îmbunătățirii eficienței managementului zonelor funcționale ale întreprinderii rămân subutilizate.

Unul dintre instrumentele moderne este de a reduce costurile de management și de a asigura o calitate îmbunătățită a managementului, care poate fi interpretată ca acuratețea prognozării profiturilor, profitabilitatea pentru fiecare cluster (un grup de întreprinderi industriale cu același tip de activitate economică) în comparație cu situația inițială sau acuratețea prognozării profitabilității zonelor funcționale de activitate ale acestor întreprinderi este analiza cluster.

Valoarea segmentării ca set de instrumente eficient pentru activitățile de marketing se explică prin următoarele caracteristici:

ü segmentarea este un mijloc extrem de eficient de concurență, deoarece se concentrează pe identificarea și satisfacerea nevoilor specifice ale consumatorilor;
ü orientează activitățile firmei către o nișă de piață specifică, acest lucru este valabil mai ales pentru firmele care își încep activitățile de piață;
ü segmentarea pieței ajută la definirea mai bună a direcției de marketing a firmei;
ü cu ajutorul segmentării, devine posibilă stabilirea unor obiective de marketing realiste;
ü segmentarea cu succes a pieței afectează eficacitatea marketingului în ansamblu, de la cercetarea pieței și a consumatorilor până la formarea unui sistem adecvat de vânzare și promovare.

În teoria marketingului, a apărut conceptul S TP -marketing ... Se formează din abrevierea primelor litere ale cuvintelor în limba englezăsegmentarea (segmentare),direcționare (selectarea pieței țintă) șipoziționare (poziționare). S TP -marketing este inima marketingului strategic modern.

Segmentarea pieței este împărțirea consumatorilor în grupuri pe baza diferenței de nevoi, caracteristici sau comportament și dezvoltarea pentru fiecare dintre grupurile unui mix de marketing separat.

Segment de piață constă din consumatori care răspund în același mod la același set de stimulente de marketing.

1. Segmentarea pieței - etapa identificării grupurilor individuale de consumatori pe piața comună.
2. Selectarea piețelor țintă - segmentele țintă sunt selectate dintre segmentele de piață selectate, adică cele către care firma ar trebui să își concentreze activitățile.
3. Poziționare - definirea produsului firmei printre produsele analogilor.

Scopul final al segmentării pieței țintă este selectarea unui segment (sau segmente) de consumatori, pentru a satisface nevoile pe care se vor concentra activitățile firmei.
Specialiștii în marketing consideră că alocarea corectă a unui segment de piață reprezintă jumătate din succesul comercial și își amintesc în mod constant modificarea faimosului legea Pareto (legea 80:20).

Segmentarea pieței este o procedură formală bazată pe aplicarea metodelor statistice de analiză multivariată la rezultatele cercetării. Patru metode principale pot fi utilizate pentru a obține segmente de piață:

1 Metode tradiționale:

A priori (a priori);

Bazat pe cluster.

2 Metode noi:

Segmentare flexibilă (flexibilă);

Segmentarea componentelor

Metoda a priori de segmentare a pieței de consum este utilizată atunci când este posibil să se prezinte o ipoteză a segmentării pieței. Pentru a face acest lucru, este necesar să înțelegem nevoile, cerințele, dorințele consumatorilor. Caracteristicile consumatorilor, precum intensitatea consumului, nevoile, elementele cheie ale motivației și valorile acestora, vor acționa ca variabile independente, iar variabilele de segmentare (vârstă, sex, regiune etc.) vor fi utilizate ca variabile dependente.

Folosind această metodă, cercetătorul propune inițial ipoteza segmentării pieței și apoi în cursul cercetării de marketing o testează.

Metoda a priori de segmentare a pieței include șapte etape:

1 Alegerea bazei segmentării. Analiza nevoilor, nevoilor și a altor factori care influențează alegerea consumatorului.

2 Selectarea variabilelor de segmentare și dezvoltarea unei grile de segmentare a pieței (ipoteză). Există o selecție și o justificare a criteriilor, variabile pentru segmentarea pieței de consum, o căutare a conexiunilor probabile între bază și variabile, contradicțiile din grila de segmentare a pieței sunt eliminate.

3 Eșantionare.

4 Se realizează un chestionar, sunt colectate date cantitative.

5 Segmente se formează pe baza defalcării respondenților din numărul de potențiali cumpărători pe categorii.

6 Stabilirea profilelor de segment. Segmentele de piață sunt formate și testate pentru conformitatea cu ipoteza.

7 Elaborarea strategiilor de marketing pentru fiecare segment de piață.

Metoda de împărțire a priori este cea mai utilizată metodă. Acest lucru se datorează simplității sale, costului redus și disponibilității tehnicilor pentru a asigura implementarea acestuia. Cu toate acestea, în practică, adesea apar situații când este destul de dificil să se prezinte o ipoteză de segmentare a pieței.

Metoda cluster este similară cu metoda anterioară, dar nu definește o variabilă dependentă - caută clustere naturale. În primul rând, potențialii cumpărători intervievați sunt grupați pe segmente de piață folosind o procedură analitică. Apoi sunt identificate variabile care ar putea fi utilizate pentru a defini un segment de piață.

În timpul grupării, grupurile naturale sunt căutate, iar în timpul clasificării, grupurile sunt formate conform unor criterii specificate artificial.


Gruparea SIDA a consumatorilor este larg răspândită. Atunci când se utilizează această metodă, este selectat un criteriu de formare a sistemului. După aceea, eșantionul este împărțit în subgrupuri, adică se formează subgrupuri cu o valoare ridicată a criteriului de formare a sistemului.

Dezavantajul acestei metode este selectarea unui segment de piață. Metoda este laborioasă și nu garantează o soluție precisă.

Segmentarea prin metoda analizei clusterului se realizează în ordine crescătoare (de jos în sus). În stadiul cercetării de marketing, sunt evidențiate multe caracteristici ale cumpărătorului. Este necesar un eșantion de cel puțin 200 de unități. Rezultatele sunt procesate. Datele sunt luate în considerare la o scară universală care determină severitatea parametrului. Apoi, fiecare consumator este examinat și se determină cei mai asemănători. Consumatorii similari sunt combinați în clustere și acționează ca un obiect compozit. Apoi, cele mai similare obiecte sunt căutate și combinate într-un nou cluster. Procesul se termină atunci când este imposibil să se identifice clustere similare.

Pentru a implementa segmentarea pieței folosind metoda de clusterizare în practică, pot fi utilizate pachete statistice precum SPSS și NCSS & PASS.

Segmentarea flexibilă a pieței este o procedură dinamică care implică flexibilitate în construirea segmentelor pe baza unei analize a preferințelor consumatorilor în raport cu alternativele de produs. Procedura de analiză colaborativă se află în centrul fragmentării flexibile. Unul dintre avantajele acestei metode este că vă permite să determinați cu precizie grupurile de consumatori atunci când un nou produs intră pe piață. Dezavantajele metodei de segmentare flexibile includ costul ridicat, procedura de implementare complexă și posibilele erori la nivel de dezvoltator.

Analiza componentelor segmentării pieței se bazează pe tehnici de analiză statistică sofisticate. Necesită o mulțime de resurse de calcul. Metoda de analiză a componentelor segmentării pieței a fost propusă de P. Green. Această metodă încearcă să determine ce tip de cumpărători este cel mai potrivit pentru anumite caracteristici ale produsului.

Potrivit experților occidentali, metoda segmentării pieței flexibile și a componentelor este pur academică și inaplicabilă vieții reale.

Ca parte a lucrării din primul capitol al lucrării finale de calificare, au fost obținute cunoștințe teoretice în domeniul segmentării pieței de consum. Sunt luate în considerare principalele caracteristici ale segmentării pieței de consum. Au fost studiate metode de segmentare a pieței.

Metode de segmentare

Există câteva metode de segmentare „de bază”. Cea mai importantă dintre acestea este analiza grupurilor de consumatori (taxonomie). Clusterele de consumatori sunt formate prin alăturarea unui grup de persoane care oferă răspunsuri similare la întrebările puse. Clienții pot fi grupați dacă sunt similari ca vârstă, venit, obiceiuri etc. Similitudinea dintre cumpărători se bazează pe diferite măsuri, dar de multe ori suma ponderată a diferenței pătrate dintre răspunsurile cumpărătorilor la o întrebare este utilizată ca măsură a similarității. Rezultatul algoritmilor de grupare poate fi arbori ierarhici sau asocierea consumatorilor în grupuri. Există un număr mare de algoritmi cluster.

De exemplu, în Statele Unite, există o analiză pe scară largă a sistemelor numite PRIZM. , care începe gruparea prin reducerea setului de 1000 posibili indicatori socio-demografici. Acest sistem formează segmente socio-demografice pentru întreg teritoriul Statelor Unite. Astfel, grupul 28 este evidențiat - familiile care se încadrează în acest grup includ persoane cu cele mai de succes cariere profesionale sau manageriale. Acest cluster reflectă, de asemenea, venituri mari, educație, proprietate, aproximativ vârsta mijlocie. Deși acest cluster reprezintă doar 7% din populația SUA, este esențial pentru antreprenorii care vând bunuri scumpe.


Există și alte exemple de segmentare a clienților bazate pe analiza clusterelor. De exemplu, printre sectoarele „psihologice”, un loc foarte important îl ocupă „atitudinea consumatorului față de noutatea produsului” (Fig. 3)

Figura 3

După cum se poate vedea din datele de mai sus, cel mai mare număr de consumatori sunt cumpărători obișnuiți.

Segmentarea clienților pe baza analizei cluster este o metodă „clasică”. În același timp, există tehnici de segmentare a pieței pe baza așa-numitei „segmentări de produse” sau a segmentării pieței după parametrii produsului. Este deosebit de important în producția și comercializarea de produse noi. O importanță deosebită o are segmentarea produselor bazată pe studiul tendințelor pieței pe termen lung. Procesul de dezvoltare și fabricare a unui nou produs, finalizarea unor programe de investiții mari necesită o perioadă destul de lungă, iar corectitudinea rezultatelor analizei pieței și evaluarea capacității sale este deosebit de importantă aici. În condițiile de lucru pe piața tradițională a produselor standard, calculul capacității sale poate fi efectuat utilizând metoda de însumare a piețelor. În condiții moderne, pentru a-și crește competitivitatea și a determina corect capacitatea pieței, nu mai este suficient ca o întreprindere să segmenteze piața într-o singură direcție - definirea grupurilor de consumatori după niște criterii. În cadrul marketingului integrat, este necesară și segmentarea produsului în sine în funcție de parametrii cei mai importanți pentru promovarea acestuia pe piață. În acest scop, metoda de compilare carduri funcționale - efectuarea unui fel de dublă segmentare, pe produs și pe consumator.

Hărțile funcționale „pot fi cu un singur factor (segmentarea se efectuează în funcție de un factor și pentru un grup omogen de produse) și cu mai mulți factori (analiza pentru care grupuri de consumatori este destinat un anumit model de produs și care dintre parametrii săi sunt cei mai importanți pentru promovarea produselor pe piață). carduri funcționale, este posibil să se determine pentru ce segment de piață este proiectat produsul dat, care dintre parametrii săi funcționali corespund anumitor cereri ale consumatorilor.

La dezvoltarea de noi produse, această metodologie presupune că trebuie luați în considerare toți factorii care reflectă sistemul preferințelor consumatorilor și, în același timp, parametrii tehnici ai unui nou produs, cu ajutorul cărora este posibil să se satisfacă nevoile consumatorilor; sunt definite grupurile de consumatori, fiecare cu propriul set de cereri și preferințe; toți factorii selectați sunt clasați în funcție de gradul de importanță pentru fiecare dintre grupurile de consumatori.

Această abordare permite deja, în faza de dezvoltare, să vadă ce parametri ai produsului trebuie să fie reproiectați sau să stabilească dacă există o piață suficient de capabilă pentru acest model.

Să dăm un exemplu de astfel de analiză de piață în legătură cu proiectul dezvoltat de computere „Apple” (Tabelul 1) (vezi pagina următoare)

Tabelul 1." Segmentarea pieței computerelor personale și factorii luați în considerare la dezvoltarea produselor pentru aceasta (1982) "

Factori Segmente de piață pe grupuri de consumatori Model
Case La scoala La Universitate In casa. cabinet În micile afaceri În corporație ȘI LA
Specificatii tehnice * * *** ** ** ** *** **
Preț *** *** ** *** *** ** 0 **
Calități speciale * * ** * * * ** *
Fiabilitate ** * * ** ** * 0 **
Comoditate în utilizare ** ** * ** * 0 *** ***
Compatibilitate 0 0 0 0 0 *** 0 0
Echipament periferic 0 0 0 0 0 *** 0 0
Furnizarea de programe * * ** ** ** *** * **

*** - un factor foarte important

** - un factor important

* - un factor neimportant

0 - factor minor

Această analiză simplă arată că Modelul A este un computer fără piață, iar Modelul B este cel mai potrivit produs pentru universități și întreprinderi mici.

Compania a pus-o pe computerul A și a pierdut.

În general, în practica mondială, se utilizează 2 abordări de bază pentru segmentarea marketingului - (a se vedea: schema generală de analiză a segmentelor (Fig. 4)) (pagina următoare)



În cadrul primei metode. numite „a priori” semne cunoscute anterior de segmentare, numărul de segmente, numărul lor, caracteristicile, harta intereselor. Adică, se presupune că grupurile de segmente din această metodă au fost deja formate. Metoda „ariory” este utilizată în cazurile în care segmentarea nu face parte din cercetarea curentă, ci servește ca bază auxiliară pentru rezolvarea altor probleme de marketing. Uneori, această metodă este utilizată atunci când există o definiție foarte clară a segmentelor de piață, atunci când varianța segmentelor de piață nu este mare. „O prioritate” este, de asemenea, admisibilă atunci când se formează un nou produs orientat către un segment de piață bine cunoscut.

În cadrul celei de-a doua metode, numită „post hoc (bazată pe cluster), este implicată incertitudinea caracteristicilor de segmentare și esența segmentelor în sine. Cercetătorul preselectează o serie de variabile care sunt interactive în raport cu respondentul (metoda implică o anchetă) și apoi, în funcție de atitudinea exprimată față de un anumit grup de variabile, respondenții aparțin segmentului relevant, în timp ce harta de interese identificată în analiza ulterioară este considerată secundară. Această metodă este utilizată la segmentarea piețelor de consum, a cărei structură a segmentului nu este definită în raport cu produsul vândut.

Segmentarea după metodă " un priorat "

La alegerea numărului de segmente în care ar trebui împărțită piața, acestea sunt de obicei ghidate de funcția țintă - determinând segmentul cel mai promițător. Evident, atunci când formați un eșantion, nu este necesar să includeți în acesta segmente, al căror potențial de cumpărare este destul de mic în raport cu produsul investigat. Numărul de segmente, după cum arată studiile, nu ar trebui să depășească 10, excesul este de obicei asociat cu detalierea excesivă a caracteristicilor de segmentare și duce la „estomparea” inutilă a caracteristicilor.

De exemplu, atunci când se segmentează în funcție de nivelul veniturilor, se recomandă împărțirea tuturor cumpărătorilor potențiali în segmente egale, ținând cont de faptul că volumul fiecăruia dintre segmente este cel puțin nu mai mic decât volumul estimat al vânzărilor de servicii pe baza cunoașterii capacității de producție a întreprinderii. Cel mai reușit exemplu care explică cele de mai sus și demonstrează posibilitatea descompunerii potențialilor consumatori în grupuri de segmente stabile este segmentarea populației după venituri, atunci când întreaga populație este împărțită în cinci grupe de 20%. Distribuția prezentată a volumului de venit pentru cinci grupuri de 20% din populație este prezentată în mod regulat în colecții statistice și rezumate, similar cu cel prezentat în tabel. 2

masa 2 ."Distribuția veniturilor pe grupe de populație. %"

Confortul de a lucra cu astfel de grupuri de segmente este evident, mai ales în ceea ce privește urmărirea capacității acestora.

 

Ar putea fi util să citiți: