การทบทวนวิธีการวิเคราะห์คลัสเตอร์และการประเมินความสามารถในการนำไปใช้ในการแก้ปัญหาการแบ่งส่วนตลาดผู้บริโภค วิธีการและเครื่องมือสำหรับการแบ่งกลุ่มผู้บริโภควิธีการแบ่งส่วนคลัสเตอร์
ฉันทำงานในอุตสาหกรรมการตลาดผ่านอีเมลสำหรับไซต์ชื่อ MailChimp.com เราช่วยลูกค้าสร้างจดหมายข่าวสำหรับผู้ชมโฆษณาของพวกเขา ทุกครั้งที่มีคนเรียกงานของเราว่า "ไปรษณีย์บรรจุ" ฉันรู้สึกหนาวเหน็บในใจ
ทำไม? เนื่องจากที่อยู่อีเมลไม่ใช่กล่องดำที่คุณทิ้งระเบิดด้วยข้อความเช่นระเบิดอีกต่อไป ไม่ในการตลาดทางอีเมล (เช่นเดียวกับการติดต่อทางออนไลน์ในรูปแบบอื่น ๆ เช่นทวีตโพสต์ Facebook และแคมเปญ Pinterest) ธุรกิจจะได้รับข้อมูลเชิงลึกว่าผู้ชมมีส่วนร่วมอย่างไรในแต่ละระดับผ่านการติดตามการคลิกคำสั่งซื้อออนไลน์ การแพร่กระจายของสถานะบนเครือข่ายสังคม ฯลฯ ข้อมูลนี้ไม่ได้เป็นเพียงการรบกวน พวกเขาแสดงลักษณะผู้ชมของคุณ แต่สำหรับผู้ที่ไม่ได้ฝึกหัดการดำเนินการเหล่านี้จะคล้ายกับภูมิปัญญาของภาษากรีก หรือภาษาเอสเปรันโต.
คุณรวบรวมข้อมูลเกี่ยวกับธุรกรรมกับลูกค้าของคุณ (ผู้ใช้สมาชิก ฯลฯ ) และใช้ข้อมูลดังกล่าวเพื่อทำความเข้าใจผู้ชมของคุณได้อย่างไร เมื่อคุณติดต่อกับคนจำนวนมากอาจเป็นเรื่องยากที่จะศึกษาลูกค้าแต่ละรายเป็นรายบุคคลโดยเฉพาะอย่างยิ่งหากพวกเขาสื่อสารกับคุณด้วยวิธีที่แตกต่างกัน แม้ว่าในทางทฤษฎีคุณสามารถติดต่อกับทุกคนเป็นการส่วนตัวได้ แต่ในทางปฏิบัติแทบจะเป็นไปไม่ได้
คุณต้องยึดฐานลูกค้าของคุณและค้นหาจุดศูนย์กลางระหว่างการทิ้งระเบิดแบบสุ่มและการตลาดเฉพาะบุคคลสำหรับลูกค้าแต่ละราย วิธีหนึ่งในการบรรลุความสมดุลนี้คือการใช้การทำคลัสเตอร์เพื่อแบ่งกลุ่มตลาดลูกค้าของคุณเพื่อให้คุณสามารถกำหนดเป้าหมายกลุ่มต่างๆของฐานลูกค้าของคุณด้วยเนื้อหาข้อเสนอพิเศษและอื่น ๆ
การวิเคราะห์คลัสเตอร์คือการรวบรวมวัตถุต่างๆและแบ่งออกเป็นกลุ่มของตัวเอง การทำงานร่วมกับกลุ่มเหล่านี้ - โดยการระบุสิ่งที่สมาชิกของพวกเขามีเหมือนกันและสิ่งที่ทำให้พวกเขาแตกต่างออกไปคุณจะได้เรียนรู้มากมายเกี่ยวกับข้อมูลที่ยุ่งเหยิงที่คุณมี ความรู้นี้จะช่วยให้คุณตัดสินใจได้ดีที่สุดและในระดับที่ละเอียดกว่าเดิม
ในบริบทนี้การจัดกลุ่มเรียกว่าการขุดข้อมูลเชิงสำรวจเนื่องจากเทคนิคเหล่านี้ช่วยดึงข้อมูลเกี่ยวกับความสัมพันธ์ในชุดข้อมูลขนาดใหญ่ที่ไม่สามารถจับภาพได้ และการค้นหาการเชื่อมต่อในกลุ่มทางสังคมมีประโยชน์ในทุกอุตสาหกรรมสำหรับการแนะนำภาพยนตร์ตามนิสัยของผู้ชมเป้าหมายเพื่อระบุศูนย์กลางอาชญากรของเมืองหรือการลงทุนทางการเงิน
หนึ่งในการใช้งานคลัสเตอร์ที่ฉันชอบคือการจัดกลุ่มรูปภาพ: การซ้อนไฟล์ภาพที่ "ดูเหมือนกัน" ไว้ในคอมพิวเตอร์ ตัวอย่างเช่นในบริการฝากรูปภาพเช่น Flickr ผู้ใช้สร้างเนื้อหาจำนวนมากและการนำทางที่เรียบง่ายกลายเป็นไปไม่ได้เนื่องจากรูปภาพจำนวนมาก แต่เมื่อใช้เทคนิคการจัดกลุ่มคุณสามารถรวมรูปภาพที่คล้ายกันเข้าด้วยกันเพื่อให้ผู้ใช้ไปยังส่วนต่างๆของกลุ่มเหล่านี้ก่อนที่จะเรียงลำดับโดยละเอียด
แมชชีนเลิร์นนิงภายใต้การดูแลหรือไม่ได้รับการดูแล?
ในการขุดข้อมูลเชิงสำรวจตามความหมายคุณจะไม่รู้ล่วงหน้าว่าคุณกำลังมองหาข้อมูลประเภทใด คุณเป็นนักวิจัย คุณสามารถอธิบายได้อย่างชัดเจนว่าเมื่อใดที่ลูกค้าสองรายมีลักษณะคล้ายกันและเมื่อใดที่พวกเขาดูแตกต่างกัน แต่คุณไม่รู้วิธีที่ดีที่สุดในการแบ่งกลุ่มฐานลูกค้าของคุณ ดังนั้นการ "ขอให้" คอมพิวเตอร์แบ่งกลุ่มฐานลูกค้าให้คุณจึงเรียกว่าแมชชีนเลิร์นนิงที่ไม่ได้รับการดูแลเนื่องจากคุณไม่สามารถควบคุมอะไรได้เลย - คุณไม่ได้สั่งคอมพิวเตอร์ว่าจะทำงานอย่างไร
ตรงกันข้ามกับกระบวนการนี้คือมีการเรียนรู้ของเครื่องที่อยู่ภายใต้การดูแลซึ่งมักจะปรากฏขึ้นเมื่อปัญญาประดิษฐ์มาถึงหน้าแรก ถ้าฉันรู้ว่าฉันต้องการแบ่งลูกค้าออกเป็นสองกลุ่ม - พูดว่า "มีแนวโน้มที่จะซื้อมากที่สุด" และ "ไม่น่าซื้อ" - และจัดหาคอมพิวเตอร์ที่มีตัวอย่างในอดีตของลูกค้าดังกล่าวโดยใช้นวัตกรรมทั้งหมดกับหนึ่งในกลุ่มเหล่านี้นั่นคือการควบคุม
หากฉันตอบว่า“ นี่คือสิ่งที่ฉันรู้เกี่ยวกับลูกค้าของฉันและนี่คือวิธีที่จะบอกได้ว่าพวกเขาแตกต่างหรือเหมือนกัน บอกสิ่งที่น่าสนใจหน่อย” - นี่คือการขาดการควบคุม
บทนี้กล่าวถึงวิธีการจัดกลุ่มที่ง่ายที่สุดที่เรียกว่า k-mean method ซึ่งมีมาตั้งแต่ทศวรรษที่ 50 และได้กลายมาเป็น Databases Knowledge Opener (DBK) ในทุกอุตสาหกรรมและรัฐบาล
วิธี k-mean ไม่ใช่วิธีที่ถูกต้องทางคณิตศาสตร์ที่สุดในบรรดาวิธีการทั้งหมด มันถูกสร้างขึ้นโดยเหตุผลหลักในการใช้งานได้จริงและสามัญสำนึกเช่นอาหารแอฟริกันอเมริกัน เธอไม่ได้มีสายเลือดที่เก๋ไก๋เช่นเดียวกับชาวฝรั่งเศส แต่เธอมักจะชอบอาหารของเรา K-Means Cluster Analysis อย่างที่คุณจะเห็นในไม่ช้านี้เป็นส่วนหนึ่งของคณิตศาสตร์และประวัติส่วนหนึ่ง (เกี่ยวกับอดีตของ บริษัท หากการเปรียบเทียบเกี่ยวข้องกับวิธีการเรียนรู้ด้านการจัดการ) ข้อดีที่เห็นได้ชัดคือความเรียบง่ายที่ใช้งานง่าย
มาดูวิธีการทำงานของวิธีนี้ด้วยตัวอย่างง่ายๆ
สาวเต้นกับสาว ๆ หนุ่ม ๆ เกาหัว
เป้าหมายของการจัดกลุ่ม k-mean คือการเลือกจุดหลาย ๆ จุดในอวกาศและเปลี่ยนเป็น k กลุ่ม (โดยที่ k คือตัวเลขใด ๆ ที่คุณเลือก) แต่ละกลุ่มจะถูกระบุโดยจุดที่อยู่ตรงกลางเช่นธงที่ติดอยู่บนดวงจันทร์และส่งสัญญาณว่า“ เฮ้นี่คือจุดศูนย์กลางของกลุ่มฉัน! เข้าร่วมหากคุณอยู่ใกล้ธงนี้มากกว่าธงอื่น! " ศูนย์กลางของกลุ่มนี้ (มีชื่อทางการว่าคลัสเตอร์เซนทรอยด์) เป็นชื่อกลางของวิธี k-mean
ลองจำการเต้นรำของโรงเรียนเช่น หากคุณสามารถลบ "ความบันเทิง" ที่น่ากลัวนี้ออกไปจากความทรงจำของคุณได้ฉันเสียใจมากที่นำความทรงจำที่เจ็บปวดเช่นนี้กลับมา
ฮีโร่ในตัวอย่างของเรา - นักเรียนจาก Macacne High School ที่มาร่วมงานเต้นรำยามเย็นภายใต้ชื่อเรื่อง "Ball at the Bottom of the Sea" ที่โรแมนติก - กระจัดกระจายอยู่รอบ ๆ ห้องประชุม 1. ฉันวาดบนไม้ปาร์เก้ใน Photoshop เพื่อให้ง่ายต่อการจินตนาการถึงสถานการณ์
รูป: 1. นักเรียนมัธยม Macacne นั่งอยู่ในห้องประชุม
ต่อไปนี้เป็นตัวอย่างเพลงที่ผู้นำหนุ่มสาวแห่งโลกเสรีเหล่านี้จะเต้นอย่างเชื่องช้า (ในกรณีที่คุณต้องการเพลงใน Spotify ในทันใด):
- Styx: มาแล่นเรือออกไป
- ทุกอย่างยกเว้นหญิงสาว: หายไป
- Ace of Base: ทุกสิ่งที่เธอต้องการ
- Soft Cell: ความรักที่แปดเปื้อน
- Montell Jordan: นี่คือวิธีที่เราทำ
- Eiffel 65: สีน้ำเงิน
ตอนนี้การจัดกลุ่มด้วย k-mean ขึ้นอยู่กับจำนวนคลัสเตอร์ที่คุณต้องการแบ่งกลุ่มเป้าหมาย เริ่มจากสามกลุ่ม (เราจะดูตัวเลือกของ k ต่อไปในบทนี้) อัลกอริทึมจะวางธงสามชุดไว้ที่พื้นห้องโถงประกอบด้วยวิธีที่ยอมรับได้ดังแสดงในรูปที่ 2 ที่คุณเห็นธงเริ่มต้น 3 ธงกระจายอยู่ทั่วพื้นและมีวงกลมสีดำกำกับไว้
รูป: 2. ตำแหน่งของศูนย์คลัสเตอร์เริ่มต้น
ในการรวมกลุ่ม k-mean นักเต้นจะผูกติดกับศูนย์กลางคลัสเตอร์ที่ใกล้ที่สุดเพื่อให้สามารถลากเส้นแบ่งระหว่างศูนย์กลางสองจุดใดก็ได้บนพื้น ดังนั้นหากนักเต้นอยู่ด้านใดด้านหนึ่งของเส้นเขาจะอยู่ในกลุ่มหนึ่งถ้าอยู่อีกด้านหนึ่งจากนั้นไปยังอีกกลุ่มหนึ่ง (ดังรูปที่ 3)
รูป: 3. เส้นทำเครื่องหมายขอบเขตของคลัสเตอร์
ใช้เส้นแบ่งเขตเหล่านี้แบ่งนักเต้นออกเป็นกลุ่มและระบายสีตามในรูป 4. แผนภาพนี้การแบ่งพื้นที่ออกเป็นรูปหลายเหลี่ยมที่กำหนดโดยความใกล้ชิดกับศูนย์กลางคลัสเตอร์หนึ่งหรืออีกแห่งหนึ่งเรียกว่าแผนภาพโวโรโนอิ
รูป: 4. การจัดกลุ่มตามคลัสเตอร์ที่ทำเครื่องหมายด้วยรูปแบบพื้นหลังที่แตกต่างกันในแผนภาพ Voronoi
มาดูการหารเริ่มต้นของเรา มีบางอย่างผิดปกติใช่หรือไม่? พื้นที่ถูกแบ่งออกด้วยวิธีที่ค่อนข้างแปลก: กลุ่มซ้ายล่างยังคงว่างเปล่าในขณะที่ขอบของกลุ่มขวาบนตรงกันข้ามมีคนจำนวนมาก
อัลกอริธึมการจัดกลุ่ม k-mean จะย้ายศูนย์คลัสเตอร์ไปทั่วพื้นจนกว่าจะได้ผลลัพธ์ที่ดีที่สุด
จะตัดสิน "ผลลัพธ์ที่ดีที่สุด" ได้อย่างไร? ปัจจุบันแต่ละคนอยู่ห่างจากศูนย์กลางคลัสเตอร์ของตนเอง ยิ่งระยะทางเฉลี่ยจากผู้เข้าร่วมถึงกึ่งกลางกลุ่มสั้นเท่าไหร่ผลลัพธ์ก็จะยิ่งดีขึ้นเท่านั้น
ตอนนี้เราแนะนำคำว่า "ย่อขนาด" ซึ่งจะเป็นประโยชน์อย่างมากสำหรับคุณในการปรับโมเดลให้เหมาะสมเพื่อตำแหน่งที่ดีกว่าของศูนย์คลัสเตอร์ ในบทนี้คุณจะบังคับให้ Solver ย้ายศูนย์คลัสเตอร์นับครั้งไม่ถ้วน วิธีที่ Solution Seeker ใช้ในการค้นหาตำแหน่งที่ดีที่สุดของศูนย์คลัสเตอร์คือการค่อยๆวนซ้ำบนพื้นผิวแก้ไขผลลัพธ์ที่ดีที่สุดที่พบและรวมเข้าด้วยกัน (ผสมพันธุ์อย่างแท้จริงเช่นม้าแข่ง) เพื่อค้นหาตำแหน่งที่ดีที่สุด
ดังนั้นถ้าแผนภาพในรูป 4 ดูค่อนข้างซีด "การหาวิธีแก้ปัญหา" สามารถจัดศูนย์ได้ทันทีเหมือนในรูป 5. ดังนั้นระยะห่างเฉลี่ยระหว่างนักเต้นแต่ละคนและจุดศูนย์กลางจะลดลงเล็กน้อย
รูป: ห้า. ขยับศูนย์เล็กน้อย
เห็นได้ชัดว่าไม่ช้าก็เร็ว "ค้นหาวิธีแก้ปัญหา" จะตระหนักว่าควรวางศูนย์กลางไว้ตรงกลางของนักเต้นแต่ละกลุ่มดังที่แสดงในรูป 6.
รูป: 6. การจัดกลุ่มที่เหมาะสมที่สุดในงานเต้นรำของโรงเรียน
ยอดเยี่ยม! นี่คือลักษณะของการทำคลัสเตอร์ในอุดมคติ ศูนย์คลัสเตอร์ตั้งอยู่ตรงกลางของนักเต้นแต่ละกลุ่มโดยลดระยะห่างเฉลี่ยระหว่างนักเต้นและศูนย์กลางที่ใกล้ที่สุด เมื่อการทำคลัสเตอร์เสร็จสมบูรณ์แล้วก็ถึงเวลาที่จะไปยังส่วนที่สนุกสนานซึ่งพยายามทำความเข้าใจว่าคลัสเตอร์เหล่านี้หมายถึงอะไร
หากคุณรู้จักสีผมของนักเต้นความชอบทางการเมืองของพวกเขาหรือเมื่อพวกเขาข้ามระยะ 100 เมตรการรวมกลุ่มก็ไม่สมเหตุสมผลเท่าไหร่
แต่เมื่อคุณตัดสินใจกำหนดอายุและเพศของคนเหล่านั้นคุณจะเริ่มเห็นแนวโน้มทั่วไปบางอย่าง กลุ่มเล็กด้านล่างเป็นผู้สูงอายุซึ่งส่วนใหญ่จะมาพร้อมกับผู้คน กลุ่มทางซ้ายเป็นเด็กผู้ชายทั้งหมดและกลุ่มทางขวาเป็นเด็กผู้หญิงทั้งหมด และทุกคนกลัวมากที่จะเต้นด้วยกัน
ดังนั้นวิธีการ k ช่วยให้คุณสามารถแบ่งผู้เข้าร่วมการเต้นรำจำนวนมากออกเป็นกลุ่มและเชื่อมโยงลักษณะของผู้เข้าร่วมแต่ละคนที่อยู่ในกลุ่มเฉพาะเพื่อทำความเข้าใจสาเหตุของการแยก
ตอนนี้คุณอาจกำลังพูดกับตัวเองว่า“ มาเถอะเรื่องไร้สาระ ฉันรู้คำตอบอยู่แล้วก่อนที่จะเริ่ม " คุณถูก. ในตัวอย่างนี้ใช่ ฉันจงใจยกตัวอย่าง "ของเล่น" ดังกล่าวโดยต้องแน่ใจว่าคุณสามารถแก้ปัญหาได้เพียงแค่ดูที่จุด การกระทำเกิดขึ้นในพื้นที่สองมิติซึ่งการจัดกลุ่มจะดำเนินการอย่างเป็นองค์ประกอบด้วยความช่วยเหลือของดวงตา
แต่ถ้าคุณเปิดร้านที่ขายสินค้าหลายพันรายการล่ะ? ผู้ซื้อบางรายซื้อสินค้าหนึ่งหรือสองครั้งในช่วงสองปีที่ผ่านมา คนอื่น ๆ ก็หลายสิบ และทุกคนซื้อของเป็นของตัวเอง
คุณรวมกลุ่มไว้บน "ฟลอร์เต้นรำ" ได้อย่างไร? เริ่มต้นด้วยฟลอร์เต้นรำนี้ไม่ใช่สองมิติและไม่ใช่สามมิติ นี่คือพื้นที่พันมิติสำหรับการขายสินค้าซึ่งผู้ซื้อซื้อหรือไม่ได้ซื้อสินค้าในแต่ละมิติ คุณจะเห็นว่าปัญหาของการรวมกลุ่มเริ่มเร็วเกินความสามารถของ "ลูกตาชั้นหนึ่ง" อย่างที่เพื่อนทหารของฉันพูดกันอย่างรวดเร็วเพียงใด
ชีวิตจริง: k-mean clustering ในการตลาดผ่านอีเมล
มาดูกรณีที่สำคัญกว่านี้ ฉันเป็นธุรกิจการตลาดผ่านอีเมลดังนั้นนี่คือตัวอย่างจากชีวิตของ Mailchimp.com ที่ฉันทำงาน ตัวอย่างเดียวกันนี้จะใช้ได้กับข้อมูลการขายปลีกการแปลงโฆษณาโซเชียลมีเดียและอื่น ๆ โดยจะโต้ตอบกับข้อมูลข้อความโฆษณาแทบทุกประเภทและพวกเขาจะเลือกคุณโดยไม่มีเงื่อนไข
Joey Bag O "อาณาจักรไวน์ขายส่งของโดนัท
ลองนึกภาพช่วงเวลาที่คุณอาศัยอยู่ในรัฐนิวเจอร์ซีย์ที่ซึ่งคุณเป็นเจ้าของ Joey Bag O "Donuts 'Wholesale Wine Empire เป็นธุรกิจนำเข้าและส่งออกที่มีเป้าหมายในการส่งไวน์จำนวนมากจากต่างประเทศและขายให้กับร้านเหล้าที่กำหนดทั่วประเทศ ธุรกิจนี้ทำงานในลักษณะที่โจอี้เดินทางไปทั่วโลกเพื่อค้นหาข้อตกลงที่น่าทึ่งพร้อมไวน์จำนวนมากเขาส่งไปยังเจอร์ซีย์ของเขาและเป็นความกังวลของคุณที่จะแนบเอกสารที่ส่งไปยังร้านค้าและทำกำไร
คุณสามารถค้นหาผู้ซื้อได้หลายวิธีไม่ว่าจะเป็นหน้า Facebook บัญชี Twitter หรือบางครั้งก็ส่งอีเมลโดยตรง - อย่างไรก็ตามอีเมล“ ส่งเสริม” ธุรกิจเกือบทุกประเภท ปีที่แล้วคุณส่งอีเมลหนึ่งฉบับต่อเดือน โดยทั่วไปแล้วจดหมายแต่ละฉบับจะอธิบายธุรกรรมสองหรือสามรายการเช่นหนึ่งรายการกับแชมเปญและอีกฉบับหนึ่งใช้กับ malbec ข้อเสนอบางอย่างนั้นยอดเยี่ยมมาก - ส่วนลดคือ 80% ขึ้นไป ด้วยเหตุนี้คุณจึงปิดดีลประมาณ 32 รายการในหนึ่งปีและทุกอย่างราบรื่นไม่มากก็น้อย
แต่การที่ทุกอย่างเป็นไปด้วยดีไม่ได้หมายความว่าจะดีขึ้นไม่ได้ การทำความเข้าใจแรงจูงใจของลูกค้าให้ลึกซึ้งขึ้นอีกนิดจะเป็นประโยชน์ แน่นอนว่าเมื่อดูคำสั่งซื้อเฉพาะคุณจะเห็นว่าอดัมส์บางคนซื้อสปาร์กลิงไวน์ในเดือนกรกฎาคมในราคาลด 50% แต่คุณไม่สามารถระบุได้ว่าอะไรกระตุ้นให้เขาซื้อ เขาชอบปริมาณการสั่งซื้อขั้นต่ำหนึ่งกล่องหกขวดหรือราคาที่ยังไม่ขึ้นสูงสุด?
คงจะดีไม่น้อยหากคุณสามารถแบ่งรายชื่อลูกค้าของคุณออกเป็นกลุ่มความสนใจได้ จากนั้นคุณสามารถแก้ไขตัวอักษรในแต่ละกลุ่มแยกกันและอาจส่งเสริมธุรกิจมากยิ่งขึ้น ธุรกรรมใด ๆ ที่เหมาะสมกับกลุ่มนี้อาจกลายเป็นหัวข้อของจดหมายและไปที่ย่อหน้าแรกของข้อความ การส่งไปรษณีย์แบบกำหนดเป้าหมายนี้สามารถสร้างยอดขายถล่มทลาย!
เป็นไปได้ที่จะให้คอมพิวเตอร์ทำงานแทนคุณ การใช้ k-mean cluster คุณจะพบตัวเลือกการจัดกลุ่มที่ดีที่สุดแล้วพยายามทำความเข้าใจว่าเหตุใดจึงเป็นวิธีที่ดีที่สุด
ชุดข้อมูลเดิม
เอกสาร Excel ที่เราจะวิเคราะห์ในบทนี้อยู่ในเว็บไซต์สมุดงาน มีข้อมูลดิบทั้งหมดในกรณีที่คุณต้องการใช้งาน หรือคุณสามารถทำตามข้อความโดยการมองที่ส่วนที่เหลือของเอกสาร
ขั้นแรกคุณมีแหล่งข้อมูลที่น่าสนใจสองแหล่ง:
- ข้อมูลเมตาสำหรับแต่ละคำสั่งซื้อจะถูกจัดเก็บไว้ในสเปรดชีตรวมถึงความหลากหลายปริมาณการสั่งซื้อขั้นต่ำส่วนลดการขายปลีกราคาสูงสุดและประเทศต้นทาง ข้อมูลนี้อยู่ในแท็บที่เรียกว่า OfferInformation ดังแสดงในรูปที่ 4 7;
- เมื่อทราบว่าลูกค้ารายใดสั่งซื้ออะไรคุณสามารถเขย่าข้อมูลนั้นออกจาก MailChimp และป้อนสเปรดชีตข้อมูลเมตาของข้อเสนอในแท็บธุรกรรม ข้อมูลเหล่านี้เป็นข้อมูลตัวแปรที่นำเสนอดังแสดงในรูป 8 ง่ายมาก: ผู้ซื้อและคำสั่งซื้อของเขา
รูป: 7. รายละเอียดของคำสั่งซื้อล่าสุด 32 รายการ
รูป: 8. รายการปริมาณการสั่งซื้อโดยลูกค้า
กำหนดเรื่องของการวัด
และนี่คือความท้าทาย ในปัญหาการเต้นของโรงเรียนการวัดระยะห่างระหว่างศูนย์ปัจจุบันและการระบุศูนย์คลัสเตอร์ไม่ใช่เรื่องยากใช่หรือไม่? การหาตลับเมตรที่เหมาะสมก็เพียงพอแล้ว! แต่จะทำอย่างไรดีล่ะ?
คุณทราบว่าปีที่แล้วมีข้อเสนอ 32 ข้อเสนอและคุณมีรายการคำสั่งซื้อ 324 รายการในแท็บแยกต่างหากโดยแยกตามผู้ซื้อ แต่ในการวัดระยะทางจากลูกค้าแต่ละรายไปยังศูนย์คลัสเตอร์คุณต้องวางไว้ในพื้นที่การค้า 32 แห่งนี้ กล่าวอีกนัยหนึ่งคุณต้องเข้าใจว่าธุรกรรมใดที่พวกเขาทำไม่เสร็จสมบูรณ์และสร้างเมทริกซ์ของธุรกรรมโดยผู้ซื้อซึ่งลูกค้าแต่ละรายจะได้รับคอลัมน์ของตัวเองที่มีธุรกรรม 32 เซลล์ซึ่งเต็มไปด้วยรายการหากมีการทำธุรกรรมและไม่มีศูนย์
กล่าวอีกนัยหนึ่งคุณต้องใช้ตารางข้อตกลงที่เน้นแถวนี้และเปลี่ยนเป็นเมทริกซ์ที่ลูกค้าจัดเรียงในแนวตั้งและข้อเสนอจะจัดเรียงในแนวนอน วิธีที่ดีที่สุดในการสร้างตาราง Pivot
อัลกอริทึมของการดำเนินการ: บนแผ่นงานที่มีข้อมูลตัวแปรเลือกคอลัมน์ A และ B จากนั้นแทรกตาราง Pivot ใช้ตัวช่วยสร้าง PivotTable เพียงเลือกดีลเป็นส่วนหัวของแถวและผู้ซื้อเป็นส่วนหัวคอลัมน์แล้วกรอกข้อมูลในตาราง เซลล์จะมี 1 หากคู่ดีลไคลเอ็นต์มีอยู่และ 0 ถ้าไม่มี (ในกรณีนี้ 0 จะแสดงเป็นเซลล์ว่าง) ผลลัพธ์คือตารางที่แสดงในรูปที่ เก้า.
รูป: เก้า. ตาราง Pivot "ไคลเอนต์ดีล"
เมื่อคุณมีข้อมูลการสั่งซื้อในรูปแบบเมทริกซ์แล้วให้คัดลอกแผ่นข้อมูล OfferInformation และตั้งชื่อเป็นเมทริกซ์ ในแผ่นงานใหม่นี้ให้วางค่าจากตาราง Pivot (ไม่จำเป็นต้องคัดลอกและวางหมายเลขดีลเนื่องจากมีอยู่ในข้อมูลคำสั่งซื้อแล้ว) โดยเริ่มจากคอลัมน์ H ดังนั้นคุณควรมีเมทริกซ์เวอร์ชันเพิ่มเติมเสริมด้วยข้อมูลคำสั่งซื้อเช่น ในรูป สิบ.
รูป: สิบ. คำอธิบายของธุรกรรมและข้อมูลคำสั่งซื้อรวมอยู่ในเมทริกซ์เดียว
มาตรฐานข้อมูล
ในบทนี้ข้อมูลแต่ละมิติของคุณจะถูกนำเสนอในลักษณะเดียวกันในรูปแบบของข้อมูลลำดับไบนารี แต่ในหลาย ๆ สถานการณ์การรวมกลุ่มเราไม่สามารถทำได้ ลองนึกภาพสถานการณ์ที่ผู้คนรวมกลุ่มกันตามส่วนสูงน้ำหนักและเงินเดือน ข้อมูลทั้งสามประเภทมีมิติข้อมูลที่แตกต่างกัน ความสูงอาจแตกต่างกันตั้งแต่ 1.5 ถึง 2 เมตรในขณะที่น้ำหนักอยู่ระหว่าง 50 ถึง 150 กก.
ในบริบทนี้การวัดระยะห่างระหว่างลูกค้า (เช่นระหว่างนักเต้นในหอประชุม) กลายเป็นเรื่องที่สับสน ดังนั้นจึงเป็นเรื่องปกติที่จะสร้างมาตรฐานของข้อมูลแต่ละคอลัมน์โดยการลบค่าเฉลี่ยแล้วหารทีละตัวโดยการวัดการกระจายที่เรียกว่าส่วนเบี่ยงเบนมาตรฐาน ดังนั้นคอลัมน์ทั้งหมดจะลดลงเหลือค่าเดียวโดยแปรผันตามปริมาณประมาณ 0
เริ่มจากสี่กลุ่ม
ตอนนี้ข้อมูลทั้งหมดของคุณลดลงเป็นรูปแบบเดียวที่สะดวกแล้ว ในการเริ่มการทำคลัสเตอร์คุณต้องเลือก k - จำนวนคลัสเตอร์ในอัลกอริทึม k-mean มักจะใช้วิธี k-mean เช่นนี้: ใช้ชุดของ k ที่แตกต่างกันและตรวจสอบทีละชุด (ฉันจะอธิบายวิธีการเลือกในภายหลัง) แต่เราเพิ่งเริ่มต้น - ดังนั้นเราจะเลือกเพียงหนึ่งชุด
คุณจะต้องมีคลัสเตอร์จำนวนหนึ่งที่เหมาะสมกับสิ่งที่คุณต้องการทำ เห็นได้ชัดว่าคุณไม่ได้ตั้งใจที่จะสร้างคลัสเตอร์ 50 รายการและส่งอีเมลส่งเสริมการขายที่ตรงเป้าหมาย 50 ฉบับไปยังผู้ชายสองสามคนในแต่ละกลุ่ม สิ่งนี้ทำให้การออกกำลังกายของเราหมดความหมายทันที ในกรณีของเราเราต้องการสิ่งเล็ก ๆ เริ่มตัวอย่างนี้ด้วย 4 - ในโลกแห่งอุดมคติคุณอาจแบ่งรายชื่อลูกค้าของคุณออกเป็น 4 กลุ่มที่เข้าใจได้กลุ่มละ 25 คน (ซึ่งในความเป็นจริงไม่น่าเป็นไปได้)
ดังนั้นหากคุณต้องแบ่งลูกค้าออกเป็น 4 กลุ่มวิธีที่ดีที่สุดในการจับคู่ลูกค้าคืออะไร?
แทนที่จะทำให้แผ่น Matrix สวย ๆ ให้คัดลอกข้อมูลลงในแผ่นงานใหม่และตั้งชื่อเป็น 4MC ตอนนี้คุณสามารถแทรก 4 คอลัมน์หลังจากคอลัมน์ H ถึง K สูงซึ่งจะเป็นศูนย์กลางคลัสเตอร์ (หากต้องการแทรกคอลัมน์ให้คลิกขวาที่คอลัมน์ H แล้วเลือก“ วาง” คอลัมน์จะปรากฏทางด้านซ้าย) ตั้งชื่อคลัสเตอร์เหล่านี้คลัสเตอร์ 1 เป็นคลัสเตอร์ 4 นอกจากนี้คุณยังสามารถใช้การจัดรูปแบบตามเงื่อนไขได้ทุกเมื่อที่คุณตั้งค่า คุณจะเห็นว่ามันแตกต่างกันอย่างไร
Sheet 4MC จะปรากฏดังแสดงในรูป สิบเอ็ด.
รูป: สิบเอ็ด. ศูนย์คลัสเตอร์ที่ว่างเปล่าวางอยู่บนแผ่นงาน 4MC
ในกรณีนี้ศูนย์คลัสเตอร์ทั้งหมดเป็นศูนย์ แต่ในทางเทคนิคแล้วพวกเขาสามารถเป็นอะไรก็ได้และคุณจะชอบอะไรเป็นพิเศษเช่นเดียวกับการเต้นรำในโรงเรียนพวกเขาจะกระจายในลักษณะที่ช่วยลดระยะห่างระหว่างลูกค้าแต่ละรายและศูนย์คลัสเตอร์
เห็นได้ชัดว่าศูนย์เหล่านี้จะมีค่าตั้งแต่ 0 ถึง 1 สำหรับการซื้อขายแต่ละครั้งเนื่องจากเวกเตอร์ของลูกค้าทั้งหมดเป็นไบนารี
แต่การ“ วัดระยะห่างระหว่างศูนย์คลัสเตอร์กับลูกค้า” หมายความว่าอย่างไร
ระยะทางแบบยุคลิด: การวัดระยะทางนอกถนน
คุณมีคอลัมน์แยกต่างหากสำหรับลูกค้าแต่ละราย คุณจะวัดระยะห่างระหว่างพวกเขาได้อย่างไร? ในทางเรขาคณิตเรียกว่า "เส้นทางที่สั้นที่สุด" และระยะทางที่เกิดขึ้นเรียกว่าระยะทางแบบยุคลิด
กลับไปที่ห้องประชุมสักพักแล้วลองหาวิธีแก้ปัญหาที่นั่น
วางแกนพิกัดบนพื้นและในรูป 12 เราจะเห็นว่า ณ จุด (8.2) เรามีนักเต้นและที่ (4.4) - ศูนย์คลัสเตอร์ ในการคำนวณระยะห่างแบบยุคลิดระหว่างพวกเขาคุณจะต้องนึกถึงทฤษฎีบทพีทาโกรัสซึ่งคุณคุ้นเคยจากโรงเรียน
รูป: 12. นักเต้นที่จุด (8.2) และศูนย์กลางคลัสเตอร์ที่ (4.4)
จุดทั้งสองนี้ห่างกัน 8 - 4 \u003d 4 เมตรในแนวตั้งและ 4 - 2 \u003d 2 เมตรในแนวนอน ตามทฤษฎีบทพีทาโกรัสกำลังสองของระยะห่างระหว่างจุดสองจุดเท่ากับ 4L2 + 2L2 \u003d 20 เมตร จากตรงนี้เราคำนวณระยะทางเองซึ่งจะเท่ากับรากที่สองของ 20 ซึ่งมีค่าประมาณ 4.47 ม. (ดังรูปที่ 13)
รูป: สิบสาม. ระยะทางแบบยุคลิดเท่ากับรากที่สองของผลรวมของระยะทางในแต่ละทิศทาง
ในบริบทของสมาชิกจดหมายข่าวคุณมีมิติข้อมูลมากกว่าสองมิติ แต่ใช้แนวคิดเดียวกัน ระยะห่างระหว่างลูกค้าและศูนย์คลัสเตอร์คำนวณโดยการกำหนดความแตกต่างระหว่างสองจุดสำหรับการซื้อขายแต่ละครั้งยกกำลังสองบวกและหาค่ารากที่สอง ตัวอย่างเช่นในแผ่นงาน 4MC คุณต้องการทราบระยะห่างแบบยุคลิดระหว่างศูนย์กลางของคลัสเตอร์ 1 ในคอลัมน์ H และคำสั่งซื้อของ Adams ของลูกค้าในคอลัมน์ L
ในเซลล์ L34 ภายใต้คำสั่งของ Adams คุณสามารถคำนวณความแตกต่างระหว่างเวกเตอร์ Adams กับศูนย์กลางคลัสเตอร์ยกกำลังสองเพิ่มแล้วรูทโดยใช้สูตรต่อไปนี้สำหรับอาร์เรย์ (ตรวจสอบการอ้างอิงแบบสัมบูรณ์ที่อนุญาตให้คุณลากสูตรนี้ไปทางขวาหรือลงโดยไม่ต้องเปลี่ยนการอ้างอิง ไปยังศูนย์คลัสเตอร์):
(\u003d ROOT (SUM (L $ 2: L $ 33- $ H $ 2: $ H $ 33) A2)))
Array Formula (ป้อนสูตรแล้วกด Ctrl + Shift + Enter หรือ Cmd + Return บน MacOS ตามที่กล่าวไว้ในบทที่ 1) ควรใช้เนื่องจาก (L2: L33-H2: H33) ^ 2 ส่วนของมันต้อง "รู้" ที่ หันมาคำนวณความแตกต่างและยกกำลังสองทีละขั้นตอน อย่างไรก็ตามผลลัพธ์สุดท้ายคือตัวเลขเดียวในกรณีของเรา 1.732 (ดังรูปที่ 14) มันมีความหมายดังต่อไปนี้: อดัมส์ทำการค้าสามครั้ง แต่เนื่องจากศูนย์คลัสเตอร์เริ่มต้นเป็นศูนย์คำตอบจะเท่ากับรากที่สองของ 3 คือ 1.732
รูป: สิบสี่. ระยะห่างระหว่างศูนย์กลางของ 1 คลัสเตอร์และอดัมส์
ในสเปรดชีตในรูปที่ 2-14 ฉันยึดแถวบนสุด (ดูบทที่ 1) ระหว่างคอลัมน์ G และ H และตั้งชื่อแถวที่ 34 ในเซลล์ G34 ระยะทางไปยังคลัสเตอร์ 1 เพื่อดูว่าอยู่ที่ไหนขณะที่ฉันเลื่อนหน้าลง
ระยะทางและการเป็นสมาชิกคลัสเตอร์สำหรับทุกคน!
ตอนนี้คุณรู้วิธีคำนวณระยะห่างระหว่างเวกเตอร์คำสั่งและศูนย์คลัสเตอร์แล้ว
ถึงเวลาเพิ่มการคำนวณระยะทางของ Adams ไปยังส่วนที่เหลือของศูนย์คลัสเตอร์โดยลากเซลล์ L34 ลงไปที่ L37 จากนั้นเปลี่ยนการอ้างอิงศูนย์คลัสเตอร์ด้วยตนเองจากคอลัมน์ H เป็นคอลัมน์ I, J และ K ในเซลล์ด้านล่าง ผลลัพธ์ควรเป็น 4 สูตรต่อไปนี้ใน L34: L37:
(\u003d SQRT (SUM ((L $ 2: L $ 33- $ H $ 2: $ H $ 33) A2)))
(\u003d SQRT (SUM ((L $ 2: L $ 33- $ I $ 2: $ I $ 33) A2)))
(\u003d SQRT (SUM ((L $ 2: L $ 33- $ J $ 2: $ J $ 33) A2)))
(\u003d SQRT (SUM ((L $ 2: L $ 33- $ K $ 2: $ K $ 33) A2)))
(\u003d ROOT (SUM ((L $ 2: L $ 33- $ H $ 2: $ H $ 33) A2)))
(\u003d ROOT (SUM ((L $ 2: L $ 33- $ I $ 2: $ I $ 33) A2)))
(\u003d ROOT (SUM ((L $ 2: L $ 33- $ J $ 2: $ J $ 33) A2)))
(\u003d ROOT (SUM ((L $ 2: L $ 33- $ K $ 2: $ K $ 33) A2)))
เนื่องจากคุณใช้การอ้างอิงแบบสัมบูรณ์สำหรับศูนย์คลัสเตอร์ (ซึ่งเป็นความหมายของเครื่องหมาย $ ในสูตรดังที่กล่าวไว้ในบทที่ 1) คุณสามารถลาก L34: L37 ถึง DG34: DG37 เพื่อคำนวณระยะทางจากลูกค้าแต่ละรายไปยังศูนย์คลัสเตอร์ทั้งสี่ มุ่งหน้าไปยังแถวในคอลัมน์ G ในเซลล์ 35 ถึง 37“ ระยะทางไปยังคลัสเตอร์ 2” และอื่น ๆ ระยะทางที่คำนวณใหม่จะแสดงในรูปที่ สิบห้า.
รูป: สิบห้า. การคำนวณระยะทางจากลูกค้าแต่ละรายไปยังศูนย์คลัสเตอร์ทั้งหมด
ตอนนี้คุณทราบระยะทางของลูกค้าแต่ละรายไปยังคลัสเตอร์ทั้งสี่ศูนย์แล้ว การกระจายเป็นกลุ่มจะทำตามระยะทางที่สั้นที่สุดในสองขั้นตอนดังนี้
ขั้นแรกให้กลับไปที่ Adams ในคอลัมน์ L และคำนวณระยะทางต่ำสุดไปยังศูนย์คลัสเตอร์ในเซลล์ L38 มันง่ายมาก:
ต่ำสุด (L34: L37)
\u003d นาที (L34: L37)
สำหรับการคำนวณเราใช้การจับคู่สูตร / การค้นหา (เพิ่มเติมในบทที่ 1) เมื่อวางไว้ใน L39 คุณจะเห็นหมายเลขเซลล์จากช่วงเวลา L34: L37 (ฉันนับแต่ละเซลล์ตามลำดับจาก 1) ซึ่งเป็นระยะทางต่ำสุด:
จับคู่ (L38, L34: L37.0) \u003d ตำแหน่งการค้นหา (L38, L34: L37.0)
ในกรณีนี้ระยะทางจะเท่ากันสำหรับทั้งสี่คลัสเตอร์ดังนั้นสูตรจึงเลือกอันแรก (L34) และส่งกลับ 1 (รูปที่ 16)
รูป: สิบหก. การเพิ่มการเชื่อมโยงคลัสเตอร์ลงในแผ่นงาน
คุณยังสามารถลากและวางสูตรทั้งสองนี้ลงใน DG38: DG39 ได้ ในการจัดระเบียบสิ่งต่างๆให้เพิ่มชื่อของบรรทัด 38 และ 39 ในเซลล์ 38 และ 39 ในคอลัมน์ G“ ระยะทางคลัสเตอร์ขั้นต่ำ” และ“ คลัสเตอร์ที่กำหนด”
การค้นหาโซลูชันสำหรับคลัสเตอร์เซ็นเตอร์
สเปรดชีตของคุณได้รับการอัปเดตด้วยการคำนวณระยะทางและการทำคลัสเตอร์ ในการกำหนดตำแหน่งที่ดีที่สุดของศูนย์คลัสเตอร์คุณต้องหาค่าเหล่านั้นในคอลัมน์จาก H ถึง K ที่ลดระยะห่างทั้งหมดระหว่างลูกค้าและศูนย์คลัสเตอร์ที่พวกเขาเชื่อมโยงซึ่งระบุไว้ในแถว 39 สำหรับลูกค้าแต่ละราย
เมื่อคุณได้ยินคำว่า "ย่อเล็กสุด": ขั้นตอนการเพิ่มประสิทธิภาพจะเริ่มขึ้นและการเพิ่มประสิทธิภาพจะดำเนินการโดยใช้ "ค้นหาโซลูชัน"
ในการใช้ Solution Finder คุณต้องมีเซลล์ผลลัพธ์ดังนั้นใน A36 เราจึงสรุประยะทางทั้งหมดระหว่างลูกค้าและศูนย์คลัสเตอร์:
SUM (L38: DG38)
\u003d คัมม่า (L3 8: DG3 8)
ผลรวมของระยะทางจากไคลเอนต์ไปยังศูนย์คลัสเตอร์ที่ใกล้ที่สุดนี้เป็นฟังก์ชันวัตถุประสงค์ที่เราพบก่อนหน้านี้ในระหว่างการรวมกลุ่มของห้องประชุมของ Macacne High School แต่ระยะทางแบบยุคลิดที่มีอำนาจและรากที่สองเป็นฟังก์ชันที่ไม่เป็นเชิงเส้นอย่างมหันต์ดังนั้นคุณต้องใช้วิธีการแก้ปัญหาแบบวิวัฒนาการแทนวิธีซิมเพล็กซ์
คุณได้ใช้วิธีนี้แล้วในบทที่ 1 อัลกอริทึมซิมเพล็กซ์หากสามารถใช้งานได้จะทำงานได้เร็วกว่าขั้นตอนอื่น ๆ แต่ไม่สามารถใช้คำนวณรากกำลังสองและฟังก์ชันอื่น ๆ ที่ไม่ใช่เชิงเส้น ในทำนองเดียวกัน OpenSolver ก็ไม่มีประโยชน์ซึ่งใช้อัลกอริทึมแบบง่ายแม้ว่าดูเหมือนว่าจะใช้สเตียรอยด์ก็ตาม
ในกรณีของเราอัลกอริธึมวิวัฒนาการที่สร้างขึ้นใน Search for a Solution ใช้การผสมผสานระหว่างการค้นหาแบบสุ่มและโซลูชันครอสโอเวอร์ที่ยอดเยี่ยมเพื่อค้นหาโซลูชันที่มีประสิทธิภาพเช่นวิวัฒนาการในบริบททางชีววิทยา
คุณมีทุกสิ่งที่จำเป็นในการตั้งปัญหาก่อน "ค้นหาวิธีแก้ปัญหา":
- เป้าหมาย: เพื่อลดระยะทางโดยรวมจากผู้ซื้อไปยังศูนย์คลัสเตอร์ (A36)
- ตัวแปร: เวกเตอร์ของแต่ละธุรกรรมที่สัมพันธ์กับศูนย์คลัสเตอร์ (Н2: К33);
- เงื่อนไข: ศูนย์คลัสเตอร์ต้องมีค่าระหว่าง 0 ถึง 1
ขอแนะนำให้มี "ค้นหาวิธีแก้ปัญหา" และค้อน เราตั้งปัญหา "ค้นหาวิธีแก้ปัญหา": เพื่อย่อ A36 ให้น้อยที่สุดโดยการเปลี่ยนค่าของ H2: K33 ด้วยเงื่อนไข H2: K33<=1, как и все векторы сделок. Убедитесь, что переменные отмечены как положительные и выбран эволюционный алгоритм (рис. 17).
รูป: 17. การตั้งค่าตัวค้นหาโซลูชันสำหรับการทำคลัสเตอร์ 4 ศูนย์
แต่คำชี้แจงปัญหาไม่ใช่ทุกอย่าง คุณจะต้องเหงื่อออกเล็กน้อยเลือกตัวเลือกที่จำเป็นสำหรับอัลกอริทึมวิวัฒนาการคลิกปุ่ม "ตัวเลือก" ในหน้าต่าง "ค้นหาโซลูชัน" และไปที่หน้าต่างการตั้งค่า ฉันแนะนำให้คุณตั้งเวลาสูงสุดเป็นเวลา 30 วินาทีขึ้นอยู่กับว่าคุณยินดีรอนานแค่ไหนสำหรับ "ค้นหาวิธีแก้ปัญหา" เพื่อรับมือกับงาน ในรูป ในวันที่ 18 ฉันใช้เวลา 600 วินาที (10 นาที) ด้วยวิธีนี้ฉันสามารถเรียกใช้ Solver และไปทานอาหารกลางวันได้ และหากคุณต้องการขัดจังหวะเขา แต่เนิ่นๆเพียงแค่กด Escape แล้วออกด้วยวิธีแก้ปัญหาที่ดีที่สุด
รูป: สิบแปด. พารามิเตอร์อัลกอริทึมวิวัฒนาการ
คลิก "เรียกใช้" และดู Excel ทำสิ่งนั้นจนกระทั่งอัลกอริทึมวิวัฒนาการมาบรรจบกัน
ความหมายของผลลัพธ์
เมื่อการแก้ปัญหาพบว่าคุณเป็นศูนย์กลางคลัสเตอร์ที่ดีที่สุดความสนุกก็จะเริ่มขึ้น ไปเรียนกลุ่มกันเถอะ! ในรูป 19 เราจะเห็นว่า Solver พบระยะทางรวมที่เหมาะสมที่ 140.7 และคลัสเตอร์ทั้งสี่ศูนย์ด้วยการจัดรูปแบบตามเงื่อนไข! - ดูแตกต่างไปจากเดิมอย่างสิ้นเชิง
รูป: 19. สี่ศูนย์คลัสเตอร์ที่เหมาะสมที่สุด
โปรดทราบว่าศูนย์คลัสเตอร์ของคุณอาจแตกต่างจากที่นำเสนอในหนังสือเนื่องจากอัลกอริทึมวิวัฒนาการใช้ตัวเลขสุ่มและคำตอบจะแตกต่างกันในแต่ละครั้ง คลัสเตอร์อาจแตกต่างกันโดยสิ้นเชิงหรือมีแนวโน้มที่จะอยู่ในลำดับที่แตกต่างกัน (เช่นคลัสเตอร์ 1 ของฉันอาจใกล้เคียงกับคลัสเตอร์ 4 ของคุณมากเป็นต้น)
เนื่องจากเมื่อคุณสร้างแผ่นงานที่คุณใส่คำอธิบายของธุรกรรมลงในคอลัมน์จาก B ถึง G ตอนนี้คุณสามารถอ่านรายละเอียดในรูปที่ 19 ซึ่งเป็นสิ่งสำคัญสำหรับการทำความเข้าใจแนวคิดของศูนย์คลัสเตอร์
สำหรับคลัสเตอร์ 1 ในคอลัมน์ H การจัดรูปแบบตามเงื่อนไขจะเลือกการซื้อขาย 24, 26, 17 และในระดับที่น้อยกว่า 2 หลังจากอ่านคำอธิบายของการซื้อขายเหล่านี้คุณจะเข้าใจสิ่งที่พวกเขามีเหมือนกัน: ทั้งหมดนี้สรุปได้ใน Pinot Noir
เมื่อดูที่คอลัมน์ I คุณจะเห็นว่าเซลล์สีเขียวทั้งหมดมีค่าต่ำสุดต่ำ เหล่านี้คือผู้ซื้อที่ไม่ต้องการซื้อจำนวนมากในระหว่างการทำธุรกรรม
แต่อีกสองศูนย์คลัสเตอร์ตรงไปตรงมายากที่จะตีความ แทนที่จะตีความคลัสเตอร์เซ็นเตอร์ลองศึกษาผู้ซื้อในคลัสเตอร์และพิจารณาว่าพวกเขาชอบข้อตกลงใดบ้าง สิ่งนี้สามารถชี้แจงปัญหาได้
การจัดอันดับข้อตกลงแบบคลัสเตอร์
แทนที่จะหาว่าระยะทางใดที่ศูนย์คลัสเตอร์อยู่ใกล้ 1 มากขึ้นให้ตรวจสอบว่าใครเชื่อมโยงกับคลัสเตอร์ใดและข้อตกลงใดที่พวกเขาต้องการ
โดยเริ่มจากการคัดลอกแผ่นข้อมูล OfferInformation ลองตั้งชื่อสำเนา 4MC - TopDealsByCluster คอลัมน์ตัวเลข H ถึง K บนแผ่นงานใหม่นี้ตั้งแต่ 1 ถึง 4 (ดังรูปที่ 20)
รูป: 20. สร้างแผ่นตารางสำหรับคำนวณความนิยมของดีลโดยใช้คลัสเตอร์
ในแผ่นงาน 4MC คุณมีการเชื่อมคลัสเตอร์ตั้งแต่ 1 ถึง 4 ในบรรทัด 39 สิ่งที่คุณต้องทำเพื่อนับธุรกรรมตามคลัสเตอร์คือดูชื่อคอลัมน์จาก H ถึง K บนชีต 4MC - TopDealsByCluster ดูว่ารายการใด แผ่นงาน 4MC เชื่อมโยงกับคลัสเตอร์นี้ในบรรทัด 39 จากนั้นเพิ่มจำนวนธุรกรรมในแต่ละบรรทัด ดังนั้นเราจะได้รับจำนวนผู้ซื้อทั้งหมดในคลัสเตอร์นี้ที่ทำข้อตกลง
เริ่มจากเซลล์ H2 ซึ่งมีจำนวนผู้ซื้อในคลัสเตอร์ 1 ที่ยอมรับข้อเสนอ # 1 คือ malbec เดือนมกราคม จำเป็นต้องเพิ่มค่าของเซลล์ของช่วง L2: DG2 บนแผ่นงาน 4MC แต่มีเพียงลูกค้าจาก 1 คลัสเตอร์ซึ่งเป็นตัวอย่างคลาสสิกของการใช้สูตร sumif / summes ดูเหมือนว่า:
SUMIF ("4MC"! $ L $ 39: $ DG $ 39, "4MC - TopDealsByCluster"! H $ 1, "4MC"! $ L2: $ DG2)
\u003d CyMMEOra ("4MC"! $ L $ 39: $ DG $ 39, "4MC - TopDealsByCluster"! H $ 1, "4MC"! $ L2: $ DG2)
สูตรนี้ใช้งานได้ดังนี้: คุณใส่เงื่อนไขบางอย่างซึ่งจะตรวจสอบในส่วนแรกของ "4MC"! $ L $ 39: $ DG $ 39, "4MC จากนั้นเปรียบเทียบกับ 1 ในส่วนหัวคอลัมน์ (" 4MC - TopDealsByCluster "! H $ 1 ) จากนั้นในการจับคู่แต่ละครั้งจะเพิ่มค่านั้นลงในแถวที่ 2 ในส่วนที่สามของสูตร "4MC"! $ L2: $ DG2
สังเกตว่าคุณใช้การอ้างอิงแบบสัมบูรณ์ ($ ในสูตร) \u200b\u200bก่อนทุกอย่างที่เกี่ยวข้องกับการผูกคลัสเตอร์หมายเลขแถวในส่วนหัวของคอลัมน์และตัวอักษรคอลัมน์สำหรับการซื้อขาย เมื่อทำให้ลิงก์เหล่านี้สมบูรณ์แล้วคุณสามารถลากสูตรไปที่ใดก็ได้จาก H2: K33 เพื่อคำนวณจำนวนดีลสำหรับศูนย์คลัสเตอร์อื่น ๆ และการรวมกันของดีลดังในรูป 21. เพื่อให้คอลัมน์เหล่านี้อ่านง่ายขึ้นคุณสามารถใช้การจัดรูปแบบตามเงื่อนไขกับคอลัมน์เหล่านี้ได้
รูป: 21. จำนวนธุรกรรมทั้งหมดสำหรับแต่ละข้อเสนอแยกย่อยตามคลัสเตอร์
ด้วยการไฮไลต์คอลัมน์ A ถึง K และใช้การกรองอัตโนมัติคุณสามารถจัดเรียงข้อมูลนั้นได้ โดยการจัดเรียงคอลัมน์ H จากน้อยที่สุดไปหามากที่สุดคุณจะเห็นว่าการซื้อขายใดได้รับความนิยมมากที่สุดในคลัสเตอร์ 1 (รูปที่ 22)
รูป: 22. จัดเรียงคลัสเตอร์ 1. Pinot, Pinot, Pinot!
ดังที่ฉันได้กล่าวไว้ก่อนหน้าการซื้อขายที่ใหญ่ที่สุดสี่รายการสำหรับคลัสเตอร์นี้คือ Pinos พวกนี้เหยียดหยามหนังไซด์เวย์ชัด ๆ หากคุณแยกคลัสเตอร์ 2 ออกไปจะเห็นได้ชัดว่ากลุ่มนี้เป็นผู้ค้าส่งรายย่อย (รูปที่ 23)
แต่เมื่อคุณจัดเรียงคลัสเตอร์ 3 ก็ไม่ง่ายที่จะเข้าใจ ข้อตกลงขนาดใหญ่สามารถนับได้ในมือเดียวและความแตกต่างระหว่างข้อตกลงกับส่วนที่เหลือไม่ชัดเจนนัก อย่างไรก็ตามข้อตกลงที่ได้รับความนิยมมากที่สุดมีบางอย่างที่เหมือนกัน - ส่วนลดที่ค่อนข้างดี 5 ข้อเสนอที่ใหญ่ที่สุด 5 รายการจากสปาร์กลิงไวน์และฝรั่งเศสเป็นผู้ผลิตผลิตภัณฑ์สำหรับ 3 ใน 4 อย่างไรก็ตามสมมติฐานเหล่านี้มีความขัดแย้ง
สำหรับคลัสเตอร์ 4 คนเหล่านี้ชอบข้อเสนอพิเศษสำหรับแชมเปญในเดือนสิงหาคมด้วยเหตุผลบางประการ นอกจากนี้ 5 จาก 6 ข้อตกลงที่ใหญ่ที่สุดสำหรับไวน์ฝรั่งเศสและ 9 ใน 10 ข้อตกลงที่ใหญ่ที่สุดสำหรับปริมาณมาก อาจจะเป็นคลัสเตอร์ค้าส่งขนาดใหญ่ที่ขายไวน์ฝรั่งเศส? จุดตัดของคลัสเตอร์ 3 และ 4 ก็น่าหนักใจเช่นกัน
นอกจากนี้เรายังพิจารณาการแบ่งกลุ่มนักเรียนตามคุณสมบัติอัตนัย (ดูหัวข้อ 14.1) และผลประโยชน์ (ดูหัวข้อ 14.4) ที่ได้รับการศึกษาระดับสูงในการศึกษาเต็มเวลา สำหรับการแบ่งกลุ่มจะใช้เทคนิคตามการวิเคราะห์คลัสเตอร์โดยใช้มาตราส่วนหลายมิติเพื่อการวิเคราะห์เพิ่มเติมที่สมบูรณ์ยิ่งขึ้น
ตัวแปรการแบ่งกลุ่ม - คุณสมบัติและประโยชน์ - ควรให้คะแนนในเชิงปริมาณ เมื่อแก้ปัญหาเฉพาะเจาะจงใช้พารามิเตอร์เก้าตัว สำหรับการประยุกต์ใช้มาตราส่วน Likert สำหรับแต่ละพารามิเตอร์จะมีการกำหนดคำสั่งที่เกี่ยวข้อง
- 1. นี่เป็นวิธีที่ดีที่สุดในการได้รับความรู้เชิงลึก
- 2. นี่เป็นโอกาสสำหรับการสื่อสารและการหาเพื่อนที่เต็มเปี่ยม
- 3. นี่เป็นโอกาสอันมีค่าในการสื่อสารกับครู
- 4. นี่เป็นขั้นตอนสำคัญในการเริ่มต้นอาชีพ
- 5. การเป็นนักเรียนเป็นช่วงเวลาที่ยอดเยี่ยมในชีวิต
- 6. ค่าวัสดุของการฝึกอบรมในแต่ละวันสูง
- 7. เวลาที่ใช้ในการฝึกกลางวันมีมาก
- 8. พัฒนาการคิดในลักษณะพิเศษ
- 9. การศึกษาในเวลากลางวันมีเกียรติ
ชุดของพารามิเตอร์ที่สามารถใช้ได้กว้างขึ้นมาก นักเรียนในแบบสอบถามมักระบุข้อดีหรือข้อเสียของการศึกษาในเวลากลางวันที่มหาวิทยาลัยดังต่อไปนี้: ความเป็นไปได้ในการขยายขอบเขตอันไกลโพ้นความเป็นไปได้ในการเลื่อนออกไปโอกาสในการเรียนรู้วินัยในตนเองและการจัดการตนเองความยากลำบากในการเรียนและการทำงานในช่วงเวลาสำคัญในชีวิตการขาดการฝึกฝนความสามารถในการรับข้อมูลจำนวนมากอิทธิพล เพื่อความก้าวหน้าในการทำงานต่อไปการเกิดขึ้นในอนาคตของโอกาสในการตัดสินใจเลือกอาชีพที่ถูกต้องการมีส่วนร่วมในชีวิตของมหาวิทยาลัย
การเก็บรวบรวมข้อมูล
การเก็บรวบรวมข้อมูลดำเนินการโดยวิธีการตอบแบบสอบถาม คำถามถูกกำหนดโดยใช้มาตราส่วน Likert (ดูส่วนย่อย 8.3) ตัวอย่างเช่นนักเรียนถูกถามเกี่ยวกับระดับความเห็นด้วย - ไม่เห็นด้วยกับข้อความในระดับห้าการไล่ระดับ ในวรรณคดีมีการใช้มาตราส่วน 7 จุด แต่บ่อยครั้งที่ผู้ตอบพบว่ายากที่จะให้คำตอบด้วยการไล่ระดับสีจำนวนมาก
ส่วนของแบบสอบถามมีรูปแบบที่แสดงในรูปที่ 24.2.
รูป: 24.2.
ผู้ตอบจำเป็นต้องทำเครื่องหมายในช่องเท่านั้นและแบบสอบถามจะดำเนินการในรูปแบบดิจิทัล มีการใช้มาตราส่วนห้าจุดที่มีระดับตั้งแต่ 1 ถึง 5 (1 - ไม่เห็นด้วยอย่างยิ่ง, ... , 5 - เห็นด้วยอย่างยิ่ง) ผู้ตอบ 19 คนตอบแบบสอบถาม - นักเรียนทุกคนในกลุ่มเดียวกันซึ่งแน่นอนว่าไม่เพียงพอ
24.7. การแบ่งกลุ่มตามคุณสมบัติของตัวอย่างผลิตภัณฑ์ทางการศึกษา 381
การคำนวณโดยวิธีการวิเคราะห์คลัสเตอร์
การวิเคราะห์คลัสเตอร์ (ดูหัวข้อ 23.7) ใช้กันอย่างแพร่หลายในการแบ่งกลุ่มตามคุณสมบัติของผลิตภัณฑ์ (ดูหัวข้อ 24.3) บางครั้งเรียกว่าการแบ่งส่วนการวิเคราะห์คลัสเตอร์ ลำดับชั้น จากคะแนนที่ได้รับระยะห่างระหว่างคะแนนของนักเรียนแต่ละคนจะคำนวณกับแต่ละคน ขึ้นอยู่กับชุดซอฟต์แวร์ทางสถิติ Statistica ขั้นแรกให้รวบรวมเมทริกซ์ของระยะทางแบบยุคลิด (ระยะทางแบบยุคลิด) สำหรับการก่อตัวของคลัสเตอร์ขั้นตอนการรวมกลุ่ม (agglomerative) ถูกนำไปใช้ตามวิธีการไกลบ้าน (การเชื่อมโยงที่สมบูรณ์) ผลลัพธ์จะถูกนำเสนอตามแผนภาพในรูปที่ 24.3.
รูป: 24.3. Dendrogram (พีพีพี Statistica)
แกนตั้งคือระยะทางเชื่อมระหว่างคลัสเตอร์ บนแกนแนวนอนนักเรียนจะแสดงด้วยตัวเลขตั้งแต่ C_1 ถึง C19 ดังต่อไปนี้จาก dendrogram มี 19 คลัสเตอร์ในขั้นตอนแรก ขั้นตอนแรกและขั้นที่สองรวมคะแนน 3 กับ 5 และ 9 กับ 11 ในขั้นตอนที่สามคะแนน 8 และ 13 จะรวมกันจากนั้นกระบวนการรวมจะดำเนินต่อไป
เมื่อเลือกขั้นตอนสุดท้ายและตามจำนวนคลัสเตอร์เราใช้แผนการรวมตัวกัน (รูปที่ 24.4) ขั้นตอนนี้ถือเป็นเวอร์ชันสุดท้ายหลังจากนั้นระยะห่างระหว่างคลัสเตอร์ที่ถูกรวมเข้าด้วยกัน (Linkage Distance) จะเพิ่มขึ้นอย่างรวดเร็ว
รูป: 24.4.
ให้เราเลือกผลลัพธ์ของพาร์ติชันตามคำแนะนำจาก Sec 23.7. ดังต่อไปนี้จากแผนการรวมตัวกันการเพิ่มขึ้นอย่างรวดเร็วของระยะห่างระหว่างกลุ่มที่เข้าร่วมจะเกิดขึ้นที่ขั้นตอนที่ 13 และ 17 (ขั้นตอนในรูปที่ 24.4) ดังนั้นจึงต้องเลือกระหว่างขั้นตอนที่ 12 ถึง 16 สำหรับทางเลือกที่ชัดเจนของขั้นตอนสุดท้ายตามคำแนะนำเดียวกันจาก Sec. 23.7 ลองเปลี่ยนเป็นมาตราส่วนหลายมิติ
ผลการแบ่งกลุ่มโดยใช้วิธีมาตราส่วนหลายมิติ
นอกจากนี้ในการเลือกเวอร์ชันสุดท้ายของการจำแนกภาพของตำแหน่งสัมพัทธ์ของจุดจะถูกพิจารณาโดยวิธีการปรับขนาดหลายมิติในรูปที่ 24.5 ซึ่งได้มาจากการทำงานกับ RFP Statistica แกนมีสองมิติ - มิติ 1 และมิติ 2
คลัสเตอร์มีรูปร่างนูนเฉพาะในขั้นตอนที่ 16 ของการวิเคราะห์คลัสเตอร์ซึ่งจะเห็นได้จากผลของการวาดขอบเขตระหว่างกลุ่มตามการปรับขนาดหลายมิติ ผลลัพธ์เหล่านี้ถือเป็นที่สิ้นสุด เกิดกลุ่มขึ้นสามกลุ่มและในความเป็นจริง - กลุ่ม คลัสเตอร์แรกประกอบด้วยเก้าคะแนนสามที่สองและเจ็ดที่สาม
รูป: 24.5.
ลักษณะกลุ่ม
กลุ่มสามารถกำหนดได้ด้วยค่าเฉลี่ยสำหรับแต่ละตัวแปรและผลการแบ่งกลุ่มสามารถนำเสนอในรูปแบบกราฟิกในรูปแบบของโปรไฟล์โดยใช้ค่าเฉลี่ยสำหรับตัวแปรแต่ละตัว (รูปที่ 24.6)
สำหรับคำอธิบายสั้น ๆ ที่มีความหมายของกลุ่มจะได้รับชื่อคำขวัญ ลักษณะทั้งหมดของคลัสเตอร์ตามมาจากโปรไฟล์ ชื่อกลุ่มสามารถขึ้นอยู่กับตัวแปรที่ได้รับคะแนนสูงสุดและต่ำสุดดังที่เห็นได้จากการตรวจสอบโปรไฟล์ การเปรียบเทียบโปรไฟล์ช่วยให้คุณระบุคุณลักษณะของแต่ละส่วน "ตำแหน่ง" เทียบกับพื้นหลังของส่วนอื่น ๆ
มากำหนดชื่อของแต่ละส่วนผลลัพธ์และให้คำขวัญ ส่วนแรก - นักคิดเชิงบวก: "ต้นทุนไม่ใช่สิ่งสำคัญ" ประการที่สอง - คนรักชีวิต. “ คิดถึงปัจจุบันนะเรา
รูป: 24.6.
ที่นี่ไม่ใช่เพื่อศักดิ์ศรีและอาชีพ "อันที่สาม - เด็ดเดี่ยว: "ศักดิ์ศรีจ่ายออก" เทคโนโลยีต่อไปนี้ถูกใช้เพื่อรับชื่อเซ็กเมนต์
ตามรูปที่. 24.6:
- สำหรับ คลัสเตอร์แรก โดดเด่นด้วยคะแนนสูงสำหรับสัญญาณ (4) "นักเรียน - ช่วงเวลาที่ยอดเยี่ยมในชีวิต" และ (8) "พัฒนาความคิดในลักษณะพิเศษ" ในขณะเดียวกันข้อความ (6)“ ต้นทุนวัสดุสูง” และ (7)“ ต้นทุนด้านเวลาสูง” ได้รับคะแนนต่ำ
- คลัสเตอร์ที่สอง - คะแนนสูงสำหรับข้อความ (1) "ความสามารถในการสื่อสารและสร้างเพื่อนอย่างเต็มที่" และ (4) "นักเรียน - ช่วงเวลาที่ยอดเยี่ยมในชีวิต" ได้รับคะแนนต่ำสำหรับข้อความ (3) "ก้าวสำคัญในอาชีพการงาน" และ (9) "วันการศึกษามีเกียรติ";
- คลัสเตอร์ที่สาม - คะแนนสูงสำหรับข้อความ (6) "ต้นทุนวัสดุสูง" และ (9) "การศึกษาในเวลากลางวันมีชื่อเสียง" ในขณะที่ค่อนข้างต่ำสำหรับ (4) "นักเรียนเป็นช่วงเวลาที่ยอดเยี่ยมในชีวิต"
- ประโยชน์ที่นี่เข้าใจได้อย่างสะดวกว่าเป็นแรงจูงใจในการได้รับการศึกษาดังกล่าว
- PPP เป็นชุดโปรแกรมประยุกต์
- ทฤษฎีของวิธีการถูกนำเสนอในวินาที 23.6.
- สำหรับมุมมองโปรไฟล์ที่คุ้นเคยมากขึ้นจะต้องหมุนตามเข็มนาฬิกา 90 °
10 มีนาคม 2558
การออกผลิตภัณฑ์ไปยังตลาดใด ๆ - ผู้บริโภคอุตสาหกรรม - ผู้ผลิตต้องเข้าใจว่าไม่สามารถให้บริการลูกค้าได้ทั้งหมดแม้ว่าจะมีกำลังการผลิตที่เพียงพอก็ตาม ท้ายที่สุดผู้ซื้อใช้ผลิตภัณฑ์นี้ในรูปแบบต่างๆกันและที่สำคัญที่สุดคือพวกเขาซื้อโดยได้รับคำแนะนำจากแรงจูงใจที่แตกต่างกัน ดังนั้นสิ่งปกติคือการแยกกลุ่มผู้ซื้อ (การแบ่งกลุ่ม) ตามแรงจูงใจและลักษณะอื่น ๆ จากนั้นจึงเสนอสินค้าที่ผลิตโดยคำนึงถึงลักษณะเหล่านี้สูงสุดเท่านั้น แนวทางที่ดีที่สุดในการวางแผนกิจกรรมทางการตลาดจากมุมมองของการตอบสนองความต้องการของผู้บริโภคโดยไม่เกินจริงถือได้ว่าเป็นการปรับผลิตภัณฑ์และบริการให้เข้ากับความต้องการของผู้บริโภคแต่ละราย
จนถึงปี 1960 ตามทฤษฎีและการปฏิบัติของธุรกิจการวางแนวไปสู่ตลาดมวลรวมที่มีชัย เนื่องจากการมุ่งเน้นไปที่ตลาดทั่วไปที่ไม่ได้จัดสรร บริษัท ผู้ผลิตสามารถผลิตสินค้าจำนวนมากและได้รับผลกระทบจากการประหยัดจากขนาด แต่ตั้งแต่ยุค 60 แนวโน้มที่จะต้องแยกแยะความแตกต่างของความต้องการของผู้บริโภคซึ่งสะท้อนให้เห็นในการแบ่งส่วนตลาดการขายเริ่มได้รับความแข็งแกร่ง
ในสภาวะสมัยใหม่ของการแข่งขันที่เพิ่มขึ้นในตลาดการขายปัญหาของความจำเป็นในการเพิ่มขีดความสามารถในการแข่งขันของผลิตภัณฑ์อุตสาหกรรมในประเทศในตลาดในประเทศและต่างประเทศกำลังเป็นเรื่องเร่งด่วนมากขึ้น ในเงื่อนไขเหล่านี้ประเด็นสำคัญคือการค้นหาเงินสำรองเพื่อลดต้นทุนซึ่งเป็นพื้นฐานทางเศรษฐกิจของราคาและกำไร เป็นผลให้ผู้ประกอบการอุตสาหกรรมจำนวนมากดำเนินกลยุทธ์ต้นทุนต่ำโดยมุ่งเน้นไปที่วิธีการต่างๆในการดำเนินการ: การปฏิเสธจากบริการที่เกี่ยวข้องที่มีราคาแพง ประหยัดค่าใช้จ่ายเนื่องจากการสร้างรูปแบบผลิตภัณฑ์ที่ถูกกว่าสำหรับการผลิตและอื่น ๆ แต่ต้นทุนทางตรงส่วนใหญ่กำหนดโดยเทคโนโลยีการผลิตระดับการใช้ประโยชน์ขององค์กรการผลิตและโอกาสในการลดต้นทุนการจัดการบนพื้นฐานของการปรับปรุงประสิทธิภาพของการจัดการพื้นที่การทำงานของกิจกรรมขององค์กรยังคงใช้ไม่เพียงพอ
เครื่องมือที่ทันสมัยอย่างหนึ่งคือการลดต้นทุนการจัดการและปรับปรุงคุณภาพการจัดการซึ่งสามารถตีความได้ว่าเป็นความแม่นยำของการคาดการณ์ผลกำไรความสามารถในการทำกำไรของแต่ละคลัสเตอร์ (กลุ่มวิสาหกิจอุตสาหกรรมที่มีกิจกรรมทางเศรษฐกิจประเภทเดียวกัน) เมื่อเทียบกับสถานการณ์เริ่มต้นหรือความแม่นยำของการคาดการณ์ความสามารถในการทำกำไรของพื้นที่การทำงานของกิจกรรมเหล่านี้ วิสาหกิจคือการวิเคราะห์คลัสเตอร์
คุณค่าของการแบ่งกลุ่มเป็นชุดเครื่องมือที่มีประสิทธิภาพสำหรับกิจกรรมทางการตลาดอธิบายได้จากคุณสมบัติต่อไปนี้:
ü
การแบ่งกลุ่มเป็นวิธีการแข่งขันที่มีประสิทธิภาพสูงเนื่องจากมุ่งเน้นไปที่การระบุและตอบสนองความต้องการเฉพาะของผู้บริโภค
ü
หรือนำกิจกรรมของ บริษัท ไปสู่ตลาดเฉพาะกลุ่มโดยเฉพาะอย่างยิ่งสำหรับ บริษัท ที่เริ่มกิจกรรมทางการตลาด
ü
การแบ่งส่วนตลาดช่วยกำหนดทิศทางการตลาดของ บริษัท ได้ดีขึ้น
ü
ด้วยความช่วยเหลือของการแบ่งกลุ่มทำให้สามารถกำหนดเป้าหมายทางการตลาดที่เป็นจริงได้
ü
การแบ่งส่วนตลาดที่ประสบความสำเร็จส่งผลต่อประสิทธิผลของการตลาดโดยรวมตั้งแต่การวิจัยตลาดและผู้บริโภคไปจนถึงการสร้างระบบการขายและการส่งเสริมการขายที่เหมาะสม
ในทฤษฎีการตลาดเกิดแนวคิด ส TP - การตลาด ... มันถูกสร้างขึ้นจากตัวย่อของตัวอักษรตัวแรกของคำภาษาอังกฤษการแบ่งกลุ่ม (การแบ่งส่วน),การกำหนดเป้าหมาย (การเลือกตลาดเป้าหมาย) และการวางตำแหน่ง (การวางตำแหน่ง). ส TP - การตลาด เป็นหัวใจสำคัญของการตลาดเชิงกลยุทธ์สมัยใหม่
การแบ่งส่วนตลาด คือการแบ่งผู้บริโภคออกเป็นกลุ่มต่างๆตามความแตกต่างของความต้องการลักษณะหรือพฤติกรรมและการพัฒนาสำหรับแต่ละกลุ่มของส่วนประสมทางการตลาดที่แยกจากกัน
ส่วนตลาด ประกอบด้วยผู้บริโภคที่ตอบสนองในทางเดียวกันกับสิ่งจูงใจทางการตลาดชุดเดียวกัน
1.
การแบ่งส่วนตลาด - ขั้นตอนของการระบุกลุ่มผู้บริโภคแต่ละกลุ่มภายในตลาดทั่วไป
2.
การเลือกตลาดเป้าหมาย - กลุ่มเป้าหมายจะถูกเลือกจากกลุ่มตลาดที่เลือกนั่นคือกลุ่มที่ บริษัท ควรเน้นกิจกรรมของตน
3.
การวางตำแหน่ง - คำจำกัดความของผลิตภัณฑ์ของ บริษัท ในผลิตภัณฑ์อะนาล็อก
เป้าหมายสูงสุดของการแบ่งกลุ่มตลาดเป้าหมายคือการเลือกกลุ่ม (หรือกลุ่ม) ของผู้บริโภคเพื่อตอบสนองความต้องการที่จะมุ่งเน้นกิจกรรมของ บริษัท
นักการตลาดเชื่อว่าการเลือกส่วนตลาดที่ถูกต้องเป็นครึ่งหนึ่งของความสำเร็จทางการค้าและพวกเขามักจะระลึกถึงการปรับเปลี่ยนที่มีชื่อเสียง กฎหมายพาเรโต (กฎหมาย 80:20).
การแบ่งส่วนตลาดเป็นขั้นตอนที่เป็นทางการบนพื้นฐานของการประยุกต์ใช้วิธีการทางสถิติของการวิเคราะห์หลายตัวแปรกับผลการวิจัย สามารถใช้สี่วิธีหลักเพื่อรับกลุ่มตลาด:
1 วิธีดั้งเดิม:
ปุโรหิต (นักบวช);
ตามคลัสเตอร์
2 วิธีการใหม่:
การแบ่งส่วนที่ยืดหยุ่น (ยืดหยุ่น);
การแบ่งส่วนส่วนประกอบ
วิธีการเบื้องต้นในการแบ่งส่วนตลาดผู้บริโภคใช้เมื่อสามารถตั้งสมมติฐานของการแบ่งส่วนตลาดได้ ในการทำเช่นนี้จำเป็นต้องเข้าใจความต้องการความต้องการความปรารถนาของผู้บริโภค คุณลักษณะของผู้บริโภคเช่นความเข้มข้นในการบริโภคความต้องการองค์ประกอบหลักของแรงจูงใจและค่านิยมจะทำหน้าที่เป็นตัวแปรอิสระในขณะที่ตัวแปรการแบ่งกลุ่ม (อายุเพศภูมิภาค ฯลฯ ) จะถูกใช้เป็นตัวแปรตาม
การใช้วิธีนี้ผู้วิจัยตั้งสมมติฐานของการแบ่งส่วนตลาดในขั้นต้นจากนั้นในระหว่างการทดสอบการวิจัยการตลาด
วิธีการแบ่งส่วนตลาดเบื้องต้นประกอบด้วยเจ็ดขั้นตอน:
1 ทางเลือกของพื้นฐานของการแบ่งส่วน การวิเคราะห์ความต้องการความต้องการและปัจจัยอื่น ๆ ที่มีอิทธิพลต่อการเลือกของผู้บริโภค
2 การเลือกตัวแปรการแบ่งส่วนและการพัฒนาตารางการแบ่งส่วนตลาด (สมมติฐาน) มีการเลือกและเหตุผลของเกณฑ์ตัวแปรในการแบ่งกลุ่มตลาดผู้บริโภคการค้นหาความสัมพันธ์ที่น่าจะเป็นไปได้ระหว่างพื้นฐานและตัวแปรความขัดแย้งในตารางการแบ่งส่วนตลาดจะถูกตัดออก
3 การสุ่มตัวอย่าง
4 กำลังดำเนินการทำแบบสอบถามรวบรวมข้อมูลเชิงปริมาณ
5 กลุ่มถูกสร้างขึ้นจากรายละเอียดของผู้ตอบแบบสอบถามจากจำนวนผู้มีโอกาสเป็นผู้ซื้อตามหมวดหมู่
6 การสร้างส่วนกำหนดค่าส่วน กลุ่มตลาดถูกสร้างขึ้นและทดสอบเพื่อให้สอดคล้องกับสมมติฐาน
7 การพัฒนากลยุทธ์ทางการตลาดสำหรับแต่ละส่วนตลาด
วิธีการเรียงลำดับเบื้องต้นเป็นวิธีที่ใช้มากที่สุด นี่เป็นเพราะความเรียบง่ายต้นทุนต่ำและความพร้อมของเทคนิคเพื่อให้แน่ใจว่าการนำไปใช้งาน อย่างไรก็ตามในทางปฏิบัติสถานการณ์มักเกิดขึ้นเมื่อเป็นเรื่องยากที่จะตั้งสมมติฐานของการแบ่งส่วนตลาด
วิธีคลัสเตอร์คล้ายกับวิธีการก่อนหน้านี้ แต่ไม่ได้กำหนดตัวแปรตาม แต่จะมองหาคลัสเตอร์ตามธรรมชาติ ขั้นแรกผู้ซื้อที่มีศักยภาพที่ได้รับการสัมภาษณ์จะถูกจัดกลุ่มเป็นกลุ่มตลาดโดยใช้ขั้นตอนการวิเคราะห์ จากนั้นจึงระบุตัวแปรที่สามารถใช้กำหนดส่วนตลาดได้
ในระหว่างการทำคลัสเตอร์จะมีการค้นหากลุ่มธรรมชาติและในระหว่างการจำแนกกลุ่มจะถูกสร้างขึ้นตามเกณฑ์ที่ระบุเทียม
การจัดกลุ่ม AID ของผู้บริโภคเป็นไปอย่างกว้างขวาง เมื่อใช้วิธีนี้เกณฑ์การสร้างระบบจะถูกเลือก หลังจากนั้นกลุ่มตัวอย่างจะถูกแบ่งออกเป็นกลุ่มย่อยนั่นคือกลุ่มย่อยที่มีค่าเกณฑ์การสร้างระบบสูงจะถูกสร้างขึ้น
ข้อเสียของวิธีนี้คือการเลือกส่วนตลาด วิธีนี้ใช้ความยากลำบากและไม่รับประกันว่าจะได้โซลูชันที่ถูกต้อง
การแบ่งกลุ่มตามวิธีการวิเคราะห์คลัสเตอร์จะดำเนินการตามลำดับจากน้อยไปมาก (จากล่างขึ้นบน) ในขั้นตอนของการวิจัยการตลาดลักษณะหลายอย่างของผู้ซื้อจะโดดเด่น ต้องมีตัวอย่างอย่างน้อย 200 หน่วย ผลลัพธ์จะถูกประมวลผล ข้อมูลได้รับการพิจารณาในระดับสากลที่กำหนดความรุนแรงของพารามิเตอร์ จากนั้นผู้บริโภคแต่ละรายจะถูกตรวจสอบและพิจารณาผู้บริโภคที่คล้ายคลึงกันมากที่สุด ผู้บริโภคที่คล้ายกันจะรวมกันเป็นกลุ่มและทำหน้าที่เป็นวัตถุผสม จากนั้นวัตถุที่คล้ายกันมากที่สุดจะถูกค้นหาและรวมกันเป็นคลัสเตอร์ใหม่ กระบวนการนี้จะสิ้นสุดลงเมื่อไม่สามารถระบุคลัสเตอร์ที่คล้ายกันได้
ในการใช้การแบ่งส่วนตลาดโดยใช้วิธีการจัดกลุ่มในทางปฏิบัติสามารถใช้แพ็คเกจทางสถิติเช่น SPSS และ NCSS & PASS ได้
การแบ่งส่วนตลาดที่ยืดหยุ่นเป็นขั้นตอนแบบไดนามิกที่แสดงถึงความยืดหยุ่นในการสร้างกลุ่มโดยอาศัยการวิเคราะห์ความชอบของผู้บริโภคที่เกี่ยวข้องกับทางเลือกผลิตภัณฑ์ ขั้นตอนการวิเคราะห์ร่วมกันเป็นหัวใจสำคัญของการแบ่งส่วนที่ยืดหยุ่น ข้อดีอย่างหนึ่งของวิธีนี้คือช่วยให้คุณกำหนดกลุ่มผู้บริโภคได้อย่างแม่นยำเมื่อมีการเปิดตัวผลิตภัณฑ์ใหม่ในตลาด ข้อเสียของวิธีการแบ่งกลุ่มแบบยืดหยุ่น ได้แก่ ต้นทุนสูงขั้นตอนการใช้งานที่ซับซ้อนและข้อผิดพลาดที่อาจเกิดขึ้นได้ในระดับนักพัฒนา
การวิเคราะห์องค์ประกอบของการแบ่งส่วนตลาดขึ้นอยู่กับเทคนิคการวิเคราะห์ทางสถิติที่ซับซ้อน ต้องใช้ทรัพยากรคอมพิวเตอร์จำนวนมาก วิธีการวิเคราะห์องค์ประกอบของการแบ่งส่วนตลาดเสนอโดย P. Green วิธีนี้จะพยายามพิจารณาว่าผู้ซื้อประเภทใดเหมาะสมกับลักษณะบางอย่างของผลิตภัณฑ์มากที่สุด
ตามที่ผู้เชี่ยวชาญชาวตะวันตกกล่าวว่าวิธีการแบ่งส่วนตลาดที่ยืดหยุ่นและเป็นส่วนประกอบนั้นเป็นเรื่องวิชาการและไม่สามารถใช้ได้กับชีวิตจริง
ในฐานะที่เป็นส่วนหนึ่งของงานในบทแรกของงานที่ผ่านการคัดเลือกขั้นสุดท้ายได้รับความรู้ทางทฤษฎีในด้านการแบ่งกลุ่มตลาดผู้บริโภค มีการพิจารณาคุณสมบัติหลักของการแบ่งส่วนตลาดผู้บริโภค มีการศึกษาวิธีการแบ่งส่วนตลาด
วิธีการแบ่งกลุ่ม
มีวิธีการแบ่งส่วน "พื้นฐาน" บางวิธี สิ่งที่สำคัญที่สุดคือการวิเคราะห์คลัสเตอร์ผู้บริโภค (อนุกรมวิธาน) คลัสเตอร์ผู้บริโภคเกิดจากการรวมกลุ่มของผู้ที่ให้คำตอบที่คล้ายกันสำหรับคำถามที่ถาม ลูกค้าสามารถรวมกลุ่มกันได้หากอายุรายได้นิสัย ฯลฯ ใกล้เคียงกัน ความคล้ายคลึงกันระหว่างผู้ซื้อจะขึ้นอยู่กับมาตรการที่แตกต่างกัน แต่มักใช้ผลรวมถ่วงน้ำหนักของผลต่างกำลังสองระหว่างคำตอบของผู้ซื้อที่มีต่อคำถามเป็นตัววัดความคล้ายคลึงกัน ผลลัพธ์ของอัลกอริทึมการทำคลัสเตอร์อาจเป็นโครงสร้างแบบลำดับชั้นหรือการเชื่อมโยงผู้บริโภคเป็นกลุ่ม อัลกอริทึมของคลัสเตอร์มีจำนวนมาก
ตัวอย่างเช่นในสหรัฐอเมริกามีการวิเคราะห์ระบบคลัสเตอร์ที่เรียกว่า PRIZM อย่างแพร่หลาย , ซึ่งเริ่มการจัดกลุ่มโดยการลดชุดตัวบ่งชี้ทางสังคมและประชากรที่เป็นไปได้ 1,000 ชุด ระบบนี้สร้างกลุ่มประชากรและสังคมสำหรับดินแดนทั้งหมดของสหรัฐอเมริกา ดังนั้นจึงมีการเน้นคลัสเตอร์ 28 - ครอบครัวที่อยู่ในคลัสเตอร์นี้รวมถึงบุคคลที่มีอาชีพทางวิชาชีพหรือการบริหารที่ประสบความสำเร็จมากที่สุด คลัสเตอร์นี้ยังสะท้อนถึงรายได้สูงการศึกษาทรัพย์สินวัยกลางคนโดยประมาณ แม้ว่าคลัสเตอร์นี้มีเพียง 7% ของประชากรสหรัฐฯ แต่ก็มีความสำคัญอย่างยิ่งสำหรับผู้ประกอบการที่ขายสินค้าราคาแพง
มีตัวอย่างอื่น ๆ ของการแบ่งกลุ่มลูกค้าตามการวิเคราะห์คลัสเตอร์ ตัวอย่างเช่นในภาค "จิตวิทยา" สถานที่ที่สำคัญมากถูกครอบครองโดย "ทัศนคติของผู้บริโภคต่อความแปลกใหม่ของผลิตภัณฑ์" (รูปที่ 3)
รูปที่ 3
ดังที่เห็นได้จากข้อมูลข้างต้นผู้บริโภคจำนวนมากที่สุดคือผู้ซื้อทั่วไป
การแบ่งกลุ่มลูกค้าตามการวิเคราะห์คลัสเตอร์เป็นวิธี "คลาสสิก" ในขณะเดียวกันก็มีเทคนิคในการแบ่งกลุ่มตลาดโดยอาศัยสิ่งที่เรียกว่า "product segmentation" หรือการแบ่งส่วนตลาดตามพารามิเตอร์ของผลิตภัณฑ์ มีความสำคัญอย่างยิ่งในการผลิตและการตลาดผลิตภัณฑ์ใหม่ สิ่งที่สำคัญเป็นพิเศษคือการแบ่งกลุ่มตามผลิตภัณฑ์จากการศึกษาแนวโน้มระยะยาวในตลาด ขั้นตอนการพัฒนาและผลิตผลิตภัณฑ์ใหม่การดำเนินโครงการลงทุนขนาดใหญ่ต้องใช้ระยะเวลาค่อนข้างนานและความถูกต้องของผลการวิเคราะห์ตลาดการประเมินกำลังการผลิตมีความสำคัญอย่างยิ่งที่นี่ ในสภาพการทำงานในตลาดดั้งเดิมของผลิตภัณฑ์มาตรฐานการคำนวณกำลังการผลิตสามารถทำได้โดยใช้วิธีการสรุปตลาด ในสภาวะสมัยใหม่เพื่อเพิ่มขีดความสามารถในการแข่งขันและกำหนดขีดความสามารถของตลาดอย่างถูกต้ององค์กรจะไม่เพียงพอสำหรับการแบ่งส่วนตลาดในทิศทางเดียวอีกต่อไปนั่นคือคำจำกัดความของกลุ่มผู้บริโภคตามเกณฑ์บางประการ ภายในกรอบของการตลาดแบบบูรณาการจำเป็นต้องแบ่งกลุ่มผลิตภัณฑ์ตามพารามิเตอร์ที่สำคัญที่สุดสำหรับการส่งเสริมการขายในตลาด เพื่อจุดประสงค์นี้วิธีการรวบรวม แผนที่การทำงาน - ดำเนินการแบ่งส่วนสองประเภทตามผลิตภัณฑ์และโดยผู้บริโภค
แผนที่ที่ใช้งานได้ "อาจเป็นปัจจัยเดียว (การแบ่งกลุ่มจะดำเนินการตามปัจจัยเดียวและสำหรับกลุ่มผลิตภัณฑ์ที่เป็นเนื้อเดียวกัน) และหลายปัจจัย (การวิเคราะห์ว่าผู้บริโภคกลุ่มใดที่มีรูปแบบผลิตภัณฑ์เฉพาะเจาะจงและพารามิเตอร์ใดที่สำคัญที่สุดสำหรับการโปรโมตผลิตภัณฑ์ในตลาด) การ์ดที่ใช้งานได้คุณสามารถกำหนดส่วนตลาดที่ผลิตภัณฑ์นี้ออกแบบมาสำหรับพารามิเตอร์การทำงานใดที่สอดคล้องกับความต้องการของผู้บริโภครายใดรายหนึ่ง
เมื่อพัฒนาผลิตภัณฑ์ใหม่วิธีการนี้ถือว่าควรคำนึงถึงปัจจัยทั้งหมดที่สะท้อนถึงระบบความชอบของผู้บริโภคและในขณะเดียวกันพารามิเตอร์ทางเทคนิคของผลิตภัณฑ์ใหม่ซึ่งเป็นไปได้ที่จะตอบสนองความต้องการของผู้บริโภค มีการกำหนดกลุ่มผู้บริโภคโดยแต่ละกลุ่มจะมีคำขอและความชอบเป็นของตัวเอง ปัจจัยที่เลือกทั้งหมดได้รับการจัดอันดับตามระดับความสำคัญของแต่ละกลุ่มผู้บริโภค
แนวทางนี้ช่วยให้อยู่ในขั้นตอนการพัฒนาเพื่อดูว่าพารามิเตอร์ใดของผลิตภัณฑ์ที่ต้องได้รับการออกแบบใหม่หรือเพื่อตรวจสอบว่ามีตลาดที่มีความจุเพียงพอสำหรับรุ่นนี้หรือไม่
ขอยกตัวอย่างการวิเคราะห์ตลาดที่เกี่ยวข้องกับโครงการพัฒนาของคอมพิวเตอร์ "Apple" (ตารางที่ 1) (ดูหน้าถัดไป)
ตารางที่ 1." การแบ่งส่วนตลาดคอมพิวเตอร์ส่วนบุคคลและปัจจัยที่นำมาพิจารณาในการพัฒนาผลิตภัณฑ์ (1982) "
ปัจจัย | แบ่งกลุ่มตลาดตามกลุ่มผู้บริโภค | รุ่น | ||||||
บ้าน | ที่โรงเรียน | ที่มหาวิทยาลัย | เข้าไปในบ้าน. คณะรัฐมนตรี | ในธุรกิจขนาดเล็ก | ใน บริษัท | และ | ที่ | |
ข้อกำหนดทางเทคนิค | * | * | *** | ** | ** | ** | *** | ** |
ราคา | *** | *** | ** | *** | *** | ** | 0 | ** |
คุณสมบัติพิเศษ | * | * | ** | * | * | * | ** | * |
ความน่าเชื่อถือ | ** | * | * | ** | ** | * | 0 | ** |
สะดวกในการใช้งาน | ** | ** | * | ** | * | 0 | *** | *** |
ความเข้ากันได้ | 0 | 0 | 0 | 0 | 0 | *** | 0 | 0 |
อุปกรณ์ต่อพ่วง | 0 | 0 | 0 | 0 | 0 | *** | 0 | 0 |
ข้อกำหนด Prog-e | * | * | ** | ** | ** | *** | * | ** |
*** - ปัจจัยที่สำคัญมาก
** - ปัจจัยสำคัญ
* - ปัจจัยที่ไม่สำคัญ
0 - ปัจจัยเล็กน้อย
การวิเคราะห์อย่างง่ายนี้แสดงให้เห็นว่า Model A เป็นคอมพิวเตอร์ที่ไม่มีตลาดและ Model B เป็นผลิตภัณฑ์ที่เหมาะสมที่สุดสำหรับมหาวิทยาลัยและธุรกิจขนาดเล็ก
บริษัท ใส่ไว้ในคอมพิวเตอร์ A และทำหาย
โดยทั่วไปในทางปฏิบัติทั่วโลกจะใช้ 2 แนวทางพื้นฐานในการแบ่งส่วนการตลาด - (ดู: รูปแบบทั่วไปของการวิเคราะห์กลุ่ม (รูปที่ 4)) (หน้าถัดไป)
การอ่านอาจมีประโยชน์:
- เมทริกซ์การแบ่งประเภทคืออะไร?;
- คำว่าเมทริกซ์หมายถึงอะไรในการซื้อขาย;
- แผนพัฒนาฝ่ายขาย;
- โฆษณาการทดสอบสื่อส่งเสริมการขาย;
- GRP (Gross Rating Point) คืออะไร?;
- การวิเคราะห์การตลาดของตลาด: ประเภทขั้นตอนวิธีการ;
- กลยุทธ์การโฆษณาคืออะไร;
- วิจัยการตลาด;