การจัดกลุ่มทางสถิติ: แนวคิดพื้นฐาน ขั้นตอน การจัดกลุ่มวัสดุ งาน

สารบัญ:

การจัดกลุ่มทางสถิติ: แนวคิดพื้นฐาน ขั้นตอน การจัดกลุ่มวัสดุ งาน
การจัดกลุ่มทางสถิติ: แนวคิดพื้นฐาน ขั้นตอน การจัดกลุ่มวัสดุ งาน
Anonim

ในวิธีการจัดกลุ่มทางสถิติ ผลรวมของปรากฏการณ์ที่ศึกษาจะถูกแบ่งออกเป็นคลาสและคลาสย่อยซึ่งมีโครงสร้างเป็นเนื้อเดียวกันตามลักษณะบางอย่าง แต่ละแผนกดังกล่าวจะอธิบายโดยระบบตัวบ่งชี้ทางสถิติ ข้อมูลที่จัดกลุ่มสามารถนำเสนอในตาราง

การกระทำนี้เป็นวิธีการหลักที่ใช้ในการศึกษาปรากฏการณ์ทางสังคมที่เกิดขึ้นจริง มันเกิดขึ้นเป็นข้อกำหนดเบื้องต้นสำหรับการประยุกต์ใช้การจัดกลุ่มสถิติขั้นตอนและวิธีการวิเคราะห์ต่างๆ ตัวอย่างเช่น การจัดประเภทมีความจำเป็นเพื่อใช้ดัชนีทั่วไป เช่น ค่าเฉลี่ย

ผลงานของ V. I. เลนิน่า

สัญญาณของการจัดกลุ่มทางสถิติ
สัญญาณของการจัดกลุ่มทางสถิติ

ในสถิติก่อนการปฏิวัติของรัสเซีย โดยเฉพาะอย่างยิ่ง zemstvos ต่างๆ (เหล่านี้คือรัฐบาลท้องถิ่น) ประสบการณ์จำนวนมากได้รับในการจัดกลุ่มองค์กรประเภทต่างๆ และในขณะนั้นก็มีการทำงานที่สำคัญในการพัฒนาไม่เพียงแต่ตารางที่มีการจัดประเภททีละตัวลักษณะเฉพาะ แต่ยังมีรูปแบบที่ซับซ้อนมากขึ้น ในนั้น ข้อมูลทั้งหมดจะถูกจัดกลุ่มตามพารามิเตอร์ตั้งแต่สองตัวขึ้นไป อย่างไรก็ตาม ประเด็นทางทฤษฎีที่เกี่ยวข้องกับการใช้วิธีการจัดกลุ่มทางสถิติยังไม่ได้รับความสมเหตุสมผลทางวิทยาศาสตร์ สถานการณ์นี้ยังคงอยู่จนกระทั่งผลงานของ V. I. เลนิน. เขามีความคิดเห็นสูงเกี่ยวกับคุณค่าทางปัญญาและความสำคัญในทางปฏิบัติของการจำแนกประเภท สำหรับตารางที่อิงจากสัญญาณของการจัดกลุ่มทางสถิติที่มีลักษณะมากกว่าหนึ่งลักษณะ เลนินเขียนว่า: “พูดได้โดยไม่พูดเกินจริงว่าพวกเขาจะปฏิวัติวิทยาศาสตร์และแน่นอนเศรษฐศาสตร์เกษตร”

คำแนะนำของ Vladimir Ilyich เกี่ยวกับความจำเป็นในการวิเคราะห์ทางการเมืองและเศรษฐกิจเบื้องต้นเกี่ยวกับธรรมชาติของรูปแบบและการกำหนดประเภทของปรากฏการณ์ก่อนเริ่มการทดลองด้วยการจัดประเภทข้อมูลเริ่มต้นมีความสำคัญพื้นฐาน

ขั้นตอนการจัดกลุ่มทางสถิติ

แนวคิดของการจัดกลุ่มทางสถิติ
แนวคิดของการจัดกลุ่มทางสถิติ

การจัดระบบไม่เพียงใช้ในการวิเคราะห์โครงสร้างของประชากรเท่านั้น แต่ยังใช้ในการกำหนดประเภทของปรากฏการณ์และในการศึกษาความสัมพันธ์ระหว่างลักษณะหรือปัจจัยต่างๆ ตัวอย่างของการจัดกลุ่มที่แสดงโครงสร้างประชากร ได้แก่ การจำแนกประเภทของบุคคลตามอายุ (ในช่วงเวลาหนึ่งปีหรือมากกว่าปกติคือ 5 ปี) และธุรกิจตามขนาด

ด้วยการรวมชั้นเรียนหรือการตั้งค่าช่วงเวลาที่ไม่เท่ากัน เป็นไปได้ที่จะสร้างความแตกต่างเชิงคุณภาพระหว่างแต่ละระบบ จากนั้นจึงกำหนดประเภทเทคโน-เศรษฐกิจหรือสังคม-เศรษฐกิจของวิชาที่เกี่ยวข้อง(เช่น สถานประกอบการหรือฟาร์ม) ดังนั้นการจัดกลุ่มประชากรของประเทศตามอายุสามารถทำได้บนพื้นฐาน นอกเหนือจากวัตถุตามลำดับเวลาอย่างง่ายของแผนกพิเศษเช่นผู้หญิงอายุ 16 ถึง 54 ปีและผู้ชายอายุ 16 ถึง 59 ปี การใช้ชั้นเรียนพิเศษเหล่านี้ทำให้สามารถคำนวณดัชนีเศรษฐกิจของประเทศได้ หรือที่เรียกว่ากำลังแรงงานของประเทศ ขอบเขตของช่วงนั้นค่อนข้างจะเป็นไปตามอำเภอใจและอาจแตกต่างกันไปในแต่ละรัฐ

งาน

การจำแนกเชิงปริมาณโดยละเอียดขององค์กรและบริษัทช่วยให้เราดำเนินการตามคำจำกัดความของกลุ่มคุณภาพพื้นฐานได้หลายกลุ่ม เช่น องค์กรขนาดเล็ก กลาง และใหญ่ หลังจากนั้นสามารถชี้แจงปัญหาทางเศรษฐกิจทั่วไปได้หลายประการ เช่น กระบวนการผลิตที่เข้มข้น การเติบโตของประสิทธิภาพทางอุตสาหกรรม และการเพิ่มผลิตภาพแรงงาน ข้อมูลใหม่ของ Vladimir Ilyich Lenin เกี่ยวกับกฎหมายที่ควบคุมการพัฒนาระบบทุนนิยมในการเกษตร เป็นตัวอย่างที่ยอดเยี่ยมของการวิเคราะห์เชิงลึกที่ใช้การจัดกลุ่มเพื่อแสดงลักษณะที่ซับซ้อนของรูปแบบ และความสัมพันธ์ระหว่างขนาดขององค์กรกับผลผลิตโดยรวม

งานที่สำคัญและยากที่สุดของการจัดกลุ่มทางสถิติคือการระบุและอธิบายโดยละเอียดเกี่ยวกับประเภทของปรากฏการณ์ทางเศรษฐกิจและสังคม วิชาดังกล่าวแสดงถึงการแสดงออกของรูปแบบของกระบวนการทางสังคมบางอย่างหรือลักษณะพื้นฐาน ดูเหมือนจะเป็นเรื่องธรรมดาในปรากฏการณ์ต่างๆ ของแต่ละบุคคล ในการวิเคราะห์การแบ่งชั้นของชาวนา วลาดิมีร์ อิลิช เลนินใช้การจัดกลุ่มอย่างทั่วถึงและทั่วถึง ก่อนอื่น เขาได้เปิดเผยกระบวนการของการก่อตัวของชนชั้นทางสังคมหลักในรัสเซียก่อนปฏิวัติ ในชนบทของยุโรปตะวันตก และในการเกษตรของสหรัฐฯ

และเมื่อมันปรากฏออกมา ข้อมูลของสหภาพโซเวียตมีประสบการณ์มากมายในการจัดกลุ่มประเภทและสถิติ ตัวอย่างเช่นงบดุลของเศรษฐกิจของประเทศของสหภาพโซเวียตสันนิษฐานว่าระบบการจำแนกประเภทที่ซับซ้อนและแตกแขนง ตัวอย่างอื่นๆ ของการจัดกลุ่มทางสถิติแบบแบ่งประเภทในพื้นที่โซเวียต ได้แก่ การจัดระบบของประชากรตามชนชั้นทางสังคม เช่นเดียวกับการรวมสินทรัพย์การผลิตถาวรตามประเภทหน่วยอุตสาหกรรมทางเศรษฐกิจและสังคม และคุณยังสามารถยกตัวอย่างเช่น การจัดกลุ่มประชากรทางสถิติของผลิตภัณฑ์โซเชียล

การจำแนกชนชั้นนายทุนไม่ได้ใช้การจัดระบบเพียงพอ เมื่อใช้การจัดกลุ่ม ส่วนใหญ่จะไม่ถูกต้องและไม่ได้มีส่วนในการจำแนกสถานะที่แท้จริงของกิจการในประเทศทุนนิยม ตัวอย่างเช่น การจำแนกประเภทของวิสาหกิจทางการเกษตรตามพื้นที่ที่ดินทำให้ตำแหน่งของการผลิตขนาดเล็กเกินจริงในแนวทางนี้ และการจัดกลุ่มประชากรตามอาชีพไม่เปิดเผยโครงสร้างชนชั้นที่แท้จริงของสังคมชนชั้นนายทุน

ลักษณะทางเศรษฐกิจและสังคมของรัฐสังคมนิยมนำเสนอแอปพลิเคชันใหม่สำหรับการจัดกลุ่มทางสถิติ การจำแนกประเภทนี้ใช้ในการวิเคราะห์การดำเนินการตามแผนเศรษฐกิจของประเทศ เพื่อกำหนดสาเหตุของการล้าหลังของบางองค์กรและภาคส่วน และยังระบุทรัพยากรที่ไม่ได้ใช้ ตัวอย่างเช่น ธุรกิจสามารถจัดกลุ่มตามระดับของการดำเนินการตามแผนหรือระดับของผลกำไร สิ่งที่สำคัญอย่างยิ่งสำหรับการกำหนดลักษณะการนำความก้าวหน้าทางวิทยาศาสตร์และเทคโนโลยีเข้าสู่อุตสาหกรรมคือการจัดกลุ่มขององค์กรตามข้อมูลทางเทคนิคและเศรษฐกิจเช่นระดับของระบบอัตโนมัติและการใช้เครื่องจักรและปริมาณไฟฟ้าที่พร้อมใช้งาน

ข้อมูลที่จัดกลุ่มเป็นข้อมูลที่เกิดขึ้นจากการรวมกลุ่มของการสังเกตทางสถิติเกี่ยวกับการมีอยู่ของตัวแปรแต่ละกลุ่มเข้าไว้ในคลาสแยกกัน เพื่อให้การกระจายความถี่ของระบบเหล่านี้เป็นวิธีที่สะดวกในการสรุปและวิเคราะห์วัสดุทั้งหมด

ข้อมูล

การจัดกลุ่มทางสถิติ
การจัดกลุ่มทางสถิติ

ข้อมูลสามารถกำหนดเป็นกลุ่มของวัสดุที่แสดงคุณลักษณะเชิงคุณภาพหรือเชิงปริมาณของตัวแปรหรือชุดของตัวแปร นี่คล้ายกับการบอกว่าคลาสสามารถเป็นชุดข้อมูลที่อธิบายเอนทิตีได้ ระบบในการจัดกลุ่มข้อมูลทางสถิติสามารถจำแนกเป็นวัตถุที่จัดกลุ่มและไม่จัดกลุ่มได้

ข้อมูลใด ๆ ที่บุคคลรวบรวมก่อนจะไม่มีการจัดประเภท การจัดกลุ่มทางสถิติที่ไม่ได้จัดกลุ่มเป็นข้อมูล แต่อยู่ในรูปแบบที่ยังไม่ได้ประมวลผลเท่านั้น ตัวอย่างของระบบดังกล่าวคือรายการตัวเลขที่คุณนึกออก

การจำแนกประเภทแรก

ข้อมูลที่จัดกลุ่มคือข้อมูลที่จัดเป็นกลุ่มที่เรียกว่าคลาส ประเภทนี้ได้รับการจำแนกแล้วและบางส่วนระดับของการวิเคราะห์ ซึ่งหมายความว่าข้อมูลทั้งหมดไม่ดิบอีกต่อไป

คลาสข้อมูลเป็นกลุ่มที่เชื่อมโยงกับคุณสมบัติที่กำหนดเองเฉพาะ ตัวอย่างเช่น ถ้าผู้จัดการขององค์กรรวบรวมคนที่เขาจ้างในปีใดปีหนึ่ง เขาสามารถจัดกลุ่มคนเหล่านี้ออกเป็นระบบตามอายุ: ยี่สิบ สามสิบ สี่สิบ และอื่นๆ และแต่ละกลุ่มจะเรียกว่าคลาส

ในทางกลับกัน นี่ไม่ใช่ดิวิชั่นสุดท้าย แต่ละคลาสเหล่านี้มีความกว้างที่แน่นอนและเรียกว่าระยะห่างหรือขนาด แนวคิดนี้มีความสำคัญมากเมื่อต้องพล็อตฮิสโทแกรมและแปลงความถี่ ชั้นเรียนทั้งหมดสามารถมีขนาดเท่ากันหรือต่างกันได้ ขึ้นอยู่กับว่าจะจัดกลุ่มข้อมูลทั้งหมดอย่างไร ช่วงเวลาของระบบเป็นจำนวนเต็มเสมอ

ข้อจำกัดและขอบเขตของชั้นเรียน

ขั้นตอนของการจัดกลุ่มทางสถิติ
ขั้นตอนของการจัดกลุ่มทางสถิติ

แนวคิดแรกหมายถึงค่าจริงที่สามารถเห็นได้ในตารางสุดท้าย ข้อจำกัดของคลาสแบ่งออกเป็นสองประเภท: ขีดจำกัดล่างของระบบและขีดจำกัดบน แน่นอน ทุกแผนกในตารางใช้เพื่อให้แน่ใจว่าถูกต้องและให้ข้อมูล

แต่ในอีกด้านหนึ่ง ตารางความถี่ไม่เคารพขอบเขตของชั้นเรียนเสมอไป แนวคิดนี้ให้ช่วงเวลาที่แท้จริงของระบบ และเช่นเดียวกับข้อจำกัดต่างๆ ที่ถูกแบ่งออกเป็นขอบเขตของค่าล่างและค่าบน

วงดนตรีที่มีชีวิตและไม่มีชีวิต

วิทยาศาสตร์พยายามทำความเข้าใจและอธิบายปรากฏการณ์ทางธรรมชาติ นักวิทยาศาสตร์เข้าใจสิ่งต่าง ๆ โดยการจำแนกพวกมัน มันเป็นของทั้งสิ่งมีชีวิตและไม่มีชีวิตกลุ่มของวัสดุทางสถิติ

ในทางกลับกัน ประเภทเหล่านี้สามารถแบ่งออกเป็นกลุ่มตามคุณสมบัติความคมชัด ตัวอย่างเช่น หากนักเรียนได้รวบรวมรายชื่อในวารสารทางวิทยาศาสตร์เกี่ยวกับเนื้อหาและวิชาต่างๆ ที่พวกเขาได้ศึกษา พวกเขาสามารถใช้ข้อมูลนี้เพื่อขยายความรู้และข้อมูลเกี่ยวกับระบบที่ศึกษาได้

ความรู้ทั้งหมดสามารถจัดเรียงหรือจำแนกตามคุณสมบัติความคมชัดต่างๆ นี่คือตัวอย่างบางส่วน:

  • โลหะกับอโลหะต่างๆ
  • ภูมิประเทศที่เป็นหินแทนที่จะเป็นทะเลทรายหรือทุ่งหญ้า
  • คริสตัลที่มองเห็นได้กับแร่ธาตุที่มองไม่เห็น
  • กระบวนการทางธรรมชาติแทนที่จะเป็นของเทียม
  • สารที่มีความหนาแน่นมากกว่าน้ำหรือมีน้ำหนักน้อยกว่าของเหลวที่ให้มา
  • แม่เหล็กกับไม่ใช่แม่เหล็ก

และคุณยังสามารถสร้างความแตกต่างของกลุ่มตามคุณสมบัติต่อไปนี้:

  • สถานะของสสารที่อุณหภูมิห้อง (ของแข็ง ของเหลว ก๊าซ)
  • การหลอมละลายของโลหะ
  • คุณสมบัติทางกายภาพและอื่นๆ

วัสดุ:

  • บทความต่างๆ ที่แสดงตัวอย่างหมวดหมู่ด้านบน
  • แม่เหล็กสำหรับทดสอบคุณสมบัติของวัสดุ
  • ภาชนะใส่น้ำเพื่อตรวจสอบว่าสิ่งของลอยหรือจม
  • วารสารวิทยาศาสตร์

ขั้นตอนการปฏิบัติงาน

สิ่งที่เกิดขึ้นจริง:

ขั้นตอนการจัดกลุ่ม
ขั้นตอนการจัดกลุ่ม
  1. นักเรียนทำงานเป็นกลุ่ม แต่ละคนได้รับวัสดุบางอย่างและขอให้หาวิธีการจัดกลุ่มรายการตามหมวดหมู่ พวกเขาพัฒนาเกณฑ์ที่จะใช้และจัดเรียงรายการตามนั้น ตารางผลลัพธ์ถูกบันทึกไว้ในวารสารทางวิทยาศาสตร์ของพวกเขา
  2. หลังจากจัดกลุ่มวัสดุแล้ว จะถูกจัดเรียงใหม่ตามเกณฑ์อื่นๆ ขั้นตอนต่อไปจะเป็นการรวบรวมรายการผลลัพธ์ และหลังจากนั้น จะมีการเขียนแถวขององค์ประกอบเพิ่มเติม ซึ่งจัดเรียงแตกต่างกันเนื่องจากเกณฑ์ที่เปลี่ยนแปลง
  3. นักเรียนบันทึกการสังเกตและตารางลงในวารสารทางวิทยาศาสตร์ของพวกเขา

ผลลัพธ์

นักเรียนแก้ไขชุดตารางที่แสดงวิธีการจัดเรียงหัวเรื่องตามเกณฑ์แต่ละข้อ ตัวอย่างเช่น นักเรียนกลุ่มหนึ่งมีคลิปหนีบกระดาษ หินแกรนิตชิ้นเล็กๆ ไม้ก๊อก ของเล่นพลาสติก จากนั้นตารางการจัดเรียงคู่อาจมีลักษณะดังนี้

  1. เรียงตามสนามแม่เหล็ก.

    ทำปฏิกิริยากับแม่เหล็ก: คลิปหนีบกระดาษหินแกรนิต. ไม่ตอบสนอง: ไม้ก๊อก, พลาสติก

  2. สินค้าเรียงตามความหนาแน่นเมื่อเทียบกับน้ำ

    ป๊อปอัพ: ไม้ก๊อก, พลาสติก. จมน้ำ: คลิปหนีบกระดาษหินแกรนิต

หลังจากนั้น นักเรียนทำการนำเสนอในชั้นเรียน พวกเขาพูดคุยกันว่าทำไมรายการต่าง ๆ จึงถูกจัดประเภทแตกต่างกันไปตามเกณฑ์ที่ใช้

นักเรียนสังเกตเหล่านี้ซ้ำในแต่ละครั้ง โดยใช้คุณสมบัติต่างกัน

พูดคุย

ในขั้นตอนนี้:

วิธีการและงาน
วิธีการและงาน
  1. นักเรียนสามารถขยายข้อสังเกตเหล่านี้ไปยังสื่ออื่นๆ ได้โดยไม่ต้องมีการวิจัยเชิงปฏิบัติ
  2. ตัวอย่างหินประเภทต่างๆ นักเรียนจะได้เรียนรู้วิธีสังเกตอย่างใกล้ชิดและเขียนสิ่งที่พวกเขาเห็นด้วยแว่นขยายและสิ่งของอื่นๆ ที่พวกเขาใช้ได้อย่างแม่นยำ
  3. หากนักเรียนสร้างไฟล์ดัชนีคุณสมบัติที่เขียนบนการ์ดแล้ว ก็สามารถจัดเรียงได้ ซึ่งจะเป็นประโยชน์หากดัชนีมีเนื้อหาเพิ่มเติมที่ไม่ได้อยู่ในชั้นเรียน

วิธีทั่วไปในการประมวลผลข้อมูลเชิงปริมาณอย่างต่อเนื่องคือการแบ่งช่วงของความหมายทั้งหมดออกเป็นหลายช่วงย่อย จำเป็นต้องกำหนดค่าคงที่ของคลาสที่วัสดุแต่ละประเภทมีค่าคงที่ให้กับวัสดุแต่ละชนิด โปรดทราบว่าชุดข้อมูลจะเปลี่ยนจากแบบต่อเนื่องเป็นแบบไม่ต่อเนื่อง

แนวคิดการจัดกลุ่มทางสถิติ

แนวคิดของสถิติ
แนวคิดของสถิติ

การจัดระเบียบทำได้โดยการกำหนดชุดของช่วงแล้วนับจำนวนข้อมูลที่อยู่ในแต่ละช่วง ช่วงย่อยไม่ทับซ้อนกัน ต้องครอบคลุมช่วงทั้งหมดของชุดข้อมูล

วิธีหนึ่งที่ประสบความสำเร็จมากที่สุดในการแสดงภาพระบบที่จัดกลุ่มไว้คือฮิสโตแกรม เป็นชุดของสี่เหลี่ยมผืนผ้าที่ฐานของรูปครอบคลุมค่าในช่วงที่เกี่ยวข้อง และความสูงก็สอดคล้องกับปริมาณข้อมูล

แนะนำ: