ในวิธีการจัดกลุ่มทางสถิติ ผลรวมของปรากฏการณ์ที่ศึกษาจะถูกแบ่งออกเป็นคลาสและคลาสย่อยซึ่งมีโครงสร้างเป็นเนื้อเดียวกันตามลักษณะบางอย่าง แต่ละแผนกดังกล่าวจะอธิบายโดยระบบตัวบ่งชี้ทางสถิติ ข้อมูลที่จัดกลุ่มสามารถนำเสนอในตาราง
การกระทำนี้เป็นวิธีการหลักที่ใช้ในการศึกษาปรากฏการณ์ทางสังคมที่เกิดขึ้นจริง มันเกิดขึ้นเป็นข้อกำหนดเบื้องต้นสำหรับการประยุกต์ใช้การจัดกลุ่มสถิติขั้นตอนและวิธีการวิเคราะห์ต่างๆ ตัวอย่างเช่น การจัดประเภทมีความจำเป็นเพื่อใช้ดัชนีทั่วไป เช่น ค่าเฉลี่ย
ผลงานของ V. I. เลนิน่า
ในสถิติก่อนการปฏิวัติของรัสเซีย โดยเฉพาะอย่างยิ่ง zemstvos ต่างๆ (เหล่านี้คือรัฐบาลท้องถิ่น) ประสบการณ์จำนวนมากได้รับในการจัดกลุ่มองค์กรประเภทต่างๆ และในขณะนั้นก็มีการทำงานที่สำคัญในการพัฒนาไม่เพียงแต่ตารางที่มีการจัดประเภททีละตัวลักษณะเฉพาะ แต่ยังมีรูปแบบที่ซับซ้อนมากขึ้น ในนั้น ข้อมูลทั้งหมดจะถูกจัดกลุ่มตามพารามิเตอร์ตั้งแต่สองตัวขึ้นไป อย่างไรก็ตาม ประเด็นทางทฤษฎีที่เกี่ยวข้องกับการใช้วิธีการจัดกลุ่มทางสถิติยังไม่ได้รับความสมเหตุสมผลทางวิทยาศาสตร์ สถานการณ์นี้ยังคงอยู่จนกระทั่งผลงานของ V. I. เลนิน. เขามีความคิดเห็นสูงเกี่ยวกับคุณค่าทางปัญญาและความสำคัญในทางปฏิบัติของการจำแนกประเภท สำหรับตารางที่อิงจากสัญญาณของการจัดกลุ่มทางสถิติที่มีลักษณะมากกว่าหนึ่งลักษณะ เลนินเขียนว่า: “พูดได้โดยไม่พูดเกินจริงว่าพวกเขาจะปฏิวัติวิทยาศาสตร์และแน่นอนเศรษฐศาสตร์เกษตร”
คำแนะนำของ Vladimir Ilyich เกี่ยวกับความจำเป็นในการวิเคราะห์ทางการเมืองและเศรษฐกิจเบื้องต้นเกี่ยวกับธรรมชาติของรูปแบบและการกำหนดประเภทของปรากฏการณ์ก่อนเริ่มการทดลองด้วยการจัดประเภทข้อมูลเริ่มต้นมีความสำคัญพื้นฐาน
ขั้นตอนการจัดกลุ่มทางสถิติ
การจัดระบบไม่เพียงใช้ในการวิเคราะห์โครงสร้างของประชากรเท่านั้น แต่ยังใช้ในการกำหนดประเภทของปรากฏการณ์และในการศึกษาความสัมพันธ์ระหว่างลักษณะหรือปัจจัยต่างๆ ตัวอย่างของการจัดกลุ่มที่แสดงโครงสร้างประชากร ได้แก่ การจำแนกประเภทของบุคคลตามอายุ (ในช่วงเวลาหนึ่งปีหรือมากกว่าปกติคือ 5 ปี) และธุรกิจตามขนาด
ด้วยการรวมชั้นเรียนหรือการตั้งค่าช่วงเวลาที่ไม่เท่ากัน เป็นไปได้ที่จะสร้างความแตกต่างเชิงคุณภาพระหว่างแต่ละระบบ จากนั้นจึงกำหนดประเภทเทคโน-เศรษฐกิจหรือสังคม-เศรษฐกิจของวิชาที่เกี่ยวข้อง(เช่น สถานประกอบการหรือฟาร์ม) ดังนั้นการจัดกลุ่มประชากรของประเทศตามอายุสามารถทำได้บนพื้นฐาน นอกเหนือจากวัตถุตามลำดับเวลาอย่างง่ายของแผนกพิเศษเช่นผู้หญิงอายุ 16 ถึง 54 ปีและผู้ชายอายุ 16 ถึง 59 ปี การใช้ชั้นเรียนพิเศษเหล่านี้ทำให้สามารถคำนวณดัชนีเศรษฐกิจของประเทศได้ หรือที่เรียกว่ากำลังแรงงานของประเทศ ขอบเขตของช่วงนั้นค่อนข้างจะเป็นไปตามอำเภอใจและอาจแตกต่างกันไปในแต่ละรัฐ
งาน
การจำแนกเชิงปริมาณโดยละเอียดขององค์กรและบริษัทช่วยให้เราดำเนินการตามคำจำกัดความของกลุ่มคุณภาพพื้นฐานได้หลายกลุ่ม เช่น องค์กรขนาดเล็ก กลาง และใหญ่ หลังจากนั้นสามารถชี้แจงปัญหาทางเศรษฐกิจทั่วไปได้หลายประการ เช่น กระบวนการผลิตที่เข้มข้น การเติบโตของประสิทธิภาพทางอุตสาหกรรม และการเพิ่มผลิตภาพแรงงาน ข้อมูลใหม่ของ Vladimir Ilyich Lenin เกี่ยวกับกฎหมายที่ควบคุมการพัฒนาระบบทุนนิยมในการเกษตร เป็นตัวอย่างที่ยอดเยี่ยมของการวิเคราะห์เชิงลึกที่ใช้การจัดกลุ่มเพื่อแสดงลักษณะที่ซับซ้อนของรูปแบบ และความสัมพันธ์ระหว่างขนาดขององค์กรกับผลผลิตโดยรวม
งานที่สำคัญและยากที่สุดของการจัดกลุ่มทางสถิติคือการระบุและอธิบายโดยละเอียดเกี่ยวกับประเภทของปรากฏการณ์ทางเศรษฐกิจและสังคม วิชาดังกล่าวแสดงถึงการแสดงออกของรูปแบบของกระบวนการทางสังคมบางอย่างหรือลักษณะพื้นฐาน ดูเหมือนจะเป็นเรื่องธรรมดาในปรากฏการณ์ต่างๆ ของแต่ละบุคคล ในการวิเคราะห์การแบ่งชั้นของชาวนา วลาดิมีร์ อิลิช เลนินใช้การจัดกลุ่มอย่างทั่วถึงและทั่วถึง ก่อนอื่น เขาได้เปิดเผยกระบวนการของการก่อตัวของชนชั้นทางสังคมหลักในรัสเซียก่อนปฏิวัติ ในชนบทของยุโรปตะวันตก และในการเกษตรของสหรัฐฯ
และเมื่อมันปรากฏออกมา ข้อมูลของสหภาพโซเวียตมีประสบการณ์มากมายในการจัดกลุ่มประเภทและสถิติ ตัวอย่างเช่นงบดุลของเศรษฐกิจของประเทศของสหภาพโซเวียตสันนิษฐานว่าระบบการจำแนกประเภทที่ซับซ้อนและแตกแขนง ตัวอย่างอื่นๆ ของการจัดกลุ่มทางสถิติแบบแบ่งประเภทในพื้นที่โซเวียต ได้แก่ การจัดระบบของประชากรตามชนชั้นทางสังคม เช่นเดียวกับการรวมสินทรัพย์การผลิตถาวรตามประเภทหน่วยอุตสาหกรรมทางเศรษฐกิจและสังคม และคุณยังสามารถยกตัวอย่างเช่น การจัดกลุ่มประชากรทางสถิติของผลิตภัณฑ์โซเชียล
การจำแนกชนชั้นนายทุนไม่ได้ใช้การจัดระบบเพียงพอ เมื่อใช้การจัดกลุ่ม ส่วนใหญ่จะไม่ถูกต้องและไม่ได้มีส่วนในการจำแนกสถานะที่แท้จริงของกิจการในประเทศทุนนิยม ตัวอย่างเช่น การจำแนกประเภทของวิสาหกิจทางการเกษตรตามพื้นที่ที่ดินทำให้ตำแหน่งของการผลิตขนาดเล็กเกินจริงในแนวทางนี้ และการจัดกลุ่มประชากรตามอาชีพไม่เปิดเผยโครงสร้างชนชั้นที่แท้จริงของสังคมชนชั้นนายทุน
ลักษณะทางเศรษฐกิจและสังคมของรัฐสังคมนิยมนำเสนอแอปพลิเคชันใหม่สำหรับการจัดกลุ่มทางสถิติ การจำแนกประเภทนี้ใช้ในการวิเคราะห์การดำเนินการตามแผนเศรษฐกิจของประเทศ เพื่อกำหนดสาเหตุของการล้าหลังของบางองค์กรและภาคส่วน และยังระบุทรัพยากรที่ไม่ได้ใช้ ตัวอย่างเช่น ธุรกิจสามารถจัดกลุ่มตามระดับของการดำเนินการตามแผนหรือระดับของผลกำไร สิ่งที่สำคัญอย่างยิ่งสำหรับการกำหนดลักษณะการนำความก้าวหน้าทางวิทยาศาสตร์และเทคโนโลยีเข้าสู่อุตสาหกรรมคือการจัดกลุ่มขององค์กรตามข้อมูลทางเทคนิคและเศรษฐกิจเช่นระดับของระบบอัตโนมัติและการใช้เครื่องจักรและปริมาณไฟฟ้าที่พร้อมใช้งาน
ข้อมูลที่จัดกลุ่มเป็นข้อมูลที่เกิดขึ้นจากการรวมกลุ่มของการสังเกตทางสถิติเกี่ยวกับการมีอยู่ของตัวแปรแต่ละกลุ่มเข้าไว้ในคลาสแยกกัน เพื่อให้การกระจายความถี่ของระบบเหล่านี้เป็นวิธีที่สะดวกในการสรุปและวิเคราะห์วัสดุทั้งหมด
ข้อมูล
ข้อมูลสามารถกำหนดเป็นกลุ่มของวัสดุที่แสดงคุณลักษณะเชิงคุณภาพหรือเชิงปริมาณของตัวแปรหรือชุดของตัวแปร นี่คล้ายกับการบอกว่าคลาสสามารถเป็นชุดข้อมูลที่อธิบายเอนทิตีได้ ระบบในการจัดกลุ่มข้อมูลทางสถิติสามารถจำแนกเป็นวัตถุที่จัดกลุ่มและไม่จัดกลุ่มได้
ข้อมูลใด ๆ ที่บุคคลรวบรวมก่อนจะไม่มีการจัดประเภท การจัดกลุ่มทางสถิติที่ไม่ได้จัดกลุ่มเป็นข้อมูล แต่อยู่ในรูปแบบที่ยังไม่ได้ประมวลผลเท่านั้น ตัวอย่างของระบบดังกล่าวคือรายการตัวเลขที่คุณนึกออก
การจำแนกประเภทแรก
ข้อมูลที่จัดกลุ่มคือข้อมูลที่จัดเป็นกลุ่มที่เรียกว่าคลาส ประเภทนี้ได้รับการจำแนกแล้วและบางส่วนระดับของการวิเคราะห์ ซึ่งหมายความว่าข้อมูลทั้งหมดไม่ดิบอีกต่อไป
คลาสข้อมูลเป็นกลุ่มที่เชื่อมโยงกับคุณสมบัติที่กำหนดเองเฉพาะ ตัวอย่างเช่น ถ้าผู้จัดการขององค์กรรวบรวมคนที่เขาจ้างในปีใดปีหนึ่ง เขาสามารถจัดกลุ่มคนเหล่านี้ออกเป็นระบบตามอายุ: ยี่สิบ สามสิบ สี่สิบ และอื่นๆ และแต่ละกลุ่มจะเรียกว่าคลาส
ในทางกลับกัน นี่ไม่ใช่ดิวิชั่นสุดท้าย แต่ละคลาสเหล่านี้มีความกว้างที่แน่นอนและเรียกว่าระยะห่างหรือขนาด แนวคิดนี้มีความสำคัญมากเมื่อต้องพล็อตฮิสโทแกรมและแปลงความถี่ ชั้นเรียนทั้งหมดสามารถมีขนาดเท่ากันหรือต่างกันได้ ขึ้นอยู่กับว่าจะจัดกลุ่มข้อมูลทั้งหมดอย่างไร ช่วงเวลาของระบบเป็นจำนวนเต็มเสมอ
ข้อจำกัดและขอบเขตของชั้นเรียน
แนวคิดแรกหมายถึงค่าจริงที่สามารถเห็นได้ในตารางสุดท้าย ข้อจำกัดของคลาสแบ่งออกเป็นสองประเภท: ขีดจำกัดล่างของระบบและขีดจำกัดบน แน่นอน ทุกแผนกในตารางใช้เพื่อให้แน่ใจว่าถูกต้องและให้ข้อมูล
แต่ในอีกด้านหนึ่ง ตารางความถี่ไม่เคารพขอบเขตของชั้นเรียนเสมอไป แนวคิดนี้ให้ช่วงเวลาที่แท้จริงของระบบ และเช่นเดียวกับข้อจำกัดต่างๆ ที่ถูกแบ่งออกเป็นขอบเขตของค่าล่างและค่าบน
วงดนตรีที่มีชีวิตและไม่มีชีวิต
วิทยาศาสตร์พยายามทำความเข้าใจและอธิบายปรากฏการณ์ทางธรรมชาติ นักวิทยาศาสตร์เข้าใจสิ่งต่าง ๆ โดยการจำแนกพวกมัน มันเป็นของทั้งสิ่งมีชีวิตและไม่มีชีวิตกลุ่มของวัสดุทางสถิติ
ในทางกลับกัน ประเภทเหล่านี้สามารถแบ่งออกเป็นกลุ่มตามคุณสมบัติความคมชัด ตัวอย่างเช่น หากนักเรียนได้รวบรวมรายชื่อในวารสารทางวิทยาศาสตร์เกี่ยวกับเนื้อหาและวิชาต่างๆ ที่พวกเขาได้ศึกษา พวกเขาสามารถใช้ข้อมูลนี้เพื่อขยายความรู้และข้อมูลเกี่ยวกับระบบที่ศึกษาได้
ความรู้ทั้งหมดสามารถจัดเรียงหรือจำแนกตามคุณสมบัติความคมชัดต่างๆ นี่คือตัวอย่างบางส่วน:
- โลหะกับอโลหะต่างๆ
- ภูมิประเทศที่เป็นหินแทนที่จะเป็นทะเลทรายหรือทุ่งหญ้า
- คริสตัลที่มองเห็นได้กับแร่ธาตุที่มองไม่เห็น
- กระบวนการทางธรรมชาติแทนที่จะเป็นของเทียม
- สารที่มีความหนาแน่นมากกว่าน้ำหรือมีน้ำหนักน้อยกว่าของเหลวที่ให้มา
- แม่เหล็กกับไม่ใช่แม่เหล็ก
และคุณยังสามารถสร้างความแตกต่างของกลุ่มตามคุณสมบัติต่อไปนี้:
- สถานะของสสารที่อุณหภูมิห้อง (ของแข็ง ของเหลว ก๊าซ)
- การหลอมละลายของโลหะ
- คุณสมบัติทางกายภาพและอื่นๆ
วัสดุ:
- บทความต่างๆ ที่แสดงตัวอย่างหมวดหมู่ด้านบน
- แม่เหล็กสำหรับทดสอบคุณสมบัติของวัสดุ
- ภาชนะใส่น้ำเพื่อตรวจสอบว่าสิ่งของลอยหรือจม
- วารสารวิทยาศาสตร์
ขั้นตอนการปฏิบัติงาน
สิ่งที่เกิดขึ้นจริง:
- นักเรียนทำงานเป็นกลุ่ม แต่ละคนได้รับวัสดุบางอย่างและขอให้หาวิธีการจัดกลุ่มรายการตามหมวดหมู่ พวกเขาพัฒนาเกณฑ์ที่จะใช้และจัดเรียงรายการตามนั้น ตารางผลลัพธ์ถูกบันทึกไว้ในวารสารทางวิทยาศาสตร์ของพวกเขา
- หลังจากจัดกลุ่มวัสดุแล้ว จะถูกจัดเรียงใหม่ตามเกณฑ์อื่นๆ ขั้นตอนต่อไปจะเป็นการรวบรวมรายการผลลัพธ์ และหลังจากนั้น จะมีการเขียนแถวขององค์ประกอบเพิ่มเติม ซึ่งจัดเรียงแตกต่างกันเนื่องจากเกณฑ์ที่เปลี่ยนแปลง
- นักเรียนบันทึกการสังเกตและตารางลงในวารสารทางวิทยาศาสตร์ของพวกเขา
ผลลัพธ์
นักเรียนแก้ไขชุดตารางที่แสดงวิธีการจัดเรียงหัวเรื่องตามเกณฑ์แต่ละข้อ ตัวอย่างเช่น นักเรียนกลุ่มหนึ่งมีคลิปหนีบกระดาษ หินแกรนิตชิ้นเล็กๆ ไม้ก๊อก ของเล่นพลาสติก จากนั้นตารางการจัดเรียงคู่อาจมีลักษณะดังนี้
-
เรียงตามสนามแม่เหล็ก.
ทำปฏิกิริยากับแม่เหล็ก: คลิปหนีบกระดาษหินแกรนิต. ไม่ตอบสนอง: ไม้ก๊อก, พลาสติก
-
สินค้าเรียงตามความหนาแน่นเมื่อเทียบกับน้ำ
ป๊อปอัพ: ไม้ก๊อก, พลาสติก. จมน้ำ: คลิปหนีบกระดาษหินแกรนิต
หลังจากนั้น นักเรียนทำการนำเสนอในชั้นเรียน พวกเขาพูดคุยกันว่าทำไมรายการต่าง ๆ จึงถูกจัดประเภทแตกต่างกันไปตามเกณฑ์ที่ใช้
นักเรียนสังเกตเหล่านี้ซ้ำในแต่ละครั้ง โดยใช้คุณสมบัติต่างกัน
พูดคุย
ในขั้นตอนนี้:
- นักเรียนสามารถขยายข้อสังเกตเหล่านี้ไปยังสื่ออื่นๆ ได้โดยไม่ต้องมีการวิจัยเชิงปฏิบัติ
- ตัวอย่างหินประเภทต่างๆ นักเรียนจะได้เรียนรู้วิธีสังเกตอย่างใกล้ชิดและเขียนสิ่งที่พวกเขาเห็นด้วยแว่นขยายและสิ่งของอื่นๆ ที่พวกเขาใช้ได้อย่างแม่นยำ
- หากนักเรียนสร้างไฟล์ดัชนีคุณสมบัติที่เขียนบนการ์ดแล้ว ก็สามารถจัดเรียงได้ ซึ่งจะเป็นประโยชน์หากดัชนีมีเนื้อหาเพิ่มเติมที่ไม่ได้อยู่ในชั้นเรียน
วิธีทั่วไปในการประมวลผลข้อมูลเชิงปริมาณอย่างต่อเนื่องคือการแบ่งช่วงของความหมายทั้งหมดออกเป็นหลายช่วงย่อย จำเป็นต้องกำหนดค่าคงที่ของคลาสที่วัสดุแต่ละประเภทมีค่าคงที่ให้กับวัสดุแต่ละชนิด โปรดทราบว่าชุดข้อมูลจะเปลี่ยนจากแบบต่อเนื่องเป็นแบบไม่ต่อเนื่อง
แนวคิดการจัดกลุ่มทางสถิติ
การจัดระเบียบทำได้โดยการกำหนดชุดของช่วงแล้วนับจำนวนข้อมูลที่อยู่ในแต่ละช่วง ช่วงย่อยไม่ทับซ้อนกัน ต้องครอบคลุมช่วงทั้งหมดของชุดข้อมูล
วิธีหนึ่งที่ประสบความสำเร็จมากที่สุดในการแสดงภาพระบบที่จัดกลุ่มไว้คือฮิสโตแกรม เป็นชุดของสี่เหลี่ยมผืนผ้าที่ฐานของรูปครอบคลุมค่าในช่วงที่เกี่ยวข้อง และความสูงก็สอดคล้องกับปริมาณข้อมูล