สถิติทางคณิตศาสตร์เป็นวิธีการที่ช่วยให้คุณตัดสินใจได้อย่างมีข้อมูลเมื่อเผชิญกับสภาวะที่ไม่แน่นอน การศึกษาวิธีการรวบรวมและจัดระบบข้อมูล ประมวลผลผลลัพธ์สุดท้ายของการทดลองและการทดลองด้วยการสุ่มมวล และการค้นพบรูปแบบใดๆ คือสิ่งที่คณิตศาสตร์สาขานี้ทำ พิจารณาแนวคิดพื้นฐานของสถิติทางคณิตศาสตร์
ผลต่างกับทฤษฎีความน่าจะเป็น
วิธีการของสถิติทางคณิตศาสตร์ตัดกับทฤษฎีความน่าจะเป็นอย่างใกล้ชิด คณิตศาสตร์ทั้งสองสาขาเกี่ยวข้องกับการศึกษาปรากฏการณ์สุ่มจำนวนมาก สาขาวิชาทั้งสองเชื่อมโยงกันด้วยทฤษฎีบทลิมิต อย่างไรก็ตาม วิทยาศาสตร์เหล่านี้มีความแตกต่างกันมาก หากทฤษฎีความน่าจะเป็นกำหนดลักษณะของกระบวนการในโลกแห่งความเป็นจริงโดยอาศัยแบบจำลองทางคณิตศาสตร์ สถิติทางคณิตศาสตร์ก็จะทำสิ่งที่ตรงกันข้าม - จะกำหนดคุณสมบัติของแบบจำลองเป็นตามข้อมูลที่สังเกตได้
ขั้นตอน
การประยุกต์ใช้สถิติทางคณิตศาสตร์สามารถทำได้เฉพาะในความสัมพันธ์กับเหตุการณ์หรือกระบวนการสุ่ม หรือมากกว่า กับข้อมูลที่ได้จากการสังเกต และสิ่งนี้เกิดขึ้นในหลายขั้นตอน ขั้นแรก ข้อมูลของการทดลองและการทดลองได้รับการประมวลผลบางอย่าง พวกเขาได้รับคำสั่งเพื่อความชัดเจนและความสะดวกในการวิเคราะห์ จากนั้นจึงทำการประมาณค่าพารามิเตอร์ที่ต้องการของกระบวนการสุ่มที่สังเกตได้อย่างแม่นยำหรือโดยประมาณ พวกเขาสามารถ:
- การประเมินความน่าจะเป็นของเหตุการณ์ (ไม่ทราบความน่าจะเป็นในตอนแรก);
- ศึกษาพฤติกรรมของฟังก์ชันการแจกแจงแบบไม่มีกำหนด
- ประมาณการความคาดหวัง;
- ค่าความแปรปรวน
- etc.
ขั้นตอนที่สามคือการตรวจสอบสมมติฐานที่ตั้งไว้ก่อนการวิเคราะห์ กล่าวคือ ได้คำตอบสำหรับคำถามที่ว่าผลลัพธ์ของการทดลองสอดคล้องกับการคำนวณทางทฤษฎีอย่างไร อันที่จริงนี่คือขั้นตอนหลักของสถิติทางคณิตศาสตร์ ตัวอย่างจะพิจารณาว่าพฤติกรรมของกระบวนการสุ่มที่สังเกตพบนั้นอยู่ในการแจกแจงแบบปกติหรือไม่
ประชากร
แนวคิดพื้นฐานของสถิติทางคณิตศาสตร์ ได้แก่ ประชากรทั่วไปและกลุ่มตัวอย่าง ระเบียบวินัยนี้เกี่ยวข้องกับการศึกษาชุดของวัตถุบางอย่างเกี่ยวกับคุณสมบัติบางอย่าง ตัวอย่างคือผลงานของคนขับรถแท็กซี่พิจารณาตัวแปรสุ่มเหล่านี้:
- โหลดหรือจำนวนลูกค้า: ต่อวัน ก่อนอาหารกลางวัน หลังอาหารกลางวัน …;
- เวลาเดินทางโดยเฉลี่ย;
- จำนวนแอปพลิเคชันที่เข้ามาหรือสิ่งที่แนบมากับเขตเมืองและอีกมากมาย
นอกจากนี้ยังน่าสังเกตว่าเป็นไปได้ที่จะศึกษาชุดกระบวนการสุ่มที่คล้ายกัน ซึ่งจะเป็นตัวแปรสุ่มที่สามารถสังเกตได้
ดังนั้น ในวิธีการของสถิติทางคณิตศาสตร์ วัตถุทั้งชุดที่อยู่ระหว่างการศึกษาหรือผลของการสังเกตต่างๆ ที่ดำเนินการภายใต้เงื่อนไขเดียวกันบนวัตถุที่กำหนดนั้นเรียกว่าประชากรทั่วไป กล่าวอีกนัยหนึ่ง ในทางคณิตศาสตร์อย่างเคร่งครัด มันคือตัวแปรสุ่มที่กำหนดไว้ในพื้นที่ของเหตุการณ์ระดับประถมศึกษา โดยมีคลาสของชุดย่อยที่กำหนดไว้ในนั้น องค์ประกอบที่มีความน่าจะเป็นที่ทราบ
ประชากรตัวอย่าง
มีบางกรณีที่เป็นไปไม่ได้หรือทำไม่ได้ด้วยเหตุผลบางอย่าง (ต้นทุน เวลา) ที่จะทำการศึกษาอย่างต่อเนื่องเพื่อศึกษาแต่ละวัตถุ ตัวอย่างเช่น การเปิดขวดแยมที่ปิดสนิททุกขวดเพื่อตรวจสอบคุณภาพนั้นเป็นการตัดสินใจที่น่าสงสัย และการพยายามประมาณการโคจรของโมเลกุลอากาศแต่ละโมเลกุลในลูกบาศก์เมตรนั้นเป็นไปไม่ได้ ในกรณีเช่นนี้ จะใช้วิธีการสังเกตแบบคัดเลือก: มีการเลือกวัตถุจำนวนหนึ่ง (โดยปกติสุ่ม) จากประชากรทั่วไปและจะได้รับการวิเคราะห์
แนวคิดเหล่านี้อาจดูซับซ้อนในตอนแรก ดังนั้น เพื่อให้เข้าใจหัวข้อนี้อย่างสมบูรณ์ คุณต้องศึกษาตำราของ V. E. Gmurman "ทฤษฎีความน่าจะเป็นและสถิติทางคณิตศาสตร์" ดังนั้น ชุดสุ่มตัวอย่างหรือกลุ่มตัวอย่างจึงเป็นชุดของออบเจกต์ที่เลือกแบบสุ่มจากชุดทั่วไป ในแง่คณิตศาสตร์ที่เคร่งครัด นี่คือลำดับของตัวแปรสุ่มที่กระจายอย่างอิสระและสม่ำเสมอ สำหรับแต่ละตัวแปรการแจกแจงจะตรงกับที่ระบุสำหรับตัวแปรสุ่มทั่วไป
แนวคิดพื้นฐาน
ลองพิจารณาแนวคิดพื้นฐานอื่นๆ จำนวนหนึ่งเกี่ยวกับสถิติทางคณิตศาสตร์โดยสังเขปกัน จำนวนอ็อบเจ็กต์ในประชากรทั่วไปหรือกลุ่มตัวอย่างเรียกว่าปริมาตร ค่าตัวอย่างที่ได้รับระหว่างการทดลองเรียกว่าการรับรู้ตัวอย่าง เพื่อให้ค่าประมาณของประชากรทั่วไปจากกลุ่มตัวอย่างมีความน่าเชื่อถือ จำเป็นต้องมีสิ่งที่เรียกว่าตัวแทนหรือกลุ่มตัวอย่าง ซึ่งหมายความว่ากลุ่มตัวอย่างต้องเป็นตัวแทนของประชากรทั้งหมด สิ่งนี้สามารถทำได้ก็ต่อเมื่อองค์ประกอบทั้งหมดของประชากรมีความน่าจะเป็นเท่ากันในการอยู่ในกลุ่มตัวอย่าง
ตัวอย่างแยกความแตกต่างระหว่างการส่งคืนและไม่ส่งคืน ในกรณีแรก ในเนื้อหาของตัวอย่าง องค์ประกอบที่ซ้ำกันจะถูกส่งกลับไปยังชุดทั่วไป ในกรณีที่สอง ไม่ใช่ โดยปกติ ในทางปฏิบัติ จะใช้การสุ่มตัวอย่างโดยไม่มีการเปลี่ยน นอกจากนี้ ควรสังเกตด้วยว่าขนาดของประชากรทั่วไปมักเกินขนาดของกลุ่มตัวอย่างเสมอ มีอยู่ตัวเลือกมากมายสำหรับกระบวนการสุ่มตัวอย่าง:
- simple - รายการจะถูกสุ่มเลือกทีละรายการ
- typed - ประชากรทั่วไปแบ่งออกเป็นประเภทและมีตัวเลือกจากแต่ละประเภท ตัวอย่างคือการสำรวจผู้อยู่อาศัยแยกชายหญิง
- เครื่องกล - ตัวอย่างเช่น เลือกทุกองค์ประกอบที่ 10;
- ซีเรียล - การเลือกถูกสร้างขึ้นในชุดขององค์ประกอบ
การกระจายทางสถิติ
ตาม Gmurman ทฤษฎีความน่าจะเป็นและสถิติทางคณิตศาสตร์เป็นสาขาวิชาที่สำคัญอย่างยิ่งในโลกวิทยาศาสตร์ โดยเฉพาะอย่างยิ่งในภาคปฏิบัติ พิจารณาการกระจายทางสถิติของกลุ่มตัวอย่าง
สมมติว่าเรามีกลุ่มนักเรียนที่สอบวิชาคณิตศาสตร์ ด้วยเหตุนี้ เรามีชุดค่าประมาณ 5, 3, 1, 4, 3, 4, 2, 5, 4, 4, 5 - นี่คือเอกสารทางสถิติหลักของเรา
ก่อนอื่น เราต้องจัดเรียงมัน หรือทำการจัดอันดับ: 1, 2, 3, 3, 4, 4, 4, 4, 5, 5, 5 - และได้รับอนุกรมรูปแบบต่างๆ จำนวนการทำซ้ำของการประเมินแต่ละครั้งเรียกว่าความถี่ในการประเมิน และอัตราส่วนต่อขนาดกลุ่มตัวอย่างเรียกว่าความถี่สัมพัทธ์ มาทำตารางการแจกแจงทางสถิติของกลุ่มตัวอย่าง หรือแค่ชุดสถิติกัน:
ai | 1 | 2 | 3 | 4 | 5 |
pi | 1 | 1 | 2 | 4 | 3 |
หรือ
ai | 1 | 2 | 3 | 4 | 5 |
pi | 1/11 | 1/11 | 2/11 | 4/11 | 3/11 |
มาสร้างตัวแปรสุ่มกัน โดยเราจะทำการทดลองเป็นชุดและดูว่าตัวแปรนี้ใช้ค่าอะไร สมมุติว่าเธอเอาค่า a1 - m1 ครั้ง; a2 - m2 ครั้ง ฯลฯ ขนาดของตัวอย่างจะเป็น m1 + … + mk=m. ชุด ai โดยที่ฉันเปลี่ยนจาก 1 ถึง k เป็นชุดสถิติ
การกระจายตามช่วงเวลา
ในหนังสือของ VE Gmurman "ทฤษฎีความน่าจะเป็นและสถิติทางคณิตศาสตร์" มีการนำเสนอชุดสถิติแบบช่วงเวลาด้วย การรวบรวมเป็นไปได้เมื่อค่าของคุณลักษณะภายใต้การศึกษาต่อเนื่องในช่วงเวลาหนึ่งและจำนวนของค่ามีมาก ให้พิจารณากลุ่มนักเรียนที่มีส่วนสูง: 163, 180, 185, 172, 161, 171, 189, 157, 165, 174, 180, 181, 175, 182, 167, 159, 173, 171, 164, นักเรียนทั้งหมด 179, 160, 180, 166, 178, 156, 180, 189, 173, 174, 175 - 30 คน เห็นได้ชัดว่าความสูงของบุคคลนั้นเป็นค่าที่ต่อเนื่องกัน เราจำเป็นต้องกำหนดขั้นตอนของช่วงเวลา ด้วยเหตุนี้จึงใช้สูตร Sturges
h= | สูงสุด - นาที | = | 190 - 156 | = | 33 | = | 5, 59 |
1+log2m | 1+log230 | 5, 9 |
ดังนั้น ค่าของ 6 สามารถใช้เป็นขนาดของช่วงเวลาได้ และควรกล่าวว่าค่า 1+log2m เป็นสูตรสำหรับกำหนดจำนวนช่วงเวลา (แน่นอนด้วยการปัดเศษ) ดังนั้นตามสูตรจะได้ 6 ช่วงซึ่งแต่ละช่วงมีขนาด 6 และค่าแรกของช่วงเริ่มต้นจะเป็นตัวเลขที่กำหนดโดยสูตร: min - h / 2=156 - 6/2=153. มาทำตารางที่มีช่วงเวลาและจำนวนนักเรียนที่มีการเติบโตในช่วงเวลาหนึ่งกัน
H | [153; 159) | [159; 165) | [165; 171) | [171; 177) | [177; 183) | [183; 189) |
ป | 2 | 5 | 3 | 9 | 8 | 3 |
P | 0, 06 | 0, 17 | 0, 1 | 0, 3 | 0, 27 | 0, 1 |
แน่นอนว่ายังไม่หมดเพียงเท่านี้ เพราะมีสูตรทางสถิติอีกมากมาย เราได้พิจารณาเพียงแนวคิดพื้นฐานบางอย่างแล้ว
กำหนดจำหน่าย
แนวคิดพื้นฐานของสถิติทางคณิตศาสตร์ยังรวมถึงการแสดงกราฟิกของการแจกแจงซึ่งมีความชัดเจนชัดเจน กราฟมีสองประเภท: รูปหลายเหลี่ยมและฮิสโตแกรม อันแรกใช้สำหรับอนุกรมทางสถิติที่ไม่ต่อเนื่อง และสำหรับการกระจายแบบต่อเนื่องตามลำดับที่สอง