แนวคิดพื้นฐานของสถิติทางคณิตศาสตร์ การประยุกต์ใช้สถิติทางคณิตศาสตร์

สารบัญ:

แนวคิดพื้นฐานของสถิติทางคณิตศาสตร์ การประยุกต์ใช้สถิติทางคณิตศาสตร์
แนวคิดพื้นฐานของสถิติทางคณิตศาสตร์ การประยุกต์ใช้สถิติทางคณิตศาสตร์
Anonim

สถิติทางคณิตศาสตร์เป็นวิธีการที่ช่วยให้คุณตัดสินใจได้อย่างมีข้อมูลเมื่อเผชิญกับสภาวะที่ไม่แน่นอน การศึกษาวิธีการรวบรวมและจัดระบบข้อมูล ประมวลผลผลลัพธ์สุดท้ายของการทดลองและการทดลองด้วยการสุ่มมวล และการค้นพบรูปแบบใดๆ คือสิ่งที่คณิตศาสตร์สาขานี้ทำ พิจารณาแนวคิดพื้นฐานของสถิติทางคณิตศาสตร์

ผลต่างกับทฤษฎีความน่าจะเป็น

วิธีการของสถิติทางคณิตศาสตร์ตัดกับทฤษฎีความน่าจะเป็นอย่างใกล้ชิด คณิตศาสตร์ทั้งสองสาขาเกี่ยวข้องกับการศึกษาปรากฏการณ์สุ่มจำนวนมาก สาขาวิชาทั้งสองเชื่อมโยงกันด้วยทฤษฎีบทลิมิต อย่างไรก็ตาม วิทยาศาสตร์เหล่านี้มีความแตกต่างกันมาก หากทฤษฎีความน่าจะเป็นกำหนดลักษณะของกระบวนการในโลกแห่งความเป็นจริงโดยอาศัยแบบจำลองทางคณิตศาสตร์ สถิติทางคณิตศาสตร์ก็จะทำสิ่งที่ตรงกันข้าม - จะกำหนดคุณสมบัติของแบบจำลองเป็นตามข้อมูลที่สังเกตได้

ทฤษฎีความน่าจะเป็นและเสื่อ สถิติ
ทฤษฎีความน่าจะเป็นและเสื่อ สถิติ

ขั้นตอน

การประยุกต์ใช้สถิติทางคณิตศาสตร์สามารถทำได้เฉพาะในความสัมพันธ์กับเหตุการณ์หรือกระบวนการสุ่ม หรือมากกว่า กับข้อมูลที่ได้จากการสังเกต และสิ่งนี้เกิดขึ้นในหลายขั้นตอน ขั้นแรก ข้อมูลของการทดลองและการทดลองได้รับการประมวลผลบางอย่าง พวกเขาได้รับคำสั่งเพื่อความชัดเจนและความสะดวกในการวิเคราะห์ จากนั้นจึงทำการประมาณค่าพารามิเตอร์ที่ต้องการของกระบวนการสุ่มที่สังเกตได้อย่างแม่นยำหรือโดยประมาณ พวกเขาสามารถ:

  • การประเมินความน่าจะเป็นของเหตุการณ์ (ไม่ทราบความน่าจะเป็นในตอนแรก);
  • ศึกษาพฤติกรรมของฟังก์ชันการแจกแจงแบบไม่มีกำหนด
  • ประมาณการความคาดหวัง;
  • ค่าความแปรปรวน
  • etc.
พื้นฐานของเสื่อ สถิติ
พื้นฐานของเสื่อ สถิติ

ขั้นตอนที่สามคือการตรวจสอบสมมติฐานที่ตั้งไว้ก่อนการวิเคราะห์ กล่าวคือ ได้คำตอบสำหรับคำถามที่ว่าผลลัพธ์ของการทดลองสอดคล้องกับการคำนวณทางทฤษฎีอย่างไร อันที่จริงนี่คือขั้นตอนหลักของสถิติทางคณิตศาสตร์ ตัวอย่างจะพิจารณาว่าพฤติกรรมของกระบวนการสุ่มที่สังเกตพบนั้นอยู่ในการแจกแจงแบบปกติหรือไม่

ประชากร

แนวคิดพื้นฐานของสถิติทางคณิตศาสตร์ ได้แก่ ประชากรทั่วไปและกลุ่มตัวอย่าง ระเบียบวินัยนี้เกี่ยวข้องกับการศึกษาชุดของวัตถุบางอย่างเกี่ยวกับคุณสมบัติบางอย่าง ตัวอย่างคือผลงานของคนขับรถแท็กซี่พิจารณาตัวแปรสุ่มเหล่านี้:

  • โหลดหรือจำนวนลูกค้า: ต่อวัน ก่อนอาหารกลางวัน หลังอาหารกลางวัน …;
  • เวลาเดินทางโดยเฉลี่ย;
  • จำนวนแอปพลิเคชันที่เข้ามาหรือสิ่งที่แนบมากับเขตเมืองและอีกมากมาย

นอกจากนี้ยังน่าสังเกตว่าเป็นไปได้ที่จะศึกษาชุดกระบวนการสุ่มที่คล้ายกัน ซึ่งจะเป็นตัวแปรสุ่มที่สามารถสังเกตได้

ประชากร
ประชากร

ดังนั้น ในวิธีการของสถิติทางคณิตศาสตร์ วัตถุทั้งชุดที่อยู่ระหว่างการศึกษาหรือผลของการสังเกตต่างๆ ที่ดำเนินการภายใต้เงื่อนไขเดียวกันบนวัตถุที่กำหนดนั้นเรียกว่าประชากรทั่วไป กล่าวอีกนัยหนึ่ง ในทางคณิตศาสตร์อย่างเคร่งครัด มันคือตัวแปรสุ่มที่กำหนดไว้ในพื้นที่ของเหตุการณ์ระดับประถมศึกษา โดยมีคลาสของชุดย่อยที่กำหนดไว้ในนั้น องค์ประกอบที่มีความน่าจะเป็นที่ทราบ

ประชากรตัวอย่าง

มีบางกรณีที่เป็นไปไม่ได้หรือทำไม่ได้ด้วยเหตุผลบางอย่าง (ต้นทุน เวลา) ที่จะทำการศึกษาอย่างต่อเนื่องเพื่อศึกษาแต่ละวัตถุ ตัวอย่างเช่น การเปิดขวดแยมที่ปิดสนิททุกขวดเพื่อตรวจสอบคุณภาพนั้นเป็นการตัดสินใจที่น่าสงสัย และการพยายามประมาณการโคจรของโมเลกุลอากาศแต่ละโมเลกุลในลูกบาศก์เมตรนั้นเป็นไปไม่ได้ ในกรณีเช่นนี้ จะใช้วิธีการสังเกตแบบคัดเลือก: มีการเลือกวัตถุจำนวนหนึ่ง (โดยปกติสุ่ม) จากประชากรทั่วไปและจะได้รับการวิเคราะห์

ตัวอย่างจากทั่วไปมวลรวม
ตัวอย่างจากทั่วไปมวลรวม

แนวคิดเหล่านี้อาจดูซับซ้อนในตอนแรก ดังนั้น เพื่อให้เข้าใจหัวข้อนี้อย่างสมบูรณ์ คุณต้องศึกษาตำราของ V. E. Gmurman "ทฤษฎีความน่าจะเป็นและสถิติทางคณิตศาสตร์" ดังนั้น ชุดสุ่มตัวอย่างหรือกลุ่มตัวอย่างจึงเป็นชุดของออบเจกต์ที่เลือกแบบสุ่มจากชุดทั่วไป ในแง่คณิตศาสตร์ที่เคร่งครัด นี่คือลำดับของตัวแปรสุ่มที่กระจายอย่างอิสระและสม่ำเสมอ สำหรับแต่ละตัวแปรการแจกแจงจะตรงกับที่ระบุสำหรับตัวแปรสุ่มทั่วไป

แนวคิดพื้นฐาน

ลองพิจารณาแนวคิดพื้นฐานอื่นๆ จำนวนหนึ่งเกี่ยวกับสถิติทางคณิตศาสตร์โดยสังเขปกัน จำนวนอ็อบเจ็กต์ในประชากรทั่วไปหรือกลุ่มตัวอย่างเรียกว่าปริมาตร ค่าตัวอย่างที่ได้รับระหว่างการทดลองเรียกว่าการรับรู้ตัวอย่าง เพื่อให้ค่าประมาณของประชากรทั่วไปจากกลุ่มตัวอย่างมีความน่าเชื่อถือ จำเป็นต้องมีสิ่งที่เรียกว่าตัวแทนหรือกลุ่มตัวอย่าง ซึ่งหมายความว่ากลุ่มตัวอย่างต้องเป็นตัวแทนของประชากรทั้งหมด สิ่งนี้สามารถทำได้ก็ต่อเมื่อองค์ประกอบทั้งหมดของประชากรมีความน่าจะเป็นเท่ากันในการอยู่ในกลุ่มตัวอย่าง

แนวคิดพื้นฐาน
แนวคิดพื้นฐาน

ตัวอย่างแยกความแตกต่างระหว่างการส่งคืนและไม่ส่งคืน ในกรณีแรก ในเนื้อหาของตัวอย่าง องค์ประกอบที่ซ้ำกันจะถูกส่งกลับไปยังชุดทั่วไป ในกรณีที่สอง ไม่ใช่ โดยปกติ ในทางปฏิบัติ จะใช้การสุ่มตัวอย่างโดยไม่มีการเปลี่ยน นอกจากนี้ ควรสังเกตด้วยว่าขนาดของประชากรทั่วไปมักเกินขนาดของกลุ่มตัวอย่างเสมอ มีอยู่ตัวเลือกมากมายสำหรับกระบวนการสุ่มตัวอย่าง:

  • simple - รายการจะถูกสุ่มเลือกทีละรายการ
  • typed - ประชากรทั่วไปแบ่งออกเป็นประเภทและมีตัวเลือกจากแต่ละประเภท ตัวอย่างคือการสำรวจผู้อยู่อาศัยแยกชายหญิง
  • เครื่องกล - ตัวอย่างเช่น เลือกทุกองค์ประกอบที่ 10;
  • ซีเรียล - การเลือกถูกสร้างขึ้นในชุดขององค์ประกอบ

การกระจายทางสถิติ

ตาม Gmurman ทฤษฎีความน่าจะเป็นและสถิติทางคณิตศาสตร์เป็นสาขาวิชาที่สำคัญอย่างยิ่งในโลกวิทยาศาสตร์ โดยเฉพาะอย่างยิ่งในภาคปฏิบัติ พิจารณาการกระจายทางสถิติของกลุ่มตัวอย่าง

สมมติว่าเรามีกลุ่มนักเรียนที่สอบวิชาคณิตศาสตร์ ด้วยเหตุนี้ เรามีชุดค่าประมาณ 5, 3, 1, 4, 3, 4, 2, 5, 4, 4, 5 - นี่คือเอกสารทางสถิติหลักของเรา

ก่อนอื่น เราต้องจัดเรียงมัน หรือทำการจัดอันดับ: 1, 2, 3, 3, 4, 4, 4, 4, 5, 5, 5 - และได้รับอนุกรมรูปแบบต่างๆ จำนวนการทำซ้ำของการประเมินแต่ละครั้งเรียกว่าความถี่ในการประเมิน และอัตราส่วนต่อขนาดกลุ่มตัวอย่างเรียกว่าความถี่สัมพัทธ์ มาทำตารางการแจกแจงทางสถิติของกลุ่มตัวอย่าง หรือแค่ชุดสถิติกัน:

ai 1 2 3 4 5
pi 1 1 2 4 3

หรือ

ai 1 2 3 4 5
pi 1/11 1/11 2/11 4/11 3/11

มาสร้างตัวแปรสุ่มกัน โดยเราจะทำการทดลองเป็นชุดและดูว่าตัวแปรนี้ใช้ค่าอะไร สมมุติว่าเธอเอาค่า a1 - m1 ครั้ง; a2 - m2 ครั้ง ฯลฯ ขนาดของตัวอย่างจะเป็น m1 + … + mk=m. ชุด ai โดยที่ฉันเปลี่ยนจาก 1 ถึง k เป็นชุดสถิติ

การกระจายตามช่วงเวลา

ในหนังสือของ VE Gmurman "ทฤษฎีความน่าจะเป็นและสถิติทางคณิตศาสตร์" มีการนำเสนอชุดสถิติแบบช่วงเวลาด้วย การรวบรวมเป็นไปได้เมื่อค่าของคุณลักษณะภายใต้การศึกษาต่อเนื่องในช่วงเวลาหนึ่งและจำนวนของค่ามีมาก ให้พิจารณากลุ่มนักเรียนที่มีส่วนสูง: 163, 180, 185, 172, 161, 171, 189, 157, 165, 174, 180, 181, 175, 182, 167, 159, 173, 171, 164, นักเรียนทั้งหมด 179, 160, 180, 166, 178, 156, 180, 189, 173, 174, 175 - 30 คน เห็นได้ชัดว่าความสูงของบุคคลนั้นเป็นค่าที่ต่อเนื่องกัน เราจำเป็นต้องกำหนดขั้นตอนของช่วงเวลา ด้วยเหตุนี้จึงใช้สูตร Sturges

h= สูงสุด - นาที = 190 - 156 = 33 = 5, 59
1+log2m 1+log230 5, 9

ดังนั้น ค่าของ 6 สามารถใช้เป็นขนาดของช่วงเวลาได้ และควรกล่าวว่าค่า 1+log2m เป็นสูตรสำหรับกำหนดจำนวนช่วงเวลา (แน่นอนด้วยการปัดเศษ) ดังนั้นตามสูตรจะได้ 6 ช่วงซึ่งแต่ละช่วงมีขนาด 6 และค่าแรกของช่วงเริ่มต้นจะเป็นตัวเลขที่กำหนดโดยสูตร: min - h / 2=156 - 6/2=153. มาทำตารางที่มีช่วงเวลาและจำนวนนักเรียนที่มีการเติบโตในช่วงเวลาหนึ่งกัน

H [153; 159) [159; 165) [165; 171) [171; 177) [177; 183) [183; 189)
2 5 3 9 8 3
P 0, 06 0, 17 0, 1 0, 3 0, 27 0, 1

แน่นอนว่ายังไม่หมดเพียงเท่านี้ เพราะมีสูตรทางสถิติอีกมากมาย เราได้พิจารณาเพียงแนวคิดพื้นฐานบางอย่างแล้ว

กำหนดจำหน่าย

แผนภูมิการกระจาย
แผนภูมิการกระจาย

แนวคิดพื้นฐานของสถิติทางคณิตศาสตร์ยังรวมถึงการแสดงกราฟิกของการแจกแจงซึ่งมีความชัดเจนชัดเจน กราฟมีสองประเภท: รูปหลายเหลี่ยมและฮิสโตแกรม อันแรกใช้สำหรับอนุกรมทางสถิติที่ไม่ต่อเนื่อง และสำหรับการกระจายแบบต่อเนื่องตามลำดับที่สอง