การกระจายของเพียร์สัน: คำนิยาม แอปพลิเคชัน

สารบัญ:

การกระจายของเพียร์สัน: คำนิยาม แอปพลิเคชัน
การกระจายของเพียร์สัน: คำนิยาม แอปพลิเคชัน
Anonim

กฎหมายการจำหน่ายของเพียร์สันคืออะไร? คำตอบสำหรับคำถามกว้างๆ นี้ต้องไม่ง่ายและกระชับ ระบบ Pearson เดิมออกแบบมาเพื่อจำลองการสังเกตที่บิดเบี้ยวที่มองเห็นได้ ในขณะนั้น เป็นที่ทราบกันดีถึงวิธีการปรับแต่งแบบจำลองทางทฤษฎีให้ตรงกับสองสะสมแรกหรือช่วงเวลาของข้อมูลที่สังเกตได้: การแจกแจงความน่าจะเป็นใดๆ สามารถขยายได้โดยตรงเพื่อสร้างกลุ่มของมาตราส่วนสถานที่

สมมติฐานของเพียร์สันเกี่ยวกับการแจกแจงเกณฑ์ปกติ

ยกเว้นในกรณีทางพยาธิวิทยา มาตราส่วนตำแหน่งสามารถกำหนดให้ตรงกับค่าเฉลี่ยที่สังเกตได้ (ค่าสะสมแรก) และความแปรปรวน (ค่าสะสมที่สอง) ในลักษณะใดก็ได้ อย่างไรก็ตาม ไม่ทราบวิธีการสร้างการแจกแจงความน่าจะเป็นที่ความเบ้ (คิวมูลัสที่สามที่เป็นมาตรฐาน) และความโด่ง ความต้องการนี้ปรากฏชัดเมื่อพยายามปรับแบบจำลองทางทฤษฎีที่รู้จักกับข้อมูลที่สังเกตได้ที่แสดงความไม่สมมาตร

ในวิดีโอด้านล่าง คุณสามารถดูการวิเคราะห์การกระจายของไคของเพียร์สัน

Image
Image

ประวัติศาสตร์

ในงานต้นฉบับของเขา เพียร์สันระบุการแจกแจงสี่ประเภท (หมายเลข I ถึง IV) นอกเหนือจากการแจกแจงแบบปกติ (ซึ่งเดิมเรียกว่าประเภท V) การจัดประเภทขึ้นอยู่กับว่าการแจกแจงได้รับการสนับสนุนในช่วงเวลาที่จำกัด บนกึ่งแกน หรือบนเส้นจริงทั้งหมด และไม่ว่าจะเอียงหรือจำเป็นต้องสมมาตร

การละเว้นสองครั้งได้รับการแก้ไขในกระดาษแผ่นที่สอง: เขากำหนดรูปแบบการแจกแจงแบบ V ใหม่ (แต่เดิมเป็นเพียงการแจกแจงแบบปกติ แต่ตอนนี้มีแกมมาผกผัน) และแนะนำการแจกแจงแบบ VI บทความสองบทความแรกครอบคลุมห้าประเภทหลักของระบบเพียร์สัน (I, III, IV, V และ VI) ในรายงานฉบับที่ 3 Pearson (1916) ได้แนะนำประเภทย่อยเพิ่มเติม

ฟังก์ชันการกระจายแบบเพียร์สัน
ฟังก์ชันการกระจายแบบเพียร์สัน

ปรับปรุงแนวคิด

Rind ได้คิดค้นวิธีง่ายๆ ในการแสดงภาพพื้นที่พารามิเตอร์ของระบบ Pearson (หรือการกระจายเกณฑ์) ซึ่งเขานำมาใช้ในภายหลัง ปัจจุบัน นักคณิตศาสตร์และนักสถิติหลายคนใช้วิธีนี้ ประเภทของการแจกแจงแบบเพียร์สันมีลักษณะเป็นปริมาณสองปริมาณ ปกติเรียกว่า β1 และ β2 อย่างแรกคือกำลังสองของความไม่สมมาตร ประการที่สองคือความโด่งแบบดั้งเดิมหรือช่วงเวลามาตรฐานที่สี่: β2=γ2 + 3.

วิธีทางคณิตศาสตร์สมัยใหม่กำหนดความโด่ง γ2 เป็นการสะสมแทนที่จะเป็นโมเมนต์ ดังนั้นสำหรับปกติการแจกแจงเรามี γ2=0 และ β2=3 นี่คือสิ่งที่ควรค่าแก่การปฏิบัติตามแบบอย่างทางประวัติศาสตร์และการใช้ β2 แผนภาพทางด้านขวาแสดงประเภทการแจกแจงแบบเพียร์สันโดยเฉพาะ (แสดงด้วยจุด (β1, β2)

สถิติของเพียร์สัน
สถิติของเพียร์สัน

การแจกแจงแบบเบ้และ/หรือแบบไม่มีเมโซคูร์ติกจำนวนมากที่เรารู้จักในปัจจุบันนี้ยังไม่เป็นที่รู้จักในช่วงต้นปี 1890 สิ่งที่เรียกว่าการแจกแจงแบบเบต้าถูกใช้โดย Thomas Bayes เป็นพารามิเตอร์หลังของการแจกแจงแบบเบอร์นูลลีในกระดาษ 1763 ของเขาเกี่ยวกับความน่าจะเป็นแบบผกผัน

การแจกแจงแบบเบต้าเริ่มมีความโดดเด่นเนื่องจากมีอยู่ในระบบเพียร์สัน และเป็นที่รู้จักจนถึงปี 1940 ในฐานะการกระจายแบบเพียร์สันประเภทที่ 1 การแจกแจงแบบ Type II เป็นกรณีพิเศษของ Type I แต่โดยปกติแล้วจะไม่ถูกแยกออกอีกต่อไป

การแจกแจงแกมมาเกิดขึ้นจากงานของเขาเองและเป็นที่รู้จักในชื่อการกระจายแบบปกติของเพียร์สัน Type III ก่อนที่มันจะได้รับชื่อสมัยใหม่ในช่วงทศวรรษที่ 1930 และ 1940 กระดาษปี 1895 โดยนักวิทยาศาสตร์ได้นำเสนอการแจกแจงแบบ Type IV ซึ่งมีการแจกแจงแบบ t ของ Student เป็นกรณีพิเศษ ซึ่งเกิดขึ้นก่อนการใช้งานของ William Seely Gosset ในเวลาต่อมาหลายปี กระดาษของเขาในปี 1901 นำเสนอการแจกแจงด้วยรังสีแกมมาผกผัน (ประเภท V) และเบตาไพรม์ (ประเภท VI)

อีกความเห็น

ตาม Ord เพียร์สันได้พัฒนารูปแบบพื้นฐานของสมการ (1) ตามสูตรสำหรับอนุพันธ์ของลอการิทึมของฟังก์ชันความหนาแน่นของการแจกแจงแบบปกติ (ซึ่งให้การหารเชิงเส้นด้วยกำลังสองโครงสร้าง). ผู้เชี่ยวชาญหลายคนยังคงทดสอบสมมติฐานเกี่ยวกับการกระจายเกณฑ์ของเพียร์สัน และพิสูจน์ประสิทธิภาพ

การกระจายทางเลือกของเพียร์สัน
การกระจายทางเลือกของเพียร์สัน

ใครคือคาร์ล เพียร์สัน

คาร์ล เพียร์สันเป็นนักคณิตศาสตร์และนักชีวสถิติชาวอังกฤษ เขาให้เครดิตกับการสร้างวินัยของสถิติทางคณิตศาสตร์ ในปีพ.ศ. 2454 เขาได้ก่อตั้งแผนกสถิติแห่งแรกของโลกที่ University College London และมีส่วนสำคัญในด้านไบโอเมตริกและอุตุนิยมวิทยา เพียร์สันยังเป็นผู้สนับสนุนลัทธิดาร์วินและสุพันธุศาสตร์ทางสังคมอีกด้วย เขาเป็นลูกบุญธรรมและนักเขียนชีวประวัติของเซอร์ฟรานซิส กัลตัน

ไบโอเมตริกซ์

คาร์ล เพียร์สันคือส่วนสำคัญในการสร้างโรงเรียนไบโอเมตริกซ์ ซึ่งเป็นทฤษฎีที่แข่งขันกันในการอธิบายวิวัฒนาการและการสืบทอดของประชากรในช่วงเปลี่ยนศตวรรษที่ 20 ชุดบทความสิบแปดเรื่อง "การมีส่วนร่วมทางคณิตศาสตร์สู่ทฤษฎีวิวัฒนาการ" ทำให้เขาเป็นผู้ก่อตั้งโรงเรียนมรดกไบโอเมตริกซ์ อันที่จริงเพียร์สันอุทิศเวลาส่วนใหญ่ระหว่างปี พ.ศ. 2436-2447 ถึง การพัฒนาวิธีการทางสถิติสำหรับไบโอเมตริกซ์ วิธีการเหล่านี้ ซึ่งใช้กันอย่างแพร่หลายในปัจจุบันสำหรับการวิเคราะห์ทางสถิติ รวมถึงการทดสอบไคสแควร์ ค่าเบี่ยงเบนมาตรฐาน ค่าสหสัมพันธ์และค่าสัมประสิทธิ์การถดถอย

ค่าสัมประสิทธิ์สหสัมพันธ์ของเพียร์สัน
ค่าสัมประสิทธิ์สหสัมพันธ์ของเพียร์สัน

คำถามเกี่ยวกับพันธุกรรม

กฎการถ่ายทอดทางพันธุกรรมของเพียร์สันระบุว่าพลาสซึมของเชื้อโรคประกอบด้วยองค์ประกอบที่สืบทอดมาจากพ่อแม่และบรรพบุรุษที่อยู่ห่างไกลออกไป ซึ่งมีสัดส่วนแตกต่างกันไปตามลักษณะต่างๆ Karl Pearson เป็นลูกศิษย์ของ G alton และถึงแม้ว่าพวกเขาจะงานแตกต่างกันในบางด้าน เพียร์สันใช้แนวคิดทางสถิติของครูจำนวนมากในการกำหนดโรงเรียนไบโอเมตริกซ์เพื่อการสืบทอด เช่น กฎการถดถอย

การกระจายของเพียร์สัน
การกระจายของเพียร์สัน

คุณลักษณะของโรงเรียน

โรงเรียนไบโอเมตริกซ์ซึ่งแตกต่างจาก Mendelians ไม่ได้มุ่งเน้นไปที่การจัดหากลไกในการสืบทอด แต่ให้คำอธิบายทางคณิตศาสตร์ที่ไม่มีสาเหตุในธรรมชาติ ในขณะที่ G alton เสนอทฤษฎีวิวัฒนาการที่ไม่ต่อเนื่องซึ่งสปีชีส์จะเปลี่ยนแปลงด้วยการก้าวกระโดดครั้งใหญ่แทนที่จะเป็นการเปลี่ยนแปลงเล็กๆ น้อยๆ ที่สะสมอยู่ตลอดเวลา เพียร์สันชี้ให้เห็นข้อบกพร่องในการโต้แย้งนี้ และใช้ความคิดของเขาเพื่อพัฒนาทฤษฎีวิวัฒนาการอย่างต่อเนื่อง ชาวเมนเดเลียนชอบทฤษฎีวิวัฒนาการที่ไม่ต่อเนื่อง

ในขณะที่ G alton มุ่งเน้นที่การใช้วิธีการทางสถิติเป็นหลักในการศึกษาพันธุกรรม เพียร์สันและเวลดอนเพื่อนร่วมงานของเขาได้ขยายการให้เหตุผลในด้านนี้ ความผันแปร ความสัมพันธ์ของการคัดเลือกโดยธรรมชาติและการเลือกเพศ

การกระจายทั่วไป
การกระจายทั่วไป

ดูวิวัฒนาการ

สำหรับเพียร์สัน ทฤษฎีวิวัฒนาการไม่ได้มีจุดมุ่งหมายเพื่อระบุกลไกทางชีววิทยาที่อธิบายรูปแบบการถ่ายทอดทางพันธุกรรม ในขณะที่แนวทางของ Mendelian ประกาศว่ายีนนั้นเป็นกลไกของการถ่ายทอดทางพันธุกรรม

เพียร์สันวิพากษ์วิจารณ์เบทสันและนักชีววิทยาคนอื่นๆ ที่ไม่นำวิธีการไบโอเมตริกมาใช้ในการศึกษาวิวัฒนาการ เขาประณามนักวิทยาศาสตร์ที่ไม่เน้นความถูกต้องทางสถิติของทฤษฎีของพวกเขาโดยระบุว่า:

"ก่อนที่เราจะยอมรับ [สาเหตุใดๆ ของการเปลี่ยนแปลงที่ก้าวหน้า] เป็นปัจจัยหนึ่ง เราต้องไม่เพียงแค่แสดงความเป็นไปได้เท่านั้น แต่หากเป็นไปได้ ให้แสดงความสามารถเชิงปริมาณของมันด้วย"

นักชีววิทยายอมจำนนต่อ "การคาดเดาเชิงอภิปรัชญาเกี่ยวกับสาเหตุของการถ่ายทอดทางพันธุกรรมเกือบ" ซึ่งเข้ามาแทนที่กระบวนการรวบรวมข้อมูลการทดลอง ซึ่งอาจช่วยให้นักวิทยาศาสตร์จำกัดทฤษฎีที่เป็นไปได้ให้แคบลงได้

สะพานสถิติ
สะพานสถิติ

กฎธรรมชาติ

สำหรับ Pearson กฎแห่งธรรมชาติมีประโยชน์สำหรับการคาดการณ์ที่แม่นยำและสำหรับการสรุปแนวโน้มในข้อมูลที่สังเกตได้ เหตุผลก็คือประสบการณ์ที่ว่า “มีเหตุการณ์หนึ่งเกิดขึ้นซ้ำแล้วซ้ำเล่าในอดีต”

ดังนั้น การระบุกลไกเฉพาะของพันธุกรรมจึงไม่ใช่ความพยายามที่คู่ควรสำหรับนักชีววิทยา ซึ่งควรเน้นที่คำอธิบายทางคณิตศาสตร์ของข้อมูลเชิงประจักษ์แทน ส่วนนี้นำไปสู่ข้อพิพาทอันขมขื่นระหว่างนักชีวการแพทย์และ Mendelians รวมถึง Bateson

หลังจากที่คนหลังปฏิเสธต้นฉบับของเพียร์สันที่อธิบายทฤษฎีใหม่ของรูปแบบการแปรผันของลูกหลานหรือโฮโมไทป์ เพียร์สันและเวลดอนได้ก่อตั้งบริษัทไบโอเมทริกาขึ้นในปี พ.ศ. 2445 แม้ว่าวิธีการไบโอเมตริกซ์ในการสืบทอดในท้ายที่สุดจะสูญเสียมุมมองของ Mendelian แต่วิธีที่พวกเขาพัฒนาขึ้นในขณะนั้นมีความสำคัญต่อการศึกษาชีววิทยาและวิวัฒนาการในปัจจุบัน

แนะนำ: