เบย์เซียนเน็ตเวิร์ก: คำจำกัดความ ตัวอย่าง และวิธีการทำงาน

สารบัญ:

เบย์เซียนเน็ตเวิร์ก: คำจำกัดความ ตัวอย่าง และวิธีการทำงาน
เบย์เซียนเน็ตเวิร์ก: คำจำกัดความ ตัวอย่าง และวิธีการทำงาน
Anonim

ความเชื่อ เครือข่ายการตัดสินใจ โมเดลเบย์เซียน (เอียน) หรือโมเดลกราฟวัฏจักรที่ขับเคลื่อนด้วยความน่าจะเป็นคือ สคีมาแบบแปรผัน (ประเภทของโมเดลทางสถิติ) ที่แสดงชุดของตัวแปรและการขึ้นต่อกันแบบมีเงื่อนไขผ่านกราฟอะไซคลิกโดยตรง (DAG)).

ตัวอย่างเช่น เครือข่าย Bayesian สามารถแสดงถึงความสัมพันธ์ที่น่าจะเป็นระหว่างโรคและอาการต่างๆ เครือข่ายสามารถใช้ในการคำนวณความเป็นไปได้ของการมีโรคต่างๆ ในวิดีโอด้านล่าง คุณสามารถดูตัวอย่างเครือข่ายความเชื่อแบบเบย์พร้อมการคำนวณ

Image
Image

ประสิทธิภาพ

อัลกอริธึมที่มีประสิทธิภาพสามารถอนุมานและเรียนรู้บนเครือข่ายแบบเบย์ได้ เครือข่ายที่สร้างแบบจำลองตัวแปร (เช่น สัญญาณเสียงพูดหรือลำดับโปรตีน) เรียกว่าเครือข่ายแบบไดนามิก ลักษณะทั่วไปของเครือข่ายแบบเบย์ที่สามารถแสดงและแก้ปัญหาภายใต้ความไม่แน่นอนได้เรียกว่าแผนภาพอิทธิพล

เอสเซนส์

เป็นทางการเครือข่ายแบบเบย์คือ DAG ซึ่งโหนดเป็นตัวแทนของตัวแปรในความหมายแบบเบย์: สามารถสังเกตค่า ตัวแปรที่ซ่อนอยู่ พารามิเตอร์ที่ไม่รู้จัก หรือสมมติฐาน เพราะมันน่าสนใจมาก

ตัวอย่างเครือข่ายแบบเบย์

สองเหตุการณ์อาจทำให้หญ้าเปียก: สปริงเกอร์ทำงานหรือฝนตก ฝนมีผลโดยตรงต่อการใช้สปริงเกอร์ (กล่าวคือเมื่อฝนตก สปริงเกอร์มักจะไม่ทำงาน) สถานการณ์นี้สามารถจำลองได้โดยใช้เครือข่ายแบบเบย์

สูตรทั่วไป
สูตรทั่วไป

จำลองสถานการณ์

เนื่องจากเครือข่าย Bayesian เป็นแบบอย่างที่สมบูรณ์สำหรับตัวแปรและความสัมพันธ์ จึงสามารถใช้เพื่อตอบคำถามเกี่ยวกับความน่าจะเป็นของพวกมัน ตัวอย่างเช่น สามารถใช้เพื่ออัปเดตความรู้เกี่ยวกับสถานะของชุดย่อยของตัวแปรเมื่อสังเกตข้อมูลอื่น (ตัวแปรหลักฐาน) กระบวนการที่น่าสนใจนี้เรียกว่าการอนุมานความน่าจะเป็น

หลังให้สถิติเพียงพอในระดับสากลสำหรับแอปพลิเคชันการค้นพบเมื่อเลือกค่าสำหรับชุดย่อยของตัวแปร ดังนั้น อัลกอริธึมนี้จึงถือได้ว่าเป็นกลไกสำหรับการนำทฤษฎีบทของเบย์ไปใช้กับปัญหาที่ซับซ้อนโดยอัตโนมัติ ในรูปภาพในบทความ คุณสามารถดูตัวอย่างเครือข่ายความเชื่อแบบเบย์ได้

เครือข่าย Bayesian ที่ใช้งานได้จริง
เครือข่าย Bayesian ที่ใช้งานได้จริง

วิธีการส่งออก

วิธีการอนุมานที่แน่นอนที่สุดคือ: การกำจัดตัวแปร ซึ่งกำจัด (โดยการรวมหรือการรวม) สิ่งที่ไม่สามารถสังเกตได้พารามิเตอร์ที่ไม่ใช่การสืบค้นทีละรายการโดยการจัดสรรจำนวนเงินให้กับผลิตภัณฑ์

คลิกการขยายพันธุ์ของ "ต้นไม้" ที่แคชการคำนวณเพื่อให้สามารถสืบค้นตัวแปรจำนวนมากได้ในครั้งเดียว และสามารถเผยแพร่การพิสูจน์ใหม่ได้อย่างรวดเร็ว และการจับคู่แบบเรียกซ้ำและ/หรือการค้นหา ซึ่งช่วยให้สามารถแลกเปลี่ยนระหว่างพื้นที่และเวลา และจับคู่ประสิทธิภาพของการกำจัดตัวแปรเมื่อใช้พื้นที่เพียงพอ

วิธีการทั้งหมดเหล่านี้มีความซับซ้อนพิเศษที่ขึ้นอยู่กับความยาวของเครือข่ายแบบทวีคูณ อัลกอริธึมการอนุมานโดยประมาณที่พบบ่อยที่สุดคือการกำจัดกลุ่มย่อย การเผยแพร่ความเชื่อแบบวนซ้ำ การเผยแพร่ความเชื่อทั่วไป และวิธีการผันแปร

ประเภทของเครือข่าย
ประเภทของเครือข่าย

เครือข่าย

ในการระบุเครือข่ายเบย์เซียนอย่างครบถ้วนและด้วยเหตุนี้จึงแสดงการกระจายความน่าจะเป็นร่วมกัน จำเป็นต้องระบุการแจกแจงความน่าจะเป็นสำหรับ X สำหรับแต่ละโหนด X เนื่องจากพาเรนต์ของ X

การแจกแจง X แบบมีเงื่อนไขโดยผู้ปกครองสามารถมีรูปแบบใดก็ได้ เป็นเรื่องปกติที่จะทำงานกับการแจกแจงแบบแยกส่วนหรือแบบเกาส์เซียน เนื่องจากจะทำให้การคำนวณง่ายขึ้น บางครั้งทราบเฉพาะข้อจำกัดในการกระจายเท่านั้น จากนั้น คุณสามารถใช้เอนโทรปีเพื่อกำหนดการกระจายเดี่ยวที่มีเอนโทรปีสูงสุดตามข้อจำกัด

ในทำนองเดียวกัน ในบริบทเฉพาะของเครือข่าย Bayesian แบบไดนามิก การกระจายแบบมีเงื่อนไขสำหรับวิวัฒนาการชั่วขณะของแฝงปกติจะถูกตั้งค่าให้เพิ่มอัตราเอนโทรปีสูงสุดของกระบวนการสุ่มโดยนัย

เว็บเบย์ของความไว้วางใจ
เว็บเบย์ของความไว้วางใจ

ความน่าจะเป็นสูงสุดโดยตรง (หรือความน่าจะเป็นภายหลัง) มักจะเป็นเรื่องยากเนื่องจากมีตัวแปรที่ไม่ได้รับการสังเกต โดยเฉพาะอย่างยิ่งสำหรับเครือข่ายการตัดสินใจแบบเบย์

แนวทางคลาสสิก

แนวทางคลาสสิกสำหรับปัญหานี้คืออัลกอริธึมการเพิ่มความคาดหวังสูงสุด ซึ่งจะสลับการคำนวณค่าที่คาดหวังของตัวแปรที่ไม่ได้รับการสังเกตโดยขึ้นอยู่กับข้อมูลที่สังเกตด้วยการเพิ่มความน่าจะเป็นรวมสูงสุด (หรือค่าหลัง) ให้มากที่สุด โดยสมมติว่าค่าที่คาดไว้ก่อนหน้านี้ ค่าต่างๆ ถูกต้อง ภายใต้เงื่อนไขของความสม่ำเสมอปานกลาง กระบวนการนี้จะมาบรรจบกันในค่าพารามิเตอร์สูงสุด (หรือสูงสุดหลัง)

แนวทางเบย์เซียนที่สมบูรณ์ยิ่งขึ้นสำหรับพารามิเตอร์คือการปฏิบัติต่อพารามิเตอร์เหล่านี้เป็นตัวแปรที่ไม่ได้สังเกตเพิ่มเติม และคำนวณการแจกแจงหลังทั้งหมดบนโหนดทั้งหมดที่ได้รับข้อมูลที่สังเกตได้ จากนั้นจึงรวมพารามิเตอร์ วิธีการนี้อาจมีค่าใช้จ่ายสูงและส่งผลให้มีโมเดลขนาดใหญ่ ทำให้เข้าถึงวิธีการปรับแต่งพารามิเตอร์แบบคลาสสิกได้ง่ายขึ้น

ในกรณีที่ง่ายที่สุด เครือข่าย Bayesian ถูกกำหนดโดยผู้เชี่ยวชาญ แล้วใช้ในการอนุมาน ในการใช้งานอื่นๆ งานในการพิจารณานั้นยากเกินไปสำหรับมนุษย์ ในกรณีนี้ ต้องเรียนรู้โครงสร้างของโครงข่ายประสาทแบบเบย์และพารามิเตอร์ของการแจกแจงแบบโลคัลระหว่างข้อมูล

เครือข่ายเบย์เซียน
เครือข่ายเบย์เซียน

วิธีทางเลือก

วิธีการอื่นของการเรียนรู้แบบมีโครงสร้างใช้การค้นหาการเพิ่มประสิทธิภาพ สิ่งนี้ต้องใช้ฟังก์ชันการประเมินและกลยุทธ์การค้นหา อัลกอริธึมการให้คะแนนทั่วไปคือความน่าจะเป็นหลังของโครงสร้างที่ได้รับข้อมูลการฝึก เช่น BIC หรือ BDeu

เวลาที่ต้องใช้สำหรับการค้นหาอย่างละเอียดถี่ถ้วนซึ่งส่งคืนโครงสร้างที่เพิ่มคะแนนสูงสุดนั้นเป็นเลขชี้กำลังยิ่งยวดในจำนวนตัวแปร กลยุทธ์การค้นหาในท้องถิ่นทำการเปลี่ยนแปลงส่วนเพิ่มเพื่อปรับปรุงการประมาณโครงสร้าง ฟรีดแมนและเพื่อนร่วมงานพิจารณาใช้ข้อมูลร่วมกันระหว่างตัวแปรเพื่อค้นหาโครงสร้างที่ต้องการ พวกเขาจำกัดชุดของตัวเลือกระดับบนสุดไว้ที่ k โหนด และค้นหาอย่างละเอียด

วิธีการที่รวดเร็วเป็นพิเศษสำหรับการศึกษา BN อย่างแม่นยำคือการจินตนาการว่าปัญหานั้นเป็นปัญหาการเพิ่มประสิทธิภาพและแก้ปัญหาโดยใช้การเขียนโปรแกรมจำนวนเต็ม มีการเพิ่มข้อจำกัดความไม่แน่นอนในโปรแกรมจำนวนเต็ม (IP) ระหว่างการแก้ปัญหาในรูปแบบของระนาบการตัด วิธีการดังกล่าวสามารถจัดการกับปัญหาได้ถึง 100 ตัวแปร

กราฟและเครือข่าย
กราฟและเครือข่าย

การแก้ปัญหา

ในการแก้ปัญหากับตัวแปรนับพัน จำเป็นต้องมีแนวทางที่แตกต่างออกไป อย่างแรกคือเลือกหนึ่งคำสั่งซื้อแล้วค้นหาโครงสร้าง BN ที่เหมาะสมที่สุดสำหรับลำดับนั้น นี่หมายถึงการทำงานในพื้นที่ค้นหาของการสั่งซื้อที่เป็นไปได้ซึ่งสะดวกเพราะมีขนาดเล็กกว่าพื้นที่ของโครงสร้างเครือข่าย คำสั่งซื้อหลายรายการจะถูกเลือกและประเมินผล วิธีนี้กลายเป็นดีที่สุดในวรรณคดีเมื่อมีตัวแปรจำนวนมาก

อีกวิธีหนึ่งคือการเน้นที่คลาสย่อยของโมเดลที่ย่อยสลายได้ซึ่งปิด MLE จากนั้นคุณจะพบโครงสร้างที่สอดคล้องกันสำหรับตัวแปรหลายร้อยตัว

การศึกษาเครือข่ายเบย์เซียนที่มีความกว้างจำกัดสามบรรทัดเป็นสิ่งจำเป็นเพื่อให้การอนุมานที่ถูกต้องแม่นยำและตีความได้ เนื่องจากความซับซ้อนกรณีที่เลวร้ายที่สุดของหลังคือแบบเอ็กซ์โพเนนเชียลในความยาวของต้นไม้ k (ตามสมมติฐานเวลาแบบเอ็กซ์โปเนนเชียล) อย่างไรก็ตาม เนื่องจากเป็นคุณสมบัติระดับโลกของกราฟ จึงเพิ่มความซับซ้อนของกระบวนการเรียนรู้อย่างมาก ในบริบทนี้ สามารถใช้ K-tree เพื่อการเรียนรู้ที่มีประสิทธิภาพ

เครือข่ายสั้น
เครือข่ายสั้น

การพัฒนา

การพัฒนา Web of Trust แบบ Bayesian มักเริ่มต้นด้วยการสร้าง DAG G โดยที่ X จะตอบสนองทรัพย์สินของ Markov ในท้องถิ่นด้วยความเคารพต่อ G ซึ่งบางครั้งอาจเป็น DAG เชิงสาเหตุ การแจกแจงความน่าจะเป็นแบบมีเงื่อนไขของตัวแปรแต่ละตัวเหนือพาเรนต์ใน G ถูกประมาณการ ในหลายกรณี โดยเฉพาะอย่างยิ่งเมื่อตัวแปรไม่ต่อเนื่องกัน หากการแจกแจงร่วมของ X เป็นผลคูณของการแจกแจงแบบมีเงื่อนไขเหล่านี้ X จะกลายเป็นเครือข่ายแบบเบย์ ช.

"ผ้าห่มผูกปม" ของมาร์คอฟเป็นชุดนอต ผ้านวม Markov ทำให้โหนดไม่ขึ้นกับส่วนที่เหลือของโหนดว่างที่มีชื่อเดียวกัน และมีความรู้เพียงพอที่จะคำนวณการกระจาย X คือเครือข่ายเบย์เซียนที่เกี่ยวข้องกับ G หากแต่ละโหนดมีความเป็นอิสระตามเงื่อนไขของโหนดอื่นๆ ทั้งหมด เมื่อพิจารณาจาก Markovianผ้าห่ม

แนะนำ: