เป็นเวลาหลายปีแล้วที่ผู้คนคาดการณ์สภาพอากาศ เหตุการณ์ทางเศรษฐกิจและการเมือง และผลกีฬา เมื่อเร็ว ๆ นี้รายการที่ครอบคลุมนี้ได้รับการเติมเต็มด้วย cryptocurrencies สำหรับการทำนายเหตุการณ์ที่หลากหลาย มีหลายวิธีในการพัฒนาการคาดการณ์ ตัวอย่างเช่น สัญชาตญาณ ความคิดเห็นของผู้เชี่ยวชาญ การใช้ผลลัพธ์ในอดีตเพื่อเปรียบเทียบกับสถิติแบบดั้งเดิม และการคาดการณ์อนุกรมเวลาเป็นเพียงหนึ่งในนั้น ในขณะที่ประเภทการคาดการณ์ที่ทันสมัยและแม่นยำที่สุดพร้อมแอปพลิเคชันที่หลากหลาย
วิธีอนุกรมเวลา
วิธีอนุกรมเวลา (TS) คือชุดข้อมูลที่รวบรวมข้อมูลในช่วงระยะเวลาหนึ่ง มีวิธีพิเศษในการแยกประเภทนี้:
- เชิงเส้นและไม่เชิงเส้น;
- แบบพาราเมตริกและแบบไม่ใช้พาราเมตริก
- หนึ่งมิติและหลายมิติ
เวลาพยากรณ์ซีรีส์นำเสนอชุดความสามารถเฉพาะตัวเพื่อตอบสนองความท้าทายในปัจจุบัน การสร้างแบบจำลองอาศัยการเรียนรู้เพื่อสร้างแรงผลักดันเบื้องหลังการเปลี่ยนแปลงข้อมูล กระบวนการนี้มาจากแนวโน้มในระยะยาว ผลกระทบตามฤดูกาล หรือความผันผวนที่ไม่ปกติซึ่งเป็นลักษณะของ TS และไม่พบในการวิเคราะห์ประเภทอื่น
แมชชีนเลิร์นนิงเป็นสาขาหนึ่งของวิทยาการคอมพิวเตอร์ที่รวบรวมอัลกอริทึมจากข้อมูลและรวมถึงเครือข่ายประสาทเทียม การเรียนรู้เชิงลึก กฎการเชื่อมโยง แผนผังการตัดสินใจ การเรียนรู้แบบเสริมกำลัง และเครือข่ายแบบเบเซียน อัลกอริธึมที่หลากหลายให้ทางเลือกในการแก้ปัญหา โดยแต่ละขั้นตอนมีข้อกำหนดและข้อแลกเปลี่ยนในแง่ของการป้อนข้อมูล ความเร็ว และความถูกต้องของผลลัพธ์ สิ่งเหล่านี้ พร้อมด้วยความแม่นยำของการคาดคะเนขั้นสุดท้าย จะมีน้ำหนักเมื่อผู้ใช้ตัดสินใจว่าอัลกอริธึมใดจะทำงานได้ดีที่สุดสำหรับสถานการณ์ที่กำลังศึกษา
การพยากรณ์อนุกรมเวลายืมมาจากสาขาสถิติ แต่ให้แนวทางใหม่ในการสร้างแบบจำลองปัญหา ปัญหาหลักสำหรับแมชชีนเลิร์นนิงและอนุกรมเวลาเหมือนกัน - ในการทำนายผลลัพธ์ใหม่โดยอิงจากข้อมูลที่ทราบก่อนหน้านี้
เป้าหมายของแบบจำลองการทำนาย
TS คือชุดของจุดข้อมูลที่รวบรวมตามช่วงเวลาปกติ พวกเขาจะวิเคราะห์เพื่อกำหนดแนวโน้มระยะยาว ทำนายอนาคต หรือทำการวิเคราะห์ประเภทอื่น มี 2 สิ่งที่ทำให้ TS แตกต่างจากปัญหาการถดถอยปกติ:
- ขึ้นอยู่กับเวลา ดังนั้นสมมติฐานพื้นฐานของตัวแบบการถดถอยเชิงเส้นที่การสังเกตเป็นอิสระจะไม่ถือในกรณีนี้
- พร้อมกับแนวโน้มที่เพิ่มขึ้นหรือลดลง TS ส่วนใหญ่มีรูปแบบของฤดูกาลบางอย่าง เช่น การเปลี่ยนแปลงที่เฉพาะเจาะจงสำหรับช่วงเวลาหนึ่ง
เป้าหมายของแบบจำลองการพยากรณ์อนุกรมเวลาคือการให้การคาดการณ์ที่แม่นยำตามความต้องการ อนุกรมเวลามีเวลา (t) เป็นตัวแปรอิสระและตัวแปรตามเป้าหมาย ในกรณีส่วนใหญ่ การคาดการณ์เป็นผลเฉพาะ เช่น ราคาขายบ้าน ผลการแข่งขันกีฬา ผลการซื้อขายในตลาดหลักทรัพย์ การคาดคะเนแสดงถึงค่ามัธยฐานและค่าเฉลี่ย และรวมถึงช่วงความเชื่อมั่นที่แสดงระดับความเชื่อมั่นในช่วง 80-95% เมื่อบันทึกเป็นช่วงเวลาปกติ กระบวนการจะเรียกว่าอนุกรมเวลาและแสดงเป็นสองวิธี:
- หนึ่งมิติพร้อมดัชนีเวลาที่สร้างลำดับโดยปริยาย
- ชุดที่มีสองมิติ: เวลากับตัวแปรอิสระและตัวแปรตามอื่น
การสร้างคุณสมบัติเป็นหนึ่งในงานที่สำคัญและใช้เวลานานที่สุดในการเรียนรู้ของเครื่องที่ใช้ อย่างไรก็ตาม การคาดการณ์อนุกรมเวลาไม่ได้สร้างคุณลักษณะ อย่างน้อยก็ไม่ใช่ในความหมายดั้งเดิม โดยเฉพาะอย่างยิ่งเมื่อคุณต้องการทำนายผลลัพธ์หลายขั้นตอนข้างหน้า ไม่ใช่แค่ค่าถัดไป
นี่ไม่ได้หมายความว่าฟีเจอร์จะถูกปิดการใช้งานโดยสิ้นเชิง ควรใช้ด้วยความระมัดระวังด้วยเหตุผลดังต่อไปนี้:
- ไม่ชัดเจนอนาคตที่แท้จริงค่าจะเป็นสำหรับคุณสมบัติเหล่านี้
- หากวัตถุคาดเดาได้และมีรูปแบบบางอย่าง คุณสามารถสร้างแบบจำลองการทำนายสำหรับแต่ละวัตถุได้
อย่างไรก็ตาม โปรดทราบว่าการใช้ค่าการทำนายเนื่องจากคุณสมบัติจะกระจายข้อผิดพลาดไปยังตัวแปรเป้าหมายและนำไปสู่ข้อผิดพลาดหรือการคาดคะเนแบบเอนเอียง
ส่วนประกอบอนุกรมเวลา
แนวโน้มจะเกิดขึ้นเมื่อซีรีส์เพิ่มขึ้น ลดลง หรือคงระดับที่คงที่เมื่อเวลาผ่านไป ดังนั้นจึงถือเป็นฟังก์ชัน ฤดูกาลหมายถึงคุณสมบัติของอนุกรมเวลาที่แสดงรูปแบบเป็นระยะที่ทำซ้ำที่ความถี่คงที่ (m) เช่น m=12 หมายถึงรูปแบบจะซ้ำทุก ๆ สิบสองเดือน
ตัวแปรจำลองที่คล้ายกับฤดูกาลสามารถเพิ่มเป็นฟังก์ชันไบนารีได้ ตัวอย่างเช่น คุณสามารถคำนึงถึงวันหยุด กิจกรรมพิเศษ แคมเปญการตลาด ไม่ว่ามูลค่าจะเป็นต่างประเทศหรือไม่ก็ตาม อย่างไรก็ตาม คุณต้องจำไว้ว่าตัวแปรเหล่านี้ต้องมีรูปแบบที่แน่นอน อย่างไรก็ตาม จำนวนวันสามารถคำนวณได้อย่างง่ายดายแม้สำหรับช่วงเวลาในอนาคตและมีอิทธิพลต่อการคาดการณ์อนุกรมเวลา โดยเฉพาะอย่างยิ่งในด้านการเงิน
รอบคือฤดูกาลที่ไม่ได้เกิดขึ้นในอัตราคงที่ ตัวอย่างเช่น คุณลักษณะการสืบพันธุ์ประจำปีของแมวป่าชนิดหนึ่งของแคนาดาสะท้อนถึงรูปแบบตามฤดูกาลและวัฏจักร โดยจะไม่เกิดซ้ำเป็นระยะๆ และอาจเกิดขึ้นได้แม้ว่าความถี่จะเท่ากับ 1 (m=1)
Lagged ค่า -ค่าที่ล้าหลังของตัวแปรสามารถรวมเป็นตัวทำนายได้ บางรุ่น เช่น ARIMA, Vector Autoregression (VAR) หรือ Autoregressive Neural Networks (NNAR) ทำงานในลักษณะนี้
องค์ประกอบของตัวแปรที่สนใจมีความสำคัญมากสำหรับการวิเคราะห์และคาดการณ์อนุกรมเวลา เพื่อทำความเข้าใจพฤติกรรม รูปแบบ และสามารถเลือกรูปแบบที่เหมาะสมได้
แอตทริบิวต์ชุดข้อมูล
คุณอาจเคยชินกับการป้อนจุดข้อมูลนับพัน ล้าน และหลายพันล้านจุดลงในโมเดลการเรียนรู้ของเครื่อง แต่ไม่จำเป็นสำหรับอนุกรมเวลา ในความเป็นจริง เป็นไปได้ที่จะทำงานกับ TS ขนาดเล็กและขนาดกลาง ขึ้นอยู่กับความถี่และประเภทของตัวแปร และนี่ไม่ใช่ข้อเสียของวิธีการ นอกจากนี้ยังมีข้อดีหลายประการสำหรับวิธีนี้:
- ชุดข้อมูลดังกล่าวจะสอดคล้องกับความสามารถของคอมพิวเตอร์ที่บ้าน
- ในบางกรณี ทำการวิเคราะห์อนุกรมเวลาและพยากรณ์โดยใช้ชุดข้อมูลทั้งหมด ไม่ใช่แค่ตัวอย่าง
- TS มีประโยชน์สำหรับการสร้างกราฟที่สามารถวิเคราะห์ได้ นี่เป็นจุดสำคัญมากเพราะโปรแกรมเมอร์พึ่งพากราฟิกในขั้นตอนการวิเคราะห์ นี่ไม่ได้หมายความว่าพวกเขาจะไม่ทำงานกับอนุกรมเวลาขนาดใหญ่ แต่ในตอนแรกพวกเขาควรจะสามารถจัดการกับ TS ที่เล็กกว่าได้
- ชุดข้อมูลใดๆ ที่มีฟิลด์ที่เกี่ยวข้องกับเวลาสามารถได้รับประโยชน์จากการวิเคราะห์และคาดการณ์อนุกรมเวลา อย่างไรก็ตาม หากโปรแกรมเมอร์มีชุดข้อมูลที่ใหญ่กว่า DB (TSDB)อาจจะเหมาะสมกว่า
บางชุดมาจากเหตุการณ์ที่บันทึกด้วยการประทับเวลา บันทึกของระบบ และข้อมูลทางการเงิน เนื่องจาก TSDB ทำงานโดยกำเนิดกับอนุกรมเวลา จึงเป็นโอกาสที่ดีที่จะนำเทคนิคนี้ไปใช้กับชุดข้อมูลขนาดใหญ่
การเรียนรู้ของเครื่อง
แมชชีนเลิร์นนิง (ML) มีประสิทธิภาพดีกว่าวิธีการพยากรณ์อนุกรมเวลาแบบเดิม มีการศึกษามากมายที่เปรียบเทียบวิธีการเรียนรู้ของเครื่องกับวิธีทางสถิติแบบดั้งเดิมในข้อมูล TS โครงข่ายประสาทเทียมเป็นหนึ่งในเทคโนโลยีที่ได้รับการวิจัยอย่างกว้างขวางและประยุกต์ใช้แนวทาง TS วิธีการเรียนรู้ของเครื่องเป็นผู้นำการจัดอันดับสำหรับการรวบรวมข้อมูลตามอนุกรมเวลา ชุดเหล่านี้ได้รับการพิสูจน์แล้วว่ามีประสิทธิภาพ เหนือกว่าชุด TS ที่บริสุทธิ์เมื่อเทียบกับ M3 หรือ Kaggle
MO มีปัญหาเฉพาะของตัวเอง การพัฒนาคุณลักษณะหรือการสร้างตัวทำนายใหม่จากชุดข้อมูลเป็นขั้นตอนที่สำคัญ และอาจส่งผลกระทบอย่างมากต่อประสิทธิภาพและเป็นวิธีที่จำเป็นในการแก้ไขปัญหาแนวโน้มและฤดูกาลของข้อมูล TS นอกจากนี้ บางรุ่นยังมีปัญหากับความเหมาะสมของข้อมูล และหากไม่เป็นเช่นนั้น ก็อาจพลาดเทรนด์หลัก
อนุกรมเวลาและวิธีการเรียนรู้ของเครื่องไม่ควรแยกออกจากกัน สามารถนำมารวมกันเพื่อให้เกิดประโยชน์ของแต่ละแนวทาง วิธีการพยากรณ์และการวิเคราะห์อนุกรมเวลาเป็นสิ่งที่ดีในการแยกย่อยข้อมูลออกเป็นข้อมูลแนวโน้มและฤดูกาลองค์ประกอบ การวิเคราะห์นี้สามารถใช้เป็นข้อมูลป้อนเข้าสู่โมเดล ML ที่มีข้อมูลแนวโน้มและฤดูกาลในอัลกอริธึม ทำให้ดีที่สุดของทั้งสองโลก
ทำความเข้าใจคำชี้แจงปัญหา
ตัวอย่างเช่น ให้พิจารณา TS ที่เกี่ยวข้องกับการคาดการณ์จำนวนผู้โดยสารในบริการรถไฟความเร็วสูงรูปแบบใหม่ ตัวอย่างเช่น คุณมีข้อมูล 2 ปี (สิงหาคม 2016 - กันยายน 2018) และด้วยข้อมูลนี้ คุณต้องคาดการณ์จำนวนผู้โดยสารในช่วง 7 เดือนข้างหน้า โดยมีข้อมูล 2 ปี (2016-2018) ที่ระดับรายชั่วโมงด้วย จำนวนผู้โดยสารที่เดินทาง และจำเป็นต้องประมาณจำนวนผู้โดยสารในอนาคต
ชุดย่อยของชุดข้อมูลสำหรับการคาดการณ์ด้วยอนุกรมเวลา:
- กำลังสร้างไฟล์รถไฟและทดสอบการจำลอง
- 14 เดือนแรก (ส.ค. 2559 - ต.ค. 2560) ใช้เป็นข้อมูลการฝึก และอีก 2 เดือนข้างหน้า (พ.ย. 2560 - ธ.ค. 2560) เป็นข้อมูลการทดสอบ
- รวมชุดข้อมูลในแต่ละวัน
สร้างภาพข้อมูลเพื่อดูว่ามีการเปลี่ยนแปลงอย่างไรในช่วงเวลาหนึ่ง
วิธีสร้างแนวทางไร้เดียงสา
ไลบรารีที่ใช้ในกรณีนี้สำหรับการทำนาย TS คือ statsmodels จะต้องติดตั้งก่อนจึงจะสามารถใช้วิธีการเหล่านี้ได้ บางที statsmodels ได้รับการติดตั้งในสภาพแวดล้อม Python แล้ว แต่ไม่รองรับเมธอดการคาดคะเน ดังนั้นคุณจะต้องโคลนจากที่เก็บและติดตั้งจากแหล่งที่มา
สำหรับตัวอย่างนี้ หมายความว่าราคาเดินทางแบบเหรียญจะคงที่ตั้งแต่เริ่มต้นและตลอดระยะเวลาทั้งหมด วิธีนี้อนุมานว่าจุดที่คาดหวังถัดไปมีค่าเท่ากับจุดที่สังเกตล่าสุดและเรียกว่าวิธีไร้เดียงสา
ตอนนี้คำนวณค่าเบี่ยงเบนมาตรฐานเพื่อทดสอบความถูกต้องของแบบจำลองในชุดข้อมูลทดสอบ จากค่า RMSE และกราฟด้านบน เราสามารถสรุปได้ว่าไร้เดียงสาไม่เหมาะสำหรับตัวเลือกที่มีความผันผวนสูง แต่ใช้สำหรับตัวเลือกที่เสถียร
แบบธรรมดา
ในการสาธิตวิธีการ แผนภูมิจะถูกวาด โดยสมมติว่าแกน Y แทนราคา และแกน X แทนเวลา (วัน)
จากนี้ไปเราสามารถสรุปได้ว่าราคาเพิ่มขึ้นและลดลงแบบสุ่มโดยมีมาร์จิ้นเล็กน้อย เพื่อให้ค่าเฉลี่ยคงที่ ในกรณีนี้ คุณสามารถทำนายราคาของงวดถัดไปได้ ใกล้เคียงกับค่าเฉลี่ยของวันที่ผ่านมา
วิธีการพยากรณ์ด้วยค่าเฉลี่ยที่คาดไว้ของจุดที่สังเกตได้ก่อนหน้านี้เรียกว่าวิธีเฉลี่ยอย่างง่าย
ในกรณีนี้ จะใช้ค่าที่รู้จักก่อนหน้านี้ ค่าเฉลี่ยจะถูกคำนวณและนำมาเป็นค่าถัดไป แน่นอนว่าสิ่งนี้ไม่แน่ชัด แต่ก็ค่อนข้างใกล้เคียง และมีบางสถานการณ์ที่วิธีนี้ใช้ได้ผลดีที่สุด
ตามผลลัพธ์ที่แสดงบนกราฟ วิธีนี้ใช้ได้ผลดีที่สุดเมื่อค่าเฉลี่ยในแต่ละช่วงเวลาคงที่ แม้ว่าวิธีการไร้เดียงสาจะดีกว่าค่าเฉลี่ย แต่ไม่ใช่สำหรับชุดข้อมูลทั้งหมด ขอแนะนำให้ลองแต่ละรุ่นทีละขั้นตอนและดูว่ามันปรับปรุงผลลัพธ์หรือไม่
ค่าเฉลี่ยเคลื่อนที่โมเดล
จากแผนภูมินี้ เราสามารถสรุปได้ว่าราคาได้เพิ่มขึ้นหลายครั้งในอดีตด้วยระยะขอบที่กว้าง แต่ตอนนี้ทรงตัวแล้ว หากต้องการใช้วิธีหาค่าเฉลี่ยแบบเดิม คุณต้องหาค่าเฉลี่ยของข้อมูลก่อนหน้าทั้งหมด ราคาของช่วงเริ่มต้นจะมีผลอย่างมากต่อการคาดการณ์ของงวดถัดไป ดังนั้น เพื่อเป็นการปรับปรุงเหนือค่าเฉลี่ยทั่วไป ให้ใช้ค่าเฉลี่ยของราคาในช่วงสองสามช่วงที่ผ่านมาเท่านั้น
เทคนิคการพยากรณ์นี้เรียกว่าเทคนิคเส้นค่าเฉลี่ยเคลื่อนที่ ซึ่งบางครั้งเรียกว่า "หน้าต่างเคลื่อนที่" ขนาด "n" การใช้แบบจำลองอย่างง่าย ค่าถัดไปใน TS จะตรวจสอบความถูกต้องของวิธีการ ชัดเจนว่าไร้เดียงสาดีกว่าทั้งค่าเฉลี่ยและค่าเฉลี่ยเคลื่อนที่สำหรับชุดข้อมูลนี้
มีการคาดการณ์แบบต่างๆ โดยวิธีการทำให้เรียบแบบเอกซ์โพเนนเชียลอย่างง่าย ในวิธีค่าเฉลี่ยเคลื่อนที่ การสังเกต "n" ที่ผ่านมาจะมีน้ำหนักเท่ากัน ในกรณีนี้ คุณอาจพบสถานการณ์ที่ 'n' ที่ผ่านมาแต่ละรายการส่งผลต่อการคาดการณ์ในแบบของตัวเอง รูปแบบนี้ซึ่งให้น้ำหนักการสังเกตที่ผ่านมาแตกต่างกัน เรียกว่าวิธีการค่าเฉลี่ยเคลื่อนที่ถ่วงน้ำหนัก
การถอดรูปแบบ
คุณสมบัติที่สำคัญที่สุดอย่างหนึ่งที่จำเป็นในการพิจารณาอัลกอริธึมการคาดการณ์อนุกรมเวลาคือความสามารถในการคาดการณ์รูปแบบภายนอกโดเมนข้อมูลการฝึก อัลกอริธึม ML จำนวนมากไม่มีความสามารถนี้ เนื่องจากมักจะจำกัดอยู่เฉพาะภูมิภาคที่กำหนดโดยข้อมูลการฝึกอบรม จึงไม่เหมาะกับ TS โดยมีวัตถุประสงค์เพื่อฉายผลงานในอนาคต
คุณสมบัติที่สำคัญอีกประการหนึ่งของอัลกอริทึม TS คือความเป็นไปได้ที่จะได้รับช่วงความเชื่อมั่น แม้ว่าจะเป็นคุณสมบัติเริ่มต้นสำหรับโมเดล TS แต่โมเดล ML ส่วนใหญ่ไม่มีความสามารถนี้ เนื่องจากไม่ได้อิงจากการแจกแจงทางสถิติทั้งหมด
อย่าคิดว่าจะใช้วิธีการทางสถิติง่ายๆ เท่านั้นในการทำนาย TS มันไม่ใช่อย่างนั้นเลย มีแนวทางที่ซับซ้อนมากมายที่อาจมีประโยชน์มากในกรณีพิเศษ Autoregressive Autoregressive Conditional Heteroscedasticity (GARCH), Bayesian และ VAR เป็นเพียงบางส่วนเท่านั้น
นอกจากนี้ยังมีโมเดลโครงข่ายประสาทเทียมที่สามารถนำไปใช้กับอนุกรมเวลาที่ใช้ตัวทำนายที่ล้าหลัง และสามารถจัดการกับคุณสมบัติต่างๆ เช่น การถดถอยอัตโนมัติของเครือข่ายประสาท (NNAR) มีแม้กระทั่งแบบจำลองอนุกรมเวลาที่ยืมมาจากการเรียนรู้ที่ซับซ้อน โดยเฉพาะอย่างยิ่งในตระกูลเครือข่ายประสาทที่เกิดซ้ำ เช่น เครือข่าย LSTM และ GRU
ตัวชี้วัดการประมาณและการวินิจฉัยที่เหลือ
ตัวชี้วัดการทำนายที่พบบ่อยที่สุดคือrms หมายถึง ที่หลายคนใช้ในการแก้ปัญหาการถดถอย:
- MAPE เพราะมันเป็นอิสระจากมาตราส่วนและแสดงอัตราส่วนของข้อผิดพลาดต่อค่าจริงเป็นเปอร์เซ็นต์
- MASE ซึ่งแสดงให้เห็นว่าการคาดคะเนนั้นทำงานได้ดีเพียงใดเมื่อเทียบกับการคาดคะเนเฉลี่ยไร้เดียงสา
เมื่อปรับวิธีการพยากรณ์แล้ว การประเมินว่าสามารถจับภาพแบบจำลองได้ดีเพียงใดจึงเป็นสิ่งสำคัญ แม้ว่าตัวชี้วัดการประเมินจะช่วยกำหนดว่าค่านั้นใกล้เคียงกับค่าจริงเพียงใด แต่ก็ไม่ได้ประเมินว่าแบบจำลองนั้นเหมาะสมกับ TS หรือไม่ ของเหลือเป็นวิธีที่ดีในการประเมินสิ่งนี้ เนื่องจากโปรแกรมเมอร์พยายามใช้รูปแบบ TS เขาจึงคาดได้ว่าข้อผิดพลาดจะมีพฤติกรรมเหมือน "สัญญาณรบกวนสีขาว" เนื่องจากแสดงถึงสิ่งที่โมเดลไม่สามารถจับภาพได้
"เสียงสีขาว" ต้องมีคุณสมบัติดังต่อไปนี้:
- ส่วนที่เหลือไม่สัมพันธ์กัน (Acf=0)
- เศษเหลือตามการแจกแจงแบบปกติโดยมีค่าเฉลี่ยเป็นศูนย์ (ไม่เอนเอียง) และความแปรปรวนคงที่
- หากไม่มีคุณสมบัติอย่างใดอย่างหนึ่งในสองคุณสมบัติ แสดงว่ายังมีช่องว่างสำหรับการปรับปรุงในแบบจำลอง
- ทดสอบคุณสมบัติค่าเฉลี่ยเป็นศูนย์ได้ง่ายๆ โดยใช้การทดสอบ T
- คุณสมบัติของภาวะปกติและความแปรปรวนคงที่ถูกควบคุมด้วยสายตาโดยใช้ฮิสโตแกรมของสิ่งตกค้างหรือการทดสอบภาวะปกติที่ไม่แปรผันที่เหมาะสม
รุ่น ARIMA
ARIMA - โมเดล AutoRegressive Integrated Moving-Average เป็นวิธีหนึ่งที่นิยมใช้กันมากที่สุดในการพยากรณ์ TS ส่วนใหญ่ผ่านการเชื่อมโยงอัตโนมัติของข้อมูลเพื่อสร้างแบบจำลองคุณภาพสูง
เมื่อทำการประเมินค่าสัมประสิทธิ์ ARIMA สมมติฐานหลักคือข้อมูลไม่คงที่ ซึ่งหมายความว่าแนวโน้มและฤดูกาลจะไม่ส่งผลต่อความแปรปรวน คุณภาพของแบบจำลองสามารถประเมินได้โดยการเปรียบเทียบแผนภาพเวลาของค่าจริงกับค่าที่คาดการณ์ไว้ หากเส้นโค้งทั้งสองอยู่ใกล้กัน ก็สามารถสันนิษฐานได้ว่าแบบจำลองนั้นเหมาะสมกับกรณีที่วิเคราะห์แล้ว ควรเปิดเผยแนวโน้มและฤดูกาล หากมี
การวิเคราะห์เศษที่เหลือควรแสดงว่าแบบจำลองพอดีหรือไม่: เศษที่เหลือแบบสุ่มหมายความว่ามีความถูกต้อง การติดตั้ง ARIMA กับพารามิเตอร์ (0, 1, 1) จะให้ผลลัพธ์เช่นเดียวกับการปรับให้เรียบแบบเอ็กซ์โปเนนเชียล และการใช้พารามิเตอร์ (0, 2, 2) จะให้ผลลัพธ์การปรับให้เรียบแบบเลขชี้กำลังสองเท่า
คุณสามารถเข้าถึงการตั้งค่า ARIMA ใน Excel:
- เริ่ม Excel.
- ค้นหา XL MINER บนแถบเครื่องมือ
- บนริบบิ้น ให้เลือก ARIMA จากเมนูแบบเลื่อนลง
สรุปความสามารถของโมเดล ARIMA:
- ARIMA - ค่าเฉลี่ยเคลื่อนที่แบบบูรณาการการถดถอยอัตโนมัติ
- รูปแบบการคาดการณ์ที่ใช้ในการวิเคราะห์อนุกรมเวลา
- ARIMA ไวยากรณ์พารามิเตอร์: ARIMA (p, d, q) โดยที่ p=จำนวนเงื่อนไขการถดถอยอัตโนมัติ d=จำนวนความแตกต่างตามฤดูกาล และ q=จำนวนเงื่อนไขค่าเฉลี่ยเคลื่อนที่
อัลกอริทึมใน SQL Server
การทายผลข้ามคือสิ่งสำคัญอย่างหนึ่งคุณสมบัติของอนุกรมเวลาในการพยากรณ์งานทางการเงิน หากใช้ซีรีส์ที่เกี่ยวข้องกันสองชุด แบบจำลองผลลัพธ์สามารถใช้ทำนายผลลัพธ์ของชุดหนึ่งตามพฤติกรรมของชุดอื่นๆ ได้
SQL Server 2008 มีคุณสมบัติอนุกรมเวลาใหม่อันทรงพลังให้เรียนรู้และใช้งาน เครื่องมือนี้มีข้อมูล TS ที่เข้าถึงได้ง่าย อินเทอร์เฟซที่ใช้งานง่ายสำหรับการจำลองและจำลองฟังก์ชันอัลกอริทึม และหน้าต่างคำอธิบายพร้อมลิงก์ไปยังข้อความค้นหา DMX ฝั่งเซิร์ฟเวอร์ เพื่อให้คุณเข้าใจสิ่งที่เกิดขึ้นภายในได้
อนุกรมเวลาของตลาดเป็นพื้นที่กว้างๆ ที่สามารถใช้โมเดลการเรียนรู้เชิงลึกและอัลกอริธึมได้ ธนาคาร โบรกเกอร์ และกองทุนกำลังทดลองใช้งานการวิเคราะห์และการคาดการณ์สำหรับดัชนี อัตราแลกเปลี่ยน ฟิวเจอร์ส ราคาสกุลเงินดิจิทัล หุ้นรัฐบาล และอื่นๆ
ในการพยากรณ์อนุกรมเวลา โครงข่ายประสาทเทียมจะค้นหารูปแบบที่คาดการณ์ได้โดยศึกษาโครงสร้างและแนวโน้มของตลาดและให้คำแนะนำแก่ผู้ค้า เครือข่ายเหล่านี้สามารถช่วยตรวจจับความผิดปกติ เช่น จุดสูงสุดที่ไม่คาดคิด การลดลง การเปลี่ยนแปลงของแนวโน้ม และการเลื่อนระดับ โมเดลปัญญาประดิษฐ์จำนวนมากใช้สำหรับการคาดการณ์ทางการเงิน