มหาวิทยาลัยอัลเบอร์ตาการศึกษาออนไลน์ฟรี

พื้นฐานการเรียนรู้การเสริมแรง

รายละเอียด

การเรียนรู้การเสริมแรงเป็นสาขาย่อยของการเรียนรู้ของเครื่อง แต่ยังเป็นระเบียบแบบแผนสำหรับการตัดสินใจอัตโนมัติและ AI หลักสูตรนี้จะแนะนำให้คุณรู้จักกับเทคนิคการเรียนรู้เชิงสถิติที่ตัวแทนกระทำการอย่างชัดเจนและโต้ตอบกับโลก การทำความเข้าใจถึงความสำคัญและความท้าทายของตัวแทนการเรียนรู้ที่ตัดสินใจได้นั้นมีความสำคัญอย่างยิ่งในปัจจุบันโดยมี บริษัท จำนวนมากที่สนใจในตัวแทนแบบโต้ตอบและการตัดสินใจอย่างชาญฉลาด

หลักสูตรนี้จะแนะนำคุณเกี่ยวกับพื้นฐานของการเรียนรู้การเสริมแรง เมื่อคุณจบหลักสูตรนี้คุณจะ:
- จัดรูปแบบปัญหาให้เป็นกระบวนการตัดสินใจของ Markov
- ทำความเข้าใจวิธีการสำรวจพื้นฐานและการแลกเปลี่ยนการสำรวจ / การแสวงหาผลประโยชน์
- ทำความเข้าใจฟังก์ชันค่าเป็นเครื่องมือที่ใช้งานทั่วไปเพื่อการตัดสินใจที่ดีที่สุด
- รู้วิธีใช้การเขียนโปรแกรมแบบไดนามิกเป็นแนวทางการแก้ปัญหาที่มีประสิทธิภาพสำหรับปัญหาการควบคุมอุตสาหกรรม

หลักสูตรนี้จะสอนแนวคิดที่สำคัญของการเรียนรู้การเสริมแรงอัลกอริทึมพื้นฐานและคลาสสิกที่ทันสมัยใน RL หลังจากจบหลักสูตรนี้คุณจะสามารถเริ่มใช้ RL สำหรับปัญหาจริงที่คุณมีหรือสามารถระบุ MDP

นี่เป็นหลักสูตรแรกของความเชี่ยวชาญการเสริมแรงการเรียนรู้

ราคา: ลงทะเบียนฟรี!

ÀÒÉÒ: ภาษาอังกฤษ

คำบรรยาย: ภาษาอังกฤษ

พื้นฐานการเรียนรู้การเสริมแรง - มหาวิทยาลัยอัลเบอร์ตา