รายละเอียด
การเรียนรู้การเสริมแรงเป็นสาขาย่อยของการเรียนรู้ของเครื่อง แต่ยังเป็นระเบียบแบบแผนสำหรับการตัดสินใจอัตโนมัติและ AI หลักสูตรนี้จะแนะนำให้คุณรู้จักกับเทคนิคการเรียนรู้เชิงสถิติที่ตัวแทนกระทำการอย่างชัดเจนและโต้ตอบกับโลก การทำความเข้าใจถึงความสำคัญและความท้าทายของตัวแทนการเรียนรู้ที่ตัดสินใจได้นั้นมีความสำคัญอย่างยิ่งในปัจจุบันโดยมี บริษัท จำนวนมากที่สนใจในตัวแทนแบบโต้ตอบและการตัดสินใจอย่างชาญฉลาด
หลักสูตรนี้จะแนะนำคุณเกี่ยวกับพื้นฐานของการเรียนรู้การเสริมแรง เมื่อคุณจบหลักสูตรนี้คุณจะ:
- จัดรูปแบบปัญหาให้เป็นกระบวนการตัดสินใจของ Markov
- ทำความเข้าใจวิธีการสำรวจพื้นฐานและการแลกเปลี่ยนการสำรวจ / การแสวงหาผลประโยชน์
- ทำความเข้าใจฟังก์ชันค่าเป็นเครื่องมือที่ใช้งานทั่วไปเพื่อการตัดสินใจที่ดีที่สุด
- รู้วิธีใช้การเขียนโปรแกรมแบบไดนามิกเป็นแนวทางการแก้ปัญหาที่มีประสิทธิภาพสำหรับปัญหาการควบคุมอุตสาหกรรม
หลักสูตรนี้จะสอนแนวคิดที่สำคัญของการเรียนรู้การเสริมแรงอัลกอริทึมพื้นฐานและคลาสสิกที่ทันสมัยใน RL หลังจากจบหลักสูตรนี้คุณจะสามารถเริ่มใช้ RL สำหรับปัญหาจริงที่คุณมีหรือสามารถระบุ MDP
นี่เป็นหลักสูตรแรกของความเชี่ยวชาญการเสริมแรงการเรียนรู้
ราคา: ลงทะเบียนฟรี!
ÀÒÉÒ: ภาษาอังกฤษ
คำบรรยาย: ภาษาอังกฤษ
TUN ช่วยนักศึกษา!
ทุนการศึกษา
สังคม
ลิขสิทธิ์ 2024 – TUN, Inc