รายละเอียด
ยินดีต้อนรับสู่หลักสูตรการเรียนรู้การเสริมแรง
ที่นี่คุณจะพบกับ:
- พื้นฐานของวิธีการ RL: การวนซ้ำค่า / นโยบาย, การเรียนรู้ q, การไล่ระดับนโยบาย ฯลฯ
- รวมคณิตศาสตร์และแบตเตอรี่
- ใช้โครงข่ายประสาทเทียมแบบลึกสำหรับงาน RL
- หรือที่เรียกว่า“ รถไฟไฮป์”
- อัลกอริทึม RL ที่ทันสมัย
- และวิธีใช้เทปพันสายไฟสำหรับปัญหาในทางปฏิบัติ
- และแน่นอนว่าการสอนเครือข่ายประสาทเทียมของคุณให้เล่นเกม
- เพราะนั่นคือสิ่งที่ทุกคนคิดว่า RL เป็นเรื่องเกี่ยวกับ นอกจากนี้เรายังใช้สำหรับ seq2seq และกลุ่มโจรตามบริบท
กระโดดเข้ามาสิจะสนุก!
คุณมีปัญหาทางเทคนิคหรือไม่? เขียนถึงเรา: coursera@hse.ru
ราคา: ลงทะเบียนฟรี!
ÀÒÉÒ: ภาษาอังกฤษ
คำบรรยาย: ภาษาอังกฤษ, เกาหลี
การเรียนรู้การเสริมแรงภาคปฏิบัติ - คณะเศรษฐศาสตร์มหาวิทยาลัยวิจัยแห่งชาติ
TUN ช่วยนักศึกษา!
ทุนการศึกษา
สังคม
ลิขสิทธิ์ 2024 – TUN, Inc