เครือข่ายมหาวิทยาลัย

การเรียนรู้การเสริมแรงภาคปฏิบัติ

รายละเอียด

ยินดีต้อนรับสู่หลักสูตรการเรียนรู้การเสริมแรง

ที่นี่คุณจะพบกับ:

- พื้นฐานของวิธีการ RL: การวนซ้ำค่า / นโยบาย, การเรียนรู้ q, การไล่ระดับนโยบาย ฯลฯ
- รวมคณิตศาสตร์และแบตเตอรี่

- ใช้โครงข่ายประสาทเทียมแบบลึกสำหรับงาน RL
- หรือที่เรียกว่า“ รถไฟไฮป์”

- อัลกอริทึม RL ที่ทันสมัย
- และวิธีใช้เทปพันสายไฟสำหรับปัญหาในทางปฏิบัติ

- และแน่นอนว่าการสอนเครือข่ายประสาทเทียมของคุณให้เล่นเกม
- เพราะนั่นคือสิ่งที่ทุกคนคิดว่า RL เป็นเรื่องเกี่ยวกับ นอกจากนี้เรายังใช้สำหรับ seq2seq และกลุ่มโจรตามบริบท

กระโดดเข้ามาสิจะสนุก!

คุณมีปัญหาทางเทคนิคหรือไม่? เขียนถึงเรา: coursera@hse.ru

ราคา: ลงทะเบียนฟรี!

ÀÒÉÒ: English

คำบรรยาย: ภาษาอังกฤษ, เกาหลี

การเรียนรู้การเสริมแรงภาคปฏิบัติ - คณะเศรษฐศาสตร์มหาวิทยาลัยวิจัยแห่งชาติ