รายละเอียด
หลักสูตรนี้สำหรับนักเรียนที่มีประสบการณ์เกี่ยวกับ SQL และตอนนี้ต้องการก้าวต่อไปในการทำความคุ้นเคยกับการคำนวณแบบกระจายโดยใช้ Spark นักเรียนจะได้รับความเข้าใจเกี่ยวกับเวลาที่จะใช้ Spark และวิธีที่ Spark เป็นเครื่องมือที่ผสานเทคโนโลยี Data และ AI ในระดับที่ไม่ซ้ำกัน โมดูลสี่ตัวต่อกันและในตอนท้ายของหลักสูตรที่นักเรียนจะเข้าใจ: สถาปัตยกรรม Spark, Spark DataFrame, การเพิ่มประสิทธิภาพการอ่าน / เขียนข้อมูลและวิธีการสร้างรูปแบบการเรียนรู้ของเครื่อง โมดูลแรกจะแนะนำ Spark รวมถึงวิธีการทำงานของ Spark กับการคำนวณแบบกระจายและ Spark Dataframes คืออะไร โมดูล 2 ครอบคลุมแนวคิดหลักของ Spark เช่นหน่วยเก็บข้อมูลเทียบกับการคำนวณแคชพาร์ติชันและ Spark UI โมดูลที่สามดูที่ท่อข้อมูลวิศวกรรมซึ่งครอบคลุมการเชื่อมต่อกับฐานข้อมูลสกีมาและประเภทรูปแบบไฟล์และการเขียนข้อมูลที่ดี โมดูลขั้นสุดท้ายดูที่การประยุกต์ใช้ Spark กับการเรียนรู้ของเครื่องผ่านกรณีการใช้งานทางธุรกิจการแนะนำสั้น ๆ เกี่ยวกับการเรียนรู้ของเครื่องคือการสร้างและการใช้โมเดลและสรุปหลักสูตรขั้นสุดท้าย โดยการทำความเข้าใจว่าเมื่อใดควรใช้ Spark ไม่ว่าจะขยายขนาดเมื่อโมเดลหรือข้อมูลมีขนาดใหญ่เกินกว่าที่จะประมวลผลบนเครื่องเดียวหรือมีความต้องการเพียงเร่งความเร็วเพื่อให้ได้ผลลัพธ์ที่เร็วขึ้นนักเรียนจะฝึกฝนทักษะ SQL ของพวกเขา นักวิทยาศาสตร์
ราคา: ลงทะเบียนฟรี!
ÀÒÉÒ: ภาษาอังกฤษ
คำบรรยาย: ภาษาอังกฤษ
การคำนวณแบบกระจายด้วย Spark SQL - มหาวิทยาลัยแห่งแคลิฟอร์เนียเดวิส
TUN ช่วยนักศึกษา!
ทุนการศึกษา
สังคม
ลิขสิทธิ์ 2024 – TUN, Inc