การคำนวณแบบกระจายด้วย Spark SQL

รายละเอียด

หลักสูตรนี้สำหรับนักเรียนที่มีประสบการณ์เกี่ยวกับ SQL และตอนนี้ต้องการก้าวต่อไปในการทำความคุ้นเคยกับการคำนวณแบบกระจายโดยใช้ Spark นักเรียนจะได้รับความเข้าใจเกี่ยวกับเวลาที่จะใช้ Spark และวิธีที่ Spark เป็นเครื่องมือที่ผสานเทคโนโลยี Data และ AI ในระดับที่ไม่ซ้ำกัน โมดูลสี่ตัวต่อกันและในตอนท้ายของหลักสูตรที่นักเรียนจะเข้าใจ: สถาปัตยกรรม Spark, Spark DataFrame, การเพิ่มประสิทธิภาพการอ่าน / เขียนข้อมูลและวิธีการสร้างรูปแบบการเรียนรู้ของเครื่อง โมดูลแรกจะแนะนำ Spark รวมถึงวิธีการทำงานของ Spark กับการคำนวณแบบกระจายและ Spark Dataframes คืออะไร โมดูล 2 ครอบคลุมแนวคิดหลักของ Spark เช่นหน่วยเก็บข้อมูลเทียบกับการคำนวณแคชพาร์ติชันและ Spark UI โมดูลที่สามดูที่ท่อข้อมูลวิศวกรรมซึ่งครอบคลุมการเชื่อมต่อกับฐานข้อมูลสกีมาและประเภทรูปแบบไฟล์และการเขียนข้อมูลที่ดี โมดูลขั้นสุดท้ายดูที่การประยุกต์ใช้ Spark กับการเรียนรู้ของเครื่องผ่านกรณีการใช้งานทางธุรกิจการแนะนำสั้น ๆ เกี่ยวกับการเรียนรู้ของเครื่องคือการสร้างและการใช้โมเดลและสรุปหลักสูตรขั้นสุดท้าย โดยการทำความเข้าใจว่าเมื่อใดควรใช้ Spark ไม่ว่าจะขยายขนาดเมื่อโมเดลหรือข้อมูลมีขนาดใหญ่เกินกว่าที่จะประมวลผลบนเครื่องเดียวหรือมีความต้องการเพียงเร่งความเร็วเพื่อให้ได้ผลลัพธ์ที่เร็วขึ้นนักเรียนจะฝึกฝนทักษะ SQL ของพวกเขา นักวิทยาศาสตร์

ราคา: ลงทะเบียนฟรี!

ÀÒÉÒ: ภาษาอังกฤษ

คำบรรยาย: ภาษาอังกฤษ

การคำนวณแบบกระจายด้วย Spark SQL - มหาวิทยาลัยแห่งแคลิฟอร์เนียเดวิส