เครือข่ายมหาวิทยาลัย

ระบบรู้จำเสียง

รายละเอียด

การพัฒนาและทำความเข้าใจระบบ Automatic Speech Recognition (ASR) เป็นกิจกรรมระหว่างสาขาวิชาโดยมีความเชี่ยวชาญด้านภาษาศาสตร์วิทยาการคอมพิวเตอร์คณิตศาสตร์และวิศวกรรมไฟฟ้า เมื่อมนุษย์พูดคำศัพท์พวกเขาจะทำให้เกิดเสียงที่ทำให้เกิดรูปแบบของเสียงที่แปรผันตามเวลา เสียงเหล่านี้เป็นคลื่นแห่งความกดดันที่แพร่กระจายไปในอากาศ เสียงจะถูกจับโดยเซ็นเซอร์เช่นไมโครโฟนหรืออาร์เรย์ไมโครโฟนและเปลี่ยนเป็นลำดับตัวเลขที่แสดงถึงการเปลี่ยนแปลงความดันเมื่อเวลาผ่านไป ระบบรู้จำเสียงอัตโนมัติจะแปลงสัญญาณแรงดันเวลานี้เป็นสัญญาณบอกเวลาความถี่พลังงาน ได้รับการฝึกฝนเกี่ยวกับชุดเสียงพูดที่มีป้ายกำกับและติดป้ายกำกับเสียงที่นำเสนอด้วย ป้ายกำกับอะคูสติกเหล่านี้รวมเข้ากับรูปแบบการออกเสียงคำและรูปแบบของลำดับคำเพื่อสร้างการแสดงข้อความของสิ่งที่พูด แทนที่จะสำรวจส่วนหนึ่งของกระบวนการนี้อย่างลึกซึ้งหลักสูตรนี้ออกแบบมาเพื่อให้ภาพรวมของส่วนประกอบของระบบ ASR ที่ทันสมัย ในการบรรยายแต่ละครั้งเราจะอธิบายวัตถุประสงค์ขององค์ประกอบและโครงสร้างทั่วไป ในแต่ละห้องปฏิบัติการนักเรียนจะสร้างบล็อกการทำงานของระบบ ในตอนท้ายของหลักสูตรเราจะสร้างระบบรู้จำเสียงจากโค้ด Python เกือบทั้งหมด edX ให้ความช่วยเหลือทางการเงินสำหรับผู้เรียนที่ต้องการได้รับใบรับรองที่ผ่านการยืนยัน แต่อาจไม่สามารถชำระค่าธรรมเนียมได้ ในการสมัครขอความช่วยเหลือทางการเงินลงทะเบียนในหลักสูตรจากนั้นไปที่ลิงค์นี้เพื่อกรอกใบสมัครเพื่อขอความช่วยเหลือ

ราคา: $ 99 - ฟรีเพื่อตรวจสอบ!

ÀÒÉÒ: English

ระบบรู้จำเสียงพูดผ่าน edX ซึ่งเป็นแพลตฟอร์มสำหรับการศึกษาที่ก่อตั้งโดย Harvard และ MIT

ระบบรู้จำเสียง - Microsoft