เหตุใดโมเดล SeamlessM4T AI ของ Meta จึงน่าตื่นเต้นจริงๆ

โลกของ AI ยังคงพัฒนาและขยายตัวอย่างต่อเนื่อง โดยมีผู้เล่นใหม่เข้ามาในสนามทุกครั้งที่เรากระพริบตา เรารู้มาระยะหนึ่งแล้วว่า Meta ต้องการสร้างโมเดลภาษาของตัวเอง เหมือนคนข้างหลัง ChatGPTแต่บริษัทได้ทำสิ่งที่น่าตื่นเต้นกว่านี้อีกเล็กน้อย อย่างน้อยก็ในรูปแบบที่กว้างขึ้น ด้วยการเปิดเผยโมเดล AI ต่อเนื่องหลายรูปแบบ SeamlessM4T

เทค ความบันเทิง. ศาสตร์. กล่องจดหมายของคุณ

ลงทะเบียนเพื่อรับข่าวสารเทคโนโลยีและความบันเทิงที่น่าสนใจที่สุด

ในการสมัคร ฉันยอมรับ ข้อกำหนดการใช้งาน และได้ทบทวนเรื่อง แจ้งให้ทราบความเป็นส่วนตัว.

เพื่อให้เข้าใจอย่างแท้จริงว่าอะไรที่ทำให้การเปิดตัว SeamlessM4T น่าตื่นเต้นมาก ก่อนอื่นเรามาดูกันว่า SeamlessM4T คืออะไร ในระดับพื้นฐานที่สุด SeamlessM4T คือโมเดลการแปลและการถอดเสียง AI หลายภาษาแบบหลายภาษา แม้ว่าเราจะเคยเห็นโมเดลอื่นๆ ในลักษณะนี้มาก่อน แต่ SeamlessM4T จะช่วยให้สามารถแปลคำพูดเป็นข้อความ คำพูดเป็นคำพูด ข้อความเป็นคำพูด และข้อความเป็นข้อความได้ ทั้งหมดนี้มาจากโมเดลเดียว

สามารถจดจำภาษาต่างๆ ได้เกือบ 100 ภาษา และการแปลคำพูดเป็นข้อความสามารถใช้ได้กับภาษาอินพุตและเอาต์พุตเกือบ 100 ภาษา พูดตรงๆ ก็คือโมเดลนี้เป็นเครื่องมือแปลแบบเดินที่สามารถเชื่อมช่องว่างระหว่างผู้พูดภาษาต่างๆ ได้ สิ่งที่น่าตื่นเต้นยิ่งกว่าความเป็นไปได้ก็คือวิธีการ

เมตา กำลังจะเปิดตัวรุ่นนี้

การเปรียบเทียบ Meta SeamlessM4T
การเปรียบเทียบ SeamlessM4T ของ Meta กับโมเดลการแปลอื่นๆ แหล่งที่มาของภาพ: Meta

ต่างจากรุ่น ChatGPT นั่นคือ GPT-3.5 และ GPT-4.0 ตรงที่ SeamlessM4T นั้นเป็นโอเพ่นซอร์สโดยสมบูรณ์ ช่วยให้นักวิจัยรับโค้ดและทำงานกับมันให้เหมาะกับแอปพลิเคชันของตนเอง สิ่งนี้จะช่วยให้นักวิจัย AI หลายร้อยหรือหลายพันคนสามารถนำโค้ดที่ Meta ได้นำไปใช้และอาจปรับปรุงด้วยวิธีต่างๆ ทำให้ดียิ่งขึ้นไปอีก

“การสร้างนักแปลภาษาสากล เช่นเดียวกับตัวละคร Babel Fish ใน The Hitchhiker’s Guide to the Galaxy นั้น ความท้าทายเนื่องจากระบบคำพูดเป็นคำพูดและคำพูดเป็นข้อความที่มีอยู่ในปัจจุบันครอบคลุมเพียงส่วนเล็กๆ ของโลกเท่านั้น ภาษา” เมต้าเขียน ในโพสต์ประกาศ เนื่องจากใช้รุ่นเดียวแทนที่จะเป็นหลายรุ่น Meta จึงเชื่อว่า SeamlessM4T จะช่วยลดข้อผิดพลาดและความล่าช้าในการแปล ทำให้มีประสิทธิภาพมากขึ้น

สถานะปัจจุบันของเครื่องมือการแปลน่าผิดหวังมาก โดยเฉพาะอย่างยิ่งเมื่อพิจารณาว่ามีรองรับภาษาใดบ้าง ดังนั้นหาก SeamlessM4T ของ Meta มีความแข็งแกร่งตามที่บริษัทกล่าวไว้ ก็สามารถเปิดประตูใหม่ให้กับวิธีที่เราสื่อสารด้วยได้ ผู้คนที่พูดภาษาต่างกัน ทำให้ง่ายต่อการทำงานร่วมกันในการวิจัยที่สำคัญและวิทยาศาสตร์ที่กำลังดำเนินต่อไป ซึ่งไปข้างหน้า.

อย่าพลาด:นักวิจัยดึงเพลงของ Pink Floyd ออกจากสมองของบุคคล – ฟังเสียงหลอน

โพสต์บล็อกล่าสุด

วิธีเดียวที่จะได้รับ SNES Classic Edition เมื่อเปิดตัว
October 30, 2023

แต่จะไม่สามารถใช้ได้อีกสามเดือน SNES Classic Edition เป็นหนึ่งในอุปกรณ์ที่หลายคนตั้งตารอคอยมากที่สุดแห่งปี. จากความสำเร็จอันยิ่งใหญ่ของ NES Classic...

มีข่าวลือว่า Sprint จะเปิดตัว HTC One X ในวันที่ 10 มิถุนายน
October 30, 2023

เทค ความบันเทิง. ศาสตร์. กล่องจดหมายของคุณลงทะเบียนเพื่อรับข่าวสารเทคโนโลยีและความบันเทิงที่น่าสนใจที่สุดในการสมัคร ฉันยอมรับ ข้อกำหนดการใช้งาน และ...

PSP เพิ่ม GPS สำหรับเกมสายพันธุ์ใหม่
October 30, 2023

เทค ความบันเทิง. ศาสตร์. กล่องจดหมายของคุณลงทะเบียนเพื่อรับข่าวสารเทคโนโลยีและความบันเทิงที่น่าสนใจที่สุดในการสมัคร ฉันยอมรับ ข้อกำหนดการใช้งาน และ...