Digital Economy Promotion Agency, Second floor, No. 80, Soi 4, Ladprao Road, Chomphon, Chatuchak District, Bangkok 10900
Digital Economy Promotion Agency, Second floor, No. 80, Soi 4, Ladprao Road, Chomphon, Chatuchak District, Bangkok 10900
Speech to Text Model (STT) หรือ Automatic Speech Recognition (ASR) คือ AI คุณภาพสูงที่มีศักยภาพในการถอดเสียงพูดเป็นข้อความ พร้อมระบุช่วงเวลาของเสียงได้ ซึ่งคุณยังสามารถกลับมาแก้ไขข้อความและเวลา ให้ถูกต้องมากขึ้นได้ภายหลัง
เทคโนโลยีที่สามารถแยกเสียงผู้พูดจากเสียงสนทนา เพียงอัปโหลดไฟล์เสียง ของผู้พูดแต่ละคนอย่างน้อย 5 วินาที เพื่อเริ่มต้นสร้างโปรไฟล์เสียง แอปพลิเคชันจะระบุผู้พูดจากเสียงสนทนาพร้อมกับถอดความไปพร้อมกันในทีเดียว
เพียงแค่กดบันทึกเสียง ระบบก็จะถอดความจากไฟล์เสียงให้ โดยสามารถเห็นข้อความที่ถอดได้ไปพร้อม ๆ กับเสียงที่พูด ช่วยพนักงานจบงานถอดเสียง หรือบันทึกการประชุมไวอีกเท่าตัว
ถอดเสียงเป็นข้อความเสร็จแล้ว แถมสรุปให้ด้วย มีเทมเพลต 4 แบบให้เลือก ได้แก่ สรุปแบบหัวข้อย่อย สรุปแบบสั้น สรุปแบบถาม-ตอบ และสรุปการประชุม ให้คุณประหยัดเวลาเข้าถึงประเด็นที่ต้องการใช้ทำรายงานต่ออย่างง่ายดาย
กดสร้างโฟลเดอร์สำหรับเก็บไฟล์เสียงแต่ละโปรเจกต์
กดสร้างบันทึกเสียง ตั้งชื่อ เลือกระบุเสียงผู้พูด (หรือไม่ระบุก็ได้)
อัปโหลดไฟล์เสียง หรือเปิดไมค์บันทึกเสียง
รีวิวข้อความ ช่วงเวลาของเสียง และผู้พูด
กดบันทึกและดาวน์โหลดข้อความตามไฟล์ที่ต้องการ