สำนักงานสาขากรุงเทพฯ ชั้น 2 สำนักงานส่งเสริมเศรษฐกิจดิจิทัล เลขที่ 80 ซอย 4 ถนนลาดพร้าว ลาดพร้าว แขวงจอมพล เขตจตุจักร จังหวัดกรุงเทพมหานคร 10900
สำนักงานสาขากรุงเทพฯ ชั้น 2 สำนักงานส่งเสริมเศรษฐกิจดิจิทัล เลขที่ 80 ซอย 4 ถนนลาดพร้าว ลาดพร้าว แขวงจอมพล เขตจตุจักร จังหวัดกรุงเทพมหานคร 10900
Speech to Text Model (STT) หรือ Automatic Speech Recognition (ASR) คือ AI คุณภาพสูงที่มีศักยภาพในการถอดเสียงพูดเป็นข้อความ พร้อมระบุช่วงเวลาของเสียงได้ ซึ่งคุณยังสามารถกลับมาแก้ไขข้อความและเวลา ให้ถูกต้องมากขึ้นได้ภายหลัง
เทคโนโลยีที่สามารถแยกเสียงผู้พูดจากเสียงสนทนา เพียงอัปโหลดไฟล์เสียง ของผู้พูดแต่ละคนอย่างน้อย 5 วินาที เพื่อเริ่มต้นสร้างโปรไฟล์เสียง แอปพลิเคชันจะระบุผู้พูดจากเสียงสนทนาพร้อมกับถอดความไปพร้อมกันในทีเดียว
เพียงแค่กดบันทึกเสียง ระบบก็จะถอดความจากไฟล์เสียงให้ โดยสามารถเห็นข้อความที่ถอดได้ไปพร้อม ๆ กับเสียงที่พูด ช่วยพนักงานจบงานถอดเสียง หรือบันทึกการประชุมไวอีกเท่าตัว
ถอดเสียงเป็นข้อความเสร็จแล้ว แถมสรุปให้ด้วย มีเทมเพลต 4 แบบให้เลือก ได้แก่ สรุปแบบหัวข้อย่อย สรุปแบบสั้น สรุปแบบถาม-ตอบ และสรุปการประชุม ให้คุณประหยัดเวลาเข้าถึงประเด็นที่ต้องการใช้ทำรายงานต่ออย่างง่ายดาย
กดสร้างโฟลเดอร์สำหรับเก็บไฟล์เสียงแต่ละโปรเจกต์
กดสร้างบันทึกเสียง ตั้งชื่อ เลือกระบุเสียงผู้พูด (หรือไม่ระบุก็ได้)
อัปโหลดไฟล์เสียง หรือเปิดไมค์บันทึกเสียง
รีวิวข้อความ ช่วงเวลาของเสียง และผู้พูด
กดบันทึกและดาวน์โหลดข้อความตามไฟล์ที่ต้องการ