Các nhà nghiên cứu của ETRI đã ứng dụng công nghệ nhận diện chuyên sâu (deep learning) của trí tuệ nhân tạo để phát triển một chương trình nhận diện-dịch thuật âm thanh đa ngôn ngữ.
Theo đó, với các cụm từ có sẵn, công nghệ sẽ nhận diện âm thanh giọng nói để dịch trực tiếp từ ngôn ngữ này sang ngôn ngữ khác rồi hiển thị nội dung đó bằng chữ viết.
So với chương trình của Google, khả năng nhận diện tiếng Hàn của ETRI vượt trội hơn khi có thể "dịch" tới 96% nội dung cuộc nói chuyện trong đời sống hằng ngày. Tỉ lệ này ở các ngôn ngữ khác đạt từ 90% tới 95%, tương đương với Google.
Hiện công nghệ trên đã được áp dụng với 9 ngôn ngữ, gồm tiếng Anh, Trung Quốc, Nhật, Tây Ban Nha, Pháp, Đức, Nga và tiếng A Rập.
ETRI dự kiến sẽ mở rộng áp dụng với một số ngôn ngữ ở Đông Nam Á.
Video: Công nghệ hô biến lợn chết thành thịt hun khói
Bình luận