Zalo AI đóng góp bộ tiêu chuẩn đánh giá năng lực tiếng Việt cho AI Việt Nam

(VTC News) -

ZALO AI chính thức ra mắt bộ tiêu chuẩn đánh giá năng lực tiếng Việt miễn phí VMLU, góp phần phát triển cộng đồng nghiên cứu Generative AI Việt Nam.

Tại sao AI Việt Nam cần một bộ tiêu chuẩn đánh giá năng lực tiếng Việt hoàn chỉnh?

Sự phát triển bùng nổ của chat GPT đã tạo ra một cuộc đua mới: Generative AI (Trí tuệ nhân tạo tạo sinh). Theo thống kê, trên thế giới hiện có khoảng 16.000 mô hình tương tư như chat GPT ra đời. Việt Nam cũng không đứng ngoài xu thế đó khi có rất nhiều nhóm nghiên cứu cũng muốn thử nghiệm với Generative AI sử dụng tiếng Việt.

Điều này kéo theo nhu cầu về một bộ đánh giá năng lực tiếng Việt cho chính các mô hình AI này để đo lường mức độ nắm tri thức cũng như tư duy ngôn ngữ tiếng Việt.

Tuy nhiên, hầu hết các nhóm nghiên cứu LLM (Large language models - Các mô hình ngôn ngữ lớn) ở Việt Nam đều phải tự xây dựng bộ công cụ đánh giá với chuẩn mực riêng cho mô hình của mình. Đây là những bộ đánh giá nội bộ, chưa được công khai ra thị trường.

Bộ đánh giá của Zalo AI hướng đến nhu cầu tổng quát, có thể làm tiêu chuẩn chung cho các mô hình LLM và được cung cấp ra cho cộng đồng AI. Điều này vừa giúp các nhóm nghiên cứu có thể tiếp cận được bộ dữ liệu đánh giá toàn diện vừa để các bên có thể so sánh kết quả lẫn nhau, từ đó tạo ra động lực hoàn thiện hơn mô hình.

Động lực cho AI Việt Nam gia nhập làn sóng Generative AI thế giới

Tháng 11 năm 2023, Zalo AI chính thức công bố bộ tiêu chuẩn đánh giá năng lực tiếng Việt VMLU (Vietnamese Multitask Language Understanding). Đây là bộ tiêu chuẩn được các kỹ sư Zalo AI phối hợp với Viện Khoa học và Công nghệ Tiên tiến Nhật Bản (JAIST) nghiên cứu và phát triển nhằm đánh giá khả năng hiểu và vận dụng ngôn ngữ tiếng Việt của các mô hình AI, đặc biệt là Generative AI.

Sự ra đời của VMLU đã tạo động lực cho các cá nhân, startup hay các nhóm nghiên cứu trong việc phát triển ra các mô hình AI tiếng Việt mới, đặt nền móng đo lường sự chính xác và nâng cấp kết quả của các mô hình cơ bản, giúp hoàn thiện quá trình phát triển các ứng dụng AI ngôn ngữ Việt, do chính người Việt tạo ra để phục vụ người Việt.

Đây cũng là một trong những yếu tố quan trọng thúc đẩy sự phát triển Generative AI Việt Nam bắt kịp với làn sóng AI trên thế giới.

Bộ tiêu chuẩn đánh giá năng lực tiếng Việt gồm những gì?

VMLU là bộ tiêu chuẩn đánh giá tiếng Việt đa khía cạnh, đa cấp độ và đáp ứng đa dạng nhu cầu nhất trên thị trường nghiên cứu và phát triển Generative AI Việt Nam, gồm 2 phần chính: dữ liệu (test dataset) và bộ công cụ tiêu chuẩn đánh giá, làm cơ sở để kiểm tra đối với các mô hình AI ứng dụng ngôn ngữ Việt.

Cụ thể, bộ dữ liệu bao gồm 10.880 câu hỏi trắc nghiệm với 58 chủ đề. Mỗi chủ đề có khoảng 200 câu hỏi và được phân bổ trên 4 lĩnh vực: STEM, Khoa học xã hội, Khoa học nhân văn và một danh mục rộng “Mở rộng”.

Với khối dữ liệu này, VMLU có sự phân tầng độ khó theo 4 cấp bậc: Tiểu học, Trung học cơ sở, Trung học phổ thông và Chuyên nghiệp - cho đại học và sau đại học. Từ đó, bộ công cụ giúp đánh giá hiệu quả năng lực ngôn ngữ tiếng Việt của các mô hình AI về cả kiến thức sơ đẳng lẫn phức tạp.

Để giúp các nhóm nghiên cứu dễ dàng đánh giá năng lực các mô hình AI tiếng Việt của mình, đội ngũ kĩ sư Zalo AI thiết kế kèm theo hướng dẫn chi tiết với các thao tác đơn giản.

Lưu ý: VMLU giới hạn 5 lần thử nghiệm/tài khoản/ngày. Kết quả được ghi nhận từ lịch sử đánh giá gần nhất.

Tiếp tục đóng góp cho cộng đồng AI Việt Nam

Bộ tiêu chuẩn VMLU là một sản phẩm được nghiên cứu nhằm hướng đến mục đích đóng góp và phát triển cộng đồng nghiên cứu AI Việt Nam nói riêng cũng như cộng đồng công nghệ thông tin nói chung, không thu phí bất kỳ người dùng, nhóm nghiên cứu hay doanh nghiệp nào.

Trước đó, Zalo AI đã triển khai và tổ chức hàng loạt các cuộc thi, chương trình cho cộng đồng AI Việt Nam như: Zalo AI Challenge, Zalo AI Hackathon, Zalo AI Summit… Những hoạt động này không chỉ tạo sân chơi cho cộng đồng AI Việt mà còn khuyến khích việc ứng dụng AI vào cuộc sống, giải quyết các bài toán cấp thiết của xã hội, phục vụ cho nhu cầu của hàng triệu người Việt Nam.

Tiến sĩ Châu Thành Đức - Trưởng bộ phận nghiên cứu Zalo AI - Giảng viên Trường Đại học Khoa học tự nhiên, Đại học Quốc gia TP.HCM khẳng định: “Zalo AI luôn hướng tới sự đóng góp cho cộng đồng AI Việt Nam, tạo động lực để AI Việt Nam phát triển. Từ đó kỳ vọng ngày càng có nhiều sản phẩm AI của người Việt, cho người Việt”.

Gia Hân