PhởGPT lần đầu tiên giới thiệu tới công chúng.
Tiến sĩ Bùi Hải Hưng, Tổng giám đốc VinAI (đơn vị nghiên cứu dự án PhởGPT thuộc Vingroup) chính là người trình diễn trước hơn 1.000 người tham dự sự kiện.
Mở đầu buổi giới thiệu, ông Hưng sử dụng ChatGPT trên điện thoại thông minh để trình diễn. Tuy nhiên, khi ông tắt internet thì ChatGPT không thể hoạt động tiếp.
Sau đó, ông Hưng sử dụng PhởGPT để mọi người có thể hiểu hơn về công nghệ do Việt Nam phát triển. Khi không sử dụng internet, PhởGPT vẫn làm việc mượt mà.
Cụ thể, ông Hưng yêu cầu PhởGPT vẽ một bức tranh mô tả khu rừng có con suối chảy qua, ngay lập tức PhởGPT hoàn thành nhanh chóng. Tiếp theo, ông yêu cầu ứng dụng vẽ bức tranh “khu rừng có con suối chảy qua vào mùa đông”. Sau 2 giây, bức tranh trước đó đã có thêm băng tuyết phủ trắng khu rừng.
Sự thông minh của PhởGPT đã khiến tất cả mọi người trong khán phòng vỗ tay hưởng ứng. Ông Hưng yêu cầu PhởGPT làm một bài thơ nắng Sài Gòn, ngay lập tức PhởGPT đã có kết quả.
Nắng Sài Gòn anh đi mà chợt nhớ
Có phải vì em đã trót thương
Sài Gòn lạ lắm em ơi
Đông nắng – Tây mưa hai phương trời
…..
Sau khoảng 2 giây, bài thơ có 12 dòng với gần 100 chữ đã nhanh chóng được thực hiện bởi PhởGPT.
Tiếp theo, ông Hưng yêu cầu PhởGPT trả lời một câu hỏi kiến thức như “La Pulga là biệt danh của cầu thủ nào?”. PhởGPT trả lời “La Pulga là biệt danh của cầu thủ Messi”.
PhởGPT cũng trả lời rất nhanh các câu hỏi khác và được mọi người tham dự AI Day 2023 vỗ tay tán thưởng.
Trước đó, như VTC News đã thông tin, PhởGPT là dự án nghiên cứu mã nguồn mở về mô hình ngôn ngữ lớn cho riêng tiếng Việt. Mục tiêu của dự án là phát triển các mô hình tương tự như ChatGPT cho tiếng Việt và văn hoá của người Việt. PhởGPT có khả năng hiểu và viết văn phong tiếng Việt một cách vượt bậc so với các công nghệ về ngôn ngữ thế hệ trước.
Mô hình cũng được huấn luyện từ đầu với tệp dữ liệu tiếng Việt, không phụ thuộc vào bất cứ một mô hình nào khác của thế giới, đảm bảo việc làm chủ công nghệ lõi tiên tiến cho Việt Nam.
PhởGPT sẽ song hành cùng trào lưu các mô hình ngôn ngữ lớn với mã nguồn mở của thế giới như Llama của Meta hay Mistral được phát triển để cạnh tranh với ChatGPT của OpenAI.
PhởGPT có thể được xem như phiên bản ChatGPT chuyên dụng cho tiếng Việt với mô hình ngôn ngữ dữ liệu lớn có 7.5 tỷ tham số, được xây dựng trên nền tảng giải mã Transformer. Mô hình này được huấn luyện từ đầu, sử dụng những kỹ thuật tiên tiến nhất hiện có (như cơ chế tập trung chớp nhoáng (Flash Attention), ngoại suy độ dài ngữ cảnh AliBi).
Những kỹ thuật này không chỉ giúp mô hình hiểu sâu hơn về ngữ cảnh mà còn làm tăng khả năng đối thoại và tương tác tự nhiên của PhởGPT. Điều này giúp mô hình trở thành một công cụ đa nhiệm và linh hoạt, có khả năng đáp ứng đa dạng các nhu cầu ngôn ngữ của người sử dụng.
Việc VinAI nghiên cứu và phát triển, công bố PhởGPT hôm nay, sẽ đặt những nền móng đầu tiên cho sự phát triển các mô hình ngôn ngữ tiếng Việt hiệu suất cao, làm cơ sở để phát triển các ứng dụng thực tế, hiêụ quả, phù hợp với chiến lược phát triển AI đến năm 2030 của Chính phủ.
Bình luận