Tại Hội thi Giải pháp ứng dụng trí tuệ nhân tạo lần 3 do Sở Thông tin và Truyền thông, Thành đoàn phối hợp Đại học Quốc gia TP HCM, Hiệp hội phần mềm và dịch vụ công nghệ thông tin Việt Nam tổ chức nhằm tìm kiếm các giải pháp ứng dụng trí tuệ nhân tạo vào các lĩnh vực cuộc sống.
Nhóm CMC AI của Viện Nghiên cứu Ứng dụng Công nghệ CMC (CMC ATI) đã nhận "cú đúp" giải thưởng tại cuộc thi Xử lý Ngôn ngữ và Tiếng nói tiếng Việt - VLSP 2022 (Vietnamese Language and Speech Processing) với một giải Nhất và một giải Ba.
Đây là cuộc thi được Câu lạc bộ Xử lý ngôn ngữ và tiếng nói tiếng Việt (VLSP) và Hội Tin học Việt Nam tổ chức lần thứ 9. VLSP 2022 tổ chức 7 cuộc thi về xử lý tiếng nói và xử lý văn bản, bao gồm: tổng hợp tiếng nói, nhận dạng tiếng nói, xác minh người nói, phân tích cú pháp thành phần, tóm tắt đa văn bản, dịch máy Trung - Việt, hỏi đáp đa ngữ về nội dung ảnh.
Cụ thể, nhóm CMC AI đạt giải Nhất với giải pháp “Mô hình transformers cho dữ liệu đa miền với khả năng phát hiện đối tượng cho bài toán hỏi đáp trực quan đa ngôn ngữ” tại cuộc thi “Hỏi đáp trực quan đa ngôn ngữ dựa trên hình ảnh”. Đồng thời, nhóm còn giành được giải Ba với giải pháp “Mô hình transformers với khả năng mô hình hoá văn bản dài cho bài toán tóm tắt tóm lược đa văn bản” tại Cuộc thi “Tóm tắt tóm lược đa văn bản Tiếng Việt”.
Để đạt được giải nhất trong cuộc thi VLSP 2022, team CMC AI đã thử nghiệm nhiều thuật toán khác nhau để tìm được ra thuật toán tốt nhất.
Toàn bộ cuộc thi diễn ra trong khoảng hơn một tháng, trong đó thời gian để các đội thi đăng ký, chuẩn bị là khoảng 3 tuần. Thời gian để các đội nộp bài thi và cạnh tranh với nhau trên bảng xếp hạng kéo dài trong 10 ngày.
“Giải thưởng là kết quả của sự cố gắng của cả đội trong một khoảng thời gian tuy không quá dài nhưng hết sức cam go và thử thách. Đây cũng là minh chứng cho năng lực của team AI nói riêng cũng như Viện CMC ATI nói chung. Các bài toán trong cuộc thi nếu xử lý được rất tiềm năng trong việc tích hợp trong nền tảng trợ lý ảo mà nhóm đã và đang phát triển”, TS Đặng Minh Tuấn, Viện trưởng Viện Nghiên cứu Ứng dụng Công nghệ CMC ATI chia sẻ.
Nói về điểm nổi bật về giải pháp “Mô hình transformers cho dữ liệu đa miền với khả năng phát hiện đối tượng cho bài toán hỏi đáp trực quan đa ngôn ngữ” của Viện CMC ATI, anh Nguyễn Tiến Đồng Trưởng nhóm CMC AI cho biết, đây là một một ý tưởng sáng tạo riêng, dựa trên những kinh nghiệm làm việc cũng như khả năng chuyên môn của Viện. Giải pháp này vừa đơn giản lại vừa hiệu quả, không giới hạn trong phạm vi cuộc thi mà còn có thể áp dụng vào thực tiễn.
Đây chính là sự giao thoa giữa kỹ thuật xử lý ảnh và xử lý ngôn ngữ tự nhiên. Bên cạnh đó, giải pháp còn kết hợp các thông tin về đặc trưng ảnh với các thực thể có trong ảnh để đưa ra câu trả lời. Đặc biệt, mô hình giải pháp này cho phép đưa ra câu trả lời cũng như sử dụng câu hỏi ở nhiều ngôn ngữ khác nhau, bao gồm tiếng Việt, tiếng Anh và tiếng Nhật.
Đặc biệt, với “Mô hình transformers với khả năng mô hình hoá văn bản dài cho bài toán tóm tắt tóm lược đa văn bản” đã được team CMC AI lựa chọn dựa trên việc thử nghiệm rất nhiều bộ tham số khác nhau. Mô hình này có thể xử lý được các văn bản dài cũng như các bài toán tóm tắt đơn văn bản và đa văn bản.
Ông Nguyễn Trung Chính - Chủ tịch HĐQT, Chủ tịch Điều hành Tập đoàn Công nghệ CMC, Giám đốc Viện Nghiên cứu Ứng dụng Công nghệ CMC ATI chia sẻ: “Mô hình tổ chức Viện nghiên cứu trong tập đoàn rất quan trọng. CMC ATI sẽ là nơi nghiên cứu tạo ra các sản phẩm công nghệ có năng lực cạnh tranh, đem lại sự hữu ích cho sự phát triển của tập đoàn và cho xã hội. Tập đoàn chuẩn bị bước sang tuổi 30 với các thách thức và cơ hội mới. Mong rằng Viện sẽ trở thành hạt nhân để dẫn dắt những chiến lược phát triển về công nghệ kỹ thuật, đồng thời tạo ra nguồn nhân lực nghiên cứu ứng dụng chất lượng cao cho Việt Nam”.
Bình luận