Mảnh dẻ, trầm tĩnh đằng sau cặp kính cận, Lê Việt Quốc hoàn toàn không có vẻ gì là người đang dẫn đầu một cuộc cách mạng trong lĩnh vực trí tuệ nhân tạo (AI) ở Google.
Vào năm 2011, Lê Việt Quốc đã đồng sáng lập Google Brain, cùng với bằng tiến sĩ của mình, cố vấn Andre, thành viên Google Jeff Dean và nhà nghiên cứu Google Greg Corrado. Mục tiêu của họ là khám phá việc học sâu trong bối cảnh dữ liệu khổng lồ của Google. Trước đó, Lê Việt Quốc đã thực hiện một số công việc tiên phong tại Stanford về học tập sâu không giám sát.
Vào năm 2012, Lê Việt Quốc đã xuất bản một bài báo (giới thiệu tại ICML) bắt đầu quan tâm đến việc học sâu: Anh đã phát triển một mô hình mạng nơron sâu có thể nhận ra mèo dựa trên 10 triệu hình ảnh kỹ thuật số từ Youtube, cũng như hơn 3.000 đối tượng trong tập dữ liệu ImageNet. Hệ thống khổng lồ bao gồm 16.000 máy móc và 1 tỷ khớp, lớn hơn gấp 100 lần so với bất kỳ ai từng thử. Bài báo của anh được AlexNet theo dõi vào cuối năm 2012 và toàn bộ lĩnh vực học sâu bắt đầu thu hút sự chú ý.
Mặc dù cách tiếp cận học tập không giám sát sau đó được chứng minh là không thực tế trong ứng dụng thương mại, Lê Việt Quốc nói trong một cuộc phỏng vấn năm 2015 rằng “Thật là tuyệt vời nếu chúng ta có một thuật toán có thể học như vậy – học giống như người – vì đó là một cách học thực tế hơn, chúng ta có nhiều dữ liệu không dán nhãn hơn là những dữ liệu được dán nhãn”.
Sau khi chính thức gia nhập Google với tư cách là một nhà khoa học nghiên cứu sau khi tốt nghiệp vào năm 2013, Lê Việt Quốc sớm đạt được những đột phá ấn tượng trong dịch máy, một trong những lĩnh vực nghiên cứu tích cực nhất trong cộng đồng học máy.
Năm 2014, anh đề xuất trình tự chuỗi (seq2seq) học với nhà nghiên cứu Google Ilya Sutskever và Oriol Vinyals. Nó là một khung công cụ giải mã bộ mã hóa có mục đích chung giúp đào tạo các mô hình để chuyển đổi các chuỗi, ví dụ như các câu giữa các ngôn ngữ khác nhau.
Việc học seq2seq đòi hỏi ít sự lựa chọn thiết kế kỹ thuật hơn và cho phép hệ thống dịch của Google hoạt động hiệu quả và chính xác trên các tập dữ liệu rất lớn. Nó chủ yếu được sử dụng cho các hệ thống dịch máy và được chứng minh là có thể áp dụng trong một phạm vi rộng hơn các nhiệm vụ, bao gồm tóm tắt văn bản, đối thoại AI và hỏi đáp.
Năm 2016, Google đã công bố hệ thống dịch máy Neural, sử dụng AI để tạo ra các bản dịch tốt hơn và tự nhiên hơn.
Cũng trong năm 2016, Lê Việt Quốc và một đồng nghiệp khác của Google, Barret Zoph đã đề xuất tìm kiếm một kiến trúc thần kinh. Một năm sau, anh và Zoph đưa nghiên cứu của họ lên cấp độ tiếp theo bằng cách đề xuất NASNet-A, một kiến trúc có thể chuyển giao cho các tập dữ liệu hình ảnh có quy mô lớn. Những nghiên cứu này của Lê Việt Quốc đặt nền móng cho AutoML, một bộ sản phẩm của Google được thiết kế cho các nhà phát triển có chuyên môn về học máy hạn chế.
Ở giai đoạn đầu, AutoML hiện đang giải quyết các vấn đề thực tế: một nhà khoa học dữ liệu đã sử dụng AutoML để xây dựng một mô hình xác định nhà hàng dựa trên hình ảnh mì, với độ chính xác gần như 95%; một nhà phát triển người Nhật đã sử dụng AutoML để xây dựng một mô hình có thể phân loại hình ảnh với tên thương hiệu.
Google đã ra mắt AutoML Vision vào đầu năm nay. Tháng trước tại hội nghị Cloud Next, Google đã công bố các công cụ dịch thuật và ngôn ngữ tự nhiên.
Lê Việt Quốc lọt vào danh sách “Những nhà sáng chế dưới 35 tuổi” của Viện Công nghệ Massachuset (MIT) vì mục tiêu “sáng tạo phần mềm đủ thông minh để hỗ trợ con người trong cuộc sống hàng ngày”.
Trong 6 năm qua, Lê Việt Quốc luôn đã ở vị trí hàng đầu trong phát triển học sâu. Nhà khoa học nghiên cứu của Google này hiện đang sẵn sàng để nghiên cứu học sâu ở cấp độ cao hơn.
>>> Đọc thêm: Các báo hàng đầu nước Mỹ đồng loạt ca ngợi sáng kiến của học giả Nguyễn Anh Tuấn
Bình luận