Google công bố Gemini 3.5, trong đó bản Flash đạt hiệu năng hơn bản Pro của Gemini 3.1, hứa hẹn xử lý tốt các tác vụ nhiều bước như lập trình, nghiên cứu.
Trong sự kiện Google I/O ngày 19/5 tại Mỹ, Google công bố Gemini 3.5, là thế hệ mô hình mới kết hợp giữa “trí tuệ tiên phong” và khả năng hành động, hướng đến việc xây dựng các AI agent có thể tự xử lý chuỗi công việc phức tạp thay cho con người. Phiên bản đầu tiên được phát hành là Gemini 3.5 Flash. Ngoài ra, hãng cho biết đang phát triển phiên bản cao cấp là Gemini 3.5 Pro, dự kiến ra mắt vào tháng tới.
Mô hình này sẽ được triển khai ngay cho người dùng thông qua ứng dụng Gemini và AI Mode trong Google Search, hệ sinh thái doanh nghiệp Gemini Enterprise. Ngoài ra, các lập trình viên có thể sử dụng qua Google Antigravity, Gemini API trong AI Studio, Android Studio.

CEO Google Sundar Pichai giới thiệu Gemini 3.5 Flash tại Google I/O 2026. Ảnh: Lưu Quý
Theo giới thiệu, dù là bản Flash chú trọng tốc độ và độ gọn nhẹ, Gemini 3.5 Flash đạt kết quả cao trong các bài đánh giá ngang với một số mô hình bản cao cấp. Số liệu kiểm thử do Google công bố cho thấy mô hình mới đã vượt qua phiên bản Gemini 3.1 Pro trong các bài đo hiệu năng. Cụ thể, mô hình đạt tỷ lệ 76,2% ở tác vụ lập trình trên Terminal-Bench 2.1, đạt mức điểm tư duy “tác nhân” 1656 Elo trên GDPval-AA và 83,6% trên MCP Atlas. Ở khả năng hiểu dữ liệu đa phương thức, phiên bản này dẫn đầu với 84,2% trên bài kiểm tra lập luận CharXiv. Ngoài ra, tốc độ xuất chuỗi ký tự của mô hình mới được khẳng định nhanh gấp bốn lần so với các AI cùng phân khúc hàng đầu hiện nay, giải quyết được bài toán đánh đổi giữa chất lượng câu trả lời và độ trễ hệ thống.
“Đây là mô hình lập trình và mang tính tác nhân mạnh mẽ nhất của chúng tôi từ trước đến nay”, Google cho biết.
Theo Google, sự cân bằng giữa tốc độ và hiệu suất giúp 3.5 Flash phù hợp để giải quyết các tác vụ mang tính “tác nhân” dài hạn, đặc biệt là những công việc kéo dài nhiều bước và đòi hỏi AI liên tục lập kế hoạch, thực hiện rồi điều chỉnh trong quá trình xử lý. Chẳng hạn, các công việc từng khiến lập trình viên mất nhiều ngày hoặc kiểm toán viên mất nhiều tuần nay có thể được rút ngắn đáng kể, với chi phí thường thấp hơn một nửa so với một số mô hình AI tiên tiến khác. Khi kết hợp với khung vận hành Antigravity, 3.5 Flash có thể trở thành một công cụ mạnh để triển khai các “tác nhân” phụ, giải quyết các vấn đề ở quy mô lớn.
Tại sự kiện, hãng cho biết đã hợp tác với nhiều đối tác để xác định các khâu phức tạp và tốn thời gian trong quy trình làm việc thực tế trước khi phát triển thế hệ mô hình 3.5. Theo đó, một số ngân hàng và doanh nghiệp tài chính đã sử dụng mô hình để tự động hóa các quy trình kéo dài nhiều tuần, trong khi các nhóm khoa học dữ liệu ứng dụng AI để khai thác thông tin chuyên sâu trong môi trường dữ liệu phức tạp và đạt hiệu quả tốt.
Trong phần trình diễn tại sự kiện Google I/O, hãng giới thiệu Gemini Spark, là trợ lý AI cá nhân được xây dựng trên nền Gemini 3.5 Flash. Công cụ này được mô tả có thể hỗ trợ người dùng quản lý các công việc trên môi trường số, thay mặt họ thực hiện một số hành động dựa trên chỉ dẫn của con người. Google cho biết Gemini Spark đang được thử nghiệm với một nhóm người dùng giới hạn và dự kiến phát hành beta cho thuê bao Google AI Ultra tại Mỹ vào tuần tới.
Bên cạnh hiệu năng, Google cũng nhấn mạnh yếu tố an toàn. Theo đó, Gemini 3.5 được phát triển theo “Frontier Safety Framework”, với các biện pháp bảo vệ liên quan đến an ninh mạng và nguy cơ tạo nội dung độc hại. Ngoài ra, các công cụ giúp kiểm tra và phân tích cũng được bổ sung trước khi AI phản hồi người dùng, nhằm giảm nguy cơ tạo nội dung nguy hiểm hoặc từ chối nhầm các truy vấn an toàn.
Theo Lưu Quý – Vnexpress











