AI của Google lại được nâng cấp

Mô hình Gemini 3 Flash có tốc độ cao và chi phí sử dụng thấp, hiệu quả không thua kém Gemini 3 Pro hay GPT-5.2.

Mô hình Gemini 3 Flash tập trung vào chi phí và hiệu quả xử lý. Ảnh: Bloomberg.

Khả năng phân tích nội dung video của Gemini 3 Flash. Ảnh: Google.

"Nhờ khả năng lập luận đa phương thức mạnh mẽ của Gemini 3 Flash, bạn có thể sử dụng công cụ để tiếp nhận, phân tích và xử lý nhiều loại thông tin với tốc độ nhanh chóng.

Chẳng hạn, bạn có thể yêu cầu Gemini phân tích video/hình ảnh và chuyển nội dung thành một kế hoạch chi tiết, có thể áp dụng ngay trong vài giây", thông báo của Google nhấn mạnh.

Khi sử dụng AI Mode, Gemini 3 Flash cũng có khả năng hiểu rõ hơn ý đồ trong câu lệnh, từ đó đưa ra phản hồi trực quan kèm ảnh minh họa hay bảng biểu. Người dùng có thể lập trình theo cảm hứng (vibe-coding) để tạo ứng dụng trong Gemini nhờ công cụ Opal.

Phục vụ lập trình hiệu quả hơn

Với nhà phát triển, Google đang cung cấp Gemini 3 Flash dưới dạng thử nghiệm thông qua Gemini AI trong AI Studio và Antigravity, công cụ lập trình tích hợp tác nhân (agent).

Google nhấn mạnh khả năng phục vụ lập trình của Gemini 3 Flash. Mô hình này đạt 78% trên SWE-bench Verified, thang đo dùng để đánh giá các agent lập trình, cao hơn Gemini 3 Pro và chỉ xếp sau GPT-5.2.

"Khả năng mạnh mẽ của Gemini 3 Flash trong suy luận, sử dụng công cụ và xử lý đa phương thức là lựa chọn lý tưởng cho các nhà phát triển muốn thực hiện tác vụ phức tạp như phân tích video, trích xuất dữ liệu và hỏi đáp bằng hình ảnh", Google cho biết.

Chi phí của Gemini 3 Flash được thiết kế tối ưu với 0,5 USD/1 triệu token đầu vào, và 3 USD/1 triệu token đầu ra. Nếu dữ liệu đầu vào sử dụng âm thanh, chi phí giữ nguyên ở 1 USD/1 triệu token.

Mức giá này cao hơn đôi chút so với Gemini 2.5 Flash (lần lượt 0,3 USD và 2,5 USD). Tuy nhiên, Google tuyên bố mô hình này hoạt động tốt hơn Gemini 2.5 Pro, tốc độ nhanh gấp 3 lần.

Google Gemini 3 Flash,  Google Gemini 3 Pro,  Gemini 3 la gi,  ra mat Gemini 3,  mo hinh AI anh 2

Hiệu quả của Gemini 3 Flash trên một số thang đo. Ảnh: Google.

Với những tác vụ suy luận, Gemini 3 Flash dùng ít hơn 30% token so với 2.5 Pro, về lý thuyết giúp người dùng tiết kiệm chi phí với một số yêu cầu nhất định.

Từ khi ra mắt Gemini 3, Google cho biết đã xử lý hơn 1.000 tỷ token mỗi ngày trên nền tảng API do công ty cung cấp. Người dùng thường sử dụng Gemini 3 cho những tác vụ vibe-coding, thiết kế trò chơi tương tác và phân tích nội dung đa phương thức.

Giới công nghệ đánh giá Gemini 3 là đối trọng lớn với GPT-5. Đầu tháng 12, CEO OpenAI Sam Altman được cho đã gửi "báo động đỏ" đến các nhân viên khi lưu lượng truy cập ChatGPT giảm sút. OpenAI nhanh chóng ra mắt GPT-5.2 và mô hình tạo ảnh mới.

Tuy không trực tiếp đề cập đến OpenAI, Google cho biết việc ra mắt mô hình mới khiến tất cả công ty trên thị trường phải hoạt động tích cực.

"Điều đang xảy ra trên toàn ngành là tất cả mô hình vẫn tốt, cạnh tranh và thúc đẩy lẫn nhau. Các công ty đang tích cực phát hành những mô hình này", Tulsee Doshi, Giám đốc Sản phẩm Gemini Models, trả lời trang tin TechCrunch.

Những câu hỏi chúng ta phải đối mặt trong thế giới AI

Chúng ta có rất nhiều câu hỏi về thế giới AI, mà đó đều là những nghi hoặc không dễ có ngay đáp án.

Cuốn sách Thời đại AI - Và tương lai loài người chúng ta trình bày cách AI làm thay đổi mối quan hệ của chúng ta với tri thức, chính trị và xã hội. Mục tiêu tối thượng của cuốn sách này là giải thích về AI và cung cấp cho độc giả những câu hỏi mà chúng ta sẽ phải đối mặt trong những năm tới lẫn bộ công cụ để bắt đầu trả lời chúng.