Google vượt qua OpenAI

Mặc dù công bố Veo muộn hơn, Google đã phát hình mô hình AI tạo sinh video này trước đối thủ Sora của OpenAI.

Hình ảnh được tạo ra từ câu lệnh "con gấu bông đánh guitar" trên Veo. Ảnh: Google.

Google vừa phát hành Veo, mô hình AI tạo sinh video mới nhất cho phép các doanh nghiệp tích hợp vào quy trình tạo nội dung của họ. Mặc dù lần đầu tiên được công bố vào tháng 5, 3 tháng sau khi OpenAI giới thiệu Sora, Veo đã vượt mặt đối thủ khi phát hành trước.

Qua phiên bản xem trước trên nền tảng Vertex AI của Google, Veo đã có khả năng tạo ra các video chất lượng cao với độ phân giải 1080p với đa dạng phong cách điện ảnh dựa trên yêu cầu từ văn bản hoặc hình ảnh.

Các video của mô hình khi lần đầu công bố có thể kéo dài hơn 1 phút. Tuy nhiên, Google cũng không cung cấp thông tin cụ thể về giới hạn độ dài của video trong phiên bản thử nghiệm lần này.

Google vuot mat OpenAI anh 1

Biểu cảm và chi tiết chân thực từ các video mẫu của Veo. Ảnh: Google.

Một số video mẫu từ phiên bản này cũng tương đương với những gì Veo đã thể hiện từ trước. Video theo câu lệnh “chú chó đứng dậy, vẫy đuôi” của Veo được The Verge nhận định là đáng kinh ngạc. Từ màu sắc, kết cấu đến từng chi tiết như lông, biểu cảm của chú chó đều rất hài hoà và nhất quán trong quá trình chuyển động.

Mặc dù vậy, nếu nhìn kỹ thì vẫn có thể nhận ra những điểm bất thường. Một video đám đông nhún nhảy ở một sự kiện âm nhạc sẽ không còn bình thường khi chú ý vào ánh sáng chiếu vào bàn tay ở góc trái màn hình, hay viên kẹo dẻo nướng trên lửa nhưng vẫn giữ màu trắng.

Google vuot mat OpenAI anh 2

Tuy nhiên, Veo cũng không tránh khỏi mắc lỗi. Ảnh: Google.

Phiên bản mới nhất của Google’s Imagen 3, công cụ tạo hình ảnh từ văn bản, sẽ được cung cấp cho tất cả khách hàng của Google Cloud thông qua Vertex bắt đầu từ tuần sau. Trước đó, người dùng chỉ có thể sử dụng công cụ trên nền tảng Google AI Test Kitchen từ tháng 8.

Người dùng trong danh sách cho phép của Google sẽ có thể truy cập các tính năng mới như chỉnh sửa ảnh dựa trên yêu cầu và khả năng thêm vào hình ảnh những yếu tố như thương hiệu, phong cách, logo, đối tượng hoặc đặc điểm riêng của sản phẩm.

Trước đó, một số thương hiệu như Agoda và Mondelez International đã sử dụng công nghệ AI như Veo, Gemini, và Imagen để tối ưu hóa quy trình sản xuất quảng cáo video, giảm đáng kể về thời gian sản xuất.

Google cho biết Veo và Imagen 3 được tích hợp các biện pháp bảo vệ để ngăn chặn việc tạo ra nội dung xấu hoặc vi phạm bản quyền dù chúng không khó để vượt qua, theo The Verge. Mọi sản phẩm tạo ra từ hai công cụ trên cũng sẽ có con dấu bản quyền từ công nghệ SynthID của DeepMind nhằm giảm bớt thông tin sai lệch và xác định rõ nguồn gốc.

Với việc công bố mô hình Veo, OpenAI rõ ràng đã tụt lại phía sau với đối thủ. Trong khi đó, lời hứa về sự ra mắt Sora vào cuối năm 2024 cũng sắp hết thời gian thực hiện.

Một số công ty lớn như Coca-Cola đã sử dụng nội dung được tạo bởi AI trong các chiến dịch quảng cáo của họ. Theo Google, 86% các tổ chức đã sử dụng AI tạo sinh đang thấy doanh thu của họ tăng lên. Điều này càng khiến cho các doanh nghiệp khó lòng chờ đợi sản phẩm của OpenAI.

Những câu hỏi chúng ta phải đối mặt trong thế giới AI

Chúng ta có rất nhiều câu hỏi về thế giới AI, mà đó đều là những nghi hoặc không dễ có ngay đáp án.

Cuốn sách Thời đại AI - Và tương lai loài người chúng ta trình bày cách AI làm thay đổi mối quan hệ của chúng ta với tri thức, chính trị và xã hội. Mục tiêu tối thượng của cuốn sách này là giải thích về AI và cung cấp cho độc giả những câu hỏi mà chúng ta sẽ phải đối mặt trong những năm tới lẫn bộ công cụ để bắt đầu trả lời chúng.