06/02/2025 17:00

AI Trung Quốc gây sốc với video tạo chỉ bằng một tấm ảnh

Mô hình AI deepfake tạo video từ ảnh của ByteDance, công ty sở hữu TikTok một lần nữa cho thấy những tiến bộ của Trung Quốc trong lĩnh vực đầy cạnh tranh này.

Đoạn video chân thực được tạo bằng OmniHuman-1. Ảnh: ByteDance.

ByteDance, gã khổng lồ công nghệ đứng sau TikTok, đang gây chú ý với mô hình trí tuệ nhân tạo OmniHuman-1, nhờ khả năng chuyển ảnh và các đoạn âm thanh thành video chân thực. Sau DeepSeek, mô hình này cho thấy năng lực ngày càng gia tăng của Trung Quốc trong lĩnh vực trí tuệ nhân tạo.

Video tạo từ một bức ảnh của ByteDance ByteDance, công ty sở hữu TikTok vừa công bố công cụ AI có thể tạo video chỉ từ một bức ảnh và dòng lệnh.

Theo nhóm phát triển từ ByteDance, mô hình đa phương thức OmniHuman-1 của công ty có thể tạo ra những video người nói, hát và di chuyển đầy sống động với chất lượng “vượt trội đáng kể” so với các phương pháp tạo video người với âm thanh có sẵn, hơn cả các phiên bản AI trước chỉ hoạt hoạ gương mặt hay thân trên của chủ thể.

Hình ảnh, video và âm thanh của người thật được tạo ra bởi AI thường được gọi là deepfakes, một công nghệ đang ngày càng trở nên phổ biến trong các trường hợp gian lận cũng như các ứng dụng vô hại hơn cho mục đích giải trí.

Bytedance đã trở thành một trong những công ty AI gây sốt nhất tại Trung Quốc. Phần mềm Duobao của công ty hiện là ứng dụng AI được dùng nhiều nhất tại quốc gia này. Và mặc dù chưa phát hành OmniHuman-1 ra thị trường, các đoạn video mẫu về mô hình đã nhận được nhiều sự chú ý.

Nổi bật nhất trong số các video mẫu là đoạn clip phát biểu dài 23 giây của nhà bác học Albert Einstein. TechCrunch đã miêu tả kết quả của mô hình này là “vô cùng ấn tượng” và "có lẽ là các video deepfake chân thực nhất cho đến nay".

Với sự ra mắt của OmniHuman-1, các nhà phát triển AI Trung Quốc đã cho thấy sự tiến bộ của mình mặc những nỗ lực hạn chế AI từ Mỹ. Sự ra mắt này theo sau việc OpenAI mở rộng phát hành công cụ tạo video Sora, được cung cấp công khai cho người dùng ChatGPT Plus và Pro vào tháng 12.

Các nhà phát triển mô hình này cho biết dù công nghệ hoạt hình con người từ đầu đến chân đã phát triển rất nhiều trong vài năm trở lại đây, phương pháp của họ vẫn cải tiến so với các công nghệ tạo video thông thường.

Chiến lược của họ là kết hợp các bộ dữ liệu đa dạng đầu vào về văn bản, âm thanh và chuyển động, cụ thể là họ đã huấn luyện OmniHuman trên hơn 18.700 giờ dữ liệu video của con người. Phương pháp này cho phép tạo ra các video chân thực với tỷ lệ khung hình và cơ thể khác nhau, từ những cảnh cận mặt đến toàn thân.

Các đoạn video được tạo ra có các biểu cảm khuôn mặt chi tiết phù hợp với âm thanh và chuyển động đầu. Với cử chỉ, điệu bộ tự nhiên như thật, mô hình có khả năng được ứng dụng rộng rãi hơn trong thế giới thực, nhóm nghiên cứu cho biết.

Kể từ khi OpenAI lần đầu tiên giới thiệu mô hình Sora vào tháng 2/2024, các công ty công nghệ Trung Quốc đã đạt được những bước tiến đáng kể trong lĩnh vực tạo video.

ByteDance dẫn đầu với nền tảng AI Jimeng, được hỗ trợ bởi công cụ tạo video chủ lực của mình là PixelDance và Seaweed. Với bản cập nhật tháng 11/2024, tích hợp các phiên bản S2.0 Pro và P2.0 Pro của các mô hình, Jimeng có thể tạo ra các đoạn video khớp chặt chẽ với hình ảnh mà người dùng tải lên.

Các công ty công nghệ Trung Quốc khác cũng đang cạnh tranh trong lĩnh vực này, bao gồm đối thủ của ByteDance là Kuaishou Technology với ứng dụng Kling, và các công ty khởi nghiệp AI như Zhipu AI tại Bắc Kinh, Shengshu Tech, cùng với MiniMax tại Thượng Hải.

Những câu hỏi chúng ta phải đối mặt trong thế giới AI

Chúng ta có rất nhiều câu hỏi về thế giới AI, mà đó đều là những nghi hoặc không dễ có ngay đáp án.

Cuốn sách Thời đại AI - Và tương lai loài người chúng ta trình bày cách AI làm thay đổi mối quan hệ của chúng ta với tri thức, chính trị và xã hội. Mục tiêu tối thượng của cuốn sách này là giải thích về AI và cung cấp cho độc giả những câu hỏi mà chúng ta sẽ phải đối mặt trong những năm tới lẫn bộ công cụ để bắt đầu trả lời chúng.

Link nội dung: https://businessinvestmentvn.com/ai-trung-quoc-gay-soc-voi-video-tao-chi-bang-mot-tam-anh-a214572.html