Mô hình AI DeepSeek mạnh mẽ nhưng chi phí đào tạo thấp hơn nhiều đối thủ ở Mỹ, khiến giới công nghệ bất ngờ. Ảnh: Reuters. |
Trong tuyên bố đưa ra vào cuối ngày 27/1 (theo giờ Mỹ), Nvidia cho biết những tiến bộ của công ty AI Trung Quốc DeepSeek cho thấy tính hữu ích của chip của họ đối với thị trường Trung Quốc và sẽ cần nhiều chip hơn nữa trong tương lai để đáp ứng nhu cầu dịch vụ của DeepSeek.
Tuyên bố này được đưa ra sau khi cổ phiếu của công ty giảm 17%, do lo ngại của nhà đầu tư rằng DeepSeek đã đạt được thành tích ngang tầm với các đối thủ như OpenAI trong khi sử dụng lượng chip Nvidia ít hơn nhiều so với các công ty Mỹ. Giá trị vốn hóa của Nvidia đã giảm gần 600 tỷ USD chỉ sau một ngày. Cổ phiếu của đối thủ Advanced Micro Devices (AMD) cũng giảm hơn 6%.
"DeepSeek cho thấy cách các mô hình mới có thể được tạo ra bằng kỹ thuật, tận dụng các mô hình sẵn có và phần cứng tính toán hoàn toàn tuân thủ kiểm soát xuất khẩu", trích tuyên bố của Nvidia, trong đó hãng nhắc đến hạn chế xuất khẩu chip tiên tiến của Mỹ.
Một trong những báo cáo nghiên cứu của DeepSeek cho thấy họ đã sử dụng khoảng 2.000 chip H800 của Nvidia, được thiết kế để tuân thủ các biện pháp kiểm soát xuất khẩu của Mỹ được ban hành năm 2022, những quy định mà các chuyên gia nói với Reuters sẽ hầu như không làm chậm tiến độ AI của Trung Quốc.
Các biện pháp kiểm soát xuất khẩu chip của Mỹ được thiết kế nhằm làm chậm sự phát triển siêu máy tính của Trung Quốc, đề phòng nước này phát triển vũ khí hạt nhân và các hệ thống trí tuệ nhân tạo.
Jimmy Goodrich, cố vấn cao cấp của RAND, cho biết có hàng chục siêu máy tính lớn ở Trung Quốc, sử dụng một lượng lớn chip Nvidia được mua hợp pháp vào thời điểm DeepSeek đào tạo mô hình của họ. Đào tạo mô hình AI hiệu quả hơn cũng đang là trọng tâm của nhiều công ty AI Mỹ.
"DeepSeek không xuất hiện từ hư không - họ đã xây dựng mô hình trong nhiều năm. Từ lâu người ta biết rằng DeepSeek có một đội ngũ thực sự giỏi, và nếu họ có thể tiếp cận năng lực tính toán tốt hơn, chỉ có trời mới biết họ có thể làm được gì", Reuters trích lời chuyên gia này.
Sau khi DeepSeek được biết đến rộng rãi ở nước ngoài, hạ tầng của công ty này bắt đầu gặp trục trặc và không thể đáp ứng lượng người dùng mới tăng đột biến. Sau khi một mô hình được công bố, quá trình phục vụ người dùng, được gọi là suy luận hay "inference", cũng sử dụng năng lực tính toán để cho ra kết quả. Nvidia cho rằng lượng người dùng sử dụng DeepSeek cũng sẽ làm tăng lượng sử dụng chip của họ.
"Suy luận đòi hỏi số lượng đáng kể GPU Nvidia và mạng hiệu suất cao," Nvidia nói trong tuyên bố của mình.
Ở Trung Quốc, Nvidia bán chip H20 được thiết kế để đáp ứng các quy định kiểm soát xuất khẩu mới nhất của Mỹ. Mặc dù năng lực tính toán bị giới hạn ở khâu đào tạo AI, Goodrich nói rằng nó "có lẽ là chip tốt nhất thế giới cho khâu suy luận".
Cách Jensen Huang đốc thúc nhân viên
Để đưa gã khổng lồ công nghệ Nvidia lên vị thế hôm nay, CEO Jensen Huang tâm niệm phải giữ nhân sự trong tâm thế có phần "lo âu", "sợ hãi". Đó là một trong những khía cạnh về CEO Nvidia được tiết lộ trong cuốn sách thuật lại trong sách The Nvidia Way: Jensen Huang and the Making of a Tech Giant (tạm dịch: Phong cách Nvidia: Jensen Huang và hành trình tạo dựng gã khổng lồ công nghệ).
Link nội dung: https://businessinvestmentvn.com/nvidia-noi-gi-ve-deepseek-ai-khien-hang-mat-600-ty-usd-a212929.html