Deepseek là gì mà gây xáo trộn lĩnh vực AI, khiến 'trùm công nghệ' NVIDIA mất 600 tỷ USD trong 1 ngày
Việc 1 công ty start up Trung Quốc DeepSeek ra mắt mô hình AI mới nhất, được họ cho là ngang bằng hoặc tốt hơn các mô hình hàng đầu trong ngành tại Hoa Kỳ nhưng có chi phí chỉ bằng một phần nhỏ, đang đe dọa làm đảo lộn trật tự giới công nghệ.
Deepseek đã thu hút sự chú ý trong giới AI toàn cầu sau khi viết trong một bài báo vào tháng trước rằng việc đào tạo DeepSeek-V3 chỉ cần sức mạnh tính toán trị giá dưới 6 triệu USD từ chip Nvidia H800.
Trợ lý AI của DeepSeek, được hỗ trợ bởi DeepSeek-V3, đã vượt qua đối thủ ChatGPT để trở thành ứng dụng miễn phí được đánh giá cao nhất có sẵn trên App Store của Apple tại Hoa Kỳ. Điều này làm dấy lên nghi ngờ về lý do đằng sau quyết định đầu tư hàng tỷ đô la vào AI của một số công ty công nghệ Hoa Kỳ và cổ phiếu của một số công ty công nghệ lớn, bao gồm cả Nvidia, đã bị ảnh hưởng.
Dưới đây là một số sự thật về công ty đang làm thay đổi ngành AI trên toàn thế giới.
Tại sao Deekseek lại gây ra sự khủng hoảng?
Việc phát hành ChatGPT của OpenAI vào cuối năm 2022 đã gây ra một cuộc chạy đua giữa các công ty công nghệ Trung Quốc, những người đã vội vã tạo ra các chatbot của riêng mình được hỗ trợ bởi trí tuệ nhân tạo.
Nhưng sau khi phát hành phiên bản ChatGPT tiếng Trung đầu tiên, được tạo ra bởi gã khổng lồ công cụ tìm kiếm Baidu (9888.HK), Trung Quốc rất thất vọng về khoảng cách về năng lực AI giữa các công ty Hoa Kỳ và Trung Quốc.
Nhưng chất lượng và hiệu quả về chi phí của các mô hình DeepSeek đã đảo ngược câu chuyện này. Hai mô hình được các giám đốc điều hành tại Thung lũng Silicon và các kỹ sư công ty công nghệ Hoa Kỳ ca ngợi, DeepSeek-V3 và DeepSeek-R1, ngang bằng với các mô hình tiên tiến nhất của OpenAI và Meta, công ty khởi nghiệp Trung Quốc cho biết.
“Chúng cũng rẻ hơn khi sử dụng”. Theo bài đăng trên tài khoản WeChat chính thức của DeepSeek, DeepSeek-R1, được phát hành vào tuần trước, rẻ hơn từ 20 đến 50 lần so với mô hình OpenAI o1, tùy thuộc vào nhiệm vụ.
Nhưng một số người đã công khai bày tỏ sự hoài nghi về câu chuyện thành công của DeepSeek. Tổng giám đốc điều hành của Scale AI, Alexandr Wang, cho biết trong một cuộc phỏng vấn với CNBC vào thứ năm, mà không đưa ra bằng chứng, rằng DeepSeek có 50.000 chip Nvidia H100, mà ông tuyên bố sẽ không tiết lộ vì điều đó sẽ vi phạm các biện pháp kiểm soát xuất khẩu của Washington, cấm bán các chip AI tiên tiến như vậy cho các công ty Trung Quốc. DeepSeek đã không trả lời ngay lập tức yêu cầu bình luận về cáo buộc này.
Các nhà phân tích của Bernstein hôm thứ Hai đã nhấn mạnh trong một lưu ý nghiên cứu rằng tổng chi phí đào tạo của DeepSeek cho mô hình V3 của họ vẫn chưa được biết nhưng cao hơn nhiều so với con số 5,58 triệu đô la mà công ty khởi nghiệp này cho biết đã được sử dụng cho sức mạnh tính toán. Các nhà phân tích cũng cho biết chi phí đào tạo của mô hình R1 cũng được ca ngợi không kém không được tiết lộ.
Ai là người đứng sau Deepseek?
DeepSeek là một công ty khởi nghiệp có trụ sở tại Hàng Châu, có cổ đông kiểm soát là Liang Wenfeng, đồng sáng lập quỹ đầu cơ định lượng High-Flyer, dựa trên hồ sơ doanh nghiệp Trung Quốc.
Quỹ của Liang đã thông báo vào tháng 3 năm 2023 trên tài khoản WeChat chính thức của mình rằng họ đang "bắt đầu lại", vượt ra ngoài giao dịch để tập trung nguồn lực vào việc tạo ra một "nhóm nghiên cứu mới và độc lập, để khám phá bản chất của AGI" (Trí tuệ nhân tạo tổng quát). DeepSeek được thành lập vào cuối năm đó.
Những người tạo ra ChatGPT, OpenAI định nghĩa AGI là những hệ thống tự động vượt trội hơn con người trong hầu hết các nhiệm vụ có giá trị kinh tế.
Không rõ High-Flyer đã đầu tư bao nhiêu vào DeepSeek. High-Flyer có một văn phòng đặt tại cùng tòa nhà với DeepSeek và cũng sở hữu các bằng sáng chế liên quan đến cụm chip được sử dụng để đào tạo các mô hình AI, theo hồ sơ công ty Trung Quốc.
Đơn vị AI của High-Flyer cho biết trên tài khoản WeChat chính thức của mình vào tháng 7 năm 2022 rằng họ sở hữu và vận hành một cụm gồm 10.000 chip A100.
Ngay sau khi Deekseek gây chao đảo giới công nghệ, Nvidia đã mất gần 600 tỷ USD vốn hóa thị trường. Đây là mức giảm chưa từng có trong 1 ngày với 1 doanh nghiệp Mỹ. Cụ thể, giá cổ phiếu của nhà sản xuất chip AI đã giảm mạnh 17% xuống còn 118,58 USD/cổ phiếu. Con số này đánh dấu ngày tồi tệ nhất của Nvidia trên thị trường chứng khoán kể từ ngày 16/3/2020, thời điểm bắt đầu đại dịch COVID.
Theo CNBC, đợt bán tháo này xuất phát từ lo ngại rằng đối thủ trí tuệ nhân tạo đến từ Trung Quốc DeepSeek đang tạo ra sự cạnh tranh mạnh chưa từng có trong cuộc chiến AI toàn cầu.