TIN TỨC

DeepSeek-R2 lộ lịch ra mắt

Mô hình AI DeepSeek-R2 được cho là sẽ ra mắt vào cuối tháng 8 này với những nâng cấp ấn tượng so với thế hệ trước.

Theo thông tin rò rỉ mới nhất, DeepSeek đang chuẩn bị ra mắt mô hình ngôn ngữ lớn thế hệ tiếp theo, DeepSeek-R2, vào cuối tháng 8/2025. Thông tin này được tiết lộ trong quá trình tương tác với mô hình AI của DeepSeek.

DeepSeek-R2 dự kiến sẽ mang đến những cải tiến ấn tượng về kiến trúc nhờ áp dụng thiết lập Mixture of Experts (MoE) tiên tiến hơn. Nó cũng sẽ tích hợp một mạng lưới cổng thông minh hơn để xử lý tốt hơn các khối lượng công việc đòi hỏi suy luận.

Theo các nguồn tin thân cận với quá trình phát triển, mô hình này có thể mở rộng lên đến 1.2 nghìn tỷ tham số, gần gấp đôi so với DeepSeek-R1, vốn chỉ có 671 tỷ tham số. Dù vậy, con số này vẫn thấp hơn ChatGPT-4/5, vốn có hơn 1.8 nghìn tỷ tham số.

Trong một động thái chiến lược hướng tới khả năng tự chủ AI trong nước, mô hình này đã được đào tạo hoàn toàn trên chip Ascend 910B của Huawei. Cụm máy tính của Huawei, với hiệu năng FP16 đạt 512 PFLOPS ở mức sử dụng 82%, được cho là đạt 91% hiệu năng của cụm A100 của Nvidia. Các nhà phân tích coi đây là một bước đi quan trọng trong việc giảm sự phụ thuộc của Trung Quốc vào phần cứng AI do Mỹ sản xuất.

Chi phí đào tạo của DeepSeek-R2 được cho là thấp hơn 97% so với GPT-4 nhờ phần cứng và kỹ thuật tối ưu hóa nội bộ. Các nhà phân tích kỳ vọng DeepSeek sẽ cung cấp quyền truy cập API với mức giá thấp hơn, điều này có thể làm thay đổi các mô hình hiện tại do OpenAI và Anthropic thống trị.

You may also like

Nhận thông báo qua email
Nhận thông báo cho
guest

0 Bình luận
Mới nhất
Cũ nhất Nhiều like nhất
Phản hồi nội tuyến
Xem tất cả bình luận