BIẾT A.I CHƯA?TIN TỨC

DeepSeek tối ưu phần mềm – Nâng hiệu năng chip AI lên gấp 8 lần, từ 73 lên 580 Tflops

Trong thế giới công nghệ không ngừng phát triển, việc tối ưu hóa phần mềm đang trở thành yếu tố then chốt để khai thác tối đa tiềm năng của phần cứng. Một minh chứng rõ ràng nhất là thành tựu của DeepSeek, một công ty Trung Quốc, khi họ tăng hiệu năng của chip xử lý AI lên gấp 8 lần chỉ thông qua tối ưu phần mềm.

DeepSeek và bước đột phá trong tối ưu phần mềm

DeepSeek đã giới thiệu một thuật toán máy học độc đáo, được thiết kế và tối ưu đặc biệt cho một mẫu GPU cụ thể – Nvidia H800. Chip này được Nvidia phát triển và sản xuất riêng cho thị trường Trung Quốc, sau khi Mỹ áp đặt các hạn chế về hiệu năng và băng thông bộ nhớ của chip dành cho khách hàng ở Đại Lục.

Thông thường, chip H800 hoạt động ở tốc độ xử lý số thực dấu phẩy động (BF16) khoảng 73.5 teraflops và băng thông bộ nhớ tối đa đạt 1681 GB/s. Tuy nhiên, khi kết hợp với FlashMLA – công nghệ tối ưu phần mềm của DeepSeek, hiệu năng của chip đã tăng lên một cách đáng kinh ngạc: băng thông đạt 3000 GB/s và hiệu suất nhân ma trận BF16 lên tới 580 teraflops.

FlashMLA – Công nghệ tối ưu phần mềm đột phá

Điều đáng chú ý là những kết quả này hoàn toàn đến từ việc tối ưu phần mềm, không hề có sự can thiệp vào phần cứng của chip H800. FlashMLA ứng dụng một kỹ thuật gọi là “nén dữ liệu then chốt”, giúp chia nhỏ dữ liệu để xử lý nhanh hơn và giảm tiêu thụ bộ nhớ từ 40 đến 60%.

Ngoài ra, FlashMLA còn sử dụng hệ thống paging theo khối, cho phép phân bổ bộ nhớ động dựa trên từng tác vụ cụ thể thay vì áp dụng một giá trị cố định. Cách tiếp cận này giúp các mô hình xử lý chuỗi dữ liệu có độ dài thay đổi hoạt động hiệu quả hơn, từ đó nâng cao hiệu suất tổng thể của các mô hình AI.

Ý nghĩa chiến lược của DeepSeek

Vào ngày 24/2, Đại sứ quán Trung Quốc tại Mỹ đã đưa ra thông báo nhấn mạnh rằng: “Khi AI tiếp tục định hình lại nhiều ngành công nghiệp và thậm chí là cuộc sống hàng ngày, DeepSeek có sứ mệnh bổ trợ chứ không phải cạnh tranh với các tên tuổi hàng đầu như OpenAI, Anthropic và Google DeepMind.”

Thông điệp này được xem là một nỗ lực của Trung Quốc nhằm xoa dịu chính quyền Washington, tránh những quy định cấm vận mới đối với ngành bán dẫn và AI. Trong bối cảnh căng thẳng địa chính trị, việc tối ưu phần mềm để khai thác tối đa phần cứng trở thành một chiến lược quan trọng giúp Trung Quốc duy trì khả năng cạnh tranh trong lĩnh vực công nghệ cao.

Tương lai của AI và sự cạnh tranh toàn cầu

Thành tựu của DeepSeek không chỉ là một cột mốc đáng chú ý trong lĩnh vực AI mà còn phản ánh xu hướng toàn cầu: tối ưu phần mềm đang trở thành yếu tố then chốt để nâng cao hiệu suất mà không cần thay đổi phần cứng. Đây cũng là minh chứng cho thấy, trong bối cảnh cạnh tranh gay gắt giữa các cường quốc công nghệ, sự sáng tạo và khả năng thích ứng sẽ quyết định vị thế dẫn đầu.

Với những bước tiến như vậy, DeepSeek không chỉ khẳng định vị thế của mình mà còn mở ra những cơ hội mới cho sự phát triển của AI trên toàn cầu.

Chia sẻ: P.W

You may also like

Nhận thông báo qua email
Nhận thông báo cho
guest

0 Bình luận
Mới nhất
Cũ nhất Nhiều like nhất
Phản hồi nội tuyến
Xem tất cả bình luận