GPU NVIDIA A100 có thêm hai “người em”: A10 và A30
maychuhnoi > 10-30-2021, 04:14 AM
GPU A100 của NVIDIA đc trình làng vào năm kia đem đến hiệu suất ưu việt cho những trung tâm tàn ác liệu đám mây & cực kỳ máy tính, nhưng dòng thiết bị này quá nặng mẽ và đắt tiền đối với nhiều workload thông thường. Chính vì như vậy mà tại sự kiện GTC, NVIDIA đã reviews hai người em cho loại GPU đầu bảng, này là A30 dành riêng cho máy chủ nghiên cứu và phân tích và AI chính thống, & A10 dành riêng cho các workload đồ họa & giám sát và đo lường hỗn hợp.
Nvidia
Bảng so sánh GPU cơ sở dữ liệu A100 của Nvidia mang 2 phiên bản tốt hơn
A100 for PCIe A30 A10
FP64 9.7 TFLOPS 5.2 TFLOPS –
FP64 Tensor Core 19.5 TFLOPS 10.3 TFLOPS –
FP32 19.5 TFLOPS 10.3 TFLOPS 31.2 TFLOPS
TF32 156 TF 82 TF 62.5 TFLOPS
Bfloat16 312 TF 165 TF 125 TF
FP16 Tensor Core 312 TF 165 TF 125 TF
INT8 624 TOPS 330 TOPS 250 TOPS
INT4 1248 TOPS 661 TOPS 500 TOPS
RT Cores – – 72
Memory 40 GB HBM2 24 GB HBM2 24 GB GDDR6
Memory Bandwidth 1,555 GB/s 933 GB/s 600 GB/s
Interconnect 12 NVLinks, 600 GB/s ? NVLinks, 200 GB/s –
Multi-Instance 7 MIGs @ 5 GB 4 MIGs @ 6 GB –
Optical Flow Acceleration – 1 –
NVJPEG – 1 decoder ?
NVENC – ? 1 Encoder
NVDEC – 4 decoders 1 decoder (+AV1)
Form-Factor FHFL FHFL FHFL
TDP 250W 165W 150W
>>> Xem thêm: máy chủ dell t640
Nvidia A30: Một GPU xử lý cho suy luận AI
Card GPU NVIDIA A30 là đứa em của A100 & dựa theo cộng một kiến trúc Ampere đào bới các node giải pháp xử lý chuyên sử dụng. Nó cũng hỗ trợ các tính năng tương tự, một loạt các phép toán cho AI cũng như những workload HPC (FP64, FP64TF, FP32, TF32, bfloat16, FP16, INT8, INT4) và thậm chí bổ trợ Multi-Instant GPU (MIG) sở hữu phiên bản 6GB. Từ gốc độ hiệu suất, GPU A30 hỗ trợ hơn một nửa hiệu suất của A100, sở hữu những chỉ số hiệu năng 10,3 FP32 TFLOPS, 5,2 FP64 TFLOPS và 165 FP16/bfloat16 TFLOPS.
lúc nói tới bộ nhớ, dòng thiết bị đc trang bị 24GB DRAM với băng thông 933GB/s (chúng tôi nghĩ rằng NVIDIA sử dụng ba lớp HBM2 mang tốc độ khoảng 2,4 GT/s, nhưng công ty chưa chứng thực điều này). Hệ thống con bộ lưu trữ Trong khi thiếu sự bổ trợ cho ECC, trên đây có thể là một trong hạn chế so với các người nên thao tác làm việc có bộ ác ôn liệu to. Một cách kết quả, NVIDIA muốn các quý khách này nghĩ đến việc sử dụng quá A100 đắt tiền hơn.
NVIDIA theo truyền thống ko bật mý cấu hình đúng đắn của những dòng sản phẩm GPU máy tính xách tay của bản thân mình lúc công bố, nhưng công ty chúng tôi nghi vấn rằng A30 và đúng là ‘một nửa’ của A100 mang 3456 lõi CUDA, dù rằng đó là điều chưa đc chứng thực tại thời điểm này.
A30 của NVIDIA có form size full-height, full-length (FHFL) chiếm hai slot PCIe, có giao diện PCIe 4.0 x16 & TDP 165W, tránh từ 250W trong tình huống của FHFL A100. Bên cạnh đó đó, A30 hỗ trợ một NVLink với tốc độ 200 GB / s (giảm từ 600 GB / s trong tình huống của A100).
>>> Xem thêm: bán t640 giá rẻ
Nvidia A10: GPU cho AI, Đồ họa và video
A10 của Nvidia không dựa theo A100 & A30, không tìm hiểu workload chuyên dụng, mà là 1 sản phẩm hoàn toàn khác thậm chí được sử dụng cho đồ họa, suy luận AI và những workload cho encode/decode (transcode) đoạn phim. A10 bổ trợ các định dạng FP32, TF32, blfoat16, FP16, INT8 & INT4 cho đồ họa & AI, nhưng không hỗ trợ FP64 cần cho HPC.
A10 là 1 trong những card đồ họa FHFL một slot sở hữu giao diện PCIe 4.0 x16 sẽ cài đặt vào sever chạy ứng dụng Nvidia RTX Virtual Workstation (vWS) & hỗ trợ sức khỏe từ xa cho các máy trạm bắt buộc cả kinh nghiệm AI & đồ họa. Ở một giai đoạn to hơn, A10 được kỳ vọng là công cụ đắc lực để thao tác từ xa cho những người nghệ sỹ, nhà thiết kế, kỹ sư và nhà nghiên cứu khoa học (những người không cần FP64).
A10 của NVIDIA Hình như dựa trên GA102 silicon, nhưng do nó bổ trợ các phân vùng INT8 và INT4, phía trên bản chất là cộng một bộ xử trí hỗ trợ sức khỏe cho GeForce RTX 3080/3090 và RTX A6000 của NVIDIA. Bên cạnh đó đó, hiệu suất của A10 (31,2 FP32 TFLOPS, 125 FP16 TFLOPS) nằm trong phạm vi của GeForce RTX 3080. Card đc đồ vật 24GB bộ nhớ GDDR6 băng thông lên tới 600GB/s, mà thậm chí là giao diện bộ nhớ của RTX 3090 nhưng vẫn không có xung nhịp GDDR6X.
>>> Xem thêm: bán máy chủ dell t440