- Tham gia
- 23/5/20
- Bài viết
- 764
- Thích
- 0
- Điểm
- 16
Giới thiệu
Không phải mọi hệ thống điện toán đều nên được đặt trên đám mây. Các đội nhóm làm việc về suy luận, mô phỏng hoặc huấn luyện AI thường được hưởng lợi từ việc giữ tài nguyên điện toán ngay tại chỗ. Khi các tập dữ liệu lớn, nhạy cảm hoặc thường xuyên được truy xuất, việc chạy tác vụ tại chỗ sẽ tránh được độ trễ truyền dẫn, cũng như việc phải truy cập đám mây liên tục và cấp quyền kiểm soát phần cứng hoàn toàn.
Máy chủ GPU mang lại khả năng tăng tốc mạnh mẽ cho các tác vụ này, và việc triển khai chúng ngay tại chỗ giúp cắt giảm chi phí đám mây định kỳ. Nó cũng giúp loại bỏ sự phụ thuộc vào hạ tầng dùng chung và cho phép các team làm việc mà không bị giới hạn sử dụng hoặc xung đột.
Tôi có thể triển khai máy chủ GPU của mình tại các phòng máy chủ của công ty không?
Hẳn nhiên! Thực tế, nhiều doanh nghiệp không có trung tâm dữ liệu chuyên dụng để đặt các tủ rack và máy chủ GPU. Các doanh nghiệp nhỏ và phòng thí nghiệm không có trung tâm dữ liệu tiêu chuẩn đầy đủ. Thay vào đó họ phải làm việc với phòng máy chủ, tủ chứa và không gian được chuyển đổi. Nhưng họ vẫn có thể hỗ trợ cho các hệ thống GPU thực thụ miễn là việc triển khai phải được lên kế hoạch một cách chu đáo.
Lựa chọn phần cứng cho máy chủ GPU
Thiết lập cấu hình triển khai của bạn với GPU để làm sao phù hợp với mục tiêu xử lý và nằm trong ngân sách dành cho hệ thống tản nhiệt và cấp nguồn của bạn.
>>> Xem thêm: máy chủ chính hãng
Lên kế hoạch về nguồn cấp điện
Đối với bất kỳ triển khai máy chủ HPC nào, bạn cần nguồn điện ổn định, thông lượng cao. Hãy sử dụng các công cụ tính toán BTU khi cấu hình máy chủ và sau đó cộng thêm mức dự phòng 30%.
Làm mát và luồng không khí
Nhiệt độ tăng rất nhanh, đặc biệt là trong không gian hạn chế. GPU hiệu suất cao tạo ra hàng trăm watt tải nhiệt mỗi chiếc, và khi bạn xếp chồng nhiều card vào một thùng máy, đường dẫn luồng khí trở nên rất quan trọng. Không gian quan trọng hơn bản thân máy chủ.
Công ty cổ phần thương mại Máy Chủ Hà Nội
Trụ sở Hà Nội: Tầng 1,2,4 - Tòa nhà PmaxLand số 32 ngõ 133 Thái Hà - Q. Đống Đa
- Hotline: 0979 83 84 84
- Tel: 024 6296 6644
Chi nhánh HCM: Lầu 1- Tòa nhà 666/46/29 Đường 3/2- Phường 14 - Quận 10
- Hotline: 0945 92 96 96
- Tel: 028 2244 9399
- Email: kinhdoanhhn@maychuhanoi.vn
Không phải mọi hệ thống điện toán đều nên được đặt trên đám mây. Các đội nhóm làm việc về suy luận, mô phỏng hoặc huấn luyện AI thường được hưởng lợi từ việc giữ tài nguyên điện toán ngay tại chỗ. Khi các tập dữ liệu lớn, nhạy cảm hoặc thường xuyên được truy xuất, việc chạy tác vụ tại chỗ sẽ tránh được độ trễ truyền dẫn, cũng như việc phải truy cập đám mây liên tục và cấp quyền kiểm soát phần cứng hoàn toàn.
Máy chủ GPU mang lại khả năng tăng tốc mạnh mẽ cho các tác vụ này, và việc triển khai chúng ngay tại chỗ giúp cắt giảm chi phí đám mây định kỳ. Nó cũng giúp loại bỏ sự phụ thuộc vào hạ tầng dùng chung và cho phép các team làm việc mà không bị giới hạn sử dụng hoặc xung đột.
Tôi có thể triển khai máy chủ GPU của mình tại các phòng máy chủ của công ty không?
Hẳn nhiên! Thực tế, nhiều doanh nghiệp không có trung tâm dữ liệu chuyên dụng để đặt các tủ rack và máy chủ GPU. Các doanh nghiệp nhỏ và phòng thí nghiệm không có trung tâm dữ liệu tiêu chuẩn đầy đủ. Thay vào đó họ phải làm việc với phòng máy chủ, tủ chứa và không gian được chuyển đổi. Nhưng họ vẫn có thể hỗ trợ cho các hệ thống GPU thực thụ miễn là việc triển khai phải được lên kế hoạch một cách chu đáo.
- Tiêu thụ điện năng: Máy chủ GPU tiêu thụ rất nhiều điện năng. Trong tủ rack hoặc khung đặt máy, ổ cắm điện có thể không dễ tiếp cận. Đối với việc triển khai nhiều GPU, hãy cân nhắc lắp đặt tủ với ổ cắm ba pha 208V hoặc một pha 240V.
- Không gian: Không gian là một thách thức lớn, đặc biệt là trong các phòng không được thiết kế riêng để lắp đặt tủ rack. Các tủ kín vừa khít cần được lên kế hoạch cẩn thận để quản lý cáp và tiếp cận các dịch vụ.
- Làm mát: Để đảm bảo cho hiệu năng tối đa đòi hỏi việc tản nhiệt hiệu quả. Nếu luồng không khí bị chặn hoặc nguồn điện không đều, hệ thống sẽ tự động giảm xung (thermal throttling) hoặc thậm chí ngắt nguồn. Các giải pháp bao gồm lắp đặt hệ thống điều hòa không khí và tạo luồng xả khí trong tủ.
Lựa chọn phần cứng cho máy chủ GPU
Thiết lập cấu hình triển khai của bạn với GPU để làm sao phù hợp với mục tiêu xử lý và nằm trong ngân sách dành cho hệ thống tản nhiệt và cấp nguồn của bạn.
- Kiểu máy chủ (form factor): Nếu phòng máy chủ hoặc tủ máy chủ của bạn có không gian hạn chế, bạn vẫn có thể triển khai hệ thống GPU lớn để cung cấp sức mạnh cho hệ thống HPC của mình.
- Nếu phòng có không gian hẹp, hãy cân nhắc máy chủ rack có chiều sâu ngắn (short-depth).
- Có thể chọn máy trạm có thể lắp lên rack. Mặc dù chiếm nhiều diện tích rack nhiều hơn, nhưng chúng có thể cho phép lưu thông không khí tốt hơn nếu không được lắp ghép chặt chẽ với nhau và có chiều sâu ngắn hơn so với máy chủ tiêu chuẩn.
- Lựa chọn GPU: Trong khi các card đồ họa hàng đầu và cao cấp đang được ưa chuộng thì các GPU đơn giản hơn có thể phù hợp với không gian và cấu hình điện năng của bạn, và vẫn có thể mang lại hiệu suất vượt trội.
- Nếu khối lượng công việc của bạn cần hiệu năng cực cao, hãy chọn những card đồ họa mạnh mẽ như NVIDIA H200 NVL và RTX PRO 6000 Blackwell. Nhưng hãy chuẩn bị tinh thần cho mức tiêu thụ điện năng lớn và yêu cầu tản nhiệt cao của chúng.
- Đối với khối lượng công việc mang tính phân tán, card có công suất thấp hơn có thể cung cấp khả năng song song hóa tốt hơn.
- Nếu luồng không khí trong phòng máy chủ của bạn bị hạn chế, GPU làm mát chủ động có thể giúp tản nhiệt so với GPU làm mát thụ động.
- Bạn không cần phải lắp đầy tất cả các khe cắm. Số lượng GPU ít nhưng có VRAM cao hơn có thể cải thiện khả năng tản nhiệt tốt hơn so với việc lắp đầy các slot.
- CPU và Bộ nhớ: CPU không nên làm tắc nghẽn thông lượng của GPU.
- Sử dụng CPU có số làn PCIe cao và đủ số lượng lõi để giữ cho bus kết nối luôn được dùng hết.
- Bộ nhớ phải phù hợp với nhu cầu công việc. Đào tạo và mô phỏng AI có thể cần 128GB hoặc hơn.
- Lưu trữ và mạng: Lưu trữ cục bộ nhanh giúp tránh tình trạng dừng I/O.
- Dùng ổ SSD NVMe/SATA bất cứ khi nào có thể.
- RAID là tùy chọn nhưng hữu ích cho khả năng phục hồi.
- Cổng mạng tối thiểu 10GbE cho khối lượng công việc được chia sẻ.
- Hãy cân nhắc sử dụng cáp gắn trực tiếp cho các đoạn chạy ngắn và ít switch hơn.
>>> Xem thêm: máy chủ chính hãng
Lên kế hoạch về nguồn cấp điện
Đối với bất kỳ triển khai máy chủ HPC nào, bạn cần nguồn điện ổn định, thông lượng cao. Hãy sử dụng các công cụ tính toán BTU khi cấu hình máy chủ và sau đó cộng thêm mức dự phòng 30%.
- Yêu cầu về mạch: Máy chủ GPU sử dụng nguồn điện lớn, thường cao hơn so với mức mà các ổ cắm tiêu chuẩn có thể cung cấp an toàn.
- Ưu tiên mạch 208V với cầu dao ngắt 20A hoặc 30A.
- Tránh chạy máy chủ công suất cao trên đường dây 15A/120V dùng chung.
- Kiểm tra tổng mức tiêu thụ, không chỉ TDP của GPU – quạt, ổ đĩa và CPU đều được cộng lại.
- Phân phối điện: Sử dụng PDU có đồng hồ đo điện rõ ràng. Giám sát trực tuyến giúp phát hiện các nhánh quá tải trước khi chúng bị ngắt, đóng vai trò như bộ ngắt tải để bảo vệ chống lại tình trạng sụt áp.
- PDU dọc giúp tiết kiệm không gian tủ rack.
- Loại ngang hoạt động tốt hơn trong các tủ rack cạn.
- Nếu thời gian hoạt động là quan trọng, hãy sử dụng UPS chuyển đổi kép để tăng cường khả năng dự phòng.
Làm mát và luồng không khí
Nhiệt độ tăng rất nhanh, đặc biệt là trong không gian hạn chế. GPU hiệu suất cao tạo ra hàng trăm watt tải nhiệt mỗi chiếc, và khi bạn xếp chồng nhiều card vào một thùng máy, đường dẫn luồng khí trở nên rất quan trọng. Không gian quan trọng hơn bản thân máy chủ.
- Nguyên lý luồng không khí: Sử dụng thiết bị có luồng không khí từ trước ra sau và áp dụng nguyên lý “không khí nóng bốc lên cao”.
- Chừa khoảng trống phía sau máy chủ để xả khí.
- Giữ cho lỗ thông hơi sạch sẽ và không bị cản trở.
- Bạn có thể sử dụng cửa thông gió kép với phần dưới là cửa hút và phần trên là cửa xả.
- Điều chỉnh cho các tủ không chuyên dụng: Các tủ lắp và không gian cải tạo thường thông gió kém.
- Thêm quạt ống dẫn luồng thẳng hàng để hút không khí ấm ra ngoài.
- Thoát khí ra trần nhà hoặc không gian thông gió liền kề.
- Lắp đặt lỗ hồi hơi (luồng quay trở lại) nếu phòng bị bịt kín.
- Tiếng ồn, An toàn và Chi phí: Hầu hết các máy chủ đều không yên tĩnh và công suất điện cao có thể gây nguy cơ hỏa hoạn.
- Sử dụng tấm cách âm và lớp chống cháy lót cho phòng máy chủ.
- Chạy các tải dài qua đêm để tránh tiếng ồn và giảm chi phí điện.
Công ty cổ phần thương mại Máy Chủ Hà Nội
Trụ sở Hà Nội: Tầng 1,2,4 - Tòa nhà PmaxLand số 32 ngõ 133 Thái Hà - Q. Đống Đa
- Hotline: 0979 83 84 84
- Tel: 024 6296 6644
Chi nhánh HCM: Lầu 1- Tòa nhà 666/46/29 Đường 3/2- Phường 14 - Quận 10
- Hotline: 0945 92 96 96
- Tel: 028 2244 9399
- Email: kinhdoanhhn@maychuhanoi.vn