- Tham gia
- 23/5/20
- Bài viết
- 601
- Thích
- 0
- Điểm
- 16
Chỉ số TFLOPs có lẽ nhiều người dùng so sánh đó là thước đo cho sức mạnh của card đồ họa, thế nhưng liệu chúng có thật sự cần thiết với game thủ không? đó vẫn là câu hỏi mà rất nhiều anh em game thủ chưa biết nó ra sao, vậy bài viết sau đây được dựa theo Engadget đã chỉ ra rằng chỉ số này chưa chắc đã nói lên được sức mạnh chơi game của 1 card đồ họa. hãy cùng Maychuhanoi tìm hiểu về vấn đề này xem liệu có đúng không nhé ?
Teraflops hay TFLOPs đang được dùng để đo sức mạnh tính toán, và thường được dùng để đo sức mạnh của bộ xử lý đồ họa (GPU). Khi mà GPU có sự khác nhau về kiến trúc, về số lượng nhân (giờ đã lên tới hơn 10 nghìn nhân rồi), TFLOPs trở thành một chỉ số dùng để so sánh, quảng bá. Nhưng rất tiếc, TFLOPs giờ không còn đầy đủ ý nghĩa cho việc này.
Chữ FLOPs có nghĩa là floating-point operations per second, hiểu đơn giản là số lượng phép tính liên quan đến số thập phân mà một con chip có thể tính được trong 1 giây. Tera là nghìn tỉ. Ghép lại nó có nghĩa là “trong một giây, GPU thực hiện được bao nhiêu nghìn tỉ phép tính”.
Trên nền tảng Steam, GPU được dùng phổ biến nhất hiện nay là GTX 1060, nó có sức mạnh là 4,4 TFLOPs, con mạnh hơn là NVIDIA RTX 2080 Ti thì có thể tính được 13,5 TFLOPs, hay như GPU của chiếc Xbox Series X sắp ra mắt có sức mạnh 12 TFLOPs.
Con số này được tính ra bằng cách lấy số nhân đổ bóng (shader) nhân với xung nhịp tối đa của GPU rồi nhân tiếp với số lượng lệnh mà GPU có thể thực hiện trong 1 clock. Đây là một cách tính khá ổn và minh bạch, nhưng khi nói về hiệu năng chơi game thì chưa đủ ý nghĩa.
>>> Xem thêm: máy chủ hp
Ví dụ, với GPU AMD RX 580 ra mắt năm 2017, nó có sức mạnh là 6,17 TFLOPs, trong khi hiệu năng thì tương đương với GPU RX 5500 - một dòng GPU giá rẻ mà hãng mới ra mắt năm nay với 5,2 TFLOPs. Như vậy, dù có số TFLOPs thấp hơn nhưng hiệu năng của RX 5500 vẫn đủ tốt nhờ vào sự thay đổi liên quan tới kiến trúc của chip, các tập lệnh, cho đến việc lập trình viên tận dụng tính năng của GPU hiệu quả hơn. Và cứ mỗi đời GPU mới ra mắt thì lại có thêm những cải tiến như thế này.
Ý mình muốn nói ở đây đó là ngay cả với cùng một công ty làm GPU thì những thay đổi về chip, về game sẽ khiến việc so sánh trực tiếp chỉ số TFLOPs giữa các dòng card với nhau trở nên không còn ý nghĩa, đặc biệt là về hiệu năng chơi game. Nó cũng giống như việc chỉ dựa vào mỗi xung nhịp để đánh giá một con CPU vậy. Và việc so sánh số này giữa AMD với NVIDIA cũng sẽ làm sai lệch ý nghĩa.
Hãy nói về dòng card RTX 3000 mới, chúng có cấu hình rất mạnh mẽ. Con rẻ nhất là RTX 3070 với giá $500 cũng đã có đến 5.888 nhân CUDA (là tên riêng của NVIDIA cho các nhân shader), sức mạnh của nó là 20 TFLOPs. Rồi chúng ta có RTX 3090 giá $1500 với 10.496 nhân và sức mạnh 36 TFLOPs. Về lý thuyết, NVIDIA đã tăng số nhân lên 140% và số TFLOPs tăng 160% so với card RTX 2080 Ti, con card mạnh nhất hiện bạn có thể mua được (tính đến tháng 9/2020)
Trước khi đi tiếp, bạn cần biết rằng card đồ họa của NVIDIA được cấu thành từ nhiều streaming multiprocessors (SM). Card RTX 2080 Ti có 68 SM, mỗi SM chứa 64 nhân “FP32” chuyên dành cho việc tính toán số thập phân và 64 nhân “INT32” chuyên dành cho việc tính toán số nguyên (ngoài ra còn một số linh kiện khác nữa nhưng chúng ta không nói tới). Thế hệ kiến trúc của cụm SM trong RTX 2080 được NVIDIA đặt tên là “Turing”.
Một cải tiến lớn của Turing đó là nó có khả năng tính toán số thập phân và số nguyên cùng lúc. Đây là thay đổi rất quan trọng so với thế hệ trước đó là Pascal (ở GPU đời Pascal, các nhân phải đổi giữa việc tính toán số thực và số thập phân chứ không chạy được đồng thời).
>>> Xem thêm: máy chủ dell r740xd
Dòng RTX 3000 mới dùng kiến trúc Ampere, tức là kế nhiệm cho Turing. Ampere giữ lại 64 nhân FP32 như trước, nhưng 64 nhân còn lại được dùng cho cả “FP32 + INT32”. Nói cách khác, một nửa số nhân của GPU Ampare được dùng chỉ để tính toán thập phân mà thôi, còn một nửa còn lại thì sẽ thực hiện các phép tính thập phân hoặc phép tính số nguyên tùy lúc.
Với thay đổi này, NVIDIA giờ đây đếm 1 SM có tới 128 nhân FP32, không còn là 64 nhân như trước. Trong con card RTX 3070, 5.888 nhân CUDA phải được mô tả chính xác là: 2944 nhân CUDA, và 2955 nhân có thể là CUDA tùy trường hợp.
Khi mà game ngày càng phát triển hơn, các nhà phát triển game càng lúc càng dùng nhiều phép tính số nguyên hơn. Năm 2018, NVIDIA từng nói rằng các phép tính số nguyên chiếm khoảng 1/4 số lượng các phép tính mà game thực hiện bằng GPU. Đến nay con số đó có thể đã tăng lên cao hơn rồi.
Vấn đềcủa kiến trúc Turing cũ đó là một số nhân có thể bị rảnh rỗi. Ví dụ, nếu game dùng 25% phép tính là số nguyên, thì khoảng 25% số nhân của GPU không được tận dụng để tính vì không phải nhiệm vụ của chúng. Thế nên Ampere khắc phục vấn đề này bằng cách tạo ra các nhân có thể chuyển đổi linh hoạt tùy theo nhu cầu của game đang cần gì, nên theo lý thuyết thì Ampere chạy hiệu quả hơn.
Ở sự kiện ra mắt RTX 3000, CEO Jensen Huang nói rằng con card RTX 3070 mạnh hơn so với RTX 2080 Ti. Giả sử lấy 25% phép toán là tính bằng số nguyên thì 1.472 nhân sẽ dùng cho INT32, và 4.416 nhân sẽ dùng cho FP32. Cộng với một số thứ khác nữa thì RTX 3070 có thể mạnh hơn 10% so với 2080 Ti (giả sử phần thay đổi về vRAM từ 11GB của 2080 Ti xuống 8GB của 3070 không phải là vấn đề). Trong một trường hợp không có thật khi công việc cần tính toán chỉ bằng số nguyên thì 3070 sẽ mạnh gần như là 2080 luôn.
Công ty cổ phần thương mại Máy Chủ Hà Nội
- Trụ sở Hà Nội: Tầng 1,2,4 - Tòa nhà PmaxLand số 32 ngõ 133 Thái Hà - Q. Đống Đa
Hotline mua hàng Hà Nội: 0979 83 84 84 Điện thoai: 024 6296 6644
- CN Hồ Chí Minh: Lầu 1- Tòa nhà 666/46/29 Đường 3/2- Phường 14 - Quận 10
Hotline mua hàng Hồ Chí Minh: 0945 92 96 96 Điện thoai: 028 2244 9399
- Email: hotro@maychuhanoi.vn
Teraflops hay TFLOPs đang được dùng để đo sức mạnh tính toán, và thường được dùng để đo sức mạnh của bộ xử lý đồ họa (GPU). Khi mà GPU có sự khác nhau về kiến trúc, về số lượng nhân (giờ đã lên tới hơn 10 nghìn nhân rồi), TFLOPs trở thành một chỉ số dùng để so sánh, quảng bá. Nhưng rất tiếc, TFLOPs giờ không còn đầy đủ ý nghĩa cho việc này.
Chữ FLOPs có nghĩa là floating-point operations per second, hiểu đơn giản là số lượng phép tính liên quan đến số thập phân mà một con chip có thể tính được trong 1 giây. Tera là nghìn tỉ. Ghép lại nó có nghĩa là “trong một giây, GPU thực hiện được bao nhiêu nghìn tỉ phép tính”.
Trên nền tảng Steam, GPU được dùng phổ biến nhất hiện nay là GTX 1060, nó có sức mạnh là 4,4 TFLOPs, con mạnh hơn là NVIDIA RTX 2080 Ti thì có thể tính được 13,5 TFLOPs, hay như GPU của chiếc Xbox Series X sắp ra mắt có sức mạnh 12 TFLOPs.
Con số này được tính ra bằng cách lấy số nhân đổ bóng (shader) nhân với xung nhịp tối đa của GPU rồi nhân tiếp với số lượng lệnh mà GPU có thể thực hiện trong 1 clock. Đây là một cách tính khá ổn và minh bạch, nhưng khi nói về hiệu năng chơi game thì chưa đủ ý nghĩa.
>>> Xem thêm: máy chủ hp
Ví dụ, với GPU AMD RX 580 ra mắt năm 2017, nó có sức mạnh là 6,17 TFLOPs, trong khi hiệu năng thì tương đương với GPU RX 5500 - một dòng GPU giá rẻ mà hãng mới ra mắt năm nay với 5,2 TFLOPs. Như vậy, dù có số TFLOPs thấp hơn nhưng hiệu năng của RX 5500 vẫn đủ tốt nhờ vào sự thay đổi liên quan tới kiến trúc của chip, các tập lệnh, cho đến việc lập trình viên tận dụng tính năng của GPU hiệu quả hơn. Và cứ mỗi đời GPU mới ra mắt thì lại có thêm những cải tiến như thế này.
Ý mình muốn nói ở đây đó là ngay cả với cùng một công ty làm GPU thì những thay đổi về chip, về game sẽ khiến việc so sánh trực tiếp chỉ số TFLOPs giữa các dòng card với nhau trở nên không còn ý nghĩa, đặc biệt là về hiệu năng chơi game. Nó cũng giống như việc chỉ dựa vào mỗi xung nhịp để đánh giá một con CPU vậy. Và việc so sánh số này giữa AMD với NVIDIA cũng sẽ làm sai lệch ý nghĩa.
Hãy nói về dòng card RTX 3000 mới, chúng có cấu hình rất mạnh mẽ. Con rẻ nhất là RTX 3070 với giá $500 cũng đã có đến 5.888 nhân CUDA (là tên riêng của NVIDIA cho các nhân shader), sức mạnh của nó là 20 TFLOPs. Rồi chúng ta có RTX 3090 giá $1500 với 10.496 nhân và sức mạnh 36 TFLOPs. Về lý thuyết, NVIDIA đã tăng số nhân lên 140% và số TFLOPs tăng 160% so với card RTX 2080 Ti, con card mạnh nhất hiện bạn có thể mua được (tính đến tháng 9/2020)
Trước khi đi tiếp, bạn cần biết rằng card đồ họa của NVIDIA được cấu thành từ nhiều streaming multiprocessors (SM). Card RTX 2080 Ti có 68 SM, mỗi SM chứa 64 nhân “FP32” chuyên dành cho việc tính toán số thập phân và 64 nhân “INT32” chuyên dành cho việc tính toán số nguyên (ngoài ra còn một số linh kiện khác nữa nhưng chúng ta không nói tới). Thế hệ kiến trúc của cụm SM trong RTX 2080 được NVIDIA đặt tên là “Turing”.
Một cải tiến lớn của Turing đó là nó có khả năng tính toán số thập phân và số nguyên cùng lúc. Đây là thay đổi rất quan trọng so với thế hệ trước đó là Pascal (ở GPU đời Pascal, các nhân phải đổi giữa việc tính toán số thực và số thập phân chứ không chạy được đồng thời).
>>> Xem thêm: máy chủ dell r740xd
Dòng RTX 3000 mới dùng kiến trúc Ampere, tức là kế nhiệm cho Turing. Ampere giữ lại 64 nhân FP32 như trước, nhưng 64 nhân còn lại được dùng cho cả “FP32 + INT32”. Nói cách khác, một nửa số nhân của GPU Ampare được dùng chỉ để tính toán thập phân mà thôi, còn một nửa còn lại thì sẽ thực hiện các phép tính thập phân hoặc phép tính số nguyên tùy lúc.
Với thay đổi này, NVIDIA giờ đây đếm 1 SM có tới 128 nhân FP32, không còn là 64 nhân như trước. Trong con card RTX 3070, 5.888 nhân CUDA phải được mô tả chính xác là: 2944 nhân CUDA, và 2955 nhân có thể là CUDA tùy trường hợp.
Khi mà game ngày càng phát triển hơn, các nhà phát triển game càng lúc càng dùng nhiều phép tính số nguyên hơn. Năm 2018, NVIDIA từng nói rằng các phép tính số nguyên chiếm khoảng 1/4 số lượng các phép tính mà game thực hiện bằng GPU. Đến nay con số đó có thể đã tăng lên cao hơn rồi.
Vấn đềcủa kiến trúc Turing cũ đó là một số nhân có thể bị rảnh rỗi. Ví dụ, nếu game dùng 25% phép tính là số nguyên, thì khoảng 25% số nhân của GPU không được tận dụng để tính vì không phải nhiệm vụ của chúng. Thế nên Ampere khắc phục vấn đề này bằng cách tạo ra các nhân có thể chuyển đổi linh hoạt tùy theo nhu cầu của game đang cần gì, nên theo lý thuyết thì Ampere chạy hiệu quả hơn.
Ở sự kiện ra mắt RTX 3000, CEO Jensen Huang nói rằng con card RTX 3070 mạnh hơn so với RTX 2080 Ti. Giả sử lấy 25% phép toán là tính bằng số nguyên thì 1.472 nhân sẽ dùng cho INT32, và 4.416 nhân sẽ dùng cho FP32. Cộng với một số thứ khác nữa thì RTX 3070 có thể mạnh hơn 10% so với 2080 Ti (giả sử phần thay đổi về vRAM từ 11GB của 2080 Ti xuống 8GB của 3070 không phải là vấn đề). Trong một trường hợp không có thật khi công việc cần tính toán chỉ bằng số nguyên thì 3070 sẽ mạnh gần như là 2080 luôn.
Công ty cổ phần thương mại Máy Chủ Hà Nội
- Trụ sở Hà Nội: Tầng 1,2,4 - Tòa nhà PmaxLand số 32 ngõ 133 Thái Hà - Q. Đống Đa
Hotline mua hàng Hà Nội: 0979 83 84 84 Điện thoai: 024 6296 6644
- CN Hồ Chí Minh: Lầu 1- Tòa nhà 666/46/29 Đường 3/2- Phường 14 - Quận 10
Hotline mua hàng Hồ Chí Minh: 0945 92 96 96 Điện thoai: 028 2244 9399
- Email: hotro@maychuhanoi.vn