Bạn sẽ làm gì với 1.5 triệu luồng xử lí trong một máy tính? Trung tâm nghiên cứu và phát triển Anh Quốc (UKRI) đã có ý tưởng về việc đó.
Hệ thống siêu máy tính Archer toạ lại tại Edinburgh được giới thiệu lần đầu năm 2013 dựa trên thiết kế Cray XC30 và từ đó đến nay được sử dụng bởi các nhà nghiên cứu cần các cỗ máy tính siêu mạnh. Nó đã từng ở trong top 20 siêu máy tính mạnh nhất hành tinh, nhưng hiện tại đã bị nhiều siêu máy tính khác vượt mặt.
Do đó, trung tâm đã thông báo ký hợp đồng với Cray để xây dựng siêu máy tính Archer 2, sử dụng các vi xử lí EPYC Rome của AMD.
Trung tâm sẽ xây dựng một hệ thống với 5,848 nút tính toán Shasta. Mỗi nút chứa 2 vi xử lí thế hệ 2 EPYC Rome của AMD với 64 luồng mỗi vi xử lí, và chúng có xung nhịp 2.2 GHz.
Tổng cộng sẽ có 11,969 CPU tổng cộng 748,544 nhân và khoảng 1.5 triệu luồng xử lí.
Tuỳ thuộc vào cách đo đạc nhưng trung bình với hơn chục bài benchmark của siêu máy tính mới này, hiệu năng đã hơn gấp 11 lần người tiền nhiệm của nó.
Thông số kỹ thuật đầy đủ được đăng trên trang HPC sau:
- Peak performance estimated at ~ 28 PFLOP/s
- System Design:
- 5,848 compute nodes, each with dual AMD Rome 64 core CPUs at 2.2GHz, for 748,544 cores in total and 1.57 PBytes of total system memory
- 23x Shasta Mountain direct liquid cooled cabinets
- 14.5 PBytes of Lustre work storage in 4 file systems
- 1.1 PByte all-flash Lustre BurstBuffer file system
- 1+1 PByte home file system in Disaster Recovery configuration using NetApp FAS8200
- Cray next-generation Slingshot 100Gbps network in a diameter-three dragonfly topology, consisting of 46 compute groups, 1 I/O group and 1 Service group
- Shasta River racks for management and post processing
- Test and Development System (TDS) platform, to be installed in advance
- Collaboration platform with 4 x compute nodes attached to 16 x Next Generation AMD GPUs
- Software stack:
- Cray Programming Environment including optimizing compilers and libraries for the AMD Rome CPU
- Cray Linux Environment optimized for the AMD CPU blade based on SLES 15
- Shasta Software Stack
- SLURM work load manager
- CrayPat as profiler
- GDB4HPC as debugger
Trung tâm sẽ lắp đặt siêu máy tính Archer 2 thay thế vào vị trí hiện tại của Archer 1, nghĩa là sẽ có một khoảng thời gian nghỉ. Archer sẽ bị tắt vào ngày 18 tháng 2 năm 2020, và Archer 2 sẽ khởi động lần đầu 78 ngày sau tức là ngày 6 tháng 5, nếu mọi thứ theo đúng kế hoạch.
Tuy nhiên, sau khi khởi động, hệ thống sẽ phải trải qua stress test trong 1 tháng trước khi thực hiện các tính toán khoa học. Một vài nhà nghiên cứu được phép truy cập vào hệ thống trong thời gian test, nhưng UKRI nói rằng truy cập sẽ “bị giới hạn”.
Nguồn: Tomshardware
Đăng bình luận về bài viết này