Fujitsu A64FX
A64FX | |
Gyártás | 2019 |
Tervező | Fujitsu |
Gyártó | TSMC |
Max CPU órajel | 1,8 GHz, 2,0 GHz, 2,2 GHz[1] |
Gyártás technológia méret | 7 nanométeres CMOS FinFET[1] |
Utasításkészlet | AArch64 |
Architektúra | ARMv8.2-A SVE-vel,[2][1] SBSA 3. szint |
Mikroarchitektúra | belső fejlesztésű |
Magok száma | processzoronként 48,[3] + 2 v. 4 kiegészítő mag[4][5] |
L1 gyorsítótár | 3 MiB (64 KiB magonként) utasítás-, 3 MiB (64 KiB magonként) adat-gyorsítótár |
L2 gyorsítótár | 32 MiB (8 MiB × 4)[1] |
Tokozás | 594 érintkezős BGA |
Foglalat | PCIe Gen3 16 sáv [15,75 GB/s (be/ki)] |
Tranzisztorok száma | 8,786 milliárd[1] |
Platform | HPC[6] |
Alkalmazása | szuperszámítógépek, nagy teljesítményű kiszolgálók |
Előd | SPARC64 V |
Az A64FX egy 64 bites ARM architektúrán alapuló mikroprocesszor, amelyet a Fujitsu tervezett.[3][7] A processzor a SPARC64 V processzorokat váltja fel a Fujitsu szuperszámítógépes rendszereiben.[8] A Fugaku szuperszámítógép is A64FX processzorokra épül; ez a gép 2020. júniusától a világ leggyorsabb szuperszámítógépeként szerepelt a TOP500 listában, míg 2022 júniusában megelőzte a Frontier szuperszámítógép, így a második helyre esett vissza.[9][7][8][10]
Tervezés
[szerkesztés]A Fujitsu az Arm vállalattal együttműködve fejlesztette ki a processzort; ez az első processzor, amely az ARMv8.2-A Scalable Vector Extension (SVE) SIMD utasításkészlet használja, 512 bites vektoros megvalósítással.[7]
A processzor rendelkezik négy operandusú összevont szorzás-összeadás (FMA) prefix utasítással,[3] azaz egy MOVPRFX utasítással, amelyet 3 operandusú FMA művelet követ (az ARM, mint a RISC processzorok általánosan, 3 operandusú gép, amelynek utasításkódolása nem teszi lehetővé több, pl. négy operandus használatát), de ezeket egyetlen műveletbe vonja össze az utasítás-futószalagon. A processzorról a tervező azt állítja, hogy 90%-nál magasabb végrehajtási hatékonyságot ér el a (D|S|H)GEMM (általános mátrixszorzás)[11] és INT16/INT8 skaláris szorzat műveletekben.[3]
A processzor 32 GiB HBM2 memóriát használ, másodpercenként 1 TiB sávszélességgel.[7] A processzor 16 3. generációs PCI Express sávot alkalmaz[3] különböző külső gyorsítóegységekhez való csatlakozásra (hipotetikusan például GPU-khoz és FPGA-khoz). A processzor egy Tofu-D összeköttetés-hálózat vezérlőt is integrál 10 porttal, amely 20 sávon nagy sebességű 28 GBps átvitelt biztosít a csomópontokhoz való csatlakozásra egy klaszterben.[3] A processzor bejelentett tranzisztorszáma közel 8,8 milliárd.[7]
Minden A64FX processzor négy NUMA csomóponttal rendelkezik, és minden egyes NUMA csomópont 12 számító magot tartalmaz, így a processzorok összesen 48 magot tartalmaznak.[12][4][5] Mindegyik NUMA csomópontnak saját második szintű gyorsítótára van, emellett HBM2 memóriával és segédmagokkal van ellátva a nem számítási feladatokhoz. A segédprocesszorok egyik feladata a nagy sebességű kommunikáció biztosítása a háttérben.[12]
A Fujitsu folyamatosan fejleszti a „RAS” (Reliability – megbízhatóság, Availability – rendelkezésre állás, Serviceability – használhatóság) képességeket eszközeiben. A hibatűrés érdekében az A64FX processzorban közel 128 400 hibaellenőrzési pontot valósítottak meg. A cég a szuperszámítógépes piacon kívüli területeken is tervezi a processzor alkalmazását, alacsonyabb specifikációjú gépekben.[4][5]
2020 júniusában az A64FX processzorokkal épült Fugaku szuperszámítógép elérte a 4,2 petaFLOPS-os teljesítményt és ezzel megszerezte a világ leggyorsabb szuperszámítógépe címet, amit 2022 közepéig tartott.[13][9]
Alkalmazása
[szerkesztés]A Fujitsu az A64FX processzort kifejezetten a Fugaku szuperszámítógép számára tervezte. 2020 júniusában és novemberében a Fugaku volt a leggyorsabb szuperszámítógép a TOP500 rangsor szerint.[14] A Fujitsu kisebb A64FX processzoros gépeket is próbált értékesíteni.[4][5] Az Anandtech 2020 júniusában arról számolt be, hogy a két A64FX csomópontot tartalmazó PRIMEHPC FX700 szerver ára 4 155 330 ¥ (kb. 39 000 USD) volt.[15]
A Cray szuperszámítógépeket fejleszt az A64FX felhasználásával.[16][17] A Isambard 2 szuperszámítógépet Fujitsu processzorok felhasználásával építi egy konzorcium az Egyesült Királyságban, a Bristoli Egyetem vezetésével, amelyben a „Met Office”, a brit Meteorológiai Hivatal is részt vesz.[18][19] Ez az első Isambard szuperszámítógép továbbfejlesztése, amely szintén ARM architektúrájú Marvell ThunderX2 mikroprocesszorral készült.[19]
Az Ookami egy nyílt tesztrendszer, amelyet az NSF támogat, a Stony Brook Egyetem és a Buffalói Egyetem tartja üzemben, hozzáférést biztosítva a kutatóknak az A64FX processzorokhoz. A rendszer 176 A64FX számítási- és 2 dedikált hibakereső csomópontot tartalmaz, egyenként 32 GiB nagy sávszélességű memóriával és 512 GB-os SSD-vel.[20]
Jegyzetek
[szerkesztés]- ↑ a b c d e Fujitsu: FUJITSU Processor A64FX (angol nyelven) (pdf). Datasheet pp. 2. Fujitsu, 2023. február 14. (Hozzáférés: 2024. március 1.)
- ↑ SVE: Scalable Vector Extension
- ↑ a b c d e f Hot Chips 30 conference; Fujitsu briefing. Toshio Yoshida. [2020. december 5-i dátummal az eredetiből archiválva].
- ↑ a b c d „Fujitsu Launches New PRIMEHPC Supercomputers Using Fugaku Technology - Fujitsu Global”, www.fujitsu.com, 2019. november 13. (Hozzáférés: 2020. június 28.)
- ↑ a b c d FUJITSU Supercomputer PRIMEHPC Specifications. www.fujitsu.com . (Hozzáférés: 2020. június 28.)
- ↑ HPC: High Performance Computing, nagy teljesítményű számítástechnika
- ↑ a b c d e Fujitsu Successfully Triples the Power Output of Gallium-Nitride Transistors - Fujitsu Global. www.fujitsu.com . Fujitsu. (Hozzáférés: 2020. március 8.)
- ↑ a b „Fujitsu's A64FX Arm Chip Waves The HPC Banner High”, The Next Platform, 2018. augusztus 24. (Hozzáférés: 2020. március 8.)
- ↑ a b June 2022| TOP500. www.top500.org . (Hozzáférés: 2023. június 23.)
- ↑ Outline of the Development of the Supercomputer Fugaku| RIKEN Center for Computational Science RIKEN Website. www.r-ccs.riken.jp . [2021. január 23-i dátummal az eredetiből archiválva]. (Hozzáférés: 2020. november 18.)
- ↑ D: kétszeres pontosságú, S: egyszeres pontosságú, H: félpontosságú, GEMM: általános mátrixszorzás (general matrix multiplication); C += A * B művelet, ahol A, B, C nagy méretű mátrixok. Ez nagy mértékben gyorsítható a vektoros számítóművek használatával, mint pl. az SVE (vagy az AVX az x86-os architektúrákban). ld. tesztek
- ↑ a b Preliminary Performance Evaluation of the Fujitsu A64FX Using HPC Applications, 2020 IEEE International Conference on Cluster Computing (CLUSTER), 523–530. o.. DOI: 10.1109/CLUSTER49012.2020.00075 (2020. szeptember 1.). ISBN 978-1-7281-6677-3
- ↑ HPCG - November 2021. www.top500.org . (Hozzáférés: 2024. március 11.)
- ↑ Supercomputer Fugaku - Supercomputer Fugaku, A64FX 48C 2.2GHz, Tofu interconnect D| TOP500. www.top500.org . (Hozzáférés: 2020. november 18.)
- ↑ „HPC Systems Special Offer: Two A64FX Nodes in a 2U for $40k”, www.anandtech.com, 2020. június 26. (Hozzáférés: 2020. június 28.)
- ↑ „Cray, Fujitsu Both Bringing Fujitsu A64FX-based Supercomputers to Market in 2020”, HPCwire, 2019. november 13. (Hozzáférés: 2020. március 8.)
- ↑ „Japan's Fugaku supercomputer is tackling some of the world's biggest problems”, The Japan Times, 2021. január 7. (Hozzáférés: 2021. január 26.)
- ↑ February: GW4 Isambard - News and features - University of Bristol. www.bristol.ac.uk . (Hozzáférés: 2020. március 8.)
- ↑ a b „Isambard 2 Is About Driving Technology Diversity”, The Next Platform, 2020. március 9. (Hozzáférés: 2020. március 9.)
- ↑ Ookami (angol nyelven). Stony Brook University, Institute for Advanced Computational Science, 2024. (Hozzáférés: 2024. március 1.) „The Ookami HPE (formerly Cray) Apollo 80 system has 176 A64FX compute nodes,...”
Fordítás
[szerkesztés]Ez a szócikk részben vagy egészben a Fujitsu A64FX című angol Wikipédia-szócikk ezen változatának fordításán alapul. Az eredeti cikk szerkesztőit annak laptörténete sorolja fel. Ez a jelzés csupán a megfogalmazás eredetét és a szerzői jogokat jelzi, nem szolgál a cikkben szereplő információk forrásmegjelöléseként.
Források
[szerkesztés]További információk
[szerkesztés]- ThunderX2 – egy másik ARM architektúrájú, nagy teljesítményű számítástechnikát (HPC) célzó mikroprocesszor
- Huawei Kunpeng 920 – szintén ARM alapú HPC mikroprocesszor (Kunpeng 920-6426 - HiSilicon, WikiChip, 2020-02-15), melyet a Huawei tulajdonában lévő HiSilicon fejlesztett ki. Csak Kínában érhető el.