eCWbXBoqKVlcyXUNIzJr7wbcnJRa7fysuT0ds4TB
Bookmark

AMD Instinct MI100 Resmi Diumumkan, Akselerator HPC Terkencang di Dunia!

AMD Instinct MI100 Resmi Diumumkan, Akselerator HPC Terkencang di Dunia! - AMD hari ini mengumumkan akselerator AMD Instinct™ MI100 baru - GPU HPC terkencang di dunia dan GPU server x86 pertama yang melampaui hambatan performa 10 teraflop (FP64 ).1 Didukung oleh platform komputasi akselerasi baru dari Dell, Gigabyte, HPE, dan Supermicro, MI100, dikombinasikan dengan CPU AMD EPYCTM dan platform software terbuka ROCm™ 4.0, dirancang untuk mendorong penemuan baru menjelang era exascale. 

Dibangun pada arsitektur AMD CDNA baru, GPU AMD Instinct  MI100 memungkinkan kelas sistem akselerasi baru untuk HPC dan AI ketika dipasangkan dengan prosesor AMD EPYC Generasi Kedua. MI100 menawarkan performa puncak FP64 hingga 11,5 TFLOPS untuk HPC dan hingga 46,1 TFLOPS performa Matriks FP32 puncak untuk beban kerja AI dan machine learning2. Dengan teknologi AMD Matrix Core baru, MI100 juga memberikan peningkatan hampir 7x dalam performa titik mengambang puncak teoritis FP16 untuk beban kerja pelatihan AI dibandingkan dengan akselerator generasi sebelumnya dari AMD.3 

AMD Instinct MI100 Resmi Diumumkan, Akselerator HPC Terkencang di Dunia!


“Saat ini AMD mengambil langkah depan yang besar dalam perjalanan menuju komputasi exascale saat kami mengungkap AMD Instinct MI100 - GPU HPC terkencang di dunia,” kata Brad McCredie, Brad McCredie, corporate vice president, Data Center GPU and Accelerated Processing, AMD. 

“Dengan target tepat pada beban kerja dalam komputasi ilmiah, akselerator terbaru kami, bila dikombinasikan dengan platform software terbuka AMD ROCm, dirancang untuk memberikan daya unggul bagi para ilmuwan dan peneliti untuk pekerjaan mereka di HPC.”   

Platform Software Terbuka untuk Era Exascale   

Pengembang software AMD ROCm menyediakan dasar untuk komputasi exascale. Sebagai sebuah perangkat open source yang terdiri dari compilers, programming APIs dan libraries, ROCm digunakan oleh pengembang software exascale untuk membuat aplikasi performa tinggi. ROCm 4.0 telah ditingkatkan untuk memberikan performa pada skala untuk sistem berbasis MI100. 

ROCm 4.0 mengupgrade compiler menjadi open source dan menyatu untuk mendukung OpenMP® 5.0 dan HIP. Framework PyTorch dan Tensorflow, yang telah dioptimalkan dengan ROCm 4.0, kini dapat mencapai performa yang lebih tinggi dengan MI1007,8.  ROCm 4.0 adalah penawaran terbaru untuk pengembang aplikasi HPC, ML dan AI yang memungkinkan mereka membuat performa software portabel.    

“Kami telah menerima akses awal ke akselerator MI100, dan hasil awalnya sangat menggembirakan. Kami biasanya melihat peningkatan performa yang signifikan, hingga 2-3x dibandingkan dengan GPU lainnya, ”kata Bronson Messer, direktur sains, director of science, Oak Ridge Leadership Computing Facility. 

“Yang juga penting untuk diketahui adalah pengaruh software terhadap performa. Fakta bahwa platform software terbuka ROCm dan alat pengembang HIP adalah open source dan bekerja pada beragam platform, itu adalah sesuatu yang hampir membuat kami terobsesi sejak kami meluncurkan sistem CPU / GPU hybrid pertama.” 

Baca juga:Review Choetech Fast Wireless Charging Stand T555-S, Cepat dan Berkualitas

Fitur Utama AMD Instinct MI100

AMD Instinct MI100 Resmi Diumumkan, Akselerator HPC Terkencang di Dunia!


  • All-New AMD CDNA Architecture

Dirancang untuk memberi daya pada AMD GPU untuk era exascale dan akselerator MI100, arsitektur AMD CDNA menawarkan performa dan efisiensi daya yang luar biasa   

  • Leading FP64 and FP32 Performance for HPC Workloads 

Menghadirkan 11,5 FP64 TFLOPS performa puncak dan 23,1 FP32 TFLOPS, memungkinkan ilmuwan dan peneliti di seluruh dunia untuk mempercepat penemuan dalam industri termasuk ilmu hayat, energi, keuangan, akademisi, pemerintah, pertahanan, dan lainnya.

  • All-New Matrix Core Technology for HPC and AI 

Performa supercharged untuk berbagai operasi matriks presisi tunggal dan campuran, seperti FP32, FP16, bFloat16, Int8 dan Int4, yang dirancang untuk meningkatkan konvergensi HPC dan AI.  

  • 2nd Gen AMD Infinity Fabric™ Technology

Instinct MI100 menyediakan ~ 2x bandwidth I/O puncak peer-to-peer (P2P) melalui PCIe® 4.0 dengan hingga 340 GB/dtk bandwidth agregat per kartu dengan tiga AMD Infinity Fabric™ Links. 4  Dalam sebuah server, GPU MI100 dapat dikonfigurasi dengan hingga dua kumpulan GPU quad yang terhubung sepenuhnya, masing-masing menyediakan hingga 552 GB/dtk bandwidth I/O P2P untuk berbagi data dengan cepat.

  • Ultra-Fast HBM2 Memory

Menampilkan memori HBM2 bandwidth tinggi 32 GB dengan kecepatan rate clock 1.2 GHz dan memberikan bandwidth memori sangat tinggi 1,23 TB/dtk untuk mendukung kumpulan data besar dan membantu menghilangkan hambatan dalam memindahkan data masuk dan keluar dari memori. 

  • Mendukung PCIe Gen 4.0 Terbaru

Didesain dengan dukungan teknologi PCIe Gen 4.0 terbaru yang menyediakan bandwidth data transportasi teoretis puncak hingga 64 GB/dtk dari CPU ke GPU.

Baca juga:Review Poco X3 NFC: Smartphone Gaming Terbaik di Kelas Menengah

Solusi Server yang Tersedia

Akselerator AMD Instinct MI100 diharapkan pada akhir tahun dalam sistem dari mitra OEM dan ODM utama di pasar enterprise, termasuk: 

Dell

“Server Dell EMC PowerEdge akan mendukung AMD Instinct MI100 baru, yang akan memungkinkan wawasan yang lebih cepat dari data. Ini akan membantu pelanggan kami mencapai hasil HPC dan AI yang lebih kuat dan efisien dengan cepat, ”kata Ravi Pendekanti, senior vice president, PowerEdge Servers, Dell Technologies. 

"AMD telah menjadi mitra berharga dalam dukungan kami untuk memajukan inovasi di data center. Kemampuan performa tinggi akselerator AMD Instinct sangat cocok untuk portofolio AI & HPC server PowerEdge kami.”    

Gigabyte

“Kami senang dapat kembali bekerja dengan AMD sebagai mitra strategis yang menawarkan server hardware kepada pelanggan untuk komputasi performa tinggi,” kata Alan Chen, assistant vice president di NCBU, GIGABYTE. 

“Akselerator AMD Instinct MI100 mewakili tingkat komputasi performa tinggi pada tingkatan berikutnya di data center, menghadirkan konektivitas dan bandwidth data yang lebih besar untuk penelitian energi, dinamika molekuler, dan pelatihan pembelajaran mendalam. Sebagai akselerator baru dalam portofolio GIGABYTE, pelanggan kami dapat memperoleh manfaat dari peningkatan performa di berbagai beban kerja ilmiah dan industri HPC.”   

Hewlett Packard Enterprise (HPE)

"Pelanggan menggunakan sistem HPE Apollo untuk kapabilitas dan performa yang dibuat khusus untuk menangani berbagai beban kerja data yang kompleks dan intensif di seluruh high-performance computing (HPC), pembelajaran mendalam dan analitik," kata Bill Mannel, vice president and general manager, HPC di HPE. 

“Dengan diperkenalkannya sistem HPE Apollo 6500 Gen10 Plus yang baru, kami semakin meningkatkan portofolio kami untuk meningkatkan performa beban kerja dengan mendukung akselerator AMD Instinct MI100 baru, yang memungkinkan konektivitas dan pemrosesan data yang lebih baik, di samping prosesor AMD EPYC ™ Generasi Kedua. Kami berharap dapat melanjutkan kolaborasi kami dengan AMD untuk memperluas penawaran kami dengan CPU dan akselerator terbaru.” 

Baca juga:Review Asus ProArt StudioBook Pro X W730, Laptop Workstation 17 Inci Paling Kencang!

Supermicro

“Kami senang bahwa AMD membuat dampak besar dalam komputasi performa tinggi dengan akselerator GPU AMD Instinct MI100,” kata Vik Malyala, senior vice president, field application engineering and business development, Supermicro. 

“Dengan kombinasi kekuatan komputasi yang diperoleh dengan arsitektur CDNA baru, bersama dengan memori tinggi dan bandwidth peer-to-peer GPU yang dibawa MI100, pelanggan kami akan mendapatkan akses ke solusi hebat yang akan memenuhi persyaratan komputasi yang dipercepat dan beban kerja enterprise. AMD Instinct MI100 akan menjadi tambahan yang bagus untuk server multi-GPU kami dan portofolio ekstensif sistem performa tinggi dan solusi server building block.”

Spesifikasi AMD Instinct MI100


Compute Units

Stream Processors

FP64 TFLOPS (Peak)

FP32 TFLOPS (Peak)

FP32 Matrix TFLOPS

(Peak)

FP16/FP16 Matrix
TFLOPS

(Peak)

INT4 | INT8 TOPS

(Peak)

bFloat16 TFLOPs

(Peak)

HBM2
ECC
Memory

Memory Bandwidth

120

7680

Up to 11.5

Up to 23.1

Up to 46.1

Up to 184.6

Up to 184.6

Up to 92.3 TFLOPS

32GB

Up to 1.23 TB/s

Tentang AMD

Selama lebih dari 50 tahun, AMD sudah mendorong inovasi pada teknologi computing, grafis, dan visualisasi berperforma tinggi ― unsur pokok untuk bermain game, immersive platforms, dan pusat data. Ratusan juta konsumen, bisnis-bisnis Fortune 500 terkemuka, dan fasilitas penelitian sains yang canggih di seluruh dunia bertopang pada teknologi AMD setiap harinya untuk memperbaiki cara mereka hidup, bekerja, dan bermain. Pegawai AMD di seluruh dunia berfokus untuk membangun produk-produk yang hebat yang mendorong melewati batas kemungkinan.
0

Posting Komentar