Chip grafis skala wafer dengan 400.000 core dan konsumsi 15 KW

Sebuah startup bernama Sistem otak Ini menunjukkan chip grafis fase prototipe yang melampaui pembuat GPU terkenal yang menawarkan peningkatan kinerja dua digit, seperti chip grafis yang lebih baru Otak Mesin Serpihan Wafer (Otak WSE), menggabungkan tidak kurang dari 5600% lebih banyak transistor tentang chip grafis terbaik di pasar, Nvidia V100untuk dapat menawarkan 21) 1 miliar transistor tentang 2.100 juta yang menggabungkan chip Nvidia.

Untuk mewujudkan ini, Startup telah berhasil memecahkan tantangan teknis utama yang belum dapat diuraikan oleh orang lain dan dengan itu Prosesor pertama yang mengukur skala wafer Di seluruh dunia

WSE Cerebras adalah prosesor skala wafer pertama di dunia. Yang logis untuk dilakukan adalah bertanya mengapa tidak ada orang lain yang melakukan sesuatu yang begitu jelas, dan alasannya adalah bahwa tantangan teknis utama komunikasi silang tidak pernah diatasi oleh orang lain.

Peralatan litograf saat ini dirancang untuk mengukir banyak prosesor kecil di sepanjang wafer; Mereka tidak dapat membuat prosesor lengkap melalui wafer. Ini berarti bahwa cerita akan berada dalam satu bentuk atau yang lain dan bahwa setiap blok harus dapat berkomunikasi melalui garis-garis ini dengan berbagai cara, dan inilah yang diputuskan Cerebras untuk mengklaim takhta. prosesor pertama di dunia dengan satu miliar transistor.

Cerebra WSE menempati area seluas 46.225 mm² dan menampung 1,2 miliar transistor. Semua core dioptimalkan. untuk beban kerja terkait Kecerdasan Buatan dan kentang goreng mengkonsumsi 15 KW daya. Karena semua energi itu juga harus didinginkan, sistem pendingin ini harus revolusioner seperti halnya sistem energi.

Untuk mendinginkan, perusahaan dapat menggunakan sistem pendingin pencelupan dengan Refrigeran freon di sirkuit yang bergerak cepat atau metode yang lebih revolusioner. Sistem energi juga harus sangat kuat. Menurut Cerebras, Chip ini sekitar 1.000 kali lebih cepat daripada sistem tradisional hanya karena komunikasi dapat dilakukan melalui jalur tulis alih-alih melompati lingkaran (interkoneksi, DIMM, dll.).

Chip grafis skala wafer dengan 400.000 core dan konsumsi 15 KW 1

WSE berisi 400.000 Aljabar Inti Terserak Tersebar (SLA). Setiap inti fleksibel, dapat diprogram dan dioptimalkan untuk perhitungan yang mendukung sebagian besar jaringan saraf. Keterampilan pemrograman memastikan hal itu Inti dapat menjalankan semua algoritma di bidang pembelajaran mesin terus berubah

400.000 core di WSE terhubung melalui tautan komunikasi Swarm dalam 2D ​​mesh dengan bandwidth 100 Pb / s. Swarm adalah jaringan komunikasi masif yang menawarkan bandwidth inovatif dan latensi rendah di sebagian kecil dari konsumsi daya teknik tradisional yang digunakan untuk mengelompokkan unit pemrosesan grafis. Ini sepenuhnya dapat dikonfigurasi; Perangkat lunak mengkonfigurasi semua inti WSE untuk mendukung komunikasi yang tepat yang diperlukan untuk melatih model yang ditentukan pengguna. Untuk setiap jaringan saraf, Swarm menyediakan saluran komunikasi yang unik dan dioptimalkan.

WSE memiliki Memori 18 GB tertanam dalam chipSemuanya dapat diakses dalam satu siklus clock tunggal dan menyediakan bandwidth memori 9 PB / s. Ini adalah kapasitas 3.000 kali lebih banyak bandwidth dan 10.000 kali lebih banyak bandwidth daripada pesaing utama. Memori pusat dan lokal yang lebih banyak memungkinkan perhitungan yang cepat dan fleksibel, dengan latensi lebih sedikit dan daya lebih sedikit.

Ini akan memungkinkan akselerasi hebat dalam aplikasi AI. dan mengurangi waktu pelatihan dari bulan menjadi beberapa jam. Ini benar-benar revolusioner, tidak perlu dipertanyakan lagi, dengan asumsi mereka dapat memenuhi janji mereka dan mulai memberikan ini kepada pelanggan segera. Otak WSE Diproduksi pada wafer TSMC 300mm gunakan proses Anda 16nmYang artinya adalah teknologi dan hanya proses pembuatan di belakang raksasa seperti Nvidia. Tentu saja, dengan 84 blok yang saling terhubung yang mengandung lebih dari 400.000 core, proses pembuatannya tidak menjadi masalah.

Brain WSE "width =" 740 "height =" 333

Kinerja dan binning (frekuensi) dari Otak WSE akan sangat menarik. Di satu sisi, jika Anda menggunakan seluruh wafer sebagai satu die, Anda akan mendapatkan hasil 100% jika desainnya dapat menyerap kekurangan atau 0% jika Anda tidak bisa. Jelas, karena prototipe dibuat, Desainnya mampu menyerap cacat.. Bahkan, CEO menyatakan bahwa desainnya sedang menunggu 1% hingga 1,5% cacat pada area permukaan fungsional, tapi ini bukan masalah, karena mikroarsitekturnya sederhana mengkonfigurasi ulang core yang tersedia. Juga Core yang berlebihan ditempatkan di seluruh chip untuk meminimalkan kehilangan kinerja. Tidak ada informasi tentang binning saat ini, tetapi tidak perlu dikatakan bahwa ini adalah desain yang paling binnable di dunia.

Mereka juga memberi tahu kami perusahaan harus merancang sendiri ilmu manufaktur dan enkapsulasi sementara saat ini tidak ada alat yang dirancang untuk menangani prosesor skala wafer. Bukan hanya itu saja, perangkat lunak harus ditulis ulang untuk menangani lebih dari 1 miliar transistor dalam satu prosesor.

via: Wccftech

Pos terkait

Back to top button