Chip grafis skala wafer dengan 400.000 core dan konsumsi 15 KW

Sebuah startup bernama Otak sistem Ini telah menunjukkan chip grafis fase prototipe yang melangkah lebih jauh dari produsen GPU terkenal yang menawarkan peningkatan kinerja dua digit, sejak chip grafis terbarunya, Otak Mesin Skala Wafer (Otak WSE), menggabungkan tidak kurang dari 5600% lebih banyak transistor mengenai chip grafis terbaik di pasaran, the Nvidia V100karena mampu menawarkan 21,1 miliar transistor tentang 2.100 juta yang menggabungkan chip Nvidia.

Untuk mewujudkan ini, startup telah berhasil memecahkan tantangan teknis utama yang belum dapat diuraikan oleh orang lain dan dengan itu prosesor pertama yang mengukur skala wafer Di seluruh dunia

Mesin Skala Wafer

WSE Cerebras adalah prosesor berskala wafer pertama di dunia. Hal yang logis adalah bertanya mengapa tidak ada orang lain yang melakukan sesuatu yang begitu jelas, dan alasannya adalah bahwa tantangan teknis utama komunikasi lintas garis tidak pernah diatasi oleh orang lain.

Peralatan litograf saat ini dirancang untuk merekam banyak prosesor kecil di sepanjang wafer; Mereka tidak dapat membuat prosesor lengkap melalui wafer. Ini berarti bahwa alur cerita akan ada dalam satu atau lain cara dan bahwa setiap blok harus dapat berkomunikasi melalui garis-garis ini dalam beberapa cara, dan inilah yang dipecahkan Cerebras untuk mengklaim takhta. prosesor pertama di dunia dengan satu miliar transistor.

Cerebra WSE menempati area seluas 46.225 mm² dan menampung 1,2 miliar transistor. Semua core dioptimalkan untuk beban kerja terkait Kecerdasan Buatan dan chip mengkonsumsi 15 KW daya. Karena semua energi itu juga harus didinginkan, sistem pendingin ini harus revolusioner seperti sistem energinya.

Untuk pendinginan, perusahaan bisa beralih ke sistem pendingin pencelupan dengan dia Refrigeran freon dalam sirkuit yang bergerak cepat atau metode yang lebih revolusioner. Sistem energi juga harus sangat kuat. Menurut Cerebras, Chip ini sekitar 1.000 kali lebih cepat daripada sistem tradisional hanya karena komunikasi dapat dilakukan melalui jalur penulisan alih-alih melompati lingkaran (interkoneksi, DIMM, dll.).

Chip grafis skala wafer dengan 400.000 core dan konsumsi 15 KW 1

WSE berisi 400.000 Core Aljabar Linier Tersebar (SLA). Setiap inti fleksibel, dapat diprogram dan dioptimalkan untuk perhitungan yang mendukung sebagian besar jaringan saraf. Kemampuan pemrograman memastikan hal itu core dapat mengeksekusi semua algoritma di bidang pembelajaran mesin terus berubah

400.000 core di WSE terhubung melalui jalinan komunikasi Swarm dalam mesh 2D dengan bandwidth 100 Pb / s. Swarm adalah jalinan komunikasi massa yang menawarkan bandwidth inovatif dan latensi rendah di sebagian kecil dari konsumsi energi teknik tradisional yang digunakan untuk mengelompokkan unit pemrosesan grafis. Ini sepenuhnya dapat dikonfigurasi; Perangkat lunak mengkonfigurasi semua inti WSE untuk mendukung komunikasi yang tepat yang diperlukan untuk melatih model yang ditentukan pengguna. Untuk setiap jaringan saraf, Swarm menyediakan jalur komunikasi yang unik dan dioptimalkan.

WSE memiliki Memori 18 GB tertanam dalam chip, semua dapat diakses dalam satu siklus clock tunggal, dan menyediakan bandwidth memori 9 PB / s. Ini berkapasitas 3.000x kali lebih banyak dan bandwidth 10.000 kali lebih banyak dari kompetitor terkemuka. Semakin banyak inti dan lebih banyak memori lokal memungkinkan penghitungan yang cepat dan fleksibel, dengan latensi yang lebih sedikit dan lebih sedikit energi.

Ini akan memungkinkan akselerasi besar dalam aplikasi AI. dan kurangi waktu pelatihan dari bulan menjadi hanya beberapa jam. Ini benar-benar revolusioner, tidak ada keraguan tentang itu, dengan asumsi mereka dapat menepati janji mereka dan mulai memberikan ini kepada pelanggan segera. Otak WSE Diproduksi dalam wafer TSMC 300mm menggunakan proses Anda 16nm, Yang berarti bahwa itu adalah teknologi dan hanya proses pembuatan di belakang raksasa seperti Nvidia. Tentu saja, dengan 84 blok yang saling terhubung yang menampung lebih dari 400.000 core, proses pembuatannya tidak menjadi masalah.

Otak WSE

Kinerja dan binning (frekuensi) dari Otak WSE akan sangat menarik. Di satu sisi, jika Anda menggunakan seluruh wafer sebagai die tunggal, Anda akan mendapatkan hasil 100% jika desain dapat menyerap cacat atau 0% jika Anda tidak bisa. Jelas, karena prototipe dibuat, Desainnya mampu menyerap cacat. Bahkan, CEO menyatakan bahwa desainnya menunggu 1% hingga 1,5% dari cacat luas permukaan fungsional, tapi ini bukan masalah, karena mikroarsitektur sederhana mengkonfigurasi ulang core yang tersedia. Juga core yang berlebihan ditempatkan di seluruh chip untuk meminimalkan kehilangan kinerja. Tidak ada informasi tentang binning pada saat ini, tetapi tidak perlu dikatakan bahwa ini adalah desain yang paling binnable di dunia.

Kami juga diberitahu itu perusahaan harus mendesain ilmu manufaktur dan enkapsulasi sendiri sedangkan saat ini tidak ada alat yang dirancang untuk menangani prosesor skala wafer. Bukan hanya itu saja, perangkat lunak harus ditulis ulang untuk menangani lebih dari 1 miliar transistor dalam satu prosesor.

via: Wccftech

Pos terkait

Back to top button