Mesin AI baru Google dapat memperbesar dan meningkatkan, seperti di film


sebelum dan sesudah foto alat peningkatan gambar AI baru Google

Anda tahu, di film-film, ketika ada gambar di komputer dan detektif yang berdiri di sebelah The Guy In The Chair berkata, “Bisakah Anda memperbesar dan memperbarui plat nomor itu?” Teknologi itu sekarang menjadi kenyataan, berkat alat AI terbaru Google.

Proses untuk melakukan ini sangat kompleks dan sulit untuk dikuasai, karena didasarkan pada model difusi (dan beberapa matematika tingkat lanjut yang serius) dan bekerja untuk menambahkan detail ke gambar asli. Ini dilakukan dengan heuristik menggunakan gambar serupa dan merupakan teknik yang disebut Google sebagai sintesis gambar alami dan dalam hal ini gambar resolusi super.

Jelas, Anda mulai dengan gambar kecil dan berpiksel (seperti gambar di sebelah kiri setiap kumpulan gambar di atas) dan berakhir dengan gambar beresolusi jauh lebih tinggi yang tidak hanya terlihat lebih tajam tetapi juga terlihat nyata di mata manusia, bahkan jika tidak persis sama dengan aslinya 100%. Untuk menyelesaikan pekerjaan, Google menggunakan dua alat AI baru: Resolusi Super melalui Repetitive Refinement (SR3) dan Cascading Diffusion Modeling (CDM).

Pertama, SR3, menambahkan noise ke gambar (ini terlihat mirip dengan keheningan atau salju yang Anda lihat di layar TV saat sinyal lemah), kemudian membalikkan prosesnya. Ini menggunakan database gambar yang besar dan serangkaian perhitungan probabilistik untuk memetakan seperti apa versi gambar beresolusi rendah, Peneliti Google Chitwan Saharia menyelidiki lebih dalam.

Contoh generasi terpilih dari gambar alami 256x256 yang dikondisikan lapisan untuk dipelajari oleh mesin AI. Setiap baris berisi contoh dari kelas tertentu.

“Model difusi bekerja dengan merusak data pelatihan dengan menambahkan derau Gaussian secara bertahap, perlahan menghapus detail dalam data hingga menjadi derau murni, dan kemudian,” jelas Saharia, yang melatih jaringan saraf untuk membalikkan proses kegagalan ini.

Alat kedua, CDM, menggunakan “pipa” yang berbagai model difusi (termasuk SR3) dapat dinavigasi untuk membuat peningkatan resolusi tinggi. Alat ini menghasilkan gambar model lanjutan yang lebih besar menggunakan simulasi yang dihitung dengan cermat berdasarkan probabilitas lanjutan, yang telah diterbitkan oleh Google dalam makalah penelitiannya.

Hasil akhir? Ketika penelitian tersebut mempresentasikan gambar akhir kepada orang-orang dalam sebuah tes, mereka memilih wajah yang dihasilkan yang disalahartikan sebagai wajah asli sekitar separuh waktu. Meskipun tingkat 50% tampaknya tidak berhasil, itu sejalan dengan apa yang dapat kita harapkan dengan algoritma dengan sempurna. Google mengatakan metode ini menghasilkan hasil yang lebih baik daripada opsi peningkatan gambar lainnya, termasuk jaringan permusuhan umum yang menggunakan jaringan saraf yang bersaing untuk memperbaiki gambar.

Google mengatakan bermaksud untuk berbuat lebih banyak dengan alat AI ini dan teknologi terkaitnya, di luar peningkatan gambar, seperti bidang pemodelan probabilistik lainnya. Dan meskipun teknologi “memperbesar dan menyempurnakan” ini akan memudahkan untuk melakukan hal-hal seperti memperbarui foto lama, teknologi ini tentu juga memiliki potensi yang tak terbantahkan, seperti memperbesar dan memperbaiki foto, plat nomor, atau lainnya.

melalui Science Alert

Pos terkait

Back to top button