Teknologi AI baru Microsoft dapat membubuhi keterangan gambar persis seperti manusia

Teknologi teks AI gambar baru Microsoft

Sejak para peneliti mulai bekerja dengan kecerdasan buatan (AI), salah satu tujuan utama selalu menjadi sistem teks gambar yang canggih. Banyak perusahaan menginvestasikan sumber daya berharga mereka di AI untuk mengembangkan produk yang lebih baik dan lebih baik. Sekarang, Microsoft telah meluncurkan sistem AI baru yang dapat membuat anotasi dan mendeskripsikan gambar lebih akurat daripada yang bisa dilakukan manusia.

Raksasa Redmond baru-baru ini mengumumkan terobosan ini melalui posting blog resmi. Sementara membuat teks gambar adalah salah satu tugas tersulit untuk sistem AI, Microsoft mengatakan bahwa AI “Peningkatan Gambar” barunya mampu membuat teks gambar seperti halnya manusia. Dan terobosan dalam teknologi AI ini akan membantu perusahaan mendorong produk dan layanannya di pasar.

Keterangan gambar yang terbaik

Sekarang, membuat teks gambar otomatis tidak terdengar seperti masalah besar, tapi percayalah. Teknologi bagus ini membantu pengguna mengakses konten dalam gambar, baik itu di perpustakaan Anda atau di suatu tempat dalam dokumen 5 halaman. Misalnya, ketika Anda mencari “anjing” di perpustakaan gambar Anda, aplikasi yang ditentukan menggunakan kemampuan pengenalan gambarnya untuk mengurutkan setiap gambar dengan seekor anjing di dalamnya dan kemudian mengumpulkannya. Ini adalah salah satu dari banyak tugas yang memerlukan sistem untuk memiliki kemampuan pengenalan gambar yang sangat baik.

Model Baru Microsoft dapat membuat teks yang lebih baik untuk gambar daripada pendahulunya. Dan keterangan ini, benar-benar, mirip dengan apa yang akan ditulis manusia untuk menggambarkan gambar tersebut.

Microsoft Gambar AI 1

Jadi, seperti yang Anda lihat, AI “Enhanced Image Caption” baru dalam deskripsi gambar jauh lebih akurat daripada sebelumnya. Apalagi model baru ini bahkan bisa mengenali konteks gambar. Lihat gambar lainnya ini.

Microsoft Visual AI 2

Pada gambar di atas, sistem sebelumnya memberikan deskripsi yang tidak jelas tanpa menunjukkan apa yang dilakukan pemain. Namun, model baru mengetahui bahwa para pemain sedang merayakan dan sebenarnya adalah pemain sepak bola, bukan pemain bisbol!

Aksesibilitas: Untuk tunanetra

Sekarang, kemampuan untuk memberi keterangan gambar ini sangat berguna bagi pengguna, tetapi orang-orang yang paling penting teknologi ini adalah mereka yang buta atau memiliki penglihatan yang rendah. Orang-orang ini harus mengandalkan perintah suara saat menavigasi melalui sistem komputer. Jadi keterangan gambar memudahkan mereka untuk menelusuri media sosial atau pesan.

“Penggunaan keterangan gambar untuk membuat deskripsi foto, yang dikenal sebagai teks alternatif, di halaman web atau dokumen, sangat penting bagi orang-orang yang buta atau memiliki penglihatan yang rendah.” Saqib Shaikh, Direktur Rekayasa Perangkat Lunak di divisi AI Microsoft di Redmond.

Hasilnya adalah, Windows Pabrikan sekarang mengintegrasikan sistem AI teks gambar baru ini ke dalam aplikasi kamera bicaranya, See AI, khusus dibuat untuk tunanetra. Aplikasi ini menggunakan kemampuan anotasi gambar AI untuk menggambarkan gambar di perangkat seluler pengguna dan bahkan di profil media sosial.

Selain integrasi dalam aplikasi See AI, Microsoft juga menyediakan sistem AI baru untuk aplikasi Azure AI. Saat ini ada sebagai bagian dari Visi Komputer Layanan Kognitif Azure dan pengembang dapat menggunakan kemampuannya di aplikasi dan layanan mereka sendirijika mereka mau.

Selanjutnya, teknologi anotasi gambar AI juga akan hadir di aplikasi Microsoft Office, seperti Microsoft Word, PowerPoint, dan Outlook, akhir tahun ini.

Pos terkait

Back to top button