Teknologi AI baru Microsoft dapat membubuhi keterangan gambar persis seperti manusia

2 2 minutes read

Sejak para peneliti mulai bekerja dengan kecerdasan buatan (AI), salah satu tujuan utama selalu menjadi sistem teks gambar yang canggih. Banyak perusahaan menginvestasikan sumber daya berharga mereka di AI untuk mengembangkan produk yang lebih baik dan lebih baik. Sekarang, Microsoft telah meluncurkan sistem AI baru yang dapat membuat anotasi dan mendeskripsikan gambar lebih akurat daripada yang bisa dilakukan manusia.

Raksasa Redmond baru-baru ini mengumumkan terobosan ini melalui posting blog resmi. Sementara membuat teks gambar adalah salah satu tugas tersulit untuk sistem AI, Microsoft mengatakan bahwa AI “Peningkatan Gambar” barunya mampu membuat teks gambar seperti halnya manusia. Dan terobosan dalam teknologi AI ini akan membantu perusahaan mendorong produk dan layanannya di pasar.

Keterangan gambar yang terbaik

Sekarang, membuat teks gambar otomatis tidak terdengar seperti masalah besar, tapi percayalah. Teknologi bagus ini membantu pengguna mengakses konten dalam gambar, baik itu di perpustakaan Anda atau di suatu tempat dalam dokumen 5 halaman. Misalnya, ketika Anda mencari “anjing” di perpustakaan gambar Anda, aplikasi yang ditentukan menggunakan kemampuan pengenalan gambarnya untuk mengurutkan setiap gambar dengan seekor anjing di dalamnya dan kemudian mengumpulkannya. Ini adalah salah satu dari banyak tugas yang memerlukan sistem untuk memiliki kemampuan pengenalan gambar yang sangat baik.

Model Baru Microsoft dapat membuat teks yang lebih baik untuk gambar daripada pendahulunya. Dan keterangan ini, benar-benar, mirip dengan apa yang akan ditulis manusia untuk menggambarkan gambar tersebut.

Microsoft Gambar AI 1

Jadi, seperti yang Anda lihat, AI “Enhanced Image Caption” baru dalam deskripsi gambar jauh lebih akurat daripada sebelumnya. Apalagi model baru ini bahkan bisa mengenali konteks gambar. Lihat gambar lainnya ini.

Microsoft Visual AI 2

Pada gambar di atas, sistem sebelumnya memberikan deskripsi yang tidak jelas tanpa menunjukkan apa yang dilakukan pemain. Namun, model baru mengetahui bahwa para pemain sedang merayakan dan sebenarnya adalah pemain sepak bola, bukan pemain bisbol!

Aksesibilitas: Untuk tunanetra

Sekarang, kemampuan untuk memberi keterangan gambar ini sangat berguna bagi pengguna, tetapi orang-orang yang paling penting teknologi ini adalah mereka yang buta atau memiliki penglihatan yang rendah. Orang-orang ini harus mengandalkan perintah suara saat menavigasi melalui sistem komputer. Jadi keterangan gambar memudahkan mereka untuk menelusuri media sosial atau pesan.

“Penggunaan keterangan gambar untuk membuat deskripsi foto, yang dikenal sebagai teks alternatif, di halaman web atau dokumen, sangat penting bagi orang-orang yang buta atau memiliki penglihatan yang rendah.” Saqib Shaikh, Direktur Rekayasa Perangkat Lunak di divisi AI Microsoft di Redmond.

Hasilnya adalah, Windows Pabrikan sekarang mengintegrasikan sistem AI teks gambar baru ini ke dalam aplikasi kamera bicaranya, See AI, khusus dibuat untuk tunanetra. Aplikasi ini menggunakan kemampuan anotasi gambar AI untuk menggambarkan gambar di perangkat seluler pengguna dan bahkan di profil media sosial.

Selain integrasi dalam aplikasi See AI, Microsoft juga menyediakan sistem AI baru untuk aplikasi Azure AI. Saat ini ada sebagai bagian dari Visi Komputer Layanan Kognitif Azure dan pengembang dapat menggunakan kemampuannya di aplikasi dan layanan mereka sendirijika mereka mau.

Selanjutnya, teknologi anotasi gambar AI juga akan hadir di aplikasi Microsoft Office, seperti Microsoft Word, PowerPoint, dan Outlook, akhir tahun ini.

Name	Domain	Purpose	Expiry	Type
wpl_user_preference	apsachieveonline.org	WP GDPR Cookie Consent Preferences	1 year	HTTP
YSC	youtube.com	YouTube session cookie.	Session	HTTP
AWSALB	api.intentiq.com	Amazon Web Services Load Balancer cookie.	7 days	HTTP

Name	Domain	Purpose	Expiry	Type
VISITOR_INFO1_LIVE	youtube.com	YouTube cookie.	Session	HTTP
GPS	youtube.com	Google advertising domain	Session	HTTP

Name	Domain	Purpose	Expiry	Type
uid	tynt.com	Generic AddThis tracking cookie.	1 year	HTTP
bkdc	bluekai.com	BlueKai tracking cookie.	Session	HTTP
bku	bluekai.com	BlueKai tracking cookie.	Session	HTTP
IDE	doubleclick.net	Google advertising cookie used for user tracking and ad targeting purposes.	1 day	HTTP
_cc_dc	crwdcntrl.net	Lotame tracking cookie.	6 months	HTTP
_cc_id	crwdcntrl.net	Lotame tracking cookie.	6 months	HTTP
_cc_cc	crwdcntrl.net	Lotame tracking cookie.	6 months	HTTP
_cc_aud	crwdcntrl.net	Lotame tracking cookie.	6 months	HTTP
vuid	vimeo.com	Vimeo tracking cookie	2 years	HTTP

Name	Domain	Purpose	Expiry	Type
CountUid	histats.com	---	1 year	---
HstCfa4342789	apsachieveonline.org	---	1 year	---
HstCmu4342789	apsachieveonline.org	---	1 year	---
HstCnv4342789	apsachieveonline.org	---	1 year	---
HstCns4342789	apsachieveonline.org	---	1 year	---
m	dtscout.com	---	Session	---
df	dtscout.com	---	3 months	---
l	dtscout.com	---	3 months	---
__stid	sharethis.com	---	1 year	---
__dtsu	apsachieveonline.org	---	3 months	---
33x_ps	33across.com	---	1 year	---
__cfduid	apsachieveonline.org	Generic CloudFlare functional cookie.	1 year	HTTP
HstCla4342789	apsachieveonline.org	---	1 year	---
HstPn4342789	apsachieveonline.org	---	1 year	---
HstPt4342789	apsachieveonline.org	---	1 year	---
b	dtscout.com	---	Session	---
st	dtscout.com	---	Session	---
pxcelPage_c010_C	t.sharethis.com	---	14 days	---
pids	tynt.com	---	3 months	---
pxcelBcnLcy	t.sharethis.com	---	51 years	---
ab	agkn.com	---	1 year	---
IQver	intentiq.com	---	2 years	---
intentIQ	intentiq.com	---	2 years	---
intentIQCDate	intentiq.com	---	2 years	---
AWSALBCORS	api.intentiq.com	---	7 days	---
bkpa	bluekai.com	---	6 months	---

Keterangan gambar yang terbaik

Aksesibilitas: Untuk tunanetra

Pos terkait

Ulasan Tur Mario Kart – “Good kart, greedy gacha”

Pembaruan Pokemon Rincian baru yang mengkilap dan ditingkatkan

Apple ProRes RAW Beta untuk Windows sepuluh

Sharp Aquos R3: smartphone high-end kuartal keempat di …