Februari 27, 2024

REPUBLIKA.CO.ID, JAKARTA – Model kecerdasan buatan (AI) dapat mendeteksi lokasi tertentu hanya dengan melihat beberapa foto di Google Street View. Mahasiswa pascasarjana Stanford mengembangkan kecerdasan buatan dengan akurasi yang mengesankan.

Laman ZDNET pada Rabu (3/1/2024) menyebut aplikasi tersebut bernama Pigeon atau Predicted Image Geolocation. Pigeon dapat memprediksi negara dalam gambar dengan akurasi 92% dan menentukan lokasi dalam jarak 25 kilometer dari lokasi target dengan lebih dari 40% tebakan.

Dove berada di peringkat 0,01% teratas pemain GeoGuessr. Ini adalah permainan di mana pengguna menebak lokasi foto yang diambil melalui Google Street View. Game ini menjadi cikal bakal proyek Pigeon.

Selain itu, Pigeon mengalahkan salah satu profesional GeoGuessr terbaik di dunia, Trevor Rainbolt, dalam enam pertandingan yang disiarkan secara online dan ditonton lebih dari 1,7 juta kali.

Agar Pigeon berfungsi dengan baik, para siswa menggunakan CLIP, jaringan saraf yang dikembangkan oleh OpenAI yang dapat menghubungkan teks dan gambar dengan melatihnya mengenali nama-nama kategori visual. Kemudian, terinspirasi oleh GeoGuessr, Pigeon dilatih menggunakan kumpulan data 100.000 lokasi nyata yang diambil sampelnya secara acak oleh GeoGuessr.

Empat gambar yang diunduh digunakan untuk mencakup keseluruhan “panorama” dari lokasi tertentu, sehingga menghasilkan total 400.000 gambar. Jumlah gambar yang ditampilkan di Pigeon cukup kecil dibandingkan dengan jumlah gambar yang dilatih oleh model AI lainnya.

Sebagai perbandingan, model pembuatan gambar DALL-E 2 OpenAI yang populer telah dilatih pada ratusan juta gambar. Para siswa juga mengembangkan model terpisah yang disebut Pigeotto, yang dilatih pada lebih dari 4 juta foto dari Flickr dan Wikipedia untuk mengenali lokasi satu gambar sebagai masukan.

Kinerja Pigeotto mencapai hasil yang mengesankan pada tolok ukur geolokasi gambar, dengan akurasi kota 7,7% lebih tinggi dibandingkan hasil canggih sebelumnya dan akurasi negara 29,8% lebih tinggi. Tinjauan penerapan ini membahas pertimbangan etis yang terkait dengan model ini, termasuk manfaat dan risikonya.

Di satu sisi, geolokasi gambar memiliki banyak kegunaan positif, seperti mengemudi secara otonom, survei visual, dan sekadar memuaskan rasa ingin tahu tentang lokasi pengambilan foto. Namun ada juga dampak negatifnya seperti pelanggaran privasi. Pertimbangan ini membuat para mahasiswa tidak merilis model AI tersebut ke publik, melainkan hanya merilis kode untuk verifikasi akademik.

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *