Google Rilis Gemini 2.5 Computer Use, AI yang Bisa Operasikan Komputer Sendiri

Sarah Shabrina . October 09, 2025

Teknologi.id – Dunia kecerdasan buatan kembali dibuat heboh dengan Google lewat peluncuran Gemini 2.5 Computer Use. Bukan sekadar peningkatan performa, tetapi menjadi bukti contoh interaksi manusia dengan mesin.

Jika sebelumnya AI hanya digunakan untuk menjawab pertanyaan atau membuat konten, kini pengguna dapat meminta AI untuk melakukan atau mengoperasikan komputer seperti membuka email, menulis dokumen dan kegiatan lainnya hanya dengan satu kali perintah.

Gemini 2.5 bukan sekadar alat bantu, tetapi hadir sebagai asisten digital cerdas yang bisa memahami konteks, mengambil keputusan dan melaksanakan tugas layaknya manusia.

Revolusi Baru AI Gemini 2.5 Computer Use

Setelah sukses meluncurkan Gemini 2.5, kini melalui blog resminya pada 7 Oktober 2025. Google kembali memperkenalkan model Gemini 2.5 Computer Use. Versi ini digadang-gadang memiliki fitur yang lebih canggih dibanding model sebelumnya.

“Hari ini, kami merilis model Gemini 2.5 Computer Use, model khusus baru kami yang dibangun di atas kemampuan pemahaman dan penalaran visual Gemini 2.5 Pro yang mendukung agen untuk berinteraksi dengan antarmuka pengguna (UI). Model ini mengungguli alternatif termuka di berbagai uji coba kontrol web dan seluler” tulis Google dalam blognya

Kehadiran model Gemini 2.5 Computer Use juga diumumkan oleh CEO Google Sundar Pichai melalui sosial media pribadinya di X atau Twitter.

“Model Penggunaan Komputer Geminni 2.5 kami yang baru kini tersedia di API Gemini. Meskipun masih dalam tahap awal, tetapi model ini mampu berinteraksi dengan web, seperti menggulir, mengisi formulir dan memilih menu dropdown, ini adalah langkah penting selanjutnya dalam menciptakan agen AI serbaguna" ujar Pichai lewat sosial media X.

Gemini 2.5 Computer Use didasarkan pada Gemini 2.5 Pro tetapi dirancang agar lebih fleksibel dan dapat tersambung langsung dengan berbagai platform sekaligus. Untuk pertama kalinya sistem AI dirancang bukan hanya untuk menjawab perintah berbasis teks tetapi juga secara aktif menjalankan komputer seperti manusia.

Baca juga: Google Search Resmi Pakai Mode AI, Pencarian Kini Lebih Pintar dan Personal!

Cara kerja Gemini 2.5 Computer Use

Gemini 2.5 Computer Use dikembangkan oleh divisi kecerdasan Google dan DeepMind. Sehingga Gemini 2.5 Computer Use memungkinkan pengguna untuk mengoptimalkan AI Gemini. Nantinya model ini dapat langsung mengoperasikan komputer sesuai keinginan pengguna, seperti

  • Membuka Google Chrome
  • Mengetik keyword
  • Mengklik tombol
  • Mengisi formulir
  • Hingga menavigasi situs web hanya dengan satu perintah dari pengguna

Secara teknisi, sistem ini bekerja melalui 4 tahap utama yaitu

1.       Send a Request to the Model

Maksudnya adalah Gemini 2.5 akan mengambil tangkapan layar dari halaman atau aplikasi yang sedang terbuka untuk memahami apa yang ada dilayar. Setelah memahami, Gemini akan mengartikan apa yang diinginkan berdasarkan intruksi teks dari pengguna.

2.       Receive the Model Response

Gemini 2.5 akan langsung bekerja sesuai dengan intruksi teks dari pengguna untuk mencapai tujuan tersebut.

3.       Execute the Received Action

Inti dari Gemini 2.5 ini adalah memutuskan apa saja yang akan dilakukan secara otomatis.

4.       Capture the New Environment State

Terakhir, Gemini 2.5 akan benar benar menggerakan kursor, mengetik teks atau mengklik tombol di layar sesuai intruksi teks yang dikirim dengan aman dan terkontrol.


Tidak perlu merasa khawatir, sebab Gemini 2.5 Computer Use dilengkapi dengan kontrol fitur keselamatan bagi pengembang untuk mencegah model menyelesaikan tindakan beresiko tinggi atau bahaya secara otomatis tanpa izin pengguna.

 

Versi model ini mendukung project mariner, Firebase Testing Agent dan Model AI di penelusuran. Perlu diketahui bahwa model komputer Gemini 2.5 sudah dapat diakses oleh para pengembang dengan menggunakan API Gemini melalui Google AI Studio dan Vertex AI. Namun, belum dapat digunakan langsung oleh konsumen.

Baca juga: Google Luncurkan Bug Bounty: Hadiah hingga Rp497 Juta untuk Pemburu Bug Gemini AI

Perbandingan Gemini 2.5 Computer Use dengan Versi Sebelumnya

Gemini 2.5  Computer Use bukanlah model Gemini AI yang dikembangkan oleh Google. Sebelumnya google juga sudah pernah mengembangkan model Gemini AI 1.0, Gemini 1.5, Gemini 1.5 & Gemini Advnced, Gemini 2.0 dan Gemini 2.5.

Namun yang membedakan Gemini 2.5 Computer Use dengan versi Gemini AI lainnya adalah Gemini 2.5 Computer Use terlihat lebih nyata dan dapat langsung mengoperasikan komputer seperti mengklik, menggulir layar, mengisi hingga mengirim formulir.

Sedangkan untuk model Gemini AI versi sebelumnya hanya bisa menjawab berdasarkan teks tanpa bisa mengklik, menggulir layar dan mengisi form.

Dibandingkan dengan Open AI yang juga mengembangkan kemampuan fitur agen ChatGPT untuk mengoperasikan  komputer, Gemini 2.5 Computer Use jauh lebih unggul. Hal ini terlihat pada nilai presentasi Benchmark Performance.



Penutup

Peluncuran Gemini 2.5 Computer Use menjadi bukti nyata bahwa Google telah bertransformasi menjadi AI Agent yang mampu berinteraksi langsung dengan antarmuka digital. Perkembangan AI tidak lagi diartikan sebagai “kecerdasan pemahaman” tetapi sudah menjadi “kecerdasan tindakan”.

 

Dengan kemampuan yang canggih, AI kini benar-benar bisa menjadi perpanjang tangan manusia di ruang digital.

 

Baca artikel dan berita lainnya di Google News

(SS)

author0
teknologi id bookmark icon

Tinggalkan Komentar

0 Komentar