Ya, "ChatGPT kini bisa melihat, mendengar, dan bicara," kata OpenAI mengutip pengumuman resmi peluncuran kemampuan baru ChatGPT di laman resminya, Selasa.
OpenAI meluncurkan kemampuan suara dan gambar baru di ChatGPT, yang menawarkan jenis antarmuka baru yang lebih intuitif dengan memungkinkan penggunanya melakukan percakapan suara atau memberitahu ChatGPT tentang apa yang anda bicarakan.
Baca juga: CEO OpenAI Samuel Altman dapat golden visa dari Imigrasi RI
Suara dan gambar memberi pengguna lebih banyak cara untuk menggunakan ChatGPT dalam kehidupan sehari-hari. Pengguna, misal, bisa memotret isi kulkas dan dapur kemudian mencari tahu menu apa untuk makan malam hari ini.
Setelah makan malam, anda juga bisa membantu anak mengerjakan soal matematika dengan mengambil foto, melingkari kumpulan soal, dan minta ChatGPT berbagi petunjuk mengenai menemukan jawabannya.
Anda kini dapat menggunakan suara untuk melakukan percakapan bolak-balik dengan ChatGPT. Bicaralah dengannya saat bepergian, minta cerita pengantar tidur untuk keluarga, atau selesaikan perdebatan di meja makan.
Untuk memulai interaksi dengan suara, buka Pengaturan kemudian pilih Fitur Baru di aplikasi seluler dan ikut serta dalam percakapan suara. Kemudian, ketuk tombol headphone yang terletak di sudut kanan atas layar dan pilih suara pilihan anda dari lima suara berbeda.
Kemampuan suara baru ini didukung oleh model text-to-speech baru, yang mampu menghasilkan audio mirip manusia hanya dari teks dan contoh ucapan beberapa detik.
OpenAI berkolaborasi dengan pengisi suara profesional untuk menciptakan setiap suara. "Kami juga menggunakan Whisper, sistem pengenalan ucapan sumber terbuka kami, untuk menyalin kata-kata yang Anda ucapkan ke dalam teks," kata OpenAI.
Baca juga: Aplikasi ChatGPT akan rilis di Android
Untuk memulai percakapan dengan gambar, silakan ketuk tombol foto untuk mengambil atau memilih gambar. Jika anda menggunakan iOS atau Android, ketuk tombol plus terlebih dahulu. Anda juga dapat mendiskusikan banyak gambar atau menggunakan alat menggambar kami untuk memandu ChatGPT.
Pemahaman gambar ChatGPT didukung oleh multimodal GPT-3.5 dan GPT-4. Model ini menerapkan keterampilan penalaran bahasanya pada berbagai macam gambar, seperti foto, tangkapan layar, dan dokumen yang berisi teks dan gambar.
Meski demikian, OpenAI mengakui bahwa mereka telah mengambil langkah-langkah teknis untuk secara signifikan membatasi kemampuan ChatGPT dalam menganalisis dan membuat pernyataan langsung tentang orang-orang karena ChatGPT tidak selalu akurat dan sistem ini harus menghormati privasi individu.
OpenAI meluncurkan kemampuan suara dan gambar di ChatGPT kepada pengguna Plus dan Perusahaan selama dua minggu ke depan. Suara akan hadir di iOS dan Android dan gambar akan tersedia di semua platform.
Baca juga: Apple tengah kembangkan teknologi AI mirip ChatGPT
Baca juga: ChatGPT dapat menjawab soal-soal dalam ujian radiologi
Baca juga: Pelaku pembuat berita bohong gunakan ChatGPT ditangkap