ChatGPT, menghidupkan kembali speaker pintar.
Layanan asisten kecerdasan buatan telah menjadi kompetisi yang sengit sejak Alexa diluncurkan pada tahun 2014. Mulai tahun 2018, berbagai jenis speaker pintar telah dirilis, yang memungkinkan asisten AI digunakan tidak hanya melalui aplikasi ponsel pintar, tetapi juga melalui berbagai jenis speaker.
Namun, speaker pintar ini tidak membutuhkan waktu lama untuk menjadi sebuah gangguan. Pertama-tama, asisten AI tidak memahami ucapan dengan baik. Mereka sering kali salah mengartikan pemicu yang tidak disengaja sebagai perintah dan terbangun, mengganggu kedamaian.
Lebih jauh lagi, bahkan ketika mereka dapat memahami ucapan, respon mereka sering kali tidak memadai. Mereka hanya dapat digunakan untuk tugas-tugas dasar seperti memeriksa cuaca, mengatur alarm, memutar musik, dan mendengarkan radio, dan tidak terlalu membantu dalam menjawab pertanyaan atau mencari informasi.
Berkat ChatGPT, speaker pintar seperti itu dan asisten AI generasi pertama mendapatkan kesempatan untuk mengembangkan sayap mereka. Pada Agustus 2022, Amazon mengungkapkan model bahasa AI baru yang dapat meningkatkan Alexa. Model ini disebut Alexa Teacher Models (AlexaTM), dan menunjukkan performa yang sangat baik dalam berbagai terjemahan bahasa dan ringkasan teks. Bahkan sebelum itu, pada tahun 2021, Google mengumumkan chatbot open-domain bernama LaMDA, yang merupakan model AI yang dapat berbicara dalam berbagai personalitas tentang berbagai topik.
Startup bernama Gorilla Technology meluncurkan aplikasi bernama Super Chat, yang dapat berbicara dengan tokoh sejarah atau tokoh terkenal dunia dengan menggunakan personalitas mereka. Startup serupa yang menyediakan layanan persona AI, seperti Poe dari Quora, Character.ai, dan D-ID, juga semakin mendapatkan perhatian.
Selain itu, startup bernama CygniContGraVitas meluncurkan layanan AutoGPT yang menggunakan GPT-4. Setelah menetapkan tujuan akhir bagi AI, AI menetapkan rencana untuk menjalankan berbagai tugas guna mencapai tujuan tersebut dan berusaha untuk mewujudkannya. Sementara ChatGPT hanya dapat merespons perintah dan pertanyaan manusia, AutoGPT dapat melakukan peningkatan diri dan menjalankan berbagai tugas detail untuk mencapai tujuan setelah tujuan dan instruksi pertama.
Misalnya, jika Anda memberi perintah “Buat satu juta akun Instagram untuk diikuti,” AutoGPT akan dengan tekun menghasilkan konten dan menjalankan berbagai tugas detail untuk mencapai tujuan ini. Jika model-model seperti ini diterapkan pada speaker pintar, mereka dapat memberikan layanan percakapan yang melebihi harapan. Mungkin asisten AI generasi pertama sekarang dapat mewujudkan ideal Jarvis dalam film Iron Man.
Josh.ai, pengembang sistem otomasi rumah yang dikendalikan suara yang didirikan pada tahun 2015, telah memperkenalkan prototipe yang menggunakan API ChatGPT untuk menerapkan fungsi yang jauh lebih alami dan cerdas pada speaker pintar mereka daripada asisten AI yang sudah ada. Berkat ChatGPT, bahkan jika pengguna mengeluarkan pertanyaan yang salah atau tidak masuk akal dengan mempertimbangkan konteks, Josh dapat mempertimbangkan situasi sekitar dan memperbaikinya sehingga mereka dapat memahami dan merespons dengan tepat.
Selain itu, ia dapat mengoperasikan objek-objek sekitar yang terhubung dengan asisten AI secara kontekstual untuk memberikan pengalaman layanan yang lebih terintegrasi. Misalnya, jika seorang pengguna mengatakan, “Hari ini saya sangat lelah. Apa beberapa cara untuk bersantai?” speaker pintar Josh yang terhubung dengan ChatGPT dapat menyarankan teknik relaksasi seperti meditasi terpandu atau meredupkan cahaya dan menampilkan video relaksasi dari YouTube di televisi.
Mahasiswa Stanford mengembangkan prototipe kacamata bernama ‘RizzGPT’ yang menggabungkan GPT-4 dengan kacamata untuk menyediakan layanan yang menampilkan berbagai informasi melalui kacamata sebagai teks saat berbicara dengan orang lain.
Percakapan antara pengguna dan orang lain dikonversi menjadi teks melalui kacamata augmented reality (AR), yang terhubung ke smartphone dan dikirim ke ChatGPT. Selain itu, informasi tentang situasi yang dilihat oleh pengguna, seperti wajah orang lain, pakaian, kondisi, objek-objek di sekitar, dan lingkungan, juga dikirimkan ke GPT-4. Hal ini memungkinkan percakapan yang lebih lancar dengan menyediakan informasi tidak hanya melalui suara, tetapi juga tentang apa yang terjadi di sekitar pengguna.
Dengan menafsirkan informasi yang dikirimkan ke GPT-4 dan menampilkannya sebagai teks melalui tampilan kacamata, pengguna dapat melakukan percakapan yang lebih efektif. Di masa depan, akan mungkin juga untuk menyediakan informasi tambahan kepada pengguna dalam bentuk gambar, video, atau suara.
Misalnya, kacamata dapat menyediakan informasi yang tepat waktu dan akurat selama kuliah, presentasi penting, atau proyek kawat listrik yang kompleks, meningkatkan nilai bagi pengguna. Ini adalah wujud dari Jarvis, yang kita lihat dalam film-film. Berkat teknologi AI seperti LLM (Large Language Model), yang memungkinkan layanan AGI (Artificial General Intelligence) seperti ChatGPT.
Dengan demikian, ChatGPT akan dapat menyediakan fungsi-fungsi baru yang sebelumnya tidak mungkin dengan mengintegrasikan dengan speaker pintar, kacamata AR, dan berbagai perangkat IoT (Internet of Things), serta memastikan kualitas layanan yang lebih baik dari sebelumnya. Tentu saja, ChatGPT seperti itu juga dapat diintegrasikan ke dalam robot, melebihi perannya sebagai asisten virtual untuk membantu kita, dan bahkan bisa memiliki kehadiran fisik.
Ini adalah dimensi lain dari masalah di mana ChatGPT memasuki realitas kita, bukan hanya secara virtual, dan masyarakat kita harus mempertimbangkan dan mempersiapkan dampak sosial yang akan ditimbulkan oleh teknologi ini, serta mengambil langkah-langkah untuk memastikan bahwa teknologi tersebut tidak menimbulkan ancaman bagi umat manusia.