Di Balik Teks: Merancang Masa Depan Prompting AI
Di Balik Teks: Merancang Masa Depan Prompting AI
Kecerdasan buatan (AI) generatif bisa tampak seperti jin ajaib. Maka mungkin tidak mengejutkan jika orang menggunakannya seperti itu—dengan mendeskripsikan “keinginan” mereka dalam bahasa alami, menggunakan prompt teks. Lagipula, antarmuka pengguna apa yang bisa lebih fleksibel dan kuat daripada sekadar memberi tahu perangkat lunak apa yang Anda inginkan darinya?
Ternyata, yang disebut “bahasa alami” masih menyebabkan masalah kegunaan serius. Peneliti UX terkenal Jakob Nielsen, salah satu pendiri Nielsen Norman Group, menyebutnya sebagai barrier artikulasi: Bagi banyak pengguna, mendeskripsikan niat mereka secara tertulis—dengan cukup kejelasan dan spesifikasi untuk menghasilkan output yang berguna dari AI generatif—terlalu sulit. “Kemungkinan besar, setengah populasi tidak bisa melakukannya,” tulis Nielsen.
Dalam diskusi meja bundar ini, empat desainer Toptal menjelaskan mengapa prompt teks sangat sulit, dan berbagi solusi mereka untuk mengatasi masalah “halaman kosong” generatif AI. Para ahli ini berada di garis depan memanfaatkan teknologi terbaru untuk meningkatkan desain. Bersama-sama, mereka membawa berbagai keahlian desain dalam diskusi tentang masa depan prompting AI. Damir Kotori? telah memimpin proyek desain untuk klien seperti Booking.com dan pemerintah Australia, dan merupakan instruktur UX utama di General Assembly. Darwin Álvarez saat ini memimpin proyek UX untuk Mercado Libre, salah satu platform e-commerce terkemuka di Amerika Latin. Darrell Estabrook memiliki lebih dari 25 tahun pengalaman dalam desain produk digital untuk klien perusahaan seperti IBM, CSX, dan CarMax. Edward Moore memiliki lebih dari dua dekade pengalaman desain UX pada proyek-proyek pemenang penghargaan untuk Google, Sony, dan Electronic Arts.
Diskusi ini telah diedit untuk kejelasan dan panjang.
Kelemahan Terbesar dari Prompt Teks
Damir Kotori?: Saat ini, ini adalah jalan satu arah. Sebagai pembuat prompt, Anda hampir diharapkan untuk membuat konsepsi sempurna dari prompt untuk mencapai hasil yang diinginkan. Ini bukan bagaimana kreativitas bekerja, terutama di era digital. Manfaat besar dari Microsoft Word dibandingkan dengan mesin ketik adalah Anda dapat dengan mudah mengedit karya Anda di Word. Ini adalah ping-pong, bolak-balik. Anda mencoba sesuatu, lalu Anda mendapatkan umpan balik dari klien atau rekan kerja, lalu Anda memutar kembali. Dalam hal ini, alat AI saat ini masih primitif.
Darwin Álvarez: Prompt teks tidak fleksibel. Dalam banyak kasus, saya harus tahu persis apa yang saya inginkan, dan itu bukan proses progresif di mana saya dapat mengiterasi dan mengembangkan ide yang saya suka. Saya harus bergerak dalam arah linier. Tapi ketika saya menggunakan AI generatif, saya sering hanya memiliki ide samar tentang apa yang saya inginkan.
Edward Moore: Kelebihan dari prompt bahasa adalah bahwa berbicara dan mengetik adalah bentuk ekspresi yang alami bagi banyak dari kita. Tetapi satu hal yang membuatnya sangat menantang adalah bahwa bias yang Anda sertakan dalam tulisan Anda dapat mempengaruhi hasilnya. Misalnya, jika Anda bertanya kepada ChatGPT apakah robot bantu merupakan pengobatan yang efektif untuk orang dewasa dengan demensia, ia akan menghasilkan jawaban yang mengasumsikan bahwa jawabannya adalah “ya” hanya karena Anda menggunakan kata “efektif” dalam prompt Anda. Anda bisa mendapatkan hasil yang sangat berbeda atau mungkin tidak benar berdasarkan perbedaan halus dalam cara Anda menggunakan bahasa. Persyaratan untuk efektif dalam menggunakan AI generatif cukup tinggi.
Darrell Estabrook: Seperti yang dikatakan Damir dan Darwin, proses bolak-balik belum ada dengan prompt teks. Juga sulit untuk menerjemahkan kreativitas visual ke dalam kata-kata. Ada alasan mengapa mereka mengatakan sebuah gambar bernilai seribu kata. Anda hampir membutuhkan seribu kata untuk mendapatkan sesuatu yang menarik dari alat AI generatif!
Moore: Saat ini, teknologi didorong oleh ilmuwan data dan insinyur. Pinggir kasar perlu diluruskan, dan cara terbaik untuk melakukannya adalah dengan mendemokratisasikan teknologi dan melibatkan desainer UX dalam percakapan. Ada kutipan dari Mark Twain, “Sejarah tidak mengulang dirinya sendiri, tetapi pasti memiliki kesamaan.” Dan saya pikir itu sesuai di sini karena tiba-tiba, rasanya seperti kita kembali ke era command line.
Masa Depan Prompt Teks
Moore: Antarmuka untuk prompting AI akan menjadi lebih visual, dengan cara yang sama seperti alat pembuat situs web memberikan lapisan GUI di atas HTML mentah. Tetapi saya pikir prompt teks akan selalu ada. Anda selalu dapat menulis HTML secara manual jika Anda mau, tetapi kebanyakan orang tidak punya waktu untuk itu. Menjadi lebih visual adalah salah satu cara antarmuka dapat berkembang.
Estabrook: Ada berbagai jalur untuk ini. Input teks terbatas. Salah satu kemungkinan adalah memasukkan bahasa tubuh, yang memainkan peran besar dalam mengomunikasikan niat kita. Bukankah akan menjadi penggunaan teknologi yang menarik dari kamera dan pengenalan AI untuk mempertimbangkan bahasa tubuh kita sebagai bagian dari prompt? Jenis teknologi ini juga akan berguna dalam semua jenis aplikasi AI. Misalnya, ini bisa digunakan dalam aplikasi medis untuk menilai sikap atau keadaan mental pasien.
Keterbatasan Kegunaan dan Strategi
Kotori?: Generasi saat ini dari alat AI adalah kotak hitam. Mesin menunggu input pengguna, dan setelah menghasilkan output, tidak ada atau sedikit penyesuaian yang dapat dilakukan. Anda harus memulai dari awal lagi jika Anda menginginkan sesuatu yang sedikit berbeda. Yang perlu terjadi adalah algoritma ajaib ini harus dibuka. Dan kami membutuhkan pengatur untuk mengontrol setiap aspek stilistik dari output sehingga kami dapat mengiterasi hingga sempurna daripada diharuskan untuk membuat mantra yang sempurna terlebih dahulu.
Álvarez: Sebagai penutur bahasa Spanyol, saya telah melihat bagaimana alat ini dioptimalkan untuk bahasa Inggris, dan saya pikir itu berpotensi merusak kepercayaan di kalangan penutur non-Inggris. Pada akhirnya, pengguna akan lebih cenderung mempercayai dan terlibat dengan alat AI ketika mereka dapat menggunakan bahasa yang nyaman bagi mereka. Membuat AI generatif multibahasa dalam skala besar kemungkinan memerlukan pelatihan dan pengujian ekstensif pada model AI-nya, dan menyesuaikan tanggapannya dengan nuansa budaya.
Barier lain terhadap kepercayaan adalah bahwa tidak mungkin mengetahui bagaimana AI membuat outputnya. Materi sumber apa yang digunakan untuk melatihnya? Mengapa ia mengatur atau menyusun output dengan cara yang dilakukannya? Bagaimana prompt saya mempengaruhi hasilnya? Pengguna perlu mengetahui hal-hal ini untuk menentukan apakah hasilnya dapat diandalkan.
Alat AI harus memberikan informasi tentang sumber yang digunakan untuk menghasilkan respons, termasuk tautan atau kutipan ke dokumen atau situs web yang relevan. Ini akan membantu pengguna memverifikasi informasi secara independen. Bahkan memberikan beberapa skor kepercayaan pada jawabannya akan memberi informasi kepada pengguna tentang tingkat kepastian alat dalam jawabannya. Jika skor kepercayaan rendah, pengguna mungkin menganggap respons sebagai titik awal untuk penelitian lebih lanjut.
Estabrook: Saya telah mengalami beberapa hasil buruk dengan generasi gambar. Misalnya, saya menyalin prompt yang tepat untuk contoh gambar yang saya temukan secara online, dan hasilnya sangat berbeda. Untuk mengatasi itu, prompting perlu lebih bergantung pada proses bolak-balik. Sebagai direktur kreatif yang bekerja dengan desainer lain di tim, kami selalu bolak-balik. Mereka menghasilkan sesuatu, lalu kami meninjaunya: “Ini bagus. Perkuat itu. Hapus ini.” Anda membutuhkan itu pada tingkat gambar.
Strategi UI bisa berupa alat yang menjelaskan beberapa pilihannya. Mungkin mengaktifkannya untuk mengatakan, “Saya menempatkan blob ini di sini berpikir bahwa itulah yang Anda maksud dengan prompt ini.” Dan saya bisa mengatakan, “Oh, benda itu? Tidak, maksud saya yang lain.” Sekarang saya bisa lebih deskriptif karena AI dan saya memiliki kerangka referensi bersama. Sementara saat ini, Anda hanya secara acak melemparkan ide dan berharap untuk mendarat pada sesuatu.
Meningkatkan Akurasi
Álvarez: Jika salah satu keterbatasan prompting adalah bahwa pengguna tidak selalu tahu apa yang mereka inginkan, lalu bagaimana jika kita mempermudah untuk memulai dengan sesuatu? Memulai dengan template mungkin membantu memberikan wawasan kepada pengguna yang tidak tahu dari mana harus memulai. Misalnya, jika Anda ingin membuat desain logom, OpenAI bisa menyediakan template seperti “kita perlu menciptakan logo yang menonjol untuk klien ini” yang memungkinkan Anda untuk menyesuaikannya berdasarkan detail yang Anda ketahui.
Kotori?: Keterampilan prompting akan menjadi lebih seperti keterampilan penulisan teknis. Pengguna perlu mengetahui bagaimana mengartikulasikan ide mereka dan memformulasikan pertanyaan secara efektif. Keterampilan ini akan menjadi lebih penting karena AI terus berkembang. Saya khawatir keterampilan ini akan menjadi keahlian tingkat lanjut, bukan keterampilan yang diperoleh oleh semua orang. Generasi mendatang dari alat AI kemungkinan besar akan lebih bergantung pada panduan visual dan pengeditan berbasis GUI yang memungkinkan semua orang berinteraksi dengan lebih mudah.
Álvarez: Sekali lagi, saya akan menghubungkannya dengan pembuatan situs web. Misalnya, ada banyak alat pembuatan situs web yang dirancang untuk pemula tanpa keterampilan teknis. Ada tingkat kustomisasi untuk profesional juga. Mungkin ada model serupa untuk AI generatif, di mana alat ini bisa mempermudah penggunaan dengan panduan yang lebih visual atau alat berbasis templat dan pengeditan. Dan dengan AI menjadi lebih terintegrasi ke dalam produk, seperti di Google Workspace dan Microsoft Office, itu bisa membuat kemampuan prompting lebih mudah diakses.