Google Gemini dimulai sebagai Google Bard, dan pada masa itu, saya melihatnya sebagai upaya yang tidak tahu malu untuk meniru apa yang dilakukan ChatGPT. Maksudku, itu bukan satu -satunya replika yang tak tahu malu yang muncul, jadi aku tidak menyalahkan raksasa teknologi untuk itu. Namun, itu mengejutkan saya bahwa ketika saya membutuhkan chatbot AI dalam bentuk apa pun, saya default ke Gemini.
Platform AI telah meningkat sangat cepat dari waktu ke waktu, dan sekarang, salah satu pembaruan utamanya adalah pengguna di aplikasi Gemini. Platform ini mendapatkan banyak pembaruan untuk fungsionalitas pembuatan gambarnya, dan jika tidak begitu menakjubkan seberapa mampu menjadi, itu akan menakutkan. Mari kita bicarakan itu.
Google Gemini meningkatkan beberapa aspek pengalaman pembuatan gambar

Sulit untuk mengatakan bahwa chatbot atau platform AI mana pun bertujuan untuk pangsa pasar yang cukup besar jika belum memperoleh sihir pembuatan gambar pada saat ini dalam perjalanan AI. Karena alasan itulah kita tidak perlu terkejut bahwa Gemini telah menjadikan citranya, keterampilan menyulap bagian besar dari fokusnya. Bagian terbaiknya adalah semua ini hadir dengan model flash Gemini 2.0 biasa. Mari selami beberapa trik barunya.
Menghasilkan gambar bersama teks dalam satu respons
Cara kebanyakan model AI dibangun mengharuskan Anda untuk membangun petunjuk terpisah untuk respons teks mereka dan respons gambar mereka. Meskipun itu bukan hal terburuk di dunia, itu berarti bahwa tanggapan tidak selengkap yang Anda inginkan.
Gemini sekarang memiliki kekuatan untuk menghasilkan respons yang mencakup teks dan gambar, yang sempurna untuk menghasilkan cerita. Apa yang membuat ini lebih unggul menggunakan beberapa petunjuk untuk membuat sesuatu yang serupa adalah bahwa elemen cerita akan tetap jauh lebih konsisten.
Pengeditan gambar melalui dialog bahasa alami
Anda tahu ketika Anda meminta AI untuk menghasilkan gambar untuk Anda, tetapi tidak cukup yang Anda cari? Mungkin Anda ingin monster fantasi menjadi lebih hair dari yang dihasilkan. Dan kemudian setelah itu, Anda ingin memiliki tanduk yang lebih panjang. Dan mungkin setelah itu, Anda ingin memperbaiki warna kulitnya. Dialog alami semacam itu dan pengeditan berurutan dapat dilakukan oleh Gemini tanpa masalah.
Generasi gambar Gemini menggunakan penalaran lanjutan
Google mengatakan Gemini sekarang membedakan dirinya dari sebagian besar kompetisi berkat “pengetahuan dunia” yang lebih baik dan “penalaran yang ditingkatkan”.
Demonstrasi Google tentang ini mungkin hal yang paling mengesankan dari set bagi saya. Ini menunjukkan seseorang meminta Gemini untuk menghasilkan resep, yang memang begitu. Tetapi yang membuatnya istimewa adalah bahwa dengan setiap langkah, itu menghasilkan gambar yang sesuai menunjukkan kepada Anda seperti apa langkah itu seharusnya.
Kemampuan rendering teks naik level
Jari adalah satu tempat di mana kita bisa melihat gambar yang dihasilkan AI tergelincir, tetapi itu sudah cukup banyak “diperbaiki”. Teks dalam gambar yang dulu terlihat seperti omong kosong yang kacau, tapi sekarang itu telah “diperbaiki” juga. Google mengatakan bahwa rendering teks Gemini 2.0 Flash jauh lebih baik daripada opsi lainnya.