agus wibisono.com

Talk to AI with enhanced speech recognition | Gemini

Audio adalah kunci utama komunikasi
dalam kehidupan sehari-hari, mulai dari berbicara dengan teman
atau mendengarkan lagu. Kebanyakan dari kita setiap hari
mengandalkan audio dalam berbagai bahasa dan untuk tujuan yang berbeda. Biasanya, saat design bahasa besar
( LLM) berinteraksi dengan audio, LLM mengambil audionya, menjalankannya melalui
sistem pengenalan ucapan untuk mengonversinya ke teks, lalu memasukkan teks itu
ke design lain yang memahami teks. Namun, dengan melakukan ini,
banyak nuansa yang hilang, seperti suara atau pengucapan, tapi Gemini,
dengan kemampuan multimodal indigenous mampu memproses sinyal sound mentah
secara menyeluruh. Mari kita ambil sebuah contoh. Kami mengupload klip audio
yang menanyakan Gemini pertanyaan tentang pengucapan
dalam bahasa asing.Mari kita dengarkan klipnya, lalu dengarkan respons Gemini. Bagaimana cara mengucapkan kata “Lunar. Januari” dalam Bahasa Mandarin.
Opsi A. Opsi B. Manakah yang benar? Nada manakah yang benar. untuk karakter pertama? Opsi A. Karakter pertama diucapkan. dengan nada pertama. Gemini mampu membedakan.
Dalam klip itu, hanya ada satu pembicara. Hai, Gemini.
Saya tidak mengerti podcast ini. Bisakah Anda meringkasnya. dalam bahasa Inggris? Podcastnya membahas. warna mode pada musim ini.
Warna yang sedang jadi setting pada musim ini. adalah kuning kenari dan merah tua.Warna yang
tidak lagi menjadi setting.

pada musim ini adalah biru malam.
Dengan kemampuan multimodal,. Gemini dapat memahami isi dari percakapan, dan menjadikannya bukan hanya. Gemini bekerja secara native.
Mari kita lihat satu contoh terakhir. Apa langkah pertama membuat telur dadar sayur. dengan bahan-bahan ini? Pecahkan dan kocok telur. dalam mangkuk. Terima kasih atas petunjuknya.
Saya sudah mulai membuat telur dadar. Apakah ini sudah matang? Sepertinya hampir matang. Balik telur untuk memasak sisi lainnya. Kenapa belum matang? Belum matang. karena telurnya masih encer.
Bagaimana dengan sekarang? Tampaknya sudah matang. Anda bisa mematikan api dan menyajikannya. Seperti yang kita lihat, Gemini mampu. memproses informasi secara bersamaan dari
tiga modalitas:. sound, aesthetic, dan teks. Kami yakin dengan kemampuan Gemini. mendengarkan audio sumber, yang akan membantu kami. terus memperluas kemampuannya dan menjadikannya lebih berguna. bagi orang-orang. GEMINI. DEEPMIND.GOOLE/ GEMINI.

Opsi A. Opsi B. Manakah yang benar? Nada manakah yang benar. Warna yang sedang jadi mode pada musim ini. Seperti yang kita lihat, Gemini mampu. Kami yakin dengan kemampuan Gemini.