The capabilities of multimodal AI | Gemini Demo

Kami telah menguji kemampuan Gemini, version AI multimodal baru kami. Kami rekam saat melakukan percobaan di berbagai situasi, menampilkan beberapa gambar, dan memintanya menginterpretasikan tentang apa yang dilihatnya. Video ini memperlihatkan beberapa interaksi favorit kami dengan Gemini. Oke. Tes, Gemini. Mari kita mulai. Beri tahu saya apa yang Anda lihat. Saya lihat Anda meletakkan selembar … Read more

Talk to AI with enhanced speech recognition | Gemini

Audio adalah kunci utama komunikasi dalam kehidupan sehari-hari, mulai dari berbicara dengan teman atau mendengarkan lagu. Kebanyakan dari kita setiap hari mengandalkan sound dalam berbagai bahasa dan untuk tujuan yang berbeda. Biasanya, saat design bahasa besar ( LLM) berinteraksi dengan sound, LLM mengambil audionya, menjalankannya melalui sistem pengenalan ucapan untuk mengonversinya ke teks, lalu memasukkan … Read more

Talk to AI with enhanced speech recognition | Gemini

Audio adalah kunci utama komunikasi dalam kehidupan sehari-hari, mulai dari berbicara dengan teman atau mendengarkan lagu. Kebanyakan dari kita setiap hari mengandalkan audio dalam berbagai bahasa dan untuk tujuan yang berbeda. Biasanya, saat design bahasa besar ( LLM) berinteraksi dengan audio, LLM mengambil audionya, menjalankannya melalui sistem pengenalan ucapan untuk mengonversinya ke teks, lalu memasukkan … Read more