Gemini Google yang belum dirilis, kependekan dari Generalized Multimodal Knowledge Network, akan menghadirkan era baru kemampuan AI dengan memproses enam atau lebih tipe data untuk memungkinkan inovasi masa depan seperti memori dan perencanaan. Tetapi inovasi Gemini tidak berhenti di situ karena, tidak seperti model tradisional, Gemini bukan hanya satu version, tetapi jaringan sinergis dari beberapa design AI terpisah yang bekerja bersama untuk menangani berbagai tugas yang sangat beragam. Tapi bagaimana cara kerjanya, dan apakah itu mengalahkan OpenAI? Bagian satu Arsitektur Gemini. Menariknya, arsitektur Gemini menyatukan pembuat enkode dan dekoder yang bekerja bersama untuk menciptakan bahasa umum yang beroperasi di sepanjang lima langkah berikut. Langkah pertama pengguna memberikan input dalam berbagai format, memungkinkan fleksibilitas yang tak tertandingi. Langkah kedua Encoder mengubah tipe data yang berbeda menjadi representasi terpadu, menerjemahkannya ke dalam bahasa yang dapat diinterpretasikan oleh decoder. Langkah ketiga Version Bekerja Tugas Agnostik, artinya memproses input yang disandikan tanpa perlu spesifik tentang tugas tersebut. Langkah empat Tahap decoding melibatkan pengambilan input yang diproses dan menghasilkan result dalam berbagai modalitas yang disesuaikan dengan kebutuhan pengguna. Langkah lima Akhirnya, result dihasilkan dan dikembalikan ke pengguna sebagai hasilnya. Gemini diharapkan jauh melebihi kemampuan dan pemahaman bahkan GPT empat yang dapat belajar dari domain dan kumpulan data apa word play here tanpa memerlukan version khusus atau penyetelan halus, yang sangat kontras dengan model bahasa besar yang ada.Alasan pertama untuk keunggulan kompetitif yang begitu besar adalah keunggulan Google dalam hal data. Bagian kedua Keunggulan Information. Google telah memindai lebih dari 25 juta buku, setara dengan sekitar 2,5 triliun kata. Selain itu, dengan lebih dari 800 juta video, kumpulan data YouTube mereka adalah harta karun untuk pelatihan design bahasa yang mendukung penglihatan, dengan puluhan miliar menit video dengan transkripsi. Selain itu, pengikisan ekstensif Google terhadap Net untuk menggerakkan mesin pencarinya dilaporkan melebihi 100 PB, dengan mudah diterjemahkan ke dalam rentang 2 triliun kata saat disaring karena luasnya sumber daya information Google. Gagasan untuk memperluas established pelatihan Gemini menjadi 5 triliun token, tidak terlalu jauh. Dengan kumpulan information seperti itu, mengecilkan 1 triliun token yang diyakini GPT empat dan memungkinkan skalabilitas yang belum pernah terjadi sebelumnya. Selain itu, angka-angka ini mengecualikan data percakapan yang dihasilkan dengan bard Google atau Claude antropik, yang kemungkinan memperkuat set pelatihan lebih jauh. Makalah teknis Google juga menekankan bahwa penskalaan parameter model, information, ukuran dan kualitas yang ditetapkan akan terus meningkatkan kinerja design bahasa besar.Bagian ketiga Penyempurnaan Di Luar Quantity Tipis. Google juga menekankan pentingnya peningkatan arsitektural dan objektif, mengklaim bahwa pendekatan multifaset ini memastikan pelatihan tidak hanya tentang kuantitas, tetapi juga kualitas. Selain itu, meskipun akses ke sistem akhir yang terlatih mungkin dibatasi karena biaya inferensi, Google kemungkinan berencana untuk menyaring pengetahuannya ke sistem yang lebih kecil dan lebih hemat biaya, bermaksud untuk menghadirkan kemampuan Gemini yang luar biasa ke audiens yang lebih luas. Google juga menyebutkan bahwa version berkisar dari Gecko hingga Unicorn, dengan Gemini menawarkan overall empat ukuran berbeda. Bahkan bekerja di perangkat seluler dan offline.Terlebih lagi, tidak seperti version AI konvensional, Gemini memiliki kemampuan luar biasa untuk menghasilkan keluaran yang benar-benar baru. Apakah membuat cerita, karya seni, atau musik yang benar-benar dapat dibuat oleh Gemini, bukan hanya meniru data pelatihan aslinya yang menjadi dasar pembuatannya. Bagian empat Kemampuan Gemini. Selain itu, Gemini dijadwalkan untuk menyertakan lima kemampuan berikut. Kemampuan satu pertanyaan multimodal menjawab menggunakan beberapa jenis data baik teks, gambar atau video clip. Kemampuan untuk meringkas konten teks, audio atau video yang tak tertandingi. Kemampuan tiga Terjemahan Melampaui terjemahan bahasa dengan Gemini juga mampu menerjemahkan antara tipe information yang berbeda.Kemampuan empat generasi dari esai hingga gambar, musik, dan bahkan mungkin video clip. Gemini akan menjadi alat yang sangat serbaguna bagi para pencipta. Kemampuan lima Kemampuan penalaran Gemini saat menggabungkan informasi membedakannya, menjadikannya alat penting untuk pemecahan masalah dan pengambilan keputusan. Dan ini mungkin hanyalah puncak gunung es dalam hal fungsionalitas dalam jangka panjang, karena Gemini juga diharapkan untuk terus belajar dan berkembang setelah dirilis. Google juga diharapkan akan meluncurkan Industry plugin AI-nya sendiri, yang memungkinkan pengembang pihak ketiga untuk juga berkontribusi pada kemampuan dan kecerdasan Gemini yang berkembang setelah peluncurannya. Bagian lima Sekilas tentang Gemini setelah antisipasi seputar proyek Google Gemini, anak perusahaan riset AI raksasa teknologi DeepMind, baru saja meluncurkan Medpharm, ahli medis AI serba guna yang mewakili evolusi terobosan dalam design AI medis yang mampu memproses teks, gambar medis, dan bahkan genom untuk diagnosis. Khususnya, Medpharm memiliki fondasinya di Hand E, model robotic mutakhir Google yang memadukan bahasa dan visi. Tidak seperti Medpharm juga, yang hanya berfokus pada teks, evolusi Med Hand mewujudkan kemampuannya untuk menganalisis data visual seperti halnya medpharm yang terlalu halus.Model bahasa dasar berhubungan dengan information medis. Medpharm m mengikuti lintasan serupa, menjadi varian khusus dari hand e yang diperkaya dengan wawasan medis. Bagian enam Seorang dokter AI global. Yang penting, DeepMind mengatakan Med hand M adalah langkah menuju design biomedis tujuan umum, seorang dokter global yang mampu mendiagnosis dan memahami segudang topik dan gambar medis dan keserbagunaan med palm M benar-benar luar biasa, karena dapat menjawab pertanyaan kompleks
yang mirip dengan med. Palm 2 plus menyelidiki gambar x ray atau memindai urutan DNA untuk mutasi di berbagai disiplin ilmu. Med Hand M tidak hanya bersaing dengan sistem khusus, tetapi bahkan mengubah tolok ukur di bidang seperti diagnostik sinar-X, tempat untuk mengevaluasi kemampuan med Hand M. Tim peneliti Deepmind mengembangkan multi med bench, tolok ukur multimodal yang terdiri dari 14 tugas dari tujuh disiplin medis. Ini termasuk lebih dari satu juta contoh untuk mendorong pengembangan AI biomedis. Kemahiran Npm dalam mendiagnosis rontgen dada menjadi jelas dalam tes dengan dokter yang lebih memilih laporan yang dihasilkan AI. Dalam sekitar 40% kasus. Ini signifikan secara klinis. Tingkat kesalahan sejalan dengan keahlian manusia, sehingga cocok untuk aplikasi klinis.Bagian tujuh Ekstra. Salah satu fitur Med Palm M yang paling menarik adalah kemampuan Zero-shot-nya, memungkinkannya untuk mengenali dan mendeskripsikan fenomena medis baru tanpa pelatihan sebelumnya. Atribut ini dapat merevolusi kasus di mana data contoh langka, dan sementara med palm m mewakili yang monumental. Kemajuan. Tim DeepMind menyadari perlunya pengembangan lebih lanjut. Terutama, tantangannya terletak pada penskalaan information berkualitas tinggi dan kadang-kadang langka serta memperluas pembandingan karena bangku Multimed masih memiliki keterbatasan dalam ruang lingkupnya dan beragam tugas secara bersamaan
. Med hand em adalah langkah penting menuju AI biomedis umum dan kecerdasan umum buatan segera. Dan saat kita menunggu kedatangan Gemini kemungkinan akhir tahun ini, jelas bahwa version bahasa besar generasi berikutnya ini akan menggabungkan kumpulan pengetahuan yang berbeda menjadi satu sistem yang koheren. Potensi yang akan datang untuk menetapkan standar baru, beradaptasi dengan tugas baru tanpa pelatihan sebelumnya, dan mengintegrasikan beragam pengetahuan medis tampaknya menunjukkan bahwa Google semakin dekat untuk mencapai kecerdasan umum di seluruh domain. Dan dengan Gemini yang berhasil mengatasi perpaduan berbagai jenis information dan tugas tanpa bergantung pada model khusus seperti Med Palm, ini juga menandai awal dari perubahan yang tak tertandingi dalam otomatisasi tempat kerja dan produksi sintetis, karena Gemini dapat mengabstraksikan pemahamannya jauh melampaui membatasi information pelatihannya untuk belajar menggeneralisasi pada tingkat yang sebelumnya tidak dapat dicapai bahkan oleh OpenAI dan Microsoft.Mengamankan masa depan jangka pendek Google dalam lanskap kecerdasan buatan yang berubah dengan cepat.
Gemini diharapkan jauh melebihi kemampuan dan pemahaman bahkan GPT empat yang dapat belajar dari domain name dan kumpulan information apa pun tanpa memerlukan version khusus atau penyetelan halus, yang sangat kontras dengan model bahasa besar yang ada.Alasan pertama untuk keunggulan kompetitif yang begitu besar adalah keunggulan Google dalam hal information. Selain itu, meskipun akses ke sistem akhir yang terlatih mungkin dibatasi karena biaya inferensi, Google kemungkinan berencana untuk menyaring pengetahuannya ke sistem yang lebih kecil dan lebih hemat biaya, bermaksud untuk menghadirkan kemampuan Gemini yang luar biasa ke audiens yang lebih luas. Apakah membuat cerita, karya seni, atau musik yang benar-benar dapat dibuat oleh Gemini, bukan hanya meniru information pelatihan aslinya yang menjadi dasar pembuatannya. Dan saat kita menunggu kedatangan Gemini kemungkinan akhir tahun ini, jelas bahwa model bahasa besar generasi berikutnya ini akan menggabungkan kumpulan pengetahuan yang berbeda menjadi satu sistem yang koheren. Dan dengan Gemini yang berhasil mengatasi perpaduan berbagai jenis data dan tugas tanpa bergantung pada model khusus seperti Med Palm, ini juga menandai awal dari perubahan yang tak tertandingi dalam otomatisasi tempat kerja dan produksi sintetis, karena Gemini dapat mengabstraksikan pemahamannya jauh melampaui membatasi data pelatihannya untuk belajar menggeneralisasi pada tingkat yang sebelumnya tidak dapat dicapai bahkan oleh OpenAI dan Microsoft.Mengamankan masa depan jangka pendek Google dalam lanskap kecerdasan buatan yang berubah dengan cepat.