Daug žadantis naujas „Google“ kūrinys – dirbtinio intelekto modelis „Gemini“
Praeitų metų gruodį „Google“ pristatė dirbtinio intelekto modelį „Gemini“, kuris gali apdoroti ne tik tekstinę medžiagą, bet ir paveiksliukus vaizdo įrašus, garsus. „Gemini“ sukūrė „Google“ valdytoja „Alphabet“, prie kūrimo tai pat prisidėjo ir „Google DeepMind“. Kaip teigia „Google DeepMind“generalinis direktorius Demis Hassabis: „Gemini“ yra milžiniškas žingsnis į priekį, kuris paveiks visus „Google“ produktus. Technologijų gigantės kurtas dirbtinio intelekto modelis turi tris skirtingas versijas, didžiausia ir pajėgiausia vadinama „Gemini Ultra“ – ji skirta ypač sudėtingoms užduotims atlikti. Vidutinė versija vadinama „Gemini Pro“ – sukurta taip, kad palaikytų naujausią AI pokalbių roboto „Bard“ versiją. Ji gali greitai reaguoti ir suprasti sudėtingas užklausas. Paprasčiausia versija yra „Gemini Nano“ – ji yra skirta veikti išmaniuosiuose įrenginiuose atlikti užduotims, neprisijungus prie išorinių serverių, pavyzdžiui, siūlyti atsakymus pokalbių programose arba apibendrinant tekstą.
Kuo „Gemini“ yra pranašesnis už konkurentus?
Lyginti „Gemini“ GPT-4 su „OpenAI“ GPT-4 yra dar gana sudėtinga. Tik psirodžiusius apžvalgos yra gana prieštaringos, tačiau kalbant apie daugiarūšiškumą – gebėjimą suprasti kelių tipų įvestis – „Gemini“ šiuo metu pirmauja tarp savo konkurentų, nors kol kas pirminė jo versija panašiausia į „OpenAI“ 3.5. versiją, tačiau galima tikėtis, kad labai greitai „Gemini“ sparčiai ūgtels ir greičiausiai pranoks savo konkurentus. Naujasis „Google“ tvarinys, kaip išvesties modelis, gali priimti vaizdo įrašą, vaizdus, garsą, tekstą, „Gemini“ gali suprasti kalbą vizualiai, pavyzdžiui, jei parodysime nuotrauką su muzikos partitūra, „Gemini“ galės ją išaiškinti jums.
Nors rugsėjo mėnesį „OpenAI“ paskelbė apie modelį GPT-4Vision, kuris taip pat gali dirbti su vaizdais, garsu ir tekstu, tačiau tai nėra visiškai daugiarūšiškas modelis, toks kaip „Gemini“. O pati „Google“ teigia, kad „Gemini“ Pro“ pagal įvairius parametrus rodo geresnius rezultatu nei „OpenAI“ modelis GPT – 3.5. (Tiesa, kai kurie apžvalgininkai teigia, kad šis pranašumas yra nedidelis). Mes nusiteikę tikėti, kad naujasis „Google“ dirbtinio intelekto modelis yra vienas didžiausių ir pažangiausių dirbtinio intelekto modelių su labai šviesia ateitimi, o kaip bus iš tikrųjų – pamatysime netolimoje ateityje.
Per kelis ateinančius mėnesius „Google“ planuoja pateikti jį „Search“, „Ads“, „Chrome“ ir „Duet AI“. Kūrėjams „Gemini Pro“ bus pasiekiamas nuo gruodžio 13 d. per „Gemini“ API „Google AI Studio“ arba „Google Cloud Vertex AI“.