Godišnja proslava softvera ove tvrtke priprema teren za sve što Google planira za nadolazeću godinu, a ovom je prilikom izvršni direktor Sundar Pichai nedvosmisleno izjavio da Google ulazi u „Gemini eru”. Od AI pretraga u vašim Google fotografijama do virtualnih AI asistenata koji će raditi zajedno s vama, Google integrira Gemini u apsolutno sve, sa značajnim posljedicama. Donosimo pregled svega što je Google najavio ove godine.
Konferenciju je otvorio Marc Rebillet, američki elektronički glazbenik i YouTuber, koji je iskoristio Googleove nove generativne modele kako bi stvorio novu pjesmu uživo pred publikom.
Gemini – Vaš novi AI asistent
Googleov AI model bio je fokus I/O eventa. Gemini 1.5 Pro bit će dostupan na više od 35 jezika svim programerima i naprednim korisnicima počevši od danas. Jedna od glavnih govornih točaka bila je činjenica da Gemini 1.5 Pro sada ima milijun tokena konteksta, pa zbog toga može obraditi npr. pet znanstvenih radova odjednom, ili uvažiti više modaliteta upita. To znači da ćemo mu moći priložiti PDF datoteku, tekstualni upit, video i sliku – sve u isto vrijeme – kako bi nam AI dao kompletan odgovor sa širokim kontekstom.
Gemini i Google Photos
Korisnici svakodnevno učitavaju više od šest milijardi fotografija na Google Photos, pa ne čudi da bi dobro došla pomoć u njihovom pregledavanju. Gemini će biti dodan u Google fotografije ovog ljeta, dodajući dodatne mogućnosti pretraživanja putem funkcije Ask Photos.
Na primjer, pitajte ga „Koja je moja registarska pločica?” i on će pretražiti vaše fotografije kako bi pronašao najvjerojatniji odgovor, štedeći vas od potrebe da ručno pregledavate svoje fotografije kako biste ga sami pronašli. Ova funkcija će uvelike ubrzati pretraživanje fotografija, te će s vremenom postajati samo pametnija i korisnija.
AI u Androidu
Naravno, Google će integrirati Gemini i u svoj mobilni operativni sustav. Android će biti prvi mobilni OS koji će uključivati tako napredan AI model, čime želi postati primarna platforma za sve AI entuzijaste. Circle to Search bio je prvi dio ove integracije, ali ove godine Google će također dodati Gemini kao standardnog AI asistenta na Androidu – uz dodatne AI funkcije u pozadini.
Zamislite Gemini na Androidu kao Google Assistant na steroidima. Moći će kontekstualno razumjeti sadržaj na vašem ekranu, uključujući sažimanje YouTube videa, stvaranje slika za odgovore i odgovaranje na sva pitanja koja imate – bez napuštanja ekrana na kojem se nalazite.
Pristupačnost je ključna značajka koju AI nudi . Funkcija Talkback je prisutna već neko vrijeme, ali sada, zahvaljujući Gemini-u, slike se mogu opisati u detalje, pružajući osobama s oštećenjem vida lakši način korištenja telefona. I budući da je Gemini dostupan na uređaju, brz je, učinkovit te siguran jer se podaci obrađuju lokalno, a ne u cloudu.
Gemini će pomoći u borbi protiv neželjenih i prevarantskih (scam) poziva. Gemini će slušati vaše pozive i dati vam upozorenje kada otkrije sumnjivu aktivnost – i budući da je sve na uređaju, informacije neće napustiti vaš telefon. Ova značajka se još uvijek usavršava i neće biti dostupna još neko vrijeme.
Notebook LM
Googleov softver koji pomaže predavačima i roditeljima da educiraju djecu također će dobiti Gemini integraciju, čime će se njegove AI sposobnosti podići na još višu razinu. Tijekom prezentacije, Google je pokazao kako prilagođava lekciju iz fizike koristeći košarku kao primjer. Ovakva personalizacija učenja vjerojatno će postati sve češća u budućnosti.
Gemini agenti
Gemini nije samo za postavljanje pitanja i sažimanje podataka – Google želi da vam stvarno obavi poslove. Iako ne može usisavati ili iznositi smeće, Agents je novi AI asistent kojem možete dodijeliti zadatke. Google je demonstrirao snimivši fotografiju para cipela i rekavši Agentu da ih vrati. Koristeći AI za identifikaciju cipela, pretražio je Gmail za račun i ponudio pokretanje povrata putem e-pošte. Agents se također može koristiti za planiranje odmora, poslovnih putovanja i drugih zadataka vezanih uz organizaciju i informacije.
Projekt Astra
Još jedan eksperimentalni projekt za Google je Astra, koji povezuje Gemini s kamerama i omogućuje mu razumijevanje i interpretaciju svijeta oko sebe. U demonstraciji, Astra je mogla identificirati zvučnik, razložiti koji dio zvučnika proizvodi zvukove, te čitati kod programa i objasniti ga pojedine funkcije isječaka koda. Astra bi se također mogla koristiti u kombinaciji sa pametnim naočalama, omogućujući vam postavljanje pitanja o stvarima koje vidite bez potrebe da podižete kameru telefona.
Ovo je jedan od projekata za koji nije definiran točan rok, stoga ne znamo kada će biti dostupan na našem tržištu.
Generativni AI za multimediju
Generativna umjetna inteligencija je najpoznatija AI tehnologija, a Google ne zanemaruje ovaj najvažniji element AI-a. Njegov najnoviji AI model za stvaranje slika zove se Imagen 3, a Google tvrdi da je to najbolji model koji je dosad napravio za stvaranje slika pomoću riječi, kao i za razumijevanje upita.
Osim slika, Google intenzivno radi na stvaranju AI modela za generiranje glazbe, kao i na AI modelu Veo, koji može stvoriti vrlo impresivne HD videozapise. Upiti se mogu koristiti za uređivanje postojećih videozapisa, tako da ne morate svaki put stvarati videozapise ispočetka, a prikazani video primjeri definitivno izgledaju bolje od većine videozapisa stvorenih pomoću AI-a.
Ako ste zabrinuti da bi generirane slike, zvukovi i videozapisi mogli biti korišteni u zlonamjerne svrhe, bez brige, Google je dodao SynthID u iteracije Geminija. Riječ je o nevidljivom obliku vodenog žiga koji upućuje da je sadržaj stvoren pomoću umjetne inteligencije – konkretno, u alatima ImageFX i VideoFX.
Gemini i Google Workspace
Gemini je već neko vrijeme dostupan u Googleovom softveru za tvrtke, ali Google je spreman podići ga na sljedeću razinu. Zadnja verzija jezičnog modela integrirana u bočnu ploču Workspacea bit će dostupna već sljedećeg mjeseca. Gemini također dolazi u Google Meet na više jezika.
Kao što se moglo očekivati, Gemini će se proširiti i na Gmail. Zamolite ga da sažme informacije iz škole vašeg djeteta i to će učiniti, ili će jednostavno sažeti duge e-poruke kako vi ne biste morali. Upišite pitanje ili upit i Gemini će moći odgovoriti ili izvršiti radnju. Primjerice, moći će prikupiti različite ponude za građevinske radove i sastaviti ih u popis te od njih napraviti tablicu za pregled svih ponuda i troškova. Također će moći kreirati Google Sheet sa svim našim računima iz e-pošte.
Pametni odgovori također dobivaju nadogradnju s Kontekstualnim pametnim odgovorima (Contextual Smart Reply). Ove mogućnosti će biti dostupne korisnicima Workspace Labs ovog ljeta.
Uskoro biste mogli raditi zajedno s umjetnom inteligencijom. Google je predstavio AI Teammate, zadužen za praćenje resursa za tim unutar tvrtke. Ovaj „kolega” može odgovarati na pitanja u chatovima u Google Workspaceu te je sposoban pamtiti kada su donesene odluke i pratiti napredak specifičnih projekata, kao i prenijeti nam odgovore na sva naša pitanja za koja bismo prije trebali listati e-poštu i grupne razgovore.
Aplikacija Gemini
Integracija Gemini modela sa svakodnevnim životom za prosječnog korisnika ići će preko aplikacije Google Gemini koja će sada nuditi odgovore skoro instantno nakon što je pitanje postavljeno. Kroz ovu aplikaciju, možemo i generirati Gemini Gem, personaliziranu verziju asistenta za svačije individualne potrebe.
Dakle, ako kontinuirano koristite Gemini na određene načine, možete stvoriti Gem kako biste uštedjeli na vremenu kad vam ponovno zatreba. Na primjer, mogli biste prilagoditi Gem da vam priča priče u stilu koji preferirate, umjesto da stalno upisujete iste upite generičkom AI chatbotu.
Aplikacija Gemini može obavljati brojne stvari koje očekujete od Geminija, uključujući planiranje putovanja i izradu itinerara. Ova funkcija bit će dostupna ovog ljeta.
Google tražilica
Generativna umjetna inteligencija pojavit će se i u Google pretragama. AI pregledi će sažeti rezultate na vrhu vaše pretrage, umjesto da vas šalju na razne web stranice. Višestupanjsko zaključivanje će razložiti vaše upite, koristeći Googleove indekse kako bi vam pružilo najrelevantnije informacije. Može vam čak pomoći i u planiranju putovanja.