Umelá inteligencia vie čítať obrázky a odhalí tvoju osobnosť: Uhádla, odkiaľ pochádzame?

Google Gemini

Google Gemini je inovatívna AI technológia (Zdroj: GettyImages)

# Súčasný pokrok v oblasti umelej inteligencie a strojového učenia otvára nové možnosti vývoja technológií. Jednou z čerstvých inovácií je aj projekt Google Gemini, ktorý prináša revolučný prístup k tvorbe obrazového obsah. V tomto článku sa dozvieš:

Čo je Google Gemini?

Táto umelá inteligencia prvýkrát spustil Google 6. decembra 2023. Jej vývoj pritom začal v máji roku 2023 a jeho predchodcom bolo AI s názvom PaLM 2.

Ako sme ti už v úvode prezradili, Google Gemini je umelá inteligencia zameraná na čítanie obrázkov. Vie prečítať fotky a povedať, aký objekt sa na nich nachádza. Dokonca dokáže určiť polohu, kde bola fotka vytvorená, čiže ak by si odfotil napríklad kostol sv. Martina v Bratislave, tak ti určí polohu a stručne v bodoch ti budovu alebo miesto opíše.

fotka google gemini
S Google Gemini sa na cestách nestratíš (Zdroj: hashtag.sk)

Medzi ďalšie výhody Google Gemini patrí zadávanie príkazov pomocou hlasu. Ak máš zaneprázdnené ruky, vieš mu zadať príkaz cez mikrofón a následne si ho cez reproduktor vypočuť namiesto čítania.

Ako vie čítať obrázky?

Google Gemini je ako superpočítač, ktorý ovláda veľa informácií o obrázkoch a zvukoch. Má tri hlavné verzie; Ultra, Pro a Nano, ktoré spolupracujú na to tom, aby si dostal výslednú odpoveď podľa svojich predstáv.

Každý z týchto modelov dokáže spracovať až 32 768 tokenov, a preto vie svoju pozornosť viacnásobne rozdeliť na viacero dotazov. Táto technológia umožňuje kombinovať rôzne formy vstupov v jednom kontextovom okne, vďaka čomu vytvára priestor pre náročnejšiu konverzáciu.

Vstupné obrázky, ktoré nahráš, môžu mať rôzne rozlíšenia, umelá inteligencia si ich automaticky prispôsobí podľa svojich potrieb. Ak mu nahráš video, tak ho bežne spracuje ako sekvenciu viacerých obrázkov. AI tiež dokáže previesť zvuk na kód, podľa ktorého potom chápe čo od neho vyžaduješ.

👉 MOHLO BY ŤA ZAUJÍMAŤ:
To je ale penis! Umelá inteligencia opäť pochybila, výskumníkom pripravila klamlivý obrázok

Viac než čítanie obrázkov

Vymoženosť čítania obrázkov je skvelá vec, no možnosť hlasového nahrávania robí Google Gemini ešte silnejším spomedzi nástrojov AI. Tento inteligentný softvér dokáže z tvojho hlasu nielen určiť pohlavie, ale aj približnú geografickú polohu.

Rozhodli sme sa zahrať si s touto umelou inteligenciou hru „hádaj, odkiaľ pochádzam”, pri ktorej sme vyskúšali viac miest, ako sú Trnava, Bernolákovo, Liptovský Mikuláš alebo mesto Snina. Takmer zakaždým sa trafil, no s malými obcami mal problémy a my sme mu museli poskytnúť doplňujúce informácie.

Uhádne typ osobnosti

Ako ďalšia vymoženosť je určenie približnej vekovej skupiny, ktorú vždy uhádol. Okrem toho vie taktiež určiť povahu človeka, či je introvert alebo extrovert, a následne aj osobnostný typ. Dokonca niekedy zašiel až tak ďaleko, že pri zmene tónu hlasu sa nás spýtal aj na zdravotný stav.

Okrem týchto vecí ti môže určiť aj finančný status alebo povolanie. Práve tu môže nastať otázka, do akej miery je umelá inteligencia bezpečná. Podľa nás je takéto zdokonaľovanie technológií dvojsečnou zbraňou, lebo mimo určovania zdravotného stavu môže dôjsť k úniku informácií.

Predstavuje Google Gemini hrozbu?

Táto technológia podnecuje otázky týkajúce sa súkromia a bezpečnosti údajov. Keďže Google Gemini dokáže analyzovať a porozumieť obrázkom a zvukom, existuje potenciál, že by AI mohla byť zneužitá na neoprávnené sledovanie alebo manipuláciu s osobnými údajmi.

Zástup nebezpečných robotov
Umelá inteligencia vie o nás veľmi veľa (Zdroj: unsplash.com/julien Tromeur)

Navyše, vzhľadom na obrovské množstvo údajov, ktoré Google Gemini spracováva a uchováva, existuje riziko, že tieto údaje môžu byť ohrozené alebo vystavené tretím stranám.

Napriek tomu by sme nemali zabúdať na pozitívne aspekty tejto technológie. Google Gemini môže priniesť výhody v oblasti medicíny, umelej inteligencie, obchodu a mnohých ďalších odvetviach. Schopnosť analyzovať a chápať vizuálny a zvukový obsah môže viesť k zlepšeniu diagnostiky chorôb, personálnym odporúčaniam produktov alebo vytváraniu inovatívnych inteligentných aplikácií.

👉 MOHLO BY ŤA ZAUJÍMAŤ:
Diabolské zisky a kontroverzia ohľadom AI: Pri sledovaní nového hororu budeš mať pocit, že si jeho súčasťou

Google Gemini verzus ChatGPT

Porovnanie medzi Google Gemini a ChatGPT je zaujímavé, pretože tu si môžeme všimnúť vývoj a využitie AI. Obe technológie sa zameriavajú na spracovanie a porozumenie jazyku a obsahu, avšak ich prístupy a schopnosti sa značne líšia.

ChatGPT je model neurónovej siete, ktorý je známy svojou schopnosťou generovať text na základe vstupných podnetov. Jeho hlavnou silou je schopnosť vytvárať text, ktorý pripomína ľudské písanie, a to na základe veľkého množstva textových údajov z internetu a ďalších zdrojov.

Naopak, Google Gemini je nová technológia, ktorá sa zaoberá nielen textom, ale aj vizuálnymi a zvukovými údajmi. Táto technológia umožňuje spracovanie a porozumenie rôznym formám obsahu, ako sú obrázky, videá a zvukové súbory.

Tak čo, vyskúšaš aj tento nový nástroj?

Sleduj náš Instagram

Zdroj: hashtag.sk
Odporúčame