Dzisiaj mamy: Wtorek, 3 Grudzień 2024

Google Gemini. Co warto wiedzieć o ChatGPT od Google?

2024.02.13

Wraz z dynamicznym rozwojem sztucznej inteligencji oraz technologii przetwarzania języka naturalnego (NLP) Google stale poszerza swoje portfolio produktów i usług. Jednym z jego najnowszych przedsięwzięć jest Google Gemini. Pod tą enigmatyczną nazwą kryje się innowacyjny projekt, który ma potencjał, by zrewolucjonizować sposób, w jaki ludzie komunikują się ze sztuczną inteligencją. Zebraliśmy dla Ciebie najważniejsze i najbardziej aktualne informacje na ten temat – zobacz, co warto wiedzieć o ChatGPT od Google!

Czym jest Google Gemini?

W grudniu ubiegłego roku Google zaprezentowało całkiem nowy model AI, który nosi nazwę Gemini. Powstał on w efekcie szeroko zakrojonej współpracy wielu zespołów, w tym Google DeepMind oraz Google Research. Przedstawiciele firmy przekonują, że jest on największym projektem naukowo-inżynierskim w historii Google. Czym dokładnie się odznacza? Przede wszystkim multimodalnością, która oznacza, że Gemini naśladuje ludzką zdolność do interpretowania świata, wykorzystując treści oraz dane odbierane przez różne zmysły. Potrafi odczytywać tekst, obrazy, dźwięki i video, a jego możliwości mają przewyższać model GPT-4 (znany z ChatGPT).

Google Gemini a Google Bard – skąd ten rebranding?

Większość z nas kojarzy Google Bard, czyli chatbot stworzony przez najbardziej znaną firmę technologiczną na świecie. Model ten jednak nie przyjął się najlepiej, ponieważ okazał się dużo mniej skuteczny niż ChatGPT od OpenAI. Google postanowiło nie spoczywać na laurach i w pocie czoła pracowało nad jego ulepszeniem, czego efektem jest Google Gemini. Według badań jest to pierwszy model, który osiąga lepsze wyniki w teście MMLU (Massive Multitask Language Understanding) od ludzi.


Zobacz też: AI w e-commerce. Do czego możesz wykorzystać sztuczną inteligencję?


Co potrafi Google Gemini?

Google zadbało o to, by umiejętności nowego narzędzia robiły wrażenie. Gemini jest w stanie interpretować obrazy z kamery w czasie rzeczywistym i odpowiadać na zadane pytania. Model potrafi również identyfikować przedstawione mu obiekty, porównywać je z innymi, a także określić, z jakiego materiału są zrobione. Z łatwością rozwiązuje różnego rodzaju zagadki i rebusy, generuje też nowe obrazy na podstawie tych wcześniej widzianych. Modele multimodalne są bardziej rozwinięte od modeli językowych, ponieważ te drugie mogą jedynie generować tekst, a do innych zadań potrzebują połączenia z kolejnymi modelami.

Trzy warianty Google Gemini

Google Gemini ma występować w trzech wariantach: Nano, Pro i Ultra. Pierwszy z nich jest przeznaczony dla urządzeń mobilnych, drugi został już zintegrowany z chatbotem Google Bard (na razie tylko w języku angielskim), a trzeci to najbardziej zaawansowany model, który zostanie wdrożony do usługi Google Bard Advanced. Gemini doczekało się już aplikacji na Androida, jednak na razie nie jest ona dostępna w Polsce.

Polecamy