Google представив нову модель штучного інтелекту Gemini 2.0 Flash
Google представив нову модель штучного інтелекту Gemini 2.0 Flash, яка удвічі перевершує за швидкістю попередню версію Gemini 1.5 Pro та демонструє кращі результати за ключовими показниками.
Окрім цього, компанія представила інші інструменти на основі нової моделі штучного інтелекту. Детальніше про кожне з оновлень — пишемо далі.
Можливості Gemini 2.0 Flash
Gemini 2.0 Flash продовжує розвиток успішної моделі 1.5 Flash, яка була улюбленою серед розробників. Нова версія стала ще швидшою та продуктивнішою: вона працює вдвічі швидше за 1.5 Pro і показує кращі результати.
Нова модель підтримує мультимодальні вхідні й вихідні дані: зображення, відео, аудіо та текст. Серед нововведень — нативна генерація зображень, багатомовне текстове озвучення (TTS) та підтримка мультимодальних API для розробників.
Gemini 2.0 Flash доступна для тестування в AI Studio та Vertex AI, а також через Multimodal Live API, яка підтримує роботу з реальними потоковими даними (аудіо, відео). Повноцінний запуск для користувачів запланований на січень 2025 року.
Інструмент для автоматизації аналізу інформації
Окрім Gemini 2.0 Flash, Google анонсував функцію Deep Research. Це — новий інструмент для автоматизації пошуку та аналізу інформації. Він допомагає проводити дослідження в кілька кроків:
- Складає план роботи після отримання запиту.
- Шукає дані у відкритих джерелах, перевіряє їх та уточнює інформацію.
- Формує звіт із посиланнями на джерела.
Звіти можна зберігати у Google Docs для подальшого редагування. Користувачі також можуть ставити додаткові запитання, щоб уточнити чи розширити результати.
Deep Research вже доступний користувачам Gemini Advanced англійською мовою через десктопну і мобільну вебверсії. На початку 2025 року функція з’явиться і в мобільному застосунку. Для активації користувачі можуть обрати модель Gemini 1.5 Pro with Deep Research у дропдавн-меню.
Інноваційні прототипи на основі моделі Gemini 2.0 Flash
Google представив нові прототипи, створені на базі моделі Gemini 2.0 Flash. Вони показують, як штучний інтелект може допомагати у різних сферах. Загалом, проєкти Astra, Mariner і Jules демонструють, як ШІ може стати частиною нашого життя.
Багатомовний асистент Project Astra
Project Astra — це універсальний помічник, який розуміє кілька мов і може працювати в різноманітних мовних середовищах. У новій версії:
- розпізнає акценти та незвичайні слова;
- використовує Search, Maps і Lens для пошуку інформації чи навігації;
- запам’ятовує до 10 хвилин розмови, щоб краще відповідати на запити;
- розуміє мову майже миттєво, як у живій розмові.
Astra тестують на Android-пристроях і у смартокулярах, відкриваючи можливості для використання ШІ у повсякденному житті.
Асистент для браузера Project Mariner
Mariner — це інструмент, який автоматизує завдання у браузері. Він може читати текст, розпізнавати зображення, код і форми на сторінці, а також виконувати завдання через розширення для Chrome.
У тестах WebVoyage Mariner показав точність 83,5% під час виконання завдань — пошуку інформації та заповнення форм. Для гаранта безпеки агент працює лише у відкритій вкладці та завжди просить підтвердити важливі дії, наприклад, покупку.
Помічник для розробників Jules
Jules — це ШІ-асистент для розробників, який інтегрований у GitHub. Він може:
- Знаходити помилки в коді.
- Створювати плани їх виправлення.
- Реалізувати цей план під наглядом розробника.
Загалом, Gemini 2.0 Flash дає нові можливості для розробників та компаній, легко інтегруючись з інструментами Google. Користувачі також зможуть отримати зручніший і кращий досвід роботи з мультимодальними технологіями.
Джерело: Google Blog