Анонси з Google I/O 2024: покращення Gemini, Google Photo та запуск SGE
Google провела щорічну конференцію Google I/O у Mountain View. Цьогоріч багато ефірного часу приділили штучному інтелекту та його покращенням у різних сервісах компанії.
Ми зібрали головні анонси й оновлення Google. Вони допоможуть швидко ознайомитися з нововведеннями як користувачам сервісів компанії, так і digital-спеціалістам.
Оновлення Gemini
На початку конференції Сундар Пічаї, генеральний директор Google, зазначив, що понад 1,5 млн розробників використовують Gemini.
Тому однією з головних новинок стало оголошення про Gemini 1.5 Flash. Це нова модель штучного інтелекту, оптимізована для швидкості та ефективності у застосунках. Вона займає проміжне місце між Gemini 1.5 Pro і Gemini 1.5 Nano, забезпечуючи розробникам доступніший варіант для створення ШІ-програм.
Окрім релізу «легшого» Gemini, Google також розширила Gemini 1.5 Pro до 2 млн токенів. Це надає можливість краще розуміти контекст звернення та надавати точніші результати.
На презентації показали, як Gemini може самостійно повернути взуття, якщо воно вам не підійшло, оформити лист зі зверненням, зафіксувати факт повернення тощо. Однак подібна історія навряд чи працюватиме в Україні, до того ж у нас повернення можна оформити відразу через Нову пошту.
Запуск Google SGE
Генеративна видача Google (SGE) тестувалася впродовж певного часу і на конференції I/O 2024 генеральний директор Сундар Пічаї оголосив про те, що тести дали результати. За його словами, багато користувачів задоволені нововведеннями, тому впродовж цього тижня AI Overviews (нова назва SGE) буде запущена у США. Згодом генеративна видача розповсюдиться на інші країни.
Ми раніше розповідали про те, що таке SGE, як вона може повпливати на трафік сайту та як підготуватися до впровадження SEO-спеціалістам і власникам сайтів.
Попри те, що AI Overviews можуть лякати творців контенту, вони надають можливість людям знайти саме те, що вони шукають.
До прикладу, на презентації Ліз Рід показала, як можна швидко знайти студію йоги та пілатесу, яка відповідатиме вашому графіку та всім необхідним умовам. На прикладі звичайного пошуку Google, користувачу довелося б самому аналізувати кожен з аспектів — від графіка роботи до ціни й розташування.
Оновлення в пошуку Google
Вже після презентації Google повідомили, що додали новий фільтр результатів пошуку. Його можна буде обрати у меню «більше». Цей фільтр дозволяє показувати тільки текстові посилання на інші сайти. Робота даного фільтра буде схожою до того, як ви фільтруєте зображення чи новини.
Обравши його, вам відкриється сторінка зі старим пошуком з блакитними посиланнями. Це корисно тим, у кого поганий інтернет, або тим, хто шукає тільки сайти з відповідями.
Google Photos та нові можливості
Сервіс Google Photos представили у 2015 році, відтоді до нього завантажується понад 6 млрд фото та відео щодня. Сундар Пічаї розповів про те, що за ці роки вони значно покращили можливості сервісу. До прикладу, якщо раніше вам потрібно було гортати фото у пошуках свого номерного знаку, зараз можна запитати це у Gemini та він надасть необхідне фото.
Також ШІ можна ставити точні запитання: «Коли моя дитина навчилася плавати?». І функція Ask Photos відповість текстовим повідомленням, прикріпивши відповідне фото з галереї.
NotebookLM
На презентації також показали застосунок NotebookLM та його можливості. Наразі програма недоступна для України, але нею можна скористатися через VPN, і в ній є українська мова інтерфейсу.
NotebookLM — це програма, де можна зібрати всі свої нотатки, замітки, презентації, щоб швидко орієнтуватися у них та оформлювати підсумки.
На конференції I/O 2024 Джорш Вудворд показав, як програма може з матеріалів створити інтерактивний урок про фізику, до якого може долучатися мовець і ознайомлюватися з матеріалами, взаємодіючи зі штучним інтелектом.
Project Astra
Project Astra — універсальний асистент з ШІ, розроблений компанією DeepMind. Він взаємодіє з камерою та звуком, вловлює контекст та інтонацію, щоб надавати поради та відповіді на запитання.
На конференції продемонстрували відео, у якому Astra аналізує відео з камери користувачки та відповідає на її запитання про динамік, його частини, що може робити окрема частина коду з камери тощо. Взаємодія відбувається у режимі реального часу.
Veo та Imagen 3
Google презентували оновлення для движків генеративного ШІ для створення відео та фото.
Veo — це аналог Sora від OpenAI. За словами Google, він може створювати відео довше хвилини з роздільною здатністю 1080p.
Також движок розуміє кінематографічні концепції — таймлапс, повільне відео, колаж тощо. Швидкість генерації покращилась на у 10 разів.
Imagen 3 — це генератор зображень, який, може створювати якісніші зображення ніж попередник із меншою кількістю артефактів. Це відрізняє його від DALLE-3.
Маркування згенерованого контенту
Щоб забезпечити захист в епоху генеративного контенту, Google буде маркувати тексти, відео, фото та музику за допомогою SynthID.
SynthID — це інструмент, розроблений Google DeepMind, який використовує штучний інтелект для створення невидимих цифрових водяних знаків на зображеннях та аудіо, створених за допомогою ШІ.
Ці водяні знаки неможливо побачити людським оком, але їх можуть виявляти інші комп’ютери.
Gemini та Android 15
Останнім, але не менш значущим оновленням є інтеграція Gemini безпосередньо в Android 15, що дозволяє користувачам взаємодіяти з програмами, зображеннями та відео в контексті використання. Gemini на пристрої зможе попереджувати користувачів про спамні дзвінки від компаній і шахраїв.
Загалом за презентацію на дві години спікери вжили слово штучний інтелект 120 разів. З цього зрозуміло, що основна ідея була в тому, щоб ознайомити з покращеннями та нововведеннями у сервісах.
Ми продовжимо спостерігати за тим, як ці нововведення повпливають на роботу пошуку та особисту продуктивність. А щоб бути у курсі подій — підписуйтеся на наш телеграм, де ми публікуємо тільки найцікавіше.
Дивіться повний запис конференції Google I/O 2024