Google запустила Whisk — інструмент для візуалізації та змішування ідей за допомогою зображень і ШІ
Компанія Google представила новий експериментальний інструмент під назвою Whisk, який працює на основі генеративного ШІ. На відміну від традиційних методів, де зображення генеруються за текстовими запитами, Whisk дає змогу створювати візуальні композиції, комбінуючи різні зображення.
Користувач може завантажити зображення для об’єкта, сцени та стилю, а потім поєднати їх для нових візуальних концепцій: від цифрових іграшок до стикерів чи брошок.
За допомогою моделі Gemini Whisk автоматично створює текстові описи завантажених зображень, які потім обробляє нова модель генерації зображень Imagen 3. Завдяки такому підходу можна зберігати головні риси зображень, не створюючи точних копій.
Розробники зазначають, що Whisk може відрізнятися від очікувань користувачів: змінювати висоту, вагу чи інші характеристики об’єкта. Тому можна буде переглядати та редагувати готові текстові описи.
Інструмент орієнтований на швидкий візуальний пошук ідей, а не на детальне редагування пікселів. Це дає змогу художникам і креативникам досліджувати десятки варіантів дизайну та завантажувати лише найкращі результати.
Google Labs продовжує розробку інновацій на базі генеративних моделей, таких як Gemini, Imagen та Veo, тестуючи нові функції й залучаючи користувачів до створення майбутнього технологій.
Джерело: Google