OpenAI представляє ШІ-агента Operator, який може планувати подорожі
Компанія OpenAI презентувала Operator — інструмент, що використовує модель Computer-Using Agent (CUA) для автоматизації завдань в інтерфейсах. Ця модель імітує взаємодію з елементами екрана: кнопками, текстовими полями чи меню. Також він виконує дії, що зазвичай потребують участі людини.
Operator може виконувати широкий спектр завдань. Наприклад, створювати списки справ, планувати подорожі, здійснювати онлайн-покупки та займатись бронюванням. Інструмент працює через окреме вікно браузера, аналізуючи знімки екрана, щоб визначати потрібні дії, а потім імітує натискання кнопок чи введення тексту.
Operator співпрацює з сервісами DoorDash, Instacart, Uber та StubHub — завдяки цьому він автоматизує рутинні процеси. Наприклад, може знайти ресторан, замовити доставку продуктів чи забронювати квитки на події.
Під час тестувань Operator показав хороші результати у виконанні рутинних завдань. На реальних сайтах (тестова платформа WebVoyager) інструмент впорався з 87% завдань. На навчальних сайтах (платформа WebArena) успішність знизилася до 58%.
У тестах на операційних системах Operator виконав 38% завдань, що перевершує попередні моделі, але все ще поступається результатам людини, яка показує ефективність на рівні 72%.
OpenAI наголошує на захисті даних. Перед введенням логіна чи інших чутливих даних, Operator завжди запитує підтвердження. Сервіс також має обмеження: не працює з платіжною інформацією та не отримує доступу до певних категорій сайтів.
Попри ці заходи, експерти попереджають про ризики зловживання: можливі атаки через маніпулятивні запити чи інші уразливості системи. OpenAI визнає ці виклики та працює над їх мінімізацією.
ШІ-агенти стають центральною темою у сфері автоматизації. Інші технологічні компанії також активно розвивають подібні рішення. Наприклад, Perplexity нещодавно запустила агента для пристроїв Android, який бронює ресторани, викликає таксі та створює нагадування.
Apple, співпрацюючи з OpenAI, інтегрувала ChatGPT у Siri, що дозволяє розширити функціонал голосового помічника. Google, своєю чергою, розробляє агента Project Mariner, який автоматизує завдання у браузері Chrome.
Джерело: TechCrunch x Reuters