• 24 Січня 2025

OpenAI представляє ШІ-агента Operator, який може планувати подорожі

Компанія OpenAI презентувала Operator — інструмент, що використовує модель Computer-Using Agent (CUA) для автоматизації завдань в інтерфейсах. Ця модель імітує взаємодію з елементами екрана: кнопками, текстовими полями чи меню. Також він виконує дії, що зазвичай потребують участі людини.

Computer-Using Agent (CUA) — це модель штучного інтелекту, розроблена OpenAI. Вона імітує дії людини на комп’ютері: аналізує екран, визначає елементи інтерфейсу та взаємодіє з ними, використовуючи віртуальну клавіатуру і мишу.

Operator може виконувати широкий спектр завдань. Наприклад, створювати списки справ, планувати подорожі, здійснювати онлайн-покупки та займатись бронюванням. Інструмент працює через окреме вікно браузера, аналізуючи знімки екрана, щоб визначати потрібні дії, а потім імітує натискання кнопок чи введення тексту.

Operator співпрацює з сервісами DoorDash, Instacart, Uber та StubHub — завдяки цьому він автоматизує рутинні процеси. Наприклад, може знайти ресторан, замовити доставку продуктів чи забронювати квитки на події.

OpenAI також планує розширити доступність сервісу. Наразі він доступний лише клієнтам ChatGPT Pro у США за $200 на місяць. У майбутньому компанія планує інтегрувати Operator у всі свої програми та надати доступ розробникам через API для створення спеціалізованих інструментів.

Під час тестувань Operator показав хороші результати у виконанні рутинних завдань. На реальних сайтах (тестова платформа WebVoyager) інструмент впорався з 87% завдань. На навчальних сайтах (платформа WebArena) успішність знизилася до 58%.

У тестах на операційних системах Operator виконав 38% завдань, що перевершує попередні моделі, але все ще поступається результатам людини, яка показує ефективність на рівні 72%.

OpenAI наголошує на захисті даних. Перед введенням логіна чи інших чутливих даних, Operator завжди запитує підтвердження. Сервіс також має обмеження: не працює з платіжною інформацією та не отримує доступу до певних категорій сайтів.

A research preview of Operator, an agent that can use its own browser to perform tasks for you. pic.twitter.com/wkBBDIlVqj
— OpenAI (@OpenAI) January 23, 2025

Дані, які збирає Operator зі знімків екрана, передаються на сервери OpenAI, але компанія надає можливість видалити історію роботи чи відключити використання даних для навчання моделей. Система також інтегрувала механізми моніторингу, які зупиняють роботу Operator у разі виявлення підозрілих дій.

Попри ці заходи, експерти попереджають про ризики зловживання: можливі атаки через маніпулятивні запити чи інші уразливості системи. OpenAI визнає ці виклики та працює над їх мінімізацією.

ШІ-агенти стають центральною темою у сфері автоматизації. Інші технологічні компанії також активно розвивають подібні рішення. Наприклад, Perplexity нещодавно запустила агента для пристроїв Android, який бронює ресторани, викликає таксі та створює нагадування.

Apple, співпрацюючи з OpenAI, інтегрувала ChatGPT у Siri, що дозволяє розширити функціонал голосового помічника. Google, своєю чергою, розробляє агента Project Mariner, який автоматизує завдання у браузері Chrome.

Джерело: TechCrunch x Reuters

Ольга Беспалько

• Media Editor

Inweb

Редакторка медіа з досвідом роботи у контент-менеджменті та копірайтингу. Постійно слідкую за digital трендами і новинами, щоб надавати вам цікаву та актуальну інформацію. Зі мною ви точно будете в курсі всіх подій.