Meta запустила ШІ-інструмент, який може перевіряти інші ШІ-моделі 

Meta запустила ШІ-інструмент, який може перевіряти інші ШІ-моделі 

Компанія Meta анонсувала запуск ШІ-інструмент Self-Taught Evaluator, який може зробити процес оцінювання ШІ більш автономним. Цей проєкт має на меті зменшити залежність від людського ресурсу у перевірці роботи штучного інтелекту. Інструмент є частиною розвитку Reinforment Learning from AI Feedback.

Reinforcement Learning from AI Feedback (Навчання з підкріпленням на основі зворотного зв’язку від штучного інтелекту) — це метод, при якому штучний інтелект використовує оцінку та підказки від інших ШІ-моделей для вдосконалення своїх результатів.

Self-Taught Evaluator базується на методі ланцюжка міркувань, який розбиває складні завдання на кілька послідовних логічних кроків. Такий підхід підвищує точність відповідей на складні питання у сфері науки, програмування та математики. Для навчання цієї моделі Meta використала виключно дані, які створені іншими моделями ШІ. Таким чином компанія повністю відмовилась від залучення людського ресурсу на цьому етапі.

Ідея ШІ-агентів, здатних перевіряти власну роботу й вчитися на помилках, може значно оптимізувати процеси. Це дозволить обійти поширений, але дорогий метод Reinforcement Learning from Human Feedback.

Reinforcement Learning from Human Feedback (Навчання з підкріпленням на основі зворотного зв’язку від людини) — метод навчання штучного інтелекту, який вимагає залучення експертів для анотації даних та перевірки складних відповідей.

Google та Anthropic також працюють над розвитком Reinforcement Learning from AI Feedback. Однак вони, на відміну від Meta, рідко публікують свої моделі у відкритому доступі. Meta планує зробити свій інструмент доступним для дослідників та розробників.

«Ми очікуємо, що з розвитком ШІ він буде перевершувати здатність людей у перевірці власної роботи», — Джейсон Вестон, дослідник компанії Meta.

Він підкреслив, що здатність до самонавчання та самоперевірки є ключовою умовою для досягнення штучним інтелектом рівня, який перевершує людські можливості.

Джерело: Reuters 

Ольга Беспалько
Ольга Беспалько
• Media Editor
Inweb
Редакторка медіа з досвідом роботи у контент-менеджменті та копірайтингу. Постійно слідкую за digital трендами і новинами, щоб надавати вам цікаву та актуальну інформацію. Зі мною ви точно будете в курсі всіх подій.
Більше цікавого