Meta запустила ШІ-інструмент, який може перевіряти інші ШІ-моделі
Компанія Meta анонсувала запуск ШІ-інструмент Self-Taught Evaluator, який може зробити процес оцінювання ШІ більш автономним. Цей проєкт має на меті зменшити залежність від людського ресурсу у перевірці роботи штучного інтелекту. Інструмент є частиною розвитку Reinforment Learning from AI Feedback.
Self-Taught Evaluator базується на методі ланцюжка міркувань, який розбиває складні завдання на кілька послідовних логічних кроків. Такий підхід підвищує точність відповідей на складні питання у сфері науки, програмування та математики. Для навчання цієї моделі Meta використала виключно дані, які створені іншими моделями ШІ. Таким чином компанія повністю відмовилась від залучення людського ресурсу на цьому етапі.
Ідея ШІ-агентів, здатних перевіряти власну роботу й вчитися на помилках, може значно оптимізувати процеси. Це дозволить обійти поширений, але дорогий метод Reinforcement Learning from Human Feedback.
Google та Anthropic також працюють над розвитком Reinforcement Learning from AI Feedback. Однак вони, на відміну від Meta, рідко публікують свої моделі у відкритому доступі. Meta планує зробити свій інструмент доступним для дослідників та розробників.
«Ми очікуємо, що з розвитком ШІ він буде перевершувати здатність людей у перевірці власної роботи», — Джейсон Вестон, дослідник компанії Meta.
Він підкреслив, що здатність до самонавчання та самоперевірки є ключовою умовою для досягнення штучним інтелектом рівня, який перевершує людські можливості.
Джерело: Reuters