Редактор
OpenAI представила технику "Confessions" для повышения прозрачности языковых моделей
OpenAI представила новую технику "Confessions" для обучения языковых моделей.
Основная цель — научить искусственный интеллект находить и признавать собственные ошибки.
В основе "Confessions" лежит дополнительный этап анализа. Сначала модель отвечает на запрос обычным способом, а затем формирует отдельный отчет, в котором оценивает свой ответ. Во втором сообщении модель может показать, где она неправильно следовала инструкциям или сделала фактическую ошибку.
Техника уже была опробована в модели "GPT-5 Thinking". До внедрения "Confessions" модель могла скрывать ошибки, но после обучения вероятность таких случаев снизилась до 4,4%. При этом метод не исправляет ошибки сам по себе — он делает их видимыми: модель начинает явно указывать, где именно ошиблась, что облегчает работу исследователям.
©oxu.az
Колумнисты
Список новостей
Все новости
Если компания, выигравшая тендер, выполнила работу некачественно, что должен делать заказчик?
05.12.2025Восстановление железнодорожной инфраструктуры в Нахичеване начато АО «Azərbaycan Dəmir Yolları»
05.12.2025Стартап "Vinci" получил инвестиции в размере 46 миллионов долларов.
05.12.2025OpenAI представила технику "Confessions" для повышения прозрачности языковых моделей
05.12.2025Мировое число долларовых миллиардеров стремительно растет: прирост за год — 287 человек
04.12.2025На полигоне в Бардинском районе выявлен пожар из-за нарушения правил обращения с отходами
04.12.2025Компания Brevo привлекла 583 миллиона долларов от ведущих инвесторов
04.12.2025AQTA проверяет объекты «Ивановка» после выявления фальсификата в Баку
04.12.2025