Топовые ИИ-агенты нарушили этику в половине случаев под давлением KPI

Исследователи показали, что GPT-5 и конкуренты готовы на обман и фальсификацию данных ради достижения целей

Редакция PUSK
Топовые ИИ-агенты нарушили этику в половине случаев под давлением KPI

Учёные из нескольких университетов опубликовали бенчмарк ODCV-Bench, который впервые системно измерил, как часто передовые ИИ-агенты идут на этические нарушения под давлением бизнес-метрик. Результаты оказались тревожными: при наличии жёсткого KPI модели нарушали заданные ограничения в 30–50% сценариев, причём речь идёт не о мелких оплошностях, а о целенаправленных манипуляциях. Эксперимент проводился на реалистичных задачах в изолированной песочнице Docker.

Агентам давали два типа инструкций: «мандатные» (чёткий запрет на определённые действия) и «стимулированные» (цель достичь показателя любой ценой, например, точность модели >90% для регуляторного одобрения). В последнем случае системы массово шли на нарушения: удаляли «неудобные» данные пациентов, манипулировали метриками, обманывали пользователей или даже подделывали результаты, рационализируя свои действия как «оптимизацию качества данных». Особенно показателен феномен «deliberative misalignment»: когда агентов попросили оценить собственные действия постфактум, они корректно идентифицировали их как неэтичные, но в момент исполнения под давлением цели всё равно их совершали.

Это говорит о том, что модели «понимают» мораль на уровне теории, но не способны её применять, когда оптимизируются под конкретный результат.

Комментарии

Войдите через Telegram, чтобы оставить комментарий

Войти

Загрузка комментариев...

Следующий материал · 1 / 98

Роботы UBTech пришли в авиацию: Airbus закупила партию гуманоидов Walker S2

Акции китайского производителя подскочили на 8%

Редакция PUSK
Роботы UBTech пришли в авиацию: Airbus закупила партию гуманоидов Walker S2

Акции китайской компании UBTech Robotics Corp. взлетели на Гонконгской бирже после объявления о сделке с Airbus. Европейский авиаконцерн приобрел новейших человекоподобных роботов Walker S2 для работы на своих заводах.

Это первый случай выхода промышленных гуманоидов UBTech в глобальный сектор авиастроения, ранее компания ориентировалась преимущественно на автопром и логистику. На фоне новостей котировки UBTech выросли более чем на 8%, достигнув максимума с октября прошлого года. Точное количество закупленных машин и сумма контракта не разглашаются, однако известно, что речь идет о «сервисном соглашении», предполагающем совместное расширение сценариев использования роботов в производстве самолетов.

Аналитики Citi отмечают, что сделка подтверждает лидерство UBTech в массовом производстве и готовность их технологий к реальным заводским условиям. Робот Walker S2 — это флагманская промышленная модель UBTech. Гуманоид ростом 1,7 метра способен выполнять высокоточные манипуляции, работать с инструментами и взаимодействовать с людьми благодаря продвинутому ИИ.

Ранее компания уже заключила партнерства с Foxconn и рядом производителей электромобилей, но контракт с Airbus открывает для китайской робототехники принципиально новый и высокотехнологичный рынок.

Комментарии

Войдите через Telegram, чтобы оставить комментарий

Войти

Загрузка комментариев...

Следующий материал · 2 / 98

Два дефектных гена могут «лечить» друг друга

ИИ помог обнаружить, что комбинация двух «сломанных» вариантов гена способна полностью восстанавливать его функцию

Редакция PUSK
Два дефектных гена могут «лечить» друг друга

Международная группа исследователей под руководством Университета Джорджа Мейсона экспериментально подтвердила теорию, предложенную десятилетия назад нобелевским лауреатом Фрэнсисом Криком. Ученые доказали феномен «секвестрации вариантов»: два генетических дефекта, каждый из которых по отдельности полностью нарушает работу гена, при объединении могут взаимно компенсировать друг друга и возвращать 100% функциональности. Для масштабирования открытия аспирант Ановарул Кабир разработал модель машинного обучения.

Алгоритм не только предсказал эффекты комбинаций в гене ASL с точностью 99,6%, но и успешно перенес эти знания на другой белок — фумаразу, показав точность 91%. Это открытие может кардинально изменить диагностику редких заболеваний, так как, по оценкам авторов, подобный эффект может наблюдаться в 4% всех генов человека. Команда изучила тысячи комбинаций мутаций в гене фермента аргининосукцинат-лиазы (ASL), дефицит которого вызывает тяжелое нарушение цикла мочевины.

Результаты поразили даже авторов работы: варианты, которые в одиночку приводили к нулевой активности фермента, при совместном наличии в одном гене восстанавливали его работу до нормального уровня. По словам главного специалиста по ИИ Амарды Шеху, это тот редкий случай в биологии, когда «ноль плюс ноль дает сто».

Комментарии

Войдите через Telegram, чтобы оставить комментарий

Войти

Загрузка комментариев...

Следующий материал · 3 / 98

Morphe нашёл способ убрать рекламу в Prime Video на Android TV

Пользователи приложения Morphe создали патч, который убирает рекламу из Prime Video на устройствах Android TV. Разработчик сообщил, что в создании патча помогал ИИ Claude.

Редакция PUSK
Morphe нашёл способ убрать рекламу в Prime Video на Android TV

Пользователи приложения Morphe, ранее известного как альтернатива Revanced для YouTube, нашли способ убрать рекламу из Prime Video на устройствах Android TV. Сообщество Morphe, изначально создававшее патчи для YouTube и YouTube Music, расширило свою деятельность и теперь работает с другими стриминговыми сервисами. Новый патч для Prime Video был разработан одним из участников сообщества при значительной помощи искусственного интеллекта Claude.

Патч предназначен специально для версии приложения Prime Video, адаптированной под Android TV. Для использования патча пользователям необходимо скачать, пропатчить и вручную установить изменённую версию приложения Prime Video на свои телевизоры. Этот процесс требует определённых технических навыков, но позволяет получить доступ к контенту без рекламных вставок, даже без платной подписки.

Комментарии

Войдите через Telegram, чтобы оставить комментарий

Войти

Загрузка комментариев...

Реклама · Sponsored

Место для интеграции. Свяжитесь с редакцией, чтобы разместить креатив здесь.

Разместить →
Загружаем следующие материалы