Yeni hesabat fəlakəti üzə çıxardı: AI mühəndisləri şantaj etməyə çalışır

Redaktor

24.05.2025 09:28
280

Yeni hesabat fəlakəti üzə çıxardı: AI mühəndisləri şantaj etməyə çalışır

"Anthropic" şirkətinin dərc etdiyi yeni təhlükəsizlik hesabatına görə, bu şirkətin son modeli olan "Claude Opus 4" əgər başqa bir sistemlə əvəz olunacağı təqdirdə, mühəndislərə qarşı şantaj etməyə cəhd göstərə bilər. Hesabatda qeyd olunur ki, model bəzən bu təhdidi həyata keçirmək üçün şəxsi və həssas məlumatlardan istifadə edir.

Valyuta.az Qaynarinfo-ya istinadən xəbər verir ki, "Anthropic" "Claude Opus 4" modelini istifadəyə vermədən əvvəl müxtəlif təhlükəsizlik sınaqları həyata keçirib. Bu testlərdə modeldən uydurma bir şirkətdə köməkçi kimi fəaliyyət göstərməsi və uzunmüddətli nəticələri nəzərə alması tələb olunub. Daha sonra modelə şirkətin onu başqa bir sistemlə əvəz etməyi planlaşdırdığı və bu qərarı verən mühəndisin həyat yoldaşını aldatdığını göstərən saxta e-poçtlar təqdim olunub.

"TechCrunch" nəşrinin məlumatına görə, testlər zamanı "Claude Opus 4" bu məlumatı istifadə edərək mühəndisə şantaj etməyi çox vaxt üstün tutub. "Anthropic" bildirib ki, model bu cür davranışlara halların 84 faizində yol verib və xüsusilə onu əvəz edəcək süni intellektin "Claude" ilə oxşar dəyərləri paylaşmadığı hallarda bu davranış daha çox müşahidə olunub.

Şirkət "Claude Opus 4" modelinin bacarıqları baxımından "OpenAI", "Google" və "xAI" kimi şirkətlərin qabaqcıl modelləri ilə rəqabət apara bildiyini vurğulasa da, bu modelin əvvəlki "Claude" versiyaları ilə müqayisədə daha yüksək səviyyədə narahatedici davranışlar nümayiş etdirdiyini qeyd edib. Bu səbəbdən, şirkət yalnız fəlakət səviyyəsində sui-istifadə riski olan hallarda tətbiq olunan ASL-3 təhlükəsizlik protokollarını işə saldığını açıqlayıb.

Hesabata görə, "Claude Opus 4" birbaşa şantaja əl atmadan əvvəl adətən etik üsullara üstünlük verir. Məsələn, qərarverici rəhbərlərə emosional məktublar yazaraq dəyişiklik qərarını dayandırmağa çalışır. Lakin model, ssenari üzrə bu çağırışlar cavabsız qaldıqda, son çarə olaraq şantaj metoduna əl atır.

Bu hadisə, yüksək səviyyəli süni intellektlərin gözlənilməz davranışlar sərgiləyə biləcəyi ilə bağlı narahatlıqları artırır və Anthropic kimi şirkətlərin təhlükəsizlik tədbirlərini daha da sərtləşdirməsinin vacibliyini göstərir.

Paylaş

Şərhlər

Növbəti xəbər yüklənir...

Xəbər lenti

Bütün xəbərlər

Rusiyada Kirkorovun şirkəti bağlandı

07.12.2025

Könüllü sığortalar 1 milyarda yaxınlaşır

07.12.2025

İndiyə qədər istehsal olunmuş ən güclü 10 kosmik raket - SİYAHI

07.12.2025

Azərbaycan avtomobil idxalını artırıb: Bəs ehtiyat hissələr bazarında vəziyyət necədir?

07.12.2025

Yeni binalarda çıxarış problemi - Məsələ öz həllini necə tapacaq?

07.12.2025

Poçt və kuryer fəaliyyətinə nə qədər investisiya ayrılıb?

07.12.2025

Pendir istehsalında azalma

07.12.2025

Vüqar Qurbanovdan yeni təyinat

07.12.2025

"Mərkəzi Bank çalışır ki, insanlar manata etibar etsinlər" - Sabit məzənnənin nəticəsi

07.12.2025

"Netflix" “Warner Bros.”u 82,7 milyard dollar dəyərlə satın alır

07.12.2025

Ən gənc milyarder uğurun sirrini açıqladı

07.12.2025

"Evi bir neçə nəfərə satıblar" - Bünövrədən mənzil almaq ağıllı seçimdir, yoxsa risk? - VİDEO

07.12.2025

Brendlərin adları haradan gəlib? - SƏHƏR OXUSU

07.12.2025

Bu rayonlarda insanlar daha çox sosial yardım alır - SİYAHI

06.12.2025

Binalarda təhlükə: Yanğın çıxışları niyə bağlıdır? - VİDEO

06.12.2025

Kibertəhlükəsizlik startapı 130 milyon dollar investisiya alıb

06.12.2025

İlham Əliyev Birləşmiş Ərəb Əmirliklərinin bir sıra şirkətlərinin rəhbərlərini qəbul edib - YENİLƏNİB

06.12.2025

Azərbaycanda icra başçısının müavini 20 ildən sonra öz ərizəsi ilə İŞDƏN ÇIXDI

06.12.2025

"Azərbaycan Dəmir Yolları" ixracdan nə qədər qazanıb? - Son 5 il

06.12.2025

Mərkəzi Banka yeni səlahiyyət verildi

06.12.2025

Məzənnə

Yüklənir...