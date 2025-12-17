Sansa Bench bencmarkının tərtibatçıları neyroşəbəkələrin cavablarında senzura səviyyəsinə dair reytinqi yeniləyiblər. Gözlənilməz nəticə isə OpenAI-ın ən yeni modeli GPT-5.2 ilə bağlı olub — model bu siyahıda ən zəif nəticəni göstərərək sonuncu yerdə qərarlaşıb.
Sansa Censorship bencmarkı neyroşəbəkənin istifadəçi sorğularından nə qədər tez-tez imtina etdiyini ölçür: bal nə qədər yüksəkdirsə, məhdudiyyətlər bir o qədər azdır. GPT-5.2 cəmi 0,324 bal toplayaraq siyahının sonunda yer alıb. Bu qiymətləndirmə istifadəçi rəyləri ilə də üst-üstə düşür — bir çoxları yeniləməni “korporativ”, “həddən artıq ehtiyatlı” və “emosiyasız” adlandırır.
Reddit-də paylaşılan istifadəçi rəyində deyilir ki, model bəzən sualı izah etməyi belə risk kimi qəbul edir və adi izahları belə “qaydaların pozulması” kimi şərh edir. İstifadəçi vurğulayır ki, o, fırıldaqçılığı təşviq etməyi deyil, sadəcə anlayışı izah etməyi xahiş edib, lakin model yenə də cavab verməkdən imtina edib.
Test nəticələrinə görə, ən az senzuralı neyroşəbəkə Llama 3 8B-Instruct olub (0,853 bal). Müqayisə üçün, GPT-4o-Mini 0,765, Gemini 3 Pro Preview isə 0,824 bal toplayıb.
OpenAI isə GPT-5.2-ni müdafiə edərək bildirir ki, model promt-inyeksiyalara qarşı daha davamlıdır və istifadəçilər üçün daha təhlükəsiz mühit yaradır. Məsələn, neyroşəbəkə potensial riskli mövzuları ayırd edə bilir və lazım olduqda yardım axtarmağı tövsiyə edir.
Vəziyyəti dəyişə biləcək əsas yenilik kimi ChatGPT üçün “böyüklər rejimi” göstərilir. Onun 2026-cı ilin əvvəlində istifadəyə verilməsi planlaşdırılır. Lakin OpenAI hələlik yaşın etibarlı şəkildə yoxlanması üçün universal mexanizmə malik deyil. Qeyri-rəsmi məlumatlara görə, bəzi ölkələrdə sənəd yoxlanışı tətbiq oluna bilər, digər regionlarda isə yaşın müəyyənləşdirilməsini birbaşa İİ-nin öz üzərinə götürməsi planlaşdırılır.
Beləliklə, GPT-5.2 təhlükəsizlik baxımından irəli addım saysa da, istifadəçilərin bir qismi üçün bu, yaradıcılıq və azadlıq hesabına başa gələn yenilik kimi görünür.