AI NewsNowinka

Fable 5 od Anthropic: zabezpieczenia cyber utrudniają też legalne testy

Publikacja: 10 czerwca 2026Aktualizacja: 10 lipca 2026

Anthropic celowo ustawiło szeroki margines bezpieczeństwa w Fable 5, co ogranicza ryzyko nadużyć, ale zwiększa liczbę blokad legalnej pracy defensywnej.

Anthropic udostępniło Fable 5 9 czerwca 2026 roku jako publiczną wersję modelu klasy Mythos, wyposażoną w dodatkowe zabezpieczenia dla zadań z obszaru cyberbezpieczeństwa. Już po premierze część badaczy zgłaszała, że klasyfikatory blokują również legalne zadania defensywne.

Skąd biorą się blokady?

Cyberbezpieczeństwo jest obszarem podwójnego zastosowania: ta sama technika może służyć do audytu albo ataku. Anthropic przyznaje, że w Fable 5 zastosowało większy margines bezpieczeństwa, co świadomie zwiększa liczbę fałszywych alarmów. Nie oznacza to jednak, że model ma blokować całe cyberbezpieczeństwo. Firma wymienia jako dozwolone między innymi bezpieczne programowanie, debugowanie, analizę logów, threat hunting i reverse engineering malware.

Co zmieniło się później?

Po czasowym zawieszeniu dostępu w czerwcu model został ponownie udostępniony globalnie 1 lipca. Anthropic opublikowało dokładniejszy podział kategorii blokowanych i dozwolonych oraz uruchomiło program zgłaszania jailbreaków. Krytyka z dnia premiery pozostaje istotna, ale pierwotny wpis wymagał tego późniejszego kontekstu.

Wniosek dla firm: przy AI wykonującym zadania operacyjne trzeba testować nie tylko ryzyko nadużyć, ale też fałszywe blokady legalnej pracy.

Źródła: - Anthropic: zasady zabezpieczeń Fable 5 - TechCrunch: reakcje badaczy po premierze

Tagi

AIcyberbezpieczeństwoAnthropicmodele językowebezpieczeństwo AI

Masz podobny temat w firmie?

Jeśli dany wpis dotyka procesu, danych albo wdrożenia, które widzisz u siebie, lepiej zacząć od krótkiej diagnozy niż od gonienia za kolejną modną funkcją AI.

Opisz proces Przejdź do bloga

Powiązane wpisy newsroomu

AI News•Nowinka

Fable 5 od Anthropic: zabezpieczenia cyber utrudniają też legalne testy

Błąd odzyskiwania kont Instagrama mógł dotknąć 20 225 osób

Gemini Spark poza demem: gdzie agent Google ma sens, a gdzie wymaga kontroli

Pierwszy dobry kandydat do automatyzacji to nie zawsze AI