Нова оцінка Британського інституту безпеки штучного інтелекту показує, що оновлена версія обмеженої ШІ-моделі "Mythos" від Anthropic значно покращила свою здатність виявляти та експлуатувати невідомі вразливості в програмному забезпеченні. Результати підсилюють побоювання, що темп розвитку наступальних кіберможливостей випереджає адаптацію захисних систем і політик контролю.
Прогрес випереджає очікування
У публікації в блозі під заголовком "Як швидко розвиваються автономні кібератакуючі можливості ШІ?" інститут повідомляє, що новіший чекпойнт моделі "Mythos Preview", отриманий після початкової квітневої оцінки, демонструє додатковий значний стрибок у ефективності.
При симульованій атаці на корпоративну мережу, що складається з 32 послідовних кроків, система успішно завершує сценарій у 6 з 10 спроб – порівняно з 3 з 10 під час попереднього тестування. В інституті підкреслюють, що "значні стрибки у можливостях не завжди потребують випуску цілком нових моделей – пізніші ітерації тієї ж системи можуть суттєво змінити наші оцінки".
Ці висновки доповнюють квітневу оцінку, згідно з якою "Mythos" стала першою ШІ-системою, яка самостійно виконує від початку до кінця симуляцію атаки на корпоративну мережу – завдання, на яке, за оцінкою інституту, досвідчений фахівець витратив би близько 20 годин роботи.
Зараз експерти підраховують, що провідні наступальні кіберможливості ШІ подвоюються приблизно кожні чотири місяці, тоді як до кінця 2025 року цей темп становив близько семи місяців.
Несанкціонований доступ і геополітичні амбіції
На тлі зростаючої потужності моделі зростають і питання, чи здатна Anthropic тримати її під контролем. У день квітневого анонсу "Mythos" група неавторизованих користувачів змогла отримати доступ до системи, скориставшись вразливістю в середовищі зовнішнього постачальника, повідомляє "Bloomberg".
Anthropic заявляє, що немає доказів того, що основні системи компанії були скомпрометовані, але інцидент підкреслює ризик того, що навіть обмежені моделі можуть вийти за межі, передбачені їхніми розробниками.
Паралельно з цим "The New York Times" інформує, що минулого місяця під час зустрічі в Сінгапурі, організованої в межах події "Carnegie Endowment for International Peace", представник китайського аналітичного центру звернувся до керівництва Anthropic із проханням надати Пекіну доступ до "Mythos". Компанія відмовила. За інформацією видання, співробітники Ради з національної безпеки США були поінформовані про розмову і відреагували з занепокоєнням.
Розрив між атакою і захистом
Нові дані інституту підкреслюють зростаючу асиметрію між наступальними та захисними застосуваннями ШІ. У квітні Anthropic запустила проєкт "Glasswing", через який надала обраним партнерам – включно з "Apple", "Microsoft", "Google", "Amazon" та "Nvidia" – ранній доступ до "Mythos" для використання в захисних цілях.
Дослідники з безпеки, однак, попереджають, що подібна модель фактично створює дворівневу систему: організації поза цим вузьким колом залишаються вразливими до потенціалу моделі, не маючи змоги скористатися її оборонними можливостями.
«Коли ця технологія стане широко доступною – а самі співробітники Anthropic говорять про горизонт від шести до вісімнадцяти місяців – організації, які й раніше відставали, не просто відстануть ще більше», – коментує Спенсер Вітман, директор із продуктів у компанії з ШІ-безпеки "Gray Swan", в інтерв'ю "Fortune". «Модель, на якій вони будували свої програми, просто перестане працювати».
Що далі: регулювання, етика та практичний захист
Швидкість, з якою "Mythos" покращує свої навички імітувати та автоматизувати складні кібератаки, ставить під питання готовність регуляторів і корпоративних систем безпеки реагувати вчасно. Виникають ключові дилеми: як обмежити доступ до подібних моделей, не блокуючи розвиток легітимних захисних додатків, і як гарантувати, що прориви, такі як неавторизований доступ через зовнішнього постачальника, не стануть каналом для злочинних або державних акторів.
Експерти попереджають, що вікно для підготовки обмежене. Якщо прогнози щодо масового поширення в межах року-півтора справдяться, організації, які не інвестують у сучасні системи кібербезпеки та в політики відповідального використання ШІ, ризикують не просто відстати, а стати легкою ціллю для нового покоління автоматизованих атак.