Weekly AI Brief #003 | DataScienceMart.in

Dwa komunikaty prasowe. Jeden tydzień. Jeden mówił: “Nasz nowy model jest już dostępny dla wszystkich.” Drugi: “Nasz mocniejszy model nie będzie dostępny, ponieważ ryzyko dzielenia się nim jest zbyt duże”

Oba od tej samej firmy - Anthropic - w odstępie niecałych dwóch tygodni.

Zapraszam do najciekawszych wiadomości 17 tygodnia 2026 roku.

1. Claude Opus 4.7 - nowy flagowy model Anthropic

16 kwietnia Anthropic wydało Claude Opus 4.7. Na benchmarku SWE-bench Verified wynik skoczył z 80,8% do 87,6%, a rozdzielczość obsługiwanych obrazów wzrosła trzykrotnie.

Nowością jest mechanizm task budgets: model dostaje z góry określony budżet na wykonanie zadania i samodzielnie weryfikuje własne wyniki przed zakończeniem. To krok w stronę AI, które zarządza własną pracą - nie tylko wykonuje polecenia.

Cena bez zmian: $5 za milion tokenów input, $25 za milion output.

2. Mythos Preview - model, którego Anthropic postanowiło nie wydać

7 kwietnia Anthropic ogłosiło coś bezprecedensowego: zbudowało swój najpotężniejszy model - Claude Mythos Preview - i odmówiło jego publicznego wydania.

Powód: podczas testów bezpieczeństwa model wykazał zdolności cybernetyczne przekraczające wewnętrzne progi protokołu ASL-3. Innymi słowy - Anthropic uznało, że model w złych rękach stanowiłby realne zagrożenie.

Zamiast publicznego release powstał Project Glasswing - zamknięta koalicja ponad 40 firm (Apple, Google, Microsoft, Amazon, CrowdStrike, NVIDIA) z dostępem do modelu wyłącznie dla celów obronnych. Brytyjski organ ds. bezpieczeństwa AI - AISI - opublikował własną ocenę potwierdzającą wagę tej decyzji.

3. Robot pobił ludzki rekord świata w półmaratonie

19 kwietnia w Pekinie robot “Lightning” firmy Honor ukończył półmaraton w 50 minut i 26 sekund. Ludzki rekord świata - należący do Jacoba Kiplimo - wynosi 57 minut i 20 sekund. Robot pobił go o prawie 7 minut.

Rok temu najlepszy robot kończył tę samą trasę w 2 godziny i 40 minut. To poprawa o 3,5-krotność w ciągu jednego roku. W zawodach wzięło udział ponad 300 robotów reprezentujących ponad 100 zespołów.

Tempo tej poprawy jest trudne do racjonalizacji. Rok to w fizyce robotyki bardzo mało czasu.

4. Chiny: roboty w fabrykach. USA: roboty w prezentacjach.

CNBC (21 kwietnia) zestawiło dwie strony wyścigu o humanoidalne roboty. Chińskie startupy już wdrażają je komercyjnie - w fabrykach, magazynach i galeriach. AI2 Robotics osiągnął wycenę 2,93 mld USD przy realnych wdrożeniach produkcyjnych.

Ich amerykańskie odpowiedniki mają wyższe wyceny i więcej presji VC - ale pozostają w fazie R&D. Pytanie, która strategia wygra, rozstrzygnie rynek - nie benchmarki.

5. TurboQuant - Google atakuje wąskie gardło dużych modeli

Na konferencji ICLR 2026 Google zaprezentowało TurboQuant - technikę kompresji KV cache, jednego z głównych ograniczników szybkości i kosztu modeli z długim kontekstem.

W skrócie: modele “pamiętające” długie rozmowy lub duże dokumenty potrzebują dużo pamięci GPU. TurboQuant ogranicza ten problem, co przekłada się na szybsze odpowiedzi i niższe koszty - szczególnie dla firm obsługujących umowy, bazy wiedzy, duże archiwa.

6. Perspektywa tygodnia: kto decyduje, które AI jest zbyt niebezpieczne?

Wróćmy do Mythos. Ta historia to nie tylko ciekawostka techniczna - to precedens, który będzie miał konsekwencje.

Anthropic samodzielnie oceniło model, samodzielnie zdecydowało o nieudostępnieniu go, samodzielnie wybrało 40 firm z dostępem i ogłosiło to jako gotowe rozwiązanie.

Anthropic prawdopodobnie zrobiło właściwą rzecz - ale zrobiło ją w próżni instytucjonalnej. Co się stanie, kiedy następne laboratorium stanie przed podobnym wyborem i zdecyduje inaczej? EU AI Act za cztery miesiące wejdzie w życie dla systemów wysokiego ryzyka - ale Mythos nie mieści się w żadnej z jego kategorii. Regulacje jeszcze nie mają na to nazwy.

To pytanie, które wróci przy każdym kolejnym modelu frontier. Lepiej zacząć na nie odpowiadać zanim ktoś inny odpowie za nas.

Marcin Szaroszyk 23.04.2026

Źródła

Claude Opus 4.7 - oficjalny release: https://www.anthropic.com/news/claude-opus-4-7
Claude Opus 4.7 - GitHub Changelog (16 IV 2026): https://github.blog/changelog/2026-04-16-claude-opus-4-7-is-generally-available/
Claude Mythos Preview - Foreign Policy (20 IV 2026): https://foreignpolicy.com/2026/04/20/claude-mythos-preview-anthropic-project-glasswing-cybersecurity-ai-hacking-danger/
Claude Mythos Preview - AISI.gov.uk: https://www.aisi.gov.uk/blog/our-evaluation-of-claude-mythos-previews-cyber-capabilities
Claude Mythos vs Opus 4.7 - CNBC: https://www.cnbc.com/2026/04/16/anthropic-claude-opus-4-7-model-mythos.html
Robot półmaraton Pekin - CNN (19 IV 2026): https://edition.cnn.com/2026/04/19/china/china-robot-half-marathon-intl-hnk
Robot półmaraton - TechCrunch: https://techcrunch.com/2026/04/19/robots-beat-human-records-at-beijing-half-marathon/
Chiny vs USA humanoidalne roboty - CNBC (21 IV 2026): https://www.cnbc.com/2026/04/21/china-humanoid-robots-us-investors.html
TurboQuant - Google: https://research.google/blog/turboquant-redefining-ai-efficiency-with-extreme-compression/