
Naglagay ang Anthropic ng humigit-kumulang anim na inhinyero sa loob ng National Security Agency (NSA) upang tumulong sa pag-deploy ng Mythos—ang pinaka-mahusay nitong AI model—para sa opensibong operasyon sa cyber, ayon sa ulat ng Financial Times nitong Huwebes.
Ang mga inhinyero ay 'forward-deployed staff' na nag-aakma sa modelo para sa mga partikular na aplikasyon. Sinabi ng isang source sa FT na maaari itong maging kapaki-pakinabang para sa pagpasok sa mga network sa mga bansa tulad ng China at Iran.
Hindi pa kumpirmado kung ang mga inhinyerong iyon ay kasama sa aktibong operasyon. Ang kumpirmado ay: Ang Mythos ang parehong modelo na tinanggihan ng Anthropic na ilabas sa publiko, dahil sa panganib ng maling paggamit. Nilimitahan ito ng kumpanya sa mga naberipikang partner sa pamamagitan ng Project Glasswing—isang limitadong koalisyon na kinabibilangan ng Microsoft, Apple, at Amazon.
Kinakasuhan din ng Anthropic ang Pentagon. Sa huling bahagi ng Pebrero, itinalaga ni Defense Secretary Pete Hegseth ang kumpanya bilang isang 'supply-chain risk'—isang label na karaniwang inilalaan para sa mga dayuhang kalaban tulad ng Huawei—matapos mabuwag ang isang $200 milyong kontrata. Ang pangunahing isyu: Tumanggi ang Anthropic na ipagamit sa DoD ang Claude para sa ganap na autonomous na sandata o domestic mass surveillance. Exempted sa pagbabawal na iyon ang kontrata ng NSA.
Isang hukom sa California ang humarang sa 'blacklisting' bilang isang maliwanag na paghihiganti sa Unang Susog. Tinanggihan ng isang appeals court sa D.C. ang hiling ng Anthropic na pigilan ito habang nagpapatuloy ang kaso. Patuloy na ginamit ng NSA ang Mythos sa buong panahong iyon, ayon sa ulat ng FT.
Paano pigilan ang AI na gumagawa ng AI
Sa parehong araw na lumabas ang kwento tungkol sa NSA, inilathala ng internal research institute ng Anthropic ang "When AI Builds Itself," na nagpapakita kung gaano na kalayo ang narating ng Claude sa pag-automate ng sarili nitong pag-develop. Dito, ipinaglalaban ng kumpanya ang isang global moratorium sa AI arms race—at inihalintulad pa ito sa mga nuclear treaty noong Cold War sa pagitan ng Estados Unidos at Russia.
Para maunawaan kung bakit, ibinigay ng kumpanya ang kaunting konteksto na ito:
Ngayon, isinusulat na ng Claude ang higit sa 80% ng code na pinagsama sa production codebase ng Anthropic—tumaas mula sa mababang 'single digits' bago inilunsad ang Claude Code noong unang bahagi ng 2025. Naglalabas ang mga inhinyero ng humigit-kumulang walong beses na mas maraming code bawat araw kaysa noong 2024.
Ang mga may-akda ng ulat—si Marina Favaro, pinuno ng Anthropic Institute, at co-founder Jack Clark—ay nangangatuwirang patungo ang trajectory na ito sa tinatawag nilang 'recursive self-improvement': mga AI system na autonomously nagdidisenyo, gumagawa, at nagsasanay ng sarili nilang mga kahalili, na may bumababang papel ang mga tao sa bawat hakbang.
Sa isang visual na representasyon, ipinapakita ng mga mananaliksik ang isang timeline kung saan ang unang paraan ng paggamit ng AI sa trabaho ay ang mga tao na nagbibigay ng 'prompt' sa computer upang makakuha ng resulta, na may dumaraming awtomasyon na nagtatapos sa AI Agents na nagbibigay ng 'prompt' sa mga 'subagents' hanggang sa makamit ang resulta, nang walang anumang partisipasyon ng tao.
Ang pinakamatinding data point na kanilang binanggit: Noong Abril, binigyan ang Claude agents ng isang bukas na problema sa AI safety—kung ang isang mas mahinang modelo ay mapagkakatiwalaang makapagsubaybay sa isang mas malakas—at hinayaan itong tumakbo. Dalawang mananaliksik na tao, sa loob ng humigit-kumulang isang linggo, ay nakabawi ng 23% ng pagkakaiba sa performance sa pagitan ng mga modelo. Ang mga agents ay nakabawi ng 97%, sa loob ng mahigit 800 cumulative compute hours. Itinakda ng mga tao ang tanong. Dinisenyo ng mga agents ang bawat eksperimento. Ito ang unang inilathalang kaso ng Claude na nagpapamalas ng research judgment, hindi lang basta isinasagawa ang mga gawain na tinukoy ng iba.
Iyan ang linyang kinababahala ng Anthropic na malampasan. Kapag pinili na ng AI kung aling mga eksperimento ang dapat patakbuhin—hindi lang basta pinapatakbo ang mga ito—mawawala na sa mga tao ang huling makabuluhang papel sa proseso ng pagbuo. Ang maliliit na 'misalignments' na nakikita sa mga modelo ngayon ay maaaring lumala sa iba't ibang henerasyon ng 'self-improvement' hanggang sa wala nang makapagwasto sa mga ito.
Ang kanilang iminungkahing solusyon ay isang nabe-beripikang 'global pause'—maraming 'frontier labs' ang sabay-sabay na titigil, na may independiyenteng beripikasyon na talagang huminto ang lahat. Sinabi ng Anthropic na sasali sila. Inamin nila na ang isang 'unilateral slowdown' ay ibibigay lamang ang pamumuno sa sinumang nagpatuloy.
Nakita na natin ang pelikulang ito. Ang mga lab na bumubuo ng AI ay siya ring nagbabala kung gaano kapanganib ang AI. Gayunpaman, ang AI ang pinakapakinabang na negosyo ng dekada, kaya walang gustong huminto—kahit pa ang mga nagbabala tungkol sa AI.
Noong 2023, mahigit isang daang malalaking pangalan sa komunidad ng pananaliksik sa AI ang pumirma sa isang bukas na liham na nananawagan para sa isang pandaigdigang pagsisikap na bawasan ang panganib ng pagkalipol na likas sa pagpapaunlad ng AI. Ilang buwan bago iyon, isa pang bukas na liham ang humiling na ipahinto ng OpenAI ang mga pag-unlad sa ChatGPT dahil sa mapanganib nitong kalikasan.
Walang huminto pagkatapos ng bukas na liham noong 2023. Hindi huminto ang OpenAI. Hindi rin huminto ang Anthropic. Ang deadline ng Pentagon upang tanggalin ang Claude mula sa mga sistema nito ay sa Agosto, halos kasabay ng inaasahang paglipat ng pananalapi ng Anthropic sa pampublikong paningin dahil sa IPO nito.