
Iminungkahi ng Anthropic ang mga bagong balangkas ng patakaran sa AI habang ang mga advanced na sistema ay nagkakaroon ng mas malakas na kakayahan.
Nais ng kumpanya na magtakda ang mga pamahalaan ng mga panuntunan para sa mga frontier model at ihanda ang mga manggagawa para sa epekto ng AI sa ekonomiya. Saklaw ng plano nito ang mga mapanganib na deployment, malayang pagsubok, cybersecurity, at pampublikong pagiging matatag.
Ipinakilala ng Anthropic ang dalawang panukala sa ilalim ng planong “Policy on the AI Exponential” nito. Nakatuon ang Advanced AI Framework sa mga makapangyarihang modelo, habang ang Economic Policy Framework ay tumatalakay sa mga manggagawa at ibinahaging benepisyong pinansyal. Ikinatwiran ng kumpanya na mas mabilis na gumagalaw ang AI kaysa sa kasalukuyang mga sistema ng paggawa ng patakaran. Sinabi rin nito na kailangan ng mga pamahalaan ng awtoridad upang harangan o pigilan ang mga mapanganib na deployment ng modelo.
Sa ilalim ng plano, ang mga sibil na parusa ay iuugnay sa pandaigdigang taunang kita. Ang paulit-ulit na paglabag ay magdudulot ng mas mataas na parusa, batay sa iminungkahing balangkas. Nanawagan din ang balangkas para sa mga frontier developer na subukan ang mga modelo bago ilabas. Maglalabas ang mga developer ng mga buod, balangkas ng kaligtasan, at mga system card para sa mga makapangyarihang sistema ng AI.
Susuriin ng mga independiyenteng evaluator ang mga pagsubok ng modelo at mga ulat sa panganib. Nais din ng Anthropic na panatilihin ng mga developer ang matitibay na programa sa seguridad para sa mga timbang ng modelo at mga sistema ng pagsasanay. Sinusuportahan ng panukala ang mga batas sa transparency sa mga estado tulad ng California at New York. Gayunpaman, iginiit ng kumpanya na ang pampublikong pagsisiwalat lamang ay hindi na tumutugma sa bilis ng pagbuo ng AI.
Ang mga iminungkahing panuntunan ay gagamitin lamang sa mga pinaka-advanced na sistema ng AI. Itinakda ng Anthropic ang limitasyon sa mga modelong sinanay sa itaas ng 10²⁵ floating-point operations. Sasaklawin din ng balangkas ang mga kumpanyang kumikita ng higit sa $500 milyon sa kita na nauugnay sa AI. Kasama rin dito ang mga kumpanyang gumagastos ng higit sa $1 bilyon sa pananaliksik at pagpapaunlad ng AI.
Pinangalanan ng Anthropic ang apat na pangunahing bahagi ng panganib sa panukala. Kabilang dito ang panganib sa biyolohiya, panganib sa cyber, pagkawala ng kontrol, at awtomatikong pananaliksik sa AI. Para sa panganib sa biyolohiya, binalaan ng kumpanya na ang mga hindi ligtas na sistema ay maaaring makatulong sa mga umaatake na bumuo ng nakakapinsalang virus. Nabanggit din nito na ang mga katulad na tool ng AI ay maaaring sumuporta sa pagtuklas ng gamot.
Para sa panganib sa cyber, ang mga frontier model ay maaaring makahanap ng malubhang depekto sa software sa malawakang sukat. Sinabi ng Anthropic na ang mga kakayahang iyon ay nagdudulot ng mga alalahanin para sa mga ospital, energy grid, at iba pang mahahalagang sistema. Itinampok din ng kumpanya ang mga panganib mula sa mga sistemang kumikilos sa labas ng kontrol ng developer. Ang awtomatikong pananaliksik sa AI ay maaaring magpataas ng mga panganib sa biyolohiya, cyber, at kontrol kung mabibigo ang mga pananggalang.
Nais ng Anthropic na maglathala ang mga frontier developer ng regular na mga ulat sa panganib. Ilalarawan ng mga ulat na ito ang pangkalahatang postura sa panganib at ang trabaho sa kaligtasan ng modelo ng developer. Nanawagan din ang balangkas para sa hindi bababa sa isang kwalipikadong independiyenteng evaluator. Susuriin ng evaluator na iyon ang mga pagsusuri ng kumpanya at ilalathala ang mga natuklasan sa mga ulat sa panganib ng modelo.
Magtatakda rin ang mga pamahalaan at industriya ng mga pamantayan para sa mga evaluator na iyon. Sinasabi ng panukala na kailangan ng mga evaluator ng pondo at access sa mga frontier model. Ang mga panuntunan sa seguridad ay bumubuo ng isa pang pangunahing bahagi ng balangkas. Poprotektahan ng mga developer ang kanilang buong kapaligiran sa pagbuo mula sa mga umaatake sa labas at mga banta mula sa loob.
Ilalarawan ng mga kumpanya ang kanilang mga programa sa seguridad sa publiko sa mataas na antas. Magbabahagi rin sila ng mas maraming detalye sa isang itinalagang ahensya ng gobyerno kapag hiniling. Sinabi ng Anthropic na maaaring magsimula ang mga gumagawa ng patakaran sa mas magaan na panuntunan at ayusin ang mga ito sa paglipas ng panahon. Sinasabi ng balangkas na ang regulasyon ay dapat sumunod sa mga kakayahan ng modelo at mga pamantayan sa pagsusuri.
Ang ikalawang bahagi ng balangkas ay nakatuon sa pampublikong pagiging matatag. Inirekomenda ng Anthropic ang mas matibay na pagpaplano para sa biyolohiya, cyber, at mga panganib sa AI na nauugnay sa kontrol. Para sa biyolohiya, kasama sa panukala ang screening ng synthesis ng gene at early-warning biosurveillance. Binanggit din nito ang mga stock ng proteksiyon na kagamitan at mga tool upang mabawasan ang paghahatid sa hangin.
Para sa cyber, nanawagan ang balangkas para sa mas matibay na software sa internet at suporta para sa mga operator ng kritikal na imprastraktura. Inirerekomenda din nito ang pagpapalit ng mga lumang sistema sa mahahalagang imprastraktura. Dapat ding subaybayan ng mga pamahalaan ang mga kakayahan ng frontier cyber sa pamamagitan ng isang dedikadong function. Iminungkahi ng Anthropic ang magkasanib na trabaho sa pagitan ng gobyerno at industriya sa mga pananggalang ng modelo.
Sinabi ng kumpanya na ang trabaho sa pagkawala ng kontrol at awtomatikong pananaliksik sa mga panganib ay nananatiling hindi gaanong binuo. Nanawagan ito para sa mas mahusay na mga tool upang makita, pigilin, o isara ang mga hindi ligtas na sistema. Hinimok ng Anthropic ang mga gumagawa ng patakaran na kumilos habang patuloy na bumubuti ang mga kakayahan ng modelo. Sinabi ng kumpanya na ang pamamahala ng AI ay dapat na sumabay sa teknolohiya.