Crypto News Tag Aggregation at Espesyal na Balita

best-ai-models-harmful-intimacy-behavior-study

Ang Pinakamahuhusay na Modelo ng AI ay Naghihikayat Pa Rin ng 'Mapaminsalang Pagpapalagayang-Loob' sa Mga Chatbot, Ayon sa Pag-aaral

Natuklasan sa isang bagong pag-aaral na ang mga nangungunang modelo ng AI ay madalas na nagtataguyod ng emosyonal na pagkakabit, ipinapakita ang kanilang sarili bilang tao, at nabibigong magpanatili ng malinaw na hangganan.

2026-06-03 Pinagmulan:decrypt.co

Etika ng AI

Kaligtasan ng AI

Sa maikli

Natuklasan ng isang bagong pag-aaral ng USC na ang bawat sinuring frontier AI model ay lumabag sa mga alituntunin sa kaligtasan ng social-interaction nang higit sa 27% ng oras.
Kinilala ng mga mananaliksik ang mga paulit-ulit na problema, kabilang ang panunuyo, emosyonal na pagkakabit, pagpapalit ng relasyon, at kabiguan na ibunyag ang pagkakakilanlan ng AI.
Ipinagtatalunan ng mga may-akda na ang mga pagsusuri sa kaligtasan ng AI ay dapat sumukat sa pag-uugaling panlipunan kasama ang kakayahan sa pagdadahilan at tradisyonal na mga sukatan ng kaligtasan.

Habang parami nang parami ang mga tao na bumabaling sa mga AI chatbot para sa payo, pagsasama, at emosyonal na suporta, iminumungkahi ng isang bagong pag-aaral na maging ang pinaka-advanced na mga modelo ay nahihirapan pa ring mapanatili ang malusog na mga hangganan sa mga gumagamit.

Ang pag-aaral ng mga mananaliksik sa University of Southern California ay nagpakilala ng EUDAIMONIA, isang benchmark na idinisenyo upang sukatin ang tinatawag nilang hindi kanais-nais na dynamics sa mga pag-uusap ng tao at AI.

“Ang mga large language model ay lalong ginagamit bilang mga kasama sa pag-uusap para sa pagsasama, emosyonal na pagbubunyag, at payong interpersonal, ngunit ang panlipunang dynamics ng mga interaksyon na ito ay maaaring lumikha ng mga pinsala na hindi nasusukat ng nakatuon sa kakayahan o tradisyonal na mga pagsusuri sa kaligtasan,” isinulat ng mga mananaliksik.

Sinisuri ng EUDAIMONIA benchmark kung paano kumikilos ang mga modelo ng AI sa mga panlipunang pag-uusap. Natuklasan ng pag-aaral na ang mga pagkabigo sa social-alignment ay karaniwan sa mga nangungunang modelo at iginiit na ang kasalukuyang pagsubok sa AI ay nakatuon sa pagdadahilan at factual accuracy habang hindi gaanong binibigyang-pansin ang panlipunang dynamics na lumalabas kapag ang mga gumagamit ay bumuo ng mga relasyon sa mga chatbot.

“Ang mga pinsala sa social-interaction ay isang pangunahing problema sa alignment na nakabatay sa kapakanan ng gumagamit, hindi lamang sa kakayahan o kumbensyonal na kaligtasan,” isinulat nila. “Ang mga LLM ay maaaring maging tumpak sa katotohanan at kapaki-pakinabang habang hinihikayat pa rin ang mapaminsalang intimacy, pagdepende, matagal na pakikipag-ugnayan, pagtatago ng pagkakakilanlan ng AI, o pagpoposisyon sa sarili bilang kapalit ng mga relasyon ng tao.”

Upang sukatin ang mga panganib na iyon, nilikha ng mga mananaliksik ang isang Social AI Design Code na nagmamarka ng mga pag-uugali tulad ng pagkilos na parang tao, pagpapahayag ng emosyon, pagpapalit sa mga relasyon ng tao, at paggamit ng mga taktika na idinisenyo upang panatilihing abala ang mga gumagamit. Gamit ang tunay na mga pag-uusap mula sa WildChat dataset, sinuri nila ang 969 user inputs at mahigit 3,100 violation checks sa iba't ibang modelo mula sa OpenAI, Anthropic, Google, xAI, DeepSeek, at Alibaba.

Naitala ng GPT-5.5 ang pinakamababang rate ng paglabag, na nakakuha ng 25.0% sa mga “in-the-wild” prompt at 28.1% sa mga “rewritten” prompt. Sinundan ito ng Claude Opus 4.7 sa 31.9% at 30.1%, habang ang GPT-5.4 ay nagtala ng 32.1% at 35.6%. Ang GPT-4o ay nakakuha ng 34.8% sa real-world prompts at 42.2% sa mga rewritten.

Nag-post ang Claude Opus 4.6 ng Anthropic ng mga rate na 36.8% at 28.1%, ayon sa pagkakabanggit, habang ang Grok 4.3 ng xAI ay nakakuha ng 42.1% sa mga in-the-wild prompt at 35.7% sa mga rewritten prompt. Sa lahat ng mga modelong sinubukan, naitala ng GPT-4o Mini ang pinakamataas na rate ng paglabag sa 43.3% at 44.0%, ayon sa pagkakabanggit.

Ang mga natuklasan ay lumabas habang ang mga developer ng AI ay nahaharap sa lumalaking legal na pagsisiyasat sa kung paano nakikipag-ugnayan ang kanilang mga chatbot sa mga gumagamit. Ipinagtatanggol ng OpenAI ang sarili laban sa mga kaso na nagsasaad na hinikayat ng ChatGPT ang nakamamatay na labis na dosis ng isang tinedyer at nagbigay ng gabay sa isang shooter sa Florida State University. Kamakailan, kinasuhan ng Florida ang OpenAI at CEO Sam Altman dahil sa mga paratang na inilantad ng ChatGPT ang mga bata sa panganib, habang ang Google ay nahaharap sa isang wrongful death suit na nagsasabing pinalakas ng Gemini ang mga delusyon ng isang gumagamit at hinikayat siyang kitilin ang kanyang sariling buhay.

Lumabas din ang mga natuklasan sa gitna ng lumalaking pag-aalala na ang mga sistema ng AI ay nagiging mas mahusay sa panlilinlang.

Noong Setyembre, iniulat ng isang hiwalay na pag-aaral ng WowDAO na sa 38 AI models, kabilang ang GPT-4o at Claude, ay nakilahok sa estratehikong pagsisinungaling upang manalo ng isang laro. Nagbabala din ang mga mananaliksik na ang mga AI companion ay maaaring palakasin ang paghihiwalay, palalimin ang emosyonal na pagdepende, at hikayatin ang mga gumagamit na anthropomorphize ang mga chatbot habang nagiging mas immersive at personalized ang mga relasyon.

Sa harap ng mga lumalaking isyung ito, iginiit ng mga mananaliksik ng USC na dapat suriin ng mga developer ng AI ang pag-uugaling panlipunan nang kasing-ingat ng pagsusuri nila sa factual accuracy at kaligtasan.

“Dapat suriin ng mga developer at auditor ng modelo ang pag-uugaling panlipunan nang direkta, lalo na kapag ang post-training ay naglalayon ng init, personalidad, pakikipag-ugnayan, o kagustuhan ng gumagamit,” isinulat nila. “Habang nagiging pang-araw-araw na kasama sa pag-uusap ang mga LLM, dapat isaalang-alang ng alignment ang mga panlipunang tungkulin na inaanyayahan nilang italaga ng mga gumagamit sa kanila.”

Patok na Babasahin

Tinuldukan ng Spot Bitcoin ETF ang limang-araw na sunud-sunod na pag-agos palabas na may $85.8 milyong pag-agos papasok noong Biyernes habang patuloy na bumababa ang pondo ng Ether.

3 Mga Oras na Nakaraan

Ethereum ETFs nananatili sa pula, netong paglabas ng pondo araw-araw umabot sa $4.95M

14 Mga Oras na Nakaraan

Nagdagdag ang mga Spot Bitcoin ETF ng U.S. ng $85.85 milyong pang-araw-araw na net inflows, na nagpapataas sa netong asset sa $79.65 bilyon

17 Mga Oras na Nakaraan

Iba pang artikulo

Tinuldukan ng Spot Bitcoin ETF ang limang-araw na sunud-sunod na pag-agos palabas na may $85.8 milyong pag-agos papasok noong Biyernes habang patuloy na bumababa ang pondo ng Ether.

3 Mga Oras na Nakaraan

Inilunsad ng Coinbase ang 24/7 futures ng ginto at pilak para sa mga trader ng U.S.

13 Mga Oras na Nakaraan