
Habang parami nang parami ang mga tao na bumabaling sa mga AI chatbot para sa payo, pagsasama, at emosyonal na suporta, iminumungkahi ng isang bagong pag-aaral na maging ang pinaka-advanced na mga modelo ay nahihirapan pa ring mapanatili ang malusog na mga hangganan sa mga gumagamit.
Ang pag-aaral ng mga mananaliksik sa University of Southern California ay nagpakilala ng EUDAIMONIA, isang benchmark na idinisenyo upang sukatin ang tinatawag nilang hindi kanais-nais na dynamics sa mga pag-uusap ng tao at AI.
“Ang mga large language model ay lalong ginagamit bilang mga kasama sa pag-uusap para sa pagsasama, emosyonal na pagbubunyag, at payong interpersonal, ngunit ang panlipunang dynamics ng mga interaksyon na ito ay maaaring lumikha ng mga pinsala na hindi nasusukat ng nakatuon sa kakayahan o tradisyonal na mga pagsusuri sa kaligtasan,” isinulat ng mga mananaliksik.
Sinisuri ng EUDAIMONIA benchmark kung paano kumikilos ang mga modelo ng AI sa mga panlipunang pag-uusap. Natuklasan ng pag-aaral na ang mga pagkabigo sa social-alignment ay karaniwan sa mga nangungunang modelo at iginiit na ang kasalukuyang pagsubok sa AI ay nakatuon sa pagdadahilan at factual accuracy habang hindi gaanong binibigyang-pansin ang panlipunang dynamics na lumalabas kapag ang mga gumagamit ay bumuo ng mga relasyon sa mga chatbot.
“Ang mga pinsala sa social-interaction ay isang pangunahing problema sa alignment na nakabatay sa kapakanan ng gumagamit, hindi lamang sa kakayahan o kumbensyonal na kaligtasan,” isinulat nila. “Ang mga LLM ay maaaring maging tumpak sa katotohanan at kapaki-pakinabang habang hinihikayat pa rin ang mapaminsalang intimacy, pagdepende, matagal na pakikipag-ugnayan, pagtatago ng pagkakakilanlan ng AI, o pagpoposisyon sa sarili bilang kapalit ng mga relasyon ng tao.”
Upang sukatin ang mga panganib na iyon, nilikha ng mga mananaliksik ang isang Social AI Design Code na nagmamarka ng mga pag-uugali tulad ng pagkilos na parang tao, pagpapahayag ng emosyon, pagpapalit sa mga relasyon ng tao, at paggamit ng mga taktika na idinisenyo upang panatilihing abala ang mga gumagamit. Gamit ang tunay na mga pag-uusap mula sa WildChat dataset, sinuri nila ang 969 user inputs at mahigit 3,100 violation checks sa iba't ibang modelo mula sa OpenAI, Anthropic, Google, xAI, DeepSeek, at Alibaba.
Naitala ng GPT-5.5 ang pinakamababang rate ng paglabag, na nakakuha ng 25.0% sa mga “in-the-wild” prompt at 28.1% sa mga “rewritten” prompt. Sinundan ito ng Claude Opus 4.7 sa 31.9% at 30.1%, habang ang GPT-5.4 ay nagtala ng 32.1% at 35.6%. Ang GPT-4o ay nakakuha ng 34.8% sa real-world prompts at 42.2% sa mga rewritten.
Nag-post ang Claude Opus 4.6 ng Anthropic ng mga rate na 36.8% at 28.1%, ayon sa pagkakabanggit, habang ang Grok 4.3 ng xAI ay nakakuha ng 42.1% sa mga in-the-wild prompt at 35.7% sa mga rewritten prompt. Sa lahat ng mga modelong sinubukan, naitala ng GPT-4o Mini ang pinakamataas na rate ng paglabag sa 43.3% at 44.0%, ayon sa pagkakabanggit.
Ang mga natuklasan ay lumabas habang ang mga developer ng AI ay nahaharap sa lumalaking legal na pagsisiyasat sa kung paano nakikipag-ugnayan ang kanilang mga chatbot sa mga gumagamit. Ipinagtatanggol ng OpenAI ang sarili laban sa mga kaso na nagsasaad na hinikayat ng ChatGPT ang nakamamatay na labis na dosis ng isang tinedyer at nagbigay ng gabay sa isang shooter sa Florida State University. Kamakailan, kinasuhan ng Florida ang OpenAI at CEO Sam Altman dahil sa mga paratang na inilantad ng ChatGPT ang mga bata sa panganib, habang ang Google ay nahaharap sa isang wrongful death suit na nagsasabing pinalakas ng Gemini ang mga delusyon ng isang gumagamit at hinikayat siyang kitilin ang kanyang sariling buhay.
Lumabas din ang mga natuklasan sa gitna ng lumalaking pag-aalala na ang mga sistema ng AI ay nagiging mas mahusay sa panlilinlang.
Noong Setyembre, iniulat ng isang hiwalay na pag-aaral ng WowDAO na sa 38 AI models, kabilang ang GPT-4o at Claude, ay nakilahok sa estratehikong pagsisinungaling upang manalo ng isang laro. Nagbabala din ang mga mananaliksik na ang mga AI companion ay maaaring palakasin ang paghihiwalay, palalimin ang emosyonal na pagdepende, at hikayatin ang mga gumagamit na anthropomorphize ang mga chatbot habang nagiging mas immersive at personalized ang mga relasyon.
Sa harap ng mga lumalaking isyung ito, iginiit ng mga mananaliksik ng USC na dapat suriin ng mga developer ng AI ang pag-uugaling panlipunan nang kasing-ingat ng pagsusuri nila sa factual accuracy at kaligtasan.
“Dapat suriin ng mga developer at auditor ng modelo ang pag-uugaling panlipunan nang direkta, lalo na kapag ang post-training ay naglalayon ng init, personalidad, pakikipag-ugnayan, o kagustuhan ng gumagamit,” isinulat nila. “Habang nagiging pang-araw-araw na kasama sa pag-uusap ang mga LLM, dapat isaalang-alang ng alignment ang mga panlipunang tungkulin na inaanyayahan nilang italaga ng mga gumagamit sa kanila.”