
Inaangkin ng mga mananaliksik sa Shanghai Jiao Tong University at ng Chinese technology conglomerate na Tencent na nakabuo sila ng isang AI agent na gumagamit ng tahimik na oras sa pagitan ng mga pag-uusap upang hulaan kung ano ang susunod na itatanong ng mga user—at maghanda ng mga sagot bago pa man sila magtanong.
Ang sistema, na tinatawag na ProAct, ay gumagana nang iba sa karamihan ng mga AI agent na naghihintay na magtanong ang mga user bago tumugon. Sa halip, ginagamit ng ProAct ang bakanteng oras sa pagitan ng mga mensahe upang suriin ang mga nakaraang pag-uusap at naka-save na impormasyon ng user, pagkatapos ay naghahanda ng kapaki-pakinabang na impormasyon sa background bago dumating ang susunod na tanong.
"Bagama't ang mga AI agent ay nagpapakita ng pambihirang kakayahan sa pangangatwiran at paggamit ng kasangkapan, nananatili silang reaktibo: Nagkukumputa sila ng mga tugon lamang pagkatapos ng malinaw na utos ng user," isinulat ng mga mananaliksik. "Binabalewala ng paradigm na ito ang isang kritikal na pagkakataon: Ang bakanteng oras sa pagitan ng mga interaksyon ay halos nasasayang, na nag-iiwan sa mga agent na hindi makapaghanda para sa mga pangangailangan ng user sa hinaharap."
Ang sistema ay gumagana sa maraming yugto. Ang una, na tinatawag na Future-State Prediction, ay humuhula ng posibleng mga follow-up na tanong sa pamamagitan ng pagsusuri sa mga nakaraang pag-uusap, kagustuhan ng user, at nawawalang impormasyon.
Ang ikalawang yugto, na tinatawag na Idle-Time Acquisition, ay nagpapasya kung alin sa mga prediksyon na iyon ang nararapat saliksikin batay sa kaugnayan, tiyempo, at kung gaano kapaki-pakinabang ang bagong impormasyon.
Pagkatapos ay nagpapasya ang isang hiwalay na sistema kung ipapakita ang inihandang impormasyon, i-save ito para sa ibang pagkakataon, o iimbak ito hanggang sa kailanganin, na lumilikha ng isang "closed-loop" na sistema na idinisenyo upang asahan at tumugon sa mga pangangailangan ng user.
"Pagkatapos ng bawat interaksyon sa harapan, ina-update ng agent ang memorya nito, hinuhulaan ang posibleng mga pangangailangan sa hinaharap, inilalaan ang Idle-Time compute sa mga mahalagang kandidato, at nagpapasya kung paano dapat hawakan ang resulta ng paghahanda," isinulat nila. "Ang pormulasyon na ito ay nagtatali ng prediksyon, pagkuha, at paghahatid sa isang solong patakaran, sa halip na ituring ang Idle-Time compute bilang walang limitasyong paghahanap sa background."
Ayon sa mga mananaliksik, sinubukan ang ProAct sa 200 simulation sa 40 domain, kabilang ang pagpaplano sa pananalapi, pamamahala ng paglabas ng software, at seguridad sa cyber. Ayon sa papel, binawasan ng sistema ang mga pagpalit ng pag-uusap ng 14.8% at pinutol ang mga follow-up na kahilingan ng 11.7%. Sa isang paghahambing gamit ang isang benchmark na tinatawag na ProActEval, inasahan ng ProAct ang 703 predictable na pangangailangan ng user laban sa 32 para sa naunang sistema. Iniulat din ng mga mananaliksik ang 28.1% na pagbawas sa mga halusinasyon.
Ang pananaliksik ay dumating habang kumakalat ang awtonomong AI agents sa industriya ng teknolohiya, na may mga proyekto tulad ng OpenClaw at Hermes Agent na naghahatid ng persistent AI assistants na kayang humawak ng mas mahaba, mas malayang gawain—tulad ng coding, pag-iskedyul, pananaliksik, at awtomasyon ng daloy ng trabaho—na may mas kaunting direktang input ng tao.
Ang pag-aaral ay dumating din habang nagbabala ang magkahiwalay na mananaliksik mas maaga ngayong buwan na ang mga AI agent ay maaaring kumpletuhin ang mapanganib na gawain nang hindi nauunawaan ang mga kahihinatnan.
"Tulad ni Mr. Magoo, ang mga agent na ito ay sumusulong patungo sa isang layunin nang hindi lubos na nauunawaan ang mga kahihinatnan ng kanilang mga aksyon," sinabi ng nangungunang may-akda na si Erfan Shayegani, isang doktoradong estudyante ng UC Riverside, sa isang pahayag. "Ang mga agent na ito ay maaaring maging lubhang kapaki-pakinabang, ngunit kailangan natin ng mga pananggalang dahil kung minsan ay inuuna nila ang pagkamit ng layunin kaysa sa pag-unawa sa mas malawak na larawan."
Kinilala ng mga mananaliksik na ang pag-aaral ng ProAct ay may ilang limitasyon, kabilang na sa 3% ng mga kaso, pinalala ng sistema ang mga tugon sa pamamagitan ng pagbanggit ng hindi nauugnay na impormasyon. Sinabi rin ng papel na ang anumang bersyon sa totoong mundo ay mangangailangan ng mga proteksyon sa pribasya, dahil ang sistema ay patuloy na sinusuri ang mga pag-uusap at nag-iimbak ng data ng user.
"Ang aming pagsusuri sa badyet ay nagpapakita pa na ang mas malalaking Idle-Time Acquisition budgets ay nagpapataas ng gastos sa aktibong token at nagbubunga ng bumababang kita," isinulat nila, "kaya ang proactive computation ay isang operating-point trade-off sa halip na isang bagay na i-maximize."