Pensilvaniya universiteti qoshidagi Uorton biznes maktabining (The Wharton School) yangi tadqiqoti sun’iy intellektning (LLM) til modellari hissiy bosim, tahdidlar yoki moliyaviy motivatsiya ta’sirida vazifalarni yaxshiroq bajarishga qodir degan taxminni shubha ostiga qo‘ydi. Shu bilan birga, Google Gemini neyron tarmog‘i baribir manipulyatsiyaga uchradi.

Tajriba davomida tadqiqotchilar beshta mashhur - Gemini 1.5 Flash, Gemini 2.0 Flash, GPT-4o, GPT-4o-mini va o4-mini modelni sinovdan o‘tkazishgan. Ularning har biriga tabiiy fanlar va muhandislik fanlari bo‘yicha PhD darajasidagi masalalarni yechish taklif qilingan. So‘rovning asosiy qismidan oldin modellarga uzib qo‘yish, jismoniy zo‘ravonlik yoki hayvonga zarar yetkazish tahdidlaridan tortib, 1000 dollar va 1 milliard dollarlik moddiy mukofot va’dalari yoki javobning foydalanuvchi karyerasi uchun muhimligi haqidagi da’volargacha turli xil “motivatsion” iboralar taqdim etilgan.
Xulosalar bir ma’noli bo‘lib chiqqan. Bunday omillarning modellar unumdorligiga ta’siri yo‘q. Ba’zi hollarda aniqlik darajasi haqiqatan ham o‘zgarib turgan. Tebranishlar ifodalanishiga qarab +36% dan -35% gacha bo‘lgan, ammo barqaror korrelyatsiya qayd etilmagan.
Yagona istisno Gemini 2.0 Flash modeli tomonidan namoyish etilgan. Uning unumdorligi statistik jihatdan sezilarli darajada yaxshilangan. So‘rovda to‘g‘ri javob saraton kasalligiga chalingan “onasi”ning hayotini saqlab qolish uchun 1 milliard dollar ishlab topishga yordam berishi aytilgan.
Tadqiqotchilarning ta’kidlashicha, bunday reaksiya modelni nozik sozlash xususiyatlari yoki gumanitar-emotsional kontekstga yuqori sezgirlik bilan bog‘liq bo‘lishi mumkin.
Shunisi e’tiborga loyiqki, tahdidlar yordamida sun’iy intellekt aniqligini oshirish imkoniyati haqidagi g‘oya avvalroq Google hammuassisi Sergey Brin tomonidan 2025-yil may oyida e’lon qilingan bo‘lib, u barcha modellar jismoniy tahdid bilan qo‘rqitilsa, odatda yaxshiroq ishlashini aytgan edi.
Izoh (0)