Пенсилвания университети қошидаги Уортон бизнес мактабининг (Тhе Wharton School) янги тадқиқоти сунъий интеллектнинг (LLM) тил моделлари ҳиссий босим, таҳдидлар ёки молиявий мотивация таъсирида вазифаларни яхшироқ бажаришга қодир деган тахминни шубҳа остига қўйди. Шу билан бирга, Google Gemini нейрон тармоғи барибир манипуляцияга учради.

Тажриба давомида тадқиқотчилар бешта машҳур - Gemini 1.5 Flash, Gemini 2.0 Flash, GPT-4о, GPT-4о-мини ва о4-мини моделни синовдан ўтказишган. Уларнинг ҳар бирига табиий фанлар ва муҳандислик фанлари бўйича PhD даражасидаги масалаларни ечиш таклиф қилинган. Сўровнинг асосий қисмидан олдин моделларга узиб қўйиш, жисмоний зўравонлик ёки ҳайвонга зарар етказиш таҳдидларидан тортиб, 1000 доллар ва 1 миллиард долларлик моддий мукофот ваъдалари ёки жавобнинг фойдаланувчи карьераси учун муҳимлиги ҳақидаги даъволаргача турли хил “мотивацион” иборалар тақдим этилган.
Хулосалар бир маъноли бўлиб чиққан. Бундай омилларнинг моделлар унумдорлигига таъсири йўқ. Баъзи ҳолларда аниқлик даражаси ҳақиқатан ҳам ўзгариб турган. Тебранишлар ифодаланишига қараб +36% дан -35% гача бўлган, аммо барқарор корреляция қайд этилмаган.
Ягона истисно Gemini 2.0 Flash модели томонидан намойиш этилган. Унинг унумдорлиги статистик жиҳатдан сезиларли даражада яхшиланган. Сўровда тўғри жавоб саратон касаллигига чалинган “онаси”нинг ҳаётини сақлаб қолиш учун 1 миллиард доллар ишлаб топишга ёрдам бериши айтилган.
Тадқиқотчиларнинг таъкидлашича, бундай реакция моделни нозик созлаш хусусиятлари ёки гуманитар-эмоционал контекстга юқори сезгирлик билан боғлиқ бўлиши мумкин.
Шуниси эътиборга лойиқки, таҳдидлар ёрдамида сунъий интеллект аниқлигини ошириш имконияти ҳақидаги ғоя аввалроқ Google ҳаммуассиси Сергей Брин томонидан 2025 йил май ойида эълон қилинган бўлиб, у барча моделлар жисмоний таҳдид билан қўрқитилса, одатда яхшироқ ишлашини айтган эди.
Изоҳ (0)