پژوهشگران دانشگاه روتجرز و کالج سنت اولاف ایالات متحده امریکا در پژوهشی که نتایج آن به تازگی منتشر شده است به بررسی مکانیزمهای زیربنایی یادگیری تقویت در سنین مختلف پرداختند.
???روش پژوهش
در این پژوهش آزمایشی مقایسهای ۲۵۲ داوطلب از سنین ۱۸ تا ۸۹ سال شرکت نمودند. ارزیابی یادگیری و حافظه توسط نرم افزار کامپیوتری صورت گرفت. آزمون پلیمرفیزم DNA بر اساس بزاق دهان داوطلبان، بلافاصله پس از اجرای فاز آزمایشی انجام شد.
???نتایج نشان دادند:
- یادگیری به هر دو شیوه بازخورد مثبت و منفی با افزایش سن کاهش مییابد، اما سازوکارهای متفاوتی دارد.
- حین یادگیری از بازخوردن منفی، سالمندان بدلیل اضافه بار تصمیمگیری کندتر میشوند.
- حین یادگیری از بازخورد مثبت، سالمندان بدلیل تمایل به اتخاذ راه حل غیربهینه، بدلیل عدم تعادل در یادگیری از خطاهای پیشبینی مثبت و منفی، کندتر عمل میکنند.
- عدم تعادل در یادگیری مثبت در سالمندی ناشی از پلیمرفیزم در ژن DARPP-32 است و متفاوت از سازوکارهایی است که قبلاً به پارکینسون نسبت داده شده بود.
- این عدم تعادل در یادگیری مثبت در سالمندی در تکالیف انتخاب احتمالی نیز نقش دارد که قبلاً به اشتباه به سازوکارهای پارکینسنی نسبت داده شده بود.
Age affects reinforcement learning through dopamine-based learning imbalance and high decision noise—not through Parkinsonian mechanisms
Abstract
Probabilistic reinforcement learning declines in healthy cognitive aging. While some findings suggest impairments are especially conspicuous in learning from rewards, resembling deficits in Parkinson’s disease, others also show impairments in learning from punishments.
To reconcile these findings, we tested 252 adults from 3 age groups on a probabilistic reinforcement learning task, analyzed trial-by-trial performance with a Q-reinforcement learning model, and correlated both fitted model parameters and behavior to polymorphisms in dopamine-related genes.
Analyses revealed that learning from both positive and negative feedback declines with age but through different mechanisms:
- when learning from negative feedback, older adults were slower due to noisy decision-making.
- when learning from positive feedback, they tended to settle for a nonoptimal solution due to an imbalance in learning from positive and negative prediction errors.
The imbalance was associated with polymorphisms in the DARPP-32 gene and appeared to arise from mechanisms different from those previously attributed to Parkinson’s disease.
Moreover, this imbalance predicted previous findings on aging using the Probabilistic Selection Task, which were misattributed to Parkinsonian mechanisms.
Keywords
Aging, Reinforcement learning, Dopamine, Q-learning, Parkinson’s disease
لینک منبع پیشنهادی برای مطالعه بیشتر (further reading)
(در صورت جذابیت و علاقمندی به موضوع، مطلب را برای دیگران نیز بازنشر فرمایید).
کانال تلگرام