نوشته دکتر محمدرضا عاطفی
مشاور استراتژی و آینده پژوه
عضو هیات علمی دانشگاه
یادگیری یک فرآیند بازخوردی
یادگیری تک حلقهای
یادگیری، یک فرآیند بازخوردی است که در آن با استفاده از اطلاعات گرفته شده از جهان واقعی و مقایسه آن با هدف، تصمیم اتخاذ شده و عمل انجام شده منجر به ایجاد تغییر در وضعیت فعلی می شود. حلقه زیر یک حلقه بازخورد منفی کلاسیک است که به موجب آن تصمیم گیرندگان اطلاعات مربوط به وضعیت دنیای واقعی را با اهداف مختلف مقایسه می کنند. اختلاف بین حالت های مطلوب و واقعی را درک می کنند و اقداماتی را انجام می دهند که به عقیده آنها باعث می شود دنیای واقعی به سمت هدف حرکت کند.
حلقه بازخورد زیر ابتدایی ترین نوع یادگیری را توصیف می کند. حلقه یک بازخورد منفی کلاسیک است که به موجب آن تصمیم گیرندگان اطلاعات مربوط به وضعیت دنیای واقعی را با اهداف مختلف مقایسه می کنند. اختلاف بین حالت های مطلوب و واقعی را درک می کنند و اقداماتی را انجام می دهند که به عقیده آنها باعث می شود دنیای واقعی به سمت هدف حرکت کند.
بازخورد اطلاعاتی در مورد دنیای واقعی تنها ورودی تصمیمات ما نیست. تصمیمات نتیجه اعمال قواعد یا استراتژیهای تصمیمگیری در مورد اطلاعات مربوط به جهان است که ما آن را درک میکنیم. این سیاستها مشروط به ساختارهای نهادی، استراتژیهای سازمانی و هنجارهای فرهنگی هستند که به نوبه خود توسط مدلهای ذهنی ما شکل میگیرند. یادگیری تک حلقهای فرآیندی است که طی آن یاد میگیریم به اهداف فعلی خود در چارچوب مدلهای ذهنی موجود برسیم. یادگیری تک حلقهای منجر به تغییر عمیق در مدلهای ذهنی ما – افق زمانی که ما مرتبط میدانیم – و همچنین در اهداف و ارزشهای ما نمی شود.
یادگیری دو حلقهای
تغییر عمیق در مدلهای ذهنی، یا یادگیری دو حلقهای، زمانی به وجود میآید که شواهد نه تنها تصمیمات ما را در چارچوبهای موجود تغییر میدهند، بلکه برای تغییر مدلهای ذهنی ما نیز بازخورد میدهند. همانطور که مدلهای ذهنی ما تغییر میکند، ساختار سیستمهای خود را تغییر میدهیم، قوانین تصمیمگیری متفاوت و استراتژیهای جدید ایجاد میکنیم. همان اطلاعات که توسط مدلی متفاوت تفسیر میشود، اکنون تصمیم متفاوتی را به همراه دارد. تفکر سیستمی یک فرآیند یادگیری تکراری است که در آن ما یک دیدگاه تقلیل گرایانه، محدود، کوتاه مدت و ایستا از جهان را با دیدگاهی جامع، گسترده، بلندمدت و پویا جایگزین میکنیم و سیاستها و نهادهای خود را بر این اساس دوباره ابداع میکنیم.
برای اینکه یادگیری اتفاق بیفتد، هر پیوند در فرآیندهای یادگیری تک و دو حلقهای باید به طور موثر کار کند، و ما باید بتوانیم سریعتر از تغییرات در دنیای واقعی که دانش موجود را منسوخ میکند دور حلقهها بچرخیم. با این حال، این بازخوردها اغلب به خوبی عمل نمی کنند. هر پیوند در حلقههای یادگیری ممکن است شکست بخورد
موانع یادگیری
اما در دنیای واقعی مسائلی وجود دارد که باعث میشود نتوانیم یادگیری را یه طور کامل انجام دهیم.
۱- اطلاعات محدود و مبهم
ما دنیای واقعی را از طریق فیلترها تجربه میکنیم. هیچ کس میزان بروز یا شیوع فعلی هر بیماری را نمی داند. در عوض، سیستمهای نظارت تخمینهایی از این دادهها را بر اساس اندازهگیریهای نمونهبرداری شده، میانگینگیری شده و تاخیری گزارش میکنند. عمل اندازهگیری، تحریفها، تاخیرها، سوگیریها، خطاها و سایر نواقص را معرفی میکند که برخی شناخته شده، برخی دیگر ناشناخته و ناشناخته هستند.
مهمتر از همه، اندازهگیری یک عمل انتخاب است. حواس و سیستمهای اطلاعاتی ما تنها بخش کوچکی از تجربه ممکن را انتخاب میکنند. ما تولید ناخالص داخلی را به گونهای تعریف میکنیم که مراقبتهای پزشکی ناشی از بیماریهای ناشی از آلودگی به تولید ناخالص داخلی اضافه شود، در حالی که تولید خود آلودگی آن را کاهش نمی دهد. از آنجایی که قیمت اکثر کالاها شامل هزینهها و پیامدهای تخریب محیط زیست و کاهش منابع نمی شود، این عوامل خارجی وزن کمی در سیاست گذاری دریافت میکنند.
البته، سیستمهای اطلاعاتی حاکم بر بازخوردی که دریافت میکنیم میتوانند با یادگیری تغییر کنند. همچنین بازخورد بین مدلهای ذهنی و بازخورد اطلاعاتی در دسترس ما را نشان میدهد: دیدن، باور کردن است و باور کردن، دیدن است. از طریق مدلهای ذهنی خود، ساختارهایی مانند تولید ناخالص داخلی را تعریف میکنیم و سیستمهایی را برای ارزیابی و گزارش آنها طراحی میکنیم. ما آنچه برجسته، ملموس و آشناست را با آنچه مهم است مخلوط میکنیم. وقتی این چیزها را اندازه میگیریم، واقعیتر میشوند، در حالی که تأثیرات دور از تصمیمهای ما، چیزهای ناآشنا و ناملموس مانند پیچ و خم محو میشوند. بنابراین ما بودجه نظامی را با امنیت، تولید ناخالص داخلی سرانه را با شادی و وسعت خانههایمان را با کیفیت زندگی خانگی اشتباه میگیریم.
بازخورد خودتقویت کننده بین انتظارات و ادراکات بارها نشان داده شده است. گاهی اوقات بازخورد مثبت با تقویت توانایی ما در درک ویژگیهای محیط به یادگیری کمک میکند، مانند زمانی که یک طبیعتشناس باتجربه پرندهای را در بوتههای دور شناسایی میکند، جایی که تازهکار فقط یک انبوه درهم را میبیند. با این حال، اغلب بازخورد متقابل انتظارات و ادراک ما را نسبت به ناهنجاریهایی که ممکن است مدلهای ذهنی ما را به چالش بکشد و به بینش عمیق منجر شود کور میکند.
به عنوان یکی از نمونههای متعدد، تاریخچه تخریب لایه ازن توسط کلروفلوئوروکربنها (CFC) را در نظر بگیرید. اولین شواهدی که توانایی CFC ها را برای از بین بردن ازن اتمسفر توصیف میکند، در سال 1974 منتشر شد. علیرغم ممنوعیت استفاده از CFCها به عنوان پیشرانهای آئروسل، تولید جهانی CFCها نزدیک به بالاترین حد خود باقی ماند. در سال 1985 بود که شواهدی از سوراخ اوزون قطب جنوب منتشر شد. همانطور که توسط میدوز و راندرز توضیح دادند:
این خبر در سراسر جهان علم پیچید. دانشمندان در [ناسا]... تلاش کردند تا خوانشهای ازن اتمسفر را که توسط ماهواره نیمبوس 7 انجام شده بود، بررسی کنند، اندازهگیریهایی که از سال 1978 به طور معمول انجام شده بود. نیمباس 7 هرگز حفره ازن را نشان نداده بود.
با بررسی مجدد، دانشمندان ناسا دریافتند که رایانههای آنها طوری برنامه ریزی شده است که خوانشهای بسیار کم ازن را با این فرض که چنین خوانشهای پایینی باید نشان دهنده خطای ابزار باشد، رد کند.
پیش فرضهای دانشمندان در مورد غلظت “عادی” ازن آنها را به طراحی یک سیستم اندازهگیری سوق داد که کشف شواهدی را که ممکن است نشان دهنده اشتباه بودن این باور باشد غیرممکن کند. خوشبختانه، ناسا دادههای اصلی و بدون فیلتر را ذخیره کرده بود و بعداً تأیید کرد که غلظت ازن واقعاً از زمان پرتاب نیمبوس 7 کاهش یافته است. تولید تا 7 سال به تاخیر افتاد.
۲- عقلانیت محدود و برداشت نادرست از بازخورد
انسانها کامپیوتر نیستند و با خونسردی احتمالات را ارزیابی میکنند. احساسات، واکنشهای عاطفی، انگیزههای ناخودآگاه و سایر عوامل غیرمنطقی یا احساسی، همگی نقش زیادی در قضاوتها و رفتار ما دارند. اما حتی زمانی که زمان را برای مشورت پیدا میکنیم، نمیتوانیم به شیوهای کاملاً منطقی رفتار کنیم (یعنی با توجه به اطلاعات موجود بهترین تصمیمهای ممکن را بگیریم). همانطور که ذهن انسان شگفت انگیز است، پیچیدگی دنیای واقعی تواناییهای شناختی ما را کوچک میکند. هربرت سایمون این محدودیتها را در اصل معروف خود «عقلانیت محدود» بیان کرد که به همین دلیل در سال 1978 جایزه نوبل اقتصاد را دریافت کرد:
ظرفیت ذهن انسان برای فرمول بندی و حل مسائل پیچیده در مقایسه با اندازه آن بسیار ناچیز است بنابراین راه حل ها برای رفتار عقلانی عینی در دنیای واقعی یا حتی برای تقریب معقول به چنین عقلانیت عینی لازم است.
در مواجهه با پیچیدگی بیش از حد دنیای واقعی، فشار زمان و تواناییهای شناختی محدود، مجبوریم به رویهها، عادت، قوانین سرانگشتی و مدلهای ذهنی ساده بازگردیم. اگرچه ما گاهی تلاش میکنیم بهترین تصمیمها را بگیریم، اما عقلانیت محدود به این معنی است که اغلب به طور سیستماتیک کوتاه میآییم.
عقلانیت محدود به ویژه در سیستمهای پویا حاد است. آزمایشها نشان میدهد که افراد در سیستمهایی با سطوح پایینی از پیچیدگی پویا عملکرد بسیار ضعیفی دارند. به عنوان مثال، ایجاد چرخههای تجاری، ورشکستگی شرکتهای خود، کاهش منابع تجدیدپذیر، و تاخیر در درمان پزشکی در حالی که شاهد افرادی در پیرامونمان هستیم که بیمار میشوند و میمیرند. این برداشتهای نادرست از بازخورد برای تجربه و انگیزههای مالی قوی است.