نوشته دکتر محمدرضا عاطفی
دکتر محمدرضا عاطفی

مشاور استراتژی و آینده پژوه
عضو هیات علمی دانشگاه

یادگیری یک فرآیند بازخوردی

یادگیری تک حلقه‌ای

 

یادگیری، یک فرآیند بازخوردی است که در آن با استفاده از اطلاعات گرفته شده از جهان واقعی و مقایسه آن با هدف، تصمیم اتخاذ شده و عمل انجام شده منجر به ایجاد تغییر در وضعیت فعلی می شود. حلقه زیر یک حلقه بازخورد منفی کلاسیک است که به موجب آن تصمیم گیرندگان اطلاعات مربوط به وضعیت دنیای واقعی را با اهداف مختلف مقایسه می کنند. اختلاف بین حالت های مطلوب و واقعی را درک می کنند و اقداماتی را انجام می دهند که به عقیده آنها باعث می شود دنیای واقعی به سمت هدف حرکت کند.

حلقه بازخورد زیر ابتدایی ترین نوع یادگیری را توصیف می کند. حلقه یک بازخورد منفی کلاسیک است که به موجب آن تصمیم گیرندگان اطلاعات مربوط به وضعیت دنیای واقعی را با اهداف مختلف مقایسه می کنند. اختلاف بین حالت های مطلوب و واقعی را درک می کنند و اقداماتی را انجام می دهند که به عقیده آنها باعث می شود دنیای واقعی به سمت هدف حرکت کند.

 

بازخورد اطلاعاتی در مورد دنیای واقعی تنها ورودی تصمیمات ما نیست‌. تصمیمات نتیجه اعمال قواعد یا استراتژی‌های تصمیم‌گیری در مورد اطلاعات مربوط به جهان است که ما آن را درک می‌کنیم‌. این سیاست‌ها مشروط به ساختارهای نهادی، استراتژی‌های سازمانی و هنجارهای فرهنگی هستند که به نوبه خود توسط مدل‌های ذهنی ما شکل می‌گیرند‌. یادگیری تک حلقه‌ای فرآیندی است که طی آن یاد می‌گیریم به اهداف فعلی خود در چارچوب مدل‌های ذهنی موجود برسیم‌. یادگیری تک حلقه‌ای منجر به تغییر عمیق در مدل‌های ذهنی ما – افق زمانی که ما مرتبط می‌دانیم – و همچنین در اهداف و ارزش‌های ما نمی شود.

یادگیری دو حلقه‌ای

 

تغییر عمیق در مدل‌های ذهنی، یا یادگیری دو حلقه‌ای، زمانی به وجود می‌آید که شواهد نه تنها تصمیمات ما را در چارچوب‌های موجود تغییر می‌دهند، بلکه برای تغییر مدل‌های ذهنی ما نیز بازخورد می‌دهند‌. همانطور که مدل‌های ذهنی ما تغییر می‌کند، ساختار سیستم‌های خود را تغییر می‌دهیم، قوانین تصمیم‌گیری متفاوت و استراتژی‌های جدید ایجاد می‌کنیم‌. همان اطلاعات که توسط مدلی متفاوت تفسیر می‌شود، اکنون تصمیم متفاوتی را به همراه دارد‌. تفکر سیستمی یک فرآیند یادگیری تکراری است که در آن ما یک دیدگاه تقلیل گرایانه، محدود، کوتاه مدت و ایستا از جهان را با دیدگاهی جامع، گسترده، بلندمدت و پویا جایگزین می‌کنیم و سیاست‌ها و نهادهای خود را بر این اساس دوباره ابداع می‌کنیم.

برای اینکه یادگیری اتفاق بیفتد، هر پیوند در فرآیندهای یادگیری تک و دو حلقه‌ای باید به طور موثر کار کند، و ما باید بتوانیم سریعتر از تغییرات در دنیای واقعی که دانش موجود را منسوخ می‌کند دور حلقه‌ها بچرخیم‌. با این حال، این بازخوردها اغلب به خوبی عمل نمی کنند‌. هر پیوند در حلقه‌های یادگیری ممکن است شکست بخورد

 

موانع یادگیری

اما در دنیای واقعی مسائلی وجود دارد که باعث می‌شود نتوانیم یادگیری را یه طور کامل انجام دهیم.

 

۱- اطلاعات محدود و مبهم

 

ما دنیای واقعی را از طریق فیلترها تجربه می‌کنیم‌. هیچ کس میزان بروز یا شیوع فعلی هر بیماری را نمی داند‌. در عوض، سیستم‌های نظارت تخمین‌هایی از این داده‌ها را بر اساس اندازه‌گیری‌های نمونه‌برداری شده، میانگین‌گیری شده و تاخیری گزارش می‌کنند‌. عمل اندازه‌گیری، تحریف‌ها، تاخیرها، سوگیری‌ها، خطاها و سایر نواقص را معرفی می‌کند که برخی شناخته شده، برخی دیگر ناشناخته و ناشناخته هستند.

مهمتر از همه، اندازه‌گیری یک عمل انتخاب است‌. حواس و سیستم‌های اطلاعاتی ما تنها بخش کوچکی از تجربه ممکن را انتخاب می‌کنند‌. ما تولید ناخالص داخلی را به گونه‌ای تعریف می‌کنیم که مراقبت‌های پزشکی ناشی از بیماری‌های ناشی از آلودگی به تولید ناخالص داخلی اضافه شود، در حالی که تولید خود آلودگی آن را کاهش نمی دهد‌. از آنجایی که قیمت اکثر کالاها شامل هزینه‌ها و پیامدهای تخریب محیط زیست و کاهش منابع نمی شود، این عوامل خارجی وزن کمی در سیاست گذاری دریافت می‌کنند‌.

البته، سیستم‌های اطلاعاتی حاکم بر بازخوردی که دریافت می‌کنیم می‌توانند با یادگیری تغییر کنند‌. همچنین بازخورد بین مدل‌های ذهنی و بازخورد اطلاعاتی در دسترس ما را نشان می‌دهد: دیدن، باور کردن است و باور کردن، دیدن است‌. از طریق مدل‌های ذهنی خود، ساختارهایی مانند تولید ناخالص داخلی را تعریف می‌کنیم و سیستم‌هایی را برای ارزیابی و گزارش آنها طراحی می‌کنیم‌. ما آنچه برجسته، ملموس و آشناست را با آنچه مهم است مخلوط می‌کنیم‌. وقتی این چیزها را اندازه می‌گیریم، واقعی‌تر می‌شوند، در حالی که تأثیرات دور از تصمیم‌های ما، چیزهای ناآشنا و ناملموس مانند پیچ ​​و خم محو می‌شوند‌. بنابراین ما بودجه نظامی را با امنیت، تولید ناخالص داخلی سرانه را با شادی و وسعت خانه‌هایمان را با کیفیت زندگی خانگی اشتباه می‌گیریم.

بازخورد خودتقویت کننده بین انتظارات و ادراکات بارها نشان داده شده است‌. گاهی اوقات بازخورد مثبت با تقویت توانایی ما در درک ویژگی‌های محیط به یادگیری کمک می‌کند، مانند زمانی که یک طبیعت‌شناس باتجربه پرنده‌ای را در بوته‌های دور شناسایی می‌کند، جایی که تازه‌کار فقط یک انبوه درهم را می‌بیند‌. با این حال، اغلب بازخورد متقابل انتظارات و ادراک ما را نسبت به ناهنجاری‌هایی که ممکن است مدل‌های ذهنی ما را به چالش بکشد و به بینش عمیق منجر شود کور می‌کند‌.

به عنوان یکی از نمونه‌های متعدد، تاریخچه تخریب لایه ازن توسط کلروفلوئوروکربن‌ها (CFC) را در نظر بگیرید‌. اولین شواهدی که توانایی CFC ها را برای از بین بردن ازن اتمسفر توصیف می‌کند، در سال 1974 منتشر شد‌. علیرغم ممنوعیت استفاده از CFCها به عنوان پیشرانهای آئروسل، تولید جهانی CFCها نزدیک به بالاترین حد خود باقی ماند‌. در سال 1985 بود که شواهدی از سوراخ اوزون قطب جنوب منتشر شد‌. همانطور که توسط  میدوز و راندرز توضیح دادند:

این خبر در سراسر جهان علم پیچید‌. دانشمندان در [ناسا]..‌. تلاش کردند تا خوانش‌های ازن اتمسفر را که توسط ماهواره نیمبوس 7 انجام شده بود، بررسی کنند، اندازه‌گیری‌هایی که از سال 1978 به طور معمول انجام شده بود‌. نیمباس 7 هرگز حفره ازن را نشان نداده بود.

با بررسی مجدد، دانشمندان ناسا دریافتند که رایانه‌های آنها طوری برنامه ریزی شده است که خوانش‌های بسیار کم ازن را با این فرض که چنین خوانش‌های پایینی باید نشان دهنده خطای ابزار باشد، رد کند‌.

پیش فرض‌های دانشمندان در مورد غلظت “عادی” ازن آنها را به طراحی یک سیستم اندازه‌گیری سوق داد که کشف شواهدی را که ممکن است نشان دهنده اشتباه بودن این باور باشد غیرممکن کند‌. خوشبختانه، ناسا داده‌های اصلی و بدون فیلتر را ذخیره کرده بود و بعداً تأیید کرد که غلظت ازن واقعاً از زمان پرتاب نیمبوس 7 کاهش یافته است‌. تولید تا 7 سال به تاخیر افتاد.

 

 

image

۲- عقلانیت محدود و برداشت نادرست از بازخورد

 

انسان‌ها کامپیوتر نیستند و با خونسردی احتمالات را ارزیابی می‌کنند‌. احساسات، واکنش‌های عاطفی، انگیزه‌های ناخودآگاه و سایر عوامل غیرمنطقی یا احساسی، همگی نقش زیادی در قضاوت‌ها و رفتار ما دارند‌. اما حتی زمانی که زمان را برای مشورت پیدا می‌کنیم، نمی‌توانیم به شیوه‌ای کاملاً منطقی رفتار کنیم (یعنی با توجه به اطلاعات موجود بهترین تصمیم‌های ممکن را بگیریم)‌. همانطور که ذهن انسان شگفت انگیز است، پیچیدگی دنیای واقعی توانایی‌های شناختی ما را کوچک می‌کند‌. هربرت سایمون این محدودیت‌ها را در اصل معروف خود «عقلانیت محدود» بیان کرد که به همین دلیل در سال 1978 جایزه نوبل اقتصاد را دریافت کرد:

ظرفیت ذهن انسان برای فرمول بندی و حل مسائل پیچیده در مقایسه با اندازه آن بسیار ناچیز است بنابراین راه حل ها برای رفتار عقلانی عینی در دنیای واقعی یا حتی برای تقریب معقول به چنین عقلانیت عینی لازم است‌.

در مواجهه با پیچیدگی بیش از حد دنیای واقعی، فشار زمان و توانایی‌های شناختی محدود، مجبوریم به رویه‌ها، عادت، قوانین سرانگشتی و مدل‌های ذهنی ساده بازگردیم‌. اگرچه ما گاهی تلاش می‌کنیم بهترین تصمیم‌ها را بگیریم، اما عقلانیت محدود به این معنی است که اغلب به طور سیستماتیک کوتاه می‌آییم.

عقلانیت محدود به ویژه در سیستم‌های پویا حاد است‌. آزمایش‌ها نشان می‌دهد که افراد در سیستم‌هایی با سطوح پایینی از پیچیدگی پویا عملکرد بسیار ضعیفی دارند‌. به عنوان مثال، ایجاد چرخه‌های تجاری، ورشکستگی شرکت‌های خود، کاهش منابع تجدیدپذیر، و تاخیر در درمان پزشکی در حالی که شاهد افرادی در پیرامونمان هستیم که بیمار می‌شوند و می‌میرند‌. این برداشت‌های نادرست از بازخورد برای تجربه و انگیزه‌های مالی قوی است‌.

image

بینش‌های مرتبط

سیستم

پویایی سیستم

امکان ارسال دیدگاه وجود ندارد!