یادگیری درونگرا (In-Context Learning) چیست؟

مقدمه یادگیری درونگرا (In-Context Learning یا ICL) یک مفهوم نوین در پردازش زبان طبیعی است که به مدلهای پیشآموزشدیده این توانایی را میدهد تا در زمان استنتاج (Inference) وظایف مختلف را بدون نیاز به بهروزرسانی وزنها یا پارامترهای مدل انجام دهند. برخلاف روشهای سنتی که نیاز به تغییرات فیزیکی در ساختار مدل دارند (مانند فینتیونینگ)، […]
یادگیری عمیق(Deep Learning) چیست؟

مقدمه یادگیری عمیق (Deep Learning) شاخهای از یادگیری ماشین است که با استفاده از شبکههای عصبی چندلایه، تلاش میکند الگوهای پیچیده را مستقیماً از دادههای خام یاد بگیرد. برخلاف بسیاری از روشهای کلاسیک که معمولاً به مهندسی ویژگی (Feature Engineering) وابستهاند، در یادگیری عمیق بخش زیادی از «ویژگیسازی» توسط خود مدل و در طی فرایند […]
رگرسیون خطی (Linear Regression) در یادگیری ماشین

مقدمه رگرسیون خطی (Linear Regression) یکی از سادهترین و در عین حال پرکاربردترین الگوریتمهای یادگیری ماشین است که هدف آن پیدا کردن یک رابطهی تقریبی بین یک یا چند ویژگی (Feature) و یک متغیر هدف (Target) است. این مدل تلاش میکند با برازش یک خط (در حالت تکمتغیره) یا یک صفحه/ابرصفحه (در حالت چندمتغیره)، مقدار […]
ترنسفورمر (Transformer)در یادگیری عمیق

مقدمه ترنسفورمر (Transformer) یکی از مهمترین معماریهای یادگیری عمیق در سالهای اخیر است که با معرفی مکانیزم توجه (Attention) توانست بسیاری از محدودیتهای مدلهای ترتیبیِ قدیمی مثل RNN و LSTM را کاهش دهد. مشکل اصلی مدلهای ترتیبی این بود که توالی را مرحلهبهمرحله پردازش میکردند؛ در نتیجه هم آموزش کندتر بود و هم وابستگیهای دور (Long-Range […]