یادگیری درون‌گرا (In-Context Learning) چیست؟

مقدمه یادگیری درون‌گرا (In-Context Learning یا ICL) یک مفهوم نوین در پردازش زبان طبیعی است که به مدل‌های پیش‌آموزش‌دیده این توانایی را می‌دهد تا در زمان استنتاج (Inference) وظایف مختلف را بدون نیاز به به‌روزرسانی وزن‌ها یا پارامترهای مدل انجام دهند. برخلاف روش‌های سنتی که نیاز به تغییرات فیزیکی در ساختار مدل دارند (مانند فین‌تیونینگ)، […]

یادگیری عمیق(Deep Learning)  چیست؟

مقدمه یادگیری عمیق (Deep Learning) شاخه‌ای از یادگیری ماشین است که با استفاده از شبکه‌های عصبی چندلایه، تلاش می‌کند الگوهای پیچیده را مستقیماً از داده‌های خام یاد بگیرد. برخلاف بسیاری از روش‌های کلاسیک که معمولاً به مهندسی ویژگی (Feature Engineering) وابسته‌اند، در یادگیری عمیق بخش زیادی از «ویژگی‌سازی» توسط خود مدل و در طی فرایند […]

رگرسیون خطی (Linear Regression) در یادگیری ماشین

مقدمه رگرسیون خطی (Linear Regression) یکی از ساده‌ترین و در عین حال پرکاربردترین الگوریتم‌های یادگیری ماشین است که هدف آن پیدا کردن یک رابطه‌ی تقریبی بین یک یا چند ویژگی (Feature) و یک متغیر هدف (Target) است. این مدل تلاش می‌کند با برازش یک خط (در حالت تک‌متغیره) یا یک صفحه/ابرصفحه (در حالت چندمتغیره)، مقدار […]

ترنسفورمر (Transformer)در یادگیری عمیق

مقدمه ترنسفورمر (Transformer) یکی از مهم‌ترین معماری‌های یادگیری عمیق در سال‌های اخیر است که با معرفی مکانیزم توجه (Attention) توانست بسیاری از محدودیت‌های مدل‌های ترتیبیِ قدیمی مثل RNN و LSTM را کاهش دهد. مشکل اصلی مدل‌های ترتیبی این بود که توالی را مرحله‌به‌مرحله پردازش می‌کردند؛ در نتیجه هم آموزش کندتر بود و هم وابستگی‌های دور (Long-Range […]