eitaa logo
Data ➕ Science
28 دنبال‌کننده
122 عکس
7 ویدیو
100 فایل
مشاهده در ایتا
دانلود
@DataPlusScience_10_Commonly_Asked_LLM_Interview_Questions_.pdf
1.04M
🤖 ده پرسش رایج در مصاحبه‌های مدل‌های زبانی بزرگ: ۱. تعریف مدل‌های زبانی بزرگ (Large Language Models) ۲. سنجش کارایی ۳. یادگیری با نمونه‌های اندک (few-shot learning) ۴. رفع خروجی‌های نامناسب یا نادرست ۵. تفاوت رمزگذار (encoder) و رمزگشا (decoder) ۶. مقایسه با مدل‌های آماری سنتی ۷. مفهوم پنجره متنی (context window) ۸. تعریف ابَرپارامتر (hyperparameter) ۹. توضیح سازوکار توجه (attention mechanism) ۱۰. چالش‌های استفاده از مدل‌های زبانی بزرگ ➖➖➖➖➖➖➖➖➖➖➖➖ برای آموزش علم داده به جمع ما بپیوندید: 👇 📊👨‍🏫 @DataPlusScience | @Data➕Science @DataPlusScience
میلاد مسعود پیامبر مهربانی حضرت محمد صلی‌الله علیه‌ و‌ آله و ولادت حضرت امام صادق علیه‌السلام بر همه مخاطبان کانال مبارک باد.🌷🌸 📊👨‍🏫 @DataPlusScience | @Data➕Science @DataPlusScience
@DataPlusScince __ ML, Deep Learning and AI Cheat Sheet.pdf
7.82M
📊 چکیده جامع هوش مصنوعی: از مبانی تا پیشرفته خلاصه کاملی از مفاهیم و الگوریتم‌های کلیدی هوش مصنوعی و یادگیری ماشین یادگیری ماشین و شبکه‌های عصبی بهینه‌سازی جستجو و تصمیم‌گیری مدل‌های احتمالاتی و منطقی روش‌های پیشرفته مانند تقویتی و عمیق ➖➖➖➖➖➖➖➖➖➖➖➖ برای آموزش علم داده به جمع ما بپیوندید: 👇 📊👨‍🏫 @DataPlusScience | @Data➕Science @DataPlusScience
@DataPlusScince __ Statistics Notes .pdf
4.94M
📊 مفاهیم کلیدی آمار برای تحلیل داده‌ها 💡 این فایل شامل مفاهیم کلیدی آمار و فرمول‌های پایه‌ای آن است که برای تحلیل داده‌ها استفاده می‌شود. همچنین، به ابزارها و تکنیک‌های آماری پرداخته و چگونگی به کارگیری آنها در دنیای واقعی را توضیح می‌دهد. 📄 ساختار فایل تعاریف پایه آماری: شامل توضیحات درباره توزیع‌های آماری مثل میانگین (Mean)، واریانس (Variance) و انحراف معیار (Standard Deviation). مفاهیم احتمالی (Probability Concepts): شامل مباحثی مانند قانون احتمال (Probability Law) و توزیع نرمال (Normal Distribution). تحلیل رگرسیون (Regression Analysis): آموزش استفاده از رگرسیون خطی (Linear Regression) و ضریب همبستگی (Correlation Coefficient) برای تحلیل روابط بین متغیرها. آزمون‌های فرضیه (Hypothesis Testing): بررسی روش‌های انجام آزمون فرضیه و مقادیر P (P-Values) برای ارزیابی اعتبار فرضیه‌ها. 📢 ➖➖➖➖➖➖➖➖➖➖➖➖ برای آموزش علم داده به جمع ما بپیوندید: 👇 📊👨‍🏫 @DataPlusScience | @Data➕Science @DataPlusScience
@DataPlusScince __ Your First RAG.pdf
1.42M
📚 ساخت اولین سیستم RAG (Retrieval-Augmented Generation) 💡 این فایل آموزشی شامل مراحل ساخت یک سیستم RAG ساده برای پاسخگویی به سوالات بر اساس اسناد است. مفاهیم کلیدی مانند استخراج متن (Text Extraction)، تقسیم‌بندی متن (Text Chunking) و جستجوی برداری (Vector Search) را توضیح می‌دهد. 📄 محتوای فایل: استخراج متن از PDF با استفاده از PyMuPDF تقسیم‌بندی متن به قطعات کوچکتر (Chunking) روش‌های بازیابی اطلاعات: جستجوی کلیدواژه‌ای (Keyword-based) و جستجوی برداری (Vector-based) الگوریتم Okapi BM25 برای رتبه‌بندی اسناد استفاده از Embeddings برای محاسبه شباهت معنایی ساخت یک سیستم RAG ساده با استفاده از OpenAI API 🔬 این فایل همچنین محدودیت‌های سیستم RAG پایه را نشان می‌دهد و زمینه را برای بحث در مورد تکنیک‌های پیشرفته‌تر در فصل‌های بعدی فراهم می‌کند. 📢 ➖➖➖➖➖➖➖➖➖➖➖➖ برای آموزش علم داده به جمع ما بپیوندید: 👇 📊👨‍🏫 @DataPlusScience | @Data➕Science @DataPlusScience
💡 پرسش‌های رایج در مصاحبه‌های الگوریتم یادگیری ماشین (ML Algorithm) اینفوگرافی از رایج‌ترین الگوریتم‌های مورد سوال در مصاحبه‌های نقش‌های داده در شرکت‌های بزرگ و استارتاپ‌ها: 🔹 جنگل تصادفی (Random Forest) در صدر 🔹 رگرسیون لجستیک (Logistic Regression) و گرادیان بوستینگ (Gradient Boosting) نزدیک به آن 🔹 دیگر الگوریتم‌ها: رگرسیون خطی (Linear Regression)، درخت تصمیم (Decision Tree)، شبکه‌های عصبی (Neural Networks) 🚀 DataInterview ➖➖➖➖➖➖➖➖➖➖➖➖ برای آموزش علم داده به جمع ما بپیوندید: 👇 📊👨‍🏫 @DataPlusScience | @Data➕Science @DataPlusScience
این تصویر، روش‌های مختلف تحلیل سری‌های زمانی (Time Series Analysis) را نمایش می‌دهد. این رویکردها شامل مدل‌های یادگیری ماشین (Machine Learning Approaches)، تحلیل‌های زمان-فرکانس (Time-Frequency Analysis Approaches)، روش‌های تحلیل آشوب (Chaotic Analysis Approaches)، نمودارهای کنترلی (Control Charts) و مدل‌های آماری پیشرفته مانند شبکه‌های بیزین پویا (Dynamic Bayesian Networks) و مدل‌های مارکوف پنهان (Hidden Markov Models) هستند. 🔑 ساختار کلی: یادگیری ماشین: شبکه‌های عصبی مصنوعی (Artificial Neural Networks)، ماشین بردار پشتیبان (SVM)، منطق فازی (Fuzzy Logic)، فرآیندهای گاوسی (Gaussian Process). تحلیل زمان-فرکانس: تبدیل فوریه سریع (FFT)، تبدیل موجک (Continuous Wavelet Transform)، تبدیل شیپلت (Chirplet Transform). کنترل و نمودارها: کنترل فردی شویهارت (Shewhart Individuals Control Chart)، نمودار EWMA و CUSUM. توابع خودهمبستگی: عملکرد همبستگی خودکار و متقاطع برای استخراج بینش‌های عمیق از داده‌ها. 🏷 📊👨‍🏫 @DataPlusScience | @Data➕Science @DataPlusScience
@DataPlusScience__Data Analytics Interview Questions.pdf
48.31M
🎯 50 سوال ضروری برای مصاحبه‌های تحلیل داده این مجموعه شامل 50 سوال کلیدی است که از سطح مبتدی تا پیشرفته را پوشش می‌دهد و به داوطلبین در آماده‌سازی برای مصاحبه‌های تحلیل داده کمک می‌کند. 🏷 ➖➖➖➖➖➖➖➖➖➖➖➖ برای آموزش علم داده به جمع ما بپیوندید: 👇 📊👨‍🏫 @DataPlusScience | @Data➕Science @DataPlusScience
@DataPlusScince __ ML Cheatsheet.pdf
5.55M
📑 خلاصه‌برگ میادگیری ماشین (ML Cheatsheet) 💡 این خلاصه‌برگ راهنمایی سریع برای مرور اصول و تکنیک‌های یادگیری ماشین (Machine Learning) است. محتوای آن شامل: 🔹 الگوریتم‌های نظارت‌شده (Supervised Learning): مثل رگرسیون خطی (Linear Regression) و ماشین بردار پشتیبان (SVM). 🔹 الگوریتم‌های بدون نظارت (Unsupervised Learning): خوشه‌بندی (Clustering) و تحلیل مؤلفه‌های اصلی (PCA). 🔹 بهینه‌سازی و تنظیم مدل (Model Optimization): مثل تکنیک‌های تنظیم بیش‌برازش (Overfitting) و تنظیم فراپارامتر (Hyperparameter Tuning). 🔹 ماتریس‌های ارزیابی (Evaluation Metrics): شامل دقت (Accuracy)، F1-اسکور و ماتریس درهم‌ریختگی (Confusion Matrix). ➖➖➖➖➖➖➖➖➖➖➖➖ برای آموزش علم داده به جمع ما بپیوندید: 👇 📊👨‍🏫 @DataPlusScience | @Data➕Science @DataPlusScience
@DataPlusScience__Data Science Interview Preparation.pdf
2.15M
📑 آمادگی برای مصاحبه علوم داده (Data Science Interview Preparation) 💡این فایل شامل مجموعه‌ای از سوالات کلیدی مصاحبه‌های علوم داده است که از مباحث پایه تا پیشرفته را پوشش می‌دهد. هدف آن کمک به متخصصان برای آماده‌سازی بهتر و پاسخگویی مؤثر در مصاحبه‌ها است. 📄 ساختار کلی: مفاهیم آماری (Statistics): توضیح تئوری حد مرکزی (Central Limit Theorem)، رگرسیون خطی (Linear Regression)، و آزمون فرضیه (Hypothesis Testing). یادگیری ماشین (Machine Learning): بررسی الگوریتم‌های نظارت‌شده و بدون نظارت، و تعادل بایاس-واریانس (Bias-Variance Trade-off). تحلیل داده (Data Analysis): مهارت‌های پاک‌سازی داده و استفاده از ماتریس درهم‌ریختگی (Confusion Matrix) برای ارزیابی مدل. آماده‌سازی برای مصاحبه: نکاتی برای بهبود مهارت‌های فنی و نمایش فرآیند فکری در مصاحبه. 📢 ➖➖➖➖➖➖➖➖➖➖➖➖ برای آموزش علم داده به جمع ما بپیوندید: 👇 📊👨‍🏫 @DataPlusScience | @Data➕Science @DataPlusScience
@DataPlusScience__Introduction to RAG.pdf
574.1K
📑 مقدمه‌ای بر RAG و کاربردهای آن 💡 این فایل به معرفی RAG (Retrieval-Augmented Generation) می‌پردازد و نحوه عملکرد، مزایا و کاربردهای آن را در بهبود کیفیت و دقت خروجی مدل‌های LLM (Large Language Models) توضیح می‌دهد. 📄 ساختار کلی: محدودیت‌های LLM: چالش‌های مدل‌های زبان بزرگ، مانند توهمات (Hallucinations) و عدم به‌روزرسانی به‌موقع. معماری RAG: ترکیب بازیابی اطلاعات با تولید متن. مزایا: بهبود دقت، انعطاف‌پذیری، و امکان استفاده از داده‌های خارجی. کاربردها: چت‌بات‌ها (Chatbots)، پاسخ‌دهی به سؤالات (Question Answering)، تولید محتوا (Content Generation) و کمک به حوزه سلامت. 📢 ➖➖➖➖➖➖➖➖➖➖➖➖ برای آموزش علم داده به جمع ما بپیوندید: 👇 📊👨‍🏫 @DataPlusScience | @Data➕Science @DataPlusScience
🎯 نمایی از الگوریتم‌های خوشه‌بندی داده‌ها (Cluster Analysis) 💡 این نمودار درختی نشان‌دهنده انواع روش‌های خوشه‌بندی و تقسیم‌بندی آنها است: 📊 دسته‌بندی اصلی: 1️⃣ خوشه‌بندی سخت (Hard Clustering): Partitioning: شامل K-means، K-medoids و GMM Grid-based: مانند STING و CLIQUE Density-based: مثل DBSCAN و OPTICS Hierarchical: با دو رویکرد Divisive و Agglomerative 2️⃣ خوشه‌بندی فازی (Fuzzy Clustering): Sequential Threshold Parallel Threshold Optimizing Threshold 🔍 روش‌های ارزیابی: Internal validation External validation Relative validation Cluster stability Cluster tendency ➖➖➖➖➖➖➖➖➖➖➖➖ برای آموزش علم داده به جمع ما بپیوندید: 👇 📊👨‍🏫 @DataPlusScience | @Data➕Science @DataPlusScience