eitaa logo
Data ➕ Science
19 دنبال‌کننده
85 عکس
7 ویدیو
51 فایل
مشاهده در ایتا
دانلود
@DataPlusScience_2023_Hands_On_Machine_Learning_with_Scikit_Learn.pdf
21.62M
ویرایش سوم کتاب فوق العاده Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow انتشار سال 2023 مهم‌ترین تغییرات نسبت به ویرایش دوم کتاب: معرفی ویژگی های جدید Scikit-Learn معرفی کتابخانه Transformers Hugging Face برای پردازش زبان طبیعی اضافه شدن چندین مدل بینایی (ResNeXt، DenseNet، MobileNet، CSPNet و EfficientNet) بعلاوه اینکه فصل های جدیدی در این ویرایش اضافه شده است که به موضوعاتی مانند مدل های بینایی، ترجمه زبان طبیعی و یادگیری generative می پردازند 📊 @DataPlusScience | @Data➕Science @DataPlusScience
🟢 ا‌م‌ال‌آپس (MLOps) به زبان ساده همراه با معرفی کتاب 🔴 کسانی که با فرایندها و الگوریتم‌های یادگیری ماشین در محیط واقعی کار کردند و آشنا هستند و یا اصلن برای دل خودشون مدلی آموزش دادند، حتمن با چالش‌های زیر برخورد کردند؛ 🔴 بعنوان مثال، هایپرپارامترهایی رو تغییر دادند و بعد یادشون رفته کدوم مدل با کدوم هایپرپارامتر چه درصدی از دقت رو بهشون داده یا اون هایپرپارامترها چی بودند؟ 🔴 یا برای دیتاست‌هاشون ورژنی نداشتند و نمی‌دونستند دیتای جدید که اضافه کردند رو جدا کنند یا مجبور بودند چندین کپی از دیتاهای تکراری نگهدارند. یا وقتی با شخص دیگری کار میکردند، داده‌هاشون با هم سینک (هماهنگ) نبوده و هزاران مشکل دیگر. 🔵 درواقع اینجاست که Machine Learning Operations (MLOps) برای این مشکلات راه حل میده و می‌گه همونجوری که ما در گذشته مهندسی نرم افزار نداشتم و با اومدن مهندسی نرم افزار و راه حل‌هاش مثل version control کلی از مشکلات برنامه نویس‌ها حل شد، ا‌م‌ال‌آپس و داشتن یه چرخه‌ی اتوماتیک از امورات مختلف ولی هماهنگ، باعث حل کلی از این قبیل مشکلات می‌شود. 🔵 بطور کلی ا‌م‌ال‌آپس داشتن یک Lifecycle یا چرخه‌ی حیات (تولید) منظم برای مراحل و مشکلات مختلف در فرایند لرنینگ یا همون آموزش هست. همچنین یکی دیگه از دغدغه‌های ا‌م‌ال‌آپس رسوندن مدل یادگیری ماشین از چند خط کد ساده به یک محصول ملموس هست. 🟡 در پایان اینرو هم اضافه کنم. می‌‌تونیم بگیم که ا‌م‌ال‌آپس از ترکیب سه حوزه‌ی زیر ایجاد شده؛ - مهندسی داده (Data Engineering) - توسعه‌ی نرم‌افزار و عملیات آی‌تی (DevOps) - یادگیری ماشین (Machine Learning) 🟤 کتاب Introducing MLOps که تنها در ۱۸۵ صفحه تنظیم شده، و در سال ۲۰۲۰ به چاپ رسیده است، یکی از کتاب‌های بسیار عالی برای ورود به دنیای ‌ام‌ال‌آپس می‌باشد. 🆔 @data_science_python_and_r @DataPlusScience
Mark_Treveil,_Nicolas_Omont,_Clément_Stenac,_Kenji_Lefevre,_Du_P.pdf
14.27M
Introducing MLOps که تنها در ۱۸۵ صفحه تنظیم شده، و در سال ۲۰۲۰ به چاپ رسیده است، یکی از کتاب‌های بسیار عالی برای ورود به دنیای ‌ام‌ال‌آپس می‌باشد. 🆔 @data_science_python_and_r @DataPlusScience
@DataScience_ir - Data Science Pocket Dictionary.pdf
584.3K
🔴 دیکشنری جیبی علوم داده 📚 اصطلاحات ضروری علوم داده 👨🏻‍💻 اگه دنبال یک دیکشنری جیبی هستین که تمام اصطلاحات ضروری و تخصصی علوم داده رو براتون پوشش بده، این راهنما برای شماست. این دیکشنری جیبی منبع ارزشمندی برای دانشمندان داده مبتدی و با تجربه‌اس که می‌تونند ازش برای مصاحبه‌های شغلی یا پروژه‌های کاری‌شون در هر مکان و زمانی استفاده کنند.💯 #️⃣ ➖➖➖➖➖➖➖➖➖➖➖➖ 📊 دانشمند داده شوید : 📎 @DataScience_ir @DataPlusScience
Free Course | ChatGPT for Data Analytics دوره رایگان چت جی‌چی‌تی برای دیتا آنالیتیکس سرفصل‌های دوره: Why AI for Data Analytics? Intro to AI, LLMs & ChatGPT Prompt Engineering ChatGPT for Excel ChatGPT for Google Sheets ChatGPT for Power BI ChatGPT for SQL ChatGPT for Python مدرس دوره هم آقای کریس داتون هستند http://zaya.io/2zk88 📊 @DataPlusScience | @Data➕Science @DataPlusScience
@DataPlusScience__ML Using Python.pdf
3.11M
MACHINE LEARNING WITH PYTHON جزوه مفید و مصور آموزش یادگیری ماشین در پایتون 📊 @DataPlusScience | @Data➕Science @DataPlusScience
توسعه چت‌بات از داده‌های شخصی با استفاده از LangChain https://learn.deeplearning.ai/langchain-chat-with-your-data 📊 @DataPlusScience | @Data➕Science @DataPlusScience
فعلا قابلیت پخش رسانه در مرورگر فراهم نیست
مشاهده در پیام رسان ایتا
موسسه نواوری تکنولوژی کشور امارات نسخه جدیدی از مدل زبانی بزرگ Falcon رو عرضه کرده که 180 میلیارد پارامتر داره و در تستها نه تنها از مدل متن باز LLaMA 2 متا بهتر عمل کرده بلکه از مدلهای متن بسته مثل PaLM گوگل (که نسخه اول بارد از اون استفاده میکرد) و نسخه کوچک و متوسط PaLM 2 عملکرد بهتری داره و فقط پشت مدلهایی مثل نسخه جدید بارد و GPT-4 قرار میگیره. این مدل به صورت متن باز عرضه شده و شرکتها میتونن اون روی سخت افزار خودشون اجرا کنن یا تمرین بدن ولی به دلیل بزرگ بودن نیاز به حداقل 8 کارت گرافیک A100 40GB برای اجرای اون دارن. این مدل رو میتونید از اینجا به صورت انلاین و رایگان ازمایش کنید. 🔎 Huggingface.co 📍 @TechTube @DataPlusScience
@DataPlusScience_NLP Transformers.pdf
6.38M
مدل‌های ترنسفورمری چطور کار کرده و در مدل‌های بزرگ زبانی استفاده می‌شوند؟ How is the transformer work, and how is it used in many large language models? 📊 @DataPlusScience | @Data➕Science @DataPlusScience
@DataPlusScience_Handwritten Machine Learning Notes..pdf
69.23M
Handwritten Machine Learning Notes جزوه دست‌نویس و مفصل یادگیری ماشین 📊 @DataPlusScience | @Data➕Science @DataPlusScience
Scope of AI, Deep Learning, and Machine Learning 📊 @DataPlusScience | @Data➕Science @DataPlusScience
@DataPlusScience _large language models.pdf
5.45M
داکیومنتی عالی برای آشنایی با مفاهیم مدل‌های بزرگ زبانی (LLM) 📊 @DataPlusScience | @Data➕Science @DataPlusScience
A timeline of existing large language models تایم‌لاین معرفی مدل‌های بزرگ زبانی 📊 @DataPlusScience | @Data➕Science @DataPlusScience
@DataPlusScience_ Machine Learning Cheatsheets.pdf
8.49M
Machine Learning Cheatsheets مجموعه ای ارزشمند از خلاصه‌برگ‌های یادگیری ماشین مشتمل بر: 🌟 NumPy Basics 🐼 pandas 🔧 Data Wrangling with pandas 📊 Data Visualization with ggplot2 🌊 Seaborn 📈 Matplotlib 🤖 TensorFlow 🔬 Scikit-Learn 🔬 SciPy 🚀 PySpark 🤖 Keras 🧠 neural network 📊 @DataPlusScience | @Data➕Science @DataPlusScience
‍ 📙 یادگیری عمیق: از اصول اولیه تا ساخت شبکه‌های عصبی عمیق با پایتون 📝 نگارنده: میلاد وزان 📖 سرفصل‌ها: - مقدمه‌ای بر یادگیری عمیق - شبکه‌های عصبی پیش‌خور - شبکه‌های عصبی کانولوشنی - شبکه‌های عصبی بازگشتی - شبکه متخاصم مولد 🆓 این کتاب به رایگان و توسط نگارنده منتشر شده است. 📊 @DataPlusScience | @Data➕Science @DataPlusScience
‍ 📘📈 Effective Pandas | Matt Harrison کتاب Effective Pandas بدون شک یکی از بهترین منابع برای یادگیری کتابخانه Pandas است. 🙌 مطالعه و تمرین این کتاب را به همه دوستانی که می‌خواهند مهارت پانداز را کسب کنند توصیه می کنیم. 🔝 ➖➖➖➖➖➖➖➖➖➖➖➖ برای آموزش علم داده به جمع ما بپیوندید: 👇 📊👨‍🏫 @DataPlusScience | @Data➕Science @DataPlusScience
‍ 📝💼 Business Analysis cheat sheet خلاصه برگ 14 صفحه ای بسیار کاربردی تحلیلگری کسب‌و‌کار ➖➖➖➖➖➖➖➖➖➖➖➖ برای آموزش علم داده به جمع ما بپیوندید: 👇 📊👨‍🏫 @DataPlusScience | @Data➕Science @DataPlusScience
‍ 🎁 جزوه دست‌نویس داده کاوی و یادگیری ماشین مقدماتی جناب دکتر کاویانی ➖➖➖➖➖➖➖➖➖➖➖➖ برای آموزش علم داده به جمع ما بپیوندید: 👇 📊👨‍🏫 @DataPlusScience | @Data➕Science @DataPlusScience
‍ 📌 ChatGPT cheat sheet for Data Science | Data Camp 📚 راهنمای استفاده از ChatGPT در علوم داده 👨‍🏫 کاری از Data Camp ➖➖➖➖➖➖➖➖➖➖➖➖ برای آموزش علم داده به جمع ما بپیوندید: 👇 📊👨‍🏫 @DataPlusScience | @Data➕Science @DataPlusScience
‍ 📚 The Ultimate Guide to Machine Learning Job Interviews | Springboard 💡 کتابچه بی‌نظیر مجموعه پرسش و پاسخ یادگیری ماشین برای آمادگی مصاحبه‌های تخصصی | ۱۲۱ صفحه ➖➖➖➖➖➖➖➖➖➖➖➖ برای آموزش علم داده به جمع ما بپیوندید: 👇 📊👨‍🏫 @DataPlusScience | @Data➕Science @DataPlusScience
‍ 📊 Machine Learning Model Metrics (Classification Metrics) 💡 این جزوه مفید به توضیح مختصر دوازده شاخص انتخاب بهترین الگوریتم‌های طبقه‌بندی می‌پردازد. 🔍 الگوریتم‌های مورد اشاره در این جزوه عبارتند از: - Accuracy - Precision - Recall (Sensitivity or True Positive Rate) - F1-Score - ROC-AUC - PR-AUC - Confusion Matrix - False Positive Rate (FPR) - True Negative Rate (TNR) or Specificity - Matthews Correlation Coefficient (MCC) - Log Loss (Cross-Entropy Loss) - Cohen's Kappa ➖➖➖➖➖➖➖➖➖➖➖➖ برای آموزش علم داده به جمع ما بپیوندید: 👇 📊👨‍🏫 @DataPlusScience | @Data➕Science @DataPlusScience
هزار؛ کتابخانه جامع هوش مصنوعی برای زبان فارسی شامل مدل‌های مختلف برای پردازش متن، صوت، تصویر و … هرچند این عنوانِ خلاصه‌ای برای این پروژه‌ست؛ اگر بخوایم دقیق‌تر توصیف کنیم «هزار» یک کتابخونه و فریموورک برای دموکراتیزه کردن تمام کارهای خفن هوش مصنوعی اعم از مدل، دیتاست، تکنیک‌های پیش‌پردازش و آموزش مدل و … هست که یا قبلا توسط افرادی توی کامیونیتی فارسی انجام شده یا در آینده توسط این کامیونیتی (و به ویژه تیم هزار) انجام می‌شه. در حال حاضر ما توی این پروژه، بیست‌واندی مدل برای کاربردهای مختلفی از جمله speech recognition، OCR، image captioning، masked language modeling، text generation، word embedding و … آموزش دادیم (یا از مدل‌های آموزش داده شده قبلی استفاده کردیم) بعضی از مدلامون در نوع خودشون نوین هستند و تا قبل از این مشابه‌شون به شکل عمومی منتشر نشده (مثل مدل‌هایی که برای image captioning و ocr و speech recognition زدیم) و خب این تازه اول راهمونه و برنامه‌های جدی برای آموزش مدل‌های خیلی خفن‌تر در آینده داریم... توصیه می‌کنم حتما به گیت‌هاب پروژه سر بزنید: github.com/hezarai/hezar 📊👨‍🏫 @DataPlusScience @DataPlusScience
‍ 📝 SQL Basics Cheat Sheet 📝 خلاصه برگ دستورات پایه‌ای SQL ➖➖➖➖➖➖➖➖➖➖➖➖ برای آموزش علم داده به جمع ما بپیوندید: 👇 📊👨‍🏫 @DataPlusScience | @Data➕Science @DataPlusScience
‍ 🌟 یکی از کاربران لینکدین 60 سوال علم داده‌ای از ChatGPT پرسیده که توی این فایل میتونید پرسش‌ها، پاسخ‌ها و که ChatGPT نوشته رو ببینید. ➖➖➖➖➖➖➖➖➖➖➖➖ برای آموزش علم داده به جمع ما بپیوندید: 👇 📊👨‍🏫 @DataPlusScience | @Data➕Science @DataPlusScience