ویرایش سوم کتاب فوق العاده Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow
انتشار سال 2023
مهمترین تغییرات نسبت به ویرایش دوم کتاب:
معرفی ویژگی های جدید Scikit-Learn
معرفی کتابخانه Transformers Hugging Face برای پردازش زبان طبیعی
اضافه شدن چندین مدل بینایی (ResNeXt، DenseNet، MobileNet، CSPNet و EfficientNet)
بعلاوه اینکه فصل های جدیدی در این ویرایش اضافه شده است که به موضوعاتی مانند مدل های بینایی، ترجمه زبان طبیعی و یادگیری generative می پردازند
📊 @DataPlusScience | @Data➕Science
دانلود در پست بعدی 👇👇
@DataPlusScience
Data ➕ Science
ویرایش سوم کتاب فوق العاده Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow انتشار
@DataPlusScience_2023_Hands_On_Machine_Learning_with_Scikit_Learn.pdf
21.62M
ویرایش سوم کتاب فوق العاده Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow
انتشار سال 2023
مهمترین تغییرات نسبت به ویرایش دوم کتاب:
معرفی ویژگی های جدید Scikit-Learn
معرفی کتابخانه Transformers Hugging Face برای پردازش زبان طبیعی
اضافه شدن چندین مدل بینایی (ResNeXt، DenseNet، MobileNet، CSPNet و EfficientNet)
بعلاوه اینکه فصل های جدیدی در این ویرایش اضافه شده است که به موضوعاتی مانند مدل های بینایی، ترجمه زبان طبیعی و یادگیری generative می پردازند
📊 @DataPlusScience | @Data➕Science
@DataPlusScience
🟢 امالآپس (MLOps) به زبان ساده همراه با معرفی کتاب
🔴 کسانی که با فرایندها و الگوریتمهای یادگیری ماشین در محیط واقعی کار کردند و آشنا هستند و یا اصلن برای دل خودشون مدلی آموزش دادند، حتمن با چالشهای زیر برخورد کردند؛
🔴 بعنوان مثال، هایپرپارامترهایی رو تغییر دادند و بعد یادشون رفته کدوم مدل با کدوم هایپرپارامتر چه درصدی از دقت رو بهشون داده یا اون هایپرپارامترها چی بودند؟
🔴 یا برای دیتاستهاشون ورژنی نداشتند و نمیدونستند دیتای جدید که اضافه کردند رو جدا کنند یا مجبور بودند چندین کپی از دیتاهای تکراری نگهدارند. یا وقتی با شخص دیگری کار میکردند، دادههاشون با هم سینک (هماهنگ) نبوده و هزاران مشکل دیگر.
🔵 درواقع اینجاست که
Machine Learning Operations (MLOps)
برای این مشکلات راه حل میده و میگه همونجوری که ما در گذشته مهندسی نرم افزار نداشتم و با اومدن مهندسی نرم افزار و راه حلهاش مثل
version control
کلی از مشکلات برنامه نویسها حل شد، امالآپس و داشتن یه چرخهی اتوماتیک از امورات مختلف ولی هماهنگ، باعث حل کلی از این قبیل مشکلات میشود.
🔵 بطور کلی امالآپس داشتن یک
Lifecycle
یا چرخهی حیات (تولید) منظم برای مراحل و مشکلات مختلف در فرایند لرنینگ یا همون آموزش هست. همچنین یکی دیگه از دغدغههای امالآپس رسوندن مدل یادگیری ماشین از چند خط کد ساده به یک محصول ملموس هست.
🟡 در پایان اینرو هم اضافه کنم. میتونیم بگیم که امالآپس از ترکیب سه حوزهی زیر ایجاد شده؛
- مهندسی داده (Data Engineering)
- توسعهی نرمافزار و عملیات آیتی (DevOps)
- یادگیری ماشین (Machine Learning)
🟤 کتاب
Introducing MLOps
که تنها در ۱۸۵ صفحه تنظیم شده، و در سال ۲۰۲۰ به چاپ رسیده است، یکی از کتابهای بسیار عالی برای ورود به دنیای امالآپس میباشد.
🆔 @data_science_python_and_r
@DataPlusScience
Mark_Treveil,_Nicolas_Omont,_Clément_Stenac,_Kenji_Lefevre,_Du_P.pdf
14.27M
Introducing MLOps
که تنها در ۱۸۵ صفحه تنظیم شده، و در سال ۲۰۲۰ به چاپ رسیده است، یکی از کتابهای بسیار عالی برای ورود به دنیای امالآپس میباشد.
🆔 @data_science_python_and_r
@DataPlusScience
@DataScience_ir - Data Science Pocket Dictionary.pdf
584.3K
🔴 دیکشنری جیبی علوم داده
📚 اصطلاحات ضروری علوم داده
👨🏻💻 اگه دنبال یک دیکشنری جیبی هستین که تمام اصطلاحات ضروری و تخصصی علوم داده رو براتون پوشش بده، این راهنما برای شماست. این دیکشنری جیبی منبع ارزشمندی برای دانشمندان داده مبتدی و با تجربهاس که میتونند ازش برای مصاحبههای شغلی یا پروژههای کاریشون در هر مکان و زمانی استفاده کنند.💯
#️⃣ #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📎 @DataScience_ir
@DataPlusScience
Free Course | ChatGPT for Data Analytics
دوره رایگان چت جیچیتی برای دیتا آنالیتیکس
سرفصلهای دوره:
Why AI for Data Analytics?
Intro to AI, LLMs & ChatGPT
Prompt Engineering
ChatGPT for Excel
ChatGPT for Google Sheets
ChatGPT for Power BI
ChatGPT for SQL
ChatGPT for Python
مدرس دوره هم آقای کریس داتون هستند
http://zaya.io/2zk88
📊 @DataPlusScience | @Data➕Science
@DataPlusScience
@DataPlusScience__ML Using Python.pdf
3.11M
MACHINE LEARNING WITH PYTHON
جزوه مفید و مصور آموزش یادگیری ماشین در پایتون
📊 @DataPlusScience | @Data➕Science
@DataPlusScience
توسعه چتبات از دادههای شخصی با استفاده از LangChain
https://learn.deeplearning.ai/langchain-chat-with-your-data
📊 @DataPlusScience | @Data➕Science
@DataPlusScience
فعلا قابلیت پخش رسانه در مرورگر فراهم نیست
مشاهده در پیام رسان ایتا
موسسه نواوری تکنولوژی کشور امارات نسخه جدیدی از مدل زبانی بزرگ Falcon رو عرضه کرده که 180 میلیارد پارامتر داره و در تستها نه تنها از مدل متن باز LLaMA 2 متا بهتر عمل کرده بلکه از مدلهای متن بسته مثل PaLM گوگل (که نسخه اول بارد از اون استفاده میکرد) و نسخه کوچک و متوسط PaLM 2 عملکرد بهتری داره و فقط پشت مدلهایی مثل نسخه جدید بارد و GPT-4 قرار میگیره.
این مدل به صورت متن باز عرضه شده و شرکتها میتونن اون روی سخت افزار خودشون اجرا کنن یا تمرین بدن ولی به دلیل بزرگ بودن نیاز به حداقل 8 کارت گرافیک A100 40GB برای اجرای اون دارن.
این مدل رو میتونید از اینجا به صورت انلاین و رایگان ازمایش کنید.
🔎 Huggingface.co
📍 @TechTube
@DataPlusScience
@DataPlusScience_NLP Transformers.pdf
6.38M
مدلهای ترنسفورمری چطور کار کرده و در مدلهای بزرگ زبانی استفاده میشوند؟
How is the transformer work, and how is it used in many large language models?
📊 @DataPlusScience | @Data➕Science
@DataPlusScience
@DataPlusScience_Handwritten Machine Learning Notes..pdf
69.23M
Handwritten Machine Learning Notes
جزوه دستنویس و مفصل یادگیری ماشین
📊 @DataPlusScience | @Data➕Science
@DataPlusScience
Scope of AI, Deep Learning, and Machine Learning
📊 @DataPlusScience | @Data➕Science
@DataPlusScience
@DataPlusScience _large language models.pdf
5.45M
داکیومنتی عالی برای آشنایی با مفاهیم مدلهای بزرگ زبانی (LLM)
📊 @DataPlusScience | @Data➕Science
@DataPlusScience
Data ➕ Science
داکیومنتی عالی برای آشنایی با مفاهیم مدلهای بزرگ زبانی (LLM) 📊 @DataPlusScience | @Data➕Science
A timeline of existing large language models
تایملاین معرفی مدلهای بزرگ زبانی
📊 @DataPlusScience | @Data➕Science
@DataPlusScience
@DataPlusScience_ Machine Learning Cheatsheets.pdf
8.49M
Machine Learning Cheatsheets
مجموعه ای ارزشمند از خلاصهبرگهای یادگیری ماشین مشتمل بر:
🌟 NumPy Basics
🐼 pandas
🔧 Data Wrangling with pandas
📊 Data Visualization with ggplot2
🌊 Seaborn
📈 Matplotlib
🤖 TensorFlow
🔬 Scikit-Learn
🔬 SciPy
🚀 PySpark
🤖 Keras
🧠 neural network
📊 @DataPlusScience | @Data➕Science
@DataPlusScience
📙 #کتاب_فارسی
یادگیری عمیق: از اصول اولیه تا ساخت شبکههای عصبی عمیق با پایتون
📝 نگارنده: میلاد وزان
📖 سرفصلها:
- مقدمهای بر یادگیری عمیق
- شبکههای عصبی پیشخور
- شبکههای عصبی کانولوشنی
- شبکههای عصبی بازگشتی
- شبکه متخاصم مولد
🆓 این کتاب به رایگان و توسط نگارنده منتشر شده است.
📊 @DataPlusScience | @Data➕Science
@DataPlusScience
📘📈 Effective Pandas | Matt Harrison
کتاب Effective Pandas بدون شک یکی از بهترین منابع برای یادگیری کتابخانه Pandas است. 🙌
مطالعه و تمرین این کتاب را به همه دوستانی که میخواهند مهارت پانداز را کسب کنند توصیه می کنیم. 🔝
➖➖➖➖➖➖➖➖➖➖➖➖
برای آموزش علم داده به جمع ما بپیوندید: 👇
📊👨🏫 @DataPlusScience | @Data➕Science
@DataPlusScience
📝💼 Business Analysis cheat sheet
خلاصه برگ 14 صفحه ای بسیار کاربردی تحلیلگری کسبوکار
➖➖➖➖➖➖➖➖➖➖➖➖
برای آموزش علم داده به جمع ما بپیوندید: 👇
📊👨🏫 @DataPlusScience | @Data➕Science
@DataPlusScience
🎁 جزوه دستنویس داده کاوی و یادگیری ماشین مقدماتی جناب دکتر کاویانی
➖➖➖➖➖➖➖➖➖➖➖➖
برای آموزش علم داده به جمع ما بپیوندید: 👇
📊👨🏫 @DataPlusScience | @Data➕Science
@DataPlusScience
📌 ChatGPT cheat sheet for Data Science | Data Camp
📚 راهنمای استفاده از ChatGPT در علوم داده
👨🏫 کاری از Data Camp
➖➖➖➖➖➖➖➖➖➖➖➖
برای آموزش علم داده به جمع ما بپیوندید: 👇
📊👨🏫 @DataPlusScience | @Data➕Science
@DataPlusScience
📚 The Ultimate Guide to Machine Learning Job Interviews | Springboard
💡 کتابچه بینظیر مجموعه پرسش و پاسخ یادگیری ماشین برای آمادگی مصاحبههای تخصصی | ۱۲۱ صفحه
➖➖➖➖➖➖➖➖➖➖➖➖
برای آموزش علم داده به جمع ما بپیوندید: 👇
📊👨🏫 @DataPlusScience | @Data➕Science
@DataPlusScience
📊 Machine Learning Model Metrics (Classification Metrics)
💡 این جزوه مفید به توضیح مختصر دوازده شاخص انتخاب بهترین الگوریتمهای طبقهبندی میپردازد.
🔍 الگوریتمهای مورد اشاره در این جزوه عبارتند از:
- Accuracy
- Precision
- Recall (Sensitivity or True Positive Rate)
- F1-Score
- ROC-AUC
- PR-AUC
- Confusion Matrix
- False Positive Rate (FPR)
- True Negative Rate (TNR) or Specificity
- Matthews Correlation Coefficient (MCC)
- Log Loss (Cross-Entropy Loss)
- Cohen's Kappa
➖➖➖➖➖➖➖➖➖➖➖➖
برای آموزش علم داده به جمع ما بپیوندید: 👇
📊👨🏫 @DataPlusScience | @Data➕Science
@DataPlusScience
هزار؛ کتابخانه جامع هوش مصنوعی برای زبان فارسی شامل مدلهای مختلف برای پردازش متن، صوت، تصویر و …
هرچند این عنوانِ خلاصهای برای این پروژهست؛ اگر بخوایم دقیقتر توصیف کنیم «هزار» یک کتابخونه و فریموورک برای دموکراتیزه کردن تمام کارهای خفن هوش مصنوعی اعم از مدل، دیتاست، تکنیکهای پیشپردازش و آموزش مدل و … هست که یا قبلا توسط افرادی توی کامیونیتی فارسی انجام شده یا در آینده توسط این کامیونیتی (و به ویژه تیم هزار) انجام میشه.
در حال حاضر ما توی این پروژه، بیستواندی مدل برای کاربردهای مختلفی از جمله speech recognition، OCR، image captioning، masked language modeling، text generation، word embedding و … آموزش دادیم (یا از مدلهای آموزش داده شده قبلی استفاده کردیم)
بعضی از مدلامون در نوع خودشون نوین هستند و تا قبل از این مشابهشون به شکل عمومی منتشر نشده (مثل مدلهایی که برای image captioning و ocr و speech recognition زدیم) و خب این تازه اول راهمونه و برنامههای جدی برای آموزش مدلهای خیلی خفنتر در آینده داریم...
توصیه میکنم حتما به گیتهاب پروژه سر بزنید:
github.com/hezarai/hezar
📊👨🏫 @DataPlusScience
@DataPlusScience
📝 SQL Basics Cheat Sheet
📝 خلاصه برگ دستورات پایهای SQL
➖➖➖➖➖➖➖➖➖➖➖➖
برای آموزش علم داده به جمع ما بپیوندید: 👇
📊👨🏫 @DataPlusScience | @Data➕Science
@DataPlusScience