کارخانههای هوشمند و خودروسازی
کارخانههایی که از دوقلوی دیجیتال استفاده میکنند،به مرحلهای از تولید پیشنگرانه و خودبهینهشونده رسیدهاند.بهجای آنکه یک خط مونتاژ ساعتها متوقف شود تا علت نقص مشخص شود،دوقلوی دیجیتال میتواند چند ساعت یا حتی چند روز قبل از وقوع خطا، آن را تشخیص دهد.شرکتهایی مانند Tesla و BMW از این فناوری برای طراحی خودکار قطعات، تحلیل رفتار مصرفکننده، شبیهسازی حوادث جادهای و حتی آموزش الگوریتمهای رانندگی خودران بهره میبرند.
برای مثال، BMW برای هر خودروی جدید،یک دوقلوی دیجیتال اختصاصی میسازد. این مدل نهفقط طراحی خودرو، بلکه عملکرد آن در شرایط محیطی مختلف، واکنش به ترمز ناگهانی، مصرف سوخت، و حتی بازخورد راننده را در خود دارد. بر پایه همین دادهها، بهبودهایی در طراحی بعدی ایجاد میشود و در صورت بروز مشکل در یکی از هزاران خودرو تولیدشده، شرکت میتواند حتی از راه دور برای رفع آن اقدام کند.
زیرساختهای شهری و حملونقل عمومی نیز از دیگر کاربردهای دوقلوی دیجیتال در صنعت و مهندسی در عصر امروز است. در دهه اخیر، مفهوم شهر هوشمند بدون دوقلوی دیجیتال عملاً ناقص است. کشورهایی مانند سنگاپور، انگلستان و امارات، روی ساخت دوقلوی دیجیتال از شهرهای خود سرمایهگذاری کردهاند. این مدلهای شهری شامل شبکه راهها، زیرساخت برق و آب، آمار جمعیتی، سیستمهای حملونقل و حتی تعاملات انسانی در فضاهای عمومی هستند. با داشتن چنین مدلی، شهرداران میتوانند پیش از اجرای یک طرح شهری، نتایج آن را روی دوقلو بررسی کنند؛ مثلاً ببیند اضافه کردن یک خط اتوبوس چه تأثیری روی ترافیک منطقه خواهد گذاشت.
معرفی معماری MoE شبکه های عصبی
معماری (Mixture of Experts) یا به اختصار MoE، رویکردی برای افزایش ظرفیت مدلهای یادگیری عمیق بدون افزایش متناسب هزینه محاسباتی است. در این رویکرد به جای یک مدل یکپارچه (dense) که همه پارامترهای آن برای هر ورودی فعال میشوند، مجموعهای از متخصصها (زیر-شبکههای عصبی تخصصی) وجود دارد که هر کدام بر بخشی از الگوهای داده مسلط میشوند. یک شبکه مسیریاب یا دروازه به عنوان هماهنگکننده عمل کرده و تصمیم میگیرد هر قطعه از ورودی به کدام متخصص (یا چند متخصص برتر) ارسال شود. بدین ترتیب برای هر ورودی تنها کسر کوچکی از پارامترهای کل مدل فعال شده و سایر متخصصها غیرفعال میمانند، که این فعالسازی تُنُک به صرفهجویی محاسباتی و حافظه منجر میشود.
در سالهای اخیر با رشد ابعاد مدلهای زبانی بزرگ (LLMها)، رویکرد MoE دوباره مورد توجه قرار گرفته است. مفهوم کلی همان است که در ابتدای دهه ۹۰ مطرح شد: مدل عظیم را به اجزای کوچکتری تفکیک کنید که هر یک در الگوی خاصی متخصص میشوند و یک مکانیزم دروازهای ورودی را به مناسبترین متخصص هدایت میکند. اولین تحقق مدرن این ایده در مقیاس بزرگ توسط شازیر و همکاران (۲۰۱۷) ارائه شد. آنها لایه MoE تنکی را با هزاران متخصص شبکه عصبی معرفی کردند و نشان دادند که میتوان ظرفیت مدل را به طور قابل توجهی افزایش داد، بیآنکه هزینه محاسباتی به شکل متناسب رشد کند. به این ترتیب، MoE به عنوان شکلی از «محاسبات شرطی» و ensemble پویا، نویدبخش دستیابی به مدلهای بسیار بزرگ با کارایی بالاست.
📱🖥️ 💻 👉@Technopalayesh
https://eitaa.com/technopalayesh
3.9M حجم رسانه بالاست
مشاهده در ایتا
اعمال مهم سفارش شده در شب قدر👇🏻
۱_ سوره واقعه
۲_سوره توحید
۳_هفت مرتبه یا الله
همراهان گرامی امشب خیلی خیلی التماس دعا دارم ازتون
راس دعاهاتون ظهور امام عصر (عج) باشه
پیروزی امت اسلام و شیعه
نابودی آمریکا و اسرائیل
و برای رفع گرفتاری همه گرفتاران
شفای همه مریضا
عاقبت بخیری همه مسلمین
و شادی و برکت همه ملت ایران دعا کنین
انشاءالله سرنوشت هممون به بهترین شکل ممکن برامون رقم بخوره
الهی امین
---------------------------------------------------------
🧠 همراه ما باشید با درگاه تکنوپالایش:
📱🖥️ 💻 👉@Technopalayesh
https://eitaa.com/technopalayesh
7M حجم رسانه بالاست
مشاهده در ایتا
خونه بابامه نجف
آخر دنیامه نجف..❤️🩹
ــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــ
🥀#شب_قدر
🥀#ماه_رمضان
🥀#شهادت_امام_علی
📱🖥️ 💻 👉@Technopalayesh
https://eitaa.com/technopalayesh
جدیدترین مدل چت جیپیتی در دسترس قرار گرفت؛ GPT-5.4 با یک میلیون توکن ورودی
اوپنایآی جدیدترین نسخه از مدل زبانی خود را با پشتیبانی از یک میلیون توکن ورودی (که بزرگترین پنجرهی ورودی پرامپت بین مدلهای زبانی این شرکت تا بهامروز محسوب میشود) و خطاهای کمتر رونمایی کرد.
خالق چتجیپیتی تأکید میکند که مدل زبانی ۵٫۴ علاوهبر افزایش تعداد توکنهای ورودی، میتواند درخواستهای مشابه را با توکنهای بسیار کمتری درمقایسهبا نسخهی پیشین خود مرتفع کند.
مدل زبانی GPT-5.4 پیشرفت عملکردی چشمگیری را نیز تجربه میکند؛ بهعنوان مثال میتوان به دستیابی به امتیاز بیسابقهی ۸۳ درصد در وظایف مربوط به دانش در آزمون GDPval اشاره کرد. این مدل در بنچمارکهای OSWorld-Verified و WebArena Verified نیز امتیازات خیرهکنندهای بهدست آورده است.
اوپنایآی میگوید مدل زبانی ۵٫۴ کمتر از گذشته دچار توهم و خطا میشود؛ بهعنوان مثال این مدل درمقایسهبا مدل ۵٫۲ تا ۳۳درصد کمتر در ادعاهای فردی خطا میکند و احتمال وجود خطا در پاسخهای کلی آن ۱۸ درصد کاهش یافته؛ از سوی دیگر، ارزیابی جدید اوپنایآی نشان میدهد احتمال فریب در نسخهی Thinking مدل GPT-5.4 کمتر است.
---------------------------------------------------------
🧠 همراه ما باشید با درگاه تکنوپالایش:
📱🖥️ 💻 👉@Technopalayesh
https://eitaa.com/technopalayesh
انواع روشهای آموزش مدلهای زبانی
در سالهای اخیر، مدلهای زبانی بزرگ به ابزارهایی قدرتمند در پردازش زبان طبیعی تبدیل شدهاند. با این حال، تنظیم کامل این مدلها برای وظایف خاص بهدلیل مقیاس بزرگ، نیازمند منابع محاسباتی بسیار زیاد است. برای کاهش بار محاسباتی و بهینهسازی مصرف حافظه، مجموعهای از روشهای تنظیم کارآمد پارامتر (یا PEFT) توسعه یافتهاند که تنها بخشی از مدل را آموزش میدهند یا پارامترهای اضافی کوچکی به آن اضافه میکنند. این روشها نه تنها حافظه و زمان آموزش را کاهش میدهند، بلکه امکان تنظیم مدلهای بسیار بزرگ را در دستگاههایی با منابع محدود فراهم میسازند.
در ادامه، روشهای رایج تنظیم مدلهای زبانی شامل Full Fine-tuning، LoRA، Adapter Tuning، Prefix Tuning و Prompt Tuning بهاختصار معرفی و مقایسه میشوند.
Full Fine-tuning
در تنظیم کامل، کلیه پارامترهای مدل روی دادههای جدید بازآموزی میشوند. این روش، بالاترین کیفیت تطبیق با دادهها را دارد و بیشترین دقت را ارائه میدهد. اما در عین حال، به دلیل نیاز به ذخیره و پردازش تمام وزنها، به منابع سختافزاری بسیار قدرتمند نیاز دارد. همچنین، برای هر وظیفه جدید باید یک نسخه کامل از مدل ذخیره شود که از نظر حافظه و مقیاسپذیری ناکارآمد است.
LoRA( Low-Rank Adaptation)
LoRA یکی از موفقترین روشهای PEFT است که با افزودن دو ماتریس کمرتبه به وزنهای مدل، تغییرات لازم را اعمال میکند. در این روش، پارامترهای مدل اصلی ثابت باقی میمانند و تنها ماتریسهای کمحجم یادگیری میشوند. به همین دلیل، LoRA با وجود مصرف بسیار پایین منابع، عملکردی همتراز با تنظیم کامل ارائه میدهد. یکی از مزیت های این روش آموزش، این مورد است که می توان برای ترکیب کردن LoRA های متفاوت بر روی آنها عملیات ریاضی انجام داد.
Adapter Tuning
در این روش، ماژولهای کوچکی به نام آداپتور بین لایههای مدل اضافه میشوند. فقط این ماژولها آموزش داده شده و وزنهای اصلی مدل بدون تغییر باقی میمانند. مزیت اصلی این روش، امکان استفاده مشترک از مدل پایه برای چندین وظیفه و ذخیره تنها وزنهای آداپتور برای هر وظیفه است. آداپتورها تعادل خوبی میان کارایی، حافظه و دقت ایجاد میکنند.
Prefix Tuning
در تنظیم پیشوندی، تعدادی بردار قابلآموزش به عنوان “پیشوند” به ورودی هر لایه مدل تزریق میشوند. این پیشوندها بدون تغییر در وزنهای اصلی مدل، میتوانند رفتار شبکه را برای وظیفه خاصی تغییر دهند. این روش در مدلهای بسیار بزرگ، عملکردی نزدیک به تنظیم کامل دارد، اما پیادهسازی آن به مداخله در ساختار لایهها نیاز دارد.
Prompt Tuning
در سادهترین روش تنظیم، تنها چند بردار به ابتدای ورودی مدل اضافه میشوند که در طی آموزش، مقدار آنها تنظیم میگردد. این توکنهای مجازی باعث هدایت مدل به سمت انجام وظیفه خاص میشوند. روش Prompt Tuning بسیار سبک است و به هیچگونه تغییر در ساختار مدل نیاز ندارد، اما عملکرد آن در مدلهای کوچکتر معمولاً پایینتر از سایر روشهاست.
---------------------------------------------------------
🧠 همراه ما باشید با درگاه تکنوپالایش:
📱🖥️ 💻 👉@Technopalayesh
https://eitaa.com/technopalayesh
🖤 یک عمل ساده برای امروز
به نیت امام علی علیهالسلام
امروز که روز شهادت مولای عدالت است…
بیایید یک کار خیلی ساده انجام بدهیم.
امروز دل هیچکس را نشکنیم.
اگر کسی اشتباه کرد، کمی گذشت کنیم.
اگر کسی ناراحت بود، کمی مهربانتر باشیم.
اگر توانستیم، حتی با یک پیام یا یک لبخند دل کسی را شاد کنیم. 🤍
امام علی(ع) فرمودند:
«بهترین کارها شاد کردن دل مؤمن است.»
امروز به نیت مولایمان
فقط یک دل را شاد کنیم
┈┈••✾🍃🏴🏴🏴🏴🏴🍃✾••┈┈
📱🖥️ 💻 👉@Technopalayesh
https://eitaa.com/technopalayesh
راهنمای آمادهسازی کوله نجات در شرایط اضطراری
در این گزارش، فهرستی از مهمترین ابزارهای ضروری را که باید در کیف اضطراری خود بگذارید مرور میکنیم. در این مطلب تمرکز ویژهای هم بر گجتها و تجهیزات قابلحملی داشتهایم که برای حفظ ارتباط، روشنایی، سلامت و اطلاعات حیاتی مفید و کاربردی هستند.
* آب و غذا: آب آشامیدنی، غذاهای آماده و کمحجم با ماندگاری بالا (کنسروها، آجیل، بیسکویت انرژیزا و...).
* کمکهای اولیه: شامل باند، گاز استریل، چسب زخم، مسکن، دارو و پد بهداشتی.
* منبع تغذیه و روشنایی: پاوربانک، چراغ قوه و باتری اضافی (همراه با هدلامپ).
* مدارک: فلش USB با مدارک رمزنگاریشده، یا حداقل نسخهای کاغذی.
* اطلاعات: رادیو قابل حمل (با باتری یا شارژی).
* علامترسانی: سوت و آینه کوچک برای جلب توجه امدادگران.
* گوشی: یک گوشی ساده هم برای مواقع اضطراری.
* پول نقد: برای مواقعی که کارتهای بانکی کار نمیکنند.
* لباس و پتو: پتو سبک و لباس کم حجم
توصیه نهایی: این کوله را آماده نگه دارید و در دسترس بگذارید. آمادهسازی این کوله میتواند به کاهش استرس و افزایش شانس بقا شما کمک کند.
تکنوپالایش | 🇮🇷 Ai
معرفی معماری MoE شبکه های عصبی معماری (Mixture of Experts) یا به اختصار MoE، رویکردی برای افزایش ظر
مدلهای MoE جدید
در یکی دو سال اخیر، موج جدیدی از مدلهای زبانی بزرگ – چه متنباز و چه تجاری – از معماری MoE برای دستیابی به ظرفیت بالا همراه با کارایی بهتر استفاده کردهاند. در این بخش به یک نمونهی شاخص از این مدلها و معماری آن میپردازیم:
مدل زبانی DeepSeekMoE (2024) یک معماری پیشرفته که توانسته است مدلهای عظیم را با هزینهی پایینتر آموزش دهد. مدلهای سری DeepSeek از جمله DeepSeek-R1/V3 با بهکارگیری MoE توانستند به ابعاد بیسابقهای برسند؛ به طور مثال DeepSeek-V3 حدود ۶۷۱ میلیارد پارامتر دارد اما تنها ~۳۷ میلیارد پارامتر را برای هر توکن فعال میکند. این نسبت (حدود ۵٪ پارامترهای فعال) در مقایسه با مدلهای متراکم بسیار چشمگیر است. نتیجه آن است که DeepSeek-R1 با چنین حجمی توانست در سال ۲۰۲۵ عنوان قویترین مدل متنباز را کسب کند و عملاً به مدت چهار ماه در رتبهی نخست مدلهای متنباز قرار گیرد. دستاورد دیگر DeepSeek، طراحی مشترک سختافزار-نرمافزار برای کاهش هزینهی آموزش بود؛ گزارشها نشان میدهد DeepSeek-V3 تنها با ۲۰۴۸ پردازنده گرافیکی Nvidia H800 آموزش داده شد که در مقایسه با خوشههای عظیم دهها هزار واحدی شرکتهای بزرگ، یک موفقیت مهم محسوب میشود. همچنین معماری DeepSeekMoE با معرفی مفاهیمی مانند مکانیزم مسیریابی تطبیقی، تلاش کرده بهرهوری MoE را به حداکثر برساند.
🤲 این دعا رو برای نصرت سربازان جان برکفمون زیاد تکرار کنیم.
┈┈••✾🍃🏴🏴🏴🍃✾••┈┈
📱🖥️ 💻 👉@Technopalayesh
https://eitaa.com/technopalayesh