eitaa logo
تکنوپالایش | 🇮🇷 Ai
5.5هزار دنبال‌کننده
1.3هزار عکس
824 ویدیو
26 فایل
ارائه مطالب آموزشی، اطلاع از آخرین رویدادها،اخبار ، آشنایی با پروژه های مرتبط با هوش مصنوعی لینک کانال https://eitaa.com/technopalayesh
مشاهده در ایتا
دانلود
کارخانه‌های هوشمند و خودروسازی کارخانه‌هایی که از دوقلوی دیجیتال استفاده می‌کنند،به مرحله‌ای از تولید پیش‌نگرانه و خودبهینه‌شونده رسیده‌اند.به‌جای آنکه یک خط مونتاژ ساعت‌ها متوقف شود تا علت نقص مشخص شود،دوقلوی دیجیتال می‌تواند چند ساعت یا حتی چند روز قبل از وقوع خطا، آن را تشخیص دهد.شرکت‌هایی مانند Tesla و BMW از این فناوری برای طراحی خودکار قطعات، تحلیل رفتار مصرف‌کننده، شبیه‌سازی حوادث جاده‌ای و حتی آموزش الگوریتم‌های رانندگی خودران بهره می‌برند. برای مثال، BMW برای هر خودروی جدید،یک دوقلوی دیجیتال اختصاصی می‌سازد. این مدل نه‌فقط طراحی خودرو، بلکه عملکرد آن در شرایط محیطی مختلف، واکنش به ترمز ناگهانی، مصرف سوخت، و حتی بازخورد راننده را در خود دارد. بر پایه همین داده‌ها، بهبودهایی در طراحی بعدی ایجاد می‌شود و در صورت بروز مشکل در یکی از هزاران خودرو تولیدشده، شرکت می‌تواند حتی از راه دور برای رفع آن اقدام کند. زیرساخت‌های شهری و حمل‌ونقل عمومی نیز از دیگر کاربردهای دوقلوی دیجیتال در صنعت و مهندسی در عصر امروز است. در دهه اخیر، مفهوم شهر هوشمند بدون دوقلوی دیجیتال عملاً ناقص است. کشورهایی مانند سنگاپور، انگلستان و امارات، روی ساخت دوقلوی دیجیتال از شهرهای خود سرمایه‌گذاری کرده‌اند. این مدل‌های شهری شامل شبکه راه‌ها، زیرساخت برق و آب، آمار جمعیتی، سیستم‌های حمل‌ونقل و حتی تعاملات انسانی در فضاهای عمومی هستند. با داشتن چنین مدلی، شهرداران می‌توانند پیش از اجرای یک طرح شهری، نتایج آن را روی دوقلو بررسی کنند؛ مثلاً ببیند اضافه کردن یک خط اتوبوس چه تأثیری روی ترافیک منطقه خواهد گذاشت.
معرفی معماری MoE شبکه های عصبی معماری (Mixture of Experts) یا به اختصار MoE، رویکردی برای افزایش ظرفیت مدل‌های یادگیری عمیق بدون افزایش متناسب هزینه محاسباتی است. در این رویکرد به جای یک مدل یکپارچه (dense) که همه پارامترهای آن برای هر ورودی فعال می‌شوند، مجموعه‌ای از متخصص‌ها (زیر-شبکه‌های عصبی تخصصی) وجود دارد که هر کدام بر بخشی از الگوهای داده مسلط می‌شوند. یک شبکه مسیر‌یاب یا دروازه به عنوان هماهنگ‌کننده عمل کرده و تصمیم می‌گیرد هر قطعه از ورودی به کدام متخصص (یا چند متخصص برتر) ارسال شود. بدین ترتیب برای هر ورودی تنها کسر کوچکی از پارامترهای کل مدل فعال شده و سایر متخصص‌ها غیرفعال می‌مانند، که این فعال‌سازی تُنُک به صرفه‌جویی محاسباتی و حافظه منجر می‌شود. در سال‌های اخیر با رشد ابعاد مدل‌های زبانی بزرگ (LLMها)، رویکرد MoE دوباره مورد توجه قرار گرفته است. مفهوم کلی همان است که در ابتدای دهه ۹۰ مطرح شد: مدل عظیم را به اجزای کوچک‌تری تفکیک کنید که هر یک در الگوی خاصی متخصص می‌شوند و یک مکانیزم دروازه‌ای ورودی را به مناسب‌ترین متخصص هدایت می‌کند. اولین تحقق مدرن این ایده در مقیاس بزرگ توسط شازیر و همکاران (۲۰۱۷) ارائه شد. آن‌ها لایه‌ MoE تنکی را با هزاران متخصص‌ شبکه‌ عصبی معرفی کردند و نشان دادند که می‌توان ظرفیت مدل را به طور قابل توجهی افزایش داد، بی‌آن‌که هزینه محاسباتی به شکل متناسب رشد کند. به این ترتیب، MoE به عنوان شکلی از «محاسبات شرطی» و ensemble پویا، نویدبخش دستیابی به مدل‌های بسیار بزرگ با کارایی بالاست. 📱🖥️ 💻 👉@Technopalayesh https://eitaa.com/technopalayesh
3.9M حجم رسانه بالاست
مشاهده در ایتا
اعمال مهم سفارش شده در شب قدر👇🏻 ۱_ سوره واقعه ۲_سوره توحید ۳_هفت مرتبه یا الله همراهان گرامی امشب خیلی خیلی التماس دعا دارم ازتون راس دعاهاتون ظهور امام عصر (عج) باشه پیروزی امت اسلام و شیعه نابودی آمریکا و اسرائیل و برای رفع گرفتاری همه گرفتاران شفای همه مریضا عاقبت بخیری همه مسلمین و شادی و برکت همه ملت ایران دعا کنین انشاءالله سرنوشت هممون به بهترین شکل ممکن برامون رقم بخوره الهی امین --------------------------------------------------------- 🧠 همراه ما باشید با درگاه تکنوپالایش: 📱🖥️ 💻 👉@Technopalayesh https://eitaa.com/technopalayesh
فعلا قابلیت بارگیری به دلیل درخواست زیاد فراهم نیست
نمایش در ایتا
7M حجم رسانه بالاست
مشاهده در ایتا
خونه بابامه نجف آخر دنیامه نجف..❤️‍🩹 ــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــ 🥀 🥀 🥀 📱🖥️ 💻 👉@Technopalayesh https://eitaa.com/technopalayesh
جدیدترین مدل چت جی‌پی‌تی در دسترس قرار گرفت؛ GPT-5.4 با یک میلیون توکن ورودی اوپن‌ای‌آی جدیدترین نسخه از مدل زبانی خود را با پشتیبانی از یک میلیون توکن ورودی (که بزرگ‌ترین پنجره‌ی ورودی پرامپت بین مدل‌های زبانی این شرکت تا به‌امروز محسوب می‌شود) و خطاهای کمتر رونمایی کرد. خالق چت‌جی‌پی‌تی تأکید می‌کند که مدل زبانی ۵٫۴ علاوه‌بر افزایش تعداد توکن‌های ورودی، می‌تواند درخواست‌های مشابه را با توکن‌های بسیار کمتری درمقایسه‌با نسخه‌ی پیشین خود مرتفع کند. مدل زبانی GPT-5.4 پیشرفت عملکردی چشم‌گیری را نیز تجربه می‌کند؛ به‌عنوان مثال می‌توان به دستیابی به امتیاز بی‌سابقه‌ی ۸۳ درصد در وظایف مربوط به دانش در آزمون GDPval اشاره کرد. این مدل در بنچمارک‌های OSWorld-Verified و WebArena Verified نیز امتیازات خیره‌کننده‌ای به‌دست آورده است. اوپن‌ای‌آی می‌گوید مدل زبانی ۵٫۴ کمتر از گذشته دچار توهم و خطا می‌شود؛ به‌عنوان مثال این مدل درمقایسه‌با مدل ۵٫۲ تا ۳۳درصد کمتر در ادعاهای فردی خطا می‌کند و احتمال وجود خطا در پاسخ‌های کلی آن ۱۸ درصد کاهش یافته؛ از سوی دیگر، ارزیابی جدید اوپن‌ای‌آی نشان می‌دهد احتمال فریب در نسخه‌ی Thinking مدل GPT-5.4 کمتر است. --------------------------------------------------------- 🧠 همراه ما باشید با درگاه تکنوپالایش: 📱🖥️ 💻 👉@Technopalayesh https://eitaa.com/technopalayesh
فعلا قابلیت بارگیری به دلیل درخواست زیاد فراهم نیست
نمایش در ایتا
انواع روشهای آموزش مدل‌های زبانی در سال‌های اخیر، مدل‌های زبانی بزرگ به ابزارهایی قدرتمند در پردازش زبان طبیعی تبدیل شده‌اند. با این حال، تنظیم کامل این مدل‌ها برای وظایف خاص به‌دلیل مقیاس بزرگ، نیازمند منابع محاسباتی بسیار زیاد است. برای کاهش بار محاسباتی و بهینه‌سازی مصرف حافظه، مجموعه‌ای از روش‌های تنظیم کارآمد پارامتر (یا PEFT) توسعه یافته‌اند که تنها بخشی از مدل را آموزش می‌دهند یا پارامترهای اضافی کوچکی به آن اضافه می‌کنند. این روش‌ها نه تنها حافظه و زمان آموزش را کاهش می‌دهند، بلکه امکان تنظیم مدل‌های بسیار بزرگ را در دستگاه‌هایی با منابع محدود فراهم می‌سازند. در ادامه، روش‌های رایج تنظیم مدل‌های زبانی شامل Full Fine-tuning، LoRA، Adapter Tuning، Prefix Tuning و Prompt Tuning به‌اختصار معرفی و مقایسه می‌شوند. Full Fine-tuning در تنظیم کامل، کلیه پارامترهای مدل روی داده‌های جدید بازآموزی می‌شوند. این روش، بالاترین کیفیت تطبیق با داده‌ها را دارد و بیشترین دقت را ارائه می‌دهد. اما در عین حال، به دلیل نیاز به ذخیره و پردازش تمام وزن‌ها، به منابع سخت‌افزاری بسیار قدرتمند نیاز دارد. همچنین، برای هر وظیفه جدید باید یک نسخه کامل از مدل ذخیره شود که از نظر حافظه و مقیاس‌پذیری ناکارآمد است. LoRA( Low-Rank Adaptation) LoRA یکی از موفق‌ترین روش‌های PEFT است که با افزودن دو ماتریس کم‌رتبه به وزن‌های مدل، تغییرات لازم را اعمال می‌کند. در این روش، پارامترهای مدل اصلی ثابت باقی می‌مانند و تنها ماتریس‌های کم‌حجم یادگیری می‌شوند. به همین دلیل، LoRA با وجود مصرف بسیار پایین منابع، عملکردی هم‌تراز با تنظیم کامل ارائه می‌دهد. یکی از مزیت های این روش آموزش، این مورد است که می توان برای ترکیب کردن LoRA های متفاوت بر روی آنها عملیات ریاضی انجام داد. Adapter Tuning در این روش، ماژول‌های کوچکی به نام آداپتور بین لایه‌های مدل اضافه می‌شوند. فقط این ماژول‌ها آموزش داده شده و وزن‌های اصلی مدل بدون تغییر باقی می‌مانند. مزیت اصلی این روش، امکان استفاده مشترک از مدل پایه برای چندین وظیفه و ذخیره تنها وزن‌های آداپتور برای هر وظیفه است. آداپتورها تعادل خوبی میان کارایی، حافظه و دقت ایجاد می‌کنند. Prefix Tuning در تنظیم پیشوندی، تعدادی بردار قابل‌آموزش به عنوان “پیشوند” به ورودی هر لایه مدل تزریق می‌شوند. این پیشوندها بدون تغییر در وزن‌های اصلی مدل، می‌توانند رفتار شبکه را برای وظیفه خاصی تغییر دهند. این روش در مدل‌های بسیار بزرگ، عملکردی نزدیک به تنظیم کامل دارد، اما پیاده‌سازی آن به مداخله در ساختار لایه‌ها نیاز دارد. Prompt Tuning در ساده‌ترین روش تنظیم، تنها چند بردار به ابتدای ورودی مدل اضافه می‌شوند که در طی آموزش، مقدار آن‌ها تنظیم می‌گردد. این توکن‌های مجازی باعث هدایت مدل به سمت انجام وظیفه خاص می‌شوند. روش Prompt Tuning بسیار سبک است و به هیچ‌گونه تغییر در ساختار مدل نیاز ندارد، اما عملکرد آن در مدل‌های کوچک‌تر معمولاً پایین‌تر از سایر روش‌هاست. --------------------------------------------------------- 🧠 همراه ما باشید با درگاه تکنوپالایش: 📱🖥️ 💻 👉@Technopalayesh https://eitaa.com/technopalayesh
🖤 یک عمل ساده برای امروز به نیت امام علی علیه‌السلام امروز که روز شهادت مولای عدالت است… بیایید یک کار خیلی ساده انجام بدهیم. امروز دل هیچ‌کس را نشکنیم. اگر کسی اشتباه کرد، کمی گذشت کنیم. اگر کسی ناراحت بود، کمی مهربان‌تر باشیم. اگر توانستیم، حتی با یک پیام یا یک لبخند دل کسی را شاد کنیم. 🤍 امام علی(ع) فرمودند: «بهترین کارها شاد کردن دل مؤمن است.» امروز به نیت مولایمان فقط یک دل را شاد کنیم ‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌ ‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌┈┈••✾🍃🏴🏴🏴🏴🏴🍃✾••┈┈ 📱🖥️ 💻 👉@Technopalayesh https://eitaa.com/technopalayesh
راهنمای آماده‌سازی کوله نجات در شرایط اضطراری در این گزارش، فهرستی از مهم‌ترین ابزارهای ضروری را که باید در کیف اضطراری خود بگذارید مرور می‌کنیم. در این مطلب تمرکز ویژه‌ای هم بر گجت‌ها و تجهیزات قابل‌حملی داشته‌ایم که برای حفظ ارتباط، روشنایی، سلامت و اطلاعات حیاتی مفید و کاربردی هستند. * آب و غذا: آب آشامیدنی، غذاهای آماده و کم‌حجم با ماندگاری بالا (کنسروها، آجیل، بیسکویت انرژی‌زا و...). * کمک‌های اولیه: شامل باند، گاز استریل، چسب زخم، مسکن، دارو و پد بهداشتی. * منبع تغذیه و روشنایی: پاوربانک، چراغ قوه و باتری اضافی (همراه با هدلامپ). * مدارک: فلش USB با مدارک رمزنگاری‌شده، یا حداقل نسخه‌ای کاغذی. * اطلاعات: رادیو قابل حمل (با باتری یا شارژی). * علامت‌رسانی: سوت و آینه کوچک برای جلب توجه امدادگران. * گوشی: یک گوشی ساده هم برای مواقع اضطراری. * پول نقد: برای مواقعی که کارت‌های بانکی کار نمی‌کنند. * لباس و پتو: پتو سبک و لباس کم حجم توصیه نهایی: این کوله را آماده نگه دارید و در دسترس بگذارید. آماده‌سازی این کوله می‌تواند به کاهش استرس و افزایش شانس بقا شما کمک کند.
تکنوپالایش | 🇮🇷 Ai
معرفی معماری MoE شبکه های عصبی معماری (Mixture of Experts) یا به اختصار MoE، رویکردی برای افزایش ظر
مدل‌های MoE جدید در یکی دو سال اخیر، موج جدیدی از مدل‌های زبانی بزرگ – چه متن‌باز و چه تجاری – از معماری MoE برای دستیابی به ظرفیت بالا همراه با کارایی بهتر استفاده کرده‌اند. در این بخش به یک نمونه‌ی شاخص از این مدل‌ها و معماری آن می‌پردازیم: مدل زبانی DeepSeekMoE (2024)  یک معماری پیشرفته که توانسته است مدل‌های عظیم را با هزینه‌ی پایین‌تر آموزش دهد. مدل‌های سری DeepSeek از جمله DeepSeek-R1/V3 با به‌کارگیری MoE توانستند به ابعاد بی‌سابقه‌ای برسند؛ به طور مثال DeepSeek-V3 حدود ۶۷۱ میلیارد پارامتر دارد اما تنها ~۳۷ میلیارد پارامتر را برای هر توکن فعال می‌کند. این نسبت (حدود ۵٪ پارامترهای فعال) در مقایسه با مدل‌های متراکم بسیار چشمگیر است. نتیجه آن است که DeepSeek-R1 با چنین حجمی توانست در سال ۲۰۲۵ عنوان قوی‌ترین مدل متن‌باز را کسب کند و عملاً به مدت چهار ماه در رتبه‌ی نخست مدل‌های متن‌باز قرار گیرد. دستاورد دیگر DeepSeek، طراحی مشترک سخت‌افزار-نرم‌افزار برای کاهش هزینه‌ی آموزش بود؛ گزارش‌ها نشان می‌دهد DeepSeek-V3 تنها با ۲۰۴۸ پردازنده گرافیکی Nvidia H800 آموزش داده شد که در مقایسه با خوشه‌های عظیم ده‌ها هزار واحدی شرکت‌های بزرگ، یک موفقیت مهم محسوب می‌شود. همچنین معماری DeepSeekMoE با معرفی مفاهیمی مانند مکانیزم مسیر‌یابی تطبیقی، تلاش کرده بهره‌وری MoE را به حداکثر برساند.
🤲 این دعا رو برای نصرت سربازان جان برکفمون زیاد تکرار کنیم. ‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌┈┈••✾🍃🏴🏴🏴🍃✾••┈┈ 📱🖥️ 💻 👉@Technopalayesh https://eitaa.com/technopalayesh