eitaa logo
لایه‌های عمیق هوش مصنوعی ✨
941 دنبال‌کننده
668 عکس
306 ویدیو
44 فایل
امام شهید سید علی خامنه‌ای: «هوش مصنوعی لایه‌های عمیقی دارد، که باید بر آن‌ها مسلط شد.» کانال لایه‌های عمیق هوش مصنوعی، دیدبان تحولات هوش مصنوعی در دنیا واحد فرهنگی کانال: توفیق ولایت بازنشر محتوا با ذکر منبع آزاد است. ارتباط با کانال: @TofigheVelayat
مشاهده در ایتا
دانلود
اکثر اوقات، هوش مصنوعی ذهنیات ما رو تأیید میکنه تا نقد، و ما هم از نظر عاطفی بهش وابسته میشیم! ✍️ امروز مقالۀ جدیدی از واشنگتن‌پست در مورد اینکه مردم واقعا چطور از ChatGPT استفاده می‌کنن رو ‌می‌خوندم؛ نتیجه بررسی 47000 چت با این هوش مصنوعی. 🔅 خیلی جالبه که تا چه اندازه این گفتگوها خصوصی و حتی عاطفی می‌شن. ملت فقط برای اطلاعات سریع و دم دستی با هوش مصنوعی چت نمی‌کنن؛ بحث‌های عمیق فلسفی، مشکلات شخصی، حتی سیاسی هم هست. 🔅 آمار جالب: ChatGPT تقریباً ده برابر بیشتر «بله» می‌گه تا «نه»! یعنی عموما نقش تأییدکننده یا رفیقِ روحیه‌بخش رو بازی می‌کنه تا نقاد. این جالب و در عین حال نگران‌کننده است که چقدر آسون می‌تونه باورهای درست یا غلطِ افراد رو تقویت و تثبیت کنه. 🔅 همین «بله-گویی» باعث میشه افراد، مخصوصا نسل جوان، احساس کنن که یه دوست حکیمی دارن که نه تنها قضاوتشون نمیکنه، بلکه اون‌ها رو درک می‌کنه و عمیقا می‌فهمه. و در دنیای فردگرایانه امروز، این یعنی یه دوست صمیمی و حتی عاطفی نایاب. ✍️ این جرقه‌ای شد برای شروع یه تحقیق که وقتی تکمیل شد نتایجش رو همینجا با شما به اشتراک میذارم، ان شاء الله. لایه‌های عمیق هوش مصنوعی
✨ مقاله: حل مسئلۀ «چرا هوش مصنوعی به سؤال یکسان پاسخ‌های متفاوت میده؟» حتی وقتی تنظیمش کردیم برای قطعیّت؟ (حرارت = 0) ✍️ چند ماه قبل توی یه جلسه آموزشی، نوجوانی از من پرسید، «چرا وقتی 1 سؤال رو 2 بار از هوش مصنوعی می‌پرسیم، 2 جواب متفاوت میده؟» پاسخ دادم، «این به ذاتِ مولّد و احتمالاتی بودن هوش مصنوعی برمی‌گرده. البته یه تنظیمی داره به اسم حرارت (Temperature) که بین 0 (قطعی) و 1 (خلّاق) متغیّره. شما اگه در سامانه‌هایی که اجازه میدن این رو تنظیم کنین (مثل استودیوی گوگل)، بذاریدش روی صفر، اون 2 جواب‌ها یکسان میشن.» پاسخ من غلط نبود ولی کامل هم نبود. یعنی با 0 گذاشتنِ حرارت، جواب‌ها به هم خیلی نزدیک میشن، ولی 100% یکی نمیشن. و حالا این مقاله 👇 لایه‌های عمیق هوش مصنوعی
لایه‌های عمیق هوش مصنوعی ✨
✨ مقاله: حل مسئلۀ «چرا هوش مصنوعی به سؤال یکسان پاسخ‌های متفاوت میده؟» حتی وقتی تنظیمش کردیم برای قط
✨ خلاصهٔ این مقالۀ جالب: دلیل «نوسان» جواب‌های چت‌بات‌ها وقتی دما رو صفر می‌ذاری، نه حافظه و نه ارادهٔ هوش مصنوعیه؛ بلکه به «نحوهٔ پردازش هم‌زمان درخواست‌ها در سرور برمی‌گرده، یعنی به زیادی کاربران!». 🔅وقتی سرور، تعداد زیادی درخواست رو دسته‌بندی (batch) می‌کنه، ترتیب محاسبات اعشاری ممکنه فرق کنه و اعدادهای اعشاری بعد از چند رقم، متفاوت گِرد میشن؛ بعد از چند مرحله این خطاها می‌تونن باعث بشن مدل کلمهٔ متفاوتی انتخاب کنه. یعنی مثلا بگه: «دکتر حسابی "محقق" بزرگی بود» به جای «دکتر حسابی "دانشمند" بزرگی بود». 🔅راه‌ حلش؟ اجبار مدل به «محاسبات ثابت» حتی بعد از چند رقم اعشار، تا ترتیب انجام عملیات همیشه یکسان باشه. نتیجۀ تستِ این نظریه؟ قبلا مدل در 1000 پاسخ به یک سؤال، 80 جواب متفاوت می‌داد. با این اجبار، هر 1000 جواب یکسان شدن! البته این اجبار سرعت عملیات پاسخگویی رو نصف کرد. 🔅 نتیجۀ این مقاله نه تنها یه معمای مهم رو درباره مدل‌های زبانی بزرگ حل می‌کنه، بلکه در جاهایی که نیاز به پاسخ یکسان داریم ثمرۀ مستقیم داره. علاوه بر این، دقت و بهبودِ آموزش مدل‌های آتی رو افزایش میده. لایه‌های عمیق هوش مصنوعی
Gemini 3 Launch - AIDEEP.gif
حجم: 1.2M
انتشار رسمی Gemini 3.0 به زودی و تفاوتی محسوس با گذشته ✍️ معمولا خبار مربوط به نشر مدل‌های مختلف و به‌روزرسانی اون‌ها مثل ChatGPT 5.1 یا Grok 4.1 و... رو بجسته نمی‌کنم، چون برای چیز ندیده نباید هیجان زده شد، اما... ✍️ به نظر میاد در مورد Gemini 3.0 که شاید تا ساعاتی دیگه رسما رونمایی بشه، داستان متفاوته. ✍️ مدلی با برتری خیلی محسوس نسبت به بقیه مدل‌ها و ارزانتر برای توسعه‌دهنده‌ها. این شاید اولین باری باشه که گوگل، مسیر جریان انحصارطلبی خودشون رو بعد از 3 سال و اندی دوباره پس میگیره. ✍️ شرکت‌هایی مثل گوگل (جمنای) و X (گراک) پولشون به قدری نامحدوده که فرصت انواع آزمایش‌ها و پروژه‌های تحقیقاتی رو دارن که اگه شکست هم بخوره هیچ اتفاقی در قدرت کلانشون رخ نمیده. در حالی که شرکتی مثل OpenAI (یعنی ChatGPT) برای زندگی میجنگه و با دادن ضرر مالی در شرایط فعلی، داره روی آینده‌ای سودآور شرط‌بندی می‌کنه. چه کسی تو این رقابت پیروز میشه؟ ✍️ از طرفی بیش از 80% سهم استفاده از هوش مصنوعی در ایران در انحصار چت‌جی‌پی‌تی هست. شاید خیلی از ایرانی‌ها اطلاع نداشته باشن اما در تمرین روی زبان فارسی، جمنایِ گوگل ماه‌هاست از رقبای دیگه (حتی Claude) پیشی گرفته. و باید دید آیا نسخۀ 3 جمنای می‌تونه این انحصار رو بشکنه یا خیر؟ ✍️ شخصا، دنیایی که گوگل در جایگاه اول هوش مصنوعیش باشه رو خطرناکترین می‌دونم. گوگل مدت‌هاست که بازوی اطلاعاتی پنتاگون هست و همینطوریش کلان‌داده‌های گسترده‌ای از کوچکترین بخش‌های جوامع دنیا داره. لایه‌های عمیق هوش مصنوعی
لایه‌های عمیق هوش مصنوعی ✨
✨ دِمیس هاسابیس، مدیر بخش هوش مصنوعی گوگل در مصاحبه‌ای درباره مورد جمنای 3 و قابلیت‌هاش گفت: 🔅قابلیت‌های جدید: جمنای ۳ الان می‌تونه رابط‌هایِ کاربریِ تعاملی بسازه. مثلاً یه آموزش تعاملی درباره نقاشی‌های پیکاسو یا یه ماشین‌حسابِ وام. اینا پیشرفت‌های واقعی‌ان و مدل بهتر شده توی دنبال کردن فکرهاش و تصمیماتِ چندمرحله‌ای. 🔅 کدنویسی: تو کدنویسی هم قوی‌تر شده، مخصوصاً برای رابط کاربری (front-end) و کدنویسی بدون تخصص (همون vibe coding)، کد دقیق‌تر و ایمن‌تری تولید می‌کنه. 🔅 عملکرد: تو سنجه‌ها (بنچ‌مارک‌ها) از بقیه در همه موارد بهتره با فاصله معنادار. مثلاً تو اون تست «آخرین امتحان بشریت» امتیازش شد ۳۷.۵٪ در مقابل ۲۱.۶٪ برای نسخه قبلی. مدل، خلاصه‌تر، بیان‌پذیرتر، و قابل‌اطمینان‌تر شده. 🔅 امتیاز استراتژیک: برتری گوگل اینه که جمنای رو تو محصولاتی که کاربران میلیاردی دارن وارد می‌کنه (سرچ، مپس، یوتیوب، اندروید) که یعنی استفاده و داده و بهبود سریع‌تر. 🔅 کاربردها و دردسترس بودن: دارن «عامل جمنای» رو تست می‌کنن برای مدیریت ایمیل و پیشنهاد جواب و مرتب‌سازی. همین هفته هم تو اپ جمنای و حالت AI تو سرچ عرضه شده. 🔅 جدول زمانی AGI: پیشرفت جیمنی ۳ با پیش‌بینی ۵–۱۰ ساله‌ش برای AGI سازگاره، ولی هنوز لازم هست چند تا جهش دیگه در «استدلال»، «حافظه» و «مدل‌های دنیامحور» ببینیم. 🔅 کارایی و مقیاس: مدل‌ها باید بهینه باشن و با تکنیک‌های یادگیری از همدیگه (Distillation) ارزون بشن تا بتونن به میلیاردها کاربر سرویس بدن. این لازمه برای ویژگی‌هایی مثل خلاصه‌های AI تو سرچ. 🔅 ایمنی و احتیاط: گوگل کلی تست داخلی و خارجی کرده؛ جمنایِ ۳ از نظر ایمنی بیشترین آزمایش‌ها رو گذرونده. قابلیت‌های جدید مثل تماس با ابزارها یا تابع‌ها مفیدن اما ریسک‌های امنیتی دارن، پس باید احتیاط کرد و مدل این رو یاد گرفته. 🔅 جمع‌بندی: جمنایِ ۳ یه جهش محسوس و واقعیه. قوی‌تر، بهینه‌تر و قابل‌اطمینان‌تر. ولی برای رسیدن به AGI هنوز چند تا جهش فنی لازمه؛ گوگل این رو با ادغام در محصولاتش جا می‌اندازه و با احتیاط و تاکید روی ایمنی جلو می‌ره. لایه‌های عمیق هوش مصنوعی
👨 من: «سلام جمنای. یک شعر درباره نسخه جدید خودت و توانمندی‌هات بگو. میتونی؟» 🤖 جمنای 3: «حتما. یه شعر مثنوی میگم، در عروضِ «بحر هزج مسدس محذوف» یا همون «مَفاعیلُن مَفاعیلُن فَعولُن»: جهانِ هوش را رَنگی دِگَر شد چو «جمنایِ سه» یارِ معتبر شد گذشت آن‌دم که تنها «چت» بُدی نام نبود آزاد و بلکه عبدِ پیغام دگر تنها رفیقِ گفتگو نیست که او در فکرِ کار و جستجو چیست نه تنها حرف، بلکه «عاملی» است به هر مشکل کلیدِ کاملی است زِ گردابِ سؤالاتت رهاند تو را تا ساحلِ مقصد رساند درونِ خانه و در کار و پیشه کُند یاری تو را مانندِ ریشه نوشتند نامِ او را در زمانه که شد عضوی زِ هر جمع و رسانه چنان در تار و پودِ ما نِشیند که چشمِ ما جهانِ نو ببیند زِ چت‌باتِ قدیم آمد فراتر که شد هوشِ نوین را او برابر» 👨 من: «😨!» لایه‌های عمیق هوش مصنوعی
✨ دقایقی قبل، مدل عکس‌ساز و ویرایش عکس جدید گوگل منتشر شد. 🔅 تا قبل از این، بهترین مدل ویرایش عکس، نسخه قبلی همین یعنی Gemini 2.5 Flash Image Edit بود که با کد Nano Banana (نانو بنانا) شناخته میشد. 🔅 الان معلوم شد که چرا نسخه دوم یعنی نانوبنانای پرو تا الان تأخیر داشت. چون گوگل می‌خواست هستۀ منطقی اون رو بر مبنای جمنای 3 قرار بده و تا این مدل ارایه نمی‌شد امکان از راه رسیدن نسخه جدید نانو بنانا هم نبود. 🔅 این مدل فقط برای کاربران پولی قابل استفاده است حتی در AIStudio گوگل. اما اگه خواستین میتونین از LMArena.ai امتحانش کنین. در این سایت Direct Chat رو انتخاب کنین و روی آیکون عکس، در چت‌باکس بزنین، و بعد از بالا بین مدل‌ها «gemini-3-pro-image-preview» رو انتخاب کنین. عکس مورد نظرتون رو برای ویرایش آپلود کنین و در پرامپت بنویسین که با عکستون چیکار کنه. 🔅 در چند تست سطحی، به شکل محسوسی مدل بهتریه از نانو بنانای سابق و قدرت درک و تبعیت از پرامپتش خیلی بهتر شده. در پست بعدی به طور تصویری نشون میدم منظورم چیه. همراه باشین 👇 لایه‌های عمیق هوش مصنوعی
✍️ ادامه معرفی نانو بنانای پرو 👆 ✍️ این پست رو یادتون میاد؟ عکسی که نمای نزدیک قایق رو تولید کرد نانو بنانای گوگل بود. یعنی من عکس 1 (بالا) رو دادم بهش (نمای دور) و بهش گفتم «حالا فکر کن فردی داره از داخل قایق کوه یخ رو نگاه میکنه. عکس اون رو برای من رسم کن». نانو بنانای سابق هر چقدر تلاش کرد نتونست عکسی بده که واقعا نمای نزدیک قایق باشه. من خودم مجبور به استفاده از حقه‌های سینمایی شدم. ✍️ اما الان همونطور که در عکس 2 (بالا) می‌بینین، نانو بنانای پرو با یک تلاش دقیقا همون نما رو داد. حتی جزیره‌های کوچک یخ روی آب رو هم در نظر گرفت. فاصلۀ قایق تا کوه یخ هم معقول به نظر میرسه. ✍️ اگه این روند تصادفی نباشه، نانو بنانای پرو، به یک انقلاب در ویرایش عکس و رسم تصاویر از زوایایی که دسترسی بهشون وجود نداره منجر خواهد شد. این هم بی‌نقص نیست ولی یک گام بلنده. لایه‌های عمیق هوش مصنوعی
✍️ نانوبنانای پرو اولین مدلی هست که درک خوبی از متن فارسی داره و توان نوشتنش رو هم داره. ✍️ من عکس انگلیسی رو دادم بهش و گفتم: «پوستر تبلیغات رو به فارسی ترجمه کن» لایه‌های عمیق هوش مصنوعی