eitaa logo
لایه‌های عمیق هوش مصنوعی ✨
942 دنبال‌کننده
672 عکس
306 ویدیو
44 فایل
امام شهید سید علی خامنه‌ای: «هوش مصنوعی لایه‌های عمیقی دارد، که باید بر آن‌ها مسلط شد.» کانال لایه‌های عمیق هوش مصنوعی، دیدبان تحولات هوش مصنوعی در دنیا واحد فرهنگی کانال: توفیق ولایت بازنشر محتوا با ذکر منبع آزاد است. ارتباط با کانال: @TofigheVelayat
مشاهده در ایتا
دانلود
✨ آنچه در گوگل I/O امسال گذشت: خیز بلند گوگل به سمت هوش مصنوعی‌های عاملی 👇
لایه‌های عمیق هوش مصنوعی ✨
✨ آنچه در گوگل I/O امسال گذشت: خیز بلند گوگل به سمت هوش مصنوعی‌های عاملی 👇
✨ مراسم Google I/O سال 2026 دیروز و پریروز برگزار شد و گوگل در اون‌ها چیزهای جالبی معرفی کرد که نمایانگر ادامۀ مسیر این شرکت در راستایِ هوش مصنوعی عاملی (Agentic) هست: ✍️ امسال گوگل کلا استراتژیش رو تغییر داده و از تمرکز صرف روی مدل‌های هوش مصنوعی، به سمت «عامل‌های خودمختار» (Autonomous Agents) در تقریبا تمام محصولاتش حرکت کرده. 🔅 جالبه بدونین در همون ابتدای مراسم آمارهای عجیبی داده شد: گوگل الان داره ماهانه بیش از ۳.۲ کوادریلیون توکن پردازش می‌کنه و اپ جمنای به ۹۰۰ میلیون کاربر فعال ماهانه رسیده! 🔅 اما مهم‌ترین معرفی‌های امسال تو بخش مدل‌ها و عامل‌ها: ❶ جمنای 3.5 فلش (Gemini 3.5 Flash): همونطور که پیشتر امروز هم اشاره کردم، این مدل بسیار سریع برای کارهای عاملی ساخته شده و الان پیش‌فرض اپ جمنای و هوش مصنوعی سرچ گوگله. ادعا شده از نسخه 3.1 پرو قوی‌تره. (البته مدل پرچمدار Gemini 3.5 Pro هم در راهه و خرداد ماه معرفی میشه). ❷ جمنای اسپارک (Gemini Spark): یک دستیار و عامل شخصیه که ۲۴ ساعته و ۷ روز هفته روی فضای ابری روشنه! این ایجنت می‌تونه کارهای پیچیده و چند مرحله‌ای رو به صورت خودکار تو برنامه‌هایی مثل جیمیل و داکس براتون انجام بده. (جمع‌آوری اطلاعات از ملّت با تمام قوا!) ❸ جمنای آمْنی (Gemini Omni): یک «مدل جهانی» یا World Model که برای تولید و ویرایش ویدیو از ترکیب متن، عکس و صدا استفاده می‌کنه و جالبیش اینه که درک فیزیکی و منطقی داره تا خروجی‌هاش واقعی‌تر باشن. ❹ آنتی‌گرویتی 2.0 (Antigravity 2.0): نسخۀ جدید این پلتفرم که برای کدنویسی با کمک چندین عامل هست. تو دموی زنده نشون دادن که ۹۳ تا زیرعامل (عامل کوچیک) تونستن یک سیستمِ عامل کامل رو از صفر تا صد تو ۱۲ ساعت با هزینه زیر ۱۰۰۰ دلار بنویسن 🤯 🔅 تو بخش محصولات کاربردی هم اتفاقات جذابی افتاده. سرچ گوگل حالا عامل‌هایی داره که می‌تونین تنظیمشون کنین تا وب رو برای موضوعات خاص (مثل قیمت سهام یا موجود شدن یک کالا) رصد کنن و خودشون بهتون آپدیت بدن. قابلیت Ask YouTube اضافه شده که می‌تونین درباره ویدیو سوال بپرسین و مستقیم برین بخش مربوطه. تو Google Docs هم می‌تونین فقط با صداتون فایل‌ها رو ایجاد و ویرایش کنین. 🌟 اما تو بخش سخت‌افزار و توسعه‌دهندگان هم خبرهای جدیدی بود: 👓 گوگل یه پیش‌نمایش از عینک‌های هوشمند صوتی Android XR (با همکاری سامسونگ) نشون داد که کاربر تو دمو فقط با فرمان صوتی به جمنای، مسیریابی می‌کرد و قهوه سفارش می‌داد. همچنین قابلیت کدنویسی حسی (Vibe-Coding) برای توسعه‌دهنده‌ها معرفی شد که می‌تونن کل یک اپلیکیشن اندروید رو با هوش مصنوعی تو AI Studio بنویسن و تست کنن. 🌟 در نهایت، پیام اصلی گوگل تو این رویداد این بود: کلمۀ «عاملی» همون نسل بعدی هوش مصنوعیه. یعنی آینده دیگه فقط چت کردن نیست، بلکه هوش مصنوعی قراره به نمایندگی از شما وارد عمل بشه و کارها رو انجام بده. لایه‌های عمیق هوش مصنوعی
✨ جهت خوانشِ راست به چپ در فارسی ✍️ یه نکتۀ کوتاه ولی مهم برای دوستانی که تصویرسازی می‌کنن. ⬅️ زبان‌های مختلف در نوشتار جهت‌های مختلفی دارن. مثلا انگلیسی و زبان‌های لاتین عموما چپ به راست هستن (چپ‌چین) و فارسی و عربی از راست به چپ نوشته میشن (راست‌چین) ❗️نکته‌ای که خیلی بهش توجه نمیشه اینه که این جهت و چینش یا اصطلاحا orientation در زبان بصری هم موضوعیت داره و در تصویرسازی هم خیلی خوبه که رعایت بشه. یعنی ناخودآگاه مخاطب فارسی‌زبان اول شروع می‌کنه به خوندن تصاویر از سمت راست به چپ؛ و اگر اینطور نباشه یا سردرگم میشه یا حس می‌کنه که یه چیزی سرجاش نیست. اگه در این زمینه چیزی نگید، معمولا مدل‌ها به طور پیش‌فرض، جهت «چپ-به-راست» رو برای تصویرسازی در نظر می‌گیرن 🌟 این به سادگی در پرامپت‌نویسی قابل حله با اضافه کردنِ: «جهت تصویر را راست به چپ یعنی متناسب با جهت زبان فارسی طراحی کن» یا به انگلیسی کافیه بگین «Right-to-left orienatation». ‼️ این لزوما فقط برای تصاویر چندپنلی مطرح نیستا. تصاویر تک پنلی هم خودشون جهت دارن، که معمولا در نوع ایستادن، جهت نگاه کردن، مسیر حرکت و... مشخص میشه. لایه‌های عمیق هوش مصنوعی
✍️ از دیروز این عکس از ٍ Cloudflare Radar دست به دست میشه که نشون میده ترافیک اینترنت بین المللی ایران از روز 19 ماه مه یعنی پریروز حسابی افزایش یافته 🤔 حالا کلی با موضوع اینترنت طبقاتی و پرو و سفید شوخی میشه و مطالب غیرکارشناسی گفته میشه، اما جای توضیح رسمی در این مورد حسابی خالیه که آیا از دید مسئولین خطر امنیتی اینترنت که ابزار مهم تهاجمی دشمن هست الان کامل رفع شده؟ آیا دولت در حال رفع کسری بودجه با اینترنت پرو هست؟ آیا واقعا در تخصیص اینترنت پرو پایش خاصی صورت می‌گیره؟ من کسی رو نمی‌شناسم که تا الان درخواست داده باشه و درخواستش رد شده باشه. امروز هم 2 تا از دوستان به بنده پیام دادن که از یکی از اپراتورها بدون اینکه خودشون اقدام کرده باشن، براشون پیامک لینک ثبت نام پرو فرستاده ان شاء الله مسئولین این رو هم به لیست اون مواردی که باید در موردش با مردم حرف زد اضافه کنن 🤲 لایه‌های عمیق هوش مصنوعی
فعلا قابلیت بارگیری به دلیل درخواست زیاد فراهم نیست
نمایش در ایتا
لایه‌های عمیق هوش مصنوعی ✨
✊ بریم به خیابون ای مردم نقطه زن ✊
❓ سؤال خوب یکی از دوستان: عکس‌های خیلی جالبی توسط هوش مصنوعی ساخته میشه اما پرامپتی که برای اون تصاویر ارایه می‌کنن معمولا خیلی مفصل، پیچیده، و به انگلیسی هم هست و به نظر نمیاد که توسط انسان نوشته شده باشه. چطوری میشه از یک ایده به این پرامپت‌ها رسید؟ ✍️ پاسخ: برای نوشتن یک پرامپت کامل که به یک تصویر خوب و قابل تکرار منجر بشه شما کافیه این 6 موردی که در این تصویر بالا ذکر شده رو مراعات کنید و در حقیقت بهشون فکر کنید 📈 اما همین پرامپتِ اولیه رو هم میشه جزئیات بیشتری بهش اضافه کرد و غنی‌ترش کرد. مدل‌های تصویرساز عاشق جزئیات فراوان هستن. به این عملیات میگن «بهبود پرامپت یا Prompt Enhancement» که توسط هر مدل خوب متنی قابل انجام هست. شما کافیه پرامپتتون رو بهش بدین و بگین «این پرامپت تصویرسازی را بهتر کن/بهبود ببخش/بهینه کن». اگر با زبان انگلیسی راحت نیستین پرامپت اولیه رو فارسی بنویسید و بخواهید که پرامپت بهتر شده رو هم به شما به فارسی بده تا خودتون مجددا ویرایشش کنین. مدل‌های عکس‌ساز پیشروی الان تقریبا با هر زبانی راحت هستن، هر چند هنوز هم دقیق‌ترین نتایج با انگلیسی حاصل میشه. ❕ برخی سایت‌ها مثل gapgpt خودشون یه بهبود دهندۀ اتوماتیک گذاشتن برای تمامی پرامپت‌ها و از جهاتی این مسیر رو برای کاربران مبتدی خیلی هموار کرده. چون شما پرامپتتون رو می‌نویسین، سایت اتوماتیک بهینه‌اش میکنه و به شما نتیجه رو نشون میده و بعد از تأیید شما عکس ساخته میشه. اما شما دستی هم می‌تونین از طریق مدلی مثل DeepSeek پرامپتتون رو بهینه کنید. لایه‌های عمیق هوش مصنوعی
✨ دنیای امروز، دنیای موشک است، نه مذاکره. دلیل؟ تجربه!
لایه‌های عمیق هوش مصنوعی ✨
✨ آهنگ‌ساز سونو، رؤیایی ناتمام!
✍️ در ادامۀ پست قبلی؛ وقتی سونو به ورژن 3.5 رسید همه احساس می‌کردیم که آیندۀ شگفت‌آوری در انتظار این ابزاره. سونو می‌تونست سبک‌ها رو با هم ترکیب کنه و خروجی‌های خلاقانه و دلنشینی بیرون بده یه سؤال بحث برانگیز اینه که به چی می‌گیم یه آهنگ قشنگ؟ آیا صرفا سلیقه‌ای هست؟ به نظر من یک music خوب، خاصیت muse کردن دارن 😄 یعنی بعد از شنیدنش ساعت‌ها در ذهن شما باقی می‌مونه... خروجی‌های سونو 3.5 این ویژگی رو داشت. چرا؟ چون این مدل روی 10-15% صدر محبوب‌ترین آهنگ‌های کل تاریخ تمرین دیده بود، بدون دغدغه از نقض قانون کپی‌رایت و هیچ مانعی. کیفیتِ صوتش جالب نبود بله، ولی دلنشینی وجود داشت. و کیفیت هم چیزیه که در طول زمان میشه بهبودش بخشید ⚖️ اما دیری نپایید که ناشران بزرگ موسیقی در دنیا متوجه ظرفیت این ابزار شدن و چندین پروندۀ قضایی بزرگ علیه سونو به جریان افتاد. از زرنگی‌های این ناشران این بود که هنرمندان خرده‌پایی که اصلا ربطی به سونو هم نداشتن رو تشویق کردن به تولید محتوا علیه سونو در شبکه‌های اجتماعی. در صحن قضایی، این ناشران بزرگ به دنبال به دست گرفتن مالکیت سونو بودن و در سطح اجتماعی در حال همراه کردن جامعه با خودشون و ترویج این ایده که سونو در حال دزدی از هنرمندان تازه‌کار هست و قراره اون‌ها رو ببلعه! 🔏 بعد از 2 سال و اندی کشمکش نهایتا این ناشران موفق شدن به هدفی که داشتن برسن. سونو عملا داخل گروه موزیک وارنِر (WMG) هضم شد و موظف شد که تغییرات گسترده‌ای در مدل‌هاش بده. 🔅 چیزی که الان به عنوان سونوی 5.5 موجوده، از نظر کیفیت صوت، بسیار بهتر از 3.5 هست اما به وضوح اون خلاقیت و دلنشینی مدل 3.5 رو نداره. علاوه بر این، سونو نه تنها نسخه 3.5 رو از دسترس عموم خارج کرده، بلکه کاربران گزارش میدن که این نسخۀ 3.5ی که برای کاربران پولی در دسترسه دیگه اون نسخه اصلیش نیست و مشخصه که جراحی‌های گسترده‌ای در اون شده به هدف حذف محتواهای کپی‌رایت دار ⚽️ خلاصه اینکه به زبان فوتبالی، سونوی امروز در مقایسه با سونوی 2 سال قبل مثل لیونل مسی امروز هست در مقایسه با مسی 15 سال پیش. مسی امروز هنوز هم مسیه، اما با نسخۀ 15 پیشش قابل مقایسه نیست 😅 اما حکمت این ماجرا چی بود؟ چرا این قصه رو براتون تعریف کردم؟ دلیلش اینه که داستان سونو ماجراییه که برای خیلی از مسیرهای خلاقانه در زمینه هوش مصنوعی قابل پیش‌بینیه، و اصلا الان یه جورایی واردش هم شدیم. یعنی چی؟ الان ما در دوره‌ای از هوش مصنوعی هستیم که «دورۀ گذار» هست؛ گذار از دورانی که هوش مصنوعی نبود به دورانی که هوش مصنوعی بخشی جدانشدنی از جامعه است. خیلی از قوانین محدودکننده و شرکتی برای هوش مصنوعی هنوز تثبیت نشدن. از دل این فضای خام، مدل‌‌ها و ابزارهایی بیرون میان که امروز خیلی شگفت‌انگیزن ولی با حملۀ قید و بندهای قانونی، شاید فردا دیگه وجود نداشته باشن. ویدیوساز گراک رو یادتونه؟ 🔸 دقیقا آبان پارسال براتون نوشتم که اگر می‌بینین امروز هوش مصنوعی در دسترسه، اصلا معناش این نیست که در آیندۀ نزدیک هم این دسترسی همچنان برقراره. امروز از ابزارها برای ارتقاء مهارت‌های شخصیتون استفاده کنین، چون تکلیف فردا اصلا معلوم نیست. سایت سونو: Suno.com لایه‌های عمیق هوش مصنوعی
✊ بریم سمت خیابان، امشب ساعت 10 نماز استغاثه هم هست