11.3M حجم رسانه بالاست
مشاهده در ایتا
✊ بریم به خیابان که مطالبۀ خون امام شهید واجب است ✊
لینک پست اصلی
لایههای عمیق هوش مصنوعی ✨
✨ آنچه در گوگل I/O امسال گذشت: خیز بلند گوگل به سمت هوش مصنوعیهای عاملی 👇
✨ مراسم Google I/O سال 2026 دیروز و پریروز برگزار شد و گوگل در اونها چیزهای جالبی معرفی کرد که نمایانگر ادامۀ مسیر این شرکت در راستایِ هوش مصنوعی عاملی (Agentic) هست:
✍️ امسال گوگل کلا استراتژیش رو تغییر داده و از تمرکز صرف روی مدلهای هوش مصنوعی، به سمت «عاملهای خودمختار» (Autonomous Agents) در تقریبا تمام محصولاتش حرکت کرده.
🔅 جالبه بدونین در همون ابتدای مراسم آمارهای عجیبی داده شد: گوگل الان داره ماهانه بیش از ۳.۲ کوادریلیون توکن پردازش میکنه و اپ جمنای به ۹۰۰ میلیون کاربر فعال ماهانه رسیده!
🔅 اما مهمترین معرفیهای امسال تو بخش مدلها و عاملها:
❶ جمنای 3.5 فلش (Gemini 3.5 Flash): همونطور که پیشتر امروز هم اشاره کردم، این مدل بسیار سریع برای کارهای عاملی ساخته شده و الان پیشفرض اپ جمنای و هوش مصنوعی سرچ گوگله. ادعا شده از نسخه 3.1 پرو قویتره. (البته مدل پرچمدار Gemini 3.5 Pro هم در راهه و خرداد ماه معرفی میشه).
❷ جمنای اسپارک (Gemini Spark): یک دستیار و عامل شخصیه که ۲۴ ساعته و ۷ روز هفته روی فضای ابری روشنه! این ایجنت میتونه کارهای پیچیده و چند مرحلهای رو به صورت خودکار تو برنامههایی مثل جیمیل و داکس براتون انجام بده. (جمعآوری اطلاعات از ملّت با تمام قوا!)
❸ جمنای آمْنی (Gemini Omni): یک «مدل جهانی» یا World Model که برای تولید و ویرایش ویدیو از ترکیب متن، عکس و صدا استفاده میکنه و جالبیش اینه که درک فیزیکی و منطقی داره تا خروجیهاش واقعیتر باشن.
❹ آنتیگرویتی 2.0 (Antigravity 2.0): نسخۀ جدید این پلتفرم که برای کدنویسی با کمک چندین عامل هست. تو دموی زنده نشون دادن که ۹۳ تا زیرعامل (عامل کوچیک) تونستن یک سیستمِ عامل کامل رو از صفر تا صد تو ۱۲ ساعت با هزینه زیر ۱۰۰۰ دلار بنویسن 🤯
🔅 تو بخش محصولات کاربردی هم اتفاقات جذابی افتاده. سرچ گوگل حالا عاملهایی داره که میتونین تنظیمشون کنین تا وب رو برای موضوعات خاص (مثل قیمت سهام یا موجود شدن یک کالا) رصد کنن و خودشون بهتون آپدیت بدن. قابلیت Ask YouTube اضافه شده که میتونین درباره ویدیو سوال بپرسین و مستقیم برین بخش مربوطه. تو Google Docs هم میتونین فقط با صداتون فایلها رو ایجاد و ویرایش کنین.
🌟 اما تو بخش سختافزار و توسعهدهندگان هم خبرهای جدیدی بود:
👓 گوگل یه پیشنمایش از عینکهای هوشمند صوتی Android XR (با همکاری سامسونگ) نشون داد که کاربر تو دمو فقط با فرمان صوتی به جمنای، مسیریابی میکرد و قهوه سفارش میداد. همچنین قابلیت کدنویسی حسی (Vibe-Coding) برای توسعهدهندهها معرفی شد که میتونن کل یک اپلیکیشن اندروید رو با هوش مصنوعی تو AI Studio بنویسن و تست کنن.
🌟 در نهایت، پیام اصلی گوگل تو این رویداد این بود: کلمۀ «عاملی» همون نسل بعدی هوش مصنوعیه. یعنی آینده دیگه فقط چت کردن نیست، بلکه هوش مصنوعی قراره به نمایندگی از شما وارد عمل بشه و کارها رو انجام بده.
#خبر #گوگل #جمنای #IO
لایههای عمیق هوش مصنوعی
✨ جهت خوانشِ راست به چپ در فارسی
✍️ یه نکتۀ کوتاه ولی مهم برای دوستانی که تصویرسازی میکنن.
⬅️ زبانهای مختلف در نوشتار جهتهای مختلفی دارن. مثلا انگلیسی و زبانهای لاتین عموما چپ به راست هستن (چپچین) و فارسی و عربی از راست به چپ نوشته میشن (راستچین)
❗️نکتهای که خیلی بهش توجه نمیشه اینه که این جهت و چینش یا اصطلاحا orientation در زبان بصری هم موضوعیت داره و در تصویرسازی هم خیلی خوبه که رعایت بشه. یعنی ناخودآگاه مخاطب فارسیزبان اول شروع میکنه به خوندن تصاویر از سمت راست به چپ؛ و اگر اینطور نباشه یا سردرگم میشه یا حس میکنه که یه چیزی سرجاش نیست.
اگه در این زمینه چیزی نگید، معمولا مدلها به طور پیشفرض، جهت «چپ-به-راست» رو برای تصویرسازی در نظر میگیرن
🌟 این به سادگی در پرامپتنویسی قابل حله با اضافه کردنِ:
«جهت تصویر را راست به چپ یعنی متناسب با جهت زبان فارسی طراحی کن» یا به انگلیسی کافیه بگین «Right-to-left orienatation».
‼️ این لزوما فقط برای تصاویر چندپنلی مطرح نیستا. تصاویر تک پنلی هم خودشون جهت دارن، که معمولا در نوع ایستادن، جهت نگاه کردن، مسیر حرکت و... مشخص میشه.
#تصویرسازی #جهت_تصویر #آموزش
لایههای عمیق هوش مصنوعی
✍️ از دیروز این عکس از ٍ Cloudflare Radar دست به دست میشه که نشون میده ترافیک اینترنت بین المللی ایران از روز 19 ماه مه یعنی پریروز حسابی افزایش یافته
🤔 حالا کلی با موضوع اینترنت طبقاتی و پرو و سفید شوخی میشه و مطالب غیرکارشناسی گفته میشه، اما جای توضیح رسمی در این مورد حسابی خالیه که آیا از دید مسئولین خطر امنیتی اینترنت که ابزار مهم تهاجمی دشمن هست الان کامل رفع شده؟ آیا دولت در حال رفع کسری بودجه با اینترنت پرو هست؟ آیا واقعا در تخصیص اینترنت پرو پایش خاصی صورت میگیره؟ من کسی رو نمیشناسم که تا الان درخواست داده باشه و درخواستش رد شده باشه. امروز هم 2 تا از دوستان به بنده پیام دادن که از یکی از اپراتورها بدون اینکه خودشون اقدام کرده باشن، براشون پیامک لینک ثبت نام پرو فرستاده
ان شاء الله مسئولین این رو هم به لیست اون مواردی که باید در موردش با مردم حرف زد اضافه کنن 🤲
#اینترنت #اینترنت_پرو
لایههای عمیق هوش مصنوعی
❓ سؤال خوب یکی از دوستان:
عکسهای خیلی جالبی توسط هوش مصنوعی ساخته میشه اما پرامپتی که برای اون تصاویر ارایه میکنن معمولا خیلی مفصل، پیچیده، و به انگلیسی هم هست و به نظر نمیاد که توسط انسان نوشته شده باشه. چطوری میشه از یک ایده به این پرامپتها رسید؟
✍️ پاسخ: برای نوشتن یک پرامپت کامل که به یک تصویر خوب و قابل تکرار منجر بشه شما کافیه این 6 موردی که در این تصویر بالا ذکر شده رو مراعات کنید و در حقیقت بهشون فکر کنید
📈 اما همین پرامپتِ اولیه رو هم میشه جزئیات بیشتری بهش اضافه کرد و غنیترش کرد. مدلهای تصویرساز عاشق جزئیات فراوان هستن. به این عملیات میگن «بهبود پرامپت یا Prompt Enhancement» که توسط هر مدل خوب متنی قابل انجام هست. شما کافیه پرامپتتون رو بهش بدین و بگین «این پرامپت تصویرسازی را بهتر کن/بهبود ببخش/بهینه کن».
اگر با زبان انگلیسی راحت نیستین پرامپت اولیه رو فارسی بنویسید و بخواهید که پرامپت بهتر شده رو هم به شما به فارسی بده تا خودتون مجددا ویرایشش کنین. مدلهای عکسساز پیشروی الان تقریبا با هر زبانی راحت هستن، هر چند هنوز هم دقیقترین نتایج با انگلیسی حاصل میشه.
❕ برخی سایتها مثل gapgpt خودشون یه بهبود دهندۀ اتوماتیک گذاشتن برای تمامی پرامپتها و از جهاتی این مسیر رو برای کاربران مبتدی خیلی هموار کرده. چون شما پرامپتتون رو مینویسین، سایت اتوماتیک بهینهاش میکنه و به شما نتیجه رو نشون میده و بعد از تأیید شما عکس ساخته میشه. اما شما دستی هم میتونین از طریق مدلی مثل DeepSeek پرامپتتون رو بهینه کنید.
#تصویرسازی #پرامپت_نویسی
لایههای عمیق هوش مصنوعی
✨ دنیای امروز، دنیای موشک است، نه مذاکره. دلیل؟ تجربه!
#جنگ_رمضان #جنگ_تحمیلی_سوم
لایههای عمیق هوش مصنوعی ✨
✨ آهنگساز سونو؛ از رؤیای خلاقیت بدون مرز تا محدودیتها در دنیای شرکتیشده! ✍️ چند روز پیش داشتم در
✨ آهنگساز سونو، رؤیایی ناتمام!
لایههای عمیق هوش مصنوعی ✨
✨ آهنگساز سونو، رؤیایی ناتمام!
✍️ در ادامۀ پست قبلی؛ وقتی سونو به ورژن 3.5 رسید همه احساس میکردیم که آیندۀ شگفتآوری در انتظار این ابزاره. سونو میتونست سبکها رو با هم ترکیب کنه و خروجیهای خلاقانه و دلنشینی بیرون بده
یه سؤال بحث برانگیز اینه که به چی میگیم یه آهنگ قشنگ؟ آیا صرفا سلیقهای هست؟ به نظر من یک music خوب، خاصیت muse کردن دارن 😄 یعنی بعد از شنیدنش ساعتها در ذهن شما باقی میمونه...
خروجیهای سونو 3.5 این ویژگی رو داشت. چرا؟ چون این مدل روی 10-15% صدر محبوبترین آهنگهای کل تاریخ تمرین دیده بود، بدون دغدغه از نقض قانون کپیرایت و هیچ مانعی. کیفیتِ صوتش جالب نبود بله، ولی دلنشینی وجود داشت. و کیفیت هم چیزیه که در طول زمان میشه بهبودش بخشید
⚖️ اما دیری نپایید که ناشران بزرگ موسیقی در دنیا متوجه ظرفیت این ابزار شدن و چندین پروندۀ قضایی بزرگ علیه سونو به جریان افتاد. از زرنگیهای این ناشران این بود که هنرمندان خردهپایی که اصلا ربطی به سونو هم نداشتن رو تشویق کردن به تولید محتوا علیه سونو در شبکههای اجتماعی.
در صحن قضایی، این ناشران بزرگ به دنبال به دست گرفتن مالکیت سونو بودن و در سطح اجتماعی در حال همراه کردن جامعه با خودشون و ترویج این ایده که سونو در حال دزدی از هنرمندان تازهکار هست و قراره اونها رو ببلعه!
🔏 بعد از 2 سال و اندی کشمکش نهایتا این ناشران موفق شدن به هدفی که داشتن برسن. سونو عملا داخل گروه موزیک وارنِر (WMG) هضم شد و موظف شد که تغییرات گستردهای در مدلهاش بده.
🔅 چیزی که الان به عنوان سونوی 5.5 موجوده، از نظر کیفیت صوت، بسیار بهتر از 3.5 هست اما به وضوح اون خلاقیت و دلنشینی مدل 3.5 رو نداره. علاوه بر این، سونو نه تنها نسخه 3.5 رو از دسترس عموم خارج کرده، بلکه کاربران گزارش میدن که این نسخۀ 3.5ی که برای کاربران پولی در دسترسه دیگه اون نسخه اصلیش نیست و مشخصه که جراحیهای گستردهای در اون شده به هدف حذف محتواهای کپیرایت دار
⚽️ خلاصه اینکه به زبان فوتبالی، سونوی امروز در مقایسه با سونوی 2 سال قبل مثل لیونل مسی امروز هست در مقایسه با مسی 15 سال پیش. مسی امروز هنوز هم مسیه، اما با نسخۀ 15 پیشش قابل مقایسه نیست 😅
اما حکمت این ماجرا چی بود؟ چرا این قصه رو براتون تعریف کردم؟
دلیلش اینه که داستان سونو ماجراییه که برای خیلی از مسیرهای خلاقانه در زمینه هوش مصنوعی قابل پیشبینیه، و اصلا الان یه جورایی واردش هم شدیم.
یعنی چی؟ الان ما در دورهای از هوش مصنوعی هستیم که «دورۀ گذار» هست؛ گذار از دورانی که هوش مصنوعی نبود به دورانی که هوش مصنوعی بخشی جدانشدنی از جامعه است.
خیلی از قوانین محدودکننده و شرکتی برای هوش مصنوعی هنوز تثبیت نشدن. از دل این فضای خام، مدلها و ابزارهایی بیرون میان که امروز خیلی شگفتانگیزن ولی با حملۀ قید و بندهای قانونی، شاید فردا دیگه وجود نداشته باشن. ویدیوساز گراک رو یادتونه؟
🔸 دقیقا آبان پارسال براتون نوشتم که اگر میبینین امروز هوش مصنوعی در دسترسه، اصلا معناش این نیست که در آیندۀ نزدیک هم این دسترسی همچنان برقراره. امروز از ابزارها برای ارتقاء مهارتهای شخصیتون استفاده کنین، چون تکلیف فردا اصلا معلوم نیست.
سایت سونو: Suno.com
#سونو #آهنگساز
لایههای عمیق هوش مصنوعی
لایههای عمیق هوش مصنوعی ✨
✍️ در ادامۀ پست قبلی؛ وقتی سونو به ورژن 3.5 رسید همه احساس میکردیم که آیندۀ شگفتآوری در انتظار این
✍️ دلم نیومد این تصویر مقایسه رو شما نبینین 😅