هدایت شده از احسان شفیعی
سلسله نشست های تخصصی مجازی
شبکه اندیشکده های استادان کشور
#نشست شماره ۱
🔍موضوع: «سیاست گذاری علم و فناوری با تاکید بر قانون جهش تولید دانش بنیان»
🎙دکتر پرویز کرمی
▪️مشاور سابق معاون علمی و فناوری ریاست جمهوری
▪️مدیرعامل مرکز نوآوری همیار دانش بنیان
▪️داور برنامه تلوزیونی میدون
🗓سه شنبه ۱۴۰۴/۰۶/۰۴
⏰ ۱۰ الی ۱۱:۳۰
✨ارائه گواهی به شرکت کنندگان
🔻🔻🔻🔻🔻🔻🔻🔻🔻
جهت ورورد به نشست اینجا کلیک کنید.
🔺🔺🔺🔺🔺🔺🔺🔺🔺
🔶 «نُها»؛ شبکه نوآوری و هم افزایی اندیشکده های استادان
❔@tn_noha❔
نشست مجازی دکتر پرویز کرمی با عنوان «سیاست گذاری علم و فناوری با تاکید بر قانون جهش تولید دانش بنیان» بعلت مشکل بوجود آمده برای ایشان، به زمان دیگری موکول گردید.
زمان جلسه جدید، متعابقا اطلاع رسانی خواهد شد.
📣اخبار هوش مصنوعی
❇️ مایکروسافت سیستم متنباز VibeVoice را منتشر کرد.
سامانه VibeVoice یک سامانه متنباز سنتز گفتار به زبان انگلیسی و چینی است که میتواند محتوای صوتی پراحساس تا ۹۰ دقیقه را با حداکثر ۴ گوینده تولید کند.
این سیستم از رمزگذارهای گفتار پیوسته با فرکانس بسیار پایین ۷.۵ هرتز و ترکیبی از مدلهای زبانی بزرگ (LLM) برای درک زمینه و مدل انتشار (diffusion) برای تولید صدای باکیفیت استفاده میکند.
کد استنتاج آن هماکنون در GitHub در دسترس است و مدل ۱.۵ میلیارد پارامتری به همراه توکنایزر در Hugging Face قرار دارد. نسخههای بزرگتر (۷B) و فشردهتر (۰.۵B) نیز در راه هستند.
microsoft.github.io
❇️ برنامه NotebookLM یاد گرفت نقد ویدئویی در ۸۰ زبان، از جمله فارسی، تولید کند.
اکنون امکان تبدیل اسناد و یادداشتهای بارگذاریشده به ارائههای ویدئویی کوتاه در ۸۰ زبان (از جمله فارسی) فراهم شده است؛ قابلیتی که پیشتر فقط در انگلیسی فعال بود.
همزمان، گوگل قابلیت Audio Overviews را ارتقا داده که امکان ساخت خلاصههای صوتی طولانیتر و دقیقتر را در زبانهای مختلف فراهم میکند.
این بهروزرسانیها در حال انتشار هستند و به گفته گوگل، طی یک هفته آینده برای تمام کاربران جهانی در دسترس خواهند بود.
blog.google
❇️ انویدیا Jetson AGX Thor را معرفی کرد.
رایانه Jetson AGX Thor قدرتمندترین رایانه امروز برای محاسبات هوش مصنوعی لبه (Edge AI) و رباتیک است. این پلتفرم عملکردی معادل ۲۰۷۰ ترافلاپس (FP4) دارد که حدود ۷.۵ برابر سریعتر از نسل قبلی، Jetson Orin، است.
این سیستم بر پایه GPU با معماری Blackwell، یک پردازنده ۱۴ هستهای Arm و حافظه ۱۲۸ گیگابایت LPDDR5X ساخته شده است. این ترکیب امکان اجرای محلی مدلهای زبانی بزرگ و چندوجهی و پردازش دادههای چند حسگر با کمترین تأخیر را فراهم میکند.
پلتفرم با مجموعه نرمافزارهای انویدیا شامل Isaac، Metropolis و Holoscan سازگار است.
کیت توسعه آن اکنون با قیمت ۳۴۹۹ دلار قابل سفارش است و ارسال آن از ماه آینده آغاز میشود. ماژولهای سریالی Jetson T5000 ویژه رباتهای آماده نیز در پایان ۲۰۲۵ با قیمت ۲۹۹۹ دلار برای سفارشهای بالای ۱۰۰۰ واحد عرضه خواهند شد.
cnbc.com
❇️ ایلان ماسک از اپل و OpenAI شکایت یک میلیارد دلاری کرد.
شرکتهای xAI و X شکایتی ضدانحصار به ارزش یک میلیارد دلار در دادگاه فدرال آمریکا علیه اپل و OpenAI ثبت کردهاند. در این شکایت آمده که این دو شرکت بهطور غیرقانونی برای تسلط بر بازار گوشیهای هوشمند و هوش مصنوعی مولد تبانی کردهاند و قوانین ضدانحصار آمریکا را نقض کردهاند.
طبق این سند ۶۱ صفحهای، ادغام انحصاری ChatGPT در iOS و دستکاری رتبهبندی اپاستور باعث پایین کشیدن جایگاه رقبای چتبات میشود. ماسک معتقد است این شرایط باعث شده «هیچ شرکت هوش مصنوعی غیر از OpenAI نتواند به صدر اپاستور برسد.»
اپل از اظهار نظر خودداری کرده و OpenAI این شکایت را «ادامه حملات سیستماتیک آقای ماسک» نامیده است.
wsj.com
❇️مرورگر Brave یک آسیبپذیری در Comet از Perplexity کشف کرد.
به گفته Brave، مشکل مربوط به حملات موسوم به "تزریق غیرمستقیم پرامپت" است؛ جایی که مهاجمان میتوانند فرمانهای مخرب را در صفحات وب جاسازی کنند و دستیار هوش مصنوعی Comet هنگام تحلیل محتوا آنها را بهعنوان دستور کاربر اجرا کند.
در آزمایشها، Brave نشان داد که چگونه میتوان Comet را وادار کرد تا دادههای محرمانه، آدرسهای ایمیل و رمزهای یکبارمصرف را برای مهاجمان ارسال کند. هرچند Perplexity بهروزرسانیهایی منتشر کرده، اما مشکل هنوز بهطور کامل حل نشده است.
brave.com
#خبر #هوش_مصنوعی
#اندیشکده_مطالعات_هوش_مصنوعی_فرهنگ_رسانه
#هوش_مصنوعی
┏━━💠┓
🆔 https://eitaa.com/nraimc
⚡️ بیش از 500 اسکریپت آماده برای n8n
یک منبع ساده و کاربردی: دو مخزن GitHub با صدها ورکفلو رایگان برای n8n.
موضوعات: فروش، بازاریابی، حسابداری مالی، کدنویسی و بهرهوری شخصی.
چارچوب n8n چیست؟
ابزار متنباز بدون کدنویسی برای اتوماسیون
سازنده بصری: اتصال بلوکها برای ایجاد فرآیند
صدها یکپارچگی: ایمیل، CRM، صفحات گسترده، پیامرسانها، وبهوکها
امکان افزودن منطق شخصی با جاوااسکریپت
اجرا بر اساس زمانبندی یا رویداد، هم در فضای ابری و هم روی سرور شخصی
نحوه استفاده:
1. ورکفلو موردنظر (json) را دانلود کرده و در n8n وارد کنید
2. کلیدهای API و اطلاعات کاربری خود را در بلوکها وارد کنید
3. مراحل را بررسی کرده و اجرای آن را با کرون (cron) یا وبهوک فعال کنید
🔗 لینکها:
https://github.com/wassupjay/n8n-free-templates
https://github.com/kossakovsky/n8n-installer
#n8n #ai
#اندیشکده_مطالعات_هوش_مصنوعی_فرهنگ_رسانه
#هوش_مصنوعی
┏━━💠┓
🆔 https://eitaa.com/nraimc
┗💠━━
✨مدل زبانی رگرسیون جدید گوگل (RLM) چارچوبی برای پیشبینی عملکرد سیستمهای صنعتی؛ مستقیماً از دادههای متنی خام
رویکرد تازهی مدل زبانی رگرسیون (Regression Language Model – RLM) که توسط گوگل معرفی شده، این امکان را فراهم میکند که مدلهای زبانی بزرگ (LLM) بتوانند عملکرد سیستمهای صنعتی را مستقیماً از روی دادههای متنی خام پیشبینی کنند؛ بدون آنکه نیاز به مهندسی ویژگیهای پیچیده یا قالبهای جدولی سختگیرانه باشد.
🔹چالش پیشبینی در سیستمهای صنعتی
پیشبینی عملکرد در مقیاس بزرگ، مثل خوشههای محاسباتی Borg گوگل، معمولاً مستلزم مهندسی ویژگیهای سنگین و دادههای جدولی تخصصی است؛ موضوعی که مقیاسپذیری و سازگاری را دشوار میکند. لاگها، فایلهای پیکربندی، ترکیبهای متنوع سختافزاری و دادههای تو در توی وظایف (Jobs) را نمیتوان بهسادگی تخت و نرمالسازی کرد تا در مدلهای رگرسیون کلاسیک استفاده شوند. همین امر باعث میشود فرآیندهای شبیهسازی و بهینهسازی شکننده، پرهزینه و کند شوند؛ بهویژه هنگامی که سختافزارها یا بارهای کاری جدید معرفی میگردند.
✨ایده اصلی: رگرسیون متنی (Text-to-Text Regression)
❇️کاربردپذیری همگانی: هر حالت سیستمی را میتوان بهصورت یک رشته (string) نمایش داد؛ بنابراین ویژگیهای ناهمگون، تو در تو و پویا بهصورت بومی پشتیبانی میشوند.
🔹جزئیات فنی: معماری و آموزش
❇️استفاده از یک مدل LLM رمزگذار–رمزگشا با اندازه نسبتاً کوچک (۶۰ میلیون پارامتر).
❇️آموزش با Cross-Entropy پیشبینی توکن بعدی بر روی نمایشهای متنی حالتها (xxx) و خروجیها (yyy).
❇️بدون پیشآموزش روی دادههای زبانی عمومی؛ آموزش از صفر شروع میشود و مستقیماً بر همبستگی وضعیت سیستم و خروجی عددی تمرکز دارد.
❇️توکنسازی عددی سفارشی: خروجیها با رمزگذاری کارآمد (مانند P10 mantissa-sign-exponent) بهعنوان مقادیر شناور در واژگان مدل نمایش داده میشوند.
🔹نتایج:
✅روی خوشهی Borg، RLM به ضریب همبستگی رتبهای اسپیرمن ۰٫۹۹ (میانگین ۰٫۹) در پیشبینی MIPS per GCU دست یافت.
✅میانگین مربعات خطا (MSE) تا ۱۰۰ برابر کمتر از مدلهای جدولی پایه بود.
✅مدلها بهطور طبیعی عدم قطعیت را از طریق نمونهگیری چند خروجی برای هر ورودی برآورد میکنند؛ که پشتیبان شبیهسازی احتمالاتی و بهینهسازی بیزی است.
🔹برآورد عدم قطعیت:
مدلهای RLM قادرند هم عدم قطعیت ذاتی (Aleatoric) و هم عدم قطعیت دانشی (Epistemic) ناشی از محدودیت در مشاهده را مدل کنند؛ قابلیتی که اغلب در رگرسورهای جعبهسیاه وجود ندارد.
🔹شبیهسازهای عمومی:
توانایی مدلسازی چگالی در RLMها نویدبخش ساخت دوقلوهای دیجیتال عمومی برای سیستمهای عظیم است؛ با هدف تسریع بهینهسازی زیرساخت و ارائه بازخورد بلادرنگ.
🔹کاربردها:
❇️ابر و خوشههای محاسباتی: پیشبینی و بهینهسازی مستقیم عملکرد در زیرساختهای بزرگ و پویا.
❇️تولید و اینترنت اشیا: شبیهسازهای عمومی برای پیشبینی خروجی در خطوط صنعتی متنوع.
❇️تجربههای علمی: مدلسازی سرتاسری هنگامی که ورودیها پیچیده، متنی و عددی متنوع هستند.
🔹جمعبندی:
این رویکرد نو – که رگرسیون را بهمثابه مدلسازی زبانی میبیند – موانع دیرینه در شبیهسازی سیستمها را از میان برمیدارد، امکان سازگاری سریع با محیطهای تازه را فراهم میکند و پیشبینیهای مقاوم و آگاه به عدمقطعیت را پشتیبانی مینماید؛ ویژگیهایی حیاتی برای نسل آیندهی هوش مصنوعی صنعتی.
👈 برای مطالعه بیشتر میتوانید به مقاله، کدها و جزئیات فنی مراجعه کنید. همچنین گوگل صفحه GitHub خود را برای آموزشها، کدها و دفترچههای راهنما منتشر کرده است.
منبع:
https://research.google/blog/simulating-large-systems-with-regression-language-models/
مقاله:
https://arxiv.org/abs/2506.21718
گیتهاب:
https://github.com/google-deepmind/regress-lm
#اندیشکده_مطالعات_هوش_مصنوعی_فرهنگ_رسانه
#هوش_مصنوعی
┏━━💠┓
🆔 https://eitaa.com/nraimc
┗💠━━
نشست مجازی اندیشکده و جایگاه آن در نظام آموزش عالی و حکمرانی، با حضور جناب آقای مهندس صابر میرزایی؛ معاون محترم پژوهش و توسعه اقتصادی مرکز همکاری های ریاست جمهوری
و با حضور اعضای اندیشکده های استادان کشور بصورت حضوری و مجازی در ساختمان مرکزی نهاد نمایندگی مقام معظم رهبری در دانشگاه ها برگزار گردید.
«نُها»؛ شبکه نوآوری و هم افزایی اندیشکده های استادان
❔@tn_noha❔
📝 اهم نکات مطرح شده در این نشست
اندیشکده با پژوهشکده تفاوت اساسی دارد. پژوهشکده معمولاً مسیری خطی و آرام دارد؛ پروژهای انجام میدهد، گزارش یا کتابی منتشر میکند و کار به پایان میرسد. اما اندیشکده چنین نیست؛ اندیشکده باید تا مرحلهی اجرا در میدان بماند، با مدیران ارتباط داشته باشد، مسائل واقعی جامعه را لمس کند و برای راهحلهای ارائهشده پیگیری کند تا مطمئن شود در عمل قابل تحقق هستند. اندیشکده محیطی کنشگرانه دارد، نه آرام و آکادمیک.
تفاوت اندیشکده و پژوهشکده
پژوهشکده: تولید دانش، انتشار گزارش، پایان مأموریت
اندیشکده: پیگیری مستمر راهکارها، درگیری مستقیم با میدان و مسئله، نقش کنشگری
🔹چالشهای اندیشکدهها در ایران
🔺وابستگی مالی به دولت و دانشگاهها → تهدید استقلال علمی
🔺نبود جایگاه حقوقی روشن و آییننامههای حمایتی
🔺ضعف ارتباط با رسانه و افکار عمومی
🔺رقابت یا مقاومت دستگاههای اجرایی که اندیشکدهها را رقیب میبینند
🔻راهکارهای تقویت اندیشکدهها
✅ایجاد استقلال مالی (تنوع منابع، حمایت غیرمستقیم، جذب حمایت خرد)
✅حضور فعال در رسانه برای گفتمانسازی
✅تعامل مستقیم با مدیران برای اقناع آنان
✅ارائه راهکارهای عملی و قابل پیادهسازی نه صرفاً تئوری
♦️فرصتها
✔️استفاده از هوش مصنوعی برای تحلیل داده و تولید راهکار
✔️بهرهگیری از ظرفیت رسانه برای معرفی و اثرگذاری
✔️نقش واسط اندیشکدهها در کاهش فشار مستقیم دولت بر مسائل حساس
📊 تحلیل و جمعبندی
1⃣ هویت اندیشکدهها: برخلاف مراکز پژوهشی، هویت آنها به میزان "قابلیت اجرایی بودن" راهکارهایشان وابسته است.
2⃣ استقلال مالی و حقوقی: یکی از اصلیترین موانع توسعهی اندیشکدهها در ایران، وابستگی مالی به دولت و نبود جایگاه قانونی مشخص است. بدون استقلال، اندیشکدهها به بازتولید گفتمان رسمی محدود میشوند.
3⃣ نقش رسانه و افکار عمومی: موفقیت اندیشکدهها در اقناع مدیران و تغییر سیاستها، به قدرت آنها در گفتمانسازی عمومی و استفاده از رسانهها وابسته است.
4⃣ چالشهای نهادی: مقاومت دستگاههای اجرایی، فقدان فرهنگ گفتوگو و نگاه رقابتی نسبت به اندیشکدهها، باعث تضعیف اثرگذاری آنها شده است.
5⃣ تجربههای موفق: نمونههایی ذکر شد که اندیشکدهها با کنشگری توانستند سیاستهای مخالف دولت را به دستاورد رسمی تبدیل کنند؛ نشاندهنده نقش مهم "پایداری و میدانداری" است.
❔@tn_noha❔
📌 چطور میتوان یک شبکه عصبی را مجبور کرد دادههایی را که دیگر دسترسی به آنها وجود ندارد، فراموش کند؟
فرض کنید تقاضایی مبنی بر حذف دادهها مطابق با GDPR یا قوانین کپیرایت دریافت کردهاید، اما دیگر به دیتاست اصلی که مدل روی آن آموزش دیده، دسترسی ندارید. بازآموزی مدل از صفر کاری زمانبر، پرهزینه و عملاً غیرممکن است.
برای چنین موقعیتهای بیراهحل، گروهی از پژوهشگران دانشگاه کالیفرنیا روشی برای «یادزدایی» (Unlearning) مدلها ارائه کردهاند که نیازی به دادههای اصلی ندارد، اما همچنان تضمینهای ریاضی سختگیرانهای برای حذف اطلاعات ارائه میدهد.
این روش بر پایهی استفاده از یک دیتاست جانشین (Surrogate Dataset) بنا شده است که فقط از نظر آماری شبیه به دیتاست اصلی است. ایدهی کلیدی، کالیبراسیون نویز تزریقشده به مدل است؛ میزان نویز مستقیماً به فاصلهی آماری (مثلاً واگرایی کولباک–لایبلر) بین توزیع اصلی و توزیع جانشین بستگی دارد.
به بیان ساده: هرچه دیتاست جانشین کمتر به دیتاست از دسترفته شباهت داشته باشد، باید نویز بیشتری به مدل اضافه کرد تا تضمین شود که مدل واقعاً دادههای ناخواسته را فراموش کرده و از نظر آماری غیرقابلتمایز از مدلی شود که از صفر بازآموزی شده است.
---
🟡 چطور میتوان این فاصله را بدون دسترسی به دیتاست اصلی اندازه گرفت؟
اینجا خود مدل وارد عمل میشود، چون به طور ضمنی اطلاعاتی دربارهی توزیع دادههای آموزشی در خود دارد. با استفاده از روش پویایی گرادیان تصادفی لانژون (Stochastic Gradient Langevin Dynamics) میتوان نمونههایی تولید کرد که توزیع اصلی را تقریب میزنند و سپس این توزیع با دیتاست جانشین مقایسه میشود.
---
🟡 آزمایشها و نتایج
روی دادههای مصنوعی، که KL-divergence دقیق قابل محاسبه است، روش Unlearn - عملکرد عالی داشت. با افزایش فاصلهی بین دیتاستها، دقت روی تست حدود 72.3 تا 72.7٪ باقی ماند؛ این رقم با روش Unlearn + (که به دادههای اصلی دسترسی دارد) تقریباً یکسان است.
روی دیتاستهای واقعی هم نتایج مشابه بود. برای CIFAR-10 با پارامتر تمرکز دیریکله=36، روش Unlearn - به دقت 76.4٪ رسید. برای مقایسه: Unlearn + به 76.5٪ و بازآموزی کامل به 76.7٪ رسید. تفاوتها ناچیز است.
متریک Forget Score (FS) نیز نشان داد که مدل یادزداییشده تقریباً همارز با مدلی است که از صفر بازآموزی شده است.
این روش روی معماریهای مختلف هم آزمایش شد. برای CIFAR-10 با مدلی شامل دو لایه کانولوشنی و یک لایه خطی، Unlearn - دقت 80.5٪ داشت، در حالی که نسخه با دسترسی به دادهها 81.4٪ بود.
در آزمایشی دیگر، برای مدلی روی دیتاست USPS از MNIST به عنوان دیتاست جانشین استفاده شد. روش Unlearn - دقت 90.4٪ گرفت، در حالی که Unlearn + به 91.3٪ و بازآموزی کامل به 91.1٪ رسید.
---
🟡 مقاله
https://arxiv.org/pdf/2506.06486
#AI #LLM #Unlearning #UCR
#اندیشکده_مطالعات_هوش_مصنوعی_فرهنگ_رسانه
#هوش_مصنوعی
┏━━💠┓
🆔 https://eitaa.com/nraimc
┗💠━━
⚡️مدل VaultGemma 1B؛ مدل زبانی متنباز گوگل با تضمین حفظ حریم خصوصی
گوگل AI و دیپمایند از مدل جدیدی به نام VaultGemma 1B رونمایی کردهاند؛ بزرگترین مدل زبانی متنباز با وزنهای آزاد که از ابتدا بهطور کامل با حفظ حریم خصوصی افتراقی (Differential Privacy) آموزش دیده است. این دستاورد گامی مهم در جهت ساخت مدلهایی است که هم قدرتمند هستند و هم امنیت دادههای شخصی را تضمین میکنند.
❓چرا حریم خصوصی افتراقی اهمیت دارد؟
مدلهای زبانی بزرگ معمولاً در معرض خطر بازتولید دادههای حساس یا شخصی هستند. حریم خصوصی افتراقی تضمین میکند که هیچ نمونهی آموزشی منفرد، اثر معناداری بر مدل نگذارد. VaultGemma از مرحلهی پیشآموزش تا انتها بهطور کامل بر این مبنا ساخته شده است.
⚙️ویژگیهای فنی VaultGemma
🔹اندازه: ۱ میلیارد پارامتر، ۲۶ لایه
🔹معماری: ترنسفورمر، فقط دیکودر
🔹توکنایزر: SentencePiece با واژگان ۲۵۶هزار تایی
🔹طول دنباله: ۱۰۲۴ توکن (برای کاهش هزینه و افزایش کارایی)
🔹فعالسازی: GeGLU
🔹توجه (Attention): چند-پرسوجو (MQA)
💽دادههای آموزشی
مدل با مجموعهای شامل ۱۳ تریلیون توکن (متون انگلیسی، کد و مقالات علمی) آموزش دیده است. دادهها پیش از آموزش فیلتر شدند تا محتوای ناامن و اطلاعات شخصی حذف شود.
🔒نحوهی اعمال حریم خصوصی افتراقی
استفاده از الگوریتم DP-SGD با برش گرادیان و افزودن نویز گاوسی
تضمین ریاضی: ε ≤ 2.0 , δ ≤ 1.1e-10 در سطح توالی ۱۰۲۴ توکنی
بهرهگیری از بهینهسازیهای محاسباتی برای مقیاسپذیری روی ۲۰۴۸ تراشه TPUv6e
💥عملکرد مدل
در مقایسه با مدلهای بدون حریم خصوصی، دقت پایینتر است (مثلاً در ARC-C: امتیاز ۲۶.۴۵ در برابر ۳۸.۳۱).
با این حال، آزمونها نشان دادند هیچ دادهی آموزشی از مدل نشت نمیکند، برخلاف نمونههای غیرخصوصی.
🔼جمعبندی
مدل VaultGemma 1B نشان میدهد که میتوان مدلهای زبانی بزرگ را با تضمینهای سختگیرانهی حریم خصوصی آموزش داد، بدون آنکه استفاده از آنها غیرعملی شود. هرچند هنوز فاصلهای در کیفیت با مدلهای غیرخصوصی وجود دارد، این کار بنیانی قوی برای آیندهی هوش مصنوعی امن، شفاف و حافظ حریم خصوصی فراهم میکند.
📝مقاله
https://services.google.com/fh/files/blogs/vaultgemma_tech_report.pdf
مدل
https://huggingface.co/google/vaultgemma-1b
---
#اندیشکده_مطالعات_هوش_مصنوعی_فرهنگ_رسانه
#هوش_مصنوعی
┏━━💠┓
🆔 https://eitaa.com/nraimc
┗💠━━