ایتا - اندیشکده مطالعات هوش مصنوعی در فرهنگ و رسانه

اندیشکده مطالعات هوش مصنوعی در فرهنگ و رسانه

سلسله نشست های تخصصی مجازی
شبکه اندیشکده های استادان کشور

#نشست شماره ۱
🔍موضوع: «سیاست گذاری علم و فناوری با تاکید بر قانون جهش تولید دانش بنیان»
🎙دکتر پرویز کرمی
▪️مشاور سابق معاون علمی و فناوری ریاست جمهوری
▪️مدیرعامل مرکز نوآوری همیار دانش بنیان
▪️داور برنامه تلوزیونی میدون

🗓سه شنبه ۱۴۰۴/۰۶/۰۴
⏰ ۱۰ الی ۱۱:۳۰
✨ارائه گواهی به شرکت کنندگان

🔻🔻🔻🔻🔻🔻🔻🔻🔻
جهت ورورد به نشست اینجا کلیک کنید.
🔺🔺🔺🔺🔺🔺🔺🔺🔺

🔶 «نُها»؛ شبکه نوآوری و هم افزایی اندیشکده های استادان

❔@tn_noha❔

1 مشاهده12:41

اندیشکده مطالعات هوش مصنوعی در فرهنگ و رسانه

نشست مجازی دکتر پرویز کرمی با عنوان «سیاست گذاری علم و فناوری با تاکید بر قانون جهش تولید دانش بنیان» بعلت مشکل بوجود آمده برای ایشان، به زمان دیگری موکول گردید.
زمان جلسه جدید، متعابقا اطلاع رسانی خواهد شد.

1 مشاهده13:14

اندیشکده مطالعات هوش مصنوعی در فرهنگ و رسانه

📣اخبار هوش مصنوعی 

❇️ مایکروسافت سیستم متن‌باز VibeVoice را منتشر کرد.
سامانه VibeVoice یک سامانه متن‌باز سنتز گفتار به زبان انگلیسی و چینی است که می‌تواند محتوای صوتی پر‌احساس تا ۹۰ دقیقه را با حداکثر ۴ گوینده تولید کند.
این سیستم از رمزگذارهای گفتار پیوسته با فرکانس بسیار پایین ۷.۵ هرتز و ترکیبی از مدل‌های زبانی بزرگ (LLM) برای درک زمینه و مدل انتشار (diffusion) برای تولید صدای باکیفیت استفاده می‌کند.
کد استنتاج آن هم‌اکنون در GitHub در دسترس است و مدل ۱.۵ میلیارد پارامتری به همراه توکنایزر در Hugging Face قرار دارد. نسخه‌های بزرگ‌تر (۷B) و فشرده‌تر (۰.۵B) نیز در راه هستند.
microsoft.github.io

❇️ برنامه NotebookLM یاد گرفت نقد ویدئویی در ۸۰ زبان، از جمله فارسی، تولید کند.
اکنون امکان تبدیل اسناد و یادداشت‌های بارگذاری‌شده به ارائه‌های ویدئویی کوتاه در ۸۰ زبان (از جمله فارسی) فراهم شده است؛ قابلیتی که پیش‌تر فقط در انگلیسی فعال بود.
همزمان، گوگل قابلیت Audio Overviews را ارتقا داده که امکان ساخت خلاصه‌های صوتی طولانی‌تر و دقیق‌تر را در زبان‌های مختلف فراهم می‌کند.
این به‌روزرسانی‌ها در حال انتشار هستند و به گفته گوگل، طی یک هفته آینده برای تمام کاربران جهانی در دسترس خواهند بود.
blog.google

❇️ انویدیا Jetson AGX Thor را معرفی کرد.
رایانه Jetson AGX Thor قدرتمندترین رایانه امروز برای محاسبات هوش مصنوعی لبه (Edge AI) و رباتیک است. این پلتفرم عملکردی معادل ۲۰۷۰ ترافلاپس (FP4) دارد که حدود ۷.۵ برابر سریع‌تر از نسل قبلی، Jetson Orin، است.
این سیستم بر پایه GPU با معماری Blackwell، یک پردازنده ۱۴ هسته‌ای Arm و حافظه ۱۲۸ گیگابایت LPDDR5X ساخته شده است. این ترکیب امکان اجرای محلی مدل‌های زبانی بزرگ و چندوجهی و پردازش داده‌های چند حسگر با کمترین تأخیر را فراهم می‌کند.
پلتفرم با مجموعه نرم‌افزارهای انویدیا شامل Isaac، Metropolis و Holoscan سازگار است.
کیت توسعه آن اکنون با قیمت ۳۴۹۹ دلار قابل سفارش است و ارسال آن از ماه آینده آغاز می‌شود. ماژول‌های سریالی Jetson T5000 ویژه ربات‌های آماده نیز در پایان ۲۰۲۵ با قیمت ۲۹۹۹ دلار برای سفارش‌های بالای ۱۰۰۰ واحد عرضه خواهند شد.
cnbc.com

❇️ ایلان ماسک از اپل و OpenAI شکایت یک میلیارد دلاری کرد.
شرکت‌های xAI و X شکایتی ضدانحصار به ارزش یک میلیارد دلار در دادگاه فدرال آمریکا علیه اپل و OpenAI ثبت کرده‌اند. در این شکایت آمده که این دو شرکت به‌طور غیرقانونی برای تسلط بر بازار گوشی‌های هوشمند و هوش مصنوعی مولد تبانی کرده‌اند و قوانین ضدانحصار آمریکا را نقض کرده‌اند.
طبق این سند ۶۱ صفحه‌ای، ادغام انحصاری ChatGPT در iOS و دستکاری رتبه‌بندی اپ‌استور باعث پایین کشیدن جایگاه رقبای چت‌بات می‌شود. ماسک معتقد است این شرایط باعث شده «هیچ شرکت هوش مصنوعی غیر از OpenAI نتواند به صدر اپ‌استور برسد.»
اپل از اظهار نظر خودداری کرده و OpenAI این شکایت را «ادامه حملات سیستماتیک آقای ماسک» نامیده است.
wsj.com

❇️مرورگر Brave یک آسیب‌پذیری در Comet از Perplexity کشف کرد.
به گفته Brave، مشکل مربوط به حملات موسوم به "تزریق غیرمستقیم پرامپت" است؛ جایی که مهاجمان می‌توانند فرمان‌های مخرب را در صفحات وب جاسازی کنند و دستیار هوش مصنوعی Comet هنگام تحلیل محتوا آن‌ها را به‌عنوان دستور کاربر اجرا کند.
در آزمایش‌ها، Brave نشان داد که چگونه می‌توان Comet را وادار کرد تا داده‌های محرمانه، آدرس‌های ایمیل و رمزهای یک‌بارمصرف را برای مهاجمان ارسال کند. هرچند Perplexity به‌روزرسانی‌هایی منتشر کرده، اما مشکل هنوز به‌طور کامل حل نشده است.
brave.com

#خبر #هوش_مصنوعی
#اندیشکده_مطالعات_هوش_مصنوعی_فرهنگ_رسانه
#هوش_مصنوعی 
┏━━💠┓ 
🆔 https://eitaa.com/nraimc

1 مشاهده21:25

اندیشکده مطالعات هوش مصنوعی در فرهنگ و رسانه

⚡️ بیش از 500 اسکریپت آماده برای n8n

یک منبع ساده و کاربردی: دو مخزن GitHub با صدها ورک‌فلو رایگان برای n8n.

موضوعات: فروش، بازاریابی، حسابداری مالی، کدنویسی و بهره‌وری شخصی.

چارچوب n8n چیست؟

ابزار متن‌باز بدون کدنویسی برای اتوماسیون

سازنده بصری: اتصال بلوک‌ها برای ایجاد فرآیند

صدها یکپارچگی: ایمیل، CRM، صفحات گسترده، پیام‌رسان‌ها، وبهوک‌ها

امکان افزودن منطق شخصی با جاوااسکریپت

اجرا بر اساس زمان‌بندی یا رویداد، هم در فضای ابری و هم روی سرور شخصی

نحوه استفاده:

1. ورک‌فلو موردنظر (json) را دانلود کرده و در n8n وارد کنید

2. کلیدهای API و اطلاعات کاربری خود را در بلوک‌ها وارد کنید

3. مراحل را بررسی کرده و اجرای آن را با کرون (cron) یا وبهوک فعال کنید

🔗 لینک‌ها:

https://github.com/wassupjay/n8n-free-templates

https://github.com/kossakovsky/n8n-installer

#n8n #ai 

#اندیشکده_مطالعات_هوش_مصنوعی_فرهنگ_رسانه
#هوش_مصنوعی 
┏━━💠┓ 
🆔 https://eitaa.com/nraimc
┗💠━━

1 مشاهده19:16

اندیشکده مطالعات هوش مصنوعی در فرهنگ و رسانه

✨مدل زبانی رگرسیون جدید گوگل (RLM) چارچوبی برای پیش‌بینی عملکرد سیستم‌های صنعتی؛ مستقیماً از داده‌های متنی خام

رویکرد تازه‌ی مدل زبانی رگرسیون (Regression Language Model – RLM) که توسط گوگل معرفی شده، این امکان را فراهم می‌کند که مدل‌های زبانی بزرگ (LLM) بتوانند عملکرد سیستم‌های صنعتی را مستقیماً از روی داده‌های متنی خام پیش‌بینی کنند؛ بدون آن‌که نیاز به مهندسی ویژگی‌های پیچیده یا قالب‌های جدولی سخت‌گیرانه باشد.

🔹چالش پیش‌بینی در سیستم‌های صنعتی

پیش‌بینی عملکرد در مقیاس بزرگ، مثل خوشه‌های محاسباتی Borg گوگل، معمولاً مستلزم مهندسی ویژگی‌های سنگین و داده‌های جدولی تخصصی است؛ موضوعی که مقیاس‌پذیری و سازگاری را دشوار می‌کند. لاگ‌ها، فایل‌های پیکربندی، ترکیب‌های متنوع سخت‌افزاری و داده‌های تو در توی وظایف (Jobs) را نمی‌توان به‌سادگی تخت و نرمال‌سازی کرد تا در مدل‌های رگرسیون کلاسیک استفاده شوند. همین امر باعث می‌شود فرآیندهای شبیه‌سازی و بهینه‌سازی شکننده، پرهزینه و کند شوند؛ به‌ویژه هنگامی که سخت‌افزارها یا بارهای کاری جدید معرفی می‌گردند.

✨ایده اصلی: رگرسیون متنی (Text-to-Text Regression)

❇️کاربردپذیری همگانی: هر حالت سیستمی را می‌توان به‌صورت یک رشته (string) نمایش داد؛ بنابراین ویژگی‌های ناهمگون، تو در تو و پویا به‌صورت بومی پشتیبانی می‌شوند.

🔹جزئیات فنی: معماری و آموزش

❇️استفاده از یک مدل LLM رمزگذار–رمزگشا با اندازه نسبتاً کوچک (۶۰ میلیون پارامتر).

❇️آموزش با Cross-Entropy پیش‌بینی توکن بعدی بر روی نمایش‌های متنی حالت‌ها (xxx) و خروجی‌ها (yyy).

❇️بدون پیش‌آموزش روی داده‌های زبانی عمومی؛ آموزش از صفر شروع می‌شود و مستقیماً بر همبستگی وضعیت سیستم و خروجی عددی تمرکز دارد.

❇️توکن‌سازی عددی سفارشی: خروجی‌ها با رمزگذاری کارآمد (مانند P10 mantissa-sign-exponent) به‌عنوان مقادیر شناور در واژگان مدل نمایش داده می‌شوند.

🔹نتایج:

✅روی خوشه‌ی Borg، RLM به ضریب همبستگی رتبه‌ای اسپیرمن ۰٫۹۹ (میانگین ۰٫۹) در پیش‌بینی MIPS per GCU دست یافت.

✅میانگین مربعات خطا (MSE) تا ۱۰۰ برابر کمتر از مدل‌های جدولی پایه بود.

✅مدل‌ها به‌طور طبیعی عدم قطعیت را از طریق نمونه‌گیری چند خروجی برای هر ورودی برآورد می‌کنند؛ که پشتیبان شبیه‌سازی احتمالاتی و بهینه‌سازی بیزی است.

🔹برآورد عدم قطعیت:

مدل‌های RLM قادرند هم عدم قطعیت ذاتی (Aleatoric) و هم عدم قطعیت دانشی (Epistemic) ناشی از محدودیت در مشاهده را مدل کنند؛ قابلیتی که اغلب در رگرسورهای جعبه‌سیاه وجود ندارد.

🔹شبیه‌سازهای عمومی:

توانایی مدل‌سازی چگالی در RLMها نویدبخش ساخت دوقلوهای دیجیتال عمومی برای سیستم‌های عظیم است؛ با هدف تسریع بهینه‌سازی زیرساخت و ارائه بازخورد بلادرنگ.

🔹کاربردها:

❇️ابر و خوشه‌های محاسباتی: پیش‌بینی و بهینه‌سازی مستقیم عملکرد در زیرساخت‌های بزرگ و پویا.

❇️تولید و اینترنت اشیا: شبیه‌سازهای عمومی برای پیش‌بینی خروجی در خطوط صنعتی متنوع.

❇️تجربه‌های علمی: مدل‌سازی سرتاسری هنگامی که ورودی‌ها پیچیده، متنی و عددی متنوع هستند.

🔹جمع‌بندی:

این رویکرد نو – که رگرسیون را به‌مثابه مدل‌سازی زبانی می‌بیند – موانع دیرینه در شبیه‌سازی سیستم‌ها را از میان برمی‌دارد، امکان سازگاری سریع با محیط‌های تازه را فراهم می‌کند و پیش‌بینی‌های مقاوم و آگاه به عدم‌قطعیت را پشتیبانی می‌نماید؛ ویژگی‌هایی حیاتی برای نسل آینده‌ی هوش مصنوعی صنعتی.

👈 برای مطالعه بیشتر می‌توانید به مقاله، کدها و جزئیات فنی مراجعه کنید. همچنین گوگل صفحه GitHub خود را برای آموزش‌ها، کدها و دفترچه‌های راهنما منتشر کرده است.

منبع:
https://research.google/blog/simulating-large-systems-with-regression-language-models/

مقاله:
https://arxiv.org/abs/2506.21718

گیت‌هاب:
https://github.com/google-deepmind/regress-lm

#اندیشکده_مطالعات_هوش_مصنوعی_فرهنگ_رسانه
#هوش_مصنوعی 
┏━━💠┓ 
🆔 https://eitaa.com/nraimc
┗💠━━

1 مشاهده23:28

اندیشکده مطالعات هوش مصنوعی در فرهنگ و رسانه

نشست مجازی اندیشکده و جایگاه آن در نظام آموزش عالی و حکمرانی، با حضور جناب آقای مهندس صابر میرزایی؛ معاون محترم پژوهش و توسعه اقتصادی مرکز همکاری های ریاست جمهوری
و با حضور اعضای اندیشکده های استادان کشور بصورت حضوری و مجازی در ساختمان مرکزی نهاد نمایندگی مقام معظم رهبری در دانشگاه ها برگزار گردید.

«نُها»؛ شبکه نوآوری و هم افزایی اندیشکده های استادان

❔@tn_noha❔

1 مشاهده14:41

اندیشکده مطالعات هوش مصنوعی در فرهنگ و رسانه

📝 اهم نکات مطرح شده در این نشست 

اندیشکده با پژوهشکده تفاوت اساسی دارد. پژوهشکده معمولاً مسیری خطی و آرام دارد؛ پروژه‌ای انجام می‌دهد، گزارش یا کتابی منتشر می‌کند و کار به پایان می‌رسد. اما اندیشکده چنین نیست؛ اندیشکده باید تا مرحله‌ی اجرا در میدان بماند، با مدیران ارتباط داشته باشد، مسائل واقعی جامعه را لمس کند و برای راه‌حل‌های ارائه‌شده پیگیری کند تا مطمئن شود در عمل قابل تحقق هستند. اندیشکده محیطی کنشگرانه دارد، نه آرام و آکادمیک.

تفاوت اندیشکده و پژوهشکده
پژوهشکده: تولید دانش، انتشار گزارش، پایان مأموریت
اندیشکده: پیگیری مستمر راهکارها، درگیری مستقیم با میدان و مسئله، نقش کنشگری

🔹چالش‌های اندیشکده‌ها در ایران
🔺وابستگی مالی به دولت و دانشگاه‌ها → تهدید استقلال علمی
🔺نبود جایگاه حقوقی روشن و آیین‌نامه‌های حمایتی
🔺ضعف ارتباط با رسانه و افکار عمومی
🔺رقابت یا مقاومت دستگاه‌های اجرایی که اندیشکده‌ها را رقیب می‌بینند

🔻راهکارهای تقویت اندیشکده‌ها
✅ایجاد استقلال مالی (تنوع منابع، حمایت غیرمستقیم، جذب حمایت خرد)
✅حضور فعال در رسانه برای گفتمان‌سازی
✅تعامل مستقیم با مدیران برای اقناع آنان
✅ارائه راهکارهای عملی و قابل پیاده‌سازی نه صرفاً تئوری

♦️فرصت‌ها
✔️استفاده از هوش مصنوعی برای تحلیل داده و تولید راهکار
✔️بهره‌گیری از ظرفیت رسانه برای معرفی و اثرگذاری
✔️نقش واسط اندیشکده‌ها در کاهش فشار مستقیم دولت بر مسائل حساس

📊 تحلیل و جمع‌بندی

1⃣ هویت اندیشکده‌ها: برخلاف مراکز پژوهشی، هویت آن‌ها به میزان "قابلیت اجرایی بودن" راهکارهایشان وابسته است.
2⃣ استقلال مالی و حقوقی: یکی از اصلی‌ترین موانع توسعه‌ی اندیشکده‌ها در ایران، وابستگی مالی به دولت و نبود جایگاه قانونی مشخص است. بدون استقلال، اندیشکده‌ها به بازتولید گفتمان رسمی محدود می‌شوند.
3⃣ نقش رسانه و افکار عمومی: موفقیت اندیشکده‌ها در اقناع مدیران و تغییر سیاست‌ها، به قدرت آن‌ها در گفتمان‌سازی عمومی و استفاده از رسانه‌ها وابسته است.
4⃣ چالش‌های نهادی: مقاومت دستگاه‌های اجرایی، فقدان فرهنگ گفت‌وگو و نگاه رقابتی نسبت به اندیشکده‌ها، باعث تضعیف اثرگذاری آن‌ها شده است.
5⃣ تجربه‌های موفق: نمونه‌هایی ذکر شد که اندیشکده‌ها با کنشگری توانستند سیاست‌های مخالف دولت را به دستاورد رسمی تبدیل کنند؛ نشان‌دهنده نقش مهم "پایداری و میدان‌داری" است.

❔@tn_noha❔

1 مشاهده14:41

اندیشکده مطالعات هوش مصنوعی در فرهنگ و رسانه

📌 چطور می‌توان یک شبکه عصبی را مجبور کرد داده‌هایی را که دیگر دسترسی به آن‌ها وجود ندارد، فراموش کند؟

فرض کنید تقاضایی مبنی بر حذف داده‌ها مطابق با GDPR یا قوانین کپی‌رایت دریافت کرده‌اید، اما دیگر به دیتاست اصلی که مدل روی آن آموزش دیده، دسترسی ندارید. بازآموزی مدل از صفر کاری زمان‌بر، پرهزینه و عملاً غیرممکن است.

برای چنین موقعیت‌های بی‌راه‌حل، گروهی از پژوهشگران دانشگاه کالیفرنیا روشی برای «یادزدایی» (Unlearning) مدل‌ها ارائه کرده‌اند که نیازی به داده‌های اصلی ندارد، اما همچنان تضمین‌های ریاضی سخت‌گیرانه‌ای برای حذف اطلاعات ارائه می‌دهد.

این روش بر پایه‌ی استفاده از یک دیتاست جانشین (Surrogate Dataset) بنا شده است که فقط از نظر آماری شبیه به دیتاست اصلی است. ایده‌ی کلیدی، کالیبراسیون نویز تزریق‌شده به مدل است؛ میزان نویز مستقیماً به فاصله‌ی آماری (مثلاً واگرایی کولباک–لایبلر) بین توزیع اصلی و توزیع جانشین بستگی دارد.

به بیان ساده: هرچه دیتاست جانشین کمتر به دیتاست از دست‌رفته شباهت داشته باشد، باید نویز بیشتری به مدل اضافه کرد تا تضمین شود که مدل واقعاً داده‌های ناخواسته را فراموش کرده و از نظر آماری غیرقابل‌تمایز از مدلی شود که از صفر بازآموزی شده است.
---

🟡 چطور می‌توان این فاصله را بدون دسترسی به دیتاست اصلی اندازه گرفت؟

اینجا خود مدل وارد عمل می‌شود، چون به طور ضمنی اطلاعاتی درباره‌ی توزیع داده‌های آموزشی در خود دارد. با استفاده از روش پویایی گرادیان تصادفی لانژون (Stochastic Gradient Langevin Dynamics) می‌توان نمونه‌هایی تولید کرد که توزیع اصلی را تقریب می‌زنند و سپس این توزیع با دیتاست جانشین مقایسه می‌شود.
---

🟡 آزمایش‌ها و نتایج

روی داده‌های مصنوعی، که KL-divergence دقیق قابل محاسبه است، روش Unlearn - عملکرد عالی داشت. با افزایش فاصله‌ی بین دیتاست‌ها، دقت روی تست حدود 72.3 تا 72.7٪ باقی ماند؛ این رقم با روش Unlearn + (که به داده‌های اصلی دسترسی دارد) تقریباً یکسان است.

روی دیتاست‌های واقعی هم نتایج مشابه بود. برای CIFAR-10 با پارامتر تمرکز دیریکله=36، روش Unlearn - به دقت 76.4٪ رسید. برای مقایسه: Unlearn + به 76.5٪ و بازآموزی کامل به 76.7٪ رسید. تفاوت‌ها ناچیز است.

متریک Forget Score (FS) نیز نشان داد که مدل یادزدایی‌شده تقریباً هم‌ارز با مدلی است که از صفر بازآموزی شده است.

این روش روی معماری‌های مختلف هم آزمایش شد. برای CIFAR-10 با مدلی شامل دو لایه کانولوشنی و یک لایه خطی، Unlearn - دقت 80.5٪ داشت، در حالی که نسخه با دسترسی به داده‌ها 81.4٪ بود.

در آزمایشی دیگر، برای مدلی روی دیتاست USPS از MNIST به عنوان دیتاست جانشین استفاده شد. روش Unlearn - دقت 90.4٪ گرفت، در حالی که Unlearn + به 91.3٪ و بازآموزی کامل به 91.1٪ رسید.
---

🟡 مقاله 
https://arxiv.org/pdf/2506.06486

#AI #LLM #Unlearning #UCR 

#اندیشکده_مطالعات_هوش_مصنوعی_فرهنگ_رسانه
#هوش_مصنوعی 
┏━━💠┓ 
🆔 https://eitaa.com/nraimc
┗💠━━

1 مشاهده16:39

اندیشکده مطالعات هوش مصنوعی در فرهنگ و رسانه

⚡️مدل VaultGemma 1B؛ مدل زبانی متن‌باز گوگل با تضمین حفظ حریم خصوصی

گوگل AI و دیپ‌مایند از مدل جدیدی به نام VaultGemma 1B رونمایی کرده‌اند؛ بزرگ‌ترین مدل زبانی متن‌باز با وزن‌های آزاد که از ابتدا به‌طور کامل با حفظ حریم خصوصی افتراقی (Differential Privacy) آموزش دیده است. این دستاورد گامی مهم در جهت ساخت مدل‌هایی است که هم قدرتمند هستند و هم امنیت داده‌های شخصی را تضمین می‌کنند.

❓چرا حریم خصوصی افتراقی اهمیت دارد؟

مدل‌های زبانی بزرگ معمولاً در معرض خطر بازتولید داده‌های حساس یا شخصی هستند. حریم خصوصی افتراقی تضمین می‌کند که هیچ نمونه‌ی آموزشی منفرد، اثر معناداری بر مدل نگذارد. VaultGemma از مرحله‌ی پیش‌آموزش تا انتها به‌طور کامل بر این مبنا ساخته شده است.

⚙️ویژگی‌های فنی VaultGemma

🔹اندازه: ۱ میلیارد پارامتر، ۲۶ لایه

🔹معماری: ترنسفورمر، فقط دیکودر

🔹توکنایزر: SentencePiece با واژگان ۲۵۶هزار تایی

🔹طول دنباله: ۱۰۲۴ توکن (برای کاهش هزینه و افزایش کارایی)

🔹فعال‌سازی: GeGLU

🔹توجه (Attention): چند-پرس‌وجو (MQA)

💽داده‌های آموزشی

مدل با مجموعه‌ای شامل ۱۳ تریلیون توکن (متون انگلیسی، کد و مقالات علمی) آموزش دیده است. داده‌ها پیش از آموزش فیلتر شدند تا محتوای ناامن و اطلاعات شخصی حذف شود.

🔒نحوه‌ی اعمال حریم خصوصی افتراقی

استفاده از الگوریتم DP-SGD با برش گرادیان و افزودن نویز گاوسی

تضمین ریاضی: ε ≤ 2.0 , δ ≤ 1.1e-10 در سطح توالی ۱۰۲۴ توکنی

بهره‌گیری از بهینه‌سازی‌های محاسباتی برای مقیاس‌پذیری روی ۲۰۴۸ تراشه TPUv6e

💥عملکرد مدل

در مقایسه با مدل‌های بدون حریم خصوصی، دقت پایین‌تر است (مثلاً در ARC-C: امتیاز ۲۶.۴۵ در برابر ۳۸.۳۱).

با این حال، آزمون‌ها نشان دادند هیچ داده‌ی آموزشی از مدل نشت نمی‌کند، برخلاف نمونه‌های غیرخصوصی.

🔼جمع‌بندی

مدل VaultGemma 1B نشان می‌دهد که می‌توان مدل‌های زبانی بزرگ را با تضمین‌های سخت‌گیرانه‌ی حریم خصوصی آموزش داد، بدون آن‌که استفاده از آن‌ها غیرعملی شود. هرچند هنوز فاصله‌ای در کیفیت با مدل‌های غیرخصوصی وجود دارد، این کار بنیانی قوی برای آینده‌ی هوش مصنوعی امن، شفاف و حافظ حریم خصوصی فراهم می‌کند.

📝مقاله 
https://services.google.com/fh/files/blogs/vaultgemma_tech_report.pdf

مدل
https://huggingface.co/google/vaultgemma-1b
---

#اندیشکده_مطالعات_هوش_مصنوعی_فرهنگ_رسانه
#هوش_مصنوعی 
┏━━💠┓ 
🆔 https://eitaa.com/nraimc
┗💠━━

1 مشاهده00:51

مطالب بعدی

پرسش‌ها

قوانین

داغ‌ترین‌ها

چندسکویی