ایتا - اندیشکده مطالعات هوش مصنوعی در فرهنگ و رسانه

اندیشکده مطالعات هوش مصنوعی در فرهنگ و رسانه

👌مدل Qwen3-VL: قدرتمندترین مدل چندرسانه‌ای از علی‌بابا

✨ به‌روزرسانی‌های کلیدی:

🧠 قابلیت‌های هوشمند:
- به عنوان یک عامل بصری روی کامپیوتر و گوشی‌های هوشمند کار می‌کند 🖥📱

- تولید کد از تصاویر (HTML/CSS/JS) 💻

- درک فضایی پیشرفته برای هوش مصنوعی و رباتیک 🤖

🎯 بهبودهای فنی:
- زمینه تا ۱ میلیون توکن 📚

- شناسایی همه چیز: افراد مشهور، انیمه، جاذبه‌های گردشگری 🌟

- قابلیت OCR به ۳۲ زبان، شامل نمادهای باستانی 🈯️

- نتایج عالی در علوم پایه و منطق 🧪

⚡️ معماری:
- معماری Interleaved-MRoPE برای تحلیل ویدئو 🎥

- معماری DeepStack برای درک دقیق تصاویر 🔍

- اتصال دقیق متن به نشانه‌های زمانی ⏱️

نسخه‌های Instruct و Thinking نیز در دسترس هستند! 🚀

🔗مدل
 https://huggingface.co/collections/Qwen/qwen3-vl-68d2a7c1b8a8afce4ebd2dbe

#AI #Qwen #VLM
#اندیشکده_مطالعات_هوش_مصنوعی_فرهنگ_رسانه
#هوش_مصنوعی 
┏━━💠┓ 
🆔 https://eitaa.com/nraimc
┗💠━━

1 مشاهده17:02

اندیشکده مطالعات هوش مصنوعی در فرهنگ و رسانه

🔊 گوگل با معرفی رویکرد جدید «Speech-to-Retrieval (S2R)» مرزهای جست‌وجوی صوتی را جابه‌جا کرد

گوگل در تازه‌ترین پژوهش خود، رویکردی نو به نام S2R (گفتار به بازیابی) معرفی کرده که مرحله‌ی تبدیل گفتار به متن (ASR) را کاملاً حذف می‌کند. در این روش، پرس‌وجوی گفتاری کاربر مستقیماً به یک بردار تعبیه صوتی (audio embedding) تبدیل می‌شود و سپس برای بازیابی اطلاعات به بردارهای اسناد تطبیق داده می‌شود.

🔹 نوآوری کلیدی:

در مدل‌های قدیمی، مسیر جست‌وجو به‌صورت زنجیره‌ای بود: گفتار 👈 متن 👈 بازیابی.
اما در S2R، گوگل از یک سیستم رمزگذار دوگانه (dual-encoder) استفاده کرده که مرحله‌ی متن را دور می‌زند و مستقیماً بین گفتار و اطلاعات پیوند برقرار می‌کند.

🌍 کاربرد در مقیاس جهانی:

این فناوری هم‌اکنون در Voice Search چندزبانه‌ی گوگل به‌کار گرفته شده و ارزیابی‌ها نشان می‌دهد که S2R از مدل‌های کلاسیک مبتنی بر متن عملکرد بهتری دارد — حتی نزدیک به نتایجی که بر پایه‌ی رونویسی انسانی تأیید‌شده به‌دست می‌آیند.

📚 استانداردسازی پژوهش:

برای تسهیل پژوهش در این حوزه، گوگل دیتاست جدیدی به نام Simple Voice Questions (SVQ) را منتشر کرده که شامل ۱۷ زبان و ۲۶ ناحیه‌ی زبانی است و بخشی از چارچوب Massive Sound Embedding Benchmark (MSEB) محسوب می‌شود.

🔗 تحلیل کامل:
 MarkTechPost

🔬 جزئیات فنی:
 Google Research Blog
 
#اندیشکده_مطالعات_هوش_مصنوعی_فرهنگ_رسانه
#هوش_مصنوعی 
┏━━💠┓ 
🆔 https://eitaa.com/nraimc
┗💠━━

1 مشاهده08:18

اندیشکده مطالعات هوش مصنوعی در فرهنگ و رسانه

هدایت شده از «نُها» شبکه نوآوری و هم‌افزایی اندیشکده‌های استادان

سلسله نشست های تخصصی مجازی
شبکه اندیشکده های استادان کشور

🔍موضوع: «مرجعیت علمی؛ چیستی، چرایی و چگونگی»

🎙دکتر ناصر باقری مقدم
▪ مدیر گروه سیاست فناوری و نوآوری موسسه تحقیقات سیاست علمی کشور
▪️قائم مقام سابق بنیاد ملی نخبگان
▪️رئیس اندیشکده مرجعیت علمی

🗓شنبه ۱۴۰۴/۰۷/۲۶
⏰ ۱۸:۳۰ الی ۲۰:۰۰
✨ارائه گواهی به شرکت کنندگان

🔻🔻🔻🔻🔻🔻🔻🔻🔻
جهت ورورد به نشست اینجا کلیک کنید.
🔺🔺🔺🔺🔺🔺🔺🔺🔺

🔶 «نُها»؛ شبکه نوآوری و هم افزایی اندیشکده های استادان

❔@tn_noha

1 مشاهده09:29

اندیشکده مطالعات هوش مصنوعی در فرهنگ و رسانه

سنجاق پیغام

09:29

اندیشکده مطالعات هوش مصنوعی در فرهنگ و رسانه

0:19

2.8M حجم رسانه بالاست

مشاهده در ایتا

🔥ساخت پاورپوینت ، کاملاً رایگان و بدون هیچ محدودیتی؟!
▪️فقط با وارد کردن متن ساده یا فایل PDF/Word، در عرض چند ثانیه یک پاورپوینت کامل و شیک تحویل می‌ده. و نکتهٔ بی‌نظیر : فارسی رو کاملاً پشتیبانی میکنه.
#پاورپوینت
#ابزارهای_کاربردی 
#اندیشکده_مطالعات_هوش_مصنوعی_فرهنگ_رسانه
#هوش_مصنوعی 
┏━━💠┓ 
🆔 https://eitaa.com/nraimc
┗💠━━

1 مشاهده14:29

اندیشکده مطالعات هوش مصنوعی در فرهنگ و رسانه

هدایت شده از «نُها» شبکه نوآوری و هم‌افزایی اندیشکده‌های استادان

سلسله نشست های تخصصی مجازی
شبکه اندیشکده های استادان کشور

🔍موضوع: «سیاست گذاری علم و فناوری با تاکید بر قانون جهش تولید دانش بنیان»
🎙دکتر پرویز کرمی
▪️مشاور سابق معاون علمی و فناوری ریاست جمهوری
▪️مدیرعامل مرکز نوآوری همیار دانش بنیان
▪️داور برنامه تلوزیونی میدون

🗓 شنبه ۱۴۰۴/۰۸/۱۰
⏰ ۱۸:۳۰ الی ۲۰:۰۰
✨ارائه گواهی به شرکت کنندگان

🔻🔻🔻🔻🔻🔻🔻🔻🔻
جهت ورورد به نشست اینجا کلیک کنید.
🔺🔺🔺🔺🔺🔺🔺🔺🔺

🔶 «نُها»؛ شبکه نوآوری و هم افزایی اندیشکده های استادان

❔@tn_noha❔

1 مشاهده12:06

اندیشکده مطالعات هوش مصنوعی در فرهنگ و رسانه

💡 چارچوب SPICE: گامی تازه در بهبود خودانگیخته مدل‌های زبانی
مقاله‌ای از پژوهشگران Meta FAIR و دانشگاه ملی سنگاپور (NUS)
(منتشر شده در اکتبر ۲۰۲۵)

🔍 خلاصهٔ پژوهش

پژوهشگران در این مقاله چارچوبی نوین به نام SPICE (Self-Play In Corpus Environments) ارائه کرده‌اند که هدف آن ارتقای مداوم توان استدلال مدل‌های زبانی بزرگ (LLMs) از طریق نوعی یادگیری تقویتی خودکار است.
در این روش، یک مدل در دو نقش هم‌زمان عمل می‌کند:

چالش‌گر (Challenger): با استخراج اسناد واقعی از پیکره‌های متنی، پرسش‌هایی دشوار و متنوع تولید می‌کند؛

استدلال‌گر (Reasoner): بدون دسترسی به سند، تلاش می‌کند به این پرسش‌ها پاسخ دهد.
در تعامل میان این دو نقش، چالش‌گر به تدریج پرسش‌های پیچیده‌تر می‌سازد و استدلال‌گر نیز گام‌به‌گام توانایی‌های استدلالی خود را بهبود می‌بخشد؛ فرآیندی که نوعی «برنامهٔ درسی خودکار» را به وجود می‌آورد.

🧠 مسئله و نوآوری

روش‌های سنتی بازی برابر خود (Self-Play) در مدل‌های زبانی غالباً با دو مشکل روبه‌رو هستند:

۱. انباشت خطا و توهم (Hallucination) در داده‌های مصنوعی،

۲. تقارن اطلاعاتی میان سازنده و پاسخ‌دهنده که مانع شکل‌گیری چالش واقعی می‌شود.

روش SPICE با افزودن مؤلفه‌ای به نام پایه‌گذاری در اسناد واقعی (Corpus Grounding) این چرخه را می‌شکند. بدین ترتیب، مدل همواره به داده‌های نو و قابل‌راستی‌آزمایی متکی است و از انباشت خطا جلوگیری می‌شود.

⚙️ سازوکار SPICE

منبع یادگیری: 
مجموعه‌ای از اسناد واقعی (مانند داده‌های ریاضی یا متون علمی).

پاداش‌ها: 
چالش‌گر بر اساس میزان دشواری مناسب پرسش (واریانس پاسخ‌های مدل) پاداش می‌گیرد.
استدلال‌گر بر اساس درستی پاسخ، پاداش دودویی دریافت می‌کند.

آموزش هم‌زمان: 
هر دو نقش با وزن‌های مشترک و الگوریتم DrGRPO آموزش می‌بینند؛ رویکردی که منجر به هم‌تکاملی (Co-evolution) دو نقش می‌شود.

📊 نتایج تجربی

آزمایش‌ها بر روی مدل‌های مختلف (از جمله Qwen3-4B و OctoThinker-8B) نشان داده‌اند که SPICE در مقایسه با روش‌های بازی برابر خود (Self-Play) موجود مانند R-Zero و Absolute Zero:
میانگین بهبود ۸٫۹٪ در استدلال ریاضی
و ۹٫۸٪ در استدلال عمومی به همراه دارد.
همچنین پویایی آموزشی نشان می‌دهد که مدل در طول زمان پرسش‌های دشوارتر و پاسخ‌های منطقی‌تر تولید می‌کند — نشانه‌ای از شکل‌گیری نوعی یادگیری خودسازمان‌یافته و پایدار.

🔬 تحلیل و بررسی

استفاده از دو پیکره‌ی NaturalReasoning و Nemotron-CC-Math بهترین نتایج را فراهم کرده است.
ترکیب پرسش‌های چندگزینه‌ای و آزاد موجب تعادل میان دقت و خلاقیت می‌شود.
تابع پاداش بر پایه‌ی واریانس گاوسی مؤثرترین روش برای تنظیم تدریجی دشواری مسائل است.

🧩 جمع‌بندی

روش SPICE نشان می‌دهد که می‌توان مدل‌های زبانی را به گونه‌ای آموزش داد تا خود به‌صورت پویا از داده‌های جهان واقعی بیاموزند و رشد کنند، بی‌آنکه نیاز به نظارت انسانی یا مجموعه‌داده‌های ثابت داشته باشند.
این رویکرد گامی مهم در مسیر خودبهبوددهی پایدار و نزدیک شدن به AGI به شمار می‌آید؛ زیرا تعامل میان مدل و محیط داده‌ای واقعی، زمینه‌ی یادگیری بی‌پایان و پیشرفت مداوم را فراهم می‌کند.

🔗 https://arxiv.org/abs/2510.24684

#اندیشکده_مطالعات_هوش_مصنوعی_فرهنگ_رسانه
#هوش_مصنوعی 
┏━━💠┓ 
🆔 https://eitaa.com/nraimc
┗💠━━

1 مشاهده09:58

اندیشکده مطالعات هوش مصنوعی در فرهنگ و رسانه

🧠 روش Think-at-Hard (TaH): روشی هوشمند برای تقویت توان استدلال مدل‌های زبانی

پژوهشگران دانشگاه Tsinghua روشی تازه به نام TaH معرفی کرده‌اند که توان استدلال مدل‌های زبانی را بدون افزایش تعداد پارامترها به‌طور قابل توجهی بهبود می‌دهد.

🔍 مسئله

در بسیاری از مدل‌ها، «تفکر بیش‌ازحد پنهان» رخ می‌دهد:
مدل وقتی بیش از حد روی یک مسئله فکر می‌کند، در نهایت پاسخ درست را خراب می‌کند.

💡 راه‌حل TaH

این روش سه ایده کلیدی دارد:

🔎 تشخیص توکن‌های سخت: مدل فقط روی بخش‌های دشوار مسئله بیشتر «فکر» می‌کند.

🧩 حل کننده مسئله سبک (Light Solver): تصمیم می‌گیرد کجا نیاز به تفکر طولانی‌تر است.

🔧 تطبیق گرهای LoRA-Adapters: هنگام لزوم، مدل را وارد حالت «اصلاح خطا» می‌کنند تا اشتباهات استنتاجی را ترمیم کند.

📊 نتایج آزمایش

🚀 افزایش ۴ تا ۵ درصدی دقت روی پنج بنچمارک مهم ریاضی

🧹 ۹۴٪ توکن‌ها از محاسبات اضافی آزاد می‌شوند

⚡️ کاهش قابل توجه FLOPs نسبت به روش‌های مبتنی بر تفکر یکنواخت

خروجی نهایی:

روشی هوشمند، انتخابی و کم‌هزینه برای افزایش کیفیت تفکر LLMها.

🔗 لینک مقاله:
https://arxiv.org/abs/2511.08577

#AI #LLM #Tsinghua #Research

#اندیشکده_مطالعات_هوش_مصنوعی_فرهنگ_رسانه
#هوش_مصنوعی 
┏━━💠┓ 
🆔 https://eitaa.com/nraimc
┗💠━━

1 مشاهده17:08

اندیشکده مطالعات هوش مصنوعی در فرهنگ و رسانه

هدایت شده از «نُها» شبکه نوآوری و هم‌افزایی اندیشکده‌های استادان

سلسله نشست های تخصصی مجازی
شبکه اندیشکده های استادان کشور

🔍موضوع: «از ایده تا اثر؛ سیاست گذاری موثر و تولید بسته های سیاستی در اندیشکده ها »

🎙دکتر ناصر باقری مقدم
▪ مدیر گروه سیاست فناوری و نوآوری موسسه تحقیقات سیاست علمی کشور
▪️قائم مقام سابق بنیاد ملی نخبگان
▪️دکتری مدیریت تکنولوژی؛ سیاستگذاری علم و فناوری

🗓یکشنبه ۱۴۰۴/۰۸/۲۵
⏰ ۱۸:۳۰ الی ۲۰:۰۰
✨ارائه گواهی به شرکت کنندگان

🔻🔻🔻🔻🔻🔻🔻🔻🔻
جهت ورورد به نشست اینجا کلیک کنید.
🔺🔺🔺🔺🔺🔺🔺🔺🔺

🔶 «نُها»؛ شبکه نوآوری و هم افزایی اندیشکده های استادان

❔@tn_noha❔

1 مشاهده08:45

اندیشکده مطالعات هوش مصنوعی در فرهنگ و رسانه

سنجاق پیغام

08:45

اندیشکده مطالعات هوش مصنوعی در فرهنگ و رسانه

سلسله نشست های تخصصی مجازی شبکه اندیشکده های استادان کشور 🔍موضوع: «از ایده تا اثر؛ سیاست گذاری م

🔰 اطلاعیه کنسل شدن نشست

نشست «از ایده تا اثر؛ سیاست گذاری موثر و تولید بسته های سیاستی در اندیشکده ها» دکتر ناصر باقری مقدم کنسل شده و به زمان دیگری موکول میشود.
زمان نشست جدید متعاقباً در کانال اطلاع رسانی خواهد شد.

❔@tn_noha❔

1 مشاهده11:17

اندیشکده مطالعات هوش مصنوعی در فرهنگ و رسانه

سنجاق پیغام

11:17

مطالب بعدی

پرسش‌ها

قوانین

داغ‌ترین‌ها

چندسکویی