👌مدل Qwen3-VL: قدرتمندترین مدل چندرسانهای از علیبابا
✨ بهروزرسانیهای کلیدی:
🧠 قابلیتهای هوشمند:
- به عنوان یک عامل بصری روی کامپیوتر و گوشیهای هوشمند کار میکند 🖥📱
- تولید کد از تصاویر (HTML/CSS/JS) 💻
- درک فضایی پیشرفته برای هوش مصنوعی و رباتیک 🤖
🎯 بهبودهای فنی:
- زمینه تا ۱ میلیون توکن 📚
- شناسایی همه چیز: افراد مشهور، انیمه، جاذبههای گردشگری 🌟
- قابلیت OCR به ۳۲ زبان، شامل نمادهای باستانی 🈯️
- نتایج عالی در علوم پایه و منطق 🧪
⚡️ معماری:
- معماری Interleaved-MRoPE برای تحلیل ویدئو 🎥
- معماری DeepStack برای درک دقیق تصاویر 🔍
- اتصال دقیق متن به نشانههای زمانی ⏱️
نسخههای Instruct و Thinking نیز در دسترس هستند! 🚀
🔗مدل
https://huggingface.co/collections/Qwen/qwen3-vl-68d2a7c1b8a8afce4ebd2dbe
#AI #Qwen #VLM
#اندیشکده_مطالعات_هوش_مصنوعی_فرهنگ_رسانه
#هوش_مصنوعی
┏━━💠┓
🆔 https://eitaa.com/nraimc
┗💠━━
🔊 گوگل با معرفی رویکرد جدید «Speech-to-Retrieval (S2R)» مرزهای جستوجوی صوتی را جابهجا کرد
گوگل در تازهترین پژوهش خود، رویکردی نو به نام S2R (گفتار به بازیابی) معرفی کرده که مرحلهی تبدیل گفتار به متن (ASR) را کاملاً حذف میکند. در این روش، پرسوجوی گفتاری کاربر مستقیماً به یک بردار تعبیه صوتی (audio embedding) تبدیل میشود و سپس برای بازیابی اطلاعات به بردارهای اسناد تطبیق داده میشود.
🔹 نوآوری کلیدی:
در مدلهای قدیمی، مسیر جستوجو بهصورت زنجیرهای بود: گفتار 👈 متن 👈 بازیابی.
اما در S2R، گوگل از یک سیستم رمزگذار دوگانه (dual-encoder) استفاده کرده که مرحلهی متن را دور میزند و مستقیماً بین گفتار و اطلاعات پیوند برقرار میکند.
🌍 کاربرد در مقیاس جهانی:
این فناوری هماکنون در Voice Search چندزبانهی گوگل بهکار گرفته شده و ارزیابیها نشان میدهد که S2R از مدلهای کلاسیک مبتنی بر متن عملکرد بهتری دارد — حتی نزدیک به نتایجی که بر پایهی رونویسی انسانی تأییدشده بهدست میآیند.
📚 استانداردسازی پژوهش:
برای تسهیل پژوهش در این حوزه، گوگل دیتاست جدیدی به نام Simple Voice Questions (SVQ) را منتشر کرده که شامل ۱۷ زبان و ۲۶ ناحیهی زبانی است و بخشی از چارچوب Massive Sound Embedding Benchmark (MSEB) محسوب میشود.
🔗 تحلیل کامل:
MarkTechPost
🔬 جزئیات فنی:
Google Research Blog
#اندیشکده_مطالعات_هوش_مصنوعی_فرهنگ_رسانه
#هوش_مصنوعی
┏━━💠┓
🆔 https://eitaa.com/nraimc
┗💠━━
هدایت شده از «نُها»
شبکه نوآوری و همافزایی اندیشکدههای استادان
سلسله نشست های تخصصی مجازی
شبکه اندیشکده های استادان کشور
🔍موضوع: «مرجعیت علمی؛ چیستی، چرایی و چگونگی»
🎙دکتر ناصر باقری مقدم
▪ مدیر گروه سیاست فناوری و نوآوری موسسه تحقیقات سیاست علمی کشور
▪️قائم مقام سابق بنیاد ملی نخبگان
▪️رئیس اندیشکده مرجعیت علمی
🗓شنبه ۱۴۰۴/۰۷/۲۶
⏰ ۱۸:۳۰ الی ۲۰:۰۰
✨ارائه گواهی به شرکت کنندگان
🔻🔻🔻🔻🔻🔻🔻🔻🔻
جهت ورورد به نشست اینجا کلیک کنید.
🔺🔺🔺🔺🔺🔺🔺🔺🔺
🔶 «نُها»؛ شبکه نوآوری و هم افزایی اندیشکده های استادان
❔@tn_noha
2.8M حجم رسانه بالاست
مشاهده در ایتا
🔥ساخت پاورپوینت ، کاملاً رایگان و بدون هیچ محدودیتی؟!
▪️فقط با وارد کردن متن ساده یا فایل PDF/Word، در عرض چند ثانیه یک پاورپوینت کامل و شیک تحویل میده. و نکتهٔ بینظیر : فارسی رو کاملاً پشتیبانی میکنه.
#پاورپوینت
#ابزارهای_کاربردی
#اندیشکده_مطالعات_هوش_مصنوعی_فرهنگ_رسانه
#هوش_مصنوعی
┏━━💠┓
🆔 https://eitaa.com/nraimc
┗💠━━
هدایت شده از «نُها»
شبکه نوآوری و همافزایی اندیشکدههای استادان
سلسله نشست های تخصصی مجازی
شبکه اندیشکده های استادان کشور
🔍موضوع: «سیاست گذاری علم و فناوری با تاکید بر قانون جهش تولید دانش بنیان»
🎙دکتر پرویز کرمی
▪️مشاور سابق معاون علمی و فناوری ریاست جمهوری
▪️مدیرعامل مرکز نوآوری همیار دانش بنیان
▪️داور برنامه تلوزیونی میدون
🗓 شنبه ۱۴۰۴/۰۸/۱۰
⏰ ۱۸:۳۰ الی ۲۰:۰۰
✨ارائه گواهی به شرکت کنندگان
🔻🔻🔻🔻🔻🔻🔻🔻🔻
جهت ورورد به نشست اینجا کلیک کنید.
🔺🔺🔺🔺🔺🔺🔺🔺🔺
🔶 «نُها»؛ شبکه نوآوری و هم افزایی اندیشکده های استادان
❔@tn_noha❔
💡 چارچوب SPICE: گامی تازه در بهبود خودانگیخته مدلهای زبانی
مقالهای از پژوهشگران Meta FAIR و دانشگاه ملی سنگاپور (NUS)
(منتشر شده در اکتبر ۲۰۲۵)
🔍 خلاصهٔ پژوهش
پژوهشگران در این مقاله چارچوبی نوین به نام SPICE (Self-Play In Corpus Environments) ارائه کردهاند که هدف آن ارتقای مداوم توان استدلال مدلهای زبانی بزرگ (LLMs) از طریق نوعی یادگیری تقویتی خودکار است.
در این روش، یک مدل در دو نقش همزمان عمل میکند:
چالشگر (Challenger): با استخراج اسناد واقعی از پیکرههای متنی، پرسشهایی دشوار و متنوع تولید میکند؛
استدلالگر (Reasoner): بدون دسترسی به سند، تلاش میکند به این پرسشها پاسخ دهد.
در تعامل میان این دو نقش، چالشگر به تدریج پرسشهای پیچیدهتر میسازد و استدلالگر نیز گامبهگام تواناییهای استدلالی خود را بهبود میبخشد؛ فرآیندی که نوعی «برنامهٔ درسی خودکار» را به وجود میآورد.
🧠 مسئله و نوآوری
روشهای سنتی بازی برابر خود (Self-Play) در مدلهای زبانی غالباً با دو مشکل روبهرو هستند:
۱. انباشت خطا و توهم (Hallucination) در دادههای مصنوعی،
۲. تقارن اطلاعاتی میان سازنده و پاسخدهنده که مانع شکلگیری چالش واقعی میشود.
روش SPICE با افزودن مؤلفهای به نام پایهگذاری در اسناد واقعی (Corpus Grounding) این چرخه را میشکند. بدین ترتیب، مدل همواره به دادههای نو و قابلراستیآزمایی متکی است و از انباشت خطا جلوگیری میشود.
⚙️ سازوکار SPICE
منبع یادگیری:
مجموعهای از اسناد واقعی (مانند دادههای ریاضی یا متون علمی).
پاداشها:
چالشگر بر اساس میزان دشواری مناسب پرسش (واریانس پاسخهای مدل) پاداش میگیرد.
استدلالگر بر اساس درستی پاسخ، پاداش دودویی دریافت میکند.
آموزش همزمان:
هر دو نقش با وزنهای مشترک و الگوریتم DrGRPO آموزش میبینند؛ رویکردی که منجر به همتکاملی (Co-evolution) دو نقش میشود.
📊 نتایج تجربی
آزمایشها بر روی مدلهای مختلف (از جمله Qwen3-4B و OctoThinker-8B) نشان دادهاند که SPICE در مقایسه با روشهای بازی برابر خود (Self-Play) موجود مانند R-Zero و Absolute Zero:
میانگین بهبود ۸٫۹٪ در استدلال ریاضی
و ۹٫۸٪ در استدلال عمومی به همراه دارد.
همچنین پویایی آموزشی نشان میدهد که مدل در طول زمان پرسشهای دشوارتر و پاسخهای منطقیتر تولید میکند — نشانهای از شکلگیری نوعی یادگیری خودسازمانیافته و پایدار.
🔬 تحلیل و بررسی
استفاده از دو پیکرهی NaturalReasoning و Nemotron-CC-Math بهترین نتایج را فراهم کرده است.
ترکیب پرسشهای چندگزینهای و آزاد موجب تعادل میان دقت و خلاقیت میشود.
تابع پاداش بر پایهی واریانس گاوسی مؤثرترین روش برای تنظیم تدریجی دشواری مسائل است.
🧩 جمعبندی
روش SPICE نشان میدهد که میتوان مدلهای زبانی را به گونهای آموزش داد تا خود بهصورت پویا از دادههای جهان واقعی بیاموزند و رشد کنند، بیآنکه نیاز به نظارت انسانی یا مجموعهدادههای ثابت داشته باشند.
این رویکرد گامی مهم در مسیر خودبهبوددهی پایدار و نزدیک شدن به AGI به شمار میآید؛ زیرا تعامل میان مدل و محیط دادهای واقعی، زمینهی یادگیری بیپایان و پیشرفت مداوم را فراهم میکند.
🔗 https://arxiv.org/abs/2510.24684
#اندیشکده_مطالعات_هوش_مصنوعی_فرهنگ_رسانه
#هوش_مصنوعی
┏━━💠┓
🆔 https://eitaa.com/nraimc
┗💠━━
🧠 روش Think-at-Hard (TaH): روشی هوشمند برای تقویت توان استدلال مدلهای زبانی
پژوهشگران دانشگاه Tsinghua روشی تازه به نام TaH معرفی کردهاند که توان استدلال مدلهای زبانی را بدون افزایش تعداد پارامترها بهطور قابل توجهی بهبود میدهد.
🔍 مسئله
در بسیاری از مدلها، «تفکر بیشازحد پنهان» رخ میدهد:
مدل وقتی بیش از حد روی یک مسئله فکر میکند، در نهایت پاسخ درست را خراب میکند.
💡 راهحل TaH
این روش سه ایده کلیدی دارد:
🔎 تشخیص توکنهای سخت: مدل فقط روی بخشهای دشوار مسئله بیشتر «فکر» میکند.
🧩 حل کننده مسئله سبک (Light Solver): تصمیم میگیرد کجا نیاز به تفکر طولانیتر است.
🔧 تطبیق گرهای LoRA-Adapters: هنگام لزوم، مدل را وارد حالت «اصلاح خطا» میکنند تا اشتباهات استنتاجی را ترمیم کند.
📊 نتایج آزمایش
🚀 افزایش ۴ تا ۵ درصدی دقت روی پنج بنچمارک مهم ریاضی
🧹 ۹۴٪ توکنها از محاسبات اضافی آزاد میشوند
⚡️ کاهش قابل توجه FLOPs نسبت به روشهای مبتنی بر تفکر یکنواخت
خروجی نهایی:
روشی هوشمند، انتخابی و کمهزینه برای افزایش کیفیت تفکر LLMها.
🔗 لینک مقاله:
https://arxiv.org/abs/2511.08577
#AI #LLM #Tsinghua #Research
#اندیشکده_مطالعات_هوش_مصنوعی_فرهنگ_رسانه
#هوش_مصنوعی
┏━━💠┓
🆔 https://eitaa.com/nraimc
┗💠━━
هدایت شده از «نُها»
شبکه نوآوری و همافزایی اندیشکدههای استادان
سلسله نشست های تخصصی مجازی
شبکه اندیشکده های استادان کشور
🔍موضوع: «از ایده تا اثر؛ سیاست گذاری موثر و تولید بسته های سیاستی در اندیشکده ها »
🎙دکتر ناصر باقری مقدم
▪ مدیر گروه سیاست فناوری و نوآوری موسسه تحقیقات سیاست علمی کشور
▪️قائم مقام سابق بنیاد ملی نخبگان
▪️دکتری مدیریت تکنولوژی؛ سیاستگذاری علم و فناوری
🗓یکشنبه ۱۴۰۴/۰۸/۲۵
⏰ ۱۸:۳۰ الی ۲۰:۰۰
✨ارائه گواهی به شرکت کنندگان
🔻🔻🔻🔻🔻🔻🔻🔻🔻
جهت ورورد به نشست اینجا کلیک کنید.
🔺🔺🔺🔺🔺🔺🔺🔺🔺
🔶 «نُها»؛ شبکه نوآوری و هم افزایی اندیشکده های استادان
❔@tn_noha❔
اندیشکده مطالعات هوش مصنوعی در فرهنگ و رسانه
سلسله نشست های تخصصی مجازی شبکه اندیشکده های استادان کشور 🔍موضوع: «از ایده تا اثر؛ سیاست گذاری م
🔰 اطلاعیه کنسل شدن نشست
نشست «از ایده تا اثر؛ سیاست گذاری موثر و تولید بسته های سیاستی در اندیشکده ها» دکتر ناصر باقری مقدم کنسل شده و به زمان دیگری موکول میشود.
زمان نشست جدید متعاقباً در کانال اطلاع رسانی خواهد شد.
❔@tn_noha❔