ایتا - اندیشکده مطالعات هوش مصنوعی در فرهنگ و رسانه

اندیشکده مطالعات هوش مصنوعی در فرهنگ و رسانه

🚩 🎙 معرفی و لینک سه هوش مصنوعی کاربردی مختص صدا

▫️ https://murf.ai/
▫️https://cleanvoice.ai
▫️http://podcastle.ai

#ابزارهای_کاربردی
#اندیشکده_مطالعات_هوش_مصنوعی_فرهنگ_رسانه
#هوش_مصنوعی 
┏━━💠┓ 
🆔 https://eitaa.com/nraimc
┗💠━━

1 مشاهده13:41

اندیشکده مطالعات هوش مصنوعی در فرهنگ و رسانه

🌟 معماری Mixture-of-Recursions (MoR): معماری نوین با استدلال انتخابی

🔬 گوگل با همکاری KAIST AI، معماری جدیدی به نام MoR را معرفی کرده که مفهوم محاسبه تطبیقی و پردازش انتخابی را به سطحی تازه می‌برد.

💡 در MoR، مدل برای هر توکن به‌طور متفاوت و پویا تصمیم می‌گیرد چقدر "فکر کند"!
بر خلاف ترنسفورمرهای کلاسیک، این معماری بازگشتی (Recursive) است و ورودی‌ها چند بار از همان بلاک عبور می‌کنند — اما با یک تفاوت کلیدی:
⏱️ عمق تکرار برای هر توکن متفاوت است و به صورت پویا تعیین می‌شود.

🔁 چطور کار می‌کند؟ یک روتر سبک و قابل آموزش مشخص می‌کند که هر توکن چند بار باید پردازش شود:

توکن‌های ساده ممکن است فقط یک بار پردازش شوند

توکن‌های پیچیده‌تر ممکن است چندین بار از لایه عبور کنند تا معنا و کاربردشان بهتر درک شود

✨ دو مزیت کلیدی MoR:

1. ✅ صرفه‌جویی در محاسبات:
توکن‌هایی که پردازششان تمام شده، دیگر در چرخه‌های بعدی شرکت نمی‌کنند → مصرف محاسباتی کمتر!

2. ✅ بهینه‌سازی حافظه (KV Caching):
به جای ذخیره تمام لایه‌ها، فقط توکن‌های فعال در هر چرخه کش می‌شوند → حافظه کمتر، سرعت بیشتر، استقرار آسان‌تر!

📉 روش MoR با بودجه محاسباتی مشابه (FLOPs) و اندازه مدل کوچکتر، نتایج بهتری در few-shot learning و perplexity نسبت به مدل‌های کلاسیک و بازگشتی ارائه می‌دهد.

🧪 امتحان کنید! کد آموزش و ارزیابی در GitHub منتشر شده:

🔗 مشاهده در GitHub

https://github.com/raymin0223/mixture_of_recursions

🟡 مطالعه در ArXiv

https://arxiv.org/pdf/2507.10524

---

#MoR #AI #LLM #MachineLearning #DeepLearning #Google #KAIST
#اندیشکده_مطالعات_هوش_مصنوعی_فرهنگ_رسانه
#هوش_مصنوعی 
┏━━💠┓ 
🆔 https://eitaa.com/nraimc
┗💠━━

1 مشاهده10:38

اندیشکده مطالعات هوش مصنوعی در فرهنگ و رسانه

📢 شبکه هم‌اندیشی استادان و نخبگان دانشگاهی برگزار می‌کند:
🔍 نشست تخصصی با عنوان:
«هوش مصنوعی، رسانه و تکنیک‌های جنگ شناختی»

🎙 مدرس: استاد محمد جوانی
📅 زمان: دوشنبه، ۱۳ مردادماه | ساعت ۸ تا ۱۱

🎯 مخاطبان:
دبیران هم‌اندیشی استادان؛ مسئولان، دبیران و اعضای کارگروه‌های رسانه؛ مدیران و اعضای اندیشکده‌های استادان

📍 برگزاری به‌صورت ترکیبی (حضوری و مجازی)
⏳ مهلت ثبت‌نام حضوری: تا پایان روز جمعه همین هفته
⚠️ به‌دلیل محدودیت ظرفیت، اولویت با افرادی است که زودتر ثبت‌نام کنند.

📝 برای همه شرکت‌کنندگان گواهی حضور صادر می‌شود (با درج نوع حضور: حضوری یا مجازی).

🔗 ثبت‌نام حضوری: https://B2n.ir/kw4803
🌐 شرکت مجازی: https://room.nahad.ir/ch/hamandishi

1 مشاهده04:53

اندیشکده مطالعات هوش مصنوعی در فرهنگ و رسانه

🌟 ابزار Google LangExtract: کتابخانه‌ای برای استخراج ساختار از هر نوع متنی

ابزار LangExtract یک کتابخانه‌ی اپن‌سورس پایتون است که با ارائه‌ی یک رابط سبک به مدل‌های زبانی بزرگ (LLM)، متن‌های حجیم را به داده‌های ساخت‌یافته تبدیل می‌کند.

---

🟡 ویژگی کلیدی LangExtract در مقایسه با ابزارهای دیگر: تمرکز دقیق بر منبع داده

هر موجودیت استخراج‌شده، مانند نام، تاریخ یا دوز دارو، به موقعیت دقیق کاراکتری در متن اصلی متصل می‌شود. این یعنی نتایج قابل ردیابی و قابل تأیید هستند، فقط با برجسته‌سازی داده‌های پیدا شده در سند اصلی. دیگر لازم نیست بپرسید «مدل اینو از کجا آورده؟»

---

🟡 دومین مزیت مهم: قابل‌اطمینان بودن خروجی‌ها

شما قالب دلخواه خروجی را با استفاده از یک تعریف ساختار داده مشخص می‌کنید و چند نمونه مثال به مدل می‌دهید. LangExtract با بهره‌گیری از این نمونه‌ها و مکانیزم تولید کنترل‌شده (که در مدل‌های Gemini پشتیبانی می‌شود)، از این الگو پیروی می‌کند. نتیجه این است که همیشه داده‌هایی با ساختار یکسان و قابل پیش‌بینی دریافت می‌کنید.

---

🟡 پردازش متون بسیار حجیم

کتابخانه LangExtract توانایی شکستن متن به قطعات (chunk) و پردازش موازی آن‌ها را دارد. این پردازش در چند مرحله انجام می‌شود که هر مرحله بر یک زمینه‌ی خاص تمرکز دارد.

برای درک بهتر نتایج، کتابخانه توانایی تولید نمایش HTML تعاملی و کاملاً مستقل را دارد. با این قابلیت می‌توان ظرف چند دقیقه، از متن خام به یک نمایش بصری رسید که هزاران برچسب استخراج‌شده را نشان می‌دهد.

---

کتابخانه LangExtract محدود به اکوسیستم Google نیست: از تغییر انعطاف‌پذیر مدل‌های زبانی پشتیبانی می‌کند، چه مدل‌های ابری و چه مدل‌های اپن‌سورس که به‌صورت محلی اجرا می‌شوند.

---

🟡 استفاده از "دانش جهانی" مدل‌های زبانی

اطلاعات استخراج‌شده می‌تواند صریحاً از متن باشد یا از دانش درونی مدل تولید شود. دقت این اطلاعات استنتاج‌شده، به توانایی مدل و کیفیت نمونه‌های داده‌شده بستگی دارد.

---

در ابتدا، ایده‌های پشت LangExtract برای استخراج داده از متون پزشکی توسعه یافته‌اند. این کتابخانه در شناسایی داروها، دوز مصرف و دیگر ویژگی‌های موجود در گزارش‌های بالینی عملکرد بسیار خوبی دارد.

---

🎯 نمونه‌ی کاربردی: RadExtract

برای نمایش توانایی ابزار در حوزه‌های تخصصی، گوگل یک دموی تعاملی در Hugging Face با نام RadExtract منتشر کرده است. در این دمو، LangExtract یک گزارش رادیولوژی به زبان طبیعی را می‌گیرد و یافته‌های کلیدی را به صورت ساخت‌یافته و با برجسته‌سازی نکات مهم ارائه می‌دهد.

---

📌 مجوز استفاده: Apache 2.0 License

🟡 مقاله
https://developers.googleblog.com/en/introducing-langextract-a-gemini-powered-information-extraction-library/

🖥 Github
https://github.com/google/langextract

---

#هوش_مصنوعی #یادگیری_ماشین #LangExtract #Google
#اندیشکده_مطالعات_هوش_مصنوعی_فرهنگ_رسانه
#هوش_مصنوعی 
┏━━💠┓ 
🆔 https://eitaa.com/nraimc
┗💠━━

1 مشاهده22:19

اندیشکده مطالعات هوش مصنوعی در فرهنگ و رسانه

🔥 وحالا مدل‌های پیشرفته اوپن ای آی در دست شما
بالاخره اوپن ای آی مدل‌هایی رو اوپن سورس کرد. مدل‌های GPT-OSS — مدل‌های متن‌باز برای استدلال پیشرفته و وظایف عاملی

🧠 دو نسخه ارائه شده است: 

❇️مدل GPT-OSS-120B — با ۱۱۷ میلیارد پارامتر، قابل اجرا روی یک کارت گرافیک H100 (با ۸۰ گیگابایت حافظه)

❇️مدل GPT-OSS-20B — با ۲۱ میلیارد پارامتر، قابل اجرا روی GPU با ۱۶ گیگابایت حافظه

💡 هر دو نسخه از نوع مدل‌های MoE (ترکیب کارشناسان - Mixture of Experts) با کوانتیزاسیون ۴ بیتی (MXFP4) هستند.

✅ ویژگی‌ها: 

• معماری Token-choice MoE با SwiGLU

• پشتیبانی از زمینه (Context) تا ۱۲۸ هزار توکن با استفاده از RoPE

• طراحی شده برای زنجیره تفکر (CoT - Chain of Thought)

• پشتیبانی از پیروی از دستورات (instruction-following) و استفاده از ابزارها (tool-use)

• سازگار با کتابخانه‌های transformers، vLLM، llama.cpp و ollama

• از همان توکن‌ساز GPT-4o استفاده می‌کند

مدل سبک‌تر حتی قابل اجرا روی سخت‌افزارهای محلی است!

🏴‍☠️ مجوز استفاده: Apache 2.0

🔗 لینک گیت‌هاب:
https://github.com/openai/gpt-oss

🔗 لینک هاگینگ‌فیس:
https://huggingface.co/collections/openai/gpt-oss-68911959590a1634ba11c7a4

🚀 امتحانش کنید: 
https://www.gpt-oss.com/

💥 انتشار رسمی:
http://openai.com/open-models

#openai #opensource #chatgpt

#اندیشکده_مطالعات_هوش_مصنوعی_فرهنگ_رسانه
#هوش_مصنوعی 
┏━━💠┓ 
🆔 https://eitaa.com/nraimc
┗💠━━

1 مشاهده18:45

اندیشکده مطالعات هوش مصنوعی در فرهنگ و رسانه

تمام ابزارهای ai که برای ساخت یک پاور حرفه نیاز دارید. 

🎨 ۱۰ ابزار جادویی AI برای پاورپوینت‌های حرفه‌ای  

1. Beautiful.ai  
   طراحی خودکار + قالب‌های هوشمند ✨  
   🌐 [beautiful.ai]

2. Tome  
   ارائه‌های داستانی با متن + تصویر + طراحی 🖼️  
   🌐 [tome.app]  

3. Gamma  
   ساخت اسلاید تعاملی و زیبا از متن! 💫  
   🌐 [gamma.app] 

4. SlidesAI.io  
   تبدیل متن به اسلاید در گوگل اسلایدز 📝  
   🌐 [slidesai.io]

5. Designs.ai  
   ارائه + ویدیو + صداگذاری حرفه‌ای 🎤  
   🌐 [designs.ai]

6. Visme  
   طراحی حرفه‌ای با نمودار و اینفوگرافیک 📊  
   🌐 [visme.co]  

7. Canva (Magic Design)  
   طراحی گرافیکی هوشمند در ۳ ثانیه! 🪄  
   🌐 [canva.com]

8. Kroma.ai  
   ارائه‌های داده‌محور با گراف‌های حرفه‌ای 📈  
   🌐 [kroma.ai] 

9. Microsoft Copilot  
   ساخت پاورپوینت با GPT در PowerPoint 🤖  
   🌐 [copilot.microsoft.com]

10. Simplified AI  
    همه‌چیز در یک پلتفرم: طراحی، متن، تصویر 🎭  
    🌐 [simplified.com](https#هوش_مصنوعی
#اندیشکده_مطالعات_هوش_مصنوعی_فرهنگ_رسانه
#هوش_مصنوعی 
┏━━💠┓ 
🆔 https://eitaa.com/nraimc
┗💠━━

1 مشاهده01:40

اندیشکده مطالعات هوش مصنوعی در فرهنگ و رسانه

سلسله نشست های تخصصی مجازی
شبکه اندیشکده های استادان کشور

#نشست شماره ۱
🔍موضوع: «سیاست گذاری علم و فناوری با تاکید بر قانون جهش تولید دانش بنیان»
🎙دکتر پرویز کرمی
▪️مشاور سابق معاون علمی و فناوری ریاست جمهوری
▪️مدیرعامل مرکز نوآوری همیار دانش بنیان
▪️داور برنامه تلوزیونی میدون

🗓سه شنبه ۱۴۰۴/۰۶/۰۴
⏰ ۱۰ الی ۱۱:۳۰
✨ارائه گواهی به شرکت کنندگان

🔻🔻🔻🔻🔻🔻🔻🔻🔻
جهت ورورد به نشست اینجا کلیک کنید.
🔺🔺🔺🔺🔺🔺🔺🔺🔺

🔶 «نُها»؛ شبکه نوآوری و هم افزایی اندیشکده های استادان

❔@tn_noha❔

1 مشاهده12:41

اندیشکده مطالعات هوش مصنوعی در فرهنگ و رسانه

هدایت شده از احسان شفیعی

سلسله نشست های تخصصی مجازی
شبکه اندیشکده های استادان کشور

#نشست شماره ۱
🔍موضوع: «سیاست گذاری علم و فناوری با تاکید بر قانون جهش تولید دانش بنیان»
🎙دکتر پرویز کرمی
▪️مشاور سابق معاون علمی و فناوری ریاست جمهوری
▪️مدیرعامل مرکز نوآوری همیار دانش بنیان
▪️داور برنامه تلوزیونی میدون

🗓سه شنبه ۱۴۰۴/۰۶/۰۴
⏰ ۱۰ الی ۱۱:۳۰
✨ارائه گواهی به شرکت کنندگان

🔻🔻🔻🔻🔻🔻🔻🔻🔻
جهت ورورد به نشست اینجا کلیک کنید.
🔺🔺🔺🔺🔺🔺🔺🔺🔺

🔶 «نُها»؛ شبکه نوآوری و هم افزایی اندیشکده های استادان

❔@tn_noha❔

1 مشاهده12:41

اندیشکده مطالعات هوش مصنوعی در فرهنگ و رسانه

نشست مجازی دکتر پرویز کرمی با عنوان «سیاست گذاری علم و فناوری با تاکید بر قانون جهش تولید دانش بنیان» بعلت مشکل بوجود آمده برای ایشان، به زمان دیگری موکول گردید.
زمان جلسه جدید، متعابقا اطلاع رسانی خواهد شد.

1 مشاهده13:14

اندیشکده مطالعات هوش مصنوعی در فرهنگ و رسانه

📣اخبار هوش مصنوعی 

❇️ مایکروسافت سیستم متن‌باز VibeVoice را منتشر کرد.
سامانه VibeVoice یک سامانه متن‌باز سنتز گفتار به زبان انگلیسی و چینی است که می‌تواند محتوای صوتی پر‌احساس تا ۹۰ دقیقه را با حداکثر ۴ گوینده تولید کند.
این سیستم از رمزگذارهای گفتار پیوسته با فرکانس بسیار پایین ۷.۵ هرتز و ترکیبی از مدل‌های زبانی بزرگ (LLM) برای درک زمینه و مدل انتشار (diffusion) برای تولید صدای باکیفیت استفاده می‌کند.
کد استنتاج آن هم‌اکنون در GitHub در دسترس است و مدل ۱.۵ میلیارد پارامتری به همراه توکنایزر در Hugging Face قرار دارد. نسخه‌های بزرگ‌تر (۷B) و فشرده‌تر (۰.۵B) نیز در راه هستند.
microsoft.github.io

❇️ برنامه NotebookLM یاد گرفت نقد ویدئویی در ۸۰ زبان، از جمله فارسی، تولید کند.
اکنون امکان تبدیل اسناد و یادداشت‌های بارگذاری‌شده به ارائه‌های ویدئویی کوتاه در ۸۰ زبان (از جمله فارسی) فراهم شده است؛ قابلیتی که پیش‌تر فقط در انگلیسی فعال بود.
همزمان، گوگل قابلیت Audio Overviews را ارتقا داده که امکان ساخت خلاصه‌های صوتی طولانی‌تر و دقیق‌تر را در زبان‌های مختلف فراهم می‌کند.
این به‌روزرسانی‌ها در حال انتشار هستند و به گفته گوگل، طی یک هفته آینده برای تمام کاربران جهانی در دسترس خواهند بود.
blog.google

❇️ انویدیا Jetson AGX Thor را معرفی کرد.
رایانه Jetson AGX Thor قدرتمندترین رایانه امروز برای محاسبات هوش مصنوعی لبه (Edge AI) و رباتیک است. این پلتفرم عملکردی معادل ۲۰۷۰ ترافلاپس (FP4) دارد که حدود ۷.۵ برابر سریع‌تر از نسل قبلی، Jetson Orin، است.
این سیستم بر پایه GPU با معماری Blackwell، یک پردازنده ۱۴ هسته‌ای Arm و حافظه ۱۲۸ گیگابایت LPDDR5X ساخته شده است. این ترکیب امکان اجرای محلی مدل‌های زبانی بزرگ و چندوجهی و پردازش داده‌های چند حسگر با کمترین تأخیر را فراهم می‌کند.
پلتفرم با مجموعه نرم‌افزارهای انویدیا شامل Isaac، Metropolis و Holoscan سازگار است.
کیت توسعه آن اکنون با قیمت ۳۴۹۹ دلار قابل سفارش است و ارسال آن از ماه آینده آغاز می‌شود. ماژول‌های سریالی Jetson T5000 ویژه ربات‌های آماده نیز در پایان ۲۰۲۵ با قیمت ۲۹۹۹ دلار برای سفارش‌های بالای ۱۰۰۰ واحد عرضه خواهند شد.
cnbc.com

❇️ ایلان ماسک از اپل و OpenAI شکایت یک میلیارد دلاری کرد.
شرکت‌های xAI و X شکایتی ضدانحصار به ارزش یک میلیارد دلار در دادگاه فدرال آمریکا علیه اپل و OpenAI ثبت کرده‌اند. در این شکایت آمده که این دو شرکت به‌طور غیرقانونی برای تسلط بر بازار گوشی‌های هوشمند و هوش مصنوعی مولد تبانی کرده‌اند و قوانین ضدانحصار آمریکا را نقض کرده‌اند.
طبق این سند ۶۱ صفحه‌ای، ادغام انحصاری ChatGPT در iOS و دستکاری رتبه‌بندی اپ‌استور باعث پایین کشیدن جایگاه رقبای چت‌بات می‌شود. ماسک معتقد است این شرایط باعث شده «هیچ شرکت هوش مصنوعی غیر از OpenAI نتواند به صدر اپ‌استور برسد.»
اپل از اظهار نظر خودداری کرده و OpenAI این شکایت را «ادامه حملات سیستماتیک آقای ماسک» نامیده است.
wsj.com

❇️مرورگر Brave یک آسیب‌پذیری در Comet از Perplexity کشف کرد.
به گفته Brave، مشکل مربوط به حملات موسوم به "تزریق غیرمستقیم پرامپت" است؛ جایی که مهاجمان می‌توانند فرمان‌های مخرب را در صفحات وب جاسازی کنند و دستیار هوش مصنوعی Comet هنگام تحلیل محتوا آن‌ها را به‌عنوان دستور کاربر اجرا کند.
در آزمایش‌ها، Brave نشان داد که چگونه می‌توان Comet را وادار کرد تا داده‌های محرمانه، آدرس‌های ایمیل و رمزهای یک‌بارمصرف را برای مهاجمان ارسال کند. هرچند Perplexity به‌روزرسانی‌هایی منتشر کرده، اما مشکل هنوز به‌طور کامل حل نشده است.
brave.com

#خبر #هوش_مصنوعی
#اندیشکده_مطالعات_هوش_مصنوعی_فرهنگ_رسانه
#هوش_مصنوعی 
┏━━💠┓ 
🆔 https://eitaa.com/nraimc

1 مشاهده21:25

اندیشکده مطالعات هوش مصنوعی در فرهنگ و رسانه

⚡️ بیش از 500 اسکریپت آماده برای n8n

یک منبع ساده و کاربردی: دو مخزن GitHub با صدها ورک‌فلو رایگان برای n8n.

موضوعات: فروش، بازاریابی، حسابداری مالی، کدنویسی و بهره‌وری شخصی.

چارچوب n8n چیست؟

ابزار متن‌باز بدون کدنویسی برای اتوماسیون

سازنده بصری: اتصال بلوک‌ها برای ایجاد فرآیند

صدها یکپارچگی: ایمیل، CRM، صفحات گسترده، پیام‌رسان‌ها، وبهوک‌ها

امکان افزودن منطق شخصی با جاوااسکریپت

اجرا بر اساس زمان‌بندی یا رویداد، هم در فضای ابری و هم روی سرور شخصی

نحوه استفاده:

1. ورک‌فلو موردنظر (json) را دانلود کرده و در n8n وارد کنید

2. کلیدهای API و اطلاعات کاربری خود را در بلوک‌ها وارد کنید

3. مراحل را بررسی کرده و اجرای آن را با کرون (cron) یا وبهوک فعال کنید

🔗 لینک‌ها:

https://github.com/wassupjay/n8n-free-templates

https://github.com/kossakovsky/n8n-installer

#n8n #ai 

#اندیشکده_مطالعات_هوش_مصنوعی_فرهنگ_رسانه
#هوش_مصنوعی 
┏━━💠┓ 
🆔 https://eitaa.com/nraimc
┗💠━━

1 مشاهده19:16

مطالب بعدی

پرسش‌ها

قوانین

داغ‌ترین‌ها

چندسکویی