eitaa logo
هوش مصنوعی | اخبار فارسی
629 دنبال‌کننده
6هزار عکس
1.6هزار ویدیو
102 فایل
تجمیع اخبار هوش مصنوعی و موضوعات مرتبط گروه گفتگوی هوش مصنوعی: https://eitaa.com/joinchat/97321450C354e02e9a9 ارتباط با ادمین: @Ahmad_Shojaei_Far
مشاهده در ایتا
دانلود
👨🏻‍💻 بالاخره یه نفر پیدا شد و یه وبسایت عالی مثل LeetCode برای الگوریتم‌های ماشین لرنینگ درست کرد که نتیجه‌اش فراتر از تصوراتتونه! ✔️ وبسایت Deep-ML پر از تمرین‌های چالش‌برانگیز توی زمینه‌های مختلف مثل یادگیری ماشین، یادگیری عمیق و جبر خطیه. از مسائل ساده مثل محاسبه‌ی ماتریس تا تمرین‌های پیشرفته مثل پیاده‌سازی رگرسیون خطی و توابع فعال‌ساز، همه رو اینجا پیدا می‌کنین. تمرین‌ها بر اساس سختی مرتب شدن؛ از آسون تا سخت. هر تمرین هم راهنمایی‌ها و توضیحات لازم رو داره که اگه گیر کردین، کمکتون می‌کنه. با حل تمرین‌ها می‌تونین مهارت‌هاتون رو ارتقا بدین و پیشرفتتون رو دنبال کنین. این وبسایت برای همه‌ی سطوح از مبتدی تا حرفه‌ای مناسبه و یه جای عالی برای یادگیری و تمرینه.👇 💸 Deep-ML └ 💰 Website 🌐 ➖➖➖➖➖➖➖➖➖➖➖➖➖➖➖➖ 💡 مهندس ML شوید : 💡 @MachineLearning_ir
؛"LLaMA-Omni یک مدل تعامل گفتاری با تاخیر کم و با کیفیت بالا است که بر اساس Llama-3.1-8B-Instruct ساخته شده است و هدف آن دستیابی به قابلیت های گفتاری در سطح GPT-4o است." https://github.com/ictnlp/LLaMA-Omni 🆔 @Ai_Tv
فعلا قابلیت پخش رسانه در مرورگر فراهم نیست
مشاهده در پیام رسان ایتا
اگه میخواهید یک code interpreter یا دستیار برای کد نویسی داشته باشید Qwen-2.5-Coder 1.5B خیلی خوبه. کاملا آفلاین/لوکال و توی خود browser، سریع، و دقتش هم خیلی خوب هست. Github: https://github.com/cfahlgren1/qwen-2.5-code-interpreter 🆔 @Ai_Tv
فعلا قابلیت پخش رسانه در مرورگر فراهم نیست
مشاهده در پیام رسان ایتا
اگه میخواهید از سیر تا پیازِ مدلهای زبانی و مدلهای LLM از مفاهیم اصلی تا آماده کردن دیتا، ترینینگ، fine tuning، دیپلوی و مانیتور کردن مدل در محیط production را یاد بگیرید این ۱۱۴ صفحه را بخونید. اندازهِ تمام ۲ سال گذشته، ماشین لرنینگ یاد میگیرید. https://arxiv.org/pdf/2408.13296v1 🆔 @Ai_Tv
کمپانی اپل و مایکروسافت اومدن و ۲ تا مدل جالب تقریبا همزمان دادن بیرون. مدل اپل اسمش Ferret-UI و از مایکروسافت OmniParser هست. این مدلها اسکرین را پارس میکنن (screen parsing) و به یک سری المنت ساختاریافته (structured) تبدیل میکنن. که این کار توانایی مدلهای vision- language مثل GPT-4V را برای تولید action ها بهبود میده. حالا شاید بپرسید که چی؟ هدف این مدل‌ها چیست؟ ساده است: بهبود عوامل رابط کاربری مبتنی بر LLM. هنگامی که از یک LLM برای انجام وظایفی روی کامپیوتر استفاده می‌کنید، باید نه تنها مکان فعلی که به آن نگاه می‌کند (صفحه نمایش دسک‌تاپ، لپ‌تاپ یا تلفن همراه) را درک کند، بلکه اطمینان حاصل کند که می‌تواند اقدام مناسب را برای دستیابی به یک هدف خاص انجام دهد. از این رو این مدل‌ها تصویر صفحه با اطلاعات زمینه ای اضافی غنی (augment) میکنه. به عنوان مثال، اگر می‌خواهید که مدل سفارش دهد، می‌خواهید به دکمه "تایید سفارش" نگاه کند و اطمینان حاصل کند که می‌تواند به‌طور قابل اعتمادی روی آن کلیک کند، صرف نظر از رابط کاربری ‏به طور خلاصه این مدلها به AI Agent کمک میکنن که با کامپیوتر تعامل داشته باشن و یک سری کارها را اتوماتیک کنن. ‏Microsoft project: ‌ microsoft.github.io/OmniParser/⁩ ‏Apple project: ‌ arxiv.org/pdf/2404.05719⁩ 🆔 @Ai_Tv
فعلا قابلیت پخش رسانه در مرورگر فراهم نیست
مشاهده در پیام رسان ایتا
یک دیتاست جدیدی اومده روی HuggingFace که بیشتر از ۶۳۰۰۰ تا مقاله از وبسایت Arxiv بین تاریخ های January 2023 تا October 2023 را شامل میشه. دیتاست بسیار clean/ تمیز شده و برای تسک های مختلف از جمله: - semantic search - domain specific language modeling - summarization - question answering عالیه! فقط دست به کد بشید! https://huggingface.co/datasets/neuralwork/arxiver 🆔 @Ai_Tv
فعلا قابلیت پخش رسانه در مرورگر فراهم نیست
مشاهده در پیام رسان ایتا
مایکروسافت امروز ابزار جدیدی را معرفی کرد به اسم GitHub Spark که به نظر میاد رقیب جدی Cursor باشه همچنین به‌روزرسانی‌های مهمی را برای GitHub Copilot معرفی کرد ؛Claude اکنون در GitHub Copilot در دسترس است. حالا توسعه دهندگان می توانند Claude 3.5 Sonnet را در Visual Studio Code و http://GitHub.com انتخاب کنند و برنامه‌نویس‌هایی که از GitHub Copilot استفاده می‌کنن، الان با یه اشتراک ماهیانه ۱۰ دلاری علاوه بر دسترسی به مدل‌های OpenAI، می‌تونن از مدل قدرتمند Claude 3.5 Sonnet و همین‌طور Gemini 1.5 Pro برای نوشتن کد و پرسیدن سوال وسط کدنویسی استفاده کنن http://anthropic.com/news/github-copilot 🆔 @Ai_Tv
کمپانی HuggingFace یک سری مدل کوچیک به اسم SmolLM2 که تا سقف ۲ میلیارد پرامتر دارند، معرفی کرده که برای خیلی از کارها از جمله بازنویسی متن (rewriting)، خلاصه کردن متن (summarization)، و function calling میتونید راحت به صورت لوکال با سرعت خیلی بالا ازشون استفاده کنید. HuggingFace link 🆔@lifeAsAService
فعلا قابلیت پخش رسانه در مرورگر فراهم نیست
مشاهده در پیام رسان ایتا
می دونستید یک مدل هوش مصنوعی جدید هست که می تونه تصاویر SVG تولید کنه ؟ Here's the SVG model on Replicate: https://replicate.com/recraft-ai/recraft-v3-svg And here's a demo repo showing how easy it is to style and manipulate SVGs using CSS and a dash of vanilla JavaScript: https://github.com/zeke/red-panda-svg 🆔 @Ai_Tv
وقتی که با مدلهای کار میکنید و قراره فایل های پیچیده pdf را تحلیل کنه نیاز دارید که اطلاعات را خیلی دقیق از فایلها استخراج کرده باشید. برای اینکار نیاز هست که با استفاده از روش هایی فایلها را parse کنیم و کلی هم روش برای این کار هست. ولی هیچ نوع metric برای ارزیابی روش ها نیست. حالا یک دیتاست و بنچمارک عالی برای ارزیابی (evaluation) روش های parsing فایلهای pdf هست که این کارو راحت تر میکنه. HF Link: https://huggingface.co/datasets/upstage/dp-bench منبع : توییتر <Mehdi Allahyari 🆔 @Ai_Tv