برای دسترسی رایگان به مدلهای Mistral و مدل جدید Codestral وارد اینجا شده و در پایین باکس ورودی نوع مدل را خود را انتخاب کنید.
#codestral
#mistral
@dumannewsletter
فاین تیون مدلهای Mistral با درصدی کمی از وزنهای متغیر
خب Mistral-finetune منتشر شد، یه کدبیس سبکوزن که امکان fine-tuning مدلهای #Mistral رو فراهم میکنه. این مبتنی بر #LoRA هست، یه الگوی آموزشی که در اون بیشتر وزنها ثابت هستن و فقط ۱ تا ۲ درصد وزنهای اضافی به شکل اختلالات ماتریسی با رتبه پایین آموزش داده میشن.
از اون کارایی هست که سختافزار زیاد لازم داره، بعضی از کاربرا میان مثلا با چند تا 3090 انجامش میدن
(البته با این رشد سرویسهای کلاد AI نیاز نیست حتما تجهیزات خرید).
گیتهاب
@silicon_brain I از هوش مصنوعی عقب نمانید
شرکت فرانسوی Mistral دو مدل جدید زبانی را معرفی کرد.
مدل Codestral Mamba با ۷ میلیارد پارامتر مخصوص کد نویسی است. این مدل از نمونههای اپنسورس مشابه نظیر CodeGemma و CodeLlama عملکرد بهتری دارد. سایز Context آن نیز ۲۵۶ کیلوبایت است.
مدل Mathstral نیز دارای ۷ میلیارد پارامتر بوده و مخصوص حل مسائل استنتاجی و ریاضی است. این مدل در بنچمارک MATH عملکرد ۵۶.۶ درصدی و در بنچمارک MMLU عملکرد ۶۳.۴۷ درصدی داشته است. هر دو مدل به صورت اپنسورس تحت لایسنس Apache 2.0 منتشر شدهاند.
#mistral
@dumannewsletter
6M حجم رسانه بالاست
مشاهده در ایتا
سریع ترین LLM دنیا به اسم groq!
این مدل 18 برابر از #GPT سریع تر هست و همونطور که توی ویدیو مشخصه، در لحظه برای شما جواب رو تولید میکنه.
گروک یه سرویس هست که مدل های زبانی موجود مثل #llama یا #gemma رو با سرعت بیشتر ران کرده. تو دمو سایت از #whisper برای تبدیل صوت به متن و از llama برای پاسخ دادن به متن استفاده میکنه. در واقع گروک یک مدل مستقل نیست پلتفرمی هست که مدل های مختلفی مثل #lama و #mistral رو روی سخت افزار خاص خودش ران میکنه که اسمش GroqRack هست و با تکنولوژی #LPU ران میشه. تعداد توکن هایی که پردازش میکنه به ۵ هزار میرسه. همچنین سخت افزارش هم برای فروش معرفی شده
لینک دمو
@silicon_brain | از هوش مصنوعی عقب نمانید
شرکت Mistral مجموعه مدلهای جدیدی را با نام Les Ministraux معرفی کرد. در حال حاضر این مجموعه شامل دو مدل زبانی Ministral 3B و Ministral 8B است. برای مطالعه جزئیات بیشتر اینجا را بخوانید.
#mistral
@dumannewsletter
استارتاپ فرانسوی Mistral مدل زبانی ۱۲۴ میلیارد پارامتری Pixtral Large را معرفی کرد.
برای دسترسی به این مدل و جزئیات فنی اینجا را بخوانید.
در این جدول مقایسه این مدل با مدلهای مشابه در بنچمارکهای مختلف نمایش داده شده است.
#mistral
@dumannewsletter
استارتاپ فرانسوی Mistral مدل زبانی ۱۲۴ میلیارد پارامتری Pixtral Large را معرفی کرد.
برای دسترسی به این مدل و جزئیات فنی اینجا را بخوانید.
در این جدول مقایسه این مدل با مدلهای مشابه در بنچمارکهای مختلف نمایش داده شده است.
#mistral
🌑 آقای هوش مصنوعی🌑
🎥رسانه هوش مصنوعی دانشگاه تهران
@MrArtificialintelligence