♦️تبدیل #صوت به #متن در ابزار ایرانی فارس آوا
🍀
رایگان امتحان کنید
https://farsava.com
http://eitaa.com/science_ai
فعلا قابلیت پخش رسانه در مرورگر فراهم نیست
مشاهده در پیام رسان ایتا
محققان GrapheneX-UTS یک سیستم EEG قابل حمل ساخته اند که می تواند سیگنال های مغز را بخواند و آنها را به متن تبدیل کند.
این مدل DeWave نام دارد و در آینده می تواند افراد را قادر سازد تا از طریق تبدیل سیگنال های مغزی به #متن که سپس توسط #هوش_مصنوعی دیگری #صداگذاری می شود، صحبت کنند.
@science_ai
فعلا قابلیت پخش رسانه در مرورگر فراهم نیست
مشاهده در پیام رسان ایتا
نوآوری انقلابی از Pika Labs👌
✍این #نرم_افزار اکنون در دسترس همگانی قرار گرفت و جنریشن داخل خود سایت انجام میشه قبلا از دیسکورد استفاده میکرد.
✍اکنون می توانید #متن خود را در promt اضافه کنید تا به #ویدئو #تبدیل شود.
https://www.pika.art/
۴ ثانیه رایگان است حتما فیلتر شکن میخواد.
#هوش_مصنوعی
@science_ai
✍غول #موتور_جستجو به برخی از اقدامات مهم خود در سال جاری اشاره کرده است که اکثر آنها به #هوش_مصنوعی مربوط میشوند.
🔴غول فناوری توضیح میدهد که Gemini «گام بعدی در زمینه مفیدتر کردن هوش مصنوعی برای همه» محسوب میشود و بههمین دلیل آن را بهصورت چندوجهی ساخته است، یعنی میتواند اطلاعات مختلفی از جمله #متن، #صدا و #ویدیو را درک کند.
✅جایگاه دوم لیست به Bard تعلق دارد و گوگل درباره آن مینویسد:
«بارد از زمان راهاندازی بهطور قابلتوجهی گسترش پیدا کرده است: نحوه کدنویسی را یاد گرفت، قابلیتهای بصری به آن اضافه شد و دسترسی به آن در سراسر جهان نیز گسترش یافت و به برنامهها و سرویسهای بیشتری اضافه شد.»
🤔سومین مورد از سه اقدام بزرگ گوگل در سال 2023 به Search Generative Experience یا SGE مربوط میشود، تجربه که از هوش مصنوعی کمک میگیرد و باعث میشود تا کاربران به روشهای سریعتر و آسانتری موضوعات موردنیاز خود را درک کنند.
@science_ai
✍#مایکروسافت برای خلق نوآوری و ترغیب کاربران به استفاده از #هوش_مصنوعی کوپایلت، قابلیت #تولید #آهنگ از روی #متن را برای این سرویس منتشر کرد.
🟣بیانیهی رسمی مایکروسافت به همکاری ردموندیها با شرکت Suno اشاره میکند. به لطف #پلتفرم ارائهشده توسط این شرکت، اکنون کاربران میتوانند موسیقی دلخواه و شخصیسازیشدهی خود را بسازند.
🔴شرکت Suno مدت زیادی است که الگوریتمهای مختلف را آزمایش میکند تا بهترین #مدل هوش مصنوعی را که بتواند انواع مختلف #آهنگها را تولید کند، ارائه دهد.
🗣 به نظر میرسد که این شرکت تاکنون خارقالعاده عمل کرده است.تنها کاری که کاربران برای ساختن آهنگ باید انجام دهند، فعالکردن پلاگین Suno و نوشتن متن مورد نظر است. سایر مراحل توسط الگوریتم تولید آهنگ انجام خواهد شد.
در گذشته #ابزارهای هوش مصنوعی در حوزهی #موسیقی به منظور کمک به موسیقیدانان تولید میشدند؛ اما این قابلیت جدید کوپایلت به منظور ایجاد #سرگرمی برای همهی کاربران و به خصوص برای کاربران غیرحرفهای طراحی شده است.
@science_ai
✍#گوگل مسیجز، پیامرسان پیشفرض اندروید، به قابلیتهای بیشتری در بخش RCS مجهز میشود.
🟣قابلیت اضافه کردن #عنوان (کپشن) به عکسهای ارسالی در چتهای RCS #پیامرسان پیشفرض اندروید، بهزودی ارائه خواهد شد.
🔴در حال حاضر، وقتی تصویری در #چت RCS ارسال میشود، نمیتوان عنوان یا متنی را همراه با #عکس ارسال کرد و #متن و #تصویر به جای یک پیام، در دو پیام جداگانه ارسال میشوند.
🔴 بهروزرسانی جدید این مشکل را برطرف میکند.در همین راستا، #گوگل اعلام کرده که مسیجز در حال دریافت تعدادی ویژگی جدید است که پیش از این تنها در اختیار کاربران نسخهی بتا قرار داشت.
✅ این قابلیتها شامل Magic Compose و Photomoji و Voice Moods میشوند.
🔴هوش مصنوعی بارد ویژگی مهم دیگری است که بهزودی برای کاربران گوگل مسیجز از راه میرسد. بارد میتواند به کاربران در نوشتن پیام، ترجمهی زبانها و شناسایی تصاویر در Messages کمک کند.
@science_ai
فعلا قابلیت پخش رسانه در مرورگر فراهم نیست
مشاهده در پیام رسان ایتا
🎥 این #هوش_مصنوعی تصاویر و متنهایتان را به #ویدیو تبدیل میکند
🔹ابزار هوش مصنوعیِ جدید #گوگل که «لومیِر» نام دارد توانایی #تبدیل تصاویر یا #متن به ویدیو را دارد و طبق اعلام گوگل، خطای آن نسبت به مدلهای هوش مصنوعیِ تولید ویدیوی دیگر کمتر است.
🔹این #ابزار هنوز در سطح یک پروژهٔ تحقیقاتی است و قابل استفاده نیست اما گوگل تصاویری از امکانات آن را منتشر کرده.
@science_ai
✍#گوگل به شکل رسمی، «لومیِر»(Lumiere) را که نسل جدید تولیدکننده #ویدیو از #متن مبتنی بر #هوش_مصنوعی است، معرفی کرد.
🟣به گزارش ایسنا، این گروه مقالهای را منتشر کرده است که در آن تلاشهای خود را در پایگاه پیشچاپ arXiv شرح داده است.
🔴در طول چند سال گذشته، برنامههای کاربردی هوش مصنوعی از آزمایشگاه به جامعه کاربران منتقل شدهاند.
🔴برای مثال، مدلهای زبانی بزرگ (LLM) مانند ChatGPT با مرورگرها ادغام شدهاند که به کاربران اجازه میدهند متون دلخواه خود را به روشهای بیسابقهای تولید کنند.
🗣اکنون تیم گوگل در این تلاش جدید با اعلام یک تولیدکننده ویدیو از متن به نام لومیر، این حوزه را به اوج جدیدی رسانده است.
🗣لومیر که احتمالاً از روی نام برادران لومیر که پیشگامان تجهیزات اولیه عکاسی بودند نامگذاری شده است، به کاربران اجازه میدهد جمله سادهای مانند «دو راکون با هم کتاب میخوانند» را بنویسند و یک ویدیوی کامل از آن دریافت کنند که نشان میدهد دو راکون دقیقاً در حال مطالعه هستند.
@science_ai
فعلا قابلیت پخش رسانه در مرورگر فراهم نیست
مشاهده در پیام رسان ایتا
#ترجمه بیدرنگ Meta AI اولین مدل بسیار #چندزبانه است که ترجمهها را با تأخیر حدود دو ثانیه و تقریباً با دقت یک مدل آفلاین ارائه میکند.
؛SeamlessStreaming که بر اساس SeamlessM4T v2 ساخته شده است، یک ابزار همه کاره است که از #تشخیص خودکار گفتار و ترجمه گفتار به #متن در حدود 100 زبان برای ورودی و خروجی پشتیبانی می کند. علاوه بر این، ترجمه گفتار به گفتار را برای نزدیک به 100 زبان ورودی و 36 زبان خروجی ارائه می دهد.
این مدل نوآورانه فرصت های جدیدی را برای #ارتباطات جهانی باز می کند. با توانایی مدیریت زبان های مختلف، #مکالمه یکپارچه بین افراد در سراسر جهان را تسهیل می کند.
@science_ai
📝گروهی از پژوهشگران #هوش_مصنوعی در گوگل ریسرچ(Google Research) نسل جدید تولیدکننده #ویدیو از #متن را که مبتنی بر هوش مصنوعی است، به نام لومیر(Lumiere) توسعه دادهاند.
این گروه مقالهای را منتشر کرده است که در آن تلاشهای خود را در پایگاه پیشچاپ arXiv شرح داده است.
در طول چند سال گذشته، برنامههای کاربردی هوش مصنوعی از آزمایشگاه به جامعه کاربران منتقل شدهاند. برای مثال، مدلهای زبانی بزرگ(LLM) مانند ChatGPT با مرورگرها ادغام شدهاند که به کاربران اجازه میدهند متون دلخواه خود را به روشهای بیسابقهای تولید کنند.
اخیرا مولدهای تبدیل متن به #تصویر به کاربران اجازه ایجاد تصاویر فراواقعی را دادهاند و مولدهای تبدیل متن به ویدیو به کاربران این امکان را دادهاند که با استفاده از چند کلمه کلیپهای ویدیویی کوتاه تولید کنند.
اکنون تیم گوگل در این تلاش جدید با اعلام یک تولیدکننده ویدیو از متن به نام لومیر، این حوزه را به اوج جدیدی رسانده است.
@science_ai
دور زدن ابزارهای تشخیص #هوش_مصنوعی با netus.ai
با #ابزار AI bypasser سایت netus میتونید به راحتی #متن تولید شده با هوش مصنوعی رو به شکلی تغییر بدید که بتونه ابزارهای تشخیص هوش مصنوعی رو به سادگی گول بزنه.
@science_ai
28.22M حجم رسانه بالاست
مشاهده در ایتا
🔹این #هوش_مصنوعی کلی ابزار رایگان داره که از زبان فارسی هم پشتیبانی میکنه نیاز به ثبت نامم نداره
🔹 #عکس کتاب و جزوه اتونو به #متن #تبدیل میکنه
🔹بازنویسی میکنه
🔹خلاصه میکنه و...
@science_ai
✍🏻انویدیا #هوش_مصنوعی Chat with RTX را برای اجرای #آفلاین روی #کامپیوترها عرضه کرد.
براساس گزارش ورج، Chat with RTX میتواند کارهای مختلفی انجام دهد. برای مثال میتوانید لینک یک ویدیوی یوتیوب را برای آن بفرستید و خلاصهای از #محتوای #ویدیو دریافت کنید؛ البته هنوز این نسخه دمو باگهایی دارد و نباید انتظار داشته باشید با یک هوش مصنوعی بینقص مواجه شوید. بهنظر میرسد این هوش مصنوعی در خلاصهکردن مطالب بلند خوب عمل میکند و میتوانید به آن یک #متن بلند بدهید و بخواهید که آن را کوتاهتر کند. اشکال بزرگ Chat with RTX این است که شبیه یک نسخه آزمایشی #کدنویسی شده اولیه است. برای اجرای این هوش مصنوعی باید یک وب سرور و نمونه پایتون را روی کامپیوتر خود نصب کنید؛ سپس این چتبات از مدلهای Mistral یا Llama ۲ برای جستجوی دادهها استفاده میکند. این هوش مصنوعی از هستههای تنسور انویدیا در پردازشگر گرافیکی RTX برای سرعتبخشیدن به درخواستهای شما بهره میبرد. براساس گزارشها، نصب این هوش مصنوعی روی کامپیوتر زمانبر خواهد بود. برنامه #چتبات نیز تقریباً ۴۰ گیگابایت حجم دارد و نمونه پایتون آن حدود ۳ گیگابایت رم اشغال میکند. پس از نصب برنامه، از یک مرورگر به Chat with RTX دسترسی پیدا میکنید.
@science_ai
فعلا قابلیت پخش رسانه در مرورگر فراهم نیست
مشاهده در پیام رسان ایتا
🌐عصر جدیدی از ایجاد #ویدیو با Latte...
از #متن تا #ویدیوی کامل. Latte با ترکیب تصاویر، #موسیقی و صداهای واقع گرایانه تولید شده توسط #هوش_مصنوعی ، ایده های شما را به واقعیت تبدیل می کند.
هوش مصنوعی دستیار خیال شماست.
https://www.latte.social/
#هوش_مصنوعی
@science_ai
فعلا قابلیت پخش رسانه در مرورگر فراهم نیست
مشاهده در پیام رسان ایتا
✍🏻با #هوش_مصنوعی کارگردان شو!
یه #متن بنویس و بدون روند #تولید صاحب یه #فیلم سینمایی شو و اکرانش کن! شبیه آگهیهای قلابی به نظر میاد؟
@science_ai
فعلا قابلیت پخش رسانه در مرورگر فراهم نیست
مشاهده در پیام رسان ایتا
#شرکت OpenAI از اولین #مدل #متن به #ویدیو خود به نام Sora رونمایی کرد.
این #مدل توانایی #تولید ویدیوهایی تا حداکثر ۶۰ثانیه که صحنههای بسیار دقیق، حرکات پیچیده دوربین و شخصیتهای متعدد با احساسات پر جنب و جوش را نشان میدهد را دارد. درحال حاضر افراد بسیار کمی به این مدل دسترسی دارند که به زودی شاهد افزایش آن خواهیم بود.
ویدیویی که میبینید با Sora و Prompt زیر تولید شده است:
"Beautiful, snowy Tokyo city is bustling. The camera moves through the bustling city street, following several people enjoying the beautiful snowy weather and shopping at nearby stalls. Gorgeous sakura petals are flying through the wind along with snowflakes.”
OpenAI Sora
#هوش_مصنوعی
@science_ai
✍🏻پنج ابزار #هوش_مصنوعی جذاب برای #تبدیل #متن به #ویدیو
Sora#
این مدل "درکی عمیق از زبان" دارد و میتواند "شخصیتهای قابل قبولی را ایجاد کند که احساسات را بیان میکنند."
Lumiere#
گوگل هوش مصنوعی ویدیویی خود به نام Lumiere را دارد که توسط یک مدل انتشار جدید به نام Space-Time-U-Net طراحی شده است. لومیر مکان اشیاء را در یک ویدیومشخص میکند و نحوه حرکت و تغییر همزمان آنها را ردیابی میکند.
VideoPoet#
یک مدل زبان بزرگ است که بر روی مجموعه داده عظیمی از فیلمها،تصاویر،صدا و متن آموزش داده شده است. این مدل میتواند وظایف مختلف تولیدویدیو را انجام دهد، از تبدیل متن یا تصاویر به ویدیو گرفته تا جذابتر کردن ویدیوها با سبک، رنگآمیزی درونی و بیرونی ویدیو، و ویدیو به صدا.
Emu_Video#
مدل هوش مصنوعی متا شامل دو مرحله است. ابتدا از متن یک عکس میسازد. سپس، از آن متن و تصویر برای ایجاد یک ویدیوی درجه یک استفاده میکند.
Phenaki#
تیم پشتیبان Phenaki Video از Mask GIT برای تولید ویدیوهای هدایتشده متنی در PyTorch استفاده کرد. این مدل میتواند ویدیوهایی با هدایت متن تولید کرده که تا مدت زمان 2 دقیقهای، بسازد.
@science_ai
✍ناکارآمدی مدل تولیدکننده #تصویر Sora باعث ناکارآمدی آن در فهم چگونگی کار دنیای فیزیکی و #شبیهسازی کارآمد آن خواهد شد.
🟣هفته گذشته، OpenAI با معرفی مدل #هوش_مصنوعی Sora که براساس #متن میتواند #ویدئو بسازد، بحثهای فراوانی را ایجاد کرد.
🟣اما «یان لیکان» (Yann Lecun)، دانشمند ارشد هوش مصنوعی که هماکنون در #متا مشغول به فعالیت است، عقیده دارد این همه هیجان برای مدل متن به ویدیو هیچوپوچ است و این مدل در تحقق اهداف ادعاشده توسط OpenAI شکست میخورد.
🔴بهطور خلاصه، لیکان از این ادعای OpenAI انتقاد کرده است که Sora در نهایت ساخت «شبیهسازهای همهمنظوره از دنیای فیزیکی» را ممکن میکند.
🗣او میگوید که رویکرد OpenAI برای ساخت یک «شبیهساز دنیا» مطلقاً اشتباه است.کمپانی متا در یک پست بلاگ اعلام کرده که «برخلاف رویکردهای تولیدگر که تلاش میکنند هر پیکسل گمشدهای را پر کنند، V-JEPA این انعطاف را دارد که اطلاعات پیشبینیناپذیر را حذف کند، که تمرین و کارایی نمونه را بین ۱٫۵ تا ۶ برابر بهبود میدهد.»
https://eitaa.com/science_ai
✍براساس اعلام یکی از مدیران #مایکروسافت، نسخهی رایگان #هوش_مصنوعی کوپایلت ازاینپس به مدل زبانی بزرگ GPT-4 Turbo مجهز است.
🟣میخائیل پاراخین، مدیر تیم #ویندوز و تجربیات وب در مایکروسافت، با انتشار پست جدیدی در شبکهی اجتماعی ایکس گفت که پس از تلاشهای او و اعضای تیمش، سرانجام نسخهی رایگان هوش مصنوعی کوپایلت به مدل زبانی GPT-4 Turbo مجهز شده است.
🔴تا قبل از تغییر جدید، نسخهی رایگان کوپایلت به مدل زبانی بزرگ GPT-4 مجهز بود. پاراخین میگوید که کاربران نسخهی پرو میتوانند درصورت تمایل GPT-4 Turbo را غیرفعال کنند و باردیگر سراغ GPT-4 بروند؛ اما این امکان برای کاربران نسخهی رایگان وجود ندارد.
🗣شرکت OpenAI هنگام رونمایی GPT-4 Turbo گفت که این مدل زبانی بزرگ نسخهی پیشرفتهتر GPT-4 است و Context Window بسیار بزرگ ۱۲۸٬۰۰۰ توکنی دارد. این یعنی میتواند در آنِ واحد ۳۰۰ صفحه متن را درک کند.
🤔سرویسGPT-4 Turbo بزرگترین مدل زبانی ساخت OpenAI است و میتواند افزونبر #متن، #عکس ورودی را هم درک و تفسیر کند.
🌐https://eitaa.com/science_ai
در ادامه با این هوشمصنوعی و نحوه استفاده از آن آشنا خواهید شد 👇
1️⃣ از ابزار WSVirbo استفاده کنید
دو حالت وجود دارد:
- ارائه ویدئو با آواتار هوش مصنوعی
- ایجاد آواتار خودتون و شبیه سازی صدا
2 دقیقه اعتبار ویدیوی رایگان برای اولین بار دریافت خواهید کرد
اینجا: https://bit.ly/3xOQvNO
پس از ثبت نام، صفحه ای با بیش از 300 آواتار هوش مصنوعی خواهید دید.
می توانید یکی را برای شروع یک ویدیو انتخاب کنید یا به «الگوهای ویدیویی» بروید و الگوی مورد علاقه خود را انتخاب کنید
2️⃣ پس از انتخاب الگوی خود، تقریباً قادر خواهید بود هر چیزی را ویرایش کنید:
- اضافه کردن پس زمینه های مختلف
- اضافه کردن #موسیقی
- زیرنویس خودکار
- تغییر و اضافه کردن #متن، #تصاویر و اشیاء
شما می توانید آواتارهای هوش مصنوعی و کل صدای آنها را با سرعت ها، زیر و بم و حجم های مختلف تغییر دهید.
علاوه بر این، شما می توانید حالت نمایش را تغییر دهید!
- حالا اگه میخواید از تصویر خودتون آواتار بسازید👇
برای ایجاد آواتار #هوش_مصنوعی خود با شبیه سازی صدا، می توانید به آدرس زیر بروید:
https://bit.ly/49O6B7t
روی «رزرو نسخه آزمایشی» کلیک کنید و یکی از چهار گزینه را انتخاب کنید.
فایل های مورد نیاز رو بهش بدید و طبق دستورالعملها پیش برید.
🌐https://eitaa.com/science_ai
28.53M حجم رسانه بالاست
مشاهده در ایتا
⁉️رقابت #چت_بات ها در سال 2024: کدام #هوش_مصنوعی از بقیه جلوتر است؟
این ویدئو رنکینگ Elo چت بات های پر کاربرد را در این تصویر نشان میدهد:
1) Chat GPT 4o (کمپانی OPEN AI)
در درک و صحبت کردن مانند انسان بسیار عالی است، که آن را برای #مکالمات و وظایف پیچیده بسیار قابل اعتماد میکند.
2) Gemini 1.5 Pro (کمپانی Google)
بهترین گزینه برای ترکیب #متن و #تصاویر، مناسب برای وظایفی که به هر دو نیاز دارند.
3) Claude 3.5 Sonnet (کمپانی Anthropic)
متمرکز بر اخلاقی و منصفانه بودن، با پاسخهای هوشمندانه و عمیق، به ویژه در #استدلال و #کدنویسی.
4) Llama 3.1 405 B (کمپانی Meta)
یک مدل منبع باز که مقرون به صرفه است و در ریاضیات و سایر وظایف عملکرد خوبی دارد.
هر مدل مورد منحصر به فردی را به میدان میآورد و مرزهای تواناییهای مدلهای زبانی بزرگ را گسترش میدهد.
🌐https://eitaa.com/science_ai
💥فرض کن یه متنی داشتی، خودت یا کس دیگهای اون متن رو تغییر داده، آپدیت کرده یا یه چیزایی رو ازش حذف و اضافه کرده!
✍حالا تو میخوای #متن اصلی خودت رو با متن جدید #مقایسه کنی و ببینی که چه تغییراتی داشته، مثلا چه چیزایی بهش اضافه شده یا چه چیزایی ازش کم شده.
✍با #هوش_مصنوعی Diff Checker به راحتی میتونید این کار رو انجام بدید ، متن قبلی و جدید رو وارد میکنید، اون قسمت هایی که هایلایت قرمزه یعنی حذف شده و اون قسمتایی که سبزه یعنی اضافه شده ؛)
👌جذااب ترین نکتش برای برنامهنویساست، میتونن کد قدیمی و جدید خودشون رو باهم مقایسه کنن، تازه از داکیومنت و فایل اکسل و... هم پشتیبانی میکنه
🌐https://eitaa.com/science_ai