🔵
هوش مصنوعی جدید گوگل برای همگامسازی آهنگ و دیالوگ با ویدیو
🔷 ابزار
V2A (Video to Audio)
که مخفف "ویدیو به صدا" است، یک پروژه جدید از آزمایشگاه هوش مصنوعی
DeepMind گوگل است که
قادر به تولید صدا همزمان با ویدیو است.
🔹 این فناوری میتواند
پیکسلهای خام را درک کند و با پرامپتهای متنی جلوههای صوتی بسازد. به این ترتیب، مدل یاد میگیرد که صداهای خاص را با صحنههای بصری خاص مرتبط کند.
🔹 ابزار V2A میتواند با مدلهای تولید ویدیو مانند Google Veo و OpenAI’s Sora هماهنگ شود و برای ویدیوهایشان صدا بسازد.
این پیشرفت بزرگی است چرا که تا پیش از این، مدلهای هوش مصنوعی تولید ویدیو معمولاً خروجیهای بیصدا داشتند و نمیتوانستند صدا را در کنار ویدیو تولید کنند.
🔹
با استفاده از V2A، میتوان صداها و دیالوگهایی را که با شخصیتها و لحن یک ویدیو مطابقت دارد، ایجاد کرد و حتی موسیقی متناسب با تصویر تولید کرد.
این ابزار میتواند برای طیف وسیعی از فیلمهای سنتی، از جمله مطالب بایگانی، فیلمهای صامت و موارد دیگر، موسیقی متن تولید کند و گستره وسیعتری از فرصتهای خلاقانه را باز میکند.
🔹 این فناوری جدید علاوه بر دیالوگ میتواند
افکتهای صوتی هم از طریق دستورات متنی روی ویدیوها قرار دهد.
هوش مصنوعی ناحیه 2
https://eitaa.com/AI_techno2