شرکت متا (فیسبوک سابق) امروز از هوش مصنوعی جدید تبدیل متن به ویدئو رونمایی کرد. مدیرعامل متا ضمن رونمایی از این سیستم هوش مصنوعی، اعلام کرد که این سیستم قادر است متن را به ویدئو تبدیل نماید. سیستم یادشده تقریبا مانند Dall-E خواهد بود، ولی وقتی به آن متن میدهید، بهجای تبدیل توصیفات شما به یک عکس یا تصویر، برای شما ویدئو تولید میکند.
روش هوش مصنوعی برای تبدیل متن به ویدئو
مارک زاکربرگ با انتشار ویدئوی یک خرس عروسکی که مشغول کشیدن تصویر و پرتره خودش است، از این برنامه که موسوم بهMake-A-Video است رونمایی کرد.
ویدئوی یادشده اسبی را مشغول آب خوردن و یک بشقاب پرنده را در ارتفاع نزدیک به زمین نشان میدهد.
علاوهبر این در ویدئو، هنرمندی در حال نقاشی روی بوم و یک سگ ابرقهرمان مشغول پرواز دیده میشود.
تمام این ویدئوها با توصیفات ساده متنی تولید شدهاند.
عملکرد شگفتانگیز
زاکربرگ گفته است که عملکرد این سیستم خیلی شگفتانگیز است. تولید ویدئو به جای عکس یا تصویر کار بسیار دشواری است زیرا این سیستم در کنار تولید دقیق هر پیکسل، باید پیشبینی کند که پیکسلها در طول زمان چگونه تغییر خواهند کرد. Make-A-Videoبا اضافه کردن لایهای از یادگیری که تحت نظارت قرار ندارد، این کار را انجام میدهد و امکان میدهد سیستم حرکات در دنیای فیزیکی را درک کرده و از این آموختهها در الگوریتمهای مرسوم تبدیل متن به عکس و تصویر استفاده نماید.
اشتراک نسخهی کامل تبدیل متن به ویدئو
مدیرعامل متا میگوید این شرکت در آینده نسخهی کاملی را از این سیستم به اشتراک خواهد گذاشت، درحال حاضر مشخص نیست که کاربران چه موقعی قادر خواهند بود خودشان این هوش مصنوعی را آزمایش کنند.
ولی در مجموع به نظر میرسد که ویدئوها کوتاه و باکیفیت میباشند و بهلطف پیشرفتهای اخیر این شرکت در بخش تکنولوژیهای مرتبط با هوش مصنوعی، تولید میشوند.
اشتراک نتایج تحقیقات هوش مصنوعی جدید متا
در این زمینه شرکت متا در بیانیهای دربارهی هوش مصنوعی جدید خود اعلام کرد که Make-A-Video از مجموعهی اطلاعات و دادههای عمومی استفاده میکند تا سطح بالاتری از شفافیت در تحقیقات را ارائه نماید.
متا آزادانه مطالعات مرتبط به این هوش مصنوعی و نتایج آن را برای دریافت بازخورد به اشتراک خواهد گذاشت و از چهارچوب مسئولانهی خود در بخش هوش مصنوعی بهره میبریم تا رویکردمان را دربارهی این تکنولوژیهای نوظهور بهبود بخشیم.
روش ساده تبدیل متن به تصویر
شرکت متا چندی پیش موتور قابلیت تبدیل متن به تصویر را معرفی کرد. تبدیل متن به تصویر از قابلیتهای مهمی به حساب میآید که بسیار محبوب کاربران است.
تشریح و توضیح عملکرد و کارآیی این موتور (تبدیل متن به تصویر) روی کاغذ، کاملا ساده و آسان است.
برای مثال، وقتی جمله «اسبی در بیمارستان وجود دارد» را میگویید، موتور یادشده نخست آن را به کمک یک مدل ترانسفورماتور و یک شبکه عصبی عبور میدهد.
هنگامی که این موتور، تمام مراحل مورد نیاز را انجام داد و متوجه منظور شما شد، با استفاده از تعدادی ازGAN ها(Generative Adversarial Networks) این هوش مصنوعی، متن را به تعدادی تصویر تبدیل میکند. هوش مصنوعی تبدیل متن به ویدئو کنجکاوی خیلی از کاربران را برانگیخته است.
علی حبیبی
شما هم میتوانید در مورد این کالا نظر بدهید
برای ثبت نظرات، نقد و بررسی شما لازم است ابتدا وارد حساب کاربری خود شوید.
افزودن نظر جدید