براساس مشاهدات جیم فان، محقق ارشد انویدیا، سورا بیشتر از اینکه هوش مصنوعی مولد باشد، یک موتور فیزیکی دادهمحور است. سورا تنها عکس یا ویدئو تولید نمیکند، بلکه فیزیک هر شیء را در یک محیط تعیین و یک عکس یا ویدئو (یا یک جهان سهبعدیِ تعاملی) را براساس دستورات کاربر رندر میکند. محققان OpenAI مینویسند: […]
براساس مشاهدات جیم فان، محقق ارشد انویدیا، سورا بیشتر از اینکه هوش مصنوعی مولد باشد، یک موتور فیزیکی دادهمحور است. سورا تنها عکس یا ویدئو تولید نمیکند، بلکه فیزیک هر شیء را در یک محیط تعیین و یک عکس یا ویدئو (یا یک جهان سهبعدیِ تعاملی) را براساس دستورات کاربر رندر میکند.
محققان OpenAI مینویسند: «این قابلیتها نشان میدهد که مقیاسپذیریِ مداومِ مدلهای ویدئویی، مسیر امیدوارکنندهای به سمت توسعهی شبیهسازهای بسیار توانمند دنیاهای فیزیکی و دیجیتالی است که در آن اشیاء، حیوانات و کاربران میتوانند زندگی کنند.»
بیشتر بخوانید
درحالحاضر، محدودیتهای معمولِ سورا در حوزهی بازیهای ویدیویی خلاصه میشود. این مدل نمیتواند بهطور دقیق فیزیک برهمکنشهای پایه مانند خرد شدن شیشه را تخمین بزند. سورا حتی تعاملات را اغلب بهطور متناقض نمایش میدهد؛ برای مثال فردی را در حال خوردن برگر مدلسازی کرده است اما نمیتواند محل گاز گرفتن روی برگر را رندر کند.
به نظر میرسد که سورا میتواند راه را برای بازیهای واقع گرایانهتر و شاید حتی فوتورئالیستی از توصیفات متنی کاربران هموار کند. این همان بخش هیجانانگیز و ترسناک هوش مصنوعی است (برای مثال خطرات دیپ فیک را در نظر بگیرید) و احتمالاً به همین دلیل است که OpenAI تصمیم گرفته تا دسترسی به سورا را بسیار محدود نگه دارد.
منبع : زومیت
-
برچسب ها: