هوش مصنوعی Veo 3 گوگل رونمایی شد؛ خلق ویدیوهای مجذوب کننده تر با صدا
به گزارش چه خبر آنلاین، گوگل در رویداد سالانه I/O 2025 از دستاوردهای تازه خود در حوزه هوش مصنوعی رونمایی کرد که در میان آن ها، مدل فراوری ویدیوی Veo 3 توجه بسیاری را به خود جلب نموده است. این مدل پیشرفته نه تنها قادر به ساخت ویدیو از متن و تصویر است، بلکه توانایی فراوری هم زمان صدا برای محتوای ویدیویی را نیز دارد، قابلیتی که آن را یک گام جلوتر از رقبایی مانند Sora قرار می دهد.

مدل Veo 3 با درک عمیق تری از فیزیک دنیای واقعی و هماهنگ سازی دقیق حرکات لب با صدای دیالوگ ها، تجربه ای واقع گرایانه تر از محتوای فراوری شده با هوش مصنوعی ارائه می دهد. به عنوان مثال، این مدل می تواند ویدیویی از پرواز پرندگان همراه با صدای آواز آن ها فراوری کند یا صحنه ای از یک خیابان شلوغ را با صدای واقعی ترافیک پس زمینه به تصویر بکشد. علاوه بر این، کاربران به کنترل های دوربین دسترسی خواهند داشت و می توانند از ارجاعات ویدیویی برای ساخت صحنه های یکپارچه و منسجم بهره ببرند.
از امروز، مشترکان طرح پولی Ultra گوگل در آمریکا با پرداخت هزینه ماهانه 249 دلار، می توانند از قابلیت های Veo 3 بهره مند شوند. این مدل بعلاوه به وسیله پلتفرم سازمانی Vertex AI در اختیار کسب وکارها قرار خواهد گرفت. نکته قابل توجه دیگر، ادغام Veo 3 در ابزار فیلم سازی تازه گوگل با نام Flow است. Flow با ترکیب قدرت Veo، جمینای و Imagen به کاربران اجازه می دهد تا با توصیف صحنه سینمایی مورد نظر خود به زبان طبیعی، خروجی نهایی را از هوش مصنوعی دریافت نمایند. گوگل اعلام نموده که برای آنالیز پتانسیل های Veo با فعالان صنعت سینما همکاری نزدیکی داشته است.
در کنار Veo 3، گوگل از مدل فراوری تصویر Imagen 4 نیز پرده برداشت. این مدل در فراوری جزئیات دقیق مانند بافت پارچه و موی حیوانات عملکردی فوق العاده از خود نشان می دهد و هم در خلق تصاویر فوتورئالیستی و هم در سبک های انتزاعی توانمند است. Imagen 4 در نمایش تایپوگرافی نیز پیشرفت قابل توجهی نسبت به نسخه های قبلی داشته و می تواند خروجی هایی با وضوح تا 2K در میزان ها و نسبت های مختلف ارائه دهد. این مدل در حال حاضر در اپلیکیشن Gemini، پلتفرم Vertex AI و ابزارهای Workspace مانند Docs و Slides قابل استفاده است. بعلاوه، اعلام شده که نسخه ای از Imagen 3 با سرعتی 10 برابر بیشتر به زودی عرضه خواهد شد.
گوگل پشتیبانی از Veo 2 را نیز متوقف ننموده و کاربران همچنان می توانند در ابزار Flow از قابلیت های آن، مانند ارجاع تصاویر افراد، صحنه ها، سبک ها یا اشیا، استفاده نمایند. ابزارهایی نظیر کنترل دوربین، تغییر زاویه دید، زوم روی سوژه های خاص، تبدیل کادر پرتره به چشم انداز و افزودن یا حذف عناصر تصویری نیز برای کاربران فراهم شده است. Flow در حال حاضر برای مشترکان Google AI Pro و Ultra در آمریکا در دسترس قرار گرفته و به زودی در کشورهای بیشتری عرضه خواهد شد.
با توجه به نگرانی ها در خصوص توسعه محتوای جعلی فراوری شده با هوش مصنوعی، گوگل پرتال تازهی به نام SynthID Detector راه اندازی نموده است. کاربران می توانند فایل های تصویری یا ویدیویی مشکوک را در این پرتال بارگذاری نمایند تا تعیین گردد آیا حاوی نشانه گذاری SynthID هستند یا خیر. این اقدام گامی در جهت افزایش شفافیت و مقابله با سوءاستفاده از فناوری های هوش مصنوعی به شمار می رود.
منبع: TechCrunch
منبع: دیجیکالا مگ