Компания Google недавно объявила о доступности Veo 3, продвинутой модели генерации видео с искусственным интеллектом, для разработчиков через платный предварительный просмотр в Gemini API и Google AI Studio. Этот запуск позволяет разработчикам и создателям создавать высококачественные видео с синхронизированным диалогом, музыкой и звуковыми эффектами, используя всего одну текстовую команду.
Разработка с Veo 3 в Gemini API: теперь доступно для разработчиков
С Veo 3 разработчики получают улучшенные возможности художественного контроля, включая:
- Синхронизированный звук: Veo 3 интегрирует диалог, фоновую музыку и реалистичные звуковые эффекты за один проход, устраняя необходимость в постобработке аудио.
- Кинематографическое качество: Модель генерирует видео высокой четкости, захватывающее креативные детали, от сложных текстур до тонких световых эффектов, указанных в команде.
- Реалистичная физика: Veo 3 симулирует физику реального мира для аутентичного движения, включая естественные движения персонажей, точное течение воды и проекцию теней.
Ранние случаи использования и эксперименты разработчиков
С момента своего анонса на Google I/O 2025, Veo 3 использовался для создания десятков миллионов видео по всему миру, вызывая новые креативные тренды и эксперименты.
Примеры первых пользователей включают:
- Cartwheel разработала систему, которая превращает 2D-видео с людьми в полностью готовые к производству 3D-анимации на основе скелетных персонажей. Используя Veo 3, Cartwheel создает реалистичное движение людей, которое затем преобразуется в 3D-анимации для клиентов.
- Volley использует Veo 3 для создания видеороликов внутри игр, которые продвигают повествование. Команда использует модель для быстрого создания и улучшения последовательностей для предстоящей ролевой игры под названием Wit's End.
Подчеркнутые возможности
Veo 3 поддерживает широкий спектр задач генерации видео, от кинематографического повествования до динамичных анимаций. Ключевые возможности включают:
- Синхронизированный звук: Родная генерация диалогов, звуковых эффектов и музыки, синхронизированных с видео за один проход.
- Кинематографическое качество: Создание HD-видео, захватывающего детализированные художественные элементы из предоставленных команд.
- Реалистичная физика: Симуляция аутентичного движения, такого как движения персонажей, течение воды и взаимодействие с окружающей средой.
Пример команд для демонстрации Veo 3
- Пушистые персонажи в стиле стоп-моушн: Яркая кухонная сцена из фетра и пряжи, где профессор Нибблс, полный хомяк в очках, нервно помешивает кастрюлю, которая извергается зеленой слизью, вызывая хаос.
- Механическое сердце в пустыне: Экстремальный крупный план вращающейся шестерни открывает массивное механическое сердце в пустынной местности, где крошечные фигуры в мантиях проводят обслуживание, подчеркивая масштаб и сложность механизма.
Эти примеры и другие можно исследовать, используя шаблон SDK и стартовое приложение, доступное в Google AI Studio. Пользователи платного тарифа могут перерабатывать, копировать и расширять образцы непосредственно в платформе.
Начало работы и ценообразование
Для доступа к Veo 3 разработчикам необходимо выбрать проект Google Cloud с включенным биллингом в AI Studio. Цена составляет $0.75 за секунду видео и аудио выхода. Также планируется вариант Veo 3 Fast, обещающий более быстрое и экономичное создание видео.
Обязательство по ответственному использованию ИИ
Все видео, созданные с помощью Veo 3, содержат цифровой водяной знак SynthID для ответственного создания контента. Разработчикам рекомендуется изучить официальную документацию, кулинарную книгу и стартовое приложение для ознакомления с лучшими практиками.
Помимо доступа через Gemini API в Google AI Studio, Veo 3 также доступен подписчикам приложения Gemini и Flow, а также корпоративным клиентам, использующим Vertex AI.
Очень впечатляющая технология! Особенно понравилось, как Veo 3 упрощает создание видео с реалистичной физикой и синхронизированным звуком. Это действительно открывает новые горизонты для разработчиков и аниматоров. Интересно узнать, как скоро появится более доступный вариант Veo 3 Fast.