首页 > 新闻 > 融媒 > 融媒采风

MiniMax发布全球首个真实可用视频Agent,开启“Vibe Videoing”创作时代

时间:2025-06-20 浏览:

6月20日,上海人工智能独角兽企业MiniMax正式推出全新视频创作工具海螺视频Agent,并开放Beta版本。这一创新工具旨在通过AI技术大幅降低视频创作门槛,让用户以自然语言输入即可一键生成专业级成片,开启“零门槛Vibe Videoing”创作时代。

海螺视频Agent抛弃了传统的工作流,创新性地用LLM语言模型实现多工具、全流程自动创作。MiniMax透露,海螺视频Agent将有三阶段的进化,从而逐步赋予用户更大的创作自由,目前已开放第一阶段的Agent模版。

多工具自动调用,开启Vibe Videoing时代

尽管AI视频生成技术已经大大降低用户的创作门槛,但许多普通用户仍未实现创作自由。从创意构思、分镜脚本设计,到生成图片素材、生成视频并配音,再到精细化剪辑,这些具有挑战的流程构成了普通用户创作路上的“拦路虎”。

MiniMax透露,海螺视频Agent将通过三阶段进化,打开用户的创作自由度。

第一阶段:提供专业视频创意Agent模版,用户只需根据提示输入文字或图片,即可一键生成高质量创意短片。

第二阶段:半自定义视频Agent,让用户能够在视频生成的任一环节进行自由编辑。

第三阶段:实现完全形态的端到端视频Agent。

目前,海螺视频Agent已经实现第一阶段能力。例如,在MiniMax提供的案例中,直接输入6个主角,即可得到敦煌壁画的高燃混剪。海螺视频Agent还可用于制作科普视频、广告大片等。通过多工具自动调用,海螺AI让优质视频创意和生成更加接近普通用户。

基于LLM语言模型,提升普通用户的创意自由度

用AI降低创作门槛、保证视频专业级别质量,同时又能实现人与AI的有效协作,如何做到?为此,MiniMax在视频Agent中实现以下技术创新,在AI更大程度地提升普通用户创作自由度的同时,让人与AI更好地进行双向协同。

自然语言驱动全局:抛弃传统工作流+节点的工具模式,通过LLM语言模型,AI自动拆解任务并调用最佳工具链,创新性地支持用户在自然语言描述中构建完整视频,从而降低创作门槛、提升普通用户的创意空间。

全流程工具集:打造视频构思、资料收集、分镜制作、剪辑、配音等视频制作全流程工具集,并通过Agent模型在不同阶段实现自动调用,根据创作阶段智能匹配最优方案,从而Agent在自动化创作的同时保证视频质量。

创作过程可视化:通过Agent思维链实时展示AI工作逻辑,为自定义编辑提供可视窗口与操作空间。Agent创作的透明化可操作窗口,让用户不仅可以有效监控AI创作流程,还能有效介入,实现可控的视频创作。

据悉,MiniMax近期开启了连续5日的科技发布周,陆续发布开源推理模型M1、视频模型Haluo 02、通用MiniMax Agent和海螺视频Agent。据MiniMax官方,接下来,第二阶段的视频Agent创作工具将于2025年夏季面世,致力于技术普惠,实现“Intelligence with Everyone”。

猜你喜欢: