
(美通社头条)12月1日,快手宣布可灵AI正式发布其全新产品「可灵O1」。可灵O1基于全新的视频和图像模型,整合文字、视频、图片、主体等多模态输入,将所有生成和编辑任务融合于一个全能引擎之中。可灵O1的推出,彻底解决了AI视频生成中角色、场景等一致性难题,为影视、自媒体、广告电商等应用场景,提供了深度适配的一站式解决方案。
可灵O1基于多模态视觉语言(MVL)理念,突破传统单一视频生成任务的模型边界,将参考生视频、文生视频、首尾帧生视频、视频内容增删、视频修改变换、风格重绘、镜头延展等多种任务,融合于同一个全能引擎之中,用户无需切换模型及工具,即可一站式完成从生成到编辑的全流程创作。
全新的可灵O1集生成与编辑于一体,广泛适用于影视、自媒体、广告电商等多种场景。无论是从零构建的叙事生成,还是对既有素材的深度重塑,可灵O1都能根据不同需求,灵活调用其参考、编辑的能力,轻松完成创作。
凭藉深层语义理解力,可灵O1可将用户上传的图片、视频、主体、文字均视为指令。模型打破了模态限制,能够从不同视角综合理解一张照片、一段视频或一个主体,精准生成各项细节。