机器之心报道
编辑:Youli
这次真的不一样,遇到了「想象力的神」!
以前常说「要把自己活成一支队伍」,如今感谢 AI,真的实现了。
最近,生数科技旗下 AI 视频模型 Vidu Q1 推出参考生功能,极大简化传统内容生产流程,真正实现「一个人就是一个剧组」!
首先,我们来看一个视频:
这几个人物形象大家应该都很熟悉。
摇着羽扇、说着「想不到世间还有如此厚颜无耻之人」出现在各大鬼畜视频中的诸葛亮,英国铁血首相丘吉尔,以及战绩可查的拿破仑,如今他们跨越时空,围坐在会议室中密切交谈,实现「世纪大会晤」!
如果用常规的 AI 图生视频来做的话,一般要经过写脚本、文生图 / P 图 / 融图、图片生成、图生视频、成片等步骤,但实际上,这里只用了三张图片和 Vidu Q1 的参考生功能!
就像把大象放进冰箱只需要三步一样,这里也只需要三个步骤:找到上传照片、写提示词、成片。
看到这里,大概就可以看出 Vidu Q1 参考生功能的不寻常之处了。
只需上传人物、道具、场景等参考图,即可直接将多个参考元素融合为一段视频素材,真正实现零分镜生成,堪称「拿来即用」。
对此,各路网友纷纷在社交平台放出自己用 Vidu Q1 参考生视频做出的作品,简直是五花八门,对人类的想象力致以崇高敬意。
X 网友 Scobleizer 发布了这样一个视频,视频中随着车库的门徐徐打开,一个只有头颅的雕像从里面蹦蹦跳跳「走」出来,还时不时做出夸张的表情。
根据 Scobleizer 的介绍,这段视频他只用了两张照片,一张他拍摄的「硅谷的发源地」—— 惠普车库,另外就是那个雕塑。将两张图片上传到 Vidu Q1 参考生视频后,他只用了一句提示词:
「Open the doors of the garage in Image1 revealing the statue inside from Image2 dancing」(打开图 1 中车库的门,露出图 2 中里面跳舞的雕像)。
可以看出,整个视频很流畅,而雕塑的表情也很生动有趣。
还有一个很有脑洞大开的视频,一个喵星人正在森林中拿着手机自拍,与此同时,后面有一只狮子正在缓缓靠近。
这是 X 网友 SohelBloom 的杰作,而根据视频中的标注也可以看到,提示词也只有一句很简单的话,意思就是:图 1(喵星人)正在拿着图 2(手机)自拍,此时图 3(狮子)正从后面走来……
更炫技的操作是,X 网友 Alex,她是一名艺术家兼程序员,在她的操作下,1989 年版本的蝙蝠侠与 1993 年版的侏罗纪公园霸王龙,不仅同框出现,还上演激烈「对打」,从画面流畅度来看,堪称一部好莱坞大片。
看到大家的视频这么精彩,接下来,我们也亲自实测一波,看看 Vidu Q1 参考生视频是是不是真的那么好用(温馨提示:以下实测均一次生成,无抽卡。)
打开官网可以很直观地看到上新的「参考生视频」,可以点击试用:
体验地址:
https://www.vidu.cn/create
大家应该都很喜欢宫崎骏的动漫,小时候想着可以住在里面,再大些想着可以画出那样的漫画。所以,如果自己笔下的角色出现在宫崎骏的动画中应该会是怎样的?
我们试了一下,找到一张粗略画成的简笔画小孩子图片、两张《龙猫》的经典画面,然后「丢」给 Vidu Q1 参考生视频,提示词很简单:
之后生成的视频效果如下:
可以看出,原本是图 1 只是个纸面形象,可进入宫崎骏的电影场景后,在保持自身特点的同时,风格会尽可能符合场景风格,仿佛真的进入到那个童话世界中。
梦想实现了,AI时代,人人都可以做5s中的漫画家!
还有一点值得说的是,大家可以看到,视频画质非常清晰,这是因为 Vidu Q1 参考生视频将清晰度提升到了 1080p!支持 1080P 视频直出,也就是说无论是宏大的科幻叙事,还是可爱的童话动漫世界,又或是人物特写的细微表情,都可以清晰呈现。
再来一个!
这次,我们请出故宫的大胖橘,让它给我们来个表演!
提示词只有一句话:大胖橘拿着红缨枪,在树林里练中国功夫!
效果如下:
可以看出,视频基本符合提示词的描述,而且原本图片中的红缨枪过长,为了使画面更和谐,红缨枪的大小也进行了自动调整,更适配大胖橘的「身材」。
接下来继续上难度!
因为当前 Vidu Q1 的参考生功能还在持续迭代,目前最多支持 7 个主体输入,也就是说,包括人物、场景、道具在内,最多可以上传 7 张图片,所以为了考验一下 Vidu Q1 的极限,我们打算做个挑战,上传 7 张图片,来试一试效果怎么样!
前面说到诸葛亮、丘吉尔和拿破仑在会议室讨论,那现在,我们思路打开,让他们换个场地,再进行多一些的互动,就先去去长城打卡吧!
首先,要把这三个经典人物的标配物品给备齐,诸葛亮的扇子、丘吉尔的经典英伦风黑色小礼帽、拿破仑的佩剑,以及一张长城的图片。
然后是提示词:
[@图 1] 拿着 [@图 5] 中的扇子,[@图 2] 中的男人头上戴着 [@图 4] 中的黑色帽子,[@图 3] 手上拿着 [@图 6] 中的佩剑,一起在 [@图 7] 拍合照,他们彼此之间有互动,并做出拍照比耶的姿势。
(温馨提示:在写提示词时,如果需要多次提及图片,可以使用「@ 」键,之后会出现此次所上传的图片列表,按需选择!)
效果如下:
诸葛亮轻摇羽扇,丘吉尔戴上了小礼帽,拿破仑手持宝剑缓缓走来,之后三个人一起对着镜头,像大多数游客一样,在长城上摆着拍照手势,留下经典画面。
好像没什么问题,符合提示词的描述,人物角色之间的互动也挺自然,看来 Vidu Q1 经受住了考验!
不过再仔细看,有点小瑕疵:诸葛亮比耶的时候,仿佛摇了个画手,变魔术一样把扇子变不见了?相比之下,拿破仑只是把佩剑扔了,虽然不理解,但合理!
好吧,拍照打卡之旅继续,再来一个,把他们三人一起打包到《冰与火之歌》中的铁王座面前。
提示词:[@图 1] 拿着 [@图 5] 的扇子,和 [@图 2] 与 [@图 3] 一起走向中间的座位前面,然后 [@图 1] 和 [@图 2]、[@图 3] 一起做出拍照的姿势!
表现依然不错,不过宰相你的扇子都快要把拿破仑的脸给遮住了,往下放一放好不好?你看丘吉尔做得就很好啊。
其实从这几个场景可以看到,不管是在会议室,还是长城,抑或是铁王座面前,这三个人物形象保持高度一致性,甚至可以将这几个视频剪辑在一起,做成转场视频,镜头叙事的转换很自然。而在传统的视频制作中,要想实现这么丝滑的转场,要耗费大量的人力、物力、时间。
不过也必须要说,在这几个视频中,或许是因为人物形象与场景本身存在一些割裂,图层融合得并不是十分好,甚至仔细看,有些些「抠图」感。
当然,瑕不掩瑜,总的来说,Vidu Q1 参考生的功能还是非常强大的,操作简单,只需要三个步骤,几乎就可以生成你想要的图片,只要是你能够想到的,几乎都可以变成现实,轻松实现导演梦想!
最后,来说一下大家关心的价格!用 Vidu Q1 参考生,制作一条长 5 秒、1080p 视频,只要 20 积分,而当前官方标准版套餐价格为 48 元 / 月,包含 800 积分,换算下来的话,不到一瓶矿泉水的价格就可以制作一个视频,价格应该说是非常亲民!
感兴趣的小伙伴可以自己动手试一下,体验一下「导演梦」!
参考链接:
https://x.com/Scobleizer/status/1942694804183474316
https://x.com/alexfredo87/status/1942651670325805466
https://x.com/thetripathi58/status/1942632730233053285
相关文章
2025-07-129阅读
2025-07-129阅读
2025-07-129阅读
2025-07-129阅读
2025-07-129阅读
2025-07-129阅读
2025-07-129阅读
2025-07-129阅读
2025-07-129阅读
2025-07-129阅读