实测Vidu Q1参考生功能，看到诸葛亮丘吉尔拿破仑在长城拍照留念-新科技-资讯-头部财经

实测Vidu Q1参考生功能，看到诸葛亮丘吉尔拿破仑在长城拍照留念

资讯 » 新科技 2025-07-11

机器之心报道

编辑：Youli

这次真的不一样，遇到了「想象力的神」！

以前常说「要把自己活成一支队伍」，如今感谢 AI，真的实现了。

最近，生数科技旗下 AI 视频模型 Vidu Q1 推出参考生功能，极大简化传统内容生产流程，真正实现「一个人就是一个剧组」！

首先，我们来看一个视频：

这几个人物形象大家应该都很熟悉。

摇着羽扇、说着「想不到世间还有如此厚颜无耻之人」出现在各大鬼畜视频中的诸葛亮，英国铁血首相丘吉尔，以及战绩可查的拿破仑，如今他们跨越时空，围坐在会议室中密切交谈，实现「世纪大会晤」！

如果用常规的 AI 图生视频来做的话，一般要经过写脚本、文生图 / P 图 / 融图、图片生成、图生视频、成片等步骤，但实际上，这里只用了三张图片和 Vidu Q1 的参考生功能！

就像把大象放进冰箱只需要三步一样，这里也只需要三个步骤：找到上传照片、写提示词、成片。

看到这里，大概就可以看出 Vidu Q1 参考生功能的不寻常之处了。

只需上传人物、道具、场景等参考图，即可直接将多个参考元素融合为一段视频素材，真正实现零分镜生成，堪称「拿来即用」。

对此，各路网友纷纷在社交平台放出自己用 Vidu Q1 参考生视频做出的作品，简直是五花八门，对人类的想象力致以崇高敬意。

X 网友 Scobleizer 发布了这样一个视频，视频中随着车库的门徐徐打开，一个只有头颅的雕像从里面蹦蹦跳跳「走」出来，还时不时做出夸张的表情。

根据 Scobleizer 的介绍，这段视频他只用了两张照片，一张他拍摄的「硅谷的发源地」—— 惠普车库，另外就是那个雕塑。将两张图片上传到 Vidu Q1 参考生视频后，他只用了一句提示词：

「Open the doors of the garage in Image1 revealing the statue inside from Image2 dancing」（打开图 1 中车库的门，露出图 2 中里面跳舞的雕像）。

可以看出，整个视频很流畅，而雕塑的表情也很生动有趣。

还有一个很有脑洞大开的视频，一个喵星人正在森林中拿着手机自拍，与此同时，后面有一只狮子正在缓缓靠近。

这是 X 网友 SohelBloom 的杰作，而根据视频中的标注也可以看到，提示词也只有一句很简单的话，意思就是：图 1（喵星人）正在拿着图 2（手机）自拍，此时图 3（狮子）正从后面走来……

更炫技的操作是，X 网友 Alex，她是一名艺术家兼程序员，在她的操作下，1989 年版本的蝙蝠侠与 1993 年版的侏罗纪公园霸王龙，不仅同框出现，还上演激烈「对打」，从画面流畅度来看，堪称一部好莱坞大片。

看到大家的视频这么精彩，接下来，我们也亲自实测一波，看看 Vidu Q1 参考生视频是是不是真的那么好用（温馨提示：以下实测均一次生成，无抽卡。）

打开官网可以很直观地看到上新的「参考生视频」，可以点击试用：

体验地址：
https://www.vidu.cn/create

大家应该都很喜欢宫崎骏的动漫，小时候想着可以住在里面，再大些想着可以画出那样的漫画。所以，如果自己笔下的角色出现在宫崎骏的动画中应该会是怎样的？

我们试了一下，找到一张粗略画成的简笔画小孩子图片、两张《龙猫》的经典画面，然后「丢」给 Vidu Q1 参考生视频，提示词很简单：

之后生成的视频效果如下：

可以看出，原本是图 1 只是个纸面形象，可进入宫崎骏的电影场景后，在保持自身特点的同时，风格会尽可能符合场景风格，仿佛真的进入到那个童话世界中。

梦想实现了，AI时代，人人都可以做5s中的漫画家！

还有一点值得说的是，大家可以看到，视频画质非常清晰，这是因为 Vidu Q1 参考生视频将清晰度提升到了 1080p！支持 1080P 视频直出，也就是说无论是宏大的科幻叙事，还是可爱的童话动漫世界，又或是人物特写的细微表情，都可以清晰呈现。

再来一个！

这次，我们请出故宫的大胖橘，让它给我们来个表演！

提示词只有一句话：大胖橘拿着红缨枪，在树林里练中国功夫！

效果如下：

可以看出，视频基本符合提示词的描述，而且原本图片中的红缨枪过长，为了使画面更和谐，红缨枪的大小也进行了自动调整，更适配大胖橘的「身材」。

接下来继续上难度！

因为当前 Vidu Q1 的参考生功能还在持续迭代，目前最多支持 7 个主体输入，也就是说，包括人物、场景、道具在内，最多可以上传 7 张图片，所以为了考验一下 Vidu Q1 的极限，我们打算做个挑战，上传 7 张图片，来试一试效果怎么样！

前面说到诸葛亮、丘吉尔和拿破仑在会议室讨论，那现在，我们思路打开，让他们换个场地，再进行多一些的互动，就先去去长城打卡吧！

首先，要把这三个经典人物的标配物品给备齐，诸葛亮的扇子、丘吉尔的经典英伦风黑色小礼帽、拿破仑的佩剑，以及一张长城的图片。

然后是提示词：

[@图 1] 拿着 [@图 5] 中的扇子，[@图 2] 中的男人头上戴着 [@图 4] 中的黑色帽子，[@图 3] 手上拿着 [@图 6] 中的佩剑，一起在 [@图 7] 拍合照，他们彼此之间有互动，并做出拍照比耶的姿势。

（温馨提示：在写提示词时，如果需要多次提及图片，可以使用「@ 」键，之后会出现此次所上传的图片列表，按需选择！）

效果如下：

诸葛亮轻摇羽扇，丘吉尔戴上了小礼帽，拿破仑手持宝剑缓缓走来，之后三个人一起对着镜头，像大多数游客一样，在长城上摆着拍照手势，留下经典画面。

好像没什么问题，符合提示词的描述，人物角色之间的互动也挺自然，看来 Vidu Q1 经受住了考验！

不过再仔细看，有点小瑕疵：诸葛亮比耶的时候，仿佛摇了个画手，变魔术一样把扇子变不见了？相比之下，拿破仑只是把佩剑扔了，虽然不理解，但合理！

好吧，拍照打卡之旅继续，再来一个，把他们三人一起打包到《冰与火之歌》中的铁王座面前。

提示词：[@图 1] 拿着 [@图 5] 的扇子，和 [@图 2] 与 [@图 3] 一起走向中间的座位前面，然后 [@图 1] 和 [@图 2]、[@图 3] 一起做出拍照的姿势！

表现依然不错，不过宰相你的扇子都快要把拿破仑的脸给遮住了，往下放一放好不好？你看丘吉尔做得就很好啊。

其实从这几个场景可以看到，不管是在会议室，还是长城，抑或是铁王座面前，这三个人物形象保持高度一致性，甚至可以将这几个视频剪辑在一起，做成转场视频，镜头叙事的转换很自然。而在传统的视频制作中，要想实现这么丝滑的转场，要耗费大量的人力、物力、时间。

不过也必须要说，在这几个视频中，或许是因为人物形象与场景本身存在一些割裂，图层融合得并不是十分好，甚至仔细看，有些些「抠图」感。

当然，瑕不掩瑜，总的来说，Vidu Q1 参考生的功能还是非常强大的，操作简单，只需要三个步骤，几乎就可以生成你想要的图片，只要是你能够想到的，几乎都可以变成现实，轻松实现导演梦想！

最后，来说一下大家关心的价格！用 Vidu Q1 参考生，制作一条长 5 秒、1080p 视频，只要 20 积分，而当前官方标准版套餐价格为 48 元 / 月，包含 800 积分，换算下来的话，不到一瓶矿泉水的价格就可以制作一个视频，价格应该说是非常亲民！

感兴趣的小伙伴可以自己动手试一下，体验一下「导演梦」！

参考链接：

https://x.com/Scobleizer/status/1942694804183474316

https://x.com/alexfredo87/status/1942651670325805466

https://x.com/thetripathi58/status/1942632730233053285

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。由用户投稿，经过编辑审核收录，不代表头部财经观点和立场。
证券投资市场有风险，投资需谨慎！请勿添加文章的手机号码、公众号等信息，谨防上当受骗！如若本网有任何内容侵犯您的权益，请及时联系我们。

智元、宇树中标1.2亿元人形机器人采购订单

2025-07-129阅读
深蓝汽车苏琳珂：智能网联生态给“燃油车蛋糕”添加“智能奶油”

2025-07-129阅读
智元、宇树中标 1.24 亿元中国移动子公司人形机器人订单

2025-07-129阅读
杨利伟：外籍航天员将在中国接受全方位训练

2025-07-129阅读
比亚迪秦 L 天神之眼最大规模 OTA 升级，新增 5 大核心智驾功能

2025-07-129阅读
南向资金今日净买入17.44亿港元，美团-W净买入7.15亿港元

2025-07-129阅读
茶饮的商业模式，越来越像共享单车

2025-07-129阅读
5699 元起，华为 Pura 80 Pro / Pro + 手机京东优惠 800 元

2025-07-129阅读
“京东秒送”在上海达成重磅协议！事关骑手收入、休息保障→

2025-07-129阅读
打通“信息孤岛” 翼龙应急型无人机连续3日执行应急救援任务

2025-07-129阅读