想当年咱们搞个视频,剪辑、配音、找素材,哪个不是熬秃头的活儿。现在倒好,AI都进化到能直接“吐”视频了,还自带音效,说是“效果惊人”。这不,谷歌又端出了个Veo 3,号称是目前最强的AI视频生成器。嘿,口气不小,我倒要看看它有几斤几两。
想玩转这个Veo 3,目前主要是通过谷歌自家的Flow平台。听着挺高大上,其实就是登录账号,新建个项目,然后找到那个“文本转视频”的选项。不过各位可得留点神,这玩意儿默认给你的是Veo 2,想用最新的Veo 3?劳驾您手动选一下。这种小细节,有时候真让人哭笑不得,新东西藏着掖着,生怕你一下子就用上了似的。当然,如果你是Gemini的Pro或者Ultra订阅用户,也能直接在Gemini里找到它,算是多条路吧。
这Veo 3到底能干啥?首先,老本行,“文本转视频”那是必须的,你写段话,它给你变个影儿出来。据说还能生成带人说话的视频,这就有点意思了,以前的AI对话那叫一个尬,希望Veo 3能有点长进。它还能搞出游戏直播那种画面,比如一个主播在玩游戏的场景。我寻思着,以后游戏主播是不是连真人都不用了,直接AI生成得了?省心!
而且啊,这玩意儿还支持生成动漫风格的视频。二次元的小伙伴们估计要欢呼了。它还能处理多种语言,甚至让视频里的人唱歌。我想起十几年前捣鼓语音合成,那生硬得跟机器人念经似的,现在都能唱歌了,科技发展是真快。用户还可以上传一张图片,让它变成视频的开头或者结尾,不过图片得先裁剪成16:9。说实话,每次遇到这种强制比例,我这老胳膊老腿就觉得有点别扭,自由度再高点不好吗?
那个“图像素材转视频”功能,就是你可以上传特定角色或物体的图片,让它们出现在视频里。听起来挺酷的吧?不过,目前这功能只支持Veo 2模型,而且,敲黑板了,得是Ultra订阅用户才能用。看到这儿,我这老江湖就得撇撇嘴了,好东西总是跟钱包挂钩,一点儿“惊喜”都没有。
发布会上展示的那些例子嘛,有穿着比基尼的年轻网红在山顶上说“你看多美啊”——嗯,创意非常“独特”。还有游戏视频里救生员做心肺复苏的,挺有场景感。动漫风格的场景里,学生们在屋顶上讨论婚姻大事,AI也开始探讨人生哲学了?还有亚裔女脱口秀演员讲段子,我就好奇AI能不能理解真正的幽默。K-pop女团跳快节奏韩舞的视频,视觉效果估计拉满了。最让我有点印象的是把一张叶问的图片,变成一个准备开打的愤怒男人的视频,这个倒是有点“灵魂注入”的意思了。
说到钱,大家最关心的还是这个。谷歌提供了两个付费套餐:Pro版,大概每月20美刀,能有限地用用Veo 3;Ultra版,更贵,但能生成的视频更多,一些高级功能也得靠它。我摸着良心说,这AI烧钱,厂商也得回本,可以理解。不过呢,好消息是Pro版有个一个月的免费试用,你得填支付信息,但在试用期结束前取消就不会扣钱。这点小羊毛,不薅白不薅,记得设个闹钟就行。对学生党更友好的是,谷歌给Pro版提供了长达15个月的免费使用期,只需要学生邮箱验证一下。想想我上学那会儿,哪有这种好事,顶多蹭蹭实验室的电脑。
Veo 3这股风是吹起来了。它是不是真的像宣传的那么“王炸”,能不能让普通人也轻松拍“大片”,还有待时间检验。毕竟,AI这东西,看着热闹,真要用得顺手、用出彩,还得看它后续的优化和大家的创意了。别最后又是一个“看上去很美”的花架子,那就没意思了。咱们这些老科技迷,见过的“革命性产品”太多了,平常心,平常心。