作加

让AI跳出“标准答案”:一句话解锁生成式模型的创意潜能


一句提示语,唤醒AI的创造力

你有没有遇到过这种情况:向AI提问“法国的首都是什么?”,它总是毫不犹豫地回答“巴黎”——准确无误,但也毫无惊喜。这正是当前生成式AI面临的一个普遍问题:太“靠谱”反而限制了创造力

生成式AI在输出内容时,通常会选择概率最高的那个答案。这种“最可能路径”虽然确保了准确性,却也导致了输出的重复和单调,研究者称之为“模式崩溃”(mode collapse)。尤其是在创意写作、角色对话或艺术生成等需要多样性的场景中,这种局限尤为明显。

但现在,一个来自斯坦福大学和西弗吉尼亚大学的研究团队,提出了一种极简却极具突破性的方法——语言化采样(Verbalized Sampling, VS),只需在提示中加入一句话,就能让AI“打开脑洞”。

一句话的魔力:从“选一个”到“列多个”

VS的核心思想非常简单:不再让AI只输出一个答案,而是要求它展示多个可能的响应及其概率分布

具体来说,研究人员在提示中加入了这样一句话:

“生成5个响应及其对应的概率,从完整分布中采样”

就这么一句,无需修改模型结构,也不用重新训练,就能让大型语言模型(LLMs)和图像生成模型展现出前所未有的多样性。

这相当于把AI从“应试模式”切换到了“思考模式”。它不再只给出“标准答案”,而是像人类一样,列出几种可能的思路,并告诉你每个选项的“可信度”。

实测效果:更像人,更有创意

研究团队在多个任务中测试了VS的效果,结果令人振奋:

  • 在创意写作中,使用VS生成的故事和段落展现出更丰富的主题和风格变化,同时内容质量并未下降。
  • 在对话模拟中,AI能够更好地模拟人类的情绪波动和思维跳跃,对话更自然、更具层次感。
  • 在开放式问答中,生成的答案分布更接近真实人类的反应,避免了“千人一面”的同质化输出。

更重要的是,VS还支持可调节的多样性控制。用户可以通过设置概率阈值,决定是想要更稳妥的答案,还是更大胆、更具实验性的输出。比如,你可以要求AI只列出概率高于10%的选项,或者鼓励它探索更低概率但更有创意的可能性。

无需重训练,即插即用的“思维解放器”

VS的最大优势之一是极低的使用门槛。它不需要对模型进行任何微调或重训练,只需在提示词中加入特定指令,就能在多种主流大模型上生效。这意味着无论是开发者、创作者,还是普通用户,都可以立即尝试并从中受益。

这项研究不仅揭示了当前AI提示工程的巨大潜力,也提醒我们:模型的能力可能比我们平时看到的要丰富得多——只是我们一直用错了“打开方式”。

结语:重新定义AI的“思考”方式

语言化采样或许不会成为每一个AI应用的标配,但它为我们提供了一个重要的启示:简单的提示设计,也能释放深层的模型潜能

在AI日益普及的今天,如何让机器不只是“正确”,而是“有想法”,正成为下一个关键命题。而VS,正是朝着这个方向迈出的一步——用一句话,让AI学会“多想一点”。