AI聊天要“开口说话”了?这家新创公司用一张图打造会动的数字分身

一张照片,生成你的AI数字代言人

想象一下:只需上传一张自拍照,就能创造出一个能说会动、表情自然的数字头像,还能让它替你讲课、带货、甚至教外语——这不是科幻电影,而是Lemon Slice正在实现的未来。

这家专注于数字头像生成的科技新秀,刚刚宣布完成1050万美元种子轮融资,投资方阵容亮眼:包括知名风投机构 Matrix Partners、顶级创业加速器 Y Combinator,以及跨界明星组合 The Chainsmokers 和多位企业高管。这笔资金将加速其在AI视频化交互领域的布局。

Lemon Slice-2:小身材,大能量

Lemon Slice 的核心技术在于其最新推出的扩散模型——Lemon Slice-2。这个拥有200亿参数的AI模型,最令人惊叹的是它的效率:仅需单个GPU,就能以每秒20帧的速度实时生成高清视频流

这意味着什么?用户不再需要昂贵的算力支持,就能流畅地直播或嵌入动态头像。通过API和可嵌入小工具,企业可以轻松将这些“活”的头像集成到自己的平台中,无论是客服系统、在线课程,还是电商直播间。

更酷的是,用户不仅能从一张静态图片生成头像,还能随时更换背景、调整风格,甚至创造非人类角色——比如卡通形象、外星人或奇幻生物,满足教育、娱乐、品牌营销等多元场景需求。

不只是“动起来”,还要“说出来”

为了让数字头像真正“活”过来,Lemon Slice 还整合了语音合成巨头 ElevenLabs 的技术,赋予头像自然流畅的声音表现力。从此,AI聊天机器人不再是冷冰冰的文字回复者,而是一个看得见、听得清、有表情、会表达的虚拟互动伙伴。

创始人 Lina Colucci 表示,团队早在生成式AI爆发初期就开始深耕视频生成领域。“我们相信,视频将是下一代人机交互的核心。”她指出,当前许多虚拟头像缺乏真实感与即时互动能力,用户体验大打折扣,“而我们的目标,就是让每一次对话都更生动、更人性化。”

安全先行,应用为王

在深度伪造(deepfake)技术引发广泛担忧的今天,Lemon Slice 特别强调安全机制。公司已建立多重防护措施,防止未经授权的面部或声音克隆,并利用大型语言模型进行内容审核,确保生成内容合规可控。

目前,Lemon Slice 已明确将技术落地于多个高潜力领域:
教育与语言学习:AI教师可24小时授课,支持多语种发音训练;
电商直播:品牌可打造专属虚拟主播,降低人力成本;
企业培训:定制化数字讲师,提升员工学习体验。

小团队,大野心

尽管目前团队仅有八名成员,但他们的技术实力已赢得资本青睐。Matrix Partners 合伙人 Ilya Sukhar 表示:“Lemon Slice 不仅拥有顶尖的AI工程能力,更重要的是,他们清楚如何将这项技术应用于真实世界场景,比如视频教学和客户互动。”

接下来,融资所得将主要用于三方面:招募工程与市场人才、扩大模型训练规模、以及持续优化生成效果与安全性

谁能笑到最后?

当然,这条路并不孤单。Lemon Slice 面临着来自 D-ID、HeyGen、Synthesia 等成熟玩家的竞争。但凭借其高效的通用扩散模型和灵活的应用架构,这家公司正试图在快速扩张的虚拟人赛道中,撕开一道属于自己的突破口。

当AI开始“面对面”与我们交谈,或许下一个出现在屏幕里的“你”,正是由一张照片生成的数字分身——而这一切,正在 Lemon Slice 的代码中悄然成真。

类似文章