Nvidia支持的人工智能初创公司发布了表达人类情感的化身

Synthesia 是一家由 Nvidia 支持的人工智能 (AI) 初创公司,推出了一项新的升级,使 AI 化身能够传达人类的情感和动作。4 月 25 日,该公司推出了“Expressive Avatars”,旨在根据文本指令表达情感,用于企业演示、营销和培训目的。

虽然生成式 AI 经常因其创建逼真的移动图像的能力而受到称赞,但OpenAI 的 Sora 视频生成器就是这样。然而,人工智能也并非没有缺陷,尤其是在描绘人类时,人类经常出现扭曲的手或四肢、拼贴的背景或嘴唇与语音不同步的情况。

Synthesia 旨在在其最新版本中纠正这一问题,该版本是根据真人在工作室中阅读脚本而开发的。这样做是为了帮助机器人捕捉嘴唇追踪并更准确地表达他们的情绪。

Nvidia支持的人工智能初创公司发布了表达人类情感的化身

Synthesia 的首席执行官兼联合创始人维克多·里巴贝利 (Victor Ribarbelli) 在一段视频中表示 ,与人类不同的是,化身不明白自己在说什么,这导致了之前缺乏对情绪的面部反应。

在工作室里,他们接受训练以回应简单的提示,例如“我很高兴。我很伤心。 “我很沮丧”,无法传达与特定情绪相关的正确面部表情和语气。

新的头像还支持 130 多种语言,可以提供自己的隐藏式字幕,甚至可以克隆用户自己的声音。然而,根据 Cointelegraph 对该模型的测试,在 Synthesia 网站上使用英语以外语言(例如法语、德语和西班牙语)的化身示例模型中,英语模型是***且最像人类的。

据报道,该初创公司拥有至少一半的财富 100 强公司客户,并为超过 55,000 家企业提供服务。其中包括 Zoom、施乐、微软和路透社等各行业的***。

Synthesia 是一家成立于 2017 年的英国公司。继去年人工智能热潮之后,该公司的估值已达到近 10 亿美元,其主要支持者包括目前主导人工智能半导体芯片开发的英伟达 (Nvidia)。

由于其方法更为狭窄——创建用于商业用途的类人化身——Synthesia 一直在回避 OpenAI 的 ChatGPT 和谷歌的 Gemini 聊天机器人等聊天机器人模型之间的一些炒作和激烈竞争。

© 版权声明

相关文章

暂无评论

暂无评论...