斯坦福大学的研究团队与 Apparate Labs 前几天发布一款名为 Proteus 的创新 AI 视频生成模型,可以从单一图像生成笑、说唱、唱歌、眨眼、微笑、说话高度逼真和具有表现力的虚拟人物。 PROTEUS兼容多种大模型的多模态输入,可以处理语音、文本和图像等多种形式的数据。
Proteus模型亮点: - 高度逼真:利用先进的AI技术,Proteus能够从单张图片生成具有高度逼真表情和流畅动作的虚拟人物形象。 - 低延迟生成:Proteus模型具备低延迟特性,能够实时响应语音输入,生成每秒超过100帧的视频流。 - 多模态交互:模型支持语音、文本和图像等多种输入形式,实现与用户的自然直观交互。
应用领域: Proteus模型在个性化虚拟助理、虚拟宠物、情感支持、客户服务、教育和培训、游戏定制、影视娱乐、市场营销和社交媒体等领域具有广泛的应用潜力。
申请体验地址: https://apparate.ai/early-access.html
发现一个好用到炸的 3D 素材库,直接就能用~并且还是免费可商用! 有文字字母类型、3D 手势、图标等,材质根据塑料、玻璃、金属、纺织品、陶瓷制品进行了分类,需要哪种材质直接选择即可~
五大必收藏理由: 1️⃣ 材质狂想曲 - 经典款:哑光玻璃/液态金属/磨砂塑料…像在玩科幻风乐高! - 隐藏款:“加密朋克气泡”“荧光黏土漩涡”…设计师私藏素材秒变发布会主KV! 2️⃣ 分辨率自由 - 免费包:512x512px,做PPT图标绰绰有余; - 付费包:3000x3000px超清大图,印刷海报也丝滑! 3️⃣ 商业友好到离谱 ✅ 个人/商用通杀 ✅ 禁止二次转售但支持改色重组 ✅ 作者亲自担保版权无忧 4️⃣ 分类比Instagram还卷 - 按材质搜:黑黏土/红塑料/蓝玻璃…像逛潘多拉魔盒! - 按主题拿:UI图标/建筑模块/抽象艺术…直接对标甲方需求! 5️⃣ 隐藏Buff:自定义颜色 虽然不能直接改参数,但官方建议用PS调色盘微调基础色(比如把“霓虹绿”掰成“荧光粉”),省下90%建模时间!
官网地址:https://shapefest.com/
OpenAI 周五在其官网上发表了博客文章,名为“驾驭合成声音的挑战和机遇”, 这也是 OpenAI 在官网首次展示了全新自定义音频模型“Voice Engine”。
用户只需要提供15秒左右的参考声音,通过Voice Engine就能生成几乎和原音一模一样的全新音频,在清晰度、语音连贯、音色、自然度等方面比市面上多数产品都强很多。
除了能合成音频之外,OpenAI 还展示了Voice Engine很多其他际商业用途,例如,一位失去声音表达能力的女孩,在Voice Engine帮助下能像以前一样正常发音说话。
全文内容:OpenAI 官网
Voice Engine 应用场景: 1. 阅读助手:可以通过自然且富有情感的声音为非阅读者和儿童提供阅读辅助,实时个性化响应,与学生互动。 2. 内容翻译:可以翻译视频和播客等内容,使创作者和企业能够以流利且原汁原味的声音触达全球更多受众。 3. 服务全球:改善偏远地区的必要服务。 4. 帮助言语障碍人士:为言语障碍人士提供治疗应用,以及为有学习需求的人士提供教育增强功能,使残疾人能够进行交流。 5. 帮助病人恢复声音:帮助患有突发性或退行性言语障碍的患者恢复声音。