Speech 2.5 - MiniMax稀宇科技推出的新语音生成模型 | 学吧导航 Speech 2.5 是 MiniMax 团队开发的先进语音生成模型。在语音合成领域取得显著进步,尤其在多语种表现力、音色复刻精度和语种覆盖范围上。模型支持 40 种语言,能精准复刻不...
Prompt Optimizer - 免费开源的AI提示词优化工具 | 学吧导航 Prompt Optimizer 是开源的 AI 提示词优化工具,能帮助用户快速生成高质量的提示词,提升 AI 输出内容的准确性和相关性。 Prompt Optimizer是什么 Prompt Optimizer 是开源...
SkyReels-A3 - 昆仑万维推出音频驱动的数字人视频生成模型 | 学吧导航 SkyReels-A3 是昆仑万维发布的音频驱动数字人视频生成工具。通过简单的输入(如人像图片和语音)生成高质量的动态视频内容,让静态照片 活 起来,可以为现有视频更换台词,人物...
ToonComposer - 腾讯联合港中文、北大开源的AI动画工具 | 学吧导航 ToonComposer 是腾讯联合港中文、北大推出的 AI 动画制作工具。工具通过生成式后关键帧技术,将传统动画制作中的中间帧生成和上色环节自动化,仅用一个草图和上色参考帧,能...
InternVL3.5 - 上海AI Lab推出的开源多模态大模型 | 学吧导航 智能体技术:智能体技术是指让模型具备自主与环境交互并完成特定任务的能力。书生·万象 InternVL3.5 的 GUI 智能体可以自动化操作软件界面,具身智能体可以进行物理空间的导...
VibeVoice - 微软研究院开源的文本转语音模型 | 学吧导航 VibeVoice是微软研究院开源的文本转语音模型,专注于生成长篇、富有表现力的多说话人对话音频,例如播客。有效解决了传统TTS系统在可扩展性、说话人一致性和自然对话流方面...
Seedream 4.0 - 字节最新推出的AI生图模型 | 学吧导航 Seedream 4.0 是字节跳动最新推出的图像创作模型,为创作者提供高效、可控的创作体验。模型支持精准指令编辑,用户能用日常语言描述需求,模型能准确完成增删、修改等操作。 ...