EchoMimicV3 - 蚂蚁技术开源的多模态数字人生成系统 | 学吧导航 学吧君476 EchoMimicV3是什么 EchoMimicV3 是蚂蚁集团支付宝终端技术部推出的多模态人类动画生成系统。基于紧凑型视频扩散模型(CVDM),通过创新的 任务融合 和 模态融合 设...
Sim - 开源的可视化AI工作流构建工具 | 学吧导航 学吧君741 Sim是什么 Sim 是开源的 AI 工作流构建工具,专为简化 AI 应用开发而设计。工具用直观的拖拽界面,让用户无需深入编码能快速搭建 AI 工作流。Sim 能与主流的大型语...
Nano Banana - AI图像编辑模型,编辑后的图像高度真实 | 学吧导航 学吧君1K Nano Banana是什么 Nano Banana 是备受瞩目的 AI 图像生成与编辑模型,为谷歌 Gemini 2.5 Flash Image模型代号。能根据简单的文本提示生成细节丰富、光影真实的图...
Baichuan-M2 - 百川智能开源的医疗增强大模型 | 学吧导航 学吧君799 Baichuan-M2是什么 Baichuan-M2 是百川智能开源的医疗增强大模型。在医疗领域表现卓越,于HealthBench评测中以60.1分超越OpenAI的gpt-oss120b等众多开源模型,登顶...
Youtu-agent - 腾讯优图实验室开源的Agent框架 | 学吧导航 学吧君818 Youtu-agent是什么 Youtu-agent 是腾讯优图实验室推出的开源智能体框架,支持构建和运行自主智能体。Youtu-agent 在 WebWalkerQA 和 GAIA 基准测试中表现优异,准...
Mureka V7.5 - 昆仑万维推出的全新AI音乐生成大模型 | 学吧导航 学吧君630 Mureka V7.5是什么 Mureka V7.5 是昆仑万维推出的 AI 音乐生成模型,擅长创作高质量的中文歌曲。模型基于优化的 ASR 技术,精准分析唱词和演唱细节,生成自然且富有...
MoE-TTS - 昆仑万维推出的先进语音合成框架 | 学吧导航 学吧君544 MoE-TTS是什么 MoE-TTS 是昆仑万维语音团队推出的先进语音合成框架,专门用在提升开放域文本描述的语音生成能力。MoE-TTS 基于混合专家(MoE)架构,将预训练的大型...