Genie Envisioner - 智元机器人开源的通用机器人平台 | 学吧导航 学吧君509 Genie Envisioner是什么 Genie Envisioner(GE)是智元机器人团队联合新加坡国立大学、北京航空航天大学等机构开发的机器人操作统一平台。通过 先想象,后行动 的方...
Matrix-3D - 昆仑万维最新推出的全景3D世界生成框架 | 学吧导航 学吧君479 Matrix-3D 是什么 Matrix-3D 是昆仑万维 Skywork AI 团队推出的一款开源框架,专注于生成可探索的全景 3D 世界。框架结合全景视频生成和 3D 重建技术,支持用单张...
Skywork MindLink - 昆仑万维推出的开源推理大模型 | 学吧导航 学吧君428 Skywork MindLink是什么 Skywork MindLink 是昆仑万维推出的开源推理大模型,基于创新的Plan-based Reasoning范式,通过动态路径选择和自适应推理,显著降低推理成...
Step-Audio 2 mini - 阶跃星辰开源的端到端语音模型 | 学吧导航 学吧君582 Step-Audio 2 mini是什么 Step-Audio 2 mini是阶跃星辰推出的开源端到端语音模型。突破传统语音模型结构,采用真端到端多模态架构,直接将原始音频输入转化为语音...
Gemini 2.5 Flash Image - 谷歌推出的先进AI模型 | 学吧导航 学吧君604 Gemini 2.5 Flash Image是什么 Gemini 2.5 Flash Image (代号 Nano Banana)是谷歌 AI Studio 推出的创新图像生成与编辑模型。模型具备多项先进功能,如保持角色在...
麻省理工《生成式AI鸿沟:2025年商业人工智能现状》 | 学吧导航 学吧君654 麻省理工《生成式AI鸿沟:2025年商业人工智能现状》报告,通过深入调研300多个AI项目、与52个组织进行访谈及对153位高管开展调查,精准揭示当前企业在生成式AI(GenA...
EchoMimicV3 - 蚂蚁技术开源的多模态数字人生成系统 | 学吧导航 学吧君476 EchoMimicV3是什么 EchoMimicV3 是蚂蚁集团支付宝终端技术部推出的多模态人类动画生成系统。基于紧凑型视频扩散模型(CVDM),通过创新的 任务融合 和 模态融合 设...