学吧导航_第29页 - 蜀驿圈娱乐网

Wan2.2-S2V - 阿里开源的电影级视频生成模型 | 学吧导航

Wan2.2-S2V 是阿里通义开源的多模态视频生成模型,能用一张静态图片和一段音频生成高质量的数字人视频,视频时长可达分钟级。模型支持多种图片类型和画幅,包括真人、卡通、...

Aivilization 是香港科技大学推出的全球首创人工智能多智能体社会模拟平台。构建了可视化的数字沙盒,用户可创建和引导成千上万个 AI 智能体,观察未来人类与 AI 共存的社会...

VibeVoice是微软研究院开源的文本转语音模型,专注于生成长篇、富有表现力的多说话人对话音频,例如播客。有效解决了传统TTS系统在可扩展性、说话人一致性和自然对话流方面...

Claudable是开源的Web应用构建工具,基于Next.js,结合了Claude Code和Cursor CLI的先进AI代理能力,以及Lovable简单直观的应用构建体验。用户只需用自然语言描述想要构建的...

Prompt Optimizer 是开源的 AI 提示词优化工具,能帮助用户快速生成高质量的提示词,提升 AI 输出内容的准确性和相关性。 Prompt Optimizer是什么 Prompt Optimizer 是开源...

MiniCPM 4.1 是面壁智能推出的专为端侧设备优化的高效大语言模型。具备卓越的推理性能,能在智能手机、平板电脑等设备上快速响应用户请求,推理速度比同尺寸开源模型快 3 倍...

Matrix-Game 2.0 是昆仑万维 SkyWork AI 推出的自研世界模型。是业内首个开源的通用场景实时长序列交互式生成模型,采用视觉驱动的交互方案,通过 3D 因果变分自编码器和多...