跻身全球第一梯队!京东开源JoyAI-Echo框架:解决长视频生成三大难题
时间:2026-06-04
小编:本站小编
阅读: 2203
今日,京东宣布推出JoyAI-Echo长音视频生成框架,号称解决行业长期头疼的长视频生成三大难题:角色易崩、声音乱变、生成缓慢。目前,JoyAI-Echo代码与权重已全部开源,项
快科技6月3日消息,今日,京东宣布推出Joyai-Echo长音视频生成框架,号称解决行业长期头疼的长视频生成三大难题:角色易崩、声音乱变、生成缓慢。
目前,JoyAI-Echo代码与权重已全部开源,项目页和github代码仓库均已上线,开发者和创作者可进行体验和二次开发。
京东表示,JoyAI-Echo的推出,标志着京东在长视频生成领域实现重大突破,进入全球第一梯队。
据了解,JoyAI-Echo内置跨模态音视频记忆库,可在多镜头生成过程中持续php保存并调用角色外观特征和说话人音色信息。
实测结果显示,在长达5分钟的视频中,角色身份、视觉形象和声音音色均能保持高度一致,避免出现同一个人演着演着变成另一个人”的python问题。
同时,京东提出记忆驱动后训练流程,结合SFT、跨模态RLHF和Distribution Matching Distillation(DMD)技术,在提升生成质量的同时实现推理加速。

其中,仅DMD技术就带来约7.5倍速度提升,让长视频生成效率大幅提高。
此外,JoyAI-Echo还加入智能导演助理”Director Agent,用户只需用自然语言描述需求,它就能自动拆分剧本、角色、编程场景和镜头。
如果生成结果中有局部镜头不满意,用户也可以直接通过对话提出修改,系统只需重新生成有问题的部分,不必整条视频重来。
为满足专业内容生产需求,JoyAI-Echo还配套实时超分模块,支持736 xphp 1280提升至11521920,以及7361280提升至14722560两档分辨率。
通过单步超分,JoyAI-Echo可生成高分辨率视频和精细化音频,即便在流式延迟约束下,也能保持稳定高清表现。
评测方面,研究团队基于100个故事、3000个镜头构建了专门的长音视频生成评测集,对JoyAI-Echo进行**度编程测试。
结果显示,JoyAI-Echo在跨镜头一致性、视频质量、文本一致性和语音内容准确率等核心指标上均取得领先表现,其中语音内容准确率达到0.8646,领先行业其他同类模型。
本文标题: 跻身全球第一梯队!京东开源JoyAI-Echo框架:解决长视频生成三大难题本文地址: http://www.eraseerrata.com/news/roll/742875.html-
跻身全球第一梯队!京东开源JoyAI-Echo框架:解决长视频生成三大难题今日,京东宣布推出JoyAI-Echo长音视频生成框架,号称解决行业长期头疼的长视频生成三大难题:角色易崩、声音乱变、生成缓慢。目前,JoyAI-Echo代时间:2026-06-04
-
蛋仔派对12月兑换码是什么?蛋仔派对12月兑换码一览蛋仔派对12月兑换码是什么?蛋仔派对12月兑换码怎样获取?蛋仔派对作为一款备受欢迎的游戏,其中兑换码是获取游戏内物品和奖励的重要途径,随着2023年12月的时间:2026-06-04
-
2026高考安检新变化上热搜:智能眼镜、智能手表带入考场即视为作弊2026年高考临近,教育部发布预警,明确携带手机、智能手表、智能手环、智能眼镜等设备进入考场即构成作弊,无论是否使用。多省教育考试机构已通知,将对考生眼镜进时间:2026-06-04
-
乱斗西游2千里眼阵容如何搭配乱斗西游2千里眼阵容分享乱斗西游2千里眼阵容如何搭配?乱斗西游2千里眼阵容推荐什么?乱斗西游2游戏中的千里眼角色是小伙伴们特别喜欢的一个英雄,如何搭配好这个角色所在的阵容,却是许多时间:2026-06-04
-
AI 转型生死线:基础设施不换,所有创新都是空谈 高校在 Agentic AI 全面落地的今天,智慧教学、科研创新、校园治理已进入智能化新阶段。高校 AI 应用从单点工具走向规时间:2026-06-04
热门阅读
-
沃尔沃推出XC70“先租后买”方案:0首付月付2999元起
阅读:3631
-
冬日狂想曲全道具NPC出现时间地点介绍-冬日狂想曲全道具NPC出现时间地点一览
阅读:1724
-
清华系航天及船舶机器人知有无界完成松禾资本、卓源亚洲天使轮融资
阅读:4436
-
王者荣耀s43段位继承规则一览 王者荣耀s43段位继承规则是什么
阅读:1655
-
京东生鲜亮相2026肉类产业消费周动员会,启动国产品质牛肉扶持计划
阅读:1946
