Echo长音视频生成框架 京东开源JoyAI
时间:2026-06-05
小编:本站小编
阅读: 2383
6月3日,京东推出JoyAI-Echo长音视频生成框架。该框架直接解决了行业长期存在的“长视频生成三大难题”——角色易崩、声音乱变、生成缓慢,并实现了对话式编辑功能。京东方面表示,这标志着其在长视频生成领域进入全球第一梯队。
该框架包含四项核心技术创新。一是跨模态音视频记忆库,能在多镜头生成过程中持续保存并调用角色的外观特征和说话人音色信息,在长达5分钟的视频中也能保持身份、形象与声音的高度一致。二是记忆驱动后训练,结合SFT、跨模态RLHF和DMD等技术,仅DMD一项就实现了约7.5倍的推理加速。三是Director Agent智能导演助理,用户用自然语言提出需求,系统自动拆分成剧本、角色和镜头,局部修改无需重跑整条视频。四是轻量化实时超分模块,支持两档分辨率提升,保障高清输出不卡顿。

为评估性能,研究团队基于100个故事、3000个镜头构建了专门评测集。实测显示,JoyAI-Echo在跨镜头一致性、视频质量、文本一致性等核心指标上均领先,其中语音内容准确率高达0.8646。在用户偏好调研中,81.7%的用户认为其音频质量更优,80.6%认为提示词遵循度更高,63.6%认为视觉美学更佳。
目前,JoyAI-Echo的代码与权重已全部开源,项目页和GitHub代码仓库已正式上线,供开发者和创作者体验及二次开发。该框架可广泛应用于虚拟故事创作、数字人直播、品牌营销视频制作及影视前期预演等多个场景。
【来源:凤凰网科技】
THE END-
星露谷物语巨大作物怎么种植星露谷物语中我们要如何种植巨大任务呢!巨大作物不仅外观独特,还能带来丰厚的收益。不过,并非所有作物都能成长为巨大形态,而且种植过程需要满足特定的条件和布局。时间:2026-06-12
-
鸣潮弗洛洛突破材料汇总鸣潮2 5版本弗洛洛突破材料有哪些呢?掌握这些材料的种类和获取途径,是快速提升弗洛洛实力的关键。本文将为你详细汇总弗洛洛突破和天赋升级所需的所有材料,并提供时间:2026-06-12
-
逆水寒新绝技和群侠技能如何抽取逆水寒二周年庆版将携全新绝技,烬海焚莲与群侠技能尺断惊涛震撼登场时。这些新技能不仅在视觉效果上令人眼前一亮,更在实战中展现出极高的强度和多样的应用场景。新绝时间:2026-06-12
-
三角洲行动零号大坝与长弓溪谷机密性价比卡战备怎么选三角洲行动任务中后期,战备值不仅影响出勤资格,还决定了通关收益的边际回报。如何在限制条件下打出高性价比操作,是不少玩家追求的目标。这次我们将以零号大坝与长弓时间:2026-06-12
-
无限暖暖悠然水畔怎么获取无限暖暖游戏中的悠然水畔不仅是一件极具特色的时装,更是一个实用的钓鱼工具。它不仅能为你的角色带来可观的属性加成,还能解锁水域交互功能,让你轻松开启钓鱼之旅。时间:2026-06-12
热门阅读
-
王者荣耀s43段位继承规则一览 王者荣耀s43段位继承规则是什么
阅读:2308
-
沃尔沃推出XC70“先租后买”方案:0首付月付2999元起
阅读:3510
-
冬日狂想曲全道具NPC出现时间地点介绍-冬日狂想曲全道具NPC出现时间地点一览
阅读:3579
-
清华系航天及船舶机器人知有无界完成松禾资本、卓源亚洲天使轮融资
阅读:2862
-
京东生鲜亮相2026肉类产业消费周动员会,启动国产品质牛肉扶持计划
阅读:3157
