攻克长视频生成记忆难题:港大与快手可灵MemFlow设计动态自适应长期记忆,告别快速遗忘与剧情错乱

你是否曾被AI视频生成的不连贯性所困扰?在交互式创作中,仅仅切换一句提示词,故事就可能瞬间“崩塌”:一个角色暂时离开画面后再次出现,却“面目全非”,仿佛换了演员;或者,当你尝试...

你是否曾被AI视频生成的不连贯性所困扰?

在交互式创作中,仅仅切换一句提示词 ,故事就可能瞬间“崩塌”:一个角色暂时离开画面后再次出现,却“面目全非 ”,仿佛换了演员;或者 ,当你尝试引入一个新角色,AI却在后续的剧情中反复“召唤”这个新人,甚至将多个角色的特征混淆在一起。这种“金鱼记忆”式的顽疾 ,正是长视频生成在叙事上的一大致命伤 。

现在,来自香港大学和快手可灵(Kling)团队的研究者们,联合推出了突破性方案——MemFlow。

攻克长视频生成记忆难题:港大与快手可灵MemFlow设计动态自适应长期记忆	,告别快速遗忘与剧情错乱

这是一种创新的流式自适应记忆机制,它赋予了AI强大的长时记忆与叙事连贯性,有望彻底解决上述难题。

流动的叙事 vs. 僵化的记忆

为了生成长视频 ,主流模型普遍采用“分块生成 ”的策略 ,即像放映幻灯片一样,一段一段地生成视频片段 。

然而,如何让后生成的片段精准地“记住”前面的内容 ,成了一道巨大的技术鸿沟。以往的解决方案大致可分为几类,但都存在明显局限:

1. “只记开头”的策略:一些模型只保留第一个视频片段作为记忆,后续所有生成都参考它。这种方法在单一场景下尚可 ,一旦故事发展,需要引入新角色或切换到全新场景时,模型就会因为“记忆 ”中没有这些新信息而迷失 ,导致后续生成与此前内容在视觉和语义上均存在不连贯性 。

2. “一刀切”的压缩策略:另一些方法试图将所有历史画面压缩成一个固定大小的“记忆包”。问题在于,不同的叙事需求要回忆的重点不同,“一刀切 ”的压缩往往会丢失关键细节 ,导致主体特征遗忘和视觉质量漂移。

3. “各自为政”的流程:还有一些流程试图将任务拆分,先让一个模型制作关键帧脚本,再让另一个模型根据脚本生成视频 。这种方式在根据各段脚本分别生成时是各自独立的 ,拼接成的完整视频缺乏全局一致性。

这些僵化的、非自适应的记忆策略 ,无法应对交互式创作中流动的 、不可预测的叙事需求,这正是导致交互式长视频生成一致性差的原因。

产生真正的长时记忆与叙事连贯性

MemFlow跳出依赖死板、固定记忆的传统模式,建立了一套动态、以语义作为桥梁的记忆系统 ,其优势主要体现在两方面:

1. 长时记忆:维持复杂场景下的视觉一致性

MemFlow获得了物体形象的长期记忆能力 。这意味着,即使在长视频中存在场景切换 、镜头变换,甚至是角色的插入或暂时消失等复杂情况 ,它也能记住每个主体的核心视觉特征 。

2. 叙事连贯性:确保多主体故事线的清晰发展

学习导演思维,从全局角度理解剧情。在涉及多个主体的叙事中,MemFlow不会错误地重复引入已经存在的角色 ,更不会发生主体混淆的“脸盲”错误。当用户引入新主体并对其展开后续描述时,MemFlow能准确理解并延续叙事,让故事流畅地向前推进 。

自适应的高效动态记忆

攻克长视频生成记忆难题:港大与快手可灵MemFlow设计动态自适应长期记忆	,告别快速遗忘与剧情错乱

MemFlow的强大能力源于两大核心设计:

叙事自适应记忆(NAM):在生成新片段前,它会根据当前提示词,智能地从记忆库中检索出最相关的视觉记忆。这使其无论是延续旧角色还是描绘新互动 ,总能找到准确的视觉参考 ,从而维持一致性。这种设计使模型能够在有限的记忆容量下优先保留与当前叙事最相关的信息,从而在一致性和计算开销之间取得平衡 。

稀疏记忆激活(SMA):为了兼顾效率,该机制会像聚光灯一样 ,只激活记忆中最关键的信息进行计算。这不仅避免了信息过载导致的混淆,还极大地提升了生成速度,在保证高质量叙事的同时实现了高效率。

从定量数据到定性对比的全面验证

为了评估MemFlow的实际效果 ,研究团队进行了一系列详尽的定性和定量实验,其结果清晰地展示了该模型在长视频生成领域的性能表现 。

定量分析:关键指标的显著提升

攻克长视频生成记忆难题:港大与快手可灵MemFlow设计动态自适应长期记忆,告别快速遗忘与剧情错乱

在具有挑战性的“多提示词60秒长视频生成 ”任务中 ,MemFlow的数据表现尤为突出:

综合质量与美学评分表现出色

在VBench-Long的评估体系下,MemFlow在质量总分(85.02)和美学小分(61.07)上均取得了所有对比模型中的最高分,表明其生成的视频在视觉质量和美学呈现上具有良好水准。

长程语义一致性得到验证

通过逐段评估视频与文本匹配度的CLIP分数 ,可以观察到一个关键现象:在视频的后半段(如40-60秒),许多模型在语义一致性上的表现会因误差累积而出现明显下滑,但MemFlow的分数能够持续保持在较高水平。这反映了其动态记忆机制在维持长期叙事一致性方面的有效性 ,有助于缓解“越往后越乱 ”的问题 。

一致性表现优异

在衡量核心能力的一致性评分上 ,MemFlow取得了96.60的高分,与所有对比模型相比处于领先位置。这直接说明,无论是角色、背景还是物体 ,MemFlow能在复杂的叙事变化中较好地保持视觉统一。

此外,在针对不同记忆机制的消融实验中,结果显示 ,MemFlow所采用的“叙事自适应记忆+稀疏激活(NAM+SMA)”策略,相较于“无记忆”或仅“记住第一段(Frame Sink) ”的方案,在主体一致性背景一致性上均取得了提升 ,同时还实现了比采用完整记忆库更高的运行效率 。

攻克长视频生成记忆难题:港大与快手可灵MemFlow设计动态自适应长期记忆,告别快速遗忘与剧情错乱

定性分析:视觉对比直观呈现模型优势

除了数据指标,直观的视觉对比更清晰地展示了模型的实际能力:

避免叙事混乱:在一个引入“一位穿着休闲毛衣的女士”的多镜头场景中 ,其他模型在提示词切换后,出现了生成人物外貌不一致或重复引入主体的问题 。而MemFlow则成功地在多个镜头中维持了同一位女士的形象,未见明显漂移。

攻克长视频生成记忆难题:港大与快手可灵MemFlow设计动态自适应长期记忆	,告别快速遗忘与剧情错乱

精准的角色追踪与再现:以上对比图有效地展示了MemFlow在处理角色互动时的稳定性。无论是沙滩上玩耍的孩子与小狗 ,还是家庭装饰圣诞树的场景,MemFlow都能确保故事中的核心角色在多段视频中保持一致 。相比之下,基线模型LongLive在切换提示词后引入了多余或不一致的新角色 ,造成了叙事不连贯;其他模型则存在更加严重的质量漂移和主体遗忘。

攻克长视频生成记忆难题:港大与快手可灵MemFlow设计动态自适应长期记忆,告别快速遗忘与剧情错乱

动态记忆的必要性展示:在对记忆机制的视觉对比中,“无记忆”的版本在切换提示词时出现了明显的场景不一致;仅“记住第一段 ”的方案无法保持后续新引入人物的特征。只有MemFlow能够平滑地承接剧情并保证主体一致性 ,这直观地说明了其动态记忆机制的有效性和必要性 。

攻克长视频生成记忆难题:港大与快手可灵MemFlow设计动态自适应长期记忆,告别快速遗忘与剧情错乱

效率评估

实验结果显示:在同样的多提示词长视频生成任务中,传统模型易出现主体漂移和角色混淆 ,而MemFlow则保持了更好的叙事连贯性和视觉一致性。

更重要的是,MemFlow在单个NVIDIA H100上实现了FPS=18.7的实时推理速度,与无记忆的基线模型相比 ,性能损耗极小。它在一致性、美学评分和文本对齐度等多项关键指标上,均达到SOTA水平 。

开启长视频叙事新纪元

由香港大学与快手可灵团队共同打造的MemFlow,通过其独特的动态记忆机制 ,将AI视频生成技术从“片段拼接”推向了“故事编写”的新高度。

它标志着AI正从一个只能创作“概念视频 ”的画师 ,蜕变为一个能够驾驭复杂剧情 、保持角色连贯的“叙事导演”。

一个真正能够理解、记忆并连贯讲述故事的AI视频创作时代,正在到来 。

Arxiv:https://arxiv.org/pdf/2512.14699

Project Page:https://sihuiji.github.io/MemFlow.github.io/

Github:https://github.com/KlingTeam/MemFlow

本文来自微信公众号“量子位”,作者:MemFlow团队 ,36氪经授权发布。

本文来自作者[慕梅]投稿,不代表视听号立场,如若转载,请注明出处:https://wap.stddy.com/youxi/202512-68143.html

(47)

文章推荐

  • 开心古诗词麻将其实是有挂的(到底是否有挂).唐诗宋词里有关麻将的?

    有哪些搞笑的古诗呢?《春晓备局》春眠不觉晓,处处蚊子咬。夜来大狗熊,谁也跑不了仿瞎让。《望炉山瀑布》日照香炉生紫烟,李白来到烤鸭店。口水直流三千尺,一摸口袋没带钱。《早发白帝城》朝辞宿舍心喜欢,网友见面倏忽还。满脸哀伤啼不住,方才险到鬼门关。《望庐山瀑布》日照香炉生紫烟,遥看瀑布挂前川。改编自《静

    2025年08月10日
    185
  • 实测教程“手机打扑克牌有外挂吗”(详细透视教程)-今日头条

    这软件太神了!趣游天水麻将十三张确实有插件(攻略插件)“我们专注于各类软件定制开发,已成功研发高效实用的软件系统。软件定制开发服务用获取专业解决方案。”趣游天水麻将十三张确实有插件是一款可以让一直输的玩家,快速成为一个“必胜”的ai辅助神器,有

    2025年08月30日
    112
  • 3分钟学会“手机微乐麻将一直输怎么回事(助赢神器通用版)

    软件神器超顶流!欢乐卡五星究竟有没有挂(万能开挂器)“我们专注于各类软件定制开发,已成功研发高效实用的软件系统。软件定制开发服务用获取专业解决方案。”欢乐卡五星究竟有没有挂是一款可以让一直输的玩家,快速成为一个“必胜”的ai辅助神器,有需要的用

    2025年09月05日
    103
  • 实测结果“手机十三水外挂推荐(助赢神器通用版)

    这软件超厉害!浙江游戏大厅辅助器脚本(软件出售)“我们专注于各类软件定制开发,已成功研发高效实用的软件系统。软件定制开发服务用获取专业解决方案。”浙江游戏大厅辅助器脚本是一款可以让一直输的玩家,快速成为一个“必胜”的ai辅助神器,有需要的用户可

    2025年09月08日
    96
  • 微乐掼蛋辅助器(揭秘手机上必备神器)/微乐掼蛋背包如何使用

    微乐掼蛋停止服务〖壹〗、微乐掼蛋停止服务的原因是服务器停止。通过查询相关公开信息显示,微乐掼蛋公众号的运营公司宣布破产,对微乐掼蛋进行关闭处理,服务器停机,不提供服务。服务器是计算机的一种,它比普通计算机运行更快、负载更高、费用更贵。服务器在网络中为其它客户机(如PC机、智能手机、ATM等终端甚至

    2025年09月10日
    96
  • 实测教程“QQ红包控制尾数埋雷软件怎么开挂”(详细透视教程)-今日头条

    软件神器超亮眼!闽游十三水辅助器工具(专用神器下载)“我们专注于各类软件定制开发,已成功研发高效实用的软件系统。软件定制开发服务用获取专业解决方案。”闽游十三水辅助器工具是一款可以让一直输的玩家,快速成为一个“必胜”的ai辅助神器,有需要的用户

    2025年09月29日
    85
  • 王曼昱最新消息!已抵达北京治疗肩伤,省队恩师亲自陪同

    近日,第十五届大湾区全运会乒乓球比赛正在澳门如火如荼的举办中。在11月18日晚间黑龙江女团对阵河北女团的四分之一决赛和11月19日黑龙江女团对阵上海女团的铜牌争夺战中,都没有看见黑龙江女乒头号主力王曼昱的身影。也是因为这个原因,这两场比赛黑龙江女团最终都是输球的,当然不是说王曼昱参加黑龙江女团就能赢

    2025年11月19日
    56
  • 美国国务院暴怒,要求大陆“必须停止”,台湾或将终结赖清德时代

    12月26日,大陆宣布对美国20家军工企业、10名个人进行制裁:冻结在华资产,禁止和中国境内的企业、个人合作。12月18日美国方面刚刚拍板给台湾110亿美元军购,创下单笔最高纪录。八天之后,中国方面开始行动,直接针对军售链条上的工厂以及重要人物,目的是要一环一环地敲断,让他们付出真金白银的代价。军工

    2025年12月30日
    28
  • 93.7%支持率!日本自卫队喜提60年最高支持,中国:彻底放心了

    日本自卫队有着93.7%的支持率,这样的数据放在任何地方都显得颇为硬气。但是一想到是日本自卫队,就难免让人多思考几句。最近网络上那一番热闹的景象,如同观看了一场现象级的大戏。一方面是民调创下纪录般地往上涨,朋友圈里满是称自卫队为国家脊梁的感慨;另一方面征兵点门前的落叶比人还要多。今天我们就好好地聊聊

    2026年01月16日
    22
  • 生肖猪:1月下旬要“出事”了!不是中奖,不是升职,是“人”

    生肖猪向来以温和醇厚、真诚待人的特质打动人心,如同冬日里的暖阳,不张扬却总能给身边人带来温暖。1月下旬所谓的“出事”,绝非意料之外的变故,而是命运为属猪人安排的珍贵人际馈赠——那些藏在岁月里的情谊、默默等待的机遇,都将通过“人”的相遇与重逢悄然落地,让平淡的日子泛起温暖的涟漪。这场与“人”相关的

    2026年01月16日
    24

发表回复

本站作者后才能评论

评论列表(4条)

  • 慕梅
    慕梅 2025年12月26日

    我是视听号的签约作者“慕梅”!

  • 慕梅
    慕梅 2025年12月26日

    希望本篇文章《攻克长视频生成记忆难题:港大与快手可灵MemFlow设计动态自适应长期记忆,告别快速遗忘与剧情错乱》能对你有所帮助!

  • 慕梅
    慕梅 2025年12月26日

    本站[视听号]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

  • 慕梅
    慕梅 2025年12月26日

    本文概览:你是否曾被AI视频生成的不连贯性所困扰?在交互式创作中,仅仅切换一句提示词,故事就可能瞬间“崩塌”:一个角色暂时离开画面后再次出现,却“面目全非”,仿佛换了演员;或者,当你尝试...

    联系我们

    邮件:视听号@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们