豆包开源视频生成模型「VideoWorld」证券配资工具
2 月 10 日,豆包大模型团队宣布,与北京交通大学、中国科学技术大学联合提出的,视频生成实验模型「VideoWorld」正式开源。值得关注的是,VideoWorld 在业界首次实现无需依赖语言模型,即可认知世界。
官方介绍,VideoWorld 作为一种通用视频生成实验模型,去掉语言模型,实现了统一执行理解和推理任务。同时,VideoWorld 基于一种潜在动态模型,可高效压缩视频帧间的变化信息,显著提升知识学习效率和效果。
据悉,在不依赖任何强化学习搜索或奖励函数机制前提下,VideoWorld 达到了专业 5 段 9x9 围棋水平,并能够在多种环境中,执行机器人任务。
团队认为,尽管面向真实世界的视频生成和泛化仍存在很大挑战,视频生成依然可以成为一种通用的知识学习方法,并在现实世界充当思考和行动的「人工大脑」。
目前证券配资工具,VideoWorld 的项目代码与模型已开源并发布。