腾讯进军文生视频赛道，但大规模商业化还需要时间

界面新闻记者 | 陆柯言
界面新闻编辑 | 文姝琪

继快手可灵、字节即梦之后，腾讯混元大模型也在12月3日宣布上线文生视频（text-to-video）能力。目前，C端用户可通过腾讯元宝APP申请试用，企业客户通过腾讯云提供服务接入，API同步开放内测申请。

文生视频是腾讯混元大模型继文生文、文生图、3D生成之后的又一次业务拓展尝试。与多数厂商不同的是，腾讯选择开源该视频生成模型，其参数量达到130亿，也是当前最大的视频开源模型。

这一新功能的操作界面并不复杂。用户只需要输入一段描述，即可生成一段5秒时长的视频，目前支持中英文双语输入、多种视频尺寸以及多种视频清晰度。

目前主流平台支持的免费文生视频体验多在5～6秒之间。腾讯混元的多模态生成技术负责人凯撒表示，视频时长并非技术挑战，而是算力和数据挑战。因为每当时长扩长一倍，算力也将呈平方级上升，在成本上并不划算。大部分影视剧或剪辑作品都是不同镜头的拼接，因此第一版将优先满足基本需求，如果未来有更强烈的长时间镜头需求，再做升级。

凯撒介绍，混元视频生成模型基于与Sora类似的DiT架构，并在架构设计上进行了多处升级，包括适配了新一代文本编码器提升语义遵循，能够更好地应对多个主体描绘。此外，它的一个代表性特色是，能够实现在画面主角保持不变的情况下自动切镜头，这是目前业界大部分模型所不具备的能力。

2024年2月，OpenAI发布的文生视频大模型Sora点燃了文生视频赛道。不过， Sora目前并未对普通用户开放，而是仅将测试资格开放给了视觉艺术家、设计师和电影制作人。一种解释是，考虑到今年的美国大选，OpenAI希望竭力避免安全风险，希望在大选之后再全面对外开放。

而在Sora尚未彻底“亮活”之前，中国厂商已经表现得颇为积极。快手可灵、字节即梦、Minimax旗下海螺AI、阿里巴巴通义万相等都是文生视频领域的代表产品，其中不少已经开始进军海外，并且推出了较为完备的会员付费体系，快速进行商业化变现。

考虑到算力及数据成本之高，商业化同时是所有相关产品难以避免的话题。腾讯同样为混元设计了商业化路径。由于混元视频生成模型具有高画质优势，可用于工业级商业场景例如广告宣传、动画制作、创意视频生成等场景。

但由于技术尚未足够成熟，目前市面上的文生视频模型仍然存在一些缺陷。例如生成视频在画质、细节、真实感等方面仍与真实视频存在差距，且用户对视频生成过程的控制能力有限，只能通过修改文本提示来间接影响视频生成效果，而文本与视频的语义匹配度不足，也会导致生成效果不及用户预期。

“我们确实看到很多产品和模型有先发优势，但自己做的时候却发现，现在视频生成、尤其是是文生视频领域成熟度远没有大家想象的那么高。失败率很高，抽卡太多了。”凯撒表示。“抽卡”指的是文生视频效果不稳定，用户需要多次尝试才能得到符合自己期望的满意画面，就像抽奖一样碰运气。

这也是腾讯并不急于商业化的原因。凯撒认为，文生视频技术还没有到大规模商业化的程度，仍在技术打磨阶段。因此，腾讯决定在这一阶段推出文生视频模型并将其开源，让更多开发者来使用并基于腾讯混元系列打造应用及服务，也只有更多人来使用，才能更快地将技术推向成熟。

腾讯进军文生视频赛道，但大规模商业化还需要时间

航天彩虹：隐身无人机系统研制项目已完成初样机的总装工作

华为Mate70中国广电合约机开售

最新文章

易方达基金张坤管理规模再度缩水百亿，增持阿里巴巴，大幅减持中海油

工信部：积极扩大新能源汽车消费，加力推进公共领域车辆全面电动化试点

微信“送礼物”小试牛刀：东方甄选微信店铺单日销售额超100万元

百度文库AI功能MAU超9000万，AI DAU增长230%

L3自动驾驶“前夜”：激光雷达年装机量首次突破130万，有望成15万元级车型标配？

九源基因聚乙二醇化人粒细胞刺激因子注射液获批上市

上海国地中心将推出人形机器人2.0版本“Deep Snake”

幻方梁文锋刷屏，参加首场总理座谈会，他谈了什么？

工信部：2024年加强关键核心技术攻关重大创新成果不断涌现

众信旅游：公司在小红书平台设立店铺并宣传售卖诸多旅游产品

标签

关注我们么么哒！

腾讯进军文生视频赛道，但大规模商业化还需要时间

航天彩虹：隐身无人机系统研制项目已完成初样机的总装工作

华为Mate70中国广电合约机开售

猜你喜欢

易方达基金张坤管理规模再度缩水百亿，增持阿里巴巴，大幅减持中海油

百度文库AI功能MAU超9000万，AI DAU增长230%

众信旅游：公司在小红书平台设立店铺并宣传售卖诸多旅游产品

腾讯混元3D AI创作引擎正式上线

员工植入恶意代码报复用户， B站回复：漏洞已修补，涉事员工已开除

小红书启用英文名rednote

小红书1500万元在杭州成立新公司 小红书新公司叫棋行科技

小红书App启用英文名“rednote”

雷军：小米su7春节出行无忧，任何原因抛锚或事故，免费提供道路救援

冯明远最新调仓曝光：加仓华勤技术、电连技术等，宁德时代重返前十大重仓

荣耀全球化冲刺迎来“关键先生”

恒生科技HKETF(513890)涨超2%，盘中换手率近16%交投高度活跃，权重股理想汽车-W涨近6%

最新文章

易方达基金张坤管理规模再度缩水百亿，增持阿里巴巴，大幅减持中海油

标签

关注我们 么么哒！

关注我们的公众号

小红书1500万元在杭州成立新公司小红书新公司叫棋行科技

关注我们么么哒！