每经记者:王郁彪 每经编辑:杨夏
继“上新”图生视频、视频续写功能后,快手视频生成大模型可灵在一个月内迎来第三次重要升级——网页端上线。
《每日经济新闻》记者从快手方面了解到,可灵推出了更加清晰的高画质版,以及首尾帧控制、镜头控制等新功能,单次生成的文生视频时长也增加至10秒。此外,快手图像生成大模型可图也宣布开源。
在刚刚落幕的世界人工智能大会(WAIC)上,快手大模型家族首次亮相,包括视觉生成大模型(可灵、可图)、快意语言大模型、推荐大模型为核心的大模型矩阵,覆盖内容理解、分发、生成等多个领域。
作为短视频平台的快手一方面通过AI技术,降低内容生产门槛,提高内容生产效率;另一方面,也积极地将AI技术运用于其电商业务中,帮助商家实现智能化经营。但在有限的注意力资源下,内容和商业之间不可避免地存在“互搏”,快手该如何让它们“化敌为友”?
在刚刚落幕的世界人工智能大会(WAIC)上,快手可灵推出了更加清晰的高画质版,以及首尾帧控制、镜头控制等新功能。 快手供图
快手大模型家族首亮相
全面对标Sora,快手视频生成模型可灵面世以来热度不减。
快手方面数据显示,截至目前,已有超过50万用户申请可灵内测资格,视频生成数量有700万条。
可灵于6月初上线,当时只开放了文生视频功能。快手表示,可灵能够生成大幅度的合理运动,模拟物理世界特性,生成的视频分辨率达1080p,时长最长可达2分钟。随后,可灵又相继更新了图生视频、视频续写、多尺寸选择等功能。
本次随着上线网页端,可灵推出了更加清晰的高画质版,以及首尾帧控制、镜头控制等新功能。此外,单次生成的文生视频时长增加至10秒。
多位互联网资深人士向记者表示,快手是最先推出比肩Sora的大模型产品的公司,是超出预期的。但其实,早在2023年初,快手就启动了新AI战略,在最近几次财报电话会议上,快手联合创始人兼CEO程一笑也多次谈及快手自研大模型的研究及应用进展。不过,当时在很多人看来,快手更侧重于短视频和社交内容,而非专业的视频剪辑工具。此前的大模型竞争中,快手也并不是引人关注的第一梯队成员。
可灵的走红,让国内视频生成大模型赛道看到了对标Sora“弯道超车”的可能。
在刚刚落幕的WAIC大会上,快手带着以语言大模型快意、推荐大模型、视觉生成大模型(可图、可灵)为核心的大模型矩阵亮相。
语言、推荐、视觉,对应内容生产、理解、推荐等多层面,目前AI产品已实际运用于快手的业务运营中。据快手高级副总裁、主站业务与社区科学负责人盖坤介绍,快手推荐模型SIM已达到十万亿的参数规模,下一代推荐大模型架构ACT预估每天可为快手App带来4亿分钟的用户观看时长。
4亿分钟的时长增长,平台用户黏性、活跃度和吸引力,对整个快手生态的补足至关重要。
AI工具提升经营质效
快手年报显示,其2023年全年总收入达1134.7亿元,同比增长20.5%,首次突破千亿规模;其中,线上营销服务板块年收入同比增长23%,达603亿元,创出新高。此外,快手电商全年GMV(商品交易总额)首次突破万亿规模达1.18万亿元,迈入国内电商年GMV万亿元俱乐部。
生意场,快手的“盘子”上升到了一个新的量级。需要考虑的问题自然也就越来越多。
比如,把内容转化为成交,一直以来都不是一个轻松的话题。特别是以快手、抖音为首的短视频平台,用户的停留判断,往往只有几秒。内容的质量、话题对感官的刺激是吸引注意力的关键,一旦平台开始过多追求商业化目标,内容的吸引力就会下降。特别是如今,互联网流量红利褪尽,内容与商业的“互搏”自然也会被进一步放大。
如何减少“互搏”?快手的答案是上AI工具。
比如,基于快意大模型构建视频脚本,叠加数字人技术等,进而生成低成本、高品质的视频和直播内容,做线索转化效率的提升。更直观的数据是,相比今年1月,今年6月快手AIGC(生成式人工智能)月活跃客户数增长了8倍,月GMV规模提升了64倍,平台AIGC广告收入规模提升了12倍。AI工具在应用层面,有一些阶段性的收效。
不过,对AI工具的使用,“快手们”也设置了一些“红线”,比如数字人直播。
今年“6·18”前,刘强东数字人在京东采销直播间开播,“6·18”期间,也有数十位总裁数字人在京东开启直播。不过,对快手、抖音这样还是以内容为主的平台,对数字人直播等AI工具的应用,会显得比较谨慎。
今年“6·18”期间,腾讯视频号修订《视频号橱窗达人发布低质量内容实施细则》征求意见,拟将“使用插件、AI等工具生成虚拟形象进行直播”分类为“非真实直播”下的“违规示例”。快手电商也针对使用外部AIGC数字人能力生成的录制直播内容严格按照“播放录制内容”规则管控。
上海财经大学数字经济系教授、数字商务研究中心主任崔丽丽表示,京东淘宝和抖音快手两方根本的逻辑区分,是前者为商品引流,后者则是内容引流。数字人天然不是内容的好载体,但它是电商商品讲解的好工具。
现阶段来看,大模型、AIGC工具,在内容理解、生成以及分发、推荐等方面的确有奇效,但想做一个完美的经营工具,一定还有很长的路要走。