《科创板日报》7月17日讯(记者 张洋洋 特约记者 陈俊清)除了人形机器人之外,建立AI社交对象也是一种将人工智能具像化的手段。
目前市面上的AI语音对话社交产品层出不穷,国产有美团的Wow、字节的猫箱、以及阅文的筑梦岛等。国外方面,ChatGPT推出了语音对话功能,亚马逊的Amazon Lex以及OpenAI和Dialogflow提供支持的UChat也都提供了语音聊天的功能。
百度近期上线了一款名为“文小言”的 AI 社交应用,使得AI社交领域又添一名新成员。
记者观察使用以上提及的AI社交软件发现,其交流主要发生在文字和声音范围,其中也不乏能够生成形象并进行沟通AI社交应用。记者就目前App Store下载量最多、评分较高的猫箱与文小言进行对比评测。两者最大的差别为,文小言的社交对象能够进行动态交流,猫箱的AI对话人物为静态。
▌文小言更逼真 猫箱走卡通动漫风
进入到两款AI社交应用的主界面,最先的直观感受为两者都十分简洁,并且相同度较高。其次,文小言的AI社交对象形象更为逼真,而猫箱社交形象偏向卡通动漫风。
文小言和猫箱都可以通过上下滑动来切换社交对象,目前,文小言仅有两款AI社交对象可以在“发现”中可以找到,一位是有问必答文小言,另一位为旅游达人丽丽。而猫箱通过滑动可以发现有数位AI社交对象可以选择,其中都是平台创作者制作出的AI社交对象。不过,猫箱的AI社交对象多数为卡懂动漫风格,并且每位AI对象都规定在特定的故事背景下或者指定领域中,并没有像文小言一样全能帮手。
此外,猫箱具备较高的AI社交角色创作能力,用户可以根据自己的喜好来DIY自己想要的AI角色。目前可以自定义的范围包括:声音、形象、场景、故事背景、人物设定。而文小言目前并不具备定制专属AI角色功能,仅能通过软件提供的两个聊天伙伴进行交流。
▌动静的不同体验
除DIY制作AI角色以外,文小言和猫箱最大区别在于对话角色的状态。记者切换多款猫箱AI社交对象发现,其人物处于静态,仅有一张关于人物的图片作为背景进行交流。另外,关于人物的表情和肢体动作只能通过文字进行描述。
反观文小言,其AI机器人在交流过程中是动态的。在没有进行沟通交流时,文小言并不处于静止状态,可以观察到头部和肩膀以及躯干的晃动,并且可以眨眼。并且十分逼真,难以辨别是AI还是真人。此外,人物的头发背景的树枝也处于晃动状态,可以感知到文小言周围的环境是有微风的。
在文小言回答问题时,这一动态表现却有了明显下滑。背景树枝树叶和文小言肩膀及以下部位均处于静止。但其嘴巴、头部、眼睛和发型仍处于动态,并且文小眼能根据输出文字形成正确的嘴形。
在视觉方面,文小言动态AI社交角色相较于猫箱AI社交角色有着截然不同的风格,猫箱更趋向于动漫风且处于静态。文小言风格更趋于逼真写实,且在环境动态和人物嘴形动态上表现较好,带给用户眼前一亮的感觉。
不过在文小言说话过程中,无论问答何种内容都处于微笑状态,没有其他表情变化,给人的感觉只有头在晃动,嘴巴在说话。给人一种肢体动作僵硬,情绪没有变化的感觉。
▌AI人物对话还都是各自大模型的“套壳”
在内容产出方面,记者就“商誉的计算”话题与有问必答文小言和猫箱上的金融一哥AI社交角色进行沟通交流。
猫箱就商誉计算进行了一段话的叙述,时常约十几秒,当记者让其详细描述时,仍然仅进行了十几秒的叙述。在内容深度上表现不佳,不过其回答语气的口吻要更加生动。
再来看文小言的表现,其对商誉计算进行了详细的解释,进行了约2分钟的发言。不过记者注意到,其内容与文心一言产出的内容在风格结构上并无明显差异。导致这一现象的原因是文小言这一产品基于文心大模型的技术打造。
在内容产出环节,相较于猫箱,文小言在回答疑问时更加详细,更加有深度。虽然其中也能输出“哎呀、哇哦”等语气词,但整体的语气变化较猫箱仍有差距。
总体而言,文小言在动态交流方面有着较好的表现,无论是背景和体态动作都给用户更加多样化的AI交流体验。此外,其交流范围和深度较猫箱表现良好。不过,在交流过程中面部表情和体态较为僵硬问题上仍需改善。由于该产品推出不久,其可供选择的AI社交对象种类仍然较少,语气和表情变化上仍有较大进步空间。
在AI驱动的社交领域,从字节、百度、美团、快手、腾讯等业界巨头,到专注于特定领域的小红书及挚文集团等企业,都基于AI对原有社交场景进行改造,或推出原生AI社交应用。
东吴证券研究报告显示,AI社交是强用户粘性、高变现潜力赛道。 其核心价值即在于通过AI虚拟角色为人类用户提供高性价比的、实时性的、1对1的陪伴,为用户提供“情绪价值”。 大模型强大的自然语言理解能力、生成式AI回复的不确定性,加上用户对聊天陪伴的需求,使得AI社交成为目前AI重要落地场景。