小红书五一期间,一款带有AI黏土滤镜的应用“Remini”在各大社交平台走红。虽说Remini尚未完全汉化,但5月8日当天依然强势霸榜App Store免费榜TOP2,应用榜单及细分摄影和录像榜单TOP1,超过抖音、快手等TOP级APP。
图源:七麦数据
Remini爆火后,随着大量网友在社交媒体的自分享,以及妙鸭相机、美图迅速跟进,社交媒体平台正被大量“黏土人”所攻占。
在抖音上,一款名为“黏土世界”的特效,5月13日冲向挑战榜TOP10。在小红书上,衍生出大量黏土特效的搜索词条。
图源:抖音、小红书
不仅如此,脑洞大开的网友以黏土特效为基础,展开大量二创。在短视频平台上,《甄嬛传》二创养活不少自媒体博主。“黏土世界”中,网友们也纷纷对《甄嬛传》中重要人物下手。
图源:小红书
黏土特效的突然爆火,除和当前AI技术的快速发展有关外,背后则是用户对美的追求愈发表现出真实化、个性化、多元化。
国内学者陈昌凤围绕智能人脸分析应用“Face++”为对象,以逆向测试的方法证实了算法推崇“瘦、白、幼”的片面审美观,而“人脸美化”算法将这种单一的审美偏好付诸自动化的美学实践。
也就是说,算法推崇的审美价值具有特定偏向,并将与人类的审美实践相互影响。技术滤镜所带来的标准美,正造成单一的审美暴力和审美疲劳。
基于此,主打健康美的椰树直播间和社会追求的“瘦弱美”构成差异,椰树直播间迅速出圈且热度不减。黏土世界里丑萌人物的真实美,和短视频、小红书、朋友圈所定义的“精致美”构成差异,短期内自然会受到大量网友追捧。
但不管是在移动互联网时代还是AI时代,图像工具类产品天然具有变现难、热度来得快去得也快、场景单一带来的用户留存差的通病。
移动APP时代,颠覆时期当时国内图像工具类超过千款,但绝大多数图像APP因处在亏损边缘,或被大厂喊停或淹没在历史的长河中。运营多年的美图,此前一直处在亏损中,2023年依靠AI大模型的火热,利润才有所改观。
图源:企业预警通
AI时代,去年爆火的妙鸭相机历经短期爆火后,逐渐归于平静。近一个月App Store的平均下载量只有3397。若考虑到从用户下载到打开到次日留存到七日留存,存在较高的用户漏斗流失,妙鸭相机近一个月由新增用户贡献的日活可想而知。这让市场也不得不担心,“Remini”们还能火多久。
图源:七麦数据
一、图像生成质量不稳定,或将带来用户高流失
黏土特效真实感的背后,却是当前生成质量的整体不稳定。
我们选取百度上的一张网图,使用妙鸭相机的黏土AI特效生成后发现,原图中女性原本光滑的皮肤被增加不少斑点,笑容显得不自然,失去原图中女性的神韵。整个生成后的图片缺少原图中男女双方互相爱慕之意,给人一种僵硬的感觉。
图源:百度原图(左)、妙鸭相机(右)
在小红书上,根据不少网友分享使用黏土特性生成后的照片来看,部分生成后的照片仅是单纯抓取原图中人物的五官,对人物神韵抓取欠佳,这让部分生成的图片几乎和美毫无关系,甚至能用惊悚来形容,颇有为了AI而AI,为了生成而生成的感觉。
图源:小红书
不仅仅是AI黏土特效,文生图、图生图、文生视频、图生视频作为当前国内外厂商布局最多的场景之一。在ChatGPT官网上,关于图片生成的大模型数量超过上百款。但我们在实测后却发现,整个大模型生产质量仍有很大改善空间。
图源:ChatGPT官网
如ChatGPT官方的Stable Diffusion XL,宣传是一款深度学习模型,具有高分辨率支持、改进的图像质量、多样化的应用、用户友好的接口、可定制化等优点。但当我们让Stable Diffusion XL帮我们生成一张“中国传统神话故事中四大神兽”的图片时,图片虽有高分辨率,但图片中却看不到四大神兽的身影,有种答非所问的感觉。
图源:由Stable Diffusion XL生成
第二次生成的图片,直接变成朋友圈中常见的九宫格照片。且九个细分头像中,虽能看到神话故事中龙的头像,但看不到朱雀、玄武、白虎的照片,且九个头像的表情完全一致。
图源:由Stable Diffusion XL生成
不仅仅是Stable Diffusion XL,月活用户超过11万的Photo CreateE大模型表现同样欠佳。但我们让Photo CreateE帮我们生产一张中国传统故事中青龙的照片时,给到的结果却是《山海经》中唯一有翅膀的应龙,又称之为翼龙,且整个翅膀更像是蝙蝠的翅膀。
图源:基于Photo CreateE生成
如果说海外大模型表现得欠佳,和其他背后的厂商对中国传统故事理解欠佳有关,但国产大模型的表现同样不容乐观。
我们分别让讯飞星火和文心一言给我们生成中国传统故事四大神兽的图片时,讯飞星火给出的四大神兽和神话故事中四大神兽形象不符。且四大神兽基于地位特殊,在国人心中有着威严的形象,并非讯飞星火给到的漫画风。
图源:基于讯飞星火生产
相较于讯飞星火,文心一言给到的图像结果,几乎和四大神兽形象完全不沾边。不知国内传统神话爱好者,看到这些会作何感想。
图源:基于文心一言生成
不可否认的是,自2023年大模型爆火至今,随着技术的快速迭代,AI在图像方面的表现迎来快速提升。如不少大模型可做到快速生图、快速消除,不少基于AI换脸的APP和小程序场景也愈发丰富,甚至AI大模型取代专业设计师的声音愈发高涨。
但AI大模型并不是简单地从几亿张或几十亿张照片中学习其背后的绘画风格、人物和场景速写。不同照片背后所传递出的情感因素、文化因素等等均需要长期摸索学习,否则很容易会产生用户高流失问题,更别提后续的商业化变现。
因此,在AI大模型最通用的生图方面,国内外厂商仍有很长的路要走。
二、高额收费,黏土特效热度正在退散
不稳定生成质量的背后,却是AI黏土特效的高收费。Remini用户使用的首周可免费每天修改5张图片,之后每周按照68元收费。若用户忘记取消订阅,一年会员高达3500多元。这个费用足够用户同时购买WPS、爱奇艺、网易云、美图几家的年度会员,不少用户也纷纷吐槽Remini收费太贵。
和Remini用户还可免费体验不同的是,妙鸭相机从用户首次开始使用就需要付费。
用户在将妙鸭相机生成的图片导出后,需要支付对应的钻石。用户虽可通过分享获得免费钻石,但考虑到部分用户不愿意分享以及分享后的钻石很快会被使用完,意味着用户只能付费才能体验妙鸭相机黏土特效的全部功能。
这种运营策略和国内消费者被互联网培育的先免费后付费的习惯构成较大差异,不仅会让APP产生较大的用户流失,且用户分享意愿较低,也不利于APP前期的传播和用户裂变。
图源:妙鸭相机APP
基于此,目前黏土特效热度正逐渐退潮。5月11日后,Remini在App Store总榜、免费榜、细分榜的排名直线下滑。5月14日时,更是跌入总榜百名开外。
图源:七麦数据
更深层来看,黏土特效热度退潮偶然中有些必然。相较于文生文、文生代码、行业垂直大模型,图像的高频使用,决定其有着广泛的TOC端基础,国内手机厂商们一直围绕影像开卷的原因也在此。
且以抖音为代表的短视频平台有着大量的AI特效、AI小程序,用户在日常接触和使用这些AI图生图、图生视频后,无形中也提高整个渗透率。这也不能解释2023年大模型火热下,图像类的美团会率先成为受益较早的厂商之一。
图源:各大企业财报
另从人性角度来看,当一款具有差异化的AI生图类大模型推出市场后,差异化满足人性中对个性、与众不同的需求,爆火后社交媒体上的高点赞、高回复,让人性中的价值感得到片刻满足。
再或是不少网友素来有跟风、爱凑热闹的习惯,均会让一款AI生图类大模型短时间内迎来火爆。
基于此,国内外市场从不缺现象级AI生图类大模型。在海外市场,Clipdrop被型Stable Difusion的母公司stability Al收购后,通过提升性能,当年7月份流量迎来暴涨。
图源:国海证券
人性成就爆款AI生图类大模型的同时,也很容易会将这些将其打入谷底。
一方面,AI特效对大量TOC端用户来说,娱乐属性高于刚需属性。且同时娱乐属性,AI特效又不像优爱腾、网易云和腾讯音乐这些APP,可依靠优质内容实现用户高留存。
另一方面,初次使用带来的新鲜感退潮后,“喜新厌旧”推动下,用户很快对其失去兴趣。某类特效爆火后,伴随着同行的大量跟随以及短视频平台上大量的同款图片,用户无法满足个性化的同时,也带来短期的审美疲劳,很多用户自然也就放弃使用。
换言之,AI生图类大模型既要持续给用户带来新鲜感,进而刺激用户分享欲才能形成用户高留存和后续付费,又要保证自身AI特效做到无法复制化。“既要”“也要”之间,AI生图类大模型运营难度可想而知。
三、AI生图最容易变现,也最难长久变现
上述问题的存在,也不能解释妙鸭相机和Remini会如此着急向用户收费,以及互联网大厂们推出的大模型会选择将生图功能作为其中的一个场景的原因。
从后续来看,AI生图大模型如何进行长期变现,也面临着不少阻力。从TOC端来看,会员订阅模式是面向TOC端大模型的变现模式之一。
但当某款APP真正爆火后,电商平台上从来不缺低价会员。如某宝上售卖的美团秀秀会员,7天SVIP粉钻PC版、30天SVIP粉钻PC版售价分别为2.58元和6.58元,这对用户构成极大的吸引力。
厂商们想要打击这些低价会员卖家并非易事,毕竟国内移动互联网APP发展多年,低价会员早已形成完整的产业链。即使妙鸭相机不采用会员模式,也难逃市场上出现破解版的存在,这均对厂商借助会员带动营收增长构成强分流。
另对标移动互联网来看,互联网本质上做的就是切割用户时长+DAU的生意。以高DAU为基础衍生出广告业务,以及和主场景相契合的其他业务,进而通过交叉销售的方式实现单个用户价值的最大化。
但在美图的高渗透以及AI特效场景单一,用户难以留存下,如何突破百万日活就是难题,更别提后续还要满足广告客户对广告位、效果的各种高要求。
在TOB端,文生图想要拿下更多TOB端客户,必须满足企业对营销素材生成的需求。和TOC端简单输入标题要求大模型生成图片不同的是,企业端对VI视觉规范有着严格要求,进而保证品牌对外形象的统一。且品牌方部分产品若牵扯到明星代言,双方合同约束下,对VI视觉规范要求更高。
或许多模态大模型能够理解企业VI视觉规范,但即使大模型真正具备该能力,开发者到底要通过何种能力和不同企业的运作环境结合,以及设计规范以何种形式保存。
是应该通过设计规范文档来制约模型输出,还以经过验证的历史产出物作为“训练”素材?即便做到了这一点,我们还要确定用户在使用AI能力创作时能够对规范进行调整突破的程度。
且企业端使用大模型的成本和使用专门设计师相比,哪个成本最优,效率最高,也是企业主们均会思考的问题。大模型厂商在为不同TOB端企业定制服务时,又面临着如何解决成本、收益、账期等问题。换言之,文生图在TOB端大模型的落地仍需大模型厂商们持续探索。
大模型图生文作为用户基础较广、使用频率较高、渗透相对较高的场景之一,商业化也面临着不小的难度。更别提其他场景下对大模型的能力以及合作要求更高。大模型商业化的持续推进过程中,又有多少厂商会被淘汰呢?