欢迎光临
我们一直在努力

“每天只睡5小时”,大模型在火热落地中

aigc阅读(2)

中工互联董事长智振,最近经常奔波于前往各地的高铁上,见客户、签订战略合作、推进大模型落地,“比起一个月前更忙了”。

3月中旬,智振曾向数智前线分享自己的工作状态——“一天就睡5小时,光战略合作都忙不过来。今年的目标是面向能源等工业领域,落地至少几百、上千个大模型项目。”

而这种忙碌状态同样存在于数智前线接触的多位行业大模型落地服务商中。业界观察,行业大模型,正在以一种意想不到的速度,加紧落地。

水面之上,或许仍旧平静无波,但水面之下,早已激流暗涌。“现在大家还在水面下,下半年应该都会浮上来一些。”在金融行业做大模型落地的宽客进化CTO王舸说。

一、“每周以10个项目的数量增长”

被业界视作“大模型落地元年”的2024年,刚过去4个月,已经涌现出火热氛围。

“去年,主要是试的人和看的人比较多,愿意付费的人很少。”云问科技联合创始人茆传羽告诉数智前线,但今年,付费人群明显多了起来。

一位行业人士观察,以2024年春节开工后第一天,国资委召开“中央企业人工智能专题推进会”为风向标,大量央国企开始大面积寻找合适的业务场景,市场氛围被迅速带动,大模型服务商们接洽的项目也在快速增长。

“客户现在热情似火。”AI智能化服务企业众数信科创始人兼CEO吴炳坤说,去年,都是他们主动去找客户,但今年元旦过后,已基本变成“被动接洽需求”。2024年一季度尚未结束,这家公司处在PoC、走合同、实施交付等不同环节的需求数已有上百个,远高于去年10余家的量级,且每周在以10个的数量新增,“我们不得不开始筛选”。

宽客进化CTO王舸则透露,去年他们在大模型上几乎没有落地项目,但今年,他们已经签约好几个百万级的合同,涉及金融、电力、运营商等多个行业。其中,一些相对浅层次的需求,如大模型与传统标准作业流程的结合,目前落地相对良好,但一些更深层次的需求,如专家经验与大模型结合,还处于初级阶段,“这块的项目现在正在研发阶段,下半年可能会有一些落地案例出来。”

“围绕市场热点,主动找来的客户也有不少。”王舸进一步说,比如个性化写作场景,又如一些企业提出,是否能将数据要素和大模型这两个今年最为火热的概念结合起来。“比如数据入表,数据分级、分类,数据怎么溯源,以及数据需求方在交易所进行数据交易时,怎么在成千上万的数据产品中自动匹配需要的数据,这些都是大家在构想和探索是否能用上大模型的方向。”

“大模型的加持,对现在大热的‘数据要素×’三年规划来说,是一个巨大的催化剂,能让很多客户很快地感受到数据带来的价值。”浪潮云总经理颜亮说。

一些聚焦在更为垂直领域的大模型落地服务商,也明确感知到了变化。

云蝠智能创始人魏佳星告诉数智前线,他们主攻的基于大模型的智能客服业务线,今年比去年同期增长了30%的订单。而且今年的增长要比去年更加稳定。“去年3月,受大模型热度刺激,我们取得了不错的增速,但很快又在4月回落,但今年4月,不仅维持住了3月的增势,还继续保持了增长。”

高新兴机器人首席技术官刘彪则透露,机器人已成为大模型最快落地的领域之一。今年底左右,他们结合大模型的机器人产品将可能全面商业化。目前,在工业领域,高新兴巡检机器人在解决“跑冒滴漏”的难题,处于试用阶段;在物业等场景的烟火检测已商用落地。

而一些服务商,已经考虑规范化复制的问题。中工互联董事长智振透露,今年开始,他们将过去一年探索出的能做的方向全都产品化了,“一旦产品化,推广复制就会很快”。

吴炳坤也告诉数智前线,由于产品化,他们一些客户的交付落地时间,已经从过去的三个月,缩短到半个月。而今年,这家公司的目标,也不再是要拿下多少个客户,而是锁定两大行业、6个细分子行业,做15个标品化的产品出来。

“今年的大模型应用肯定会爆发,这个速度会比想象的要快得多。”智振说。

不过也有资深人士用“方兴未艾”来形容大模型目前的落地势头。“今年我们看到很多头部企业都动了起来,但大多都还是一些单点的应用或几个场景的组合。”一些人士表示,大家都在等待C端和B端的杀手级应用出现。

浪潮云CEO颜亮认为,从单点到全流程植入才能带来质的变化,可能需要1~2年,其中关键是大模型要经过周期性迭代,才能达到可用。“最多两年时间。竞争会促成大家的互相学习和投入,我们感知到,2024年用户在大模型上的投入,是2023在3~4倍以上。”

二、“在定价上遇到了‘挫折’”

春节过后,百度智能云渠道生态部总经理陈之若他们发现一个现象,一些大模型服务商,在帮客户做完PoC后,在定价上遇到了挫折。

“服务商起初自己也没有概念,打个比方假设以前产品卖两万块钱,加了大模型后定价三万五,服务商觉得是比较合理的,因为我给你降本增效了,但客户反馈‘效果不错但贵’。”于是,大家开始掰扯定价、交付和服务的事情。

这对于服务商来说,既是挑战,也是一个积极信号,因为大模型开始迈出商业化的第一步了。

定价背后,也有关于ROI(投资回报率)的考量。

“客户对于最终的产出物其核心关注的点就是ROI。”曹玺说。但大模型销售的更多的是服务,看不见摸不着,客户不容易算出ROI。

“这就需要服务商去帮客户把ROI明确出来。”软通动力罗晟告诉数智前线。比如,给企业售后场景赋能。原来一个售后人员即使经过好几天的培训,想要精准找到每个产品的售后问题,也要花十几分钟。但现在有了大模型助手,可以秒级辅助他们找到问题。这对于客户来说,就是一个ROI比较高突出的场景。

而曹玺介绍,当下ROI的测算需要拿效果说话有时甚至是较为直观的计算。比如,工作效率的具体提升,获新客户与客户转化的量化、购买数字人的成本比对。

几位行业人士谈到了大模型替代员工的敏感问题。“我们并不是说,大模型能减掉他们多少人,而是减少员工一些程序性的事物,提高效率,去做更有价值的事。或者可以有更多资源做新业务。”一位大模型服务商观察,他们遇到一家医院科室主任抱怨,自己手下那么多博士,整天在办公室写病历,根本接触不到患者。他们就想解决这个问题。

三、大模型场景落地要“短平快”

场景的选择,同样考验服务商的能力。吴炳坤告诉数智前线,过去一年间,行业内不乏“叫好不叫座”的情况。“大家的场景需求很多,但都是在做PoC,真正要让客户愿意付钱,还有蛮大的门槛要迈过去。”

智振则总结,“一年能回本,客户很容易接受;三五年回本,客户就要考虑考虑;7年回本,肯定得政策强制要求了。”这要求他们必须首先找到投资回报高的点来做。

为此,不少服务商都会选择小点切入的策略,快速形成闭环来看效果

比如新致软件,最开始实际是以咨询师的身份,切入到膳魔师项目中,并在多轮沟通和探讨中,发现了老板在了解公司运营情况时耗时过长的痛点。通过在工作群中引入数字人,收集对话素材,并进行模型微调后,实现对管理层需求的快速响应。

“原来一个数据报表的诉求,大概需要2~3周,现在可以缩短到一天。”曹玺告诉数智前线,这大大提升了管理层的决策效率。而在内部跑通几个场景后,新致软件又帮膳魔师进一步打通了外部场景,落地了to c的7×24小时的AI助理。

我们现在所有项目都是按‘短平快’的方式去做实施。我们会帮客户把一个大的需求,切到一个个比较小的点,逐点试错,逐点突破,而不是像以前做软件一样,一个项目做上半年一年,客户才能看到效果。”曹玺告诉数智前线,这样既保证客户能快速看到效果,也能根据客户反馈,更快发现问题,“少走弯路”。

“你要知道客户到底在做一门怎么样的生意,他最想达到的是流量盘活、转化率还是更精准的获客?你要不断的去了解客户业务诉求,同时要不断去做复盘和打磨。”曹玺说。

众数信科也在场景选择上提出了“小切口、大纵深”的策略。而为了避免大模型前期落地效果与客户预期之间因偏差而导致客户中途放弃的情况,有经验的大模型服务商,在锁定某个场景后,还会主动降低客户的心理预期。

中工互联智振也告诉数智前线,大家现在的想法都是优先把一个点打透,然后再基于这些成功的经验,做全链条的整合。“现在已经有客户与我们做了两年的规划,一点一点来做。”智振说。

技术和服务的延续性也被重点强调。“我经常被问到,大模型技术发展那么快,我们之前的选择的大模型会不会过时?为它做的定制、数据标注会不会失效?”百度智能云AI与大数据总经理忻舟说。

吴炳坤也告诉数智前线,大模型迭代太快了,但企业内部又基本没有专门的AI人才。这就要求服务商要形成一种新的思维——大模型时代的项目不再是交钥匙工程,而是需要提供教练式的陪跑服务,“陪着客户不断优化它自有的模型”。

四、大模型落地成本在下降

企业一旦在某个场景验证模型的价值后,第二步关心的就是如何降低成本。

“现在最常见的成本区间,主要有两级。”宽客进化CTO王舸告诉数智前线,一些简单应用,比如个性化写作、在传统BPM流程中串接大模型能力等,一般可以直接调用API,成本较低,二三十万元即可实现落地。另一极则是一些需要与专家经验深度绑定的项目,会有私有化部署要求,成本普遍在百万元起,甚至四五百万

“二三十万元的市场,今年会非常卷,而跟业务深度绑定的市场,是大家想做,但目前做起来还比较困难的市场。”王舸说,尤其是需要私有化的项目,算力会是一个比较大的困难。

实际上,为了解决算力难和成本过高的问题,业界目前已经探索了一些方法。比如,企业除了使用纯私有化的模式,也可以选择“公有云的私有化”模式,即在公有云上开一个私有化的环境,达到节省成本的目的。

“目前,像银行等有着严格数据不出域要求的金融企业,基本都还是采用前一种私有化,而在零售、酒店和文旅等数据管控没那么严格的行业,则有不少企业倾向于选用后一种模式。”新致软件曹玺告诉数智前线。

算力不足的情况下,通过CPU进行推理,也被不少人视为一个可选方案。“7B以下的模型,一般的推理场景,CPU目前是能够满足的。模型再大一点,30B~70B,速度会明显变慢,但一些不需要实时交互的场景,CPU也是一个比较好的解决方案。”王舸说。

更重要的是,模型轻量化的趋势,以及MoE概念的火热,也降低了企业客户对算力资源的诉求。

可以看到,通用大模型参数虽然已从上千亿走到万亿级,但具体到行业落地上,却不是参数规模越大越好。在海外,Meta发布的Llama系列模型,从70亿、130亿、330亿到700亿不等。在国内,百度、阿里、百川等都发布轻量级大模型。

“很多场景其实并不需要全知全能的能力,而是需要一个行业专家来解决一些专业的问题。”吴炳坤说。根据他的经验,在很多垂类场景中,通过剪枝蒸馏等手段,压缩出一个百亿级的基础模型,最大程度保留行业通识和能力,再结合企业的私有数据,也能实现千亿级的效果,推理成本更低,使用也更简单,是目前企业欢迎的做法。

“在行业中,我们认为7B-70B性价比最佳。”浪潮云CEO颜亮透露。

吴炳坤告诉数智前线,通过模型轻量化,他们已将包含算力、模型、应用等在内的落地成本做到几十万到小一两百万元的成本这也是不少中腰部企业普遍能接受的价格区间。智振则透露,现在做大模型私有化部署,成本已降到百万元起,一些小的嵌入式产品,比如1.6B参数、能放到一台单机上的模型,甚至可以做到5万元起

一些企业探索MoE(混合专家系统),以实现用更合适的性价比。MoE的全称是Mixture of Experts,被认为十分符合人类社会的分工概念,它通过“专家+路由”的机制,将不同问题交给对应领域的专家来解决,理论上能在算力成本不增加的前提下,显著提升Transformer模型的性能。

去年年中,GPT-4曾一度被传由8或16个MoE构成,这一概念随之在业内引起关注。几天前,腾讯混元宣布完成架构升级到MoE。

智振告诉数智前线,大模型会和第二次工业革命中兴起的电器一样,“最终并非一个电器通用,而是会涌现出各种各样的电器,从灯泡到电饭煲,它只会取决于不同场景下怎么样的性价比最高,怎么样的功能最强,客户接受度最高。”

李彦宏则在此前的一场演讲中指出,未来大型的AI原生应用基本都是 MoE 架构。

值得关注的是,多位业内人士告诉数智前线,MoE目前仍处于发展早期,还存在不少挑战。一些人士认为,它的技术复杂性太高,投入产出比不太匹配。也有人士表示,MoE需要资源较多,在响应速度和算力占用方面还有较大提升空间。

过去半年,大模型的技术进步速度极快,也推动行业落地的大潮在快速演进。

AI Agent推荐,把一群助理拉到聊天框里过一把领导瘾

aigc阅读(2)

近期,一条消息突然闯入眼帘,钉钉上线了钉钉AI Store。

带着好奇心打开许久未开的钉钉,在应用中心,多了一个tab“找AI助理”。

做为已经使用了一年多GPT+NewBing的用户,内心是有点瞧不上这次更新;

这不就是模仿GPTs,所做的AI Agent而已。

在实际使用过,才发现是自己EGO过大了,这次更新真的没有想象中那么简单,下面我将从几个实际的体验结果,带你了解钉钉AI助理真的没有我们想得那么简单…

一、初体验钉钉AI助理

首先, 只要更新到最新的钉钉,无论是移动端或是电脑桌面端,都可以从原本的应用中心下,找到“AI助理”,快速浏览200个左右现成的AI助理,且涵盖了多个领域,仿佛让每个打工人都不花钱地拥有了一批工作助理,随时待命。

在这里还提供了试用AI助理的功能,你可以先从侧边对话框中,尝试让AI助理完成你所交代的任务,如同面试、或试用期般,可以先尝试与AI助理协作看看顺不顺手,喜欢的话,在点击右上角的添加,把AI助理添加到日常工作的聊天列表里,随时可以从聊天继续呼唤AI助理协作,完成工作任务。

这段用户体验,真的让人仿佛获得到一位线上助理,如同平时在公司工作中在钉钉交代任务给实习生、助理帮忙协作的感觉,除了无法见面沟通外,真的就是多了一位工作上的小帮手,降低许多原本需要花许多精力的事情;

虽然市面上的AI Agent也不少,但能像钉钉AI助理这般,直接融入日常工作协作的工具中,形成工作流程闭环的产品,目前钉钉AI助理算是独一档的存在;拉了一排AI助理到聊天列表上,真的有种当上一个不小团队领导的幻觉,哈哈哈。

当然,也是有一些钉钉上的AI助理会有出现Bug的情况,发了好几次链接,就是无法顺利完成脑图的整理,过了几天才恢复了正常…

二、推荐几个好玩、靠谱的钉钉AI助理

1. 脑图专家

虽然刚刚吐槽了他刚上线时出bug,根本work不了,但过了几天后,我突然一试,可以正常生成脑图了,真的是非常方便,只要把想要整理、或粗略了解的文章,直接丢给他,但就帮你整理成一个个有结构化的脑图,帮你省去不少阅读、整理、理解的时间,尤其在工作上有很多资料需要消化的时候,快速阅读整理后的脑图,了解内容的大框架与脉络,便能快速地过滤、消化材料,真的不赖~

2. 小筑设计助手

虽然这个小筑需要支付额外的订阅费,但初次使用时,可以免费试用16天,在使用上整体效果还是令人惊艳的,只要随手画几张草图丢给TA,TA就能帮你渲染出一张张完整的建筑设计效果图,如是建筑相关行业、或设计师,这个AI助理能快速帮你省去不少精力,帮你做出完美的建筑效果图或建筑背景…

3. 行业知识树

行业知识树,这个AI助理跟上面的脑图专家AI助理有异曲同工之妙,但核心不同的是,TA只要你大方地将想要了解的行业告诉TA,TA就会自动搜集、整理出该行业底下的100个关键词与对应的解释,借鉴了麦肯锡的100个关键词快速了解一个行业的理论,真的是调研、学习的好帮手;

脑图专家是扫描仪,帮我们快速过滤内容的可读性、与结构化整理;行业知识树是精华行业百科,随手一翻就能快速入门任一行业的基础知识。

4. MoLook创意生成

这个AI助理就不得了,可以当你的服饰模特外,还是非常厉害的服装设计师,可以快速通过你给的关键词或描述,生成对应的服饰结果,还可以生成逼真的模特试穿效果图,大大降低请模特拍摄的成本,非常适合中小型电商、或个体户商家使用。

5. 薪酬分析助理

虽然薪酬分析助理跟其他AI助理稍微有些不一样,TA基本上不算是完整的AI助理,不像其他的AI助理可以直接在聊天框里就反馈你交代的任务,但TA仍然提供了一些简单的指导、说明,带领我们打开智能薪酬分析的钉钉应用上去使用;

虽然TA的智能程度不如其他AI助理,但TA仍有非常强大的薪酬分析能力,也值得我们借鉴,现在我们不止可以通过KOL、效果广告去帮我们的品牌、产品做宣传,也可以学习这个TA,制作一些吸引人使用的AI助理,让AI助理帮忙我们的品牌、产品导流,相信这未来也会是越来越多公司会不愿错过的流口入口之一…

6. 打工搭子

相信打工人总会有上班上得莫名其妙厌烦的时候,不管忙或不忙,就死活不想干活,却又要装得在干活,这个AI助理就很适合这个Moment使用,提供了几个不一样好玩的文字对话游戏,让你假装在跟协作方、客户讨论沟通,其实是在给自己的情绪做个心灵SPA,是短暂舒压的好助理。

三、体验总结

1. 开放才能共赢

开放共赢,我个人感觉就是刻入阿里巴巴的DNA,做为国内最大的企业沟通协作工具钉钉,不仅开放了第三方应用接入,AI时代的当下,还开放了AI助理,让各路好手能到这里制作出不同有趣、好用的AI助理给打工人排忧解闷,同时也给第三方带来流量或收入,让钉钉生态中的协作方皆能从中获得到各自所需的,形成生态中的良性循环:吸引更多用户使用,让更多协作方获利,进一步吸引更多协作方入驻,提供更多好用的AI助理,再进一步吸引跟更多用户使用…

2. 好的AI Agent体验,是被主动反馈

虽然现在AI Agent的产品很多,也有很多功能很强大的AI工具可以使用,但无一例外的,就是你得在浏览器上开各式各样的网页来与TA们保持联系,一不小心就点击到关闭网页,得重新找到网址打开TA们…仿佛你得求着这些AI助理帮你做事,且得在各种花里胡哨的对话框中传达任务指令;

现在你不用再辛苦到处收集AI助理的网址,只需一键就添加到钉钉的聊天列表里,随时一句指令,就会在聊天列表开始工作,并把任务成果回传给你,与平时领导交代你任务,你处理完回传给领导一样,让打工人也过过当领导的瘾,只动动口就能有AI助理帮你完成任务,多么好的体验。

3. Agent与工具,要聚在一起,才会有综效

综效(Synergy)就是我们管理学上常说的1+1>2的理论名词,现在的AI虽然对用户需求的理解已经很高,但对任务的处理逻辑能力、运算能力还不是特别足够;而工具应用是已经有很成熟、很强大的功能可以处理任务,但却无法很好地与用户沟通,让用户轻易地上手。

但在钉钉内部,就实现了AI助理与工具在统一生态中,你可以通过AI助理的协助,帮你轻松地上手使用工具,处理掉工作中难度较高的任务,也可以直接让AI助理帮你解决掉工作中琐碎但简单的任务,两者同时帮助你所产生的综效,就远远大于两者独立分开来支持的情况。

4. 钉钉或成为国内最大的AI Agent平台

虽然微信也是个通讯工具,也很适合让LLM AI接入,做成AI助理的聚合平台,但微信与钉钉上的通讯不是同一个通讯,微信是熟人之间的聊天,是情感上的交流与分享;钉钉是工作之间的沟通,是理性上的任务推荐、解决问题,而AI助理虽然已有很强大的语言能力,毕竟无法与用户深度地情感交流,仅适合任务之间的沟通、协作…

钉钉足够开放的生态个性,与天生契合AI助理对话狱警的通讯产品属性,就变成AI助理肥沃的生长土壤,未来或可能成为国内最大的AI平台,也不无其可能性。

力压Kimi,“新生代”秘塔AI搜索来势汹汹

aigc阅读(4)

一、革搜索引擎的“命”

比kimi更火的AI产品来了。

今年3月,据SimilarWeb数据,“新生代”秘塔AI搜索网站日均访问量达到 20万次以上,月增速达551.35%,大超kimi的321.55%。

刚跻身前三的秘塔AI搜索,热度与访问量还在持续攀升。

秘塔AI搜索由秘塔科技2024年初推出,被业界称之为“中国版的Perplexity”。

秘塔科技创立于2018 月4月,核心团队主要有CEO闵可锐、技术专家唐悦和首席运营官王益为等三人。

闵可锐曾是猎豹移动首席科学家,也是玻森数据CTO&联合创始人。唐悦曾获全国青少年信息学奥林匹克总决赛(NOI 2023)银牌。

王益为不仅拥有10年红圈律所工作经验,还是B站坐拥58万粉丝的著名法律up主“王一快”。

借助流量优势,王益为带领运营团队,在B站、微博、公众号等多平台为秘塔系列产品进行内容投放和转化。

秘塔自研的大语言模型 MetaLL,已通过了《生成式大模型备案》(第二批)和《大模型算法备案》(第二批)。

从垂直的法律 AI 办公工具赛道出发,MetaLLM逐渐扩展到翻译、写作、搜索等泛知识领域。秘塔科技也在2021年5月获得 Pre-A 轮融资,融资金额达数千万元人民币。

与传统搜索相比,AI搜索更加高效简洁。

传统搜索软件,结果返回的是多个网页内容,中间还参杂广告。用户需反复点击进入多个网页分析后,才能获取想要的信息。

而通过在数据库中检索与用户问题有关的内容,AI搜索经总结后输入大模型,并由大模型输出直接答案,且该答案可索引。

秘塔AI搜索增长迅猛,与它提供的搜索新体验密不可分。

在使用上,根据回答详细程度不同,秘塔AI搜索分为简洁、深入和研究三个选项,并有“全网”和“学术”两种模式可切换。

AI回答右侧附有大纲,下方则附有相关事件、组织和人物,并标明来源。

二、AI搜索亟需商业化

在全球市场,AI搜索同样来势汹汹。

2024年3月,根据非凡产研统计的全球AI产品数据访问量,个人聊天与助手类排名第一,占比为44.25%。紧随其后的就是AI搜索,访问量占比为24.21%。

国外AI搜索引擎玩家,不只有类似秘塔这样的初创团队,微软等大厂的身影也显现其中。

但摆在所有AI搜索引擎面前的,除了技术和搜索体验的突破外,还有一大共同难题——如何实现商业化。

传统搜索引擎在用户流量大幅增长之后,并不会即刻引发公司成本大幅增长。只有用户数量到达一定规模之后,企业才会添加服务器。

但由于每一次使用AI搜索引擎,都要调用大模型API,还有算力成本。因此,用户量与AI 搜索公司成本与呈强相关。

号称“没有广告,直达结果”的秘塔同样如此。长期免费或者不考虑商业变现,几乎不可能。

三、卖广告的宿命

秘塔AI搜索用户量急速上升,未来商业化如何落地,是秘塔的重要课题。

同样是AI搜索领域的初创企业,“领头羊”Perplexity的探索路径,或许对秘塔有重要参照意义。

Perplexity成立于2022年8月,由前OpenAI研究科学家Aravlinind Srinivas联合几位合伙人共同创办。

自问世以来,Perplexity访问人数一直保持稳定增长。同样在今年3月,Perplexity的月访问量达到了6414万人次,是秘塔9倍。

创立一年半,Perplexity的估值已是半个独角兽。今年1月,Perplexity完成7360万美元的B轮融资,投后估值达5.2亿美元。

Perplexity最为出圈的一次曝光,要感谢英伟达CEO黄仁勋。

当有媒体问黄仁勋“多久使用一次ChatGPT或者Bar”时,黄仁勋答到:“我一般用Perplexity,且几乎每天都在用”。

黄仁勋每天用的,应该是Perplexity的Pro专业付费版。

该类用户单日可使用超过300次,且可无限制上传文件。目前付费版月费定价与ChatGPT Plus相同,为20美元/月。

Perplexity的收入,目前主要来自付费订阅,去年已突破1000万美元。

据AI业内人士透露,这些收入,绝大多数来自B端。主要是企业购买账号给员工使用,C端付费非常少。

这种营收结构,在大模型公司以及大模型衍生产品中十分常见。

甚至可以说,凡是已跑通商业模式、形成稳定收入的AI公司,客户基本都依赖B端。

就连Open AI这种巨型用户量级的大模型,同样呈现出企业级用户付费意愿更强的态势。

这或许因为,企业用户在大模型时代,既积极,也焦虑。他们担心,如果不率先在同行中使用大模型降本增效,就会落后于人。

“没有广告,直达结果”的口号,直击时下搜索引擎的痛点。AI搜索,能一直保持“纯净”吗?

值得注意的是,靠B端商业化渐成稳态,Perplexity近期在对广告的态度上也有所改变。

和秘塔一样,Perplexity目前也没有广告。但据某一位Perplexity管理层表示,Perplexity并不排斥广告。

他透露,AI能够提升广告触达目标用户的效率,这一新功能有望未来几个季度推出。

在Perplexity官网,搜索结果中呈现相关(Related)问题,将成为首先对品牌开放的广告位。

也就是说,未来当用户询问时,在回答下方位置,Perplexity将在延展性问题中,植入品牌相关的内容。如用户进一步追问,Perplexity将继续显示广告链接。

这种模式,十分类似谷歌和百度这类传统搜索引擎的竞价排名。

之所以躬身卖广告位,核心原因还是成本和盈利压力。

创始人兼首席执行官Aravind Srinivas 提到,Perplexity尚未盈利。

API成本和搜索算力,都不是小钱。20 美元一个月的订阅价,难以支撑长期运营,更无法撼动商业模型成熟完善的搜索引擎巨头。

这令不少AI从业者感慨,AI再高大上、再喊无广告口号,也逃不脱卖广告的宿命。

市场亦有传闻称,为给下一代AI手机准备,苹果将接入Google的Genimini,还打算收购Perplexity。报价据悉将超过10亿美元。

除了卖广告和“卖身”,AI搜索是否还能有更多商业化新路径?

这有待秘塔及其他同行给出答案。

AI Agent,普通人也能抓住的AI技术的第一波红利

aigc阅读(3)

前段时间,人人都是产品经理视频号上做了一场有关于AI Agent的直播分享。在直播间里,张佳老师提到了如何抓住AI时代的第一波红利。个人感触还是比较大的,所以把直播分享的信息与个人的真实体验做了一些融合,供大家阅读。

一、你的能力和经验

一个趋势,所有大模型厂商都在布局智能体,比如钉钉这款覆盖面巨大的软件,就推出了由通义千问承担底座的钉钉AI助理,并在4月18号正式上线了AI助理市场(AI Agent Store)。企业、个⼈⽤户、开发者开发的AI助理都可通过上架市场,分享给更多⼈。其他厂商也在跟进智能体这件事,比如百度旗下的“灵境”、讯飞星火旗下的“星火助手”等等。

恰好,这两天看了钉钉举办的AI助理创造大赛,里面不仅有航空公司、芯片公司这类的专业选手,也有很多养猪、公安的比较有话题性的Agent打造者,也不乏DIY赛博财神、考研考公的素人选手。挺有意思,值得关注的是这些人、这些公司真的在用AI做事了。

我们先看看,为什么几乎所有大模型厂商都在布局智能体?我们先从大模型的日常使用说起。

在大模型的日常使用中,不少人可能都有类似感受,即大模型的输出总是不太靠谱,甚至到了现在,AI幻觉这一问题依旧不能被消除。即使我们在不断地做提示词优化,类似的问题依旧在不断发生。

所以,提示词工程解决不了普通人用AI的问题,在大模型主要以对话式窗口作为呈现样式的当下,用户需要一个专门的“窗口”来解决问题,即不需要通过提示文字或者修改提示词,用户打开对话框,调起相应的窗口(比如智能体,比如Agent等)即可直接解决问题。卖提示词和提供提示词优化解决方案是错误的方向,我们应该开发专门的工具来满足用户需求。

而“窗口”就是智能体,即AI Agent。

2010年左右是移动互联网时代,时间快进到2015年以后,短视频平台疯狂涌现;在这些时间段里,我们可以抓住的红利并不是直接开发或搭建相应的手机系统或者短视频平台。当下也一样,AI时代的红利并非搭建大模型,而是在大模型生态中搭建一个应用。Agent就是这样的一个个应用,我们可以基于需求去调教机器人,通过反复的调试优化,让最终的解决过程实现标准化

  1. 提示词标准化;
  2. 工作流标准化。

同时这个标准化流程,或者说这个智能体是可以同步给他人使用的,其他人亦可以在智能体里得到答案。这意味着,这套思考问题、解决问题的方法和工作流将可以被复制和变卖,人的能力可以被转化为服务和赚钱的机会。

尤其在AI时代,用户在使用Agent的过程中可能存在信息差,但这类信息差已经可以被大模型弥补。

二、唯场景和想象力

为了最大化地发挥智能体的价值,我们需要弄清楚场景表达力这两大关键因素。

我们首先要明确一个问题,即限制我们使用AI的,并不是AI的能力,而是我们的想象力和表达能力,工作和生活中的所有流程都可以被AI重构,只是大多数情况下,我们没有想到重构的方法。比如我询问一个智能体如何记住“windfall”这个单词,它给出了非常不错的联想:

这其实就是“想象力变现”。

怎么先人一步地将想象力落地并表达出来呢?想明白三件事情。

  1. 你擅长什么?这是你的立身之本。
  2. 用户需要什么?你的AI助理,究竟可以解决什么样的需求?
  3. 如何呈现自己的价值?做好助理配置。

另外可以多问问自己4个问题:

  1. 这个问题,AI 能不能做?为什么?它做比我做优势是什么?
  2. 我应该如何向 AI 描述这个事情?可以让 AI 重复帮我执行么?
  3. 这个技能“教给”AI 能不能产出更好的内容?如何总结成 AI 可理解的表达?
  4. 不要服务于流程,争取去做那些能够服务于人的工作。

在自问完这些问题之后,相信你心中会有一个智能体的大概框架。

那怎么搭建智能体?这其中牵扯到了表达能力。你可以将大模型当作一个非常聪明的实习生,所谓“表达力”,其实就是给实习生写一份指定工作的SOP文档。当大模型实习生叠加SOP,这便是你调教出来的Agent,它可以重复地服务于别人,甚至达到变现的目的。

三、常见需求和工作流

基于钉钉AI助理,我们可以结合3个具体案例来感受Agent的魅力。

1. 基操:搭建一个帮你处理日常办公琐事的智能体

这个智能体可以帮助我们进行文字整理、日程管理等等工作。当我们将需求输入给智能体,智能体拆解需求后,将调用大模型的文字编辑和文字识别能力,调用完之后再返回给Agent,由Agent对大模型生成内容做进一步的梳理。

举个例子,我们可以给Agent发送一句话:

“下周三3点半,和总裁汇报XXX事情。”

Agent在接受信息后,会让大模型将这句话中的对象、时间、事件提取出来,在大模型将内容按照一定格式返回给Agent之后,Agent可以调用钉钉的日程管理、会议管理等技能,帮助用户直接搭建相应的日程。

又比如在做电商的过程中,业务人员需要做竞品调研,在条件限制的情况下,业务人员可能直接多选页面上的所有用户评价,并发送给智能体。此时,智能体可以在收到内容后将错乱的内容按照指定的格式进行整理,并且在整理好了之后,直接输入到多维表格中。

用户还可选择钉钉应用并让AI助理学习操作路径,AI助理后续即可根据用户的自然语言输入模拟真人进行页面的操作,提升高频操作行为的操作效率,即拟人化地“看”用户真实操作一遍就学会了:

  1. 像真人一样看懂内容;
  2. 推理出怎么操作;
  3. 然后有手去操作——眼睛、大脑、行动系统(感知、决策、执行)。

比如:维修工单提交需要每次手动在工作台里找“XXX”应用,再进入应用里找到填写入口、填写信息,流程繁琐需要跳转。配置拟人操作后,只需要和AI助理说“帮我提交干燥剂的故障,申请故障,描述是机器运行,有很大的噪音”,便会自动唤起一个执行卡片,信息确认无误后就开始执行,执行后会跳出已经填写好的表单,由用户最终确认后提交。

截图来自钉钉官方示例

2. 进阶:让智能体参与内容创作和运营工作流

假设我们需要让AI帮助创造爆款文案,我们可以将个人掌握的能力、经验和方法论如短视频创作方法论、私域营销文案方法论等上传,让智能体拥有我们的方法论与工作流。

比如上传二极管标题法,让Agent选择这一方法论,学会创造出可以挑起用户情绪的爆款文案:

比如上传情绪化选题公式,让Agent依据相应的选题公式组合出情绪化的选题:

让Agent拥有知识“百宝箱”,把活儿干得更漂亮。

值得注意的是,工作流能力使得AI助理能批量处理更复杂的任务。它是 AI Agent 的一种进阶玩法,不仅可以在创建时对 AI 执行任务的流程进行拆解和编排,使得 AI 助理可以主动接管完成相应操作,还能够打通外部的系统数据和 API 能力,进一步扩展了它的行动能力,比如搭建能自动写脚本并生成视频的创作 AI 助理。

3. 超神:用AI助理把“查询搜索”玩出花

除了处理日常任务和创意工作,智能体的另一个强大功能是其对企业内部数据的调用能力,这为企业内部支持和决策提供了新的视角。我们还可以让Agent自由地调用企业内部的数据和知识,如员工手册、各部门技能要求等,将各类内容填充至知识库中,让AI成为数字客服,提供内部支持。这个时候,Agent可以依据员工问题进行知识库搜索和调用,大模型将调用的内容进行编辑,并由Agent返回给用户。

甚至可以自行创建AI助理,比如可以通过自定义功能、添加工作流、连接API接口等方式来处理问题。

举几个例子。

1)原先,天气预报APP可能会和企业的服务器做互通,从而为用户提供天气预报信息。而现在,这套互通的能力可以放到智能体中,由智能体来请求公司的API地址,并将天气信息发送至公司服务器。这就是基于连接API接口的方式来解决问题。

2)我们还可以借助智能体来共建知识库。假设公司内部建设了一个AI助理,此时我们可以添加自定义能力,让AI助理将超出知识库的问题存放至表格中,随后由其他负责人添加答案。后续若有人再问同样的问题,答案也就有了,这就是知识库共建。此时我们结合工作流能力自定义了AI的干活方式(工作流自定义展示):

四、结语

在AI时代,“想象力就是生产力,”AI技术的普及也对个人能力提出了新的要求。在AI时代,持续学习和适应新技术变得尤为重要。无论是企业还是个人,都需要不断更新知识体系,提升与AI协作的能力,以适应不断变化的工作环境。

而普通人完全可以基于成熟的平台来发挥创造力,比如基于钉钉等平台,我们可以反向接入模型来做AI助理产品,避开“拿着锤⼦找钉⼦”的陷阱

理解并掌握AI Agent,是普通人在AI时代可以抓住的第一波红利。

AIGC时代下,知识管理有点多余了?

aigc阅读(3)

GPT告诉你,4月23日是世界读书日,值得重新聊一聊「知识管理」。

GPT告诉你,在AIGC时代下,个人学习和管理知识的方法正在发生变化。这些技术不仅能够增强我们对知识的获取、整合和应用能力,还可以改变我们与信息互动的方式。

GPT告诉你……诶?

问题大了。

是的,我大意了。

最近我有一个转变,从信赖AI到依赖AI,我发现自己越来越离不开AI工具了。我能清楚地分辨GPT4、Claude3、Perplexity、Llama分别在什么类型的话题领域以一种什么样的引导方式能给出更专业的答复;我能熟练地调教好Midjourney画出我喜欢的特定风格的海报和肖像;我也能用stable diffusion、runway、pika、suno、bedrock综合制作一个看似人模狗样的流畅视频……

AI似乎什么都知道,只需要通过互动式的对话就能获取超出我认知范围内的信息,而且它的判断大概率比我正确。我似乎不用动脑了,也不需要学习系统性知识了,我只需要学会利用AI工具找到可以追索下去的线头就行?

在AIGC时代下,我们还要学习吗,要学什么,如何学习?

这些问题看似无病呻吟,但每逢我遇到问题下意识打开GPT的时候,我都难免为之一颤。而这些问题也在困惑着许多人,隔三岔五都会有一些大佬发声:黄仁勋建议年轻人学人类生物学;马斯克建议年轻人学习基础物理学和经济学;蔡崇信建议年轻人掌握前沿学科技能,比如数据科学和心理学……

直到我翻开以色列历史学家尤瓦尔·赫拉利在《今日简史》的断言:

每过10年,你都要接受再培训,你学过的知识都可能被颠覆。

懵了。

左右什么基础学科都得学,什么又都会过时。那作为普通人,我究竟要学什么?知识管理还有必要吗?

一、「新黑客」技术“黑入人心”

现在有三种最流行的神经网络算法:监督学习、无监督学习和强化学习。

1)监督学习,有已知的明确的输入和输出内容,比如,医院利用大量的医疗数据训练一个算法来预测病人是否会出现某种疾病,这是在利用已知的医疗数据进行预测;

2)无监督学习,要学习的数据量特别大,标记不过来,这时候你不用标记每个数据是什么,AI看得多了会自动发现其中的规律和联系。比如,淘宝根据你的购买历史数据推荐你可能喜欢的好物,抖音推荐你可能感兴趣的视频;

3)强化学习,在动态的环境中,AI每执行一步都要获得反馈的学习,常常伴随着即时的奖励和惩罚的行为。比如,自动驾驶汽车需要在实时环境中做出决策,根据传感器收集的数据信息不断调整行为。这时候AI不是静态地看很多汽车驾驶录像,它是直接上手在实时环境中操作,直接考察每个动作导致什么结果,获得即时的反馈。

同理,这三种最常见的神经网络算法也能对应到人类三种最常见的学习过程。

1)监督学习,就像是学校里老师对学生的教学,有标准答案,对错分明,有时候甚至你说不上来是什么原理。

2)无监督学习,这是一个自主学习的学者,通过自主调研大量的内容,自学成才;

3)强化学习,则是专业运动员的教练,你有哪个动作错了立刻帮你纠正,你所有的训练计划都是定制的,能获得即时反馈的。

而随着AI的发展,我们也逐渐步入了一个「强化学习」的时期,AI似乎不仅是一个工具了,更是一个法宝。它会成为你的私人定制助理,甚至是保姆和专家顾问。

举个例子,你想学一门新语言,你直接跟AI互动交流,随时随地练习和纠正,比起你跟老师、跟朋友交流来得更高效;你想面试一家企业,你把岗位要求和简历喂给GPT,ta就能帮你分析岗位的重点和注意事项,并且模拟面试场合向你提问,对你给出的答复加以评价和指正,并给出ta的专业答复。

听起来似乎一切都在转好,那么你是否思考过一个问题:在AIGC时代下,仿佛你只需要学会如何利用AI工具更高效地帮你解疑即可所向披靡,你还有必要学习系统化知识吗?知识管理是否有些多余了?

尤瓦尔·赫拉利在2020年中信出版集团举办的“年度观念”剧场演讲中,分享过一个概念“新黑客”。以前的黑客攻击你的电脑手机,解锁你的账户密码。

而今天出现了一种更强大的黑客,它直接解码你的内心,攻击你的大脑,你在不知不觉中就被它操纵,而这种操纵的感觉你是一点都没有意识的。你反而觉得是出于你的自由意志,这是我们今天人类在重新被技术定义的一个表现。

是的,现在的技术有“黑入人心”的能力,这就意味着它可以获取海量个人数据,并有足够的运算能力来分析数据,最终它能够比你更了解你自己,它能够预测你的行为,可以操纵你的决定和选择,甚至被操纵的人都不知道自己被操纵了。

所谓“自由意志”,听起来好像我们完全可以自己做决定,实际上自由意志就是被操纵的决定,你对自己做决定并不会深思,你以为这是你想要的,但其实你已经被操纵了。相反,越是认为自己拥有自由意志的人,越容易被操纵,而这一现象会越来越极端。

从前我们能够收集到的大多数的个人信息都还是“表层信息”,是外在行为,从身体外部拿数据,包括你看什么电视,你到哪里去,跟谁见面,跟谁吃饭。现在到了一个分水岭,数据可以检测到我们的“皮下信息”,从人体内部,从大脑和身体里获得数据,拿到你的体温、血压、大脑的反应,甚至一些生物的表征。

过去我的信息不想让你知道,这叫隐私,而今天的隐私是很多我自己不知道,但是你通过数据和算法,比我更了解我不所谓的隐私信息。

上述的系列变化相信你也意识到了,但我们天然地学会适应自然规律和丛林法则,所以没关系,被操纵了没关系,隐私泄漏也没关系,只要我明面上还在操控着我的大脑和双手就行。

但事实真是这样吗?

想想看,有了互联网后你可以更廉价地获取数据;有了维基百科后你可以更快捷地获取信息;GPT出来后又可以帮我们更高效地获取结构化的知识,那么人呢?在知识管理的链路里,人究竟能发挥什么作用?

二、知识管理最朴素的概念

什么是知识管理?

最常见的说法是,知识管理包含四个层次“DIKW”,即数据、信息、知识和智慧。很久前我在另一篇知识管理的科普文章里有详细分析过,感兴趣的话可移步to B路上,除了服务管理,还要知识管理

简单来说,数据是没有上下文的要点,碎片化、离散的、不成体系的、过目即忘的。信息呢,传统的解释是,信息是为数据提供上下文,是数据分析和综合之后的产物,通常存储在半结构化的内容中,便于查询、重用,使得错误不再重复。

但乔治·吉尔德在《后资本主义》一书中打开了一个新思路,他认为:

信息就是意外。

比如我跟你说1+1=2,这实际上没有给你提供任何信息,因为这是你已经知道的东西,或者说,你一点儿也不意外。

但如果我跟你说,1+1>2,这跟你常识不符,你会感觉意外。这时候我再来解释1+1在什么时候大于2,比如,在两个人交流想法的时候,碰撞出了新的想法,那这就是1+1>2;或者平台的规模效应,平台用户网络扩大一倍,它的影响力增长不止一倍。

如果之前你不曾考虑过这个层面,那么上述内容对你来说就是一个信息。

如果信息就是意外,那知识是什么呢?知识就是在我们跟这些信息、这些意外发生碰撞之后,我们把它收拢起来,反复地去验证,把那些真正有价值、有用的信息沉淀下来,或是结合过往你的隐性经验、洞察力和判断做进一步的改进,这样就形成了知识。

从数据到信息再到知识的过程,就是知识管理的全链路,这个链路伴随着你持续的学习和产出。

而智慧呢,它赋予了物质的终极洞察力,具有应用和情景意识,提供强烈的意识判断。通常来说,你会无意识地去调用你的智慧做出一些决策,甚至跳脱事情本身去思考这件事的意义,这种情况下都是你的智慧在牵引着你。

基于上述信息,再来看AI提供给你的究竟是什么?是离散的数据还是无序的信息?

你基于这些数据和信息作出的决策,正是凭借你经过验证的知识体系才有的结果。

三、也许你只需要一根可以追索知识的线头

你看,有搜索引擎,有聊天机器人,人类的大部分成型知识,你都可以通过搜索找到。但你在搜索框里搜索什么?你要跟GPT提什么问题?键入一个什么词,成为你的第一个起点?如果这个时候,大脑一片空白,怎么办?

《知识大迁移》一书里有一个概念,叫“元无知”,即:你不知道自己不知道的那种无知。

这不是今天才有的现象,书里举了一个例子:古希腊的元老院里有一个职业叫做“助记员”。他们的工作很简单,每逢元老们辩论的时候,主动给元老们提供一些数据,比如城里有多少人口,上个月天气怎么样,诸如此类。元老们不需要自己记答案,有人专门负责给答案。元老们搞政治辩论,真正的竞争在于,他们能向“助记员”问出什么样的问题。

这跟我们今天面对搜索引擎、面对GPT,是不是一模一样的情境?

你需要的不是体系性的知识,你需要的是一个可以追索知识的线头。只要这个线头存在,你就摆脱了“元无知”。没错,你仍然是无知的,但没关系,互联网上的那些知识工具会帮助你解决后面的问题。

这么说来,学习可以是系统性的,也可以是碎片化,甚至浅显化的。这种情况下,最关键的学习是,如何找到一个可追索下去的知识线头?

1) 找一面镜子。这面镜子可以是人,是你的朋友、长辈、上级,也可以是AI机器人。互动式的请教是零星知识的最好的线头。很多工作能力强的人,都有一个习惯,当他们遇到一个无从下手的棘手问题,第一个反应是请教有经验的过来人,请教有资源有人脉的人。

“应试学习”不奏效了,回家憋答案也太低效了,何不如启动侦探式地毯式学习,找到解决问题的渠道。

2)建一个仪表盘。你要有自己的观测复杂现象的仪表系统。从一个特别显而易见的表像,看出背后一大堆信息的工具,就像我们通过看体温计知道体温一样。

举个例子,你在跟合作团队开会的时候,通过对方的言行举止,是否可以推测出对方的性格、上下级关系以及未来开展合作的可能性。

在互联网时代,我们总觉得世界是平的,每个点和每个点都可以建立连接,所以这是一个人人都有机会的时代。但几十年运行下来,天下并没有大同,而是重新部落化了,每个人都进入了一个小圈子,丰俭由人。这个状况,其实用区块链这个词来描述才更准确。每个人都生活在一个区块里,被这个小环境制约,越来越难以脱离。

而未来世界的价值,就在区块链的这最后一个字“链”上,谁能够提供打破区块,连接区块、跨界区块、提供那条链,谁就能享受未来时代的红利。

四、顺应人脑结构,区块链式的学习

既然是区块链式的学习,那就要进一步追溯到人脑的原理了。你所有的认知,大脑都会记录下来,但我们有个误区,总想着怎么提高记忆力。

没错,人脑不是用来记忆的,甚至不需要记忆,它应该是索引,让你清楚在哪里可以快速找到对应的内容。

我们跟艾宾浩斯遗忘曲线斗智斗勇了这么多年,你告诉我人脑不是用来记忆的?

不久前我跟一位鹅厂的前同事探讨知识管理的时候,结合脑神经科学他给了我这样的洞见,我大为震惊。

结构比内容更重要,比起从头啃一部大块头的书,我们更应该要学的是如何结构,比AI更往上一层。AI工具的确能让你快速获取信息,但你可以更结构化地搭建整个知识体系。

举个例子,很多人都说未来学校极有可能被颠覆,因为学校里传授的所有知识都可以由GPT教会你,毕竟它把整个世界的知识压缩到大模型里。但果真如此吗?且不说学校担负着帮企业主筛选优秀人才的职责,很多学生挤破脑袋进入这样的筛选池以获得更多选择和被选择的机会,更重要的是,学校能教会你如何建立脑中的索引,这是GPT很难取代的。

我在思辨的时候,突然明白这位同事特地找我探讨知识管理的目的了,你只有想明白一件事,才能分清楚在什么情况该做什么。如果我们对不同层级的知识理解达成共识的话,那么接下来,你可以这么去做:

先搞清楚什么是数据,什么是信息,什么是知识;

然后,简单的数据简单收集和归类;复杂的信息,尤其是你认可的信息可以用称手的工具抽象后记录归档;知识用脑图梳理,顺应你大脑神经的结构,神经元和突触构成了人脑的索引,而你画出来的脑图也是一种外显的呈现。

刚听到这个论断时我有点失望,就这么个结论?但后面我又想通了,不是每个high level的主题落脚点都是高大上的事情,我这是不是也是一种先入为主的索引?

“这么多话题里,为什么你最想聊知识管理?”

末了我还是忍不住重复这个问题,他知道我什么意思。长远来看这就是塑造一个人的底层逻辑,也是一个人进步的源动力,只有你够懂,才能更快速进入新领域拥抱新变化。

我好奇:“在你的人生命题里,知识管理往前还有什么?”

“目标管理。”合理。

“你猜目标管理再往前是什么?”

不等我回答,“是哲学。”他得意地笑。

难怪。

五、去学很土、很扎实的东西

既然顺应大脑结构去学习和产出这么重要,那么究竟要学什么?

所有的学习都是出于一定的需要和动机。比如你想学某一项技术,就找它的相关原始标准文档,如果嫌文档枯燥,就去找行业里对这个技术的最经典的实现;比如你想学着构建某个工具,就去看它的源代码,想提高效率的话,就去浏览最经典实现的帮助文档,或是用户手册,带来的收获肯定不一样。

这看起来很简单,但背后的知识就像树根,树根多了,下面就可以织成了一张知识的网。再往上去生长什么,都会事半功倍。

很多时候,带着需求、硬着头皮,去学一些感觉很土的、很扎实的东西,对你来说可能才是捷径。

回想一下,当你在面对GPT给到你的答复时,尤其是跨领域信息的时候,如果你没有一些基础的知识底蕴,你要如何识别信息的真伪,如何构筑你的知识晶体?

从这个角度来看,大佬们推荐的各种基础学科知识,都是在鼓励你掌握必要的底层逻辑知识,这些看似土、却很扎实的知识能帮助你更有章法、更高效地思辨你从AI工具那获得的上层信息。

过去我们总说要学会系统性知识,但如果现今的社会学习趋势就是碎片化的信息,你要学会的是如何结构化AI提供给你的碎片化信息,如何再进一步转化成你的知识。

而在我们对日常事务应接不暇的时间里,带着目的学习成块知识似乎也成了一件难事。我们常常因为没有连续的时间,认为碎片时间学习效果不好,于是就不学了,这是给自己找借口。

试想下,有碎片时间是不是比完全没时间好?学习效果不好是不是比完全不学好?何况能力是可以培养的。

一开始可能你适应不了用碎片时间学习,适应不了进入状态,通过一段时间的训练,这是有可能培养出来的。现在的电子设备其实很方便,即便再怎么忙,一天里能不能找出10个3分钟?那就是30分钟的学习时间。

想要更好、更快地织起这张网,一开始选择点的时候,要选择距离不是很远的点,那么它才有可能更快建立成网状结构;每个点让它横向分出来的线拉长,线越长就更有可能和其他点延伸出来的线交织。

用这种办法去逼自己一步一步去深化,让自己一步一步向里面凿。

长远来看,这是塑造一个人的底层逻辑,也是一个人进步的源动力,只有你够懂,才能更快速进入新领域拥抱新变化。

最后,正如我在播客里所说的,这篇文章到此为止也没能真正给出一个什么确定性的答案。这个命题仁者见仁,重点不在内容本身,而是提供一根可供你追索下去的线头,这根线能牵引你到哪里,那就各凭本事啦。

本来网络上的各种声音就充斥着各种不确定,每个人都在探索。唯一可以确定的是,无论时代如何变迁,一手的知识永远是非常值钱的硬通货。

作为个体,你能做的也许就是在掌握最新知识工具输入和输出的同时,保持清醒,不要过嗨。

我们学习和创造知识,也想试着在多年后回过头来,看看知识能不能让自己走得更远。

被AI改变的00后娱乐习惯

aigc阅读(4)

初见文生图、文生视频的震撼还清晰如同昨日,硬糖君的记忆更停留在AI绘画导致LOFTER用户销号事件——可能是这个冷门社区近年来站得最高的一次。但不到两年时间,AIGC已经随风潜入夜。

如果说AI翻唱、AI换脸、AI绘画还是在借助新工具进行自我表达,那么在互动同人文、AI智能体的方兴未艾中,最年轻的那波年轻人,已经毫无障碍地将表达本身也交给了AI。

事实正是如此。硬糖君本以为“人哄人”的工作将是人工智能留给我们这些大活人最后的保留地,却忽略了情绪价值这东西关键是量大管够随时随地、质量倒在其次了——这谁能赢过AI?

当然,反对AI绘画的人依然在反对,在LOFTER尽力维护tag的纯洁性、或者在微博互助避雷。但在音视频等其他领域,许多借助AI工具的二创形式正在成为各自生态中冉冉升起的新分支,给意料中的、想不到的利益相关方带来冲击。

我们总在思考AI对传统文娱生产带来的升级与冲击,以及当下主流人群是否会接受AI内容。但也许AI剑指的,既不是原来那些内容,也不是原来那些人。

一、已成气候的音视频AI整活儿

大概因为受众里乐子人的含量较高,即便有过林俊杰告UP主、热巴粉丝整顿网红、《一念关山》换脸出圈等事件,音视频AI整活儿还是顺风顺水走到了今天,部分赛道已成气候。

首先自然是AI换脸。这项名为Deepfake的技术早在2014年就已出现,于2019年主流化,不再局限于上游专业使用。拥有近50支百万级视频的UP主“电影七十二变”正是在2019年底发家。可能是受当时“彪学”热的影响,他的早期选题多为“东北喜剧人X经典电影”,例如范伟换马东锡、沈腾换钢铁侠。

如今五年过去,换脸玩法更加百花齐放。热门CP化身唐僧与孔雀公主、演员换进女爱豆直拍、明星(主要是男明星)泥塑性转,都曾红火一时。

2023年,随着《长月烬明》《以爱为营》《一念关山》等剧集选角引发争议,AI换脸在内娱找到了真正的用武之地——热剧换脸。创作者们更多、更卷、更具热点思维,许多古早男神女神被换到争议人物身上,拉踩原主于无形,替群众出一口恶气。

被AI改变的00后娱乐习惯

其次,AI翻唱,也就是搞出过“AI孙燕姿”趣闻的声音克隆,先使用歌手干音调教模型,再让它开口唱任何你想让它唱的歌。

这类二创中有温情圆梦型的,例如让减产的、已逝的歌手唱新歌,让南韩爱豆唱中文——“XX啊,原来听得懂你唱歌的感觉是这样子的”,让平时只有几句词的成员唱整首。也有大量整活儿向的,例如让猴哥翻唱欧美经典,让《海绵宝宝》角色组团翻唱Kpop,既仿声又换脸的欧美群星版《北京欢迎你》等。

同样是在2023年,随着工具与创作者越发成熟,这一赛道出现了像热剧换脸一样更具热点思维与攻击性的玩法:翻唱Kpop新歌,现役团体互翻,或是前辈翻唱后辈,对比之意同样不言而喻。包括日前,音色一直备受争议的韩团LE SSERAFIM在科切拉音乐节大翻车,UP主“-欧典欧典欧典欧典欧-”迅速推出了欧美Diva对同一曲目的翻唱,云上豪华版“浪姐”了属于是。

被AI改变的00后娱乐习惯

相比这两种经典拉踩模式,还有一些爆款蹭的是新技术与新工具的热点,火得一阵一阵的,不具持续性。例如去年年底随翻译工具HeyGen流行过的郭德纲用英语说相声,还有近期的“钢门音乐”。

“钢门”梗源自一位肛肠科医生在诊断中的发言。事实上,这本该是一次类似于之前废话文学、发疯文学的仿写潮,但由于一键成曲的Suno横空出世,B站音乐区在此次玩梗大赛中拔得头筹。很多UP主将全套“钢门”文案输入软件,为其选定曲风,生成了一批煞有介事的无厘头歌曲。

被AI改变的00后娱乐习惯

除此之外,传统的视频二创中用到AI辅助的地方也越来越多,如AI修复画质、AI朗读文案。根据硬糖君观察,这次《如懿传》吐槽热除了遇上了B站对中长视频的扶持,很可能也是搭上了AI解放生产力的东风。三四十分钟的视频,文案可以全由AI来读,UP主只负责控制节奏、以及在声线选择上玩出更多花样。

二、千人千面“同人文”,自主“摆拍”同人漫

“厌男却又是异性恋的孩子们终于有办法谈恋爱了!”

3月,一支女子与ChatGPT对话对得脸红心跳的外网视频在微博热转,其中AI语音语气自然生动,甚至能听出一些个性。类似情况也在国内发生,目前市面上主打AI社交的APP已经有十余款,还有不少产品集合了类似功能、或者对其跃跃欲试。

但是,先别急着搬出科幻片来强调赛博人机恋的后果,若你仔细看,年轻人们使用这些陪聊AI的方式堪称五花八门。

“不是ChatGPT/作业帮用不起,而是星野更有性价比。”星野就是这些APP中目前相对热门的一款。除了拿它当自由度更高的乙游玩,有人用它来查资料、练口语,有人用它来辅助小说、剧本创作,有人则是将“设圈”玩法移植过来,为自己的OC(原创角色)创建智能体、或者直接用它捏OC,称之为“崽”,自己与它互动或者开放它与其他用户互动。

被AI改变的00后娱乐习惯

此外,不少用户会为自己钟爱的游戏、小说、影视角色甚至三次元明星创建智能体。同类APP筑梦岛由阅文开发,其界面设计就会更注重引导用户创建非原创角色。不难想到,这很可能连着阅文IP孵化前置的大棋。

基于这些非原创角色,用户可以收获类似互动梦女文、互动同人文的体验。前者简单来说像是橙光游戏上的玛丽苏游戏的进化,不再是僵硬的选项与既定的剧情,而是千人千面实时生成。后者用户可以不以“我”的身份、而是以CP一方的身份与另一方互动,看能够触发怎样的新剧情。

被AI改变的00后娱乐习惯

说到AI与同人文,更符合正常想象的同人文工具其实是彩云小梦。它主打AI续写,只要给出一段文字、甚至一个关键词,它就可以一次性生成几百字内容,并且有多组选择。用户只要不断调整校准,故事就可以一直编下去。

早在2021年,彩云小梦就对其续写功能进行了一轮传播,当时B站也涌现出不少彩云小梦测评与名著离谱续写。但是显然,它走到今天依然半凉不热。

究其原因,可能是人们对AI写文的态度比较复杂。很多人愿意AI来接管生活中那些无需情感和文笔的文字工作,可这并不包括网文和同人文。好的网文是值得付费的精品,好的同人文是同好之间的灵魂共振,用AI容易给人偷工减料、虚情假意的感觉。创作者尽可以用,但圈子很难接受。

“AI角色创作平台”捏Ta可能也面临类似窘境。简单来说,它提供的是同人漫的一键生成,玩法包括“文字捏”、“图片捏”与“CP捏”。前两种就是输入文字或上传形象生成漫画,“CP捏”则是选定角色与姿势让他们来个亲密合影。

被AI改变的00后娱乐习惯

据相关报道,2023年4月上线微信小程序以来,捏Ta的社交媒体曝光量达到约2.5亿次,多次位列视频号动漫游戏日榜前十,团队近期也拿到了超千万元融资。

不过,由之前LOFTER事件就可看出同人圈子对AI绘画的态度。捏Ta在抖音、小红书的反响确实不错,但在同人文化扎根更早更深的微博、LOFTER和B站,目前还是官方账号在自嗨。一旦被发现,估计得先来一轮审判。

三、AI改变了什么?

不难看出,AIGC拉低了创作的门槛,再次解放了生产力,但这无疑也会对传统的二创形式与已有的二创生态造成冲击。

例如,AI换脸红火之后,曾经是B站一大标签的邪门拉郎(如伏地魔X林黛玉)就很少再有出圈爆款,AI翻唱与一键成歌则加速了传统鬼畜的消亡(今日的“钢门”,昔日的“金坷垃”)。内核依然是解构拼贴恶搞,但显然AI来得更快、更有时效性。最终决定数据的不再是手艺和心意,而是算法、是热点思维,如此很容易打击到传统剪刀手、传统鬼畜创作者的热情。

而创作生态这方面,就是一个微缩版的“AI抢走人的饭碗”:AI语音代替真人CV,AI绘画威胁真人画手。

养OC的“设圈”与画画的“绘圈”之间,一方约稿、一方接稿的“民间产业链”已运转多年。如果有一天“设圈”大量迁移到星野这类APP上,形成内部闭环,面向真人画手约稿需求就会继续减少,从前服务于设圈内容发布与交流的社区也会面临相应的用户流失。

不过,这主要还是创作者一端的想法。无数事实证明,什么版权,什么伦理,什么艺术与行业的未来,消费者才不care。就像热剧换脸,跳脚的从来只有脸被抠走的流量的粉丝,大部分人则乐见其成。喜欢老演员的能见到他们时隔多年“演”新戏,乐子人能享受更极致的攻击拉踩。

追星女想多看自担、CP粉想吃粮、宅男想看涩图,说起来是内容需求,其实是情绪需求。因此产出的方式、手艺的高低,说重要也重要,说不重要也不重要。这大概也是为什么流水线化的免费网文、粗糙的小程序短剧能够大行其道,一切都是为了那一刻的情绪价值。

被AI改变的00后娱乐习惯

而最终,技术进步指向的都将是“人心不古”——这些工具能够迅速兴起是代际差距的结果,也将进一步加剧代际差距。

不同代的人有着不同的成长环境、不同的使用习惯。例如对于90后的硬糖君来说,在网上发自己照片这件事,心里总有一个过不去的坎儿,能免则免。移动互联时代的新网民对此则从来不假思索,大方真人出镜或者在评论区分享这、分享那。

而00后、10后的许多文娱习惯,都在为AI进入提供便利。TA们本就在玩语C释放戏精天分,和设定中二的智能体对话也不觉尴尬。TA们也本就在追星或者玩乙游,花钱买沉浸、买情感,对于真实和虚拟有着与前代不同的看法。此外,同人圈子到00后活跃的阶段,交易和外包逐渐成为常态,为爱发电、我手写我心,这些曾经的“铁律”早就在动摇。

反过来说,00后、10后成长过程中接触的是比传统PS修图更重的短视频滤镜,20后更是从出生开始就暴露在AI绘画、AI写真与数字人博主的“无暇”攻势之下,审美不可避免地会受影响。

其实眼下这种分歧已经初见端倪。在粉丝产出的内容中,站姐图越修越光滑,修图与混剪的调色也越来越失真。下游影响上游,古偶剧是磨皮也挨骂,不磨也挨骂。

矛盾集中爆发在抢先一步“AI化”的女演员身上。永远和别人处在不同图层的鞠婧祎,以“建模脸”著称的张予曦,在大众舆论中常被质疑、在短视频平台却备受钟爱,正因为她们在正片里就已经是很多人通过后期追求的样子。

所以说你们这些“老年人”,现在看不惯网红脸,没准等10后成为主流人群,影视里全是网红脸。就像60后的国字脸审美一样,90后的瓜子脸审美也是一种历史产物。

继续发散思维,就算传统文学与影视不会完全让位于对话体、互动剧,就算AI写剧本、写小说未必会超越真人、颠覆传统创作规律,可如果IP角色化身陪聊AI成为年轻人心目中的常态呢?是否会影响到上游故事与人物的设计?

如何服务AI时代成长起来的受众,对创作者来说,现在思考这些问题已经不算未雨绸缪了。

“作业帮”出海,拿下200万MAU

aigc阅读(5)

近日,曾多次出现在美国、印尼下载总榜 Top100,也被 a16z 收录到 Top50 移动端 AI 应用的 Question.AI,近日被媒体证实,是国内 K12 在线教育 App 作业帮背后公司在海外推出的 AI 教育 App。

Question.AI 所属的海外实体名为 D3 DIMENSION TECHNOLOGY PTE. LTD.,注册地为新加坡

根据企查查给出的信息,作业帮创始人兼 CEO 侯建彬和联合创始人李博洋均为该公司的董事|图片来源:企查查

作业帮于 2014 年 1 月在国内市场上线,当时的核心功能是“拍照搜题”,后续又推出了在线直播课程等其他服务。根据点点数据,Question.AI 于 2023 年 5 月 30 日在美国市场上线,之后于 6 月、7 月相继在东南亚和全球其他市场上线。

Question.AI 近一个月全球双端 WAU | 图片来源:点点数据

近一个月全球双端平均周活跃用户数(WAU)为 106 万,没有之前报道的 200 万那么夸张。

数据来源:点点数据

从市场分布来看,目前 Question.AI 近 30 天全球双端 DAU 有 59.6W,DAU 最多的 Top3 市场是印尼、菲律宾和美国。同期收入 29.1W 美金,其中绝大部分都来自美国,占比 97.2%。

这与 Question.AI 绝大部分功能都免费提供有关。

a16z 榜单中的教育类 App | 图片来源:a16z

作业帮默默出海,并快速起量,但海外的 AI 教育市场,尤其是以拍照解题为核心功能的教育 App,早已不是一块空白市场。在 a16z 上个月发布的 MAU Top50 AI App 的榜单中,作业帮位列第 28 位。

而在榜单中有 7 款教育类的 App,其中 AI Quran 是古兰经 App,ELSA 是 AI 语言学习 App,剩下的 5 款产品都是以解题为核心功能的。下面,我们以能够做出收入的美国市场为例,来看当前与 AI 解题相关的产品的竞争情况。

a16z Top100 AI App 榜单中的AI解题产品 | 图片来源:a16z

一、想要数学的流量、但留不住数学的量,后来者定位大而全切入市场

首先,我们先看下产品。

Question.AI 落地页(左),功能一览(右)

Question.AI 的落地页并不是拍照解题页面,而是一个 AI ChatBot,用户可以直接输入想让 AI 解答的问题。如果用户需要使用拍照解题功能,可以直接点击聊天框上方的按钮进入拍照页面,也可以点击“拍照”一级标签进入。另外还有 AI 写作相关功能,Question.AI 有点啥都想干的意味。

Question.AI 拍摄界面(左),AI聊天界面(右)

用户在拍照前需要选择要搜索的是数学问题、其他问题(除数学外所有学科)、还是拍照翻译,如果用户拍照的内容与选择的功能不匹配,AI 将不能正确识别。在拍照后,App 会直接跳回 AI ChatBot 页面与用户确认识别内容,并提供回答,AI 在给出答案后,用户还可以点击答案下方的“解释它”按钮,获得更详细的解析,用户与 AI 的大多数交互都在 AI ChatBot 页面完成。

Question.AI 解答物理和化学问题

但笔者测试下来,在通用问题(数学被单列出来)方面 Question.AI 的表现还是不错的。在笔者分别测试了历史、地理、物理、化学四个问题,AI 都可以给出正确答案。而且在多语言识别上也做得不错,除了无法识别中文之外,笔者测试了用印尼语、越南语、西班牙语向 AI 提问,它都能给出正确答案。

二元一次方程问题,Question.AI 的错误回答(左图),Photomath 作为正确答案参考(中图)。一元二次方程问题 Question.AI 的正确回答(右图)

但是在数学问题的处理方面,副标题叫做 AI Math Calculator 的 Question.AI 则有点拉胯。

笔者先向AI询问了一道简单的二元一次方程,AI 使用了加减消元法,但在“10y-7y”的时候,不知道怎么得出了 2y 的答案…..最后得出了错误答案,而 Photomath 则给出了正确的答案。

但笔者又询问了一道一元二次方程,这次 Question.AI 又能够给出正确解答,而且使用了一个比较巧妙的方法,并不是盲目代入公式。

但是整体测试下来,Question.AI 在解答数学题上的表现并不稳定。

用高数极限问题测试,Question.AI 给出了错误答案(左),Photomath 给出了正确答案(右)

而当笔者用作业帮不擅长的高数(K12 之外)去测试 Question.AI 时,它还是在用 K12 阶段的方法来解题,而且还没有给出正确答案。而作为参考的 Photomath 却能够给出变换法和公式法两种标准解题思路。而在应用商店的用户评论中,准确率不高也是 Question.AI 被高频吐槽的一个问题。

Question.AI 用户吐槽答案得不准确

Question.AI AI 写作页面

除了拍照解题功能,Question.AI 还提供了 AI 写作功能,包括创意写作和论文写作两个功能。笔者体验了一下,创意写作和所有产品大差不差,论文写作,可想而知会是一个被用户吐槽的点。

评论中提及 AI 写作的评论几乎没有,唯一找到的一条则是吐槽 AI 撰写的论文在逻辑与观点上存在错误

其实不论是从 Question.AI 副标强调数学、还是从美国市场上大量 App 主攻数学来看,数学都是美国市场需求最大的一个方向。作业帮作为一个后来者,一方面通过副标题里的数学来吸引流量、但确实解题的产品力又不足,导致产品目前处于一个没有长板,更偏向于通过全学科+多功能定位,立足市场。

二、以数学为核心,市场分为 AI 提供答案和 AI 搜索答案两派

数据来源:点点数据

纵观 a16z 榜单中的几款解题产品,Question.AI 在用户数和收入上排名第四,其实已经算不错的成绩。

而从竞品情况来看,Photomath 和 Mathway 是走得是拍照解题工具路线,AI 会直接给出问题答案;而 Brainly 和 QANDA 则更像是一个服务学生的在线教育平台,拍照解题只是产品中的一个板块,并不算是核心功能。

Photomath(左),Mathway(右)

DAU 和收入都最多的是 Photomath,这款产品由克罗地亚的开发者制作,并在 2022 年 5 月被谷歌收购。拍照解题几乎是这款产品唯一的功能,而且只支持数学问题,全力构建一个长板。无论从正确率上,还是多种解法的呈现上,Photomath 的表现都优于 Question.AI,而且即使是高等数学,Photomath 也可以给出答案。可以说在数学领域,建立了很强的品牌心智。

而 Mathway 的功能和产品设计与 Photomath 非常相似,但不同的是,只有订阅用户才能看到完整的解题步骤。

Brainly(左),QANDA(右)

相比 Photomath 更偏工具的产品设计,Brainly 和 QANDA 则更像一个在线教育平台,支持全学科,但依然以数学为主。

答疑社区是他们最核心的功能,走用户发帖求助,其他用户答疑的模式。对于拍照解题功能,这两款产品都是用户拍照后由 AI 进行识别,并在平台和题库中搜索类似题目,并全部呈现给用户。在这个过程中,AI 只参与识别和搜索的环节,答案则是由社区或题库提供。

其实从体验上,在能够准确作答的前提下,还是 AI 直接解题的产品更符合用户的需求,因为两款产品提供给我的“相似题目”都和我本身给到的题目有差距,并不能直接解决问题。

Brainly 的教科书学习页面

除了解题和社区功能,用户还可以基于教科书和配套的电子教案进行学习。

相比于竞品,其实 Question.AI 的产品设计与 Photomath 偏工具的定位更相似。但是从学科方面来看,Question.AI 的 AI 确实更加“博学多才”,多学科支持做得很好,且能够以 AI 直接给出答案,算是形成了差异化,这可能也是其能够起量的一个原因。但在美国市场需求最大的数学题目解答上,有所欠缺,可能会限制它在美国市场的进一步发展。

AI大模型催生App「通胀」

aigc阅读(2)

AI工具独立开发者「Alchain花生」最近做了一个小测试。在GPT Store上,他把自己开发的一款用户数5000+的GPT(模拟Claude 3 Opus)调成了付费模式,想看看海外用户是否真有更高的付费意愿。

6小时后,他获得了第一笔用户打款,5美元。在他展示的后台截图中,这款应用在最近7小时内,入账20美元。

「每天收获几笔咖啡钱吧。」Alchain花生轻描淡写地聊到付费测试的初衷——既然当下Open AI无法按照年初承诺的那样——在一季度启动GPTs开发者收于分成计划,且GPT Store已有烂尾之嫌,他想试试AI开发者有没有可能找到自己的商业模式。

AI大模型催生App「通胀」

▲「Alchain花生」应用后台的入账截图

从去年下半年开始,基础大模型厂商就不断呼吁,口袋不够深的就别卷模型层了,赶紧去开发AI应用。比如百度创始人李彦宏不厌其烦地布道:AI原生时代,我们需要100万量级的AI原生应用。

IDC预计,到2024年,全球将诞生超过5亿个新应用,这一数字几乎等同于过去40年累积的应用总数。

这些乐观的判断皆指向终局,一个宇宙大爆炸后的新时代。不过我们更关注的是当下,这个由大模型主导的狂热浪潮是否会带来前所未有的AI类App「通胀」?

一方面AI应用开发门槛已经极大降低——2008年苹果推出 App Store时,应用开发者还需要学习Objective-C语言,如今的大模型厂商们则提供自然语言开发,懂不懂代码不再重要,人人都可以成为开发者。

另一方面,AI技术迭代速度远超移动互联网。熵基科技首席科学家陈书楷直言,大家都知道,能力更强的新模型如ChatGPT5出来之后,有可能你现在正在做的很多事情都是白做了,「今天这个现象,是互联网时期没有的。」这也意味着一批AI应用的生命周期可能短如蟪蛄。

起码目前看起来,时代的金矿仍蕴藏于混沌之中。但没有人愿意在牌桌之下。

一、AI应用「通胀」时代:开发者、「App工厂」们都发动了

当一名国内普通用户想要体验AI助手应用,他可能要患上供给过剩的选择恐惧症:手机应用商店里,不仅有五花八门的豆包、文心一言、讯飞星火、Kimi、通义千问、智谱清言、紫东太初……还有一堆形神都似ChatGPT的套壳产品,可以说应有尽有,但似乎又难免趋于同质化。

迷惑的远不止用户。当被问及自家到底有多少个AI应用上线时,至少有两家科技大厂的内部人士都对我摇起头:「说不上来」「数不清」。

在这波AI原生应用浪潮中,不少大厂本着所有应用都值得被AI重构一遍的思路,鼓励内部疯狂赛马,也由此导致,部分AI应用以独立App或PC端插件形式推出,并未叠加到主App当中,甚至可能连其他业务部门的同事都不知情。

没有科技公司想错过这波AI应用浪潮。况且,中国公司本就以擅长做应用层著称。

从公开信息来看,目前百度、字节、阿里等都在争分夺秒。

像百度,除了用AI改造原有App、上线文心一言之外,还发布了「万话」「小侃星球」「SynClub」等社交类AI应用、「文心一格」等AI绘画工具以及「AI用药说明书」、「智能候诊室」、「有医笔记」等医疗类AI应用。

暗中发力的「App工厂」字节,最近半年推出的AI应用不下10款,除了聊天机器人「豆包」、AI伴侣类「心晴」、AI社交类「话炉」(猫箱),类似Sora的AI视频工具「Dreamina」也在内测之中,而这些还只是字节野心的冰山一角。有媒体报道,字节还在秘密研发多模态数字人产品、AI生图产品,剪映团队也在封闭研发全新AI产品。

其他公司如科大讯飞,除了聊天机器人「讯飞星火」,也有AI口语助手「星火语伴」、讯飞写作、智慧工牌等效率工具上线……此前专注技术解决方案的AI技术公司商汤科技,也在发布自家大模型之外,下场搞起应用,推出「商量」、「秒画」、「如影」「小浣熊」等生成式AI应用产品,并将生成式AI应用列入今年的重点发力方向。

在国内外基础大模型厂商、技术解决方案商、开发者、投资人的联合推动之下,AI应用正进入一个供给侧的爆发阶段。2023年,软件项目托管平台GitHub人工智能项目的数量暴增59.3%。百度方面数据显示,截至今年3月,其千帆AppBuilder平台上每周新增应用突破3000;到4月,平均每周新增应用达六七千个。

在北京的地铁车厢中,甚至已经出现智谱清言这类对话式AI应用针对C端市场的高调推广。在此之前,同类型的Kimi已经在线上渠道刷足了存在感。

AI大模型催生App「通胀」

C端用户也正对AIGC报以极大热情。根据QuestMobile的洞察,独立APP的需求持续增长。2024年1月,TOP10 APP去重用户规模同比增长37倍。头部APP的活跃用户超5千万。

AI大模型催生App「通胀」

不过这场爆发的「暗面」则是AI应用的速生速死。去年9月,美国知名科技风投公司a16z根据月访问量整理了一份Top50 AI应用榜单;今年3月,该公司推出最新Top50 AI应用榜单时发现,名单上40%的应用都是新面孔。这意味着,半年内至少有20款AI应用已经掉队。

对于这个数字变化,a16z表示,「令人瞠目」。

QuestMobile数据也直接印证了这一行业趋势。今年1月,国内头部AIGC APP活跃率均在20%以下,比较低;忠诚度方面,3日留存均在50%以下;流失风险高,部分APP的卸载率在50%以上。

这一点同移动互联网时代不同。移动互联网初期,一大堆高频的原生应用很快被创造出来,并形成崭新的商业模式,比如国外的Instagram,国内的微信、滴滴……「但AI目前还没到这地步」,独立开发者「Alchain花生」认为,当下AI应用更多是在提升既有产品的用户体验,而且主要作用在生产力端。

AI应用进展比大家期待的要慢,背后主要「卡脖子」的大概还是基础大模型。打个不太恰当的比方,45亿年前地球诞生之初是不太可能出现寒武纪那样的物种大爆发盛况的,因为地球本身仍处于剧烈变化中,动不动就被其他行星碰撞,还没有大气保护罩,可以说,尚未完成塑形。只有等地球内外部环环境于相对稳定了,才有生命可言。

大模型便处于类似的阶段。业内人士公认,大模型的迭代几乎以周为单位。反映到科技媒体的资讯弹窗中,「炸裂」这个词都快不够用了,因为每隔几天就会有新的颠覆者出现。

MiniMax创始人闫俊杰在接受《晚点》采访时提到,产品价值的来源,核心还是模型性能和算法能力,「你可以做很多产品feature,但你会发现,几乎所有大的提升都来自模型本身的进步。」

传说中将于今年登场的GPT-5,被认为将掀起更大的海啸,或者说成为AI发展史上举足轻重的一个分水岭。某工具软件出海企业人士姜辛在同《降噪NoNoise》交流时提到,今年可能会有一大波套壳类应用受到大模型迭代的挤压,预计会死掉一批,「基础大模型自身功能的迭代,就可能替换掉那些App的产品价值。」

对于这一点,曾经的AI文本生成工具明星——Jasper大概是如鲠在喉。而OpenAI 发布新一代视觉大模型Sora后,也有业界人士担心Pika、Runway等一众AI视频产品再无活路。

在「Alchain花生」看来,一些没有护城河的AI应用原本就属于「屎上雕花」,价值不大;但一些工具类产品在跟场景结合后产生价值的,不至于被颠覆,比如Monica、sider、沉浸式翻译等插件应用。它们把大模型能力和用户实际使用场景结合后,都提供了不错的价值。

二、有价值的AI应用,都跟特定场景结合

价值正成为衡量AI应用会否被技术迭代所覆盖的重要标准。

在a16z整理的AI应用榜单中,生产力工具类应用MaxAI,把ChatGPT、Claude、Gemini/Bard、Bing AI等模型的部分能力抽离出来,整合到一起,基于应用场景做一个封装的插件,可以帮用户总结文本、辅助写作、创建图像。

本质上,MaxA做的是「水管」生意。有业内人士透露,该团队已获得高额融资。

另一款受到关注的Chrome插件——Monica,其创始人肖弘在阐述产品价值的时候提到,他们做了很多很具象的场景里面的工作,比如回邮件、帮用户总结文章或者在用户打开一个YouTube视频的时候,帮其总结每段内容。这些功能都通过插件潜入浏览器,因为浏览器插件在海外是一个比较主流的产品形态。

AI大模型催生App「通胀」

在极客公园大会上,肖弘还提到关键一点,应用层创业者应该想办法收集用户在特定场景的数据,有了数据,AI应用便可以与大模型这个大脑形成协作关系。

数据也是很多AI应用即便没有找到商业模式、也会依然做下去的原因。姜辛告诉我们,像个人助手和效率工具,可以积累用户数据、行为数据,这样在产品下一次迭代时就有了数据参考。

至于基础大模型迭代带来的App「短命」,姜辛坦言,这样也好,倒逼C端应用继续迭代、在细分场景做深,也倒逼开发者思考——产品下一步要往哪个方向迭代?护城河是什么?「打个比方,剪映是通用的视频制作工具,但创业者可以根据剪映拆分出细分功能,单独做成产品。

姜辛认为,C端应用比B端应用更容易触及天花板,因为当前字节、百度这类大公司,甚至商汤科技这种技术方案提供商都开始下场做AI应用了,竞争会很激烈。

AI大模型催生App「通胀」

对于小规模的大模型初创公司来说,关键是如何能够找到自己的竞争壁垒。趣丸网络副总裁、前经纬中国副总裁庄明浩此前对媒体表示,他观察到,很多初创公司转向了「小作坊做小工具」的模式:先找准一个市场上还没有的功能与产品,抓住窗口期,通过运营手段快速推广,哪怕这个窗口期只有3到6个月,也可以挣到一笔钱,而后继续寻找新的市场机会。

以妙鸭相机举例,这一产品刚推出便受到了市场的追捧,从第一天便开始收费,但两个月后市场的热度也很快就降了下来。这与移动互联网时代的应用早期通过免费争夺用户市场,而后再逐步开始收费的创业模式已经完全不同。

沪渝人工智能研究院的徐工程师告诉我们,AI时代和移动互联网时代创业最大的不同是,当时大家最主要的关注点在于抢占市场份额,但现在大家主要是在探索商业模式。

量子位智库新近发布的《中国AIGC应用全景报告》显示,C端AIGC产品以智能助手以及图像生成类的生产力工具为主,虽然用户量大(纯C端占比50%以上),但盈利状况普遍不乐观,近50%的产品当前仍未有明确的收入模式,以免费为主。相较之下,B端产品商业模式较为清晰,以订阅和按需付费为主。

AI大模型催生App「通胀」

姜辛直言,包括他所在公司在内的很多应用开发商,大家其实都想去切B端场景,瞄准行业+AI,但囿于缺少行业kown-how,其实也很难切进去,更别提大幅改造。

在同《降噪NoNoise》交流时,蚂蚁数科某业务负责人也认为,大模型加持下的场景化能力要想在产业端落地、做出价值,还需要一点时间。这个「价值」,要么让此前的业务更有效,要么让企业能做此前做不了的业务。但目前来看,大多数企业还在探索阶段,「没那么快」。

如果从全球视角来看,追求风险投资也成为一类AI企业的专属道路。例如意大利科技公司Bending Spoons,便是视频编辑器Splice和照片增强器 Remini的幕后推手。不久前,该公司对外宣布获得了1.55亿美元的股权融资。

三、急不来

按照人工智能研究者、认知学家Gary Marcus的判断,生成式AI要达到互联网甚至智能手机带来的那种变革水平,还须有巨大的改进。

一个繁荣的AI原生应用生态,需要大模型、智能算力、AI原生应用研发新范式三要素相辅相成。从这个维度来看,杀手级的AI原生应用的问世是急不来的。

熵基科技首席科学家陈书楷直言,「大家要去做开发、做测试,要克服各种困难,解决各种各样的实际问题,所以不可能太快,但是润物细无声,大家确实都在做。」

他认为,作为AI应用的开发者,大家首先要关注的是AI怎么去解决实际业务当中的问题,再者就是随时关注最新的技术发展。

陈书楷看到,当前各种应用模式也是在不断的成熟和发展的过程当中,比如基于知识库的应用、基于Agent的应用,都会不断的有新的成果出来,这些成果能够直接提升现有AI应用的水平。与此同时,大模型本身的基础能力在不断提升,AI应用的一些局限性也会不断被打破。

业内不少人认为,AI Agent或许可打造出AI原生场景及应用。AI Agent是指在人工智能领域具有自主决策能力、环境感知能力和反应能力的智能体。AI Agent强调主体的自主性、反应性、主动性和社交性等方面的能动特征,而具有理解生成、复杂推理、自主学习等类人脑功能的大模型,则可以作为Agent的基础而存在。

当AI Agent以App的形态出现时,这也意味着,Open AI的GPT Store可能会面临来自APP Store的竞争。毕竟,Writerbuddy研报告中显示,超过60%的用户习惯于在手机等移动终端上访问AI工具。

这同时或许也表明,AI领域的创业公司们,可能会迎接更大层面的机会和挑战。

回望移动互联网时代,在2014年,中国智能手机用户首次超过5亿人,成为拥有智能手机用户最多的国家。疯狂生长的移动App正占据新的风口。2015年4月,我国主要应用商店的应用规模已累计超过400万个。

但这些App的生命周期平均只有十个月。其中,85%的用户会在1个月内将其下载的应用程序从手机中删除,而到了5个月后,这些应用程序的留存率仅有5%。

而这一场景,恐怕在AI时代只会愈发惨烈,AI应用「通胀」在所难免。

但即便如此,在同样大厂当道的当时,字节跳动、陌陌、滴滴等一系列创业公司,依然杀出了属于自己的生路。腾讯更是凭借微信,将原本平起平坐的对手们远远甩下。

那么,在可能新一轮时代「金矿」中,又有谁可能会成为新一轮的优胜者?谁有可能会被时代抛下?对此,我们充满好奇,只不过,这一答案,要先交给时间。

(注:应受访者要求,姜辛为化名)

爆火的Kimi,抢了谁的生意?

aigc阅读(3)

一个仅成立一年的创业公司,一群顶着名校光环的90后,做出了一款效果出众的大模型产品,让整个AI圈震动。

自从妙鸭相机短暂出圈后,国内的大模型行业,已经很久没出现爆款产品,Kimi填补了这一空白。

最让人意外的是,A股股民也来凑热闹,各大炒股群讨论Kimi概念股,流量激增导致Kimi服务器宕机。

如今一个多月过去了,虽然热度减退,但身边依然有人在讨论Kimi。

北京一所高校的在校大学生告诉「定焦」,近期学校组织了学习会,安排老师学习Kimi,老师给学生布置作业,要求学习、训练Kimi。

在网络上,时不时能看到有人推荐Kimi,这其中有一些可能是定向投放的广告推文,但也不乏一些自来水。

Kimi带给人们的一个认知冲击是,AI发展太快了,创业公司也可以在短时间内做出让人眼前一亮的产品,相比之下,那些号称做了十几年、砸下千亿资金的科技大厂,不过如此。

Kimi抢走了科技大厂的风头,未来还可能抢走他们的用户。

问题是,火爆能持续吗?

一、谁在用Kimi?

Kimi是一个面向C端用户的智能助手,善于读长文、搜网页,主打功能包括整理资料、解读文件、辅助编程、文案写作等,被网友称为ChatGPT中文平替。

因为有ChatGPT在前边教育市场,还有文心一言、通义千问、讯飞星火等大厂推出的产品相互内卷,Kimi提供的这些功能,其实很多人之前或多或少了解过。

但对比之下,像Kimi一样让很多人自发使用,不只是厂商自吹自擂,还能让2亿A股股民狂欢的国产大模型产品,此前没有过。

Kimi呈现给用户的东西很简单:一个像百度搜索一样的搜索框,“文件,拖进来;网址,发出来”,然后用户可以直接针对发给它的文件或网址提问,让它帮忙总结归纳、分析数据、全网搜索。

图源 /kimi.ai官网截图

最大的亮点是它支持超长文本输入,一开始是20万字,后来增加到200万字,而当时纵观全球范围内的大模型,没有一个能超过10万字的。

这在用户体验上最大的变化是,你给大模型投喂资料,不用再把文件拆分成好几个了,直接丢进去就行,它都能很快读懂,还能“大海捞针”定位其中的信息,告诉你某个信息出现在哪一页。

看到这,Kimi的用途很明确了——长文本阅读和分析概括,可以理解为AI搜索+文档总结。它是一个生产力工具,帮助我们处理信息,偏实用导向,不是用来吟诗作画、聊天娱乐的。

这个定位,决定了Kimi的使用者主要是打工人。Kimi官方介绍文档中提到了六类人群:学术科研人员、互联网从业者、程序员、自媒体与内容创作者、金融和咨询分析师、法律从业人员。他们有个共性:要处理大量文档信息。

一位非诉律师对「定焦」说,之前经常用ChatGPT整理法律政策,利用它写报告、总结,但ChatGPT有个问题是每次输入的信息不能太长,比如一份1万字的材料,需要分成好几份,分批发给它才能进行分析。Kimi的长文本特点,解决了这个问题。现在他是两款产品同时在用。

一位自媒体从业者告诉「定焦」,他会用大模型分析上市公司财报信息,查询一些财务数据,在对比了文心一言和Kimi之后,他觉得Kimi更好用。“Kimi的功能很直接,简单好上手,总结归纳能力很强。”

不过,他们都表示,目前使用频率不高,更多是尝鲜、试用,因为AI生成的内容质量不稳定,有时候会出现胡说八道的情况,“可以参考,但不能全信。”

Kimi的开发者,是一个叫作月之暗面的创业公司,去年3月成立。Kimi去年10月第一次亮相,从一开始就主打长文本,对外宣传的噱头是“完整吃下了一本《三体》”。

亮相之后的半年内,Kimi迭代了三次。识别扫描件、上架小程序、联网搜索,以及将支持的上下文长度升级到200万字。

3月18日的200万字升级是一个转折点。在那之前,Kimi还是在互联网圈、大模型从业者,以及小范围的AI爱好者中传播,升级之后,Kimi成功引起了2亿股民的注意,出现一批Kimi概念股,Kimi APP和小程序宕机上了热搜,进一步传播出圈。

如今来看,Kimi能火,是多个因素共同促成的。首先是产品确实还不错,这是前提;其次恰到好处的营销,2月中旬月之暗面那笔10亿美金、号称国内AI大模型公司单轮最大金额的融资,极大增加了关注度;此外,Kimi概念股的发酵,来自2亿股民的神助攻,最后一举将Kimi送上了微博热搜和Appstore总榜前十。

Kimi的确是出圈了,这跟此前国产大模型只在业内人中传播不一样。不过,从总量上看,实际使用Kimi的人数还是有限,Similarweb监测到Kimi网页版的日活用户数峰值在三四十万的水平,全网日活峰值在百万水平。

对于一家创业公司而言,这个成绩相当不错。

问题是,为什么做成这件事的是一家创业公司?

二、Kimi做对了什么?

月之暗面不是国内最早那批做大模型的公司,在它之前,百度的文心一言作为ChatGPT之后第一个亮相的国产大模型,被认为最接近ChatGPT。此外,阿里的通义千问、科大讯飞的讯飞星火、智谱GLM,都已迭代了好几轮。

但除了厂商们的主动发声,国内一直没有出现C端用户真正认可、愿意自发为之宣传的产品。

一大乱象是卷参数、刷榜单。几乎每家在发布产品时,都要把GPT拉出来对比一波,找到几个指标把GPT超越——比如,中文能力。GPT成了靶子,被国产大模型轮番吊打。但业内人都知道,论综合能力,国内没有一个大模型能超越GPT4。

“刷榜”是大模型行业公开的秘密。国产大模型乐于刷榜,经常在各种榜单上排名第一。但多位做榜单测评的业内人士告诉「定焦」,大部分排名没有太大参考意义,跟“刷题”一样,不代表真实能力。

普通用户感到很迷惑,“你说你很强,榜单上有你,媒体推荐你,博主夸赞你,我就信了你,但用完之后,一言难尽……”一位试用过多款国产大模型的用户说。

国内做大模型的公司很有意思,有些是为了拉股价,有些是蹭热点,还有的就是想圈钱,动机很不单纯。稍微好点的,是为了赶超对标OpenAI,是为了要赢。

即便是把长期主义挂在嘴边的大厂,很多也是为了打赢对手,而不是想着怎么满足用户需求。

最典型的是阿里和360。Kimi宣布支持200万字超长无损上下文之后,因流量激增服务器崩溃上了热搜。然后第二天,阿里通义千问宣布免费开放1000万字长文档处理功能,号称“全球文档处理容量第一”,紧接着360 AI浏览器宣布内测500万字长文本处理功能。

好吧,大厂又“赢”了,他们又“第一”了。

有人点评:“既然你(阿里、360)知道长文本好,而且你也能实现,早干嘛去了?这是来给用户提供便利的,还是来蹭流量的?”

除了大厂,还有大佬。去年Kimi刚发布不久,李开复成立的零一万物,发布了大模型Yi-34B,能处理约40万字,是Kimi的约2倍,声称问鼎了多项全球英文和中文能力测试排行榜第一。但马上就有业内人指出,“Yi系列”的模型架构与Meta的开源大模型LLaMA相比,只改了两个张量(tensor)的名字,让其陷入套壳争议。

图源 / 零一万物官网

在这样的大模型创业生态中,其实只要产品稍微好一点,营销巧一点,时机把握好,很容易脱颖而出。

今年3月,AI创业者华融琦利用Kimi,写了一个《Kimi最全指南》的云文档,传播很广。他对「定焦」说,Kimi做长文本很早,从一开始就拿这个点做单点突破,给人留下了根深蒂固的印象,而长文本是一个通用性的功能,Kimi相当于是以功能和场景出圈。另外,创始人杨植麟超级学霸、AI大牛、90后的人设自带滤镜,在感性层面获得了外界更多支持,用户出于认可自发的宣传也给Kimi增添了不少流量和好感。

产品定位决定了市场策略。在国内大模型产品中,Kimi是少有的从一开始就明确只做to C,不做to B的产品。Kimi发布的第一天,杨植麟就说过,希望先提升模型能力,同时也会聚焦C端超级应用,通过产品连接技术与用户,Kimi是第一个产品尝试。

对C端用户的看中,决定了Kimi的产品体验不会差。无论是200万字的超长文本,还是拖拽文件的无门槛操作,以及简洁的页面设计,都能体现这家公司的用户思维。

BAT等大厂的大模型,做的很早,想要的也很多。在“做给谁用”这个问题上,大厂是典型的既要还要,既要吸引C端用户,又想让B端客户付钱,所以大厂基本都是把大模型跟云服务打包在一块,C端B端两手抓。

智谱AI是清华系的创业公司,全面对标OpenAI,公认技术实力强悍。智谱也有面向C端的产品,但落地方向以to B为主——智谱在机场广告牌上打的大屏广告,“助力千行百业加速迈向通用人工智能时代”,明显是给企业看的。

相比之下,Kimi是少有的从用户需求出发打造的产品。这不是说月之暗面的动机多么高尚,只是从结果来看,用户认可度更高。

三、抢了谁的生意?

作为一家创业公司,月之暗面少了些包袱,得到人们更多包容,这是大厂没有的优势。

去年3月百度在国内率先推出文心一言时,人们的关注点不是产品的功能表现,而是它有没有套壳,以及产品演示为什么是录播。

C端用户对大厂有一种天然的挑剔,甚至认为他们是创新的敌人。所以当杨植麟顶着90后创业者的光环出现时,很轻易就被贴上了颠覆者、破局者的标签。

那么,月之暗面的真实技术实力如何?Kimi的火爆能持续吗?

AI创业公司语核创始人池光耀认为,总体来看,考虑到长文本能力,Kimi是潜力很强的模型,能排在国内的第一梯队。

他对「定焦」分析:“Kimi对长文本的追溯能力很强,在给定材料中靠指令要求追溯特定信息的准确度很不错。即使是把指令埋在两三万字的小说中也能做到正确遵循。另外,它处理大部分日常任务的逻辑性能足够,虽然对超长材料的总结提取可能会漏掉部分细节,但能保留主体正确。”

图源 /kimi.ai官网截图

华融琦认为,各家大模型都有自己擅长的点,Kimi的优势是解读长文本,像是一个超级智能的文本检索器;智谱的智能体比较完善,搭建了开源生态,基于这个生态开发项目比较方便;MiniMax的模型比较懂人性,在角色扮演、情绪价值上有优势;文心一言的安全性和合规性做的比较好。

“Kimi确实是C端工具中最耀眼的,但在其他方面,比如AI系统搭建,光靠Kimi还不行。”华融琦说。

由此来看,Kimi只是在C端用户最容易感知的一些方面,暂时做到了比较好的体验,但这不意味着它就具备了很大的优势。

AI行业投资人柳笛对「定焦」说,现有的这些大模型,没有同一框架下的可比性,其实论综合能力,百度、阿里、智谱AI的产品是不错的,但Kimi在一些办公场景,比如复杂搜索、多轮对话、报告分析等方面好用,被用户当作辅助工具来用。

不过,由于产品定位清晰,Kimi已经对大厂的产品产生了替代效应,比如搜索。

“我觉得有了Kimi,基本可以不用搜索引擎了。”一位Kimi用户对「定焦」说,在他看来,Kimi的联网搜索+自动生成功能,对传统搜索是降维打击,“过去搜资料,你要从大量结果中自己去筛选、判断、分析,现在这些过程都可以省略,你只需要下指令就可以了。”

很多人没有注意到,Kimi爆火的那段时间,还有一款产品的流量也增长迅猛。根据“AI产品榜”的统计,AI搜索产品“秘塔AI搜索”3月访问量同比翻了5倍,在总榜中的排名快速爬升,仅次于文心一言和Kimi。

柳笛认为,Kimi对大厂接下来的策略产生了影响。“大厂明确to C finetune(微调)的方向了,更加看重paperwork的质量,而不是纯生成一些聊天内容,让用户调戏。”

当然,也有人对Kimi的可持续性持怀疑态度,认为它不一定能赚到钱。国内的大模型厂商之所以要做to B生意,是因为能看到明确的变现场景,C端产品难出爆款,出了爆款后算力成本是个巨大负担,让用户付费则考验用户粘性。而很多用户涌入Kimi,也是看中它是免费。

秘塔科技CEO闵可锐曾经直言:在国内不论针对什么环境,与国际市场的付费意愿相比而言是糟糕的。

“Kimi也没成功,它在试图先培养用户习惯,现在能维持百万DAU(日活),月推理成本都得大几千万,接下来大家就要验证收费了。”柳笛说。

华融琦认为,Kimi对C端收费是一个必由之路,“只是要看在什么阶段、对哪些功能进行收费,这就很考验Kimi的产品和定价水平。”

大厂转变策略后,对Kimi形成围剿之势,因此技术和产品的迭代速度很重要。

“AI这一波浪潮,大家达成共识特别快,一旦进入白热化的打仗阶段,不管是抢用户还是抢收入,恐怕不会特别久。”华融琦说。

* 应受访者要求,柳笛为化名。