欢迎光临
我们一直在努力

大模型没过“试用期”

aigc阅读(66)

东市买骏马,西市买鞍鞯,南市买辔头,北市买长鞭。

出自《木兰辞》中的诗句展现了充分竞争的自由市场中,供给方各司其职的状态。在同一市场内,消费者往往会从不同供应商处获取不同商品和服务,就像当下扎入垂直行业、走向定制化的大模型服务一般。

如果仔细观察诸如百度、阿里、科大讯飞等大模型服务商透露的产业方向的商业化进展,我们不难发现虽然其客户列表中重量级选手不少,但这些客户们往往“只取一瓢饮”,以探索的方式从点开始大模型及AIGC方面的合作。

新兴技术的未知性特点在大模型的算法黑箱下再度放大,导致产业在面对既往合作伙伴时依旧保持着相当的审慎——虽同为产业智能化,但模型服务的“完整性”远不如上云。这也导致了模型服务商扩大商业化的一个困境,即在体量不大的项目上投入大量定制化服务与资源,成为做多收少的“高科技施工队”。

然而吊诡的地方在于,而今增速趋近停滞的云计算市场已经发生了明确的转向,拓客方向自大客户转向中小客户。但模型服务却因以算力为主的基建成本高企,而难以跟上云计算的节奏,只能试图通过标准化产品广撒网,一点点啃下中小企业。

生成式AI代表未来已经成为业内共识,“断舍离”再难成为选项之一的同时,一众企业不得不迎难而上,冲突亦在这一过程中不断上演。

一、大模型需要好销售

过去一年多的时间内,商业化无疑是国内模型服务商最为关注的重要议题,以至于在一定程度上影响了服务商对模型及相关能力的迭代路线。

一个绝佳例证是,业内在模型易用性、工具链、避免“幻觉”等关乎使用门槛的演进频频落地。事实上,在2024年这一被定义为“AI原生应用”元年的时间节点,以低代码或无代码形式创建AI应用正逐渐成为现实,门槛或早已不是大模型商业化的首要难关。

此外,除少数闭源巨头外的开源社区也在持续缩小国内模型服务商的底座能力代差,几乎业界每每出现突破性的进展,其余主流玩家总能第一时间跟进,在Kimi近期掀起长文本风潮中,百度、阿里等玩家跟进并没有花多少时间。这意味着,通用底座能力难成大模型商业化初级阶段的胜负手。

事实上,在以AIGC为代表的产业智能化的创新扩散中,智能并不是关键,反而更像是一种“添头”。例如我们曾对话的一家SaaS企业,他们与而今逐渐深入业务流程的AI大模型的相遇,不过是一次偶然。

上述企业人士李浩告诉光子星球,就像许多深耕垂直行业的企业一般,他们对技术的感知不算敏捷,之所以了解到大模型,还是源于此前某场展会上的一次闲聊。

“腾讯那边有人和我们CTO聊了会,展会结束后,CTO觉着可行就跟市场部的人接触了”,他说,“机缘巧合下凑了一桌饭局,人家直接让业务VP拎着一大瓶酱酒来,推杯换盏间讲了很多大模型改造业务流程的事情,不过合作还是没能在饭局上谈成”。

尽管腾讯的合作意向非常明确,但李浩的领导还是有些兴致缺缺——早在去年,CTO便有意与业务数据所在的阿里云展开AI合作,但是“阿里那边迟迟不见动静,也没什么优惠”,这才给了腾讯半道截胡的机会。

另一方面,许多垂直行业早在两三年前就感受到了AI的冲击,但实际对业务的改造其实并不算明显。或许大模型的加入足以让AI脱胎换骨,但在销售口中天花乱坠的功能并不足以构成决策理由。

我们不难在云计算的政企BD中看到与之类似的销售场景——不可否认的事实是,“上云是一种趋势”的共识更多存在在互联网视域内,而政企侧对云的需求更多在于对顶层设计的考量。说白了,大多数非互联网企业应用新型技术的根本原因并非技术本身,而是需要“跟上同行的节奏”,AI大模型亦然。

当然,腾讯方面绝无可能放弃这条相对明显的线索,其还在饭局结束后多次登门拜访,“除了婉拒给我们独家提供技术支持外,我们提其他的条件,基本都答应了”。在这么一个几近赔本赚吆喝的情况下,腾讯才堪堪拓展一家企业客户。

据了解,这家SaaS公司经过数月的“AI初体验”后,最终决定在年中前后扩大合作范围。届时,腾讯作为模型服务商提供的由点到面的服务才刚刚开始,成本回收尚不知时日,遑论凭此盈利。

云计算行业从“比较技术性的超前概念”到“上云是一种趋势”,花了足足10年时间。反观技术深度、黑箱、幻觉等问题并存的大模型,似乎其商业化的路途更为崎岖。

这么看来,与其在产品层面持续做加法,倒不如多下功夫挖掘销售线索。另一方面,完善的BD体系也在一定程度上可以打破技术认知的高墙。可惜的是,在大模型技术尚未祛魅的当下,厂商的外宣重点往往落在技术突破上。进一步说,当大模型服务可以像云计算一般召开合作伙伴大会的时候,或许大模型商业化才能迎来真正的春天。

二、大模型需要CIO

模型再强也只能解决业务上的问题,其商业化困境本质上不在于技术,而在于商业模式和生态。不过自模型服务商的视角看,模型服务普及的“鬼故事”同样不少。

正如上文提到的SaaS企业,便在希望更广泛地接入AI能力时犯了难。“现在我们内部可以说是跑着两套系统,内部业务流还像以前一样跑在阿里云上,但尝试对外输出的AI大模型能力却跑在腾讯云上。领导那边还希望再引进语音、OCR之类的AI支持,又准备让我们接触一下科大讯飞”。

李浩无奈表示,现在公司有点“骑虎难下”,既不太方便彻底抛下阿里云做整体数据迁移,又不好再拓展与其他厂商的AI合作,毕竟这背后是搭建混合多云架构的隐性成本。他还提到,前端时间领导才刚刚因为销售团队开不出单而大发雷霆,在AI大模型尚未展现盈利能力的情况下,狠下心全面转投腾讯云怀抱可以说是不可能的事情。

不难看出,即使是有意引入AI能力改造业务的企业,由于领导层对AI大模型的了解仅限于网络公开信息与模型服务商的单向度灌输,其往往对市场没有一个清晰明确的认知。这家SaaS企业在采购决策上犹豫不决便是绝佳例证。

况且,非互联网企业的组织架构也是遭致上述情况的重要原因。或许大部分组织完善的企业都设有CTO职位,但其既有知识域基本局限于企业业务,而设有CIO的企业可以说是寥寥无几。

据红杉于去年末的一次调查显示,以CIO为代表的企业技术管理者将通过应用AIGC满足产品差异化和服务创新需要、增强办公效率与内部沟通作为主要目的;相较而言,CEO则将紧跟前沿技术趋势、拓宽企业经营边界作为AIGC应用的核心动因。哪种更利于AI对业务的深度改造,一目了然。

如果CIO的缺位不过是将AI大改造交由CEO或CTO统筹的话倒也还好,更糟糕的情况是在买方市场下,这份重担被转嫁给模型服务商。在一位模型创业者看来,这无异于是化身客户企业刚刚萌生的AI业务的“保姆”。

“前阵子,和我一起创业的产品经理差点顶不住与客户之间无休止的扯皮,闹离职”,他说,“我那时候还在美国那边做交流,听他辞职信都写好了,我赶紧打飞的回去,好说歹说才劝住他”。

据悉,事件起因是客户在为期三个月试用期内,就提出做多个深入业务流程的应用,从早期的基于RAG(检索增强生成)的企业内部知识问答到数字员工再到智能营销,可是试用项目的合同金额才30万。可怜这位产品经理在试用期内每天抓耳挠腮地控制交付成本,团队两天一小会三天一大会,然而客户还是在试用期结束后便接洽了服务更为成熟的大厂。

定制化项目在固定时限内的交付,将模型服务高大上的“皇帝的新衣”无情扯下,空留一个期货般的内核。

当模型服务商被迫在客户企业的AI改造中承担主要责任的时候,所谓产品的价值交付也就不再存在,取而代之的是极致的成本控制和交付压力。如果不能完全把握客户的需求,那么深入合作破裂也不过是时间问题。

三、定制化之困

近段时间,国内一级市场对AIGC的热情愈发低落。著名投资人朱啸虎亦公开表示,“AIGC PMF(产品/市场匹配),你投十个人找不到,投一百个人同样找不到。”

不可否认,在难销售、难交付、高成本的特性之下,大模型距离养家糊口的距离太远。那么,大模型PMF的终极阻碍是什么?

从上述案例中我们不难看到,首当其冲的难关在于定制化。

这背后的逻辑是,技术尚未进入创新扩散周期之前,依靠标准化产品回笼资金遥遥无期,高强度的BD以及其后的定制化是现金流的唯一来源。而定制化项目扯皮、交付、成本等各种窘境的缘由,则在于服务商丧失了对需求的控制力。

设想一下,如果是模型服务商自己训练某个MoE模型或是针对业务创建AI应用,在技术一把手的统筹下,只需对应业务部门给出明确需求以及不同优先级,便可以按需求驱动的方式进行敏捷开发,确保项目能在时限内以较高完成度交付。

如果将AI开发场景放到模型服务商与客户之间,则情况很可能“两级反转”。一面是客户并不真正了解AIGC对业务创新的抓手所在,导致需求频出而没有重点,另一面是服务商在不断提出的需求中疲于奔命。

如果服务商能在提供服务时获取行业数据的话,转起数据飞轮从而迭代垂直领域能力倒也是一笔不错的买卖。只是大多体量稍大的企业都对自家数据敝帚自珍,导致定制化项目做来做去都没有太多实际收益。

可以预见的是,定制化作为大模型商业化的一个补充手段,很可能只是少数大客户的专属。标准化产品做铲子以及建立在其上的应用生态才是淘金者的未来。

AGI的愿景虚无缥缈,长期主义也不过是商业化举步维艰的推辞。无论是靠定制化拉起营收从而做好市值管理,还是靠标准化打开认知从而将创新扩散出去,这锅夹生饭怎么着都得把它吃下去。

“每天只睡5小时”,大模型在火热落地中

aigc阅读(87)

中工互联董事长智振,最近经常奔波于前往各地的高铁上,见客户、签订战略合作、推进大模型落地,“比起一个月前更忙了”。

3月中旬,智振曾向数智前线分享自己的工作状态——“一天就睡5小时,光战略合作都忙不过来。今年的目标是面向能源等工业领域,落地至少几百、上千个大模型项目。”

而这种忙碌状态同样存在于数智前线接触的多位行业大模型落地服务商中。业界观察,行业大模型,正在以一种意想不到的速度,加紧落地。

水面之上,或许仍旧平静无波,但水面之下,早已激流暗涌。“现在大家还在水面下,下半年应该都会浮上来一些。”在金融行业做大模型落地的宽客进化CTO王舸说。

一、“每周以10个项目的数量增长”

被业界视作“大模型落地元年”的2024年,刚过去4个月,已经涌现出火热氛围。

“去年,主要是试的人和看的人比较多,愿意付费的人很少。”云问科技联合创始人茆传羽告诉数智前线,但今年,付费人群明显多了起来。

一位行业人士观察,以2024年春节开工后第一天,国资委召开“中央企业人工智能专题推进会”为风向标,大量央国企开始大面积寻找合适的业务场景,市场氛围被迅速带动,大模型服务商们接洽的项目也在快速增长。

“客户现在热情似火。”AI智能化服务企业众数信科创始人兼CEO吴炳坤说,去年,都是他们主动去找客户,但今年元旦过后,已基本变成“被动接洽需求”。2024年一季度尚未结束,这家公司处在PoC、走合同、实施交付等不同环节的需求数已有上百个,远高于去年10余家的量级,且每周在以10个的数量新增,“我们不得不开始筛选”。

宽客进化CTO王舸则透露,去年他们在大模型上几乎没有落地项目,但今年,他们已经签约好几个百万级的合同,涉及金融、电力、运营商等多个行业。其中,一些相对浅层次的需求,如大模型与传统标准作业流程的结合,目前落地相对良好,但一些更深层次的需求,如专家经验与大模型结合,还处于初级阶段,“这块的项目现在正在研发阶段,下半年可能会有一些落地案例出来。”

“围绕市场热点,主动找来的客户也有不少。”王舸进一步说,比如个性化写作场景,又如一些企业提出,是否能将数据要素和大模型这两个今年最为火热的概念结合起来。“比如数据入表,数据分级、分类,数据怎么溯源,以及数据需求方在交易所进行数据交易时,怎么在成千上万的数据产品中自动匹配需要的数据,这些都是大家在构想和探索是否能用上大模型的方向。”

“大模型的加持,对现在大热的‘数据要素×’三年规划来说,是一个巨大的催化剂,能让很多客户很快地感受到数据带来的价值。”浪潮云总经理颜亮说。

一些聚焦在更为垂直领域的大模型落地服务商,也明确感知到了变化。

云蝠智能创始人魏佳星告诉数智前线,他们主攻的基于大模型的智能客服业务线,今年比去年同期增长了30%的订单。而且今年的增长要比去年更加稳定。“去年3月,受大模型热度刺激,我们取得了不错的增速,但很快又在4月回落,但今年4月,不仅维持住了3月的增势,还继续保持了增长。”

高新兴机器人首席技术官刘彪则透露,机器人已成为大模型最快落地的领域之一。今年底左右,他们结合大模型的机器人产品将可能全面商业化。目前,在工业领域,高新兴巡检机器人在解决“跑冒滴漏”的难题,处于试用阶段;在物业等场景的烟火检测已商用落地。

而一些服务商,已经考虑规范化复制的问题。中工互联董事长智振透露,今年开始,他们将过去一年探索出的能做的方向全都产品化了,“一旦产品化,推广复制就会很快”。

吴炳坤也告诉数智前线,由于产品化,他们一些客户的交付落地时间,已经从过去的三个月,缩短到半个月。而今年,这家公司的目标,也不再是要拿下多少个客户,而是锁定两大行业、6个细分子行业,做15个标品化的产品出来。

“今年的大模型应用肯定会爆发,这个速度会比想象的要快得多。”智振说。

不过也有资深人士用“方兴未艾”来形容大模型目前的落地势头。“今年我们看到很多头部企业都动了起来,但大多都还是一些单点的应用或几个场景的组合。”一些人士表示,大家都在等待C端和B端的杀手级应用出现。

浪潮云CEO颜亮认为,从单点到全流程植入才能带来质的变化,可能需要1~2年,其中关键是大模型要经过周期性迭代,才能达到可用。“最多两年时间。竞争会促成大家的互相学习和投入,我们感知到,2024年用户在大模型上的投入,是2023在3~4倍以上。”

二、“在定价上遇到了‘挫折’”

春节过后,百度智能云渠道生态部总经理陈之若他们发现一个现象,一些大模型服务商,在帮客户做完PoC后,在定价上遇到了挫折。

“服务商起初自己也没有概念,打个比方假设以前产品卖两万块钱,加了大模型后定价三万五,服务商觉得是比较合理的,因为我给你降本增效了,但客户反馈‘效果不错但贵’。”于是,大家开始掰扯定价、交付和服务的事情。

这对于服务商来说,既是挑战,也是一个积极信号,因为大模型开始迈出商业化的第一步了。

定价背后,也有关于ROI(投资回报率)的考量。

“客户对于最终的产出物其核心关注的点就是ROI。”曹玺说。但大模型销售的更多的是服务,看不见摸不着,客户不容易算出ROI。

“这就需要服务商去帮客户把ROI明确出来。”软通动力罗晟告诉数智前线。比如,给企业售后场景赋能。原来一个售后人员即使经过好几天的培训,想要精准找到每个产品的售后问题,也要花十几分钟。但现在有了大模型助手,可以秒级辅助他们找到问题。这对于客户来说,就是一个ROI比较高突出的场景。

而曹玺介绍,当下ROI的测算需要拿效果说话有时甚至是较为直观的计算。比如,工作效率的具体提升,获新客户与客户转化的量化、购买数字人的成本比对。

几位行业人士谈到了大模型替代员工的敏感问题。“我们并不是说,大模型能减掉他们多少人,而是减少员工一些程序性的事物,提高效率,去做更有价值的事。或者可以有更多资源做新业务。”一位大模型服务商观察,他们遇到一家医院科室主任抱怨,自己手下那么多博士,整天在办公室写病历,根本接触不到患者。他们就想解决这个问题。

三、大模型场景落地要“短平快”

场景的选择,同样考验服务商的能力。吴炳坤告诉数智前线,过去一年间,行业内不乏“叫好不叫座”的情况。“大家的场景需求很多,但都是在做PoC,真正要让客户愿意付钱,还有蛮大的门槛要迈过去。”

智振则总结,“一年能回本,客户很容易接受;三五年回本,客户就要考虑考虑;7年回本,肯定得政策强制要求了。”这要求他们必须首先找到投资回报高的点来做。

为此,不少服务商都会选择小点切入的策略,快速形成闭环来看效果

比如新致软件,最开始实际是以咨询师的身份,切入到膳魔师项目中,并在多轮沟通和探讨中,发现了老板在了解公司运营情况时耗时过长的痛点。通过在工作群中引入数字人,收集对话素材,并进行模型微调后,实现对管理层需求的快速响应。

“原来一个数据报表的诉求,大概需要2~3周,现在可以缩短到一天。”曹玺告诉数智前线,这大大提升了管理层的决策效率。而在内部跑通几个场景后,新致软件又帮膳魔师进一步打通了外部场景,落地了to c的7×24小时的AI助理。

我们现在所有项目都是按‘短平快’的方式去做实施。我们会帮客户把一个大的需求,切到一个个比较小的点,逐点试错,逐点突破,而不是像以前做软件一样,一个项目做上半年一年,客户才能看到效果。”曹玺告诉数智前线,这样既保证客户能快速看到效果,也能根据客户反馈,更快发现问题,“少走弯路”。

“你要知道客户到底在做一门怎么样的生意,他最想达到的是流量盘活、转化率还是更精准的获客?你要不断的去了解客户业务诉求,同时要不断去做复盘和打磨。”曹玺说。

众数信科也在场景选择上提出了“小切口、大纵深”的策略。而为了避免大模型前期落地效果与客户预期之间因偏差而导致客户中途放弃的情况,有经验的大模型服务商,在锁定某个场景后,还会主动降低客户的心理预期。

中工互联智振也告诉数智前线,大家现在的想法都是优先把一个点打透,然后再基于这些成功的经验,做全链条的整合。“现在已经有客户与我们做了两年的规划,一点一点来做。”智振说。

技术和服务的延续性也被重点强调。“我经常被问到,大模型技术发展那么快,我们之前的选择的大模型会不会过时?为它做的定制、数据标注会不会失效?”百度智能云AI与大数据总经理忻舟说。

吴炳坤也告诉数智前线,大模型迭代太快了,但企业内部又基本没有专门的AI人才。这就要求服务商要形成一种新的思维——大模型时代的项目不再是交钥匙工程,而是需要提供教练式的陪跑服务,“陪着客户不断优化它自有的模型”。

四、大模型落地成本在下降

企业一旦在某个场景验证模型的价值后,第二步关心的就是如何降低成本。

“现在最常见的成本区间,主要有两级。”宽客进化CTO王舸告诉数智前线,一些简单应用,比如个性化写作、在传统BPM流程中串接大模型能力等,一般可以直接调用API,成本较低,二三十万元即可实现落地。另一极则是一些需要与专家经验深度绑定的项目,会有私有化部署要求,成本普遍在百万元起,甚至四五百万

“二三十万元的市场,今年会非常卷,而跟业务深度绑定的市场,是大家想做,但目前做起来还比较困难的市场。”王舸说,尤其是需要私有化的项目,算力会是一个比较大的困难。

实际上,为了解决算力难和成本过高的问题,业界目前已经探索了一些方法。比如,企业除了使用纯私有化的模式,也可以选择“公有云的私有化”模式,即在公有云上开一个私有化的环境,达到节省成本的目的。

“目前,像银行等有着严格数据不出域要求的金融企业,基本都还是采用前一种私有化,而在零售、酒店和文旅等数据管控没那么严格的行业,则有不少企业倾向于选用后一种模式。”新致软件曹玺告诉数智前线。

算力不足的情况下,通过CPU进行推理,也被不少人视为一个可选方案。“7B以下的模型,一般的推理场景,CPU目前是能够满足的。模型再大一点,30B~70B,速度会明显变慢,但一些不需要实时交互的场景,CPU也是一个比较好的解决方案。”王舸说。

更重要的是,模型轻量化的趋势,以及MoE概念的火热,也降低了企业客户对算力资源的诉求。

可以看到,通用大模型参数虽然已从上千亿走到万亿级,但具体到行业落地上,却不是参数规模越大越好。在海外,Meta发布的Llama系列模型,从70亿、130亿、330亿到700亿不等。在国内,百度、阿里、百川等都发布轻量级大模型。

“很多场景其实并不需要全知全能的能力,而是需要一个行业专家来解决一些专业的问题。”吴炳坤说。根据他的经验,在很多垂类场景中,通过剪枝蒸馏等手段,压缩出一个百亿级的基础模型,最大程度保留行业通识和能力,再结合企业的私有数据,也能实现千亿级的效果,推理成本更低,使用也更简单,是目前企业欢迎的做法。

“在行业中,我们认为7B-70B性价比最佳。”浪潮云CEO颜亮透露。

吴炳坤告诉数智前线,通过模型轻量化,他们已将包含算力、模型、应用等在内的落地成本做到几十万到小一两百万元的成本这也是不少中腰部企业普遍能接受的价格区间。智振则透露,现在做大模型私有化部署,成本已降到百万元起,一些小的嵌入式产品,比如1.6B参数、能放到一台单机上的模型,甚至可以做到5万元起

一些企业探索MoE(混合专家系统),以实现用更合适的性价比。MoE的全称是Mixture of Experts,被认为十分符合人类社会的分工概念,它通过“专家+路由”的机制,将不同问题交给对应领域的专家来解决,理论上能在算力成本不增加的前提下,显著提升Transformer模型的性能。

去年年中,GPT-4曾一度被传由8或16个MoE构成,这一概念随之在业内引起关注。几天前,腾讯混元宣布完成架构升级到MoE。

智振告诉数智前线,大模型会和第二次工业革命中兴起的电器一样,“最终并非一个电器通用,而是会涌现出各种各样的电器,从灯泡到电饭煲,它只会取决于不同场景下怎么样的性价比最高,怎么样的功能最强,客户接受度最高。”

李彦宏则在此前的一场演讲中指出,未来大型的AI原生应用基本都是 MoE 架构。

值得关注的是,多位业内人士告诉数智前线,MoE目前仍处于发展早期,还存在不少挑战。一些人士认为,它的技术复杂性太高,投入产出比不太匹配。也有人士表示,MoE需要资源较多,在响应速度和算力占用方面还有较大提升空间。

过去半年,大模型的技术进步速度极快,也推动行业落地的大潮在快速演进。

AI Agent推荐,把一群助理拉到聊天框里过一把领导瘾

aigc阅读(75)

近期,一条消息突然闯入眼帘,钉钉上线了钉钉AI Store。

带着好奇心打开许久未开的钉钉,在应用中心,多了一个tab“找AI助理”。

做为已经使用了一年多GPT+NewBing的用户,内心是有点瞧不上这次更新;

这不就是模仿GPTs,所做的AI Agent而已。

在实际使用过,才发现是自己EGO过大了,这次更新真的没有想象中那么简单,下面我将从几个实际的体验结果,带你了解钉钉AI助理真的没有我们想得那么简单…

一、初体验钉钉AI助理

首先, 只要更新到最新的钉钉,无论是移动端或是电脑桌面端,都可以从原本的应用中心下,找到“AI助理”,快速浏览200个左右现成的AI助理,且涵盖了多个领域,仿佛让每个打工人都不花钱地拥有了一批工作助理,随时待命。

在这里还提供了试用AI助理的功能,你可以先从侧边对话框中,尝试让AI助理完成你所交代的任务,如同面试、或试用期般,可以先尝试与AI助理协作看看顺不顺手,喜欢的话,在点击右上角的添加,把AI助理添加到日常工作的聊天列表里,随时可以从聊天继续呼唤AI助理协作,完成工作任务。

这段用户体验,真的让人仿佛获得到一位线上助理,如同平时在公司工作中在钉钉交代任务给实习生、助理帮忙协作的感觉,除了无法见面沟通外,真的就是多了一位工作上的小帮手,降低许多原本需要花许多精力的事情;

虽然市面上的AI Agent也不少,但能像钉钉AI助理这般,直接融入日常工作协作的工具中,形成工作流程闭环的产品,目前钉钉AI助理算是独一档的存在;拉了一排AI助理到聊天列表上,真的有种当上一个不小团队领导的幻觉,哈哈哈。

当然,也是有一些钉钉上的AI助理会有出现Bug的情况,发了好几次链接,就是无法顺利完成脑图的整理,过了几天才恢复了正常…

二、推荐几个好玩、靠谱的钉钉AI助理

1. 脑图专家

虽然刚刚吐槽了他刚上线时出bug,根本work不了,但过了几天后,我突然一试,可以正常生成脑图了,真的是非常方便,只要把想要整理、或粗略了解的文章,直接丢给他,但就帮你整理成一个个有结构化的脑图,帮你省去不少阅读、整理、理解的时间,尤其在工作上有很多资料需要消化的时候,快速阅读整理后的脑图,了解内容的大框架与脉络,便能快速地过滤、消化材料,真的不赖~

2. 小筑设计助手

虽然这个小筑需要支付额外的订阅费,但初次使用时,可以免费试用16天,在使用上整体效果还是令人惊艳的,只要随手画几张草图丢给TA,TA就能帮你渲染出一张张完整的建筑设计效果图,如是建筑相关行业、或设计师,这个AI助理能快速帮你省去不少精力,帮你做出完美的建筑效果图或建筑背景…

3. 行业知识树

行业知识树,这个AI助理跟上面的脑图专家AI助理有异曲同工之妙,但核心不同的是,TA只要你大方地将想要了解的行业告诉TA,TA就会自动搜集、整理出该行业底下的100个关键词与对应的解释,借鉴了麦肯锡的100个关键词快速了解一个行业的理论,真的是调研、学习的好帮手;

脑图专家是扫描仪,帮我们快速过滤内容的可读性、与结构化整理;行业知识树是精华行业百科,随手一翻就能快速入门任一行业的基础知识。

4. MoLook创意生成

这个AI助理就不得了,可以当你的服饰模特外,还是非常厉害的服装设计师,可以快速通过你给的关键词或描述,生成对应的服饰结果,还可以生成逼真的模特试穿效果图,大大降低请模特拍摄的成本,非常适合中小型电商、或个体户商家使用。

5. 薪酬分析助理

虽然薪酬分析助理跟其他AI助理稍微有些不一样,TA基本上不算是完整的AI助理,不像其他的AI助理可以直接在聊天框里就反馈你交代的任务,但TA仍然提供了一些简单的指导、说明,带领我们打开智能薪酬分析的钉钉应用上去使用;

虽然TA的智能程度不如其他AI助理,但TA仍有非常强大的薪酬分析能力,也值得我们借鉴,现在我们不止可以通过KOL、效果广告去帮我们的品牌、产品做宣传,也可以学习这个TA,制作一些吸引人使用的AI助理,让AI助理帮忙我们的品牌、产品导流,相信这未来也会是越来越多公司会不愿错过的流口入口之一…

6. 打工搭子

相信打工人总会有上班上得莫名其妙厌烦的时候,不管忙或不忙,就死活不想干活,却又要装得在干活,这个AI助理就很适合这个Moment使用,提供了几个不一样好玩的文字对话游戏,让你假装在跟协作方、客户讨论沟通,其实是在给自己的情绪做个心灵SPA,是短暂舒压的好助理。

三、体验总结

1. 开放才能共赢

开放共赢,我个人感觉就是刻入阿里巴巴的DNA,做为国内最大的企业沟通协作工具钉钉,不仅开放了第三方应用接入,AI时代的当下,还开放了AI助理,让各路好手能到这里制作出不同有趣、好用的AI助理给打工人排忧解闷,同时也给第三方带来流量或收入,让钉钉生态中的协作方皆能从中获得到各自所需的,形成生态中的良性循环:吸引更多用户使用,让更多协作方获利,进一步吸引更多协作方入驻,提供更多好用的AI助理,再进一步吸引跟更多用户使用…

2. 好的AI Agent体验,是被主动反馈

虽然现在AI Agent的产品很多,也有很多功能很强大的AI工具可以使用,但无一例外的,就是你得在浏览器上开各式各样的网页来与TA们保持联系,一不小心就点击到关闭网页,得重新找到网址打开TA们…仿佛你得求着这些AI助理帮你做事,且得在各种花里胡哨的对话框中传达任务指令;

现在你不用再辛苦到处收集AI助理的网址,只需一键就添加到钉钉的聊天列表里,随时一句指令,就会在聊天列表开始工作,并把任务成果回传给你,与平时领导交代你任务,你处理完回传给领导一样,让打工人也过过当领导的瘾,只动动口就能有AI助理帮你完成任务,多么好的体验。

3. Agent与工具,要聚在一起,才会有综效

综效(Synergy)就是我们管理学上常说的1+1>2的理论名词,现在的AI虽然对用户需求的理解已经很高,但对任务的处理逻辑能力、运算能力还不是特别足够;而工具应用是已经有很成熟、很强大的功能可以处理任务,但却无法很好地与用户沟通,让用户轻易地上手。

但在钉钉内部,就实现了AI助理与工具在统一生态中,你可以通过AI助理的协助,帮你轻松地上手使用工具,处理掉工作中难度较高的任务,也可以直接让AI助理帮你解决掉工作中琐碎但简单的任务,两者同时帮助你所产生的综效,就远远大于两者独立分开来支持的情况。

4. 钉钉或成为国内最大的AI Agent平台

虽然微信也是个通讯工具,也很适合让LLM AI接入,做成AI助理的聚合平台,但微信与钉钉上的通讯不是同一个通讯,微信是熟人之间的聊天,是情感上的交流与分享;钉钉是工作之间的沟通,是理性上的任务推荐、解决问题,而AI助理虽然已有很强大的语言能力,毕竟无法与用户深度地情感交流,仅适合任务之间的沟通、协作…

钉钉足够开放的生态个性,与天生契合AI助理对话狱警的通讯产品属性,就变成AI助理肥沃的生长土壤,未来或可能成为国内最大的AI平台,也不无其可能性。

力压Kimi,“新生代”秘塔AI搜索来势汹汹

aigc阅读(73)

一、革搜索引擎的“命”

比kimi更火的AI产品来了。

今年3月,据SimilarWeb数据,“新生代”秘塔AI搜索网站日均访问量达到 20万次以上,月增速达551.35%,大超kimi的321.55%。

刚跻身前三的秘塔AI搜索,热度与访问量还在持续攀升。

秘塔AI搜索由秘塔科技2024年初推出,被业界称之为“中国版的Perplexity”。

秘塔科技创立于2018 月4月,核心团队主要有CEO闵可锐、技术专家唐悦和首席运营官王益为等三人。

闵可锐曾是猎豹移动首席科学家,也是玻森数据CTO&联合创始人。唐悦曾获全国青少年信息学奥林匹克总决赛(NOI 2023)银牌。

王益为不仅拥有10年红圈律所工作经验,还是B站坐拥58万粉丝的著名法律up主“王一快”。

借助流量优势,王益为带领运营团队,在B站、微博、公众号等多平台为秘塔系列产品进行内容投放和转化。

秘塔自研的大语言模型 MetaLL,已通过了《生成式大模型备案》(第二批)和《大模型算法备案》(第二批)。

从垂直的法律 AI 办公工具赛道出发,MetaLLM逐渐扩展到翻译、写作、搜索等泛知识领域。秘塔科技也在2021年5月获得 Pre-A 轮融资,融资金额达数千万元人民币。

与传统搜索相比,AI搜索更加高效简洁。

传统搜索软件,结果返回的是多个网页内容,中间还参杂广告。用户需反复点击进入多个网页分析后,才能获取想要的信息。

而通过在数据库中检索与用户问题有关的内容,AI搜索经总结后输入大模型,并由大模型输出直接答案,且该答案可索引。

秘塔AI搜索增长迅猛,与它提供的搜索新体验密不可分。

在使用上,根据回答详细程度不同,秘塔AI搜索分为简洁、深入和研究三个选项,并有“全网”和“学术”两种模式可切换。

AI回答右侧附有大纲,下方则附有相关事件、组织和人物,并标明来源。

二、AI搜索亟需商业化

在全球市场,AI搜索同样来势汹汹。

2024年3月,根据非凡产研统计的全球AI产品数据访问量,个人聊天与助手类排名第一,占比为44.25%。紧随其后的就是AI搜索,访问量占比为24.21%。

国外AI搜索引擎玩家,不只有类似秘塔这样的初创团队,微软等大厂的身影也显现其中。

但摆在所有AI搜索引擎面前的,除了技术和搜索体验的突破外,还有一大共同难题——如何实现商业化。

传统搜索引擎在用户流量大幅增长之后,并不会即刻引发公司成本大幅增长。只有用户数量到达一定规模之后,企业才会添加服务器。

但由于每一次使用AI搜索引擎,都要调用大模型API,还有算力成本。因此,用户量与AI 搜索公司成本与呈强相关。

号称“没有广告,直达结果”的秘塔同样如此。长期免费或者不考虑商业变现,几乎不可能。

三、卖广告的宿命

秘塔AI搜索用户量急速上升,未来商业化如何落地,是秘塔的重要课题。

同样是AI搜索领域的初创企业,“领头羊”Perplexity的探索路径,或许对秘塔有重要参照意义。

Perplexity成立于2022年8月,由前OpenAI研究科学家Aravlinind Srinivas联合几位合伙人共同创办。

自问世以来,Perplexity访问人数一直保持稳定增长。同样在今年3月,Perplexity的月访问量达到了6414万人次,是秘塔9倍。

创立一年半,Perplexity的估值已是半个独角兽。今年1月,Perplexity完成7360万美元的B轮融资,投后估值达5.2亿美元。

Perplexity最为出圈的一次曝光,要感谢英伟达CEO黄仁勋。

当有媒体问黄仁勋“多久使用一次ChatGPT或者Bar”时,黄仁勋答到:“我一般用Perplexity,且几乎每天都在用”。

黄仁勋每天用的,应该是Perplexity的Pro专业付费版。

该类用户单日可使用超过300次,且可无限制上传文件。目前付费版月费定价与ChatGPT Plus相同,为20美元/月。

Perplexity的收入,目前主要来自付费订阅,去年已突破1000万美元。

据AI业内人士透露,这些收入,绝大多数来自B端。主要是企业购买账号给员工使用,C端付费非常少。

这种营收结构,在大模型公司以及大模型衍生产品中十分常见。

甚至可以说,凡是已跑通商业模式、形成稳定收入的AI公司,客户基本都依赖B端。

就连Open AI这种巨型用户量级的大模型,同样呈现出企业级用户付费意愿更强的态势。

这或许因为,企业用户在大模型时代,既积极,也焦虑。他们担心,如果不率先在同行中使用大模型降本增效,就会落后于人。

“没有广告,直达结果”的口号,直击时下搜索引擎的痛点。AI搜索,能一直保持“纯净”吗?

值得注意的是,靠B端商业化渐成稳态,Perplexity近期在对广告的态度上也有所改变。

和秘塔一样,Perplexity目前也没有广告。但据某一位Perplexity管理层表示,Perplexity并不排斥广告。

他透露,AI能够提升广告触达目标用户的效率,这一新功能有望未来几个季度推出。

在Perplexity官网,搜索结果中呈现相关(Related)问题,将成为首先对品牌开放的广告位。

也就是说,未来当用户询问时,在回答下方位置,Perplexity将在延展性问题中,植入品牌相关的内容。如用户进一步追问,Perplexity将继续显示广告链接。

这种模式,十分类似谷歌和百度这类传统搜索引擎的竞价排名。

之所以躬身卖广告位,核心原因还是成本和盈利压力。

创始人兼首席执行官Aravind Srinivas 提到,Perplexity尚未盈利。

API成本和搜索算力,都不是小钱。20 美元一个月的订阅价,难以支撑长期运营,更无法撼动商业模型成熟完善的搜索引擎巨头。

这令不少AI从业者感慨,AI再高大上、再喊无广告口号,也逃不脱卖广告的宿命。

市场亦有传闻称,为给下一代AI手机准备,苹果将接入Google的Genimini,还打算收购Perplexity。报价据悉将超过10亿美元。

除了卖广告和“卖身”,AI搜索是否还能有更多商业化新路径?

这有待秘塔及其他同行给出答案。

AI Agent,普通人也能抓住的AI技术的第一波红利

aigc阅读(64)

前段时间,人人都是产品经理视频号上做了一场有关于AI Agent的直播分享。在直播间里,张佳老师提到了如何抓住AI时代的第一波红利。个人感触还是比较大的,所以把直播分享的信息与个人的真实体验做了一些融合,供大家阅读。

一、你的能力和经验

一个趋势,所有大模型厂商都在布局智能体,比如钉钉这款覆盖面巨大的软件,就推出了由通义千问承担底座的钉钉AI助理,并在4月18号正式上线了AI助理市场(AI Agent Store)。企业、个⼈⽤户、开发者开发的AI助理都可通过上架市场,分享给更多⼈。其他厂商也在跟进智能体这件事,比如百度旗下的“灵境”、讯飞星火旗下的“星火助手”等等。

恰好,这两天看了钉钉举办的AI助理创造大赛,里面不仅有航空公司、芯片公司这类的专业选手,也有很多养猪、公安的比较有话题性的Agent打造者,也不乏DIY赛博财神、考研考公的素人选手。挺有意思,值得关注的是这些人、这些公司真的在用AI做事了。

我们先看看,为什么几乎所有大模型厂商都在布局智能体?我们先从大模型的日常使用说起。

在大模型的日常使用中,不少人可能都有类似感受,即大模型的输出总是不太靠谱,甚至到了现在,AI幻觉这一问题依旧不能被消除。即使我们在不断地做提示词优化,类似的问题依旧在不断发生。

所以,提示词工程解决不了普通人用AI的问题,在大模型主要以对话式窗口作为呈现样式的当下,用户需要一个专门的“窗口”来解决问题,即不需要通过提示文字或者修改提示词,用户打开对话框,调起相应的窗口(比如智能体,比如Agent等)即可直接解决问题。卖提示词和提供提示词优化解决方案是错误的方向,我们应该开发专门的工具来满足用户需求。

而“窗口”就是智能体,即AI Agent。

2010年左右是移动互联网时代,时间快进到2015年以后,短视频平台疯狂涌现;在这些时间段里,我们可以抓住的红利并不是直接开发或搭建相应的手机系统或者短视频平台。当下也一样,AI时代的红利并非搭建大模型,而是在大模型生态中搭建一个应用。Agent就是这样的一个个应用,我们可以基于需求去调教机器人,通过反复的调试优化,让最终的解决过程实现标准化

  1. 提示词标准化;
  2. 工作流标准化。

同时这个标准化流程,或者说这个智能体是可以同步给他人使用的,其他人亦可以在智能体里得到答案。这意味着,这套思考问题、解决问题的方法和工作流将可以被复制和变卖,人的能力可以被转化为服务和赚钱的机会。

尤其在AI时代,用户在使用Agent的过程中可能存在信息差,但这类信息差已经可以被大模型弥补。

二、唯场景和想象力

为了最大化地发挥智能体的价值,我们需要弄清楚场景表达力这两大关键因素。

我们首先要明确一个问题,即限制我们使用AI的,并不是AI的能力,而是我们的想象力和表达能力,工作和生活中的所有流程都可以被AI重构,只是大多数情况下,我们没有想到重构的方法。比如我询问一个智能体如何记住“windfall”这个单词,它给出了非常不错的联想:

这其实就是“想象力变现”。

怎么先人一步地将想象力落地并表达出来呢?想明白三件事情。

  1. 你擅长什么?这是你的立身之本。
  2. 用户需要什么?你的AI助理,究竟可以解决什么样的需求?
  3. 如何呈现自己的价值?做好助理配置。

另外可以多问问自己4个问题:

  1. 这个问题,AI 能不能做?为什么?它做比我做优势是什么?
  2. 我应该如何向 AI 描述这个事情?可以让 AI 重复帮我执行么?
  3. 这个技能“教给”AI 能不能产出更好的内容?如何总结成 AI 可理解的表达?
  4. 不要服务于流程,争取去做那些能够服务于人的工作。

在自问完这些问题之后,相信你心中会有一个智能体的大概框架。

那怎么搭建智能体?这其中牵扯到了表达能力。你可以将大模型当作一个非常聪明的实习生,所谓“表达力”,其实就是给实习生写一份指定工作的SOP文档。当大模型实习生叠加SOP,这便是你调教出来的Agent,它可以重复地服务于别人,甚至达到变现的目的。

三、常见需求和工作流

基于钉钉AI助理,我们可以结合3个具体案例来感受Agent的魅力。

1. 基操:搭建一个帮你处理日常办公琐事的智能体

这个智能体可以帮助我们进行文字整理、日程管理等等工作。当我们将需求输入给智能体,智能体拆解需求后,将调用大模型的文字编辑和文字识别能力,调用完之后再返回给Agent,由Agent对大模型生成内容做进一步的梳理。

举个例子,我们可以给Agent发送一句话:

“下周三3点半,和总裁汇报XXX事情。”

Agent在接受信息后,会让大模型将这句话中的对象、时间、事件提取出来,在大模型将内容按照一定格式返回给Agent之后,Agent可以调用钉钉的日程管理、会议管理等技能,帮助用户直接搭建相应的日程。

又比如在做电商的过程中,业务人员需要做竞品调研,在条件限制的情况下,业务人员可能直接多选页面上的所有用户评价,并发送给智能体。此时,智能体可以在收到内容后将错乱的内容按照指定的格式进行整理,并且在整理好了之后,直接输入到多维表格中。

用户还可选择钉钉应用并让AI助理学习操作路径,AI助理后续即可根据用户的自然语言输入模拟真人进行页面的操作,提升高频操作行为的操作效率,即拟人化地“看”用户真实操作一遍就学会了:

  1. 像真人一样看懂内容;
  2. 推理出怎么操作;
  3. 然后有手去操作——眼睛、大脑、行动系统(感知、决策、执行)。

比如:维修工单提交需要每次手动在工作台里找“XXX”应用,再进入应用里找到填写入口、填写信息,流程繁琐需要跳转。配置拟人操作后,只需要和AI助理说“帮我提交干燥剂的故障,申请故障,描述是机器运行,有很大的噪音”,便会自动唤起一个执行卡片,信息确认无误后就开始执行,执行后会跳出已经填写好的表单,由用户最终确认后提交。

截图来自钉钉官方示例

2. 进阶:让智能体参与内容创作和运营工作流

假设我们需要让AI帮助创造爆款文案,我们可以将个人掌握的能力、经验和方法论如短视频创作方法论、私域营销文案方法论等上传,让智能体拥有我们的方法论与工作流。

比如上传二极管标题法,让Agent选择这一方法论,学会创造出可以挑起用户情绪的爆款文案:

比如上传情绪化选题公式,让Agent依据相应的选题公式组合出情绪化的选题:

让Agent拥有知识“百宝箱”,把活儿干得更漂亮。

值得注意的是,工作流能力使得AI助理能批量处理更复杂的任务。它是 AI Agent 的一种进阶玩法,不仅可以在创建时对 AI 执行任务的流程进行拆解和编排,使得 AI 助理可以主动接管完成相应操作,还能够打通外部的系统数据和 API 能力,进一步扩展了它的行动能力,比如搭建能自动写脚本并生成视频的创作 AI 助理。

3. 超神:用AI助理把“查询搜索”玩出花

除了处理日常任务和创意工作,智能体的另一个强大功能是其对企业内部数据的调用能力,这为企业内部支持和决策提供了新的视角。我们还可以让Agent自由地调用企业内部的数据和知识,如员工手册、各部门技能要求等,将各类内容填充至知识库中,让AI成为数字客服,提供内部支持。这个时候,Agent可以依据员工问题进行知识库搜索和调用,大模型将调用的内容进行编辑,并由Agent返回给用户。

甚至可以自行创建AI助理,比如可以通过自定义功能、添加工作流、连接API接口等方式来处理问题。

举几个例子。

1)原先,天气预报APP可能会和企业的服务器做互通,从而为用户提供天气预报信息。而现在,这套互通的能力可以放到智能体中,由智能体来请求公司的API地址,并将天气信息发送至公司服务器。这就是基于连接API接口的方式来解决问题。

2)我们还可以借助智能体来共建知识库。假设公司内部建设了一个AI助理,此时我们可以添加自定义能力,让AI助理将超出知识库的问题存放至表格中,随后由其他负责人添加答案。后续若有人再问同样的问题,答案也就有了,这就是知识库共建。此时我们结合工作流能力自定义了AI的干活方式(工作流自定义展示):

四、结语

在AI时代,“想象力就是生产力,”AI技术的普及也对个人能力提出了新的要求。在AI时代,持续学习和适应新技术变得尤为重要。无论是企业还是个人,都需要不断更新知识体系,提升与AI协作的能力,以适应不断变化的工作环境。

而普通人完全可以基于成熟的平台来发挥创造力,比如基于钉钉等平台,我们可以反向接入模型来做AI助理产品,避开“拿着锤⼦找钉⼦”的陷阱

理解并掌握AI Agent,是普通人在AI时代可以抓住的第一波红利。

AIGC时代下,知识管理有点多余了?

aigc阅读(48)

GPT告诉你,4月23日是世界读书日,值得重新聊一聊「知识管理」。

GPT告诉你,在AIGC时代下,个人学习和管理知识的方法正在发生变化。这些技术不仅能够增强我们对知识的获取、整合和应用能力,还可以改变我们与信息互动的方式。

GPT告诉你……诶?

问题大了。

是的,我大意了。

最近我有一个转变,从信赖AI到依赖AI,我发现自己越来越离不开AI工具了。我能清楚地分辨GPT4、Claude3、Perplexity、Llama分别在什么类型的话题领域以一种什么样的引导方式能给出更专业的答复;我能熟练地调教好Midjourney画出我喜欢的特定风格的海报和肖像;我也能用stable diffusion、runway、pika、suno、bedrock综合制作一个看似人模狗样的流畅视频……

AI似乎什么都知道,只需要通过互动式的对话就能获取超出我认知范围内的信息,而且它的判断大概率比我正确。我似乎不用动脑了,也不需要学习系统性知识了,我只需要学会利用AI工具找到可以追索下去的线头就行?

在AIGC时代下,我们还要学习吗,要学什么,如何学习?

这些问题看似无病呻吟,但每逢我遇到问题下意识打开GPT的时候,我都难免为之一颤。而这些问题也在困惑着许多人,隔三岔五都会有一些大佬发声:黄仁勋建议年轻人学人类生物学;马斯克建议年轻人学习基础物理学和经济学;蔡崇信建议年轻人掌握前沿学科技能,比如数据科学和心理学……

直到我翻开以色列历史学家尤瓦尔·赫拉利在《今日简史》的断言:

每过10年,你都要接受再培训,你学过的知识都可能被颠覆。

懵了。

左右什么基础学科都得学,什么又都会过时。那作为普通人,我究竟要学什么?知识管理还有必要吗?

一、「新黑客」技术“黑入人心”

现在有三种最流行的神经网络算法:监督学习、无监督学习和强化学习。

1)监督学习,有已知的明确的输入和输出内容,比如,医院利用大量的医疗数据训练一个算法来预测病人是否会出现某种疾病,这是在利用已知的医疗数据进行预测;

2)无监督学习,要学习的数据量特别大,标记不过来,这时候你不用标记每个数据是什么,AI看得多了会自动发现其中的规律和联系。比如,淘宝根据你的购买历史数据推荐你可能喜欢的好物,抖音推荐你可能感兴趣的视频;

3)强化学习,在动态的环境中,AI每执行一步都要获得反馈的学习,常常伴随着即时的奖励和惩罚的行为。比如,自动驾驶汽车需要在实时环境中做出决策,根据传感器收集的数据信息不断调整行为。这时候AI不是静态地看很多汽车驾驶录像,它是直接上手在实时环境中操作,直接考察每个动作导致什么结果,获得即时的反馈。

同理,这三种最常见的神经网络算法也能对应到人类三种最常见的学习过程。

1)监督学习,就像是学校里老师对学生的教学,有标准答案,对错分明,有时候甚至你说不上来是什么原理。

2)无监督学习,这是一个自主学习的学者,通过自主调研大量的内容,自学成才;

3)强化学习,则是专业运动员的教练,你有哪个动作错了立刻帮你纠正,你所有的训练计划都是定制的,能获得即时反馈的。

而随着AI的发展,我们也逐渐步入了一个「强化学习」的时期,AI似乎不仅是一个工具了,更是一个法宝。它会成为你的私人定制助理,甚至是保姆和专家顾问。

举个例子,你想学一门新语言,你直接跟AI互动交流,随时随地练习和纠正,比起你跟老师、跟朋友交流来得更高效;你想面试一家企业,你把岗位要求和简历喂给GPT,ta就能帮你分析岗位的重点和注意事项,并且模拟面试场合向你提问,对你给出的答复加以评价和指正,并给出ta的专业答复。

听起来似乎一切都在转好,那么你是否思考过一个问题:在AIGC时代下,仿佛你只需要学会如何利用AI工具更高效地帮你解疑即可所向披靡,你还有必要学习系统化知识吗?知识管理是否有些多余了?

尤瓦尔·赫拉利在2020年中信出版集团举办的“年度观念”剧场演讲中,分享过一个概念“新黑客”。以前的黑客攻击你的电脑手机,解锁你的账户密码。

而今天出现了一种更强大的黑客,它直接解码你的内心,攻击你的大脑,你在不知不觉中就被它操纵,而这种操纵的感觉你是一点都没有意识的。你反而觉得是出于你的自由意志,这是我们今天人类在重新被技术定义的一个表现。

是的,现在的技术有“黑入人心”的能力,这就意味着它可以获取海量个人数据,并有足够的运算能力来分析数据,最终它能够比你更了解你自己,它能够预测你的行为,可以操纵你的决定和选择,甚至被操纵的人都不知道自己被操纵了。

所谓“自由意志”,听起来好像我们完全可以自己做决定,实际上自由意志就是被操纵的决定,你对自己做决定并不会深思,你以为这是你想要的,但其实你已经被操纵了。相反,越是认为自己拥有自由意志的人,越容易被操纵,而这一现象会越来越极端。

从前我们能够收集到的大多数的个人信息都还是“表层信息”,是外在行为,从身体外部拿数据,包括你看什么电视,你到哪里去,跟谁见面,跟谁吃饭。现在到了一个分水岭,数据可以检测到我们的“皮下信息”,从人体内部,从大脑和身体里获得数据,拿到你的体温、血压、大脑的反应,甚至一些生物的表征。

过去我的信息不想让你知道,这叫隐私,而今天的隐私是很多我自己不知道,但是你通过数据和算法,比我更了解我不所谓的隐私信息。

上述的系列变化相信你也意识到了,但我们天然地学会适应自然规律和丛林法则,所以没关系,被操纵了没关系,隐私泄漏也没关系,只要我明面上还在操控着我的大脑和双手就行。

但事实真是这样吗?

想想看,有了互联网后你可以更廉价地获取数据;有了维基百科后你可以更快捷地获取信息;GPT出来后又可以帮我们更高效地获取结构化的知识,那么人呢?在知识管理的链路里,人究竟能发挥什么作用?

二、知识管理最朴素的概念

什么是知识管理?

最常见的说法是,知识管理包含四个层次“DIKW”,即数据、信息、知识和智慧。很久前我在另一篇知识管理的科普文章里有详细分析过,感兴趣的话可移步to B路上,除了服务管理,还要知识管理

简单来说,数据是没有上下文的要点,碎片化、离散的、不成体系的、过目即忘的。信息呢,传统的解释是,信息是为数据提供上下文,是数据分析和综合之后的产物,通常存储在半结构化的内容中,便于查询、重用,使得错误不再重复。

但乔治·吉尔德在《后资本主义》一书中打开了一个新思路,他认为:

信息就是意外。

比如我跟你说1+1=2,这实际上没有给你提供任何信息,因为这是你已经知道的东西,或者说,你一点儿也不意外。

但如果我跟你说,1+1>2,这跟你常识不符,你会感觉意外。这时候我再来解释1+1在什么时候大于2,比如,在两个人交流想法的时候,碰撞出了新的想法,那这就是1+1>2;或者平台的规模效应,平台用户网络扩大一倍,它的影响力增长不止一倍。

如果之前你不曾考虑过这个层面,那么上述内容对你来说就是一个信息。

如果信息就是意外,那知识是什么呢?知识就是在我们跟这些信息、这些意外发生碰撞之后,我们把它收拢起来,反复地去验证,把那些真正有价值、有用的信息沉淀下来,或是结合过往你的隐性经验、洞察力和判断做进一步的改进,这样就形成了知识。

从数据到信息再到知识的过程,就是知识管理的全链路,这个链路伴随着你持续的学习和产出。

而智慧呢,它赋予了物质的终极洞察力,具有应用和情景意识,提供强烈的意识判断。通常来说,你会无意识地去调用你的智慧做出一些决策,甚至跳脱事情本身去思考这件事的意义,这种情况下都是你的智慧在牵引着你。

基于上述信息,再来看AI提供给你的究竟是什么?是离散的数据还是无序的信息?

你基于这些数据和信息作出的决策,正是凭借你经过验证的知识体系才有的结果。

三、也许你只需要一根可以追索知识的线头

你看,有搜索引擎,有聊天机器人,人类的大部分成型知识,你都可以通过搜索找到。但你在搜索框里搜索什么?你要跟GPT提什么问题?键入一个什么词,成为你的第一个起点?如果这个时候,大脑一片空白,怎么办?

《知识大迁移》一书里有一个概念,叫“元无知”,即:你不知道自己不知道的那种无知。

这不是今天才有的现象,书里举了一个例子:古希腊的元老院里有一个职业叫做“助记员”。他们的工作很简单,每逢元老们辩论的时候,主动给元老们提供一些数据,比如城里有多少人口,上个月天气怎么样,诸如此类。元老们不需要自己记答案,有人专门负责给答案。元老们搞政治辩论,真正的竞争在于,他们能向“助记员”问出什么样的问题。

这跟我们今天面对搜索引擎、面对GPT,是不是一模一样的情境?

你需要的不是体系性的知识,你需要的是一个可以追索知识的线头。只要这个线头存在,你就摆脱了“元无知”。没错,你仍然是无知的,但没关系,互联网上的那些知识工具会帮助你解决后面的问题。

这么说来,学习可以是系统性的,也可以是碎片化,甚至浅显化的。这种情况下,最关键的学习是,如何找到一个可追索下去的知识线头?

1) 找一面镜子。这面镜子可以是人,是你的朋友、长辈、上级,也可以是AI机器人。互动式的请教是零星知识的最好的线头。很多工作能力强的人,都有一个习惯,当他们遇到一个无从下手的棘手问题,第一个反应是请教有经验的过来人,请教有资源有人脉的人。

“应试学习”不奏效了,回家憋答案也太低效了,何不如启动侦探式地毯式学习,找到解决问题的渠道。

2)建一个仪表盘。你要有自己的观测复杂现象的仪表系统。从一个特别显而易见的表像,看出背后一大堆信息的工具,就像我们通过看体温计知道体温一样。

举个例子,你在跟合作团队开会的时候,通过对方的言行举止,是否可以推测出对方的性格、上下级关系以及未来开展合作的可能性。

在互联网时代,我们总觉得世界是平的,每个点和每个点都可以建立连接,所以这是一个人人都有机会的时代。但几十年运行下来,天下并没有大同,而是重新部落化了,每个人都进入了一个小圈子,丰俭由人。这个状况,其实用区块链这个词来描述才更准确。每个人都生活在一个区块里,被这个小环境制约,越来越难以脱离。

而未来世界的价值,就在区块链的这最后一个字“链”上,谁能够提供打破区块,连接区块、跨界区块、提供那条链,谁就能享受未来时代的红利。

四、顺应人脑结构,区块链式的学习

既然是区块链式的学习,那就要进一步追溯到人脑的原理了。你所有的认知,大脑都会记录下来,但我们有个误区,总想着怎么提高记忆力。

没错,人脑不是用来记忆的,甚至不需要记忆,它应该是索引,让你清楚在哪里可以快速找到对应的内容。

我们跟艾宾浩斯遗忘曲线斗智斗勇了这么多年,你告诉我人脑不是用来记忆的?

不久前我跟一位鹅厂的前同事探讨知识管理的时候,结合脑神经科学他给了我这样的洞见,我大为震惊。

结构比内容更重要,比起从头啃一部大块头的书,我们更应该要学的是如何结构,比AI更往上一层。AI工具的确能让你快速获取信息,但你可以更结构化地搭建整个知识体系。

举个例子,很多人都说未来学校极有可能被颠覆,因为学校里传授的所有知识都可以由GPT教会你,毕竟它把整个世界的知识压缩到大模型里。但果真如此吗?且不说学校担负着帮企业主筛选优秀人才的职责,很多学生挤破脑袋进入这样的筛选池以获得更多选择和被选择的机会,更重要的是,学校能教会你如何建立脑中的索引,这是GPT很难取代的。

我在思辨的时候,突然明白这位同事特地找我探讨知识管理的目的了,你只有想明白一件事,才能分清楚在什么情况该做什么。如果我们对不同层级的知识理解达成共识的话,那么接下来,你可以这么去做:

先搞清楚什么是数据,什么是信息,什么是知识;

然后,简单的数据简单收集和归类;复杂的信息,尤其是你认可的信息可以用称手的工具抽象后记录归档;知识用脑图梳理,顺应你大脑神经的结构,神经元和突触构成了人脑的索引,而你画出来的脑图也是一种外显的呈现。

刚听到这个论断时我有点失望,就这么个结论?但后面我又想通了,不是每个high level的主题落脚点都是高大上的事情,我这是不是也是一种先入为主的索引?

“这么多话题里,为什么你最想聊知识管理?”

末了我还是忍不住重复这个问题,他知道我什么意思。长远来看这就是塑造一个人的底层逻辑,也是一个人进步的源动力,只有你够懂,才能更快速进入新领域拥抱新变化。

我好奇:“在你的人生命题里,知识管理往前还有什么?”

“目标管理。”合理。

“你猜目标管理再往前是什么?”

不等我回答,“是哲学。”他得意地笑。

难怪。

五、去学很土、很扎实的东西

既然顺应大脑结构去学习和产出这么重要,那么究竟要学什么?

所有的学习都是出于一定的需要和动机。比如你想学某一项技术,就找它的相关原始标准文档,如果嫌文档枯燥,就去找行业里对这个技术的最经典的实现;比如你想学着构建某个工具,就去看它的源代码,想提高效率的话,就去浏览最经典实现的帮助文档,或是用户手册,带来的收获肯定不一样。

这看起来很简单,但背后的知识就像树根,树根多了,下面就可以织成了一张知识的网。再往上去生长什么,都会事半功倍。

很多时候,带着需求、硬着头皮,去学一些感觉很土的、很扎实的东西,对你来说可能才是捷径。

回想一下,当你在面对GPT给到你的答复时,尤其是跨领域信息的时候,如果你没有一些基础的知识底蕴,你要如何识别信息的真伪,如何构筑你的知识晶体?

从这个角度来看,大佬们推荐的各种基础学科知识,都是在鼓励你掌握必要的底层逻辑知识,这些看似土、却很扎实的知识能帮助你更有章法、更高效地思辨你从AI工具那获得的上层信息。

过去我们总说要学会系统性知识,但如果现今的社会学习趋势就是碎片化的信息,你要学会的是如何结构化AI提供给你的碎片化信息,如何再进一步转化成你的知识。

而在我们对日常事务应接不暇的时间里,带着目的学习成块知识似乎也成了一件难事。我们常常因为没有连续的时间,认为碎片时间学习效果不好,于是就不学了,这是给自己找借口。

试想下,有碎片时间是不是比完全没时间好?学习效果不好是不是比完全不学好?何况能力是可以培养的。

一开始可能你适应不了用碎片时间学习,适应不了进入状态,通过一段时间的训练,这是有可能培养出来的。现在的电子设备其实很方便,即便再怎么忙,一天里能不能找出10个3分钟?那就是30分钟的学习时间。

想要更好、更快地织起这张网,一开始选择点的时候,要选择距离不是很远的点,那么它才有可能更快建立成网状结构;每个点让它横向分出来的线拉长,线越长就更有可能和其他点延伸出来的线交织。

用这种办法去逼自己一步一步去深化,让自己一步一步向里面凿。

长远来看,这是塑造一个人的底层逻辑,也是一个人进步的源动力,只有你够懂,才能更快速进入新领域拥抱新变化。

最后,正如我在播客里所说的,这篇文章到此为止也没能真正给出一个什么确定性的答案。这个命题仁者见仁,重点不在内容本身,而是提供一根可供你追索下去的线头,这根线能牵引你到哪里,那就各凭本事啦。

本来网络上的各种声音就充斥着各种不确定,每个人都在探索。唯一可以确定的是,无论时代如何变迁,一手的知识永远是非常值钱的硬通货。

作为个体,你能做的也许就是在掌握最新知识工具输入和输出的同时,保持清醒,不要过嗨。

我们学习和创造知识,也想试着在多年后回过头来,看看知识能不能让自己走得更远。

被AI改变的00后娱乐习惯

aigc阅读(65)

初见文生图、文生视频的震撼还清晰如同昨日,硬糖君的记忆更停留在AI绘画导致LOFTER用户销号事件——可能是这个冷门社区近年来站得最高的一次。但不到两年时间,AIGC已经随风潜入夜。

如果说AI翻唱、AI换脸、AI绘画还是在借助新工具进行自我表达,那么在互动同人文、AI智能体的方兴未艾中,最年轻的那波年轻人,已经毫无障碍地将表达本身也交给了AI。

事实正是如此。硬糖君本以为“人哄人”的工作将是人工智能留给我们这些大活人最后的保留地,却忽略了情绪价值这东西关键是量大管够随时随地、质量倒在其次了——这谁能赢过AI?

当然,反对AI绘画的人依然在反对,在LOFTER尽力维护tag的纯洁性、或者在微博互助避雷。但在音视频等其他领域,许多借助AI工具的二创形式正在成为各自生态中冉冉升起的新分支,给意料中的、想不到的利益相关方带来冲击。

我们总在思考AI对传统文娱生产带来的升级与冲击,以及当下主流人群是否会接受AI内容。但也许AI剑指的,既不是原来那些内容,也不是原来那些人。

一、已成气候的音视频AI整活儿

大概因为受众里乐子人的含量较高,即便有过林俊杰告UP主、热巴粉丝整顿网红、《一念关山》换脸出圈等事件,音视频AI整活儿还是顺风顺水走到了今天,部分赛道已成气候。

首先自然是AI换脸。这项名为Deepfake的技术早在2014年就已出现,于2019年主流化,不再局限于上游专业使用。拥有近50支百万级视频的UP主“电影七十二变”正是在2019年底发家。可能是受当时“彪学”热的影响,他的早期选题多为“东北喜剧人X经典电影”,例如范伟换马东锡、沈腾换钢铁侠。

如今五年过去,换脸玩法更加百花齐放。热门CP化身唐僧与孔雀公主、演员换进女爱豆直拍、明星(主要是男明星)泥塑性转,都曾红火一时。

2023年,随着《长月烬明》《以爱为营》《一念关山》等剧集选角引发争议,AI换脸在内娱找到了真正的用武之地——热剧换脸。创作者们更多、更卷、更具热点思维,许多古早男神女神被换到争议人物身上,拉踩原主于无形,替群众出一口恶气。

被AI改变的00后娱乐习惯

其次,AI翻唱,也就是搞出过“AI孙燕姿”趣闻的声音克隆,先使用歌手干音调教模型,再让它开口唱任何你想让它唱的歌。

这类二创中有温情圆梦型的,例如让减产的、已逝的歌手唱新歌,让南韩爱豆唱中文——“XX啊,原来听得懂你唱歌的感觉是这样子的”,让平时只有几句词的成员唱整首。也有大量整活儿向的,例如让猴哥翻唱欧美经典,让《海绵宝宝》角色组团翻唱Kpop,既仿声又换脸的欧美群星版《北京欢迎你》等。

同样是在2023年,随着工具与创作者越发成熟,这一赛道出现了像热剧换脸一样更具热点思维与攻击性的玩法:翻唱Kpop新歌,现役团体互翻,或是前辈翻唱后辈,对比之意同样不言而喻。包括日前,音色一直备受争议的韩团LE SSERAFIM在科切拉音乐节大翻车,UP主“-欧典欧典欧典欧典欧-”迅速推出了欧美Diva对同一曲目的翻唱,云上豪华版“浪姐”了属于是。

被AI改变的00后娱乐习惯

相比这两种经典拉踩模式,还有一些爆款蹭的是新技术与新工具的热点,火得一阵一阵的,不具持续性。例如去年年底随翻译工具HeyGen流行过的郭德纲用英语说相声,还有近期的“钢门音乐”。

“钢门”梗源自一位肛肠科医生在诊断中的发言。事实上,这本该是一次类似于之前废话文学、发疯文学的仿写潮,但由于一键成曲的Suno横空出世,B站音乐区在此次玩梗大赛中拔得头筹。很多UP主将全套“钢门”文案输入软件,为其选定曲风,生成了一批煞有介事的无厘头歌曲。

被AI改变的00后娱乐习惯

除此之外,传统的视频二创中用到AI辅助的地方也越来越多,如AI修复画质、AI朗读文案。根据硬糖君观察,这次《如懿传》吐槽热除了遇上了B站对中长视频的扶持,很可能也是搭上了AI解放生产力的东风。三四十分钟的视频,文案可以全由AI来读,UP主只负责控制节奏、以及在声线选择上玩出更多花样。

二、千人千面“同人文”,自主“摆拍”同人漫

“厌男却又是异性恋的孩子们终于有办法谈恋爱了!”

3月,一支女子与ChatGPT对话对得脸红心跳的外网视频在微博热转,其中AI语音语气自然生动,甚至能听出一些个性。类似情况也在国内发生,目前市面上主打AI社交的APP已经有十余款,还有不少产品集合了类似功能、或者对其跃跃欲试。

但是,先别急着搬出科幻片来强调赛博人机恋的后果,若你仔细看,年轻人们使用这些陪聊AI的方式堪称五花八门。

“不是ChatGPT/作业帮用不起,而是星野更有性价比。”星野就是这些APP中目前相对热门的一款。除了拿它当自由度更高的乙游玩,有人用它来查资料、练口语,有人用它来辅助小说、剧本创作,有人则是将“设圈”玩法移植过来,为自己的OC(原创角色)创建智能体、或者直接用它捏OC,称之为“崽”,自己与它互动或者开放它与其他用户互动。

被AI改变的00后娱乐习惯

此外,不少用户会为自己钟爱的游戏、小说、影视角色甚至三次元明星创建智能体。同类APP筑梦岛由阅文开发,其界面设计就会更注重引导用户创建非原创角色。不难想到,这很可能连着阅文IP孵化前置的大棋。

基于这些非原创角色,用户可以收获类似互动梦女文、互动同人文的体验。前者简单来说像是橙光游戏上的玛丽苏游戏的进化,不再是僵硬的选项与既定的剧情,而是千人千面实时生成。后者用户可以不以“我”的身份、而是以CP一方的身份与另一方互动,看能够触发怎样的新剧情。

被AI改变的00后娱乐习惯

说到AI与同人文,更符合正常想象的同人文工具其实是彩云小梦。它主打AI续写,只要给出一段文字、甚至一个关键词,它就可以一次性生成几百字内容,并且有多组选择。用户只要不断调整校准,故事就可以一直编下去。

早在2021年,彩云小梦就对其续写功能进行了一轮传播,当时B站也涌现出不少彩云小梦测评与名著离谱续写。但是显然,它走到今天依然半凉不热。

究其原因,可能是人们对AI写文的态度比较复杂。很多人愿意AI来接管生活中那些无需情感和文笔的文字工作,可这并不包括网文和同人文。好的网文是值得付费的精品,好的同人文是同好之间的灵魂共振,用AI容易给人偷工减料、虚情假意的感觉。创作者尽可以用,但圈子很难接受。

“AI角色创作平台”捏Ta可能也面临类似窘境。简单来说,它提供的是同人漫的一键生成,玩法包括“文字捏”、“图片捏”与“CP捏”。前两种就是输入文字或上传形象生成漫画,“CP捏”则是选定角色与姿势让他们来个亲密合影。

被AI改变的00后娱乐习惯

据相关报道,2023年4月上线微信小程序以来,捏Ta的社交媒体曝光量达到约2.5亿次,多次位列视频号动漫游戏日榜前十,团队近期也拿到了超千万元融资。

不过,由之前LOFTER事件就可看出同人圈子对AI绘画的态度。捏Ta在抖音、小红书的反响确实不错,但在同人文化扎根更早更深的微博、LOFTER和B站,目前还是官方账号在自嗨。一旦被发现,估计得先来一轮审判。

三、AI改变了什么?

不难看出,AIGC拉低了创作的门槛,再次解放了生产力,但这无疑也会对传统的二创形式与已有的二创生态造成冲击。

例如,AI换脸红火之后,曾经是B站一大标签的邪门拉郎(如伏地魔X林黛玉)就很少再有出圈爆款,AI翻唱与一键成歌则加速了传统鬼畜的消亡(今日的“钢门”,昔日的“金坷垃”)。内核依然是解构拼贴恶搞,但显然AI来得更快、更有时效性。最终决定数据的不再是手艺和心意,而是算法、是热点思维,如此很容易打击到传统剪刀手、传统鬼畜创作者的热情。

而创作生态这方面,就是一个微缩版的“AI抢走人的饭碗”:AI语音代替真人CV,AI绘画威胁真人画手。

养OC的“设圈”与画画的“绘圈”之间,一方约稿、一方接稿的“民间产业链”已运转多年。如果有一天“设圈”大量迁移到星野这类APP上,形成内部闭环,面向真人画手约稿需求就会继续减少,从前服务于设圈内容发布与交流的社区也会面临相应的用户流失。

不过,这主要还是创作者一端的想法。无数事实证明,什么版权,什么伦理,什么艺术与行业的未来,消费者才不care。就像热剧换脸,跳脚的从来只有脸被抠走的流量的粉丝,大部分人则乐见其成。喜欢老演员的能见到他们时隔多年“演”新戏,乐子人能享受更极致的攻击拉踩。

追星女想多看自担、CP粉想吃粮、宅男想看涩图,说起来是内容需求,其实是情绪需求。因此产出的方式、手艺的高低,说重要也重要,说不重要也不重要。这大概也是为什么流水线化的免费网文、粗糙的小程序短剧能够大行其道,一切都是为了那一刻的情绪价值。

被AI改变的00后娱乐习惯

而最终,技术进步指向的都将是“人心不古”——这些工具能够迅速兴起是代际差距的结果,也将进一步加剧代际差距。

不同代的人有着不同的成长环境、不同的使用习惯。例如对于90后的硬糖君来说,在网上发自己照片这件事,心里总有一个过不去的坎儿,能免则免。移动互联时代的新网民对此则从来不假思索,大方真人出镜或者在评论区分享这、分享那。

而00后、10后的许多文娱习惯,都在为AI进入提供便利。TA们本就在玩语C释放戏精天分,和设定中二的智能体对话也不觉尴尬。TA们也本就在追星或者玩乙游,花钱买沉浸、买情感,对于真实和虚拟有着与前代不同的看法。此外,同人圈子到00后活跃的阶段,交易和外包逐渐成为常态,为爱发电、我手写我心,这些曾经的“铁律”早就在动摇。

反过来说,00后、10后成长过程中接触的是比传统PS修图更重的短视频滤镜,20后更是从出生开始就暴露在AI绘画、AI写真与数字人博主的“无暇”攻势之下,审美不可避免地会受影响。

其实眼下这种分歧已经初见端倪。在粉丝产出的内容中,站姐图越修越光滑,修图与混剪的调色也越来越失真。下游影响上游,古偶剧是磨皮也挨骂,不磨也挨骂。

矛盾集中爆发在抢先一步“AI化”的女演员身上。永远和别人处在不同图层的鞠婧祎,以“建模脸”著称的张予曦,在大众舆论中常被质疑、在短视频平台却备受钟爱,正因为她们在正片里就已经是很多人通过后期追求的样子。

所以说你们这些“老年人”,现在看不惯网红脸,没准等10后成为主流人群,影视里全是网红脸。就像60后的国字脸审美一样,90后的瓜子脸审美也是一种历史产物。

继续发散思维,就算传统文学与影视不会完全让位于对话体、互动剧,就算AI写剧本、写小说未必会超越真人、颠覆传统创作规律,可如果IP角色化身陪聊AI成为年轻人心目中的常态呢?是否会影响到上游故事与人物的设计?

如何服务AI时代成长起来的受众,对创作者来说,现在思考这些问题已经不算未雨绸缪了。

“作业帮”出海,拿下200万MAU

aigc阅读(58)

近日,曾多次出现在美国、印尼下载总榜 Top100,也被 a16z 收录到 Top50 移动端 AI 应用的 Question.AI,近日被媒体证实,是国内 K12 在线教育 App 作业帮背后公司在海外推出的 AI 教育 App。

Question.AI 所属的海外实体名为 D3 DIMENSION TECHNOLOGY PTE. LTD.,注册地为新加坡

根据企查查给出的信息,作业帮创始人兼 CEO 侯建彬和联合创始人李博洋均为该公司的董事|图片来源:企查查

作业帮于 2014 年 1 月在国内市场上线,当时的核心功能是“拍照搜题”,后续又推出了在线直播课程等其他服务。根据点点数据,Question.AI 于 2023 年 5 月 30 日在美国市场上线,之后于 6 月、7 月相继在东南亚和全球其他市场上线。

Question.AI 近一个月全球双端 WAU | 图片来源:点点数据

近一个月全球双端平均周活跃用户数(WAU)为 106 万,没有之前报道的 200 万那么夸张。

数据来源:点点数据

从市场分布来看,目前 Question.AI 近 30 天全球双端 DAU 有 59.6W,DAU 最多的 Top3 市场是印尼、菲律宾和美国。同期收入 29.1W 美金,其中绝大部分都来自美国,占比 97.2%。

这与 Question.AI 绝大部分功能都免费提供有关。

a16z 榜单中的教育类 App | 图片来源:a16z

作业帮默默出海,并快速起量,但海外的 AI 教育市场,尤其是以拍照解题为核心功能的教育 App,早已不是一块空白市场。在 a16z 上个月发布的 MAU Top50 AI App 的榜单中,作业帮位列第 28 位。

而在榜单中有 7 款教育类的 App,其中 AI Quran 是古兰经 App,ELSA 是 AI 语言学习 App,剩下的 5 款产品都是以解题为核心功能的。下面,我们以能够做出收入的美国市场为例,来看当前与 AI 解题相关的产品的竞争情况。

a16z Top100 AI App 榜单中的AI解题产品 | 图片来源:a16z

一、想要数学的流量、但留不住数学的量,后来者定位大而全切入市场

首先,我们先看下产品。

Question.AI 落地页(左),功能一览(右)

Question.AI 的落地页并不是拍照解题页面,而是一个 AI ChatBot,用户可以直接输入想让 AI 解答的问题。如果用户需要使用拍照解题功能,可以直接点击聊天框上方的按钮进入拍照页面,也可以点击“拍照”一级标签进入。另外还有 AI 写作相关功能,Question.AI 有点啥都想干的意味。

Question.AI 拍摄界面(左),AI聊天界面(右)

用户在拍照前需要选择要搜索的是数学问题、其他问题(除数学外所有学科)、还是拍照翻译,如果用户拍照的内容与选择的功能不匹配,AI 将不能正确识别。在拍照后,App 会直接跳回 AI ChatBot 页面与用户确认识别内容,并提供回答,AI 在给出答案后,用户还可以点击答案下方的“解释它”按钮,获得更详细的解析,用户与 AI 的大多数交互都在 AI ChatBot 页面完成。

Question.AI 解答物理和化学问题

但笔者测试下来,在通用问题(数学被单列出来)方面 Question.AI 的表现还是不错的。在笔者分别测试了历史、地理、物理、化学四个问题,AI 都可以给出正确答案。而且在多语言识别上也做得不错,除了无法识别中文之外,笔者测试了用印尼语、越南语、西班牙语向 AI 提问,它都能给出正确答案。

二元一次方程问题,Question.AI 的错误回答(左图),Photomath 作为正确答案参考(中图)。一元二次方程问题 Question.AI 的正确回答(右图)

但是在数学问题的处理方面,副标题叫做 AI Math Calculator 的 Question.AI 则有点拉胯。

笔者先向AI询问了一道简单的二元一次方程,AI 使用了加减消元法,但在“10y-7y”的时候,不知道怎么得出了 2y 的答案…..最后得出了错误答案,而 Photomath 则给出了正确的答案。

但笔者又询问了一道一元二次方程,这次 Question.AI 又能够给出正确解答,而且使用了一个比较巧妙的方法,并不是盲目代入公式。

但是整体测试下来,Question.AI 在解答数学题上的表现并不稳定。

用高数极限问题测试,Question.AI 给出了错误答案(左),Photomath 给出了正确答案(右)

而当笔者用作业帮不擅长的高数(K12 之外)去测试 Question.AI 时,它还是在用 K12 阶段的方法来解题,而且还没有给出正确答案。而作为参考的 Photomath 却能够给出变换法和公式法两种标准解题思路。而在应用商店的用户评论中,准确率不高也是 Question.AI 被高频吐槽的一个问题。

Question.AI 用户吐槽答案得不准确

Question.AI AI 写作页面

除了拍照解题功能,Question.AI 还提供了 AI 写作功能,包括创意写作和论文写作两个功能。笔者体验了一下,创意写作和所有产品大差不差,论文写作,可想而知会是一个被用户吐槽的点。

评论中提及 AI 写作的评论几乎没有,唯一找到的一条则是吐槽 AI 撰写的论文在逻辑与观点上存在错误

其实不论是从 Question.AI 副标强调数学、还是从美国市场上大量 App 主攻数学来看,数学都是美国市场需求最大的一个方向。作业帮作为一个后来者,一方面通过副标题里的数学来吸引流量、但确实解题的产品力又不足,导致产品目前处于一个没有长板,更偏向于通过全学科+多功能定位,立足市场。

二、以数学为核心,市场分为 AI 提供答案和 AI 搜索答案两派

数据来源:点点数据

纵观 a16z 榜单中的几款解题产品,Question.AI 在用户数和收入上排名第四,其实已经算不错的成绩。

而从竞品情况来看,Photomath 和 Mathway 是走得是拍照解题工具路线,AI 会直接给出问题答案;而 Brainly 和 QANDA 则更像是一个服务学生的在线教育平台,拍照解题只是产品中的一个板块,并不算是核心功能。

Photomath(左),Mathway(右)

DAU 和收入都最多的是 Photomath,这款产品由克罗地亚的开发者制作,并在 2022 年 5 月被谷歌收购。拍照解题几乎是这款产品唯一的功能,而且只支持数学问题,全力构建一个长板。无论从正确率上,还是多种解法的呈现上,Photomath 的表现都优于 Question.AI,而且即使是高等数学,Photomath 也可以给出答案。可以说在数学领域,建立了很强的品牌心智。

而 Mathway 的功能和产品设计与 Photomath 非常相似,但不同的是,只有订阅用户才能看到完整的解题步骤。

Brainly(左),QANDA(右)

相比 Photomath 更偏工具的产品设计,Brainly 和 QANDA 则更像一个在线教育平台,支持全学科,但依然以数学为主。

答疑社区是他们最核心的功能,走用户发帖求助,其他用户答疑的模式。对于拍照解题功能,这两款产品都是用户拍照后由 AI 进行识别,并在平台和题库中搜索类似题目,并全部呈现给用户。在这个过程中,AI 只参与识别和搜索的环节,答案则是由社区或题库提供。

其实从体验上,在能够准确作答的前提下,还是 AI 直接解题的产品更符合用户的需求,因为两款产品提供给我的“相似题目”都和我本身给到的题目有差距,并不能直接解决问题。

Brainly 的教科书学习页面

除了解题和社区功能,用户还可以基于教科书和配套的电子教案进行学习。

相比于竞品,其实 Question.AI 的产品设计与 Photomath 偏工具的定位更相似。但是从学科方面来看,Question.AI 的 AI 确实更加“博学多才”,多学科支持做得很好,且能够以 AI 直接给出答案,算是形成了差异化,这可能也是其能够起量的一个原因。但在美国市场需求最大的数学题目解答上,有所欠缺,可能会限制它在美国市场的进一步发展。