欢迎光临
我们一直在努力

VR社交已是过去式?构建MR社交的7种方式

aigc阅读(18)

伴随着Vision Pro的发布,苹果也相应公布了其3D Avatar解决方案,与其他依赖于捏脸的虚拟数字人平台不同,Vision Pro用户可以通过头显扫描脸部进而生成拟真的Avatar形象,苹果将其称之为Persona。

早些时候Persona以窗口的形象展示,本月,Vision Pro进一步更新了一项名为Spatial Personas(空间角色)的功能,自此,Persona可以在真实空间中走动,进一步提升了真实感。

Persona背后其实可以看到苹果并不倾向于相对成熟的VR社交、协作策略,相反,它希望未来空间计算时代用户的沟通交流依旧能发生在真实空间,这也就是所谓的AR/MR社交。

接下来,你将能看到MR社交的难点以及可能存在的系列机遇。

本文编译于外媒SKARREDGHOST,作者在VR/AR行业具有多年从业经历,以下是文章原文。

图源:苹果

目前社交无疑是VR的重要应用场景之一,现如今我们可以通过Rec Room、VRChat等优秀的VR社交应用与朋友在虚拟空间中聊天或者玩乐。

不过,当前MR的概念也正在被大肆宣传,因此我们应该开始思考如何在MR(混合现实)中与人们见面。

这里值得一提的是苹果最近所更新的Spatial Personas,网上基于此出现了大量的体验以及分享视频。

不过如果我们体验后便很容易发现VR社交与MR社交其实遵循的并非同一套规则,未来无论是MR社交又或者MR会议,里面的设计都需要进行一系列重构。

Spatial Personas体验视频,图源:YouTuber

Cosmo Scharf VR社交与MR社交是两种截然不同的体验 可能不少人都体验过VR社交相关应用,如VRChat、Roblox等,我曾在一家VR音乐会平台工作过,对于这种体验也十分了解。

当你在VR中观看音乐会,就像是被传送到了另一个宇宙,你可以在这个宇宙中与朋友见面并且完成各种游戏互动。

我喜欢VR社交,因为这就像是一种神奇的传送:戴上头显、然后用户便可以脱离当前现实环境,甚至能获得突破物理法则的体验,如在空中飞翔,或者变成另一个人、一只狗甚至一个牛奶盒等。

VR演唱会,图源:SKARREDGHOST

除了VR外,我也是视频穿透AR(VST方案)的粉丝,我一直好奇相应的VR音乐体验能否通过MR体现出来。当深入研究后,我得出的结论是:我们永远也不可能在MR中获得与VR相同的体验。

理由很简单,所谓AR/MR都旨在创造一种与周围环境相融合的体验,MR就像是一种黑魔法,它能让虚拟元素与您周围真实环境相融合,并提供让人信服的结果。

图源:SyncReality

举例而言,假设我们有10个人都处于同一个MR社交场景当中,而每个人都在各自的家里面,那么基于前面的原则MR体验需要适配所有不同用户的房间,但这是不可能的。

想象一下,如果A正身处一个小房间、B在一个巨大的仓库内、C在一条狭窄的走廊当中,理论上我们都应该看到相同的虚拟元素,而这些虚拟元素又要与各自的环境相契合;再者,由于我们的Avatar也属于虚拟元素的一部分,我们也应该需要一种可信且一致的方式看到彼此的化身。

实际上这是不可能的,如果B走到仓库的尽头,那么在C看来,他可能早已穿越墙壁,从而破坏了魔法。

此外,即便你们的房间完全相同,如果里面的家具摆放有所差异,那么也很容易出现有人站在你沙发或者橱窗里面的情况,再次打破魔法。

MR场景中虚拟化身的位置不可控,破坏了真实感,图源:SKARREDGHOST

虽然某些时候你看到有人出现在你的房间当中这种感觉会很奇妙,不过实际上这也没太大作用,因为对方压根看不到你房间的样子,对方所看到的仍是自己的家,所以双方会有一种一厢情愿的感知错位。

这一切让我意识到,这种简单粗暴的社交MR体验其实是行不通的。

基于此,又可以延伸出很多问题?我们为什么需要MR社交,而未来它又该如何实现? 

从本地AR到场景三维重建,MR社交的7种实现手段 每个产品的出现都是为了解决需求,而选择特定的技术是因为你相信这是实现相应目的的最佳技术。

你的用户也生活在使用你的产品的特定环境当中,如AR设备会在家里或者户外使用,而这种差异可能会严重影响您设计产品的方式。

对于MR社交而言,想要实现不同的目标,背后就需要采用不同的策略。

一、可能你并不真的需要MR社交

如果你想在另一个世界(比如火星)举办活动或者聚会,这种情况下VR无疑是最佳选择,MR其实并没太大必要,因为后者需要用户呆在自己的空间当中。

不过,假如项目方表示一定要引入MR,并表示“MR是当前的趋势,它需要在我们的应用中有所体现。”

这种情况该怎么办呢?

VR演唱会,图源:SKARREDGHOST

我的建议是可以以VR为基准,然后在此基础之上添加部分MR功能。以《阿斯加德之怒2》为例,这是一款VR游戏,不过里面也出现了部分MR元素,如用户可以在真实空间窗口中消灭怪物,这可能对于未来的VR社交具有一定的借鉴意义。

在VR基础上引入MR,图源:SKARREDGHOST

二、单纯以看清楚真实环境为目的

去年,Brad Lynch(海外XR分析师)曾在X平台展示了VRChat的透视功能(他将其称之为ARChat):当打开游戏透视模式后,虚拟背景将切换为现实画面,而虚拟化身也会相应出现在真实空间之上,不过也相应出现了穿墙、卡在沙发上等一系列问题。

从VRChat到ARChat,图源:X

虽然体验不佳,不过VR社交的透视功能在某些时候可能是必要的,比如用户在游戏中途需要查看周围环境,比如照顾孩子,那么在VR中激活透视功能可以解决他的“燃眉之急”。

不过,这仍算不上真正的MR社交,因为它只是简单地将虚拟元素叠加在现实之上,而没有真正考虑如何与环境相融合的问题。

三、多人本地AR

如果所有用户都处于同一个物理位置,这种情况下,想要实现MR体验其实会变得相对简单,因为用户能看到相同的真实元素,而这时候只需考虑虚拟元素的对齐问题。

(也有人将这类体验称之为多人本地AR)这背后需要结合使用共享空间锚点(所有AR SDK都会配备该功能)以及特定的网络(比如使用镜像网络库)。

在这时候,游戏可以考虑设计一些同时涉及多个玩家的互动体验,以创造更多的共同感。

Niantic曾打造的多人AR体验,图源:Niantic

四、让MR社交聚焦于某些特定元素

对于多人MR体验,其实苹果也考虑到了这一问题,并在Vision Pro开发指南中提供了相应的设计规范。

多人MR的三种场景,图源:苹果

从图片可以看到,苹果所展示的多人MR体验重点都并非环境本身,而是场景中的某一元素。

如果MR社交只涉及某一件事,那么用户建立联系会变得容易得多。比较典型的是一起追剧,它并不涉及任何真实元素,并且也没有太多交互事件。

(Ps:这也是网上UP主分享Vision Pro Persona体验出现最多的场景之一,因为它呈现效果最好,并且不容易出戏。)

通过Vision Pro一起玩平面游戏,图源:X

因而想要让MR社交获得良好的体验,一是需要尽量让用户围绕同一个元素,二是让用户尽量寻找一个相同的真实背景。

关于这点,VR桌游《Demeo》是一个很好的例子,它于去年推出了MR玩法,我曾与朋友一同测试了它的MR功能。

打开透视模式时,会看到朋友与我坐到同一个桌子上,并且他专注于他的游戏,就跟我一样。

之所以会造成这种错觉,是因为我们在游戏时都坐在实体牌桌上,我们在相同的条件下进行游戏。另外,卡牌游戏都是偏固定场景,人物无需进行太多移动,这也能一定程度避免穿墙等情况发生。

在这种情况下,MR不再是噱头,相反,它能进一步提升用户的游戏体验。

Vision Pro也有类似的多人下棋的场景,用户都会坐在各自的椅子上下棋,不会随意走动,因而相当于无意间创造了相同的物理环境。

在Vision Pro中远程下棋,图源:X

对于MR社交体验来说,你可以针对一个(或多个)特定关注点设计你的体验。

以我前面所提到的音乐会为例,未来,或许可以让歌手站在你的桌子之上,而其他人则围在桌子周围,这种情况下,基本相当于所有用户营造了同一个观影环境,不过,它可能仍会存在空间相对局限或者偏静态的问题。

五、可以通过相对不真实打破MR社交体验的割裂

其实我们大脑存在着一个奇怪的规则特性:当你赋予它越多的真实性,那么它对真实性的要求就越高。如果你的Avatar是卡通人物,那么大脑可能并不会介意它到底有多少根手指,相反,如果Avatar是超写实人类,那么大脑可能会开始注意皮肤上面的不完全真实的光线反射细节。

刘强东AI数字人直播带货,图源:网络

Vision Pro也采用了类似技巧,以试图让MR社交变得可信。

比如Persona没有手臂、没有腿和脚,它们有点类似于漂浮在空间的幽灵,看起来显然不是真实的,不过这也不失为一种逃避问题的办法:因为Persona在你的设定中是一个幽灵,因而它漂浮在椅子上、沙发上甚至卡在墙里,你也不会出现强烈的违和感。

(不过奇怪的是,外界对于Meta Avatar没有腿这件事似乎诸多抱怨。)

网友测试新版本Persona,图源:X

如果你的MR社交体验并不需要太多真实感,那么里面也可以设计一些小技巧,比如你可以让某些人看起来像幽灵或者一片云,这些粒子本身就可以存在任何一个地方。

此外,应用在启动时也可以考虑自动将Avatar尽量传送在相近的地点,这样能避免过多走动。

甚至,应用可以预先考虑某种物理空间的差异,比如用户A的房间尺寸为2m×2m,用户B的房间尺寸为4m×4m,那么可以考虑将B的步幅调大一倍。

(不过这里面也会出现很多不可控因素,应尽量避免使用。)

六、偏弱体验的社交

某些时候,MR社交场景其实可以打造成单纯的语音聊天室,即玩家的Avatar不一定需要相互见面。不过仅凭语音、缺乏肢体交流可能会导致用户联系没那么紧密,这时候,可以考虑设计一些独特的互动体验:比如用户按下某一按键,另一用户的家里面就会绽放鲜花。

VR社交应用《Where Thoughts Go》其实也提供了一个很好的思路,玩家可以在虚拟气泡中留下个人的语音信息,然后将其分享给社区的其他人。(有点类似于语音漂流瓶)。而未来MR社交也可以借鉴这种形式:即便用户之间没有直接互动,也可以留给对方某些线索或者彩蛋。

图源:《Where Thoughts Go》

七、基于各自空间的建模

在终极场景下,如果我想在家里就能打造一场MR社交,并且远程的朋友也乐在其中,这里还有一种解决方案:我们可以预先将我们的空间进行3D扫描,然后邀请朋友进入这一空间。

在这种情况下,他们基于VR模式进入体验,他们的虚拟世界其实就是你的真实房间。而你则可以基于透视模式下运行,双方都能在相同的环境下获得相同的体验。

实际上,Quest 3也有扫描房间3D网格并共享的功能,不过它的扫描效果十分粗糙,并且会丢失纹理细节,用户只能进入一个纯白背景的虚拟世界。

此外,Varjo Reality Cloud(Varjo推出的一个云服务平台)也可以实现类似功能:Varjo头显可通过摄像头扫描房间并上传到云平台,而重建数据也能分享给其他用户。

图源:Varjo

根据一些体验视频,Varjo Reality Cloud所构建的这一体验仍十分粗糙,不过它是一个不错的原型。

我也十分喜欢这一解决方案,目前它可能是唯一能够真正实现远程邀请朋友来“家里做客”的方式:我能实现混合现实体验,并且双方都基于同一空间,动作行为保持连贯。

来源:https://skarredghost.com/2024/04/15/social-mixed-reality-how-design/ 

从互联网+到AI+,公安政务助手AI助理带给我们的一些思考和启发

aigc阅读(13)

2024 年 4 月 18 日,作为国内最大的企业级办公应用,钉钉正式上线了AI 助理市场(AI Agent Store),首批上架近200个AI助理,覆盖了创作设计、学习教育、运营推广、销售客服、人事行政、财税法务、电商外贸、生产制造、企业服务等领域。

笔者第一时间体验了钉钉市场的部分应用,其中对杭州市「公安政务助手」AI助理的印象非常深。相比一些常见的运营、营销工具,这是一个针对传统行业的业务场景量身定制的AI助理,旨在解决政务服务中用户的常见痛点。接下来,我向大家详细介绍一下我对这款AI助理的体验感受以及带给我的思考。

一、什么是钉钉AI助理?

在介绍杭州公安政务助手AI助理之前,我们先了解一下什么是钉钉AI助理。

AI助理英文全称为AI Agent,也称作AI智能体。随着AI的快速发展,从产品形态上业内普遍认为 AI 应用将沿着 AIGC(内容生成)、Copilot(智能助手)、Insight(知识洞察)、Agent(智能体)四个重要的方向演进,而钉钉AI助理正是属于Agent(智能体)这一个方向。

Agent(智能体)有什么特点优势呢? 它最强大的优势就是具备超强的感知、记忆、规划和任务执行能力。相较于Copilot(智能助手),Agent能够自动感知环境,通过自己独立的决策和行动来改变环境,并通过不断学习和自适应来提高性能。

作为国内最大的企业级办公应用,钉钉 AI 助理依托于钉钉平台,融合了钉钉的多项 AI 产品功能,比如文档、会议、行程、待办等,以智能化的方式辅助企业日常的工作流程。钉钉 AI 助理覆盖了企业管理、办公协同等多个工作场景,旨在帮助企业通过AI实现智能管理、智能协同、提升业务效率。

在2023年11月钉钉推出AI助理以后,钉钉把「Al 助理」定位成为未来应用的主流形态,并以公开、协同的战略吸引众多企业、个人用户和开发者基于工作场景进行丰富的AI应用开发,旨在成为国内最活跃的AI超级助理孵化、分发平台。“公安政务助手”AI 助理正是杭州市公安局基于钉钉平台,为用户量身定制开发的一款AI应用

简而言之,「公安政务助手」是依托于钉钉平台开发的一款AI助理。

二、公安政务助手AI助理解决什么问题?

在理解AI助理的概念以后,我们开始全面认识这款AI助理,以及我在这款AI助理体验中的真实使用感受。

1. 产品介绍

「公安政务助手」是杭州市公安局基于钉钉平台搭建的AI助理,它接入了杭州市公安政务服务九大类业务、250 余个办事事项规定细则以及浙里办APP的在线办理流程,高效定位用户的核心需求,精准了解一站式业务流程、一次性准备办理所需资料,形成从前置咨询、终端办理到问题反馈的流程闭环,最终为用户打造从居住证申领到出入境业务办理等多元化政务需求的一站式服务。

可以看出,这款AI助理是基于真实的线下业务场景进行拓展,区别于过往智能客服这样的产品,「公安政务助手」的底层逻辑是以庞大的知识库和定制化的工作流为主,通过喂养AI助理,把用户在使用政务类场景中所出现的各种痛点、反馈都汇总起来集中处理。它的产品目标就是打造杭州市公安局面向用户咨询的24小时AI办事窗口,帮助用户无差错办事,建立友好、愉悦、美好的服务体验。

2. 核心场景

1)新手引导

相信多数新人对于政务类的办事流程都有天生的恐惧,“麻烦”、“复杂”、“一知半解”这些词语是和政务类事务挂钩最频繁的词语。但是通过「公安政务助手」这款AI助理,它有效解决了新手在办理政务类事务之前的信息困扰,甚至消除了用户对政务事务办理流程的“模棱两可”。

想想过去我们都在使用什么工具或平台去检索这些办事流程以及所需准备的资料。无论是通过搜索引擎找到官网,最后在信息满载的政务网站上去找到所需的资料,还是通过人工客服、或者智能客服进行咨询,这一整套流程下来,所消耗的时间和精力都会让用户在找寻信息的过程中产生烦躁、失落、厌烦的情绪

但如今,对于新用户来说,你只需要输入“身份证办理”、“居住证办理”这些关键词,AI助理就会清晰地把完整的办理流程和所需准备的资料向你展示出来。通过AI助理为用户节省的时间成本,一定能让用户去前台办置事务的时候拥有一个美好的心情。

美中不足的是,目前AI助理还没有为用户提供对应的申请表单功能,如果后期可以结合钉钉实现用户一键录入信息,就像在电商平台勾选默认收货地址那样,那这样的政务办事体验可太美妙了。

2)深度定制

区别于智能客服这样的冰冷的机器人,AI助理由于具备感知、记忆、规划和任务执行能力,AI助理能通过和你的沟通,根据你的情况提供深度定制的方案。比如当你的年龄暂未达到身份证办理的需求,AI助理会进行分析判断,并向你提出周全又合理的指导。

再比如假如你是一个美国人,嗯,在你输入一串英文之后,系统会自动识别你的语言,并转换语言进行回复。对了,你要是日本人或者韩国人,AI助理同样可以使用日语和韩语和你对话。

另外还有一个非常强大的功能,那就是产品团队为AI助理按照统一的格式重新编写的近40万字的知识库。这里面不仅包含了办事流程这些基础内容,而且还提供了对应的超链接地址,用户可一键跳转,其次这份知识库还是政务服务的科普百科,比如你可以查询居住证有什么作用,AI助理就会为你详细讲解。

不过目前「公安政务助手」的感知能力还不够完善,还无法深度理解用户前后的语境,进行预判。比如当我咨询完动车登记有什么作用,再次发起如何办理的提问时,系统无法感知,提醒我需要再次输入准确的关键词。

3)就近服务

在了解完具体的办事流程和所需资料以后,AI助理还提供了就近办理事务的地点的推荐。这个功能看上去好像不起眼,但其实对于用户来说,获取准确、就近的办事大厅地址是重中之重,想想如果你跑错了办事地方耽搁一早上的场景,那简直是不能再糟糕的体验了。

在选择办事大厅以后,你还可以让AI助理为你输出出行的公交路线,办事大厅的上班时间等,把政务事务办理的前置咨询做到极致。

基于这个场景,我在思考下一个版本的AI助理能不能自动读取用户的地理位置,比如办理身份证的时候,自动推荐最近的办事地点,而不是需要用户输入地址才能进行分析。其次如果能在对话框就为用户提供一键跳转至其他导航APP的功能,那这样的体验就更完善了。

4)动态反馈

为了不断提升产品服务能力,「公安政务助手」设计了一个「用户反馈」的工作流。用户只需要在输入框输入「反馈」的关键字,就能自动唤醒「用户反馈」的工作流程,通过提交AI助理已经设计好的表单,就能把你在这个产品中任何一个流程节点不满意的地方反馈给产品团队。

关于工作流,这是Agent( 智能体 )的另一大特色,这里的技术原理是产品团队通过模拟用户在使用产品中可能会出现的问题和输入的关键词触发反馈,用户填入信息后,反馈就自动提交给平台。随着这个产品的迭代,我相信未来也许会出现“一键预约”等工作流,用户通过AI助理查询以后,实现一键预约。

5)日程策划

受益于钉钉平台强大的应用,「公安政务助手」还能结合用户的日程安排,为用户自动安排办事行程计划,规避时间冲突。我认为这是钉钉平台和AI Agent天生契合、完美的场景之一,毕竟用钉钉为用户设计的场景正是智能、协同办公,而感知和规划能力,正是Agent的优势之一。

不过目前「公安政务助手」在这个场景的开发还比较基础,比如我先让AI助理为我查询5月20日能否办理杭州市的居住证,但接下来我让AI助理创办行程的动作中,AI却无法感知,而是需要我再次输入准确的日期和时间。期望这个产品能在随后的版本中持续迭代,让用户真正感受到钉钉AI所带来的办公便利和优势。

3. 小结

正如「公安政务助手」产品团队负责人在钉钉AI极客盛典的总结,他们的产品目标是借助钉钉、借助AI,努力去打造一个真正聪明、懂你的24小时公安政务助手。在全面体验完这款AI助理之后,我认为这是政务服务全新的用户体验升级,相比过往和那些冰冷机器人的对话,正是AI Agent的赋能,让「公安政务助手」这样的政务产品,充满了服务的温度和力量。它聪明,理解你的想法;它懂你,预判你的行为!

三、公安政务助手带给我们的思考和启发

一百年前,英国人嘲笑美国人发明的电话,因为他们拥有足够多的马匹和驿站。

二十年前,当国内互联网的浪潮来临时,有很多传统企业不屑一顾,他们只想要更多的门店和雇佣更多的员工。

如今,在科技时代的又一个拐点,面对AI持续不断的发展升级,我们又该如何面对?我认为从「公安政务助手」这款AI助理至少可以为我们带来三个启发。

第一,拥抱AI+,就像十年前一样拥抱互联网+。

毫无疑问,我们已经踏入了AI时代,无论你身处哪个行业,AI都已经带来了巨大的变化。在体验「公安政务助手」这样的AI助理之前,你能想象得到在政务办事的场景中,你可以通过一个对话工具,就能先把所有资料都带齐吗?甚至连最近的办事大厅上班时间、地址和行车路线都为你规划好了。

这不仅仅是效率和服务的提升,更是产品设计理念的提升,而促成这样质的变化的最大原因,就是AI的发展,就是AI Agent。拥抱 AI+,正如我们十年前一样拥抱互联网+,无论你是传统企业、小微企业还是超级个体,在时代的洪流面前,我们需认真思考一下AI如何改善我们的产品和工作模式了。

第二,优化升级工作流,让AI为我们降本增效。

如上文所说,我认为钉钉平台和AI Agent的理念是天生契合的完美场景之一,因为钉钉就是基于企业办公的场景而设计,而AI Agent超强的感知、记忆、规划和任务执行能力,刚好可以和钉钉这样以工作场景为中心的企业办公平台深度结合。

在「公安政务助手」的体验中,我构思了多个未来AI助理可以帮助用户实现更深层次需求的功能和场景,这是工作流的升级,也是企业服务的升级,如果没有AI,靠我们通过人工的形式去实现,也许是天方夜谭,但加入了AI,一切就变得不再那么困难。是时候像「公安政务助手」一样,思考一下如何借助钉钉、借助AI,优化升级我们的工作流了。

第三,沉淀企业知识库,通过AI提升品牌专业度。

「公安政务助手」产品团队为AI助理打造的近40万字的知识库深深地启发了我,不仅改变了我对AI这项技术的看法,更是让我明白打造自己核心知识库对于企业和个人的重要性。无论你身处哪个行业,你是企业还是个人,知识才是你真正赖以生存的筹码,而通过AI的赋能,我们完全可以打造一个提升品牌专业度和权威度的专属AI Agent。

如果「公安政务助手」只是为我提供基础的信息查询功能,我会觉得它只是一个优秀的AI助理,但当它通过自身沉淀的知识库加入了政务服务科普百科的理念,我觉得这才是它真正的核心竞争力,以及为社会和用户创造的真正价值。而实现这一切,只需要我们从现在开始,重新认识AI,结合自身的知识库,开始打造一个专属的AI Agent!

职场人成为时间管理大师,只差一个AI智能体

aigc阅读(19)

前言

你好,我是张文靖。

谈到时间管理,记得上次它成为热门话题还是因为那位姓罗的时间管理大师。

一晃眼,四年就这样过去了。

那么,对于我们普通人来说,时间管理是否也同样重要呢?

答案是不言而喻的。

作为职场人,工作和生活的节奏很快,很多时候因为工作繁忙而忽视了家庭和生活。

尽管我们每个人每天拥有的时间都是相同的24小时,但通过巧妙地规划这些时间,我们可以在有限的时间里创造无限的价值。

因此,掌握时间管理技巧,不仅能够提升我们的时间使用效率,还能帮助我们实现工作与生活的和谐共处,养成良好的习惯,最终实现我们的人生目标。

很多人可能觉得时间管理是很麻烦,自己没时间、没精力可能还没必要。

但有没有想过,我们可以借助AI的力量来管理时间呢?

AI,作为人类之外最了解人类的存在,经过一系列的训练,它甚至可能比你自己还要了解你。

在体验了众多的AI工具和大模型过程中,发现Agent智能体这类AI工具最匹配这种场景。(例如AlphaGo,是围棋圈最好的智能体)

那智能体是什么?

智能体=LLM+规划能力+记忆力+外部工具。

依靠底层的大模型,加上短期和长期的记忆力,最后通过三方方便使用的外部工具进行人机交互。

Agent看了很多种,包括KIMI、字节的豆包、智谱清言这些智能体,最后发现落地的比较好的是钉钉。

因为钉钉本身就是办公软件,天然有更丰富的场景,然后通过Agent+场景结合的方式,给我的体验感是最好的。

结合智能体的智能与我的时间管理方法,结果让我眼前一亮;

它解决了我在时间管理上的许多难题,总能在关键时刻为我安排好时间。

有时候,我甚至觉得它比我自己还要了解我(ORZ…)

今天和你聊聊:如何高效管理时间,以及如何巧妙利用AI打造专属的时间管理助手。

时间管理真的挺费时间

我们如果自己去做时间管理,真的挺费精力的。

先不说,是否谁都有必要进行时间管理,光是去做时间规划和分配就要做很久,更别说执行和复盘了。

为什么这么说?那就要展开聊聊如何做时间管理了。

时间管理,真的只是管理时间吗?

其实并不是,管理时间只是一种手段,时间管理主要是:能力管理、精力管理、最后才是管理时间

精力管理的核心是时间块。

比如把时间拆分30分钟、1小时、2小时的时间块。

把每天的时间拆分成比较固定的若干个单元进行使用。

2小时时间块做需要长时间专注的事情;

1小时的时间块需要一定时间专注的,但尽量1小时内可以完成的;

30分钟做一些碎片化工作。

时间块,可以让AI助理学习,让他帮我们按照这个逻辑帮我们拆分。

管理时间核心是什么。其实就是聚焦当下。

在任何时候,都知道自己当前的时间应该干什么。

我通常会给自己一个这样的面板,拆分时间块,并确定每日的待办。

这个完全可交给AI助理来做,让他们帮我们生成。

能力管理的核心就是,找到规律。

每个人的工作,本质上讲都是有规律遵循的;

通过模式识别,找到他的规律变成标准,然后固化,最后精进。

就相当于产品经理刚学了一个模型或者方法,在第一次用的时候很慢,需要不断实践才能消化。

当用了第二次、第三次很熟练了逐渐标准化以后,速度会非常快。

这是因为,我们找到了规律,能力也有所提升。

没有变成标准前怎么办呢?

那些不能标准完成的工作,要留够Buffer,留够缓冲时间。

这样至少自己的时间安排不会被某个任务打乱。

那么,问题来了。

怎么找到规律,怎么分配时间,怎么预测每个任务的时间就是个难题了。

另外,时间管理流程很长,以我为例,我迭代了两年的时间管理SOP如下图:

尽管我已经用这种方式执行了2年,但是这个流程中,还是有花费我大量时间去梳理的事情:

  1. 根据每月目标,拆解到每周,制定每周的任务待办清单(每周120分钟)
  2. 将每周的任务待办同步到日程表中,并且确定每个任务的具体时间。(每周60分钟)
  3. 记录和总结每周实际完成情况(30分钟)
  4. 每周复盘并调整未来任务的计划时间(30分钟)

这些问题在以前,我都是通过自己的感觉去预测时间;然后吭哧吭哧自己去规划和排期。

时间上来说,一个月下来,就是600分钟(一次月度计划拆解120分钟+四周的计划和复盘2x(60+30+30)分钟)。

今天我才发现,原来我以前一个月光做时间管理的熵增竟然用了10个小时!!

最近研究Agent以后,通过AI来帮我预测,又快又准。

当我发现钉钉AI助理,能直接在钉钉内进行AI生成内容后,我开始尝试用提示词为自己构建一个“私人定制时间管理助理”。

来生成我下图这些“花里胡哨”的各种表和总结复盘。

开始使用钉钉的AI助理后,我统计的我的时间管理所用时间,从每月大概花600分钟,到现在合计不到100分钟,效率提高了至少6倍,而且效果比我自己整理的好的太多。

没用过AI的同学可能会觉得:

AI很难喂知识吧?

提示词很难做吧?

配置参数是不是很复杂?

AI的反馈内容是不是不够好……

从我的体验来看,效果能打,完全能够满足我日常工作和生活的需求。

而且搭建一个钉钉的AI助理没那么复杂,从配置、调校到最后的使用,前后就用10几分钟,3个步骤就搞定~

10分钟快速搭建AI助理,一劳永逸

第一步:从实际痛点倒推AI的工作目标

首先明确AI助理的工作目标:就是根据我的时间管理痛点去提升我的管理效率。

花费时间关键点:

1. 根据每月目标,拆解到每周,制定每周的任务待办清单(每周120分钟)

目标1:能够自动帮我规划每周待办

2. 同步到日程表中,并且确定每个任务的具体时间。(每周60分钟)

目标2:能够预测我每个任务计划完成的时间

3. 记录和总结每周实际完成情况(30分钟)

目标3:能够帮我进行复盘总结,给我一些客观的建议。

4. 每周复盘并预估未来任务的计划时间(30分钟)

目标4:对任务的预估没办法做到很精准,没有外部的辅助优化机制。

甚至希望AI告诉我哪些任务完成时间太长,需要进行针对性去培训学习

所以,AI助理的工作任务与目标是:

  • 协助我完成月度任务的分解,生成每周的任务计划;
  • 确定我每周的任务排期,整理出需要同步到每日待办的文本内容;
  • 根据历史数据,预测我每个任务计划完成的时间;
  • 协助我完成每周复盘、每月复盘,为我提供合理的建议;

如果觉得这个步骤麻烦,可以直接用钉钉AI助理市场找【帮你写角色设定】AI助理,让他帮你完成或者进一步优化你的提示词,直到满意为止。

最后整理出了现在我用的这份提示词:

第二步:配置钉钉AI助理

配置钉钉AI助理时,最关键的步骤就是精心设定角色提示词。

在第一步中,我们已经准备好了这些提示词。

现在,我们只需将这些提示词复制并粘贴到角色设定即可。

配置的同时,可以在界面的右侧实时测试AI助理的反馈结果。

这种即时反馈机制,让你能够直观地看到AI助理返回的信息是否符合你的预期。

根据AI助理的反馈,即时调整提示词,直到它的表现完全符合你的要求。

通过这样的个性化配置,你的AI助理将能够更好地理解你的需求。

比如:我将我的月度计划,发给AI助理。

让他通过以下格式生成给我:

AI助理会自动生成接下来一个月中,我每周的计划。

最让我惊喜的是:AI还能识别任务性质!!

提醒我某些事件不用分配小时数!

能识别到这里真是万万没想到的!

并且AI助理根据我的要求,为我预测的各个任务的计划开始时间和结束时间~

有的朋友可能会好奇,AI助理的时间预测到底准不准?

准确性很大程度上取决于我们如何去塑造和训练它。

只要你有心让AI准,它就有变得准。

我们要一个私人的时间管理助手,能私人定制的AI助手,才是你的AI助手。

怎么私人定制呢?

用的就是Agent的长期记忆,上传知识文件,让大模型学习。

在钉钉里面也有这个功能,在配置AI助理时,可以上传知识文件,AI会自动学习文件中的内容,让他更懂你。

比如说,我将我做了2年的时间管理数据喂给他,让他基于此去预测我未来的任务的时间。

2年前的事情我们人类有时候记得不清楚,但是AI记得可是明明白白!

通过预测的结果来看,还是比较满意的!

第三步:打造你的AI助理矩阵

试想一下,如果规划你的时间安排有一个助理,那么在管理时间上,需不需要更多助理呢?

答案是肯定的。我就给自己添置了一个专门的复盘助理。

正因为钉钉 AI 助理支持钉钉知识库、在线文档、本地文档,这些长效记忆知识的方式。

所以我把我所有的个人习惯都“喂”给了这个助理,包括我对每个任务的定义、我对某些任务的个人理解、通常情况下的空余时间等等。

除此之外,我还把历史任务的完成情况告诉了它,它会学习并进行分析,然后在未来的任务规划中预测出更合理的计划时间。

所以,这么一啪拉过程资料,都投喂给AI助理,你就让他学吧。

后面有新的数据,继续补充给他,让他成为我的一个不断进化的智能伙伴,帮助我从过去的经验中学习,为我做更私人定制的个人复盘。

最后我们看看,让复盘助理指定时间段复盘时间的效果:

告诉我以后制定某项任务的时候,怎么合理安排时间:

很多时候,我都没考虑到的东西,AI都帮我考虑到了……

我还有个习惯,每周会把一周的待办同步到日程中。

这里我又加了一个日程助理,同步你的待办,只需要告诉他你要做什么,一周的日程面板很快能生成出来。

不得不说,钉钉通过他的内生生态,再配合AI,很能打。

总结

在我这两年不断地优化自己时间管理的方法,尽管有了一套SOP,但每个月在做时间管理这件事,至少是需要花费600分钟的。

而AI的出现,做一些简单的调校、训练,一个月累计用不到100分钟,提升了至少6倍的效率。

让时间管理的门槛变得更低了。

通过钉钉AI助理做了时间管理助理、个人复盘助手、日程助手,让他们帮我完成了:

  • undefined 月度计划拆解
  • undefined 每周任务待办
  • undefined 每周复盘
  • undefined 预测待办安排的时间

通过这些AI助理,你不再是一个人,而是一个团队。

当我了解智能体的时候,我第一时间想到的就是这个时间管理的Agent。

每一个Agent都是基于强大的底层模型构建而成,它们能够理解环境、进行合理的规划与预测。

这些智能体还能够通过知识库的方式,拥有类似人类的长期记忆能力。

这种长期记忆与智能体本身的短期记忆相结合,形成了一种高效且友好的交互方式。

人与信息的交互方式,是随着时代在一点一点地改变的。

我们回过头去看历代信息连接者,从古代的媒婆、荐头到近现代的报纸、出版社、电话局,再到互联网初期的导航网站、搜索网站信息流,再到现在的抖音小红书这类自媒体生态。

放眼未来,我们能看到的是,到了AI时代,智能体可能又会像25年前互联网掀到来的时候一样,掀起一波信息革命。

最后,AI的门槛已经很低了,像钉钉AI助理这种工具更是如此。

如果说25年前,互联网人需要的是网感,那么此刻,更重要的是智能感。

希望大家能使用智能体、试用智能体、制作智能体。

智能体用好了是很好的辅助工具,就像我的这些助理一样。

通过接触智能体,逐渐适应智能体的交互方式来提高prompt能力。

这就好像当年多用互联网的人,更快速地想到了自己行业和互联网的结合。

如果你不想被时代抛弃,现在多用智能体,更容易思考智能体各种落地方式。

如果说AI是一种魔法,未来的人类会分为两种:魔法师和麻瓜。

Prompt就是咒语,像钉钉AI助手这类智能体就是魔法棒。

如果你想成为魔法师,开始体验Agent智能体,相信你和我一样能有更多场景的思考。

大模型没过“试用期”

aigc阅读(27)

东市买骏马,西市买鞍鞯,南市买辔头,北市买长鞭。

出自《木兰辞》中的诗句展现了充分竞争的自由市场中,供给方各司其职的状态。在同一市场内,消费者往往会从不同供应商处获取不同商品和服务,就像当下扎入垂直行业、走向定制化的大模型服务一般。

如果仔细观察诸如百度、阿里、科大讯飞等大模型服务商透露的产业方向的商业化进展,我们不难发现虽然其客户列表中重量级选手不少,但这些客户们往往“只取一瓢饮”,以探索的方式从点开始大模型及AIGC方面的合作。

新兴技术的未知性特点在大模型的算法黑箱下再度放大,导致产业在面对既往合作伙伴时依旧保持着相当的审慎——虽同为产业智能化,但模型服务的“完整性”远不如上云。这也导致了模型服务商扩大商业化的一个困境,即在体量不大的项目上投入大量定制化服务与资源,成为做多收少的“高科技施工队”。

然而吊诡的地方在于,而今增速趋近停滞的云计算市场已经发生了明确的转向,拓客方向自大客户转向中小客户。但模型服务却因以算力为主的基建成本高企,而难以跟上云计算的节奏,只能试图通过标准化产品广撒网,一点点啃下中小企业。

生成式AI代表未来已经成为业内共识,“断舍离”再难成为选项之一的同时,一众企业不得不迎难而上,冲突亦在这一过程中不断上演。

一、大模型需要好销售

过去一年多的时间内,商业化无疑是国内模型服务商最为关注的重要议题,以至于在一定程度上影响了服务商对模型及相关能力的迭代路线。

一个绝佳例证是,业内在模型易用性、工具链、避免“幻觉”等关乎使用门槛的演进频频落地。事实上,在2024年这一被定义为“AI原生应用”元年的时间节点,以低代码或无代码形式创建AI应用正逐渐成为现实,门槛或早已不是大模型商业化的首要难关。

此外,除少数闭源巨头外的开源社区也在持续缩小国内模型服务商的底座能力代差,几乎业界每每出现突破性的进展,其余主流玩家总能第一时间跟进,在Kimi近期掀起长文本风潮中,百度、阿里等玩家跟进并没有花多少时间。这意味着,通用底座能力难成大模型商业化初级阶段的胜负手。

事实上,在以AIGC为代表的产业智能化的创新扩散中,智能并不是关键,反而更像是一种“添头”。例如我们曾对话的一家SaaS企业,他们与而今逐渐深入业务流程的AI大模型的相遇,不过是一次偶然。

上述企业人士李浩告诉光子星球,就像许多深耕垂直行业的企业一般,他们对技术的感知不算敏捷,之所以了解到大模型,还是源于此前某场展会上的一次闲聊。

“腾讯那边有人和我们CTO聊了会,展会结束后,CTO觉着可行就跟市场部的人接触了”,他说,“机缘巧合下凑了一桌饭局,人家直接让业务VP拎着一大瓶酱酒来,推杯换盏间讲了很多大模型改造业务流程的事情,不过合作还是没能在饭局上谈成”。

尽管腾讯的合作意向非常明确,但李浩的领导还是有些兴致缺缺——早在去年,CTO便有意与业务数据所在的阿里云展开AI合作,但是“阿里那边迟迟不见动静,也没什么优惠”,这才给了腾讯半道截胡的机会。

另一方面,许多垂直行业早在两三年前就感受到了AI的冲击,但实际对业务的改造其实并不算明显。或许大模型的加入足以让AI脱胎换骨,但在销售口中天花乱坠的功能并不足以构成决策理由。

我们不难在云计算的政企BD中看到与之类似的销售场景——不可否认的事实是,“上云是一种趋势”的共识更多存在在互联网视域内,而政企侧对云的需求更多在于对顶层设计的考量。说白了,大多数非互联网企业应用新型技术的根本原因并非技术本身,而是需要“跟上同行的节奏”,AI大模型亦然。

当然,腾讯方面绝无可能放弃这条相对明显的线索,其还在饭局结束后多次登门拜访,“除了婉拒给我们独家提供技术支持外,我们提其他的条件,基本都答应了”。在这么一个几近赔本赚吆喝的情况下,腾讯才堪堪拓展一家企业客户。

据了解,这家SaaS公司经过数月的“AI初体验”后,最终决定在年中前后扩大合作范围。届时,腾讯作为模型服务商提供的由点到面的服务才刚刚开始,成本回收尚不知时日,遑论凭此盈利。

云计算行业从“比较技术性的超前概念”到“上云是一种趋势”,花了足足10年时间。反观技术深度、黑箱、幻觉等问题并存的大模型,似乎其商业化的路途更为崎岖。

这么看来,与其在产品层面持续做加法,倒不如多下功夫挖掘销售线索。另一方面,完善的BD体系也在一定程度上可以打破技术认知的高墙。可惜的是,在大模型技术尚未祛魅的当下,厂商的外宣重点往往落在技术突破上。进一步说,当大模型服务可以像云计算一般召开合作伙伴大会的时候,或许大模型商业化才能迎来真正的春天。

二、大模型需要CIO

模型再强也只能解决业务上的问题,其商业化困境本质上不在于技术,而在于商业模式和生态。不过自模型服务商的视角看,模型服务普及的“鬼故事”同样不少。

正如上文提到的SaaS企业,便在希望更广泛地接入AI能力时犯了难。“现在我们内部可以说是跑着两套系统,内部业务流还像以前一样跑在阿里云上,但尝试对外输出的AI大模型能力却跑在腾讯云上。领导那边还希望再引进语音、OCR之类的AI支持,又准备让我们接触一下科大讯飞”。

李浩无奈表示,现在公司有点“骑虎难下”,既不太方便彻底抛下阿里云做整体数据迁移,又不好再拓展与其他厂商的AI合作,毕竟这背后是搭建混合多云架构的隐性成本。他还提到,前端时间领导才刚刚因为销售团队开不出单而大发雷霆,在AI大模型尚未展现盈利能力的情况下,狠下心全面转投腾讯云怀抱可以说是不可能的事情。

不难看出,即使是有意引入AI能力改造业务的企业,由于领导层对AI大模型的了解仅限于网络公开信息与模型服务商的单向度灌输,其往往对市场没有一个清晰明确的认知。这家SaaS企业在采购决策上犹豫不决便是绝佳例证。

况且,非互联网企业的组织架构也是遭致上述情况的重要原因。或许大部分组织完善的企业都设有CTO职位,但其既有知识域基本局限于企业业务,而设有CIO的企业可以说是寥寥无几。

据红杉于去年末的一次调查显示,以CIO为代表的企业技术管理者将通过应用AIGC满足产品差异化和服务创新需要、增强办公效率与内部沟通作为主要目的;相较而言,CEO则将紧跟前沿技术趋势、拓宽企业经营边界作为AIGC应用的核心动因。哪种更利于AI对业务的深度改造,一目了然。

如果CIO的缺位不过是将AI大改造交由CEO或CTO统筹的话倒也还好,更糟糕的情况是在买方市场下,这份重担被转嫁给模型服务商。在一位模型创业者看来,这无异于是化身客户企业刚刚萌生的AI业务的“保姆”。

“前阵子,和我一起创业的产品经理差点顶不住与客户之间无休止的扯皮,闹离职”,他说,“我那时候还在美国那边做交流,听他辞职信都写好了,我赶紧打飞的回去,好说歹说才劝住他”。

据悉,事件起因是客户在为期三个月试用期内,就提出做多个深入业务流程的应用,从早期的基于RAG(检索增强生成)的企业内部知识问答到数字员工再到智能营销,可是试用项目的合同金额才30万。可怜这位产品经理在试用期内每天抓耳挠腮地控制交付成本,团队两天一小会三天一大会,然而客户还是在试用期结束后便接洽了服务更为成熟的大厂。

定制化项目在固定时限内的交付,将模型服务高大上的“皇帝的新衣”无情扯下,空留一个期货般的内核。

当模型服务商被迫在客户企业的AI改造中承担主要责任的时候,所谓产品的价值交付也就不再存在,取而代之的是极致的成本控制和交付压力。如果不能完全把握客户的需求,那么深入合作破裂也不过是时间问题。

三、定制化之困

近段时间,国内一级市场对AIGC的热情愈发低落。著名投资人朱啸虎亦公开表示,“AIGC PMF(产品/市场匹配),你投十个人找不到,投一百个人同样找不到。”

不可否认,在难销售、难交付、高成本的特性之下,大模型距离养家糊口的距离太远。那么,大模型PMF的终极阻碍是什么?

从上述案例中我们不难看到,首当其冲的难关在于定制化。

这背后的逻辑是,技术尚未进入创新扩散周期之前,依靠标准化产品回笼资金遥遥无期,高强度的BD以及其后的定制化是现金流的唯一来源。而定制化项目扯皮、交付、成本等各种窘境的缘由,则在于服务商丧失了对需求的控制力。

设想一下,如果是模型服务商自己训练某个MoE模型或是针对业务创建AI应用,在技术一把手的统筹下,只需对应业务部门给出明确需求以及不同优先级,便可以按需求驱动的方式进行敏捷开发,确保项目能在时限内以较高完成度交付。

如果将AI开发场景放到模型服务商与客户之间,则情况很可能“两级反转”。一面是客户并不真正了解AIGC对业务创新的抓手所在,导致需求频出而没有重点,另一面是服务商在不断提出的需求中疲于奔命。

如果服务商能在提供服务时获取行业数据的话,转起数据飞轮从而迭代垂直领域能力倒也是一笔不错的买卖。只是大多体量稍大的企业都对自家数据敝帚自珍,导致定制化项目做来做去都没有太多实际收益。

可以预见的是,定制化作为大模型商业化的一个补充手段,很可能只是少数大客户的专属。标准化产品做铲子以及建立在其上的应用生态才是淘金者的未来。

AGI的愿景虚无缥缈,长期主义也不过是商业化举步维艰的推辞。无论是靠定制化拉起营收从而做好市值管理,还是靠标准化打开认知从而将创新扩散出去,这锅夹生饭怎么着都得把它吃下去。

“每天只睡5小时”,大模型在火热落地中

aigc阅读(37)

中工互联董事长智振,最近经常奔波于前往各地的高铁上,见客户、签订战略合作、推进大模型落地,“比起一个月前更忙了”。

3月中旬,智振曾向数智前线分享自己的工作状态——“一天就睡5小时,光战略合作都忙不过来。今年的目标是面向能源等工业领域,落地至少几百、上千个大模型项目。”

而这种忙碌状态同样存在于数智前线接触的多位行业大模型落地服务商中。业界观察,行业大模型,正在以一种意想不到的速度,加紧落地。

水面之上,或许仍旧平静无波,但水面之下,早已激流暗涌。“现在大家还在水面下,下半年应该都会浮上来一些。”在金融行业做大模型落地的宽客进化CTO王舸说。

一、“每周以10个项目的数量增长”

被业界视作“大模型落地元年”的2024年,刚过去4个月,已经涌现出火热氛围。

“去年,主要是试的人和看的人比较多,愿意付费的人很少。”云问科技联合创始人茆传羽告诉数智前线,但今年,付费人群明显多了起来。

一位行业人士观察,以2024年春节开工后第一天,国资委召开“中央企业人工智能专题推进会”为风向标,大量央国企开始大面积寻找合适的业务场景,市场氛围被迅速带动,大模型服务商们接洽的项目也在快速增长。

“客户现在热情似火。”AI智能化服务企业众数信科创始人兼CEO吴炳坤说,去年,都是他们主动去找客户,但今年元旦过后,已基本变成“被动接洽需求”。2024年一季度尚未结束,这家公司处在PoC、走合同、实施交付等不同环节的需求数已有上百个,远高于去年10余家的量级,且每周在以10个的数量新增,“我们不得不开始筛选”。

宽客进化CTO王舸则透露,去年他们在大模型上几乎没有落地项目,但今年,他们已经签约好几个百万级的合同,涉及金融、电力、运营商等多个行业。其中,一些相对浅层次的需求,如大模型与传统标准作业流程的结合,目前落地相对良好,但一些更深层次的需求,如专家经验与大模型结合,还处于初级阶段,“这块的项目现在正在研发阶段,下半年可能会有一些落地案例出来。”

“围绕市场热点,主动找来的客户也有不少。”王舸进一步说,比如个性化写作场景,又如一些企业提出,是否能将数据要素和大模型这两个今年最为火热的概念结合起来。“比如数据入表,数据分级、分类,数据怎么溯源,以及数据需求方在交易所进行数据交易时,怎么在成千上万的数据产品中自动匹配需要的数据,这些都是大家在构想和探索是否能用上大模型的方向。”

“大模型的加持,对现在大热的‘数据要素×’三年规划来说,是一个巨大的催化剂,能让很多客户很快地感受到数据带来的价值。”浪潮云总经理颜亮说。

一些聚焦在更为垂直领域的大模型落地服务商,也明确感知到了变化。

云蝠智能创始人魏佳星告诉数智前线,他们主攻的基于大模型的智能客服业务线,今年比去年同期增长了30%的订单。而且今年的增长要比去年更加稳定。“去年3月,受大模型热度刺激,我们取得了不错的增速,但很快又在4月回落,但今年4月,不仅维持住了3月的增势,还继续保持了增长。”

高新兴机器人首席技术官刘彪则透露,机器人已成为大模型最快落地的领域之一。今年底左右,他们结合大模型的机器人产品将可能全面商业化。目前,在工业领域,高新兴巡检机器人在解决“跑冒滴漏”的难题,处于试用阶段;在物业等场景的烟火检测已商用落地。

而一些服务商,已经考虑规范化复制的问题。中工互联董事长智振透露,今年开始,他们将过去一年探索出的能做的方向全都产品化了,“一旦产品化,推广复制就会很快”。

吴炳坤也告诉数智前线,由于产品化,他们一些客户的交付落地时间,已经从过去的三个月,缩短到半个月。而今年,这家公司的目标,也不再是要拿下多少个客户,而是锁定两大行业、6个细分子行业,做15个标品化的产品出来。

“今年的大模型应用肯定会爆发,这个速度会比想象的要快得多。”智振说。

不过也有资深人士用“方兴未艾”来形容大模型目前的落地势头。“今年我们看到很多头部企业都动了起来,但大多都还是一些单点的应用或几个场景的组合。”一些人士表示,大家都在等待C端和B端的杀手级应用出现。

浪潮云CEO颜亮认为,从单点到全流程植入才能带来质的变化,可能需要1~2年,其中关键是大模型要经过周期性迭代,才能达到可用。“最多两年时间。竞争会促成大家的互相学习和投入,我们感知到,2024年用户在大模型上的投入,是2023在3~4倍以上。”

二、“在定价上遇到了‘挫折’”

春节过后,百度智能云渠道生态部总经理陈之若他们发现一个现象,一些大模型服务商,在帮客户做完PoC后,在定价上遇到了挫折。

“服务商起初自己也没有概念,打个比方假设以前产品卖两万块钱,加了大模型后定价三万五,服务商觉得是比较合理的,因为我给你降本增效了,但客户反馈‘效果不错但贵’。”于是,大家开始掰扯定价、交付和服务的事情。

这对于服务商来说,既是挑战,也是一个积极信号,因为大模型开始迈出商业化的第一步了。

定价背后,也有关于ROI(投资回报率)的考量。

“客户对于最终的产出物其核心关注的点就是ROI。”曹玺说。但大模型销售的更多的是服务,看不见摸不着,客户不容易算出ROI。

“这就需要服务商去帮客户把ROI明确出来。”软通动力罗晟告诉数智前线。比如,给企业售后场景赋能。原来一个售后人员即使经过好几天的培训,想要精准找到每个产品的售后问题,也要花十几分钟。但现在有了大模型助手,可以秒级辅助他们找到问题。这对于客户来说,就是一个ROI比较高突出的场景。

而曹玺介绍,当下ROI的测算需要拿效果说话有时甚至是较为直观的计算。比如,工作效率的具体提升,获新客户与客户转化的量化、购买数字人的成本比对。

几位行业人士谈到了大模型替代员工的敏感问题。“我们并不是说,大模型能减掉他们多少人,而是减少员工一些程序性的事物,提高效率,去做更有价值的事。或者可以有更多资源做新业务。”一位大模型服务商观察,他们遇到一家医院科室主任抱怨,自己手下那么多博士,整天在办公室写病历,根本接触不到患者。他们就想解决这个问题。

三、大模型场景落地要“短平快”

场景的选择,同样考验服务商的能力。吴炳坤告诉数智前线,过去一年间,行业内不乏“叫好不叫座”的情况。“大家的场景需求很多,但都是在做PoC,真正要让客户愿意付钱,还有蛮大的门槛要迈过去。”

智振则总结,“一年能回本,客户很容易接受;三五年回本,客户就要考虑考虑;7年回本,肯定得政策强制要求了。”这要求他们必须首先找到投资回报高的点来做。

为此,不少服务商都会选择小点切入的策略,快速形成闭环来看效果

比如新致软件,最开始实际是以咨询师的身份,切入到膳魔师项目中,并在多轮沟通和探讨中,发现了老板在了解公司运营情况时耗时过长的痛点。通过在工作群中引入数字人,收集对话素材,并进行模型微调后,实现对管理层需求的快速响应。

“原来一个数据报表的诉求,大概需要2~3周,现在可以缩短到一天。”曹玺告诉数智前线,这大大提升了管理层的决策效率。而在内部跑通几个场景后,新致软件又帮膳魔师进一步打通了外部场景,落地了to c的7×24小时的AI助理。

我们现在所有项目都是按‘短平快’的方式去做实施。我们会帮客户把一个大的需求,切到一个个比较小的点,逐点试错,逐点突破,而不是像以前做软件一样,一个项目做上半年一年,客户才能看到效果。”曹玺告诉数智前线,这样既保证客户能快速看到效果,也能根据客户反馈,更快发现问题,“少走弯路”。

“你要知道客户到底在做一门怎么样的生意,他最想达到的是流量盘活、转化率还是更精准的获客?你要不断的去了解客户业务诉求,同时要不断去做复盘和打磨。”曹玺说。

众数信科也在场景选择上提出了“小切口、大纵深”的策略。而为了避免大模型前期落地效果与客户预期之间因偏差而导致客户中途放弃的情况,有经验的大模型服务商,在锁定某个场景后,还会主动降低客户的心理预期。

中工互联智振也告诉数智前线,大家现在的想法都是优先把一个点打透,然后再基于这些成功的经验,做全链条的整合。“现在已经有客户与我们做了两年的规划,一点一点来做。”智振说。

技术和服务的延续性也被重点强调。“我经常被问到,大模型技术发展那么快,我们之前的选择的大模型会不会过时?为它做的定制、数据标注会不会失效?”百度智能云AI与大数据总经理忻舟说。

吴炳坤也告诉数智前线,大模型迭代太快了,但企业内部又基本没有专门的AI人才。这就要求服务商要形成一种新的思维——大模型时代的项目不再是交钥匙工程,而是需要提供教练式的陪跑服务,“陪着客户不断优化它自有的模型”。

四、大模型落地成本在下降

企业一旦在某个场景验证模型的价值后,第二步关心的就是如何降低成本。

“现在最常见的成本区间,主要有两级。”宽客进化CTO王舸告诉数智前线,一些简单应用,比如个性化写作、在传统BPM流程中串接大模型能力等,一般可以直接调用API,成本较低,二三十万元即可实现落地。另一极则是一些需要与专家经验深度绑定的项目,会有私有化部署要求,成本普遍在百万元起,甚至四五百万

“二三十万元的市场,今年会非常卷,而跟业务深度绑定的市场,是大家想做,但目前做起来还比较困难的市场。”王舸说,尤其是需要私有化的项目,算力会是一个比较大的困难。

实际上,为了解决算力难和成本过高的问题,业界目前已经探索了一些方法。比如,企业除了使用纯私有化的模式,也可以选择“公有云的私有化”模式,即在公有云上开一个私有化的环境,达到节省成本的目的。

“目前,像银行等有着严格数据不出域要求的金融企业,基本都还是采用前一种私有化,而在零售、酒店和文旅等数据管控没那么严格的行业,则有不少企业倾向于选用后一种模式。”新致软件曹玺告诉数智前线。

算力不足的情况下,通过CPU进行推理,也被不少人视为一个可选方案。“7B以下的模型,一般的推理场景,CPU目前是能够满足的。模型再大一点,30B~70B,速度会明显变慢,但一些不需要实时交互的场景,CPU也是一个比较好的解决方案。”王舸说。

更重要的是,模型轻量化的趋势,以及MoE概念的火热,也降低了企业客户对算力资源的诉求。

可以看到,通用大模型参数虽然已从上千亿走到万亿级,但具体到行业落地上,却不是参数规模越大越好。在海外,Meta发布的Llama系列模型,从70亿、130亿、330亿到700亿不等。在国内,百度、阿里、百川等都发布轻量级大模型。

“很多场景其实并不需要全知全能的能力,而是需要一个行业专家来解决一些专业的问题。”吴炳坤说。根据他的经验,在很多垂类场景中,通过剪枝蒸馏等手段,压缩出一个百亿级的基础模型,最大程度保留行业通识和能力,再结合企业的私有数据,也能实现千亿级的效果,推理成本更低,使用也更简单,是目前企业欢迎的做法。

“在行业中,我们认为7B-70B性价比最佳。”浪潮云CEO颜亮透露。

吴炳坤告诉数智前线,通过模型轻量化,他们已将包含算力、模型、应用等在内的落地成本做到几十万到小一两百万元的成本这也是不少中腰部企业普遍能接受的价格区间。智振则透露,现在做大模型私有化部署,成本已降到百万元起,一些小的嵌入式产品,比如1.6B参数、能放到一台单机上的模型,甚至可以做到5万元起

一些企业探索MoE(混合专家系统),以实现用更合适的性价比。MoE的全称是Mixture of Experts,被认为十分符合人类社会的分工概念,它通过“专家+路由”的机制,将不同问题交给对应领域的专家来解决,理论上能在算力成本不增加的前提下,显著提升Transformer模型的性能。

去年年中,GPT-4曾一度被传由8或16个MoE构成,这一概念随之在业内引起关注。几天前,腾讯混元宣布完成架构升级到MoE。

智振告诉数智前线,大模型会和第二次工业革命中兴起的电器一样,“最终并非一个电器通用,而是会涌现出各种各样的电器,从灯泡到电饭煲,它只会取决于不同场景下怎么样的性价比最高,怎么样的功能最强,客户接受度最高。”

李彦宏则在此前的一场演讲中指出,未来大型的AI原生应用基本都是 MoE 架构。

值得关注的是,多位业内人士告诉数智前线,MoE目前仍处于发展早期,还存在不少挑战。一些人士认为,它的技术复杂性太高,投入产出比不太匹配。也有人士表示,MoE需要资源较多,在响应速度和算力占用方面还有较大提升空间。

过去半年,大模型的技术进步速度极快,也推动行业落地的大潮在快速演进。

AI Agent推荐,把一群助理拉到聊天框里过一把领导瘾

aigc阅读(28)

近期,一条消息突然闯入眼帘,钉钉上线了钉钉AI Store。

带着好奇心打开许久未开的钉钉,在应用中心,多了一个tab“找AI助理”。

做为已经使用了一年多GPT+NewBing的用户,内心是有点瞧不上这次更新;

这不就是模仿GPTs,所做的AI Agent而已。

在实际使用过,才发现是自己EGO过大了,这次更新真的没有想象中那么简单,下面我将从几个实际的体验结果,带你了解钉钉AI助理真的没有我们想得那么简单…

一、初体验钉钉AI助理

首先, 只要更新到最新的钉钉,无论是移动端或是电脑桌面端,都可以从原本的应用中心下,找到“AI助理”,快速浏览200个左右现成的AI助理,且涵盖了多个领域,仿佛让每个打工人都不花钱地拥有了一批工作助理,随时待命。

在这里还提供了试用AI助理的功能,你可以先从侧边对话框中,尝试让AI助理完成你所交代的任务,如同面试、或试用期般,可以先尝试与AI助理协作看看顺不顺手,喜欢的话,在点击右上角的添加,把AI助理添加到日常工作的聊天列表里,随时可以从聊天继续呼唤AI助理协作,完成工作任务。

这段用户体验,真的让人仿佛获得到一位线上助理,如同平时在公司工作中在钉钉交代任务给实习生、助理帮忙协作的感觉,除了无法见面沟通外,真的就是多了一位工作上的小帮手,降低许多原本需要花许多精力的事情;

虽然市面上的AI Agent也不少,但能像钉钉AI助理这般,直接融入日常工作协作的工具中,形成工作流程闭环的产品,目前钉钉AI助理算是独一档的存在;拉了一排AI助理到聊天列表上,真的有种当上一个不小团队领导的幻觉,哈哈哈。

当然,也是有一些钉钉上的AI助理会有出现Bug的情况,发了好几次链接,就是无法顺利完成脑图的整理,过了几天才恢复了正常…

二、推荐几个好玩、靠谱的钉钉AI助理

1. 脑图专家

虽然刚刚吐槽了他刚上线时出bug,根本work不了,但过了几天后,我突然一试,可以正常生成脑图了,真的是非常方便,只要把想要整理、或粗略了解的文章,直接丢给他,但就帮你整理成一个个有结构化的脑图,帮你省去不少阅读、整理、理解的时间,尤其在工作上有很多资料需要消化的时候,快速阅读整理后的脑图,了解内容的大框架与脉络,便能快速地过滤、消化材料,真的不赖~

2. 小筑设计助手

虽然这个小筑需要支付额外的订阅费,但初次使用时,可以免费试用16天,在使用上整体效果还是令人惊艳的,只要随手画几张草图丢给TA,TA就能帮你渲染出一张张完整的建筑设计效果图,如是建筑相关行业、或设计师,这个AI助理能快速帮你省去不少精力,帮你做出完美的建筑效果图或建筑背景…

3. 行业知识树

行业知识树,这个AI助理跟上面的脑图专家AI助理有异曲同工之妙,但核心不同的是,TA只要你大方地将想要了解的行业告诉TA,TA就会自动搜集、整理出该行业底下的100个关键词与对应的解释,借鉴了麦肯锡的100个关键词快速了解一个行业的理论,真的是调研、学习的好帮手;

脑图专家是扫描仪,帮我们快速过滤内容的可读性、与结构化整理;行业知识树是精华行业百科,随手一翻就能快速入门任一行业的基础知识。

4. MoLook创意生成

这个AI助理就不得了,可以当你的服饰模特外,还是非常厉害的服装设计师,可以快速通过你给的关键词或描述,生成对应的服饰结果,还可以生成逼真的模特试穿效果图,大大降低请模特拍摄的成本,非常适合中小型电商、或个体户商家使用。

5. 薪酬分析助理

虽然薪酬分析助理跟其他AI助理稍微有些不一样,TA基本上不算是完整的AI助理,不像其他的AI助理可以直接在聊天框里就反馈你交代的任务,但TA仍然提供了一些简单的指导、说明,带领我们打开智能薪酬分析的钉钉应用上去使用;

虽然TA的智能程度不如其他AI助理,但TA仍有非常强大的薪酬分析能力,也值得我们借鉴,现在我们不止可以通过KOL、效果广告去帮我们的品牌、产品做宣传,也可以学习这个TA,制作一些吸引人使用的AI助理,让AI助理帮忙我们的品牌、产品导流,相信这未来也会是越来越多公司会不愿错过的流口入口之一…

6. 打工搭子

相信打工人总会有上班上得莫名其妙厌烦的时候,不管忙或不忙,就死活不想干活,却又要装得在干活,这个AI助理就很适合这个Moment使用,提供了几个不一样好玩的文字对话游戏,让你假装在跟协作方、客户讨论沟通,其实是在给自己的情绪做个心灵SPA,是短暂舒压的好助理。

三、体验总结

1. 开放才能共赢

开放共赢,我个人感觉就是刻入阿里巴巴的DNA,做为国内最大的企业沟通协作工具钉钉,不仅开放了第三方应用接入,AI时代的当下,还开放了AI助理,让各路好手能到这里制作出不同有趣、好用的AI助理给打工人排忧解闷,同时也给第三方带来流量或收入,让钉钉生态中的协作方皆能从中获得到各自所需的,形成生态中的良性循环:吸引更多用户使用,让更多协作方获利,进一步吸引更多协作方入驻,提供更多好用的AI助理,再进一步吸引跟更多用户使用…

2. 好的AI Agent体验,是被主动反馈

虽然现在AI Agent的产品很多,也有很多功能很强大的AI工具可以使用,但无一例外的,就是你得在浏览器上开各式各样的网页来与TA们保持联系,一不小心就点击到关闭网页,得重新找到网址打开TA们…仿佛你得求着这些AI助理帮你做事,且得在各种花里胡哨的对话框中传达任务指令;

现在你不用再辛苦到处收集AI助理的网址,只需一键就添加到钉钉的聊天列表里,随时一句指令,就会在聊天列表开始工作,并把任务成果回传给你,与平时领导交代你任务,你处理完回传给领导一样,让打工人也过过当领导的瘾,只动动口就能有AI助理帮你完成任务,多么好的体验。

3. Agent与工具,要聚在一起,才会有综效

综效(Synergy)就是我们管理学上常说的1+1>2的理论名词,现在的AI虽然对用户需求的理解已经很高,但对任务的处理逻辑能力、运算能力还不是特别足够;而工具应用是已经有很成熟、很强大的功能可以处理任务,但却无法很好地与用户沟通,让用户轻易地上手。

但在钉钉内部,就实现了AI助理与工具在统一生态中,你可以通过AI助理的协助,帮你轻松地上手使用工具,处理掉工作中难度较高的任务,也可以直接让AI助理帮你解决掉工作中琐碎但简单的任务,两者同时帮助你所产生的综效,就远远大于两者独立分开来支持的情况。

4. 钉钉或成为国内最大的AI Agent平台

虽然微信也是个通讯工具,也很适合让LLM AI接入,做成AI助理的聚合平台,但微信与钉钉上的通讯不是同一个通讯,微信是熟人之间的聊天,是情感上的交流与分享;钉钉是工作之间的沟通,是理性上的任务推荐、解决问题,而AI助理虽然已有很强大的语言能力,毕竟无法与用户深度地情感交流,仅适合任务之间的沟通、协作…

钉钉足够开放的生态个性,与天生契合AI助理对话狱警的通讯产品属性,就变成AI助理肥沃的生长土壤,未来或可能成为国内最大的AI平台,也不无其可能性。

力压Kimi,“新生代”秘塔AI搜索来势汹汹

aigc阅读(14)

一、革搜索引擎的“命”

比kimi更火的AI产品来了。

今年3月,据SimilarWeb数据,“新生代”秘塔AI搜索网站日均访问量达到 20万次以上,月增速达551.35%,大超kimi的321.55%。

刚跻身前三的秘塔AI搜索,热度与访问量还在持续攀升。

秘塔AI搜索由秘塔科技2024年初推出,被业界称之为“中国版的Perplexity”。

秘塔科技创立于2018 月4月,核心团队主要有CEO闵可锐、技术专家唐悦和首席运营官王益为等三人。

闵可锐曾是猎豹移动首席科学家,也是玻森数据CTO&联合创始人。唐悦曾获全国青少年信息学奥林匹克总决赛(NOI 2023)银牌。

王益为不仅拥有10年红圈律所工作经验,还是B站坐拥58万粉丝的著名法律up主“王一快”。

借助流量优势,王益为带领运营团队,在B站、微博、公众号等多平台为秘塔系列产品进行内容投放和转化。

秘塔自研的大语言模型 MetaLL,已通过了《生成式大模型备案》(第二批)和《大模型算法备案》(第二批)。

从垂直的法律 AI 办公工具赛道出发,MetaLLM逐渐扩展到翻译、写作、搜索等泛知识领域。秘塔科技也在2021年5月获得 Pre-A 轮融资,融资金额达数千万元人民币。

与传统搜索相比,AI搜索更加高效简洁。

传统搜索软件,结果返回的是多个网页内容,中间还参杂广告。用户需反复点击进入多个网页分析后,才能获取想要的信息。

而通过在数据库中检索与用户问题有关的内容,AI搜索经总结后输入大模型,并由大模型输出直接答案,且该答案可索引。

秘塔AI搜索增长迅猛,与它提供的搜索新体验密不可分。

在使用上,根据回答详细程度不同,秘塔AI搜索分为简洁、深入和研究三个选项,并有“全网”和“学术”两种模式可切换。

AI回答右侧附有大纲,下方则附有相关事件、组织和人物,并标明来源。

二、AI搜索亟需商业化

在全球市场,AI搜索同样来势汹汹。

2024年3月,根据非凡产研统计的全球AI产品数据访问量,个人聊天与助手类排名第一,占比为44.25%。紧随其后的就是AI搜索,访问量占比为24.21%。

国外AI搜索引擎玩家,不只有类似秘塔这样的初创团队,微软等大厂的身影也显现其中。

但摆在所有AI搜索引擎面前的,除了技术和搜索体验的突破外,还有一大共同难题——如何实现商业化。

传统搜索引擎在用户流量大幅增长之后,并不会即刻引发公司成本大幅增长。只有用户数量到达一定规模之后,企业才会添加服务器。

但由于每一次使用AI搜索引擎,都要调用大模型API,还有算力成本。因此,用户量与AI 搜索公司成本与呈强相关。

号称“没有广告,直达结果”的秘塔同样如此。长期免费或者不考虑商业变现,几乎不可能。

三、卖广告的宿命

秘塔AI搜索用户量急速上升,未来商业化如何落地,是秘塔的重要课题。

同样是AI搜索领域的初创企业,“领头羊”Perplexity的探索路径,或许对秘塔有重要参照意义。

Perplexity成立于2022年8月,由前OpenAI研究科学家Aravlinind Srinivas联合几位合伙人共同创办。

自问世以来,Perplexity访问人数一直保持稳定增长。同样在今年3月,Perplexity的月访问量达到了6414万人次,是秘塔9倍。

创立一年半,Perplexity的估值已是半个独角兽。今年1月,Perplexity完成7360万美元的B轮融资,投后估值达5.2亿美元。

Perplexity最为出圈的一次曝光,要感谢英伟达CEO黄仁勋。

当有媒体问黄仁勋“多久使用一次ChatGPT或者Bar”时,黄仁勋答到:“我一般用Perplexity,且几乎每天都在用”。

黄仁勋每天用的,应该是Perplexity的Pro专业付费版。

该类用户单日可使用超过300次,且可无限制上传文件。目前付费版月费定价与ChatGPT Plus相同,为20美元/月。

Perplexity的收入,目前主要来自付费订阅,去年已突破1000万美元。

据AI业内人士透露,这些收入,绝大多数来自B端。主要是企业购买账号给员工使用,C端付费非常少。

这种营收结构,在大模型公司以及大模型衍生产品中十分常见。

甚至可以说,凡是已跑通商业模式、形成稳定收入的AI公司,客户基本都依赖B端。

就连Open AI这种巨型用户量级的大模型,同样呈现出企业级用户付费意愿更强的态势。

这或许因为,企业用户在大模型时代,既积极,也焦虑。他们担心,如果不率先在同行中使用大模型降本增效,就会落后于人。

“没有广告,直达结果”的口号,直击时下搜索引擎的痛点。AI搜索,能一直保持“纯净”吗?

值得注意的是,靠B端商业化渐成稳态,Perplexity近期在对广告的态度上也有所改变。

和秘塔一样,Perplexity目前也没有广告。但据某一位Perplexity管理层表示,Perplexity并不排斥广告。

他透露,AI能够提升广告触达目标用户的效率,这一新功能有望未来几个季度推出。

在Perplexity官网,搜索结果中呈现相关(Related)问题,将成为首先对品牌开放的广告位。

也就是说,未来当用户询问时,在回答下方位置,Perplexity将在延展性问题中,植入品牌相关的内容。如用户进一步追问,Perplexity将继续显示广告链接。

这种模式,十分类似谷歌和百度这类传统搜索引擎的竞价排名。

之所以躬身卖广告位,核心原因还是成本和盈利压力。

创始人兼首席执行官Aravind Srinivas 提到,Perplexity尚未盈利。

API成本和搜索算力,都不是小钱。20 美元一个月的订阅价,难以支撑长期运营,更无法撼动商业模型成熟完善的搜索引擎巨头。

这令不少AI从业者感慨,AI再高大上、再喊无广告口号,也逃不脱卖广告的宿命。

市场亦有传闻称,为给下一代AI手机准备,苹果将接入Google的Genimini,还打算收购Perplexity。报价据悉将超过10亿美元。

除了卖广告和“卖身”,AI搜索是否还能有更多商业化新路径?

这有待秘塔及其他同行给出答案。

AI Agent,普通人也能抓住的AI技术的第一波红利

aigc阅读(29)

前段时间,人人都是产品经理视频号上做了一场有关于AI Agent的直播分享。在直播间里,张佳老师提到了如何抓住AI时代的第一波红利。个人感触还是比较大的,所以把直播分享的信息与个人的真实体验做了一些融合,供大家阅读。

一、你的能力和经验

一个趋势,所有大模型厂商都在布局智能体,比如钉钉这款覆盖面巨大的软件,就推出了由通义千问承担底座的钉钉AI助理,并在4月18号正式上线了AI助理市场(AI Agent Store)。企业、个⼈⽤户、开发者开发的AI助理都可通过上架市场,分享给更多⼈。其他厂商也在跟进智能体这件事,比如百度旗下的“灵境”、讯飞星火旗下的“星火助手”等等。

恰好,这两天看了钉钉举办的AI助理创造大赛,里面不仅有航空公司、芯片公司这类的专业选手,也有很多养猪、公安的比较有话题性的Agent打造者,也不乏DIY赛博财神、考研考公的素人选手。挺有意思,值得关注的是这些人、这些公司真的在用AI做事了。

我们先看看,为什么几乎所有大模型厂商都在布局智能体?我们先从大模型的日常使用说起。

在大模型的日常使用中,不少人可能都有类似感受,即大模型的输出总是不太靠谱,甚至到了现在,AI幻觉这一问题依旧不能被消除。即使我们在不断地做提示词优化,类似的问题依旧在不断发生。

所以,提示词工程解决不了普通人用AI的问题,在大模型主要以对话式窗口作为呈现样式的当下,用户需要一个专门的“窗口”来解决问题,即不需要通过提示文字或者修改提示词,用户打开对话框,调起相应的窗口(比如智能体,比如Agent等)即可直接解决问题。卖提示词和提供提示词优化解决方案是错误的方向,我们应该开发专门的工具来满足用户需求。

而“窗口”就是智能体,即AI Agent。

2010年左右是移动互联网时代,时间快进到2015年以后,短视频平台疯狂涌现;在这些时间段里,我们可以抓住的红利并不是直接开发或搭建相应的手机系统或者短视频平台。当下也一样,AI时代的红利并非搭建大模型,而是在大模型生态中搭建一个应用。Agent就是这样的一个个应用,我们可以基于需求去调教机器人,通过反复的调试优化,让最终的解决过程实现标准化

  1. 提示词标准化;
  2. 工作流标准化。

同时这个标准化流程,或者说这个智能体是可以同步给他人使用的,其他人亦可以在智能体里得到答案。这意味着,这套思考问题、解决问题的方法和工作流将可以被复制和变卖,人的能力可以被转化为服务和赚钱的机会。

尤其在AI时代,用户在使用Agent的过程中可能存在信息差,但这类信息差已经可以被大模型弥补。

二、唯场景和想象力

为了最大化地发挥智能体的价值,我们需要弄清楚场景表达力这两大关键因素。

我们首先要明确一个问题,即限制我们使用AI的,并不是AI的能力,而是我们的想象力和表达能力,工作和生活中的所有流程都可以被AI重构,只是大多数情况下,我们没有想到重构的方法。比如我询问一个智能体如何记住“windfall”这个单词,它给出了非常不错的联想:

这其实就是“想象力变现”。

怎么先人一步地将想象力落地并表达出来呢?想明白三件事情。

  1. 你擅长什么?这是你的立身之本。
  2. 用户需要什么?你的AI助理,究竟可以解决什么样的需求?
  3. 如何呈现自己的价值?做好助理配置。

另外可以多问问自己4个问题:

  1. 这个问题,AI 能不能做?为什么?它做比我做优势是什么?
  2. 我应该如何向 AI 描述这个事情?可以让 AI 重复帮我执行么?
  3. 这个技能“教给”AI 能不能产出更好的内容?如何总结成 AI 可理解的表达?
  4. 不要服务于流程,争取去做那些能够服务于人的工作。

在自问完这些问题之后,相信你心中会有一个智能体的大概框架。

那怎么搭建智能体?这其中牵扯到了表达能力。你可以将大模型当作一个非常聪明的实习生,所谓“表达力”,其实就是给实习生写一份指定工作的SOP文档。当大模型实习生叠加SOP,这便是你调教出来的Agent,它可以重复地服务于别人,甚至达到变现的目的。

三、常见需求和工作流

基于钉钉AI助理,我们可以结合3个具体案例来感受Agent的魅力。

1. 基操:搭建一个帮你处理日常办公琐事的智能体

这个智能体可以帮助我们进行文字整理、日程管理等等工作。当我们将需求输入给智能体,智能体拆解需求后,将调用大模型的文字编辑和文字识别能力,调用完之后再返回给Agent,由Agent对大模型生成内容做进一步的梳理。

举个例子,我们可以给Agent发送一句话:

“下周三3点半,和总裁汇报XXX事情。”

Agent在接受信息后,会让大模型将这句话中的对象、时间、事件提取出来,在大模型将内容按照一定格式返回给Agent之后,Agent可以调用钉钉的日程管理、会议管理等技能,帮助用户直接搭建相应的日程。

又比如在做电商的过程中,业务人员需要做竞品调研,在条件限制的情况下,业务人员可能直接多选页面上的所有用户评价,并发送给智能体。此时,智能体可以在收到内容后将错乱的内容按照指定的格式进行整理,并且在整理好了之后,直接输入到多维表格中。

用户还可选择钉钉应用并让AI助理学习操作路径,AI助理后续即可根据用户的自然语言输入模拟真人进行页面的操作,提升高频操作行为的操作效率,即拟人化地“看”用户真实操作一遍就学会了:

  1. 像真人一样看懂内容;
  2. 推理出怎么操作;
  3. 然后有手去操作——眼睛、大脑、行动系统(感知、决策、执行)。

比如:维修工单提交需要每次手动在工作台里找“XXX”应用,再进入应用里找到填写入口、填写信息,流程繁琐需要跳转。配置拟人操作后,只需要和AI助理说“帮我提交干燥剂的故障,申请故障,描述是机器运行,有很大的噪音”,便会自动唤起一个执行卡片,信息确认无误后就开始执行,执行后会跳出已经填写好的表单,由用户最终确认后提交。

截图来自钉钉官方示例

2. 进阶:让智能体参与内容创作和运营工作流

假设我们需要让AI帮助创造爆款文案,我们可以将个人掌握的能力、经验和方法论如短视频创作方法论、私域营销文案方法论等上传,让智能体拥有我们的方法论与工作流。

比如上传二极管标题法,让Agent选择这一方法论,学会创造出可以挑起用户情绪的爆款文案:

比如上传情绪化选题公式,让Agent依据相应的选题公式组合出情绪化的选题:

让Agent拥有知识“百宝箱”,把活儿干得更漂亮。

值得注意的是,工作流能力使得AI助理能批量处理更复杂的任务。它是 AI Agent 的一种进阶玩法,不仅可以在创建时对 AI 执行任务的流程进行拆解和编排,使得 AI 助理可以主动接管完成相应操作,还能够打通外部的系统数据和 API 能力,进一步扩展了它的行动能力,比如搭建能自动写脚本并生成视频的创作 AI 助理。

3. 超神:用AI助理把“查询搜索”玩出花

除了处理日常任务和创意工作,智能体的另一个强大功能是其对企业内部数据的调用能力,这为企业内部支持和决策提供了新的视角。我们还可以让Agent自由地调用企业内部的数据和知识,如员工手册、各部门技能要求等,将各类内容填充至知识库中,让AI成为数字客服,提供内部支持。这个时候,Agent可以依据员工问题进行知识库搜索和调用,大模型将调用的内容进行编辑,并由Agent返回给用户。

甚至可以自行创建AI助理,比如可以通过自定义功能、添加工作流、连接API接口等方式来处理问题。

举几个例子。

1)原先,天气预报APP可能会和企业的服务器做互通,从而为用户提供天气预报信息。而现在,这套互通的能力可以放到智能体中,由智能体来请求公司的API地址,并将天气信息发送至公司服务器。这就是基于连接API接口的方式来解决问题。

2)我们还可以借助智能体来共建知识库。假设公司内部建设了一个AI助理,此时我们可以添加自定义能力,让AI助理将超出知识库的问题存放至表格中,随后由其他负责人添加答案。后续若有人再问同样的问题,答案也就有了,这就是知识库共建。此时我们结合工作流能力自定义了AI的干活方式(工作流自定义展示):

四、结语

在AI时代,“想象力就是生产力,”AI技术的普及也对个人能力提出了新的要求。在AI时代,持续学习和适应新技术变得尤为重要。无论是企业还是个人,都需要不断更新知识体系,提升与AI协作的能力,以适应不断变化的工作环境。

而普通人完全可以基于成熟的平台来发挥创造力,比如基于钉钉等平台,我们可以反向接入模型来做AI助理产品,避开“拿着锤⼦找钉⼦”的陷阱

理解并掌握AI Agent,是普通人在AI时代可以抓住的第一波红利。