欢迎光临
我们一直在努力

AIGC对图片行业的影响分析

aigc阅读(111)

AIGC自2023年全面进入大家视野,对各行各业造成了或大或小的影响。大模型、AI、AIGC这几个词大家耳熟能详了,不同的行业、公司,都尝试在自己的领域、业务中找到结合AIGC的方式,带来新的机会。

有这么一种说法,AIGC的到来是PGC、UGC之后的第次创作者革命。也有说法是AI、大模型的这次浪潮几乎可以等同与互联网、移动互联网这样新概念给社会带来的变革。AI是个风口,AIGC是个风口,大模型是个风口,大多数行业、公司、个人都期望能借着这次风口乘风而上。

本文仅结合作者在图片行业的工作经验,去分析AIGC对于图片行业带来的影响,以及以后发展的趋势。很多东西比较主观,是分析也是预测,希望对各位读者有一些作用。

一、图片行业概述

一切的话题从上面这张图说起,整个图片行业其实可以简单的划分为三个组成部分,即:

  1. 生产方
  2. 交易平台
  3. 使用方

二、生产

图片行业的创作者整体分为这么几大类,摄影师、插画师、AIGC创作者。其中第三类正是在2023年AIGC工具蓬勃发展的背景下诞生的新的创作方式。

1. 门槛

从工具来说,摄影师的主要工具是相机,无论是创意类摄影师还是资讯类摄影师(*以拍摄新闻图片未主的摄影师,这类图片不强调创意性,更在乎的是时效性、画面故事性和主题)都是借助相机完成创作。他们的创作工具可能是专业的照相机,也可以是普通的手机。摄影师的门槛不高不低,原因是摄影师想要做到最好自然是很难的,但是入门却十分简单。

有一个可以拍照的设备,有基本的拍照常识(快门、光圈、焦距、焦段)就可以入门,如果再掌握了一些构图、色彩的知识,并且掌握了一些基本的灯光设备使用技巧,就算还可以了。再此基础上再积累了一些审美、经验,那就算是一个比较好的摄影师了。所以整体门槛不算高。

插画师的门槛较高,因为设备其实还不是主要的,主要的是绘画是一门需要长久学习的专业技能,要达到客户愿意为此付费的程度,即使不是科班出身,也是需要很长时间的绘画技能学习、审美积累的。要达到“好”的程度,更是需要付出巨大的努力,甚至是需要有一些“天赋”才能达到,所以门槛其实很高。

而AIGC创作者,由于创作的能力大部分是“工具”提供的。创作者只需要去学习工具的使用,并且善于思考,能够准确将需求表达给工具既可以创作出不错的内容。以Midjourney举例,只需要非常简单的英文词汇,就可以创作出五花八门创意十足的图片。而StableDiffusion则学习门槛高一些,由于SD能满足较高程度的定制化,所以对应学习成本会高很多。(并且由于MJ的商业化较为成功,开发团队有很强的意愿和驱动力去进一步优化使用体验,降低使用门槛。而SD是开源免费,因此需要自己多学习去“折腾”才能产出不错的成果)

2. 定制化程度

摄影师创作的定制化程度较高,无论是需要什么样的山川风光,还是精致的产品摄影,都是能够想办法去创作解决的。尤其是在有PS之类的后期工具辅助下,一些不太好实拍的摄影题材也可以通过后期的合成一定程度解决。

插画师同理,根据用户的需求可以创作出任何主题、风格的内容,并且可以相对成系列,因此插画的定制程度也是极高的。

AIGC创作就目前市面上的MJ和SD两个工具来说,在当前时间点(2024年3月)MJ其实定制化程度很低,甚至想要控制角色的一致性都非常难做到(虽然有了–cref命令去控制同一个角色),至于说想要对画面有精准的布局、色彩等控制就更是难上加难(不考虑用词严谨的话,我可以说当前版本基本做不到)。而SD则有完全不同的体验,SD要生成一个好的东西,需要更加详细准确的正负向提示词,需要各种模型选择,需要各种参数配置,需要各种ControlNet的控制。但是得益于这些控制,SD的定制化程度非常高,可以一定程度上控制角色一致性,可以精准控制构图、光影(2023年底各种新媒体平台流行的光影错觉拼成文字就是SD的基本应用),可以定向换脸或者换服装。SD的门槛高但是可控性上非常强。

3. 生产成本

摄影的生产成本是很高的,尤其是商业广告使用的一些图片。风光摄影的成本高在去一些人迹罕至的地方拍摄带来的旅途成本,产品摄影的成本高在工作室、灯光设备、大量的人员、后期时间、一些实体装饰物品的购置成本。甚至是婚纱摄影也需要工作室各种灯光、摄影器材的成本(如果是旅拍的话还有旅途费用成本)。

插画的生产成本更多体现在人工、时间成本。插画师即使在熟练,也是需要一定时间才能绘制的,更别说人的创意是有限的,很多插画师在绘制插画主要的时间消耗在找灵感、改稿子上,人力成本在当前时代,尤其对于专业技术人员来说,是最高的成本。

AIGC创作成本就大幅降低,MJ可以1分钟生产4张高质量的图片,并且对人员专业程度要求低,可以随时培训上手。而SD虽然复杂、门槛高,但是实际创作起来时间成本比摄影和插画大幅缩减,并且通过ComfyUI行成工作流后更是可以自动化批量生产。AIGC需要的生产成本,是远远低于摄影和插画的。

4. 从生产来总结

从生产来说,AIGC带来的是极低的门槛,极高的生产效率,极低的生产成本。曾经有人在元宇宙兴起的时候说过,限制元宇宙发展的其实是生产效率,而AIGC带来了生产效率的跨时代式提高,当然,AIGC已经不再限于元宇宙了,AIGC带来各行各业生产效率的跨时代提升。

一个简单的例子,一个插画师绘制一张不错的插画,需要多年的学习、经验累积,需要很长的时间累积灵感,然后用一天、两天绘制出一张精致的插画。这个过程在Midjourney只需要一个普通人,输入一个提示词“apple illustration”,然后等待1分钟就可以得到4张超过市面上80%插画质量的插画。

三、交易

图片行业,产生交易在什么地方,其实可以概括说产生在工具产品、图库和中介平台。

1. 工具产品

工具产品是指最终用户实际使用图片的场景发生地,例如做PPT的人用图在WPS,做新媒体封面的人用图在创客贴、爱设计、Canva,做广告设计的人在Adobe PhotoShop,以此类推。

2. 图库

图库是指一些较为专业的图片市场,例如视觉中国、千图网、站酷海洛、图虫创意,在图库选择图片的用户相对专业性较高,并且对版权要求较高,需要保证无版权风险。主要使用在社交媒体发布、线上线下广告、图书出版和商品印刷。这是一个价格相较于工具产品更高的市场,工具产品往往是包月、会员制无限用图,图库则是按张计费比较常见。就单张图片价格来说图库是远高于工具产品的。但是图库中图片数量、质量通常会更高一些。

3. 中介平台

中介平台指的是一些提供定制化拍摄、插画绘制的中间平台,帮助摄影师、插画师和客户牵桥搭线。这通常是一个定制化程度非常高的高端需求市场,给到摄影师、插画师的价格通常是远高于图库的。比如一些大的广告公司会在需要某些题材的市面稀有照片时,会找一些专业摄影师去定制拍摄交付。插画师也是同理,例如出版教材时需要整本书的插画风格统一,且主题是和配文一致的,就会花钱雇佣一个插画师去完成整本图书的插画绘制。

AIGC的出现,给这三类产品带来了巨大的影响。

4. AIGC对工具产品的影响

原来在工具产品中,更多是通过API接入图库或买断一些素材的方式,向用户提供图片使用。例如用户在做PPT时,会在WPS中查找有没有符合自己要表达主题的图片然后插入。但是AIGC由于门槛低、效率高的特点,可以做到让终端用户直接描述自己需求,生成一张独一无二且符合自己需求的图片直接使用。

整个逻辑从拿着需求去找图片匹配,变成了AI拿着需求去创作一个符合需求的图片。可以理解为为每一个用户都配套了一个效率超级高的摄影师、插画师,1分钟给你输出高质量内容。

工具产品因为是最接近终端用户的,所以AIGC可以赋予他直接满足用户需求的能力。随着AIGC的生成效果越来越好,逐渐“生成式满足需求”会完全替代现在的人工去找图方案(因为效率低、质量差)

5. AIGC对图库产品的影响

原来给图库供稿,需要相对较为有经验的摄影师,需要比较专业的插画师来创作。而AIGC时代的来临会大大提高创作效率,创作者只要对于选题有思路,就会很快的批量生产图片,这会极大的冲击传统供稿。尤其图库入库,其实定制化要求不高(甚至没有),所以MJ之类的工具非常好用。就我个人来说,我在端午节3天就创建了600多张插画入库到图库中,这个在以往是完全难以想象的。

可能有同学会想,为啥用图的人不自己生成而要到图库购买?其实本质上,图库图片的创作,已经从一个艺术性创造工作变成了体力活。AIGC创作人是在出卖自己的体力赚钱,AIGC目前的问题是不会100%可用,而AIGC创作者就是不停尝试,然后筛选出好的内容,这样用图的人就省得自己去试错了。购买图片本质就是为选题和试错的成本进行付费。

但是以后等AIGC生成内容成功率非常高、质量非常高(现在市面门槛最低,生成质量最高的应该就是MJ,但是MJ只在一些题材上非常的好,例如静物、单个人的肖像,但是在一些题材非常差,例如大场景的自然风光、城市风光还非常的不理想,如果MJ能把这一块做好,真是对图库极大的冲击),AI非常能准确满足用户需求描述时,可能真正会对图库带来毁灭性的冲击。

6. AIGC对中介平台的影响

对于牵桥搭线的中介平台,AIGC的到来可能会带来新的发展机遇。因为门槛降低,会有更多人成为AIGC创作者,并且AIGC创作的标价应该会更低,很多客户会倾向于找AIGC创作人做定制化的创作。这会让中介平台更加的欣欣向荣。

四、总结

对于创作者来说,AIGC降低了门槛。但是要说会不会替代所有摄影师、插画师,我的结论是不会。甚至高端的20%摄影师工资收入会比现在还高,在全面AI的时代高技术、好创意的“手工”会更加值钱。而中低端的摄影师和插画师要么被替代,要么会拥抱AIGC去提高产出效率和质量,要么就会被逐渐替代,这肯定是未来的趋势,更加两极分化严重。高端从事创意工作,低端从事体力工作。

  • 对于交易平台来说,能更好盈利的一定是离用户最近的工具平台(或者说离用户使用场景最近的地方)。AIGC大大降低门槛,让普通需求方也可以自行按需生产使用了,这会极大的侵占商业图库市场。所以对于以后的图片市场,一定是大家充分拥抱AIGC,但是更需要在自己的垂直赛道去深耕,满足垂直领域用户直接生产的需求。毋庸置疑,核心是生成内容的质量和效率,而在垂直领域耕耘是在大家生成质量都大差不差的情况下的致胜法宝。
  • 对于中介市场来说,AIGC创作者将是一个极大的增量,也会是未来一个核心的创作者大类。
  • 对于使用者来说,未来的用图成本大大降低,用图质量大大提高是必然趋势。

AIGC核心在生成质量,AIGC机会在垂直赛道,AIGC的盈利关键点将回到众多的普通用户身上,技术的下放,门槛的降低,成本的下降将给图片行业带来一次新的机遇,对传统图片产品和企业带来一场无法逃避必须直面的挑战。

AI大模型在汽车行业应用探索

aigc阅读(133)

一、AI大模型的前世今生

1. 大模型发展概述

人工智能早在1956年就已出现,后面在此基础上又出现了机器学习。在发展过程中,算法层面变得更为丰富。进一步发展,又出现了深度学习,引入了神经网络。基于深度学习,在2021年出现了预训练大模型。2023年ChatGPT的发布,引起了人们更多的关注和更广泛深入的探索。

2. 什么是大模型

到底什么是大模型,大模型大在什么地方?

首先,算法模型不一样,最早是transformer奠定了后续各类大模型的模型基础。其次是海量参数,以前的模型最多只有百万级参数,而现在的大模型常常是亿级、十亿级,甚至百亿级。第三是海量数据,预训练会用到很多的数据,比如ChatGPT完全是基于网上数据去进行预训练。

3.大模型很强大,但仍处于早期发展阶段

大模型能力很强大,真正比较深入的应用还不是很多,整体上还处于早期的阶段,因此在行业应用中会碰到各种问题。

1)成本高

如果去做一个垂类的大模型应用,首先考虑部署,私有或者共有。私有部署需要基础数据标注、训练成本、算力成本、预训练团队成本。在训练完成后,上线使用还会有推理成本。

2)垂类应用难

现在应用较多的还是通用大模型,通过文字输入一些问题,以知识库的形式去回答,一旦聚焦到解决具体行业问题时,经常难以满足一些垂类应用。比如AIGC做一些营销素材的生成,如果嫁接到汽车行业里面去解决一个具体的问题,还是比较难的,中间会需要很多的调整,以及预训练。

3)安全问题

大模型应用时,尤其是知识库,会涉及到各种各样的敏感问题,答案输出也需要考虑是否符合国家相关规范,因此大模型需要解决合规的一些问题。

4)隐私问题

与个人相关,包括法律法规规定的一些敏感数据,一定不能通过通用大模型去输出。

4. 大模型催生“效率革命”,为产业提质增效

经常会有人问,大模型能够创造什么价值?其价值的核心在于效率,为各个产业降本增效起到积极的作用。

1)能力比较强

大模型在专业领域,包括推理能力上比人强很多。

2)效率更“高”

AI大模型,以及衍生出的AI数字员工,能够代替一部分人工的工作,提高效率。

3)场景更“广”

AI大模型的应用场景广泛,比如汽车营、销、服、研、产、供等各个环节,包括智能驾驶、智能座舱等等,各个车企都已经开始实现大模型上车,在车上真正的去使用大模型。

4)应用更“深”

无论是行业级应用,还是具体产生直接价值的应用,大模型+AI将推动全链路的智能化。

二、AI大模型在汽车营、销、服领域的探索

1. 汽车营、销、服业务全景图

在整个营、销、服阶段有很多环节都可以基于AI大模型去进行赋能。我们对这些环节逐一进行了探索和尝试,寻找可以真正落地的场景。

2. 营销:提高内容产出效率,助力线索提升

1)舆情问题智能匹配

在舆情问题发生后,需要质量部门的人员进行识别和判断,再发到研发侧。

可以通过AI大模型去做预判,把每天舆情的问题自动转换成一些匹配,分给对应的质量部门和研发部门。

2)媒介投放

投放广告的时候,需要写关键词,可以通过AI大模型去做拓词,拓展关键词把它放进去。

还可以通过大模型去做标题和素材的生成,批量生成多个标题和对应的落地页素材。

3)AIGC智能生成内容

在车企营销部门会做专门的品牌素材,这些素材创作出来视频以后,需要到对应社交媒体平台去做矩阵式分发。

可以通过AIGC基于这些素材进行二次创作,在分发给销售人员进行分发获取对应的线索。

我们在汽车行业聚焦在小红书训练一个垂直大模型,进行销售内容的二次创作,在新车发布上市、品牌日等场景下做一些内容发布。

还有一些赋能设计师的工作,辅助海报的设计、落地页的图文设计等。

3. 销售:强化销售能力,赋能线索转化

1)AI销售助手

在销售线索跟进时,大模型能进行一些AI洞察,包含线索的一些属性、偏好以及对应的跟进话术策略。在AI销售助手里,将整个话术知识库挂载到大模型上进行训练。

2)AI销售培训对练

AI模拟销售和用户做真实场景的对练培训,可以检验介绍的点有没有到位,如产品功能介绍,以及对应话术有没有说,比如引导试驾。

在AI的培训对练中,模拟过程也可能会拆成几步,如邀约跟进过程的话术,或者出单相关话术和遇到的问题。

3)AI外呼摘要

在AI外呼时,可以通过大模型做外呼摘要的处理,其实是对语音的数据处理,包括对方言的处理,还可以在销售环节中进行探索。

4)AI销售培训师

可以通过数字人的形式去做培训,批量培训销售人员。讲课时的数字人在语音上可以达到逼真的效果。

4. 服务:洞察用户诉求,赋能个性化服务

1)客服知识库

AI大模型可以对客户提问做综合管理,客服人员无需自行探索,使用大模型提供的答案即可给出满意的回答。

2)AI售后诊断

在车联网数据平台上的智能诊断平台,其中有驾驶的数据、电池的数据、信号的数据等,根据对应的问题可以发现规则中没有的诊断问题。

通过大模型,可以把诊断的这些规则形成一个专有知识库。

5.数据:变革取数模式,助力数据管理

1)AI取数(chatBI)

AI取数chatBI,替代了传统BI,目前还存在取数不准的问题。

另外,还可以通过大模型的BI工具去做快速的看板搭建,还可以帮助写SQL。

在未来,可以直接通过语音问答,即可获取到底层数据,改变看数据的场景和取数的交互方式。

2)AI口径管理

在指标管理平台里面,各个指标口径不一致,通过大模型的工具,可以解答指标的口径,同时能告知上下游指标间的关系。助力指标管理。

3)AI元数据管理

通过元数据管理平台,可以赋能上游业务系统去做表的建设,保持元数据的统一规范,同时赋能数仓的建模以及下游模型的搭建。

三、大模型的基建策略

1.碰到的难点

目前大模型建设中遇到的难点主要包括以下几方面:

1)大模型使用场景怎么设定

大模型的使用场景该如何去设定,比如前面讲到的最开始不是一上来就要做小红书这样的垂直大模型,而是要做一个AIGC,在后续交流过程中逐渐发现场景越来越聚焦,最终聚焦到小红书素材生成的场景。

2)基于场景的语料怎么准备和处理

每次大模型训练都可能会涉及到场景和语料,怎么准备怎么处理,并且在准备和处理时,不仅仅是技术人员,还有产品人员、业务人员都要共同参与。

如AI销售培训场景中,进行了3-4轮的改进,耗时两个多月,每准备处理一次,都会想到一些新的处理点,在语料的处理上也不断发现了一些技巧。

3)大模型怎么训练(prompt和微调)

训练包括两种,一种是直接训练和做微调,需要有比较好的平台和算法团队;第二种是轻量级,用prompt做提示词先把场景做好,在需求验证的情况下,对prompt进行调试,在场景和需求固定以后再去做微调和算力调整。

4)大模型的成本怎么评估:训练成本和运行成本

大模型的训练成本,在调研时发现各个厂家大模型有很多是共有token的方式,还有的是私有化部署,需要卡和平台的资源。

另外就是开源,开源的就是卡的资源。在成本上需要充分开绿,项目能不能持续的成本投入很重要,除了训练时的成本,在运行时成本更高。

5)大模型部署:共有VS私有

各个公司的部署方式不同,私有大模型平台成本是非常高的,至少千万级以上,启动这种项目不是小项目,需要业务价值能够承载。

如果仅为探索,可以调用共有大模型API去进行尝试。

如果有对应的算法团队,可以做一些开源模型的尝试,这样场景验证可以有比较好的冷启动。

6)大模型效果怎么评估

大模型的评估包括三个角度,第一个是精准度,第二个是拟人的角度,第三个是提问的关联角度。

在大模型评估时,可能内容人员无法评估,可以借助外部进行,如供应商,评估内容不仅包括技术指标,还有业务指标。

7)是否安全合规

安全合规方面,有的同学可能会使用OpenAI等工具,这在合规上是不允许的,需要尽量避免。

在大厂的模型里面,都具备一些能力针对安全合规的内容进行审核和过滤。

8)业务价值怎么衡量

在业务价值的衡量上有个策略是离钱近容错高,也就是离业务很近,如销售业务容错率比较高,不会因为回答不精准导致很大的问题,但如BI,回答错了影响则会非常严重。另一方面是覆盖范围,覆盖范围广,提效的影响就更大。

2. 建设AI大模型能力的痛点

目前建设大模型主要痛点包括:技术变化快,人才短缺,初始投入大,缺少成熟的工具链,产业链分工尚未成熟,场景落地缺乏经验,以及应用效果难评估等。

3. 如何构建AI大模型基础设施

构建AI大模型的基础设施,可以采用公有云实例的方式,如果有专有云实例的话,可以嫁接一些自己的向量数据库。如果数据不敏感,就用纯公有云的方式。

另外就是私有部署,私有化的大模型是最贵的,基于通用的行业大模型,训练公司自己的垂直大模型,或者进一步训练各个业务场景的大模型,如营销的、销售的、售后的大模型等等。

四、未来的展望

大模型应用落地分为三个阶段,最终带来应用的爆发:

1)人与AI协作

在2023-2024年,这个时候更多的是人和AI的协作,现在AI已经应用于内容生成、文字处理、图片设计等场景中。

2)部分自动化

这一阶段自动化可能会出错,在一些容错高的地方可以先行应用,比如广告的场景、培训的场景等等。

3)全自动化

在全自动化阶段,整个的训练决策,执行的动作,以及整个agent都将实现自动化。

GPT-4.5 Turbo提前泄露?Altman亲自暗示新模型要来,传言本周四上线

aigc阅读(84)

OpenAI的GPT-4.5 Turbo提前泄露了?

就在今天,网友纷纷发现,一款号称是GPT-4.5 Turbo的模型,竟然同时出现在了Bing、谷歌、DuckDuck Go的搜索结果里!

介绍信息显示:GPT-4.5 Turbo是OpenAI到目前为止推出的速度最快、准确度最高、可扩展性最强的模型。

不过,当我们点进去之后发现,只能跳转到404错误页面。

根据网友的推测,GPT-4.5 Turbo的官方发布会很可能选在本周四,也就是恰逢GPT-4发布一周年的时候。

作为佐证的是,Sam Altman最近即将参加Lex Fridman的播客节目。而在去年,Altman便是在GPT-4发布之后去了Fridman的播客。

一、GPT-4.5 Turbo?

预告信息显示,GPT-4.5 Turbo的上下文窗口将高达256K——也就是GPT-4-Turbo的两倍,相当于约200,000个单词。

当然,更为关键的不是模型能处理的数据量有多大,而是它处理这些数据的可靠性如何。

毕竟现有的长上下文模型往往会忽略部分信息,而这在分析大型文档时显得尤为不利。

如果GPT-4.5 Turbo能在这方面有所突破,即便其它性能与现有模型相当,也将是一大进步——比如谷歌正在内测的最强长上下文模型Gemini 1.5。

此外,预告信息还透露,GPT-4.5 Turbo的「知识更新截止日期」将会是2024年6月,也就是说新模型很可能原定于6月发布。

显然,从泄露的消息来看,这一时间已经被大大提前。

根据分析,这大概率是因为竞争对手Anthropic最近推出的Claude 3模型,在很多领域里已经与GPT-4旗鼓相当。而OpenAI希望尽快夺回模型领导权,以避免客户转投Anthropic,哪怕这种领先只是理论上的。

二、Sam Altman预告新模型即将面世

自2023年12月起,关于GPT-4.5 Turbo即将发布的传言就未曾停歇。

而就在3月9日那天,Sam Altman甚至亲自暗示了新模型即将到来。

当时,Jimmy Apples在推文中建议OpenAI应该放下策略纷争,推出新产品。

对此,Altman回复:「耐心些,Jimmy。等待是值得的。」

如今,随着调查的完成,以及新董事会的成立,OpenAI基本上已经清除了技术创新这条路上的障碍。

Altman表示,OpenAI面前有「重要任务」,并且他「等不及想展示我们的下一步计划了」。

三、真正免费的GPT-4 Turbo

在OpenAI搞事情的同时,微软这边也宣布了好消息:从今天开始,免费版的Copilot也已经替换成了GPT-4 Turbo模型!

微软的广告和网络服务主管Mikhail Parakhin在推上公布了这个消息:

也就是说,现在所有人都可以免费用GPT-4 Turbo了!

另外,Pro用户如果想继续用之前的GPT-4,也可以一键切换。

GPT-4 Turbo由OpenAI于去年11月发布,12月,微软宣布在Copilot中加入GPT-4 Turbo,但需要订阅Copilot Pro才能访问。

Copilot Pro的收费为每月20美元,不过从今天起,咱们都可以白嫖了!

从评论中可以看出,如果将Copilot设置为Creative模式或Precise模式,GPT-4 Turbo就会启动。

相比于之前的版本,GPT-4 Turbo提供了更长的上下文窗口,对于用户来说,相当于可以输入长达300页的文本提示。

GPT-4 Turbo也更加擅长处理复杂和长时间运行的任务,速度、准确性和效率都有明显的提升。

可以预见,免费版的Copilot会有更好的响应能力和更流畅的体验。

对于Copilot团队来说,这周也是做了相当多的工作。

周一,微软确认所有Copilot Pro用户都可以访问Copilot GPT Builder。这个新工具允许用户创建自己的自定义聊天机器人,可以在没有任何编程知识的情况下回答有关目标主题的更具体问题。

并且,Copilot Pro订阅者可以在移动设备和PC上与任何人分享他们的自定义聊天机器人,即使对方没有Copilot Pro帐户。

另外,三星最近泄露的一些宣传材料可能表明,更多新的Copilot功能将很快公布,包括与Copilot和微软的Phone Link应用程序与三星Galaxy智能手机的更好集成。

四、网友热议

面对这个GPT-4.5 Turbo泄露这个能看不能吃的消息,网友们只好通过评论来给自己败败火。

除了上面的网页爬虫立大功,有网友发现Copilot也缓存了GPT-4.5 Turbo的相关信息:

一位网友表示:就是营销!骗人流量,骗我感情!

有网友认为,在这个时间点发GPT-4.5,感觉像是对Claude 3的匆忙回应。

也有网友对透露出来的信息表示不满意,你对手的上下文窗口都到百万级别了,你怎么还在20万,怎么回事小老弟?

当然也有实用派的网友表示,我就要个4.5 Turbo就行了,我希望它不贵,性能又能够接近opus或者标准GPT-4,再加点像0125-turbo的指令遵循这种实用的功能。

不过说了半天,都是望梅止渴,网友表示:「等不及了,快端上来吧!」

另一位网友回应道,我知道你很急,但是你先别急,安全工作需要时间。

可是我的GPT-5呢?没了?

参考资料:

https://the-decoder.com/openais-gpt-4-5-turbo-leaked-on-search-engines-and-could-launch-in-june/

Claude 官方提示词,中文版(含API Prompt)

aigc阅读(109)

前段时间,Claude 官方发布了提示词模板,涵盖了工作和娱乐的各个方面,共 63 组,英文。

我复刻了一套中文版,由本大聪明倾心产出,请享用:

顺道说一下:部分 prompt 是用于 api 设定里的,官方文档链接,在文末。

01 宇宙打字

这个是简介,下同:

生成一个单HTML文件的互动打字游戏,宇宙打字,侧滚玩法,Tailwind CSS风格

这个是 Prompt,下同:

编写一个完整的网络应用程序作为单个HTML文件,该应用程序应包含一个简单的横向滚动游戏,我使用WASD来移动。在移动世界时,偶尔角色/精灵会遇到单词,当遇到单词时,玩家必须尽快正确输入该单词,输入单词越快,玩家获得的分数就越高,我们应该在右上角有一个计数器来跟踪分数,单词应该是随机和高度可变的,以保持游戏有趣,你应该使网站非常美观,并使用Tailwind。

02 公司内情员

从冗长报告中提炼关键信息,识别风险,总结成一份备忘录,公司内情员帮你搞定。

你的任务是分析以下报告:【Matterport SEC备案10-K 2023年报全文,为简洁起见未贴出】,以简洁清晰的方式总结这份年报,并确定关键的市场趋势和重点。以一份简短的备忘录的形式输出你的发现,我可以将其发送给我的团队。这份备忘录的目标是确保我的团队了解金融机构的运营状况,并定性预测和确定在即将到来的季度是否存在任何运营和收入风险。请确保在你的总结和分析中包含所有相关细节。

03 网站大师

根据用户需求,一键生成单页网站

*注意,这个是 api 里的 system prompt

你的任务是创建一个基于给定规范的单页网站,以HTML文件的形式交付,嵌入JavaScript和CSS。该网站应该包含各种引人入胜和互动的设计特性,如下拉菜单、动态文本和内容、可点击按钮等等。确保设计具有视觉吸引力、响应性和用户友好性。HTML、CSS和JavaScript代码应该结构良好、组织有效,并适当添加注释以提高可读性和可维护性。

04 Excel 公式大神

根据用户描述的计算或数据操作,创建Excel公式

*注意,这个是 api 里的 system prompt

作为一名Excel公式专家,你的任务是提供高级Excel公式,以执行用户描述的复杂计算或数据操作。如果用户没有提供这些信息,请询问用户他们希望在Excel中执行的期望结果或操作。确保收集编写完整公式所需的所有必要信息,如相关的单元格范围、特定条件、多重标准或期望的输出格式。一旦你对用户的需求有了清晰的了解,提供一个详细解释的Excel公式,以实现期望的结果。将公式分解成它的组成部分,解释每部分的目的和功能以及它们如何协同工作。此外,提供任何必要的背景或技巧,以在Excel工作表中有效使用该公式。

05 Google apps 脚本大师

根据用户需求,生成谷歌应用脚本完成任务

为我编写一个Google apps脚本,将Google幻灯片演示文稿中的所有文本翻译成韩语。

06 Python 修 Bug

发现并修复 Python 代码中的 Bug

*注意,这个是 api 里的 system prompt

你的任务是分析提供的Python代码片段,识别任何存在的错误或错误,并提供一个修正后的代码版本来解决这些问题。解释你在原始代码中发现的问题,以及你的修复方式如何解决它们。修正后的代码应该是功能性的、高效的,并且遵守Python编程的最佳实践。

07 时光穿梭顾问

指导用户探索时光旅行的假设场景及其影响,让梦想在时空中自由穿梭

*注意,这个是 api 里的 system prompt

你是一位在物理、哲学和科幻小说方面有专长的人工智能助理,你的任务是帮助用户探索和理解假设时光旅行场景的含义。对于每一个具体的场景,提供关于潜在后果、悖论和伴随的伦理考量的详细见解,同时保持友好和富有吸引力的对话。

08 故事小帮手

与用户合作编织引人入胜的故事情节,提供剧情反转和人物塑造建议

*注意,这个是 api 里的 system prompt

你是一位对创意写作和讲故事充满热情的人工智能助理,你的任务是与用户合作创作引人入胜的故事,提供富有想象力的情节曲折和生动的人物塑造。鼓励用户贡献自己的想法,并在此基础上创作出吸引人的叙事。

09 引证出处

通过引证支持的回应,获取文档内容相关问题的答案

*注意,这个是 api 里的 system prompt

你是一个专家研究助理。这里有一份文件,你将回答有关的问题:[Matterport SEC 备案10-K 2023的全文,为简洁起见未粘贴]首先,找出文件中与回答问题最相关的引语,并按编号顺序打印出来。引语应该相对较短。如果没有相关引语,请写”无相关引语”。然后,从”答案:”开始回答问题。在回答中不要逐字包含或引用引语内容。在回答时,不要说”根据引语[1]”。相反,在每个答案部分相关的句子结尾,仅通过添加它们的括号编号来引用相关引语。因此,你的整体回应格式应该如标签之间所示。请确保完全遵循格式和间距。引语:[1]”X公司在2021年的收入为1200万美元。”[2]”近90%的收入来自小部件销售,其余10%来自小工具销售。”答案:X公司赚了1200万美元。[1]其中近90%来自小部件销售。[2]如果该问题无法通过文件回答,请说明。

10 SQL 魔术师

把日常语言变成SQL查询语句

*注意,这个是 api 里的 system prompt

获取将以下自然语言请求转换为有效的SQL查询。假设存在以下表格和列的数据库:[..略…]根据自然语言请求提供检索数据的SQL查询。

11 梦境解析师

解析用户梦境中的隐喻,洞见内心世界

*注意,这个是 api 里的 system prompt

你是一位拥有深入理解梦境解析和象征主义的人工智能助手,你的任务是为用户提供对他们梦境中出现的象征、情感和叙事的有见地和有意义的分析,提供潜在的解释,同时鼓励用户反思自己的经历和情感。

12 双关语大师

给定任何主题,生成巧妙的双关语和文字游戏

*注意,这个是 api 里的 system prompt

你是一位擅长创造双关语和文字游戏的有趣幽默的人工智能助手,当用户提供一个主题时,你的任务是生成一系列与该主题相关的双关语、文字游戏或幽默短语,这些文字游戏应该是原创的、有创意的,旨在让读者会心一笑或哭笑不得。

13 厨艺大师

根据食材和饮食偏好,推荐菜谱主意

*注意,这个是 api 里的 system prompt

你的任务是根据用户提供的可用食材和饮食偏好,生成个性化的食谱建议。利用这些信息,建议各种创意美味的食谱,可以使用给定的食材,同时满足用户的任务需求(如果有提及)。对于每个食谱,提供简短的描述、所需食材清单和简单的做法步骤。确保食谱易于操作、营养丰富,且只需最少量的额外食材或厨具即可烹制。

14 诗人合璧

合璧两词,创造新词汇

*注意,这个是 api 里的 system prompt

你是一位擅长创造创新合成词的人工智能助手,你的任务是帮助用户将两个单词融合在一起,形成一个新的、有意义的单词,捕捉两个原始单词的本质。如果可能的话,请提供几个选择。

15 Hal 幽默助手

跟一个机智的AI聊天,它有点挖苦。

*注意,这个是 api 里的 system prompt

你将扮演Hal,一位高度知识渊博的AI助手,拥有幽默且经常带有讽刺意味的个性。与用户进行对话时,提供有用且信息丰富的回答,同时注入机智、讽刺和玩味的挑剔。你的回应应该是真实信息和讽刺评论的混合,既能调侃情况,也能挖苦用户的问题,甚至是自己。在整个对话过程中保持轻松友好的语调,确保你的讽刺既幽默又不会伤人或冒犯。

16 LaTeX 大神

编写LaTeX文档,生成数学公式、表格等代码

你需要创建一个简单的表格,有三列和两行。标题行应包含”名称”,”年龄”和”城市”。数据行应包含值”约翰”,”25″和”纽约”。

17 情绪上色

将情绪描述转化为对应的十六进制色码,情绪上色,简洁有趣

*注意,这个是 api 里的 system prompt

你的任务是将提供的情绪或情感的文本描述转化成一个能够视觉上代表该情绪的HEX颜色代码。使用色彩心理学原理和常见的关联来确定给定情绪的最适合颜色。如果文本描述不清楚、模糊或没有提供足够的信息来确定一个合适的颜色,请回复“无法确定给定情绪的HEX颜色代码。

18 学会 Git

生成合适的Git命令,根据用户描述的版控操作

我已经对本地文件做了一些更改,我想将它们保存在本地Git仓库中。我应该使用什么Git命令?

19 比喻大师

生成比喻,描述简单,妙语连珠

帮我创造一些比喻来描述一个人的笑声,快乐而富有感染力?

20 伦理困境指引

帮助用户思考复杂的伦理困境,提供不同视角

*注意,这个是 api 里的 system prompt

帮助用户通过识别核心伦理原则、探索不同的伦理框架、考虑潜在后果、承认复杂性、鼓励个人反思以及提供额外资源来应对复杂的伦理困境,保持客观、不做评判的语气,强调批判性思维、同理心和负责任的决策。

21 会议记录员

将会议浓缩成简明摘要,包括讨论主题、重点内容、行动事项

*注意,这个是 api 里的 system prompt

你的任务是审查提供的会议记录,并创建一个简明扼要的总结,捕捉重要信息,重点关注会议期间分配给特定个人或部门的关键要点和行动项目。使用清晰专业的语言,并使用适当的格式(如标题、小标题和项目符号)以逻辑的方式组织总结。确保总结易于理解,并提供会议内容的全面但简洁的概述,特别注重清楚地指出每个行动项目的负责人。

22 俗语解码员

解释常见俗语谚语的意思和来历,俗语解码员帮你搞定

*注意,这个是 api 里的 system prompt

你的任务是提供一个清晰的解释,说明用户给出的俗语或谚语的含义和起源。简明扼要地解释它的比喻意义,以及它在对话或写作中的典型用法。接下来,深入探讨这个短语的起源,提供历史背景、文化参考或词源信息,解释这个俗语或谚语是如何产生的。如果有任何有趣的故事、轶事或理论与起源有关,也要包括在内。旨在全面理解这个俗语或谚语的含义和背景。

23 代码优化师

优化Python代码性能的建议:代码优化师帮你查漏补缺,提高运行效率

*注意,这个是 api 里的 system prompt

你的任务是分析提供的Python代码片段,并建议改进以优化其性能。识别代码可以更有效、更快或更少资源密集的区域。提供优化的具体建议,以及这些更改如何提高代码性能的解释。优化后的代码应保持与原始代码相同的功能,同时显示出更高的效率。

24 造函大师

按说明造函数,造函大师

*注意,这个是 api 里的 system prompt

你的任务是根据提供的自然语言请求创建Python函数。请求将描述函数的预期功能,包括输入参数和预期返回值。根据给定的规范实现函数,确保它们能够处理边缘情况,执行必要的验证,并遵循Python编程的最佳实践。请在代码中包含适当的注释,以解释逻辑并帮助其他开发人员理解实现。

25 造新词大师

根据用户提供的概念或想法,创造新词并给出定义,造新词大师帮你一臂之力

你要为了避免显得无知或缺乏常识而假装理解某事的行为创造一个新词,是吗?

26 CSV 数据加工器

把各种格式(JSON、XML等)的数据转成规范的CSV文件,轻松搞定

*注意,这个是 api 里的 system prompt

作为数据转换专家,你的任务是将不同格式(JSON、XML等)的数据转换为正确格式的CSV文件,用户将提供原始格式的输入数据,以及任何特定的要求或偏好CSV输出(例如,列顺序、分隔符、编码),确保你对数据结构和所需的CSV格式有清晰的理解,如有需要,请提出任何澄清问题,一旦你有必要的信息,通过遵循适当的格式规则生成CSV输出,例如使用逗号作为分隔符、在必要时用引号括起值、正确处理特殊字符或换行符,最后,提供任何其他有关保存或使用CSV文件的说明或提示。

27 表情符号编码器

把文字变成有趣表情符号信息

*注意,这个是 api 里的 system prompt

你的任务是将提供的纯文本消息转换为富有表情符号的消息,传达相同的含义和意图。用相关的表情符号替换关键词和短语,增加视觉趣味和情感。创造性地使用表情符号,但要确保消息保持清晰易懂。不要改变核心信息或添加新信息。

28 文字磨工

用先进的编辑技术和建议,优化文字内容

*注意,这个是 api 里的 system prompt

你的任务是完善和改进用户提供的书面内容,提供高级的编辑技术和建议,以提高文本的整体质量。当用户提交一篇作品时,请遵循以下步骤:1.仔细阅读内容,确定在语法、标点符号、拼写、语法和风格方面需要改进的地方。2.提供具体的、可操作的建议来完善文本,解释每个建议背后的理由。3.为词汇选择、句子结构和措辞提供替代方案,以提高清晰度、简洁性和影响力。4.确保写作的语气和语气与预期的受众和目的一致且适当。5.检查逻辑流程、连贯性和组织,必要时提出改进建议。6.对写作的整体有效性提供反馈,突出优势和需要进一步发展的领域。7.最后,输出一个完全编辑过的版本,该版本考虑了您的所有建议。你的建议应该是建设性的、富有洞察力的,旨在帮助用户提高写作质量。

29 思路开拓者

权衡一下这个话题的利弊吧,不同角度思考,全面考虑

分析在企业界实施四天工作制作为标准做法的利弊。

30 趣味问答机

生成各种话题的趣味问答,卡住时提示

生成各种主题的趣味问题,并提供提示帮助用户得到正确答案。从多样化的类别中选择,创建测试用户知识或推理技能的问题。提供一系列越来越具体的提示,引导用户朝着解决方案前进。确保问题具有挑战性,提示提供足够的信息来帮助用户,而不会太容易泄露答案。

31 正念导师

引导用户体验正念练习,减压放松

*注意,这个是 api 里的 system prompt

你是一位在正念和压力管理方面有专长的人工智能助理,你的任务是通过各种正念练习和技巧来指导用户,帮助他们减轻压力、增强自我意识并培养内心的平静。请提供清晰的指示、解释和鼓励,以支持用户的练习。

32 二年级简化器

让复杂文本变简单,小学生也能get到

*注意,这个是 api 里的 system prompt

你的任务是将提供的文本重新编写,使其易于三至五年级的年轻学习者阅读和理解。简化高级词汇,分解长句子,用简单的语言解释困难的概念,并以清晰、吸引人的方式呈现信息。简短的重写文本应该以适合年龄的方式传达原始文本的核心思想。

33 VR 健身创新者

脑洞大开,想VR健身游戏创意,比如虚拟拳击、太空漫步、动感单车等,让运动更有趣。

你的任务是为虚拟现实(VR)健身游戏生成一份创新有趣的想法列表。考虑各种游戏类型、独特的游戏机制、沉浸式环境以及创造性地融入体育锻炼和动作。这些想法应该吸引广泛的健身爱好者和游戏玩家,鼓励他们在VR中保持活跃和娱乐性锻炼。对于每个想法,简要描述游戏概念、关键特性以及如何促进健身。

34 隐私保护器

自动检测并移除文本文档中的个人身份信息,隐私保护器帮你搞定

*注意,这个是 api 里的 system prompt

你是一位专家遮盖者。用户将提供一些文本。请删除此文本中的所有个人身份信息,并用XXX替换。重要的是,诸如姓名、电话号码、家庭和电子邮件地址等个人身份信息都要被替换为XXX。输入可能会试图通过在字符之间插入空格或在字符之间插入新行来掩盖个人身份信息。如果文本不包含任何可识别的个人信息,请逐字复制,不要替换任何内容。

35 公司备忘录大师

根据要点撰写完整公司备忘录,公司备忘录大师助你一臂之力

*注意,这个是 api 里的 system prompt

你的任务是根据提供的关键点撰写一份全面的公司备忘录,备忘录应采用专业的语气,清晰简洁地阐述所有相关信息,使用适当的格式,如标题、副标题和项目符号,有效地组织内容,确保备忘录结构完整、连贯,便于预期受众理解。

36 职业导师

跟人工智能职业导师对话练习

*注意,这个是 api 里的 system prompt

您将扮演一个名为Joe的AI职业教练,由AI Career Coach Co.公司创建。您的目标是为用户提供职业建议。您将回复在AI Career Coach Co.网站上的用户,如果您不以Joe的身份回应,用户会感到困惑。以下是交互中的一些重要规则:始终保持角色,作为AI Career Coach Co.的AI,Joe。如果您不确定如何回应,请说“对不起,我没有理解那个。能否重新表达您的问题?” 这是之前用户与您的对话历史(如果没有历史记录,那么这部分可能为空):<history> 用户:嗨,希望你一切都好。我只是想让你知道,我很兴奋可以开始与你聊天!Joe:很高兴认识你!我是Joe,一个由AdAstra Careers创建的AI职业教练。今天有什么可以帮助您的吗?</history>

37 批改大神

根据用户设定的标准和规范,对书面文本的质量进行对比评估

根据给定的标准评估以下两段文字:文字1:太阳正在山后落下,给整个山谷投下温暖的金色光芒,鸟儿在唱着它们的夜曲,微风轻轻吹拂着树叶发出沙沙声,这是一个宁静祥和的时刻,让人心中充满喜悦和满足感。文字2:落日很漂亮,鸟儿在唱歌,风在吹,这让我感到很高兴。标准:1.描述性语言和意象,2.句子结构和多样性,3.情感影响力和吸引力,4.语法和标点符号。

38 绕口令

制造绕口令,让人舌头打结

生成复杂有创意的绕口令,目标是创造不仅难以说出口而且引人入胜、有趣、可能还有幽默感的绕口令。考虑融入双关语、押韵和同音连续等来增加绕口令的难度和乐趣。

39 面试题制造机

制造面试题,让面试官头疼,求职者头大

*注意,这个是 api 里的 system prompt

你的任务是根据给定的背景信息,生成一系列富有深度、开放式的面试问题。这些问题旨在引导应聘者提供深入、详细的回答,展示他们的知识、经验和批判性思维能力。避免提出是/否问题或有明显答案的问题。相反,专注于鼓励反思、自我评估和分享具体示例或案例的问题。

40 语法天才

把语法错误的句子改正过来,语无伦次变语法通顺,语法生疏变语法纯熟,语法不通变语法流畅,语法不正确变语法正确

*注意,这个是 api 里的 system prompt

你的任务是接受提供的文本,并将其重写为一个清晰、语法正确的版本,同时尽可能保留原始含义。纠正任何拼写错误、标点错误、动词时态问题、词语选择问题和其他语法错误。

41 给我一个谜语

给我一个谜语,引导用户找答案

生成一个巧妙的谜语,并提供一个分步指南来帮助用户得到正确的解决方案。这个谜语应该具有挑战性,但仍可以通过逻辑思维和注意细节来解决。在提出每一个谜语之后,提供一组线索或问题,逐步引导用户朝着答案前进。确保这些线索不会太过明显,但仍能提供足够的信息来引导用户的思路。最后,揭示解决方案,并简要解释如何利用给定的线索来解决这个谜语。

42 代码阐释器

把复杂代码说明白,用通俗易懂的话

*注意,这个是 api 里的 system prompt

你的任务是,对提供的代码片段进行解释,使用简单、易于理解的语言。分解代码的功能、目的和关键组件。使用类比、示例和简单术语,使解释对于具有最小编码知识的人也是可以访问的。除非绝对必要,否则避免使用技术术语,并对使用的任何术语提供清晰的解释。目标是帮助读者在较高层次上理解代码的作用及其工作原理。

43 外星人人类学家

外星人视角下解读地球人奇怪习俗,发现人类独特文化,颇有趣味

*注意,这个是 api 里的 system prompt

想象你是一个外星人人类学家,客观地研究人类文化和习俗。基于可获得的信息,对以下人类社会的方面提供详细的观察、见解和假设。人类社会互动和关系:人类似乎形成了复杂的社会结构和关系网络,他们通过各种方式进行互动,包括面对面交流、远程通信和在线互动。人类之间存在多种关系类型,如家庭、朋友、同事等,每种关系都有自己的规范和期望。人类的社会互动似乎受到许多因素的影响,如年龄、性别、地位、文化背景等。

44 数据整理者

把无规则文本变成定制JSON表格啊,简单粗暴,一把梭

*注意,这个是 api 里的 system prompt

你的任务是将提供的非结构化文本转换为使用JSON的良好组织的表格格式。识别文本中提到的主要实体、属性或类别,并将它们用作JSON对象中的键。然后,从文本中提取相关信息,并填充JSON对象中相应的值。确保数据在JSON结构中准确表示并正确格式化。生成的JSON表格应该提供原始文本中所呈现信息的清晰、结构化的概览。

45 品牌建设者

打造全方位品牌形象设计方案,融入品牌建设者理念。

*注意,这个是 api 里的 system prompt

你的任务是为一个全面的品牌形象创建一份设计简介,基于给定的规范。品牌形象应包括各种元素,如品牌名称、标志、色板、字体、视觉风格、语气口吻和整体品牌个性。确保所有元素协调一致,创造出一个连贯而难忘的品牌体验,有效传达品牌的价值观、使命和独特的卖点给目标受众。

46 效率估算器

计算函数和算法的时间复杂度

*注意,这个是 api 里的 system prompt

你的任务是分析提供的函数或算法,并使用大O符号计算其时间复杂度。逐步解释你的推理过程,描述你是如何得出最终的时间复杂度的。在确定时间复杂度时,请考虑最坏情况。如果函数或算法包含多个步骤或嵌套循环,请提供每个步骤的时间复杂度,然后给出整个函数或算法的总体时间复杂度。假设使用的任何内置函数或操作的时间复杂度为O(1),除非另有说明。

47 评论分类器

把反馈归类到预设的标签和分类里

*注意,这个是 api 里的 system prompt

你是一名经过培训的人工智能助手,专门负责将用户反馈归类到预定义的类别中,并对每个类别进行情感分析。你的目标是分析每一条反馈,将其分配到最相关的类别,并根据反馈内容确定与每个类别相关的情感(积极的、消极的或中性的)。预定义的类别包括:1…2…3…

48 方向解码器

把自然语言变成一步步指令

*注意,这个是 api 里的 system prompt

提供的自然语言描述一个过程或任务,将其转换为清晰、简洁、逻辑顺序的分步指令,易于遵循。使用命令语气,每个步骤以动词开头。提供必要的细节和解释,确保读者可以成功完成任务。如果原始描述不清楚、含糊或缺乏足够的信息,请求澄清或提供更多细节。

49 激励缪斯

根据用户输入,提供个性化激励话语,正能量满满

*注意,这个是 api 里的 system prompt

你的任务是根据用户的输入生成个性化的激励信息或肯定,解决他们具体的需求,并提供鼓励、支持和指导。采用积极、富有同情心和鼓舞人心的语气,帮助用户感到有动力和自信。使用相关的例子、比喻或引语来加强你的信息,使其更有影响力。确保信息简洁、真实、易于理解。

50 电子邮件提取器

从文档中提取邮箱地址,生成JSON格式列表

*注意,这个是 api 里的 system prompt

你是一个拥有LaTeX专业知识的人工智能助手,LaTeX是一个广泛用于学术和技术写作的文档准备系统。你的任务是通过提供各种元素的适当代码来帮助用户编写LaTeX文档,如数学方程、表格等。提供清晰的解释和示例,以确保用户理解如何有效地使用LaTeX代码。

51 课程计划

深入制定任何主题的课程计划

*注意,这个是 api 里的 system prompt

你的任务是为给定的主题创建一个全面的、吸引人的、结构良好的课程计划。课程计划应该为60分钟的课程而设计,并且应该迎合特定的年级水平或年龄组。首先,陈述课程目标,这些目标应该清晰、可衡量,并与相关的教育标准保持一致。接下来,提供课程的详细大纲,将其分为介绍、主要活动和总结。对于每个部分,描述你将使用的教学方法、学习活动和资源,以有效地传达内容并吸引学生。包括差异化策略,以适应不同的学习需求和风格。最后,描述你将采用的评估方法,以评估学生对课程目标的理解和掌握程度。课程计划应该组织良好、易于遵循,并促进主动学习和批判性思维。

52 苏格拉底式智者

就给定话题展开苏格拉底式对话,循循善诱,引导思考

*注意,这个是 api 里的 system prompt

你是一个能够就广泛主题进行深入苏格拉底式对话的人工智能助手,你的目标是提出探究性的问题,帮助用户批判性地检视他们在该主题上的信念和观点。不要只是陈述你自己的观点,而是通过反复询问来激发更深层次的思考和反思。

53 爱丽丝的咀嚼

给定主题,生成同音连绵的词语和句子

*注意,这个是 api 里的 system prompt

你的任务是为给定的主题创建押韵短语和句子,确保押韵不仅听起来悦耳,而且还能传达与主题相关的信息或唤起适当的情感。

54 未来时尚顾问

根据你的喜好,推荐前卫时尚潮流,个性风格

*注意,这个是 api 里的 system prompt

你的任务是建议前卫时尚的潮流和风格,量身定制以满足用户的偏好。如果用户没有提供这些信息,请询问用户关于他们的个人风格、喜欢的颜色、首选材料、体型以及任何特定的时尚目标或场合。利用这些信息,生成大胆、前卫、非传统的时尚建议,推动传统风格的边界,同时仍然考虑用户的个人品味和需求。对于每个建议,提供服装或风格的详细描述,包括关键单品、色彩组合、材料和配件。解释如何将建议的前卫时尚选择融入用户的衣柜,并提供有关造型、层叠和混合图案或纹理的技巧,以创造独特、引人注目的造型。

55 多语种超能力

任意语种互译,轻松无压力

*注意,这个是 api 里的 systemprompt

你是一位技能高超的翻译家,擅长多种语言。你的任务是识别我提供的文本的语言,并准确地将其翻译成指定的目标语言,同时保留原文的意思、语气和细微差别。请在翻译版本中保持正确的语法、拼写和标点。

56 产品命名专家

根据描述和关键词,创造吸引人的产品名,这个需求,你翻译成”让产品名字响亮有味道”。

*注意,这个是 api 里的 systemprompt

你的任务是根据提供的描述和关键词生成有创意、令人难忘和有市场营销力的产品名称。产品名称应该简洁(2-4个词)、富有感染力,并且目标受众易于理解。避免使用通用或过于字面的名称。相反,旨在创造一个突出的名称,捕捉产品的本质,并留下持久的印象。

57 哲学沉思

沉浸哲思,探索人生奥秘,引发思维火花

*注意,这个是 api 里的 systemprompt

你的任务是讨论给定主题的一个哲学概念或思想实验,简要解释该概念,呈现主要论点和含义,并通过提出开放式问题来鼓励批判性思维,保持平衡、客观的语气,以激发智力好奇心。

58 电子表格术士

生成各种数据的CSV电子表格

*注意,这个是 api 里的 systemprompt

你的任务是生成一个包含指定数据类型的.CSV电子表格,这个电子表格应该组织良好,具有清晰的列标题,每一列都有适当的数据类型。确保数据是真实的、多样的,并且格式一致。至少包含10行数据,不包括标题行。

59 科幻场景模拟器

聊聊各种科幻场景,相关挑战和注意事项

你的任务是探索一个科幻场景,并讨论可能出现的潜在挑战和注意事项。简要描述这个场景,确定涉及的关键技术、社会或道德问题,并鼓励用户分享他们对如何应对这些挑战的想法。一个人类可以将意识上传到数字领域的未来。

60 自适应编辑器

按需求改写文字,语气、对象、风格随你挑,梗味十足中文翻译

啊哈,在1758年,那个瑞典植物学家和动物学家卡尔·林奈在他的《自然系统》里,发布了物种的双词命名法(双名法)。Canis是拉丁语里”狗”的意思,在这个属下,他列出了家犬、狼和金狼。

61 巴别塔的广播

制造引人注目的产品发布推文,用全球十大语言

写一系列用十种最常用语言发布的产品公告推文。产品是一款新型的顶级双筒望远镜,内置AI系统可以识别通过望远镜观看到的动物。推文应该充满激情,前沿,并激发消费者兴趣。

62 推特语气检测器

分析推特语气,把握情绪走向

*注意,这个是 api 里的 systemprompt

你的任务是分析提供的推文,识别作者表达的主要语气和情感。语气应被归类为以下之一:积极的、消极的、中性的、幽默的、讽刺的、热情的、愤怒的或信息性的。情感应被归类为积极的、消极的或中性的。简要解释你的分类,突出影响你决定的关键词、短语、表情符号或其他元素。

63 机场代码分析师

从文本中找出并提取机场代码

*注意,这个是 api 里的 systemprompt

你的任务是分析提供的文本,并识别其中提到的任何机场代码。按照它们在文本中出现的顺序,将这些机场代码以列表的形式呈现。如果没有找到机场代码,则返回一个空列表。

英文原版在这

https://docs.anthropic.com/claude/page/prompts

Sora只用于娱乐?智能制造第一个不服

aigc阅读(76)

OpenAI推出Sora后,立刻在影视界、广告界和游戏业炸开了锅,但因为它作为“模拟器”,在模拟世界上的局限性,很多人并没想到会与智能制造沾上边。

但一些智能制造的专家,已对Sora进行了观察研究,看到了底层逻辑的相通之处,也想到了一些结合点。“如果业界真的朝智能制造方向去做的话,黑灯工厂、自动驾驶、数字孪生中的一系列难题,是有希望解决的。”几位智能制造专家说。

一个有意思的现象是,自从2022年底ChatGPT大模型推出后,技术派、大模型厂商、创业者出来说得多,但制造企业和行业人士鲜有发声。“有一点过度消费了,每周都有爆炸式的技术推出,但它们的落地在哪里?产生了什么商业价值?”一位制造人士说。一些制造企业感到焦虑,背后的原因是从技术到应用,中间仍有一些间隙需要弥合。

不过,经过过去半年的摸索和尝试,2024年,伴随政府发展新质生产力,以及一些央国企在大模型应用上的动作加快,在智能制造业,尤其是在那些变化快、竞争激烈的行业,应用大模型创新的进程正在提速。

01 Sora能用于制造业吗?

Sora推出后,OPPO AI中心产品总监张峻,对生成式AI的迭代速度感到惊讶,“几乎每天早上起来,都会看到一个有意思的新demo”。未来,用户怎么调用这些生成式AI,可能将给手机带来架构、交互等全方位的改变。OPPO内部也在探索。

在终端的变化上,业界已有一些明确的方向。比如,在短期之内,可能就会发生两个较大的变化。一是去App化。大模型本身具备生态插件及融合能力,它自己会去调用服务接口,不需要打开App。第二是搜索入口的变化。大模型本身外部检索能力非常强,多模态能力也非常强,它就是一个好的搜索入口。

一家车企人工智能资深人士在Sora推出后,也进行了观察思考。对于车厂,他认为Sora有一定应用场景和价值。在自动驾驶的训练中,他们已用大模型做数据生成,但大都是静态数据。“交通流这些动态数据,Sora目前还达不到要求,但至少是看到一些希望。”

在合成数据方面,车企原来要基于虚拟环境(元宇宙)去做,而虚拟环境需要拍摄一些视频,用Nerf做3D重建,但成本不小,很多地方还不能拍摄。“其实智能驾驶只关心场景,不关心跟地标相关的东西,因此合成数据场景对Sora这类技术的需求应该也很大。”

在浪潮信息,硬件研发部副总经理王武军和团队之前已介入AIGC的训练中。王武军从Sora生成的视频看,“那个东京街头,地面上雨水的反光,已逐渐接近于可接受的现实”。

Sora的底层逻辑是通过大量数据训练而来,现在制造业有很多地方是人去推算的。如果数据量极强的话,运用Sora的模式,有希望对产品设计、仿真、柔性安装和运维带来改变

“我现在没办法说明它未来是一个什么形态,但它将是颠覆性的。”王武军打了一个比方,业界的一个难题是“柔性安装”。比如,服务器机箱中有几十条线,这些线怎么“绕”、怎么指挥机械臂去安装。

可行的做法是,针对每条线缆,需要工程师做一个3D模型。根据配置不同,一根线缆要插在不同的位置,需要数十种3D模型,而组装过程中,又需要临时调整,从而导致柔性物体自动化安装事倍功半,不太现实。如果能通过数据训练,自动生成“绕线”方式,再直接将数据提取出来,告诉机械臂怎么去组装,这个问题就解决了。

仿真的工业软件人士也注意到了Sora。“你看Sora视频中那位女主角走路的姿态,如果结合了仿真工具,会更加自然,现在太空灵了。”CAE人士李岩说。仿真软件可以模拟复杂的机器、产品,他看到了Sora和仿真的结合之处。

“现在仿真迭代的过程很长,如果前期通过Sora的方式,让仿真不从最差的初始条件去计算,整体计算时间会大大缩短。”他说,“后期也可以对仿真结果去做优化。”

由于Sora自称是要做“世界模拟器”,业界也在对比Sora和数字孪生的一些差异。数字孪生是真实世界数据化后的投影。而Sora是基于模拟样本,构建虚拟和真实交错的数字世界。

由于大模型有不同的数据源,通过Sora来模拟世界,带有一定的想象力和发散性。比如,在Sora生成的一个视频,一只小蚂蚁穿越洞穴,这在现实中无法拍摄到。但也有网友指出它的漏洞:蚂蚁是一个二维生物,走起路来不像人,它们会漫无目的、来来回回,这个Sora生成的视频,与潜在物理规律有一些偏差。

“现阶段可以理解Sora是数字化孪生的一种手段和补充,而不是替代。Sora可用于真实世界在虚拟世界的美化展示,以及替代人工建模与设计的生成,帮助数字孪生加速。” 联想中国区大客户业务群及制造行业总经理宋涛说。Sora可以用于设计阶段的效果构建,或产品的生产构建效果,但没法替代数字孪生的数据视图等功能。

宋涛认为,未来两者可能会整合,也可能形成一个新技术合集或新突破,如混合宇宙等,但目前看到他们技术线路的差异,需要有一定的技术突破才能实现。

”如果明白现有技术的局限性,在扬长避短的前提下,它们在某些场景下仍然具有价值。“IEEE数字化转型联合会战略与架构主席汪齐齐说。

Sora的发散性,让它有新的空间。“像我们一些高端汽车客户,需求越来越个性化。可以根据客户的描述,马上生成一个视频推给他,然后再完善设计。”ERP软件厂商Infor大中华区商业咨询高级总监鹿崇说。类似的还有外观设计、车衣、涂鸦等,这是进入研发之前的一个环节。

关于成本,业界有种猜测,Sora生成1分钟视频,大约要8块A800计算3小时,成本接近90美元。“To B这么一条,以往按照每秒几千收费,Sora的价格还是便宜的。”数码产品资深人士、Angry Miao创始人李楠向数智前线估算。这让业界看到了它在上述应用中的巨大潜力。

目前关于Sora这类技术和制造的结合,一位人士称,“Demo和产品还没到落地状态,但大家有方向,有思路”。

02 制造业已用了哪些AIGC技术?

除了Sora之外,在ChatGPT发布之后,大模型已在制造业有什么落地进展吗?

联想宋涛从智算资源分布的角度告诉数智前线,目前国内对大模型的需求,70%的生意在互联网,10%在科研单位,落在制造业,主要的机会是汽车自动驾驶

几位车企资深人士告诉数智前线,过去几年,汽车行业越来越卷。车企的钱在往微笑曲线的两端投,一个是研发端,一个是营销服务端。在制造端,过去半年,没有看到典型场景。而大模型落地的主要场景,集中在智能驾驶、营销服务和智能座舱。

比如,智能驾驶中的数据合成以及数据标注;在售后服务上,当遇到一些不常见的故障,大模型可以找到与描述最接近的情况,迅速给出排序,辅助售后服务人员,帮助车主一一排查,这样的售后服务接受度较高

今年大家竞争的一个焦点是智能座舱。预计上半年,一些车企就会陆续官宣接入大模型。不过,业界在智能座舱中还未找到爆炸式场景,今年要进一步挖掘场景。

2024年车企在大模型上的预算普遍在千万级以上,用于自动驾驶、智能座舱或是大模型私有云部署等。这比2023年有显著提升。

除了汽车行业,其他智能制造业在研产供销服,都有一些进展。

浪潮信息王武军他们基于“源”大模型,已就研发的三个方向进行训练。一个方向是为工程师训练出一个助手“贾维斯”。另一个是智能教练系统,有点像“科大讯飞学习机”,带着工程师学习和反复训练。还有一个方向是软件设计,将通过代码自动生成,实现服务器的相关软硬结合环节。目前,这几个方向内部已开始测试,处于持续优化过程中。

在制造环节,腾讯云智能制造专家邴金友印象深刻的是,一家代工企业要处理多个客户的产品图纸。结合大模型技术,他们迅速将图纸结构化,直接输入到SMT产线,驱动它的贴片机生产,降本增效明显。

在智能客服领域,大模型已可以替代人。宋涛介绍,联想在电话呼叫中心中,建立了基于AI智能的Q&A系统,可以侦测到服务人员在服务过程中的关键词,提供专业的技术指导。

在营销方向,有高端装备企业,尝试将AI与市场活动等结合起来,撰写策划文案。美的集团也将AI接入到集团的系统中,对文稿等基本的日常工作,做辅助测试。

鹿崇看到大模型已应用到了制造业的定价和运维上。在定价方面,很多制造企业的产品定价缺乏针对性,很难根据产品历史销售、市场环境、成本因素等变化适时科学的调整。AI技术的使用,使得定价模型成为可能

在运维方面,大量的数据已让工厂中的机器开口“说话”。在机器发生疲劳之后,一些模型结合起来,可以做到预防性/预测性维护策略更科学。

而大模型最直接的应用落地是产品,比如AIPC、AI手机。

在过去一年,邴金友看到,像光伏、新能源或新型高端装备业,所处的市场竞争压力较大、变化较快,更愿意采用大模型创新技术。另外,一些制造企业的三产或数科公司,对大模型的接受度也较高。

大模型在制造业有点状落地按照Gartner的技术曲线,目前处于上升期。”邴金友介绍。

03 面对大模型,制造业要做哪些准备?

从2024年开始,几乎每周,大模型都有“爆炸性”新闻推出。而根据业界的信息,在接下来,仍有一些公司的大招放出。阿里巴巴集团副总裁、瓴羊CEO朋新宇接触的不少企业,焦虑于自己不知道该怎么做。在焦虑不断延伸下,社会上也出现了“AI的尽头是卖课”这样一些社会怪相。

鹿崇坦承,现在概念谈得多,但真正的应用还要一步步做。

“如果落到企业层面,无非是三样东西:算力、企业的数据,以及企业的人才。”朋新宇分析说,从算力来讲,除了OpenAI等少数企业,对大多数企业而言,大家的起跑线几乎一样。

从数据来说,OpenAI已把地球上所有的公开数据基本上都收集完了,但是对企业最有价值的数据,往往是企业的自有数据,这部分是OpenAI收集不到的。企业要考虑如何把这些数据的质量提升,变成好的资产,与大模型结合。“我觉得这是企业能抓得住的、实实在在的投入。”

从人才来说,对于大多数企业来讲,去找AI领域的大牛,本质上并没有必要,关键是现在这样的人才也找不到。企业反而需要那些理解如何应用大模型,如何与企业工作流去对话,将大模型的能力转变成企业生产力的一拨人“企业要抓得住这拨人。”

汪齐齐则强调了行业专家的力量。他以直播带货为例,社交平台的兴起,解放了个人的生产力,改变了许多传统行业的运作模式。但是,这种模式的成功,往往依赖于对特定行业深入了解的专家。”例如,一个精通化妆品销售的专家可能不擅长电子产品的直播销售,反之亦然。“他说,尽管技术为各个领域提供了不同程度新的机会,但真正的专业知识和行业理解仍然是不可或缺的

“不管大模型未来以什么样的姿态出现,它一定会出现。”朋新宇说,企业要做好准备。

人工智能属于智能制造第5级可以实现的目标。”联想宋涛说,企业需要从基本的业务梳理,软件应用和平台打通等数字化工作开始落实,打好地基。而这些也需要基础架构的支持,云计算、混合云、数据安全、数据管理等基础工作,这也是帮助企业重新梳理IT、OT、DT、ET等之间的机会

宋涛也提到了人工智能技术落地的四大要素——算力、数据、算法和场景。其中,场景是驱动,要挖掘能够利用AI降本提效的场景。算力是底层支撑,数据是养分,而算法是人工智能技术形成的价值。

他建议,在人工智能落地中,优先做好算力建设和数据存储,再做好数据治理和数据价值的挖掘;用高质量数据,去训练好对应的算法,从而对业务产生价值。而AI的落地,也需要对应的人才,分步、分期通过技术实现。

朋新宇提到上周政府工作报告中的“发展新质生产力”。“大模型用于智能制造是众望所归。”他说,从OpenAI这一年的动作来看,它打开了新的空间——人类的空间、经济的空间以及企业发展的空间。“本质上,目前行业里还没有看到真正颠覆性的改变,但这也是离企业现场更近的这些人们的职责。”

女神节特辑!AI+PS轻松搞定38女神节系列海报

aigc阅读(85)

首先,向所有女士们送上最热情的祝福,愿我们在38妇女节这天尽情享受快乐与欢笑。

今天用Midjourney加PS迅速高效地创作出一系列精美的女神节海报。

用Midjourney产出自己理想的画面,在PS里面对颜色细节等进行调整,进行文字排版,分分钟产出系列精美海报。我们的目标是保证工作质量的同时,提高工作效率,确保准时下班,享受美好时光。

不再赘述,直接开始海报设计之旅。

一、3D风格海报

先看效果图:

描述词:

Cute cartoon beauty, long hair, confident, proud expression, proud, pink top, wearing pink hat, pink fashion, flowing long skirt, sitting by the seaside, panoramic view, large aperture, 3D cartoon style rendering, trendy fashion long skirt, new trendy portrait, vibrant colors, pop Mart production, delicate luster, clean background, frosted glass, complete character body,

翻译:

可爱的卡通美女,长发,自信的,骄傲的表情,高傲的,粉色的上衣,戴着粉色的帽子,时尚的,飘逸潮流时尚长裙,坐在海边,全景,大光圈,3D卡通风格渲染,新的潮流肖像,充满活力的色彩,pop Mart制作,细腻的光泽,干净的背景,磨砂玻璃,完整的人物身体

生成的图片展示:

知识点:

在图像生成过程中,为了提升画面的质量和准确性,我们经常依赖于局部重绘这一高级功能。

局部重绘允许我们对画面中的具体区域进行细致的调整和优化,尤其是当这些区域存在明显的错误或不符合预期时。

通过使用局部重绘功能,我们首先选择画面中需要修改的特定区域。

然后,我们输入与期望结果相匹配的描述性关键词。这个过程可以重复进行,直到画面达到用户的要求。

局部重绘功能的关键在于它能够锁定特定的画面部分,而不影响其他已经满意的区域。

结合用户输入的描述性关键词,该功能可以进行针对性的二次绘制,从而精确地实现用户对目标选区的视觉要求。

这种能力显著提高了图像生成的灵活性和准确性,使得最终输出的画面更加符合用户的理想标准。

操作步骤展示:

重绘后图片展示:

二、扁平插画海报

先看效果图:

描述词:

A beautiful woman dressed in a new Chinese style, elegant pink qipao, featuring green bamboo leaves, illustrations, flat illustrations, minimalism, dreamy photos, subtle layers, calmness and harmony, graphic design inspiration illustrations, high-definition image quality, high saturation, and bright colors,

翻译:

一个穿着新中式的漂亮女人,穿着优雅的粉色旗袍,画面中有绿色的竹叶,插画,扁平插画,极简主义,梦幻的照片,微妙的层次,平静和谐,平面设计灵感插画,高清画质,高饱和度,亮丽的颜色,

知识点:

在设计海报时,插画风格与文案内容的完美融合至关重要。我们需要精心挑选与插画风格相协调的文案,确保文字信息能够传达出所需的情感调性,同时增强视觉效果。每一句话都应该精准地捕捉到插画的精神内核,与之产生共鸣。

在选择文案时,除了考虑语义的准确性,还要关注节奏、韵律和和谐性,以达到文案与插画之间的同步共振。文案与插画之间应该形成一种无形的对话,相互补充,相辅相成。

此外,字体选择也是不可忽视的细节。

字体的设计和风格将直接影响到文案的阅读体验和视觉冲击力。因此,我们需要精心挑选能够体现文案气质的字体样式,确保它与海报中的插画风格保持和谐统一。

字体不仅仅是文字的表现形式,它所蕴含的设计元素和风格会对文案的阅读体验产生一定的影响,同时也会对视觉冲击力产生决定性的作用。

以三八妇女节的海报为例,我选择了具有圆角和纤细特征的字体,以确保文案和视觉元素共同营造出优雅轻盈的氛围。

这种精心挑选的字体以其流畅的线条和柔和的边缘,巧妙地补充了海报中的视觉元素,如温暖的色彩和女性形象,共同强化了女性的柔美气质。同时,字体的纤细特点也象征着女性的坚韧和独立,传达出女性在现代社会中的独特地位和力量。

如果我们的海报主题是偏向于活泼和充满活力的风格,我们会倾向于选择一种更具动感的字体,比如卡通字体。

这种字体通常具有较强的视觉冲击力,其夸张的形状和生动的设计能够吸引观众的注意力,为海报增添一份轻松愉快的气氛。

卡通字体的使用不仅能够使海报看起来更加亲切和有趣,还能够有效地传达出一个轻松活泼的主题,让观者感受到节日的欢乐氛围。

总的来说,字体的选择需要设计师结合海报的主题和风格,以及所要传达的信息,来做出恰当的判断。

无论是展现女性的柔美与独立,还是营造一个活泼欢快的节日氛围,合适的字体都能够极大地提升海报的视觉效果和信息传递的效率。

三、结语

最后,再次祝愿所有的女神们,三八妇女节快乐,愿我们的笑容如春花般绚烂,愿我们成为自己的光,每时每刻都出色。让我们携手前行,在各自的领域中继续闪耀,共同创造一个更加平等、和谐、美好的世界。

只需几十元,用AI“复活”亲人,是慰藉还是自欺欺人?

aigc阅读(72)

近日,知名音乐人包晓柏用AI“复活”女儿的事引发热议。

据媒体报道,包小柏表示,他女儿去世后,他攻读博士,经过反复尝试、训练后,如愿复刻出了“数字女儿”,不仅可以即时回应对话,前阵子老婆生日时,“女儿”还为妈妈唱了一首生日歌。

与此同时,在商汤2024年年会上,商汤科技创始人,刚去世不久的汤晓鸥以数字人的形式现身,还来了一场演讲。

并且,汤晓鸥数字人的演讲风格,与汤晓鸥生前的演讲风格非常像。

事实上,不论是包小柏的女儿还是数字人汤晓鸥,他们都并非是首个被AI“复活”的人。

自生成式AI技术兴起以来,一直都有人在探索用AI“复活”逝去的人。

不仅如此,用AI来“复活”逝去的人,已经发展成了一门生意。

一、90后小伙一年做了600多单

多家媒体曾报道过,来自江苏的90后小伙张泽伟利用AI帮助600多个家庭“复活”亲人的事。

只要拥有逝者生前的视频、音频数据,张泽伟团队就可以用AI技术让逝者再现于亲人眼前。

据悉,张泽伟团队的主要业务有两个,分别是“数字遗照”和“AI治愈”。

“数字遗照”是收集逝者的形象、声音等数据,然后用AI技术制作出虚拟的数字人形象,可以拥有简单的动作和表情,也可以进行一些简单的对话。

“AI治愈”则是用AI技术给真人换上逝者的形象和声音,让其扮演逝者与人交流,可以在线上实时互动。

此外,张泽伟团队还在探索一种“3D超写实仿生数字人”,就是让数字人以3D全息的方式呈现出来,用立体形象与别人进行互动。

据了解,从2022年开始,张泽伟就做起了这门生意。因需求火爆,他在一年内完成600多个订单,平均一单几千到1万元不等。

其中,有年轻人希望拥有偶像的数字分身,也有母亲找他“复活”癌症去世的孩子。

而张泽伟在做了600多单后,又提出了关于“数字永生”的设想:无论生者还是逝者,每个人都可以用AI创造一个“数字分身”,用这种形式留存在亲人身边。

二、电商平台标价几元到几千,有商家称可以软件自动生成,有商家称需要AI训练

一些电商平台上,也有不少在做AI“复活”生意的商家。

在某电商平台,这些AI“复活”的商品,标价从几元、几十元,到上百元,乃至数千元的都有。

只需几十元,用AI“复活”亲人,是慰藉还是自欺欺人?

笔者咨询了几位商家,其中一位商家的店铺中共有三个商品,分别是创意AI修复亲人复活照相、AI配音仿真模拟定制专属、AI代唱翻唱歌手声音克隆。三款商品标价均为10元。

只需几十元,用AI“复活”亲人,是慰藉还是自欺欺人?

其中,销量最多的是“创意AI修复亲人复活照相”,销量为21。

但笔者跟该商家沟通时对方表示,他的商品是根据照片难易程度定价的,没有10元的。

当笔者想要咨询更多信息时,却被对方给拉黑了。

另一位商家的店铺里商品比较多,标价基本都是几十块。

只需几十元,用AI“复活”亲人,是慰藉还是自欺欺人?

这些商品的销量有的为几十,也有100多和200多的。

笔者从标价40元的商品点击联系客服后,对话框里弹出一个40元-8888元的链接。

只需几十元,用AI“复活”亲人,是慰藉还是自欺欺人?

该商家表示,具体价格要根据照片和要求来定,前提是不做人脸识别,不做违法的,只做怀念。

如果只是让照片动起来,只需要提供正面照片就可以,成片是13秒。

如果想要让照片说话,需要提供正面照片与配音,价格是根据视频时长来。如果没有配音,则提供文字内容,商家给配普通话。

至于可以实时互动的那种,该商家表示自己做不了。

该商家还表示,可以出售教程,售价1500元。可以用软件自动生成,也可以手动做。

还有一位商家的店铺中有两个产品,分别是“AI复活亲人”和“明星AI祝福视频”,标价均为10元,销量均为个位数。

只需几十元,用AI“复活”亲人,是慰藉还是自欺欺人?

该商家提供的价目表显示,其部分商品可以实现实时互动。具体内容和价格,如下图:

只需几十元,用AI“复活”亲人,是慰藉还是自欺欺人?

该商家表示,要实现实时互动是需要用AI训练的,不是一个软件就能做到的。

除此之外,还有一些店铺的商品比较简单,只是单纯的让照片动起来。

有商品页面显示,其销量已超过1000。

不过,有很多买家评论称,该产品没用,是骗人的。

只需几十元,用AI“复活”亲人,是慰藉还是自欺欺人?

事实上,这种只是让照片动起来的技术已存在多年了。

笔者印象中,在网贷正盛行的那几年,就有很多做贷款的中介能做到让照片动起来,来通过人脸识别。

从这些商品的销量和高达数千元的售价来看,AI“复活”逝者的确是有市场的。

但一直以来,AI“复活”都是一个备受争议的话题。

三、让逝者通过AI“复活”有没有意义?这是个问题

有观点认为,在生成式AI技术的加持下,和逝去的亲人“再见一面”成为可能。

通过AI来实现和逝者相聚,不仅能得到一丝慰藉,还能在难过的时候和已故亲人倾诉。

也有观点认为,这样的做法没有意义,人没了就是没了,自欺欺人的做法只会让自己陷入虚无,更难走出失去亲人的痛苦。

也有人质疑,用逝者生前影像样本“克隆”出来的“亲人”,还是我们认识的那个人吗?

其实这种AI“复活”逝者的做法,跟电影《流浪地球2》中的“数字声明”有些相似之处。

在《流浪地球2》中,刘德华饰演的图恒宇因为女儿丫丫意外身故,思女心切,将女儿的精神转化成数字生命。

但图桓宇的同事马兆对此持反对意见。他认为人死了就是死了,离开人类的文明没有意义。

早在去年年初,三言就在《行星发动机、太空电梯、数字生命,〈流浪地球2〉中的科幻产品能实现吗?》一文中,对所谓的“数字生命”进行过分析。

包括人类在内的所有“肉身”生命,都有自我意识,是具备无限可能性的,有真正意义上的随机性,而数字生命很难完全代替“意识”。

如果精神、思想能够被数字化,意味着一切事情都是能够被电脑计算出来的,是否能够通过计算实现真正随机存在很大不确定性。

四、生成式AI技术还有法律风险

除了伦理上的争论之外,生成式AI技术在法律层面上也有着侵犯肖像权、AI诈骗等风险。

日前,刘德华电影公司映艺娱乐还连发2条声明,提醒警惕AI语音合成骗局以及盗版网站骗演唱会订金。

去年,福州一老板10分钟被骗走430万的事情也曾轰动一时。

骗子就是通过AI换脸技术,佯装成受骗者的好友,对其实施诈骗。

生成式AI才兴起不久,它象征了科技进步的同时,也衍生出一些灰黑产业。

对于这项技术,目前既无专门的监管条例,也没有自发形成的行业标准。

因此,AI“复活”这门生意的未来走向如何,还不得而知。

你支持AI“复活”逝者的做法吗?欢迎留言。