近几年,AI(Artificial Intelligence,人工智能)技术发展迅猛,各种大模型产品层出不穷。例如,代表性的聊天产品ChatGPT和绘图产品Midjourney的推出,使人们切身感受到了人工智能的魅力,在一定程度上方便了人们的工作和生活。
然而,尽管人工智能大模型是目前投资领域的热门方向,但仍然有大量基于大模型的人工智能初创公司倒闭。这些初创公司的大模型产品,目前还没有找到合适的商业化路径。
前期高昂的基础设施投入,以及后期训练模型的运营成本,无疑是压死骆驼的最后一根稻草。
大多数大模型人工智能初创企业所面临的问题是,他们研发出的产品方向,已经被其他巨头想到了。他们辛苦研发出的大模型产品,发现巨头们的产品做得还比自己的好。本来想着主打性价比,少量收费,结果发现巨头们的大模型产品直接免费了。
由于大模型产品前期的基础设施、中期的训练以及后期的产品运营,都需要耗费大量的时间和金钱成本,这就导致了很多没有持续现金流支持的初创企业产品,没有持续性,很多倒在了黎明之前。
这就逐渐形成了以微软、Meta、OpenAI这些巨头主导的寡头市场,这些巨头凭借着资金、资源、技术的优势,快速发力,对其他人工智能大模型初创公司的产品形成了降维打击。
在作者看来,人工智能大模型的创业,一定要建立产品思维,一切从需求、从用户、从市场出发,研发接地气的产品,而不是盲目跟风,觉得这块资本市场比较青睐,希望可以在风口上获得一些资金,来进行大模型产品的创业。杜绝手里拿着锤子看什么都是钉子的错觉。
在产品经理视角下看人工智能大模型产品,一定要回归需求的本身。单纯的人工智能大模型产品如同空中楼阁,毫无意义,一定是需要基于某些特定场景,例如脑科学产品。大脑作为人类最复杂的器官,大脑健康水平同人们的幸福水平息息相关。
因此,在产品经理视角下,人工智能大模型与脑科学相结合的产品,才是大模型最有价值的应用方向。因为,科技发展的初衷是为了人类服务,让这个世界,让这个星球变得更加美好。
我们基于这个愿景,来看一下产品经理视角下人工智能大模型与脑科学相结合将会带来哪些产品机遇。
一、AI产品进化分析
首先我们从用户使用场景出发,如果我们梳理用户和人工智能发起的历程,可以很清晰发现,最早我们使用计算机,主要是当作工具使用。
不论是PC时代,还是最初的移动互联网时代,各大公司推出了各式各样的工具软件,像大家熟知的Word、Excel、PowerPoint等,极大提升了人们的工作效率。
这个时期的软件,更多的是基于规则执行,而不是智能。很多银行在贷前推出了基于大数据的智能评分与授信系统,以及针对贷后管理推出的智能催收产品,虽然可以实现同用户的互动问答,但是仍然是基于策略和规则进行执行,算不上真正的人工智能大模型。
人们真正感受到机器智能,是最初的ChatGPT产品推出之后,可以媲美真人的问答互动,让人们感受到了不一样的人工智能。
但是初代的ChatGPT虽然问答互动功能强大,但是可扩展的功能并不是很理想。对于实际场景中的应用,仍然是人类为主导,ChatGPT作为辅助工具,解答人们提出的问题,不直接处理人类的工作。
随着大模型技术的不断发展,目前已经有很多厂商的产品从辅助型的人工智能产品向协作型的人工智能产品迈进。例如:
- 字节跳动在其飞书多维表格产品中加入了大模型【飞飞】,可以在工作中直接协助生成相应的内容。
- 微软在2023年10月发布了 Windows 11 22H2 Moment 4 更新,推出了Microsoft Copilot大模型,其产品定位是日常AI助手,并可以同Office产品进行集成,提升用户工作效率。
大模型作为协作工具,其生成结果仍然需要人们根据实际场景进行后期的调整、完善,虽然大模型直接参与了人们的工作,但是仍然需要人工进行深度参与,大模型并不能完全自动化完成人们希望的工作。
现阶段大模型更倾向于向代理的方向发展。代理这个词很容易理解,比如我们在OA(办公自动化)中常见的代理发起申请,审批人由于出差或是其他原因,授权后由代理人进行代理审批。
在大模型的代理与协作所不同之处在于,协作仅是大模型承担部分工作,大部分工作由人类完成,而代理则是大模型会承担人类的大部分工作。
AutoGPT是Github上的一个免费开源项目,结合了GPT-4和GPT-3.5技术,已经实现了大模型在代理场景中的应用。AutoGPT的特点在于,用户不需要不断对ChatGPT提问以获得对应回答,在AutoGPT中只需为其提供一个AI名称、描述以及目标,AutoGPT就可以自己完成项目。AutoGPT可以自己去浏览网页、读写文件,将其与所说的历史提示记录相结合,审查自己提示的结果。
通常我们与AI的交互形式基本上都是用户先输入指令,然后AI会根据用户的指令内容做出响应。这样交互的痛点在于,用户每次在进行提供有效的提示词才能达到想要的效果。
随着代理模式的不断升级,逐渐被设计为具有独立思考和行动能力的AI程序。用户只需要提供一个目标,比如制作一首歌曲、开发一个程序,AI大模型就会根据用户输入的目标,形式生成一个任务序列开始工作。
人工智能大模型代理的实现,可以极大减轻人类重复性的工作,极大提升单位个体的工作效率,甚至会由此诞生非常多的超级个体,这些个体成为独立的公司,公司只有一个人,借助AI完成以往需要10人左右规模的小型公司的工作任务。对很多工作领域带来巨大变革,例如:MCN(Multi-Channel Network,多频道网络)机构、课程培训机构和广告公司等。
智能,是AI大模型的终极目标。不论是多模态还是单模态的大模型,只需要人类给定一个目标,其余的都由大模型自己完成。这种模式比代理的模式更为智能,人类参与度更低或几乎没有。
这种完全智能的大模型产品,会为人类的生活、学习和工作带来质的飞跃。各种细分领域的智能产品会如雨后春笋般涌现。例如:个人助理产品的出行订票场景,只需要告诉大模型:“需要订上海到北京,下午3点火车商务座”,大模型便会根据要求,自动完成火车车次查询、订购以及支付。
综上所述,AI产品的进化标准,我们主要以AI在具体场景中的参与程度进行衡量。为了便于读者们理解,整理下表请大家参考。AI参与度是一个参考值,在不同的场景中,不同阶段的AI参与度会有所不同。
二、脑科学产品
脑科学产品其实在市面上已经存在多年。只不过大多数产品用于医院相关疾病的诊疗,而且产品使用复杂,体验不佳。
另外脑科学的设备也比较笨重。未来的脑科学产品应该是小型化,便捷化,随时随地方便使用,并且注重预防。
对于脑科学产品,目前比较通用且已经实现商业化的脑科学产品包括:
1)脑电图(EEG)仪器:用于测量大脑电活动,广泛应用于临床诊断、神经科学研究等领域。
2)功能性磁共振成像(fMRI)设备:通过检测血液中的氧气水平来观察大脑活动,可以用于研究认知功能、情绪调节等方面的问题。
目前也会有一些其他利用数字技术的脑科学相关产品,例如:
1)神经反馈技术:利用脑电信号来控制外部设备或游戏界面,可以帮助人们改善注意力、情绪调节等问题。
2)虚拟现实技术:通过模拟真实环境来训练和治疗神经系统疾病,例如帕金森病、抑郁症等。
3)脑机接口技术:将人脑与计算机或其他设备连接起来,可以实现更高效的信息传递和控制方式。
4)智能假肢:利用脑电信号控制机械手臂的运动,可以帮助残疾人士恢复一定的生活自理能力。
以上这些产品需要借助于外部硬件。我们希望可以利用非常便携的设备,例如我们常用的手机,就可以打造脑科学产品,提升大脑的机能,预防大脑相关病症的发生。
AI大模型技术的发展,使得这个设想成为现实。基于大模型技术,只需要手机一个载体,再配合相关的App应用,就可以打造一个脑科学相关的产品。
睡眠,是一个困扰很多人很多年的问题。睡眠质量的好与坏,关系到大脑的健康与否。睡眠质量的低下可能会导致非常多的健康问题,例如:
1)精神疲劳:睡眠不足或睡眠质量差会导致身体和大脑无法得到充分的休息,从而出现精神疲劳、注意力不集中、记忆力减退等问题。
2)情绪问题:睡眠不足或睡眠质量差还可能导致情绪问题,如焦虑、抑郁、易怒等。
3)免疫力下降:睡眠不足或睡眠质量差会影响免疫系统的正常运作,从而增加感染疾病的风险。
4)代谢问题:睡眠不足或睡眠质量差还可能导致代谢问题,如肥胖、糖尿病等。
5)心血管疾病:长期睡眠不足或睡眠质量差还会增加患心血管疾病的风险,如高血压、心脏病等。
因此,保持良好的睡眠质量对于身体健康和心理健康都非常重要。根据世界卫生组织的数据,全球有超过30%的人口存在睡眠障碍。具体数字可能因地区、年龄、性别等因素而有所不同。
例如,在发达国家,成年人中有20%至30%的人存在睡眠障碍;而在发展中国家,这一比例可能更高。此外,儿童和青少年也面临着睡眠障碍的问题,尤其是在城市化和数字化程度较高的地区。
助眠的方式有很多种,例如保持生活规律、创造一个舒适的睡眠环境、在睡前进行放松练习,如深呼吸、瑜伽、冥想等,也可以使用助眠工具,如使用香薰、按摩器、音乐等助眠工具。服用药物是非常不推荐的做法,也是没办法的办法。
音乐助眠是属于声波助眠的一种,利用手机就可以实现。除此之外,声波还可以是白噪声、自然声音、以及一定频率的声音。
1)白噪音:白噪音是一种均匀分布的噪声,可以掩盖其他声音,从而帮助人们入睡。可以使用专门的白噪音机或手机应用程序来播放白噪音。
2)自然声音:自然声音如海浪声、雨声、风声等也可以帮助人们放松身心,进入睡眠状态。可以使用专门的自然声音机或手机应用程序来播放这些声音。
3)频率音乐:频率音乐是一种利用特定频率的声音来调节身体和大脑状态的音乐。这种音乐通常包含低频、中频和高频的声音,可以帮助人们放松身心,进入睡眠状态。可以使用专门的频率音乐机或手机应用程序来播放这种音乐。
因为每个人的身体和大脑状态都不同,声波助眠并不是适用于所有人的方法。AI大模型的出现,可以通过对每个人的健康指标和日常活动进行分析,从而找出适合每个人的声波,从而实现声波助眠。
对于AI大模型而言,原本需要高额成本去做音频采集的事情 ,可以由计算机实时自动生成,且生成效率比传统人工采集效率会高很多。
我们知道,声波的发出依赖于物体震动的频率。人耳可以感知的声音频率范围大约在20Hz到20,000Hz之间。这个范围内的声音被称为可听声,超出这个范围的声波被称为超声波或次声波,人耳无法直接感知它们。
因此,我们可以基于20Hz到20,000Hz之间的频率生成适用于每个人的助眠声波。我们也可以从钢琴的音域范围生成助眠声波。例如:钢琴里C调“1”(“do”)的频率是262Hz,D调“1”(“do”)的频率是294Hz。
每个人听到不同频率的声波,反应会有所不同。实现中,有些人会对某些特别的声音过敏,有的人听到刮铁锅的声音感会觉到不舒服,有的人听到石头划水泥地的声音会感觉到不舒服。同样,也有人听到某些频率的声音,会感觉到非常舒适。
因此,AI大模型同脑科学的结合,可以在声波助眠这个细分方向发挥其特有的价值。
三、总结
而声波助眠是一个非常不错的切入点。作者最近也在研发这样的一款产品,希望先从自己进行实验,如果自己使用起来有效,则这种基于AI大模型与脑科学相结合的产品,就可以适用其他人,但到依据每个人的大脑特质,定制化适用于每个人的助眠产品。
然而,这项技术非常有挑战。需要对音频原理有深入了解,也需要有极深的计算机算法与编程功底,同时还需要有音乐乐理知识。
作者相信,即使是充满挑战,困难重重,这项工作仍然是非常有价值的一件事情,如果研发成功,将会极大缓解人们的焦虑,增加幸福感,提升工作、学习效率。并且,还可以扩展应用于自闭症、抑郁症、阿尔兹海默症等大脑相关疾病的预防或康复。
下图是历史上的五轮康波周期,下一波的周期应该是AI大模型,甚至是超大模型的周期,AI与其他领域的结合,将会带来巨大的科技变革。
基于产品思维,做有价值有意义的事。目前这款产品已经进入到Demo自己测试和验证阶段,接下来会寻找种子用户,进行产品体验。
欢迎有音频、脑科学相关的朋友随时交流,合伙做一些有意义的事情 ,同时非常欢迎投资者与我联系,对我的这款AI大模型与脑科学相结合的助眠产品进行投资。