比如,之前的“AI来了,会不会取代我?”,“AI芯片的规模将突破多少多少亿?”......又比如,最近的“全是AI的诺贝尔奖”和“马斯克的无人驾驶汽车”......可是,一边,AI的风已经刮到这个地步,另一边,其实也有很多人说:你说,GPT火了,可是真的和它多聊几次,又发现它有时也胡言乱语,并不觉得它真能取代办公室里的哪位同事。你说,AIGC火了,可是它生成的那些东西,有时确实惊艳,但有时又确实像人工智障。你说,那些大厂都在做大模型,可是那都是要疯狂烧钱的事,和普通人,普通创业者好像也没什么关系......AI的潜力,有没有被高估?会不会和过去的很多概念一样,只是一个被炒得过热的泡沫?作为一个普通人,一个普通创业者,我该怎么看待AI?又该怎么做?作为一个商业顾问,这几年我也在找答案。今年在问道全球,我曾和几十位的企业家去到硅谷参访,看了一些AI方面的公司,包括OpenAI。后来去百度参访时,也曾和百度的同学聊了聊。而前段时间,我的进化者栏目,还很荣幸地请到了王煜全老师。作为一位在美国的科技领域积累了十几年的投资人,同时也是一位近期回到国内投身人工智能领域的创业者,他对于人工智能的见解里,不但有他看过的大量先进进展和实操案例,还有他用自己管理的资金真真正正下过的判断,和因此积累的第一手认知。别焦虑。先认识它,拥抱它,持续刷新自己对它的认知。那天,王煜全老师分享了很多。我帮你整理了一下,今天和你分享,相信一定能对你有启发。AI之于你我,是个什么事儿?除了目前这一波,未来还会往什么方向发展?还有什么机会?AI,好像也就那么回事儿?并且,很多声音预测,它不但吹向了更多地方,还可能吹翻更多地方。看报告:麦肯锡的最新预测说,50%工作被AI取代,对于很多人来说,时间窗口只剩6年......看新闻:今年的诺贝尔物理奖颁给了AI,化学奖又颁给了AI......嗯,真厉害。可是,可是,也有很多人觉得,这股风,好像,其实,也就那么回事?自己的生活,也就是多刷到了一些AI相关的大佬言论和热搜新闻,或者开始用AI搜搜东西。有时真忙起来,想用AI帮忙写个什么文案,改个什么PPT,拿到结果一看,还是会深吸一口气,点杯咖啡,自己接着改......慢慢地,也有声音开始讨论,AI很厉害,但对普通人来说现在暂时还没什么用。甚至,未来也有可能像3D打印、区块链和元宇宙等技术一样,在经历一段热潮后,逐渐冷却。人工智能真的有那么巨大的潜力吗?人工智能到底是一个会改变世界的技术,还是只是一个过热的泡沫?人工智能,是一个可以和当年工业革命相媲美的技术革命。还记得吗?很久很久以前,人做多复杂的事,大多都是用手。用手洗衣服,用手打家具,甚至用手组装汽车。但后来,蒸汽机出现了,电力出现了,借助9台两三层楼高的蒸汽机,打造出生产流水线,从而让汽车这么复杂的产品也能大规模批量生产的福特汽车出现了。再后来,除了汽车,还有电视、冰箱、洗衣机......人类的世界,从此可以借助机器,实现复杂产品的规模化生产。今天和之前,人做不了的事,大多都是找另一个人帮忙。找医生看病,找老师讲题,找教练学开车。但现在,人工智能出现了,ChatGPT出现了,文心一言、KIMI、豆包们出现了,有什么事都能像个秘书一样,帮你满世界搜罗资料,再帮你整理得明明白白地给到你,整个过程甚至还兼顾情商和幽默感。再后来,除了生成内容,在更多领域里,可以帮医生看片子,帮科学家分析DNA序列,甚至帮人开车的AI助手出现了......人类的世界,从此可以借助人工智能,规模化复制人类经验,并且能够个性化提供服务。工业革命的核心,是实现了复杂产品的规模化生产。而人工智能革命的核心,是规模化复制人类经验,并且能够个性化提供服务。今天的人工智能,就相当于当年的电力。今年上了好几次热搜的借助人工智能实现的自动驾驶,就相当于当年借助电力建立的生产流水线。而在未来的10年、20年、30年里,你会看到的变化还会有:像看到无数个生产流水线被建立起来,无数汽车开始实现规模化生产,并因此得以降低成本和价格让无数人开得起一样,看到无数个各领域的专家经验被复制,并变成更便宜的服务,提供给到更多人。可以媲美工业革命的技术,可以真正改变全人类和全世界的变化。每当时代遇到一个巨大的变化时,其实都是很多人的机会所在。很久很久以前,这个机会可能叫“工业化”或者“懂机械”、“开厂”、“做工程师”......后来,这个机会可能叫“信息化”或者“懂电脑”、“互联网”、“做程序员”......创业、投资、乃至自己花钱买课学习,决定未来报什么志愿转什么行业......怎么判断一个技术到底能不能成,是不是被高估?王煜全老师,分享了1个总的判断方法,和3个具体的新机会。比如,一开始的大模型,后来的AIGC,自动驾驶,具身智能机器人......都是借助AI的技术衍生出来的机会,我怎么知道哪些机会靠谱?哪些有没有被高估?王煜全老师说,他们基本上会先从2个角度来看这个事儿:首先,看一件事能不能成,一个前提是先要看产业化时点。无论未来多厉害,多有想象空间,这个技术到底什么时候能成熟并进入到社会?100年后,和明天,注定不一样。这个技术能做什么,不能做什么,未来最好能做到什么水平?天花板在哪里?无论是以前的电力,还是后来的人工智能,一个通用技术最终总会进入各行各业,改变各行各业。这个过程中,无论是应用、创业,投资,还是围观,总有人会低估它,也总有人会高估它。学会看产业化时点和技术的能力边界的人,更容易从一开始就看得清楚一点。基于这套判断方法,结合今天中国、美国的技术进展,主流、非主流的趋势看法,你的判断是什么?接下来,AI技术进步的方向主要有哪些?分别对应着怎么样的机会?这3个关键,前段时间,那个一度被“全网删除”的前谷歌CEO施密特在斯坦福大学的演讲,也有提到。只不过当时,很多人关注的是他“脸有没有绿”,而没注意到他说的那句:“在接下来的一年里,你会看到更大规模的上下文窗口、AI Agent和Text-to-Action的功能。当它们被大规模应用时,影响将比我们现在看到的社交媒体带来的巨大冲击还要大”更大规模的上下文窗口、AI Agent、Text-to-Action。
它说,好的,请先回答:你的年龄、体重是多少?平时爱吃什么?有没有什么慢性病?平时会不会容易疲劳出汗?......你花了半小时,一一回答,拿着方子下线,各方面都很满意。但2周后你来复诊,你说,上次看完后,有效果诶,但是有些问题......它却说,怎么不好?它说,好的,请先回答:你的年龄、体重是多少?平时爱吃什么?有没有什么慢性病?平时会不会容易疲劳出汗?......你不想回答?也行。但不回答,它就不了解你,你只能得到一份“放之四海皆准”的减肥建议。王煜全老师说,他们曾参与到很多人工智能应用的开发,发现要做好服务,很多时候最缺的一环就是“工作记忆”。怎么办?加强AI应用的“工作记忆”。尽可能多地记住上次和你的对话。无论是帮人诊断,还是帮人做旅行攻略、购物推荐、客服......不但能记住你2周前的答案,甚至能记住你2个月,2年前的答案,让你不用反复说,也能得到更连贯,更个性化的服务。它的核心价值在于,“能够提供更精准、更个性化的服务”。
翻译成中文,是“智能体”。翻译成更简单粗暴的普通话,还可以是“更能干的助理”。今天你想去西双版纳旅游,你觉得你手机里的“助理”能帮你什么?可能,是问问“明天西双版纳天气怎么样?”可能,是问问“泼水节是几号?”但是,如果你对它喊“我打算明天就去西双版纳,你帮订个离机场近的酒店,要一间大床房,一晚300-500元之间的。再帮我去微信发个朋友圈,昭告天下我要去度假了。”它会怎么样?有没有那个理解和决策能力,还是其次,自己努努力就行。但更难受的,是别人不见得配合。让它定个闹钟还好,都是自己家里的APP,可是订酒店,发朋友圈......是不是得去敲开酒店APP、社交APP的门,调用它的数据接口,和它的系统协作?王煜全老师说,AI Agent,主要解决的就是“协作问题”。过往一个APP都像一座数据孤岛,一旦能更自由地出入其中,和它们协作,就能代表用户完成更多更复杂的任务。它的核心价值在于,“能够与外部系统协同,提供更复杂、更便捷的服务”。
翻译成中文,是“从文本到行动”。翻译成更简单粗暴的普通话,还可以是“更有执行力的服务”。
前谷歌CEO施密特,在他的那场演讲里举了个例子。
当时他说,未来每个人都会有自己的程序员,去帮忙执行自己的指令,你说往东就往东,你说往西就往西。而不是像那些今天在为他工作的人类程序员那么叛逆不听话。
所以,作为未来的AI技术大方向之一,“Text-to-Action”的关键,就在于“更听话”,从而提供“更有执行力的服务”吗?
不止。王煜全老师说,施密特暗示的意义,远超过这个。
在“听话”和“有执行力”之间,还有关键的一环:
“它能不能像一个业内专家一样,真正知道和理解,要达成你说的,具体应该怎么做”。
也就是,它有没有领域智能(Domain Intelligence)。
举个例子,自动驾驶。
今天,你抢先买到了一辆无人驾驶汽车,坐上去后,你和它说:“去东方明珠”。
很快,车子启动了。可是,要真正把你安全带到东方明珠,具体应该怎么动?
只是会打方向盘、会踩油门和刹车,够吗?它要怎么才能知道,什么时候该转向,转多大角度的方向盘?什么时候踩油门,什么时候又该换刹车?
以前的做法是:像一台机器一样,”按程序“开”车。
比如,先基于摄像头采集回来的图像信息,对周围的环境做一个完整的识别。对面那个东西,是不是一个红灯?是的话,按照之前那些基于交规设定好的程序,我是不是该停车?
后来,有了端到端的视觉智能,做法又不一样了:像一个“老司机”一样,按经验“开”车。
比如,先在上路前好好学习,提前“学习”很多有经验的老司机开车的视频。“学习”了10000个人开车的视频,10000个视频里,老司机都在类似的那个东西面前选择停车,那下次我碰到这么个东西,也停车。
像机器一样开车,像老司机一样开车。
“听话”,“不但听话,还能在任务对应的特定领域内,像专家一样思考和决策,真正知道和理解,要达成你说的,具体应该怎么做”。
你觉得,哪种“司机”,在执行力上更有潜力?
王煜全老师说,Text-to-Action,主要解决的就是“执行问题”。
怎么解决?关键不止是“听话,让做什么做什么”,还有“有领域智能,知道这事怎么做”。
“Text-to-Action”,就是“更有执行力的服务”。
它的核心价值在于,“能够将输入的文本指令直接转化为具体的实际动作或流程,提供更听话、更落地的服务”。
更大规模的上下文窗口、AI Agent、Text-to-Action。AI的潜力,有没有被高估?作为一个普通人,一个普通创业者,我该怎么看待AI?又该怎么做?下一波的新机会,是什么?首先,人工智能,是一个可以和当年工业革命相媲美的技术革命。而人工智能革命的核心,是规模化复制人类经验,并且能够个性化提供服务。具体会有哪些服务?今天AI技术发展的主流发展方向是什么?又对应了哪些机会?第一,“更大规模的上下文窗口”,也就是“更好的记忆力”。接下来,谁能在这方面做得更好,谁就更有能力提供更精准、更个性化的服务。第二,“AI Agent”,也就是“更能干的助理”。接下来,谁能在这方面做得更好,谁就更有能力与外部系统协同,提供更复杂、更便捷的服务。第三,“Text-to-Action”,也就是“更有执行力的服务”。接下来,谁能在这方面做得更好,谁就更有能力将输入的文本指令直接转化为具体的实际动作或流程,提供更听话、更落地的服务。以前,AI刚出来时,很多人说,AI就是3件事:算力,算法,数据。可是,了解了这个,会发现:这3件事都太遥远了。要真正参与这件事,或许需要很高精尖的技术,和很多的钱。和它相关的,可能是大厂的竞争,乃至大国的竞争。后来,AI进入应用阶段,很多人还会说,AI就是另3件事:感知,思考,实现。可是,了解了这个,会发现:这3件还是离普通人有点远。要真正参与这件事,或许依然大多是大公司,比如百度和它的萝卜快跑,比如特斯拉和它的Cybercab。但是,就像工业革命发现电的第一天,也好像和普通人很远。一个普通人,能拿电干嘛呢?但后来,属于电的机会,并不只是在发电厂,而是演变到用电先一步实现效率迭代的工厂,再演变到今天千千万万普通人的行业。人工智能,也一样。从一开始的大模型,演变到自动驾驶、具身智能,人工智能这件事,和这件事里的机会,也在继续演变。比如,今天说到的这3件事:更大规模的上下文窗口、AI Agent、Text-to-Action。至少,别再把心力分给焦虑和迷茫。要分,分给积累认知。王煜全老师,在谈话中曾说过这么一句话:掌握人工智能,像学一门语言一样,是要花时间泡的。而年轻人最大的机会在于,有时间去泡,去养成对人工智能的认知。*文章为王煜全独立观点,仅供参考。
观点 / 王煜全 主笔 / 尤安 编辑 / 二蔓 版面 / 黄静这是刘润公众号的第2420篇原创文章