云启资本合伙人陈昱:AI大模型突破核心在工程优化,应用落地符合“二八定律”

21世纪经济报道采访人员骆轶琪 广州报道
进入大模型发展时期,AI产业被视为进入了“iPhone时刻”甚至将来到“奇点”,诸多行业都将由此被改变 。那么对于产业和个人来说,机会将在哪里?
近日举行的2023小蛮腰科技大会暨AIGC人工智能峰会期间 , 云启资本合伙人陈昱接受21世纪经济报道采访人员专访时表示,当前还在竞速中的国内AI大模型企业都有发展机会 , 核心在于不断提升工程优化和技术迭代能力,同时也要充分挖掘创新应用场景 。
在他看来,生成式AI落地到应用场景中,将是80%存量应用升级 20%新应用探索的“二八定律”局面 。也将给正在演进中的技术,如元宇宙、自动驾驶等 , 带来渐进式能力推动 。
作为早期投资人,在面对AI大模型创业项目时,他看好有野心、懂技术、执行力强的团队 。毕竟如今竞争对手众多,如果执行力不够,将很难在这一轮浪潮中跑出成果 。据悉,2021年底,云启在天使轮投资的MiniMax,是国内第一家拥有自研多模态大模型的创业公司,目前已开放API接口,和WPS等众多企业合作 。

竞速AI大模型

追根溯源,如今火爆全球的ChatGPT背后,是Transformer架构的支撑 。这一技术早在2017年被谷歌提出,2018年谷歌还提出基于Transformer架构的BERT技术等 。
“其实无论是早期的CNN(卷积神经网络)还是Transformer,都属于在深度学习领域,行业探索过程中寻求的不同网络结构 。恰好Open AI用解码器decoder only架构,证明了Transformer的可行性,并把参数规模从十亿扩展到上千亿量级 。”他续称,因此这一方面有赖于深度学习算法的持续发展;另一方面英伟达提供的GPU算力支持同样功不可没 。
实际上 , 在早期路径探索中,谷歌认为decoder only路线可能会不如encoder decoder(编码-解码)效果好,因此采用了另外一条路线 , 而谷歌内部长期有多个团队在做不同尝试 。
最终Open AI持续迭代,加之RLHF(人类反馈强化学习)后,证明了decoder only路线的可行性 。随着路线被证明,谷歌很快也推出号称可对标GPT4的大模型PaLM2 。
“国内和国外有不同的大模型体系,投身AI大模型的国内企业,当前还是有一定机会 。”陈昱对采访人员分析,目前GPT-4的水平可能已经达到了95分 , 国内很多产品在80分左右,但是并不存在代际差 。
这时候更重要的是,一方面,AI大模型公司需要花费更多时间在工程优化和技术迭代上;另一方面,更需要产品经理的创新能力 , 充分挖掘AI大模型的创新功能 。
“我觉得这一轮,微软在创新应用方面做得比绝大部分公司好,近期微软密集发布新功能,比如在Bing中引入ChatGPT、适用于Windows 11的Windows Copilot等,因此也有声音说,微软的一系列动作要抢了创业公司的饭碗 。”他续称 。
不过有行业观点认为,Open AI更多是证明了Transformer架构路线的可行性,在具体落地时,或许未必要重投入,而是可以考虑小模型发展路线 。
“目前业界存在不同观点 。”陈昱对采访人员分析,一部分人认为,小模型可能存在诸多优势,如资源消耗较少、成本低,而成本低就是跑通商业模型的重要一环;同时,当前“大力出奇迹”的AI大模型中集合了太多数据量和能力,但实际在应用中或许未必需要 。
但另一部分人认为,AI公司最终的发展目标都是瞄准通用人工智能(AGI) , 也即类似人类的大脑,在运转过程中并不会分区,而是可以同时多路线思考运行,甚至各分区之间会互相作用,产生意想不到的效果 。这条思路之下,就意味着需要大模型最终“一统江湖” 。
总体来看,当前业界对这两条路仍有分歧 。“学术上也还没有证明,大模型是否的确是参数量越多越好 。毕竟目前AI的运作还是一个黑匣子 。”
当然他也认为,并不是所有企业都需要有自己的大模型 。“训练大模型要从头开始,这意味着巨大的资源消耗,需要衡量投入产出比 。有时调用成熟的大模型,取得的效果可能远比自己从头搭建和训练要好 。”他强调,长远来看,综合考虑成本和收益是否算得过来账很重要 。

如何改变未来

当前最受关注的,便是在生成式AI浪潮之下 , 对应用生态和相关底层技术带来的影响 。陈昱对采访人员分析,在应用场景落地中,将是80%存量应用升级 20%新应用探索的局面 。
具体来说,数字经济、企业服务/SaaS服务等技术此前已经发展多年,通过引入更好的AI大模型能力 , 可以将既有技术进一步升级,把之前很难做好的体验真正做到满意;再如微软近期不断对旗下应用进行迭代升级,将极大提升内容生产力和工作效率 。这都是由技术变革带来的体验变革 。
当然也会诞生新的应用,比如这一轮生成式AI与前一轮预训练模型不同的是,已经能够处理多模态、多语言信息 , 这将可能给教育、外贸等产业带来新变化;此外,还将有面向开发者的AI解决方案(AI for Developers),可以帮助程序员编写代码、检查安全漏洞等 。
生成式AI技术的出现 , 也将给正在迭代中的技术路线带来一定帮助,比如元宇宙和自动驾驶等 。但这总体带来的将是渐进式改变,而非颠覆式驱动 。
陈昱对采访人员分析 , AIGC对元宇宙的推动将主要在于素材生成 。“元宇宙前期会在这方面花费较多时间,AIGC就可以帮助提高素材生成效率、节省创意时间 。”
不过这并不能起到根本性推动作用 。“元宇宙一直难以大面积落地,是因为暂时没有刚需的应用场景 。AR/VR被视为元宇宙的入口,但目前遇到的难题是,还没有一款眼镜达到可以长期佩戴使用的效果 。”他指出 。
对于自动驾驶的改善可以包括两方面:感知(perception)和规划(planning)部分 。
此前自动驾驶功能运行时 , 传感器需要不断收集外部信息,进行标注 。但有了AI大模型后,由于其具备zero-shot(零样本)能力,可能就不再需要具象到所有可能出现的物体样本进行标记 。
而自动驾驶进程中,根据收集到的地图、实时视觉等信息后,该决策是加速、减速还是换道等,就可以运用到AI大模型的推理能力,这将会比现有自动驾驶所用模型做到更好的效果 。
对云计算的变化,陈昱指出,AI相关服务用量将激增,短期内会利好英伟达,但长久以后,云厂商可能会发现,与其每年不断向英伟达下订单购买芯片,不如自己开发芯片或和其他芯片厂商合作 。
“英伟达的强悍在于开发了一款相对通用的AI芯片,但如果云厂商明确了未来几年都会采用Transformer架构时,那么自己也可以考虑针对Transformer优化一款专有芯片,所以也看到包括谷歌、微软、Meta都有自己的芯片开发计划 。”他续称 。
AI大模型还在不断渗透到软硬件层面,如近期ChatGPT推出iOS版、百度为此推出硬件产品等 。不过陈昱并不认为AI大模型的出现会对既有软硬件生态带来太大角色改变 。
我认为改变的可能是搜索生态 。”他续称,比如ChatGPT就可能成为谷歌在搜索方面的竞争对手 。这意味着对用户使用习惯没有太大改变,改变的只是获取信息的途径 。
从社会影响来说,陈昱认为,这将对整个教育体系带来巨变 。可以类比此前计算机出现后,复杂的珠算、五位数乘法等学习,到今天多被计算器所取代 , 人们可以把脑力放在其他更有创造力知识的学习中去 。“如果能够利用好AI工具,帮助我们人类完成此前80%的工作,剩下20%可以更好地施展创造力和想象力,同时也会带来新的职业畅想和组织范式 。
【云启资本合伙人陈昱:AI大模型突破核心在工程优化,应用落地符合“二八定律”】更多内容请下载21财经APP

相关经验推荐