很多人跟我聊大模型,一般亲戚朋友通常认为,尽管大模型还看不到多少实际应用,但在对话中展现出的知识储备和理解能力让人惊叹,还是很神奇的。而很多专业人士,对大模型的谈论也流于表面,急于臧否,在谈及行业应用时,多采用极其粗糙的类比或浅显的嫁接,似乎并不愿意稍微下点功夫去学习一下。
这里整理一些比较重要的认知,供大家参考。
- 千亿级参数的大模型志着生成式人工智能(GenAI)向通用人工智能(AGI)迈出了重要一步,展现出更像人类一样的智力水平,在语言理解、图像理解、数学、代码、推理能力等方面已经超过人类平均水平,但整体而言,人工智能仍处于发展的初级阶段,有人认为图书馆应用大模型是“石器时代”,其实各行各业都差不多。
- 以GPT-o1、DeepSeek-r1以及Claude 3.7Sonnet为代表的推理大模型(及混合大模型)将人工智能的智力水平提升至新的高度,从此机器学会了像人类一样进行“慢”思考。Deep Search和Deep Research等技术的应用,正在逐步实现研究工作的部分自动化。智能体技术可望很快落地,将带来今年大模型应用的爆发态势。
- 大模型的应用形式早已不仅限于问答对话和搜索增强,还可通过各种API调用方式融入工作流程,完成更多复杂任务(如Manus),甚至开始驱动设备(如各类机器人),对物理世界产生影响。
- 作为一项系统工程,大模型应用的核心在于其作为“智能中枢”的角色。然而,要实现全面智能化,仅依赖大模型本身是远远不够的。系统还需具备以下关键要素:通过搜索引擎获取模型所不具备的领域知识、本地知识及动态更新的信息资源;配备记忆体和知识库,以记录用户的个性化经历、当前状态及所处环境等背景信息;具备良好的用户界面和感知系统,以实现有效的人机交互;具备调用外部工具和应用的能力,以扩展其功能范围。这些技术要素均可归入“智能体”技术的范畴。智能体技术作为大模型应用和未来人工智能能力展现的重要形式,正在成为人工智能领域发展的主要方向之一。
- 随着模型能力的提升,将逐步“蚕食”下游应用开发的必要性。当前搜索、知识库、本地文件、多模态、计算机使用、输出可视化等功能,可能会被逐渐集成到领域模型中,使得领域应用开发(智能体开发)更加简便,更多地关注需求而非技术本身。因此目前行业应用的开发应该着眼于随AI能力“水涨船高”型,大模型能力强大之后,应用的能力也随之更强大;而不要成为“刻舟求剑”型,AI能力强大之后你的开发就被完全替代、毫无必要了。
- 行业应用的成功与否,除了取决于大模型能力和应用开发水平(应用开发将逐渐向标准化的智能体框架普及)外,将更多依赖于数据质量、对领域业务需求的理解以及数据/业务飞轮的持续迭代三个方面,因此领域数据、人才和先行开发出原型系统进入迭代,哪怕是漏洞百出、被骂套壳,也总比一直纸上谈兵好。

留下评论