整体结论
语言大模型服从技术发展规律,为什么认为机会可能7月
大量公司开始正式投入,2023年1-2月: 一般选择GPT(decoder-only)路线,开源大模型选择LLAMA或者BLOOM;
【资料图】
第一批百模大战开始时间,4月:但这一批对话模型效果一般:普遍测试水平为GPT3左右,即,逻辑、情感、数学、归纳测试都无法通过,和小模型对话工具差异不大,让人没有付费意愿。
但是3.5后,生产力工具大发展,体验效果不同,付费意愿和定价出现!
指令微调时间:2个季度左右可以达到3.5水平。即1月开始,最早7月会有变化。
科大讯飞、金山办公、福昕软件、万兴科技、拓尔思、软通动力
视觉大模型,重点关注大模型对于具身智能的提升:
主要涉及robotics的感知、规划、控制、导航等上层部分。
具身AI不再像传统AI仅从图像、视频、文本等数据库中学习,而是基于自身传感器(多是视觉传感器)感知环境并通过与环境交互进行学习。
提升1、通过抽象的自然语言直接对机械智能控制。
提升2、Zero shot下的CV能力:图像分类、语义分割、目标检测、实例分割、物体追踪
提升3、更多跨模态的理解能力
虹软科技、萤石网络、大华股份
风险提示:技术尚处于早期阶段,下游落地慢于预期风险。数据保护政策强化影响应用数据互通风险。