半年大模型,还在天上飞(2)
时间:2023-08-07 22:30 来源:网络整理 作者:墨客科技 点击:次
而立足 OTA 的携程问道,在携程董事局主席梁建章看来是一个旅游业的 " 可靠答案库 "。其产品成效如何还需时间检验,但自定位来看,同样有 " 舍本逐末 " 之嫌。 旅游在年轻用户眼中本就不存在标准答案," 特种兵式 "、" 打卡式 "、" 沉浸式 " 等多样化旅游形式的出现证明了这一点。如假设大量用户通过 AI 制定旅游路线规划,千篇一律的路线规划反而会影响社区交流与氛围,甚至遭致用户停留时间的下降。 大体看来,垂直模型在 C 端的落地尝试算不上顺利,甚至有成为 " 沉没成本 " 的可能。或许受到大模型本身 " 提高效率 " 神话的影响,产品定位也大多囿于 " 效率 " 二字,只是效率仅仅是用户体验中一个不算核心的维度。 相同的范式在 to B 领域也有所展现,而在追求效率的 B 端,行业大模型的商业模式与落地问题得到了更深刻的展现。 摸不清的黑匣子 "AI 不是物理,很少有理论上的重大技术突破,更多的是在模型结构、数据质量等维度做微调和小优化,甚至很多时候模型输出更好了,团队却找不到原因。" 在一位业内人士看来,大模型在业内外存在巨大的认知偏差,而原因则在于大模型训练以及 AI 行业对于外界而言是一个不折不扣的 " 黑匣子 ",很难审视大模型产生输出结果的推理过程,它看不见摸不着。 这导致外界在度过 ChatGPT 带来的狂热期后,一旦冷静下来,便会对大模型这个 " 黑匣子 " 持审慎态度。这将导致大模型在落地上的困境,而这一现象在如今向 to B 路线转变的过程中更为明显。 以如今已明确 to B 路线的大厂出品为例,包括腾讯云推出的 MaaS 技术方案、华为云推出的盘古大模型等,依靠自身云计算生态,均称其大模型服务支持多样化部署,包括云端部署、本地化快速部署等。在交互、操作、后续加入新的行业数据迭代优化等方面也有建树,可以说是为了落地,把大模型的门槛降到了极低。 但 " 审慎 " 带来的认知墙还是没有打破,即使 ChatGPT 的风吹了半年,许多企业没有动力也没有兴趣去研究如何导入大模型。 数年前的云计算行业可以看到因循的相似逻辑。云计算是在认识到数据价值后,以此为基础的服务和衍生,至于大模型于企业的价值,相对而言更是数据价值的跃升。同样是企业客户缺乏的技术能力,连云计算在国内企业的普及之路都距终点尚远,大模型自不必说。 行业大模型究竟好用与否,其实已经并不重要了,毕竟商品的使用价值最终还需使用者来挖掘。更有甚者,外界会粗暴通过某些测试、表现来衡量模型水平,例如 " 松鼠鳜鱼法 " 或近来因预测特大台风 " 杜苏芮 " 的登陆地点与强度有错误现象而遭受质疑的华为盘古气象大模型。 或许正因如此,于近期发布的京东灵犀大模型选择优先跑通自家业务场景,预计于明年初方对 " 外部严肃商业场景 " 开放。 更值一提的是," 行业成风 " 之下,商业化导向下的所谓行业模型在取代大模型原本的 " 通用 " 叙事的同时,也遭致不少人的 " 迷失 "。 所谓行业大模型的定义存在模糊不清。大模型(Foundation Model)的内涵不在于参数量多少而在于使用通用数据训练而涌现出的通用能力。如采用同样的模型架构,但在数据上使用单一领域数据,不仅丧失了通用能力,甚至会由于涌现的折扣导致领域问题也无法解决。 如在原大模型基础上使用行业数据做二次预训练,相当于微调了原模型,那么即产品本身仍处于模型层,可以被称作行业大模型;如通过 prompt 或外挂数据库的方式加入领域知识,那便仅是对原模型能力的激发,产品也应归属至模型之上的应用层,称之为行业大模型言过其实。 目前大厂中发力行业大模型的绝大多数均是前者,如腾讯、京东、华为等。后者则由于更轻的投入与快速提高模型能力的表现,更多会出现在开源社区中,例如前段时间引发热议的法律大模型 ChatLaw。 " 相比前者,后者在产品形态上更为成熟,便于快速构建模型能力,但后者在完成灌输领域知识的流程后,往往上限会更高 ",一位业内人士称。 开源威胁 近日,Meta 在开放商用许可下免费提供其最新开源大模型 Llama2,并将其引入微软的 Azure 平台,此举被誉为开源 LLM 的重要里程碑,甚至开始威胁闭源的头部厂商 OpenAI 的地位。 通过微软这个大模型金主,Meta 以更开放的姿态挑战 OpenAI。 (责任编辑:admin) |
- 上一篇:红石崖避暑音乐那达慕开幕
- 下一篇:新疆法规规章规范性文件数据库建设领导小组协