网络安全检测|网络安全服务|网络安全扫描-香港墨客投资移动版

主页 > 业界资讯 > ddos防御

半年大模型,还在天上飞(3)

实际上," 开源派 " 早在此前便以第三方的身份悄然崛起。" 我们没有护城河,OpenAI 也没有。" 这句话出自 5 月谷歌意外泄露的一份内部文件。其内容大意是表面上, OpenAI 和谷歌在大模型上你追我赶,但真正的赢家未必会从这两家中产生,下此判断的原因便在于愈加丰富的开源生态。

开源生态愈发活跃,乃至于出现了模型能力的代表 Llama2 以及 Finetune(模型微调)范式的代表技术 LORA,这一切都让闭源争取 " 大力出奇迹 " 的巨头厂商感受到明显寒意。

开源的技术分享以及人才流转等因素,也在让大模型的黑匣子愈发 " 玻璃化 ",缺少壁垒的必然结果是大厂在巨量资金、时间的投入下的 Konw How 轻易为开源社区所倾覆。

国内头部大厂对此的应对大多是 " 两手抓 "。左手 " 关门造车 ",以小规模内测形式不断打磨产品形态与能力,右手 " 集思广益 ",以云端开发者生态为基础打造生态内的开源社区,但这刚需厂商自算力层、模型层到应用层的全栈布局。阿里云推出了大模型开源社区魔搭 GPT,华为云、百度云、腾讯云也都有所布局。

总体来看,无论是行业还是通用,to C 还是 to B,大模型的半年考给予我们的直接感觉是:落地困难,盈利预期不断后移;风险渐强,难言技术壁垒。那么,当下的破局之路在哪?

目前而言,有两个有意思的方向。其一是被誉为 " AI 时代的 Memory" 的向量数据库,其二是模型智能赋予下的智能硬件。

所谓向量,即是可以代表任何东西的多维数据,包括如今 LLM 训练最为重视的文本,以及图像、视频、音声等。这些形式的内容会在数据库中清晰表示,并且支持语义检索,即通过相似性检索,例如男人与男孩。换句话说,于大模型而言,向量检索就是大模型的 SEO。

如上文所述,领域知识可以通过向量数据库能力,或是精调或是外挂来提高行业模型的建构和使用,于大厂而言自然是下一阶段的发力点所在。自 5 月起,资本便不断涌入向量数据相关赛道,作为前景更为确定的应用层产品,向量数据也收获了一众 VC 的密切关注。

至于智能硬件内置模型,则是相对曾经的 "siri"、" 小爱 " 等智能助手的能力跃升,也是对真正的智能设备(手机、电脑)的外延拓展。开源社区内早有将大参数模型内置 MAC 的尝试,而大厂则是在过去的移动互联网时代便积累了一定硬件生产能力,相对而言其先发优势更为明显。

少了 PR 式的春秋笔法,落地成为核心需求的大模型不再神秘,故事也越来越少,开始 " 深潜 " 的赛道玩家们仍在发力。行业需要下一个 "ChatGPT" 时刻,我们方能见到潜水者浮出水面,正面对抗。

(责任编辑:admin)