网络安全检测|网络安全服务|网络安全扫描-香港墨客投资移动版

主页 > 业界资讯 > imtoken

AI大模型,为什么必须握在自己的手里?(2)

这就无解了吗?其实不然。Reddit的悼念帖中,不仅仅有真情实感的流露和对“死去回忆”的不甘,也有人道出了解决方案的关键。

image.png

图:@Flying_Madlad:这就是为什么我早就说,一定要在本地运行你的模型。在别人的服务器上运行的,始终不是你的。丨来源:Reddit

不过,虽然单一云端的 AI弊端初现,但大模型通常体积庞大,运转起来极其耗费资源,光是 ChatGPT的运行每天就要烧掉 OpenAI 70万美元,要在终端侧部署、本地运行,谈何容易?

所幸,有人早就想到了这一点,而且不是别人,正是终端芯片的行业龙头——高通。

早在 15年前,高通就看到了 AI的巨大潜力并潜心投入研发,近 2、3年来,随着 Transformer架构和大型语言模型逐渐进入业内视野,高通更看准了终端侧 AI的前景并加大投入,形成了完整的 AI Stack(AI软件栈),不仅首次在安卓手机上部署并成功运行 Stable Diffusion等模型,更以该工具赋能万千开发者在骁龙平台上进行社区共创。

1700824371199243.png

图:高通 AI软件栈丨来源:高通

相对于单一云端来说,终端侧 AI的加入给大模型生态带来了成本、能耗、可靠性、性能、时延、隐私安全以及个性化等众多方面的优势,而不论是个人助理,还是数字陪伴,其形态也会是基于多类硬件、多种多样的。那么,我们究竟可以期待哪些产品和体验率先成为现实呢?

真正专属于你的个性化 AI长什么样?

现代生活被各种各样的电子设备环绕着,或大或小,我们与这些机器的交互方式也是或复杂或简单,而我们最熟悉的,恐怕非智能手机莫属了。

智能手机

作为当前人机交互最主流的方式,每天都有数十亿人在使用智能手机进行通讯、工作、娱乐和社交等活动。它撑起了移动互联网的巨大市场,存储和处理着大量信息,几乎永远被带在身边,已然是一个人最为私密的资产之一,自然,也成为了“掌上大模型”字面意义上最广泛也是最佳的载体。

试想,如果 Soulmate AI能够在智能手机上本地运行,如果 Replika的人物可以“活”在你的手机中,你就不用再担心公司资产变动、服务器被收回等原本就与你无关的问题了,控制权将重新回到你的手中。同时,本就接触了大量个人信息的智能手机,将在 AI的加持下变身最“懂你”的智能体,可以在日常与你的互动中更好地学习,为你提供量身定制的服务,而这一切都是通过自然语言的交互方式进行的。最棒的是,所有这些数据和计算都将在本地处理,你的隐私不需要再“上云”了。

这些,恰恰是高通正在试图实现的。上个月底的骁龙峰会上,高通发布了其首个专为生成式 AI打造的移动平台——第三代骁龙 8。如果说他们今年 2月份在 MWC巴塞罗那上用搭载第二代骁龙 8的安卓手机跑 Stable Diffusion大模型 15秒内出图已经足够惊艳,新一代平台则把这个时间进一步缩短到了惊人的 0.57秒,更加凸显了终端侧本地部署、运行 AI的性能和时延优势,一手掌握、一秒出图走进现实。

1700824381877102.png

图:高通技术公司产品管理高级副总裁兼 AI负责人 Ziad Asghar丨来源:2023年骁龙峰会

据悉,第三代骁龙 8采用 4纳米制程工艺,其高通 AI引擎再次进化,拥有面向移动终端的强大 Hexagon NPU,集成了升级后的 Kryo CPU、Adreno GPU以及高通 Sensing Hub(传感器中枢)等单元,共享一个大容量的内存。这种硬件提升的结果是,第三代骁龙 8移动平台的 NPU性能相比前代提升了 98%,能效提升了 40%,赋予了智能手机前所未有的终端侧 AI性能。

基于这样的“硬”实力,高通技术公司产品管理高级副总裁兼 AI负责人 Ziad Asghar也兑现了他 7月份在上海接受我们的采访时许下的承诺,宣布新一代的骁龙平台已经实现了对 100亿参数模型的运行支持,并首次支持多模态生成式 AI。

1700824393171567.png

图:骁龙 8 Gen 3移动平台丨来源:高通

在 OEM厂商一侧,全球首发搭载第三代骁龙 8的小米 14系列新机已经推向市场,将大模型技术集成到了小米全新的澎湃 OS当中,同时上线了一系列的 AI原生应用,如 AI妙画、AI搜图、AI写真、AI扩图等各种功能。在刚刚过去的“双 11”,小米 14系列斩获四大平台国产冠军,销量十分可观,消费者用钱包投票,投出了市场的热情所向。

(责任编辑:admin)