安卓设备率先成功运行多模态大型模型,实现本地图像生成文本功能!
明敏 发自 凹非寺
多模态大模型,首次本地部署在安卓手机上了!

现在,对着手机AI助手,输入照片、语音,都能自如对话,所有功能完全在终端侧运行。
MWC 2024首日,高通就放大招,通通聚焦终端侧AI。
手机上能跑多模态大模型之外,全球首个在Windows PC上运行的音频推理多模态大模型演示,也来了。
它能理解音频并进行推理、可实现语音输入的多轮对话。

最后,高通还发布了面向开发者的AI Hub,让开发者可以更加方便在手机、PC上开发大模型应用,目前已支持超过75个大模型。
以及连WiFi系统都要被AI增强了,高通最新一代WiFi 7解决方案FastConnect 7900,同样面向混合AI时代而来,是全球首个使用了AI增强的WiFi系统。
高通这一套组合拳,只为证明一件事:终端侧AI趋势,现在已经到来。

高通这一次秀肌肉,核心展示了生成式AI在手机、PC端侧运行的新突破。
而且在官方资料中,多次强调了“所有功能完全在终端侧运行”——但尚未明确是否都是在不联网条件下实现的。
不过总而言之,终端侧能跑更多AI大模型,对于终端变革、用户价值变革,绝对都是大消息。
具体细节,来看官方放出的演示。
安卓机方面,高通将生成式AI的本地运行拉升到了多模态级别。
首个在Android智能手机上运行的大语言和视觉助理大模型(LLaVA),可接受包括文本和图像在内的多种类型的数据输入,并可基于输入内容进行多轮对话。
现在,用户可以拍一张照片向AI助手提问:
AI助手就能基于照片信息给出回答。所有功能都完全在终端运行,可以进行多轮对话、保障响应速度。

另外,高通还发布了可在安卓手机上运行LoRA的实例。
LoRA能在不改变底层模型的前提下,调节或定制模型的生成内容,通过使用大小仅为模型2%的适配器,即可个性化定制生成式AI模型。
比如Stable Diffusion就可以通过LoRA进行定制化调整。大语言模型也可以通过LoRA定制为个人助理、改进翻译能力等。

PC方面同样强调多模态能力的本地部署。
现在,在Windows PC上可以运行音频推理多模态大模型,能够实现由语音完成多轮对话。
搭载骁龙X Elite的Windows PC将可以理解鸟叫、音乐或者各种声音。比如它能听歌进行相似推荐。

与此同时,高通还“翻译”了一下什么叫真正意义上的AI PC。
骁龙X Elite的NPU运算能力高达45TOPS,两台设备同时运行集成Stable Diffusion插件的GIMP(一款广受欢迎的图像编辑器)进行AI图像生成。骁龙X Elite只需7.25秒就能生成一张图像,速度是X86竞品(22.26秒)的3倍。
开发者方面,高通推出全新AI Hub。
它支持超过75个模型,传统AI模型和生成式AI模型都有。比如ControlNet、Stable Diffusion、Baichuan-7B等,可在骁龙和高通平台上部署。
开发者选择好所需模型、所用框架,确定目标平台(比如特定型号手机或芯片)。高通AI Hub就可以为开发者提供面向指定应用、指定平台进行优化的模型。只需几行代码即可获取模型,并将模型集成进应用程序。
高通表示对AI Hub支持的每个模型都进行了优化,基于高通的AI引擎可以达到4倍推理加速,同时占用内存带宽和存储空间也将减少。
这些优化模型可在高通AI Hub、Hugging Face和GitHub上获取。

为什么要用AI增强WiFi?
因为高通认为,AI的未来是混合AI,也就是需要跨云端、终端和边缘云。
因此也给连接提出更高要求。
在MWC 2024上,高通带来全新一代WiFi 7解决方案:高通FastConnect 7900系统。

这也是全球首个AI增强的WiFi系统,集成了近距离感知功能。
此外,这也是高通首次在6nm芯片上集成了蓝牙、WiFi和超带宽,达到“以一顶三”的效果。
相较于上一代,7900采用了全新的射频前端模组和架构,在降低40%系统功耗的同时提高能效;该系统还助力减少25%占板面积,从而留出更大的电池空间以提升续航能力。
而在今年MWC上,高通不仅发布一系列终端AI技术,一系列搭载骁龙8 Gen 3的旗舰机也纷纷亮相,比如荣耀Magic6 Pro、OPPO X7 Ultra、小米14 Pro等。
它们带来了AI扩图(小米)、AI创建日程(荣耀)、AI图像消除(OPPO)等功能。
AI手机元年与否或许还有争议,但终端侧的AI落地,正在在高通的底层驱动下,走向Everywhere、Everyone……
参考链接:
https://www.qualcomm.com/news/media-center/press-kits/mwc-barcelona-2024
— 完 —
量子位 QbitAI · 头条号签约
关注我们,第一时间获知前沿科技动态
相关资讯
-
车祸模拟器如何改中文 车祸模拟器中文破解版
在现代社会中车祸模拟器成为了一种备受关注的游戏类型,许多玩家对于这类游戏充满了好奇与热情,对于一些玩家来说,他们可能更希望能够体验到车祸模拟器的中文版本,以便更好地理解游戏内容...
-
DNF:鬼剑士模型全新改版!13套时装新旧对比,暖暖党惨败
助手小师妹已经官宣了,男鬼剑模型重做将在国服1.11版本上线,模型重做对角色伤害几乎没有影响,不过对玩家本身的伤害对比较大,尤其是一些暖暖党玩家,这次改版后很多时装风格都变了。13...
-
谷歌Gemini AI模型即将登陆Pixel8Pro 革新Android体验
站长之家(ChinaZ.com) 12月8日 消息:据报道,谷歌宣布Gemini AI模型即将首次亮相Pixel8Pro,并计划逐步覆盖整个Android生态系统。Gemini N...
-
iOS 18推出15个实用AI新功能,升级了吗?
【CNMO科技】苹果终于在WWDC 2024上公布了其对AI的想法。新的人工智能被称为Apple Intelligence,建立在多个大型语言和扩散模型之上。一直以来,苹果都在强调...
-
烟花燃放模拟器如何完成任务 烟花模拟器怎么操作
烟花燃放模拟器是一款非常有趣的模拟游戏,玩家可以在其中体验燃放各种不同类型的烟花,想要完成任务,玩家需要先选择好烟花的种类和数量,然后在指定的时间内将它们成功燃放出来。操作起来...
-
原神刷本是什么意思啊 原神副本奖励
原神刷本是指在游戏中进行副本挑战,以获取各种丰厚的奖励,在原神中,副本是一种特殊的游戏模式,玩家可以通过完成任务、击败敌人或探索地图等方式,进入不同的副本挑战。挑战副本不仅可以...
-
欧洲卡车模拟3如何购买车辆 欧洲卡车3模拟买车库怎么操作
欧洲卡车模拟3是一款非常受欢迎的模拟驾驶游戏,许多玩家都希望能够购买自己的卡车来体验更真实的驾驶乐趣,在游戏中玩家可以通过前往车库购买自己喜欢的卡车。购买车辆的操作也非常简单,...
-
墨剑江湖怎么钓鱼 燕云十六声怎么找到钓鱼地点
在江湖中,钓鱼可谓是一项乐趣无穷的活动,无论是墨剑江湖还是燕云十六州,都有许多绝佳的钓鱼地点等待着者的到来。想要在墨剑江湖钓到心仪的鱼儿,最重要的是要选择合适的钓点。而在燕云十...
-
三国人生如何比武 三国人生模拟比武玩法
在三国乱世中,比武是一种展现实力和智慧的方式,无论是在战场上还是在政治上,比武都是一种必不可少的手段。三国人生模拟比武玩法,让我们可以在游戏中体验到三国时代的刺激与挑战。通过比...
-
黑暗料理王怎么分解装备 暗黑破坏神不朽装备分解技巧
在暗黑破坏神游戏中,不朽装备是玩家们追逐的终极目标之一,拥有不朽装备并不意味着就能在战斗中无敌,正确的装备分解技巧同样至关重要。黑暗料理王给出了一些关于如何分解不朽装备的建议,...