你的位置:幸运快3大小单双计划在线 > 新闻动态 > 大模型:AI Agent与端侧新入口共筑AI应用未来
全球 AI Agent市场正以高速增长的趋势重塑各行业的运营模式和客户交互体验。AI Agent通过记忆能力、规划能力、行动能力和工具能力,与人 类用 户、外界环境、其他Agents及系统开发者实现高效协作。LLM作为AI Agent的核心能力构建基础,结合规划、记忆、工具和行动四大能力模块 ,实 现了 对复杂任务理解、分解与执行。
幻影视界今天分享的是计算机行业深度研究报告:《AI Agent与端侧新入口共筑AI应用未来》。
研究报告内容摘要如下
1. AI Agent逐步发力,构筑大模型应用未来
全球AI Agent市场正以高速增长的趋势重塑各行业的运营模式和客户交互体验。根据Grand View Reasearch数据,全球AI智能体市场在2023年的规模已达到38.6亿美元,并预计从2024年到2030年将以CAGR 45.1%快速增长,2030年市场规模有望突破503亿美元;推动这一增长的核心驱动力包括自动化需求的增加、自然语言处理(NLP)等技术的进步,以及消费者对个性化体验和实时服务的期望不断提升。AI Agent通过分析客户行为、优化产品推荐和提高客户参与度,广泛应用于电商、医疗和安全等多个领域,显著提升了企业在营销、销售和客户服务方面的效率,同时降低了运营成本,为企业创造了更大的商业价值。
展开剩余82%AI Agent(智能体)通过记忆能力、规划能力、行动能力和工具能力,与人类用户、外界环境、其他Agents及系统开发者实现高效协作。分工上,人类用户通过接口与Agent交互,作为监督者、合作者和决策者;外界环境为Agent提供感知和反馈交互空间;多个Ag ent之间通过协作整合任务结果,形成群体智能;系统开发者则负责设计开发Agent的相关能力模块,确保其功能可靠和高效运行。
LLM作为AI Agent的核心能力构建基础,结合规划、记忆、工具和行动四大能力模块,实现了对复杂任务理解、分解与执行。LLM不仅提升了AI Agent的理解能力和泛化能力,还显著增强了其在多任务处理和上下文信息解析方面的效率。我们认为,结合规划、记忆、工具和行动四大能力模块,AI Agent能够更好地支持复杂任务执行和多样化场景需求,提供高效且连贯的交互体验。
在此基础上,Agent专有的编排层在AI生态系统中发挥着核心作用,通过整合大模型(如OpenAI和Anthropic等)与云服务(如AWS、Google Cloud、Azure),实现任务的动态分配与高效协作。它不仅作为连接基础设施与应用程序的桥梁,还为上层应用提供智能化支持,极大地提升了AI系统的灵活性和创新能力。我们认为,Agent编排层是驱动AI生态高效运行的关键环节。
人工智能著名学者、斯坦福大学教授吴恩达认为,智能体AI Agent领域有4种模式,包括反思、工具使用、规划和多智能体协作。使用AI agent,AI能做的事情会大幅扩展。Reflection(反思):让LLM审视并修正自己生成的输出。Tool Use(工具使用):LLM使用网络搜索、代码执行等工具来帮助它收集信息、采取行动或处理数据。Planning(规划):LLM分解复杂任务,制定并执行多步骤计划来实现目标。Multi-agent Collaboration(多智能体协作):多个AI Agent协同工作,通过分解任务、讨论和辩论来提出比单个智能更好的解决方案。
2.从Claude3.5到GLM,Agent 在 C 端硬件落地正进入临界点
Claude3.5推出最新Sonnet模型新增Computer use功能,可以类似人一样使用电脑,输入语言指令后模型感知界面互动,自然语言控制硬件更进一步。同时智谱推出AutoGLM,实现了在安卓系统手机和Web端的自然语言交互功能;硬件厂商中,我们看到苹果带头推出Apple Intelligence,华为也相应推出了Harmoney Intelligence。
3.端侧AI成为海内外大模型重要方向与大厂必争之地
作为争夺下一代流量入口的关键机遇,端侧AI已然成为各大厂商必争之地。虽然短期内还存在各种困难,包括电池续航和散热问题>显存带宽>GPU算力和显存容量,成为一系列亟待解决的难点。尽管如此,终端生态多方的信心并没有受到影响,各行业正在使尽浑身解数共同促进端侧AI的实现。IDC最新预测估计,2024年生成式AI手机的出货量将同比增长364%,达到2.342亿部。到2028年,全球生成式AI智能手机的出货量将达到9.12亿部,按照这个预测,202 3年- 2028年生成式AI的智能手机的CAGR高达78.4%。从2022年ChatGPT引发的生成式AI迅速崛起以来,谷歌、三星等各大厂商,都在尝试将AI大模型内置于手机,完成AI在手机终端的部署。
4. AI Agent成为端侧应用重要支柱
端侧模型有一个不可能三角:性能、参数量和内存及功耗占用。性能优异需要大参数量;而参数量大就意味着内存占用大,功耗也会大;功耗过大又可能会影响性能。AGI是一个长期演进的过程,Agent有望成为当务之急的“解决问题”,这一特性在端侧尤为重要。通过主动工作流的配置辅以性能不错的模型解决问题,而主动工作流的配置离不开Agent技术的应用。
根据腾讯研究院公众号的内容指出,从电池容量的角度来看,通过工作流优化任务的实现是刚需。目前,由于手机和PC的保有量占据绝对优势,它们理所当然地成为了端侧AI的最佳落地方向,但在落地过程中,由于面临的芯片和电池的挑战,为了实现大模型的终端落地,需要进行大量的适配工作。微软作为端侧模型的有力竞争者Phi-3/3.5的开发者,除了模型本身,还提供了一套名为Agents的工具。通过Microsoft Copilot Studio的升级,Copilot+PC不仅可以调用Wind ow s附带的40多个端侧AI模型提供支持,还可以构建成百上千的自动化业务流程,在客户需求下独立工作,从而实现长期运行的业务流程自动化。未来,移动端和PC端体验到的端侧AI,大部分将是通过适配器和分类器挑选的微调小模型,以及针对特殊需求开发的自定义Agents,而无需调用全量的模型参数,是更具性价比的方案。
另一方面,从生态搭建的维度,需要Agent调用多方资源以实现繁荣。无论是端侧还是云端AI,大模型都只是底层计算;要实现用户价值,还需要一个繁荣的应用生态和强大的工具集来提供支持。不论是现有的APP形态,还是未来可能实现的“去皮化”的API形态,除了底层计算,还需要通过Agent来实现价值的连接。在6月的Apple Intelligence发布会上,苹果表示,Siri的全新形态将改变交互规则,大量AI新功能将很快上线;此外,屏幕读取以及App内与App之间的操作等能力预计明年到位,这将使AI真正串联起苹果生态下的诸多应用。苹果提前承诺的这项能力,源自其在4月份发布的一项名为“Fe rret-UI” 的新技术。Ferret-UI能够“看懂”手机屏幕,建立对UI元素的基本理解,奠定了执行复杂任务的基础,并通过分层次的任务设计,最终实现对用户指令的理解和响应。这本质上是一种通过视觉方式来构建主动工作流Agent的思路。底层模型本身并不能直接创造价值,苹果需要维持其最强的盈利因素:生态位。
长期来看,专业化端侧与全能云端协同或是端侧AI的最优解。云端模型比端侧模型先进一个数量级。虽然许多小模型在特定能力上已经具备了媲美十倍甚至百倍参数大模型的实力,但事实上,当前基础模型的综合能力依然基本遵循Scaling Law法则。千亿、万亿参数的大模型以及实验版本模型,作为探索AGI的最前沿模型,其整体智力水平无疑会持续领先。云端大模型始终比端侧大模型先进一个以上的数量级。例如,8月份谷歌发布的轻量级小模型Gemma 2 2B,是从6月份发布的Gemma 27B和9B Gemma 2模型中蒸馏而来的;微软开发的AI小语言模型(SLMs)Phi-3系列有多个版本,包括mini(3.8B)、sma ll(7B)和medium(14B)。根据微软公布的不同表现水平,在同一时间段内,参数规模仍然是决定大模型综合能力的关键因素。苹果的Apple Intelligence通过一个对标GPT-4的云端模型Apple Server来处理复杂任务,这不仅是因为终端设备受限于芯片、电池和发热等因素的选择,更是为端侧提供“无所不知、无所不能”的云端支持保留了重要的接 口 。
发布于:广东省Powered by 幸运快3大小单双计划在线 @2013-2022 RSS地图 HTML地图