大语言模型火爆的今天,我们为什么还要拥抱世界模型?

图灵奖得主杨立昆认为,目前AI界持续追捧的大语言模型并非十全十美,它隐藏着四个难以突破的致命弱点:一是理解物理世界,二是拥有持久记忆,三是具备推理能力,四是复杂规划能力。 而能够克服第一个“致命弱点”的技术,叫作世界模型。 这听起来或许很抽象,但你一定知道谷歌的3D游戏、特斯拉的自动驾驶。 世界模型意味着机器能够像人一样辨别物理空间、理解物理规律、根据经验做出推理决策。 与大语言模型不同的是,世界模型不再遵循从海量文本语料生成概率的逻辑,而是在深度分析大规模现实世界视频后推测因果。 就像人类世界的婴儿一样,在交互学习中构建对这个世界的认知。 想象一个刚出生的婴儿,她的眼睛尚未完全聚焦,却能通过触摸、温度、声音的碎片拼凑出世界的轮廓。人类大脑用数百万年进化出这种能力——将感官信息转化为对物理规律的理解。 而这恰是今天人工智能所欠缺的,世界模型正在努力发展的——从数据中重构对重力、时间等知识的理解。 世界模型的概念最早可追溯至1980s到1990s的认知科学和控制理论,那时的研究者受心理学影响,提出AI系统需要构建对环境的内部模拟,从而进行预测和决策,即AI的环境建模能力。 这里有一个重要的要素:环境。 从生物学上来讲,不论是微生物、动物还是人,行为都遵循着一个最基本的规则:刺激-反应模式,即生物反应是对环境刺激的直接响应。 随着生物千亿年漫长的进化,动物发展出感觉和心理,通过视觉、听觉、嗅觉等感官感知外界,产生出兴奋、恐惧等简单情绪;人类进一步发展出自我意识,而人类意识和动物感觉最大的区别是能否自主规划、有目的地进行决策和行动。 拿生物进化过程和AI的发展历程相比,我们不难发现,其实AI的终极形态AGI就是要发展出自主感知现实、自我规划、有目的决策的能力。 世界模型的雏形就萌芽于心理学家对人类和动物认知理解世界并做出决策的观察。这个理论叫作心智模型,1990年由David Rumelhart提出,强调智能体需对环境形成抽象表征。 以我们自身举例,人类大脑对周围世界有一种习得的内在认知框架,根据经验做决策,如看到乌云就联想到下雨。再比如,我们不会记住每片树叶的形状,却能瞬间判断树枝能否承受体重。同理,世界模型就是让机器构建起对周围环境和世界的理解和预测能力,比如看到火就联想到烫伤。这种抽象能力,正是这一时期学者希望机器具有的禀赋。 但是,这阶段的世界模型研究停留在理论构想阶段,虽有了较为清晰的定义和目标,仍没有具体的技术路径。 世界模型研究开始落地是2000s到2010s的计算建模阶段,随着强化学习和深度学习的深入发展,学者开始尝试用神经网络构建可训练的世界模型。 强化学习通过奖惩机制让其在与环境交互过程中不断习得策略,类似于“训狗”,深度学习通过分层特征提取让其从海量数据中自动学习规律,类似于“炼金”。 2018年,DeepMind 《World Models》(Ha & Schmidhuber)论文首次用“VAE+RNN+控制器”的三段式架构,构建可预测环境的神经网络模型,成为现代世界模型的里程碑。 这一过程类似于“造梦”——先通过自动编码器VAE将现实场景压缩成数据,再利用RNN循环神经网络推演未来可能的情节,最后用精简的控制器指导行动。这意味着世界模型首次具备了颅内推演的能力,像人类一样在行动前预判后果,大大降低了试错成本。 2022年后,世界模型进入大模型时代,借助Transformer的序列建模能力和多模态学习技术,应用范围从单一模态扩展到跨模态仿真,世界模型的推演也从2D走向3D(如OpenAI的GATO、DeepMind的Genie)。 近期研究如Meta的VC-1、Google的PaLM-E进一步将世界模型的概念带入公众视野,将世界模型与大语言模型结合以实现更通用的环境推理成为一种技术发展路径。 Google的PaLM-E(5620亿参数)模型成功将语言模型与视觉、传感器数据等物理世界信息结合,机器人能够理解复杂指令(如“捡起掉落的锤子”)并适应新环境执行任务。Meta Llama系列的开源多模态框架(如MultiPLY)进一步促进了对物理环境的3D感知研究。 由上,从概念推演到落地实践,世界模型在发展中逐步摸索,渐渐走出一条从混沌到清明的路。 Transformer架构的进化、多模态数据的爆发,让世界模型走出训练场,走进游戏场,再走向真实世界——谷歌、腾讯通过其生成逼真的游戏场景,特斯拉用神经网络预测车辆轨迹,DeepMind通过建模预测全球天气。 就这样,在实验室中蹒跚学步的世界模型开始了他对现实物理规律的探索之路。 就像人类幼年通过游戏感受规则完成社会化一样,世界模型的第一关也是游戏。 初期的模型应用仰赖规则明确的虚拟环境和边界清晰的离散空间,如Atari游戏(DQN)、星际争霸(AlphaStar),采用表格型模型(如Dyna),后期结合CNN/RNN处理图像输入。 进化至3D版后,谷歌DeepMind的Genie 2可通过单张图片生成可交互的无限3D世界,时长达1min,用户可自由探索动态环境(如地形变化、物体互动)。由腾讯、港科大、中国科大联合推出的GameGen-O模型可一键生成西部牛仔、魔法师、驯兽师等游戏角色,还能以更高保真度、更复杂的物理效果生成海啸、龙卷风、激光等各种场景。 经过大量训练后,世界模型由游戏过渡到工业场景。 游戏引擎的核心能力在于构建高保真、可交互的3D虚拟环境。这种能力被直接迁移到工业场景中,用于模拟工业场景中各种可能出现故障的复杂场景。 机器人公司波士顿动力在虚拟环境中预演机器人动作(如摔倒恢复),再迁移到实体机器;特斯拉2023年提出的世界模型直接整合了游戏引擎的仿真技术,利用合成数据训练自动驾驶系统,减少对真实路测数据的依赖;蔚来的智能世界模型能够在极短时间内推演数百种可能情境并做好预案和决策。 最近,世界模型还走进了基础研究领域。 DeepMind的GraphCast靠世界模型处理百万级网格气象变量,预测天气能力比传统数值模拟快1000倍,能耗降低1000倍。它通过图神经网络架构,能够直接从历史再分析数据中学习天气系统的复杂动力学,精准、高效预测全球天气。 从游戏般的虚拟场景到自动驾驶等现实场景,世界模型的本质是通过大量多模态资料理解物理世界的规律。未来,“世界模型+大语言模型”可能成为AGI的核心架构,让AI不仅能聊天,还能真正理解并做出决策改变现实世界。 不过,我们为何需要世界模型?在大语言模型火爆全球的今天,是什么让其显得不可替代呢? 让AI真正从模仿表征到感知本质,克服其各种恐怖谷效应的关键是:让它真正理解这个世界,了解现实空间和物理规律,进而理解它为什么会做这件事,而不是机械地根据海量数据的关联概率推测下一个token是什么。 这是基于大规模文本语料的大语言模型和不断试错优化寻找最优路径的强化学习做不到的,只有世界模型能做到。 传统AI是数据驱动型的被动反应系统,而世界模型通过构建内部虚拟环境理解了物理、碰撞等现实规律,能够像人类一样通过想象预演行动后果,并在游戏、机器人等领域共享底层推理算力。 首先是通过底层建模和多模态整合构建出跟人类一样的心智模型。外部,世界模型不仅模拟物理规律,还试图理解社会规则和生物行为,从而在复杂场景中趋利避害。内部,世界模型根据感知、预测、规划和学习的协同,形成类似人类心智的时空认知能力。 其次是因果预测和反事实推理能力。世界模型能够基于当前状态和行动,预测未来的演变结果。其具备类似人类的常识库,能填补缺失信息并进行反事实推理(what if),即使未直接观察某事件,也能推断“如果采取不同行动会如何”。这种能力使其在数据稀缺时仍能有效决策,减少对海量标注数据的依赖,在自动驾驶领域应用较多。 最后,世界模型通过自监督学习构建对世界的通用表征,获得了跨任务、跨场景的泛化能力,而传统模型通常需针对特定领域的具体任务微调。 但是,这些能力,为什么火极一时的大语言模型做不到呢? 要弄清为什么世界模型的预测能力和大语言模型的推测token能力不一样,我们需要弄清一个概念:相关性≠因果性。前者是概率关联、后者是因果推理。 大语言模型(如GPT系列)侧重于大数据驱动的自回归学习,通过海量文本数据训练模型以生成文本,本质是预测概率,而世界模型学派认为自回归的Transformer无法通往AGI。AI需要具备真正的常识性理解能力,这些能力只能通过深度分析大量照片、音视频等多模态数据对世界的内在表征来获得。 模型结构层面,大语言模型主要依赖Transformer架构,通过自注意力机制处理文本序列。世界模型则包含多个模块,如配置器、感知、世界模型、角色等,能够估计世界状态、预测变化、寻找最优方案。 通俗地讲,大语言模型训练出的文本天才是纸上谈兵的文将,对常识可能一窍不通。而世界模型更像在建模环境里身经百战的武将,可以凭直觉和经验预判对手如何出招。 世界模型虽前景可期,目前依然面临着一些瓶颈。 算力上,训练世界模型所需要的计算资源远超大语言模型,且存在“幻觉”(错误预测)问题;泛化能力上,如何平衡模型复杂度与跨场景适应性仍需突破;训练集上,多模态的数据规模更少,且需深度标注,质量把关是重中之重。 如果说类似GPT一样的大语言模型已经到了能言善辩的青春期,世界模型实则还处于牙牙学语的幼年期。 总的来讲,世界模型是深度学习之外的另一条探索道路。如果未来深度学习陷入发展瓶颈,世界模型可能是一种备选方案。但现阶段,世界模型仍在探索期,我们仍要将主心骨放在大语言模型和深度学习这条技术线上。 多点发力,协同并进,才能让AI的成长有更多道路可走。...
阅读更多

AI时代,所有行业都值得再做一遍

AI似乎为我们展现了一幅光怪陆离的画卷,在这幅画卷之下,人们看待所有行业的方式都不再是互联网式的。  正是因为人们跳出了互联网的牵绊,因此,在很多看上去业已尘埃落定的行业,开始有了新的起色,开始有了新的可能性。  正是由于这样一种可能性,我们完全有理由相信,在AI时代,几乎所有的行业都值得我们再做一遍。  或许是看到了AI时代带来的无限可能性,因此,我们才看到了阿里巴巴对于AI的大手笔投入,我们才看到了腾讯在腾讯元宝推广上的没有上限。  不出意外的话,随着越来越多的玩家们杀入到AI赛道,特别是当他们开始以AI为主要竞争焦点,一场全新的战局将会拉开序幕。  如同互联网时代深度改造了与我们生活相关的诸多领域和场景一样,在AI时代,同样的场景或许将会出现。  AI之所以会有如此巨大的魔力,AI之所以被如此多的玩家们推崇,并不仅仅只是因为它是一个新生的概念,而是因为它提供了一种全新的解决方案,按照这样一种解决方案,我们可以找到新的红利,我们可以获得新的发展,我们可以将几乎所有的行业重新做一遍。  本文试图通过AI之于行业的内在改造逻辑来探究AI视角下所有行业都值得再做一遍的深层次原因。  AI提供了一种提升效率的可能性  互联网时代,之所以会有如此多的玩家投身其中,之所以会有如此多的行业会与互联网产生联系,其中一个很重要都原因在于,借助互联网式的去中间化,借助“互联网+”模式,各个行业都能够获得效率上的提升。  电商如此,金融如此,其他类型的“互联网+”模式,同样如此。  然而,当互联网在去中间化的效率上开始展现出越来越多的痛点和难题,特别是随着玩家们边界的拓展,以及随着流量的见顶,以互联网为代表的效率提升方式开始遭遇到了越来越多的问题和挑战。  可以说,仅仅只是借助互联网的方式,仅仅只是借助去中间化的方式,开始越来越无法带来效率的提升,亦或是在提升效率上所耗费的成本越来越高。  拿电商为例,站在面对海量的产品,用户的主要痛点早已不再是买不到货的问题,而是在如此多的供应商里如何找到适合自己的商品的问题。  在这样一个大背景下,找到互联网的替代品,以更好地,更低成本地实现效率的提升,成为了一种必然。  正是在这个时候,我们才看到了AI的横空出世,我们才看到了越来越多的玩家开始将关注的焦点聚焦在了AI上。  通过AI技术,原本看似无法再度提升的效率有了新的可能性,原本看似无法再度缩短的中间化,有了再度缩短的可能性。  正是因为如此,我们才有理由相信AI可以为我们提供一种全新的效率提升解决方案,并且由此孪生出新的商业模式,释放新的发展红利。  AI提供了实现商业进化的可能性  当互联网时代的发展开始进入到一个全新的阶段,特别是当互联网玩家们开始感受到越来越多的发展瓶颈,它们便开始探索新的发展模式,它们便开始探索新的商业模式。  在这个过程中,我们看到了新零售的出现,我们看到了工业互联网的萌芽,我们看到了诸多新概念的出现。  那么,缘何这些新概念并未真正得以持续发展呢?缘何这些新概念昙花一现呢?  深入分析,不难看出,这些新概念、新提法,并未真正衍生出新的商业,并未真正实现互联网式的商业模式的颠覆,才是导致它们昙花一现的关键所在。  当AI时代来临,特别是当AI开始催生出新的商业进化,实现了互联网式的商业模式的迭代和创新,我们便看到了与以往的发展模式完全不同的发展模式。  以AI为新的视角,玩家们的商业模式不再是以平台和中心为主导的,不再是以边界的拓展和规模的增长为驱动力的,不再是由外而内的。  如果我们对于这样一种发展状态进行总结和定义的话,商业上有了新的进化,有了新的创新,不再仅仅只是困囿于传统意义上的商业模式,不再困囿于互联网意义上的商业模式,或许才是AI之所以为人们打开新的发展思路的关键。  毫不夸张地说,AI的成熟与落地,让人们看到了衍生出新的商业的可能性。  如果对于AI所衍生出来的这样一种新商业进行总结和定义的话,不再以虚拟经济和实体经济为界,不再是平台和用户为界,而是真正达成了共生、共存,彼此协同,最终蜕变出来了一种全新的商业状态,无疑是再合适不过的了。  随着AI的逐渐落地,特别是随着AI对于B端和C端的改造开始变得深入而全面,所有行业的构成元素、运行逻辑都将发生一次深刻而全面地改变。  在这样一种改变的大背景下,新的商业将会萌生,我们看到的零售、金融、制造、教育等诸多行业都将发生一次彻底而深入的改变。  正是得益于此,我们才有理由相信在AI时代,几乎所有的行业都值得重新再做一遍。  AI提供了行业重构的新机会  所有的行业都值得重新再做一遍,需要一个先决条件,即,在看似业已确定的市场格局之下,蕴藏着新的机会。  当新的机会开始出现,几乎所有的玩家们并不是以它们在互联网时代的市场地位和规模来衡量的,而是站在了同一个起跑线上。  如果对于这一现象进行总结和定义的话,行业的重构,无疑是再合适不过的了。  那么,现在正在开启的这样一种行业的重构,究竟是如何引起的呢?  笔者认为,AI的逐步成熟和完备,特别是AI在商业上的逐渐展开,行业的元素、行业的运行逻辑、行业的格局都开始一场深刻而全面的改变。  可以说,当人们开始用AI来改造自身,当人们开始用AI来重塑以往的行业运行逻辑的时候,新的机会,便开始打开。  这一点,我们可以从deepseek的横空出世之后,以及由此所带来的对于原本市场格局的打破上,看出一丝端倪。  我们都知道,当deepseek开始出现,原本各个玩家研发自身的大模型,甚至将大模型看出是打造自身护城河和生态体系的发展模式开始被打破,越来越多的玩家们开始通过主动接入deepseek来占得发展的先机。  在这样一个过程当中,我们看到了百度、腾讯等诸多玩家们开始主动接入到deepseek,可以说,这个时候,玩家们站在了同一个起跑线上。  以此为开端,传统行业不仅将会面临一次重构的机会,而且互联网行业同样将会面临一次重构的机会。  可以想象,当AI开始大规模地落地,现在业已形成的行业格局将会被打破,随着「AI+」的逐渐丰富和完善,那些真正将不同的行业、场景接入到AI的玩家,并且实现了这样一种AI生态的打造的玩家,才能在新的发展过程当中,占得先机。  最后的话  当AI开始成熟,特别是当AI开始对传统行业和互联网行业开启一场深度而全面地改造,我们看到的是,一场全新浪潮的来临。  可以说,在AI时代,几乎所有的行业都值得我们再做一遍。  这一点,我们业已从AI新生代玩家们的强势崛起上,看出一丝端倪;这一点,我们业已从互联网玩家们对于AI的全面拥抱上,看出一丝端倪。  当AI所开启的这样一场新浪潮汹涌而来,一幅更加生动而鲜活的商业新场景开始出现。  在这样一个新场景下,新的商业将会衍生,新的玩家将会崛起,新的生活方式,同样将会出现。...
阅读更多

北电数智主办酒仙桥论坛,探索AI产业发展新路径

为全面推动数字技术与实体经济深度融合,有关部门围绕数字中国建设与人工智能工业革命协同发展,密集出台相关政策,通过顶层设计、技术攻关、数据支撑、场景落地及生态协同等系统性举措,加快形成新质生产力,助力产业智能化转型。工信部等部门发布《制造业企业数字化转型实施指南》,以“人工智能+研发设计”为核心推动制造业全流程升级,并推出专项方案聚焦智能工厂、跨境数据流动等关键领域。技术层面,政策鼓励开源大模型(如DeepSeek)研发及国产AI芯片突破,加速800G高速光模块布局,夯实算力底座;数据要素方面,推动行业数据集开放共享与安全治理,预计“十四五”期间市场规模年增速超25%。应用场景上,AI深度嵌入工业设计、数字孪生等环节,多家企业推出行业智能解决方案,无人驾驶、具身智能等前沿领域加速商业化。生态协同方面,政策引导产学研合作与国际竞争力培育,支持AI企业出海、跨学科人才培养及垂类创新投资。可以说,建设数字中国与AI工业革命正在深度交融,“万物皆数、万物皆智”的新时代正加速到来。 当然,这场变革的广度和深度也引发深思:AI爆发式发展,会引发怎样的生产力与生产关系重构?AI应用不断深入,将在哪些产业领域催生范式创新?AI加速渗透,在社会、经济发展层面会引发何种蝴蝶效应?带着这些疑问,首届酒仙桥论坛将于4月15日至20日在北京数字经济算力中心召开。 2025酒仙桥论坛以“开启AI生产力元年”为主题,将在6天内覆盖11场论坛,这是一场不跑步、只“烧脑”的“AI马拉松”。酒仙桥论坛的主办方北电数智是北京电控旗下一家专注于原创性、颠覆性、引领性科技创新的人工智能科技企业,以“1个AI基础设施底座+2大产业发展平台”的创新范式,加速推动人工智能与实体经济深度融合,并已取得了突破性成果。北京数字经济算力中心能够提供千P的算力供给,北电数智以该项目为样板,致力于将“星火·智算”推向全国,在华南、华东、西南等多个区域逐步构建面向信创需求,并满足地方优势产业需求、驱动区域产业升级的AI底座。 不仅如此,北电数智基于“传统产业赋能平台”构建了星火·国产信创底座”“星火·影视底座”“星火·佛山泛家居底座”三大行业AI专属底座,为不同领域提供定制化AI行业解决方案;基于“新兴产业加速平台”构建了“星火·低空经济底座”和“星火·高端制造底座”,为多个行业的智能化升级转型提供有力支撑。 论坛举办期间,北电数智与一众嘉宾将围绕“产业创新应用、生态发展与数智未来”三大议题,深入探讨AI技术演进方向,挖掘场景落地实践,链接技术、资本与产业资源,推动科技创新与产业创新深度融合。4月15日,即2025酒仙桥论坛首日,大会主论坛将汇聚政、产、学、研多方力量,共同探讨AI黄金发展期的机遇与挑战。包括中国工程院院士邬贺铨,中国信通院云计算与大数据研究所所长何宝宏,京东方高级副总裁、集团联席首席技术官姜幸群,北方华创微电子副总裁夏凡,以及新华三、中科闻歌等企业代表将分享最新的AI创新趋势和数智化发展的最新实践成果;作为大会主办方,北电数智党支部书记、董事长荆磊,企业首席技术官谢东,企业首席营销官杨震将从产业驱动和新质生产力打造、AI技术驱动产业范式转移、加速创新链和产业链无缝对接等角度发表主题演讲,拆解加速AI产业化和产业AI化的“通关攻略”。 4月16日至20日,AIDC创新驱动生产力新变革专场、金融专场、可信数据服务专场、应用驱动新质AI生产力专场、星火国产AI原生专场、战略新兴产业专场、AI+文化解决方案暨AIGC视听创新专场、医疗专场、新质人才生态专场以及AI创新投融资专场,共计10个专场分论坛将陆续召开,北电数智将详细介绍其在多个领域的建设成果,并与一众嘉宾将围绕AI基础设施、数据、算力、模型、产业、应用、人才等AI产业发展的多方面议题展开深度交流和讨论。各方专家也将分享产业一线的最新趋势,开展跨界对话,一场精彩纷呈的“思想大爆炸”即将拉开帷幕。 AI生产力元年,北电数智期待与你共同开启。...
阅读更多

AI网页版扎堆上线,华为、理想、OPPO们打的什么算盘?

一切为了「多终端一致体验」和「用户数据闭环」。 过去三年,大模型带来了对话式 AI 的全新体验,也带来了一股 Web 产品的复古潮,就连诞生于移动 APP 时代的字节跳动,都给「豆包」开发了网页版。事实上,目前几乎所有主流大模型,都开发了自己的网页版来提供大模型的对话服务。 但手机厂商甚至汽车厂商,为什么也要「不务正业」开发 AI 助手的网页版? 这几天,有网友就发现 OPPO 悄悄上线了小布助手网页版(https://xiaobu.coloros.com)。雷科技测试发现,小布助手网页版可以用 OPPO 账号直接登录,整体设计则与 ChatGPT、阿里通义非常相近,侧边是对话列表,主体是AI对话界面,支持基于 DeepSeek-R1 的智能深度思考。 图/ OPPO 小布 问题在于,既然内核都是 DeepSeek,用户为什么不用 DeepSeek 官方提供的服务,或者腾讯元宝提供的 DeepSeek?坦白讲,这是包括我在内,很多人对于 OPPO 上线小布助手网页版的困惑所在。 但必须指出的是,这么做的不只是 OPPO 一家。今年 2 月,华为上线小艺助手网页版;3 月,理想汽车也上线了理想同学的网页版;4 月,OPPO 也接着上线了小布助手网页版。 这样算下来,基本就是一月一上线,那接下来的 5 月会是哪一家手机厂商和汽车厂商吗?不过我更倾向于上线时间纯属巧合,但手机和汽车厂商要为 AI 助手打造「网页版」的趋势,或许已经很明朗了。 AI网页版爆发,体验到底如何? 在理解手机和汽车厂商为什么要开发 AI 助手的网页版之前,我们还是有必须首先了解下这些已经上线的 AI 助手网页版。 公允地讲,目前 AI 助手网页版设计已经非常成熟,从 ChatGPT 到 Kimi,再到豆包和 DeepSeek,大体的设计都如出一辙。但作为最新上线网页版的「AI 助手」,OPPO 小布助手网页版目前的版本,还是有些粗糙。 在核心的对话体验中,除了不能复制问题,更重要的是并不支持重新编辑问题。更明显的问题是,当小布调用 DeepSeek-R1 进行深度思考时,思考过程完全没有「排版」,导致阅读体验相当糟糕。 图/ OPPO 小布 不过和手机端保持一致,小布助手网页版默认启动「智能深度思考」,会自动根据提问调用常规模型快速回答,或者调用 DeepSeek-R1 进行深度思考。缺点在于,我们还是不能手动默认「R1 深度思考」。 另外,小布助手网页版的设置界面,也再次证明了目前还是很早期版本,除了「退出登录」甚至没有提供任何选项。 倒也可以理解,毕竟 OPPO 才刚刚上线。作为对比,2 月份华为小艺助手网页版(https://xiaoyi.huawei.com/chat/)才上线的时候,设计和功能也非常简单,但经过两个月的更新加入了不少的设计和功能。 首先值得一提的是,在侧边栏中小艺助手网页版除了「下载手机版」的引导,还提供了「设置默认引擎」的教程,用户可以将基于大模型的小艺直接设置成浏览器的「默认搜索引擎」。 图/华为小艺 这种做法,可以说「百利而无一害」,对于开始习惯使用小艺助手搜索信息的用户来说,直接增加了最为便捷的一个「入口」。 说回对话界面,小艺助手网页版明显提供了更丰富的交互引导,更接近豆包的做法。同时,尽管和小布助手网页版一样默认「自动深度思考(R1)」,但小艺助手网页版比较好的一点是提供了「强制深度思考(R1)」的选择,方便用户按需选择: 图/华为小艺 真心希望 OPPO 后续跟进下。 整体来说,当前版本的小艺助手网页版无疑更加成熟,虽然提问还不支持重新编辑,但至少支持了一键复制。 至于理想同学网页版,基本就和上线时间一样,整体的完成度介于 OPPO 小布和华为小艺之间。设计上,理想同学网页版还是保持了非常简洁的风格,但能提供的选项和配置也非常有限,但一键复制问题、分享回答等设计和功能已经比较完善。 当然,理想同学网页版(https://chat.livis.com/chat)同样也提供了 DeepSeek-R1 深度思考的能力,但不同于 OPPO 小布和华为小艺的直接调用,理想同学会在调用 R1 模型之前,首先根据提问「规划任务」「联网获取资料」。 举个例子,当我在关闭「联网搜索」下提出「JOJO 动画化新作」的问题,即便没有指出「哪一部 JOJO」,理想同学 R1 模型依然可以基于前一步获取的资料知道是第七部《飙马野郎》。 图/理想同学 事实上,在部分回答中,理想同学还会在「规划任务」后,直接指明「调用检索工具检索」,然后再进入我们熟知的 R1 深度思考。而这,实际上也是延续了理想同学在车机、手机 APP 上的做法。 图/理想同学 但这几家网页版用下来,显然还无法说服我自己用它们,而不是用产品完成度更高的 DeepSeek 官方、腾讯元宝等,反正都是以 DeepSeek-R1 为核心。 甚至在我们的测试中,当我以比较模糊的「NS2」提问,只有 DeepSeek 官方和腾讯元宝第一时间就明白「Nintendo Switch 2」的指向,OPPO 小布助手(R1)起码还提到了「Nintendo Switch 2」的可能,华为小艺助手(R1)和理想同学(R1)则全都指向「Network Simulator version 2」一词。 AI 网页版,其实是厂商为「自家用户」准备的 从功能完整度来看,当前这些 AI 助手网页版很难与 DeepSeek 官方、豆包、Kimi 等专业模型服务相提并论。但如果我们换一个角度,从「华为用户」「OPPO 用户」「理想汽车用户」的视角出发,这些看似「多此一举」的产品决策,反而开始变得合理起来。 对于华为用户来说,小艺助手早已成为日常交互的重要组成。从手机到智慧屏、再到车机,小艺无处不在。而网页版的上线,更像是对多端场景的最后一块拼图——一个可以在电脑上继续和「小艺」保持连贯交互的浏览器入口。 尤其是其同步对话记录、与华为账号绑定、加入「鸿蒙开发助手」等设计,体现了它不仅仅是一个「对话框」,更是连接手机和浏览器之间用户身份与数据的「粘合剂」。 图/华为小艺 OPPO 的小布助手也是类似思路。尽管网页版目前仍显早期,但它与手机端的同步逻辑已初步建立,甚至连「默认开启深度思考」这一配置也与手机保持一致。对于 OPPO 用户而言,网页版更像是将「小布」从手机带到 PC 上的自然延伸,而不是为了从头争夺 ChatGPT 或 DeepSeek 的泛用户市场。 最为典型的还是理想汽车的「理想同学」,本身就是「车载智能中控助手」的延伸。包括去年在手机端上推出的理想同学 APP,一方面体现了理想对「多终端智能体验一体化」的重视,另一方面也为理想车主提供了一个熟悉且稳定的使用路径,让「理想同学」成为车内、车外都重要的「AI 助手」。 图/ App Store 不难看出,目前 OPPO、理想、华为推出 AI 助手网页版的真正目的,并不是要与通用大模型平台正面对抗,而是为了绑定原有用户、延展已有的产品体验路径、增强品牌与用户的粘性。 简言之,大模型只是工具,而「多终端一致体验」和「用户数据闭环」才是目标。 归根到底,这是一场关于入口的战役。AI 助手网页版的出现,标志着手机和汽车厂商不再满足于控制 App,而是要在更上游的浏览器层、操作系统层争夺用户的主动交互空间——哪怕它还很小,但却足够关键。 写在最后 如果按照过去三个月的节奏推演——2 月是华为,3 月是理想,4 月是 OPPO,那 5 月会是谁? 小米、荣耀、vivo、蔚来,甚至哪吒和极氪,谁又不想拥有一个可以绑定账号、承接多终端对话历史、在浏览器中自然衔接产品体验的 AI 助手网页版? 从产品逻辑来看,这种布局是合理的。从厂商角度来看,它也不重,不难,甚至「显得先进」。但问题也随之而来: 用户真的愿意用这些网页版吗? 当 DeepSeek 官方、腾讯元宝、豆包已经拥有更强模型能力和更成熟交互体验时,这些厂商自建的 AI 助手网页版能否成为一个用户愿意主动打开的标签页,而不是藏在浏览器书签里的「一次性体验」?  网页版的上线,也许只是厂商的野心起点。但它要如何走到用户的起点,还远未可知。...
阅读更多

工信部人工智能标委会公开征集人工智能相关行业标准立项建议

4月14日,据中国信通院消息,工业和信息化部人工智能标准化技术委员会基于广泛调研,形成了《工业和信息化部人工智能标准化技术委员会2025年标准制定指南》,并计划组织制定一批人工智能关键亟需标准。现面向社会公开征集人工智能相关标准立项建议。本次征集的人工智能标准立项建议,旨在加快完善人工智能标准体系,满足人工智能技术快速迭代与产业高质量发展对人工智能标准化的新需求,将围绕指南提出的五个方向,重点考虑2025年拟制定标准进行推进,请意向单位参考指南相关内容研提标准立项申请。本次公开征集人工智能标准立项建议的截止日期为2025年4月30日。来源:界面新闻...
阅读更多

天工人工智能工业平台来了!中国电信上海公司携手行业共绘“模塑申城”崭新篇章

在当今科技飞速发展的时代,人工智能正以前所未有的力量重塑着各个行业的面貌,而制造业作为实体经济的核心领域,也即将迎来一场意义非凡的变革。1月3日,上海市经济和信息化委员会、中国电信上海公司、上海市人工智能行业协会、上海库帕思科技有限公司以及人工智能产业链上下游企业共同举办天工人工智能工业平台及首批AI+智能制造应用场景暨工业语料库1.0版发布会,标志着上海在推动人工智能与智能制造深度融合方面迈出重要一步。上海市经济和信息化委员会副主任张宏韬、中国电信上海公司副总经理龚豪出席会议并致辞。 张宏韬表示,上海正在持续推进人工智能上海高地建设,为推动人工智能创新发展,全面实施“模塑申城”方案。天工人工智能工业平台及工业语料库1.0版正式发布,是上海在人工智能+制造领域迈出的坚实一步。市经济信息化委将全力支持平台运营,助力更多企业进行智能化转型,共同开创人工智能与制造融合发展的新篇章。 龚豪表示,作为通信业的领军者,中国电信上海公司积极响应政府战略,深刻认识到通信与人工智能技术相融合的重要性,并始终致力于助力传统制造业朝着智能化、数字化方向迈进。中国电信上海公司将进一步加大在人工智能工业应用领域的投入力度,积极拓展应用场景以及服务范围,全力推动人工智能与智能制造深度融合创新。 天工人工智能工业平台发布赋能智能制造核心驱动力 大会上,天工人工智能工业平台发布。该平台集成了先进的人工智能技术,旨在降低工业企业使用人工智能的门槛,提高AI应用开发验证效率,助力企业实现智能化转型。 天工AI平台采用三层架构,确保从底层算力支持到顶层具体应用的全面覆盖。底层是通用的算力和大模型底座,提供强大且可控的GPU等智算资源支持,集成多种预训练的大模型,支持高效利用资源。中层是工业中试平台,汇集了丰富且动态的工业相关数据,包括公开数据和客户私有数据,提供数据清洗、标注、预处理等工具,帮助企业打造个性化知识中心。以共性价值为牵引,促进数据端到端利用,培育行业可信数据空间。顶层是面向各个工业领域的具体落地应用。 平台采用开放架构,打造丰富的产业生态,汇聚了无问芯穹等模型训推加速能力,兼容中国电信星辰、书生等主流基础大模型,同时根据工业行业特点将库帕斯通用语料库以及由行业权威机构提供的专属语料库纳入其中。平台提供公有云和私有化部署等定制化的个性化解决方案,为制造业企业提供全方位、智能化的解决方案,助力企业实现技术规范的校验与生成,达成生产设备的互联互通、生产过程的优化、质量检测识别以及供应链协同等目标,进而有效提高生产效率、降低成本、提升产品质量与竞争力。在平台上企业可选择合适的合作伙伴牵手共同开展基于人工智能技术的产学研成果转化以及应用场景落地,助力制造企业更好地传承工匠技艺。 工业语料库1.0 版正式发布支撑知识赋能产业升级 当前,高质量语料数据已经成为提升模型能力、深化垂类应用的重要抓手。作为“模塑申城”行动的重要组成部分,按照“空、海、陆、核”四个板块推动工业领域高质量语料库的建设,涵盖了制造业各个环节的专业术语、工艺流程、案例数据等海量内容,经过精心整理和标注,具有极高的准确性和实用性。它将为人工智能在工业领域的深度学习提供坚实的知识基础,助力开发更智能、更贴合实际需求的工业应用。企业可以利用该语料库对工业大模型进行针对性训练,使其更好地理解和处理工业领域的复杂问题,为企业提供更精准的决策支持和解决方案。 “模塑申城”智能制造行业应用基地启动推动更多人工智能应用落地 会上,“模塑申城”智能制造行业应用基地启动。应用基地将主要聚焦在人工智能创新技术、构建协同创新生态、加快应用场景落地三方面。一是基地将吸引智算底座、基础大模型、语料库等生态伙伴融入“天工人工智能工业平台”,为行业应用落地服务;二是构建产研转化、应用孵化的生态体系,推进人工智能与智能制造行业的深度融合,培育高端人才,推动技术创新与产业升级;三是将持续吸引制造企业、场景应用入驻基地,推动更多人工智能+智造创新应用生根发芽。 汇聚行业精英共话人工智能+智造新未来 会上来自政府、制造企业、人工智能领域的众多专家学者、企业领袖以及行业精英们齐聚一堂,围绕人工智能平台、应用场景以及工业语料库展开深入探讨与交流,分享独到的见解和实践经验,共同展望人工智能在智能制造领域的发展趋势与机遇。 未来,中国电信上海公司将继续携手各方合作伙伴,深化人工智能创新应用,开拓人工智能赋能智能制造深度融合的应用边界,共同开启“模塑申城”崭新篇章,助力建设人工智能上海高地。...
阅读更多