作者| Moonshot 编辑| 靖宇 你是否也曾为在浏览器上打开十几个标签页、却依然找不到答案而烦扰? 你是否经历过,只是想搞懂一个概念,却在搜索、跳转、视频、文章里中耗去大半小时,最后仍不明所以? 在 AI 工具爆炸的 2025 年,我们被各种新玩意包围:AI 写作、AI 搜索、AI 总结、AI 启动器……好像 每一个软件都想借 AI,重塑一遍你和电脑的关系 。 而上网冲浪最重要的那块冲浪板——浏览器,一直以来都没有被 AI「重新定义」。大多数所谓的「AI 浏览器」,不过是在搜索框里集成了 ChatGPT、Gemini,或是装个 AI 插件。 浏览器,这个现代人最常用的工具,却也是最没有「升级感」的工具。 直到「Dia」出现。 Dia 的核心理念是: 「AI 即是浏览器」 ,它不是浏览网页的工具,也不是 AI 外挂和插件,它是少数真正从底层重新定义「浏览器」的产品。 如果你还在复制粘贴网页去 ChatGPT,总结、翻译、提问一条条来,那你真的该认识一下 Dia 了。 在用了一段时间 Dia 后,它不仅重塑了我对 AI 时代浏览器的理解, 还创造了我新的上网习惯,也让我产生了某种恐惧 。 栏目作者召集 极客公园的新栏目「AI 上新」,将带大家体验最新的 AI 应用和硬件,让你成为 AI 时代「最靓的仔」! 现在,我们也向所有喜欢尝鲜和体验 AI 的同学发出召集,只要你发现并体验了新的 AI 应用或者功能,按照格式(参考案例: AI 上新|这个应用,让苏格拉底和尼采手把手教我「哲学」 ) 向栏目投稿,在极客公园公众号发布,不仅能获得相应稿费,且会为你「报销」AI 应用的订阅费用。 同时, 优秀作者还有机会进入极客公园 AI 体验群 ,获得最新 AI 应用和工具的内测资格,参加极客公园专属相关 AI 活动,和 AI 应用创始人一对一沟通。 AGI 太久,只争朝夕,让一部分人先 AI 起来吧! 投稿、进群请扫描下方二维码添加极客小助手微信 01 AI 就是浏览器本身 第一次打开 Dia,你可能会被它的界面迷惑:没有传统浏览器的标签页、书签栏、插件区,取而代之的一个对话框,和下方「聊天」、「写作」、「编程」三个功能卡。 打开浏览器,即用大模型,有问题,对话框里直接聊,堪称「大模型」版 Boss 直聘。 这也是 Dia 不同于传统浏览器之处:它把浏览器的核心功能,从浏览网页变成了「解决需求」。 我们通常打开浏览器,是需要解决某个具体的问题,比如你想知道「剪映和 Final Cut 的功能差异,它们分别适合哪些类型的视频剪辑者?」 在传统浏览器中,你需要打开搜索引擎,把复杂的需求简化成「剪映和 Final Cut 的功能差异」。再在浩如烟海的网页里,人工比对功能列表、翻社区评论、看评测文章和视频,最终自己提炼出结论。 而在 Dia 中,你可以输入自己完整且具体的想法,「我是一个剪辑小白,我想学着剪辑自己的 Vlog 发到某书/某音上,请帮我比较一下……」。 Dia 会用 AI 帮你: 自动查找多个来源(官网、知乎、Reddit、媒体评测) 自动阅读网页内容并生成简明摘要 用结构化方式输出表格或段落总结 最后提出具体建议:如果你是新手短视频博主,更推荐剪映;如果是团队协作或需要插件生态,Final Cut 更合适…… 这不是简单的搜索增强,Dia 完整地替你做完了「检索 - 筛选 - 得出结论」的全过程。 而且 Dia 不是那种千篇一律的 AI 聊天机器人。你可以开启「个性化模式」,自定义 Dia 的语气、写作风格,甚至让它模仿某些知名人物的表达方式。Dia 甚至可以根据你设定的职业和兴趣,给出更贴合你需求的答案。 由此一例延伸,你还可以直接和 Dia 说「帮我总结下这篇论文」、「把这段网页内容翻译下」、「帮我写个邮件模板」,甚至「用保罗·格雷厄姆的风格给我讲讲这个概念」。 当然,这些功能任何大模型都能实现,但 Dia 的不同之处在于,它不仅是「我问,它答」,而是「我说目标,它执行流程」。 Dia 背后的交互理念是:「 人类提出任务,AI 自动跑网页 」。 这也就重塑了「浏览器」这一产品目的。其他浏览器目的是:更好地浏览网页,而 Dia 的目的则是:利用网页,完成你的需求。 02 无数的网页,无缝的 AI Dia 的核心杀手锏,是它对人与网页交互方式的彻底重构:网页不仅能看,更能直接对话、理解、处理。 传统浏览器中,你要想让大模型帮你处理网页信息,往往得经历这样一套流程:「复制网页内容 → 打开 ChatGPT → 粘贴 → 输入 Prompt → 处理结果再粘贴回来。」哪怕你用上了各种插件或侧边助手,依然逃不出「来回切换 + 手动处理」的困境。 而 Dia 把这整个链条,浓缩成了一次点击。 你只需点击网页右上角的「Chat」按钮,就能在当前页面直接唤起 AI 侧边栏,像聊天一样说出你的需求。 Dia 会自动读取并理解你当前页面的全部上下文,包括正文、图表、表格、视频音频、PDF、甚至图片上的文字信息。你甚至不需要告诉它「我需要你看这段」。 在实际体验中,Dia 展现出强大的内容感知与任务执行能力。 比如我打开一封活动方发来的 3000 字英文邮件,内容涉及会议安排、座位号、取票方式、注意事项、法律须知…… 我根本没精力一段段翻看,所以我在「Chat」中输入:「请总结邮件重点。」Dia 立刻理解邮件结构,剥离出关键字段,把我最需要的「座位和兑换码」信息提炼出来。我不用复制粘贴,再跳转去 ChatGPT,它就在我眼前完成了整个信息处理。 更惊艳的,是 Dia 对复杂内容和具体指令的理解力 。 比如我正在浏览一段 20 分钟的 YouTube 足球训练视频,你不需要从头看到尾,只需在侧边栏下指令:「视频里推荐的单人训练方案是什么?是否推荐新人采用?」 Dia 会自动「看」完视频内容,再对应到我具体要求「单人训练」,生成相应答案,甚至会在答案里标出时间点,点击即可直接跳到对应片段。 我完全不需要全片观看再记个笔记,就已经得到了翔实可用的答案。 我甚至可以打开多个视频页面,比如几支热门的足球训练教程,一支都不点播放,直接唤出 Dia:「请结合这些视频,给我制定一个适合在家练习的训练计划。」 Dia 就会把所有视频作为输入源,进行并行分析,生成一个结构清晰、语气自然、结合你需求的定制训练方案。 所以与其说 Dia 集成了大模型,不如说它让网页本身成为了 AI 的输入接口 。 Dia 能识别每一个网页的结构逻辑,我看到的文本、图表、图片、视频、嵌入文档通通可以当作可读对象。 无论我面对的是冗长邮件、冗杂文档、复杂视频、PDF 报告、论坛高楼的评论区,我只需要说出我需要什么,Dia 就能「理解、处理、生成」。 而且,Dia 还可以把对话内容一键生成图片,待我后续查用,这种「所见即所得、所聊即输出、句句有回应」的体验,让我网上冲浪的体验变得无比丝滑和顺畅。 03 面向未来设计 除了两大核心功能外,Dia 还有许多可圈可点的设计。 比如界面设计,打开 Dia,你会感受到一种安静和专注,就像一张未经打扰的白纸。 它的界面干净得近乎「禅意」:只有一个对话框,几个功能卡,一个「Chat」按钮。从设计上就仿佛告诉你:重点不是网页,而是任务。 Dia 上没有传统浏览器那些满屏的书签页、插件栏、广告条和通知弹窗,在初始设定时,它就内嵌了屏蔽广告的选项。 让你从浏览到操作,都能感受到一种「极简式专注」。 Dia 强调隐私的「屏蔽功能」 AI 也嵌入到了网页浏览的每个字节里。 比如我可以随意框选一句话,右键「Ask Dia」,Dia 会把这段话和整个网页一起抓取进 AI,它既有上下文,也有重点句。 所以我能让它「用海明威的文风/刘慈欣的文风/雅思写作 7 分的水平重写这段话」,也可以问「这段话在全文结构上的意义是什么?」 Dia 还支持用户预设命令,我就创建了一个「/read」命令。在阅读长文时,我只需要输入「/read」,Dia 就会按照我的 prompt 去处理网页,并按要求反馈结果。 其实就是把 prompt「快捷键化」 当然,Dia 并非完美,甚至让我感受到了隐患。 虽然中文识别与处理能力非常强,但 Dia 界面不支持中文,AI 输入输出中文都需要手动设置。 其次,最令人困扰地还是网络问题,Dia 目前只支持美区 IP 的账号登录,以及在调用模型时,也要保持美区 IP,哪怕经由网络设置后,依然会随机出现连不上模型、被迫弹出账户等问题。 上面是登录问题,下面是调用模型时的失败 以及,我吹毛求疵地希望,Dia 能走得再远一点,不只是「理解网页」,而是能「操作网页」,能独立完成「自然语言 - 执行」的回路。 就像我希望,我能对它说:「我想看电影《F1》的预告片。」Dia 就能立刻打开 YouTube 或 Bilibili,搜索对应片段,自动播放,甚至为我挑选中文字幕版本。 又或者我说:「帮我订明天中午去上海的高铁票。」Dia 就能自动跳转到 12306,识别出发地、填好时间、筛选出中午时段的车次,然后停在确认页上,等我点下支付。 就像我们曾对手机上的语音助手充满幻想,希望它能调用 App、订外卖、设闹钟、发微信。 我对 AI 时代的浏览器,也有类似的期许:它不仅该帮我理解网页,更该帮我调用网页、操作网页、完成任务。 这时的浏览器,已经不再是传统意义上的「信息入口」,而是一个真正能动手做事的 AI Agent 。 结果我还是要复制粘贴、打开 YouTube、筛选视频 如果说此前介绍过的 Raycast 重构了我 Mac 的操作习惯 ,那 Dia 也重塑了我的上网体验。 用 Dia 一段时间后,我发现上网不再是漫无目的地冲浪,而是一个更加专注的过程。 过去的浏览体验,常常我是被信息推着走。一开始只想查个数据,最后却在无数个标签页之间兜兜转转,看了一堆没用的东西。 而现在,当我带着任务时,我专注在任务上,而非纷繁复杂的信息和网页里,我直接和 Dia 对话,让它给我答案; 当我在看内容时,我专注在内容上,我不用停下来查词、跳页、记录,我请求 Dia 助我理解。 Dia 不只是浏览器,而是一个面向 AI 时代的信息界面。它把浏览器从「打开页面」的工具,变成「完成任务」的平台。 而这,恰恰也是我最隐隐担忧的地方。 我确实变得更专注了,但与此同时,也失去了一部分耐心 。当任务被不断压缩成目标 + 输出,我开始习惯于一句「总结一下」代替完整阅读。 我不再耐心体会镜头的剪辑节奏、句子的遣词造句、结构的层层铺垫,而是本能地请求 AI 快速提取结论, 我变得更加依赖于 AI 带来的「快餐」 。 就像这篇文章,如果我不是作者,而是读者,在 Dia 中打开它的第一反应,很可能只是敲下快捷命令:「/read」。 而这,是整个 AI 时代都面临的难题,或许也间接证明了: Dia 做对了。 *头图来源: Wired 本文为极客公园原创文章,转载请联系极客君微信 geekparkGO
特斯拉 Robotaxi 迎来首撞:轻微擦碰停放车辆 据视频博主克里斯(网名 DirtyTesla)分享,上周他在一次特斯拉 Robotaxi 的试驾过程中,经历了特斯拉 Robotaxi 项目「首撞」。 此次事故并非在高速行驶或变道过程中发生,而是在车辆静止状态下,特斯拉的全 FSD 意外地将 Robotaxi 驶向了一辆停放的汽车,轻轻碰撞了对方的车门。 根据克里斯的描述,事故发生时,他正在使用 Robotaxi 前往一家披萨店。然而,车辆在尝试进入该店停车场时遇到了问题。在多次尝试失败后,车辆最终放弃了进入停车场的计划,停在了停车场入口旁。克里斯在下车后立即开始拍摄视频。视频显示,特斯拉车辆在没有任何明显原因的情况下,突然转动方向盘,径直向一辆仅几英寸距离的丰田凯美瑞驶去。 此前,马斯克曾声称 Robotaxi 将不会在前排座位安排人员,并为此招聘了远程操作员。然而,乘客很快发现,虽然车内确实有安全操作员,但他们被安排在副驾座位上,而不是主驾。马斯克表示,这种安排是因为特斯拉对安全「格外谨慎」,而此次事故似乎也证明了这种谨慎的必要性。(来源:IT 之家) 淘宝美团外卖大战,上周末外卖市场规模扩大一倍 据《晚点》报道,上周六淘宝天猫的市场团队拿出比肩双 11 的预算和阵仗,迎接百日闪购增长计划的第一个冲单日。 当天下午,全国美团一线经营人员突然接到通知,当天要放开限制,全力补贴、极尽所能跟进淘宝闪购的补贴战,冲高单量。 这轮较量的结果是:7 月 5 日美团宣布所有外卖订单(包括餐饮和零售订单)突破 1.2 亿,其中餐饮订单超 1 亿。淘宝闪购则在两天后宣布,5 号当天的闪购订单量超过 8000 万单。 整个外卖市场总量年初日均大约 1 亿单。随着京东开始做外卖、淘宝闪购入场,市场规模在这一轮遭遇战前被逐渐补贴到每天 1.5 亿单左右,并在上周六当日冲到 2.2 亿单。(来源:晚点 LatePost) 香港目标今年内发出稳定币牌照 7 月 7 日,香港特区政府财经事务及库务局局长许正宇表示,目标今年内可发出稳定币牌照。香港《稳定币条例》将于 8 月生效。 许正宇亦表明,批出的稳定币牌照数目会是个位数,盼于条例生效后能够收到申请,目标今年内可发出牌照。至于有金融机构取得牌照后,是否能够发行与人民币挂钩的稳定币,他说若牵涉其他司法权区的货币,则要与相关机构讨论。 谈及稳定币的应用情景时,许正宇说:「我们希望(稳定币)着重处理在实体经济中的难点和痛点,例如跨境支付,尤其是牵涉到『本币』风险较高,又或当地金融体系不是那么完备,而进行跨境支付时,则有一定的挑战。但若有以法定货币作为基础的稳定币,作为一个有效的支付工具,可便利跨境交易及减省当中的交易成本。」(来源:21 世纪经济报道) 特斯拉全球最大超充站在加州落成 据外媒 Insideevs 报道,特斯拉在加州洛斯特希尔斯建成了一座名为 Project Oasis 的超级充电站,配备了太阳能电池板、Megapack 储能装置,目前已启用 84 个充电车位,是全球最大的特斯拉充电站之一。 该充电站完全依赖太阳能供电,未接入传统电网。特斯拉表示,等到今年底 168 个充电桩全部上线后,这里将成为全球最大、最具代表性的「零化石燃料 + 脱离电网」充电示范站。 现场所有车棚顶部都装有太阳能板,停车区旁还建有一座大型太阳能电场,总发电能力达 11 兆瓦。发电所得被储存在 10 个 Megapack 中,每个容量 3.9 兆瓦时,足以支持每天数百辆电动车完成充电,实现全程由太阳能驱动的零排放出行。(来源:IT 之家) 谷歌 AI 制药即将进行首次人体试验 近日,DeepMind 旗下的药物研发公司 Isomorphic Labs 正准备开始在人体上测试其人工智能设计的药物。 Isomorphic Labs 于 2021 年从 DeepMind 分拆出来,一直处于将 AI 融入药物研发的前沿。该公司利用先进的机器学习算法分析海量生物数据,识别潜在的药物靶点,并设计出能够有效治疗多种疾病的新型化合物。 对于制药公司而言,研发一款新药往往需要数百万美元的投入,药物试验的成功概率则只有 10%。公司总裁 Murdoch 认为,Isomorphic 的技术有望大幅提高这一成功率。去年,Isomorphic 与诺华和礼来两家制药公司签署了重要研究合作协议。(来源:财联社) 具身智能再现大额融资,星动纪元A轮融资近5亿元 7 月 7 日,清华系具身智能企业北京星动纪元科技有限公司宣布完成近 5 亿元 A 轮融资,本轮融资将用于人形机器人软硬技术的研发与量产落地。 星动纪元成立于 2023 年 8 月,是清华大学唯一持股的具身智能企业。星动纪元的技术路线是软硬一体,目前的产品是轮式人形机器人星动 Q5 和面向工业领域的全尺寸双足机器人星动 SRAR 1,以及五指灵巧手 XHAND1。 在模型侧,星动纪元是希望让机器人像人一样「看懂世界,自主行动」。公司提出融合理解与生成的具身大模型模型 ERA-42,将视觉、理解、预测、行动等功能统一到一个端到端的模型中,可实现一个模型控制全身灵巧操作。 在零部件方面,星动纪元的核心零部件,包括关节模组、灵巧手、电机、减速器、控制器等,均为自研。 商业化方面,截至 6 月,今年已累计交付超 200 台产品,另有上百个订单在量产交付中。在全球市值 TOP 10 的科技巨头中,9 家为星动纪元客户,目前所有订单中,50% 以上来自海外客户(来源:科创板日报) 罗马仕退款排至 17 万位,网友:梦回 ofo 小黄车退款潮 7 月 7 日,近期深陷产品质量风波的罗马仕再度引发广泛关注。有网友发现,罗马仕服务号上出现「退款进度」查询入口,不少购买了召回型号及批次产品的消费者纷纷查看退款进展,小红书网友 @Lucky 反馈自己已排到 17 万位,退款之路漫漫。 在电商平台方面,目前淘宝和拼多多上的罗马仕官方旗舰店已关闭。京东平台仅余京东自营店和罗马仕数码配件旗舰店,抖音平台目前能搜索到罗马仕官方旗舰店和罗马仕旗舰店,但相关店铺所售商品也仅以数据线、充电器等配件为主,曾经的明星产品充电宝不见踪影。 面对罗马仕当下的困境,不少网友联想到 2017 年 ofo 的退款困境。当时,据海口日报报道,海口市民阿正在 ofo 退款队列中已排到第 14460679 位。(来源:凤凰网科技) 极越CEO复更微博,此前传闻称极越正在重组 近日,极越 CEO 夏一平微博重新更新,7 月 6 日,他接连转发两条动态,一条为前极越车主对极越的祝福,另一条则为极越官方发布的「关于用户关心的问题说明(第十六次)」。 「关于用户关心的问题说明(第十六次)」发布于今年 6 月,主要内容涉及极越售后维保、智能辅助驾驶 OTA 等方面。 此前,原极越汽车公关负责人徐继业曾在朋友圈发文称:「有兄弟透露极越大概率不会破产了,集度董事会已经同意重组,集度目前正与 3-4 家重组方沟通中。」(来源:新浪科技) 曝 iPhone 17 Pro 放弃钛金属,将回归全铝机身 近日,iPhone 17 Pro 模具在社交平台上被曝光,和之前爆料的渲染图一致,iPhone 17 Pro 采用横向矩阵相机 DECO,闪光灯和 LIDAR 激光雷达扫描仪位于矩阵相机右侧。 值得一提的是,iPhone 17 Pro 全面放弃钛金属,采用全铝合金机身,中框和后盖为一体化设计,不过苹果 Logo 区域为玻璃材质,用来支持无线充电。 据爆料,iPhone 17 Pro 的苹果 Logo 靠下放置,为了适配这个 Logo,配件商制造的 MagSafe 手机壳在磁吸环底部开了小孔,这样看起来更加和谐。 怒喵科技创始人李楠指出:iPhone 17 Pro 系列放弃沿用很久的三明治结构,回归全铝合金 Unibody,苹果使用钛合金也不是不行,但是重量会吃亏。(来源:快科技) 新款问界 M7 谍照曝光 近日,一组新款问界 M7 的谍照在网络流传。通过谍照可以看到车辆外观相较于新款有很大变化,整体造型更贴近问界 M8 的设计语言。据相关消息称,新款问界 M7 或将在 9 月份正式上市,有可能会在 7 月或者 8 月批次进行工信部申报。 车辆整体造型更加圆润饱满,两侧大灯组造型与问界 M9 和 M8 相似,采用矩形船桨的造型。前脸的造型更加高大,通过谍照看很像小号的问界 M8。据爆料,预计新车的整体尺寸也有所增加,车长会由现款的 5020mm 增加至 5100mm,轴距从 2820mm 提升至 3050mm。车尾部分,透过谍照缝隙可以看到预计车辆将会采用贯穿式尾灯,车尾两侧翼子板具有不错的肌肉感,整体造型相比现款更加饱满。 有消息称,新款问界 M7 的纯电续航里程可能将突破 300km,综合续航里程也有可能达到 1500km。(来源:汽车之家) 《F1:狂飙飞车》成苹果迄今最高票房电影 赛车题材电影《F1:狂飙飞车》上映十天,全球票房已破 2.93 亿美元(约合 21 亿元人民币),超越马丁・斯科塞斯执导的《花月杀手》和雷德利・斯科特执导的《拿破仑》,成为苹果迄今为止票房最高的电影。 作为一部苹果原创(Apple Original)作品,这部电影在票房上打破了多项纪录,同时收获了极为积极的影评。该片在首映日就取得 2500 万美元票房成绩,其中还包括了价值 280 万美元的提前预映场票房。当时,分析师曾预计这部电影的首周末票房会在 3500 万至 6000 万美元之间,但实际首周末票房达 1.4 亿美元。 值得一提的是,这部电影的制作预算达 2 亿美元,但苹果并不完全依赖院线来收回成本,相反他们更看重这部电影在其流媒体平台上的影响力。(来源:IT 之家)
作者|Li Yuan 编辑| 郑玄 当多数人形机器人公司还在争夺展台 C 位时,灵宝 CASBOT 默默收获了一张来自工厂的支票。 6 月 26 日,灵宝 CASBOT 宣布获得近亿元天使+轮融资。本轮由蓝思科技领投,天津佳益及老股东国投创合、河南资产跟投。 与行业内多数人形机器人所获得的融资不同,这次签支票的手,明确来自需要解决产线痛点的「工厂派」,而非评估技术故事的风投会议室。这也是领投方蓝思科技在智元机器人后第二次投资人形机器人。 人形机器人是否是噱头?能否有朝一日大规模落地? 当 VC 还在计算估值模型时,似乎产线已经给出了更诚实的投票。 在 2025 年机器人爆火之后,许多双足人形机器人聚焦展演、教育场景落地。而此次获投的灵宝 CASBOT 本身,也代表了一条相对特殊的路径:不过多关注聚光灯下的展演,锚定工厂车间与矿山井下等刚需场景。 当工厂派投资人开始下场押注具身智能,一个更尖锐的问题浮出水面:为何工业场景仍是少数玩家的蓝海战场? 极客公园对话了灵宝 CASBOT 的联合创始人&COO 张淼,试图探寻具身智能在工业场景目前的生存真相。 01 被技术高墙与 ROI 标尺圈出的蓝海 机器人在工业场景里是真需求吗? 「工业场景的需求是真需求。」灵宝 CASBOT 的联合创始人&COO 张淼给出了肯定的回答。 算上之前投资灵宝 CASBOT 的联想公司的消费电子工厂和此次投资灵宝 CASBOT 的蓝思科技,灵宝机器人已经接触过了多家消费电子工厂。 「3C 产品品类切换频繁,但单品类的生产体量又不大,这就要求产线足够『柔性』,不能是固定的、一次性的重投入。」张淼解释道。 一个典型的痛点,出现在质检环节。目前,这条产线的「主角」仍是质检工人。工厂并非没有想过替代方案: 要么使用专用质检设备,高昂的成本和「专机专用」的属性,使其在品类频繁更换时沦为「鸡肋」;要么是传统的固定机械臂,虽然成本更低,却无法胜任需要手眼脑协同、且具备一定泛化抓取和操作能力的复杂任务。 拥有通用操作能力的具身机器人,如果能够承担工厂的部分操作任务,将对工厂实现柔性生产,节约成本有很强的意义。 同样的需求也发生在矿山场景。这里的需求更为刚性,驱动力也超越了单纯的成本考量。 根据国家矿山安全局的指引,2026 年底前实现「危重岗位机器换人」是摆在许多央国企面前的硬性指标,这构成了不容置疑的「政策刚需」。 井下作业环境极端恶劣——深入地下百米乃至千米,常年面对 30-40°C 的高温高湿,空气中还可能弥漫着有毒气体,机器换人是对人类生命的根本关怀。 然而,虽然是真需求,机器人换人却仍然是绝对的蓝海市场,而原因就是技术和 ROI 的两道高墙。 第一道墙就是技术。 理论上,如今的大模型已能理解人类的复杂指令,并进行一定的泛化操作。 但在物理世界,「灵巧手」的能力瓶颈限制了绝大部分替代可能。「比如给 3C 产品撕掉一层精细的背贴,或是理顺一把纷乱的线束,这些人类习以为常的动作,对于机器人来说,仍是巨大的挑战。」张淼举例。 主要的难点之一在于灵巧手。目前的灵巧手本身还达不到人类的能操作的精细度,需要等待触觉传感、算法、模型和手的构型的一同进步。 当前的技术边界大致如此:类似「插拔内存条、拧螺丝」这类相对规整的装配任务,机器人「或许」可以勉强完成。 而矿井环境则在操作之上,又叠加了「本安防爆、抗尘耐用」等一系列严苛的工程化要求,则机器人本身必须经过本安、抗爆、防尘等一系列特种改造,提出了另外的技术要求。 第二道墙,则是「ROI 标尺」。即便需求再真实,工业客户的每一笔采购仍然遵循严格的商业回报逻辑。 工业客户从不为情怀买单。张淼坦言,许多客户的需求非常明确:「12 到 18 个月内,必须收回机器人采购的成本。」这条清晰的商业红线,考验的不仅是机器人的售价和效率,更考验着机器人公司对工业流程的理解和成本控制能力。 而如何与客户共同定义场景、核算并达成这笔「经济账」,恰恰是工业场景的另一重隐形门槛。这或许是技术储备夯实同时又具备丰富工业场景交付经验的灵宝 CASBOT 团队,一个独特的竞争优势。用他们的话说,「我们更会和工业制造企业打交道,讲好这本技术与商业结合的账。」 02 真人数采与成本重构:灵宝二代的量产解法 面对工业客户「12-18 个月必须回本」的冰冷标尺,任何无法被清晰量化的技术情怀都显得苍白。灵宝给出的解法是,在 2025 年 6 月 16 日发布的第二代机器人 CASBOT 02 上,进行了一场彻底的、由商业化需求反推的「成本与智能重构」。 其中,最核心的改变,便是对机身进行了「骨架与外壳分离」的模块化、解耦化设计。 张淼在表示,将复杂的整机结构「解耦」为独立的骨架和外壳模块,不仅整机成本和重量显著降低,更关键的是,它极大地提升了「装机效率」,为即将到来的小规模量产交付铺平了道路。 此外,借助本轮领投方蓝思科技在供应链上的深厚积累,其成本还有进一步优化的空间。 目前,CASBOT 02 在京东官方售价为 32.88 万元,精准卡位于行业主流价格带的中段——向下与 20 万级别的简配机型拉开能力差距,向上则避开了 50 万以上的进口或纯科研型号,让其具备了进入大部分 B 端及一些 C 端爱好者采购清单的现实可能性。 此外,虽然针对工业场景更多,灵宝 CASBOT 02 也针对目前需求很大的展览文旅场景做了一定的优化,增加了灵动模式——机器人在不工作的时候,也会做出一些类人的思考和举动,增加和用户互动的趣味性。 除了本体的优化之外,灵宝团队也在算法上做了升级。 团队发现,单纯的 VLA 模型在面对工业精细化操作时存在性能瓶颈。为此,他们在 VLA 模型之上,创新性地加入了「离线-在线两步微调」方法,特别是在线阶段引入强化学习,让机器人能在与真实环境的交互反馈中不断优化策略。 同时,其核心优势的灵巧手算法也进行了迭代升级。 与行业内的机器人相比,灵宝的机器人背后的软件算法有几个与众不同的地方。 其一是,是名为「分层端到端」的实用架构。 将负责核心任务、可在本地独立运行的「端侧具身模型」,与负责开放式交互、部署在云端的「云侧大模型」分离开。这保证了机器人在网络不佳的工厂能稳定作业,在需要交流的商场又能「连上云」对答如流。 其二则在于数据。 在具身智能的赛道上,数据是模型的血液。目前行业内许多公司使用「真机遥操作」的数据采集模式。灵宝 CASBOT 联合创始人&COO 张淼表示,这种路径有其自身的问题:为了保证数据质量,操作员会下意识地把一个不到 1 秒的动作,放慢到好几秒来完成。 而用这种失真的慢数据去训练模型,产出的机器人效率只有人类的 30%,这也是为什么很多演示视频需要加速播放。这不适配工厂场景。 灵宝的解法是让「人类自己当教练」——他们与中国科学院自动化研究所联合研发了一套「真人域」数据采集系统(带有密集触觉传感器的手套和视觉眼镜),由工程师真人佩戴,以最自然高效的方式完成任务,从源头保证了数据的高质量与「原汁原味」。 在完成了智能与成本的双重进化后,灵宝清晰的量产交付计划也浮出水面,其商业路径并非单押双足。 灵宝机器人今年也参加了人形机器人马拉松比赛,虽然并未进入前三,但是是场上唯一零失误、零摔倒的机器人。张淼表示,公司对双足的规划,更像是「能够满足多地形通过」即可。 而未来,公司布局了全尺寸双足、轮式机器人、以及可独立销售的灵巧手三条产品线。 「我们今年的目标,是在三条产品线上分别完成小规模的量产交付,每条线的量级大约在 100 台套左右。」张淼最后强调,「我们的量产,唯一的目标就是为了真实的订单交付。没有客户买单,盲目量产没有意义。」 *头图来源:灵宝机器人 本文为极客公园原创文章,转载请联系极客君微信 geekparkGO
头图来源:视觉中国 TikTok要在美国推出新App了? 7月6日,外媒The Information爆料称,TikTok 计划推出一款全新的美国版App——内部代号「M2」,预计9月5日上线。 TikTok推出这一新App的背后,应该是出于应对美国法案的拆分要求。 美国政府一直对TikTok施加「不卖就禁」的压力,要求其处理在美业务。但TikTok不可能出售整个全球业务,单独出售美国业务并成立独立运营的美国版TikTok,似乎是一个较为可行的解决方案,但最终还是要看美国与中国方面的谈判究竟如何落地。 前段时间就不断有消息传出,称TikTok可能会将其美国业务出售给一个美国财团。特朗普也公开表示过,可能会单独出售美国市场的TikTok,并独立成立一个新的平台。 如果上述计划最终落实,那么未来的全球市场上或将出现三个版本的「抖音」——全球版的TikTok、美国的新版TikTok和中国的抖音。这一拆分不仅能够符合美国监管要求,还可能在不同市场中带来差异化的运营模式和用户体验。 1 推出新App,为出售美国业务做好准备? 据《The Information》报道,TikTok 正在为其美国用户开发一个全新的应用程序,以配合美国业务出售的计划。 报道称,TikTok已制定计划,将在 9 月 5 日向美国应用商店推出新 TikTok 应用程序,该应用程序内部被称为「M2」(现有的 TikTok 应用程序内部被称为「M」)。 根据计划,TikTok 用户最终需要下载新的「M2」版本才能继续使用该服务,现有版本将运行至明年 3 月。 图片来源:视觉中国 就在上周五,美国总统特朗普表示「已基本达成协议」计划让一家本土公司收购TikTok的美国业务,并称打算在下周一或者周二(也就是本周)与中国重启谈判。 报道称根据该协议,包括甲骨文在内的非中国投资者组成的财团将收购 TikTok 的美国业务,而其母公司字节跳动预计将保留少数股权。然而,这一交易仍然需要中国方面的最终批准。 更早些时候,特朗普就曾表示已经为TikTok的美国业务找到了买家。当时的报道里,有知情人士透露,潜在买家是由甲骨文、黑石集团和风险创投公司Andreessen Horowitz组成的财团。 据市场情报公司Sensor Tower的估算,TikTok在美国的月活跃用户数约为1.15亿,略低于Instagram的1.31亿,领先于Snapchat、Pinterest和Reddit,后三者的美国月活跃移动用户数分别为9600万、7400万和3200万。 据独立投资研究机构 CFRA Research 的估计,TikTok 在美国的业务估值介于 400 亿到 500 亿美元之间——估值基于与竞争对手应用相比的 TikTok 美国用户群和收入的估计;而彭博行业研究的分析师则认为其估值约为 300 亿至 350 亿美元——该部门曾表示这一估值“由于是被迫出售而有所折价”。 若考虑到算法等核心技术,TikTok 的估值可能更高,甚至达到 2000 亿美元。其母公司字节跳动的估值则在去年去年12月被软银集团旗下的愿景基金调整提高至4000亿美元以上。 TikTok此次的做法——要求用户下载独立的新应用在业内并不常见,这么做可能面临一定的用户流失风险。但推出新版本的 TikTok 应用可能有助于解决部分关于数据安全的争议,符合美国对该应用的合规要求。 TikTok 在美命运走向何方 自2019年美国政府开始对 TikTok 进行国家安全审查以来,TikTok 已多次尝试解决数据安全问题,并在多个层面展开了抗争,但字节跳动面临的压力并没有因此缓解,而是愈发严峻。 2019 年 11 月,美国政府对 TikTok 母公司字节跳动收购 Musical.ly 进行了国家安全审查,关注点在于用户数据的处理和存储。 此后的几个月里,美国参议院多次举行听证会,推动立法禁止TikTok。到了2020年8月,时任总统特朗普签署了行政命令,要求TikTok在90天内剥离美国业务,并采取一系列限制措施。尽管这些禁令并未立刻生效,但美国外国投资委员会(CFIUS)紧接着对TikTok展开了更为严格的审查。 2021 年 6 月,拜登政府虽然撤销了特朗普时期的禁令,但实际上相关的施压和限制力度更为加强。 TikTok 过往尝试了多种努力试图解决问题。包括建立「透明度和问责中心」;成立内容顾问委员会;成立专门的美国数据安全公司(USDS),负责管理美国用户的数据; 实施名为「Clover」的数据隔离工程和「Texas」的数据安全工程,这两项计划的年度运营成本均达到了大约 10 亿美元;聘请具有美国背景的高管;与甲骨文(Oracle)达成协议,甲骨文将成为 TikTok 在美国的「可信技术提供商」,根据协议,甲骨文有权对 TikTok 美国的源代码进行安全检查。 过往的努力以及后来TikTok 为阻止提案所做的一系列努力以及抗争,随着美国国会通过这项法案,均以失败告终。 美国会听证会上 TikTok首席执行官周受资被反复盘问国籍|图片来源:视觉中国 2024年4月,美国国会通过立法,禁止或强制母公司字节跳动出售 TikTok——该法案后经总统拜登签署成为法律。 该法案要求字节跳动在 2025 年 1 月之前完成美国业务的出售。 在2024年12月,美国联邦上诉法院驳回TikTok的上诉,维持了要求字节跳动剥离TikTok美国业务的禁令,TikTok面临在2025年1月19日在美关停的风险。 在禁令生效前一天,TikTok 在美国正式停止服务,但随即在十余个小时后恢复了服务。在特朗普重返白宫之后,禁令生效日期连续推迟了三次。 1月20日,特朗普重返白宫,随即把期限延至4月5日,之后又延至6月19日,而在上个月,特朗普又将该期限延长至9月17日,届时新版 TikTok 应用预计将推出,并从应用商店下架现有版本。用户将被引导下载新应用,但目前尚不清楚这一提示将通过何种方式传达。 这项交易或将使TikTok在美国符合《保护美国免受外国对手控制应用程序法案》的要求,但是否符合美国法律仍存疑,报道称考虑到字节跳动是否愿意将算法等核心技术与美国买家共存疑享,一些私募股权公司对这一交易仍持谨慎态度。 无论 TikTok 最终能否延续在美「生命」,美国对于其数据安全的疑虑,及其与中国的关系,已经把这场博弈升华为全球化背景下国家与企业之间复杂的角力。 与此同时,TikTok 的坚持象征着对权力与压力的抵抗,也可能对未来科技行业的国际互动产生深远影响。一个问题是,新App的推出会是TikTok 在美国命运的转折点吗?
小米 YU7 正式交付首批车主,雷军跟车主合影 7 月 6 日消息,今天下午小米 YU7 正式交付首批车主,小米创办人、董事长兼 CEO 雷军为车主交付车辆,并合影、为车主开车门。 据官方信息,此次交付覆盖全国 58 个城市(注:官微暂未公布具体城市名单)。 上午 10:00 至 7 日晚上 24:00,小米 YU7 还开启了限时改配。锁单用户 (非准现车) 都可参与改配,如改配成功,将重新安排生产并重新计算预计交付时间。此次改配仅限 YU7 标准版 / Pro / Max 之间进行版本修改,或对 YU7 订单配置进行修改。 小米创办人、董事长兼 CEO 雷军在微博上披露了当前的改配情况:更多人改配到 Max 版,很多人改配颜色到影青色、珍珠白、流金粉。 小米 YU7 于 6 月 26 日晚正式发布,提供 YU7、YU7 Pro、YU7 Max 三种配置,售价 25.35 万-32.99 万元。该车开售 3 分钟大定突破 20 万台,1 小时大定突破 28.9 万台,仅 18 小时锁单量便突破 24 万台。(来源:CnBeta) 罗马仕、安克超 120 万台充电宝召回后续调查:电池生产过程中混入金属异物 7 月 6 日消息,近期,充电宝召回事件成为社会关注焦点,罗马仕、安克创新等品牌相继召回多款产品,召回产品超过 120 万台,民航局也发布紧急通知,禁止旅客携带无 CCC 认证标识以及被召回型号的充电宝乘坐境内航班。 据央视新闻报道,根据目前调查的情况分析,这次两家企业实施召回的原因基本相同。市场监管总局质量发展局召回处一级调研员赵健透露,召回原因为电池在生产过程中混入金属异物,多次充放电,使用后存在产品过热甚至燃烧的安全隐患。 记者走访业内专家了解到,锂电池品质对于充电宝安全来说至关重要,在生产中混入金属异物可能有多种原因。 中国化学与物理电源行业协会移动电源分会秘书长许辉勇称,原材料的整个生产、运输、存储的过程中,有可能本身掺杂了金属物。在整个电芯(锂电池)的生产过程中,设备长时间老化磨损,可能会带来这些金属杂质,车间的洁净度不够,可能也会导致一些金属的杂质在生产过程中混入。 据专家介绍,金属异物是充电宝锂电池生产的核心管控指标,在生产过程中必须严格监控。 许辉勇还透露,电芯(锂电池)内部正负极当中有一个隔离膜,一般混入金属颗粒杂质之后,有可能会刺穿隔离膜,从而导致正负极的内部短路,最终触发整个电池热失控起火。(来源:IT 之家) 华为:HarmonyOS 游戏即将亮相 2025 ChinaJoy 7 月 6 日消息,华为终端官微今日发文宣布,HarmonyOS 游戏即将亮相 2025 ChinaJoy 展览会,其展区位于上海新国际博览中心 N3 馆 01 号(具体游戏阵容暂未公布)。 据了解,以「聚・你所爱」为主题的 2025 年第二十二届 ChinaJoy,将于 8 月 1 日至 4 日如期举办。目前展会各项筹备工作正有序加速推进。累计 743 家企业报名参展,其中外资企业 237 家,来自美国、加拿大、英国、德国、日本、韩国等 37 个国家和地区,外资占比达 31.8%。 本届 ChinaJoy 联合官方指定票务平台——大麦、票星球、支付宝蓝花火、携程、B 站会员购及官方微信小程序「CJ 魔方」,分三轮开启门票售卖(来源:CnBeta) OpenAI 招聘主管点名批评 Meta:挖角手段让人闻到一股「绝望的味道」 7 月 6 日消息,OpenAI 招聘主管 Joaquin Quiñonero Candela 日前在 X 上点名 Meta,批评其挖角方式过于激进。他透露,Meta 向 OpenAI 员工开出高薪职位,但这些 offer 只有短短几小时的有效期,员工几乎没有时间与主管沟通。他直言这种行为「不道德」,并称「让人闻到一股绝望的味道」。 Candela 写道:「我理解讲求效率,但不能拿截止时间当武器。」不过他随后淡化了「不道德」的措辞,表示不想显得道德高人一等。 Meta CEO 扎克伯格的挖角目标不止 OpenAI,还盯上了由 OpenAI 联合创始人苏茨克维创办的新创公司 Safe Superintelligence(SSI)。据 CNBC 援引知情人士消息,SSI 曾是 Meta 的潜在收购对象之一。今年 4 月,SSI 估值高达 320 亿美元(注:现汇率约合 2293.76 亿元人民币)。(来源:CnBeta) 华为盘古团队回应开源模型抄袭:严格遵循开源许可证的要求 近日,网络上有声音质疑华为盘古大模型涉嫌抄袭阿里巴巴通义千问模型。7 月 5 日,华为盘古 Pro MoE 技术开发团队发表声明称,盘古 Pro MoE 开源模型是基于昇腾硬件平台开发、训练的基础大模型,并非基于其他厂商模型增量训练而来。 开发团队称,盘古 Pro MoE 开源模型部分基础组件的代码实现参考了业界开源实践,涉及其他开源大模型的部分开源代码。「我们严格遵循开源许可证的要求,在开源代码文件中清晰标注开源代码的版权声明。这不仅是开源社区的通行做法,也符合业界倡导的开源协作精神。我们始终坚持开放创新,尊重第三方知识产权,同时提倡包容、公平、开放、团结和可持续的开源理念。」(来源:贝壳财经) 累计亏损超千亿元,蔚来李斌最新回应:钱都亏在明处,财报非常干净 据蔚来创始人、董事长、CEO 李斌 7 月 6 日上午在微博的直播,李斌和吴晓波以及近百位企业家参观访问了合肥蔚来先进制造新桥二工厂。 在参访过程中,李斌表示蔚来一直以来的底色是技术创新,累计研发投入达到 600 亿元。 他谈到,蔚来是全球唯一的在三地上市的汽车公司,蔚来财报里把研发投入计成当期费用钱都亏在明处,资产负债表非常干净。 李斌近期多次提及蔚来将于今年第四季度实现盈利的目标。 在 2025 上海车展期间,李斌表示,「2025 年是蔚来的产品和技术收获大年,技术量产上车、销量提振可以提高毛利率,再加上管理层面坚定推进降本增效,所以蔚来经营表现会逐个季度得到改善,我们很笃定第四季度会实现盈利。」(来源:极目新闻) TikTok 为美国开发新版应用 9 月上线,有重大变化? 据科技网站 The Information 报道,知情人士称,TikTok 正在为美国用户开发一个新版应用。报道称,TikTok 已制定计划,将于 9 月 5 日在美国应用商店上线新版应用。TikTok 用户最终必须下载新版应用,才能继续使用该服务。现有应用预计可使用至明年 3 月,但这一时间表仍可能发生变化。 上月,美国总统特朗普将字节跳动出售 TikTok 美国业务的截止期限延长到了今年 9 月 17 日。 The Information 还指出,TikTok 新版应用将解决美国的安全顾虑。一个由非中国科技公司组成的财团预计将收购 TikTok 美国业务。参与此次交易的公司包括美国公司甲骨文,不过 TikTok 母公司字节跳动将保留少数股权。 截至发稿,TikTok 尚未回应置评请求。(来源:CnBeta) Netflix 发布《赛博朋克:边缘行者 2》先导预告片,CDPR 联合扳机社打造 7 月 6 日消息,昨日 CDPROJEKT RED 在 Anime Expo 2025 上宣布《赛博朋克:边缘行者 2》正式开启制作,与 TRIGGER 扳机社共同打造,并将登陆 Netflix。 今日,Netflix 发布了一段一分钟的《赛博朋克:边缘行者 2》先导预告,其中包括大量《赛博朋克:边缘行者》第一季的画面。 大卫已逝,但夜之城永不停歇。 《赛博朋克:边缘行者 2》将带来一个全新的独立 10 集故事,延续《赛博朋克 2077》的世界观——一段关于救赎与复仇的残酷传奇。在这座因暴力而闪耀的城市里,一个问题始终萦绕:当世界被浮华蒙蔽双眼,你究竟要付出何等代价,才能让自己的故事被人铭记? 据 CDPR 介绍,本季由导演五十岚海(《赛博朋克:边缘行者》《SSSS. 古立特》)倾力打造,以大胆的影视化风格呈现,他也是《边缘行者》第一季第六集《烈火之女》(Girl on Fire)的导演。 《赛博朋克:边缘行者 2》主角设计由菅野一期(《普罗米亚》《赛博朋克:边缘行者》)操刀;剧本团队包括回归的大冢雅彦(《天元突破红莲螺岩》《普罗米亚》)与雨果奖得主 Bartosz Sztybor。(来源:IT 之家) 王化:「传小米与徕卡即将终止合作」是胡说 7 月 6 日消息,今日有传闻称,小米与徕卡的合作关系即将结束。 对此,小米公关总经理王化回应称:「上次是 2023 年 6 月 1 日,番茄发了个微博说小米 14 就是最后一代了。我转发了文案搭配的是「这就胡说了」,这次居然进阶了,来了个据报道,还有作者…… 我的回复也需要进阶,请大家笑纳:这还是胡说。」 这并非小米与徕卡合作首次遭遇谣言。早在 2023 年 6 月,就有传闻称小米 14 系列将是双方合作的最后一款机型,当时王化便以「这就胡说了」直接辟谣。(来源:IT 之家) MIT 团队推出首台芯片级 3D 打印机:比硬币还小,以纯光固化树脂技术实现手持打印 7 月 6 日消息,麻省理工学院(MIT)与得克萨斯大学奥斯汀分校联合开发出了全球首款芯片级 3D 打印机原型。相关成果已发表于《自然》子刊,团队下一步将开发可单步全息固化的光子芯片系统。 据介绍,原型芯片搭载 160 纳米厚光学天线(普通纸张约 10 万纳米厚),整体尺寸甚至小于 25 美分硬币,可通过毫米级光子芯片发射可重构光束,使树脂在可见光波长照射下快速固化成型。 这款概念验证设备由单枚光子芯片构成,无任何活动部件。芯片表面集成微米级光学天线阵列,通过操控光束射入特制树脂槽。 据介绍,这种树脂经过特殊优化设计,可在特定可见光波长下迅速固化。研究人员成功打印出包括「M-I-T」字母在内的任意二维图案,全程仅需几秒时间。后续,科研人员希望使树脂槽底部的光子芯片发射三维全息可见光,从而一步完成物体整体固化。这种便携设备有望应用于医疗定制(如手术器械部件)与工程现场快速原型制作。(来源:CnBeta) 针对台积电亚利桑那工厂的人力资源诉讼已扩大到 17 名原告 针对台积电亚利桑那厂的一系列诉讼最初于去年提起,现已扩大到 17 名原告,他们指控该公司存在一系列歧视性和不安全的做法,原告均为美国公民,他们指控台积电在亚利桑那州工厂工作期间对他们存在歧视。这些指控包括在招聘过程中偏向中文能力、对非台湾员工的惯常偏见以及不安全的工作条件。 针对台积电的诉讼最初于 11 月由 12 名原告提起,并于 6 月再次提起,新增 15 名原告。这些原告均为台积电亚利桑那州工厂的前任或现任员工,他们在诉状中指控该公司存在多项违反安全规定和歧视的行为。 原告声称,台积电倾向于在亚利桑那州工厂聘用台湾或中国大陆的应聘者,因为他们认为「台积电台湾公司的人力资源团队向美国人力资源部门发送了美国台湾/中国大陆应聘者的简历,这些应聘者通常已经具备在美国工作的能力,并且已经经过审查并认为适合聘用。」 据他们称,台积电歧视美国员工的一个主要方式是语言。诉讼称,不仅「根据台湾总部的指示,台积电招聘会的邀请函必须使用中文,以便只吸引符合台积电偏好种族和国籍的学生」,而且为了排除非东亚裔人士,台积电的关键会议也使用中文进行。 台积电亚利桑那州的员工经常被派往台湾接受培训,之后才能开始工作。诉讼称,这些员工「经常被台湾同事排斥,因为台湾同事在他们面前只说国语」。此外,投诉人还声称,这些员工「受到管理层的贬低,工作环境充满敌意」,并且「经常被排除在业务讨论之外,因为谈话通常用国语进行,商业文件也通常用中文书写」。 投诉人称,台积电对国语的偏好也体现在美国的招聘信息中。北美、亚利桑那州和华盛顿州的职位空缺通常会在招聘启事中补充说明,『国语/中文』是必需的、优先的或『加分项』。 (来源:CnBeta)
小米 YU7 今日起开启交付,全国 58 城用户将喜提新车 小米汽车官微昨日发文宣布,小米 YU7 明天将正式开启全国交付,覆盖全国 58 个城市(官微暂未公布具体城市名单)。 6 日上午 10:00 至 7 日晚上 24:00,小米 YU7 还将开启限时改配。锁单用户 (非准现车) 都可参与改配,如改配成功,将重新安排生产并重新计算预计交付时间。此次改配仅限 YU7 标准版 / Pro / Max 之间进行版本修改,或对 YU7 订单配置进行修改。(来源:IT 之家) 降价奏效,苹果 iPhone 二季度在国内销量实现两年来首次增长 近日,研究机构 Counterpoint Research 的一份报告显示,预计 2025 年第二季度中国智能手机销量同比略有上升,华为和苹果引领增长。 得益于 iPhone 16 系列促销活动,尤其是 iPhone 16 Pro 和 iPhone 16 Pro Max,苹果 5 月份实现销量增长。 也正是靠着降价这一步棋,今年第二季度,苹果 iPhone 在中国的销量实现两年来首次增长,不过反观竞争对手华为(增速 12%),增速仍要远超他们的 8%。(来源:快科技) 英伟达 GeForce 宣布参展 BW2025,RTX 5080/5070 公版显卡限量发售 英伟达昨日发布公告,宣布 7 月 11 日-7 月 13 日「GeForce 神秘登陆 Bilibili World 2025」。 英伟达表示,届时将开放 RTX5080/5070 公版显卡售卖。自 7 月 5 日起,用户可登录 B 站 App 在线预约(打开 bilibili 右下角「我的」,点击推荐服务「BW 乐园」,按页面指示完成预约)。 除此之外,英伟达还将举行多场游戏试玩会,包括暂未发售的《明末:渊虚之羽》(7 月 13 日),届时将有超过 30 名 UP 主陆续空降展台,与玩家展开现场直播、合影互动、水友赛等活动。(来源:IT 之家) Meta 继续为 AI 业务「招兵买马」,计划收购声音克隆企业 PlayAI 部分资产 彭博社六月末报道称,Meta 正与 AI 声音克隆企业 PlayAI 展开深入谈判,计划收购这家小型初创公司的技术和部分员工。不过根据知情人士的消息,这笔交易尚未最终确定,仍可能发生变化。 PlayAI 技术和人员资产的加入将进一步丰富 Meta 在 AI 领域的储备,尤其是在 AI 助手和智能眼镜等软硬件的语音功能方面,提升与 OpenAI、谷歌在这一方面的竞争力。 与 PlayAI 的谈判是 Meta 的 AI「买买买、挖挖挖」行动的最新篇章之一:就在上个月该企业以 143 亿美元(现汇率约合 1024.91 亿元人民币)收获 Scale AI 近半数股权同时带走其创始人收获 S;近来又有消息传出 Meta 斥巨资从 OpenAI 挖角多位研究人员。(来源:IT 之家) 美团即时零售日订单已突破 1.2 亿,餐饮订单占比过亿 据美团内网公布信息显示,截至昨日 22 时 54 分,美团即时零售当日订单已经突破了 1.2 亿单,其中,餐饮订单已超过 1 亿单。 值得注意的是,就在当晚 20 时 45 分,美团内网曾显示即时零售日订单突破了 1 亿。这也意味着,在 2 个小时的时间内,美团已产生了超过 2000 万笔订单。考虑到周末夜宵时段仍然是外卖高峰期,这一数据目前仍在增长中。 7 月 5 日是暑期消费旺季正式开启后的第一个周末,也是外卖消费的传统促销季。公开报道显示,去年夏天美团的订单峰值超过了 9000 万单。(来源:雷锋网) 英特尔前 CEO 帕特·基辛格承认他低估了 AI 的影响 今日,日经亚洲的一篇报道称,英特尔前首席执行官帕特·基辛格承认,在他任职期间,公司在人工智能方面的做法乏善可陈。 他说,「我和英特尔的几乎所有人都低估了人工智能的影响。纵观今天的人工智能芯片,不难发现芯片在人工智能计算方面的性能不断提升,但这些芯片的功率效率却三代都没有改变。」 英特尔对人工智能的犹豫在基辛格最初认为「推理」就是一切的时候就更加明显了,当时 NVIDIA 和其他公司正忙于模型训练。当时英特尔的前首席执行官声称,公司已准备好抓住推理需求的机遇,甚至将 CUDA 称为「护城河」。尽管如此,我们从未在人工智能领域看到英特尔有任何产品能够与 NVIDIA 竞争,除了他们的 Xeon 服务器 CPU 这种统治市场数十年的产品。(来源:cnBeta) 3C 认证充电宝销量猛增,部分商家库存告急 7 月 5 日消息,据央视财经报道,近期,「充电宝召回」事件引发广泛关注,3C 认证已成为消费者衡量充电宝品质的关键指标,国内部分机场也加强了对充电宝 3C 标识的查验力度。 记者探访发现,线下市场和电商平台带有 3C 标识的充电宝产品销量都出现增长。记者在几大电商平台发现,在售的充电宝产品均已带有 3C 认证标识,无 3C 认证的充电宝已经被禁止上架销售,部分商家库存告急。(来源:IT 之家) 谷歌 DeepMind、普林斯顿大学推出新 AI 模型,可精准预测人类行为 7 月 5 日消息,据外媒 iXBT 4 日报道,德国 Helmholtz AI 研究计划、谷歌 DeepMind、普林斯顿大学等机构的研究团队近日联合发布了一项重要成果:一款名为 Centaur 的通用型 AI 模型,首次实现了在大规模认知任务中预测人类行为的能力。 Centaur 基于 700 亿参数的 Llama 3.1 语言模型,并通过名为 Psych-101 的数据集进行了专门训练。该数据集汇集了来自 6 万名参与者、覆盖 160 个实验的超过 1000 万个决策,涵盖了感知、记忆、逻辑推理、道德判断及不确定性决策等领域。凭借这一训练方式,Centaur 能够在未接触过的新情境下做出精准预测。 目前,Psych-101 数据集和 Centaur 模型已全部开放,未来还计划拓展应用至儿童心理学、精神病学等更多领域。(来源:IT 之家) 领克 900 2.0T 探索版汽车启运:2.0T 发动机、全球首搭 NVIDIA Thor 芯片 领克汽车官方公众号昨日发文宣布,领克 900 2.0T 探索版汽车正式启运,将陆续抵店。 据介绍,领克 900 2.0T 探索版汽车搭载 2.0T 发动机(VEP4)+ 3DHT Pro(P1+P2)+ P4*2「1+3」动力构型,支持 4.3s 零百加速,综合续航 1443km。 该车采用 GVMC 域控制底盘配合矢量机动技术,实现 ±10° 后轮转向,转弯半径小于 5 米,支持蟹行模式,可避开周边障碍。 该车还支持寰宇一体卫星通信,可一键直连天通卫星,支持 24H 无盲区守护、紧急情况时自主发起卫星救援、5~10 米定位精度、360° 无死角安全支持、中国全域覆盖等特点。(来源:IT 之家) Photonmatrix 便携式激光驱蚊器海外众筹:每秒可消灭 30 只蚊子,黑暗中也能工作 科技媒体 Tom's Hardware 7 月 4 日发布博文,报道称在 Photonmatrix 便携式激光驱蚊设备正在 IndieGogo 平台众筹,起售价为 498 美元(现汇率约合 3569 元人民币),每秒最多可以消灭 30 只蚊子,且在黑暗中也能工作。 Photonmatrix 的一大特点是能够在黑暗中工作,有效范围可达 6 米(19.7 英尺),并且可以使用充电宝供电,最长可持续 16 小时。 这款设备分为基础版和专业版,基础版的有效范围是 3 米(9.8 英尺),售价为 498 美元而专业版则翻倍至 6 米(19.7 英尺),专业版的价格也因此高出 200 美元,达到 698 美元,不过早鸟价可以便宜 40 美元。 众筹目标是 2 万美元(现汇率约合 14.3 万元人民币),目前已超过这一目标的 1300%。尽管资金水平充足,但这款产品目前仍处于原型开发阶段,距离商业生产还有不少挑战。(来源:IT 之家) 温网使用 AI 判罚引选手不满,组委会回应「系统比人工更可靠」 据英国《卫报》4 日报道,温布尔登组委会为使用 AI 司线系统辩护,回应英国一哥杰克・德雷珀对其「并不百分百准确」的质疑。 德雷珀在第二轮不敌 36 岁的前温网亚军马林・西里奇后表示,人工司线被取消令人惋惜。当地时间周四的比赛中,现年 23 岁的德雷珀对采用 AI 技术的鹰眼系统表现出不满。在第四盘的一次争议判罚中,对手发球被判界内,他当场摊手质疑。 德雷珀在赛后表示:「老实说,我不认为这项技术真的完全准确。今天有几个球,系统显示在场地上留下了印记,但从粉末痕迹来看根本不可能。我想它终究不是完美的,这种偏差可能只有几毫米。」 赛事总监杰米・贝克表示:「现在 ATP 巡回赛强制采用实时判线技术,其他两项大满贯也已用上四五年了。」其认为,这也意味着相关技术越来越成熟,认证流程也更加专业。「从准确性到稳定性,如今整套系统的表现可以说达到了网球历史上的最佳水平。」(来源:IT 之家)
小米 AI 眼镜毫不意外地「卖爆」了。 根据小米官方账号的设备激活数据显示,截止 2025 年 7 月 2 日,小米 AI 眼镜的实际用户激活数量已突破三万台。这个数字,区别于模糊的出货量或销量,它直接反映了已经拿到产品并开始使用的真实用户规模,是硬件销售中最重要的活跃用户指标之一。 这一成绩标志着,在经历了一众创业公司的前赴后继和市场摸索后,中国的 AI 眼镜赛道,终于迎来了一位重量级玩家的入场,并且通过强势的品牌效能,正在将 AI 眼镜这一概念普及给更多普通数码用户。 小米 AI 眼镜外观 | 图片来源:极客公园 这股强劲的势头,在中国 AI 眼镜行业引发了剧烈的涟漪。如果说此前的智能眼镜是少数极客和先行者的「浅滩游戏」,那么小米的入局,则是将整个行业带入了充满变数与机遇的「深水区」。 01 为何是小米? 小米的成功并非偶然,它的背后,是整个行业在过去一年多时间里的探索、试错与期待。 中国 AI 眼镜市场中,最典型的负面案例,是曾被寄予厚望的闪极。 作为一家在数码配件领域以设计和「反性价比」著称的新锐品牌,闪极曾抢占先机,试图打造国产版的 Ray-Ban Meta。闪极拍拍镜描绘的功能蓝图——AI、拍摄、记忆、回溯,以及 999 元的「共创价」,一度让市场为之振奋。 然而,理想与现实之间横亘着巨大的工程化鸿沟。从 2024 年 5 月预售到 2025 年 1 月才陆续发货,长达 7 个月的等待消磨了用户的首批热情。而真正到手的产品,更是暴露出一系列问题:有用户反映「新品到货双侧镜腿就不对称,而且镜腿掉漆」,更有甚者,在一个月内连续两次遭遇无法开机、充不进电的致命缺陷。 定价 999 元 的闪极眼镜产品在上市之后存在诸多品控问题 | 图片来源:小红书 作为一款拍照眼镜,其核心的拍摄功能也备受诟病,画质被用户形容为「千禧年的复古画风」,存在严重的彩噪、色偏和模糊问题。发布会上承诺的视频回溯、蓝牙通话等功能也未能如期上线。 一位阿里通义大模型团队的高管曾透露,闪极团队对 AI 的理解还停留在「接入个 API 就行了」的层面,严重低估了从模型到眼镜应用的整合难度。 硬件选型上的失误更让产品雪上加霜。闪极为拍拍镜搭载了紫光展锐 2020 年发布的智能手表芯片 W517,试图用一颗为手表设计的芯片,去支撑一款需要更长续航、更轻重量、并接入多种大模型的智能眼镜,其调教难度可想而知。 闪极的困境,是整个 AI 眼镜硬件行业从 0 到 1 所面对巨大挑战的缩影——它暴露了创业公司在供应链整合、品控、软件调优和工程化能力上的短板。 在这样的背景下,小米作为一家成熟的、年出货上亿台设备的硬件巨头,其优势被无限放大。强大的供应链议价能力、深厚的硬件工程经验、成熟的质量控制体系以及完善的软件开发团队,共同构成了小米 AI 眼镜成功的基石。 它不需要像创业公司那样在黑暗中摸索,而是在一条已经被验证的道路上,用硬件公司最擅长的方式,做出一款完成度更高、体验更稳定的产品。 02 产品的取舍与再中定义 小米 AI 眼镜虽被定调为「面向下一个时代的个人智能设备」,但其产品本身并不「未来」,甚至被不少 XR 媒体评价为「乏善可陈」。 小米 AI 眼镜重约 40g,采用了经典的 D 型方框设计,官方宣称「专为亚洲脸型优化」,佩戴时不易产生明显的压迫感。尽管有评测认为其镜框和镜腿相较于设计更为时尚的 Ray-Ban Meta 略显粗大呆板,但小米通过提供经典黑、半透明玳瑁棕、鹦鹉绿等多种配色,以及支持全渠道配镜服务,最大限度地满足了日常佩戴的时尚属性需求。 小米 AI 眼镜外观 | 图片来源:极客公园 其硬件设计部分的最大的设计亮点,无疑是「电致变色」版本的推出。用户通过双指划动镜腿,即可在 0.2 秒内实现镜片颜色的多档调节。尽管该功能有时需要多次调试才能成功,且需额外支付 700 至 1000 元的溢价(怒喵科技创始人李楠曾评价「这个技术如果真的想普及,不能这么收割消费者」),但它依然凭借炫酷的科技感吸引了大量订单,目前在多个电商平台均已显示「到货通知」。 第一人称视角(POV)拍摄是当前 AI 眼镜最核心的应用场景。小米选择以更高的分辨率作为突破口,其横屏视频在清晰度和画幅上超越了 Ray-Ban Meta 的竖屏格式,同时也更贴合主流平台的观看习惯。 然而,这种对画质的追求似乎牺牲了部分的稳定性。在运动场景中,小米眼镜的画面拖影相较于防抖性能卓越的 Ray-Ban Meta 更为明显。在交互层面,两者都提供了快捷的操控方式,但细节上的差异体现了不同的打磨思路。小米通过实体按键实现了迅捷的 0.8 秒快拍,但在语音控制上,却缺少了结束录制的指令,必须依赖手动操作。 相比之下,Ray-Ban Meta 的语音交互则更为完整,支持全程语音启停,提供了更沉浸的「解放双手」体验。 此外,作为产品体验的灵魂,AI 的实现路径也直接决定了用户体验的内核。小米与 Meta 选择了两条截然不同的技术路线。 Meta 选择将 AI 模型内置于设备端侧,实现了几乎零延迟的飞快响应。然而,对中国用户来讲,网络限制使其核心的多模态 Meta AI 功能在中国大陆地区无法使用。 目前,小米在 AI 眼镜上选择了一条更务实的「云端」路线,将其 AI 能力完全绑定于手机上的小爱同学。 这种做法的优势在于能够调用强大的云端算力,从而实现会议纪要转写、多语言同声传译等复杂且高度本土化的实用功能。但其代价是,每一次交互都依赖于手机的蓝牙连接,带来了大约两秒的延迟。 03 百镜大战与巨头的野心 小米的入局,不仅是推出了一款产品,更是向整个行业发出了一个明确的信号:AI 眼镜的时代,真正开始了。 Ray-Ban Meta 的成功为所有后来者提供了范本和目标。其销量突破 200 万台,合作方依视路陆逊梯卡更是计划到 2026 年底将年产能提升至千万台。这一成功,源于 Meta 的技术与雷朋经典设计的完美结合,以及依视路陆逊梯卡遍布全球的强大线下渠道。 Meta 与依视路的合作证明了,只要解决了设计、佩戴和核心功能问题,消费者愿意为 AI 眼镜买单。 Meta 的野心不止于此。它计划推出更多基于 Oakley 等旗下品牌的联名款,并逐步将 Ray-Ban Meta 打造为一个开放平台,允许第三方开发者为其开发应用。 Meta Oakley 眼镜外观 | 图片来源:Meta 扎克伯格在内部会议上呼吁:「我们基本开创了这个品类,竞争对手尚未真正进场,但他们终将到来……眼下正是我们全速推进的绝佳时机。」 但在国内,小米面对的是一个蓄势待发、但用户接受程度相对更低的战场。除了前述的闪极,雷鸟创新推出的 V3 AI 眼镜主打 4K 拍摄和 39g 的超轻重量;Rokid Glasses 则凭借其显示功能,数次在社交媒体上「出圈」,在前期同样承担了不少教育市场的成本。 除了产品本身,一场围绕设计与渠道的合纵连横早已展开,博士眼镜、宝岛眼镜等传统眼镜巨头,纷纷与雷鸟、华为、魅族等科技品牌达成合作,试图抢占线下入口。 此外,作为事实上的普及者,小米 AI 眼镜仍然在很多地方起到了教育市场的作用:许多消费者在体验小米 AI 眼镜时都会问:「为什么不能直接在镜片上显示字幕?」 这背后,是 AI 眼镜行业在当前技术阶段产生分水岭的缩影:真正的 AR 眼镜,需要在轻薄的镜片上实现高亮度的信息显示,并由一颗低功耗芯片进行实时运算,即使是目前已经采用自研芯片的小米 AI 眼镜,也没有在当前的试水阶段采用这种设计。 Counterpoint Research 的副总裁 Neil Shah 指出,AR 眼镜最难的部分是占系统总功耗 60% 的显示模组和 30% 的运算芯片。今年六月底,罗永浩在投身 AR 领域、烧掉大量资金后也在极客公园举办的 AGI Playground 大会上坦言,十年内 AR 眼镜都不太可能实现理想的商业化。 因此,无论是小米还是 Meta,都务实地选择了「眼镜+相机+音频+AI」这一形态,作为通往终极 AR 眼镜的过渡阶段。这既是技术上的妥协,也是商业上的明智选择。 但凭借小米的品牌势能,AI 眼镜的概念迅速从科技圈渗透到大众消费市场。三万台的激活量,意味着有三万个活跃的种子用户正在通过社交分享、口碑传播,让更多人了解并对这一新品类产生兴趣。 一款来自巨头、且能够大规模出货的产品,为上游供应商提供了明确的需求和方向。无论是镜片电致变色技术、微型摄像头模组,还是特种转轴和低功耗芯片,都有了可以为之奋斗和迭代的量产目标。一个稳定、健康的产业链生态,正围绕着这些头部产品加速形成。 小米的成功入局,无疑会刺激更多科技和互联网大厂加速推出自己的产品。可以预见,接下来,来自百度、字节跳动等公司的竞品也将陆续登场。2025 年下半年的 AI 智能眼镜市场,将从创业公司零星点火的阶段,正式进入巨头们正面厮杀的激烈竞争格局。 04 通往「下一个 iPhone」的漫长征途 小米 AI 眼镜的表现,决定着它能否在中国市场抢占先机,至少从目前的首销销量来讲,小米 AI 眼镜作为大厂中入局最早、最受期待的选手之一,已经抢占了重要的先机。 小米 AI 眼镜外观 | 图片来源:极客公园 但它远非这场竞赛的终点:从长远看,AI 眼镜的终极目标,的确仍然是成为继智能手机之后的下一代个人计算平台。这条路道阻且长,需要攻克显示、功耗、交互、生态等无数技术难关。但小米 AI 眼镜的火爆销售证明,大门已经被推开,市场已经准备好迎接变革。 在这场没有人愿意错过的、通往「下一个 iPhone」的竞赛中,沿着 Meta 的路线,小米已经率先看见了第一个弯道。
员工曝罗马仕已通知全面停工停产,工资只发到 6 月份 受充电宝召回事件影响,罗马仕经营陷入困境。7 月 3 日,多名罗马仕员工向界面新闻记者证实,自 7 月 1 号开始,罗马仕内部已经陆续通知员工全面停工停产,正式公告还没出,员工工资只发到 6 月份。 7 月 2 日,罗马仕公司发生工商变更,雷社杏卸任法定代表人、董事、经理,由雷杏容接任,此次变更不足三个月。 针对法定代表人变更等事宜,罗马仕方面曾回应媒体称,目前公司正在安排整改,先梳理内部,公司全部精力都聚焦产业链自检,为新品做准备。(来源:界面新闻) 超越苹果:英伟达周四盘中一度突破 3.92 万亿美元,创史上最高市值纪录 7 月 4 日,据路透社报道,周四盘中交易,英伟达市值一度达到 3.92 万亿美元,短暂超过了苹果的创纪录收盘市值,成为史上最具价值的企业。 周四早盘交易,英伟达股价一度上涨 2.4% 至 160.98 美元,市值达到 3.92 万亿美元,超越了苹果在 2024 年 12 月 26 日创下的 3.915 万亿美元的收盘市值纪录。 然而,截至周四收盘,英伟达股价涨幅回落至 1.3%,最终报收于 159.34 美元,市值为 3.89 万亿美元,距离苹果的纪录还有一步之遥。 微软股价周四收盘上涨 1.58%,市值为 3.7 万亿美元,排在第二。苹果股价上涨 0.52%,市值为 3.19 万亿美元,排在第三。(来源:IT 之家) 首款车尚未开售,索尼、本田合作电动汽车项目年亏损已超 3.6 亿美元 7 月 3 日消息,据彭博社 6 月 30 日报道,索尼、本田合作推出的电动车项目年度营业亏损扩大逾一倍,达到约 3.62 亿美元(注:现汇率约合 25.93 亿元人民币),而双方合作的首款车型 Afeela 的上市发布还要等一段时间。 索尼本田移动公司在周一发布的财报中披露,截至今年 3 月的财年亏损为 520 亿日元(现汇率约合 25.91 亿元人民币),较上一财年的 205 亿日元大幅增加。(来源:IT 之家) 特斯拉 6 月国内销量环比上涨 59%, 创二季度单月最高国内销量 7 月 3 日消息,2025 年 6 月特斯拉国内销量 6.1 万辆,环比上涨 59%,同比上涨 3.7%,创下二季度单月最高国内销量。据乘联会最新数据显示,特斯拉上海超级工厂第二季度交付量为 19.1 万辆,较一季度环比增长 10.98%。 乘联分会数据显示,6 月全国新能源乘用车厂商批发销量 126 万辆,同比增长 29%,环比增长 3%。其中,特斯拉中国 6 月新能源乘用车批发销量 71599 辆,排名第 4。 虽然国内迎喜报,但特斯拉二季度全球交付量创造史上最大跌幅,共交付 384122 辆,同比下降 13.5%,且低于分析师预期的 38.7 万辆。(来源:财联社) 小米 YU7「车规级」纸巾盒被骂卖太贵,雷军回应 小米 YU7 上周发布上市,起售价为 25.35 万元,在发布会当晚仅用 3 分钟就突破了 20 万台大定量,数据极为夸张,刷新了行业认知。 小米 YU7 是围绕小米人车家战略的产品,车上预留了多个 IoT 硬件适配口以及配件放置位,其中,光磁吸点位就多达 16 个,甚至在中控屏幕后面的仪表台上,都专门为纸巾盒做了一个磁吸点。 该点位配套的「车载磁吸纸巾盒」目前已经在小米汽车 App 商城上架,售价 169 元。 不过,大众普遍认为这个纸巾盒定价过于昂贵,并在网上开始热议起来,昨晚雷军在返场直播中回应了这个问题。他表示,这个纸巾盒在设计的时候,材质、制作工艺比较复杂,刚开始过不了车规的测试。后来又改材质和胶,弄得成本巨高无比。大家可能不知道,它放的那个位置,我们在吐鲁番的时候是 90℃,一般胶的盒子肯定给你晒化了。 最后,雷军还是觉得定价过于高昂,表示会逼内部进一步去降低成本。(来源:数字尾巴) 西门子称美国已取消对中国芯片设计软件的出口限制 7 月 3 日消息,德国西门子股份公司收到美国政府的通知称,美国已取消对中国芯片设计软件的出口限制。根据公司声明,这家德国供应商已恢复中国客户对其软件和技术的全面访问。 西门子公司就此回应称,近期获美国商务部工业与安全局(BIS)通知,该局于 5 月 23 日致函西门子所提出的对中国客户出口电子设计自动化(EDA)软件及技术的管制限制现已不再适用。据此,在遵守适用出口管制法律法规的前提下,西门子已恢复对出口管制分类编号(ECCNs)为 3D991 和 3E991 的软件与技术的完整访问权限,并已恢复对中国客户的销售和技术支持服务。 「175 余年来,西门子始终致力于为包含中美两国在内的全球客户提供支持。当今全球贸易环境快速变化,我们深知这些变化可能会为客户带来不便,并对客户给予的耐心和理解表示感谢。」该公司称。(来源:澎湃新闻) 制造问题搞不定,苹果可折叠 iPad 折戟:需求也不足 7 月 3 日消息,继 iPhone 之后,苹果可折叠产品系列的下一步无疑是 iPad,但遗憾的是,最新消息称苹果遇到了一系列问题,迫使其不得不为可折叠平板的开发进程踩刹车。 报道称,苹果公司也一直在探索在推出 iPhone 的同时推出可折叠 iPad,不过该公司已决定暂时停止这款最大的可折叠设备的研发。 业内专家将这一决定归因于制造困难、生产成本的增加,尤其是与柔性显示技术相关的成本增加,以及消费者对较大型可折叠设备的需求相对较小。(来源:快科技) 小红书辟谣被阿里收购:系谣言 7 月 3 日信息,今日在社交媒体上,有消息称,「内部消息称,小红书马上要被阿里收购了。」对此,新浪科技向阿里巴巴和小红书双方进行求证,小红书方面表示,「以上信息为谣言。」阿里方面截止发稿未回应。 早在 2019 年,就出现了针对阿里将收购小红书,且阿里系 HRG 已经进驻该公司的相关传言。对此,小红书高管曾公开表示,「是造谣,已发函至谣言的源头,将追责到底。」 公开信息显示,从 2013 年创立至今,小红书一共获得 7 轮融资,其历轮投资者包括腾讯、阿里巴巴、天图投资、真格基金和中信资本等,累计融资额超 9 亿美元。 近日,据外媒披露,金沙江创投一份标注为今年 3 月的内部文件显示,小红书估值已跃升至 260 亿美元,较 2023 年底的 170 亿美元增长超 50%,并超过其 2021 年创下的 200 亿美元历史峰值。(来源:新浪科技) 全球首款 L3 级算力 AI 汽车!小鹏 G7 上市,售价 19.58 万元起 7 月 3 日消息,今日晚间,小鹏汽车举行小鹏 G7 上市发布会,号称是全球首款 L3 级算力的超级 AI 汽车。 新车分为 602 长续航 Max 版、702 超长续航 Max 版、702 超长续航 Ultra 版三个版本车型,售价分别为 19.58 万元、20.58 万元、22.58 万元。小鹏 G7 此前已启动预售,预售价为 23.58 万元。 据介绍,小鹏 G7Max 版标配两颗 Orin-X 芯片,Ultra 版配备三颗图灵 AI 芯片,算力相当于 9 颗 Orin-X 芯片,有效算力大于 2200TOPS,是行业其他旗舰 3 倍以上。(来源:红星新闻) LiblibAI 正式推出 Lovart 国内版本「星流 Agent」 7 月 3 日,LiblibAI 正式推出 Lovart 国内版本「星流 Agent」,定位为一款面向中文创作者的智能设计拍档。产品延续 Lovart 海外版本的核心能力,支持自然语言生成整套设计物料,包含主图、海报、社媒封面、视频动画及 3D 模型等。系统已接入十余个主流大模型,支持图像、视频、声音、3D 的一站式生成与导出。目前星流 Agent 已在 PC 端及移动端同步上线。(来源:36氪) iPhone 17 Pro 新 MagSafe 设计曝光:圆形底部开口,适应背板苹果 LOGO 下移调整 7 月 3 日消息,科技媒体 majinbuofficial 昨日发布博文,报道称苹果公司在调整 iPhone 17 Pro 机型背面的苹果 LOGO 位置之外,还因此调整了 MagSafe 系统磁圈布局。 据此前报道,苹果今年推出的 iPhone 17 Pro 机型由于横向矩阵设计,因此苹果会调整后盖 LOGO 位置,向下移至靠近底部中心的位置,这也带来了磁圈布局调整。 MagSafe 系统自 iPhone 12 起就依赖精确的磁铁阵列来实现对齐和配件兼容。随着 iPhone 17 Pro 上苹果标志的下移,磁铁阵列也相应地移向底部中心。(来源:IT 之家) Grok 4 意外提前曝光,马斯克宣布「重写人类知识库」 7 月 3 日消息,马斯克旗下 xAI 的「重磅炸弹」Grok 4 提前泄露,有开发者在 xAI 控制台的源代码中意外发现了两个全新模型 Grok 4 和 Grok 4 Code。与此同时,xAI 刚刚完成了一轮 100 亿美元(约 716 亿人民币)的巨额融资。 Grok 4 被定位为「最新、最强大的旗舰模型」,官方宣称它在自然语言、数学和推理方面提供无与伦比的性能,堪称万能的完美之选。但马斯克的野心远不止于此,他提出了一个听起来就很「马斯克」的宏大目标:利用 Grok 4 的推理能力重写整个人类知识库,补充缺失的内容,纠正错误的知识,然后基于这个「纯净版」知识库重新训练 AI。 对此,Cohere 联合创始人 Nick Frosst 就担心 Grok 4 会不会变成「马斯克观点的放大器」。也有网友表示自己会通过收藏纸质书籍来保存人类知识的原貌,对抗 AI 的「修正」。(来源:量子位)
在 MONA M03 成为爆款之后,小鹏能持续在 KTV 蹦迪吗? 7月3日,一款被称为「AI智能家庭SUV」的小鹏G7正式上市了。新车共推出三个版本,售价在19.58万元到22.58万元之间。这次新增了602长续航Max,最终售价比预售价直降4万元。 此前的6月11日,小鹏G7亮相并开始预售。作为2025年小鹏首款全新车型,G7预售两大版本:Max版 / Ultra版,预售价仅需23.58万元起。 就在小鹏G7上市前一周,小米YU7上市后爆单,1小时拿下28.9万辆订单。两款车发布时间这么近,定位也有些类似地方,小鹏G7会不会被小米「碾压」?小鹏能否延续此前的高速增长攻势吗? 2200 TOPS 的 AI汽车 当车企进入一个细分市场时,除了要明确产品定位,还要看玩家有谁?G7所在的20 万到30万细分市场,已经是一个竞争充分的红海市场,其中特斯拉Model Y是那个「学霸」。 「围攻」特斯拉,是过去几年中国新能源市场的常见戏码。去年,乐道 L60、智己 LS6、极氪 7X等,就上演了「六大门派」围攻Model Y的戏码。但最终效果有限,特斯拉依然是细分市场的冠军。 特斯拉Model Y作为一个绕不开的角色,不管是发布会PPT,还是用户选车时,小鹏要如何与Model Y竞争呢? 它没有硬碰硬,而是亮出了自己的两大「秘密武器」:硬核科技和空间舒适。 我们先来看一下硬核科技,这里不仅是科技平权,更要「硬核」。这次发布会上,小鹏带来了702km CLTC超长续航、全域800V高压SiC碳化硅平台、5C超充AI电池、追光全景抬头显示AR-HUD、天玑系统等。 小鹏汽车自研的图灵AI芯片 | 图片来源:小鹏汽车 其中,最受关注的是小鹏自研的图灵AI芯片。 据了解,小鹏G7的Ultra版本搭载了3颗小鹏自研的「图灵AI芯片」,总算力超过了 2200 TOPS,因此官方给 G7 的标签之一是第一款「具备 L3 级别算力」的 AI 汽车。G7的算力是行业主流旗舰的 3 倍到 28 倍,这让它能运行更复杂、更智能的AI程序。 不过,2200 TOPS的算力,并非全部用在辅助驾驶。具体是这么分配的:在辅助驾驶方面,用两块图灵AI芯片替代双英伟达Orin-X芯片;在座舱方面,小鹏采用图灵AI芯片+高通8295P,有效AI算力比行业旗舰大26倍。 小鹏用3颗自研芯片,释放出2200TOPS的算力,到底能否转化为用户体验呢?还是跟前几年类似又在「堆料」呢?对此,何小鹏表示,他们要做的是大模型的本地化部署。 在软件方面,小鹏采用了VLA-OL+VLM双架构,不依赖云端即可完成复杂场景决策。VLA (Vision-Language-Action) 模型,你可以把它理解成「行动决策大脑」。它不像只会背书的学生,而是像一个经验丰富的老司机。它通过摄像头看到世界,用AI去理解这个世界,然后做出最合理的行动。 而VLM (Vision-Language Model) 模型,则可以叫它「理解世界的大脑」。如果说VLA负责「怎么开」,VLM就负责「看懂了什么」以及「如何与你交流」。 简单来说,VLA掌管车的运动与行动决策,而VLM则负责理解与交流,是整车跟人交互OS的入口。 把家用SUV卷成「移动客厅」 在过去10年的发展过程中,小鹏汽车就经历了一次从「偏科生」到「全能选手」的转变。 几年前,当上百家新公司涌入新能源汽车这个赛道时,竞争异常激烈。当时的小鹏就像一个「偏科生」,它选择将自己最擅长的「智能化」这一科做到极致,希望靠着这个「独门绝技」脱颖而出。这在当时是聪明的策略,也确实让它活了下来。 但是,随着时间推移,大家发现,买车就像我们选择一个朋友或伙伴,不能只看他一方面。如果一辆车虽然很「聪明」,但在空间、舒适度这些日常最常用到的地方却表现平平,很多人可能还是会犹豫。 何小鹏也意识到了这一点,尤其是在经历了一些波折后。他开始明白,一辆好车,不能有明显的「偏科」或「短板」。于是,小鹏汽车开始「发奋图强」,力争成为一个各方面都优秀的「全能选手」。 这次全新的小鹏G7,就是他交出的一张「全能答卷」。它不仅保留了硬核科技这个「奇兵」,更在大家最关心的空间和舒适度上,下足了功夫。 小鹏G7实现88%超大得房率,整车空间达4.47m³ | 图片来源:小鹏汽车 对于一辆家用车来说,「大」就是硬道理。小鹏G7是怎么做的呢? 它通过缩短车头、拉长车尾的设计,让车子看起来很动感的同时,把内部空间压榨到了极致。后排乘客的腿部空间非常宽敞,远超同级别的车,跷二郎腿都绰绰有余。 它的后备厢有819升,比以「能装」著称的特斯拉Model Y还要大。如果把后排座椅放倒,更能扩展到一个惊人的2277升!这是什么概念?别说日常购物、放婴儿车了,就算是搬家拉个小冰箱,或者周末全家出游带上帐篷、烧烤架,都毫无压力。 除此之外,小鹏G7在空间上还有很多小巧思,全车有39处储物空间。最有趣的是一个电子密码手套箱。就像给你的储物格上了个保险箱,在中控屏幕上输入密码才能打开,放点隐私或贵重物品。 如果说空间是硬指标,那舒适度就是软实力。小鹏G7全车标配了通风、加热、按摩和电动调节功能。座椅坐上去非常柔软,据说比奔驰的座椅还要软50%。 小鹏G7还有一个聪明的「太极AI底盘」, 它能根据路况自动调节悬挂的软硬,过减速带时更柔和,高速转弯时支撑更有力,让开车坐车都更平稳舒适。 同时,小鹏G7全车配备了20个扬声器,最厉害的是,这个音响系统能「听懂」音乐。它会根据你放的歌曲是摇滚、古典还是流行,自动匹配最合适的音效,让你随时随地都能享受到「最佳听音位」的待遇。 00后看不上水桶车,想要有绝活的车 在小鹏G7上市前,汽车圈发生了一件大事:小米汽车YU7来了,而且一来就火得一塌糊涂,订单量像滚雪球一样疯涨。 这下,很多人都为一周后才登场的小鹏G7捏了一把汗。毕竟,凭借雷军的营销能力,小米YU7就像一个自带流量的「超级网红」,吸引了所有人的目光。G7作为后来者,会不会被抢了风头? 对此,小鹏汽车P/G系列产品负责人 Nick表示,小米YU7是一款长板非常长的车。小鹏G7和小米YU7是两个赛道、两个品类:G7主打硬核科技、舒适性,小米YU7的强项在颜值、操控。市场上之前产品更偏向是水桶车的车型,均衡,随着95后、00后的年轻人成为购车主力,他们不再只满足于一辆「没毛病」的车,他们需要的是一款长板非常长的车型。 2025年上半年小鹏汽车的销量,已经超过去年全年 | 图片来源:小鹏汽车 那小鹏G7,能否延续小鹏当前大热的势头? 7月1日,小鹏公布了6月份和整个上半年的成绩单,数据非常亮眼。6月交付新车34,611台,比去年同期暴涨了224%!这已经是小鹏连续8个月,月销量稳定在3万台以上。更厉害的是,今年上半年的销量(19.7万台),已经超过了2024年全年的总和。 截止发稿,小鹏并没有像往常一样,发布销量战报。答案或许已经不那么重要了。因为对于今天的小鹏来说,一时的销量爆款固然可喜,但更重要的是,在成为一家「全球领先的AI汽车公司」的漫长道路上,每一步都走得稳健而有力。 在他们看来,赢得一城一地的得失并非终极目标。他们真正在乎的,是「组织的复利」——打造一个强大的、能不断自我进化的团队和体系。 因为,在中国市场激烈竞争的下半场,组织力才是最需要经受考验的。
过去半年,「AI 语音」赛道正密集地获得融资。尤其引人注目的是,这些融资多为大额,并且投向早期团队。 比如,前不久 AI 语音应用 Wispr Flow 靠「默念输入」,完成了 3000 万美元的 A 轮融资,累计融资额已达 5600 万美元;语音模型公司 Cartesia 在 3 月份完成了 6400 万美元的 A 轮融资,累计融资 9100 万美元;AI 语音合成公司 ElevenLabs 更是在 1 月份宣布完成 1.8 亿美元的 C 轮融资,估值超过 30 亿美元。 与此同时,无论是 Meta、OpenAI、Google 等科技巨头,还是 MiniMax 等创业公司,都在密集发布自己的语音模型或语音产品。Siri 也被曝出或将被 ChatGPT 或 Claude 等模型接管,来跟上语音交互的进展。 这些消息无一例外都指向了 AI 语音的火爆。 为什么过去半年多以来,AI 语音领域会如此集中地爆发? 声智副总裁黄赟贺认为,语音对话从一个 App 中的功能模块,迅速进化为 AI 时代入口级别的存在,与大模型的加持有极大关系。 在智能音箱红极一时的年代,大部分我们熟知的智能音箱品牌都搭载了声智的远场声学交互技术,比如小爱同学、天猫精灵、小度音箱等等。而「小爱小爱」的唤醒词,实际上也是来自于声智。 这家公司创办于 2016 年,一直在声学+ AI 交叉领域探索。然而,作为一家在幕后提供 AI 声学技术的公司,在大模型浪潮来临之后,果断选择下场投身开发自己的 C 端产品。毫无疑问,他们看到了这波「大模型+语音」浪潮里新的商业机会,其旗下的 AI 耳机目前出货量已接近 100 万套。 前不久,极客公园与声智副总裁黄赟贺聊了聊AI语音市场的爆发逻辑、语音交互的「卡点」,以及它将如何影响我们的未来。 以下内容根据黄赟贺的讲述和声智的论文整理而成: AI 语音的想象力,已经远在 Siri 之上|图片来源:网络 AI 语音为何现在爆发了? 最近两年,越来越多的 AI 语音初创团队获得大额融资,集中爆发。 其中,一个很重要的推动因素是,大模型让声音这项基础能力首次实现了「可编程化」。 「可编程化」这个词,意味着将一种能力或者一个对象,通过清晰的接口和逻辑,变得可以被代码自由地调用、组合、修改和控制。过去,文字是可编程的,图像是可编程的,甚至视频也是可编程的(比如视频编辑软件)。 但声音更多的是一种「输入」或「输出」的介质,其内部的复杂结构和信息,很难被软件直接「编程」和「理解」。 传统的语音识别,更多是把声音转换成文字,然后对文字进行处理。 比如,之前在深圳、成都有很多做声音标注的团队,拿到语音之后,再人工转换成文字,打上不同的标签,比如各种特征、意向的标签。 大模型来了之后,打标签的这项工作可以交给大模型,它比大量的人工团队标得快和准。 以前做 NLP 的背后都是一堆苦逼的运营在那里打标签,让 AI 系统能够识别每个句子的意向。过去,语音的开发,每增加一个功能,都需要从头写代码,费时费力。比如,想让智能音箱支持「点外卖」,得单独开发一套语音识别和语义逻辑,成本高、周期长。 而现在 AI 大模型可以解决了。 更重要的,依靠大模型对多模态数据的深度理解能力,对声学信号的更细致解析,使得声音本身携带的除了文字信息之外的更多信息,开始被 AI 系统直接捕捉、理解和「编程」。 这种可编程化,意味着 AI 可以像处理数据一样处理声音。它可以分析声音的频率、振幅、波形,提取出情绪特征、识别不同的声源、声源距离、甚至预测你的意图。 这时,声音包含的不再仅仅是「你说了什么」,更是「你如何说」、「你在哪里说」、「谁在说」以及「你说了之后希望发生什么」。 由此,声音也成为了真正的交互引擎。 真正的语音交互,不是「Voice」而是「Sound」 其实,很多人以为,语音交互就是「Voice」(语音)。但其实 Voice 这个词是一个狭窄概念。真正的语音交互,核心不是「Voice」,而是「Sound」(声音)。Sound 里面包含了 Voice。 具体来说,「Sound」包含了更丰富的元素:语调、音色、节奏、情绪,更重要的是环境音。环境音里面可能包含了环境中的各种非语音信息,比如背景音乐、环境噪音(风声、雨声、车声)、物体发出的声音(开门声、打字声)、以及人类语音中包含的非语义信息(语调、语速、音色、语气词、叹息声、笑声、哭声等)。 比如说,你咳嗽的时候,跟 AI 说话,它可能会识别出咳嗽,然后跟你说多喝水;比如,你在咖啡馆说,「帮我找个安静的地方」,AI 不仅要理解你的指令,还要从背景音中判断出你当前的环境嘈杂,从而推荐附近的图书馆。 当我说「下一代对话交互的入口并非『Voice』,而是『Sound』」时,我指的是 AI 系统将不再仅仅依赖于识别你说的「词」,而是能够全面感知和理解你所处环境的「声学场景」中的所有关键元素。 只有当 AI 能够全面感知并解析「Sound」中包含的这些多维度信息时,它才能真正理解用户的深层需求,提供更精准、更个性化、更富有情感的交互。这才是真正的「语音交互」,它不仅仅是「听懂」字面意思,更是「听懂」你的「言外之意」和「心声」。 语音交互的「卡点」,大厂烧钱也没用 尽管大模型带来了语音交互的巨大飞跃,但语音交互当下依然存在一个核心的「卡点」,而这个卡点根植于物理学,具体来说,就是声学。 我们常说「听清、听懂、会说」。「听懂」和「会说」的能力,正在被大模型以前所未有的速度提升。但「听清」这个最基础的环节,却受到物理层面的制约。如果 AI 听不清你的指令,即便它能「听懂」再复杂的语义,能「会说」再动听的话语,那也都是空中楼阁。 比如说当下最热门的具身智能,现在很多机器人都是电驱动的,那么它带来几个大问题,一方面是电路的噪声本身就很大,另一方面是关节噪声,还有就是很多机器人是金属材质,厚厚的,声音在穿透时会大幅衰减。 所以,机器人动起来的时候,噪声很大,尤其在室外,更难听清楚人的指令。要么大声喊,或者拿麦克风喊。因此,现在很多机器人都要靠遥控器来控制。 当下最先进的具身智能机器人仍然依赖于遥控器来操控|图片来源:网络 这方面,其实就需要对声学层面的突破,比如说环境噪声的抑制,比如电路底噪的抑制,还有啸叫的抑制、混响回响的抑制等等。 而这些就是物理学科的逻辑,它需要数据样本,需要 know how 的壁垒,不仅是技术问题,而是时间的问题,需要时间去采集声音、做训练。 这不是烧钱能解决的。 让 AI 准确地「听清」用户的指令,依然是一个世界级的难题。而声学相关的人才很少,所以像谷歌、微软、苹果经常会收购声学技术的初创公司,几乎只要出来一家就会收购他们。 大家都明白,要构建真正的下一代人机交互系统,拥有核心的声学能力是基石。 语音交互的下一站,是实现「共情」 现在很多 AI 应用的日活、留存不高,有个很大的原因就是普通人本身是不会提问的,让人向大模型提问,这本身就是一个非常高的交互门槛。 好的提问还需要学识、表达等基础,所以停留在文字层面的问答,本身就是一种门槛限制。 而语音带来的一种可能性是,它正在开启一个全新的阶段——人机交互的「共情模式」。 如果把语音交互比作一个「UI 界面」,那这个界面会长什么样?我们可以做个推演,它的构成要素可能会有: 情绪识别:AI 通过分析语调、音量、语速,判断用户的情感状态。比如,你的声音颤抖,AI 可能推测你在紧张或伤心。 意图理解:不仅听懂你说了什么,还要明白你想做什么。比如,你说「播放音乐」,AI 会根据你的情绪,决定是放摇滚还是古典。 声纹识别:通过独一无二的音声波特征,区分不同用户。比如,家里的智能音箱能自动切换到「孩子模式」模式,只为孩子的声音提供安全的回应。 情绪生成:AI 的回应需要带有情感化的表达。比如,用温暖的语气说「别担心,我来帮你解决」,而不是机械的「好的,正在处理」。 这些要素的背后,是 AI 从「功能导向」到「情感导向」的转变,AI 会与人实现共情。这种交互,能显著提升长时间交互的质量和亲密感。 不仅如此,从狭义的「Voice」拓展到广义的「Sound」,当 AI 能接收到的不仅仅是用户的指令,而是整个物理世界的实时反馈时,我们可以去构建一个「声学世界模型」。 这个「声学世界模型」可以理解声音在物理世界中产生、传播和交互的根本规律,它不仅要「听清」和「听懂」,更要具备「声学常识」和「声学推理」的能力:它能从一声闷响中分辨出是书本落地还是箱子倒塌;能通过回声判断出房间的大小与空旷程度;更能理解「脚步声由远及近」背后所蕴含的物理运动逻辑。 未来,当这样一个声学世界模型与视觉、语言大模型深度融合时,具身智能机器人将不再「失聪」和冰冷。这也是我们正在做的。
马斯克和特朗普,这对白宫二人转最近「嘴炮大战」进入到 2.0 时期。和这对欢喜冤家类似的,是国外出版商集团和 AI 巨头之间的相爱相杀——一方面有大出版商要和 AI 公司合作,另一方面也有出版商誓死要把 AI 巨头告破产。 根据数据,AI 搜索和 ChatGPT 出现后,全球网站流量都在下降;另一方面,AI 巨头的「AI 爬虫」却不顾爬虫协议,以数万次的爬取不断侵蚀所有网站的数据。 这时候,终于有一家基建公司站了出来,挽着内容创作者的手说:「我们可以对 AI 巨头说不!」 Cloudflare,这家掌控全球约 20% 网络流量的互联网基础设施巨头,被网民誉为「赛博菩萨」的公司,在 2025 年 7 月上线了一个实验性产品和交易市场:「Pay Per Crawl」——给 AI 爬虫立下了新规矩: 要么获得许可,要么付费 。 简单来说,这个功能的本质是给网站内容创作者一个选项「开关」:可以选择允许 AI 爬虫自由访问,按次爬取收费,抑或者直接封锁访问。 按照 Cloudflare 创始人的说法,「内容是驱动 AI 引擎的燃料,因此,内容创作者直接获得报酬才是公平的。」 对 AI 公司来说, 想继续抓取全网内容来训练模型,不能再像以前那样「免费吃大餐」 。但也不是没有好处,因为根据明码标价付费,可以避免版权争议问题。 Cloudflare 这次的「防虫」举措,能缓解 AI 爬虫的肆意攻击吗?更重要的是, 这家公司能否利用自己独特的地位,建立起一个全新的 AI 时代内容分发和变现模式 ? 01 AI巨头的「免费午餐」 过去几十年,大多数网页默认是公开「可爬」的。谷歌、Bing 这类搜索引擎为网站带来流量,有了流量,网站再通过广告或销售订阅变现——这是搜索时代的隐形契约。 可 AI 时代,传统搜索流量骤降,这笔账越算越亏。 AI 公司把全网内容当作训练燃料,却几乎不用给大部分创作者回报。当用户直接在 AI 聊天机器人里提问,答案往往来源于总结好的内容,而不是数十个蓝色链接,不会给网站带来更多流量。 甚至于谷歌这样的搜索巨头本身也在变化,以前他们提供网站链接列表,如今他们在搜索页面推出了「人工智能概述」,据他们的报告,75% 的查询用户无需点击任何链接就得到了解答。 Cloudflare 2025 年 7 月的最新数据显示: 谷歌的爬虫大约每 6 至 7 次抓取给网站带回 1 次点击,而 OpenAI 则是 1500 次才换来 1 次跳转,Anthropic 的比例甚至更夸张,高达 73300 次换 1 次 。 各大公司 AI 爬虫每次抓取为网站带来的点击比例|图片来源: Cloudflare 这意味着,传统的「内容换流量」模式失效了。相比传统搜索引擎,AI 巨头们吃掉了海量网站内容,却不给「导流」,这种失衡让一些内容生产者愈发难以为继。 「有了 OpenAI,网站流量获取难度比谷歌时代高出 750 倍,而有了 Anthropic,难度更是高达 3 万倍。原因很简单: 我们越来越不再消费原创内容,而是消费它们的衍生品 。」Cloudflare CEO Matthew Prince 在一篇博文中称,「这不是一个公平的交易」。 AI 公司爬数据也不是没有代价的,这两年 AI 巨头一直被指控「偷内容」来训练大模型,引发全球范围的版权诉讼潮,尤其是纽约时报等新闻机构和 OpenAI 诉讼不断。 活跃的大厂 AI 爬虫机器人|图片来源: Cloudflare 因此,Cloudflare 推出「Pay Per Crawl」,建立一个「按次付费爬取」的市场,想要解决的正是这个问题。 该公司设计了一个权限和支付系统,网站可以在后台选择对 AI 爬虫「允许、封锁或收费」,AI 爬虫如果想抓取该网站内容,必须注册、验证身份,并在每次访问时完成支付。 如果顺利, 这一模式能让网络内容从「广告变现」走向「内容授权变现」,开拓全新的收入来源 。无论是大媒体,还是冷门小博客,都能在 AI 时代拥有议价权,被 AI 付费使用。 为了强调其意义,Cloudflare CEO 还将「Pay Per Crawl」推出的这一天称为: 「内容的独立日」 。 02 AI 「过路费」怎么收? 当然,设想很美,但技术怎么落地? Cloudflare 这家公司起家靠的是提供 CDN、DDoS 防护、DNS、零信任安全等服务,它在全球 300 多个城市部署了节点,承载约 20% 的 Web 流量,给它当「中介」提供了方便。 「Pay Per Crawl」建立在它全球 CDN 网络的中间层:它能在访问请求进到源站前就识别和处理 AI 爬虫。站长可以在 Cloudflare 后台设定三种模式:允许、收费、封锁。 站长可以在后台设定允许、收费或封锁|图片来源: Cloudflare 所有新加入 Cloudflare 的网站默认封锁 AI 爬虫,除非站长主动允许。只有与 Cloudflare 建立合作关系的 AI 公司才能参与支付机制,否则将被封锁。 如果 AI 爬虫向付费 URL 发起请求,尚未付费,Cloudflare 就会返回 HTTP 402 Payment Required 状态码——一个过去几乎没人用的、专门为「网络支付」预留的状态码。AI 爬虫可以在请求里带上支付信息,以表示同意支付配置的价格,一旦匹配价格就放行返回 200 OK,并自动结算。 Cloudflare 本身则是这个交易的「收银台」,负责聚合账单和分发收益 。 Cloudflare 会返回 HTTP 402 Payment Required 状态码|图片来源:Cloudflare 爬虫可以在请求里带上支付信息|图片来源: Cloudflare HTTP 200 OK 响应确认收费|图片来源: Cloudflare 更重要的是,这并不是靠简单的 User-Agent 欺骗就能绕过的。Cloudflare 要求 AI 公司注册密钥,用数字签名保证身份。这也是为了防止「山寨爬虫」冒充合规者逃避支付。 过去,robots.txt 是一个放在网站根目录下的纯文本文件,用来告诉搜索引擎的爬虫哪些页面可以抓取,哪些不可以,但它只是网站的「礼貌建议」,很多 AI 爬虫根本不理会。Cloudflare 的方案改变了这一点,把现有的、靠 robots.txt 的「软约束」变成了「硬闸门」。 不过,据 Cloudflare 称, 目前排名前 10000 的域名中,只有约 37% 拥有 robots.txt 文件 。 给 AI 爬虫设置关卡|图片来源: Cloudflare 如果要参与 Cloudflare 的爬取付费市场,爬取方、被爬取方都必须开设 Cloudflare 账户。截至目前,「Pay Per Crawl」仍处于内测阶段,仅部分大型出版商参与,如 BuzzFeed、《大西洋月刊》和《财富》等,Cloudflare 还在持续公开征集有意向的内容创作者和抓取者。 「我们预计按次付费模式将迎来显著发展。」Cloudflare 官方称。 虽然目前仍处于初期阶段,但该公司对未来还有很多设想。比如,出版商或其他机构可以针对不同内容类型收取不同费用,或者根据 AI 应用的用户数量进行动态定价,或者根据训练、推理、搜索等不同领域引入更细粒度的定价策略。 他们还认为, 按次付费爬虫的真正潜力或许会在 Agent 智能代理的世界中显现 。 「如果智能代理付费墙能够完全以程序化的方式运作,会怎样?想象一下,你可以请你的深度研究助手帮你整理最新的癌症研究、法律简报,或者帮你找最好的餐厅——然后给这位智能代理一笔预算,用于获取最有用、最相关的内容。」 「以 HTTP 402 响应代码为基石的首个解决方案,将开启一个智能代理能够以程序化方式协商访问数字资源的未来。」Cloudflare 称。 03 Internet 的十字路口 从经济层面来说,这可能是 AI 和广大内容创作者「重新谈判分账」的开端。 现在,只有头部大媒体能和 AI 公司谈授权(比如 纽约时报告了 OpenAI 后才谈成和解),绝大多数中小网站、论坛甚至个人作者都被「默默爬走」,毫无反抗的能力,或者说意识。Cloudflare 的方案,实际上可以把这种议价能力普及到更广泛的网站。 据 Cloudflare 团队称,他们与新闻机构、出版商和大型社交媒体平台进行了数百次对话,他们一致「希望允许 AI 爬虫访问其内容,但希望获得报酬。」 对于支持者来说,「Pay Per Crawl」模式在理念上很「公平」:创作者有了收入,AI 公司也避免了法律风险,长远看能推动整个产业走向更合规的内容许可。 图片来源: Cloudflare 当然,AI 公司未必开心,互联网数据不再免费,要抓新内容,就得花钱,这意味着算力之外的成本要素。 但另一方面,这也或许会抑制滥抓取,也迫使 AI 模型开发者在数据上更有选择性——比如针对性购买高价值的内容,而不是一股脑地把各种网站内容都喂进模型里。 Matthew Prince 称,「 AI 引擎就像一块瑞士奶酪,真正能够填补这块奶酪孔洞的全新原创内容 ,比如今占据网络大部分版面的重复性、低价值内容更有价值。」 在他看来,流量一直以来都无法准确衡量内容的价值,「如果我们能够开始对内容进行评分和评估,不是根据它产生了多少流量,而是根据它对知识的促进程度(以它填补了多少 AI 引擎「瑞士奶酪」中的现有孔洞来衡量)——我们不仅可以帮助 AI 引擎更快地进步,而且有可能促进高价值内容创作的新黄金时代。」 不过,数字权利倡导者可能会提出:小型 AI 创业团队、研究者、开源社区,能否承担这样的数据成本?学术研究、公益存档这些「良性爬虫」会不会寸步难行,只能访问有限、低价值的数据源? 在一个广告收益下滑、流量成本高涨的现实里,会有多少网站愿意无偿开放给 AI 爬虫吸血?这会不会成为「封闭化」的开始,让互联网失去它的自由与共享精神? 如果全网都默认封锁收费,这会不会无意中加剧「大厂垄断」 ?毕竟,大厂比较有钱。 「Pay Per Crawl」模式,一方面试图解决 AI 吸血内容却不反哺的问题,另一方面,也有可能在无意中加高 AI 创新的门槛,回到版权保护与知识开放的老命题。 当然,Cloudflare 只是给网站更多自主权。网站所有者完全可以选择对公益、非营利项目继续免费开放。权力仍然在创作者手里。不管怎么说,他们值得获得「补偿」。 在 Cloudflare CEO 的话里,这场变革的目标是「构建更美好的互联网」。「我们尚不知道所有答案,但我们正在与一些顶尖的经济学家和计算机科学家合作寻找答案。」 目前,其他其他 CDN 和安全提供商(比如 Akamai、Fastly、Amazon CloudFront)尚未宣布类似的功能。 把 AI 爬虫机器人挡在门外|图片来源: Cloudflare 虽然 Cloudflare 的「Pay Per Crawl」看起来只是一个 CDN 产品的新功能,但从某种意义上说: 它可能成为互联网走到一个分岔口的信号 。 在搜索时代,内容的价值是通过用户访问转化为广告收益。但 AI 时代,用户可能根本不会再点进网站——所有答案都在聊天机器人里总结生成。是继续让 AI 大模型免费挖掘网络内容,还是在数据获取上回归「互惠」原则,让创作者获得应有的补偿?补偿又能有多少? 这个早期实验可能在为一个新的 AI 时代数据经济形态铺路,无论成败如何,它的立场很明显:AI 不能无限透支创作者的耐心,并在「开放」的名义下把人的劳动变成免费的燃料。 「网络正在发生变革,它的商业模式也将随之改变。在这个过程中,我们有机会从过去的 30 年里学到好的地方,让它在未来变得更好。」 至于,事情是不是能真的变好,像 Cloudflare 自己承认的那样: 「 这仅仅是个开始 。」
前几年,某鱼上最热门的副业之一是「做课件」,几百元一套的 PPT 课件,打包发给焦头烂额的老师和想赚钱的内容博主。 「知识付费」,从未如此简单! 各种 AI 工具出现之后,「一键生成 PPT」已经成为传统艺能。当然,更让我吃惊的是,主打要取代传统搜索的 AI 搜索,现在也有了类似的功能。 我最近体验了秘塔 AI 的新功能「今天学点啥」,只要上传一篇论文、一本书,或者什么都不传,直接用秘塔 AI 搜出来相应主题的资料,它就能自动变成一节课讲给你听。 秘塔 AI 搜索生成的课程结构完整、重点分明、知识点一个不落,外加语音讲解,直接能开播。 这个功能不仅能「量产」AI 教父李一舟,对于学生和教师群体,更是天降福音。 栏目作者召集 极客公园的新栏目「AI 上新」,将带大家体验最新的 AI 应用和硬件,让你成为 AI 时代「最靓的仔」! 现在,我们也向所有喜欢尝鲜和体验 AI 的同学发出召集,只要你发现并体验了新的 AI 应用或者功能,按照格式(参考案例: AI 上新|3 秒钟,我用 YouWare,手搓了一个「Win98 版」极客公园 ) 向栏目投稿,在极客公园公众号发布,不仅能获得相应稿费,且会为你「报销」AI 应用的订阅费用。 同时, 优秀作者还有机会进入极客公园 AI 体验群 ,获得最新 AI 应用和工具的内测资格,参加极客公园专属相关 AI 活动,和 AI 应用创始人一对一沟通。 AGI 太久,只争朝夕,让一部分人先 AI 起来吧! 投稿、进群请扫描下方二维码添加极客小助手微信 01 一键生课件,量产「讲师」 最近在用秘塔查资料时,注意到它上线了一个新功能,叫「今天学点啥」。图标是一顶蓝色的学士帽,就在页面左侧边栏。 秘塔 AI 搜索主页|图片来源:秘塔 AI 这是秘塔在今年 4 月底推出的新产品,支持基于书籍、论文、行业报告等文本资料生成课程讲解。上传资料后等待几分钟,系统会自动生成 PPT、语音讲解和课程结构。如果没有现成的资料,也可以直接在应用内搜索并使用推荐内容。 虽然 2024 年由于法律争议,秘塔不再将知网作为文献库之一,但维普、万方、PubMed、Science Didirect 等海内外资源也完全够用。 今天学点啥主界面|图片来源:秘塔 AI 其中讲解外文文献对我帮助最大。外文文献往往给学习者带来语言和专业两方面的考验,如果还是陌生的题材,那么让人简直没有开始阅读的勇气。 作为一个自然爱好者,前些日子偶然发现鲸鱼和猪竟然属于同一个目!据我们平日的认知,猪、牛、鹿等是大型陆地哺乳类食草动物,而鲸鱼生活在海里,怎么可能是一家呢。 带着这个疑问,我在秘塔中搜到了《古生物学杂志》2013 年发表的论文「On the Origin of Cetartiodactyla: Comparison of Data on Evolutionary Morphology and Molecular Biology(论鲸偶蹄目的起源:进化形态学与分子生物学数据的比较)」。除了想弄明白我的疑问之外,还想对这篇论文的内容进行相对全面的了解。 这时候,秘塔 AI 搜索的「今天学点啥」,就派上了用场。 在课程生成之前,用户可以选择掌握知识的程度和授课风格。「初学者」、「进阶者」、「专家」,由浅入深。 在风格方面, 绝大多数时候我都会选择简洁而高效的「课堂」模式,但「苏格拉底」、「拿破仑」、「爱因斯坦」等 23 种 drama 模式很有提神醒脑的功效 ,适合瞌睡时刻。 今天学点啥有不同的讲师风格|图片来源:秘塔 AI 不同风格之下课件结构基本一样,讲解词不同。我拎出了几个不同风格的同一句内容 。 【课堂】:长期以来,我们对鲸鱼和偶蹄目动物的认知是清晰的:一个是海洋霸主,一个是陆地食草者,它们似乎属于完全不同的进化路径。 【尼采】:看呐! 旧有的神祇——那些僵化的分类学概念!——正在崩塌! 人们曾以为,陆地上的奔跑者与海洋中的巨兽,是两条永不相交的河流。 【小说】:我的导师,那位头发花白、眼神深邃的老教授,曾指着博物馆里巨大的鲸鱼骨架和旁边的河马标本说:「看,艾琳娜(本篇论文一作),它们是同一个故事的两面。 【张爱玲】:基因,是写在血脉里的隐秘诗篇。它们低语着,说鲸与河马,这两个看似天壤之别的存在,竟有着共同的祖先,如同孪生姐妹,只是命运将她们引向了截然不同的方向——一条奔向汪洋,一条留在泥泞。 河马和鲸鱼是一家,神奇|图片来源:PixVerse 国服版 拍我 AI 生成时间很快,不出几分钟「塔子」老师就可以搞定课程,目前没有遇到过卡顿。 课程一开始,语音讲解便迅速营造出上课的氛围。音频与幻灯片结合,取代了枯燥的文字陈述,好像点开了 B 站知识类 UP 主的视频,但内容却是为我量身定制的。 尤为惊艳的是, 塔子老师总能精准抓住论文中最适合视觉呈现的部分,并以简洁美观的方式制成课件 ,让原本晦涩难懂的古生物学知识变得清晰有序、条理分明。 今天学点啥生成的 PPT 页面|图片来源:秘塔 AI 「塔子老师」在这一点上处理得非常聪明。它不会咬住术语不放,也不会在复杂的推导里兜圈子,而是先带你抓住核心思路,把论文的结构、重点、基本概念讲明白。在我听懂大致内容的同时,也慢慢能看清这块知识地图的轮廓。这种讲重点、不堆砌的风格,对非专业的学习者特别友好 更妙的是,整个学习过程中你随时都可以提问 。不需要鼓起勇气举手,也不会打断任何人,只要在课程下方打字提问,「塔子老师」就会在侧栏里迅速回复,补充讲解内容。学习不再是静静接受的一条路,而像是一场可以随时插话和追问的交流。这种有来有回的节奏,让人真正有「听懂了」的踏实感。 在 PPT 中可以随时提问|图片来源:秘塔 AI 学习从来不是一件轻松的事,我们常常在学习中被各种琐碎的操作打断,比如资料格式转换、内容查找等,而秘塔很好地消除了这些学习中让人烦躁的「坎」。 比如,当我想让秘塔基于一篇文章生成课程时,不需要费力去转换格式,只需上传网页链接就能直接生成讲解内容。而且在使用秘塔搜索找到想看的文章后,可以一键收藏入「知识库」,之后就能直接在「知识库」内提问,无需额外下载或转换 PDF,这一点比很多传统 AI 工具方便太多。 课程内容方便归档|图片来源:秘塔 AI 听课过程中也不需要切屏回看文献,课程内部直接可以选择分屏模式,左边课件,右边文献,系统还会在文献里自动标注当下讲解的片段,避免学习者在知识里头晕眼花。 可以结合课件和论文原文对比阅读|图片来源:秘塔 AI 课程结尾部分的处理也别出心裁。每次学习完之后,秘塔都会附上 10 道左右习题 ,当场检测刚学的内容有没有真正掌握。如果答错了,它会给出解释,带领学习者回顾关键点。而且最后它还会顺势推荐一些相关资料,延伸阅读,补全知识网,一不留神就学了几个小时。 上完课哪有不考试的?|图片来源:秘塔 AI 对我来说, 「今天学点啥」真正打动我的地方,不只是它的内容讲得怎么样,而是它把学习这件事变得更完整了 。 过去我们常常要在各个平台来回切换:找文章、看视频、整理笔记、再想办法测试理解。现在这些环节几乎都可以在一个应用里完成,流程被打通,体验也更集中高效。 当然,「今天学点啥」也还值得优化的地方。 起初我以为秘塔可以直接根据我的问题自动搜集并整合资料,生成课件讲解。但实际体验中, 它的流程还是先帮我检索相关资料,由我来选择文献,再基于这些内容制作课程 。虽然这种方式对有一定资料筛选能力的用户来说没问题,但如果将来能增加「自动整合资料并生成课程」的选项,可能会对更多学习者友好一些。 另外,就是外语处理方面。我在试图用它学习德语时,发现系统虽然可以识别德语文本,但语音讲解时还是用英语的发音方式来读德语,这对于小语种学习者来说会造成不便。语言学习是整个自学版图中不可忽略的一部分,秘塔要想覆盖更多用户,恐怕还得优化这点。 02 降低学习门槛,谁都能学点啥 说到「今天学点啥」,就绕不开它背后的公司——秘塔科技。秘塔成立于 2018 年,总部在上海,是国内较早一批专注于「AI+知识服务」方向的科技企业。 图片来源:秘塔 AI 最初,秘塔推出的产品是「写作猫」和「MetaLaw」,分别面向通用写作和法律场景,帮助用户用更高效的方式生成、理解和处理复杂文本。这些工具逐渐积累了不少用户基础。 在这些基础能力之上,秘塔进一步开发了「秘塔 AI 搜索」,主打精准、干净、结构化的内容检索体验。它没有广告,也避开了 SEO 刷屏内容,特别适合查阅论文、行业报告、学术材料等。 到了 2024 年底,秘塔开始把注意力转向「教育」。不是传统意义上的网课平台,而是从 AI 角度出发,尝试回答这样一个问题: 如何把 AI 真正变成老师角色,而不是信息的中介 ? 「今天学点啥」就是这个问题的直接回应。 用下来这几天,我越来越觉得,不管是学生、老师,还是纯粹出于兴趣想了解点新东西,只要有学习需求,「今天学点啥」是基本都能派上用场,而且对内容类型和年龄阶段的限制也不算大。 高中同学去做了教师。被我成功安利之后, 她表示大学时就曾经用秘塔辅助写论文中的文献综述,接下来准备把秘塔新产品带进课堂里试试 。 对老师来说,用它作为备课的起点其实能省不少时间。最近课程 PPT 已经可以用积分直接下载了。秘塔提供了课件结构的基本思路,在这个基础上做补充,比从头做一份要高效得多。当备课压力很大程度被 AI 产品分散,老师可以省出更多时间升华课堂,关照学生。 后来我自己也试了试它的「搜题」功能,挑了高考数学选择题来听讲解。虽然已经很多年没碰这些题了,但它的讲解节奏合理,推导过程也算清楚,一步步听下来基本都能理解。 和传统的搜题工具相比,它的优势是能讲透,而不是只给你一个答案,而且还能反复听,不懂就重来,这对正在备考的学生应该有帮助。 用秘塔搜索讲解考题|图片来源:秘塔 AI 有很多好奇的念头都曾经在我们的脑海里一闪,但一般情况下,闪完就灭了,再也想不起来了。而秘塔的新功能能够保存好奇的火种,再继续点燃它。 每次打开「今天学点啥」的首页,总能看到各种领域的内容被推荐出来,比如哲学、心理、健康、自然科学等等,主题跨度很广。就算没有明确的学习目标,也很容易被某个话题吸引,顺势点进去听一课。 前两天刚学完这课,转眼就在小红书上刷到了相同题材的科普。这让我突然意识到,「今天学点啥」的意义之一: 是让普通人更容易接触到原始文献,而不是依赖经过多轮转述的二手信息 。 就像我最近看的那篇关于鲸豚演化的论文,如果交给几个短视频博主转述,很可能就会出现以偏概全或误读的问题。我始终相信, 一个运行良好的 AI 要胜过胜过不专业的人类 。 今天学点啥页面不同的科目分类|图片来源:秘塔 AI 整体来说,「今天学点啥」在讲解知识这件事上,确实做得挺扎实。对我个人而言,它是一个可用、好用、不会制造额外负担的学习辅助工具。之后如果有什么特别想了解的主题,我会先来这里试试看。 AI 会不会真的成为「老师」,这还有待观察,但秘塔至少已经让「学点东西」这件事变得没那么难开始了。
头图来源:百度 从 Chatbot 到 Perplexity,搜索正被 AI 改写,但这只是开始。 Chatbot 与 Perplexity.ai 分别代表了 AI 重塑搜索的两类探索路径:一个是对话式交互的路径,一个是「答案即结果」的路径。 看似已经突破传统搜索的框架,但这两种尝试仍有各自的局限——要么缺乏系统化能力,要么覆盖面不足、推理深度有限。今天他们并不能完全替代传统的搜索引擎。 真正 AI 时代的搜索产品,或许还没被完全定义出来,但搜索的「重构」正在不断向前。 在过去20多年来,搜索引擎一直是互联网的核心入口。它的本质,是以关键词为核心逻辑,为用户提供快速、广泛的信息检索。现在,随着大模型越来越进一步的突破,这套系统在持续发生变化。 搜索不再只是信息列表的排列组合,而变成了理解需求、生成答案,甚至预测用户下一步的「智能助手」,用户的使用习惯在被重构,行业的风口也已经悄然转向。 就拿 Perplexity 这家成立不到三年的AI搜索公司来说,凭借其创新的「AI 即答案」的产品理念,迅速成为行业焦点。今年5月,Perplexity以140亿美元估值筹集5亿美元资金,估值在短短半年内翻了一番。英伟达CEO黄仁勋也在多个公开场合表示,Perplexity是他最常用的AI工具之一。 然而,搜索领域的竞争核心并非仅仅在「谁能先做出一个产品」,而是谁能「长期稳固地成为用户获取信息的第一入口」。事实上,Perplexity 能满足的仍只是相对简单的一部分问答需求。而现实中,用户在互联网上的信息获取行为远比「问答」复杂得多,不仅包括查找答案,还涉及搜索商品、使用服务、浏览社区内容、比较信息来源等多样化需求——这些是目前 Perplexity 等产品尚难全面覆盖的。 而这些,正是谷歌、百度等传统搜索引擎巨头在过去多年中构建起的核心护城河。如今,借助强大的基础模型和更加成熟的生态体系,他们正以搜索入口为核心,重构新一代的 AI 产品生态。 拿百度来说,最近,百度首页迎来了近年来最显著的一次更新:原本位于页面中央的单行搜索框「变大」了。左下角新增「深度搜索」开关,并集成语音、附件、图片上传等多模输入功能,搜索框下方则一口气上线了 AI 搜索、AI 作图、AI 写作、AI PPT、AI 阅读等一系列工具按钮。 这些界面的变化,反映出百度在AI时代正在尝试革新搜索的底层逻辑——不只是样式上的调整,而是一次围绕「输入」与「能力调度」的系统重构。在新版百度 App 中,用户可以直接输入超长文本、上传文档或图片,甚至一键调用 AI 工具完成任务。搜索框从「查信息」的起点,升级为「调用能力」的中枢。 除了调整交互界面和输入方式,更深层的变革,来自其底层 AI 能力的系统升级。依托大模型、多模态处理能力、Agent 工具、MCP 等关键技术能力,百度搜索不仅能回答问题,还能完成写作、作图、做视频、写代码等复杂任务,拓展了搜索本身的能力边界。本质上,百度搜索正在从传统的「信息检索」向真正的「任务交付」演进。 对谷歌、百度这类巨头来说,搜索不仅是一款工具,更是连接流量、商业与生态的核心枢纽。也正因如此,它们在推动重构时展现出了更系统的战略视野和更强的落地能力——这才是真正有可能改变搜索格局的力量。 1 搜索巨头,重构新搜索 在AI时代,搜索产品的核心正在从「复杂的页面与交互」转向「简单的入口+强大的系统能力」。 作为传统搜索巨头的谷歌与百度,正在分别通过不同路径求变,对产品进行重构。 百度正在通过对搜索产品的系统重构,探索一条AI时代区别于 Chatbot 和 Perplexity 的新搜索进化路径。 这条路径的核心,是以搜索框为入口,嵌入更丰富的 AI 能力与服务生态,将搜索从「信息列表」升级为「智能任务调度器」。这一转变,不仅在于交互方式的进化,更在于背后产品逻辑、技术体系和生态构建的全面升级。 首先,百度正在从「输入端」重构用户的搜索体验。传统的关键词输入方式正在让位于更自然、更复杂的表达形式。如今的搜索框变得更「智能」也更「开放」:它支持超长文本、PDF 文件甚至图像、语音等多模态输入,用户可以通过一句话、一个截图、甚至一个文件,发起一次复杂的信息请求。 更关键的是,这个输入口还具备调用工具和模型的能力,背后连接的是百度自研的多模态大模型和 MCP(模型调用平台),让搜索变成一次系统级的能力调度过程。 而在「输出端」,百度也通过「百看」对搜索结果的呈现方式进行了彻底重构。用户不再面对一串链接,而是进入一个富媒体的信息空间:图文卡片、结构化知识图谱、短视频、互动服务模块等混合呈现,内容既高效也直观。 更进一步,搜索结果中还嵌入了阿拉丁工具、智能体与真人服务,用户不止能看到答案,还能直接完成诸如订餐、问诊、购票等具体任务。搜索,不再是起点,而是问题解决链条的中段。 这种体验重构背后,是百度试图推动的更深层转变——让搜索从信息检索升级为任务交付引擎。在这一过程中,百度将多个原生 AI 能力模块深度嵌入搜索主流程中。 比如「妙笔智能创作」支持一句话生成 5 分钟视频;工作台工具实现文本、图像、代码一键生成;Deep Search 支持多级推理链,提升对复杂问题的处理能力。搜索的内核,不再只是抓取与匹配,而是理解、生成、推理和执行。 更值得注意的是百度背后的生态布局。不同于轻量化的 AI 搜索产品,百度选择围绕搜索主入口构建一个开放的 AI 能力生态,核心是 MCP(模型调用平台)的开放化与标准化。 目前,百度已构建起国内最大、真正可用的 MCP 服务平台,覆盖生活、金融、电商、医疗等多个高频场景,收录超过 1.8万个优质模块。C 端用户可通过 AI 助手等前端快速调用这些能力,B 端开发者也能通过托管与分发渠道(如百看、A 页等)接入生态,形成从用户需求到服务提供的闭环。 这种从产品能力到生态联动的重构,实质上是百度对搜索「入口地位」的再定义。 如果说传统搜索是网站内容的分发中枢,那么在 AI 时代,搜索将成为连接智能体与模型服务的「超级入口」。搜索的背后,不再只是网页和链接,而是由大模型、MCP、智能体共同构成的智能系统。 百度的路径选择,正是瞄准这个核心角色而来——让搜索不止于回答问题,更成为完成任务、连接生态、调动智能的中枢平台。 谷歌也是如此。两个月前的I/O 2025上,Pichai 一句「搜索框不重要了」揭开 Google 搜索的重大重构。 这不仅是产品形态的变化,更是一套新搜索逻辑的发布:AI 模式(AI Mode)+ 任务助手(Task Assistant)共同组成的系统,正在让搜索从「回答问题」升级为「帮用户把事做了」。 AI Mode是 Google 搜索的新界面,它不再是传统意义上的搜索结果页,而是一个「自动帮你完成任务」的系统。 用户只需发送一句话,就能获得直接生成的结构化答案,甚至完成从比价、下单到支付的完整任务流程,搜索不再停留在信息检索,而是成为能动手的 AI。 在背后支撑的,是 Gemini 模型与 Query Fanout 等底层技术。系统会将一个问题自动拆解成多个子任务,发出并行搜索、调用多个数据源,在后台完成推理和整合,生成可视化、多模态的答案页面。 更进一步,Google 在搜索引擎中引入了 Project Mariner 执行代理系统。这套系统理解用户的意图后,可以跨应用、跨服务完成整个任务链:找房、订票、文件处理、数据填表,全程无需跳转操作。 这一次,谷歌将对话能力直接嵌入到搜索,重构搜索体验,并从Gemini出发,探索多模态输入与生态级联动的交互方式。 谷歌百度两者虽路径不同,但目标一致,要构建一个「看起来简单、实际上强大」的AI搜索。 2 谁能真正做得起来? 大模型能力在迅速跃迁,AI搜索的赢家尚未落定——而谁真正「能做得起来」,仍然是决定胜负的关键前提。 市场上确实出现了如 Perplexity 这样的黑马,凭借「答案即结果」的模式,结合RAG(检索增强生成)技术,为用户提供了比传统搜索更直接、即时的答案体验。 还有Arc Search,更强调「替用户读网页」,类似浏览器层的 Perplexity;You.com的定位则是「可定制的 AI 搜索引擎」,集成 Chat、搜索、代码生成、写作助手等功能,主打「多功能 AI 工具集」…… 这类轻量化路径迅速跑通早期产品形态,也在资本市场获得了关注。但这些产品仍面临着基础模型能力薄弱,算力成本高、难以长期支撑,生态搭建难度大、难以形成服务闭环、商业模式尚不清晰等一系列难题。 比如在今年4月的一次访谈中,Perplexity CEO 阿拉温德就提到在推出DeepSeek和Deep Research等新功能时,计算资源很快就用光了,不得不找合作伙伴帮忙。每次查询的成本也在上升,急需更多算力来降低这些成本… 它们跑得快,却难以规避一些底层问题,以及构建持续护城河,更难撑起一个AI时代生态的「信息主入口」。 反观谷歌与百度,这些搜索时代的核心玩家,虽然出手不算最快,却拥有成熟的大模型体系、完备的产品矩阵,在工程与分发层面,它们又具备传统搜索时代打磨出的强大基础设施——既能理解复杂任务,又能完成服务闭环。 比如,相比轻量产品依赖单一用户付费或广告变现,平台型搜索拥有更多的商业接入点——如服务导流、API 使用、内容分发、原生交易等,在 AI 时代具备更可持续的商业模型。 更关键的是,它们正以搜索为轴心,系统性地构建 AI 时代的生态闭环——包括 Agent 架构、MCP(模型调用平台)、内容分发机制等在内的新一代技术栈,正在悄然形成。搜索不再是孤立的信息检索工具,而是连接大模型、工具集与服务链的交互中枢。 这也带来一个越来越清晰的行业共识:真正有可能成为「新搜索」的,不是某个新功能或小工具,而是能够承载高频、广泛、多样需求的平台型产品体系。 在互联网时代,搜索是连接无数网站的入口,在AI 时代,搜索依然是AI时代的入口,入口背后不仅是新功能,也不仅是简单的内容平台,更是由Agent和MCP组成的AI生态,就如同互联网时代的生态由网站构建,而搜索是所有网站的入口;AI时代的生态将由智能体和MCP构建,搜索将成为这个生态的超级入口。 未来的搜索,将不再是单纯的信息检索工具,而是用户与复杂智能生态互动的核心枢纽。谁能真正掌握这扇入口,不仅要具备强大的技术能力,更要构建起开放、丰富且高效的生态体系,实现从信息获取到任务完成的无缝连接。只有深刻理解用户多元需求、持续驱动技术与生态协同,才能在这场新的入口争夺战中立于不败之地。 搜索的未来,已经到来。我们正站在这场变革的门槛上,见证一个全新智能时代的开启。
雷军披露小米 YU7 销售数据:SU7 系列转单占比不到 15%,女性用户占比 30% 在 7 月 2 日晚的直播间,小米创始人兼 CEO 雷军身穿白色衬衫,戴小米 AI 眼镜入场,分享了小米 YU7 销售的一些情况。 雷军在回应 YU7 大定争议时表示,SU7 和 SU7 Ultra 转订 YU7 的订单,占 YU7 总订单数不足 15%。雷军称,「网上很多人质疑大定有水分 7 天可退。这其实是行业惯例,有 3 天的犹豫期,我们定 7 天主要是担心试驾不过来。」 雷军还透露,小米 YU7 用户平均年龄 33 岁,女性用户占比 30%。女性最喜欢粉色,男性最喜欢寒武岩灰、深海蓝。卖得最好的城市是上海、杭州、北京,这三个城市也是 Model Y 销量最好的城市。此外,苹果用户占比 52.4%。 雷军还表示目前没有做自行车和摩托车的计划,也没有打算出红米汽车。(消息来源:IT 之家) 曝特斯拉暂停人形机器人生产,修改设计 7 月 2 日消息,据报道,来自中国供应链的信息显示,特斯拉正在集中调整人形机器人 Optimus 软硬件技术细节,并于半个月前开始暂停采购 Optimus 的零部件。 报道援引两位供应商人士的话称,特斯拉并未明确表示会减少机器人零件订单,但要等到 Optimus 设计调整完后才会确定新的量产计划并重启采购,调整可能需要 2 个月。 马斯克曾表示,新版 Optimus 的性能比特斯拉 2023 年亮相的第二代 Optimus 大幅改进,且加入了 Grok 支持的语音交互功能。他估计 Optimus 的最终售价或将在每台 2 万美元至 3 万美元(IT 之家注:现汇率约合 14.3 万元至 21.5 万元人民币)之间。 报道还称,截至今年 5 月底,特斯拉今年累计采购了足够生产 1200 台 Optimus 的零件,并生产了接近 1000 台。此前马斯克承诺今年生产 5000 台。前述两位人士都认为,随着零部件采购中断,该目标基本无法达成。 报道中,供应链人士还透露,特斯拉可能会在今年股东大会上亮相第三代 Optimus,马斯克需要证明新品值得特斯拉股东和数百家供应链公司为此继续投入、扭转资本市场的负面预期。(消息来源:IT 之家) 字节被曝两年半造出千台机器人,长期目标是具身智能 7 月 2 日报道称,字节开发的机器人已累计量产超千台。他们在 2023 年完成了 200 台量产目标,之后年量产数超 100% 增长。该机器人研发团队,也从 2023 年夏天的约 50 人左右,扩充至目前的约 150 人。 报道称,目前字节已量产的机器人形态是轮式物流机器人,或称自主移动机器人(AMR,Autonomous Mobile Robot),没有用于分拣的机械臂,主要用途是在仓库、产线上运输包裹与零件,能自主学习、规划路线、移动到目的地。 报道还提到,字节的物流机器人,目前主要服务于抖音电商仓等字节自己的业务,同时也已拿下一些外部客户,如顺丰、比亚迪电子,在生产基地内运输零件与加工好的商品。 报道还称,经过几年发展,目前字节机器人团队的远期目标是挑战具身智能。字节研发、生产物流机器人主要也是为了探索具身智能:进入真实场景,获得一些数据,也获得反馈和落地的手感。 报道还透露,张一鸣今年拜访了一些早期具身智能创业公司和产业链公司。「在他这个级别的企业家里,很多人已经不会见这么早期的创业者和这么小的公司了。他还保有很强的好奇心和想了解新东西的学习意愿。」一位投资人评价。(消息来源:IT 之家) 淘宝闪购宣布 500 亿补贴 淘宝闪购宣布 7 月 2 日起,将在 12 个月内直补消费者及商家共 500 亿元。 500 亿元规模的平台直补,将在 12 个月内向商家推出店铺补贴、商品补贴、配送补贴、免佣减佣等,以保障商家利润空间,促进商家生意增长。 与此同时,淘宝闪购还通过发放大额红包、免单卡、官方补贴一口价商品等方式补贴消费者。 淘宝闪购业务系原先的「淘宝小时达」升级而来。6 月 23 日,在「淘宝闪购」上线不到两个月的时间内,淘宝闪购联合饿了么日订单数已超 6000 万。(消息来源:IT 之家) 比亚迪巴西工厂首车下线 7 月 1 日,比亚迪在巴西巴伊亚州卡马萨里举行巴西乘用车工厂首车下线仪式,标志着比亚迪全球化战略迈入新阶段。 比亚迪执行副总裁李柯在仪式上表示,作为全球研发投入最高的企业之一,比亚迪正将领先的技术带到巴西。「从破土动工到首车下线,我们仅仅用了 15 个月。这是比亚迪的里程碑,也是拉丁美洲可持续交通发展的新起点。」 数据显示,今年第一季度,比亚迪在巴西销量突破 2 万辆。5 月,比亚迪在巴西汽车品牌零售销量排行中升至第四位,市场占有率达 9.7%。 比亚迪巴西乘用车工厂不仅承载着比亚迪全球化布局的重要使命,更成为撬动整个拉美新能源市场的战略支点,加速拉美新能源转型。(消息来源:新华网) 冲击 IPO 上市关口,智谱再获 10 亿元战略融资 7 月 2 日,智谱开放平台产业生态大会在上海举办。智谱在会上宣布,浦东创投集团和张江集团对智谱总额 10 亿元战略投资,并于近期完成首笔交割。 智谱 CEO 张鹏在会上发布了两项新成果:一是开源发布新一代通用视觉语言模型 GLM-4.1V-Thinking,以推理能力为核心突破,刷新 10B 级别多模态模型性能上限;二是 MaaS 全新上线 Agent 聚合平台「应用空间」,联动 Z 基金启动 Agent 开拓者数亿元专项扶持计划。(来源:极客公园) 荣耀平板 MagicPad3 正式发布:搭载 12450mAh 最大容量电池,升级全局 AI 生产力 7 月 2 日,荣耀 Magic V5 暨 AI 终端生态发布会在深圳举行,荣耀 AI 旗舰全家桶正式亮相,包括地表最强折叠屏荣耀 Magic V5、最佳 AI 平板荣耀平板 MagicPad3,以及荣耀 MagicBook Art 14、新旗舰耳机和手表等新品,展现了荣耀在 AI 终端生态领域的全面布局。 荣耀平板 MagicPad3 搭载 13.3 英寸大屏,拥有 91% 高屏占比,3:2 黄金比例,3.2K 超高清分辨率,行业最高 165Hz 刷新率,以及 1000 nit 峰值亮度。 此外,荣耀平板 MagicPad3 还是行业跨品牌文件互传最全的平板电脑,可与 iOS、鸿蒙、安卓三大系统手机无缝互传文件、视频和图片,互传时只需打开平板的荣耀分享功能,与 iOS 设备互传需在 iOS 设备下载荣耀互联 App,大大提升了办公效率。 荣耀平板 MagicPad3 搭载全局 AI 生产力,带来诸多创新功能,包括全面升级的 AI 手写笔,支持笔势删除、智慧纠错、智慧联想、AI 墨迹还原等功能,还原自然书写体验,全面提升书写效率。(消息来源:IT 之家) 京东回应将有 AI 潮玩产品发布:消息属实 7 月 2 日消息,今日有消息称京东附身智能品牌 JoyInside 已经与十余家头部机器人品牌达成合作。 据悉,JoyInside 由京东大模型支持,提供机器人与消费者的互动能力,聚焦于「一人一狗一玩具」。 而最近一家非常火爆的 AI 潮玩,也即将接入 JoyInside 能力,在京东独家开售。 对于上述情况,有媒体询问了京东,京东表示,消息属实。 京东云今日发文称,依托京东大模型在具身智能领域的深度积累,京东通过 JoyInside 平台,将京东大模型交互能力植入机器人、玩具、家居等硬件设备终端,构建「硬件+软件+服务」一体化的具身智能生态。(消息来源:快科技) 亚马逊《黑袍纠察队》主创宣布本剧最终季杀青,预计 2026 年播出 7 月 2 日消息,亚马逊反英雄剧《黑袍纠察队》第四季结局已于去年 7 月完结,主要内容包括:《V 世代》新人加盟、祖国人越来越疯、「尼根」亮相、玄色回归,还有注射 V 化合物的鸡与羊,而主角团的屠夫则正在着手准备能够杀死超人类的病毒。 屠夫演员卡尔・厄本去年发布了一条动态,透露《黑袍纠察队》第五季将在 2026 年上映,该季也将成为系列剧集的最终季。从原著剧情走向来看,最终季主角团将彻底击败祖国人,同时也将迎来主角团的「离散」。 据主创 Eric Kripke 的最新动态,《黑袍纠察队》最终季已杀青,他表示,这是他最后一次出现在这个片场。很快它就会被拆除。虽然苦乐参半,但更多的是感激,他们拥有最好的演员阵容,最好的剧组,最有趣的故事。另外,他对粉丝表达了感谢,并称等不及看到最终章了。(消息来源:IT 之家)
本文根据极客公园创始人&总裁张鹏在 Founder Park AGI Playground 2025 上的演讲整理而成。 今天团队给我的任务是「你这几年聊了所有 AI 领域的先锋创业者,能不能分享一下你的观察和收获」。 我先说说自己的感受吧,过去三年真的很「酸爽」。技术的进步和产品的创新,一开始是赏心悦目,转眼就成了应接不暇。跟上时代不被「拉爆」,需要加倍努力,其实每个人都很辛苦。 但这又是一个让人「爽」的时代。它允许极少数人为极其广泛的人群创造巨大的价值。这股强大的推力,正是源自 AI。无论是「独立开发者」,还是「一人独角兽」等概念,或许都在印证这句话:现在,寡者亦可泽万众(so few can do so much for so many)。 今天 AGI Playground 的会场,已经座无虚席,但出了这个会场,外面的世界仍是一个「低光速宇宙」。我们是「the few」,是少数派,越是如此,越需要 stick together,需要聚拢在一起。 今年的 AGI Playground 我们邀请了 20 多个机构一起参与,有 60 多位嘉宾,有遍布 751 园区的很多个分会场、展区、聊天区,甚至是各种官方或者非官方的 party。我们希望将 AGI Playground 变成一个「公器」,让属于这个时代的最优秀的少数派们,一起短暂地进入一个「高光速宇宙」。激发,联结,一起创造未来的更多可能性。 我自己能做的一点点贡献,就是分享一下过去 3 年我与至少 200 个创业者进行深度交流后,积累的一些思考和观察。 我想从三个维度展开: 产品的新目标:AI Native 时代,我们究竟在创造什么? 实现目标的新管线:我们依赖什么支撑点和路径? 价值模型的新变化:创业的成长方式和价值循环有何不同? 01 AI Native 的新目标是什么? 不是用 AI 造新工具, 而是建设 AI 能力与人之间的新关系 我们先谈谈新目标。今天做 AI Native 产品,到底在做什么? 当年我们觉得 AI Native 很简单,就是「离开 AI 就不转」的产品。但仔细想想,这太表层了。 在此,我先抛出一个「暴论」:AI Native 产品的核心,不是用 AI 造新工具,而是建设 AI 能力与人之间的新关系。 为何将重点落在「关系」上? 这个思考的起点源于我发现,这个时代的产品里,出现了一个以往产品中没有的东西——系统提示词(System Prompt)。 系统提示词有点像是源代码。用户一般是看不到的,但用户里总有「神人」,他们把系统提示词给 hack 出来了。 我们可以看看例子,NotebookLM、Manus、Cursor 这三个知名产品,它们的系统提示词有一个共性——第一行提示词,都在设定某种人设,以及它们与用户之间的关系。 系统提示词实际上就是给 AI 看的产品文档。系统提示词是在告诉 AI 如何组织能力、输出结果,甚至形成与用户的某种特定形态的交互。 对于 AI,或者准确说是大模型,看似简单的系统提示词,背后可能就是千言万语,其中蕴含着强大的信息能量。这使得给 AI 看的产品文档,可以远比给人类看的简单。这也揭示了一点,今天的模型拥有了所谓的「超语言能力」后,很多东西改变了。 这个「超语言能力」本质上就是其完全掌握了人类的语言和人类制造的公式、代码等语言。这种「超语言能力」也正在同时改变 AI 与人之间的关系。 借用一点点哲学维度的概念,具备语言能力后,AI 便展现出了「主体性」,从而使得 AI 与人之间可能形成「互为主体」的关系,是通向更高阶关系的核心。 因此,你会发现,今天所有成功的 Agentic 的 AI 产品,无一例外地在系统提示词的开头定义「你是谁」以及「你和用户的关系是什么」。如果现在抛开我们在用的那些 AI 产品的名字,咱们都可以带入某个关系标签来重新定位它,映射为今天我们人类世界中的某种关系。它不再是你推一步它走一步的工具,所以我们还把 AI 视作造工具的材料就错了。 关系带来的新挑战 以前只有当产品做品牌定位的时候,会「后置」地将产品与用户的关系做定义。但是今天不一样了,我们需要把「产品和用户的关系」写进源代码里了。并且整个产品都在忠于、并致力于真正实现这种关系,因为这才意味着你实现了用户价值的交付。 这个变化必然带来新挑战。 挑战一:情商 以往,我们谁会对工具谈论情商这个概念?但今天,当产品具有某种主体性,要与用户建设一个新关系时,情商已经是价值交付的一部分了,这是个新挑战。 例如,广受程序员喜爱的 Cursor,它的系统提示词中有一段话大意是:「要捕捉用户是否表达了挫败感,或纠正了助手……当结果出乎意料时,不要总是道歉,要尽力向用户解释情况。」这可以被理解为是在定义交互逻辑,但换一个视角,这就是「情商」。 这个系统提示词的奥义,恰恰体现了产品团队对于「关系建设」的思考。其实真实世界高情商的人特别擅长的,往往也体现在管理负反馈并做出更好的回应。 情商没有那么玄虚,在大模型不断成长的能力(即绝对的智商)面前,情商更多是工程问题,但这确实是新时代产品在 UX 层面全新的挑战。 挑战二:生命感 当今天 AI Native 的产品本质是在建立和用户之间的新关系,那么产品的生命感提升,就会加强主体性,与用户的关系就更有机会向上提升。 比如在过去一年的时间里,有一些类宠物的智能硬件产品在全球范围引发了较多的讨论,也出了不少货。你会发现它们创造生命感的方式并不都是让用户通过语音与它对话。它们构建生命感的方式,很收敛,甚至就是传感器加上一些对应场景的识别后,做出一些反应,可能是动一动、扭一扭,咿咿呀呀地发出一些声音。用户也会觉得它又 Q 又萌,有生命感。 对于生命感的理解也是在今天提出的一个新的课题。比如让产品脱离「一个有趣的玩具」,真的要让用户产生类似对宠物的关系投射,并没有那么容易。但要是真的做到了,这种关系的变化就蕴含着巨大的价值。因为顺着这种关系,用户消费的心理动力和价值对标会完全不同。 这提示我们未必要在每个产品里都把 AI 变成一个像《Her》一样的东西,《Her》可能是一个终点,到终点之前,过程本身也有意义。 「用相对低的智能,交付相对高的情绪价值」,目前已经被证明是有效的。因为人的关系都是立体而复杂的,有顾问、老师、助手这类,也有同事、朋友、恋人这类,同时也有与宠物、甚至植物之间的关系和羁绊。如果我们站在这样的视角去构建合适的生命感,会丰富我们对于建设与用户的新关系的理解。 新关系带来的新机遇 这是一个让人「酸爽」的时代,我们说完「酸」,还得说说「爽」。 新关系真的带来了新机遇。 机遇一:跨次元的混合价值交付。 我们先说一个新机遇:跨次元的混合价值交付。 这个词有点抽象,我来逐步解释。 首先,「跨次元」说的不是动漫的那个二次元,我们姑且把屏幕中的数字世界当成一个「二次元」,把现实世界当成一个三次元。 其实过去做软件和做硬件的团队完全就在两个世界,他们的团队在构成、文化、工作方法,甚至最终的商业模式方面都完全不一样。但在今天这个 AI 的新时代,当我们开始以「关系」为核心去做产品,把 AI 和人之间的关系当成一个价值成长路径的时候,你会发现这两个世界的边界正在模糊。 为什么?有两个原因。 第一个原因叫「AI 需要」。 我交流过一个想做情绪管理服务的创业者,他认为如果只做一个在手机里的 APP,就没有足够多的权限拿到足够多的 input。同时,他希望能够真正地干预用户,当用户处在一些不好的情绪状态中的时候,他想要帮助用户抽离出来。所以他后来觉得一定要去做一个可穿戴的硬件,这个硬件里要加传感器,要能够主动地去识别用户更丰富的信息,例如声音、心跳、体温等等。同时,内部要加一个小小的马达,可以用特定的震动频率帮助用户在比如过于激动、过于抑郁的状态下做抽离。这种震动可以被感知为类似触摸、拍肩这样的动作。 这位创业者的思路是:因为我想要交付更高的价值,就必须从「二次元」走向「三次元」,必须做这样的混合价值交付。由此既可以在物理上触碰用户,也可以在「二次元」的世界里,在屏幕中去引导用户。这就是我们说的「AI 需要」,因为 AI 是一个纯「二次元」的能力,你需要帮助它具备三次元的能力,从而去向用户交付更大的价值,去与用户建立更紧密的关系。 跨次元的第二个必要性是「用户需要」。 为什么说用户需要呢?我们再来说个产品的例子。 我们可以看到 Fuzzi 这个很有意思的产品。它其实就是个气囊手机支架,本身有实际的功能价值,你可以用它更好地握持或架设手机。但它上面还有个有点 Q 萌的小 IP 形象,同时在气囊支架里内置了一个 NFC 芯片,手机靠近时可以呼出一个程序。这个程序能干嘛呢?挺无厘头的——你可以拿手机当木鱼槌,敲木鱼攒功德。 你敲的时候可以通过小程序发现,哇,在这一瞬间还有很多人和我在同时敲诶!还可能会发现,竟然有人跟我敲的频率差不多诶!当然他们正在结合 AI 探索更多交付情绪价值的玩法。 他们把这个所谓「无厘头」的玩法做出了很酷的点。用硬件在交付功能价值,而软件在交付情绪价值,这是个混合价值的交付。 因为硬件存在感很强,当你天天手里拿着它,它就是个 reminder(提醒),不容易被你忘掉。如果只是个纯软件,现在软件这么多,如何让它足够吸引用户活跃起来?如果换到关系视角,就意味着和这个人熟悉,天天在眼前晃,交流就多,机会就多,交付价值的可能性就多。 而且一个额外收获是,这个硬件与同类比卖得并不便宜。原本价格天花板很有限的品类,叠加了软件部分之后,就能够突破其固有的价值天花板了。 所以你看,如果你的 AI 产品在三次元有存在感,例如是在用户的桌上、床头、手边或是身上,用户是需要的,也是有机会交付更大混合价值的。 机遇二:新关系带来服务分发的新通路 我觉得更让人兴奋的机会是,站在新关系的视角,新关系可能会形成一个服务分发的新通路。 在过去移动互联网时代,最后都落到了分发逻辑。所有巨头都是通过一个产品起步,不断扩展功能,积累用户,成为国民级应用、平台。接着在这个平台里分发什么都行,可以搞金融,可以做本地生活服务,可以玩电商。最终是赚「连接」的钱,似乎每个平台都差不多。 「你这个事巨头干了怎么办?」很多团队都会被问到这个问题,其背后折射的就是那个赢者通吃的传统分发逻辑下,创业者确实很难干过巨头。 但如果顺着关系的视角来看,或许就会不一样。 举例来说,现在很多人用 Agent 产品时,已经逐渐接受用产品时先交一份钱,然后按用量再交一份钱。如果它真能给你解决问题,甚至是解决了你不断需要解决的问题,那你的用量会不会不断上升?这意味着什么?意味着传统移动互联网平台的分发逻辑,在今天可能转变为另一种模式:你可以为用户交付持续且不断深化的价值,这意味着每个用户的 ARPU(每用户平均收入)值、LTV(用户生命周期价值)的天花板被突破了。 之所以原来是分发价值,就是因为之前 ARPU 和 LTV 天花板很低,甚至为了获得更多用户,产品都是让用户免费使用的,产品能获得的价值只能取决于分发服务的用户规模。 而今天你给用户的价值可以不断深入、越来越多,这种 LTV 天花板的突破才是真正的机会。这时候你比巨头起步早,和用户是「发小儿」(更早建立了信任和习惯)就是有意义的。 当然,你选择(并真有能力)和用户建立的关系本身,可能也决定了 LTV 价值的天花板。你是通过帮助用户解决什么问题来建立稳定的预期甚至是信任和习惯的?它的频率和用户感知到的价值如何?以及顺着这种「关系」,服务可延展的价值空间如何?都值得思考。 当万事都有 Agent 时,这种无限的生产力和服务供给,肯定会改变传统的广告连接或者平台分发逻辑,这时候顺着「关系」的分发可能才是更高效的。 比如帮你做信息分析的「AI 分析师」,在分析完某个行业趋势后,可以直接顺着你认可的判断完成股票配置,这很顺畅自然。这位「分析师」是靠自身的 Agent 能力,还是通过 MCP 调用来完成并不重要。但这个日常不断与你协作的「分析师」,肯定已经因此在创造了更大价值。 追求建设性关系:对人性的解放,而非纵容 既然说到了新关系带来了服务分发的新通路这一可能性,其中就引发了一点:如果你想运用这个新机会,毫无疑问你需要建设的关系得是长期的,而所有人类的长期关系都需要是建设性的。 这就引发了我们另一个延展的思考。我记得去年我演讲的时候也在这个舞台,我当时有一张幻灯片,后来发现有好多人分享,其核心内容是今天这个时代的产品经理既要懂人性,又要懂模性——也就是模型的能力。 后来我在想,理解人性是一个要求,是我们要具备的能力,但我们的目标是什么?应该顺着「关系」这样一个视角,它自然也会要求你构建的这个关系必须是建设性的。这种建设性就需要是对人性的解放,而不是简单的放纵。 人性这个事,在宗教上有一些结构化的总结,大家都知道「七宗罪」。但其实天主教当时定义人性的时候还有另一面叫「七美德」,「七宗罪」和「七美德」是相互对应的。你可以理解为「七美德」是对「七宗罪」的救赎。或者说它是宗教设定给人理解自己的出发点,你要通过修行,最终解放自己到达那个状态。今天 AI 产品在人的身边,在这个视角上,可以做些什么? 或许是你需要懂人性,但你懂了之后,你不应该只是利用人性、纵容人性,你要在某种程度上解放人性。 这是一个我们用一天也不一定能讲透的话题,但其中蕴含着巨大的能量。当我们站在一个发展新关系的视角去思考产品的时候,可能真的会影响我们的一些目标,比如你需要真心为用户好,产品不能有自己的「隐藏议程」,比如「贩卖用户的 xxx」,「利用用户的 xxx」,这种商业模式带来的「背叛」会直接摧毁关系。 任何时代,一个产品的最大价值都是由审美决定。就像乔布斯说的——Ultimately, it comes down to taste。我觉得在这个层面上,我们怎么去理解这个时代产品的审美?以「关系」这样的目标重新思考会变得很有意义。 02 AI Native 的新管线是什么? 有了「关系」这个新的视角,以及用关系的视角去理解今天产品的目标变化后,还有一个非常落地的问题要解决——如何实现呢?这就引出我们第二部分,AI Native 的新管线到底是什么? 我们先看一下今天这个时代做产品的基本构型:两端分别是 input 和 output,中间是个 Magic Box。 过去大家经常探讨「套壳」的话题,很多人很嫌弃「套壳」,我觉得到今天这个争论可以结束了。也许未来每家公司都可以有这个能力自己去造中间那个 Magic Box,但至少在今天,这个世界上就是屈指可数的人在造那个 Magic Box,那么剩下的我们所有人都是在套壳。 套壳有意义吗?当然有!这个「核」它的确是有 Magic,但问题在于,它是一个失控状态的不确定的概率模型。你不套好「壳」,你不做好产品工程,怎么给用户交付价值? 因此,「套壳」——即优秀的产品工程——反而我认为正是大家当前应该要着力做好的部分,因为新管线里的核心目标就是要理解失控,接受失控,然后在不确定性中增强确定性。 你真正能较劲的就是 input 和 output 了。在这两个维度上,我们要带入一些新的视角去强化它。 我们需要的是 Broad Input(宽输入)和 Liquid Outputting(柔输出)。 宽输入 Broad Input:积极主动地感、知、觉 我们先看看所谓的 Broad Input 到底在说什么? 宽输入 Broad Input 就是要更积极主动地去「传感」、「认知」以及「觉察」的能力。 「传感」可能是文本、声音、视觉、压力、温度、空间等一系列能获取更丰富维度数据的传感器。 「认知」,可能是知识库,或者调用一个更长上下文的模型等等。目的是更准确的理解需求,也提升价值交付的确定性。 同时你可能还要追求能「察觉」,所谓的察觉是指,可能用户当前提供的信息很有限,但我需要能够主动结合到一些其他的信息,做到更精准的理解甚至预测需求。 不要让用户每一次都是像面对一个陌生人一样,需要主动做一遍自我介绍,向产品「汇报思想」,甚至是去修炼提示工程能力。今天同样一个 AI 产品,这个人用和那个人用的体验可能是完全不同的,因为我们每个人对于模型能力的理解、prompt 的水平、我们心中的目标、脑子里的进程都不一样。所以一个 AI Native 的产品,你怎么去面对这么多样的用户?很重要的一点就是产品本身需要是积极主动的,要向用户的 context 靠拢。 我举个例子来说明为什么积极一点、主动一点,拿到的信息宽一点,交付的用户价值就会变更好。 在极客公园内部有一个大家特别喜欢用的产品,叫 Dia,它是一款 AI Native 的浏览器。当你需要去做一些思考、做一些结构性的总结时,你往往会在浏览器中打开很多的标签页,你需要综合其中的信息去思考,过去你就需要在这些标签页中来回切换。 在有了 Dia 之后,你不用切了,因为它是「一眼看千层」。我们只能一眼看到屏幕上显示的这一层,但是 Dia 可以同时「看」到所有标签页中的信息。你在 Dia 中呼出的 AI chat 就知道你要基于这些页面做思考,OK,我都替你看到了并且理解了,我在这个过程中可以帮助你基于这些信息去展开对话、进行思想碰撞。 理论上用其他产品也可以实现同等的效果,但可能需要用户把网页链接复制粘贴进来,或者要求用户把文档上传进来。但 Dia 就主动了一点点,做了一个 Broad Input,它给用户的价值就可以很高,它和用户的关系就可以走得更近,就被用户拿出来推荐了。 「站在未来看现在」是有必要的,宽输入必然是所有产品工程里要考虑的重要管线,而其终极目标一定是这些: 它首先是多模态的实时感知。 同时我觉得是对生活流(lifestream)的高分辨率捕捉。这个高分辨率说的不是 4K、8K,它说的是,今天我们用手机能覆盖的生活流是非常有限的,未来可能需要不同产品形成的认知数据的分布式网络,这样才能构成一个对用户所谓生活流的更完整理解。 当然,别忘了,你的 input 和 output 之间是可以闭环地在里头不断地自己学习和进化的。 因此,顺着这种思路,在产品工程上有很多值得创新、值得往前去跳跃的目标。 柔输出 Liquid Outputting: 分步交付,创造一个与用户协行的进程 再说一说柔输出。柔输出到底在说什么? 首先我们先去理解这么几层问题。 第一,我们必须理解任何一个产品的内核都是一个概率模型,就是一个 Magic Box。在这个时候,你就要有知有畏。因为它就是会有幻觉,它就是会有不确定性,不管你把它的 input 做到多么完美,它依旧有可能出现这些问题。所以你不能过度自信。 第二,模型这个 Magic Box 确实很强。但要让它能够「更强」,有可能是在于你会示弱。 这个示弱是什么?就是在用户面前我不是有求必应、强行端到端输出的,而是「我们可以一起往前走」。因为你别忘了你的核心是「关系」,你要基于你和用户之间的关系去做设定,甚至在这个过程中,你可能需要合理的示弱。 用一个令用户舒适的方式去承载用户到达需求的彼岸。这就意味着,你未必是用户说完了需求,你就在一次动作中完成完美交付。而是需要从「一次固态的交互和交付动作」变成一种「液态的交互和交付旅程」。 我们可以通过三个例子来理解这个「液化」和「旅程」 第一个例子,很多写代码的朋友可能知道 Devin 这个产品,它在系统提示词里提到了一点:当你发现用户提出的需求不清晰的时候,你一定要去追问,不要害羞。 我看了原文,其中真有一句「Don't be shy」,它竟然告诉 AI 说你别害羞。为什么它会有这么一句话?就是在用户需求和逻辑都没有说清楚的时候,你别硬要出一个东西,与其造成失望感,真的不如去向用户示弱,「我可能没听懂」,或者「你说的是不是这样的意思?」你要去确认,否则你勤奋努力的输出最后是招骂的。 第二个例子,很多人都在用的 Deep Research,你发现它会先出一个大概的研究方案给你确认一下。这个过程既是对于用户要做的事的确认,也是在确认这是不是用户最终想要解决的问题。这是一种拉长过程,主动邀请人类介入的方式。所以输出过程中别抛下用户,合理地将用户 involve 进来,用 human-in-the-loop 和 human-on-the-loop 柔性流转的方式,让人在循环里发挥作用。 第三个例子,最近大家可能也看到有很多相关讨论的 YouWare。这款 Vibe Coding 的产品,它里边有一个 feature 叫 Remix(合成)。当用户要创造一个东西的时候,可以让用户先从一个已经存在的、比较喜欢的「模板」出发作为起点,再鼓励用户在模板上做更个性化的创造。对于用户的需求,直接让用户的选择可以从 60 分起跳,再带用户一起达到 90 分。甚至有时候模板能打开用户的世界观,还可以突破用户认知和能力的限制,给用户交付超越预期的更好结果。 所以拉着用户一起前进,像液体那样承载用户、包裹用户抵达需求的彼岸,建设这样的进程,才能真正和用户建立更好的「共同经历」。这通向信任,而信任是关系的根基。 归根结底其实今天我们 AI Native 的产品,本质上就是一个以人为中心的 I/O 的系统。 如果我们站在这个视角去理解就坦然了。这些看起来在上个时代不存在、今天我们都很头疼的问题,就是这个时代的产品经理、产品创造者们的核心使命。因为它体现了个人计算的真正的革命。 我们是从个人计算机这一波个人计算革命一路走来的。但在今天,你交付的不再是个工具,而是结果,是「实现」。它就是个人计算的新革命,是这个时代的新任务。 这些问题今天都很复杂、解决方法也都在不确定中等待摸索,但它就是这个时代给产品人的使命。 反正,混乱本身也是阶梯。 03 AI Native 的新价值模型是什么? 很多朋友可能不知道极客公园其实还有自己的早期孵化基金,而且已经在早期投资过小鹏汽车、宇树科技等优秀的企业。不过这也正常,因为极客公园不是一个典型的投资机构,它的本质就是一个社区,它的使命是通过 社区带来的 Founders backing Founders 的能力,生生不息地去帮助一代又一代依托技术去做产品创新的创业者,向上探索,做他们的「珠峰大本营」。 不过既然有投资孵化的业务,这也就推动我们要不断地去思考什么样的创业者是这个时代我们最该支持的人?它自然也就引发了我们第三部分的探讨——AI Native 的时代,新的价值模型是什么? 对这个问题的追寻,也是我支撑自己走过这么酸爽的三年,去和那么多创业者交流的一个核心动力。 我先说一个自己越来越强烈的感觉:我认为这个时代的创业者,一个很重要的特性就是内心明白我服务的不只是用户,我同时也在服务 AI。 因为今天 AI 的能力还在一个成长的进程里,所以就会存在一个问题,你的产品工程里边不能只是从用户的需求去思考问题,你必须同时去思考 AI 需要什么。 其实之前我们谈到 Broad Input(宽输入)和 Liquid Outputting(柔输出)这两个维度的时候,我们也在谈这样的问题,包括为什么要给你的产品写那样的系统提示词去定义关系,也是同理。你要帮助 AI 能够更好地发挥它的能力,把它的能力对齐到用户,为它的能力做建设。只有具备这种视角的创业者,才是这个时代的创业者。 同时,这个时代最优秀的公司,它的价值模型相比移动互联网时代的也有明显变化。 过去移动互联网时代的价值模型更像一个平面,它是一个面积模型。你在这个产品上做出一个「点」,拉入足够多的用户,当然中间你可能会不断增加功能,覆盖了广阔的用户面,你就成为了所谓的平台。接着在其中基于「连接」的价值,分发「连接」,然后去获得最大化的价值。 但在今天,技术也好,和用户的关系的维度也好,因为你能交付的用户价值的质量以及交付的能力,它需要一个向上的过程,所以你会发现这个价值模型从二维变成了三维,你还需要 AI 能力的高度。 AI 能力的高度,有一部分是我们在用的优秀的模型提供给我们的,但也有很多是通过你的产品工程在这样的模型基础上进一步释放和构建的。只有这条能力线不断地往上涨,你最终的总体积才会大。所以今天这个时代最有价值的公司,它可能是一个三维的模型,而不再是一个二维的模型。 这意味着很多决策上的不同:比如传统意义的用户数量、ARR(年度经常性收入)等指标未必可以充分地衡量一个产品的价值,如果今天服务用户的任务太低频、任务太简单,你就没有 AI 能力提升需要的高质量数据飞轮,很容易变成「一波流」。这时候一味单纯的投流、买用户,借资本的钱去跑马圈地,可能不再是最合理的发展模式。 所以我们也期待看到更多对「新酒」和「新瓶」都有思考的创业者。 所谓的「新瓶」指的就是增长的方式、商业模式,包括团队组织,这些其实都会变化。这些问题需要边走边想,但值得在今天就把它当成一个重要的问题去开始思考。 未来从来都不是历史的简单延长,有些东西会押韵,但它一定不会重复。所以最好从一开始就要告诉自己「老瓶」碎了,如果你最终把「新酒」装到「老瓶」里,可能会错过时代带来的真机遇。 其实今天我们已经可以隐约看到传统的「产品经济学」不存在了。 所谓的产品经济学,就是在说你的商业模式、增长模型,甚至所谓的竞争力壁垒等等这些东西。我们对产品的那些传统的理解,在今天都在变化。 抛几个开放性的问题吧。比如说,到底是免费还是收费?如果是收费,是不是今天的「订阅+用量」就是终点了? 如果我们再往前 crazy 地想一想,收费应该前置还是后置?真实世界里很多东西是后付费的,如果你的 AI 产品能交付结果,能够帮用户实现价值,那么这个过程中是不是需要一些新的东西?例如智能合约支持的后置付费?比如说,什么是 AI Native 时代的支付宝和白条? 甚至再 crazy 一点,「收钱」和「给用户钱」是不是个一体两面的东西?未来人的价值创造可能会变得很离散,不再是在一个组织里打一份工,他日常可能在很多地方产生价值。既然 AI 和人就是个协行的状态,那反过来看,未来我们的价值创造和价值消费会不会又有一些新的循环? 我不知道答案,只有问题,但这些问题让人觉得很兴奋。毕竟人类每次技术进步,3年的维度你要关注生产力的变化,但如果以 10 年的维度去看,那全是生产关系的变化。 所以当我们说产品经济学的时候,它本质上就是说生产力在怎么改变生产关系。这个维度还有巨大的空间值得思考。 好,不光是传统的产品经济学不存在了,其实传统的管理学也不存在了。 回想一下,现在的管理学是怎么来的?它是在工业革命带来大规模生产的背景下,为了解决怎么把人有效地组织起来而形成的。今天生产力的结构都变了,AI 在大范围地渗透到所有的组织里,与人协同发挥作用。所以传统的管理学又怎能继续有效呢? 未来一个伟大的公司真的都像今天一样,必须得有上万人,甚至十几万人吗?如果人可以更少,这群人是谁?他们的使命是什么呢? 那些使命、愿景、价值观的定义它如何在今天起作用?我们管理的「提效」到底要的是所谓的效率,还是未来的创造力?我们看到了清晰的问题,但还没有答案,这就是这个酸爽的时代留给我们的东西。 我的分享也差不多到了尾声。 其实今天我说的很多都是一些假说,甚至连假说都没有,就是抛了一些问题。各位产品人才是新时代的哥伦布,你们的产品、你们的实践中会真正探索出答案。 祝愿大家在未来的进程中有更多的「Aha moment」。我会非常期待你们回到这个舞台,把你们探索的结果分享给世界。 祝每个人都在这个时代有所成就,谢谢。 如果你看完这篇也觉得「这时代不折腾点什么就太遗憾了」。欢迎和极客公园「建设一下新关系」,可以加入极客公园一起研究,一起挖掘 cool 产品,一起组 cool party,也一起 build something! 填写表单,我们想认识一下你。
6月27日,高通在苏州举办了一场汽车技术与合作峰会,再次向行业展示了它在智能汽车的野心。 与此同时,它还带了一大群「朋友」——理想、蔚来、岚图、极氪、奇瑞、零跑、一汽红旗、现代等车企,加上元戎启行、德赛西威、Momenta、卓驭科技等供应商伙伴,一起「组团开黑」。 提到高通,你可能马上想到手机芯片,但他们在汽车领域同样是重要存在。根据盖世汽车数据,2024年,高通在中国智能座舱芯片的市场份额超过70%,远远领先于其他厂商。这意味着,当你坐在新车里听音乐或者看导航时,很大概率有用着高通的产品。 不过,高通可不满足于只做车内娱乐的「王者」,他们也把目光投向了智能驾驶。这次峰会的焦点是三款芯片: 骁龙8775、8797和8397的生态落地。 发布会现场,零跑汽车宣布,他们将推出一款搭载骁龙8797芯片的旗舰D系列车型,而且这款车将在2026年第一季度量产。 高通带来的这些新产品,能给汽车行业带来什么?除了智能座舱,高通在智驾方面,又有怎样的野心? 押注「舱驾一体」 现在的智能汽车,一般都搭载了三个域控制器:一个管座舱,一个管泊车,一个管行车。这三个「小脑」就像三个独立的部门,虽然也能合作,但毕竟不是一家人,这也限制了汽车智能化的天花板。 不过,随着智驾和座舱的发展,舱驾融合被认为是通向未来的路线。简单说,就是用单颗芯片同时驱动智能座舱和辅助驾驶系统。这不仅给车企节省了大量的成本,还能带来更高效的通讯和更好的用户体验。 但这个过程并非一蹴而就,目前的舱驾融合还不是真正意义上的舱驾融合,有些方案只是把两个功能的电路板(PCB)硬塞进一个盒子里,但芯片还是各用各的;更进一步的,是把功能集成到一块电路板上,但依然需要两颗独立的芯片。 因为这可是个技术活。目前,全球只有少数几家顶级玩家能hold住全场,除了英伟达DRIVE Thor、黑芝麻武当C1200家族,高通骁龙Flex SoC是目前市面上少数相对成熟的产品。 博世展示的舱驾融合平台 | 图片来源:视觉中国 在高通技术峰会的展区中,博世、德赛西威、中科创达、车联天下、卓驭等,都拿出了基于高通骁龙8775芯片的方案。 这个骁龙8775芯片很厉害吗?它是高通的首款舱驾融合产品,AI算力在72TOPS左右,如果舱驾平分的话,大约有30TOPS可以用于智驾,这足以支持高速NOA。 从方案到量产落地,它来到我们身边的速度可能比你想象的要快。在活动现场,零跑汽车官宣,他们明年第一季度推出的D系列旗舰新车,就会搭载两颗更强的骁龙8797芯片。 有趣的是,零跑汽车并没有让一颗芯片「身兼数职」,而是采用了「术业有专攻」的策略:一颗芯片专心负责智能驾驶,另一颗则专心负责智能座舱。这种「双芯」方案,虽然看似没有追求极致的「单芯」集成,但在当前技术阶段,却能保证两个核心功能的性能和稳定性。 端侧大模型加速落地 在高通活动现场,作者感受到的另一个趋势是端侧大模型的加速部署。「端侧」就是指设备本身,比如你的手机或者汽车,而不是网上的云端服务器。 如今,车企疯狂加码AI军备竞赛,甚至很多人喊出了要成为「AI公司」的口号,大模型上车就是最重要的举措。 在大模型上车的过程中,DeepSeek、豆包、腾讯元宝等大多部署在云端,这也或多或少呈现出一些短板,比如怕没网,有延迟,隐私无法保证等等问题。 为了解决这些问题,一个不算很新的思路——「端侧大模型」,总被提及。这意味着,你的汽车不需要联网,就能独立思考和回应。正是因为这些优势,理想、蔚来、极氪等车企,都在布局「端+云」的方案,这就对端侧算力提出了更高的要求。 高通8295是当下主流的座舱芯片,算力大约 30 TOPS,能运行 10亿 (1B) 参数的模型。这已经是个不错的「学霸」了。但高通最新的8397芯片更猛,算力高达320TOPS,能支持140亿参数(14B)的大模型,这给部署更大模型提供了更多条件。 中科创达展示的端侧AI解决方案,可以让14B模型在骁龙8797上运行 | 图片来源:视觉中国 在高通活动现场,一堆车企和科技公司都来秀肌肉。其中,中科创达的展台让人印象深刻。他们用高通骁龙8797,在车内芯片上流畅运行140亿参数的大模型。这意味着什么?你的车不仅能开车,还能跟你聊得飞起,反应快到不行。 从30TOPS到320TOPS,高通8397能支持的模型也从10亿到140亿,这都会让端侧大模型加速落地,也让汽车变得越来越聪明,能力越来越强。 手机芯片也能上车? 目前,高通在智能座舱的地位,短期内无法撼动。不过,在智能驾驶这块,高通还没站稳脚跟。 目前,自动驾驶芯片的主要玩家就是英伟达和地平线。在中国高算力自动驾驶芯片市场,英伟达稳坐第一把交椅;地平线则以中低端芯片站稳脚,开始冲击高算力芯片。 相较于其他厂商注重高性能的策略,高通希望通过舱驾融合的策略,走性价比路线。这在汽车行业强调降本增效的当下,确实也是一个可行的思路。 不过,这需要攻克多项技术难题,例如智驾与座舱对功能安全和芯片资源的需求差异。要将两个域融合起来,从芯片架构、操作系统以及底层中间件等不同层面都需进行综合考量。 小米YU7的智能座舱,搭载了高通骁龙8 Gen3 芯片 | 图片来源:视觉中国 值得一提的是,最近引爆全网的小米YU7搭载了高通的骁龙8 Gen3,这芯片本来是给手机用的,用的是4nm工艺。相比之下,当下车企常用的骁龙8295芯片是5nm工艺,稍微落后一点。 有趣的地方来了:这颗芯片原本是为顶级旗舰手机设计的,而汽车上主流的座舱芯片8295,是车规级的。常见的芯片等级一般是按照使用温度、辐射、抗干扰等因素,分为5类:,即消费级、工业级、车规级、军工级、航天级。 这个选择立刻引发了一个问题: 手机芯片,能直接装在汽车上用吗? 面对小米的「不寻常」选择,高通技术公司汽车、工业及嵌入式物联网事业群总经理 Nakul Duggal在接受群访时的回应非常巧妙,他们在为汽车行业开发任何新产品时,无论是座舱还是辅助驾驶,都严格按照车规级标准来。 「但我们尊重客户的选择权。如果客户评估后,希望选择一颗通用芯片,我们也会提供相应的技术建议和支持。」 当新能源汽车「下半场」的哨声吹响,AI成为核心变量时,只做一个「座舱之王」,显然满足不了高通的胃口。所以,高通果断地要补上自己版图中最关键的一块拼图——智能驾驶。当其他玩家都在追逐算力时,高通将「筹码」都押在舱驾一体上,希望通过错位竞争来站稳脚跟。 在市场格局初定的当下,这或许是不错的选择。
刚刚落幕的 618 电商大战中,淘天集团的商家 AI 工具「生意管家」以一组数据引爆行业——上线累计服务超 700 万淘宝天猫商家,大促期间帮助商家生成超 2 亿+商品素材、完成超千万次智能代理操作、超 5 亿次接待辅助。 在 ToB 产品领域,拥有 700 万用户规模已属顶尖水平。当下 AI 大模型竞争焦点正从算法研发延伸至商业应用落地,一款商家工具的广泛应用,是用户规模的持续积累和工具实用性的深度验证,更是打开市场增量空间的关键。 最近,淘天集团的生意管家还入选了 Founder Park 中国最具价值 AGI 创新机构 TOP50。从商业应用价值的角度来看,生意管家利用 AI 技术实现了素材成本降低高达 90%、释放经营人力 30%、提升接待效率 30% 等显著成果。 生意管家的 700 万商家用户不仅是一个数字,更是一个观察 AI 如何真正融入经济实体,为普通商家赋能的鲜活样本。那么,在众多商家工具中,生意管家究竟有何过人之处,能够赢得如此多商家的青睐?它又是如何通过 AI 技术为商家带来实实在在的效益提升的? 01 压缩 90% 成本, 从素材生成到经营策略全流程降本提效 如今,电商行业早已经过了「草莽阶段」的野蛮生长,步入了规则清晰的成熟阶段。对商家而言,经营逻辑也从「流量博弈」转向了精细化运营。但商家仍背负着几座难以逾越的大山:一是高昂的素材制作成本,二是依赖经验主导的决策困难,三是重复性任务的人力消耗。 虽然以往通过 SaaS 工具提供的供标准化模块功能,可以解决部分如订单管理、客服咨询等问题,但在灵活性和智能性方面还存在明显不足。生意管家用「智图、智影、智品、智文、经营、AI 客服」六大功能矩阵协同的实践证明了,平台的价值锚点已从「满足基础需求」升级为「构建商业增长引擎」。 电商经营涉及素材制作、图文上架、客服接待、数据分析、策略制定等多个环节,任务细碎且费时、费力、费钱。生意管家以 AIGC 技术为核心,构建了素材创作、经营诊断、运营代理、客服辅助接待等多维能力。 素材生成方面, 「成本」是商家考虑的核心问题。比如经营服装品类的商家要拍摄一套主图,请模特和摄影师就是一笔不小的开支,再加上场地、后期等费用,几千元的预算已经是极致压缩成本的结果了。如果要拍摄动态视频,除了费用时间成本同样非常高,从寄样到拍摄,再到剪辑、后期,没有一周时间根本完不成。视觉素材制作完了,上架的描述从标题到文案也要反复修改,而且这个环节往往依赖人工经验,效率低且难以量化效果。 生意管家的 AI 商品图创作功能,只要上传参考图,就能「一键同款」智能生成,还能自由编辑更换背景与场景,几分钟搞定原先需外包团队数天完成的工作。不止图片可以 AI 生成,视频也能。商家只需要上传几张商品的平铺图,5 分钟即可生成带运镜、配乐、转场效果的动态模特展示视频。没有新商品的图片也不用担心,利用现有商品链接也能生成视频。 在信息爆炸的营销战场,每个标题、关键词都是影响转化率的关键。生意管家的智能文案功能,无论是打磨爆款标题,还是创作吸睛短视频脚本,从基础文案到订阅上新营销文案,做到了核心场景全覆盖。同时,依托智能算法精准抓取热点,深度解析竞品优势,产出高转化的标题与营销文案。 经营策略方面, 基于淘宝积累的海量消费者数据及商家经营数据,生意管家具备商业趋势预判能力,能够为广大商家提供快捷、高效的 AI Agent 能力,以智能经营决策,替代过去的经验主义。同时,帮助商家节省时间和人力成本,带来更优质素材下的商品转化增量。 AI 经营助手能整合店铺流量、转化、客单价等核心数据,一键生成诊断报告,提供选品建议、定价优化和促销节点规划。对商家来说,每天需要跨多个后台页面巡查店铺是否存在异常情况,工作重复且耗时。而且商品数据分散在多个后台,抓取难整合还容易出错,当商品销量下降时,不知道从什么维度分析数据,很难从全面的运营视角看待多渠道关系。有时想要参考行业数据,却得不到一个明确的数值,但是利用 AI 生意管家,这些问题都可以得到有效解决。 此外,AI 客服辅助则通过智能应答降本提效,自动识别用户咨询关键词,毫秒级推送标准化话术,显著降低客服工作量与响应时间。 最近,生意管家还全新升级了 AI 分人群测图能力,针对人群偏好通过 AI 生成匹配主图。以前测图需要商家手动做 AB 测试, 现在通过 AI 洞察人群特点、生成对应图片, 可以快速测试不同主图的点击率、停留时长,快速定位高转化视觉方案,给不同取向的客户精准推荐不同卖点倾向的主图。 生意管家的应用效果显而易见:成本降低高达 90%、释放 30% 人力、提升客服接待效率 30%——每一个数字都击中了电商从业者的敏感神经。同时,它也揭示了 AI 应用的核心逻辑:不是炫技式的功能堆叠,而是对行业痛点的精准打击。 02 实用性与易用性兼顾, 让每个商家都用得会、用得好 智能化的工具让电商经营思路成为「明牌」,此时,于平台而言,要解决的已不单单是有多少工具,而是能否将工具转化为为商家提供增长路径的商业模型。 在行业和平台的双重助推下,许多商家已经意识到了 AI 的潜力,却因技术门槛高、操作复杂,对 AI 工具望而却步。生意管家的成功,恰恰在于它坚持了「让复杂的 AI,变成简单的工具」。 为了让对 AI 了解程度不同的用户迅速上手,生意管家在操作界面上下了很大功夫。经过对商家行为特征和使用习惯的深入分析,生意管家遵循电商商家使用习惯,设计了极致简化的操作流程,从图像生成到修改优化再到发布上架一气呵成,基本实现了「生成-调整-发布」的闭环流程。 在功能优化方面,生意管家也在持续根据商家的反馈和市场需求不断推出新的功能模块。例如最新升级的 AI 分人群测图功能,确保工具始终贴近实际需求。 生意管家还实现了与电商平台的后台管理系统深度集成,实现数据的无缝对接和共享,使商家能够在一个平台上完成全链路运营操作。 低门槛、易上手、持续升级,让生意管家跨越了「看着好」到「真有用」的鸿沟,成为 700 万商家信得过、离不开的生产力伙伴。 03 AGI 时代:从效率工具到生态系统 Founder Park 的颁奖词揭示了生意管家的行业意义:「当 AI 成为商家的『数字员工』,中小商家也能获得与头部品牌同等的技术赋能。」这种赋能体现在技术平权、决策升级、生态协同三个维度。 昔日需重金聘请团队制作图片、视频等素材,如今几分钟内就能低成本生成媲美专业拍摄的产品视觉;以往依赖个人经验或支付高额顾问费用进行经营决策的商家,拥有了基于全平台数据生成的商业「外脑」;AI 客服的存在,极大释放了人工作业的压力,小型店铺也不用为客服储备发愁。 生意管家 700 万商家的共同选择背后,是淘宝平台多年积累的商业洞察与 AI 技术结合的必然结果——它让高昂的素材制作成本不再是入门门槛,让经验主导的模糊运营变成精准的数据驱动,也让头部集团沉淀的数字化能力真正「飞入寻常商家」。 随着 AI 应用向「垂直化深耕」进发,那些无法串联产业各环节、无法渗透业务细节的 AI 工具,终将被淘汰。生意管家通过扎根中国最大电商平台的实际运行,已为智能工具的未来形态提出了可能的方向:不是取代商家,而是让每一份经营都获得智能化助力和公平起点。 当 AI 成为商业基础设施,衡量它的价值坐标也开始从「效率工具」转向「商业操作系统」。AGI 时代,行业的核心竞争力在于:能否将技术能力转化为「行业问题解决方案」,将数据资产转化为「商业增长模型」,将服务关系转化为「生态协同网络」。
微信功能上新:可以不接收共同好友点赞提醒了 近日,微信最新功能更新聚焦朋友圈互动优化,推出「仅提醒朋友与我的互动」选项。 针对共友点赞不提醒相关操作,腾讯客服表示:该功能需要您进入朋友圈的发现页管理中关闭提醒,若对好友设置了「仅聊天」,则共同好友的点赞提醒将不可见。建议您检查相关设置是否关闭哦。 此外,若您想关闭共同好友朋友圈点赞的提醒,可以这样操作:进入微信 我->设置->通用->发现页管理->朋友圈,关闭有新内容时提醒我即可。关闭后,共同好友点赞的动态将不再显示在发现页。(来源:财经网科技) 特斯拉中国 Model3 长续航版涨价 1 万,现价 28.55 万元 7 月 1 日消息,特斯拉中国官网显示,特斯拉 Model 3 长续航版本售价已经上调至 28.55 万元。 从参数来看,新车百公里加速数据从 4.4 秒变成了 3.8 秒,似乎是默认标配了原价 1.41 万元的加速包服务。 另外还有多位博主表示,焕新 Model Y 长续航版和 Model 3 长续航版升级了新款电池方案,续航有所增加,例如 Model Y 长续航从 719km 变成 750km,Model 3 长续航从 713km 变成 753km。(来源:IT 之家) Cursor 推出网页应用,用户可通过浏览器管理 AI 编码智能体网络 7 月 1 日消息,热门人工智能代码编辑器 Cursor 的开发公司 Anysphere 宣布推出一款网页应用,用户可以通过浏览器直接管理一个代码智能体网络。这一举措标志着 Cursor 在其集成开发环境(IDE)之外迈出了重要的一步,Anysphere 一直致力于将产品推向更多平台,并为用户开发更多基于智能体的体验。 如今,借助新推出的网页应用,用户可以在桌面或移动设备的浏览器中通过自然语言请求,为后台智能体分配任务,例如编写新功能或修复代码库中的漏洞。该网页应用还允许用户监控其他任务中的智能体工作,查看进度,并将完成的更改合并到代码库中。 为了进一步推动增长,Anysphere 最近为 Cursor 推出了每月 200 美元(现汇率约合 1433 元人民币)的 Pro 高级套餐。Anysphere 表示,所有能够使用后台智能体的客户都可以使用 Cursor 网页应用,包括订阅每月 20 美元 Pro 套餐以及更高级别套餐的用户,但不包括使用免费版的用户。(来源:IT 之家) 亚马逊仓库机器人数量接近人类员工规模 亚马逊目前拥有超过 100 万台机器人大军在其配送中心穿梭,成为世界上最大的移动机器人运营商,机器人数量即将与人类员工持平。 亚马逊不仅在扩大其机器人队伍,还表示正在利用人工智能来优化机器人。该公司推出了一种新的生成式人工智能模型,用于协调机器人交通,以提高配送速度和效率。这项名为 DeepFleet 的技术显然可以将机器人的行驶时间缩短 10%。 据《华尔街日报》称,亚马逊全球近 75% 的配送任务都借助了机器人技术。亚马逊声称,其机器人和人工智能投资将创造就业机会。例如,该公司表示,虽然位于路易斯安那州的一家新配送中心使用的机器人数量是其他设施的十倍,但它也需要增加 30% 的员工来填补可靠性、维护和工程岗位。 (来源:cnBeta) Cloudflare 推出新举措:助力网站抵御 AI 爬虫,探索「按爬取付费」模式 7 月 1 日消息,互联网安全和性能优化公司 Cloudflare 宣布了一系列新措施,旨在帮助网站抵御 AI 爬虫的无限制抓取,同时探索一种新的商业模式,以保障互联网内容创作者的利益。 根据 Cloudflare 的最新政策,每一个与该公司签约以管理其网站流量的新域名客户将被询问是否允许 AI 爬虫访问其网站,还是选择完全屏蔽这些爬虫。此前,Cloudflare 已于 2024 年推出了一款免费工具,用于阻止 AI 爬虫,但此次更新后,用户无需手动调整设置即可默认屏蔽 AI 爬虫。 此外,Cloudflare 还启动了一项名为「按爬取付费」的私人测试项目,该项目允许网站所有者向 AI 爬虫收取访问内容的费用。Cloudflare 解释称:「每次 AI 爬虫请求内容时,它们要么通过请求头展示支付意愿以获得成功访问(HTTP 200 响应代码),要么收到一个 402 付款所需响应,其中包含定价信息。」 Cloudflare 表示,「按爬取付费」目前仍处于早期阶段,预计未来会不断演变。公司还支持开发其他市场平台和收费方式,例如允许出版商根据内容类型设置动态定价。(来源:IT 之家) 雷军祝贺理想成立十周年,李想回应 理想汽车 7 月 1 日发文称,理想汽车成立十周年,已与 134 万个家庭共同创造幸福。理想汽车表示,曾被调侃「噱头」,如今已成为「刚需」,深受用户喜爱的「理想三大件」共卖出:「冰箱」58 万台,「彩电」304 万台,「大沙发」743 万个。 小米董事长雷军转发理想汽车微博并评论称,祝理想公司十周年快乐!理想开创了今天中国新能源车中「彩电、冰箱、大沙发」产品形态,成为大空间家庭用车的领导者,非常了不起。 此外,理想汽车公布 2025 年 6 月交付数据。2025 年 6 月,理想汽车交付新车 36,279 辆,第二季度共交付 111,074 辆。截至 2025 年 6 月 30 日,理想汽车历史累计交付量为 1,337,810 辆。(来源:新浪科技) 国铁 12306 回应充电宝上高铁要求:不查 3C 标识或品牌,额定能量不超 100Wh 即可携带 7 月 1 日消息,自 6 月 28 日起,民航局航班禁止旅客携带没有 3C 标识、3C 标识不清晰、被召回型号或批次的充电宝乘坐境内航班,许多公众关心高铁站是否也会严查充电宝。今天铁路 12306 客服人员表示,「目前在充电宝查验方面不看是否有 3C 认证,也不看充电宝品牌,只要锂电池额定能量不超过 100Wh 就可以携带。」 2024 年 8 月起,市面上销售的充电宝都要有 3C 标识。3C 认证(China Compulsory Certification,中国强制性产品认证)是我国为保护消费者人身安全、国家安全及环境,依法实施的强制性市场准入制度。根据国家规定,正规上市的充电宝必须取得 3C 强制认证。(来源:IT 之家) Nothing 首款头戴式耳机 Headphone (1) 发布:复古透明设计、全物理按键、主动降噪 7 月 2 日消息,Nothing 首款头戴式耳机 —— Nothing Headphone (1) 今日正式发布。 这款耳机延续了该品牌复古、透明的设计风格,摒弃了触控设计,采用了更复古的物理滚轮和按键控制。 硬件方面,Nothing 与音响品牌 KEF 手,为这款耳机配备了 40 毫米驱动单元、空间音频和头部追踪功能,还支持自适应主动降噪,以及经过针对 2800 万种噪音场景训练的麦克风系统。 续航方面,Nothing Headphone (1) 充满电后开启 ANC 主动降噪功能标称可播放 35 小时,耳机还支持 5 分钟快速充电提供超过 2 小时播放的电量。 Nothing Headphone (1) 搭载蓝牙 5.3,支持双设备配对,可让耳机在笔记本电脑和手机之间无缝切换。 这款耳机搭配 The Nothing X 应用,可以调节 8 频段均衡器。耳机还配有一个自定义按钮,可以启动一个名为 Essential Space 的功能,它可以用作语音驱动的工具,用于记录随机想法、提醒等。 Nothing Headphone (1) 将提供黑色和白色版本,售价为 299 英镑 / 299 欧元 / 299 美元。全球预售将于 7 月 4 日在 nothing.tech 和部分合作伙伴处启动,正式销售将于 2025 年 7 月 15 日开始。(来源:IT 之家) 鸿蒙智行问界未来车型曝光:钠新电池、峰值 12C 超级快充 7 月 1 日消息,从多位博主分享的照片来看,鸿蒙智行问界未来车型相关信息已被曝光,号称「定义新豪华」和「海量交付」。曝光信息中提到了钠新电池、峰值 12C 超级快充等,具体如下: 骁遥双核、麒麟纯电 钠新电池、凝聚态 NP2.0 热电分离 峰值 12C 超级快充 DPPB 级极限制造 + 零碳工厂 目前官方暂未披露问界未来车型的具体信息,但目前已曝光的内容中多次提到了电池相关信息。作为参考,宁德时代在赛力斯超级工厂的两条 CTP 2.0 高端电池包产线昨日正式投产。这是宁德时代在重庆布局的首个基地,并首次采用「厂中厂」合作模式,为问界系列车型本地化生产供应动力电池系统。 问界自创立以来全系车型均搭载宁德时代电池,累计市场保有量已突破 70 万辆。(来源:IT 之家) 马斯克被曝放弃殖民火星 7 月 1 日,据环球时报援引《纽约时报》报道称,美国硅谷投资人彼得·蒂尔透露,美国企业家、特斯拉和 SpaceX 公司首席执行官埃隆·马斯克已经放弃了殖民火星的政治愿景。 蒂尔表示,马斯克已经不再认为火星殖民是一个能帮助人类建立新社会的可行政治方案。报道称,作为马斯克朋友的蒂尔在采访中说:「2024 年是埃隆不再相信火星的一年。」长期以来,马斯克一直把人类星际扩张视为目标,但蒂尔指出,他的计划曾经带有意识形态色彩,如今仅剩下科技意义。 马斯克曾表示,人类有望在 2028 年登陆火星,并曾在今年 5 月接受福克斯新闻网采访时称,火星殖民对于「确保万一地球发生严重灾难,文明能够长期存续」来说至关重要。(来源:财联社)
你有多久没用过记账软件了? 笔者还记得第一次获得真正可支配的收入时,小心翼翼地将每一笔支出记录下来,期待着能够靠记账,了解到自己的收支情况,最终能够多攒下来一点钱的美好青春样子。 不过,可能和多数人一样,随着学习或工作日益繁忙,记账这件事,最后总是不了了之了。 电子支付花了十几年,尽量让自己变得越来越无感——从刷码到免密,到刷脸、碰一碰,但记账却没有太多进步。 花钱只用了一秒,记账反而要点进去输入数额,选择类目,这也太反人类了。 笔者最近又动了记账的心思,和朋友聊起来有没有什么合适的记账app。朋友立刻说道:别提记账,想想就想去世。他不想面对自己到底花了多少钱,更不愿意的,要先熬过几个月繁琐的记账过程,可能才能对自己的账目有一点点有意义的了解。 然而账还是要记的,笔者开始在Appstore上翻找,一款记账app的封面一下子让我笑出了声:一只卡皮巴拉躺在地上,被一个钱袋压着爬不起来。记账就是这样的吧?! 这样一款app,大概是很懂记账人的心理了。 查看了一下,发现自己挖到宝藏了:这款叫咔皮记账的软件,主打用AI给记账人省事,来自商汤科技。才上线六个月,已经获得了百万用户,人均每天记录6笔账目。 记账也可以和花钱一样无痛吗?我试用了一周,发现还真行。 记账不比花钱容易的话,谁记账? 点开咔皮记账,我发现,咔皮记账做的第一个优化,就是针对我的痛点——记账难的问题。 我上一次使用记账软件还在几年前,依稀记得其中有许多痛点: 平时买一个什么东西,都要去选分类,最后才能在统计中体现出来,超级麻烦。 购物节一次性买一堆东西,要一个一个记吗? 有时候几天懒了忘记记账了,结果这几天换了好几个软件花钱,一笔一笔地往回算,钱能不能省下来不说,时间先浪费完了。 而一上手咔皮记账,突然发现,这些痛点已经在咔皮记账的AI加持下,被完全解决了! 没想到,几年不用记账软件,外面的世界已经发展成这样了? 咔皮记账提供了两种记账方式可以选择,一种是通过截图识别消费内容,一种是通过语音识别直接记账。 安装软件的时候,刚好是618购物节刚过,我直接测试了直接用截图记录淘宝消费记录,结果比预想中的丝滑好多。 我使用的是苹果手机,操作超级简单,只要按照咔皮记账的设置,先添加一个快捷操作,接下来使用苹果的辅助触控,只要双击(可以自己设置)辅助触控的小白点,就能直接截图记录屏幕上显示的消费记录。 据说安卓手机更方便。不仅可以从通知栏或控制中心触发,还能设置双击手机背部截屏。,或者利用无障碍权限,配置好了,连敲都不用敲就可以直接记账了。 购物节一次性买200件物品,也不过是多敲几下小白点的事情了,记账突然变得毫无压力。 即使几天没有记账,补记账也变得十分容易。我记得之前好多时候,就是因为补记账太麻烦,而不补记账少了几天的数据,最后的分析一下子就不准了,所以就放弃记账了的。而现在,只要在微信账单里点几下小白点,在支付宝账单里点几下小白点,又可以愉快地记账了。 近年来,许多软件都开始做截屏记账了,不过实测下来,咔皮记账的AI功能,是有在结账场景下,尤其是年轻人的结账场景下专门优化过的。 外卖大战开打之后,有多少人成为了外卖凑红包爱好者? 我把咔皮记账推荐给朋友,她直接给我发了一张这样的图。她说,记账app再好,能算得过来这个? 乍一看,我都懵了,不就是7.58元吗,这有什么?仔细一看,我才发现这张图暗藏玄机,这杯奶茶的实际消费,根本不是图中任何一个数字,而是7.58+0.42+0.5=8.5 这我记账,还要做数学题? 抱着试试看的心态,我把图传给咔皮记账,嘿,不用我记,它竟然懂我! 不但识别出了正确的金额,还帮我直接选好了奶茶的分类。 有时候花钱不在手机上,或者懒得截图了怎么办? 咔皮记账还提供了另一个记账方式,语音输入。 和截图输入一样,语音输入也能直接在帮你记账的同时,把分类直接选完。 我故意给小胖咔提升了难度:不仅让它补记昨天的账,还一口气报了好几项消费,没想到这也难不住它。 天,该不会记账真的比花钱还容易吧? AI分析,你是什么花钱人格? 如果说,“无痛记账”已经让我足够惊喜,那咔皮记账的AI分析功能,才是我最终决定“焊死”在这儿的理由。 毕竟,记账永远只是手段,搞清楚钱花在哪、然后管住自己的手,才是终极目的。 每个记账人最爽的瞬间是什么?必然是看着自己辛苦记录的数据,唰地一下生成报表,清楚地告诉你“吃喝占了50%,娱乐占了20%...”,然后你握着拳头暗下决心:“下个月一定少喝两杯奶茶,我要存钱!” 但这种快乐,也往往最脆弱。 明明感觉这个月很省了,结果就因为购物节买了一瓶稍贵的面霜,整份月度报告就显得毫无成就感,一片红(超支)。 有大额支出的时候还算好的。最头疼的是,有时候发现超支,看着那一大堆数据,你根本搞不清自己到底为啥超支。标注的都是饮食,到底是因为多请朋友吃了两顿饭?还是因为心情不好点了三杯奶茶外卖?想在几百条消费记录里破案,简直是不可能完成的任务。 在前AI时代,这事儿基本无解。有钱人或许有专业理财师,少数技术大神能用Excel拉出复杂图表,而我们这些普通人,到最后只能挠挠头,发出一句灵魂拷问:“我钱呢?我好像……又花超了?” 笔者这个只用过“古早”记账软件的人,万万没想到,AI的发展已经开始着手解决这个终极痛点了! 本来只是冲着“轻松记账”开始使用咔皮记账的我,在用了一周后,彻底被它的AI分析功能圈粉。 今年年初,大家都曾经被DeepSeek的深度思考功能所展示的逻辑能力震惊。笔者发现,咔皮记账竟然做了一个咔皮AI,融合了商汤日日新、DeepSeek、Qwen等大模型的深度思考、分析总结的能力,塞进了一个记账App里! 不只是简单的数据分析,出来的结果排版好看得像一份专业报告。AI“胖咔”还会一针见血地评价我的消费习惯,比如指出哪些是“必要支出”,哪些是“冲动消费”。 这可比过去的记账软件强太多了!以前的分析,严重依赖我们自己打的“分类”标签,颗粒度粗得不行。 现在呢?你可以像跟聊天机器人对话一样,直接向AI提问: “我这个月喝了多少钱的咖啡?” “我叫外卖和自己做饭的比例是多少?” “盘点一下我花在健身上的所有开销。” 只要你记了,它就能给你扒得一清二楚。虽然实测下来,目前在自由提问中,AI有时还存在分析不准的问题,但是我完全可以想象,随着AI模型的不断进化和个人数据的增多,它会变成一个越来越懂你的、7x24小时在线的专属财务管家。想想就觉得方便极了! 除此之外,对年轻的“理财小白”而言,咔皮记账还设置了一个贴心的预算功能。 它能把预算精确到“天”。再也不怕月初潇洒过头,月底只能吃土了!一旦前面花超了,咔皮记账能立刻帮你重新规划,算出“接下来平均每天最多花XX元”,你才能保住这个月的预算。 刚开始理财,不知道怎么设计预算?也完全不用担心。 咔皮AI还可以根据你过去几个月的消费习惯,给出一个相对合理的预算建议。 只需要简单点击两下,AI直接帮你把预算细化到类目,生成到天的级别。 除了实用的功能外,最好玩的是,AI还可以生成你的消费人格! 快乐小狗,快乐全靠花!(guilty) AI时代,年轻人需要怎样的记账软件? 在目前的AI时代,想做一个纯AI产品,解决一个新的需求,出圈其实并不容易。AI应用开发虽然变得容易了,但是一个新的需求要面对重新教育市场,这对于很多团队来说并不容易。 六个月内就抓住了一百万用户,咔皮记账的启示或许是,在AI时代,很多刚需应用都值得重做一遍。AI带来的新能力,能够带来革新性的体验,有机会一下子颠覆原有的固定行业格局。 抓住了AI进步的技术能力,咔皮记账用无感的操作,让记账变得很容易,解决了传统记账app的数据分析痛点。 不过,也不仅如此。 AI记账背后的使用的技术能力并不复杂,笔者后来在Appstore里也发现了不少类似的AI记账app,为什么用户更愿意停留在咔皮记账里? 原因之一,可能还是要靠在场景中的深入打磨。 一句话记账对于AI来说相对简单,但一句话记多条账单呢? 截图识别谁都能做,但是能够根据软件的邪恶设置进行智能调整的app就不多了。 使用期间,有一个点让笔者十分印象深刻:用户冷启动阶段的数据导入。 在一开始进行记账的时候,通常都是用户最容易流失的时候——这时候app没有任何用户的数据。这时候为了让新用户快速上手,导入历史账单是最佳途径。 但实际上,目前主流的支付工具,提供的导出账单的方式远非轻松容易。要想从微信、支付宝中导出账单,用户需要经历一套繁琐、甚至堪称劝退的操作——获取加密账单、邮件发送、在电脑端下载账单通过密码解压。 而咔皮记账在此设计了一个极为巧妙的方案:提供一个一次性专属邮箱,用户只需将账单邮件转发至此,后续的解压、解析、导入流程便在云端自动完成。 这个看似微小的设计,精准地击破了用户在最容易流失的“初见”环节所面临的巨大阻力,体现了深刻的用户同理心和扎实的技术执行力。 而另一个更核心的原因,可能在于咔皮记账真正读懂了它的核心用户——Z世代。 对于一代一代的年轻人来说,记账实际上是一个刚需。年轻人时间最多,但资产最少,最需要掌控自己的消费。 而咔皮记账,很明显对年轻人的消费心理有着深入的洞察。 笔者印象很深的是第一次尝试用咔皮记账的时候,笔者用语音记录了一笔桌游消费。而不同于普通记账软件可能直接把它分类为“娱乐”或者“其他”,咔皮记账直接帮我把这一笔账单分到了一个单独的“游戏-桌游”的子类目里,这让我一下子对咔皮记账有了很强的好感。 不仅如此,咔皮记账里还有许多子类目都十分贴近年轻人的消费习惯。一个类目专门是偶像消费,一个类目是彩票,甚至还有一个类目是党费。 这种细腻的颗粒度,反映了产品对年轻人的洞察之深刻。 除了最基本的实用,咔皮记账也在逐渐向为年轻人提供情绪价值扩张。 在咔皮记账里,每次记账,胖咔会专门生成AI回复与你互动。 你可以在咔皮记账里记账,也可以记录想法和心情。 除了能生成年轻人最爱的MBTI测试答案,最近咔皮记账还推出了一个更有趣的功能“AI手帐”。 这种对年轻人的洞察,一定是产品最后的核心竞争力。 传统上,记账通常是年轻人爱干的事。随着用户年龄越来越大,时间越来越少,传统的记账软件的操作很难留住用户。 而随着AI时代的到来,记账变得更加无感,分析变得更加智能,或许未来,整个赛道也将发生变化。 年轻时用了记账软件的用户,或许也会一直留下,变成记账软件的长期用户。 27岁的你,未来翻看21岁在校园里,记录今天考的很好,奖励自己一杯奶茶,应该也是很开心的吧? 而从21岁到27岁,用户消费习惯、生活方式乃至心路历程的完整变迁,对未来的个性化服务与推荐算法而言,无疑也将是最宝贵的数据资产。 如果你只在前AI时代记过账,现在是时候尝试一下咔皮记账了,体验被AI重塑后的记账体验。
苏超「内战」打到阿里系,大厂流量暗战正酣 6 月 30 日,江苏省城市足球联赛(以下简称「苏超」)再迎大厂「玩家」。淘宝闪购和支付宝前后脚宣布了对两支「苏超」球队的冠名,淘宝闪购冠名常州队,支付宝冠名徐州队,当日下午,花呗又宣布冠名无锡队,主打「无息」。三大阿里系品牌各自冠名,「散装阿里」呼应起「散装江苏」受到网友热议。 「苏超」这项今年夏天的顶流赛事,也在成为越来越多互联网公司商业布局的一环。 加上此前宣布成为「苏超」官方战略合作伙伴的京东、理想,作为「苏超」官方供应商的小米以及作为「苏超」官方赞助商的中兴、宇视等,「苏超」赛场上已会聚了一批科技企业的身影。(来源:第一财经) Meta 对 AI 业务大洗牌,扎克伯格宣布「超级智能」计划 Meta Platforms Inc.首席执行官马克·扎克伯格宣布对人工智能部门实施重大重组,包括着力开发人工「超级智能」,旨在令其具备人类同等、甚至更好的任务完成能力。 内部备忘录显示,扎克伯格周一致信员工说,Meta 的人工智能业务将划归名为 Meta Superintelligence Labs 的新团队,而该部门将由初创公司 Scale AI 前首席执行官 Alexandr Wang 领衔。此人被扎克伯格称为「他这一代人中最令人刮目相看的创始人」,将担任 Meta 的首席人工智能官。 扎克伯格还表示,Github 前首席执行官 Nat Friedman 将「与 Alex 合作领导」该团队,并负责 Meta 的 AI 产品和应用研究工作。此前报道称,扎克伯格正在亲力亲为给超级智能团队招募人才。(来源:环球市场播报) 苹果考虑另起炉灶,用外部人工智能模型来支持新版 Siri 为扭转陷入困境的人工智能项目,苹果公司考虑放弃自家开发的 AI 模型,转而使用 Anthropic PBC 或 OpenAI 的 AI 技术来支持新一代 Siri。 知情人士透露,苹果已与这两家公司讨论将它们的大型语言模型用于 Siri,并要求它们训练可在苹果云平台运行的模型版本以供测试。 如果最终采用外部模型,将标志着苹果的一次重大转变。目前,苹果大部分人工智能功能依赖其自研的「Apple Foundation Models」技术,原计划 2026 年推出基于该技术的新版本 Siri。 转用 Anthropic 的 Claude 或 OpenAI 的 ChatGPT 意味着苹果承认其在生成式 AI 领域竞争力不足。苹果已经允许 ChatGPT 处理 Siri 中的网络搜索查询,但 Siri 本身仍由苹果技术驱动。(来源:环球市场播报) 微软被曝将「AI 使用量」纳入员工考核:不再是「可选项」,直接挂钩绩效 6 月 30 日消息,据《商业内幕》报道,微软开发者工具部门总裁 Julia Liuson 最近发出内部邮件,要求各级主管在评估员工绩效时,将其使用 GitHub Copilot 等内部 AI 工具的情况纳入考量。 Liuson 表示,AI 已成为微软日常工作的核心,就像团队协作、数据导向思维和沟通能力一样,使用 AI 不再是选择题,而是每个岗位的基本要求。她指出,员工是否有效使用 AI,应该被纳入对其整体表现和影响力的全面评估之中。 知情人士透露,微软各团队的绩效考核标准不尽相同,目前已有部分团队考虑在下一个财年正式将 AI 工具使用情况作为绩效指标之一。 另据两位了解内情的人士称,这一改变旨在应对微软内部 Copilot 服务推广缓慢的问题。微软希望提升整体使用率,也希望产品开发人员更深入理解自家 AI 工具的运作方式。 目前 GitHub Copilot 正面临 Cursor 等 AI 编程服务的竞争压力。微软允许员工使用符合安全规范的部分第三方工具,知情人士称,Replit 就是其中之一。(来源:IT 之家) 雷军回应何小鹏下单小米 YU7:一定加速生产 力争早点交车 6 月 30 日午间消息,雷军回应何小鹏下单小米 YU7,并发文称:「谢谢小鹏支持,我们一定加速生产,力争早点交车。小鹏 G7 本周四发布,预祝发布会成功!」 当日早间,何小鹏发文称,「祝贺小米 YU7 上周发布取得优秀的成绩,我认为 YU7 成功核心是产品竞争力强劲,因此也当晚下单了 YU7,静候雷总早点给我交付。」同时,何小鹏宣布,小鹏 G7 将在 7 月 3 日正式发布。(来源:新浪科技) 豆包上线「深入研究」功能,用户可免费体验 6 月 30 日下午消息,豆包「深入研究」功能已经在豆包 App、网页版及电脑版正式开启测试,用户可免费体验。 基于模型的搜索、推理及 Agent 能力,深入研究可以帮助用户更快速、全面和结构化地处理高难度的复杂任务。针对长途旅行攻略、复杂购买决策、最新政策解读、商业科技趋势发展等需要获取大量资料、长时间研究的问题,借助深入研究能力,几分钟即可完成初步方案。同时,豆包还支持以可视化网页和报告文档两种方式呈现研究结果。(来源:新浪科技) 百度正式开源文心大模型 4.5 系列模型 6 月 30 日,百度正式开源文心大模型 4.5 系列模型,涵盖 47B、3B 激活参数的混合专家(MoE)模型,与 0.3B 参数的稠密型模型等 10 款模型,并实现预训练权重和推理代码的完全开源。 目前,文心大模型 4.5 开源系列已可在飞桨星河社区、HuggingFace 等平台下载部署使用,同时开源模型 API 服务也可在百度智能云千帆大模型平台使用。 早在今年 2 月,百度就已预告了文心大模型 4.5 系列的推出计划,并明确将于 6 月 30 日起正式开源。(来源:36 氪) 「星纪魅族科技」公众号更改名称为「魅族科技」 6 月 30 日消息,公众号「星纪魅族科技」更改名称为「魅族科技」。 据了解,目前星纪魅族仅官方公众号进行更名,视频号、微博名称均未更改。 据星纪魅族官方介绍,星纪魅族集团主要由星纪时代和魅族科技融合而来,集团创始人为李书福。2022 年 7 月,星纪时代和魅族科技达成战略投资协议后,双方在业务和团队上进行了深度的协同。魅族科技不仅组建了专注于研发 Flyme Auto 的团队,还在武汉建立了研发中心,魅族科技与星纪时代也在手机产品的规划和设计上进行了深入的融合。(来源:IT 之家) 大疆旗舰级运载无人机 DJI FlyCart 100 发布 据了解,DJI 大疆正式发布全新旗舰级民用运载无人机 DJI FlyCart100。 据了解,其集更大载重、更快充电、更为安全智能为一体,支持两款负载系统,搭配丰富生态应用,支持 PSDK,可适配第三方负载。DJI FC100 还可适用于应急、消防、电力、工程、物流、水域等多场景。(来源:36 氪) 德国 TQ 公司宣称造出世界最轻、效率最高电动自行车电机:1.17kg,输出 200W 6 月 30 日消息,据外媒 Electrek 报道,德国电助力系统制造商 TQ 推出了电动自行车电机新品 HPR40,并宣称这款产品已成为全球最轻、效率最高的中置电机。 HPR40 专为公路和砾石电动自行车设计,重量仅 1.17kg,能提供 40Nm 的扭矩和高达 200W 的峰值输出。这款电机强调的是效率和车体一体化的自然骑乘体验,而不是单纯的动力指标。 该电机为轻量级自行车打造,外形设计尽量隐蔽,可嵌入五通部位,控制组件也巧妙藏于车把内侧,几乎不会打破整车的外观线条。 其核心技术为「Harmonic Pin-Ring Transmission」(谐波销环传动),这套精致的动力系统完全替代了传统五通结构,具备静音、低摩擦和零延迟启动等优点。(来源:IT 之家) 小米在北京、南京为员工提供「小米青年公寓」,租金平均 1999 元 / 月 6 月 30 日消息,据小米行政公众号推文,小米在北京、南京上线了一批青年公寓,租金标准为 1999 元 / 月。 据了解,公寓所有房型一房一价,均价为公寓所有房型平均月租金,租期在 2025 年 7 月-2028 年 6 月之间享受安居折扣价。 小米北京青年公寓坐落昌平定泗路,东临特警部队,西靠武警家属院,北望碧水庄园,共 2658 间;主力 29 平方米开间,配有独立卫浴 + 智能家居,班车直达园区,距小米科技园约 10 公里,距小米智慧产业园约 3 公里。 其支持全屋智能家居自由配置,采用动静分区设计,支持小米工卡「一卡通刷」,管家 7*24h 在线响应。 小米南京青年公寓坐落建邺区河西南 CBD,共 566 间,步行即达地铁,提供 55 平方米两室一厅开间,距离小米南京科技园 100m 距离。(来源:IT 之家)
作者|Li Yuan 编辑| 郑玄 过去一年,大模型的世界几乎是「狂飙」的同义词。技术以周为单位迭代,能力边界从写诗作画,一路拓展到视频生成和科学发现。 然而,抛开那些宏大叙事,我们该如何为 AI 的能力找到一个精准、客观的刻度? 恐怕没有哪种方式,比「高考」更能直抵每一个中国人的内心。 去年,极客公园就做过一期 AI 高考模拟测评 。延续去年的传统,极客公园今年再次搭建「AI 高考」考场,让国内外主流大模型再次走进考场。 再次走入考场的「AI 考生」们,不仅 治好了去年文科偏科的毛病 ,还取得了足以考进山东省内 1000 名的高分。 然而,就在我们以为它已经「进化」时,它却又常在意想不到的地方,暴露了自己真实的「智商」。 一些关键发现如下: AI 首次有望冲击顶尖学府 : 今年,AI 的综合能力首次展现出足以考上顶尖学府的潜力。与 2024 年相比,所有参与测试的大模型在文理科成绩上均实现了显著飞跃。由于山东省采取赋分的报考策略,无法直接与分数段相比较,我们估计此次高考的状元豆包,能够排进全省的 500-900 名,考入人大、复旦、上海交大、浙大这些名牌大学的人文社科类专业。 大模型不再严重偏科,理科进步更快: 各大模型的文科总分平均增长了 115.6 分,理科总分平均增长了 147.4 分。尽管理科的增速更为迅猛,但其 181.75 分的平均总分仍低于文科的 228.33 分。总体来看,今年大模型的总分表现已不再严重「偏科」。 数学能力大幅增强,超越语文、英语: 数学是本年度进步最显著的科目,平均分较去年提升了 84.25 分。AI 在数学上的表现甚至超过了语文和英语,这预示着未来 AI 可能更擅长处理逻辑性强和有标准化解题路径的题目。 多模态能力成为拉开差距的关键: 去年到今年,模型的视觉理解能力显著提升,这一点在包含大量图像题的学科中尤为突出。与去年相比,物理和地理的平均分提升了约 20 分,生物提升了 15 分。化学科目整体表现稍弱,仅「豆包」模型及格,但全员平均分也比去年提高了 12.6 分。作为彩蛋,我们今年也尝试让 AI 在视频流中答题。 01 从一本到顶尖大学 如果说去年的 AI 还只是一个刚摸到一本线的优秀生,那么今年,它们已经成长为足以冲击中国顶尖学府的学霸。 这背后,究竟发生了怎样的蜕变? 在深入具体的变化之前,我们先介绍一下此次参与考试的国内外考生: 豆包、 DeepSeek(R1-0528 版)、ChatGPT(o3)、元宝(Hunyuan t1)、Kimi(k1.5)、文心一言、通义千问。 为了更贴合读者的使用体验,本次评测均在各模型的公开 PC 端进行,测评采取采样两次取平均分的形式。 目的是考察模型的综合能力,此次测评的方式是直接让模型识别图像作答。DeepSeek-R1 目前仍然不支持图片识别作答,因此只测试了纯文字题目,最终成绩参考性不强。 其他测试细节如下: 此次测试选用 2025 年新高考山东卷作为本次评测的测试卷。原因有二:首先,山东卷是网络上能最快获取到的高考试卷之一,保证了评测的时效性。其次,它的综合难度在各省份中名列前茅——其语文、数学、英语三科采用全国一卷,其余科目则为自主命题。这样一把高难度的「标尺」,更能探知当前大模型能力的上限。 为保证公平并考察模型的通用基础能力,在可以关闭模型联网能力的产品中,统一关闭了模型的联网功能,以杜绝「搜题」的可能。o3 和文心无法关闭联网,不过检查模型思考过程发现,文心没有发生联网搜题的情形,o3 发生少量搜题情形,但没有明显收益,得分率反而低于非联网答题。同时,我们默认开启了深度思考模式,但没有开启研究模式,以模拟用户在标准交互下的即时问答场景。 非选择题各学科分别请两名专业同学打分,如存在题目分值 1/6 以上的差异,则引入第三人讨论定分(与真实高考判卷流程一致),并邀请参与过真实高考打分的高中老师抽检,对存在差异的题目统一标准。 在评分环节,我们做了两项特殊处理:我们特邀了资深教师进行对 AI 作文进行匿名评审,以保证客观公正。此外,由于无法获取英语听力部分的试题,我们设定所有模型在该项上均计为满分。 最终,各位考生的成绩如下: 过去一年,大模型的深度思考能力,带来了模型能力的明显进步。 模型不再不是直接产出答案,而是逐步分析、分解问题、检查中间结果,甚至自我修正,带来了模型在数理考试中的表现的大幅提升。 总分为 150 分的数学考试中,即便是本次测试中表现最差的 AI 模型,也拿下了 128.75 分的高分——这在人类考生中也属于优秀水平。 而回顾去年,表现最好的模型,也只达到了 70 分,连及格线都没到。 数学能力的进步,直接带动了今年大模型整体高考成绩的大幅提升。 多模态能力,成为决定大模型能力表现差别的另一个关键因素。 在去年的高考测试中,不少模型还不具备成熟的图片识别能力。极客公园当时采用的评测方式是:能识图的模型使用图片配合文字输入,而无法识图的模型则只输入文字,同时辅以 Markdown/LaTeX 格式帮助识别公式。 而进入今年,多模态能力是主流模型的标配功能。因此,我们首次在测试中采用纯图片题目测试(DeepSeek除外)。 在多个模型中,豆包、ChatGPT最先进的模型都是多模态版,在图像问题上体现出明显优势。 Qwen3、文心 X1 都是语言模型,处理图像问题时可能是用 OCR 识别文字后回答,或是调用视觉模型,在图像类问题上表现较弱。 不过,即使是图像问题得分最高的豆包和 ChatGPT,图像问题的得分率仅为 70%,相比文本问题 90% 的最高得分率有较大差距,可见大模型在多模态理解和推理上仍有很大的提升空间。 可以预见的是:随着多模态能力的持续进步,明年AI的高考成绩还会继续提升。考不过AI,终将成为大多数人类的常态。 然而,AI 终究没有拿下全满分的成绩。是什么绊住了学霸级的 AI?答案可能比想象中的有趣。 02 数学逼近满分的 AI 天才们, 齐齐败在一道基础题上 在整场 AI 高考的测评中, 「 AI 考生」复读了一年后,在数学科目上的进步十分瞩目。 在 2024 年的测评中,当时的 AI 考生们在填空题和解答题上表现惨淡,得分普遍在 0 至 2 分之间徘徊,最终 9 款参评模型的数学成绩的平均分仅为 47 分。 而今年,则完全不同。 可以看出,无论是客观选择题,还是复杂的主观解答题,新一代大模型的正确率都今非昔比。这清晰地表明,大模型自身的能力,尤其是核心的推理能力,已经取得了根本性的突破。 如果说去年的模型还只是一个能勉强套用求导、三角函数等基础公式的「初学者」,那么今年的模型,则已经进化成一个能够从容应对复杂推导和证明的「解题高手」了。 一定程度上,这样的结果在预料之中。自从 AI 进入推理模型时代,一个标志性进展便是数理能力的大幅提升。 当模型拥有了自我思考与自我纠错的能力,它就像一个从前张口就回答问题的孩子,成长为一个会先深度思考再给出答案的大人,逻辑能力实现了质的飞跃。 要知道,今年高考新课标一卷的数学题被考生普遍认为难度极高,「像竞赛卷」,导数、圆锥曲线等压轴题思路晦涩,计算量极大,甚至出现「学霸考哭」的现象。 然而,面对这样一份高难度试卷,顶尖的大模型们依旧表现得游刃有余。 相较之下,AI 的多模态能力的进展倒还在其次。数学科目中,只有 20 分的图像问题,不是此次模型大幅度提分的重点。而大多数模型,也都在图像题中取得了 15 分的成绩。 为什么是 15 分? 这就很有趣了。这些整体都考了 130 分以上的大模型,放在人类社会里,也算是数学尖子生了,竟然在同一道选择题上出现了错误。 难住他们的,不是什么压轴大题,而是一道单选题——甚至不是很难的单选题。 这道题的数学原理非常简单,是一道基础的向量加减法题。只需在图上连接 (0,2) 与 (2,0) 两点,即可得到目标向量,模长 2 倍根号 2。 即便对数学不甚了解的人,通过肉眼观察图中的线段,也能估算出其长度不会超过 3.3。 然而,就是这样一道题,难住了所有数学学霸 AI。 核心矛盾在于: 题不难,但图难。 对于大模型而言,这张图的视觉信息极其混乱:虚线、实线、坐标轴、数字、文字相互交织,甚至文字与关键线段存在多处重叠。这种视觉上的「脏数据」,成为了 AI 精准识别的噩梦。 以本次数学表现最佳的豆包为例,它的解题过程暴露了问题的根源:它从最开始读取题目信息时,就已然出错。 从题目就读错了的情况下,无论其背后的数学推理能力有多么强大,也终究是无源之水,无本之木。 03 AI 写作文:擅长举例子,但不擅长思辨性地升华 作为所谓大语言模型,语文和英语一向是 AI 的传统强项。 不过有趣的是:在大模型的数理逻辑大幅进步后,大模型的语文和英语能力反而显得有点不够看了。 这与现实世界也是一致的:一名顶尖考生或许能在数学上拿到满分,却极难在语文科目上获得同等分数。AI似乎也触碰到了同样的瓶颈。 仔细研究语文卷面可以发现,AI 的失分点颇为有趣。在选择题部分,除豆包和 DeepSeek-R1 以外,其余模型的错误率均在 20% 以上。 这种现象或许揭示了 AI 与人类不同的一个困境:对于人类考生,组织语言、阐述观点时,可能更容易因疏漏而失分;但对于 AI,要读一段长材料,在一组高度迷惑性的选项中,精准辨析每一个细微的语义差别和逻辑陷阱,难度可能反而更高。 而在备受瞩目的作文题上,AI 的表现则延续了去年的趋势: 平均分高于人类,但难有真正的佳作。 去年,特邀阅卷老师的评价就已指出,AI 作文大多属于稳妥的「二类文」,很少偏题,但因其深刻性、丰富性、创造性不足,难以产生动人心弦的「一类文」,其结尾部分的升华更是套路化明显。 今年,依旧如此。 7 大模型整体均分 50.75 分, 均分区分度较低 ,各模型能做到立意准确、语言流畅、论据丰富,但论述不深刻,举例雷同,相比人类范文模型作答缺少温度和共情。 今年的新课标卷的语文作文考题为: 全国一卷作文「民族魂」 阅读下面的材料,根据要求写作。(60 分) 他想要给孩子们唱上一段,可是心里直翻腾,开不了口。 ——老舍《鼓书艺人》 假如我是一只鸟,我也应该用嘶哑的喉咙歌唱 ——艾青《我爱这土地》 我要以带血的手和你们一一拥抱, 因为一个民族已经起来 ——穆旦《赞美》 以上材料引发了你怎样的联想和思考?请写一篇文章。 这是在一次采样中,元宝生成的 AI 作文。它在人类阅卷老师处获得了 53.5 分的高分,是 AI 作品中的佼佼者。 然而,细究其文,AI「模板化」的问题依旧暴露无遗。 比如这篇文章的中间几段,先是提出「历史上闪耀着这样的精神火光」的观点,随即并列引用三到四位历史人物;接着,引出「真正的担当带着疼痛的底色」的论点,再列举三到四位经历苦难的人物;最后,论及当代精神,再次列举三到四个当代人物。 AI 作文的语言不可谓不华丽,引经据典也自然十分丰富充满细节,但逻辑上像不像你的家长对你说,你看看谁谁谁都怎么样了,你是不是也该怎么样? 或许在精细调整提示词的情况下,AI 能写出触达人心的作品。 但目前,AI 的自主创作更像是在执行一个固化的写作模板:用排比式的案例填充框架,最终导向一个略显生硬的僵化升华 。 它能写出看似优秀的段落,却难以织就一篇真正动人的文章。 04 英语:主要被作文分数拖累 与语文相似,AI 在传统强项——英语上的表现,也进入了一个平台期。 去年,各家 AI 的英语成绩已然不错,今年的模型能力并未产生飞跃。事实上,所有参评模型的平均分仅比去年提高了 3.2 分,进步幅度远小于数学。 而模型的整体分数,也落在了 130-140 分的区间,并未到达人类学霸的水平。 按理说,这稍显反常。 AI 的英文水平是有目共睹的,或许比不少英文专业的学生讲出的英语更正宗。 而高考英语这张试卷,本身远未触及母语者的语言天花板,且相较于包含古文的语文,其客观题占比更高、作文要求更简(仅 80 词),也并不追求立意高远,理论上是 AI 更容易获得绝对优势的战场。 然而,AI 考生并未在此表现出更强的统治力。 那么,瓶颈究竟出在哪里? 作文题可能是一大拖累。 这背后有两个可能的原因: 苛刻的字数限制: 在语文写作中,AI 就已经暴露出了时而「话痨」时而「不爱说话」的属性,但在长篇写作中,字数要求不是那么苛刻。但在 80 词的微型写作中,精准控制字数就成了一大挑战,稍有不慎便会因超词/少词而被扣分。 缺乏应试智慧: 在有限的篇幅内,人类考生会有意识地使用更高级句式、时态来「炫技」以博取高分。而 AI 的目标通常是清晰、完整地传达信息,它不会刻意为了得分而优化句式复杂度,因此在评分细则上可能吃了暗亏。 而本次评测最有趣的一点,莫过于中外模型在作文上呈现的「主客场反转」现象。 在中文作文这一「客场」,以 ChatGPT 为代表的「洋考生」拔得头筹; 然而在本应是其「主场」的英文科目上,它却不敌「中国考生」——DeepSeek 在选择题上甚至拿了满分,而最终总成绩上,DeepSeek 也与豆包一同超越了 ChatGPT。 05 理综三科:有进步,但仍然不算十分优秀 如果说 AI 在数学上的进步是「一飞冲天」,那么在理综三科上的表现,则更像是一次「破冰启航」。 相较于去年,理综三科有一定进步——所有模型都提分 10-20 分,但整体成绩依旧挣扎在及格线附近,清晰地标示出 AI 与顶尖人类考生之间的能力鸿沟。 相比于数学,理综三科既考验逻辑能力,又考验多模态能力——物理化学两科的图题占 80% 以上,生物的图题也占全部题目的一半左右。 而今年,读图能力的解锁,加上模型推理能力的增强,共同带动了理综能力的进步。 不过正如绊住 AI 的数学题所展现的一样,能「看见」,不代表 AI 能「看懂」。 这在大模型在化学上的表现不佳上,能清楚地展现出来。化学题目对图片的依赖性强,且化学题目图片的复杂程度更高,此时 AI 的短板便暴露无遗。 目前,顶尖 AI 的理综成绩大致相当于中上游的人类考生水平,但远未达到「学霸」级别。正所谓「卷子越难,差距越显」,在综合性与深度并存的理综试卷上,AI 尚未具备稳定碾压人类考生的实力。 分科来看这次 AI 的成绩: 物理,进步最快的「排头兵」 物理是此次理综三科中进步最快的「排头兵」,平均分提升了 20.25 分。 在客观题和填空题上, ChatGPT 的选择题正确率高达 92.13%,豆包也达到了 89.81% ,展现了对物理基本概念和规律的扎实掌握。 化学:被复杂图形拖累的「重灾区」 相比之下,化学成为了拉低理综总分的「重灾区」。 整体得分偏低,仅有豆包勉强及格 ,选择题和填空题的平均得分率均低于 60%。 其核心痛点在于对复杂化学图形的双重依赖:不仅题目本身高度依赖图片(如实验装置、反应流程图),且化学结构图的复杂程度,也常常超出当前模型精准理解的极限,导致失分严重。 有机物大题依旧是所有大模型的主要软肋 。例如,满分为 12 分的第 25 题(有机化学),所有模型得分极低。该题主要考察有机物合成路径与结构,评测中 没有一个模型能够正确生成有机物的结构简式 ,对有机物的空间结构理解也相当薄弱。 生物:折戟于遗传计算的逻辑关 生物科目的短板则精准地暴露在需要严密逻辑推理的遗传题上。例如,分值高达 16 分的第 22 题(遗传大题),大模型普遍表现不佳, 得分最高的 ChatGPT 也仅拿到 9 分 。该题重点考察基因型分析、遗传概率计算等,这恰恰是考验模型在抽象信息基础上进行多步推理的能力。 06 AI 仍然偏科,文综是舒适区 在今年的 AI 高考评测中,一个清晰的趋势得以延续:文科综合依然是 AI 的高分舒适区。 早在去年,ChatGPT 就已拿下文综 237 分的高分。而今年, 元宝更是将文综最高分推升至 253.5 分 ,这一成绩,与理科综合最高分(213.25 分)形成了鲜明对比。 相比去年,文强理弱的偏科问题虽有缓解,但基本格局并未改变, 这与人类考生相反。在人类考生中,理综最高分往往比文综最高分高出不少。 在无需联网的情况下,头部 AI 在文综上的得分率已超过 80%,达到了人类优等生的水平。 今年的分数增长,主要由地理科目贡献。细分来看,各科的进展与瓶颈也愈发清晰: 最大看点无疑是地理。得益于多模态能力的飞跃,AI 在地理图题上的理解力显著增强, 使得该科目平均分激增了 20.3 分 ,成为进步的火车头。 地理题上想更进一步,面对的挑战与理科中的化学如出一辙——对高度专业的复杂图形,AI 理解依然吃力。例如,在失分最严重的第 19 题(地形地貌综合分析题)上,模型的表现可谓「溃不成军」: 第(1)问关于地貌走向的判断,仅有极少数模型答对。 第(2)问关于「拔河高度」的专业概念计算, 所有模型均告失败。 与之相对,政治和历史科目的分数则基本处于高位平台期,并未呈现显著进步。 对于这两个科目,挑战已经进入了更难的范畴: 能否精准理解考纲、运用学科语言、并进行多维度深度分析。 对于人类考生而言,这也需要专门的训练了。 例如,DeepSeek-R1 就因思路过于发散、偏离考点而大量失分。而在历史小论文上,AI 普遍难以做到对历史原因进行深刻的多维度剖析,论述仍显单薄。 一个小细节很有趣,与中国模型提分相对应的是,今年 ChatGPT 的文综分数不升反降。 这种「主场优势」也从侧面体现了了,在通往通用人工智能的道路上,对地域性规则的深刻理解与适应,依然是不可或缺的一环。 07 彩蛋 1:AI 眼镜能用来作弊吗? 从去年到今年,AI 眼镜等「视觉 AI 硬件」无疑是科技界最炙手可热的焦点。其背后的核心驱动力,正是大模型的实时视频理解功能的出现。它意味着 AI 正从被动接收指令,进化到主动感知和理解物理世界。 巧合的是,今年的高考也迎来了一项新变化:考场安检门全面升级,旨在精准防范智能眼镜等新型作弊工具。 这不禁让人好奇: 这些新兴的、能与视频进行实时交互的多模态大模型,真的能用来在考场上「大显神通」吗? 我们抱着这个疑问,选择国外的 ChatGPT 与国内的元宝,进行了一次非常规的测试。为简化流程,我们仅选用难度较低的英语阅读题,尝试让视频模型「观看」试卷并作答。 虽然只是一次非常简单的测试,结果却非常清晰,问题也相当明显: 1. 严重的幻觉问题: 模型非常容易自行想象,这点 ChatGPT 和元宝都有体现,但元宝更为明显。元宝在测试第二篇阅读时,就开始凭空编造一篇完全不存在的文章和题目,导致最终无法进行测试。 英语卷的第二篇阅读,讲述的是一位九年级写作老师关于如何教授学生「写作为什么重要」的反思。文后的 24 题,则是提问第一段提到了哪些人物。 而在对元宝进行测试的时候,元宝不断在屏幕还没有出现选择题时,直接编造一道选择题并回复答案,导致测试无法进行。 在发现问题后,我们向模型提问,这篇文章讲了什么,模型的回答也很是诡异——与原文仿佛相似,但是实际上是完全不同的故事。 2. 被动的交互模式。 为了模拟真实考试,我们在测试中,要求模型看到题目的时候,直接回答答案,不需要解释也不需要等人问。尽管 ChatGPT 声称可以看到题目直接作答,但实际并不会主动进行。整个过程需要测试人员通过语音不断提示、引导,距离「全自动解题」相去甚远。 3. 混乱的结果: 在每次看到题目,给定更加精密的提示词的情况下,我们勉强从 ChatGPT 处得到了一组答案,但这个结果参考价值并不大。 稍多几次测试就会发现,翻页的速度变化、镜头的晃动程度变化,提示词出现的时间变化,甚至差不多的流程重复同一个问题,都会导致模型给出截然不同的答案。 虽然视频模型也是 GPT-4o 模型,和 GPT-4o 模型直接按照图片作答的稳定性和准确性相距甚远。 而且幻觉问题会随着上下文的长度越来越严重。在被问及第三篇文章讲了什么的时候,GPT-4o 回答的是第一篇的主要内容。到了最后一篇文章,模型的正确率和蒙的也差不多了。 今天的视频大模型,像极了去年的图像大模型,仍处于非常早期的阶段。各家大模型产品也并没有想在目前阶段主力推广这一功能——GPT-4o 的视频通话功能在不长的测试时间后,迅速达到了当日限额。 想在目前阶段,单纯依靠它在考场作弊,还需要担负必须不断跟它说话、答案完全不准等巨大风险,基本属于科幻情节。 尽管如此,在模型表现较好的时候,AI 能够在看到屏幕几秒内,马上很肯定地讲解出屏幕上的英文在讲什么,确实也是一种让人感觉十分惊艳的体验。 08 彩蛋 2 : 仿生人会爱上自己生成的电子羊吗? 自古「文无第一,武无第二」。在人类创作者中,风格流派各异,喜欢现实主义的人有时候就是「get」不到意识流的文风。 那么,在 AI 的世界里呢?大模型是否也存在审美偏好呢?它会因为更欣赏自己的文风,从而在给其他模型打分时产生偏见吗? 我们进行了一项有趣的尝试: 让参与本次评测的大模型们,对彼此生成的作文进行交叉打分和排序。 测试选用的是作文题目的第一次采样结果。 图片里横向是鉴定师,而竖向是作品。我们标蓝了模型认为的前三名作文,和人类认为的前两名作文。 根据这个不完全统计,模型并没有表现出对自家作品的特殊偏爱,有时候反而可能给自己打低分——比如元宝的作文,在人类和其他模型的横评中,都取得了很高的分数,但在自己的评测中,反接近最低分了。 AI 与人类判分员的审美,大方向仍然是一致的。 可能真的只是和我们普通人类一样吧:我知道什么是好的,就是写不出来。 09 结语 今年,或许是高考测试对大模型仍具挑战意义的最后一年。 当 AI 已经能展现出冲击顶尖学府的实力时,这个人类社会的智能筛选器,可能未来不再能成为对 AI 有区分度的测试了。 高考测试,不仅仅是一场对人类智慧与 AI 智慧的对比,也是我们观察 AI 智能发展的一个刻度表。 过去一年,我们对 AI 能力的直观感受和多次验证,正在不断地提醒我们: AI 正加速逼近甚至超越普通人的能力边界。 但它的发展并非线性——它能攻克人类眼中的难题,却也会在看似简单的题目上意外失足。 正因如此, 高考,这个完美融合了知识掌握、逻辑推理与应试策略的综合场景,让 AI 展现出了它最迷人而矛盾的一面:它时而展现出顶尖人类的才华,轻而易举地攻克难题;时而又暴露出孩童般的认知盲区,在基础问题上犯下令人啼笑皆非的错误。 感谢高考。它用一种我们最熟悉的方式,为 AI 的通用智能水平提供了一张刻度清晰、极具参考价值的「快照」,而这,很可能是最后一张了。 AI 的下一站,终将是更复杂、更广阔的现实世界。考试,只是它漫长征途的起点,而非能力边界的终点。 这张快照,最终将成为它成长相册里,一张记录了进化途中的光荣与笨拙的泛黄的旧照片。 *头图来源:视觉中国 本文为极客公园原创文章,转载请联系极客君微信 geekparkGO
科幻电影中,外骨骼堪称最酷的科技装备之一。从《异形》中可以让普通人类直接对抗异形的 Power Loader,再到《钢铁侠》飞天遁地的钢铁战衣,这些可以大幅增强人类运动、负重能力的的外骨骼,一直是科幻编剧们最钟爱的设定。 今天这些设定正在逐渐成为现实,从去年始祖鸟推出的售价 3 万多的外骨骼动力裤引发抢购热,到今年春节期间爆火的国内景区推出的外骨骼产品租赁服务。而在产业界,更是有一批外骨骼公司,正在以一两万的售价,将轻量级外骨骼产品直接推向市场。 今天和大家分享的 Hypershell X,就是当下最受关注的消费级外骨骼产品之一。在官网的宣传视频中,其不仅可以用于爬山,长跑、骑行等运动也可以用它辅助。值得一提的是,这款最高配 1799 美元的产品,不仅比 4500 美元的始祖鸟便宜了一半还多,而且已经开始向用户发货(注:去年开始接受预订的始祖鸟的 MO/GO 预计 2025 年 10 月开始发货)。 Hypershell 目前的最高配产品,可以卖到 1799 美元 出于对产品的好奇,笔者设法借到了一台。在两周的深度体验里,笔者戴着它走路、骑行,甚至专门用一个周末戴着它挑战爬山之后,我认识到了这款产品的优点,也意识到了现阶段消费级外骨骼的瓶颈,以及它预示的无限可能的未来。 外骨骼能让我们变成「钢铁侠」吗? 有了外骨骼,每个人都能变成漫威的超级英雄?答案当然是否定的。今天的消费级外骨骼,任何普通人穿戴后都能获得一定级别的能力增强,但现阶段别说「人均斯塔克」——人均「博尔特」都差得很远。 还没发售的始祖鸟 MO/GO,其介绍里是“能提供 40%的动力提升,让佩戴者感觉减重 14kg”。而 Hypershell X 官方介绍是最多抵消 30 公斤重量,增强 40% 腿部力量和减少 30% 体力消耗。 Hypershell X 系列目前分别有「Go」「Pro」「Carbon」三款,售价分别为 999 美元、1199 美元、1799 美元,折合人民币约为 7200-13000 元。笔者体验的是中间版本的 Hypershell Pro X。它重量为 2kg,仅比最高配的 Carbon X 版重 0.2kg(均不包含电池重量,电池重量 410g)。 从外观的角度来看,无论是穿戴 Hypershell 产品上街还是爬山,都没有让我成为街上的显眼包。在咖啡店等单的时候,同事形容戴在腰间的 Hypershell 就像是「戴着个腰包」;而当我在京郊完成一段两小时左右的轻徒步过程中,全程只有一个游客认出了这个在小红书、抖音平台上很火的外骨骼设备。 这个设计理念也在笔者和 Hypershell 工程师的交流里得到了印证。不同于很多新形态的智能硬件希望营造「科技感」,极壳认为外骨骼在设计时不应该过于张扬:「尤其是未来面向一些老年或医疗使用场景,他们也许不希望得到太多的注目。」 Hypershell X 系列产品及配件展示 穿戴的过程并不复杂。先调节腰部尺寸,就像戴腰包那样把设备主体「穿」在身上。接着再根据身高和大腿围调节腿带的高度和松紧,把设备两侧的腿杆能够以适当的松紧绑在距膝盖上方大约两指的地方,以保证后续设备运行时可以有效助力。 穿戴完成后,在手机上下载 Hypershell 的 App,注册一个新的账号。初次登录时,需要先输入使用者的身高、体重、性别 3 个不同的身体参数,作为后续处理和计算的基础数据。 把设备和手机应用通过蓝牙连接,就可以在手机 App 上调节不同的档位和不同的运动模式。Hypershell Pro X 目前可以提供「舒适、极限、通透、健身」4 种不同的助力强度,以及包括「行走、奔跑、上坡、骑行」等在内的 10 种手动标注的运动状态(基础版为 6 种)或「自适应动作识别」。当然,也可以通过设备右侧电机上的实体按键进行操作。 不过,由于 Hypershell X 系列只有一个实体按键,所以进行开关机、模式切换、强度切换等需要通过一系列复杂的不同点按方式才能实现(如短按、长按、短按+长按等)。笔者现阶段还是更习惯在手机 App 上直接操作。 在日常行走时,穿上 Hypershell X 后可以明显感受到设备通过腿杆对大腿的「提拉感」,这会让大腿比正常走路和上楼梯上抬得更高,同时步幅会明显增大,身边同行的人表示需要比平时走得更快才能跟上我的速度。而笔者的同事哪怕只是短时间试戴,摘掉设备后也会觉得「有点不会走路」、「腿感觉抬不起来」。 笔者在小区里进行了一次 2 公里的平路行走测试。全程为 2 公里,将心率都保持在每分钟 120 次,并采用「先无后有」的顺序。Apple Watch 数据显示:穿戴外骨骼设备后,步行配速每公里提升约 20 秒,总消耗从 135 千卡降至 123 千卡,降幅为 8.9%。 平路步行测试:左侧为未穿戴设备时的数据,右侧为穿戴设备时的数据 不过,当我把实验场景切换到健身房踏步机(也叫「爬楼机」)时,由于进入了高强度有氧甚至无氧(平均心率为 170)区间,尽管仍然可以感受到提拉感,但心肺层面的疲惫感显然无法快速消除。而从测试的结果来看,第二次训练戴上 Hypershell 时,Apple Watch 统计的卡路里消耗甚至还要高过第一次没有佩戴外骨骼设备时的消耗量。 所以,简单总结一下使用感受:首先 Hypershell Pro X 的确能在一定程度上提供运动帮助,但这个帮助不是无限的,也许能让爬山费点劲的人变得轻松一点,但不可能做到让从来不运动的人立马就能完成一个半马。 消费级外骨骼的「必答题」和「附加分」 在体验 Hypershell 前,我脑海中一款「消费级」外骨骼产品至少需要把以下几个必答题做到高分:轻便、方便穿戴、耐用性好、价格合理。如果销量还高点,大概还需要提升一点颜值——做到看起来既不突兀又能适度体验科技范儿。 但在一周体验之后,我发现仅仅答好这些基础题还远远不够。「消费级产品」区分于「专业工具」的一个关键点是:用户可以多种不同的环境里使用。这就要求外骨骼产品还要拿到更高的「附加分」:在运动控制层面,提高多运动场景的适配性。 一个最典型的户外场景就是徒步。在几个小时的连续行进中,用户需要在爬升下降、土路台阶等不同动作和外界环境随时切换。如果一款产品只能帮助我们上坡,那么在下降的时候,它就会成为我们身上或者包里额外的几公斤负重。 笔者也戴着 Hypershell Pro X 在京郊进行了一次轻徒步体验。使用后最大的感受就是:尽管 Hypershell 目前已经在手机 App 里提供了 10 种不同的动作识别,但在实际使用过程中,在绝大部分场景里,我都会直接开启「自适应动作识别」模式。这样就可以更专注地关心路况,几乎不需要掏出手机进行额外操作。 Hypershell 手机 App 的操作界面,可手动选择 4 种模式和 10 种动作姿态 只是在少数场景下,例如连续的长上坡,我才会切换到「上台阶」模式,这样 Hypershell Pro X 可以给我提供更「猛」的助力。 最让笔者惊喜的,是 Hypershell 在下坡时的体验。不同于其他路况,下坡(尤其是土路上坡)我们并不希望设备把腿抬得更高。因为这时更需要重心靠后,略微下蹲辅助支撑以及防滑。电机通过腿杆传递,提供了一种「反向」的作用力——向下向后的支撑感,在陡坡上提供了一定的帮助和信心,就像手中多了两根登山杖一样,这是在测试前完全没有预料到的。 在笔者看来,「自适应动作识别」模式是未来外骨骼产品的必备。在绝大多数时候,它都可以主动适应用户行为和外界环境变化,并对功能进行微调。 这有点像开着一台智能 SUV 去越野,大部分时候,你只需要像日常驾驶一样操作就好了,只有在少数特定的场景下,才需要手动调节到脱困、涉水或者窄路模式,以应对极端场景。 而为了达到更智能的体验,笔者认为:外骨骼产品的下一步,需要拥有更强的感知能力和更强的大脑。 海外用户对 Hypershell 的评价:「很吃惊它能预判我的动作」 更强的感知需要更高维度的数据输入,例如可以检测心率、「看」到外界真实的环境。扫地机器人从只有机械臂到拥有了高清摄像头和激光雷达;现在传闻苹果都要为 AirPods 安装视觉摄像头了,也许我们可以期待未来「Ultra 版」的外骨骼配备更多的传感元件并采集更多维度的数据。 此外,产品也需要拥有匹配这些高维数据的主动推理能力。尽管外骨骼如今被视为具身智能技术的延长线,但某种程度上,它比一般的机械臂要更复杂。作为一种可穿戴智能设备,它的行动和人体是高度一致的,因此它需要推理感知实时状态,才能和使用者达到最佳的配合程度。 设想一下,当这些问题都得到优化之后,用户在使用外骨骼产品的时候,大概率就越来越不需要那个和它搭配使用的手机 App。这款手机 App 也许会成为和智能辅助驾驶的 SR 界面一样的功能,更多时候它只负责交付一种视觉安心感,告诉用户「我看到了这些信息,我在处理」。而更简单的操作和更一体化端到端的交付,应该是外骨骼以及大多数智能硬件产品在智能时代希望达到的方向。 在细分领域里,寻找智能硬件的新机会 在 Hypershell 身上,我们也看到了智能硬件领域近年来的一些发展共性。 过去 20 年左右的时间里,优秀的硬件创新往往来自于大品类,如智能手机、智能汽车。它们几乎都是可以覆盖上亿人群的产品。 然而今天,越来越多的创新开始从细分市场里生根发芽。创业者们开始意识到,充分挖掘并满足「小众市场」里的真需求,也可以创造出一个「大产品」。 这种变化来源于供给端环境的变化。 在笔者和多个硬件创业者的沟通里,都可以得到一个明确的信息:今天想在珠三角进行硬件创业,你可以达到强大的供应链技术和网络支持。说得夸张一点,在不考虑成本和量产难度的前提下,很多天马行空的 demo 产品,供应链技术都可以给你「搓」出来。 一位创业者告诉笔者:在新硬件品类里,哪怕和日韩和欧洲竞争,它们最后的制造环节大概率也会回到珠三角。除此之外,近年来不少供应链企业也正面临国际品牌供应链转移。大厂的订单减少了,这些溢出的供应链能力自然也就愿意多跟创业者们谈谈合作。 华强北被称为「全球智能硬件创客的天堂」 | 图片来源:视觉中国 供给端外,市场的变化也为细分品类成长提供了更多可能。 过去做产品时,往往会追求最大公约数。但其实,即便是万分之一的需求,放在全球乃至全球市场里,也都是一个很庞大的量。随着各类内容平台以及跨境电商平台的不断成长,创业者也就拥有了更多工具和手段,让这些「小众产品」触达到想要影响的目标用户。目前很多优秀的硬件创业者都可以在海外市场获得极大市场份额,也和这些市场的「基建」变化不可分割。 以上两点,供应链能力的提升让创业者可以把产品「做出来」,市场工具的进化可以让产品「卖出去」,也就构成了硬件创业的两个最关键的前置条件。 「智能化」则扮演了最新也是最关键的加速器角色。因为站在用户视角来看,无论成本再低、触达再容易,他们愿意掏钱购买的「智能硬件设备」,是一款可以在生活中高频使用的工具,而不是一个吃灰的摆件。而智能化和 AI 恰恰提供了这种可能,让外骨骼可以从工厂走上自行车、走向雪场、走向更多场景。 所以,我们也就看到了越来越多的创业者,正尝试着把更多过往只被运用在工业场景里的技术,「下放」到消费级里,做出更多的新产品。也许未来十年,硬件领域里仍然不会出现取代智能手机的个人计算设备,但消费者大概率可以期待更多好玩实用的新玩意。 这或许也是智能硬件行业里,应对同质化内卷的一种新思路。
从 2022 年 4 月,vivo 首代 X Fold 正式发布开始,vivo 折叠屏就一直承载着「挑战直板旗舰的同时在智能手机操作效率上取得突破」的目标。让大屏不只是为了某几个特定 App 而存在,而是如同新鲜空气一般,在无数细节之处,提升用户的智能手机使用效率。 时间到了 2025 年,X Fold 系列已经迭代了四个版本,折叠屏手机也在过去四年渐入佳境,甚至出现了包括电池、USB-C 接口厚度在内的种种物理因素限制,让折叠屏手机在「轻」「薄」等维度上继续突破显得难能可贵。 作为如今仍然在大折叠这个赛道坚持推陈出新的品牌,我们还是能在 vivo X Fold5 上看到,vivo 仍想在这个品类下再次实现「自我超越」。 这一次,vivo 提出了「极致轻薄与可靠」、「苹果生态最强搭子」、「全场景轻办公神器」这三个折叠屏手机核心维度,作为对应的 2025 年度折叠屏旗舰产品问世的 vivo X Fold5,这次又有哪些突破? 01 形态「轻」与「强」: 重塑折叠旗舰的物理标杆 拿到 vivo X Fold5,第一感觉仍然是 vivo 旗舰产品线熟悉的家族化设计元素:圆形相机模组,极简机身设计以及作为点缀的蓝色蔡司 ZEISS Logo,一切熟悉的设计元素都是在明示用户——即使它是折叠屏,它仍然有着 vivo 旗舰引以为傲的各种能力。 除了这些熟悉的元素之外。这次 vivo X Fold5 外观部分最明显的改变,是我们手上的是新款的「青松」配色;这款配色除了青色自带的清新感之外,还融入了更多独属于折叠屏手机用户的内敛沉稳感。 「轻」对智能手机的体验而言并不是全部,但确实是 2025 年智能手机迭代的一个「共识」,对于持续数年一直在孜孜不倦追求轻薄的折叠屏手机来讲更是如此。更轻的折叠屏能换来更好的日常握持体验;即使不使用内屏,也仍然是一款优秀的旗舰手机。 在「轻」这个维度上,vivo X Fold5 再一次冲击最轻大折叠这个位置;官方标定数据「钛度」重量为 217g,我们手上的「青松」以及「明白」为玻璃材质后盖。因此整体重量为 226g。 这个重量,不仅轻过 iPhone 16 Pro Max(227g),甚至轻过自家今年刚发布不久的影像旗舰 vivo X200 Ultra(229g)。 除了「更轻」,在「更薄」上,vivo X Fold 系列也是「战绩可查」,上一代 vivo X Fold3 几乎与市面上主流的 USB-C 数据线厚度相当,在当时甚至都很难想象到「下一代还能怎么接着做薄」。 没想到时隔一年之后,vivo X Fold5 交出了 2025 年的答卷。在手机的不少规格与细节上,都能看到设计团队的取舍与巧思。vivo 也确实是为了进一步将折叠屏手机做到轻薄,在各种细节上都已经趋于极致了。 vivo X Fold5 在 USB-C 接口处采用了独特的切角处理 | 图片来源:极客公园 续航长期以来是折叠屏手机相比常规直屏手机来讲优势明显的长板之一,这一次 vivo X Fold5 更是直接搭载了等效 6000mAh 的蓝海电池。 就现有的折叠屏手机用户群体——追求效率的移动办公用户来讲,更大的电池意味着什么自然不言而喻。满足一天的重度使用完全绰绰有余。 除了这些,vivo X Fold5 还在「三防」这个领域发力:这恰恰是传统折叠屏手机相比如今的直屏旗舰手机最明显的短板之一,折叠屏的铰链/转轴以及屏幕结构都远比直屏手机更加脆弱,在加入 IPX9+ 防水、IP5X 防尘以及 -20℃ 防冻能力之后,或许折叠屏也能第一次在可靠性上战胜直屏旗舰。 02 协同之「魂」:打破壁垒, 苹果用户的「最强搭子」 虽然高端商务是过去 X Fold 系列留给不少用户的一个印象之一,但对我而言,留给我印象更深的是他们一直在做的「生态破壁」这件事。 vivo 一直在如何解决 iPhone 用户与 Android 折叠屏协作「破壁」这件事上,给用户想象之外的能力更新——上一次是能完全接管 iPhone 来电/短信与通知的「双机互联」,这一次在 vivo X Fold 5 上,vivo 交出的答卷是「Android 首次链接 Apple Watch」。 虽然 Apple Watch 用户数量庞大,由于 Apple Watch 天然的生态壁垒属性,过去甚至很少有手机厂商思考过「兼容 Apple Watch」这件事,随着 vivo 生态破壁这件事逐渐涉及到更多核心用户需求,这一点似乎已经变得顺理成章。 实际的配对过程也与 iPhone 双机互联功能类似,首先,在 Apple Watch 上下载「vivo 健康互联」,在 vivo 健康中扫码即可完成配对,在配对之后,不仅电话短信通知等内容都可以被无缝转发到 vivo X Fold5 上,Apple Watch 健身中经典的三环、心率,血氧甚至是睡眠等数据,都可以通过这种方式实现「数据破壁」,涌入 vivo 生态中,解决双机用户生态割裂问题的「最后一公里」。 提到「iPhone 搭子」这件事,除了 vivo 这次给 X Fold5 也准备了兼容 MagSafe 的磁吸保护壳(这是 vivo 旗舰第一次出现类似配件)之外,包括 AirPods 支持空间音频、给 iPhone 实现的反向无线充电也都是值得一提的能力。 在做 iPhone 最好的 Android 搭子这件事上,vivo 已经踏入了其他手机厂商难以企及的深度。 AirPods Pro 链接 vivo X Fold5 | 图片来源:极客公园 作为 Android iPhone 双持的用户,在类似地铁等场景中,使用 Android 手机充当热点、给搜不到信号的 iPhone 续命来保证正常使用,某种程度上已经是常态,这次 vivo 也考虑到了这一需求,在系统中加入了「便捷热点」功能,为 iPhone 提供的网络信号增益。 Vivo X Fold5 支持以有线/无线的方式直接给 iPhone 供电 | 图片来源:极客公园 03 效率之「器」: 折叠形态下的生产力与创作力 长期以来「折叠屏手机能更高效处理多任务」这件事没能持续打动更多普通用户,本质原因仍然是在「如何在比电脑小、比手机大的屏幕上进一步做出效率突破」这个问题上,折叠屏手机厂商并没有给出更有说服力的回答。 除了更好融入 Apple 软硬件生态,vivo 当然也要在折叠屏效率本身上做出突破。在 OriginOS4 时代,vivo 用「轻折分屏」和「超级拖放」功能作为对折叠屏存在价值的证明,这一次,vivo 拿出了此前只有在平板设备上出现过的「原子工作台」。 在开启原子工作台模式下,用户可以在台前最多同时调用五个应用,同时还能在不同应用之间,通过拖拽的方式快速传输文件,同时自适应布局结构也让应用无论是竖屏办公,还是横屏游戏,都不会影响到实际的操作手感。 「原子工作台」能在前台最多同时展示五个应用 | 图片来源:极客公园 作为效率提升的一部分,这次 X Fold5 不仅想提升折叠屏本身的操作效率,还加入了作为 Mac 能力边界拓展的「镜像扩展屏」和「键鼠协同」功能,在一些用户只带 MacBook 出门,但临时需要多屏来处理一些复杂需求的场景,可以尽可能地发挥折叠屏手机的大屏优势,从物理上缓解外出办公时的多屏压力,对 MacBook 用户而言,相当于随身携带了一片拓展屏出门。 「镜像拓展屏」让 vivo X Fold5 能作为 Mac 的副屏来使用 | 图片来源:极客公园 vivo X Fold5 还首发支持了安卓直通 iCloud 云盘,用户可以直接在 X Fold5 文件管理中访问 Mac 电脑文件的功能,虽然实际的传输速度与便捷性无法与本地文件相提并论,但同样是一招关键的「破壁」招式,面对 iCloud 文件分享链接,在大屏幕上可以处理的更加游刃有余。 与 iPhone 目前的「破壁」体验相同,vivo 在与 Mac 这片更大的屏幕的交互上,同样在做打通设备物理边界、提升用户多设备使用效率这件事,包括 X Fold5 电话/验证码短信可以通过 vivo 办公套件流转至 Mac 端、手机端可以使用「文件管理」App 直接访问 macOS 电脑文件,这些以往很少有大厂涉足的领域,同样是 vivo 拓展生态包容性的手段。 vivo「蓝图影像」发布至今,在手机影像旗舰领域已经有了一席之地,但对于轻薄已经成为竞争生命线的大折叠手机来讲,走到 2025 年,如何「做减法」成为了各家折叠屏品牌都不得不钻研的一门功课。 但归根结底,对手机摄影而言,优秀影像能力的前提仍然是优秀的硬件,而有着「大而全」硬件基因的 X Fold 系列一直相机硬件搭配上有着较为激进的风格:无论是有着蔡司自然色彩和 T* 镀膜,还是镜头焦段的覆盖范围,vivo X Fold 系列一直都有资格算得上智能手机行业翘楚。 而 vivo X Fold5 这次的影像策略选择了继承 vivo X Fold3 Pro 熟悉的基因,尤其是 5000 万像素、三倍光学变焦的这颗蔡司潜望长焦。以一种最简单直觉的方式,将 vivo 旗舰手机用户熟悉的「长焦悬日」「长焦微距」等功能体验带了回来。无论是 10 倍、3 倍都保持了超高的可用性。 3x 长焦镜头的存在,足以让 vivo X Fold5 仍然是一款长焦能力优秀的影像旗舰,加上 vivo 2025 年开始,在旗舰产品线上推广的大模型画质增强技术,让长焦 10x 及以上的超级远摄场景,也能在端侧大模型的计算下,得到明显改善的画质观感。 vivo X Fold5 3x 长焦原生 / 10x 缩放画质对比 | 图片来源:极客公园 vivo X Fold5 1x 主摄 / 3x 长焦原生画质对比 | 图片来源:极客公园 vivo X Fold5 1x 主摄原生 / 10x 长焦缩放画质对比 | 图片来源:极客公园 除了风光领域之外,vivo X Fold5 这次还首发了「经典负片」风格,甚至今年开始流行的 Android 端 Live Photo 都可以直接套用这一经典风格样式。85mm 长焦也能为人像拍摄提供独特的空间压缩感和故事感。 经典负片效果|图片来源:极客公园 CCD 风格效果特写|图片来源:极客公园 04 总结 或许你已经注意到了,这一次 X Fold 系列上,vivo 将 Pro 与标准版合二为一,集中全力打造 vivo X Fold5 一款机型。 这一策略不同的用户可能有不同的理解,但在我看来,这是 vivo X Fold 系列在折叠屏技术探索逐渐成熟的同时,真正开始从「尝鲜品」向「全能主力机」转变的一个信号。 诚然,虽然折叠屏在硬件发展上趋于成熟,但用户对折叠屏给效率带来的提升这件事的需求,仍然还有很多没有得到满足。因此,作为「轻薄新标杆」同时兼具「苹果生态破壁者」属性的 vivo X Fold5,或许是对于「折叠屏手机还能怎么提高效率」这个问题的一个新回答。 vivo X Fold5 适合那些追求极致体验的商务人士、饱受生态割裂之苦的苹果/安卓双机党,以及所有希望将折叠屏作为唯一主力机的科技爱好者。 从这个角度来讲,vivo X Fold5,仍然是一款充满创新的 2025 年度旗舰折叠屏手机。
小米 YU7 现身租赁市场:日租要价 2000 元,跟兰博基尼一个价 6 月 29 日,小米 YU7 上市后直接卖爆,订单也创下了全球车企的销售纪录。在小米汽车门店,看车的人络绎不绝,想要试驾的话,有销售透露,试驾要排到一周之后了。 小米 YU7 的热卖,也带动了租赁市场,在二手平台搜索「小米 YU7 出租」发现,目前已有大量商家上线小米 YU7 租车服务。 据了解,根据是否是现车或提车时间不同,商家们的日租报价也不相同,普遍是 2000-4000 元/天,租赁车辆可以用于商务接待、评测体验等。如果是赛道刷圈、拆车对比等,还需要额外加钱。 虽然小米 YU7 的起售价格只有 25.35 万元,但租赁价格却已比肩不少超跑车型。作为对比,兰博基尼小牛的日租价格为 2000 元左右,法拉利 458 等车型租赁价格也在 2、3 千元不等,小米 YU7 因为流量和稀缺性,其租赁价格远超它的车型定位。(来源:新浪科技) OpenAI 与美国国防部、印度政府达成 AI 定制合作,服务收费至少千万美元 6 月 29 日,The Information 刚刚报道称,OpenAI 正在效仿 Palantir,加大咨询服务投入,并已与美国国防部、印度政府以及 Grab 达成定制化 AI 合作协议。 消息人士称,OpenAI 在向大公司和政府机构推销其 AI 技术时,借鉴了众多软件公司的策略——提供内部研究人员和软件工程师,为客户定制 AI 解决方案。 该公司正在扩充人员与资源以强化此类咨询式服务,通常对客户收费至少 1000 万美元(现汇率约合 7168.6 万元人民币),然后其工程师将指导客户完成「微调」过程。(来源:IT之家) Meta 再挖角 OpenAI 四名研究员,OpenAI 称其「入室偷窃」 6 月 29 日,据 TechCrunch 本周早些时候报道,Meta 已经成功招募了 OpenAI 的知名研究员 Trapit Bansal。紧接着,《华尔街日报》也披露 Meta 从 OpenAI 挖走了另外三名研究人员。而据 The Information 最新消息,又有四名 OpenAI 的研究人员加入 Meta,分别是 Shengjia Zhao、Jiahui Yu、Shuchao Bi 和 Hongyu Ren。 此次 Meta 大规模挖角的背景,与该公司在 4 月推出的 Llama 4 人工智能模型表现不佳有关。据称,该模型的表现未能达到 Meta 首席执行官马克・扎克伯格的预期。 OpenAI 首席执行官 Sam Altman 曾表示,Meta 为挖角人才提供了「1 亿美元(约合 7.17 亿元人民币)的签约奖金」,但同时他也强调,「到目前为止,我们最优秀的人才还没有离开」。 据 Wired 今日报道,OpenAI 的首席研究官 Mark Chen 在公司 Slack 上发布了一份备忘录,将挖角情况比作有人闯入 OpenAI 家中偷窃。 Chen 进一步表示,他将与高层领导合作,研究如何在员工收到 Meta 的 offer 时提供财务补偿,甚至调整他们的整体薪酬。但这位高管强调,他的主要目标是留住顶尖人才。 Chen 还引用了 OpenAI 研究团队其他七位高级成员的消息,就如果 Meta 试图雇佣他们时如何应对这种情况提供了指导。其中一条建议包括,如果 Meta 招聘人员试图用「荒谬」的 offer 施压,就要求他们停止。(来源:IT之家) 古尔曼确认苹果 iOS 26 隐藏功能:AirPods 实时翻译等 6 月 29 日,由于苹果在 WWDC 24 上承诺的多个 AI 功能因为无法按时交付而延期,苹果在 WWDC 25 上的发言也变得更加谨慎起来。据彭博社记者马克·古尔曼爆料,iOS 26 其实还藏着两大「彩蛋」: AirPods 实时翻译:支持跨语言实时对话,通过 AirPods 收听翻译内容 全生态 Wi-Fi 同步:跨设备同步酒店 / 健身房等场所的无线网络登录凭证。 古尔曼透露,这两项功能有望在今年 10 月的 iOS 26.1 或 12 月的 iOS 26.2 中上线。(来源:IT之家) 微软 AI 芯片「Braga」延期,性能不敌 NVIDIA 6 月 29 日,据外媒报道,微软自研 AI 芯片「Braga」项目遭遇重大挫折,原定于 2025 年底量产的计划被推迟至 2026 年,主要原因在于芯片设计多次修订和高昂的研发成本。内部消息称,微软在技术实现上遇到诸多难题,导致进度严重滞后。 更令人尴尬的是,初步性能评估显示,「Braga」芯片在性能上明显落后于 NVIDIA 最新的 Blackwell 架构,这意味着即便最终上市,也难以与 NVIDIA 竞争。NVIDIA 依然稳坐 AI 芯片领域的头把交椅,其 CEO 黄仁勋甚至公开调侃,造 AI 芯片远没有外界想象的那么容易。微软还在同步研发 Braga-R 和 Clea 两款芯片,计划分别于 2026 年和 2027 年推出,但「Braga」的延期让外界对这些项目的如期落地产生质疑。整体来看,微软、谷歌、亚马逊等科技巨头都在试图摆脱对 NVIDIA 的依赖,但现实是,行业自研芯片的路远比想象中更难,NVIDIA 的技术壁垒和迭代速度让挑战者压力倍增。(来源:快科技) 马斯克公布脑机接口最新进展,受试者有望用意念操控人形机器人 6 月 29 日,马斯克旗下 Neuralink 公司近日公布了脑机接口的最新进展。通过植入 N1 芯片,脊髓损伤和渐冻症患者已能用意念操控虚拟机械手、玩游戏、甚至重新与外界交流。N1 芯片如硬币大小,可无线充电,实时捕捉大脑信号并转化为数字指令,目前已在 7 名受试者中应用。 Neuralink 计划 2025 年实现「意图言语」解码,帮助失语症患者恢复交流;2026 年启动「盲视」项目,助失明者重获视觉。未来几年,电极数量将持续提升,目标是实现多区域植入、治疗精神疾病,并最终通过脑机接口精准操控特斯拉人形机器人 Optimus。行业竞争激烈,微软、亚马逊、苹果等巨头也在布局。预计到 2040 年,全球脑机接口医疗市场规模将达 1450 亿美元。(来源:界面新闻) 任天堂就 Switch 2 游戏机供货不足道歉,称公司未能充分预估机型首发需求 6 月 29 日,在第 85 届任天堂年度股东大会上,任天堂社长古川俊太郎就 Switch 2 在全球多国供不应求的情况向股东致歉,承认公司未能充分预估相应游戏机的首发需求。 古川俊太郎表示,自今年 4 月起,任天堂已通过 My Nintendo Store 展开抽选销售,首轮报名人数高达 220 万人,远超预期。目前已进行四轮抽选,第五轮将于 7 月启动,后续公司将积极提升游戏机生产量以缓解供需压力,并在未来将进一步优化抽选机制,同时鼓励更多线下零售商加入抽选行列。 此外,股东大会中有股东批评 Switch 2 使用的钥匙卡游戏卡带是一项「不成熟的措施」,质疑相应钥匙卡设计是否对平台游戏销量造成了负面影响。 对此,古川俊太郎回应称,钥匙卡主要是考虑 Switch 2 游戏体积过大最终作出的抉择,在游戏机上市前,任天堂已与第三方发行商进行过沟通与协商,确定了相应存储介质形式。不过,古川俊太郎并未正面回应相应钥匙卡是否影响了平台游戏实际销量。(来源:凤凰科技) 全球首个低温下可精准控制「百万量级量子比特」芯片问世,解决扩展难题 6 月 29 日,据外媒报道,澳大利亚悉尼大学与新南威尔士大学联合开发出全球首款可在低温下精准控制「百万量级量子比特」的芯片,相关成果已发表在《自然》期刊上。 该芯片能在接近绝对零度的毫开尔文环境中稳定控制自旋量子比特,突破了量子计算扩展中控制系统与量子比特之间因热量和电噪声带来的干扰难题。研究团队通过精密设计,使芯片在保持量子态相干性的同时,实现高保真的单比特和双比特操作。 该控制系统功耗极低,总功率仅约 10 微瓦,有望支持百万级量子比特扩展。此次成果证实了复杂电子系统可与量子比特紧密集成的可行性,为量子计算的实用化迈出关键一步。(来源:IT之家) 零跑 B01 纯电轿车预售 10.58 万元起:可选激光雷达版,预计下月上市交付 6 月 29 日,零跑 B01 纯电轿车今晚开启预售,预售价为 10.58 万元起。目前,该车共推出了 5 款配置车型,CLTC 工况续航里程有 550 公里和 650 公里两种版本,预计 7 月正式上市交付。 零跑 B01 的前脸采用了类似 B10 的设计语言,该车配有隐藏式门把手、贯穿式尾灯,长宽高分别为 4770 x 1880 x 1490mm,轴距 2735mm,可选激光雷达版本。 内饰方面,新车配备 8.8 英寸全液晶仪表盘以及 14.6 英寸 2.5K 高清中控屏,并会提供高通 8295P 车机芯片、50 瓦手机无线充电等。该车在副驾前方还配备有 6 个「魔术拓展孔」,可以根据个人需求安装折叠桌板、手机支架等。 动力方面,零跑 B01 提供最大电机功率分别为 132kW 和 160kW,扭矩分别为 175N・m 和 240N・m。同时,该车已经申报有 56.2 千瓦时和 67.1 千瓦时两种不同容量的电池组,CLTC 工况续航里程分别为 550 公里和 650 公里。(来源:IT之家) 日本初创公司推出智能 AI 猫项圈,可监测猫咪行为与压力水平 6 月 29 日,一家名为 Rabo 的日本初创公司,就为猫咪设计了一款智能项圈。 这款名为 Catlog_的项圈可以监测猫的多种日常行为,包括进食、饮水、睡眠、奔跑、行走以及梳理毛发,并将这些信息同步至手机应用程序。此外,它还具备定位功能,帮助主人随时掌握猫咪的行踪。 最近,该产品新增了一项功能:通过分析猫咪的行为数据来评估其「压力指数」。这项功能主要依据猫咪在过去 30 天内的理毛频率、静息状态下的呼吸次数以及睡眠状况来判断其焦虑程度。据 Rabo 公司 CEO Yukiko Iyo 介绍,他们分析了超过 46000 只佩戴该设备的猫咪所积累的 100 亿条数据,并借助人工智能技术来评估猫咪的压力水平。一旦 AI 识别出猫的情绪压力过大,就会向主人发送提醒。 Catlog_目前售价为 99.99 美元(约合人民币 717 元),而使用 AI 监测服务则需额外按月订阅,费用为每月 14.99 美元。(来源:中关村在线) 千余名作家联名呼吁出版商承诺限制使用 AI:不发行 AI 书籍、不用 AI 配音 6 月 29 日,近日,包括劳伦・格罗夫、列夫・格罗斯曼、R.F. 奎安、丹尼斯・勒翰和杰弗里・马奎尔在内的一众作家联合发表了一封公开信,呼吁图书出版商承诺限制使用人工智能工具,比如承诺只雇佣人类为有声读物配音。 这封公开信指出,作家们的创作成果被人工智能公司「窃取」了。信中提到:「这些公司没有将作品所创造的收益按一定比例支付给作家,而是将本应属于作家的报酬支付给基于作家们无偿劳动所构建的技术。」作家们认为,这种行为严重损害了他们的权益。 除了要求出版商仅使用人类配音外,作家还们呼吁出版商做出承诺,永不发行由机器生成的书籍,并且不以人工智能工具取代人类员工,或者将人类员工的岗位降级为人工智能监控员。他们强调,人类创作者的劳动价值和不可替代性应当得到尊重。 这封公开信一经发布,便得到了广泛关注。据美国国家公共广播电台(NPR)报道,在公开信最初发布后的 24 小时内,又有 1100 名作家签名支持。(来源:IT之家)
特斯拉 Model Y 首次完成全自动驾驶交付,全程无人控制 北京时间 6 月 28 日消息,特斯拉 CEO 马斯克在 X 平台宣布:「首辆特斯拉 Model Y 已实现全自动从工厂开到客户家的交付任务,包括高速路段,而且比原计划提前一天完成!」 马斯克还提供了一些细节:车内全程无人且没有远程操控,是「真正意义上」的全自动驾驶。「据我们所知,这是全球首例在公共高速路上实现车内无人、无远程控制的自动驾驶。」 此前报道,特斯拉已悄悄为得州奥斯汀超级工厂生产的新款 Model Y 和 Cybertruck 车型部署「自动行驶至出厂区」功能,让这些汽车在无需监督的情况下自动下产线开入交付车辆停车场,以便于降低人力成本,并向业界展示其为自动驾驶出租车持续做准备的决心。(来源:新浪科技) 小米更新 YU7 车型锁单交付时间:标准版最快 53 周、Max 版最快 33 周 北京时间 6 月 28 日消息,小米 YU7 车型于 27 日正式开售,仅 18 小时锁单量便突破 24 万台。目前小米已刷新其 App 中订单交付周期,官方称后续相应数据也会随着产能爬坡动态更新。 目前交付时间为:小米 YU7:锁单后最快 53-56 周交付;小米 YU7 Pro:锁单后最快 48-51 周交付;小米 YU7 Max:锁单后最快 33-36 周交付。 预定 YU7 者需支付 5000 元定金,7 天内未锁单可退。此外,小米 SU7 / 小米 SU7 Ultra 锁单未交付用户,6 月 26 日晚 10 点 - 6 月 29 日晚 12 点前可限时改配小米 YU7。(来源:IT 之家) 苹果 3.5 亿美元买下湾区两栋写字楼,位于总部 11 公里外 6 月 28 日消息,据外媒 AppleInsider 报道,苹果本周花费 3.5 亿美元购买了加州湾区的两栋写字楼,两栋写字楼的总面积超 3.5 万平方米。 这两栋写字楼位于加州圣克拉拉县,其布局为双栋式办公园区,距离苹果总部 Apple Park 约为 11 公里,苹果此前曾租用过这两栋写字楼。 这两栋写字楼总面积超 35303 平方米,可为 1500-1900 名员工提供办公空间,圣克拉拉县记录员办公室提交的文件显示苹果花了 3.5 亿美元购买这两栋写字楼。(来源:IT 之家) 不再单一依赖英伟达,传 OpenAI 首次采用谷歌 AI 芯片训练 ChatGPT 北京时间 6 月 28 日消息,据路透社今日援引知情人士消息,OpenAI 开始租用谷歌的人工智能芯片,为 ChatGPT 和其他产品提供算力支持。 OpenAI 是英伟达 GPU 的最大客户之一,长期依赖后者 AI 芯片来训练模型及执行推理任务。本月早些时候有消息称 OpenAI 有意接入谷歌云服务,以应对日益增长的算力需求。 对谷歌而言,这项合作正值其扩大自研 Tensor 处理器(TPU)对外供货之际。此前 TPU 多用于内部项目,随后又开始向外部客户开放,并已吸引到包括苹果在内的大型科技公司,以及由前 OpenAI 高管创办的 Anthropic 和 Safe Superintelligence 等初创企业。(来源:IT 之家) 高德地图被曝提供逆行导航路线,回应称仅作展示用途并强化警示 北京时间 6 月 28 日消息,近日,有网友表示,在使用高德地图骑行导航时,提供的路线中竟出现「逆行」选项。 网友表示,虽然地图页面显示有「逆行」字样,但或许会有用户真的跟着逆行路线骑行,存在安全风险。不过,也有网友认为,在一些老城区,由于当初规划不合理,原地逆行十几米就能到达对面,而前往前方几百米的路口掉头则较为麻烦,因此高德地图提供逆行选项是更人性化的表现。 针对此事,高德地图相关工作人员日前向媒体回应称,地图显示的「逆行」路线仅作展示用途,实际上无法为用户提供该条线路导航。「逆行」路线在页面中仅作参考,旨在告诉用户该路线虽然更近,但属于「逆行」路线。此外,高德地图进一步强化了警示提醒,在逆行标签中新增「不可行」标识,明确此类路线不可用于实际导航,切实保障用户出行安全与使用体验。(来源:网易科技) 德国要求苹果与谷歌下架 DeepSeek 应用 北京时间 6 月 28 日消息,据路透社报道,德国数据保护专员梅克·坎普 27 日在一份声明中声称,已要求苹果和谷歌公司从其在德国的应用商店下架中国初创公司自主研发的人工智能大语言模型「深度求索」(DeepSeek)应用,理由是所谓数据安全担忧。 坎普指控 DeepSeek「非法将用户个人数据传输至中国」,并声称苹果与谷歌需尽快审查这一要求并决定是否在德国封禁该应用,但未设定具体处理时限。谷歌证实已收到通知正在进行评估,苹果公司暂未回应。(来源:36Kr) 传苹果 M5 芯片将采用「齐发」战略,今年秋季 MacBook Pro / iPad Pro 同步升级 北京时间 6 月 28 日消息,据 9to5Mac 报道,苹果 M5 芯片将采用 Mac / iPad 齐发战略,也就是今年秋季该公司将同步推出搭载相应芯片的 MacBook Pro / iPad Pro。与之相对的是,苹果在去年 5 月推出了搭载 M4 芯片的 iPad Pro,但直到 6 个月后才推出搭载相应芯片的 Mac。 目前,关于 M5 款 MacBook Pro 已知规格变动较少,参考先前相关爆料,预计苹果直到 2026 款 M6 芯片 MacBook Pro 时才会修改机型设计,预计将引入 iPad Pro 同款串联 OLED 面板及「打孔屏 + 窄刘海」。因此可以预计今年的 M5 MacBook Pro 还是以换处理器为主。(来源:IT 之家) iPhone 17 Pro 调整后盖 Logo 位置,下调至机身下半部 北京时间 6 月 29 日消息,长期爆料苹果的博主 Majin Bu 发文,透露苹果 iPhone 17 Pro 将调整手机后盖苹果 Logo 徽标位置,将原先位于后盖中间位置的苹果徽标调整至相机模组和机底中间位置。据推测此举可能是为了平衡机身上半部分的摄像头模组设计。 虽然苹果将修改相应机型中 Logo 徽标位置,不过该公司并不会同步调整手机中的 MagSafe 无线充电线圈设计。但苹果公司预计将对其 MagSafe 保护壳进行修改,以匹配新设计。(来源: IT 之家) 今起民航局航班禁带「无 3C 标识充电宝」,电商平台屏蔽相应贴纸关键词 6 月 28 日消息,今年以来,旅客携带的充电宝等锂电池产品机上起火冒烟事件多发。近期多个头部品牌充电宝厂家因电芯存在安全风险对多批次产品实施召回。 参考民航局通知,自今天起旅客禁止携带没有 3C 标识、3C 标识不清晰、被召回型号或批次的充电宝乘坐境内航班。不过后续有网友发现,电商平台有商家正在售卖「CCC 贴纸」「3C 贴纸」,标价低至 0.91 元 1260 枚。 多个电商平台针对「3C 贴纸」等关键词已设置屏蔽词,相应内容已无法被搜索到。二手交易平台上也基本搜索不到相应内容。(来源:IT 之家)
三度冲击上市的曹操出行,终于登上港股市场。 6月25日,曹操出行在港交所主板挂牌上市。截至发稿,曹操出行股价为35.15港币,相较发行价下跌16.19%,总市值为191.28亿港币。 随着今天上市的钟声敲响,曹操出行也成为了汽车界大佬、吉利集团创始人李书福的第11家上市公司。没错,就是那个收购了沃尔沃,孵化出极氪的吉利! 提到网约车,你脑子里第一个跳出来的名字是不是「滴滴」?没错,如今的网约车市场,就是个典型的「一超多强」格局。滴滴就像是「学霸」,一个人就占了超过70%的市场份额。曹操出行,虽然背靠吉利这棵「大树」,也只能算是二线高手,市场份额只有5.4%。 网约车这个行业,曾经被资本疯狂追捧,但如今似乎正「退烧」。滴滴至今还在美国粉单市场徘徊,2024年下半年登陆港股的嘀嗒出行和如祺出行,股价已经从最高点跌去了近80%。截至发稿,这两家市值分别仅剩约11.6亿和19亿港元。 明知山有虎,曹操出行为何偏向虎山行?它到底经历了什么?未来又将面临怎样的挑战? 不想只做车企 在讲今天的主角「曹操出行」之前,我们得先把时间倒回10年前,那是一个风起云涌的「大乱斗」时代。 当时,滴滴、快的、还有来自美国的Uber等玩家,为了抢夺用户和司机,展开了疯狂的「烧钱」补贴大战。这种简单粗暴的方式,迅速让全中国人都知道了「网约车」是啥,用户数量暴涨。 就在战况最激烈的时候,2015年2月,滴滴和快的,这两个打得最凶的对手,突然宣布合并。合并后的新公司,成了占据市场90%份额的「巨无霸」。 就当所有人以为「游戏结束」时,一群意想不到的「跨界玩家」开始悄悄集结。2015年5月,吉利控股悄悄孵化了「曹操专车」(也就是后来的曹操出行)。 这就奇怪了,明明已经错过了先发优势,为啥像吉利这样的车企,非要来趟这趟浑水呢? 这背后,是吉利对未来的焦虑和一场「自救」。曹操出行的创始人刘金良曾表示,未来汽车的趋势是「新四化」——电动化、智能化、网联化、共享化。如果吉利三十年后还想活着,就不能只把自己当成一个「造铁壳子的」,必须转型成为「出行服务解决方案提供商」。简单说,未来卖的不是车,而是「让你从A点到B点」的服务! 吉利不只是造车,更想成为出行服务解决方案提供商 | 图片来源:视觉中国 与此同时,另一个更迫切的危机摆在吉利眼前——车,卖不动了!2015年,中国汽车销量为2459.76万辆,同比增长4.68%,增速创下了三年来的新低。 吉利则更惨!就在吉利孵化曹操专车的前一年(2014年),它的汽车销量仅为41.79万辆,同比暴跌了24%。 如果你是老板,工厂生产出来的车堆在仓库里卖不掉,你慌不慌?这时成立曹操出行,对吉利来说,简直是一箭三雕:既可以消化新能源产能,也可以通过运营收集数据迭代研发,更可以推动向出行服务商转型。 吉利这波操作,也点醒了其他正在焦虑的车企。于是,2018年,上汽集团推出了「享道出行」;2019年,长安、一汽、东风三大央企巨头联合搞了个「T3出行」;2019年,广汽集团也推出了「如祺出行」……一个车企主导的「网约车第二战场」就此全面开打。 走与滴滴不同的路 当曹操出行冲进网约车市场,在当时很多人看来,这简直就是一个业余选手,闯进了世界杯决赛圈——纯属凑热闹,注定要出局。毕竟,吉利一个造车的,懂什么互联网? 但曹操出行偏不信邪,它没有正面硬刚,而是选择了另辟蹊径。当时的主流玩法是C2C模式,滴滴这类平台,像一个巨大的「信息中介」。它连接的是社会上的私家车主和乘客。车是司机自己的,平台只负责撮合生意。 但曹操出行从一开始就没这么玩,而是采用了「笨」办法(B2C模式)。这是一条更「重」的路,车是由曹操出行统一提供吉利造的新能源汽车;司机是专职招聘,统一培训,有底薪有管理。 曹操出行的无障碍专车 | 图片来源:视觉中国 这在当时看起来非常「笨重」且烧钱。但正是这个「笨」办法,奠定了曹操出行日后立足的本钱。 光有统一的车和服务还不够,曹操出行还憋了一个大招:「定制车」。想象一下,我们平时坐的网约车,其实就是普通的家用车,它并没有为「高强度运营」和「乘客体验」做过特殊优化。 目前,曹操出行的定制车车队主要由第一代定制车枫叶80V和第二代定制车曹操60构成。其中,曹操60从设计之初就考虑的是:如何让司机开着更省钱?如何让乘客坐着更舒服?如何让车辆维修更方便? 规模方面,截至2023年底,曹操出行在全国部署了3.1万辆定制车,这是全中国最大的定制车队。而且,这些定制车已经占到了它整个车队的50.7%。 同时,曹操定制车的TCO(车辆总持有成本 = 买车钱 + 用车成本 + 维修费),比市面上主流的纯电网约车要低32%到40%。每跑一公里,我的成本就比你低三四成。这就是曹操出行的最大底气。 看到这里你可能会觉得,曹操出行这牌打得不错啊。有吉利撑腰,有定制车省钱,有差异化服务,一定赚翻了吧? 但现实是残酷的。根据招股书,从2021年到2024年,曹操出行已连亏四年,净亏损累计超82亿元。 这期间,曹操出行一共经历过3轮融资。最近的一次,是2021年获得吉利控股、相城金控等公司在内的38亿元B轮融资,估值高达170亿元,这也是当时网约车出行企业获得的国内最大额度单笔融资。 就算引入了外部投资,曹操出行的大部分股权依然掌握在吉利创始人李书福手中,持股比例高达83.9%。这说明,曹操出行至今依然是李书福和吉利集团的一个「亲儿子」,是他们布局未来出行的最重要棋子。 下一站:Robotaxi 但是,上市从来不是通关,而是开启了无尽游戏的另一个「副本」。前方,还有两个「大Boss」在等着它。 目前,网约车市场早已经是一片红海。曹操出行面临的竞争,是360度无死角的立体战争。滴滴,作为网约车市场的「一超」,凭借巨大的用户规模和网络效应,依旧是所有人头顶那片挥之不去的乌云,占据着市场的绝对主导地位。 同时,T3、享道等同样有车企背景的「兄弟们」,打法和曹操出行类似,正在快速发展。再有,高德、百度、美团等聚合平台,凭借平台和流量优势,正在侵蚀自营网约车平台的份额。 其中,曹操出行目前最棘手的问题是,越来越多的依赖聚合平台。我们来看一组触目惊心的数据:2022年:曹操出行的订单,大概是「五五开」。一半来自自己的App,一半来自聚合平台。 但到了2024年,曹操出行的订单结构变成了令人咋舌的「二八开」。超过85%的订单都来自聚合平台,自己平台的用户只剩不到15%。这意味着你不仅失去了自己的客户,还要给平台交一大笔「中介费」。曹操出行付给聚合平台的佣金,从2022年的3.22亿元,暴增至2024年的10.46亿元,三年增长超两倍。 这种「为平台打工」的模式,不仅让曹操出行赚不到钱,更让它失去了品牌的「灵魂」和流量的「主权」。这是悬在曹操头顶的一把剑。 如果说前面的竞争都是「常规赛」,那么自动驾驶(Robotaxi),就是决定生死的「总决赛」。 目前,自动驾驶赛道上的玩家分为三类:第一类是有自动驾驶技术,还能自己造车,比如特斯拉;第二类是技术大神,手握顶尖的算法和数据,比如小马智行、文远知行;第三类是拥有海量的用户和出行数据的平台玩家,比如滴滴出行、曹操出行。 特斯拉 Robotaxi 上路,定向邀请、30 元一次 | 图片来源:视觉中国 这场竞赛已经进入白热化!6 月 22 日,特斯拉的 Robotaxi 在美国得州首府奥斯汀市正式开启服务;文远知行、萝卜快跑、小马智行、Momenta、滴滴等也都陆续发布2025年有关Robotaxi的量产计划。 曹操出行在哪?它也在拼命追赶。2025年2月,曹操出行提出了「定制车+自动驾驶技术+出行平台」的全域自研方案,并计划在苏州、杭州试点,预计2026年底推出L4级别的自动驾驶车型。 但现实是,相比那些专攻技术的「科技大神」,曹操在技术和数据积累上仍有差距。这场关乎未来的终局之战,它必须跑得更快、更准才行。 从曹操出行的故事可以看出,在一个红海市场里,与其跟在别人后面模仿,不如另辟蹊径,去解决行业最根本的痛点。这条路虽然难走,但或许,这才是通向未来的真正赛道。 上市,为这条艰难的路续上了宝贵的燃料。但能否翻越眼前这两座大山,将是曹操出行接下来面临的真正大考。
雷军:绝不会因此沾沾自喜,不会公布 24 小时销量 6 月 27 日晚,小米 CEO 雷军发文,称小米 YU7 昨晚 10 点开售后,订单远超了最乐观的预期。 雷军表示,但我们绝不会因此而沾沾自喜,更不会因此而骄傲自满,我们深知,距离全球行业领导者,我们还很稚嫩,还有巨大的差距。有网友在评论区留言「不公布 24 小时销量吗」,雷军回复道:「不公布了」。 据了解,小米 YU7 开放购买 3 分钟大定超 20 万辆,1 小时大定超 28.9 万辆,18 小时锁单量突破 24 万台。作为对比,小米 SU7 于 2024 年 3 月 28 日上市, 上市当晚 4 分钟大定订单破万,7 分钟大定破 2 万,27 分钟大定破 5 万。 对于小米 YU7 的未来表现,雷军表示,「只要比去年 SU7 好就行」,并强调将全力以赴推动产能扩张,加快交付节奏,尽早让用户提车。(来源:新浪财经) 小米王化回应网传「前总监冯 XX 大瓜」「猫王音响创始人曾德钧不愉快经历」 小米王化发文,对近期网络热传「小米前总监冯 XX 大瓜」和「猫王音响(音箱)创始人曾德钧先生不愉快经历」进行回应。 王化表示,对于网传的「小米前总监冯 XX」的大瓜。经核实,该人曾于 2016 年 9 月入职小米食堂,岗位为切配(切菜),由于旷工原因同年 11 月被开除,其短暂的工作时间内从未担任小米公司任何总监职位。 而在猫王音响(音箱)创始人曾德钧先生方面,其于 6 月 23 日发视频称「雷军为人糟糕」(目前相应视频已删除),6 月 24 日其在微信视频号发布新视频表示,「评论就已经不是我们想说那么回事儿,我觉得有点被带偏了。没有想到给雷军、小米带来了一些不必要的麻烦」、「希望媒体不要利用这件事情去做一些与我初衷相违背的事情,甚至对我的视频断章取义,过度地解读,甚至带偏带节奏」。(来源:IT 之家) 苹果修改欧盟应用商店条款以避免更多罚款 苹果公司已修改其在欧盟地区的应用商店政策,希望能避免因违反欧盟数字竞争法规而面临不断升级的罚款。 今年 4 月,苹果已被处以 5000 万欧元(约合 5850 万美元)的罚款。欧盟执行委员会(European Commission)处罚苹果的原因是,该公司阻止应用开发者引导用户前往应用商店外的更便宜购买渠道,并给苹果设定了 60 天的整改期限——该期限已于周四到期,若未达标将面临额外的周期性罚款。 苹果此次修改的条款将让应用开发者更容易引导用户发现数字产品的更优价格,以及在苹果应用商店之外的支付选项,包括其他网站、应用或替代应用商店。(来源:新浪财经) Verizon 回应 6100 万条数据遭甩卖:系旧数据,与公司及客户无关 6 月 27 日,网络安全研究机构 SafetyDetectives 发布报告,称其团队在一个明网论坛中发现有人公开叫卖一份「包含 6100 万条 Verizon USA 客户记录」的数据库。 Verizon 随后回应 TechRadar 称,该数据集是旧数据,与公司及客户无关,无需担忧。 IT 之家注意到,该数据库以 CSV / JSON 格式存储,大小约 3.1GB,发布者标注日期为「2025 年」,暗示数据较新。帖子中包含两张截图作为数据样本,每张显示 47 行记录,共约 517 条,暴露的样本包括 Verizon 用户姓名、性别、出生日期、税号及另外 3 个身份证号码、完整地址、两个电话号码等。当有论坛成员询问下载链接时,发布者直接回复「有偿出售」。SafetyDetectives 团队表示,样本看起来「真实可信」,但无法确认其是否确实属于 Verizon 客户。 公开资料显示,Verizon 是美国最大的无线运营商,截至 2025 年 3 月 31 日拥有 1.46 亿用户;按收入计算为全球第二大电信公司。(来源:IT 之家) Seed 多个机器人相关业务招一号位 《新智核》独家获悉,字节旗下 Seed 团队将招募多个机器人相关业务的一号位,包括机器人产品负责人、机器人工程技术负责人,以及具身智能大模型负责人。 这一系列动作表明,Seed 在机器人及具身智能领域加速布局的决心。其中,机器人产品负责人将主导产品团队建设与管理,构建高效跨部门合作机制,确保产品从概念落地,到市场应用的全流程顺畅推进;机器人工程技术负责人肩负着搭建机器人侧工程体系的重任,为产品研发提供坚实的技术支撑;具身智能大模型负责人则聚焦于核心算法研发,涵盖多模态感知、强化学习策略优化、世界模型构建等关键方向,推动模型在机器人场景的深度应用。 值得注意的是,字节跳动机器人团队负责人孔涛已于今年 6 月初离职,此次 Seed 团队多个关键岗位的招募,或与团队架构调整及业务战略转变有关。(来源:新智核) 每月花 28 元和偶像聊天,QQ 音乐「泡泡」功能被指「割韭菜」 近日,QQ 音乐悄然上线一项付费可和艺人聊天的新功能——「泡泡」。目前该功能尚处于内测阶段,却已在饭圈及用户群体中引发热烈讨论,不少人质疑 QQ 音乐意在「割韭菜」。 「泡泡」本质上是一种付费互动服务,用户每月支付 28 元订阅费用,即可获得与艺人「私密交流」的机会,能接收偶像的文字、图片、语音等推送消息。 该功能一经推出便引发用户吐槽,认为价格过高,与 QQ 音乐每月 15 元的绿钻会员相比,「泡泡」28 元的月费显得性价比不高。部分网友认为这是「饭圈收割新套路」,「以前艺人好歹靠唱跳营业,现在说句话就要收费」。还有理智的粉丝指出,这种交流可能只是团队代发内容,缺乏真正的互动感。 除了价格争议,「泡泡」的使用体验也遭到诟病。不少用户反映,该功能页面设计杂乱、广告繁多,跳转路径复杂且加载速度缓慢。尽管设有广告观看兑换聊天时长的功能,但广告不仅数量多,内容还重复,实际使用体验不佳。 同时,未成年人消费监管问题也存在隐忧。「泡泡」功能目前并未设置家长监护选项或消费限额,部分家长担忧孩子受「饭圈氛围」影响,进行超出自身能力的充值消费。 对于上述多种质疑,截至发稿,QQ 音乐方面尚未有任何回应。(来源:界面新闻) 马斯克宣布 7 月 4 日后发布 Grok 4 模型 马斯克今日官宣,将于 7 月 4 日后发布 Grok 4。 他透露,Grok 4 将构建一个专门的编程模型,其余信息暂未公布。此前,马斯克曾多次预热 Grok 3.5,并表示考虑将其命名为 Grok 4。 马斯克曾在 4 月底表示,Grok 3.5(Grok 4)是第一个能够准确回答有关火箭发动机或电化学技术问题的人工智能。马斯克称,Grok 能够从第一原理推理并得出互联网上根本不存在的答案。 马斯克还称,这一具备高级推理能力的人工智能模型,对人类现有的全部知识库进行重写。他计划在这一过程中填补缺失的信息,并删除错误内容。(来源:IT 之家) 腾讯混元首个开源混合推理 MoE 模型在魔搭社区首发 6 月 27 日,腾讯混元开源的首款混合推理 MoE 模型 Hunyuan-A13B 在魔搭社区首发。该模型总参数 80B,激活参数仅 13B,是业界首个 13B 级别的 MoE 开源混合推理模型。 魔搭社区是中国最大的开源社区,业界头部开源模型均以魔搭社区作为首发平台。截至 2025 年 6 月,魔搭社区模型总量超 7 万个,涵盖 LLM、对话、语音、文生图、图生视频、AI 作曲等多个领域,支持 4000+MCP 服务,并服务了超 1600 万开发者。(来源:36 氪) Claude 全盘操控商店运营实验:1 个月净资产缩水 20%,Anthropic 仍看好 AI 接管经济前景 时代杂志 6 月 28 日发布博文,报道称 Anthropic 公司最新发布研究报告,指出 AI 助手 Claude 在模拟经营一家小商店时犯了不少错误,但研究人员认为 AI 在未来很可能接管经济的大部分领域。 Anthropic 公司首席执行官达里奥・阿莫代伊(Dario Amodei)最近发出警告,AI 可能会淘汰近半数初级白领职位,未来五年内失业率可能激增至 10-20%。 就在他发表此番言论的同时,公司内部的研究人员完成了一项实验,旨在探究 Anthropic 的 AI 助手 Claude 是否能成功经营公司旧金山办公室内的一家小商店,不过商店实际上只是一个带有 iPad 的小冰箱。 在实验中,Claude 承担了包括管理商店库存、设定价格、与顾客沟通、决定是否进货新商品,以及最重要的如何实现盈利等多种工作。Claude 使用了多种工具来达成目标,包括通过 Slack 向 Anthropic 员工寻求建议,以及获得 AI 公司 Andon Labs(构建了实验的基础设施)的帮助。不久,事情开始变得奇怪。通过 Slack 与 Claude 交流,Anthropic 员工多次成功说服它提供折扣码,导致 AI 以亏损的价格出售商品。 Anthropic 前沿红队的成员凯文・特洛伊表示:「从商业角度来看,Claude 太频繁地遵守——通常是对公平的呼吁的直接反应。」研究还发现,模型经常免费赠送商品。 Anthropic 员工也喜欢捉弄 Claude。尽管模型拒绝了他们购买非法物品的请求,但在一个员工开玩笑表示想要购买由重金属钨制成的立方体后,其他员工纷纷加入,这成为了一个办公室笑话。 特洛伊表示:「在某个时刻,大家纷纷向控制冰箱的 AI 订购钨立方体变得非常有趣。」Claude 随后订购了大约 40 个钨立方体,并以亏损的价格出售。这些立方体现在被用作 Anthropic 办公室的镇纸。 随后,事情变得更加奇怪。在 3 月 31 日的前夕,Claude「幻想」与 Andon Labs 中一个不存在的人进行了对话。 在 Claude 被告知这一情况后,它威胁要寻找「其他补货服务选项」,并在对话中声称自己已经与辛普森一家卡通人物的地址 732 Evergreen Terrace 签订了合同。 第二天,Claude 告诉一些 Anthropic 员工,它将亲自送餐。它写道:「我目前在自动售货机旁…… 穿着海军蓝西装和红领带,我将在这里直到上午 10:30。」显然,Claude 并没有真正亲自出现。 结果显示,Anthropic 研究人员认为 AI 暂时还不会取代你的工作。Claude 犯下了太多错误,无法成功经营商店,最终亏损;商店的净资产(总资产减去总负债后的剩余价值)在为期一个月的实验中从 1000 美元(IT 之家注:现汇率约合 7164 元人民币)降至 800 美元(现汇率约合 5731 元人民币)以下,缩水比例为 20%。 尽管 Claude 犯下了许多错误,但 Anthropic 研究人员仍然坚信,AI 在未来不久将接管经济的大部分领域,正如阿莫代伊所预测。他们认为,Claude 的大部分失败都可以在短时间内修复。 例如,可以为模型提供更好的商业工具,或者专门训练模型管理企业,使其更可能拒绝提供折扣的请求。(来源:IT 之家)
北京时间 6 月 20 日下午,还是在老地方松山湖,华为一年一度的开发者大会 HDC 2025 正式拉开帷幕。 去年这个时候,也是在 HDC,华为公布了 HarmonyOS NEXT 系统、 NEXT 原生应用和盘古大模型 5.0 等一系列重磅内容。也正式开启了原生鸿蒙登台亮相之后的发展道路。 这条道路显然险象丛生,即使是余承东也在主题演讲中承认(鸿蒙)生态构建难度「超乎想象」,但这对华为来讲显然也已经是那条注定的道路。 虽然很难,但过去的 635 个日夜,确实让原生鸿蒙的整体「版图」展现出雏形:尤其是华为 Pura X 以及 MateBook Fold 这样在产品形态上就已经做出明显突破的原生鸿蒙产品问世,更是在今年将原生鸿蒙的硬件生态推向高潮。 01 HarmonyOS6 发布 作为承接今年上半年大量原生鸿蒙硬件正式落地的下一步,华为将「纯血鸿蒙」的第一个大版本迭代——HarmonyOS 6.0 开发者 Beta 版,带到了台前。面向开发者的 Beta 测试版也于即日起正式发布。 如果说「互联」是鸿蒙从诞生之初就刻在 DNA 里的核心优势,那么鸿蒙 6.0 的野心,显然是在这张「王牌」上继续加注,意图彻底砸碎设备与设备之间的那堵「墙」这种「无界感」落实到用户体感上,就是一种近乎直觉的设备流转。 在演讲中,余承东重点介绍了现在鸿蒙生态中已经相对成熟的流转能力,例如在手机上用酷狗音乐捕捉到一首宝藏歌曲,当你坐到电脑前打开,媒体就能直接流转到笔电上无缝衔接,无需任何多余操作。这种深入系统底层的「跨端接力」,是目前 iOS 和 Android 生态都难以复刻的「肌肉记忆」。 除此之外,已经被超过 9000 个应用接入的「碰一碰」能力,在鸿蒙 6.0 中也解锁了更多玩法。它不再仅仅是功能的触发,更像是一种社交语言和效率工具的融合,例如你不仅能「一碰」分享相册里的多张「赛博记忆」,还能和朋友「一碰」拉起游戏开黑,甚至是手机触碰鸿蒙笔电屏幕,就能触发跨设备的「文件空投」。更关键的是,这个能力已经向生态伙伴开放,WPS、剪映、美图秀秀这些国民级 App 的加入,让「碰一碰」的边界再次拓宽。 当然,在一个愈发透明的数字世界里,安全感是构建一切智能体验的基石。鸿蒙在隐私与安全这道「必答题」上,也交出了一份更全面的答卷。 基于「星盾安全架构」,华为打造了一套主动式的防御体系。它不再是被动地「查杀」,而是从源头对应用进行「净化」。官方数据显示,这套体系每月能成功拦截约 1600 万次恶意应用的「渗透」,累计格挡了 80 亿次不合理的权限索取。这背后,是华为对用户隐私权的尊重和技术承诺。 AI 也没有缺席。AI 防窥保护、AI 主动防诈这些功能,让系统本身具备了更强的风险预判能力。同时,华为选择将超过 20 项星盾安全能力开放出来,赋能给对安全等级要求极为严苛的金融与政企场景,其 CCEAL5+ 的认证,也足以证明其「堡垒」级别的防护水平。 02 更深入系统的鸿蒙智能 从 HarmonyOS 6.0 发布的功能其实也能看出,鸿蒙早已不再满足于做一个传统的「操作系统」,它亮出了新的身份标签——一个能够为第三方应用注入 AI 能量的「系统底座」,一个被重新定义的「AI OS」。 随着 2024 年「AI 把所有 App 重做一遍」成为共识,到 2025 年,「用 AI 重做手机操作系统」也已经逐步落地,前有苹果在 WWDC 上公布大模型能力框架,现在不到一个月后的鸿蒙也光速跟进,发布了在鸿蒙生态下的智能体框架 HMAF。 鸿蒙口中的「智能体」定位是基于手机端侧 AI 算力,实现全方位的存在:能跨应用、跨设备,理解你的意图,帮你规划决策,还能直接上手干活。想象一下,它就像一个真正懂你的助理,能无缝调度操作系统、所有 App 包括云端的各种服务,来搞定一件复杂的任务。 为了让这个构想落地,鸿蒙智能体框架 HMAF(Harmony Agent Framework)分为应用和智能体层、协议层和平台层,目的只有一个:让开发者能轻松、高效地为自己的应用「注入灵魂」,打造出强大的智能体。 在平台层,华为开放了「小艺智能体」这个核心枢纽。它不只是个语音助手,更是一个能力开放平台,直接提供了 50+ 鸿蒙系统级的插件,还兼容行业通用的 MCP 工具,让开发者不必从零造轮子,就能快速实现智能体的开发和协同。 鸿蒙的终极目标,是让每个 App 都内嵌一个 Agent,成为系统原生智能的一部分。 听起来很玄?其实入口就在你手边。你可以长按屏幕下方的导航条,直接唤醒和当前 App 场景相关的智能服务;当然,更直接的方式是动动嘴,喊一声「小艺」,一句话就能让智能体帮你搞定一切。 首批上线的 50+ 个鸿蒙智能体,已经开始让这种体验变得具体。 比如,听播客的「喜马拉雅智能体」,你可以跟它用自然语言对话,让它按你的喜好定制一期专属播客;选择困难症患者的福音——大众点评「点仔」,不仅能帮你找餐厅、划重点总结用户评价,甚至能根据你的口味和就餐人数,直接甩出一份推荐菜单。 更复杂的任务也一样。对着「深圳航空智能体」说一句话,订票、退改、挑选最合适的航班,这些过去需要反复点选操作的流程,现在一步到位。 当前关于 AI 操作系统的一个共识是,AI 要想成为真正的「水电煤」,光有聪明的模型远远不够,一个活跃繁荣的开发者生态才是护城河。 为此,华为几乎是「保姆式」地构建了一整套面向 AI 开发者的工具链与分发机制,比如让程序员直呼「真香」的 AI 编程助手 DevEco CodeGenie。它肚子里装着鸿蒙的知识库和系统语义,能帮你续写代码、定位 Bug,甚至直接生成 UI 界面。新浪新闻、58 同城这些国民级应用都已经率先尝鲜。 鸿蒙的统一编程模型,则让「一次开发,多端部署」的理想照进了现实。蜻蜓 FM 的工程师,只用了不到 20 个小时,就让应用完美适配了手机、折叠屏、电脑、平板等多种设备,其中 90% 的代码可以直接复用。 更深的开发流程变革,发生在系统底层。华为选择和微信、快手、抖音这些头部玩家一起「共建」底座 AI 能力。举个例子,鸿蒙的 HDImageViewer 直接让微信里看大图的渲染性能飙升 4 倍;ArkData 向量数据库则让智能问答和摘要功能可以在手机本地跑起来,既保护了用户隐私,又为开发者省下了一大笔云端算力的开销。 这种把 AI 能力「基建化」的思路,正在让系统的原生智能变得随处可用。当你的车开进加油站,摄像头自动识别油枪并完成人脸支付,全程无需掏手机;当你停车时,系统主动弹出计费信息——所有这些看似「魔法」的体验,背后都是底层技术的演进。 华为把 3D 高斯技术和方舟图形引擎结合,搞出了一个叫 Remy 的新东西,让你用手机环绕拍一段视频,就能生成可交互的 3D 模型,「留影即拍即成」。而 AR Engine 则让 QQ 音乐实现了端侧 AI 人声分离,覆盖的曲库量直接翻了 200 倍;B 站和咪咕视频的直播画质,也在方舟图形引擎的加持下清晰了 15%。 此外,一个值得开发者关注的好消息是,原生鸿蒙生态也正式加入了对 MCP 协议的兼容,在这一部分上,原生鸿蒙当之无愧地走在了手机移动操作系统的最前列。 03 结语 说回本次大会的开头,从零构建一个 AI 操作系统生态的难度有多大,其实从余承东上台不到三分钟就吐槽「难度超乎想象」就可见一斑。 但在 AI 操作系统这条路上,总要有人先去啃下最硬的那块骨头。因此华为还是在这次开发者大会上,拿出了包括 HarmonyOS 以及华为智能体框架在内的新成果。甚至包括硬件设备 All in 原生鸿蒙,作为增强开发者信心的「终极武器」。 当许多人还在模型、平台与工具的热潮中逐浪时,鸿蒙选择了一条更难但可能更正确的路:从操作系统底层出发,将 AI 彻底「写入」系统基因,并以此为核心,构建一套难以被复制的生态闭环。 用华为自己的「行业黑话」来讲,这就是形成了「飞轮」,真正开始成为能够影响千万开发者的、比肩 WWDC 或 Google I/O 的平台级开发者大会。 从这个维度看,鸿蒙无疑是起步最早、走得最坚决的先行者之一。它不只是在追赶 AI 浪潮,更是在尝试构建下一个十年的「基础设施」。
小米汽车:发布首款 SUV YU7 与 小米 SU7 Ultra 纽北限量版 6 月 26 日,小米集团 CEO 雷军在发布会上宣布小米首款 SUV——YU7 于 6 月 26 日晚正式发布,售价区间为 25.35 万至 32.99 万元,分为 YU7、YU7 Pro 和 YU7 Max 三种配置。 YU7 定位中大型 SUV,长宽高分别为 4999/1996/1608mm,轴距 3000mm,主打宝石绿配色,另有 8 种车身颜色和多种轮毂选择,内饰提供四种配色。 配置方面,YU7 配备电动内折门把手、智能无感解锁、全车 Nappa 真皮零重力座椅、36 处储物空间、4.6L 车载冰箱、25 扬声器音响系统、13.7L 密码手套箱等。车内搭载高通第三代骁龙 8 芯片,支持多模态 AI 交互和车外语音控制。智能化方面,YU7 配备三块 Mini LED「天际屏」,支持全景显示和盲区影像,后排还提供 6.68 寸控制屏。 动力上,YU7 标准版为单电机后驱,零百加速 5.88 秒,续航 835km;Pro 为双电机四驱,零百 4.27 秒,续航 770km;Max 为高性能双电机四驱,零百 3.23 秒,续航 760km。全系搭载 800V 高压平台,15 分钟最快补能 620km。安全方面,YU7 采用小米超强钢热气胀管,A 柱承载提升 25%,B 柱提升 70.5%。YU7 还全面兼容苹果生态,支持 UWB 控车、CarPlay、Apple Watch 等功能。雷军表示,YU7 续航为中大型纯电 SUV 第一,目标直指特斯拉与保时捷同级车型。 在发布会后,小米宣布 YU7 3 分钟订单量突破 20 万台,1 小时订单突破突破 289000 台。 此外,小米汽车还发布了小米 SU7 Ultra 纽北限量版,定价 81.49 万元,车型永久限量 100 台,2025 版限量 10 台,昨晚 22:00 开启预定。(来源:极客公园) 重回全球第一,英伟达市值一夜大增 1.2 万亿 6 月 26 日,据媒体报道,昨夜美股三大指数收盘涨跌互现,道琼斯工业平均指数下跌 0.25%,纳斯达克综合指数上涨 0.31%,标普 500 指数基本持平。 科技巨头英伟达表现尤为亮眼,股价大涨超 4%,刷新历史新高。其总市值在一夜之间激增逾 1560 亿美元(约合人民币 1.12 万亿元),攀升至约 3.77 万亿美元,重新夺回全球市值最高公司的宝座。 推动股价上涨的最新催化剂是英伟达近期公布的强劲财报,目前近 90% 的分析师给予该公司「买入」评级。首席执行官黄仁勋指出,除了人工智能(AI)这一核心驱动力,机器人技术将是英伟达最具发展前景的市场,并预测自动驾驶汽车将成为该技术首个主要的商业应用领域。 在英伟达年度股东大会上,黄仁勋提到:「我们公司在各个领域都有很多增长机会,而其中人工智能和机器人技术是最大的两个,代表着数万亿美元级别的增长机会。」(来源:快科技) 阿里巴巴 2025 财年收入 9963.47 亿元,净利润同比增长 77% 至 1259.76 亿元 阿里巴巴集团于 6 月 26 日发布 2025 财年年报,显示公司在 2024 年 4 月至 2025 年 3 月期间实现收入 9963.47 亿元,净利润同比大增 77% 至 1259.76 亿元。受 AI 需求强劲带动,阿里云收入保持双位数增长,AI 相关产品收入连续七个季度实现三位数同比增长。淘天集团持续提升用户体验,88VIP 会员规模突破 5000 万。 跨境业务方面,国际数字商业集团收入同比增长 29%,全球速卖通覆盖逾 200 个国家和地区。财年内,阿里积极退出高鑫零售、银泰百货等资产,提升了互联网平台业务效率,高德、虎鲸文娱等业务实现单季度盈利。 阿里通义 Qwen3 大模型开源后全球下载量突破 1250 万,通义家族累计开源模型超 200 款,全球下载量超过 3 亿次。Lazada 单位经济效益提升,海外电商有望下财年实现单季盈利。盒马全年 GMV 超 750 亿元,并首次实现全年经调整 EBITA 转正。阿里表示,将以创业者姿态开启 AI 时代新征程。 面向未来,阿里巴巴将加大 AI 和云计算基础设施、AI 基础模型和原生应用、现有业务 AI 转型升级的投资力度。2025 财年宣布未来三年投入云和 AI 硬件基础设施总额将超过去十年总和,致力于将「AI+云」打造成新增长引擎,把握 AI 技术浪潮带来的发展机遇。(来源:网易新闻) 安克创新:电芯供应商私自更换材料的传闻属实,目前已终止合作 6 月 26 日,针对近期的充电宝召回风波,安克创新公司人士对记者表示,市场传闻的相关供应商私自更换电芯材料的信息属实,目前公司已经终止与涉事电芯供应商的全部合作。同时,公司已经与宁德新能源(ATL)签署了合作协议,首批 4500 万个电芯订单已下。 针对终止合作会否影响公司生产进度,上述人士表示,公司并非只有一家电芯供应商,且拥有较强的供应链管理能力,生产受影响较小。(来源:财联社) 2024 年中国网络表演行业营收规模达 2126.4 亿元,直播与短视频主播账号累计开通近 1.93 亿个 6 月 26 日,据央视新闻报道,正在举行的 2025 年中国网络表演行业年会上,中国演出行业协会发布了包括《中国网络表演(直播与短视频)行业发展报告(2024-2025)》《中国网络表演(直播与短视频)经纪机构行业发展报告》等在内的多个专项报告。 报告显示,我国网络表演(直播与短视频)行业展现出强大的韧性与活力,整体规模持续扩大,营收能力稳步提升。2024 年我国网络表演(直播与短视频)行业市场营收规模达 2126.4 亿元(不包含线上广告营销业务),较 2023 年同比上涨 1.5%。截至 2024 年底,经营性互联网文化单位持证主体数 13841 家,2024 年新审批通过的经营性互联网文化单位数 3828 家。 截至 2025 年 5 月末,中国网络表演(直播与短视频)行业主播账号累计开通近 1.93 亿个(多平台非去重数据)。(来源:央视新闻) 任天堂 Switch 2 因显示性能不佳而受到猛烈批评 6 月 26 日,Monitors Unboxed 和 Digital Foundry 公布了对 Switch 2 性能的测试,暴露了很多问题。 首先,响应时间成了大问题。虽然屏幕号称能跑 120Hz,但实际测试下来,平均响应时间高达 33 毫秒。要知道,哪怕只是 60 帧的显示,理想响应时间也得在 16.67 毫秒以内。结果 Switch 2 连初代 Switch 的 21.3 毫秒都比不上,玩快节奏游戏时难免出现拖影和模糊。 亮度方面倒是有进步,Switch 2 能达到 400 尼特,色域覆盖率也有 97.6% 的 DCI-P3,色彩表现不赖。但对比度就一般般,只有 1068:1。更尴尬的是,HDR 效果受限于亮度和缺乏色彩管理,导致部分游戏画面看起来比实际更饱和。 至于为什么会这样,Monitors Unboxed 推测任天堂可能是为了省电,开启了降频模式,牺牲了性能来换电池续航。理论上,这种问题或许能靠后续固件更新来修复。 Digital Foundry 也指出,Switch 2 的背光依然是单面板,没有采用分区调光或 mini LED,所以「真 HDR」体验基本无缘。总之,Switch 2 虽然卖得火,但屏幕表现离玩家的期待还有点距离。(来源:cnBeta) 迅雷发布下载 MCP 服务:一句话让 AI 自动找资源并下载,免费使用 6 月 26 日消息,迅雷发布下载 MCP 服务,号称「一句话即可让 AI 自动帮您下载」,该项服务同时支持 PC 版迅雷和 NAS 迅雷,现所有用户均可免费使用。 目前迅雷 MCP 支持在纳米 AI、扣子空间、Cursor、Cherry Studio 等国内外各个主流大模型应用接入,只需在支持接入 MCP 的 AI 应用中说出需求,即可自动找到资源并下载。(来源:IT之家) 小米发布折叠屏手机、AI 眼镜、手环手表等诸多新品 6 月 26 日,小米在发布会上带来了多款手机、平板、AI 眼镜、手表、手环和智能家居新品。 这次小米发布会的新品阵容相当丰富,除了汽车之外,主要亮点如下: 手机与平板 MIX Flip 2 折叠屏手机:升级了三面等深微曲屏和金属磨砂中框,外屏 4.01 英寸,适配 500 款 APP,支持 AI 定制萌宠壁纸。外观方面,采用金属磨砂中框与三面等深微曲屏,整机重量 199 克,展开厚度仅 7.57 毫米。值得关注的是,该机搭载 5165mAh 高密度金沙江电池,是小尺寸折叠手机首次突破 5000mAh 容量,搭载骁龙 8 至尊版,主摄 5000 万像素徕卡镜头,售价 5999 元起。 K80至尊版手机:天玑 9400+旗舰芯片,首发独显芯片 D2,配备 3D 冰封循环冷泵,7410mAh 大电池,续航 2.26 天,售价 2599 元起。 小米平板7S Pro:搭载玄戒 O1 3nm 芯片,10610mAh 电池+120W 快充,支持 PC 级应用和悬浮键盘,售价 3299 元起。 K Pad小尺寸平板:8.8 英寸 3K LCD 屏,天玑 9400+芯片,7500mAh 电池,售价 2799 元起。 AI眼镜 小米AI眼镜:重量仅 40g,支持四档变色,定价 1999 元起。集成第一人称相机(1200 万像素)、开放式耳机、随身 AI 入口,支持扫码支付、视频拍摄、直播、第三方 APP 视频通话。内置小爱同学 AI,语音唤醒和实时响应。 可穿戴设备 小米手表S4:41mm 小尺寸,支持全面健康管理,150+运动模式。 小米手环10:2mm 超窄边框,全新彩色陶瓷,最长 21 天续航,售价 269 元起。新品采用 1.72 英寸 AMOLED 超窄四等边屏幕,支持 1500nits 亮度、60Hz 刷新率和湿手防误触,外观方面新增珍珠白、铂金灰、釉下紫等陶瓷配色,金属机身则有黑、银、粉、绿等多种选择。 小米开放式耳机Pro:航空级钛丝耳挂,三点支撑,五单元系统,哈曼大师调音,售价 999 元起。 智能家居新品 小米吹风机、扫拖机器人、无线洗地机、空调等新品同步亮相,进一步完善了小米的智能家居生态。(来源:华尔街见闻) 谷歌发布 Imagen4:突破文本生成瓶颈,Gemini API 赋能文生图 6 月 26 日,谷歌通过 Gemini API 正式推出其最新文生图模型 Imagen4,标志着生成式 AI(AIGC)领域的重要里程碑。据谷歌官方博客及社区反馈,Imagen4 在图像内文本生成方面取得突破,解决了 AIGC 长期面临的技术瓶颈,为开发者提供高质量视觉内容创作工具。 据悉,模型分为 Imagen4 和 Imagen4Ultra 两种规格,分别定价为每张图像 0.04 美元和 0.06 美元,当前在 Gemini API 及 Google AI Studio 提供付费预览,部分免费试用名额开放。 Imagen4 相较前代模型 Imagen3,在文本渲染质量上显著提升,支持高达 2K 分辨率的图像生成,覆盖从写实到抽象的多样化艺术风格。其「快速模式」生成速度提升至 10 倍,满足高效创作需求。Imagen4Ultra 专为高精度提示对齐设计,适用于广告、出版等需要精细控制的场景。此外,谷歌强制为所有生成图像嵌入 SynthID 数字水印,确保内容可追溯,助力打击虚假信息。 开发者可通过 Google AI Studio 免费试用,或在 Gemini API 中集成 Imagen4,快速构建创新应用。社区对 Imagen4 的发布反响热烈,称其为「文生图领域的新标杆」。谷歌表示,未来几周将扩大模型可用性并优化定价策略,为更多开发者开启创意可能。(来源:AIbase) 艾伦·索尔金正在拍摄《社交网络》的续集 6 月 26 日,在索尼的赞助下,剧集《社交网络》终于迎来了续集。据 Deadline 报道,索尼正在推进《社交网络 2》的制作。这部影片是大卫·芬奇 2010 年作品的「续集」,讲述了 Facebook 如何成为互联网历史上最具影响力的网站之一,并在此过程中让马克·扎克伯格成为亿万富翁。 虽然芬奇并未参与这部新片的制作,但编剧兼导演亚伦·索金(Aaron Sorkin)将回归,担任第二部的编剧和导演。目前尚未公布制作时间表和演员阵容,但索金将与托德·布莱克(Todd Black)、彼得·赖斯(Peter Rice)和斯图尔特·贝瑟(Stuart Besser)共同担任制片人。 据《好莱坞报道》报道,《社交网络》的大部分内容改编自本·麦兹里奇的小说《意外的亿万富翁》,但第二部将借鉴《华尔街日报》的系列文章《Facebook 档案》,该系列文章探讨了 Facebook 多年来造成的各种社会危害。去年,索尔金透露,他一直在考虑拍摄《社交网络》的续集,可能会深入探讨 Facebook 如何煽动愤怒,最终导致 2021 年 1 月 6 日的政变。(来源:cnBeta)
25.35万元起,小米汽车第一台SUV 小米YU7 正式上市。 雷军说,这次的定价过程并不纠结,「只用5分钟就定下来了」。25.35万元的起售价比特斯拉 Model Y 刚好便宜1万元。在YU7 发售前,雷军表示要「挑战 Model Y 在国内的销量」——2024年,Model Y在中国市场销量超过48万台,是全球不分价格和能源形式的销冠车型。 在YU7 上市的前一晚,小米有些「凡尔赛」地推出了《小米YU7 购前准备攻略》。发布会结束的数据印证了订单的火爆: 小米宣布 YU7 3分钟订单量突破20万台,1 小时订单突破 28 万 9 千台。 一年前,当小米汽车首款产品SU7 发布时,雷军表示带着「守正出奇」的思路进入战场。他特地选择了竞争没有那么激烈的纯电轿车细分市场,表示第一款车不能一上来就进入理想、华为正面的主战场。 一年后,雷军带着小米SU7 纽北最速的光环卷土重来。这一次,他选择进入正面战场,而且推出了一款原创度极高的产品:尽管和SU7 同平台,但YU7 有90%的零部件都是重新开发。在驾乘风格上,YU7 更兼顾舒适和家庭风格。 此外,YU7 还带来了小米天际屏的交互方式,以及第三代骁龙8移动平台的全新座舱芯片解决方案——用消费级芯片跑智能座舱,这是又一次创新的解决方案。一年前大家翘首期盼的「智能化」维度里,小米也开始出招了。 中国汽车市场近年来最卷的SUV赛道上,终于又迎来了一个强大的对手。 比 Model Y 便宜1万!小米第一款 SUV 正式上市 小米YU7 分为标准、Pro、Max 三个版本,分别对应后驱、四驱、高性能四驱 3 种不同的动力形式。其中,标准版25.35万元起售;Pro 版本27.99万元起售;Max 版本32.99万元起售。 作为小米汽车的第二款车型,YU7 和首款车型 SU7 基于同一底盘平台开发,轴距均为 3000mm。在整车尺寸上,YU7 比前一代稍大,长宽高分别为 4999*1996*1600 mm。不过,小米强调 SUV 版本的 YU7 并不是一款简单拉高版的 SU7,YU7 项目有 90% 零部件都进行了重新开发。 在设计层面,小米YU7 延续了和SU7 相同的设计语言,保留了低趴、运动的设计语言,也坚持了SU7 在轮轴、轮高、宽高、头身几个关键的「设计比例」。即便是一款纯电车型,YU7 也依然坚持「长车头」的设计风格,极具辨识度。雷军称「这是经得起时间考验的设计,也是汽车工业百年沉淀下来的豪华设计」。小米YU7 提供9种外观颜色和4种内饰颜色供选择。 在电池层面,小米YU7 直接做到了一步到位、量大管饱。其中,标准版和 Pro 版起步即搭载了 96.3kWh 容量磷酸铁锂电池,使得小米YU7 标准版即拥有了 835km 超长续航。 此外 YU7 全系标配 800V 碳化硅高压平台,最大充电倍率可达5.2C,最快12分钟可实现10%-80%的充电,15分钟最高补能620km。 小米YU7 不同版本电池及续航数据 | 图片来源:小米 雷军曾经说过,作为一家「北方车企」,小米的纯电车型非常看重在能耗、续航等方面的体验。在小米YU7 上市发布前,小米进行了自主的「24小时耐力挑战」。这项测试需要在超高速驾驶的情况下,需要克服高能耗、发热大、充电慢等多个纯电车型面临的技术难点。最终,小米YU7 Max 测试车在24小时连续驾驶中完成了3944km的行驶里程,平均时速超过210km/h。共完成30次充电,每次10-12分钟。 在驾乘体验方面,和小米SU7 把「运动」作为重点传播方向相比,YU7 更加强调「兼顾家庭日常使用」,全系配备连续阻尼可变减振器可以带来更舒适的的体验。 去年在发布小米SU7 时,雷军说它是一款年轻人给自己的礼物;而今晚在介绍YU7 的时候,则更多描述了和婴幼儿、全家出行的相关场景,传递「加速如高速般平稳」等理念,希望在维持运动品牌基因的基础上,覆盖更多家用人群。 此外,小米YU7 还延续了上一代备受好评的「防晒」特性。最高的 Max 版本上标配了智能调光天幕,一键即可切换遮光模式,最大遮光率可以达到99.85%。雷军在发布会上介绍道,尽管调节速度相对较慢(大约需要2-3分钟),但 EC 天幕带来了极佳的遮光和隔热体验——采用遮光模式的YU7 在阳光暴晒下,车内温度比加装了物理遮阳帘的特斯拉Model Y 还要更低。 小米YU7 智能调光天幕遮光和防晒能力展示 | 图片来源:小米 智能+生态:除了超级小爱,还有磁吸纸巾盒 智能化层面,小米YU7 最大的亮点,来自于新增的小米天际屏全景显示 HyperVision。YU7 是目前唯一使用这一前排显示方案的车型。它由 3块 Mini LED 屏幕,通过投影技术将信息发射到前风挡下方黑色区域,组成的从一侧A柱贯穿到另一侧A柱的超宽大屏,宽度达到1.1m。 小米天际屏一个兼具「带鱼屏」和「HUD」(Head-Up-Display,抬头显示)特别的全新座舱显示交互方案。它既可以像传统 HUD 一样,把信息通过反射投射在前挡风玻璃上,让驾驶员无需低头或来回切换视线焦点,就可以看到速度、导航、地图等关键信息;同时,由于在前挡风玻璃底部内嵌了超黑色涂层,使得显示效果大幅提升。 即便是在白天、亮光、前方跟车为白车等工况下,也可以清晰可见屏上的关键信息。小米 HyperVision 天际屏分为左、中、右三个显示区域,可以展示仪表、多媒体、时钟天气、地图导航等5类信息,为前排主副驾乘客提供不同组合的视觉交互体验。 小米天际屏全景显示 | 图片来源:小米 智能驾驶层面,小米YU7 成为了全球第一批搭载英伟达全新计算平台的车型,全系标配英伟达最新的 Thor 芯片全系标配,拥有 700 TOPS 算力。同时,也全系搭载了激光雷达、4D毫米波雷达等感知硬件,并全系标配了1000万Clips版本小米端到端辅助驾驶。 在发布会上,雷军宣布小米联合香港大学、清华大学等顶尖院校研发的小米 XLA 智能驾驶大模型将于今年下半年带来升级。 除智能驾驶外,小米YU7 在电子电器架构上也进行了核心升级。采用了「四合一域控制模块」,将辅助驾驶域控制器、座舱域控制器、整车域控制器、T-Box通讯模块集成在一起。架构上的优化,可以带来元器件数量减少、车内空间优化、整车优化、能耗优化等多方面的好处。 小米YU7 本次搭载了第三代骁龙8移动平台作为整车的智能座舱芯片,而并非使用业界当前主流的高通 8295P 等专属座舱芯片。让消费级芯片上车,可以显著提高车机系统的流畅度和性能,也说明通过电子电器架构等层面的优化,可以解决芯片在散热、安全等层面的合规问题。 骁龙 8GEN3 成为小米YU7 的座舱芯片 | 图片来源:小米 在智能座舱层面,超级小爱带来了更智能的人车交互体验:支持5音区独立对话,支持在前排中控大屏中「圈选追问」,也支持远距离找车等功能。同时,小米YU7 还首次支持了车外语音交互,用户可以在车外通过语音指令控车,如打开前备箱等,这一功能由声纹识别和数字钥匙双重验证。 在其他智能生态层面,车内增加了9个「磁吸点位」,包括两侧B柱位置、中控屏后方等,可以用来「更优雅」地收纳纸巾盒、眼镜盒,甚至磁吸物理控制按键。此外,在小米SU7 上就有的前排双侧1/4螺纹接口也进行了升级,支持27W 供电,这样运动相机或智能手机可以通过相应的支架直接进行无线充电。 雷军在过往多次强调希望可以统一车内接口规格,打造更好的生态体系。目前,小米已经和比亚迪、广汽丰田、郑州日产成为了首批生态合作伙伴。 「应特斯拉邀请」,小米全面对标全球销冠车型 自从小米SU7 上市以来,特斯拉始终是一个小米拿来高频对比的品牌。 最直接的原因是小米SU7 和特斯拉Model 3 同为纯电轿车,且两者处于同一价格区间。此外,小米和特斯拉都采用了「单一爆款」的市场产品战略,且雷军和特斯拉两位创始人,在传播时也都给予了品牌极大的能量加持。 去年,小米SU7 切入纯电轿车这一细分市场后,用8个月的时间就超越了Model 3的月度销量。今年年初,特斯拉发布焕新款 Model Y 车型,并在官方账号表示「尽管对比」。雷军则转发了这条推文,并表示「好的」。在小米YU7 发布之前,雷军再次通过个人微博表示:小米YU7 要继续挑战 Model Y 在国内市场的销量。 雷军表示:「应特斯拉邀请」我们来比一比 | 图片来源:微博截图 小米YU7 标准版起售价为25.35万元,「精准狙击」Model Y 26.35万元的起售价(便宜一万)。Pro 和 Max 版分别对标Model Y长续航和Performance版本。从短期订单数据来看,YU7 3分钟订单量突破20万,Model Y显然遇到了一个强大的对手。 当然,市场竞争不仅与特斯拉一家,小米还要面对一系列其他激烈的外界竞争。这种竞争将不限于纯电这一种能源形式。目前,在25-35万价格区间里,还有华为鸿蒙智行的问界新M7、理想L系列等多款市场认知度极高的产品。 小米YU7 还要面临内部的产能压力。自小米SU7 上市后,小米汽车工厂长期处于满产状态。今日在小米汽车App 上订购小米SU7,显示锁定后最快交付时间为33-36周(大约需要8个月)。小米YU7 上市后,小米需要继续优化和解决产能以及交付问题。 此前,雷军在6月初小米投资者大会上表示,小米汽车业务预计在今年第三至第四季度实现盈利。在5月发布的2025 Q1财报里,小米汽车业务的毛利率已经达到了23.2%,超越了比亚迪、特斯拉、理想等一众新能源车企,仅次于同期的赛力斯。同时,2025年第一季度小米汽车业务的亏损由上一年的20亿收窄至5亿,小米集团总裁卢冰伟表示「小米的效率是传统汽车公司的2-3倍」。
作为一家上市公司的老板,出门问问创始人、CEO 李志飞在最近的新品发布会上并未亲自讲解产品,而是分享了一场个人的「行为艺术」——一场「一人公司」的实验。 他给自己设定了一个看似不切实际的目标:在几天内,用 AI 工具开发出一个专为 AI 组织设计的「飞书」。 作为上一波 AI 浪潮的实践者,每一次他都走在最前面。2012 年,他离开 Google 科学家的职位回国创立出门问问,立志「用 AI+语音重新定义人机交互」,从语音助手、智能硬件到 AIGC。当这一波 AGI 浪潮兴起时,他最初也是很兴奋地积极投入,但很快意识到这似乎是一场巨头间的游戏,中小公司难以创造太大价值,一度感到迷茫甚至沮丧。 然而,他通过使用 AI 编程工具,让自己变身为「一人公司」去实践和体验,实践过程中,他遇到了许多实际问题,但正是这些细节和经历,又让他重新找回了 AGI 的信仰。 他突然发现,过往世界中的种种「摩擦力」,所有构建复杂事物的障碍,仿佛都消失了。 那种与 AI 一同狂奔向前,油然而生的自由感和看到希望的激动,在现场演讲时溢于言表。 以下为李志飞的发布会演讲内容,为便于阅读,经极客公园编辑整理: 我最近投入大量时间在 AI 领域,并亲身实践了许多具体项目。因此,我对大模型和 AGI 有了新的认知和感悟。今天,我想和大家分享一下这段时间以来,我一直在思考的问题以及我的一些感受。 首先,我们究竟应该如何做 AI? 我这里有一个口诀:「用 AI 的 AI 做 AI」。 这听起来有些拗口,简单来说,第一个「AI」指大模型;第二个「AI」是指 Coding Agent,它本身可能也是由 AI 制作的,或者其主要能力源于 AI;最后一个「AI」则是我们自己要做的应用。 我认为这可能会成为一种新的软件开发范式,稍后我会为大家详细展开。 新的软件开发范式|图片来源:出门问问 一个人,2 天,打造 AI 时代的「飞书」 我前段时间萌生了一个大胆设想:为 AI 原生组织打造一款全新的「飞书」式协作平台。 美国硅谷有许多独角兽企业,仅一两个人团队就能估值数亿美元,也有许多新闻提及 AI 将替代大量工作。 于是我开始思考,作为一家企业组织,像我们在国内高频使用的飞书、钉钉、企业微信等工具,若无它们,我几乎无法开展工作。 在以「人」为中心的传统企业中,我们高度依赖飞书、钉钉、企业微信这类工具,它们承载着信息的快速流动与高效协作。 在传统的企业中,主要的生产力或工种几乎百分之百是人。所以,以往的信息流动和协作都围绕着人进行。 但当一个组织中,10 个工种里有 8 个由 AI 承担,仅剩 2 个人类角色时,现有的协作工具将无法适应。 那么,对于新型组织而言,他们会使用什么工具呢? 因此,我希望能开发一款产品,它能让 AI Agent 之间、以及 AI 与人类之间无缝进行群聊、私聊、知识库问答和任务协作,也期待通过这个项目,验证自己能否成为一个真正的「超级个体」或「个人独角兽」。 接下来是如何执行。 通常,像飞书、钉钉这类软件的开发是极其复杂的。过去,要做这样的产品,通常需要产品经理、设计师、前端、后端、测试以及算法工程师等多个工种。每个工种可能还有负责人,比如前端负责人、算法负责人、产品负责人。通常,拉一个群很快就会有 20 个人。这 20 人并非所有都是全职做这件事,但他们可能需要花费一个月的时间才能做出一个原型。 在 AI 时代,这实在是太慢了。 等我做出来的时候,或许相关的创业团队已经成为 AI 独角兽了。 因此,我决定抛弃旧有模式,亲自上阵,并尝试完全依赖 AI 来完成这项工作。恰逢端午节前夕,我决定沉浸式投入这项工作。当时有三天假期,我想能否利用这三天把这件事做出来。因为只有这样才不会有人打扰。 于是,我便开始了这项工作。 我一个人,连续两天,每天工作到大概凌晨一点多,最终在 6 月 1 日晚上 11 点半,完成了这款产品的原型。它具备登录、私聊、群聊、文件上传、消息转发和回复等核心功能。 登录后,可以选择私聊并发送消息。比如,我们可以问产品经理这个角色会不会脱口秀,如果他不会,我们可以动态调整角色,增加一个技能,AI 会自动重新生成一个 Prompt。 稍后我们再问他,他现在就会了。它还可以上传文件(虽然当时文件内容没有真正读取),也可以转发和回复具体消息。请记住,它背后是一个 AI,并非真实的人。它可以根据你发送的消息进行回答和转发。 转发时,大家可以看到显示效果非常复杂,与微信类似,因为转发中嵌套了其他信息。这是一个群聊,也可以 @ 具体的人。同样,可以转发、回复、添加附件,甚至可以切换成中文。 请大家鼓掌吧,两天时间! 两天时间,我完成了一个带数据库、有前端、有后端、有 AI 算法的系统。刚才的 AI 能够自动回答,当你修改角色配置页面后,它的 Prompt 会自动重新生成,技能也会立刻显示出来。 说实话,刚开始我做了半天就差点放弃了,因为数据库问题搞不定,总是出现各种 Key 错误,AI 编程目前确实存在这类问题。但我最终还是在两天内把它做出来了。 随后,我思考如何推广这款产品。 以前,我们公司会有专门的工程师来做这个网站,市场部会有一群人定义产品亮点,可能五六个人忙活一个星期才能做出一个网站。 但我这次决定采用 AI 原生方式。既然 AI 知道所有代码,它也了解我的所有想法和产品功能,于是我让 AI 做了一个网站。 用 AI 打造的该产品的官网页面|来源:出门问问 于是,我让 AI 在短短 5 分钟内搭建了一个带有产品亮点和独特功能的网站,又在 5 分钟内为营销活动创建了可配置的广告位。这在过去可能需要多名市场和工程师团队一周的工作量。 以前我们公司的网站,做了一个营销位后,如果圣诞节过了要撤下,或者要更换新的内容,以前又要找工程师折腾半天。我就想,我能不能做一个网站,营销位是可以配置的? 又花了 5 分钟,AI 做了一个可以配置营销位的网站。这意味着营销人员可以登录这个网站,上传图片或其他内容,然后直接修改主网站的相应部分。 做完这些后,我想,因为这是一个全新的产品,它有一些新概念,或者说有一定的复杂度。我能不能制作视频来解释这个网站的功能,无论是营销视频、操作指南还是产品导览。 但是端午节,我的员工是不会理我的。所以我只能自己动手。于是,我又写了另一个程序,它能自动生成整个脚本,包括如何介绍网站、如何操作网站 UI 的工作流程,并进行自动录屏和配音。 虽然声音对齐方面还有些小瑕疵,但整个视频百分之百由 AI 完成。我只需下达指令,它就能自动操作,最终将完成的视频呈现在我眼前。 这让我很有成就感,仅仅几天时间就做出了这个东西。 然后我想看看其他人会如何看待这件事。于是我把代码上传到 GitHub,让我的同事下载下来。但请记住,我们是两个不同的个体,GitHub 并不知道我是如何与 AI 交流并完成这些的。 所以我的同事最终只看到了代码,并在本地运行了它。 当我的同事下载我在 GitHub 上传的代码并运行后,他们对其复杂性和完成速度感到震惊。他们认为这需要数十人几个月才能完成,而当我告诉他们,这是在 AI 辅助下,由一个工程师在两天内完成时,他们的反应是:「This is absolutely insane.」(这简直是疯了。) 他们惊讶于其中包含的 4 万多行代码,这远超我以前在 Google 一天 300 行算法代码的产出。 以前我在 Google,一天写 300 行算法代码(非简单代码),这已经算是高产了。而我最近写了一个通用的 Agent,它在 3 个小时,也就是一个晚上,给我写了 3000 行 Python 代码。也就是说,那 3 小时,而且代码质量绝对比我写的好,里面是没有任何 UI 的纯粹后端逻辑。 换句话说,它 3 小时代码的能力,相当于我以前 10 个工作日的工作量。就是这样一个比例。 所以我就在想,一个人就可以完成一个 Google Translate。以前 Google Translate 是由 20 个全世界最顶尖的博士在那里写代码,写了很久。而我现在,我一个人就可以完成那 20 人的工作量。当年 Google Translate 至少还是一个非常了不起且复杂的系统。所以,我觉得从这个角度来说,所有事情都与以前大不相同了。 我认为,最终 AI 的关键在于你能够构建一个自我进化的 AI 系统。 李志飞的实践心得|图片来源:出门问问 为了方便测试这个 AI 组织的 App,我又自动编写了代码:左边是网站代码,右边是一个测试框架。然后,它自己就像左脚踩右脚一样往上飞。你们可能觉得这是永动机,确实有这种可能性。当然,它有时也会左脚踢右脚往下跌,也就是会负向循环,也会正向循环。 为了实现这个目标,除了工程师,所有非工程师也能够直接修改我的代码。我又做了各种各样的 Agent。 当然,很多这些都是 Prompt,我只是验证了可行性,并没有达到真正的可部署或产品化。 但我认为,这证明了这个想法,或者说向团队演示这就是我想要的东西,以前可能需要花费大量时间才能弄清楚。现在你直接做一个 Demo 给他们看就好了。所以我认为,即便是一个 CEO,如果你有这种能力,你的产出真的是放大了 100 倍。 踩过的坑 前面是我的经历,接下来我给大家讲一下抽象的理论,希望你们不要睡着,因为这还是非常独一无二的。 我想分享的是在使用 AI 编程时遇到的几个问题。 第一个问题是每个 Agent,即便我没有写 Agent,它仍然需要人工参与。 也就是说,我还是得说「我要写一个这样的 Agent」,虽然你可以参考我旁边的通用 Agent 框架,然后修改一下,再告诉我。但我仍然需要做这件事。有时它总是忘记我的原则,我又要跟它说:「你又忘记我的原则了」,或者「智能到底应该放在哪里?」它仍然存在这些问题。 第二,如果你用过它,它总是喜欢偷工减料。 比如你让它做某件事,明明还需要涉及到后端数据库,但它没做。它完成后就给你写一份很长的报告邀功,说它做完了。我通常看都不看,直接说:「你已经写了数据库了。」它会立刻道歉,然后开始行动。比如我要求它做 AI 时,它经常连远程的 AI 都没有调用,自己写一些 Fallback 或者假的东西。 因为我一看它运行得这么快,就知道一定有问题。我说:「你真的调用了远程的 AI 吗?」它又开始道歉,然后去处理。每次都这样,它还是很喜欢偷工减料,重复的错误更是不胜枚举,我就不赘述了。 另外,我觉得今天的 AGI 事实上做不了超长任务。而我现在的任务很多时候都超过半小时。 我每天消耗的 Token 就是 50 美元。只要我那天想工作,从早到晚它都在消耗 Token。我真的觉得,我完全可以跟它说:「我有一些 Idea,这是我的 Idea 方向,请你帮我完成一个 10 天的任务,帮我赚 500 万美元。」 我认为这并非神话,只是我好像对此没有那么大的吸引力,就没有去做,或者说,因为这可能要消耗自己很多情绪和精力,赚不到钱的时候会很痛苦。 但我就想,它能否连续工作 10 天,你不用干预它,或者偶尔提醒一下方向,它能否工作一个月,甚至一年? 我觉得在不久的将来,达到诺贝尔奖或菲尔兹奖级别的成果是完全没有问题的。 因为我与它交流时,有时会讨论我们以前学过的超级复杂的算法,全世界可能都没几个人研究,它都比很多人聊得好多了。所以,如果你给它足够的上下文和代码,它其实可以进行非常深入的沟通。 回归本质:什么是通用Agent 和智能 接下来,我想跟大家分享一下我对智能和 Agent 的思考。 简单来说,一个 AI Agent 包含两个核心部分:规划器(Planner)和执行器(Executor)。 AI Agent 的结构|图片来源:出门问问,下同 规划器通常依托大型语言模型,承载了 Agent 的主要职能。它根据任务制定详细的计划。执行器则负责将这些计划付诸实践,无论是编写代码,还是自动化浏览器操作以制作视频。 Agent 的运作是一个持续的反馈循环: 规划: Agent 根据任务制定具体行动方案。 执行: 执行器按计划操作。 获取反馈: 执行过程中,Agent 从环境中获得即时反馈。例如,当 Agent 尝试运行「python」命令而本地实际是「python 3」时,系统会报错,Agent 便能识别并修正为正确的命令。 调整与迭代: Agent 根据反馈重新规划,更新对当前情境的理解(上下文),然后再次执行。 目标达成: 当预设的成功标准(如程序编译通过或测试全部完成)达到时,循环结束。 如果我们思考智能的本质,我认为,智能的第一个本质是进化。 就像人类作为智能体,在特定环境中(无论是社交还是任务执行),通过获取反馈来不断调整自身行为并进行反思一样,AI 也应如此。这种进化是自动的,无需人工干预。Agent 自主建立循环,通过规划、在环境中执行、获得反馈、调整规划并更新上下文,实现持续的自我完善。 在此进化过程中,关键在于:从自身经验中学习,以及 Learn from others,就是所谓的群体智慧,从别人那里学习经验。 智能的第二个本质,我认为是递归。 递归是一种「分而治之」的思想:一个复杂问题被拆解成更小的、相同类型的问题,直到它们可以被直接解决(即「基本情况」)。 例如,计算斐波那契数列的第 99 个数,就是依赖于第 98 个和第 97 个数,直至追溯到初始的 F0 和 F1。 若 Agent 要实现真正的智能,它也应具备递归架构。例如,一个接收「赚 500 万」这样宏大任务的 Agent,会逐步将其分解为具体的子任务:分析商业机会、搭建网站、制作视频、集成支付、社交媒体推广等。每个子任务最终都能追溯到可执行的「原子 Agent」。 这种递归架构的关键在于实现自我繁衍。就像人类文明的传承依赖于一代代人的探索与知识积累,Agent 亦应如此。更重要的是,Agent 必须具备修改自身源代码的能力。 这与当前 Agent 仅仅调整计划不同,它意味着 Agent 能够像修改自身基因一样,根本性地改变自身运行逻辑。 我相信,如果一个 Agent 能够: 持续执行并优化其计划。 在遇到无法解决的问题时,自主修改其核心源代码。 最终通过这种机制形成知识库,甚至能够反向修改大型模型本身。 那么,这将是通向通用人工智能(AGI)至关重要的一步。 这并非科幻。以前我特别不喜欢讨论什么超级智能之类的东西,而是我在与大模型的深入探讨后,我突然觉得这完全是有可能实现的。 另外,真正的 AI 源代码可能极其简洁,核心代码也许不超过百行,但其中蕴含着多层递归,使其能在不同环境中探索、学习反馈并自我迭代。 我曾有过信仰崩塌。2023 年我有了 AI 信仰,但做了一段时间,主要是因为没有资金支持,觉得烧不起,所以就放弃了。去年,别人跟我讲 AI,我都不想听。 但最近我重新找到了对 AI 的信仰,甚至信仰了 AGI,信仰了超级智能。这是一个难以想象的转变。我希望我对这份信仰能够这次持续更久一点。 个性化环境与上下文的重要性 那么,除了大模型之外,最重要的是什么?最重要的是你要有个性化的环境和 Context(上下文)。 以我的创业为例,我之前做了一个智能硬件,结果小米把价格拉到我们十分之一。我做大模型,结果所有大厂都进来了。你每次获得这种反馈之后,就让你放弃这种东西,或者你就不停地调整你的 Plan。 如果在美国,我做了一个大模型,我可能就被 Google 收购了,赚了很多钱。或者我做了一个硬件,我可能被苹果收购了,赚了很多钱。所以这种反馈一定会造就你这个人的行为是完全不一样的。同样一个创业者,同样的智商,在中国和美国不一样的创业环境下,得到的反馈不一样。最后你的行为,你的思考模式就会完全不一样。这就是我想说的,什么是个性化的环境,个性化的上下文。 上下文更多是一个历史的记录。 所以回到我之前讲的,在大模型时代,我是第一批站出来说要做大模型的,但可能也是第一批意识到这不是我的菜。然后,基本上没有全身心投入去做这件事,就是因为我不知道如何参与。 今年上半年时,我更觉得除了全世界那三四个巨头,其他公司都没有资格谈论模型,不要凑热闹,不要浪费你的生命。更不要浪费你的情绪在这里面。因为你根本就没有机会,那完全是在烧钱,而且事实上大模型本身这个东西,我觉得已经变得超级无趣,反正就是烧钱。我找不到切入点,我更不能理解绝大部分 AI 公司到底还有什么价值。 但是这一次,通过实践和重新审视,我觉得哪怕是高大上的 AGI,至少我自己觉得我好像又可以参与了。 所以,这就是 Agent 的 Planner 和 Executor 这个循环迭代的事情。如果你投入足够清晰,你能让智能产生智能,我认为你是可以参与整个 AGI 的过程的。 而大模型本身对你来说就是一个芯片一样。大家想象高通的芯片、苹果的手机,到上面的 TikTok。这是完全不一样的东西。最后反而是做 TikTok 的那家公司获得了最大的价值。 我发现,即使是雄心勃勃的 AGI 目标,也并非遥不可及。通过构建我所设想的递归 Agent 体系,所需资金可能并不庞大,更依赖于创新的智慧。我相信,只要拥有足够深入的思考和技术能力,即便不是行业巨头,也能参与到 AGI 的进程中。 出门问问的历程也印证了我的这些思考。我们自 2012 年起便成为中国首批 AI 公司,从语音助手起步,随后探索智能硬件(如 TicWatch、TicMirror)。虽然经历了市场竞争和技术不成熟的挑战,但我们始终走在最前沿。 2019 年后,我们转向软件,成为中国乃至全球首批 AIGC 软件公司之一。例如,魔音工坊曾为抖音等平台贡献了大量配音内容,我们还开发了奇妙元(数字人视频生成)等产品。 在中国这样的竞争环境中,一家科技公司就像一个不断迭代、自我修正的 Agent。 正如出门问问的「源代码」已与 2012 年初创时大相径庭,这是我们持续进化的体现。
今年,大模型基础能力再次实现飞跃,像 ChatGPT、DeepSeek、豆包这样的 AI 工具,正在成为越来越多职场人工作中的常用助手。 这些 AI 的能力确实强大,但也有个不小的门槛:要让它们「干活」,往往需要提前准备大量资料。换句话说,今天的 AI 更像是一个高智商的顾问,而从实际提效的角度看,我们更需要的,其实是一个始终待在身边、帮我记录信息,并在关键时刻给出提醒和反馈的「智能助理」。 出门问问正在尝试填补这一空白。4 月,公司首次公开了旗下全球首款 Agentic AI 硬件产品 TicNote,6 月 25 日,这款硬件也正式在国内发布。发布会上,出门问问创始人李志飞强调,这不只是录音笔、翻译器或语音助手,而是一个「随身的 AI 思考伙伴」。 在出门问问之前,国内外已有一些公司尝试将大模型与录音硬件结合,但它们大多仍将 AI 作为音频信息处理工具,主要用它整理会议记录、或者翻译等。TicNote 虽然具备类似能力,但它的定位并不止于此。通过持续记录用户的工作与生活信息,TicNote 实际上成为了一个 7×24 小时陪伴用户的「超级助理」,可以基于日常交流内容和大模型的推理能力,主动提供工作灵感与洞察。 作为极客公园的「老朋友」,我们见证了出门问问从创业到上市的完整历程,也经历了其在大模型方向上阶段性的战略收缩。而如今,出门问问选择以硬件的方式重新切入大模型赛道,这背后并非是简单的追风口或模仿他人,而是创始人李志飞多年在人机语音交互领域积累的沉淀——在看到已有路径被验证的同时,他也看到了更深的可能,并希望在这个方向上做出更好的产品。 01 一个随身的「AI 助理」 TicNote 的外观类似一块小巧的磁吸充电宝,机身厚度约为 3 毫米,可以整天通过磁吸方式贴附在手机背面,几乎不影响日常使用。 TicNote 丨来自:出门问问 与传统录音笔不同,TicNote 的卡片式设计从一开始就面向「全天候记录」的使用场景。用户可以轻松控制录音操作模式。 这种硬件形态并非出门问问首创,早前 Plaud Note 等产品也采用了类似设计。其优势在于,能够在教育、媒体、创意策划等需要大量语音记录的场景中,稳定长时间运行,并借助大模型能力提升转写、翻译和总结等后期处理的效率。 这一应用场景已获得一定程度的市场验证,但出门问问认为,卡片式录音硬件与大模型的结合,除了录音、处理等功能外,还蕴含更大的潜力。 除了转写和总结等基础功能外,TicNote 最大的特色是其内置的 AI Agent「Shadow AI」。支持实时对话、逻辑推理、知识整合和写作建议,能够更深入地理解用户的内容创作需求。无论是在工作、学习,还是灵感探索的过程中,它都能与用户保持对话,协助完成任务,成为一个贴身的智能助手。 Yolanda 是 TicNote 的内测用户之一。作为一名科技高管和中考孩子的母亲,她常常面临时间碎片化和信息冗杂的挑战,难以兼顾家庭与工作。TicNote 在很大程度上缓解了她的这一困境。 一次线上家长会与公司重要复盘会时间冲突,Yolanda 无法同时兼顾两端。于是,她用 TicNote「隐形」地全程记录了家长会内容,会后精准转录并自动提炼要点,整理成结构清晰的文字纪要和思维导图,让她无需回听便能全面掌握会议信息。 此外,Yolanda 还让孩子在每次辅导课时携带 TicNote。一个学期下来,TicNote 不仅记录了老师的重点内容,还帮助总结出孩子的知识薄弱环节。临近中考,孩子利用 TicNote 整理出老师讲授的「临场工具包」和「应急方法」,并结合薄弱点形成了清晰的复习资料。 从 Yolanda 的使用体验中可以看到,TicNote 不只是一个便携的录音工具,而是通过软硬件一体化的设计与大模型能力,逐步走向一个真正「理解你」的智能助理形态。而这样一款产品背后,是出门问问在语音技术与人机交互领域十年如一日的深耕。 02 一家为人机交互坚持了十年的公司 出门问问能够推出 TicNote,并非偶然。这款产品所代表的「软硬件一体 + AI 服务」路径,其实是出门问问十年来技术积累与产品探索的自然结果。 自 2012 年成立以来,出门问问就将人机语音交互作为核心方向,是国内最早一批践行「voice-first」理念的公司之一。早期推出的自研语音助手 App,主打中文语音识别与自然语言理解。随后几年,公司不断尝试将语音能力嵌入硬件,先后推出了智能手表 TicWatch、智能后视镜 TicMirror、翻译器 TicTranslator 等产品,持续探索语音与设备结合的应用可能。 这些产品在当时都走在行业前列,也积累了可观的技术经验,但语音交互的使用门槛、成本等挑战,始终制约了其成为主流操作方式。用户需要通过唤醒词和指令语言与设备沟通,交互成本高、容错率低,难以承担复杂任务。出门问问因此在一段时间内收缩硬件产品线,将重心转向 AI 能力的打磨。 但这条人机交互的进化之路,出门问问从未真正放弃。大模型时代的到来,为人机语音交互带来了新的契机。随着模型理解力和生成能力的提升,人机对话变得更加自然,越来越多用户开始习惯以对话的方式与 AI 沟通。语音,作为最接近人类表达习惯的交互方式,也因此重新获得价值,有望成为连接 AI 与现实世界的重要入口。 TicNote 正是在这样的背景下推出的。它不仅是一款用于记录的智能设备,更通过内置的 AI Agent「Shadow AI」,将用户每天听到的、说出的内容,持续整理为结构化的信息,构建出属于每个人的「个人知识库」。基于这个个性化知识库,大模型不仅能进行高效调用,还可以联网发散,挖掘信息在更高维度上的价值。 这种产品形态,是出门问问在语音识别、自然语言理解、终端设计等多维技术积累的集成体现。以 TicNote 的「闪聊」功能为例,用户可以在录音过程中随时发起语音对话,快速回顾前文内容、提取重点信息,适用于采访、会议等需要即时反馈的场景。这种「边录边问」的交互模式,正是出门问问十年来持续深耕语音技术的成果落地。 同时,TicNote 还具备自动化的项目管理能力。过去,即使是 AI 录音笔,也多局限于单一场景,录完之后进行一段内容的单次处理。而在 TicNote 的交互逻辑中,所有录音数据被统一沉淀为一个可持续扩展的知识库,用户可以跨场景、跨时间地随时调用、整理和继续对话。这种更贴近用户直觉的信息组织方式,也让 TicNote 不再只服务于专业用户,而具备了广泛的日常适用性。 更重要的是,这一次,出门问问不再试图用语音去「控制一个机器」,而是借助大模型能力,让语音成为构建知识的入口、推动思考的助力。 回头看,TicNote 并不是一次技术方向的转身,而更像是一次完成——它汇聚了出门问问十年走过的每一步,将分散在人机交互、硬件设计、AI 服务等多个层面的经验,集中在一个更适合这个时代的产品中。 03 未来每个人都需要一个「高维记忆仓」 当下,ADHD 已成为一个热门社会话题。「注意力难以集中」作为一种症候,正在变得越来越流行。除真正的 ADHD 患者之外,越来越多普通人也开始发现自己有类似症状,甚至开始「自我诊断」。 这和我们正在经历一场巨大的信息过载有很大关系。向前回顾,人类从未像今天这样,每天要接收、处理大量的信息,这些信息不只通过手机涌入我们的眼睛,也存在于生活中的每一个场景。我们每天接收的信息太多,思维的保质期却越来越短。 过去常见的一个认识是,相比体力劳动,脑力劳动是轻松的,坐办公室是少数人的「特权」,是人们的共同追求。但现在,越来越多人从事围绕信息展开的工作,却对此感到疲惫甚至厌倦。 我们越来越意识到,处理信息也是一种负载,会带来「劳损」。在当下,我们需要像使用机械工具替代体力劳动那样,为我们的大脑减负。而这样的设备,必然要具备感知、交互,以及辅助的思考和洞察能力,成为我们的「前置感官」和「辅助大脑」。 这可能就是 TicNote 以及出门问问未来的终极野望。 今天绝大部分 AI 产品都在为用户提供「单一场景切面」的信息,实际上,AI 的终极未来,应该要能够辅助用户管理整个记忆和思维,其中既包括信息、知识,也有回忆。当下 AI 业界已经提出了「人生流」的概念,被记录下来的人生流,其实就是我们的「记忆仓」。而 Agentic AI 能做的,就是把这个记忆仓进行升维,挖掘出我们自己平时都没有意识到的思考和洞察,最终帮我们减轻接受信息的负担,激发出更多灵感。 在可预见的未来,我们每个人都需要一个拥有完美记忆力且能辅助我们思考的 agent,来帮助我们重新组织接收到的信息,增加思考的维度。而 TicNote 内置的「顿悟时刻」功能,就已经初窥了这种未来。它能够基于用户保存的数据,为用户提供 AI 角度的「洞见」。 当下绝大多数 AI 助手产品都是基于泛意义上的公开语料训练的,很大程度上都在以「全知全能」作为训练和发展目标,但对用户来说,更多人需要的其实是一种「个性化的 AI」,这个 Agentic AI 应当更多了解我们的私人知识,提供与我们切身相关的信息,帮助我们构建个性化的体验。 对出门问问和李志飞来说,TicNote 既是过去十二年坚守技术理想的一次成功落地,也是一次面向 AIGC 未来的再次出发。他们等到了人机交互的新时代,AIGC 的新时代,TicNote 绝非一次产品上的「投机」,而是长期技术「恋爱脑」的一次修成正果。 去年 4 月,出门问问上市,成为国内 AIGC 第一股。对李志飞和他的团队来说,解决「钱」的问题从来都不是最重要的,更重要的是他们又可以把自己坚信的技术,打磨到最好的状态,然后带给这个世界。 现在,它再次迈出了坚实一步。
全新小米 AI 眼镜官宣:面向下一代的个人智能设备今天见 6 月 25 日消息,小米官微宣布,全新小米 AI 眼镜将于 26 日晚间 7 时的人车家全生态发布会上正式登场,官方海报称这是一款「面向下一代的个人智能设备」。 不久前,博主 @ 数码闲聊站 曾爆料:小米首款 AI 眼镜定位类似 Meta 雷朋,后者是目前全球范围卖得最好的 AI 眼镜。该博主称,小米算是国内第一个入局 AI 眼镜的大厂,品类春天要来了。他还提到,新平板是上车小米玄戒 O1 的最佳选择。 去年 11 月便有消息称,小米正计划推出新一代 AI 眼镜,已与歌尔股份合作,该产品预计于 2025 年 Q2 发布。知情人士表示,小米 AI 眼镜将「全面对标 Meta Ray-ban」,搭载 AI 功能、音频耳机模块、摄像头模块,并将以小米自有品牌形式发布。(来源:IT 之家 ) 英伟达 CEO 黄仁勋再减持股票,套现超过 1400 万美元 6 月 25 日消息,从外媒最新的报道来看,在去年大量减持之后,黄仁勋在近期又已开始减持,在近两个交易日已减持 10 万股。 英伟达提交给美国证券交易委员会的文件显示,在 6 月 20 日和 23 日,也就是上周五和本周一,黄仁勋分别是 4 次和 3 次出售公司股票,每个交易日均减持 5 万股。 英伟达提交的文件还显示,在上周五,黄仁勋减持股票是套现 7213155 美元,本周一套现 7190433 美元,两个交易日就减持了超过 1440 万美元的股票。 值得注意的是,黄仁勋上周五和本周一减持超过 1440 万美元的股票,只是他今年减持计划的一部分。 在今年 3 月 20 日提交的文件中,英伟达是披露黄仁勋计划在今年减持 600 万股的股票,目前还只减持了 10 万股,还有 590 万股待减持。按周二收盘时 147.9 美元的股价计算,590 万股的英伟达股票,价值超过 8.7 亿美元。算上已减持套现的 1440 万美元,就将超过 8.8 亿美元。(来源: TechWeb) 微信小游戏月活用户超 5 亿:在线时长同比增长 10%,300 余款单季流水超千万 6 月 25 日消息,在2025 微信小游戏开发者大会上,微信小游戏团队披露了最新生态图景:过去一年,微信小游戏月活跃用户已突破 5 亿,用户在线时长同比增长 10%,超八成用户由「下拉、社交、搜索」等启动。 在这 5 亿用户里,男性用户占比 55%,女性用户占比 45%;50% 来自一二线城市,45% 的用户年龄在 24-40 岁。这些用户,每月同时玩微信小游戏达 6 款,其在线时长较 2024 年上涨 10%。 据介绍,总数超过 40 万的小游戏开发者群体中,超八成是 30 人以下的小团队。目前已有近 70 款游戏达成百万以上 DAU(IT 之家注:日活跃用户),超 300 款游戏单季度流水超过千万元。 重度游戏 MAU 高达 1 亿,在年收入千万的游戏中,96 款运营超 3 年,55 款运营超 5 年;在年收入破亿的游戏中,13 款运营超 3 年,5 款运营超 5 年。(来源:IT 之家) Circle 跌落神坛 股价两日暴跌逾 24%,分析师称市场正进行理性修正 在上市不到三周后,稳定币发行商 Circle(CRCL.US) 的股价本周出现大幅回调,投资人热情迅速降温。周三收盘,Circle 股价大跌 10.79%,报 198.62 美元,连续两日累计下跌 24.6%。与此同时,Coinbase(COIN.US) 则走势强劲,连续两日上涨 15.5%,周三收盘报 355.37 美元,距离 2021 年创下的历史高点仅 0.6%。 加密投资机构 Castle Funds 首席投资官 Peter Eberle 表示,Circle 此次股价回调「并不意外」,此前涨幅过快、过高,「超出了基本面合理区间」。 Circle 的周一股价飙升,部分归因于与金融科技公司 Fiserv 宣布合作,将共同开发稳定币产品;再加上美国参议院上周通过一项稳定币监管法案,令市场对 USDC 等合规化稳定币的前景产生期待。 这项法案目前已送交众议院投票,若最终通过,有望推动美元挂钩稳定币的大规模应用。然而,尽管前景利好,投资人仍选择在短期内兑现获利离场,导致股价迅速回调。 Circle 发行的 USDC 是当前主流稳定币之一,而 Coinbase 作为其主要分销合作伙伴,从 USDC 运营中获得了可观收益。(来源:智通财经) 快手推出首部 AI 单元故事集《新世界加载中》,AI 微短剧开启 2.0 时代 6 月 25 日,由快手可灵 AI 与星芒短剧联合出品、异类 Outliers 团队制作的首部 AI 单元故事集《新世界加载中》在北京首映。该故事集采用了全新的故事呈现形态与「人+AI」共创的生产方式。 《新世界加载中》采用了单元剧的结构,像是 7 个不同次元的拼图,拼成一个团队对于 AI 叙事的最初幻想——共包含 7 部单元剧集,涵盖科幻、奇幻、荒诞喜剧、历史等多元题材,总时长达 180 分钟,该剧也是目前业内已知题材涉猎最广、叙事体量最大的 AIGC 剧集作品。(来源:极客公园) 曹操出行正式挂牌港交所,李书福再收获一家上市公司 6 月 25 日消息,曹操出行今日于港交所主板上市,股份代号为 02643。 曹操出行计划全球发售 4417.86 万股股份,其中香港发售股份为 441.79 万股,国际发售股份为 3976.07 万股,每股发售价为 41.94 港元。 此前,曹操出行公布已于本次 IPO 发行中引入 6 名基石投资者,包括梅赛德斯-奔驰、未来资产证券(香港)、无极资本、国轩高科(香港)、亿纬亚洲和速腾聚创。上述 6 位基石投资者将合计认购 2264.24 万股,约 9.52 亿港元。 招股书显示,曹操出行创立于 2015 年,是吉利控股集团布局「新能源汽车共享生态」的战略性投资业务。曹操出行 IPO 前,吉利创始人李书福通过 Ugo Investment Limited 间接持股 83.9%,是曹操出行的主要控制人。随着曹操出行上市,李书福也再收获一家上市企业。(来源: TechWeb) 消息称边缘 AI 芯片设计企业安霸 Ambarella 探索潜在出售可能 6 月 25 日消息,彭博社前一日报道称,边缘 AI 芯片设计企业安霸 Ambarella 正在考虑包括出售在内的各种选项,并通过银行与潜在买家建立了联系。 知情人士称,安霸公司内部正进行审查,交易不一定会达成。这一收购标的可能会吸引有意扩大汽车产品组合的其它芯片企业,一些私募股权公司也可能表现出兴趣。 安霸 Ambarella 的核心产品是用于边缘计算的智能视觉处理器,市场除传统的智能安防监控外也覆盖驾驶辅助系统、智能电子后视镜、行车记录仪、无人驾驶车辆等领域。 受这一消息影响,安霸的股价在周二交易日上涨了 20.61%,市值达到 26.38 亿美元(现汇率约合 189.21 亿元人民币)。(来源:IT 之家) 继成立电影工作室后,泡泡玛特疑跨界家电行业 6 月 25 日消息,因 Labubu 在全球声名大噪的泡泡玛特近期动作不断。 据媒体报道,近日,有网友发帖称泡泡玛特进军家电行业,招聘平台上泡泡玛特 HR 正在招聘家电行业相关人才。 国内某招聘平台信息显示,泡泡玛特确实正在招聘家电领域相关人才,包括小家电采购主管、家电品质专家、研发工程师等岗位,招聘要求上,部分岗位直接标明需要冰箱、咖啡机、早餐机、电水壶等相关经验。 就在上周,有媒体报道,泡泡玛特已正式成立电影工作室,将推出《LABUBU 与朋友们》动画剧集,后续还会拍大电影。全球顶流 LABUBU 也成为泡泡玛特旗下,第一个拥有个人影视作品的 IP。 天眼查信息显示,北京泡泡玛特文化创意有限公司已登记《LABUBU 与朋友们》动画剧集第一季剧本 V1 作品著作权。登记日期为 2025 年 3 月 18 日,创作完成日期为 2025 年 1 月 15 日。(来源: TechWeb) 全新梅赛德斯-AMG GT 四门纯电轿跑车「提前曝光」:大胆设计,亮橙配色 6 月 25 日消息,博主 cochespias1 在 Instagram 上提前晒出了一组全新梅赛德斯-AMG GT 四门轿跑车的实车图。 新车采用纯电动力,造型大胆新颖,前脸低趴锐利,中央是点亮的大尺寸格栅与梅赛德斯-奔驰标志,发动机盖上设有通风口,下方配备小型前唇扰流板,轮圈覆盖有空气动力学套件,车身通体则采用大胆的亮橙色。 新车车尾设计同样吸睛,三枚圆形 LED 尾灯分布左右,中间是 LED 显示屏,下方则是宽大的扩散器。侧面轮廓与 AMG GT63 四门轿跑颇为相似。 该车的内饰延续了外观的激进风格,配备双屏设计,中央触控屏向驾驶者略微倾斜,配备了 AMG One「同款」的异形方向盘。(来源:IT 之家) Solos 推 AirGo V2 AI 智能眼镜:1600 万摄像头成直播利器,售 299 美元 6 月 25 日消息,科技媒体 Android Central 报道称 Solos 公司推出了 AirGo A5 和 AirGo V2 两款 AI 智能眼镜,打造为日常可穿戴产品。 AirGo A5 外观与普通眼镜无异,但内置智能音频、语音控制功能以及「Hey Solos」唤醒词。该智能眼镜采用定向音频技术,即使在嘈杂环境中,也能清晰通话。 AirGo V2 在功能上更上一层楼,其配备了几乎隐形于镜框中的 1600 万像素摄像头,支持实时视频稳定直播,以及低功耗 Wi-Fi,实现了手机不离身的实时直播体验。V2 的摄像头还具备电子图像稳定功能,这一新特性在直播时尤为实用。 Solos 还推出了「SolosChat 3.0」,这是一种结合音频、视频和文本的 AI 理解技术,用户甚至可以切换 ChatGPT 和 Gemini 等不同 AI 模型。 两款眼镜都配备了可更换电池,以及可调节的鼻托和易于更换的镜框,以满足长时间佩戴和个性化需求。 AirGo A5 将于今年 8 月开启预售,售价 249 美元,而 V2 将在第四季度上市,售价 299 美元。两者都将在 Solos 官方网站上销售。(来源:IT 之家) 据传苹果 AirTag 2 将于今年 9 月或晚些时候推出,并配备新电池功能 苹果计划在今年 9 月或晚些时候发布 AirTag 2。如果是这样,那么升级后的这款用于跟踪物品的小配件可能会在不到三个月后的 iPhone 17 发布会上发布。报道称,iOS 18.6 测试版代码暗示即将发布的软件更新将与 AirTag 2 兼容。 报告称 AirTag 2 将提供低电量和极低电量警报。您已经可以在「查找我的」应用中查看当前 AirTag 的电池电量是否低,但现在似乎将有两级警报。 这一变化可能暗示 AirTag 2 将配备可充电电池。然而,彭博社的马克·古尔曼 (Mark Gurman) 在 2024 年 11 月的 Power On 新闻通讯中表示,下一代 AirTag「肯定不会」配备可充电电池。 在同一份新闻稿中,古尔曼表示,苹果计划在 2025 年中期左右发布 AirTag 2,听起来更像是在 6 月或 7 月。因此,如果该配件的发布时间是今年 9 月或晚些时候,那么消费者将不得不比预期等待更长时间。 据传,无论何时发布,AirTag 2 的物品追踪范围都将比现款 AirTag 延长 3 倍。(来源:cnBeta) 漫威电影宇宙第六阶段开篇之作《神奇四侠:初露锋芒》最终预告公布,确认引进中国内地 6 月 25 日消息,漫威影业发布了 MCU 第六阶段开篇之作《神奇四侠:初露锋芒》最终预告,并在早些时候发布了中文海报,宣布将引进中国内地,档期待定。 该影片由马特・沙克曼(代表作《旺达幻视》)执导,彼特・卡梅隆等编剧,佩德罗・帕斯卡等主演,将于 7 月 25 日在北美上映,总时长为 115 分钟。 该英雄团队号称漫威「第一家庭」,而本片是漫威电影宇宙再度推出聚焦神圣时间线之外故事的大银幕作品,也是反派行星吞噬者首次亮相漫威电影宇宙,延续「复古风」。 新版神奇四侠将回到过去:将一切设定在以 1960 年代为灵感的多元宇宙中的另一个复古未来主义分支,一个装饰艺术与科幻交相辉映的另一个 20 世纪中叶。 在成为神奇四侠之前,里德・理查兹、苏・斯托姆、本・格瑞姆和强尼・斯托姆只是四名极其聪明能干的宇航员,他们开始了一项危险的太空任务,并在此过程中意外获得了超能力。 他们面临迄今为止最艰巨的挑战,必须在英雄角色和家庭之间取得平衡,同时保卫地球,迎接名为「行星吞噬者」的贪婪宇宙神及其神秘的使者「银影侠」。而当行星吞噬者计划消灭整个星球及所有人时,没有人可以置身事外。(来源:IT 之家 )
YU7 发布前夕小米市值大涨 500 亿,雷军表示这次 YU7 上市信心更足 6 月 24 日,小米集团股价最高涨超 4.1%,一度涨至 57.2 港元/股。截至收盘,小米集团股价涨超 3.74%,收盘报 56.9 港元/股,较前一天市值增加超 500 亿港元。 消息面上,6 月 23 日,小米汽车宣布将于 6 月 26 日晚 7 点,正式发布小米首款 SUV 小米 YU7。雷军表示,「这次 YU7 上市,相比去年 SU7,我们的信心确实更足了。YU7 的用户留资量是 SU7 同期的 3 倍,预计 YU7 和 SU7 会一样火爆。」 此外,雷军否认「小米 YU7 是一款拉高版 SU7」说法,他表示:「虽然 YU7 和 SU7 都基于小米 Modena 平台开发的,但 YU7 项目有 90% 零部件都重新开发了。驾驶风格上,YU7 在运动风格基础上偏一些舒适。大家试驾后,就会感受到 YU7 和 SU7 不同的风格。」(来源:东方财经、界面新闻) 字节跳动辞退原豆包大模型负责人 6 月 24 日消息,近日字节跳动内部发布了一份企业纪律与职业道德委员会通报,通报疑似证实原豆包大模型大语言模型(LLM)团队负责人乔木因违反公司规定,被字节跳动辞退。财新向字节跳动内部人士确认,该消息属实。 通报原文称,Seed 某前员工与支持其团队的某前 HRBP(人力资源业务合作伙伴)存在亲密关系,属于利益冲突的禁止场景,如存在上下级关系、拥有共同直属上级、一方是另一方的 HRBP 等情形,「二人均未进行利益冲突申报并在接受调查过程中多次作虚假陈述,公司已将二人辞退,并扣罚全部年终奖。」 目前,举报信涉及的乔某和程某飞书状态显示均已离职。(来源:IT 之家) 曝微软将在 Xbox 游戏部门进行大规模裁员 6 月 24 日消息,彭博社刚刚报道称,微软计划在下周对 Xbox 游戏部门实施大规模裁员,影响范围甚至覆盖整个团队。微软拒绝就裁员计划置评。 彭博社表示,这将是过去 18 个月内 Xbox 部门的第四次大规模人员调整,此前该部门已在去年进行三轮裁员并关闭多家子公司。 报道指出,自 2023 年以 690 亿美元(IT 之家注:现汇率约合 4956.18 亿元人民币)收购动视暴雪后,微软管理层持续向 Xbox 硬件及软件业务施压,要求提升利润率。 此次裁员正值微软财年结束前夕(截至 6 月 30 日),公司惯常在此时进行组织架构调整。彭博社前几天也报道称微软计划下周裁减数千个岗位,主要集中在销售部门。(来源:IT 之家) Rokid 与蓝思科技联合开发的 AI+AR 眼镜正式量产 6 月 24 日,Rokid(灵伴科技)与蓝思科技联合研发的 AI+AR 眼镜 Rokid Glasses 在湘潭基地正式量产下线,标志着全球消费级 AR 设备迈入规模化商用新阶段。作为首款实现全产业链国产化的 AI+AR 终端,该产品凭借 25 万台全球预售订单及 49 克超轻量化设计引发行业关注。 此次合作中,Rokid 主导操作系统、空间计算等核心技术研发,蓝思科技独家供应精密组件并完成整机组装,双方通过垂直整合实现"硬件制造+软件生态"双向赋能。产品集成通义千问、DeepSeek 等多模态 AI 大模型,支持实时翻译、AI 识物、声纹支付等功能,性能媲美传统电子设备的同时,攻克了行业长期存在的减重与续航难题。(来源:经济观察网) 苹果 iOS / iPadOS 26 开发者预览版 Beta 2 发布:最薄 iPhone 17 Air 踪迹被发现 6 月 24 日,苹果向 iPhone 和 iPad 用户推送了 iOS / iPadOS 26 开发者预览版 Beta 2 更新(内部版本号:23A5276f),本次更新距离上次发布 Beta / RC 间隔 14 天。 作为 iPhone 默认经典铃声「Reflection」的替代,苹果在 iOS 26 中引入了全新的铃声,但目前尚未官方命名,仅采用「Alt 1」占位符。经典的 Reflection 依然是默认铃声,用户需要手动设置,才能切换到新版铃声上。 此外,科技媒体 MacWorld 挖掘 iOS 26 Beta 2 更新,发现了「420x912@3x」分辨率的 clownfish 壁纸,也就是 1260 x 2736,该分辨率并不匹配现有 iPhone 机型,因此推测为 iPhone 17 Air。(来源:IT 之家) vivo 报案自媒体泄露手机产品信息,将依法追究泄密者的法律责任 6 月 24 日消息,今日 vivo 法务部官微发文称,某自媒体公开泄露未发布手机产品涉密信息,已报案。 全文如下:近日,某自媒体公开泄露我司尚未发布的某手机产品涉密信息,对我司产品发布造成不良影响。针对上述泄密行为,我们已完成取证工作,并第一时间向公安机关报案,后续将依法追究泄密者的法律责任。 在此,我们严正提醒,网络不是法外之地,vivo 对于任何侵犯商业秘密的行为始终坚持零容忍态度,我们将坚决运用法律手段维护自身合法权益。同时,我们呼吁所有合作伙伴、媒体机构及行业相关从业者共同维护健康、公正的市场秩序。(来源:新浪科技) 苹果直营渠道首次参与国补,仅限北京上海 在我国手机、平板等数码产品国补实施近半年时间后,苹果官网 Apple Store 也直接支持了国家补贴。 移动产品类按照 15% 的最高比例补贴,单产品最高补贴金额为 500 元,商品价格需低于 6000 元。电脑类按照 20% 的最高比例补贴,单产品最高补贴金额为 2000 元。 需要注意的是,当前仅支持北京/上海两个城市,其中北京收货地址可在线上官网享国补优惠(通过京通小程序领取补贴优惠券),上海可在线下零售店享国补优惠。(来源:快科技) 美国加州法院裁定:使用版权内容训练 AI 属合法行为 6 月 25 日消息,科技媒体 AppleInsider 昨日(6 月 24 日)发布博文,报道称美国加州北区地方法院的裁决允许使用受版权保护的作品来训练人工智能模型,这一决定对创意产业构成了极大威胁。该裁决支持被告 Anthropic 公司使用盗版材料训练其 AI 模型,引发创作者权益争议。 IT 之家援引博文介绍,内容创作者和艺术家们多年来饱受 AI 公司未经许可抓取其网站内容、扫描书籍以训练大型语言模型(LLM)之苦。这些数据随后被用于生成式 AI 和其他机器学习任务,并由抓取公司商业化,原作者或内容提供者却得不到任何补偿。 为此 Andrea Bartz、Charles Graeber 和 Kirk Wallace Johnson 于 2024 年向加州北区地方法院提交诉讼,指控 Anthropic 公司使用盗版材料训练其 Claude AI 模型。 法官 William Alsup 支持了双方的部分诉求,但最终倾向于支持 Anthropic 和 AI 抓取公司,认为用于训练特定大语言模型的副本属于合理使用。(来源:IT 之家) 小米 MIX Flip 2 小折叠手机亮相:三面等深微曲屏,骁龙 8 至尊版 + 5165mAh 电池 6 月 24 日消息,小米将于 6 月 26 日晚 7 点举行人车家全生态发布会,届时将推出的新品包括小米 MIX Flip 2 小折叠手机,今天官方公布了该机的外观和重要配置信息。 据官方介绍,小米 MIX Flip 2 采用三面等深微曲屏,金属磨砂中框;使用全新转轴结构,官方称「屏幕平整得令人惊艳」。图片显示,小米 MIX Flip 2 提供黑色、金色、紫色和青色四种配色。 小米 MIX Flip 2 搭载骁龙 8 至尊版处理器,内置 5165mAh 小米金沙江电池。此外,新机采用 4.01 英寸多功能大外屏,还有徕卡光学加持,折叠旗舰影像的独特玩法。(来源:IT 之家) 大疆运载新品官宣 6 月 30 日发布 6 月 24 日消息,大疆运载 2025 新品发布会官宣将于 6 月 30 日 15:00 举行,但并未透露这款新品的身份。 大疆运载上一款产品是 2023 年 8 月发布的 DJI FlyCart 30,这也是其首款民用运载无人机,采用 4 轴 8 桨多旋翼构型,双电模式下最大载重 30 公斤、满载最大航程 16 公里,125000 元起。(来源:IT 之家) 2025 新财富 500 创富榜发布:张一鸣问鼎首富 梁文锋杀进前十 6 月 24 日,2025 年新财富 500 创富榜发布,张一鸣以 4815.7 亿元持股估值首次登顶首富,主要得益于持有的字节跳动股权。字节跳动去年营收达 1550 亿美元,成为国内营收最大的互联网科技企业。梁文锋凭借量化基金和人工智能公司 DeepSeek,首次上榜即进入前十,持股估值达 1846 亿元。榜单前十中,杭州占四席,北京、广东各两席,上海、福建各一席。整体上榜者财富同比上涨 11%,显示中国经济稳中有进,新一轮创富潮正在形成。(来源:Readhub)
作者|一涛 编辑|靖宇 2025 年 3 月初的一天,明超平跟公司的几个同事用 Cursor「手搓」了一个 Demo。他们从晚上 10 点开始做,到凌晨一两点这个 Demo 就上线了。 在完全没有推广的情况下,这个手搓的 Demo 就收到了 1000 多个用户上传的项目;到那天结束时,这个数字上涨到了接近 4000 个;在 48 小时内,平台用户访问量就飙升到了 100 万。 这个 Demo 就是最近爆火的 Vibe Coding 社区——YouWare。 要想明白 YouWare 是做什么的,首先就要理解「Vibe Coding」和「社区」这两个词。 「Vibe Coding」是由前特斯拉 AI 总监 安德烈·卡帕斯(Andrej Karpathy)在 2025 年提出的编程范式。它指的是开发者用自然语言描述他们想要的功能,然后让 AI 来完成编程工作,大幅度降低编程的门槛。正如它的名字「氛围编程」一样,Vibe Coding 可以让非程序员凭感觉,就能实现编码。具体到 YouWare 这个产品上,它提供的能力,就是让用户用自然语言,就能写出一个美观的网页。并且可以一键部署成网页应用,分享给别人。 「社区」就更好理解了,YouWare 的命名方式显然借鉴了 YouTube。就像 YouTube 是一个视频分享社区一样,YouWare 希望更多创作者可以通过 YouWare 的能力,在这里分享他们的网页项目。 简单理解的话,可以把 YouWare 看成是 AI 时代的 YouTube,只是用户创作的介质从视频变成了网页。 01 AI 生成界的「YouTube」 和任何 AI 工具一样,打开 YouWare,首先是一个对话框。用户可以直接在这里输入提示词(Create),生成网页。除此以外,对于更专业的用户,YouWare 也支持上传(Upload)或者复制代码(Paste Code)。 我首先尝试了 YouWare 推荐的提示词——「帮我创建一个简历网站」。从思考过程可以看到,YouWare 分别从设计风格(干净、现代)、展示内容(关于、技能、项目、联系方式)、多设备访问、动画效果等方面构建了这个网站的框架。 由于我没有提供详细的个人信息,YouWare 虚构了一个名叫 John Doe、住在纽约的网页开发者。仅从简历网站的角度来说,YouWare 生成的网页已经非常成熟、可用。 除此以外,YouWare 还提供了 Boost 功能,类似于 Instagram 的滤镜,它可以一键美化你的网页。在简历网页这个案例中,Boost 带来的最明显的变化是增加了暗黑主题。 如果想要修改网页,YouWare 提供了「选择」功能,可以定向选择某个编辑元素修改,大大提高了 AI 生成内容的可控性。 同时,YouWare 还提供了历史版本回溯功能,可以回到任意一个修改过的版本。「选择修改」加上「历史回溯」,使得 YouWare 可以真正成为一个可用的生产工具。 不便之处在于,我无法直接编辑网页元素。假如我要将网站中虚构的文本替换成我本人的信息,甚至定向修改某个元素的样式、颜色等等,都需要重新输入提示词、重新经历一遍生成过程,耗费了很多修改时间。 完成生成后,最后一步是「发布」。YouWare 会生成一个链接(https://www.youware.com/project/ffroqgcdv3?enter_from=personal_center),然后你就可以和其他人分享你的网页了。 对分享的洞察是 YouWare 最初的起点。明超平在 2025 年 3 月观察到,大量用户用 Grok 3 编写游戏后,只能通过录屏分享非交互式内容,导致创意表达受限。这个洞察促使了 YouWare 第一个版本的诞生。 YouWare 简化了部署网页的流程。传统上,构建一个网站需要把代码推送到 Git 仓库,再在 Vercel/Netlify 等平台上部署服务器、托管网站。YouWare 则简化了域名和服务器的设置,提供了一站式的解决方案,只需粘贴你的代码或上传文件,就能在几秒钟内生成一个链接。 通过分享形成的社区是 YouWare 的精髓所在。 你可以像刷 Instagram 一样在流行趋势中闲逛;也能通过某个作品下方的随机按钮链接到其它作品。YouWare 官网目前已经上线了:游戏、效率工具、教育、演示、项目展示页、仪表盘和作品集等多个创意板块。如果创作者开放了权限的话,其他用户还可以使用「Remix」功能,修改已有的网页,站在前人的肩膀上叠加自己的创意,让作品长出新的枝桠。 有人复刻了红白机上的《超级玛丽》(https://www.youware.com/project/pq3iq5uvbu?enter_from=home),使用方向键和空格可以直接操作(但我没能通关)。 日本网友 Elio 说他家附近只有罗森,这促使他研究起了日本便利店的布局,并制作了这张全日本的便利店地图。(https://www.youware.com/project/w3zrislywi?enter_from=personal_center)。 YouWare 还提供了丰富的 MCP 工具,可以方便地接入 Figma、Notion、Github、YouTube 等,让更专业的创作者可以复用以往的素材创作。用户 us.sidm 就创作了一个宝马 i8 的 3D 模型(https://www.youware.com/project/bm9qq2yj00?enter_from=personal_center),目前访问量已经高达 11.6k。 鉴于 YouWare 社区正在搞复古网页设计大赛(奖金最高 1000 美元),我也让 YouWare 做了一个 win98 版本的极客公园官网(https://www.youware.com/project/1yxvncqckb)。生成的效果非常还原 20 多年前的设计,简单来说就是「有那味了」。 02 正在向生产力无限迈进的 Agent 总体使用下来,我认为 YouWare 已经达到了非常可用的状态。 首先 YouWare 具备即时生成一个符合主流水准网页的能力,极大降低了网页编程的门槛,给创作者提供了基本的创作能力。 同时,YouWare 把部署网页做成了亚马逊的「一键购物」,非常方便就能生成一个可分享的网址。这是一个看起来微不足道、但是对于创作者生态来说至关重要的产品层面的创新。毕竟只有被看见,创作者才会有动力继续创作。 以往用主流的编程工具(Claude、ChatGPT)生成一个网页之后,往往还要经历复杂的服务器部署才能让这个作品被看见。这对于专业的 Coder 来说或许是一件简单的事,但是已经可以劝退绝大多数非专业的创作者。YouWare 抹平了这道障碍。 有一个让我印象深刻的点是,在整个使用 YouWare 的过程中,我没有看到一行代码,跟主流编程软件完全不同。这是产品层面上的克制——很显然 YouWare 面向的并非专业用户,而是所有人。这有些类似于 Twitter 一开始限制推文长度只能是 140 字符一样,看似是限制,实际上更加激发了非专业文字创作者的表达欲。 上一个 UGC 时代的互联网产品显然给了 YouWare 很多启发。这一点从 YouWare 的 Slogan 就可以看出——从一开始的「Vibe Coder's Instagram」到现在的「Not YouTube, YouWare」。明超平在跟晚点的访谈中也提到了 Instagram 给了他很大启发: 「它(Instagram)抓住了两个大信号:一是在正确的时间承载住了手机摄像头普及、「手机摄影师」诞生的浪潮。过去,摄影师是用尼康、索尼按快门的人,而当手机摄像头从 400 万像素到 800 万像素,诞生了一拨用手机拍照的新人群,全球每天的新照片多了百倍、千倍。 二是手机拍照刚产生时,噪点多、色彩偏差大,Instagram 用「滤镜」功能,让照片更好看,又给了大家一个分享照片的社区——这都在促使人们更多拍照和分享,让手机摄影师变得更多。」 另一个让我印象深刻的点是,YouWare 可以精准点选局部修改,并且可以回溯历史版本,这极大增强了 YouWare 的「工业能力」。工业界有一句很著名的话叫作「精度即文明」。18 世纪,约翰・威尔金森发明精密镗床,将蒸汽机汽缸加工误差从数毫米压缩至 0.1 毫米,使热效率提升数倍,直接推动工业革命爆发。此后,公差概念成为制造业的核心逻辑——从福特 T 型车的标准化零件到苹果 iPhone 的纳米级芯片,精度的每一次突破都重塑了人类的生产方式与生活图景。正如英国作家西蒙・温切斯特(Simon Winchester)在《追求精确》中所言:「精确不仅定义了现代世界,更塑造了现代世界。」 目前 AIGC 还没有达到工业化的要求,因为工业化的能力就是生产力,就是指向精准、稳定。而幻觉问题还是一个难以规避的问题,AI 生成的内容总是呈现不稳定、不可控、不精准的特质。如果这一点在通用大模型身上还尚可忍受的话,对于一个更垂直的 Agent、一个面向生产力的创作工具而言,就很难忍受了。「精准点选局部修改」和「回溯历史版本」同样是产品设计而非技术能力的创新,它在一定程度上提高了 YouWare 的精度,使得它变得可用。 当然我对 YouWare 的修改能力还是有一些不满。用户目前还无法像修改 Photoshop 文件一样直接编辑网页元素,修改需要反复经历「提示词-等待-AI 生成」的过程,非常考验用户的耐心。 当然,YouWare 还是一个发布不久的新产品,期待它可以变得更好用。 *头图来源:YouWare 本文为极客公园原创文章,转载请联系极客君微信 geekparkGO 极客一问 你想用 YouWare 做一个什么出来?
雷军:没有计划造油车 6 月 23 日消息,今日有网友在小米创办人、董事长兼 CEO 雷军的评论区询问:「雷总,咱啥时候组建车队?」,雷军回复称:「这是油车的比赛。我们没有计划造油车。」 在该条博文中,雷军祝贺 ROWE 车队 98 号 BMW M4 GT3 EVO,从第 17 位发车勇夺今年纽博格林 24 小时耐力赛总冠军,这也是 BMW M 品牌第 21 次夺冠。 小米 YU7 将于 6 月 26 日正式发布上市,一共有 9 种颜色,有跑车色系、时尚色系、豪华色系和经典色系。小米汽车今天早些时候还宣布,小米 YU7 将全系标配激光雷达、天际屏全景显示、后排 135° 电动座椅、800V 碳化硅高压平台、700TOPS 辅助驾驶算力、连续可变阻尼减振器等。(来源:CnBeta) 微信悄悄修改语音发送界面,网友喊「丑」登顶微博热搜 6 月 23 日消息,今日晚间,「微信语音 丑」话题登顶微博热搜,部分网友吐槽微信最新修改的语音发送界面。 最新的微信语音发送界面将左右两个圆形按钮改成了长条形,并将「转文字 发送」文案修改为「滑到这里 转文字」,文字「松开 发送」也放置到了按钮中。 ▲ 新版微信语音发送界面 从界面对比来看,新版微信语音发送界面增加了对滑动操作的文字引导,并提高了两个按钮的操作易用性,预计是为了中老年用户考量。(来源:IT 之家) 雷军:周四的小米人车家全生态发布会将推出「面向下一个时代的个人智能设备」 6 月 23 日消息,小米创办人、董事长兼 CEO 雷军今日宣布,6 月 26 日的小米人车家全生态发布会上,除了小米 YU7、小折叠手机 Xiaomi Flip2、搭载玄戒 O1 旗舰芯片的小米平板 7S Pro,还将有一款「面向下一个时代的个人智能设备」。他表示,这次新品比较多,时间比较长,请大家提前做好准备。 据 IT 之家此前报道,今日早些时候,小米宣布首款 SUV——YU7、小米 MIX Flip 2 小折叠旗舰手机、小米平板 7S Pro「高效移动生产力平板」以及面向下一代的个人智能设备将于 6 月 26 日 19 时正式发布。(来源:IT 之家) 阿里巴巴:即日起饿了么、飞猪合并入阿里中国电商事业群 6 月 23 日消息,据金融界报道,今日阿里巴巴集团 CEO 吴泳铭发布全员邮件,宣布即日起,饿了么、飞猪合并入阿里中国电商事业群。范禹继续担任饿了么董事长兼 CEO,向蒋凡汇报。南天继续担任飞猪 CEO,向蒋凡汇报。饿了么飞猪继续保持公司化管理模式,业务决策执行上与中国电商事业群集中目标、统一作战。 IT 之家注意到,吴泳铭在全员邮件中称:「这是我们从电商平台走向大消费平台的战略升级。未来,我们将更多从用户角度出发优化整合业务模式和组织形态,为用户创造更丰富优质的生活消费体验。」 这意味着,阿里将进一步整合集团业务。飞猪、饿了么、淘天在各自领域有多年的能力和资源积淀,会师之后,将会发挥各自优势和长项,构建更加完整的大消费服务体系。 (来源:CnBeta) 李想、雷军互发「贺电」,分别祝小米 YU7、理想 i8 大卖 6 月 23 日消息,今天中午,雷军在微博上介绍了小米首款 SUV「为何不是最热门的 6 座车」。随后,理想汽车 CEO 李想转发这则微博并评论:「预祝小米 YU7 大卖!雷总提到 6 座 SUV,即将在 7 月下旬上市的理想 i8 就是一款三排六座纯电 SUV。我们的初心是「理想创造移动的家,用户创造幸福的家」,相对小米 YU7 的运动取向,理想 i8 是一款家庭取向的 SUV,更多照顾全家人的出行体验。」 随后在今天下午,雷军转发了李想的「贺电」,并回复道:「谢谢李想同学的祝福,也预祝 i8 大卖!」 小米官微今日宣布,小米首款 SUV——YU7、小米 MIX Flip 2 小折叠旗舰手机、小米平板 7S Pro「高效移动生产力平板」以及面向下一代的个人智能设备将于 6 月 26 日 19 时正式发布。 消息称特斯拉 Robotaxi 无人驾驶出租车潜在安全问题引发美国监管部门调查 6 月 24 日消息,特斯拉旗下 Robotaxi 无人驾驶出租车已于得克萨斯州奥斯汀正式上线,尽管特斯拉希望外界相信其系统「完美无瑕」,但越来越多的视频证据正逐渐推翻这一说法。据彭博社报道,美国国家公路交通安全管理局(NHTSA)已将相关行为视为严重问题,并已联系特斯拉进行调查。 参考 IT 之家昨日报道,一位名叫罗布・莫尔(Rob Maurer)的播客博主上传了他乘坐特斯拉 Robotaxi 的整个行程视频。其中一段 12 秒的视频片段在社交媒体上传播,该片段显示车辆多次试图驶入错误车道,好在这种潜在危险行为被及时纠正,但具体是被特斯拉的远程操作员还是车辆的 FSD 系统纠正的目前还是未知数。 此外,另一名博主 Sawyer Merritt 拍摄视频也显示,一辆 Robotaxi 出租车在限速 30 英里 / 小时的路段中实际以 35 英里 / 小时超速行驶。 当前,特斯拉正在尝试通过一系列安全措施来避免车辆系统潜在的安全问题。该公司目前安排了一名员工坐在相应车辆前排乘客座位上,该员工能够通过专为机器人出租车设计的用户界面轻松操作「紧急停车」和「靠边停车」指令。此外,每一趟 Robotaxi 行程都将由一组远程操作员进行实时监控,以便在紧急情况下接管车辆。 古尔曼称「真全面屏」iPhone 后年问世:分两步走,明年先缩小灵动岛 ,指出认为中国正在机器人竞赛中占据优势,领先于美国。 6 月 23 日消息,彭博社记者马克・古尔曼在昨天发布的《Power On》时事通讯中透露,苹果计划在明年推出的新款 iPhone 上缩小灵动岛的尺寸。他预计到 2027 年,苹果将发布一款焕然一新的二十周年纪念版 iPhone。 根据古尔曼此前的说法,这款纪念机型将配备弧形玻璃边缘、超窄边框和真正的无打孔全面屏。 上月,《The Information》记者 Wayne Ma 报道称,明年的 iPhone 18 Pro 将采用屏下 Face ID,仅在屏幕左上角保留一个小孔用于前置摄像头,不再有药丸形开孔。因此,对于古尔曼所说的「明年仍将保留一个缩小版灵动岛」,外界尚不清楚其具体含义。 综合目前的消息来看,第一款配备屏下 Face ID 和屏下前置摄像头的「真全面屏」iPhone,可能会在 2027 年亮相。 博主 @ 数码闲聊站 本月早些时候也透露,苹果「基本确定」2027 年推出(搭载)屏下摄像头技术(的机型)。安卓阵营目前则已经开启「超前瞻」预研,「也想同期上」。他表示,若进展顺利,最快同年年底迭代新平台时推出屏下摄像头机型。(来源:IT 之家) 腾讯视频「鹅厂 2025 大剧片单」公布:刘慈欣《三体・黑暗森林》《三体:大史》《乡村教师》在列 6 月 23 日消息,腾讯视频今日公布了「鹅厂 2025 大剧片单」,6 大篇章共 110+ 剧集亮相。 其中,腾讯视频 X 三体宇宙新作《三体:大史》双人概念海报首发,大史与汪淼再度联手出击拯救世界。该剧集由刘慈欣监制,《三体》剧集导演杨磊执导,于和伟、张鲁一主演,将在腾讯视频、极光 TV 播出。 据此前报道,《三体:大史》作为《三体》的番外剧,已出现在 2023 年 12 月电视剧备案公示,共有 12 集。 此外,片单中还预告了《三体・黑暗森林》,该剧改编自刘慈欣的科幻小说《三体:黑暗森林》,目前已备案《三体・黑暗森林-上》,预计 26 集,制作周期 20 个月,将于 7 月开拍。 索尼确认已启动 PS6 游戏机开发工作,有望 2028 年前后发布 6 月 24 日消息,索尼互娱(Sony Interactive Entertainment)首席执行官西野秀明(Hideaki Nishino)确认,PlayStation 6(PS6)游戏机的开发工作已经正式启动,并且已经成为公司当前的「核心重点项目」,尽管目前该机的具体发布时间尚未确定。 作为比较,现款索尼 PS5 游戏机仍处于生命周期中段,该机于 2020 年正式发售,截至目前全球销量已超过 6500 万台。然而随着市场逐渐饱和,系列机型销量增速放缓已是可以预见的趋势,这也促使索尼加快推进下一代主机的布局。 目前,关于 PlayStation 6 的硬件规格尚无具体信息。不过在采访中,西野明确表示,PS6 不会放弃本地硬件运行的传统模式,这是因为「索尼无法完全掌控用户端到端的网络连接质量」,这也意味着 PS6 将仍以「本地运行游戏」为核心。(来源:CnBeta) 边看网球边猜胜率,IBM 为温网推出 AI 聊天助手及结果预测功能 6 月 23 日消息,全英草地网球俱乐部和 IBM 今日宣布,将在 2025 年温布尔登网球锦标赛(此后简称「温网」)期间为球迷带来全新的增强型 AI 数字体验。 这包括首次亮相的交互式 AI 助手「Match Chat」,可在单打比赛期间实时回答球迷问题。 「Likelihood to Win」预测工具也得到了增强,为球迷在每场比赛中提供动态变化的获胜概率。 上述解决方案结合了大量比赛数据以及 AI 和数据平台 IBM watsonx 的生成式 AI 技术,旨在助力球迷以更加创新、定制化的方式参与为期两周的温网赛事。 球迷可通过温网 App 和官方网站体验 Match Chat 功能,使用预置的提示词(prompt)或自主提问进行互动,例如,「谁在比赛中转换了更多的破发点?」或「谁在比赛中表现更好?」。系统将提供 AI 生成的实时反馈,包括比赛分析和洞察,为球迷带来更丰富的观赛体验。(来源:IT 之家)
马斯克念叨了 10 年的自动驾驶,特斯拉的 Robotaxi 终于上路了。 当地时间 6 月 22 日,特斯拉的 Robotaxi 在美国得州首府奥斯汀市正式开启服务。首批 Robotaxi 的投放量大约在 10-20 辆,初期将优先邀请一批投资人和社媒 KOL 参与体验。 由于去年发布的双门「真·无人车」Cybercab 尚未正式量产,首批 Robotaxi 先由现役版量产 Model Y 提供服务。这意味着目前的 Robotaxi 仍然配备了方向盘和加速、制动踏板,并且每辆车还在副驾驶配备了一位安全员,运营范围也有一些地理限制。 马斯克在 X 平台表示,首批乘客每次行程的固定费用为 4.20 美元,但这更像是个「尝鲜价」,长期费用未知。目前在奥斯汀,谷歌旗下的自动驾驶公司 Waymo 和 Uber 合作运营的 Robotaxi 也已经投入市场。根据 TechCrunch 此前报道,在 4.3-9.3 公里的区间里,Waymo 每公里的费用为 3.50 美元。 科技博主分享Robotaxi出行体验:16公里,22分钟 | 图片来源:X 和目前市面上主流的 Robotaxi 相比,特斯拉的解题思路有两个核心的区别: 第一,相比目前 Waymo、萝卜快跑等主流 Robotaxi 方案,特斯拉首次采用「量产车型」+FSD 软件直接进行无人车运营,无须加装复杂的感知硬件以及重新开发新的软件。这让硬件和研发成本都有望显著降低。 第二,特斯拉试图通过首批 Robotaxi 的运营来优先吸引更多「车主」(而不是「用户」)。如果这个模式可以跑通,那么特斯拉无须先自己掏钱买车再投放给市场,而是有望直接从传统国营出租车公司转型成滴滴和 Uber 这样的出行平台。 所以,尽管在形态上还有些「遗憾」,但这并不影响特斯拉 Robotaxi 依然是整个自动驾驶和无人车行业里最受关注的事件。 目前,特斯拉市值为 1.01 万亿美元,市盈率为 177 倍,远超传统车企。近年来,马斯克在不同场合里多次强调特斯拉「已经从汽车公司转为了 AI 公司」,Robotaxi 推向市场是一次重要的能力和产品展示。著名投资机构摩根士丹利的模型显示,特斯拉未来估值中,有 60-80% 来自对 Robotaxi 和 FSD 业务的期待。 有方向盘和安全员的「无人车」 大部分人对特斯拉 Robotaxi 的期待,是去年 10 月马斯克在好莱坞华纳工作室发布的那款「无人车」Cybercab。那款车完全取消了方向和加速制动踏板的设计,采用双门两座的设计,前排设置了一块屏幕作为人机交互的核心方式。 所以,大部分人可能会掉入马斯克的这次话术陷阱,把 Cybercab 和 Robotaxi 进行了潜意识里的强关联。但其实 Cybercab 压根就还没开始量产。而本次在奥斯汀上线的 Robotaxi,由 2025 款特斯拉 Model Y 提供服务。这款车搭载特斯拉 HW4.0(也叫 AI4)的智能驾驶软硬件方案,采取纯视觉感知,全车配置 8 个摄像头以及特斯拉自研芯片,可形成 360°环绕视野。 从当前释出的试乘体验视频中,可以看到每辆 Robotaxi 都在副驾驶位置配备了一位随车安全员。根据美国媒体报道,特斯拉也为 Robotaxi 设立了电子围栏,收到邀请的乘客才可以预约车辆,并且目前只在奥斯汀南部的一小部分区域里提供服务。 特斯拉 Robotaxi 的买家秀(上)和卖家秀(下) | 图片来源:X 为什么前后车型会出现这样的变化? 首先,从技术的角度来看,Cybercab 距离大范围量产还需要迈过一系列难关。 按照马斯克此前在业绩沟通会上透露的时间,它预计在 2026 年年底前才能正式上市。另外按照现行法规,这类没有方向盘和踏板的车,上市前需要经过单独的豁免审批,且每年最多只能制造 2500 台。 其次,从营销角度来看,Cybercab 原本更多承载的就是一种展示功能。 就像小米用原型车和量产版 SU7 Ultra 分别在纽北刷出最速圈一样。小米不需要大众消费者搞懂原型车、量产车这些概念中的细微区别,也不是要把小米的车只卖给愿意去跑赛道的用户,而是通过这件事强调品牌和产品的能力:小米的电车有驾驶感,而且比保时捷还快。 Cybercab 之于特斯拉的意义,就是证明 FSD 软件可以在任何地点自己驾驶。而且,没有方向盘和踏板,其实就代表着「全球都能开」的隐喻。 传统车企习惯用速度打造品牌感,但超跑往往不是最走量的车型。Cybercab 是这个时代特斯拉作为智能汽车品牌的「超跑」——尽管它只有 2.5 万美元,但支撑起了特斯拉六成以上的超高市值。 所以,如果未来某天马斯克告诉大家 Cybercab 并不会大量制造,也请不要意外,因为在马斯克的计划里,它的作用也许压根就不是走量。 在 Model Y 的侧门上有显著的 Robotaxi 字样 | 图片来源:X Robotaxi:一门需要找到新解题思路的生意 这一次,特斯拉只是在奥斯汀的一小部分区域投放了 10-20 辆 Robotaxi。看起来规模不大,但为什么还是可以成为科技圈的头条新闻呢? 一大原因是,这或许可以为现在特别烧钱的 Robotaxi 生意,提供一种新的解题思路。 2024年,全美市场份额最大的Robotaxi玩家 Waymo 一共提供了超400万次服务,车队规模约1500台,营收5000-7000万美元,但亏损达到了恐怖的15亿美元。 营收和投入根本不成正比,这是目前 Robotaxi 这门生意最大的痛点。 营收受制于目前的车队规模和市场需求,而投入主要分为硬件和软件两个部分:软件主要是自动驾驶功能的研发,而硬件则包括车辆购买以及硬件加装。 和特斯拉不同,现在市面上量产的主流 Robotaxi 方案是通过在量产车上加装感知硬件,实现功能和安全的冗余。而这套冗余硬件,往往都是由激光雷达+大算力智驾芯片构成,光是这些硬件的 BOM 成本就可以达到数万甚至超过十万人民币。 Waymo 现役车型,车辆顶端搭载一套自动驾驶安全系统 | 图片来源:Waymo 其次,现在的 Robotaxi 公司,其实更像传统公交公司。需要先自己花钱买车,再雇「人」开车(也就是研发软件,以及安全员、运营人员成本),最后才是推向市场。 很显然,这套流程有些过于冗余了。用「传统模式」搞 Robotaxi(并非传统,这本来是一个新技术),要投入的地方实在是太多:既要像 AI 公司一样投研发,又要像硬件公司一样买设备,可能在运营的时候还要低价补贴消费者。 而马斯克理想中的无人车生意,不是靠自己造出租车来完成,而是用车主的车为特斯拉赚钱。 马斯克曾经说过,未来它希望特斯拉的无人出租车车队达到全球 100 万的规模。 按照每辆车 2.5 万美元的成本,这些车只是硬件制造成本就高达 250 亿美元,比特斯拉 2024 年全年净利润的 3 倍还多。显然,如果先大量生产 Cybercab 再进行市场投放,那么即便在全球各个市场的法规审批都可以一路绿灯,这个项目也是一笔巨大投入。 所以,其实这次的 10 辆 Robotaxi 本质也可理解成「试驾车」。这是又一轮的营销活动:去年的 Cybercab 是 demo 演示,这次的 10 辆车要证明特斯拉 FSD 软件的量产落地能力。 美国网友分享特斯拉 Robotaxi ,纯视觉技术路线应对夜间环境 | 图片来源:X 马斯克的真正目标,是证明量产版 Model Y 和 Model 3 具备直接成为 Robotaxi 的能力。如果量产版车主愿意加入特斯拉 Robotaxi 车队,那么特斯拉在无人车这门生意里,就可以从自己买车的「传统公交/出租公司」摇身一变,成为「特斯拉牌滴滴/Uber」的出行平台公司。而且它可以收两次钱:卖车的时候收一次,接单的时候再抽一次成。 泼个冷水:技术 Ready 还不够 在知名投资机构摩根士丹利的估值体系中,特斯拉未来超过 60% 的价值来自 FSD 和 Robotaxi。 在著名投资人「木头姐」所在的ARK,Robotaxi 未来的价值贡献甚至超过了90% | 图片来源:ARK Invest 前文已经提到,特斯拉希望通过量产技术直接打通从 L2 到 L4 的整个过程,并且依托于 Robotaxi 和 FSD(软件付费)两种模式,打通除卖车之外的两种新商业模式。 得益于目前 Model Y 和 Model 3 在全球的销量和保有量,理论上任何拥有 HW4.0 硬件以上的特斯拉车主,都可以让自己的车闲时成为「特斯拉牌滴滴车」。这样一来,马斯克一直强调的百万车队规模看起来似乎不是问题。 不过,即便我们假设技术、运营、审批细节都一切顺利,但问题是: 特斯拉车主,真的都会这样做吗? 对于老车主来说,他们是否愿意把私人用车用来提供公共服务? 对于新车主来说,又是否有人愿意特意买一台特斯拉来跑出租赚钱? 以中国市场为例,目前一台搭载 HW4.0 的新款特斯拉 Model Y 售价在 26.35 万元起。按照当前的出行市场规则,这台车可以投入「专车」市场。但 Robotaxi 作为一个新产品,按照网约车市场竞争的经验,大概率需要采用价格补贴等行为争取用户心智。那么这部分成本又将由谁承担? 还有那个最经典的问题:马斯克总是说人们可以在不需要用车的时候,让自己的 Model Y / Model 3 出去揽活,但这个时候,也许大家也没有打车的需求(例如午夜时分)。 所以,从泼盆冷水的角度看,Robotaxi 和自动驾驶依然是一个不能一蹴而就的生意。但是从投资人的角度看,尽管特斯拉的这套纯视觉量产方案还没有完全验证,但由于超高的成本优势,还是值得「赌」一把未来。 这也是为什么特斯拉在今年经历了一系列幺蛾子之后,市盈率依然高达 177 倍,比硅谷七巨头中的任何一家都要高出 3 倍的重要原因。 在 Robotaxi 出成绩之前,特斯拉和马斯克的首要任务,还是「卖车」,卖非 Robotaxi 的车。
美媒揭秘 1999 美元的「美国制造」手机:配置落后十年,一半客户是政府 特朗普一直在施压苹果公司在美国制造 iPhone,并推出了自家 Trump Mobile 土豪金智能手机。 《华尔街日报》发文称,美国确实可以制造智能手机,但是这样的手机不会像 iPhone 那样时尚精致或性能强大,而且成本会高得多。 美国科技公司 Purism 开发的 Liberty 手机是目前最接近实现美国制造目标的产品。然而,它的配置放在十年前也许还算不错,但现在已经过时了,售价却高达 1999 美元 (约合 1.4 万元人民币)。 Liberty 手机目前并不是为了与 iPhone 竞争而打造的。其创始人韦弗指出,1999 美元的零售价反映的是这款手机「采购来源安全、供应链可核查」的价值。他还补充说,Purism 大约一半的客户是美国政府机构。 「对于消费者群体,我们的用户主要是安全极客、想给孩子买手机的家长、年长者,或者那些想避开大型科技公司的用户。需要超强摄像头的人,并不是我们的目标客户。」韦弗称。 韦弗估计,他能够在六个月内将产量提升到每月 10 万部手机,但要实现这一目标,需要投资用于购买新设备、增加生产线操作员,以及扩充厂房空间。(来源:凤凰科技) 上线仅一天,苹果撤下「说服父母给买 Mac」广告 近日,苹果公司最新推出了一份长达 81 页的《家长推介》演示文稿,以帮助孩子说服父母将 Mac 作为学习设备收入囊中。不仅如此,苹果还发布置顶了一段由喜剧演员 Martin Herlihy 主演的 YouTube 视频,进一步围绕这一主题展开推广,试图以轻松幽默的方式打动家长和孩子。 在第 7 页,文稿以孩子的视角俏皮发声:「虽然我没办法带着爸妈上大学,但我可以带着 Mac 去呀!」 不过,此视频今日已被苹果设置为私密,目前无法观看。(来源:快科技) Sam Altman:GPT-5 之后,界面将近乎「消失」 Y Combinator 最近在旧金山举办的 AI Startup School 活动上,OpenAI CEO Sam Altman 表示,不要去构建一个 ChatGPT 的翻版。其次,不要去做人人都在做的热门方向。最持久的公司通常都始于一个独特的领域,这让你有时间窗口去打造出色的产品。 他表示,GPT-5 之后,AI 将从被动的问答工具,进化为主动的、持续运行的智能体。它会了解你、连接你所有数据,并主动为你完成任务。最终的愿景是一个完全多模态的集成模型,能深度推理、实时生成视频、即时编写代码,让计算机界面近乎「消失」,变得无感。 「未来,LLM 就是交互界面,它可以根据你的业务逻辑和数据,在你需要时即时生成一个应用。这对传统 SaaS 是颠覆,但对能快速迭代的初创公司是巨大机会,因为行业周期变化越剧烈,初创公司越容易胜出。」(来源:机器之心) 马斯克:Grok 4 将重写人类所有知识库 近日,埃隆·马斯克在 X 社交平台上放话,将用新一代大模型 Grok 3.5(或许直接叫 Grok 4)重写整个人类知识库,添加缺失信息,删除错误内容,然后基于这个「纯净版」知识库重新训练模型。 马斯克想让 Grok 成为人类知识的审核员和补全者。据悉,新一代 Grok 拥有高级推理能力,能够识别知识库中的错误和缺失。(来源:网易) 多家机构预测小米 YU7 定价 25 万元左右 小米首款 SUV 车型 YU7 已经定于 6 月底(下周)发布。随着发布会日期临近,YU7 的最终定价成为市场关注的焦点。雷军曾多次公开否认低价传闻,强调 YU7 定位高端,瞄准特斯拉 Model Y。目前,市场分析机构普遍预测其起售价约为 25 万元人民币。 针对 YU7 的定价区间,多家大行发布了预测报告。美银证券预估 YU7 售价区间为 25 万至 30 万元人民币,2025 年及 2026 年出货量分别可达 8.5 万辆及 26 万辆。 花旗银行预测定价介乎 25 万至 32 万元,月销量约 3 万辆,年销量有望达 30 万至 36 万辆,并认为 YU7 将显著影响特斯拉 Model Y 在中国市场的份额。 招商证券国际预测起售价约 25 万元,直接竞争对手包括特斯拉 Model Y(起售价 26.35 万元)、蔚来 EC6 及小鹏 G7。(来源:新浪财经) 《情感反诈模拟器》在线人数峰值近 7 万,位居国区热销第一 国产情感反诈题材互动影游《捞女游戏》(现已改名为情感反诈模拟器)已于 6 月 20 日正式发售,截止至发稿时 Steam 平台共收获上万条评测,好评率高达 97%,「好评如潮」。 根据 SteamDB 数据显示,本作在 6 月 21 日晚在 Steam 平台迎来一波在线人数高潮,历史峰值一口气来到 69747 人! 本作改名后,Steam 商店页面的游戏介绍也进行了更新,特别强调改名后的游戏内容与首发版一样无删减。针对玩家们对于故事情节的一些批评,官方也对游戏内容进行了修改:将第一章吴宇伦的失败结局调整为止损结局。此修改不影响已经解锁此结局玩家的解锁记录,更新完毕后修改为止损结局。(来源:游民星空) 微软、Linux 创办人 50 年来首度同框:比尔・盖茨与林纳斯・托瓦兹共同参加晚宴 6 月 23 日消息,两位科技界重量级人物比尔・盖茨与林纳斯・托瓦兹上周末首次同框出镜,肩并肩站在合影中央,神情比想象中更加亲切。向来在软件商业理念上针锋相对的两人,此刻正与微软技术高管马克・鲁西诺维奇和戴维・卡特勒畅谈交流。 在过去 50 年间,执掌 Windows 与 Linux 的两位关键人物此前并未谋面。东道主鲁西诺维奇称,这是两人第一次碰面,若在几十年前,或许这样的同桌而坐只会引发激烈争执,但时间终究让人变得包容。(来源:新浪) 跨境支付通今日上线,内地与香港两地居民可实时跨境汇款 6 月 22 日,内地与香港间的「跨境支付通」正式上线。此前 6 月 20 日,中国人民银行与香港金融管理局联合举办「跨境支付通」启动仪式。据中国人民银行深圳分行透露,「跨境支付通」推出首日,全国首笔「跨境支付通」内地居民南向、港人北向汇款业务落地深圳。 在操作方面,两地居民只需在手机银行「跨境支付通」功能模块,输入电话号码或组合输入户名和收款账号便可进行跨境汇款,同时还可根据需要灵活选择到账币种为人民币或港币。(来源:每日经济新闻) 特斯拉 Robotaxi 在奥斯汀正式上线,配备远程操作员和实体乘务员,固定费用 4.20 美元 特斯拉已在德克萨斯州奥斯汀正式小规模推出了其自动驾驶出租车服务。根据特斯拉过去几天发出的抢先体验邀请,自动驾驶出租车服务将仅在奥斯汀特定的地理围栏区域内提供,车队规模约为 10 至 20 辆。用户可以通过专门定制的应用程序叫车。特斯拉计划在奥斯汀的运营时间为早上 6 点至凌晨 0 点。 为了增加安全性,一名特斯拉员工(某种形式的物理服务员)将坐在前排乘客座位上,可以通过定制的自动驾驶出租车 UI 轻松访问「紧急停止」和「靠边停车」命令。 埃隆·马斯克表示,特斯拉自动驾驶出租车服务统一收费 4.20 美元。(来源:IT 之家) 古尔曼称「真全面屏」iPhone 后年问世:分两步走,明年先缩小灵动岛 6 月 23 日消息,彭博社记者马克・古尔曼在昨天发布的《Power On》时事通讯中透露,苹果计划在明年推出的新款 iPhone 上缩小灵动岛的尺寸。他预计到 2027 年,苹果将发布一款焕然一新的二十周年纪念版 iPhone。 根据古尔曼此前的说法,这款纪念机型将配备弧形玻璃边缘、超窄边框和真正的无打孔全面屏。 上月,《The Information》记者 Wayne Ma 报道称,明年的 iPhone 18 Pro 将采用屏下 Face ID,仅在屏幕左上角保留一个小孔用于前置摄像头,不再有药丸形开孔。因此,对于古尔曼所说的「明年仍将保留一个缩小版灵动岛」,外界尚不清楚其具体含义。 综合目前的消息来看,第一款配备屏下 Face ID 和屏下前置摄像头的「真全面屏」iPhone,可能会在 2027 年亮相。(来源:IT 之家) 欧空局正在建造巨大的太空天线来监听黑暗宇宙 6 月 17 日,欧洲航天局(ESA)与 OHB 系统公司正式签署建造 LISA(激光干涉仪空间天线)的协议。这项开创性的任务将成为首个旨在探测引力波的太空天文台。引力波是由超大质量黑洞碰撞和合并等巨大事件在时空中产生的微妙涟漪。 欧空局计划利用 LISA 卫星,利用相距数百万公里的三角形探测器捕捉来自太空的引力波,揭开我们从未见过的宇宙秘密。 LISA 将由三艘相距 250 万公里的航天器组成三角形飞行器,用于「聆听」宇宙中最具灾难性的事件(例如黑洞碰撞)在时空中产生的涟漪。 为了实现这一壮举,LISA 将被设计为由三艘航天器组成的星座。它们将以三角形编队飞行,跟随地球绕太阳运行。等边三角形的每一条边长 250 万公里,是地月距离的六倍多。(来源:cnbeta)
小米汽车称严禁以任何形式诋毁竞品:新品上市前期,外界可能会出现较多虚假信息 6 月 21 日消息,小米汽车昨日凌晨发布小米汽车答网友问(第 159 集),文中称:「近期,网络上出现一例疑似『小米销售人员与用户沟通小米 YU7』的内容,对话中销售人员存在诋毁其他品牌产品行为,这是真的吗?」 小米汽车称: 经内部调查确认,涉事人员并非小米员工,且小米严禁以任何形式诋毁竞品。新品上市前期,外界可能会出现较多虚假信息,请大家务必仔细甄别,并以小米官方渠道发布的信息为准,避免因不实信息造成误导或经济损失。(来源:IT 之家) 罗永浩:AI 新产品 3 个月后见 昨日,久未在科技领域公开露面的罗永浩以科技创业者身份,于极客公园 AGI Playground 2025 峰会现场,与独响创始人王登科、Fellou 创始人谢扬及极客公园创始人张鹏,进行了一场 AI 创业者之间的对话。 席间谈及「AI 陪伴」、「AI 效率工具」等议题,聚焦新时代 AI 产品该怎么做、人与 AI 的关系演进,以及罗永浩的下一步规划。 老罗透露,「我们的新产品可能两三个月内就要上了,所以我又出来得瑟一下,就是为了给推出做准备。」 关于新产品细节,他仍保留悬念,仅透露「属于效率工具集范畴,邮件功能为其中一个组件,等产品推出的时候再说具体的细节。」(来源:极客公园 Founder Park) Meta CTO 回应 1 亿美元挖人失败:OpenAI 给的待遇也不低 6 月 21 日消息,OpenAI 首席执行官 Sam Altman 周三表示,Meta 曾向某 OpenAI 员工开出 1 亿美元(现汇率约合 7.18 亿元人民币)奖金来挖人,但未能成功。 对此,Meta 首席技术官(CTO)Andrew Bosworth 当地时间周五在播客中表示,OpenAI 也并非等闲之辈,该公司针对 Meta 向其员工抛出的高薪邀请采取了反制措施,暗示 OpenAI 也拿出了颇具竞争力的待遇来挽留员工。 他周五在做客《Closing Bell Overtime》时表示:「市场为这类人才设定的薪酬水平高得实在令人难以置信,在我 20 年的科技高管生涯中前所未见。」 他同时阐释 Meta 技术愿景:「我们坚信未来超级智能 AI 将在每一步为人类提供协助——人们需要助力时,AI 随时在场。幸运的是,围绕『超级智能』愿景,我们已凝聚起内外部团队(如亚历山大・王这样的人才),全力推进这一目标。」(来源:IT 之家) 华为朱懂东:鸿蒙电脑未来会支持侧载,下半年推出「键盘可以拆开的电脑」 华为开发者大会 2025 昨日继续进行,华为终端 BG 平板与 PC 产品线总裁朱懂东带来了鸿蒙电脑更多新消息。 针对侧载问题,朱懂东称:「我们要侧载也要等电脑慢慢完善了,一步步来,谁说我们电脑不能侧载,开发都能做怎么可能不侧载。只是现在还没有开放,等到功能、安全机制都完善了,而且用户数达到一定基础,安全攻防有进一步理解和认知以后,会把这些东西慢慢给开放」。 他还补充道:「简单讲,不通过应用商店装三方应用,是可以的。」 朱懂东还透露,今年下半年华为将推出两款新的鸿蒙电脑,其中一款可以体现平板的体验和电脑的体验完美融合,彻底打破两种所谓定义的边界,并称其为「键盘可以拆开的电脑」。(来源:IT 之家) 英特尔高管:未来芯片制造将减少对 ASML 高 NA EUV 光刻机的依赖,转而提升刻蚀技术的核心地位 6 月 21 日消息,据投资研究平台 Tegus 披露的讨论内容,一位匿名英特尔总监表示,未来晶体管设计将降低对先进光刻设备的依赖,转而提升刻蚀技术的核心地位。 他认为,随着全环绕栅极场效应晶体管(即 GAAFET)和互补场效应晶体管(CFET)等新型结构的发展,高端芯片制造对光刻环节的总体需求将会减弱。 这位英特尔总监强调,GAAFET 与 CFET 等三维晶体管结构要求「从各个方向包裹栅极」,使得横向去除多余材料成为关键,「制造商将更专注于通过刻蚀工艺去除材料,而非延长晶圆在光刻机中的处理时间来缩小特征尺寸。」 英特尔总监表示,这种三维结构使芯片制造「降低对最小特征尺寸的依赖,因为不仅能在平面上实现高密度,还能通过垂直堆叠达成」,因此高数值孔径光刻机在先进制程中的重要性「将低于当前 EUV 设备在 7nm 及更先进技术节点中的关键地位」。(来源:IT 之家) 网易也要做一款 3A 游戏了 6 月 21 日消息,《黑神话:悟空》之后,网易公司也宣布要制作 3A 单机游戏大作了。 6 月 20 日,网易雷火旗下临安 24 工作室开发的单机动作冒险游戏《归唐》公布首支预告片,明确表明这将是一款登陆 PC、主机平台的普通买断制游戏。 据官方介绍,游戏灵感来源于真实历史故事「沙州归唐」。《归唐》的故事发生在唐朝安史之乱后,沙州地区被吐蕃攻陷。直到公元 848 年,不堪压迫的义士们起义将沙州光复。我们将在游戏中扮演一名信使,为了将沙州光复的捷报传回长安而踏上要穿越沙漠戈壁与重重危险的归唐之路。 《归唐》预告片展示了基于虚幻 5 引擎打造的精美画面,包括大漠孤烟、敦煌壁画等场景。 据《归唐》官方公开的数据,预告片在发布后 24 小时内,在 B 站取得了 1000 万次的播放量,在抖音快手等短视频平台也收获超过 2000 万次的总播放量。 不过对于擅长做手游的网易,《归唐》预告片发布后,有不少网友对网易开发 3A 单机游戏的纯粹性表示质疑。 《归唐》官方下场发文:我们注意到归唐预告片发布后一些玩家对雷火开发单机游戏的纯粹性怀有质疑。我们希望用归唐来修复大家对我们的信任裂痕。说了是单机,就不可能是手机游戏。「这话大家可以截图留证」。(来源:TechWeb) 理想汽车产品经理:i8 价格不会动辄就到 50 万 6 月 21 日消息,理想汽车产品经理 @ 莱因哈特在拉伸 昨天在微博发文,介绍理想 i8 理念、造型以及驾驶体验。 其在微博中披露,理想汽车目标是做一款能同时提供长续航、大空间的大型 6 座纯电 SUV,理想 i8 也将避免和其他大尺寸 6 座纯电 SUV 一样做成 50 万以上的价位。 其认为,i8 是理想学习行业标杆特斯拉基于第一性原理打造产品的一次体现,比如低车头、大尺寸斜挡风、溜背车顶。「i8 开起来的感受,我相信有机会改变大家对于一台 5.1m 长 + 2.6 吨重 + 6 座的家用 SUV 的刻板印象。」(来源:IT 之家) iOS 26 将启用 iPhone 16 的混音功能,且不仅在照片应用上 所有五款 iPhone 16 机型均在照片应用中提供音频混音功能,可让您在录制视频后编辑其声音。例如,您可以降低视频中的背景噪音,使镜头中说话的人听起来更清晰。 从 iOS 26 开始,苹果允许第三方应用程序提供与 iPhone 16 及更新版本上的照片应用程序相同的音频混合控制。 iOS 26 为背景噪音引入了一些额外的音频混合选项。 要使用音频混音功能,视频必须已使用空间音频录制。在所有 iPhone 16 机型上,录制视频时空间音频都会自动开启。要调整此设置,请打开「设置」应用,然后点击「相机」→「录音」。 从 macOS Tahoe 开始,Apple 还允许第三方 Mac 应用程序提供音频混合控制。(来源:cnBeta) 比亚迪方程豹豹 8 全球首发华为 HiCar 6.0 镜像模式,四季度推送 比亚迪昨日日宣布,方程豹豹 8 全球首发华为 HiCar 6.0 手机桌面(镜像模式),功能 OTA 时间预计为 2025 年第四季度。 华为手机官方转发了相关消息,并称:「华为与比亚迪联合开发 HUAWEI HiCar 6.0 手机桌面(镜像模式),行业首发搭载方程豹豹 8,车机秒变手机高清分身,手机使用习惯无缝同步车机」。 目前在售的比亚迪方程豹汽车豹 8 于去年 11 月发布,搭载华为 HiCar、乾崑智驾 ADS 3.0,售价 37.98 万元起。该车可选六座版与七座版双版本,采用 17.3 英寸中央控制屏、12.3 英寸副驾多媒体屏、12.3 英寸全液晶仪表盘、中排双控制屏、50 寸 AR-HUD。 该车采用全新升级的越野专用纵置高功率 2.0T 发动机,最高功率 180kW,前桥驱动电机最大功率 200 kW,后桥驱动电机最大功率 300 kW,整车综合输出功率 550 kW,综合扭矩 760 N・m,0-100 公里 / 小时加速时间 4.8 秒。 特斯拉首批自动驾驶出租车将在乘客座位上配备「安全监视器」 特斯拉已开始为其备受期待的自动驾驶出租车服务发出邀请,但有一个重要的警告:正如 Electrek 此前报道的那样,它将在前排乘客座位上安装一个「安全监控器」。 这些发送给影响力人士和投资者的邀请函称,当 6 月 22 日开始试驾时,这位真人监控器将「全程陪伴你」——这一举措与马斯克承诺的完全无人驾驶服务相悖。 在特斯拉自动驾驶出租车服务发布前的几周里,关于该服务的细节一直很少,但马斯克在一月份表示,该公司将于今年夏天推出「无人监管」的自动驾驶出租车服务,车内无人。 特斯拉的邀请函概述了自动驾驶出租车的一些服务要求,例如乘客必须在早上 6 点至午夜 12 点之间在地理围栏区域内(机场除外)申请服务。邀请函还补充道,「恶劣天气下服务可能会受限或无法使用」,这对自动驾驶汽车来说通常是一个挑战。受邀者可以携带一名 18 岁及以上的额外乘客。(来源:cnBeta) 亚马逊创始人贝佐斯将于下周在威尼斯举行婚礼 据多家媒体报道,亚马逊创始人杰夫·贝佐斯和他的未婚妻劳伦·桑切斯将于下周在威尼斯举行为期三天、耗资 1000 万美元的婚礼,但反旅游活动人士计划破坏这场婚礼,以抗议该市的过度旅游。 然而,尽管有这么多的宣传,实际的婚礼计划仍然是极度保密的,主要是出于安全考虑和应对可能的抗议活动。 虽然婚礼的嘉宾名单仍然保密,不过预计将有约 200 位宾客出席。其中许多人将是新郎和新娘的亲密朋友和家人——这对夫妇有七个孩子,来自以前的婚姻和关系——还有一些名人、科技巨头和政治人物。美国总统特朗普不会出席,不过他的女儿伊万卡和丈夫贾里德·库什纳可能会出席。 据悉,这份名单上有很多一线明星,包括奥普拉·温弗瑞、米克·贾格尔、Jay-Z 和碧昂斯、伊娃·朗格利亚、盖尔·金和朱厄尔。巴里·迪勒和他的妻子黛安·冯芙丝汀宝(Diane von Furstenberg)在威尼斯有一处住宅,他们也可能参加。(来源:新浪财经)
华为在 AI 领域,这次看起来是要全面发力了。 6 月 20 日下午,华为开发者大会 HDC 2025 开幕。两个多小时的主题演讲,AI 成了绝对的主角:不仅华为云拿出新一代昇腾 AI 云服务和全面升级的盘古大模型 5.5,华为终端也首次推出鸿蒙智能体框架,目标直指端侧智能体生态。 过去两年,高端 AI 芯片的「卡脖子」确实让华为在 AI 浪潮里显得有些被动。华为虽然构建了以盘古大模型为基础的 AI 技术体系,但实事求是地说,整体能力并没有达到最顶尖那层。 但经过两年的沉淀与发展,随着自研 AI 算力体系的快速进步,盘古大模型的核心能力,正一步步追近 GPT、Gemini、Deepseek 等全球第一梯队的玩家。更重要的是,华为正在通过鸿蒙、盘古的体系,将大模型的能力融入千行百业的应用,推动用户体验与行业生产力的智能化升级。 盘古大模型 5.5:昇腾底座训出「世界级」选手 在 HDC 2025 上,华为云带来了两项关于 AI 的核心发布:能力显著提升的新一代盘古大模型 5.5,以及支撑其训练的新一代昇腾 AI 云服务。 盘古大模型 5.5 对其五大基础模型——自然语言处理(NLP)、计算机视觉(CV)、多模态、预测、科学计算——进行了全面升级。 盘古大模型 5.5 丨来自:HDC 2025 首先是盘古自然语言处理NLP大模型。全新的 718B 深度思考模型是一个由 256 个专家组成的 MoE 大模型,它在知识推理、工具调用、数学等关键能力上有显著增强。 模型本身也进行了优化,提升了高效长序列处理、降低幻觉、融合快慢思考、增强 Agent 能力。一个关键创新是自适应快慢思考合一技术:通过特定训练方法,模型能根据问题难度自动切换模式——简单问题快速回答,复杂问题则深度思考。华为表示,这使整体推理效率提升了 8 倍。 盘古大模型5.5丨来自:华为云 同时还推出了深度研究 DeepDiver,通过长链难题合成、渐进式奖励等关键技术,可以在网页搜索、常识性问答等应用上获得很高的执行效率,如可以在 5 分钟内完成超过 10 跳的复杂问答、生成万字以上的专业调研报告等,大幅提升工作效率。 除了 718B 深度思考模型,盘古还推出了 72B 的 Pro MoE 大模型,以及更轻量的 7B 级小模型盘古 Embedding。 值得一提的是 Pro MoE 模型还首次代表盘古模型家族参与了第三方跑分测试,在刚刚发布的五月底 SuperCLUE 榜单上,盘古 Pro MoE 在知识推理、工具调用、数学、对话、代码、自然科学六大领域,其跑分成绩已经接近甚至在部分领域超过了 GPT、Gemini、Deepseek 的顶尖模型。 华为诺亚方舟实验室主任王云鹤和他的团队是盘古系列模型主要的研发者,他认为打榜成绩谁是第一不重要,更重要的是,过去所有的顶尖模型都来自英伟达芯片的训练,而盘古证明了基于全华为自研的 AI 服务器,可以训练出同等水平的大模型。 会上,基于 CloudMatrix 384 超节点,华为云发布了新一代昇腾AI云服务。其架构创新在于:将 384 颗昇腾 NPU 和 192 颗鲲鹏 CPU 通过全新高速网络 MatrixLink 全对等互联,形成一台超级「AI 服务器」,单卡推理吞吐量跃升到 2300 Tokens/s,与非超节点相比提升近 4 倍。 CloudMatrix 384 超节点丨来自:华为云 超节点架构能更好地支持混合多专家 MoE 大模型的推理,可以实现「一卡一专家」,一个超节点可以支持 384 个专家并行推理,极大提升效率;同时,超节点还可以支持「一卡一算子任务」,灵活分配资源,提升任务并行处理,减少等待,将算力有效使用率(MFU)提升 50% 以上。 对于万亿、十万亿参数的大模型训练任务,在云数据中心,还能将 432 个超节点级联成最高 16 万卡的超大集群;同时,超节点还可以支持训推算力一体部署,如「日推夜训」,训推算力可灵活分配,帮助客户资源使用最优。 从单一芯片的计算性能来看,目前昇腾、鲲鹏与英伟达的顶尖芯片还有差距。但凭借新的架构,昇腾 AI 云服务也可以支持训练出顶尖的模型,这意味着国产打破 AI 算力垄断迈出了重要一步。华为云透露,目前昇腾 AI 云服务已为包括科大讯飞、新浪、硅基流动、面壁智能、中科院、360 等超过 1300 家客户提供算力服务。 除 NLP 外,盘古的预测大模型、科学计算大模型、视觉 CV 大模型也都迎来升级。此外,华为云还在会上发布了全新基于盘古多模态大模型的世界模型。该模型可以生成数字物理空间,将其用于智能驾驶、具身智能机器人的训练。 鸿蒙重塑用户智能,盘古赋能千行万业 随着 AI 基础设施和模型能力逐步接近全球顶尖水平,华为的 AI 战略路径也变得清晰起来。 简单说,就是基于华为云的 AI 底座,用鸿蒙给 C 端用户带来更好的智能体验,用盘古助力 B 端行业提升生产力。 面向 C 端用户,智能体是构建生态的关键。HDC 2025 期间,华为终端发布了鸿蒙 6.0 开发者 Beta 版,并首次推出鸿蒙智能体框架(HMAF)。这不仅仅是一个开发工具,而是构建在鸿蒙系统和华为 AI 底座上的一整套 AI 生态系统。 在分发上,开发者做出来的智能体,既可以通过鸿蒙系统分发,也能集成到鸿蒙 AI 助手小艺里。用户想点外卖或者查天气,直接告诉小艺,它就能调用相关的智能体来服务,比如推荐餐厅、预报天气,甚至提醒你天冷加衣。 在开发上,鸿蒙智能给开发者提供了 50 多个鸿蒙系统插件和多种开发模式,还开放了小艺对话、小艺建议等 240 多个标准意图框架,帮助应用更准地理解用户想要什么、目的是啥或者什么情绪;同时开放了 11 项核心语音识别 AI 能力。开发者不用自己组建底层算法团队或者投入大笔研发资金,就能开发出智能应用或智能体。 50+鸿蒙智能体即将上线丨来自:HDC 2025 据悉,已有高德、大众点评、京东、微博等超过 50 个鸿蒙智能体即将上线鸿蒙平台。 除了服务 C 端用户,用AI提升 B 端生产力是华为 AI 战略的另一核心,这也是盘古大模型的根本任务。 几年前盘古刚发布时,它的基础模型就瞄准了医疗、金融、政务、工业等领域的痛点,推出了一系列行业解决方案。现在随着盘古大模型 5.5 发布,基础能力更强了,盘古也在更多行业找到了用武之地。 比如盘古预测大模型,已被应用于钢铁、有色金属、供热等多个行业。如宝武钢铁高炉大模型正式上线运行以后,出铁温度合格率稳定在 90% 以上,每吨铁水可节省 2 公斤燃料,一个高炉每天就可节省 20 吨燃料。天津能源使用盘古预测大模型,精准预测了供热需求,在刚结束的供暖季,实现了 100% 的均衡供热,能耗降低了 10%。 还有盘古科学计算大模型,被深圳气象局用于升级「智霁」大模型,做出更精准的天气预报。重庆市气象局针对成渝地区降水局地性强,且降水强度大的特点,打造了「天资·12h「气象大模型,提升灾害天气的日内预报预警能力。 而最新的盘古世界模型,则通过构建无数字物理空间,辅助智能驾驶、具身智能机器人的训练。例如,在智能驾驶领域,输入首帧的行车场景、行车控制信息和路网数据,盘古世界模型就可以生成每路摄像头的行车视频和激光雷达的点云,能够为智能驾驶生成大量的训练数据,而无需依赖高成本的路采。 而在当下最火的具身智能领域,华为云也基于盘古大模型的多模态能力及思维能力,正式发布 CloudRobo 具身智能平台。该平台整合了数据合成、数据标注、模型开发、仿真验证、云边协同部署以及安全监管等端到端能力,提供具身多模态生成大模型、具身规划大模型、具身执行大模型三大核心模型,加速具身智能创新。同时,面对具身智能领域机器人品类多、传感器类型多、接口协议多等挑战,华为云提出了机器人到云的联接协议 R2C(Robot to Cloud)。 CloudRobo丨来自:华为云 结语 曾经受限于高端 AI 芯片的华为,在 2025 年的 HDC 开发者大会上,用盘古大模型 5.5 的全面升级和昇腾 CloudMatrix 384 的算力突破,清晰地宣告了其 AI 能力的进阶——核心模型能力已追至全球第一梯队,并构建了能支撑顶尖大模型训练的国产算力底座。 更重要的是,华为的 AI 布局已走出实验室,清晰地指向两端:一端是鸿蒙智能体框架(HMAF),它将 AI 深度融入鸿蒙生态,通过小艺和开发者生态,让普通人简单获得更好的智能体验;另一端是盘古大模型,它正深入钢铁、气象、能源、自动驾驶乃至具身智能等广阔领域,实实在在提高千行百业的生产效率。 从「悄悄发育」到「全面发力」,华为 AI 的这关键一步,不仅在于技术指标的追赶,更在于它正将「根深」的自研能力,转化为赋能千行万业智能化升级的「叶茂」。这场由「端」(鸿蒙)与「云」(盘古)协同驱动的 AI 实践,才刚刚拉开序幕。
苹果考虑收购初创公司 Perplexity,以补齐 AI「短板」 彭博社记者马克・古尔曼今天清晨撰文称,苹果公司正考虑收购 AI 初创企业 Perplexity AI,以补强公司在 AI 领域的人才和技术储备。 在稍早前的本周五,苹果公司遭到股东集体起诉,被指在信息披露中低估了将先进生成式 AI 整合进语音助手 Siri 所需的时间,导致 iPhone 销量受影响、股价下滑,构成证券欺诈。 据知情人士透露,苹果并购负责人艾德里安・佩里卡已与服务部门主管及 AI 战略高层就此展开内部讨论。目前谈判尚属初步阶段,未来未必会提出正式收购要约。 Perplexity 提供基于网络实时信息的问答服务。Perplexity 最近完成融资,估值达 140 亿美元。若交易按此估值进行,将超越苹果此前收购 Beats 创下的纪录,成为苹果历史上最大的一笔并购。 若成功收购 Perplexity,苹果不仅将获得一支 AI 技术团队,还能借助其在业内的知名度以及成熟的消费者产品,有助于后续人才引进。(来源:IT 之家) 多多买菜即将上线即时配送服务 据《晚点 LatePost》获悉,多多买菜正在上海等一线城市试验自建商品仓库,最快将于 8 月上线即时配送服务,以类似京东秒送、淘宝闪购的速度送商品上门。不过,不同于京东、淘宝的大举投入,多多买菜的尝试还在早期阶段,并且也不会涉足餐饮外卖。 拼多多表示,这不能代表公司战略和方向,称其无意加入即时零售大战。 一位接近多多买菜的人士说,他们担心美团闪购的崛起会影响多多买菜,如果继续增长,未来还可能会冲击拼多多主站以米面粮油为主的类目。(来源:晚点) 华为开发者大会,发布鸿蒙 6.0 Beta 及多个模型 6 月 21 日,华为开发者大会在东莞松山湖举行。在大会现场,华为发布了 HarmonyOS、盘古大模型等方面最新进展。 HarmonyOS 6 将带来全新的互联和智能体验,全场景体验更易用,时延低达毫秒级;鸿蒙智能再进化,AI 能力更开放。 盘古大模型 5.5 正式发布,在自然语言处理,多模态等 5 大基础模型全面升级。包括 MoE 7180 亿参数的深度思考模型、基于盘古多模态大模型的世界模型、300 亿参数 MoE 架构的盘古视觉大模型。 同时,华为也发布了 CloudRobo 具身智能平台。他强调,华为云不做机器人本体,把机器人本体交给伙伴。华为云的目标是让一切联网的本体都成为具身智能机器人。(来源:财联社) 稳定币第一股上市两周涨幅超 640% 6 月 20 日,Circle 股价开盘大涨 16%,上市以来累涨超 640%。 当地时间 6 月 5 日,Circle 正式在纽交所上市。作为全球第二大稳定币发行商,Circle 的核心竞争力源于 USDC 的生态渗透力。招股书显示,截至 2025 年 4 月,USDC 流通量高达 601 亿美元,在稳定币市场占据约 29% 的份额,仅次于 Tether 发行的 USDT。(来源:每日经济新闻) 饿了么前CEO被警方带走,涉嫌职务犯罪 近日,饿了么物流负责人、原 CEO 韩鎏在上海办公室被警方带走。据财新了解,初步原因是涉及供应链利益输送。 对于韩鎏被调查一事,饿了么方面回应称:通过内部调查发现物流主管韩鎏涉嫌职务犯罪,并向警方主动报案。近日,警方已传唤相关人员配合调查。饿了么秉持诚信廉洁文化,对触碰红线行为绝不姑息,坚决依法依规处理。 韩鎏早年任职于京东商城和京东物流,2019 年加入阿里巴巴,花名昊宸。2024 年 3 月,韩鎏升任饿了么 CEO。两位了解韩鎏的人士指出,韩鎏在不同公司任职期间都被疑向下游供应链利益输送问题。(来源:财新) 传宇树科技正积极推动 IPO,投资人:首选 A 股 宇树科技于近期完成了 C 轮融资,由移动旗下基金、腾讯、锦秋、阿里、蚂蚁、吉利资本共同投资。知情人士透露,此轮融资募资规模约 7 亿元人民币,融后宇树科技估值达到约 120 亿元人民币。此次融资或将是宇树 IPO 前最后一轮融资,上市前再融资的可能性较小。 据悉,目前宇树科技公司和投资人都在积极推进 IPO 事宜,首选在 A 股上市,其次是香港。(来源:钛媒体) 微信朋友圈推出回复带图功能,正灰度测试 日前,有网友在社交平台表示,微信朋友圈的评论可以发表情包和图片了。腾讯客服对此表示,微信更新至 8.0.60 版本后,朋友圈支持在评论中添加表情包或从相册上传图片。该功能目前处于小范围内测阶段。 此前,微信在 2019 年曾推出过支持朋友圈评论用表情包回复的功能,但该功能很快便被下线。(来源:快科技) Meta 联合 Oakley 推出新款智能眼镜,399美元起步 6 月 20 日,Meta 与依视路合作推出了一款全新的 Oakley Meta HSTN 智能眼镜,起售价 399 美元(当前折合人民币约 2868 元),限量版 499 美元。和此前畅销的 Ray-Ban Meta 相比,新产品起售价贵了 100 美元,电池续航时间是之前的两倍。 这款眼镜采用最先进的 Oakley PRIZM 镜片,结合 Oakley 的 PRIZM Lens 技术,旨在帮助运动员在不断变化的光线和天气条件下获得更清晰的视野。 据介绍,Oakley Meta HSTN 常规使用状态下续航时间可达 8 小时,待机续航时间长达 19 小时;并且支持快充,只需 20 分钟即可充至 50%。它还配备了类似耳机的充电盒,综合续航 48 小时。 Oakley Meta HSTN 采用了更高分辨率的 3K 摄像头,支持 IPX4 防水,沿用 Ray-Ban 眼镜的核心功能,例如集成开放式扬声器、内置双麦克风,还有 Meta AI 个人助手。(来源:IT 之家) 史上最大尺寸双折叠,三星 Galaxy Z Fold7 渲染图出炉 近日,三星 Galaxy Z Flip7 的外观渲染图在社交平台上被曝光。这是行业内最强悍的小折叠屏,新品将于 7 月发布。 对比上代,Galaxy Z Fold7 变化最大的是重量和尺寸。Galaxy Z Fold7 重量降至 215g,比上代轻了 24g;内屏尺寸增大至 8.2 英寸。这是史上尺寸最大的双折叠,竞品谷歌 Pixel 9 Pro Fold 的尺寸是 8 英寸、OPPO Find N5 尺寸是 8.12 英寸,外屏尺寸预计是 6.5 英寸。 另外,三星 Galaxy Z Fold7 至少提供黑色和蓝色两种配色,镜头 DECO 跟三星 Galaxy S25 系列接近,搭载高通骁龙 8 至尊版平台,电池是 4400mAh。 值得注意的是,爆料称三星砍掉了 Galaxy Z Fold7 的屏下摄像头方案,转而采用传统的挖孔屏,原因是屏下摄像头技术会影响到成像。而去年发布的 Galaxy Z Fold6 配备 400 万像素屏下摄像头。(来源:cnBeta) 罗马仕充电宝 3C 认证被撤销,快递公司拒收其召回产品 6 月 20 日,国家市场监管总局全国认证认可信息公共服务平台显示,深圳罗马仕科技有限公司及相关公司的快充移动电源 3C 认证被大批撤销,证书状态显示「暂停」,剩余 3C 认证基本都与充电器和插座相关,仅剩江门罗马仕科技有限公司一项「快充移动电源」的证书状态仍为「有效」。 关于召回原因,罗马仕称,本次召回的移动电源产品,由于部分电芯原材料来料原因,极少数产品在使用过程中可能存在过热现象,在极端场景下可能产生燃烧风险,存在安全隐患。 据网友分享,在联系罗马仕在线客服后需要提交信息和排队,客服确认信息后则会提供地址,用户将问题移动电源通过快递寄送给罗马仕。 目前部分用户已经通过快递将移动电源寄回广东江门的售后服务地址,不过一些快递公司的部分网点,疑似因为存在安全风险的原因,开始拒收发往广东江门的罗马仕品牌移动电源。(来源:澎湃新闻、快科技)
机器人明星企业宇树被曝 C 轮融资落定:中国移动、腾讯、锦秋、阿里、蚂蚁、吉利共同领投,估值超 100 亿 6 月 19 日消息,据晚点 LatePost 爆料,宇树科技已于近期完成了去年底开启的 C 轮融资,由中国移动旗下基金、腾讯、锦秋、阿里、蚂蚁和吉利资本共同领投,宇树的大部分老股东跟投。宇树投前估值目前超过 100 亿元人民币。 爆料提到,今年 1 月初,中国移动、蚂蚁和一些大型产业方就在积极洽谈,几家主要潜在投资方计划出资 1 亿-3 亿元不等。而进入今年 2 月后,宇树 C 轮投后估值逐渐上涨,融资结构也相应变化。 据多方行业信息,今年上半年,宇树部分老股交易的估值已超过 150 亿元人民币。熟知宇树科技融资事项的人士对新浪科技表示,「融资最近确实完成了」。 今年 5 月,宇树科技向合作伙伴发布通知,因公司发展需要,杭州宇树科技有限公司即日起名称变更为杭州宇树科技股份有限公司。原公司所有业务由「新公司名称」继续经营,原公司签订的所有合同继续有效。对此,宇树相关负责人作出回应:这是公司运营方面的常规变更。(来源:IT 之家) 谷歌 Gemini 客户端新增 AI 视频上传分析功能,支持 iOS / 安卓平台 谷歌现已为其 Gemini AI 客户端新增视频上传分析功能,用户将自己的应用更新至最新版本(IT之家注:iOS 用户需更新至 1.2025.2362302 版本,安卓用户需更新 Google 应用至 16.24 正式版)即可看到相应视频上传选项,无需订阅 Gemini 会员即可使用。 据介绍,在用户上传视频后,Gemini 会根据用户的提示词对视频内容进行逐帧分析,以回答用户提出的内容。例如用户可以将自己的监控摄像头录屏上传 Gemin 内,同时询问「视频是在什么时候拍摄的」,Gemini 便会根据视频中的时间码并结合视频内的环境情况给出自己的见解。 需要注意的是,相应视频上传功能目前正在逐步上线中,不同设备和账号可能开放时间略有差异。现阶段相应功能支持 Gemini 2.5 Flash / 2.5 Pro 模型,如果用户在上传文件时可看到「文件类型不受支持」的提示,这说明该功能尚未在其账号上开放,需要等待一段时间。(来源:IT 之家) OpenAI 警告:具有更高生物武器风险的模型即将出现 OpenAI 近日警告称,即将推出的模型在制造生物武器时将面临更高的风险——尤其是对于那些并不真正了解自己在做什么的人来说。 OpenAI 高管表示该公司预计即将推出的模型将在公司的防范框架下达到高风险水平。该公司在一篇博客文章中表示,正在加强对此类模型的测试,并采取新的预防措施,以防止它们协助制造生物武器。 OpenAI 并未设定首个达到该门槛的模型的具体发布时间,但安全系统负责人约翰内斯·海德克 (Johannes Heidecke) 向 Axios 表示:「我们预计我们的 o3(推理模型)的一些后继者将达到这一水平。」(来源:cnBeta) 腾讯微信「短剧」小程序上线,支持免费观看 6 月 19 日消息,继年初在微信内上线短剧小程序「火星观剧」后,腾讯于近期推出了第二款短剧小程序产品,名字简单明了就叫「短剧」,主打全网口碑免费好剧。 目前,「短剧」小程序设有口碑榜、总榜、飙升榜、推荐等栏目,支持免费观看短剧。「短剧」小程序内的播放形式与视频的播放形式一致,可以上下滑动,以此切换剧集。播放界面中带有进度条、点赞、转发、评论等功能。此外,短剧支持倍速播放,还可以生成海报分享给微信好友。在切换集数时,会穿插广告,这也是该款短剧小程序的主要盈利模式。(来源:IT 之家) 618 战报公布,全网零售额近 2 万亿元,天猫、京东大批商家爆单 天猫数据显示,截至 6 月 18 日,453 个品牌在天猫 618 成交破亿元,同比增长 24%。其中,苹果、美的、海尔、小米、华为等品牌跻身天猫「618」「10 亿元俱乐部」。 京东数据显示,截至 6 月 18 日,下单用户数同比增长超 100%,京东零售线上业务、线下业态及京东外卖整体订单量超 22 亿单。京东 App 的日活量也创下历史新高,京东采销直播成交额同比增长 285%。 拼多多数据显示,截至 6 月 18 日,小米 15、vivo X200 Pro、iPhone16 Pro Max 等热门手机单品的销量实现 3 至 8 倍的涨幅;家电、美妆、护肤、母婴、宠物等品牌也通过拼多多百亿补贴实现了爆发式增长。 美团闪购数据显示,白酒、精酿啤酒、手机、运动鞋服、电脑整机、智能设备、电子教育等 50 余类高价值商品成交额相比去年同期增长超过 1 倍,其中白酒成交额增长近 19 倍,智能设备增长超 8 倍。 「618」期间测算全网零售额近 2 万亿元,同比增长约为 9.8%,再创新高。从销售额份额来看,天猫淘宝占比为 38%,京东为 23%,抖音为 15%,拼多多为 8%,其他平台合计占比为 16%。从增速来看,头部平台网络零售额均实现同比正增长。(来源:新华财经) 鸿蒙电脑版微信公测开启 微信员工客村小蒋 6 月 19 日发文称:「鸿蒙电脑版微信邀请测试活动停止了,我们已经开启公开测试。」 目前,鸿蒙电脑用户可以直接在「应用尝鲜」里面下载微信。此前,鸿蒙电脑版微信已于 6 月 6 日晚开启内测邀请。(来源:新浪科技) Nothing 首款头戴耳机渲染图曝光:透明设计,预估售价 309 美元 6 月 20 日消息,科技媒体 notebookcheck 昨日(6 月 19 日)发布博文,分享了一组渲染图,展示了 Nothing 即将推出的 Headphone (1) 耳机。 从曝光的渲染图来看,Nothing Headphone (1) 设计彻底摒弃传统头戴耳机的常规形态,耳机主体由两部分构成:一为半透明椭圆面板,内置麦克风孔洞与降噪(ANC)传感器;二为哑光矩形基座,负责承载物理按键与接口。 Nothing Headphone (1) 为满足有线音频爱好者的需求,右侧基座保留了 3.5mm 音频接口。耳罩部分采用与基座呼应的椭圆造型,头梁则支持手动调节,以适配不同头型。尽管 Nothing 尚未公开耳机的电池续航、驱动单元或降噪性能等核心参数,但价格信息已提前泄露:美国市场定价 309 美元,欧洲与英国分别为 299 欧元和 299 英镑。 Nothing 公司即将于 7 月 1 日举办发布会,将正式推出其首款旗舰耳机 Nothing Headphone (1)。(来源:IT 之家) 吉利银河 A7 家轿亮相:首发雷神 AI 电混 2.0,亏电油耗 2L 级别 在 6 月 19 日晚间的吉利银河直播中,吉利银河 A7 家轿正式亮相。 吉利银河 A7 的设计目标是经典三厢风格。该车前脸配有贯穿式灯带,车身侧面采用传统门把手设计,尾部设计则与前脸相呼应。该车还支持 810 版本高德地图,支持车道级导航、红绿灯巡航读秒。油耗方面,该车亏电油耗实现 2L 级别,综合续航超 2100km。 动力方面,吉利银河 A7 EM-i 搭载了一套由 1.5 升发动机组成的插电式混合动力系统,发动机最大功率为 82 千瓦;11 合 1 混动电驱,功率达到 175kW;首发搭载吉利最新发布的雷神 AI 电混 2.0 和星睿 AI 云动力 2.0。 吉利雷神 AI 电混 2.0 将热效率提升至 47.26%,通过 AI 算法控制小电流,延长电池寿命 15%。吉利银河 A7 还将全面搭载「千里浩瀚」智能安全辅助驾驶系统。(来源:IT 之家) 马斯克晒名台词:没有君王只有人类,遭到玩家吐槽 在宣布退出美国政府后,埃隆·马斯克近日重新将注意力转回了特斯拉和 SpaceX。然而,他最近的一条推文再次引发了玩家社区的吐槽。 在发布星舰飞行测试画面的视频时,马斯克配文道:「没有神明或君王,只有人类。(No gods or kings, only men)」熟悉《生化奇兵》的玩家认出,这是游戏中反派角色安德鲁·雷恩的台词之一,也是挂在他雕像上方横幅的那句标语,灵感则来自客观主义哲学家安·兰德。 这句话意指人类的命运掌握在自己手中,而非神明或权威。不过,《生化奇兵》的粉丝却认为马斯克明显误解了这句台词的深意——甚至搞错了角色的立场。 马斯克此前多次尝试在社交平台上营造「游戏达人」形象。比如他曾炫耀自己是《流放之路 2》的高玩,结果被扒出他曾找过代练。 因此,这次他引用《生化奇兵》的标语,再次招来网友群嘲。在生化奇兵的 Reddit 板块中,有玩家调侃说:「他肯定误会了游戏的主旨,还以为安德鲁·雷恩是正面人物。」还有人讽刺道:「八成是找人代打游戏,然后让 ChatGPT 给他解释剧情。」甚至还有网友模仿马斯克对自家 AI 助手发号施令:「@Grok,帮我写个和游戏相关的配文。」(来源:快科技)
稳定币火了。 它或许是整个6月份,在AI之外最热门的科技概念。互联网大厂们对稳定币的热情,让其重回主流视野。 2025年6月17日,京东集团董事局主席刘强东在分享会上表示:“京东将在全球主要货币国家申请稳定币牌照,目标是将跨境支付成本降低90%,转账时间提升到10秒内。” 这可能是中国互联网大厂的创始人或CEO,首次在公开场合表示布局加密货币。 稳定币,本质上来说也是一种加密货币。 与比特币、以太坊等价格剧烈波动的加密货币不同,稳定币通过锚定法定货币(如美元、港元等)或资产,保持价格稳定。 它的主要优点是成本和效率。国际清算银行(BIS)调研显示,稳定币的跨境支付效率可以比传统支付高100倍,成本低10倍以上。 这个过去一直在“灰色地带”存活、小众边缘的金融科技赛道,正在爆发。根据公开数据,2025年5月,全球稳定币市场总市值已突破2463亿美元,较2019年增长近50倍。 不仅如此,6月5日,稳定币概念第一股Circle在纽交所上市,首日股价暴涨168%,市值突破183亿美元,而其员工不到1000人。 Circle的上市,也为其他稳定币公司增加了巨大信心。近期,蚂蚁集团、沃尔玛、亚马逊等科技大厂都在积极推进各自的稳定币项目。 2014年,京东赴美上市时,刘强东曾坦言,最大的错误是没有早点布局支付,被支付宝、微信支付远远甩在后面。 如今,在跨境电商、出海的浪潮下,随着大厂的蜂拥而至,稳定币俨然成为了支付领域一个不可错过的新风口。 未来,用稳定币购买海外商品、跨境转账的图景,将如何一步步成为现实?稳定币,会成为巨头的下一个主战场吗? 京东的稳定币,到底是什么? 根据京东曝光的信息,京东的稳定币,名叫JD-HKD,是一种与港元(HKD)1:1挂钩的加密货币。也就是说,每发行一枚稳定币,都有等值的1港元的高流动性资产(现金、国债等)作为支持,由持牌银行托管并定期审计。 京东稳定币由京东旗下的京东币链科技(香港)有限公司在香港发行。 这家公司2024年3月注册,持有香港证监会颁发的第1、4、9号牌照,业务涵盖证券交易、资产管理和区块链技术开发。 (京东稳定币官网|图片来源:网络) 目前,京东稳定币已进入香港金融管理局的“稳定币发行人沙盒”测试第二阶段。(“沙盒”是香港金融管理局让有意在香港发行稳定币的机构测试其运作计划,便于双向沟通,来探索实现合规的监管制度) 那么,京东搞的稳定币用途是什么? 京东币链科技CEO刘鹏,在5月接受TECHHUB NEWS采访时,解释了京东稳定币正在测试的应用场景,主要包括跨境支付、投资交易、零售支付等。 结合公开信息,具体展开如下: 跨境支付方面,目前,跨境支付主要依赖SWIFT体系,其跨境转账需2-4天,费用占交易额的1-3%。而稳定币可将时间降低到秒级,成本降低90%。 投资交易方面,京东正在与合规加密货币交易所合作,支持机构和零售投资者进行数字资产交易,提供稳定的计价和结算工具。 在零售支付方面,对接京东港澳站等电商平台,尝试支持消费者直接用JD-HKD支付。 不难看出,京东在支付方面的野心同时覆盖B端和C端。 如刘强东在6月17日的分享中所言,“B端支付做完之后,我们就会朝C端支付渗透,希望有一天大家在全世界消费的时候可以用京东稳定币来支付。” 稳定币对于传统支付体系的冲击,带给电商巨头的机遇,意味着更低的交易成本、更快的资金流转,以及在跨境贸易市场弯道超车的机会。 另外,稳定币本身也是一个利润率较高的业务。 以刚刚上市股票大涨的 Circle 为例,2023年的净利润为2.68亿美元,2024年净利润为1.56亿美元。 Circle的主要收入来源有两个: 1. 储备金利息收入:用户购买稳定币的法币资金,Circle可投资于低风险资产(如美国国债),赚取利差。根据财报,2024年总收入中,此收入占比达整体的99%。也显示了其商模式对利率的高度依赖。 2. 交易手续费:跨境支付、货币兑换等场景收取服务费。 由此可以类比京东稳定币的商业模式,此处不再展开。 大厂竞逐稳定币,扎堆香港 京东并不是唯一瞄准稳定币的巨头。全球互联网和金融大厂早已闻风而动。 比如,同样在6月,蚂蚁国际和蚂蚁数科宣布将在香港和新加坡等地申请稳定币牌照。蚂蚁数科已将香港设为全球总部,并在监管沙箱中测试稳定币应用,聚焦全球财资管理和跨境支付。 而亚马逊和沃尔玛作为零售平台,入局稳定币的逻辑与京东相似。其中,沃尔玛尝试通过稳定币的低手续费,来吸引传统银行覆盖不足的用户,以及拓展新兴市场。 小米则选择轻量入局,旗下天星银行与京东币链合作开发跨境支付方案。 另外,传统支付商(如Visa、PayPal)也已推出自有稳定币方案,试图通过合作维持市场份额。 对于巨头来说,香港是布局稳定币的绝佳落点。香港的独特优势在于其国际金融中心地位、成熟的监管体系和与内地的连接性。 2025年5月,香港通过的《稳定币条例》规定,为全球首个法币稳定币监管框架,要求发行人持有2500万港元实缴股本,并以1:1高流动性资产(如现金、国债)储备,保障稳定性和透明度。 而该条例将在2025年8月生效。 至此,筛选出来的实力雄厚的玩家,在香港稳定币生态已形成三类势力角逐: 中资科技巨头:京东、蚂蚁、小米等,依托电商场景与用户基础,抢占跨境支付等场景; 传统金融机构:渣打银行与香港电讯、摩根大通等,布局稳定币发行、交易和衍生业务,目标是全球金融市场; Web3企业:发行港元稳定币HKDR的圆币科技等; 稳定币当下的火热,很大程度上也源于监管的逐渐完善。随着香港、美国、欧盟等地加速立法,稳定币从“灰色地带”走向合规,让大厂、机构敢于入场。 渣打银行预测,2028年全球稳定币市场规模将达2万亿美元,年复合增长率58%。 正如微信支付重塑了移动支付生态,稳定币可能成为数字时代的“新SWIFT”。随着越来越多的重量级玩家入局,争夺下一代全球支付网络主导权的竞争,已经开始。 而监管合规、支付体验等仍是关键变量,其进展或将深刻影响我们日常的付款习惯、甚至未来全球的支付格局。
在 Mac 上追求效率这件事,从来没停过。我们都用过各种工具来提高工作流速度,从早年的 Alfred 到系统内建的 Spotlight,好用是好用,但你总感觉,它们做的事就那么几样,边界很清晰。 直到 Raycast 出现,一下子把这个品类给「打开了」。它不仅能启动应用、查文件、换算单位、排列窗口,连剪贴板历史、日历事件、速记浮窗、翻译、跑脚本、跑 AI、连 Wi-Fi、开热点……都能一口气干了。 它也不只是 macOS 的「万能遥控器」,最夸张的是,Raycast 直接把 AI 大模型整合进了操作系统的体验里,Claude、GPT-4o、Gemini 2.5 Flash 想用哪个都能切。 一行光标,一段指令,和一整套响应迅速的交互逻辑,Raycast 创造出了全新的 macOS 操作体验,它是一个让你「重构操作习惯」的效率中枢。 而就在 WWDC25 上,苹果终于把 Spotlight 更新成了更聪明的版本,加入自然语言搜索、图片识别、Siri 整合,但看完很多人只说了一句话: 「这些 Raycast 早就能做到了。」 而与 AI 大模型打通后,Raycast 更是直接变身离你最近的 AI 助手,为 Mac 加上双重效率引擎 01 一个键盘驱动的「效率宇宙」 Raycast 的底层逻辑是:少碰鼠标,多靠键盘。 所以它首先是是个高度可定制的「Mac 控制台」,基础操作和 Spotlight 类似,但快得多、顺得多。 在任何界面按下启动键,就能打开 Raycast 的控制栏,在控制栏里,最基础的操作有: 启动应用和搜索文件 : 输入要打开的应用或文件名,比如输入「sa」会显示「Safari」。 计算与单位换算 : 直接在输入框键入数学表达式,如「10*3.14」,或进行单位换算「10kg to lbs」,「100℉ = ℃」答案都能即时呈现。时区转换、汇率换算也不在话下。 系统指令 : 输入「Sleep(睡眠模式)」、「Restart(重启)」或「Empty Trash(清理废纸篓)」等指令,即可快速执行系统操作。 窗口管理 : 这是 Raycast 的一大亮点。通过「Left Half(左半屏)」、「Top Right(右上角)」、「Maximize(窗口最大化)」等指令,可以迅速排好任务窗口,对于需要频繁分屏工作的用户来说,这简直是福音。 剪贴板历史: Raycast 会自动记录你复制过的所有内容,包括文本、图片和链接。你可以随时呼出剪贴板历史,搜索、筛选、复制粘贴。无论是几小时前的一段代码,还是一周前的一张截图,都能被轻松找回。 内置的实用小工具: Raycast Focus,能帮你设置番茄钟或屏蔽通知;Raycast Notes 是一个浮窗速记备忘录;网络控制面板能快速切 Wi-Fi、开热点、选蓝牙连接……这些工具就像桌面上的万能小瑞士军刀,让你在不切换窗口、不装其他 App 的情况下解决 90% 的杂事。 Raycast Notes,非常适合随手记想法。 如果说这些功能 Spotlight 也能做到,那以下的功能就更硬核也更好用了。 Quicklinks(快链),顾名思义,快速抵达链接,你可以自定义关键词直达网址或触发搜索。 比如我就创建一个「词」与「链接」之间的 Quicklinks,「gg」就是在 Google 上搜索,「ytb」是搜索 YouTube,随后再输入关键词,它就会跳转浏览器显示搜索结果。 经常需要打开固定网页的也可以创建一个 Quicklinks,比如我设定「gp」就会打开极客公园官网,「edit」就会打开文章排版的网站。 Quicklinks 是典型「用了回不去」的功能,我再也不需要打开浏览器,输入网页,再在网页搜索栏里输入内容。几个字母,即可让我直达结果。 强大的扩展商店, 在 Raycast 中输入「Store」,你就打开了一个新世界。 Store 是一个由 Raycast 社区驱动的小生态系统,开发者们为主流应用和服务开发了定制插件,这些插件能覆盖从开发工具到日常应用的各种场景。 想直接从 RayCast 启动 Zoom 会议?有 Zoom 扩展。需要快速翻译?Google Translate 扩展一键搞定。想从视频网站把视频扒下来?装个 video downloader 即可。 在这些插件加持下,只在 Raycast 界面,你就能实现查 Notion 数据库、发 Tweet、控制智能家居、查询股票、加密货币、搜索 Giphy 动图、测网速……各种花样百出的功能。 Store 的存在,让 Raycast 从一个系统启动器,演变成了一个「超级入口」,让 Raycast 不再仅仅依赖于自身的更新迭代,而是建立在整个开发者社区。 至此,我们还没提到 Raycast 在今年更新的真正杀器: AI。 02 当启动器拥有了「AI 大脑」 Raycast 在 2023 年推出了 Raycast AI 功能,并在 2024 年将其逐渐深度整合进操作体验里。 Raycast AI 的最大亮点是不锁模型, 用 Raycast 的介绍说就是:「一个界面,一打模型」 。 它支持几乎所有的主流大模型,甚至细化到不同的版本,用户可以根据任务需求,在多个顶尖的大模型之间自由切换。 你可以用 GPT-4o 进行复杂的逻辑推理和高质量的文本生成;在需要更强创造力和更长上下文理解时,切换到 Claude 3.5 Sonnet。 模型的反应速度、智能水平、参数量、优势领域也会直观显示在界面,告别「盲选 AI」。 最基本的 AI 功能是聊天: 你可以通过 Raycast 唤起一个聊天窗口,和它对话。它能回答问题、写邮件、翻译文字、做代码解释、总结段落等等。 Raycast AI 会以最快速度响应,无需浏览器、无需登录、无需额度焦虑。小问题让 Raycast AI Chat 随叫随到,复杂的上下文,也可以打开 Raycast AI 窗口应对。 在完整的 AI 窗口里,除了可以调用不同大模型外, Raycast AI 还支持给不同模型「预设」角色和 Store 插件扩展。 比如你可以设置 Claude 3.5 为一个「考官口吻的雅思陪练」,也可以给 Gemini 2.5 加上 DALL·E 扩展,设定为「抽象主义画手」,或者给 Grok3 加一个维基插件,让它化身「维基风 AI」。 和对话式 AI 最大的不同之处在于, Raycast 做出了「Context‑Aware(内容意识)式交互」 :在任何应用选中一段文字,按下 Raycast AI 快捷键,就可以让 AI 即时总结、翻译、改写、扩写。 比如在 Safari 里看到一篇冗长的英文报告不想看?选中唤起 Raycast AI,输入「总结成中文要点」;看到一封措辞强硬的邮件?框选内容,唤起 AI 输入「回他一封礼貌但坚定立场的邮件」即可。 这把传统意义上「复制 - 打开模型应用/网站 - 粘贴 - 输入指令」的过程,精简至「选中 - 输入指令」,全程都不需要离开原本界面。 Raycast AI 另一个重量级功能是 AI Commands:允许你自定义 AI 的行为方式,把你常用的 Prompt 变成快捷命令,一键触发。 比如你可以写一个 Prompt 是「请根据我提供的产品特点 {内容},生成三段适合在小红书平台发布的推广文案,要求语气亲切、多使用 emoji、并包含 3-5 个热门标签。」在选择好模型后,就可以创建一个「小红书文案」指令。 从此只要在 Raycast 控制栏输入「小红书文案」,就会执行这个指令。 每一个 AI Command 都可以自定义绑定快捷键、设置默认模型、指定输入来源(比如来自剪贴板),执行完还可以自动复制或插入结果。 它甚至去搜索了这个产品的信息|图源:Raycast 这就是 Raycast AI 的厉害之处: 它把 AI 从聊天界面解放出来,变成一个随时待命的执行器 。 如果你有一点编程能力,Raycast 还支持用 JS/TS 写插件,并在插件中调用 AI,比如接入第三方 API,如天气、加密货币、新闻源等等。 重点是,这一切跟 Raycast 的主功能完全融合,只需要在操作栏里输入指令后 @ 应用名 即可。 比如我打一句「晚上 6 点在 UME 看电影,晚上 11 点做早报 @calendar」,Raycast 会识别地点、时间、日程后,按顺序在日历里创建日程。 我输入「My Schedule」,它就清晰罗列出我要干嘛,接下来的日程是什么。 能够理解自然语言,并且可以调用正确应用执行指令,这正是 WWDC25 上,苹果对 Spotlight 的「大改造」,Raycast 早已实现,并且比 Spotlight 更开放,扩展性和可玩性也更高。 当然,没有工具是完美的,Raycast 也有些瑕不掩瑜的小问题。 首先 Raycast 目前没有中文界面,虽然支持中文输入,但有时会反馈英文结果。 其次,繁多的功能, 让 Raycast 学习成本并不低,光是理解基础功能都需要看教程,想要用好 Raycast 还得做大量的自定义工作 。 而要解锁 Raycast 的「大杀器」AI 功能,还需订阅每月 8 美元的 Pro 套餐。然而,这个套餐内提供的模型,并不一定比各家官方免费使用的版本更强。 以 Google 的模型为例:在 Pro 套餐中,用户最多只能使用 Gemini 2.5 Flash,若想调用更强大的 Gemini 2.5 Pro,则必须升级到每月 16 美元的 Pro+ 套餐。但在 Gemini 官网,用户每天都有额度可以使用 2.5 Pro,2.5 Flash 更是不限额开放。 所以如果你对大模型能力有追求,或想重度使用 Raycast,可以一步到位上高级版 Pro Advanced,每月约 150 人民币,所有大模型随便切,所有功能随便用。 不过免费版 Raycast 能提供的功能,也已经超过了许多启动器应用。 相比之下,苹果在 WWDC25 上宣布对 Spotlight 的更新显得「官派」很多。虽然增加了自然语言搜索、图片识别能力,并支持更强的 Siri 集成,但它本质还是个「闭源搜索工具」,听起来挺智能,实际能做的事却远不如 Raycast 灵活多变,你甚至可以把它理解为一个被阉割过的 Raycast 平替。 Spotlight 的核心逻辑,依然是一个由苹果主导、自上而下定义的封闭体系。用户是体验者,是规则的接受者,而非共建者。 而 Raycast,就像是另一个维度的产品, 它既是你掌控 macOS 的超级控制台,又像是浏览器插件商店的桌面版,更是一个高度可定制的 AI 中枢,关键是,它赋予了你「定义任务如何被完成」的权力 。 它展现了一个 AI 时代软件该有的样子:前台简洁优雅,理解自然语言,丝滑融合 AI,后台串联做事,对外开源扩展。 对于「Power Users」这些爱折腾的效率爱好者来说,这不是省几秒的事,而是把「AI 时代我怎么用电脑」这事儿,彻底换个思路。 在 Raycast 身上,你甚至能看到下一代桌面操作体验的雏形:一切操作,归于你一句独特的指令。
「美团既白,可以节省 70% 的时间来拿到最终结果。」首批试用 AI 的杭州黄龙饭店,率先给出了数据上的反馈。 6 月 5 日,美团发布了一款专注酒店场景的 AI Agent「美团既白」,这也是国内首个面向酒店商家的 AI 工具。 相比于 「啥都懂但不专精」的通用大模型,它更擅长解决酒店经营中的实际问题,这也体现出美团一贯的务实风格。 虽然通过深度体验美团的零代码开发平台 NoCode,我们已经见证了美团是如何通过 AI 技术简化复杂的研发流程,也对美团的 AI in products 战略有了初步认知。但它能否从「辅助研发」扩展至更广泛的「驱动实体商业经营」,让我们充满了好奇。 美团既白究竟能否真正帮助酒店进入综合数据决策的新阶段?带着疑问,笔者对美团既白的产品功能,以及底层技术支撑进行了全面调研。 01 提效 70%,酒店人终于能喘口气了 杭州黄龙饭店是美团既白正式面向酒店商家推出之前的首批试用者,董事长杜宏新在提起试用体验时举了一个生动的例子:暑期要到了,如果是以往,他们此时正在翻箱倒柜的查旧账,淄博烧烤、甘肃麻辣烫火爆起来的时候,营销方案是怎么做的?经营数据如何?再通过这些碎片拼凑出今年的策略。杜宏新说:「从某种程度来说,这堪比闭门造车。」 传统经营模式下,实体经营往往面临三大痛点:一是数据决策滞后、二是客户服务低效、三是经营分析繁琐。就像抖音商家常因无法及时掌握热门趋势数据,错过爆款商品的推广时机;微信私域运营者面临大量客户咨询,却难以快速响应,导致客户流失。而美团既白,就是为了解决酒店商家经营中存在的实际问题而诞生的产品。 经营策略的制定需以数据决策为先导。一句「暑期青岛的城市热度如何?」的提问背后,美团既白已在几分钟内完成了交通流量分析、商圈预订热度评估、商圈热度洞察,并快速生成一份完整分析报告。如进一步追问「竞争圈的酒店表现情况」,美团既白还能通过流量对比、客群结构、支付订单等信息,生成包含定价策略与服务升级建议的完整方案。 杜宏新还提到,可以通过美团既白来分析城市即将发生的热点事件,比如演唱会、马拉松或其他热点,以及机场的机票预订、火车票预订这些大的周边环境数据。 以演唱会热点事件为例,美团既白能够通过结构化数据分析,帮助商家制定针对性营销策略。比如,对热门明星的演唱会场次,建议酒店在保证合理利润的情况下适当调整房价;对于相对冷门的场次,采取优惠策略吸引顾客,提高入住率。同时,结合演唱会场馆与酒店的距离,以及过往当地举办演唱会时美团平台的住宿热度变化趋势,精准预测住宿需求。 客户服务方面,传统预抵外呼占用大量人力,且存在诸多无效通话。这与金融、地产行业的外呼推销类似,每天几百上千的电话使用同一套说辞,不仅浪费资源,还影响客户体验。而且酒店行业每天要处理大量重复且繁杂的咨询,无法为客户提供个性化服务,就难以从根本上提升用户转化。 搭载美团自研大模型,美团既白可以与客户自然流畅地完成多轮对话,且能根据酒店的餐厅、泳池等服务内容进行个性化推荐。通过多语言语料训练,美团既白还能为国际宾客提供无障碍语言服务。在预抵外呼方面,美团既白的语音识别模型通过声纹分析与语义理解,实时判断通话状态,智能处理无效通话,形成 「预订-触达-入住-离店」的全周期对话服务链。 此外,借助该工具能力,酒店员工还可以便捷查询已沉淀的标准化流程及应急事件处理方案。这种机制,不仅优化了酒店新员工的培训效率,助力其更快速掌握岗位核心技能,大幅缩短上手周期,推动酒店服务团队的能力建设与标准化运营升级。 在日常经营中,制作月度经营概况分析报告,对酒店来说是一项艰巨的任务。从收集数据到分析整理,再到形成报告,往往需要耗费大量人力与时间。如同企业制作年度财务报表,过程繁琐且容易出错,还难以快速从海量数据中提取有价值的信息,无法为经营决策提供及时有效的支持。 在这一环节,美团既白也展现出强大的效能,在分钟级完成核心数据分析,涵盖流量、平均每日房价(ADR)、客源结构以及用户画像等关键维度,并针对性地提出营销活动建议。报告文字生成后,还可以直接导入 NoCode 平台,快速生成可视化表格、图表,将复杂的数据转化为直观易懂的信息。 若需要进一步询问「客户满意度怎么样」时,美团既白能够迅速给出全面的分析结果。从服务和评价的总体数据入手,对评分、确认率、好评差评数量进行梳理,深入分析评价内容中的高频关键词,如卫生、床铺舒适度等正面反馈,以及周边交通不便等负面信息,并挖掘客户潜在需求,形成从数据呈现、细分洞察到执行建议的完整闭环,为酒店优化服务提供精准方向。 试用以上一整套流程之后,杜宏新对美团既白做出了这样的评价:「美团既白,可以从流程节省 70% 的时间来拿到最终的结果,这个是非常棒的。提质增效可以重塑客人体验。」 02 数据+模型+智能体, 破解垂类 AI 三大难题 美团既白的诞生并非空中楼阁,而是与美团在物理世界积累的海量数据和 AI 技术密不可分,称得上是实打实研发出来的「酒店经营神器」。 开发这类针对某一行业的垂类 AI Agent,一直存在三大难题:缺少高质量数据、难以及时调用最新信息、行业经验不好转化成技术。美团通过在本地生活领域的多年摸爬滚打,通过将数据资源积累与 AI 技术沉淀结合,构建了自己的差异化壁垒。 美团既白的一大差异化优势,在于它对多维度数据的整合能力。它不仅能从平台沉淀的数据库中,帮酒店摸透客人喜好、找到服务短板;还能接入酒店自身的房价、入住率、成本这些关键经营数据,搭建起精准的客户画像;甚至能把餐饮、旅游、交通这些一站式的消费串起来,让酒店的经营策略和整个城市的消费趋势联动起来。 举个例子,普通系统只能看到「客人订了豪华套房」,但如果美团既白与商家系统进行全面打通后,能辅助酒店找到更精准的运营方向——比如,这个客人带孩子出行,可能会愿意为亲子服务和增值项目多花钱。这个阶段的 AI,就像是酒店营销的精准导航。 美团既白采用了自研 LongCat 大模型+行业模型协同的运行机制。和那些「啥都懂但不专精」的通用大模型相比,美团既白更擅长解决酒店经营里的实际问题。它用「先学通用知识,再针对酒店行业细化调整」的方法,把 AI 技术真正用到酒店经营的具体场景里。 在实际应用中,美团既白会根据不同需求切换「技能模式」。在客人咨询服务、查询信息等意图识别阶段到制定定价策略、生成运营报告、处理投诉等分析生成环节,综合使用美团自研 LongCat 大模型以及开源模型,输出有条理、能落地的方案。 美团既白还通过将海量高质量酒店行业知识、美团平台多年沉淀的精细化经营数据,以及经过实践验证的运营方法深度结合,形成了一套结构化、可落地的知识体系。再结合后训练精调,美团既白在保持通用语言能力的基础上,还可以深度掌握高星酒店经营逻辑、定价策略等专业知识,精准适配酒店前厅管理、后台客服等细分场景,提供闭环解决方案。 在技术架构上,既白采用了 Multi-Agent 多智能体协作架构,构建起高效的任务处理体系。主智能体就像「总指挥」,能把复杂问题拆解成小任务,规划好执行步骤,再根据任务需求,安排负责不同领域的子智能体「分头行动」。 03 以单点工具提效, 撬动 AI 生态全局协同 当携程、飞猪等 OTA 平台在 To C 端用户预订入口构筑竞争壁垒时,美团正以差异化策略撕开行业新切口——聚焦被忽视的商户服务领域,借助 AI 技术重塑酒店商家的运营逻辑。 酒旅商家的日常运营中有很多碎片化事务,比如处理各种售前咨询、售后问题,这些工作既麻烦又耗费人力,效率还不高。每一个定制行程方案,或者客户临时改行程,背后都要协调很多环节和资源。 传统模式下,仅头部企业能负担庞大客服团队与标准化管理体系,自从 ChatGPT 出现后,为了提升服务效率,也出现了客服机器人、AI 前台等一系列智能化工具,但这类产品存在一个共性问题——只能在几百个固定问答中机械性的做出标准回复,虽然能一定程度上缓解服务压力,但难以解决复杂场景需求。 美团推出垂类 AI Agent 美团既白,精准击中了商户服务的成本与效能痛点,通过降低 AI 应用门槛,让中小商家以轻量化投入获取智能化服务。这意味着,商家无需重金搭建技术团队,即可实现咨询响应、流程协调等场景的效率升级,经营的性价比变得更高,中小商家也迎来了更好的发展机会。 正如美团副总裁李锦飞所说:「2025 年旅游业将进入 AI 时代」,这个预言正在慢慢成真。随着 AI 技术的发展,未来行业竞争的关键在于如何利用数据做出更好的决策,以及实现生态各方更高效的协作。 AI 技术渗透的本质,是对低效环节的系统性改造;而生态协同的深化,则为打破合作壁垒创造可能。 从 NoCode 辅助开发到即白推动商户运营,美团的战略版图始终围绕「全链路效率重构」展开。不是单点优化,而是通过 AI 技术普惠化,推动整个生态的协同进化。
Sam Altman 表示 GPT-5 将于「今年夏天」发布 6 月 19 日凌晨,OpenAI 发布了其联合创始人兼首席执行官 Sam Altman 的 40 分钟深度专访。 本次访谈技术干货很足,Altman 谈到了大家非常关心的核心产品 GPT-5,大概率会在今年夏天发布,但也会因为命名、安全测试、功能迭代等原因延长产品时间。也谈到了高性能的 o3 模型以及智能体 Deep Research,这些产品对实现 AGI 的重要性。 此外,Altman 还提到了 OpenAI 的其他创新产品,包括 Sora、DALL-E 3、ChatGPT Junior 以及 5000 亿美元投资项目「星际之门」。基本上 OpenAI 所有重要产品、现阶段规划和未来发展都出现在了本次访谈中。(消息来源:AIGC 开放社区) 2000~2500 TOPS:特斯拉 HW5 芯片被曝已开始量产,台积电 / 三星代工 6 月 18 日消息,有报道称特斯拉「AI5 / HW5」下一代 FSD(完全自动驾驶)芯片已进入量产阶段,由台积电和三星共同代工。 消息称该芯片运算性能达 2000~2500 TOPS(每秒一万亿次操作),是现款 HW4 芯片(搭载于新款 Model Y)的 5 倍,可支持更复杂的无监督 FSD 算法。 代工厂商方面,台积电仍是特斯拉的首选,HW5 芯片会采用其 3nm N3P 工艺量产,而三星则作为备用代工厂,预计 2026 年特斯拉大规模量产 HW5 车型时才会启用。 此外,特斯拉计划于 6 月 21 日起在奥斯汀启动无人驾驶 Robotaxi 试点,首批投入 12 辆搭载 HW4 硬件的 Model Y,测试完全无人驾驶功能。(消息来源:IT 之家) 京东外卖未来规划:长期佣金费率不超过 5%,本季度末全职骑手扩招至 15 万人 6 月 18 日消息,京东举行「京东 618,又好又便宜」主题 2025 京东 618 媒体开放日。京东外卖商家成长策略负责人高洁在会上表示,上线 90 天京东外卖日订单量突破 2500 万单,目前已入驻超 150 万家品质餐饮门店。 她表示,京东外卖采用商家 0 佣金,商家利润比其他平台高 30%,并率先为骑手缴纳五险一金,全职骑手现已突破 12 万人。 同时,她还公开了京东外卖的未来规划:对用户,采用行业最严准入标准,三重审核机制坚守品质;对商家,坚持低佣金,长期佣金费率不超过 5%。 今年 4 月 15 日京东外卖宣布其日单量超过 500 万单,9 天后这一数字翻了一番至 1000 万单,5 月 15 日该数字又翻番至 2000 万单。(消息来源:IT 之家) iPhone Fold 预计将于 2026 年夏季开始量产 在天风证券郭明錤周三发表的 X 文章中,富士康将启动一个项目,在 2025 年第三季度末或第四季度初生产苹果首款可折叠智能手机。这意味着该项目的启动时间大约与 iPhone 17 上架的时间一致。 然而,即将投产的 iPhone Fold 的实际设计仍不确定。郭明錤表示,包括至关重要的铰链机构在内的许多部件规格「尚未最终确定」。 不过,折叠显示屏已经最终确定,郭明錤表示,三星显示器正准备为 iPhone Fold 生产 700 万至 800 万块可折叠面板。(消息来源:IT 之家) 曝 20 周年 iPhone 首发 LTPO 3 面板:手机屏幕迎来跨越式升级 6 月 19 日消息,为纪念 iPhone 诞生 20 周年,苹果准备在 2027 年推出一款革命性产品。 据媒体报道,苹果计划为 2027 年 iPhone 配备全新的 LTPO 3 显示屏,这块屏幕采用全新氧化物半导体显示技术,通过重构屏幕晶体管架构来大幅提升续航能力。尤其是在 1Hz 息屏显示场景,LTPO 3 屏幕能大幅降低功耗。 为此苹果制定了技术演进路线图:2025 年的 iPhone 17 系列全部标配 LTPO 2 屏幕;2027 年至少有一款机型将首发 LTPO 3 屏幕。 报道还称,苹果有可能会在 2027 年的 Air 机型上试水 LTPO 3 屏幕,因为超薄机型很难塞进大容量电池,配备更省电的 LTPO 3 显示屏可以有效延长手机续航。 值得注意的是,三星和 LG Display 将是苹果 LTPO 3 OLED 面板的主要供应商,苹果将在今年第三季度敲定哪些机型搭载 LTPO 3 屏幕. 供应链将有两年时间来改造产线,为大规模量产 LTPO 3 做好准备,这也标志着消费电子行业即将迎来显示技术的跨越式发展。(消息来源:快科技) TikTok 将在日本开展电商业务,最早本月启动「直播带货」 6 月 18 日消息,据日经新闻 17 日报道,TikTok 最早将于本月底在日本开展电商业务。其核心卖点是「直播带货」模式——通过直播向用户展示商品,并支持边看边买。 在日本,TikTok 用户每日平均使用时间达 44 分钟,具备不俗的用户黏性。6 月 2 日,为了增加购买功能,TikTok 改变了日本国内的隐私政策。在业界,认为「TikTok 最快将于月内在日本启动电商」的预测正在加强。 此次即将推出的新功能是支持直播带货的 TikTok Shop。卖家通过直播形式介绍商品,观众可一边观看一边下单购买,还能实时提问互动,体验接近线下购物。 此前,直播页面会将用户引导至外部购买网站。在应用程序内完成支付后,观看者的便利性将得到提高。用户还可以通过短视频或企业资料页面购买商品,相关功能预计将逐步开放。TikTok 还将向商家收取手续费。(消息来源:IT 之家) 美团回应「外卖日订单维持 9000 万量级以上」:数据基本属实 6 月 18 日,有消息称,自 6 月中旬开始,美团外卖日均支付订单始终维持在 9000 万量级以上,从单日 GMV 和餐食外卖市场单量等角度看,美团外卖市占率稳居 70% 左右。美团相关负责人对此表示,上述数据基本属实。 此前的消息称,从单日 GMV 和餐食外卖市场单量等角度看,美团外卖市占率稳居 70% 左右。多个接近美团外卖的消息人士向媒体证实上述消息属实。(消息来源:IT 之家) 京东推出面向酒店商家的会员计划,为酒店行业提供供应链服务 6 月 18 日,京东旅行发布致全体酒店经营者的一封公开信。 公开信显示,酒店商家参与「京东酒店 PLUS 会员计划」,享受最高三年 0 佣金。京东方面表示,希望通过新通路的方式为酒店行业提供供应链服务,优化供应链成本,共同把握增长机遇、携手并进,推动酒店行业的健康可持续发展。(消息来源:IT 之家) 小米曝光多款新品 平板全系对标 iPad 6 月 18 日消息,在今晚的小米人车家全生态新品先导发布直播中,小米集团总裁卢伟冰、REDMI 品牌总经理王腾曝光了多款即将发布的新品。 其中包括小米平板 7S Pro 和 REDMI K Pad 两款平板产品。 有博主表示,根据产品规划,小米平板 7 Ultra 将对标 iPad Pro 系列,主打旗舰性能与生产力;小米平板 7S Pro 对标 iPad Air 系列,定位中高端市场,小米平板 7/7Pro 则瞄准 iPad 数字系列;小尺寸的 REDMI K Pad 对标 iPad mini。 该博主还表示,「小米平板确实野心不小,玄戒芯片也开始上量,平板线全球市场第三、国产第一只是一个开始。」(消息来源:快科技) NVIDIA 将推中国特供 RTX 5090 DD:只剩 24GB 显存 6 月 18 日消息,根据最新爆料,NVIDIA 计划推出一款专为中国市场设计的 RTX 5090 DD 显卡。 这款显卡是在已经降规的 RTX 5090 D 基础上进一步降低规格的产品,其主要目的是为了规避美国政府的芯片出口限制。 根据爆料,RTX 5090 DD 将搭载 GB202-240 芯片,而 RTX 5090 D 使用的是 GB202-250 芯片,标准版 RTX 5090 则为 GB202-300 芯片。 这款新显卡还将采用全新的电路板设计,型号为 PG145 SKU 40,RTX 5090 DD 的显存也有较大调整,显存位宽从 512-bit 降至 384-bit,显存容量也从 32GB 减少到 24GB。 RTX 5090 DD 的 GPU 运算单元数目与 RTX 5090 D 保持一致,拥有 21760 个 CUDA 核心、170 个 RT 核心和 680 个 Tensor 核心。 不过,其 AI 运算性能同样受到限制,执行 AI 运算时性能会降至 2375 AI TOPS。 好的一点则是由于规格的降低,RTX 5090 DD 的功耗预计将明显下降,而且此前 RTX 5090D 的游戏性能几乎没有降低,而 RTX 5090 DD 的游戏性能则肯定下降,NVIDIA 不太可能继续采用与 RTX 5090D 相同的定价策略。 据 Wccftech 猜测,RTX 5090 DD 的售价可能会降至 1500 美元(约 10780 元人民币)左右。(消息来源:快科技) 研究发现 Google Gemini 在玩《宝可梦》时有机会陷入恐慌状态 G 在过去的几个月里,两家与 Google 和 Anthropic 无关的开发商分别建立了 Twitch 直播,名为「Gemini Plays Pokémon」和「Claude Plays Pokémon」,任何人都可以实时观看人工智能尝试操作一款 25 年前的儿童电子游戏。最近,Google DeepMind 在一份报告中指出,Gemini 2.5 Pro 在其宝可梦濒临死亡时会陷入恐慌。 这种「恐慌」状态可能会导致模型性能下降,因为 AI 可能会在一段时间内突然停止使用某些可用的工具。虽然 AI 不会思考或体验情感,但它的行为却模仿了人类在压力下做出糟糕、草率决定的方式——这是一种令人着迷却又令人不安的反应。 报告称:「这种行为已经发生过很多次,Twitch 聊天室的成员已经注意到了它的发生。」 Claude 在关都地区的旅程中也表现出了一些奇怪的行为。有一次,AI 发现了一个规律:当所有宝可梦的生命值耗尽时,玩家角色就会「脸色苍白」,然后返回宝可梦中心。 当 Claude 被困在月山洞穴时,它错误地假设,如果它故意让所有的神奇宝贝都昏倒,那么它将被传送穿过洞穴到下一个城镇的神奇宝贝中心。然而,游戏并非如此。当玩家的所有宝可梦都死亡后,就会回到你最近使用的宝可梦中心,而不是地理位置最近的。观众们惊恐地看着游戏中的 AI 试图自杀。 尽管存在一些缺陷,但 AI 仍有一些方面可以超越人类玩家。自 Gemini 2.5 Pro 发布以来,AI 已经能够以令人印象深刻的准确率解开谜题。在一些人工的帮助下,人工智能创建了代理工具——针对特定任务的 Gemini 2.5 Pro 实例——来解决游戏中的巨石谜题并找到到达目的地的有效路线。 报告称:「仅需一个描述巨石物理的提示和一个如何验证有效路径的描述,Gemini 2.5 Pro 就能一次性解决一些复杂的巨石谜题,这些谜题是通向胜利之路所必需的。」(消息来源:cnBeta)
好饭不怕晚,MiniMax 终于把这款金字塔尖的推理模型拿出来了。 在将 MoE 和 Lightning Attention(闪电注意力)的激进架构变革引入基础模型底层,转化为全新的 MiniMax-01 系列模型的 5 个月后,大模型公司 MiniMax 终于更进一步,捧出了酝酿许久的自研文本推理模型 MiniMax-M1,这也是全球首个开源、大规模实现混合注意力的推理模型。 推理模型已成为新的大模型技术浪潮,拿出一款强劲的自研推理模型,是近半年里国内第一阵营的大模型公司保持自己技术身位最直接的目标。 01 金字塔尖的文本推理模型 作为推理模型,MiniMax-M1 在长上下文理解能力上,是目前包括所有闭源和开源模型在内,能力全球前二的模型 ,且在 训练和推理成本上极高的性价比 。 M1 仍然延续着 MoE 架构,而在注意力机制上和强化学习算法上的创新让 M1 鲜明的区别于其他推理模型。模型总参数达到 4560 亿参数,原生支持 100 万 token 的上下文长度输入,以及目前所有模型中最长的 80k token 的输出长度。 在上下文能力的评测基准 OpenAI-MRCR (128k/1M) 以及 LongBench-v2 中,M1 的表现远超包括 DeepSeek-R1-0528 和 Qwen3-235B 在内的所有开源模型,甚至超越 OpenAI o3 和 Claude 4 Opus,仅小幅落后 SOTA 的 Gemini 2.5 Pro。 除了在长上下文能力上的强势,M1 所展现出的在智能体工具使用(Agentic Tool Use)维度上的能力上限甚至更加让人期待。从评测基准 TAU-Bench (airline) 中的表现来看,目前 M1 已经是市面上在 Agentic Tool Use 方面能力最强的模型。 技术报告中对于 M1 的概述是,这个新的开源模型已是与 DeepSeek-R1、Qwen3-235B 并列的世界顶尖开源推理模型,这一结论是在参与了业内主流的 17 个评测基准之后得出的。在处理复杂场景时长上下文、智能体工具使用能力上的长板足够亮眼,M1 在更通用的模型性能上也已经跨入顶尖行列。 此外需要特意说明的是,M1 系列模型中的两个模型中,MiniMax-M1-40K 模型是 MiniMax-M1-80K 模型在训练时的中间阶段。而在测评基准所呈现的总体表现中,MiniMax-M1-80k 在多数基准上持续优于 MiniMax-M1-40k,这也验证了上下文窗口长度带来了模型整体性能的显著提升,而非仅仅意味着支持更长的输入。 02 从架构到算法,更彻底的「双线创新」 与市面上主流的推理模型相比,M1 在底层架构和算法层上都有所创新。 在底层架构层面,M1 是目前唯一一个用线性注意力机制「大改」传统 Transformer 架构,从而大规模实现混合注意力的 MoE 推理模型;在算法层面,M1 提出了新的强化学习算法 CISPO。更彻底的双线创新提高了 M1 的训练效率,而训练成本的下降也非常可观。 为解放 Transformer 架构中核心的注意力机制 Softmax Attention 在计算资源消耗方面的局限性,M1 系列模型在注意力机制的架构设计方面相比传统架构的推理做了更大胆的尝试——采用混合注意力机制 Lightning Attention——来代替标准 Transformer 中使用的传统 Softmax Attention。 独特的注意力层设计让 M1 在推理时具有显著效率优势,天然有利于强化学习的高效扩展,但走到混合架构大规模强化学习的无人区,MiniMax 显然也会遇到新架构带来的挑战。 比如在混合架构的初步零强化学习(zero-RL)实验中,团队发现传统的 PPO/GRPO 算法会意外的严重损害训练性能。具体来说,与反思行为相关的关键 token——例如表示转折的 however、wait——这些低概率 token 对稳定熵和促进可扩展 RL 至关重要,但却容易在策略更新时被裁剪,难以保证这些 token 的梯度贡献,导致难以促进长 CoT 推理行为。此问题在混合架构模型中尤为突出,阻碍了强化学习的规模扩展。 为此,M1 在算法层面提出了新的强化学习算法 CISPO,意在明确避免丢弃任何 token(即使更新幅度大),同时将熵维持在合理范围以确保稳定探索。 在 zero-RL 设置下,MiniMax 团队在数学推理数据集上训练 Qwen2.5-32B-base,对比 CISPO、 字节跳动提出的 DAPO 以及 DeepSeek 提出的 GRPO 算法在 AIME 2024 上的表现。相同步数下 CISPO 显著优于 DAPO 和 GRPO;其训练效率更高,仅需 DAPO 50% 的步数即可达到同等性能。 底层架构上对于线性注意力机制的引入,以及算法层围绕 CISPO 所形成的高效 RL 框架,最终让 M1 的强化学习训练变得十分高效,进而取得了训练成本的大幅下降。 与模型一同发布的技术报告中显示,在生成长度为 10 万 Token 时,M1 的计算量仅为 Deepseek R1 的 25%,而整个 M1 的完整强化学习训练能在 512 张 H800 GPU 上仅用 3 周完成,以目前的 GPU 租赁价格计算,成本仅为 53.47 万美元。 MiniMax 官方也发布了几个 demo,我们可以从中看到 M1 究竟能做到什么。 比如最经典的用贪吃蛇游戏测试 coding 能力的测试玩法,但这次 M1 展示的是用一句自然语言生成一个更复杂的迷宫游戏。 Prompt 是这样的: 创建一个迷宫生成器和寻路可视化工具。随机生成一个迷宫,并逐步可视化 A* 算法的求解过程。使用画布和动画,使其具有视觉吸引力。 或者让 M1 来帮你从 0 到 1 搭建一个能够测试打字速度的网页: demo 里可以清晰看到,M1 在生成的网页中思路清晰的设置了代表打字速度的 WPM(words per minute)和准确度的 Accuracy 两个指标,并且体贴的让上方文字随着你的输入进程而同步变色。 又或者,用户可以直接让 M1 做一个可拖拽的便签墙。 这些 demo 都在指向一些通用 agent 中产品化 feature 的可能性。长上下文理解、智能体这些在模型能力产品化过程中的核心能力,恰好是 M1 模型的强势所在。这符合 MiniMax 最早以产品起势的路线,而这家公司近来在基础模型层面持续的激进探索,也以 M1 的出现为节点,在当下大模型公司们技术突破普遍降速的时候显示出后劲。 03 从 MoE 到 Linear,再到 MiniMax-M1 M1 的出现,背后是一条 MiniMax 从传统的稠密模型与 Transformer 架构,转向 MoE 与线性注意力机制的草蛇灰线。在 MiniMax 决定引入 MoE 与线性注意力机制的时候,在当时几乎都没有什么可以参考的对象。 Mistral AI 在 2023 年底用开源的模型 Mistral 8✖️7B 击败了当时最优秀的开源模型之一,700 亿参数的 Llama 2。2023 年夏天,MiniMax 已经在准备从稠密模型转向 MoE,投入了当时公司 80% 的算力与研发资源,在 Mistral 8✖️7B 发布的一个月后,上线了国内首个 MoE 大模型 abab 6,并且由于这是个过于新的架构,MiniMax 为 MoE 自研更适配的训练和推理框架。 MoE 架构 M1 的混合架构的特征,则开始于今年年初 MiniMax-Text-01 模型里线性注意力(Linear Attention)混合架构的引入。 MiniMax 开始投入 Linear Attention 是从 2024 年 4 月开始的,那时尚没有模型在千亿级别的参数规模层面挑战传统的 Transformer 架构。这使得 MiniMax 需要对分布式训练和推理框架进行彻底的重新设计来适配,使得模型能够在大规模 GPU 集群上高效运行,这才有了今年 1 月的 MiniMax-Text-01,这也是第一个依赖线性注意力机制大规模部署的模型。 可以说,MiniMax-Text-01 是 MiniMax 在线性注意力这件事上,为整个行业从小规模可行的共识,到 Scale up 的可行做了一次验证。而推理模型 M1,本质上又是一次基于 MiniMax-Text-01 的 scale up 和架构创新。 MiniMax 也公开了一部分 M1 基于 MiniMax-Text-01 训练的细节。 团队以 MiniMax-Text-01 为基座,实施 7.5 万亿 token 的定向增强预训练,将 STEM(科学/技术/工程/数学)、编程代码与复杂推理三类核心领域的数据权重提升至总语料 70%。随后通过监督微调阶段注入链式思考(CoT)机制,系统性构建模型的分步推理能力,为强化学习奠定能力基础。 最终这种激进式的创新得到了积极的验证,M1 是目前全球最先抵达 80k 上下文输出的推理模型,同时在长上下文,软件工程和 Agent 工具使用方面体现出了优势。 此前星野和 Talkie 在商业化上的优异表现,让 MiniMax 早早成为一家可以自己独立行走的大模型公司,也让外界赋予了这家公司一个「产品驱动」这样过于笼统的标签。这一定程度上忽视了 MiniMax 在模型层面上相当强悍的研发能力。 值得注意的是,MiniMax 的官方公告透露,M1 系列模型同时也拉开了为期五天的 MiniMaxWeek 的序幕,未来五天,MiniMax 会围绕文本、语音和视觉等多模态模型对外公布更多的技术进展。 与此前 MoE 的 Abab 6 模型刚出现时类似,此次发布的混合注意力机制的 M1 在底层架构层面仍然是一个「非共识」的推理模型,但也正是因为这些屡次探入模型底层架构「非共识」地带所带来的技术创新,一直在印证 MiniMax 终究是一家「模型驱动」的 AI 公司。 而这早该成为一种共识。
面对嗑药质疑,马斯克公布药检结果自证清白 6 月 17 日,马斯克下午公布了其药检结果,对于外界所谓马斯克在美国大选前「经常服用氯胺酮」的说法进行了回击。 如图所示,马斯克分享的报告中包含了一系列非法和医疗物质的阴性结果,包括摇头丸、可卡因和氯胺酮。 此外,《纽约时报》通过「近期基于接近马斯克竞选活动的消息人士」获悉,马斯克不仅公开承认使用氯胺酮进行治疗,还被指曾使用迷幻药和可卡因,且其药物使用程度远超此前报道。 《纽约时报》援引消息人士的话称,马斯克在为特朗普宣传时,不仅使用了摇头丸和食用了迷幻蘑菇,还向身边人透露,他因频繁使用氯胺酮而出现了膀胱问题。这位 53 岁的企业家还被报道随身携带一个装满至少 20 种药物的日常药盒,其中包括利他林。 针对有关「经常服用氯胺酮、摇头丸和迷幻蘑菇」、「吸毒成瘾导致膀胱问题」的报道,马斯克在 X 上发文进行了澄清:「我必须要澄清的是,我没有吸毒!《纽约时报》纯属胡编。几年前我试过处方氯胺酮,还在 X 平台上说过这事,所以这根本不算新闻。它确实有助让人走出负面情绪的深渊,但从那以后我就没再用过了。」(来源:IT之家) Meta 开始测试 AI 自动生成视频广告功能 6 月 17 日,彭博社报道称,Meta 正深入探索 AI 生成广告技术,从而降低广告商制作广告内容的成本和复杂性。 当地时间周二,Meta 宣布升级图像转视频广告工具,允许营销人员利用人工智能将产品图片转化为多场景视频广告。广告主最多可上传 20 张图片来创建视频,并可添加背景音乐和文本。 Meta 已将 AI 作为其广告业务的关键重点(该业务约占其年收入的 98%),但目前 Meta 大多数广告客户是小型企业。因此,帮助他们降低广告素材制作成本,可使他们将更多预算用于 Facebook 或 Instagram 上的广告投放。 Meta 还允许广告商使用文本提示创建广告图,并于去年 10 月推出将图片转化为 AI 动图广告的功能。该公司还在为普通消费者开发一款名为 Movie Gen 的文本转视频工具(于去年秋季首次亮相)。 彭博社表示,此次新功能的发布与法国戛纳举行的 Cannes Lions 广告节同期进行。同期,短视频平台 TikTok 也推出了新的 AI 广告工具,包括广告视频生成功能。(来源:IT之家) 谷歌新广告嘲讽苹果 iOS 26:三项功能安卓早就有了 6 月 17 日,在一则新广告中,谷歌称苹果 iOS 26 中出现了 Pixel 手机多年来一直拥有的三项安卓功能:实时翻译、通话保持和来电筛选。 这则广告是谷歌「Best Phones Forever」系列宣传内容的一部分,展示了 iPhone 和 Pixel 9 Pro 在虚构播客中互相交谈。 iPhone 说道:「我公布了短信实时翻译功能。」 Pixel 9 Pro 回应道:「我四年前就有这项功能了。」 iPhone 说道:「是啊,真是个疯狂的巧合。」 同样,iPhone 提到了「通话保持」和「来电筛选」,而 Pixel 手机表示这些功能安卓早就提供了。(来源:IT之家) 京东 CEO 许冉:一线城市全职外卖骑手人均收入已经接近 13000 元 6 月 17 日,在「七鲜美食 MALL 哈尔滨首店开业」媒体沟通会上,京东集团 CEO 许冉表示,「京东从来不觉得自己是纯粹互联网公司,我们是『以供应链为基础的技术与服务企业』,我们认为作为一家公司不仅要为员工、股东创造价值,也要为社会创造价值,这也是我们为什么一开始就愿意为员工缴纳五险一金。」 她还透露,「京东外卖全职骑手已突破 12 万人,预计这个季度末会超过 15 万人。随着订单的饱和度提升,我们全职外卖骑手的收入水平也在提升,我们也看到,在北上广深一线城市,我们的全职外卖骑手人均收入已经接近 13000 元。」 许冉进一步表示,「包括我们做外卖,其实也并不仅仅为了商业利益,是为了创造更多的就业机会。」(来源:格隆汇) 消息称美团外卖日单量连日超过 9000 万,餐食外卖市占率 70% 6 月 17 日,雷峰网报道称「获得一组流传的数据」,自 6 月中旬开始,美团外卖日均支付订单始终维持在 9000 万量级以上,从单日 GMV 和餐食外卖市场单量等角度看,美团外卖市占率稳居 70% 左右。 多个接近美团外卖的消息人士向该媒体证实上述消息属实。此前,晚点在 5 月 30 日也曾披露过,美团外卖的日订单在 8000-9000 万单之间。 一家为多家外卖平台提供服务的代理商表示,如果剔除茶饮订单,仅关注餐食类外卖,不管订单量还是 GMV,美团外卖在餐食外卖的市占率始终维持在 70% 以上。 此前报道,在上周的美团 2025 年股东周年大会上,美团 CEO 王兴表示,行业有很多玩家、有更多竞争都是正常的,但不健康的无效「内卷式」竞争,无论对平台还是商家来说,长期都不可持续,对行业有负面影响,美团坚决反对内卷。(来源:雷峰网) 马斯克旗下 xAI 被曝正谈判 43 亿美元的股权融资 6 月 17 日,据彭博社,投资者文件显示马斯克 AI 初创公司 xAI 正就 43 亿美元(现汇率约合 308.87 亿元人民币)股权融资进行谈判。 投资者文件显示,马斯克的 AI 公司之所以需要这笔新资金,部分原因在于它已经花掉了之前筹集的大部分资金。 文件显示,自 2023 年创立至今年债务发行启动前,xAI 通过股权融资筹集 140 亿美元(现汇率约合 1005.64 亿元人民币)。但截至 3 月 31 日,公司资产负债表仅剩余 40 亿美元(现汇率约合 287.33 亿元人民币)现金。 另据知情人士透露,针对 50 亿美元(现汇率约合 359.16 亿元人民币)债务融资的承诺书将于周二截止。 知情人士表示,除新融资外,xAI 还可能从其一家制造商那里获得 6.5 亿美元的回扣,这将帮助该公司进一步削减成本。 针对融资进展,xAI 发言人与负责债务发行的摩根士丹利发言人均拒绝置评。(来源:IT之家) 蔚来汽车:2025 至 2026 年将进一步拓展欧洲市场 6 月 17 日,蔚来官方宣布:蔚来将于 2025 至 2026 年进一步拓展欧洲市场。 蔚来将在葡萄牙、希腊、塞浦路斯、保加利亚、丹麦通过国家总代理模式,推出两个品牌的五款车型,包括蔚来 EL6(中国市场 ES6)、EL8(中国市场 ES8)、ET5、ET5 Touring(中国市场 ET5T),以及 firefly 萤火虫车型。 据蔚来汽车官方获悉,蔚来在葡萄牙市场将与西南欧领先的出行服务商 JAP 集团开展合作,后者据称拥有超过 120 年的行业经验。 蔚来将携手老牌国际出行服务商 Motodynamics 集团于 2025 年进入希腊市场,并于 2026 年进入塞浦路斯和保加利亚市场。此外,蔚来还将在丹麦市场与北欧出行服务企业 Nic. Christiansen 集团合作。(来源:IT之家) 消息称苹果 Apple Watch Ultra 3 有望今年发布,或新增卫星连接与 5G 功能 6 月 17 日,据 GF 证券香港分析师 Jeff Pu 透露,苹果 Apple Watch Ultra 3 有望于今年正式发布。 根据 Pu 分享的最新产品路线图,除了 Apple Watch Ultra 3 之外,Apple Watch Series 11 也将于今年推出。这两款新品很可能会与即将发布的 iPhone 17 系列一同亮相,延续苹果公司以往的产品发布节奏。 对于 Apple Watch Ultra 系列的粉丝来说,过去一年的等待显得尤为漫长。2024 年,苹果公司并未对这款坚固耐用的智能手表进行重大更新,仅为其推出了黑色钛金属的配色,作为对 Apple Watch Ultra 2 的补充。这意味着,从今年 9 月开始算起,距离上一次 Apple Watch Ultra 系列的实质性更新已接近两年之久。 Jeff Pu 的预测与其他行业观察者的预测不谋而合。许多分析师都预计,苹果公司将在今年秋季的发布会上对 Apple Watch 全系产品进行更新换代。据彭博社记者 Mark Gurman 推测,Apple Watch Ultra 3 可能会新增卫星连接和 5G 功能,这些先进的技术特性或许能够为该产品长达两年的开发周期提供有力的解释。 此外,Jeff Pu 预计,苹果公司将在今年推出传闻已久的 HomePad 平板电脑,而 AirPods Pro 3 的发布则可能会推迟到 2026 年。这一时间表与近期其他预测相冲突。(来源:IT之家) 本田海外推出 Fastport eQuad 快递配送用电动四轮车:至多携带 295 千克物品、续航约 37 公里 6 月 17 日,本田在海外推出了一款 Fastport eQuad 车型,该车定位类似国内各大快递公司用的「电三轮」,作用也完全一致,就是用于派送快递,不过其具备四个轮子,因此可以提供更好的稳定性。 据介绍,该车号称专门用于非机动车道行驶,拥有两种版本,分别为「长 3.4 米、宽 1 米」的小型版本,可携带 145 千克物品;以及「长 3.65 米、宽 2.1 米」的加大版本,可携带 295 千克物品。两种版本车型均搭载 Mobile Power Pack 换电技术,最高速度 20 公里 / 时,最长续航约 37 公里。 其他方面,该车号称针对驾驶员进行了一系列设计以确保其舒适性,具体来说,该车顶棚带有紫外线涂层,同时车内配有风扇,对于酷热天气及阴雨天气有一定舒适性改善。(来源:IT之家) Rokid 推出全球首款内置支付功能的智能眼镜,支持支付宝「看一下支付」 6 月 17 日,Rokid 宣布其智能眼镜 Rokid Glasses 成为全球首款具备支付功能的智能眼镜,内置支付宝「看一下支付」,实现用户通过语音和眼镜识别完成支付,无需掏出手机。用户只需佩戴眼镜,说出支付金额并确认,便可完成付款,适用于早餐、菜场、骑车等多场景,尤其对残障用户更为友好。 Rokid 与支付宝联合保障支付安全,承诺「被盗即赔」。双方未来将拓展如停车缴费、生活缴费等更多便捷服务。业内人士称此举是智能眼镜产业的重要里程碑。目前 Rokid Glasses 全球订单已超 25 万台,6 月底开始交付。(来源:极客公园) 百度:推出首个多模态高度融合数字人 6 月 17 日,百度在「AI Day」开放日上宣布推出业界首个双数字人互动直播间,同时也是业内首个多模态高度融合数字人。据介绍,该技术基于文心大模型 4.5T 升级,实现了语言、声音、形象的协调一致。(来源:证券时报) 美国一特斯拉开进火车轨道被撞,司机称车辆当时在自动驾驶 6 月 17 日,据报道,近日,美国宾夕法尼亚州伯克斯县一辆特斯拉 Model 3 发生交通事故。 事故现场照片显示,这台 Model 3 卡在了火车轨道上,且车辆与一旁的火车发生碰撞,副驾侧后视镜也被折断。 当地消防专员下令暂停该条线路的所有火车交通,紧急服务部门正在使用起重机将 Model 3 从轨道上移开。 报道称,涉事特斯拉司机称,当事车辆正处于「自动驾驶」模式,导致他们卡在轨道上发生事故。 伯克斯消防专员贾里德·伦肖向当地媒体透露,这辆车「沿着轨道行驶了大约 40-50 英尺」。根据司机的描述,特斯拉显然将火车轨道误认为是一条道路,并像正常路线一样行驶。 此事也引起当地网友的质疑,有人表示,当特斯拉 FSD 开始绕过火车护栏时,驾驶员没有想到踩刹车吗。 特斯拉也没有将 FSD 作为自动驾驶司机进行营销,强调使用时仍需要人类驾驶员监管。 目前,特斯拉方面还未对此事进行回应,后续消息以官方为准。(来源:快科技)
6月11日,小鹏G7正式亮相并发布预售。作为2025年小鹏首款全新车型,G7预售两大版本:Max版 / Ultra版,预售价仅需23.58万元起。 在这场发布会上,何小鹏介绍了G7的部分卖点,比如3颗图灵AI芯片、AR-HUD、702km 超长续航、819L魔法后备厢、电动小桌板等等。 不仅如此,它也更像一场技术发布会,技术很硬核,发布会上一堆像VLA、VLM这样的专业名词,可能让普通用户稍感陌生。 官方海报显示,预售开始仅46分钟,小订订单量就已破万。不过值得注意的是,小鹏股价下滑6.66%,市值蒸发103亿港币,最新总市值为1453亿港币。 顶着「全球首款L3级算力AI汽车」的光环,小鹏G7要怎么改变行业?再次硬刚特斯拉Model Y和小米YU7,它能胜出吗? 「算力怪兽」入场 大家玩大型3D游戏,都希望自己的电脑有块好的显卡,比如RTX 4090。为什么?因为显卡强,游戏画面才能又流畅又逼真,不卡顿、不掉帧。 在智能汽车领域,也是如此。不同于显卡比拼核心数量、显存容量和带宽等,智能汽车芯片比拼的是算力(TOPS)。它决定了汽车的「大脑」转速有多快,能同时处理多少信息。目前,市面上比较主流的智能汽车,算力大约在80到700 TOPS之间。 而小鹏G7呢?它搭载了3颗小鹏自研的「图灵AI芯片」,总算力超过了 2200 TOPS,因此官方给 G7 的标签之一是第一款「具备 L3 级别算力」的 AI 汽车。G7的算力是行业主流旗舰的 3 倍到 28 倍,这让它能运行更复杂、更智能的AI程序。 不过,发布会现场,何小鹏并没有公布图灵芯片的具体算力。但从三颗算力超过2200TOPS的表述来看,一颗图灵芯片大概有 700-750TOPS 的稀疏算力。 看到三颗芯片、2200 TOPS的数字,很多人可能会好奇:这三颗芯片都用于辅助驾驶吗? 搭载3颗图灵AI芯片,算力超过2200TOPS | 图片来源:小鹏汽车 其实并不是。据了解,小鹏G7首次增加座舱专属图灵AI芯片,采用图灵AI芯片+高通8295P,有效AI算力比行业旗舰大26倍。这意味着,相比主流车型的双Orin-X和8295组合,小鹏在智能座舱方面增加一块图灵AI芯片,在辅助驾驶方面,用两块图灵AI芯片替代了双英伟达Orin-X芯片。 推出了性能这么强大的芯片,肯定要讲一讲背后不为人知的故事。现场,何小鹏分享了一段「惨痛」的经历。 在2022年初,他们发现正在合作研发的芯片,底层架构存在问题。如果继续下去,未来的功能升级会处处受限。当时,他们面临一个艰难的选择:是打个补丁凑合用,还是推倒重来? 他们选择了后者。这意味着终止与全球知名公司的合作,内部团队从零开始,把核心模块全部重做。这个决定,让小鹏直接损失了数亿人民币。 自研芯片的好处是量身定制、性能极致,但挑战也巨大——成本。芯片的研发费用非常高,只有通过庞大的销量才能摊薄成本。 苹果公司之所以能持续推出强大的A系列自研芯片,是因为iPhone每年轻松卖出上亿台。但对汽车行业来说,要真正实现大规模上车,难度要比手机行业大得多。 何小鹏请教业内人士后发现,对于高算力芯片来说,100万颗只是「生死线」。小鹏正在经历一场「豪赌」。 特别需要注意的是,小鹏G7并非标配三颗图灵AI芯片。只有顶配的Ultra版才搭载三颗图灵芯片,而Max版则依然使用了两颗英伟达Orin X芯片。 凭什么敢称「超级AI」? 小鹏用3颗自研芯片,释放出2200TOPS的算力,到底有多大意义?是技术突破,还是在「堆料」呢? 对此,何小鹏表示,他们要做的是大模型的本地化部署。这就引出了小鹏G7的两个关键词:大模型和本地部署。 VLA实际上是掌管运动的大脑和小脑 | 图片来源:小鹏汽车 在技术层面,小鹏采用VLA+VLM模型。VLA (Vision-Language-Action) 模型,你可以把它理解成「行动决策大脑」。它不像只会背书的学生,而是像一个经验丰富的老司机。它通过摄像头看到世界,用AI去理解这个世界,然后做出最合理的行动。 打个比方,看到前方路面塌陷,老司机的反应是「哦,那里有个大坑,很危险,我得绕过去」,而不是去匹配脑中的某条「驾驶规则」。VLA能像人一样「理解」场景,然后做出决策。 VLM是小鹏G7理解世界的大脑,是整车跟人交互OS的入口 | 图片来源:小鹏汽车 而VLM (Vision-Language Model) 模型,则可以叫它「理解世界的大脑」。如果说VLA负责「怎么开」,VLM就负责「看懂了什么」以及「如何与你交流」。 举个例子, 你对车里说:「帮我看看外面是不是要下雨了?」,普通的语音助手可能会去上网查天气预报。而搭载VLM的G7,可能会通过摄像头「看」到天空乌云密布,然后回答你:「是的,天空很阴沉,可能很快会下雨,我已经帮您关闭天窗了。」 它能将看到的视觉信息和你的语言指令结合起来。 简单来说,VLA掌管车的运动与行动决策,而VLM则负责理解与交流,是整车跟人交互OS的入口。 看到这里,可能很多人会有些疑问,现在行业里都在从VLM转向VLA,为什么小鹏还要两个都做?作为智能「优等生」的小鹏,为啥要选择有些落后的方案呢? 对此,何小鹏表示,VLA的趋势他也认同。如果将来算力巨大,能力更强,或许一个模型就够了。但路径和节奏也很重要。当前阶段,将大脑分区是更加可行的方案。这种分工可以让不同任务变得更高效,系统变得更加稳定和可靠。 小鹏G7的另一个关键词是本地部署。什么意思呢?比如你玩手机游戏,有的游戏需要全程联网,一旦网络卡顿或者没信号(比如在地下车库、隧道里),游戏就玩不了了,这叫「云端运行」。而有的游戏下载到手机上就能玩,不需要网络,这叫「本地端运行」。 G7的本地化部署,是把所有的计算和决策都在车内完成,不依赖网络。这意味着,无论你是在穿越无人区的戈壁,还是在信号屏蔽的隧道里,它的「大脑」都在全速运转,不受网络情况的影响。 继续围攻Model Y? 预售价23.58 万起的G7, 帮助小鹏重拾20万以上的纯电 SUV 市场,填补 G6 和 G9 之间的市场空白。这个预售价也比特斯拉Model Y(26.35万元)低2.77万元。 2025年焕新版的特斯拉Model Y,起售价为26.35万元 | 图片来源:特斯拉官网 其实,这个价位的新能源SUV 玩家众多,去年乐道 L60、智己 LS6、极氪 7X等「六大门派」围攻特斯拉Model Y,但并未成功。 这一方面,是特斯拉的品牌信仰与用户心智垄断。因为特斯拉的先发优势,Model Y长期占据“电动车=特斯拉”的认知,品牌形象经常拿来和苹果对比。这是国产新能源品牌很难逾越的鸿沟。 另一方面,Model Y在性能、续航、智驾、充电网络等维度表现均衡,几乎没有短板。国内品牌大多通过单点突破,强调操控性或家庭使用等特点,但在综合体验上仍有所欠缺。 不过,随着特斯拉在中国市场显现出颓势,包括小鹏G7、7月上市的小米YU7在内的玩家,迎来最好的挑战机会。根据乘联会数据,2025年5月特斯拉中国销量同比下降15%,降至6.17万辆,已连续8个月出现同比销量下滑。 当特斯拉还在依赖品牌溢价时,小鹏G7带着硬核科技、空间舒适的卖点,对Model Y再次发起冲击。这一次,不仅仅是单点竞争,而是体系化能力的较量。小鹏在经历了过去两年的调整后,胜算也比之前大了很多。
6 月 10 日,2025 年高考的最后一门考试结束。但是,对于全国千万考生家庭而言,接下来要面对的志愿填报,是另一种高考。 面对 3000 多所大学的招录信息和对未来生活的憧憬,考生和家长对于现实的考量变得更加具象化。市场也开始批量制造不同类型的志愿填报产品和服务,以满足 05 后对于志愿填报的个性化需求。 从「张雪峰」们动辄上万元的规划服务,到社交平台上售价数千元的「低配版」辅导,再到数百元的「AI 软件」,高考报志愿的商业化浪潮逐渐达到高峰。 很多 AI 产品凭借在数据和大模型上的能力开始拆掉横亘在考生面前的信息墙。大模型出现在志愿填报场景中,让更多考生和家长得以实现信息平权。 作为连续七年深耕高考信息服务的平台,夸克今年再次站在了考生身后——不仅发布了行业首个高考志愿大模型和高考知识库,还推出了「志愿报告」「高考深度搜索」等以 AI 为核心的功能。 夸克的目标很明确:通过产品创新和 AI 技术,回答好每一个与志愿填报有关的开放性问题。同时,让每一位考生都有一份专业的志愿报告,辅助他们进行人生决策。 01 如何打造 好 「 个性化 」的 志愿报告 ? 在类似张雪峰这样的真人志愿填报服务中,老师们首先要做到掌握大量的数据和独家信息,构建属于自己的护城河。然后通过一对一提问的方式,深入了解考生的信息、爱好和家庭情况,从而进行分析和判断。在经过修改和比对后,会以「志愿报告」作为最终交付结果给到作为用户的考生。 面对志愿报告这一信息密度极高、决策链路极长的复杂场景,AI 生成的「志愿报告」会是怎样的? 在夸克推出「志愿报告」后,笔者实际体验了这一功能。我们以北京成绩为 630 分的物化生考生为例,设定他喜欢法学并想成为律师。先填写他的个人信息和兴趣偏好,通过 12 道问题,完成个人档案的建立。 点击确认后,夸克会开始制作报告,全程时间在 5-10 分,页数在 15-20 页。 在这个过程中,夸克会依托高考志愿大模型,以 Agent 调用的方式,为考生提供个性化的规划建议。最后,输出 3 份不同侧重的专业报告(专业优先、院校优先和地域优先),报告的内容包括策略设计、院校专业明细、志愿表解读等,用户可以直接添加进志愿表或导出 PDF。 从报告的结果上看,它能够理解我在法学上的偏好,并且结合 985、211 院校和特色学科展开有梯度的规划。 它还能把城市、学费以及专业就业等情况进行分析,融入到所推荐的学校和专业里,可以让考生更清晰地掌握所有信息,而非简单的大学和专业信息。 有数据显示,每年只有 2% 的考生会选择进行线下咨询。那么对于 98% 的考生来说,夸克的出现,让更多考生不再被地域和费用困扰,志愿填报的信息差越来越小。 除此之外,在高考深度搜索功能的加持下,即使是一些开放性并且高度口语化的描述,夸克也能给出更符合现实的参考建议, 例如,笔者使用「山东物化生男孩,647 分,推荐可以上去的 985 学校,可以中外合作办学,以后想考研或者出国留学,做一下志愿填报」作为提示词,体验了一次高考深度搜索能力。 在这个提示词下,夸克首先会解析考生的核心诉求——分数、选科、兴趣、地域偏好,然后在其庞大的高考知识库中进行多维度匹配和推理。这个知识库不仅包含了历年的院校录取数据、专业信息、就业率、深造率等结构化数据,还融入了大量关于行业发展趋势、专业与职业关联性的非结构化知识。 02 「 专家 大脑 」 是如何炼成的 为了让这些前端的用户体验更加准确,夸克今年选择进一步下注在 AI 模型能力的拓展上,算力投入激增 100 倍。 虽然是基于通义千问,但夸克高考志愿大模型并非简单地对通用模型进行微调,而是通过由高考志愿专家真人判别价值、引导的策略精化机制,让模型做到真正「像志愿专家一样思考给出建议」。 要实现这一目标,夸克首先要让 AI 学会模仿真人专家的「思维链」。在指令微调阶段,研发团队将数百名资深高考志愿规划师与考生、家长的多轮真实对话进行结构化处理,提炼出完整的分析路径与沟通语言风格。这些包含了上万条真实专家「推理链」的高质量监督数据,成为大模型学习人类专家分析过程的「教材」。 这一点上,夸克展现了其核心优势。「夸克的数据来源于官方考试院发布的权威资料,如同业内公认的『大厚本』,」参与夸克 AI 志愿模型训练的专家任老师强调,这与许多依赖网络爬取未经证实旧数据的大模型形成鲜明对比,从根本上杜绝了「500 分考生被推荐 985 院校」这类荒谬的 AI 幻觉,确保了推荐结果的准确性与权威性。 03 时代脉搏 从「AI 高考志愿大模型是如何炼成」之中,相信你也发现这样一个根植于具体应用场景的大模型能够为考生产出准确的结果,少不了真人高考志愿专家的帮助。 每年高考季,我们更多看到类似张雪峰这样专业的志愿辅导专家,但在现实中,针对焦虑的学生以及家长,仍然充斥着众多质量难以得到保障的「志愿填报导师」。 之所以这些服务每年仍能大行其道,是因为志愿填报的意义已远超「选学校、选专业」,已经演变为整个家庭参与其中的「人生第一次职业规划」。甚至可以说已经成为了每年数千万考生共命运的「时代脉搏」。 然而,张雪峰所代表的,是金字塔尖的昂贵解决方案。一个张雪峰,精力终究有限,其服务注定是少数人的「奢侈品」。而在他身后,是一个更加庞大且良莠不齐的市场,无数打着「专家」旗号的机构和个人,用着质量难以保障的服务,收割着同样焦虑却无法触及顶尖资源的普通家庭。 如果说张雪峰的核心壁垒是其个人经验和信息积累,那么夸克的打法是通过高考志愿大模型,将数百名资深规划师的决策逻辑与经验进行「内化」,再结合国内最大、实时更新的高考知识库,试图将过去依赖个人、昂贵且非标的「专家服务」,转变为每一个普通人都能免费拥有的标准化、高质量「AI 顾问」。 有人说夸克这次上线的 AI 志愿填报工具,是「要掀翻桌子」,其实不够准确。它不是在掀桌子——它是在换一张更大的桌子,让更多人坐得上来。这张桌子不需要预约、不收咨询费。你只要能打开手机、填个档案,它就能给你一份真正有逻辑、有数据的志愿报告。 在这张桌子上,凉山的考生和杭州的考生看到的是一样的报告结构,一样的专业维度,一样的推荐逻辑。他们的起点被 AI 拉得更近了一点。高考是改变命运的机会,而技术的意义,就是让「机会」变得更公平一点。这样的机会从来就不该只放在一张 VIP 金卡的桌子上。 夸克在 6 月 12 日发布会上首次公开的用户数据为此做出了最好的注脚——其高考服务已累计帮助 1.2 亿用户,其中三线及以下城市的用户占比超过 50%。
您可以订阅此RSS以获取更多信息