距离苹果“Awe Inspiring”新品发布会还有不到两天,关于其旗舰设备的爆料持续不断。此前泄露的通常都是零部件,例如机身中框、软排线、摄像组件、电池盖板或模型等,从未有过实物整机曝光。这次,有爆料人展示了iPhone 17 Pro Max的工程样机,橙色与深色两种配色的背面首次清晰现身。 知名数码博主PhoneArt(前X账号“i冰宇宙”)分享了两张据称为iPhone 17 Pro Max工程样机的照片。由于照片是通过社交网络上传,画质有所损失,且明显是局部特写。泄密者出于隐私考虑,没有展示完整手机,以免背景细节泄露身份。 从样机实拍照片来看,Pro系列的后摄模组及突出凸起依然醒目,显示苹果确实在设计和影像系统上做出了新变化。但目前尚无证据表明会从钛合金转向铝制中框,这一信息还需等待发布会澄清。知情人透露,苹果对发布会前的泄密极为重视,曝光者若不谨慎,甚至会被立即辞退。 此外,报道认为,彩色方案的增加可能是苹果吸引老用户升级iPhone 17 Pro/Pro Max的策略之一,而不仅限于常规的性能和功能提升。关于更多细节,建议期待发布会及后续进一步爆料。 查看评论
近日有媒体发布了疑似大疆全景无人机谍照和工程师测试场景图,这也是相关照片首次在网络上出现。曝光的图片包含有大疆全景无人机、无人机电池、飞行眼镜、穿越摇杆、以及带屏遥控器,而且根据以往的时机来判断,试飞被偷拍到就表明该机已处于排产状态。 大疆全景无人机机身形态酷似AVATA系列,采用全包桨保、前视双目避障,相比传统裸露桨叶无人机,拥有更高的安全性和更强的创造性飞行能力,同时与全景航拍差异化竞争。 镜头外观疑似为Osmo 360同款,可转动云台设计,预计会支持1英寸全景影像和8K高帧率拍摄。 据测试场景内容上看,大疆全景无人机极有可能搭载能实现十公里以上的稳定高画质图传的O4图传,并且从外观上看,大疆全景无人机疑似搭载多目避障系统,可能还拥有激光雷达。 当然具体还是要以官方为准,但若以上功能属实的话,肯定会出色飞行体验、拍摄水平和生产力表现,甚至颠覆消费无人机玩法和性能表现,大家可以期待一下。 查看评论
知名分析师郭明錤近日表示,苹果公司有望在今年秋季发布AirPods Pro 3。这一预测与此前猜测苹果将在今年秋季推出多款产品相吻合,除了确定将发布的iPhone 17以外,AirPods产品线的升级也被寄予厚望。 郭明錤在社交平台X上补充说明,他原本预计AirPods系列要到2026年才会迎来重大更新,届时配备红外摄像头(IR cameras)的版本将进入量产。但根据最新消息,AirPods Pro 3将在2025年下半年亮相,也就是说,该产品极有可能在苹果秋季新品发布会上与大家见面。 关于AirPods Pro 3,目前坊间传闻称,新一代耳机将加入心率监测功能,这一特性早前已在Powerbeats Pro 2上应用。此外,AirPods Pro 3还将采用更方便配对的新机制,并配备更小巧的收纳盒。 郭明錤以其在苹果供应链方面的独特洞见和高准确率而著称,他对AirPods Pro 3即将发布的判断,也获得了业界广泛认可。其他传闻来源也纷纷指出,AirPods Pro 3即将到来,包括搭载心率监测和全新充电盒等升级。 报道称,未来的AirPods系列还将配备红外摄像头,预计于2026年量产。该功能有望提升Apple Intelligence产品在计算机视觉领域的能力,例如Apple Intelligence系统。此举不但可以让耳机本身直接收集环境信息,不必依赖iPhone摄像头,还可能带来一定的深度映射能力。 报道称,给AirPods增加摄像头还将有助于实现苹果开发智能眼镜(Apple Glass)的蓝图。如果耳机已经可以采集环境影像,就能让智能眼镜变得更轻便,无需额外配备多组摄像头。同时,如果利用AirPods音频反馈,再结合与iPhone的连接,基本可以实现大多数智能眼镜的核心功能,唯一缺失的只是视觉显示反馈。 查看评论
苹果公司的“Apple Intelligence”有望于2025年底前登陆中国大陆市场,不过预计将是经过审查的版本。此次推迟上线主要与中国严格的监管审批流程有关,苹果需获得相关许可,并通常需要与本地企业合作运营该功能。 据悉,苹果已与百度和阿里巴巴展开合作,百度将在中国市场扮演类似ChatGPT于美国市场的角色,主要负责视觉智能等方面;而阿里巴巴则负责确保Apple Intelligence符合中国政府的监管要求。 报道还指出,预计Apple Intelligence将随iOS 26.1或iOS 26.2版本上线,目前相关功能已在中国地区由苹果员工进行内部测试。苹果方面认为,Apple Intelligence对于即将发布的iPhone 17系列销售至关重要,因此正加紧推动其在中国市场落地。 目前在中国的iPhone用户,即便设备是在海外购买的,只要Apple ID地区为中国,仍无法在境内使用Apple Intelligence。而此前2024年4月推出的简体中文版Apple Intelligence,仅面向中国大陆以外的用户开放。 业内人士分析,监管层的审批复杂而漫长,且美方政府官员对此也表示担忧。不过苹果仍计划将Apple Intelligence作为吸引用户升级新款iPhone的重要卖点,努力争取在2025年底前上线中国市场,以抢占新一代智能手机市场先机。 查看评论
近日,连接辽宁中部与辽东半岛的沈阳至丹东高速铁路(沈丹高铁)迎来了开通运营十周年。沈丹高铁位于辽宁省境内,起自沈阳市,经本溪市,终到丹东市,全长208公里,运营时速250公里,于2015年9月1日正式开通运营。 沈丹高铁开通后,沈阳至丹东列车最快运行时间由原来的3小时34分缩短至最快1小时09分,本溪、丹东融入沈阳“一小时经济圈”,并与哈大高铁、京哈高铁、长珲城际铁路、丹大高铁等衔接,形成了贯通辽宁、辐射东北、通达全国的快速客运网络。 截至2025年9月1日,沈丹高铁共安全发送旅客1.2亿人次,日均3.4万人。 十年间 ,沈丹高铁按照城际化、公交化模式运行。 目前每天开行动车组列车31对,平均30分钟一趟,最短运行间隔仅5分钟,真正实现高铁公交化,还推出了“计次票”。 查看评论
上海人口大区松江目前仅依赖9号线这一条地铁线路,该线路长期处于高负荷运营状态,被称为“上海最忙碌的地铁线”,早晚高峰拥挤问题一直困扰着通勤市民。9月6日,上海地铁在9号线试行首列“座椅拆除”改造列车,引发公众关注。 拆除车厢座椅的主要目的是腾出更多站立空间,提升单次运力。上海申通地铁方面此前表示,为缓解9号线高峰时段的拥挤状况,正在探索在确保安全的前提下,通过部分车厢改造增加旅客站立区域,从而提高列车整体载客能力。 此次改造并未改变车厢主体结构及安全标准,运营方在列车头尾两节车厢共拆除了4排座位,原有地面加铺防滑材料。据估算,拆除座椅后每列车可多容纳约25名乘客。是否进一步推广该做法,将视试点效果综合评估。 目前,9号线仅一列列车开展部分座椅拆除试点,乘客偶遇该列车的概率较低。后续地铁公司将收集乘客反馈,结合运营实际情况作出进一步决策。 查看评论
距离苹果正式发布新一代iPhone 17智能手机仅有两天时间,但相关机型的详细规格似乎已经提前曝光。刚刚有韩国一大型电信运营商疑似提前泄露了苹果公司即将发布的iPhone 17系列的详细参数信息。 这批泄密内容由X平台的消息人士@Jukanlosreve发布,展示了韩国运营商内部的产品参数表。除了涵盖四款主力新机的核心配置外,还包含iPhone 17 Air与三星S25 Edge的对比信息。 据悉,iPhone 17 Pro系列将搭载A19 Pro芯片和12GB内存,而iPhone 17 Air及标准版则配备A19芯片和8GB内存。 屏幕方面,iPhone 17和iPhone 17 Pro均采用6.3英寸显示屏,iPhone 17 Air为6.6英寸,Pro Max依然最大为6.9英寸。 摄像头方面,iPhone 17后置为常规的双摄,主摄为4800万像素,搭配1200万像素副摄。Air版则为单一的4800万像素摄像头,支持4K视频录制。而Pro系列则拥有4800万像素主摄,并号称支持8K超高清视频拍摄。 电池容量方面,iPhone 17为3600mAh,Air为2800mAh,Pro为3700mAh,Pro Max则高达6000mAh。 存储配置上,iPhone 17和Air提供128GB到512GB版本;Pro从128GB起步最高1TB;Pro Max则为256GB起步,最高同样1TB。 这份参数基本符合此前多方的爆料和传闻,但报道同时指出,运营商一般并不会在发布前获得苹果官方确认,相关规格多为基于业界“爆料”和幕后调整后的版本。 据悉,苹果将在两天后正式揭晓iPhone 17系列的更多细节及最终配置。 查看评论
最近,一位电脑新手在论坛上分享了自己在当地的Goodwill二手店淘到的主机,以令人难以置信的9美元(约64元人民币)买到了一台二手电脑。Key-law-3005承认自己对电脑一窍不通,因此发帖询问大家对这台9美元电脑的改造建议,希望能将其升级为一台性能更强的电脑。 从分享的照片来看,这台电脑的硬件基础相当不错,主板是技嘉GA-Z68X-UD3H-B,基于Intel Z68平台,采用LGA 1155插槽,这意味着它可以升级到Intel Sandy Bridge或Ivy Bridge处理器。 此外,这台电脑还配备了海盗船的ATX机箱和一个520W电源(Seasonic S12 II),其他部件具体型号不太清楚,但可以看到机箱内安装了一张Wi-Fi网卡、一个SATA SSD,机箱贴纸显示当前的CPU是酷睿i3。 Reddit上的网友们对这台电脑的升级方向提出了各种建议,一些人建议将CPU升级为Sandy Bridge系列的酷睿i7,比如经典的2600K,甚至有人建议使用当代的至强处理器。 不过,由于LGA 1155插槽的限制,无论选择哪种处理器,这台电脑最多只能支持4核8线程。 网友们还建议Key-law-3005在主板的四个DDR3内存插槽中尽可能多地安装内存,并且推荐安装一块独立显卡,对于显卡的选择,大多数网友推荐使用经典的GTX 1060。 查看评论
长江重庆段水位近日下降,位于太洪长江大桥附近的一处江心岛逐渐露出水面,岛上的3龛摩崖造像清晰可见,吸引不少游客隔岸观看。该江心岛地处重庆巴南区双河口镇与江北区五宝镇之间,被当地人称为“佛爷梁”。据了解,这组摩崖造像每年在秋季或长江枯水期便会露出水面。通过望远镜可见,3龛造像均雕刻于石上,形似观音,中间一尊最高,约1米左右,正面朝向五宝镇。 据当地史料记载,五宝镇太洪岗一带原有“接圣台”遗址。相传明建文四年(1402年),燕王朱棣攻破南京,建文帝朱允炆剃发为僧,沿长江上行,于1406年5月抵达重庆江北,太洪岗正是其登岸之处。 2022年,重庆市文物考古研究院等机构曾专程登岛勘察,发现中间主尊为一结跏趺坐于仰莲座上的僧像,高约95厘米;僧像两侧还各有两个小龛,从造像风格与服饰判断,可能属于道教造像。 专家推测,该处摩崖造像距今已有近600年历史,其功能很可能为保佑往来长江的船只平安航行。 查看评论
FreeBSD 15.0 首个 Alpha 版本现已发布,FreeBSD 15.0 是这款 BSD 操作系统的一次重大更新,旨在圣诞节前发布稳定版本。FreeBSD 15.0 带来了许多新硬件支持,这得益于许多更新的内核驱动程序,例如改进的 WiFi 驱动程序 、更佳的电源管理,以及许多现在可以在 FreeBSD 下顺利运行的新硬件。 FreeBSD 15.0 还致力于通过提供 KDE 桌面安装选项在其操作系统安装程序中 、提供更具可复现性的构建版本 、最新的 OpenZFS 文件系统支持,并放弃了一些过时的支持( 包括移除旧的AGP驱动程序 ),从而更好地迎合新桌面用户的需求。 FreeBSD 15.0 Alpha 1 将于本周末准时发布。FreeBSD 15.0 的每周 Alpha 版本将持续发布,直至 10 月份 Beta 版本发布,以及 11 月份的每周候选版本发布。FreeBSD 发布工程团队希望 FreeBSD 15.0-RELEASE 能够在 12 月初发布。 完整的 FreeBSD 15.0 发布时间表可 在此处 查看。 正在进行的 FreeBSD 15.0 发行说明可以在 FreeBSD.org 上找到,以获取有关 FreeBSD 15 重大变化的更多详细信息。 那些想要帮助测试 FreeBSD 15.0 的人可以通过download.freebsd.org 下载 Alpha 1 ISO。 查看评论
著名显卡制造商XFX官方公布了一组性能数据,称其定制的显卡在搭载三星GDDR6显存时相比使用SK Hynix(海力士)显存拥有更好的运行表现。一般来说,AIB(板卡厂商)会收到配套显存的GPU核心,不过包括AMD、NVIDIA和Intel在内的主流厂商会从三星、SK Hynix和美光等多家合作伙伴采购显存模块,有时候,AIB厂商也会倾向于优先选择某一家显存品牌。 XFX表示,显存功耗与散热表现直接关系到整卡的稳定性。此前XFX 9060 XT显卡采用了Hynix显存,而全新推出的9060XT V3版本则改用了三星显存。不仅显卡整体温度更低,显存温度更是比Hynix版本低了10°C。具体数据显示,三星GDDR6显存的工作温度为77°C,而SK Hynix的则为87°C。 此外,换用三星显存后,整卡板载功耗也从207瓦降至183瓦,降低了24瓦的热量负担,进一步减轻了散热系统的压力,风扇转速也随之降低。三星版本的风扇转速为1461转/分,而Hynix版本则需达到1814转/分。这些优化令整体系统更加稳定,减少了显存降频的可能,并达到更高的稳定性。 值得一提的是,采用三星显存后GPU核心本身温度反而上升了3°C,推测原因可能是显存控制器工作更为繁忙,或者因为风扇转速降低所致。目前,尚需更多细节信息和第三方测试来验证不同显存厂商对于GPU整体性能影响的真实程度。 XFX 9060 XT V3已在中国市场上市。 查看评论
今日,理想汽车产品线负责人李昕旸发微博称:“最近理想i6开始上路拍摄了,欢迎偶遇,咱们月底见”。一同公布的还有两张理想i6的路拍图。从图中来看,基本可以看作是小一号的理想i8。 外观上,理想i6延续了i8的设计风格,前风挡下方有星环日行灯,车顶还有激光雷达,预计会搭载最新的驾驶辅助系统。 车侧用了低风阻轮辋和隐藏式门把手,车顶线条比i8下压得更明显,后侧窗也更小,运动感十足。车尾和i8很像,有贯穿式灯带和后扰流板,牌照架在尾门中间。 新车定位中大型5座纯电SUV,长4950mm,宽1935mm,高1655mm,3米整的轴距,提供20英寸和21英寸轮圈供选择。 动力部分,理想i6首次提供了单电机版本,后轮驱动,最大功率250千瓦;而四驱版依旧得到保留,在后驱的基础上添加了一个150千瓦前电机。全系标配5C磷酸铁锂电池,采用800V高压系统,充电10分钟续航500公里。 该车是理想汽车第二款纯电SUV,将是理想汽车价格门槛最低的纯电SUV,同时肩负着理想纯电车型走量的重任。 价格方面,理想i6大概率会在20万到30万元之间,预计理想L6相差不大。 此前,理想汽车CEO李想发文称,2025年是理想汽车正式进入纯电SUV的第一年,他内心的目标是:到今年年底,我们在高端纯电赛道能“保五争三”。 李想表示,理想i8的目标是稳定后6000辆/月,理想i6的目标是稳定后9000-10000辆/月,算上理想MEGA,理想纯电车型整体稳定在18000-20000辆/月。 “纯电赛道高手很多,想达到这个目标肯定很不容易,但我充满信心!” 查看评论
知名分析师表示,三星原本计划明年为苹果iPhone 18系列供应4800万像素摄像头传感器,但相关大规模量产被推迟至2027年,这意味着三星进入苹果摄像头传感器供应链的时间将比预期更晚。 多年来,苹果相机传感器始终依赖索尼,这种单一供应格局对苹果而言长期来看并不利,因此苹果有意推动供应多元化。三星此前已为多代iPhone供应屏幕、DRAM和NAND芯片,被视为苹果供应链中极其可靠的合作伙伴。此次若能进入摄像头传感器领域,对三星来说不仅意味新增收入来源,也让苹果在采购议价中获得更多优势。 据分析师郭明錤透露,最初传闻三星将为iPhone 18系列提供三层堆叠式CMOS图像传感器,并于2026年量产,但计划如今推迟到2027年。郭明錤未说明推迟原因。他还指出,三星供应的超广角摄像头传感器可能会先应用于中低端机型,后续再逐步进入高端iPhone型号。 尽管三星有丰富的苹果零部件代工经验,但在摄像头传感器领域仍需向苹果证明自身实力。此次合作或给三星技术改进和提升的机会,也有助于后续自家旗舰手机相关硬件研发。如果这一策略落实,类似于苹果自研5G基带芯片先在入门级产品尝试、再进入高端产品的路径。 查看评论
在赢得连任前夕,特朗普曾向支持者承诺,将让罗伯特·F·肯尼迪“在健康、医疗和食品领域放手去干”。近一年后,身为卫生与公共服务部长的肯尼迪正不断测试这句话的边界。本周国会山听证会上,肯尼迪因解雇疾控中心(CDC)主任、限制新冠疫苗接种以及可能调整儿童常规免疫政策而遭到两党议员质询。特朗普随后表示欣赏肯尼迪“与众不同”,并称其“本意很好”,继续对其给予支持。 位于亚特兰大的美国疾病控制和预防中心 白宫重申“完全信任”肯尼迪推动总统“让美国更健康”(MAHA)议程。但部分共和党高层已流露担忧,认为政府全面拥抱疫苗怀疑论可能引发公众反感。参议院两位共和党领袖在被问及是否仍支持肯尼迪时,仅强调会跟随总统立场。 疫苗在疫情后成为美国政治热点。肯尼迪声称总体支持疫苗,但批评CDC在新冠疫情中的表现,并认为机构存在系统性问题。他的支持者强调,这是重建公众信任的必要过程。副总统万斯甚至在社交媒体上为肯尼迪辩护,抨击批评者“服务于制药利益”。 然而,多项民调显示,美国两党选民在大多数常规疫苗问题上保持高度共识,支持儿童必须完成疫苗接种才能入学。共和党议员巴拉索在听证会上直言,对肯尼迪的政策转向“深感担忧”。 特朗普本人在疫苗问题上也态度复杂。一方面,他强调“某些疫苗极其重要”,并批评佛罗里达州取消校内疫苗要求是“艰难立场”;另一方面,他又赞同肯尼迪缩减新冠加强针接种范围,并质疑疫苗功效。 这种摇摆影响了特朗普的政治声誉。近期民调显示,疫苗议题是少数几个在选民中更有利于民主党的政策领域之一。 肯尼迪长期在公众场合质疑疫苗安全性,早在参议院提名确认阶段就曾遭遇争议。如今,他更换了疫苗顾问委员会的全部成员,任命了自己的团队,引发部分共和党议员不满。北卡州参议员蒂利斯批评其言行与确认听证会承诺“不一致”。 尽管存在分歧,肯尼迪在民众中的声望依旧较高,并被视为内阁中支持率最高的成员之一。正如一位前政府官员所言,他的强硬改革注定会“得罪旧体系”,但在总统支持下,他拥有足够的政治资本继续推动议程。 查看评论
Intel新任CEO陈立武接手之后,也对Intel公司做了大量改革,从公司战略到财务,再到产品路线图都有一系列重大变化。在这些改革中,还有一个政策不那么起眼,但或许能决定Intel未来的——那就是陈立武这次要亲自督战,他要求公司每一款主要芯片在流片之前都要经过他的审查与批准。 这也意味着Intel未来推出的CPU、GPU、AI芯片等主要产品都会由他来决定生死。 在陈立武之前,Intel CEO是否深度参与了公司每款芯片的决策,外界不得而知,考虑到Intel庞大的规模和复杂的产品线,CEO即便听取各部门的汇报,可能也不会具体了解到产品的优劣点,决定上市与否的或许还是各业务部门的主管。 为什么这个政策很重要?前几天Intel高管不是承认了Arrow Lake这一代在桌面平台表现不尽如人意吗,这一代产品的设计思路和方向跟以前的酷睿有所不同,生产力、功耗等方面表现很不错,但在游戏性能上却是倒退。 在陈立武亲自督战前线产品之后,希望能减少这种情况的出现,否则下一代产品,不论是消费级的还是服务器级的,亦或者是AI芯片的,再有类似的开倒车情况,对Intel的竞争力会是严重打击。 查看评论
一手X3D好牌,让AMD在中高端战场取得了全面胜利。锐龙7 9800 X3D、 锐龙9 9950 X3D实现了对Intel的全面压制。如今,AMD的围剿行动正式向中低端及入门市场延伸。近期,AMD将一口气迎来四款新CPU—— 无核显入门款锐龙5 9500F、锐龙7 9700F,以及中低端X3D型号锐龙5 9600 X3D、锐龙79700 X3D,全面覆盖不同价位段,直指Intel核心市场腹地。 锐龙59500F:9600X “降频去核显版”,游戏性能远超上代 日前,AMD官方正式宣布, 锐龙 5 9500F处理器在中国市场开启预售。该U基于Zen 5架构和4nm核心制程工艺,拥有6核心12线程,加速频率至高5.0GHz,专为追求高性价比的PC攒机用户量身打造。 其核心规格与9600X保持一致:6核心12 线程、38MB L3缓存、65W TDP,但基础频率从3.9GHz降至3.8GHz,加速频率从5.4GHz砍至5.0GHz,同时移除了2个CU单元的 RDNA2亮机核显,必须搭配独立显卡使用。 性能方面,泄露的Geekbench 6跑分显示,其单核3122 分、多核14369分,与非X版的锐龙5 9600接近,虽弱于满血9600X,但 Zen5架构带来的游戏性能提升显著,对比上代R5 7500F有明显优势。 价格上,国内京东已开启预售,定价 1299 元,9月8日正式开售。打算入手的同学,可以稍微观望一段时间。作为对比,AMD锐龙 5 9600X的盒装1449元(散片更便宜),只贵了150元,显然后者性价比更高。 建议等价格降到1000元出头,再入手更合适。 锐龙7 9700F:8核16线程定价2000+,适合观望 另外一款是锐龙7 9700F,国内上市时间尚未确定,但美国已上架,售价294美元(约合人民币2097元)。 整体规格看齐锐龙9700X:8核心16线程、40MB L3缓存、65W TDP,仅加速频率预计降低0.2-0.4GHz,无核显。 但这款CPU的性价比争议较大。从历史来看,AMD非X3D版的锐龙7系列历来市场表现平淡,其游戏性能与同代锐龙5差距普遍不足10%,价格却高出一截。 以锐龙7 9700F为例,价格较锐龙5 9500F近乎翻倍,但参考锐龙9700X与锐龙5 9600X 的性能对比,游戏帧率提升有限,仅适合对多核性能有明确需求的用户。建议需等待其价格降至1500元以下,性价比才具备竞争力。 锐龙5 9600 X3D:102MB超大缓存加持,国内因 “库存压力” 暂不上 然后是全新X3D阵容,作为 AMD官方自曝的入门级X3D型号,锐龙5 9600 X3D的核心亮点包括:基于 6 核心 12 线程设计,配备6MB L2 缓存 + 32MB L3缓存,叠加 64MB 3D缓存,总缓存达到 102MB,仅比高端锐龙9800 X3D少2MB L2缓存。3D V-Cache技术的加持,使其游戏性能被普遍看好。 不过遗憾的是,这款 “潜力股” 虽即将在海外上市,国内却暂时无缘。业内分析认为,核心原因有二:一是定价难平衡,若价格过低,可能冲击9600X等现有产品;若定价过高,又会失去入门X3D的竞争力。 锐龙7 9700 X3D:9800X3D “降频版”,2500-3000元档补位 近期曝光的锐龙7 9700 X3D,可看作为降频版9800 X3D,采用8核心16线程设计,配备96MB L3 缓存,TDP 120W,类似之前 5800 X3D与5700 X3D的定位,专门填补9800 X3D与其它9000系型号之间的价格空白。 据悉,锐龙7 9700 X3D定价预计在 2500-3000 元区间,既能承接追求X3D缓存技术的游戏玩家,又 9800 X3D 亲民,有望成为中端游戏主机的新选择。 AMD全面布局成型,Intel 短期或靠降价应对 从此次四款新品的布局来看,AMD的战略已十分明确:以3D V-Cache技术作为核心优势,同时通过 “同架构多规格” 的产品策略,覆盖从入门(千元档)到中低端(2000-3000 元档)再到高端(4000 元以上)的全价格带。 尤其是锐龙9500F的推出,进一步加固了 AMD 在入门主流市场的防线;而X3D家族的扩容,则持续强化其游戏性能优势。 对于Intel而言,短期或只能通过降价来守住市场份额,除此之外,恐怕别无他法了。 查看评论
AMD RX 9070系列发布后,一度有传闻称,AMD还会推出一款32GB的旗舰,可能叫做RX 9070 XTX,但最终落空了。现在,有网友发现了一块Radeon AI PRO R9700专业显卡的EVT原型开发板,它恰好就有32GB显存。 该卡市售只有非公版,所以这款AMD的原型卡还是相当有收藏价值的,而且保存相当完好。 从标签上看,这块卡是今年1月10日生产的,那时候RX 9070系列还远未发布,或许这就是32GB RX 9070 XTX传闻的由来。 标签上还明确写着,它的核心编号是Navi 48 XTW(W代表工作站),不仅版本A0(最早期的),整卡功耗300W。 查看评论
OpenAI近日发布研究报告,针对当前广受关注的“语言模型幻觉(hallucination)”问题进行深入剖析。报告指出,即便当前的语言模型能力不断增强,模型自信地生成不真实答案的“幻觉”问题依然难以彻底根除。OpenAI的最新论文认为,这一现象源自目前主流的训练和评估方式更倾向于奖励“猜测”而非“承认未知”。 什么是语言模型的“幻觉”? 所谓“幻觉”,指的是语言模型生成看似合理但实际上错误的陈述。即便面对表面上极其直接的问题,模型也可能出现幻觉。例如,论文作者之一Adam Tauman Kalai的博士论文题目及生日,主流聊天机器人都曾自信地给出多个不同、但实际均不正确的答案。 评估偏差助长模型“猜测” OpenAI指出,当前模型评估方法本质上激励了“猜测”——类似于选择题考试中,答错虽扣分但完全空白就得零分。因此,即使模型并不确定答案,也更倾向于给出猜测答案以获取更高准确率,而非坦诚表示“不知道”。这一机制导致模型在排行榜上的得分提高,但相应地幻觉现象也更加普遍。 实际数据进一步说明了这一点:在同一组评估中,旧版模型尽管准确率略高,但其错误率(即幻觉发生率)远高于那些选择性回避不确定问题的模型。 下一步:改革评估标准、强调“不确定性” 报告建议,未来的模型评估体系应对自信的错误给予更高惩罚,同时对恰当表达不确定性的模型给予部分分数。这一思路借鉴了部分教育领域的负分制和部分学术团体的前沿研究。OpenAI强调,仅在部分评估体系中试行新办法是不够的,主流的基于准确率的评分标准应全面革新,否则模型开发者会持续优化“猜测”算法。 模型“幻觉”来自训练机制 研究分析称,大语言模型的主要训练方式是序列预测(即“下一个词预测”),缺乏负面示例,因此模型更擅长生成流畅语言而非判别真假。在模型学习过程中,常见知识(如拼写)可通过归纳掌握,但不常见甚至随机性的事实(如生日)则难以通过语言规律推断,导致出现幻觉现象。 主要结论与前景展望 OpenAI报告澄清了社会对幻觉的诸多误解,并得出如下结论: 幻觉无法通过提升准确率彻底消除,因为客观上有些问题无法精准回答。 幻觉并非不可避免,模型应在不确定时选择回避。 幻觉并不只是大模型的“智能”问题,较小的模型在某些边界条件下反而更能坦承“不知道”。 幻觉是当前评估体系激励机制下的产物,通过科学的评级机制可望大幅减少。 OpenAI表示,其最新模型的幻觉率已显著下降,团队将持续努力,进一步降低语言模型自信输出错误信息的概率。 报告作者包括Adam Kalai、Santosh Vempala(佐治亚理工学院)、Ofir Nachum、Eddie Zhang、David Robinson、Saachi Jain、Eric Mitchell、Alex Beutel和Johannes Heidecke。 阅读官方博客原文: https://openai.com/index/why-language-models-hallucinate/ 查看评论
微软近日为Windows 11的网页版Outlook应用引入了多项离线功能升级,力图进一步缩小新Outlook与经典Outlook之间的差距。此次更新带来了包括:可在离线状态下访问邮件附件、在回复邮件时添加多个收件人、更好地支持共享邮箱访问等一系列实用改进。 在最新的稳定版Outlook应用中,部分功能尚未全部推送,但微软已计划在2025年9月内让所有用户用上离线附件访问功能。此前,虽然Outlook已经可以离线保存邮件、日历与便笺等个人数据,但附件文件无法本地保存,导致离线情况下无法预览或打开相关文档。今后,用户即使在无网络的环境下也能直接在预览面板中查看邮件的附件,显著提升了办公与通讯体验。 更新还带来了类似Gmail的“多收件人回复”功能。用户在点击回复时,可以在收件人栏中添加多个地址,实现“一封邮件回复多人”的需求,解决了长期以来Web版Outlook的使用痛点。 此外,新版本对搜索快捷键进行了优化——Ctrl + F将直接呼出文本搜索框,让用户在大量邮件内容中迅速定位关键信息,而不会像以往那样错误地启动回复界面。 邮件文件夹中的“共享邮箱”也变得更易访问,通过新增的“与我共享”设置页面,用户可以自定义共享邮箱的展示和管理方式,提升团队协作效率。 业界普遍认为,微软此次在听取外部反馈后加快了Outlook Web版的功能迭代节奏,积极解决离线支持等用户强烈呼声,将持续缩小与经典Outlook在体验上的差距。 查看评论
为了缓解停车难题,几年前不少城市的小区和商场建了机械车位。但随着汽车产业的快速发展,车辆尺寸都发生变化,一些原来的机械车位已无法满足停放要求,还有不少机械车位闲置多年。 日前,央视财经报道了“机械车位为何大量闲置?”,记者在走访市场时发现,一边是车主抱怨停车难,一边是大量的机械车位形同虚设,被闲置起来。 调查发现,“不好用”“不实用”是目前大部分车主对机械车位的感受。 报道称,常见的机械车位可以停放长4.8米、宽1.9米、重量2吨以内的车辆。 然而目前新上市的不少车型,车长普遍在4.8米至5米以上,宽度接近2米,重量在2吨以上,无法停放在机械车位里。 此外,“不会用”是大部分机械车位面临的首要难题。 大部分车库工作人员既没有接受过机械车位的操作培训,也没有特种作业操作证。 不少保安也害怕设备出现故障或自己操作失误损坏了车辆,因此不愿使用。 查看评论
今年5月,《重庆三峡学院防火墙及DNS设备采购(CQS25A00331)中标(成交)结果公告》引发社会高度关注。原因是重庆三峡学院采购的普联TL-R473G出口防火墙,中标价格为75万元一台,但该型号产品在电商平台普联官方旗舰店售价仅299元。 据了解,专业防火墙需具备防御入侵、病毒过滤等安全功能,而路由器仅仅是网络连接设备,二者在技术功能和价格上有天壤之别。 经过官方深入调查后,日前,重庆市教委官方网站发布《关于重庆三峡学院防火墙及DNS设备采购事件调查情况的通报》,就调查结果进行通报。 通报提到,洪正公司(中标公司)在制作投标文件时,因不具备相关专业知识,便在购物平台搜索防火墙、DNS等关键词,随意选取了普联TL-R473G(实为路由器)作为防火墙设备,技术参数直接照抄竞争性谈判文件。 通报如下: 经查,在重庆三峡学院防火墙及DNS设备采购过程中,洪正公司虚假承诺,恶意扰乱采购秩序;采购人重庆三峡学院履责不力、把关不严,相关领导和工作人员不认真不负责;代理机构市政采购中心未认真履行委托采购职责,工作人员简单机械执行采购程序,相关领导内部管理不到位;专家开展评审谈判流于形式。 调查中未发现中标单位洪正公司与重庆三峡学院及其他相关方存在利益输送的情况。 通报指出,责令重庆三峡学院党委作出深刻检查,对分管副院长王某伟立案调查。 对实验实训中心主任鲁某亮、副主任胡某,网络信息科工作人员胡某华立案审查(调查);对市政采中心工作人员仇某远立案调查,对市政采中心分管副主任童某诫勉;对评审专家魏某、潘某春予以解聘,禁止参加政府采购评审活动。 中标单位洪正公司违反《中华人民共和国政府采购法》相关规定,对该公司处以采购金额千分之十的顶格罚款,罚款人民币9000元,列入不良行为记录名单,在三年内禁止参加政府采购活动。 通报全文 查看评论
近日,全球首架具备最远航程的湾流G800公务机正式交付客户,其航程超过了1.5万公里。目前,该机已顺利获得美国联邦航空局(FAA)和欧洲航空安全局(EASA)的认证,后续将投入初始运营。 这架飞机在湾流宇航公司位于威斯康星州阿普尔顿的内装工厂完成装配工作。 据悉,湾流G800是迄今为止飞行航程最远的专用公务机,能够以0.85马赫的远程巡航速度飞行15200公里(8200海里),以0.90马赫的高速巡航速度飞行13000公里(7000海里)。 最高飞行速度则从0.925马赫提升到了0.935马赫。 G800在飞行高度为12500米(41000英尺)时,客舱压力高度达到业界最低的866米(2840英尺)。 客舱内实现了100%新鲜空气循环,并配备等离子空气净化系统,以及16扇湾流标志性的椭圆形全景舷窗。 舱内可配置多达四个起居区,或者三个起居区加一个机组专用舱。 查看评论
北京时间9月7日午夜至8日凌晨,本年度重磅天象“红月亮”月全食将现身天宇,我国全境可见全过程,观测月全食通过肉眼、望远镜、相机、手机均可。据了解,月食过程分为初亏、食既、食甚、生光、复圆五个阶段。 据媒体报道,这次月全食始于北京时间9月7日23时28分,此时月球开始稍微阴暗(半影食始); 8日零时27分,月面开始有缺(初亏); 1时31分,月球完全进入地球本影(食既); 2时12分,月球的中心与地球本影的中心最近(食甚); 2时53分,月球开始重现光芒(生光); 3时56分,月球走出地球本影(复圆); 4时55分,月食现象结束(半影食终)。 其中,食既到生光为全食阶段,也就是民间俗称的“红月亮”“血月”,持续1小时22分。 据悉,上一次我国可见全过程的月全食是在2022年11月8日,而下一次可见全过程的月全食则要等到2028年12月31日至2029年1月1日。 查看评论
近日,高通CEO克里斯蒂亚诺・安蒙(Cristiano Amon)接受媒体采访时直言,Intel的芯片制造技术目前仍未达到高通需求,至少对 Snapdragon X而言如此。安蒙直言不讳地表示,Intel今天“仍然不是高通的选项”,但仍保留未来合作的可能性。“我们希望Intel能成为一个选项”,他说。 这段话简单但尖锐,这意味着至少在短期内,断绝了高通成为Intel潜在客户的希望。 今年7月,Intel曾表示,若无法获得足够的外部订单或达成关键进展,可能暂停或放弃14A的研发。 此后,外界对18A节点的执行风险与良率问题也提出疑虑。 安蒙的最新评论,为这团疑云又添了一份阴霾。 不过高通并未完全关上与Intel合作的大门。安蒙指出,只要Intel能达成需求标准,公司愿意考虑,而双方过去也曾释出合作意向。 但至少目前,Snapdragon X仍将交由台积电生产。 查看评论
Intel公司今年将量产18A工艺,这是他们四年五代工艺中的关键一环,而且该工艺会持续改进,一直用到2030年。18A下一代工艺就是14A了,这一代还会用上High NA EUV光刻机,也就是ASML公司的Twinscan NXE:5000系列,NA提升到0.55,分辨率更高,是2nm节点以下的关键设备。 相比当前EUV光刻机每台2亿美元的价格,Twinscan NXE:5000的价格也上天了,每台售价4亿美元以上,差不多30亿rmb一台,非常烧钱。 正因为此,14A工艺虽然性能更好,但成本也是个考验,尤其是Intel当前面临财务困境,能否继续建造14A工艺晶圆厂得看情况,Intel之前表态2026年会是关键一年,会决定14A生死。 外界对Intel 14A工艺的未来不太看好,但是Intel自己这边倒也没那么悲观,CFO David Zinsner日前透露,14A比18A工艺更贵,但它无法吸引客户的可能性相对也比较低。 简单来说,Intel还是认为14A工艺能够吸引到外部的代工客户的,哪怕价格比18A要高,不过Intel并没有提到他们如此自信的依据,是14A工艺性能、功耗等指标目前还没多少信息公布。 查看评论
日前,宝马首款新世代车型iX3在慕尼黑迎来全球首发。据悉,中国专属版将于年内正式亮相,并计划在2026年实现量产。宝马集团董事长齐普策表示:“无论搭载何种驱动系统,宝马全系产品阵列都将受益于新世代的创新科技。iX3是首款投入量产的新世代车型。我们不仅将下一代最成功的纯电车型之一带上道路,同时也开启了宝马的全新时代。” 外观方面,新世代宝马iX3以经典元素致敬1960年代宝马1500车型,保留经典双肾格栅、天使眼大灯及SAV车型典型比例,通过“超感数字融合”设计,将LED轮廓光融入格栅与灯组,打造光型一体的“天使之翼”前脸。 座舱中,3D抬头显示、视平线全景显示、超感方向盘与超感中控四大交互界面联动。 其中,视平线全景显示采用宝马自研的超近距投影平视显示技术,替代传统仪表盘,可将信息投射在纳米涂层风挡玻璃下部的黑色涂层,提供4K级显示效果。 全新3D抬头显示位于视平线全景显示上方,可将导航和自动驾驶信息投影到驾驶员最佳视野内;宝马超感中控屏采用“自由剪裁”式设计,屏幕左右两侧向驾驶员倾斜17.5°。 宝马iX3采用全面升级的宝马第六代电驱系统,搭载大圆柱电池和全新800V高压平台。国产版本实现10分钟补能超400公里,CLTC续航超过900公里。 动力系统方面,后桥励磁同步电机升级,并结合全新紧凑异步电机组成双电机组合,实现能量损耗降低40%、整车效率提升20%。 宝马还宣布,iX3中国专属版即将于年内正式亮相。该车型在智能座舱、驾驶乐趣、驾驶辅助和舒适性等方面为中国用户做了专属定制与调校。 iX3中国专属版将采用与阿里巴巴共同开发的宝马定制大语言模型技术,并将AI智能体引入座舱;驾驶辅助方面,宝马携手本土合作伙伴Momenta共同研发适配中国道路环境和驾驶行为的辅助驾驶解决方案,功能覆盖高速及城区道路,实现全场景、点到点的领航辅助驾驶。 针对中国典型路况与驾驶偏好,宝马工程团队对底盘与悬架系统进行了专属调校优化;舒适性方面,轴距加长超100mm,后排腿部空间显著提升,专属后排座椅座垫加厚加长。 值得一提的是,宝马携手宁德时代、亿纬锂能等中国电池供应商,已于2024年底在沈阳生产基地启动大圆柱电池包试生产。 宝马GINA、328 Hommage、新世代概念车与新世代X概念车: 查看评论
飞机上的应急舱门,非紧急情况下严禁开启。并且,乘客必须在乘务员指令下才能开启,如果擅自打开应急舱门,旅客需要承担相关责任。据报道,2024年7月4日晚,第一次坐飞机的张某乘坐国航CA2754号航班从衢州机场前往成都天府机场。 在登机期间,张某走到客舱后部准备使用卫生间,误将飞机尾部的R2门当成卫生间门打开,致使R2门在滑梯预位下打开,R2门滑梯释放。 事故发生后,该航班取消,张某由机场公安带走接受询问,同年7月8日,衢州市公安局机场公安分局对被告张某作出行政拘留十日的行政处罚。 事件发生后,国航起诉了旅客张某称,张某误放应急滑梯给航司造成经济损失共计110847.8元,具体包含:飞机维修费用32697.8元;航班取消补偿费用53000元;旅客安置费用(住宿、交通、餐饮)25150元。 张某表示,国航在客舱管理过程中存在多种违反相关规定、职责缺失、管理与措施不到位的情形。 该航班在事发时飞机尾部无人执勤看管,该区域左右各有一个飞机逃生应急舱门及厨房,属于客舱重要安全区域,被告从通道进入该区域时无人执勤也未放下帘布并悬挂闲人莫进等应有的安全提示。 衢州市柯城区人民法院认为,被告虽然是第一次乘坐飞机,但在其座椅前部放有安全须知卡片,电子屏幕也会播放安全须知录像,客舱卫生间写有“厕所”标识,其未阅读安全须知,也未注意观察客舱内设施的标识。 并且在已经注意到飞机舱门和一般厕所门存在很大差别且无法轻易开启的情况下,没有向其他旅客或乘务员寻求帮助,而是依旧大力开启舱门,未尽到注意义务,应承担主要责任。 最终法院判决:被告承担70%的赔偿责任,原告承担30%的责任。张某赔偿国航各项损失77593.46元(110847.8元 x 70%)。案件受理费1258元(减半后),由国航负担377元,张某负担881元。 查看评论
今年iPhone 17系列的一大变化,就是放弃了钛合金材质,转而“开倒车”回归铝合金。名记马克·古尔曼撰文称,苹果之所以作出这一决定,自然有其核心原因。简单来说,铝合金主要有两个关键优势——轻和散热。 “2023年iPhone 15 Pro改用钛金属框架后,iPhone 17 Pro将回归铝制框架。铝制框架更轻,散热效率更高,对于习惯使用15 Pro或16 Pro的用户来说,这将是一个不错的改变。” 苹果两年前在iPhone 15 Pro中首次采用了钛金属材质,并将其作为一项高端功能,iPhone 16 Pro也延续了这一配置。 但从用户反馈来看,iPhone 15 Pro在某些情况下会出现过热现象。“我自己也遇到过很多次这个问题,但从未将其归咎于钛金属。”古尔曼说。 就重量而言,iPhone 17系列的一大卖点就是轻,iPhone 17 Air是有史以来最轻薄的iPhone,Pro系列的重量势必也会进一步减轻。 此外,17 Pro Max今年配备了更大的电池,如果再使用钛金属,那就是“真板砖”了。 另外一个重要原因就是散热。在Apple Intelligence时代(AI需要大量运算),这一点变得比以往任何时候都更加重要。iOS 26将推出20 多项新的Apple Intelligence功能。 不仅如此,iPhone 17系列的相机也有重要升级,这也会是一个发热大户。 与不锈钢和钛相比,铝具有最佳的导热性,在一些特定情况下,铝的导热性比钛高出33倍。 所以,为什么苹果要用铝代替钛,答案就不言而喻了——更轻,更利于散热,而且它的制造成本要低得多。 查看评论
特朗普当日在白宫宴请二十多名美国科技及商业领袖时,苹果CEO蒂姆·库克在不到两分钟的时间内,说了8次谢谢。特朗普表示,库克为苹果这家小公司做出了令人难以置信的贡献,很少人能做到这样,祝贺你。 库克表示,感谢大家、感谢大家,这对我来说意义重大,感谢您今晚邀请我,能和在座的各位一起真是不可思议。 库克对特朗普表示感谢,因为他为大家定下了基调,可以在美国进行重大投资,其中还有一些关键的制造。 同时,库克肯定了特朗普的领导力,认同他的创新和专注。 此外,库克还表示,感谢特朗普帮助世界各地的美国公司,这是非常关键的事情,很喜欢和特朗普政府合作。 随后,他还感谢了“第一夫人”对美国教育的关注,没有什么比教育更重要了,非常感谢你邀请我。 最后,特朗普问库克:“你在其他地方都投了很多钱,现在你要回来了,那么你打算在美国投入多少钱呢?” 库克表示将会投入6000亿美元,能做这些自己很自豪,感谢您。 查看评论
日前,比亚迪执行副总裁何志奇在其微博晒出比亚迪9000吨大压铸生产线。何志奇表示,前后舱地板以前由74件冲压件焊接变成一个大压铸铝件,效率大大提高,重量大大降低。据介绍,该设备为国产,模具微比亚迪自制,从铝锭到成品完全自动化。 何志奇直言:“这在以前不可想象,为中国制造的长足进步点赞。” 今日,腾势方程豹直营事业部总经理赵长江转发表示,“大压铸在汽车领域今年应该是大发展的一年,是目前汽车制造领域一项颠覆性的工艺变革。它通过超大型压铸机,将原本需要冲压、焊接的数十个甚至上百个零件一次性压铸成型。” 赵长江称,一体化压铸正在重塑汽车制造业的生产模式,它能显著提升效率、降低成本、改善车辆性能。 据了解,除比亚迪外,此前也有家车企展示过自家工厂的大压铸技术。 2023年12月,小米CEO雷军在小米汽车技术发布会上发布9100吨小米超级大压铸。 2024年2月,赛力斯超级工厂建成投用,该工厂还配有全球领先的9000T压铸机,实现了一体化压铸部件中最高的集成度。 今年9月,由土木公司承建的全球最大吨位一体化压铸工厂——东风汽车一体化压铸产业化建设项目提前25天完成竣工验收。 厂房内建设全球最大的16000吨及10000吨一体化压铸双产线,项目投产后,将提高东风新能源汽车制造产能和效率。 查看评论
近日,消费者葛女士投诉称,今年8月18日,她在去哪儿网购买了4张国际航班机票,购买机票时在增加旅客信息旁边按提示要求填写拼音。葛女士称,她第一次买国际航班机票,不清楚一定要严格与护照名称一致,所以写了中文拼音。第二天发现名字不能写中文拼音,名字不一致不能登机,葛女士立即向去哪儿网和航司申请修改,均被告知错误太多无法修改。 葛女士认为,因去哪儿网误导,致4张机票无法使用,损失近2000元。目前,她要求去哪儿网将购票钱款全额退回。 接到葛女士投诉后,澎湃新闻联系了去哪儿网相关工作人员,该工作人员回应称,事发时已和航司沟通,错误太多确实无法修改。平台已尽到告知义务,填写信息时多次弹窗提醒。葛女士有3张机票已购买过退款理赔包服务,可以在平台内申请,可减少损失。 去哪儿网工作人员提供的多次弹窗提醒界面 女子购买国际航班机票,信息填错致无法正常登机 据葛女士介绍,她因打算与友人一同出国旅行,便于2025年8月18日在去哪儿网平台帮朋友订购了4张国际航班机票,分别为9月6日从香港到吉隆坡、9月7日从吉隆坡到瓜拉丁加奴、9月9日从瓜拉丁加奴到吉隆坡和9月10日从吉隆坡到香港,总计花费两千余元。 葛女士说,她为朋友购票时注意到增加旅客信息一栏的旁边要求填写拼音,她便填写了朋友的中文名拼音。但实际上,葛女士朋友使用的为香港护照,护照英文名与中文拼音并不一致。 第二天,葛女士与朋友预订酒店时发现,酒店预订信息中显示的为朋友的英文名,而此前她订票时填写的却是中文拼音,二者之间存在差异。担心出现问题,葛女士随即查询后才知道,机票与护照姓名信息必须严格保持一致,否则无法登机。葛女士朋友的机票输入错误姓名为HUANG/JINNENG,正确应为:WONG/KAMNANG。 葛女士提供的新增乘机人界面 葛女士认为,之所以出现这种差错,是因为去哪儿网购票页面引导不当所致。据葛女士提供的去哪儿网平台新增乘机人信息填写界面截图显示,填写姓名的两栏区域,平台都以“姓(拼音)与名(拼音)”标注。葛女士表示,她第一反应就是按姓名中文拼音填写的,这种失误是由平台误导所致,“平台理应出面解决”。 发现问题后,葛女士立即联系了去哪儿网。要求更改乘机信息或退票,但平台表示无法退改。之后,葛女士还通过亚航官网询问了客服,对方表示错误太多无法更改。葛女士通过亚航邮件表示这是中文拼音和英文的区别,并不是更换乘客。亚航的回复邮件显示,对方称,“旅行社(第三方机构)将完全有权根据需要,管理和修改您的预订”。 亚航给葛女士发的邮件 此外,根据民航局《关于改进民航票务服务工作的通知》(局发明电〔2018〕1952号)中第五条:(五)航空公司要为旅客错购机票(例如姓名书写错误、重复购票等)提供免费补救措施。在界定旅客错购情形时,应当把握合理且包容原则,对于航空公司无法证明旅客非错购情形的,均应视为错购,并提供免费退票等服务。 基于以上原因,8月19日,葛女士再次联系去哪儿网客服要求退改。8月23日,客服给她退了一张机票的钱。葛女士认为,去哪儿网是有权限给她机票退款的,她在错购机票的24小时内提出退款,此时距离起飞尚有18天,葛女士认为去哪儿网应该对她错买的机票进行全额退款。除去已经退款的1张机票,剩余3张机票共1775元,目前葛女士已通过平台收到保险退款180元,她要求去哪儿网退剩余机票1595元。 葛女士需要退款的机票明细 回应:与航司核实均告知错误太多无法修改 接到葛女士投诉后,澎湃新闻致电去哪儿网,相关工作人员回应称,去哪儿网不存在误导的情况,在填写乘机人姓名时,平台有多次明确的弹窗提醒,“请确保与乘机证件一致”“请输入与乘机证件一致的英文名”,并且平台也提供证件扫描新增和在线查询的方式。葛女士填写的错误名字为11个字母,要求修改为12个字母的名字,去哪儿网与航司核实,被告知错误太多,等同换人,无法修改。 该工作人员表示,葛女士所说的已经退款的那张机票并非退票,退款金额241.5元是葛女士此前购买的退票无忧服务包(航前退票可理赔50%)里可以理赔的123元,和特别申请的体验金128元,该体验金128元已在沟通中明确告知。 去哪儿网工作人员与葛女士电话记录(表明所退款并非退机票钱,而是特殊申请的体验128) 去哪儿网工作人员表示,虽然无法全额退款,但葛女士购买的4张机票有3张享受了理赔包服务,除去已经理赔123元的那张机票,还有两张机票都可以申请理赔,如果需要可以致电办理,可以挽回点损失。 目前,双方尚未就退票方案达成一致。 查看评论
美国近年来加大了对高科技出口的限制,AI相关的技术更是高度管控,日前又提出了一项新法案,要求厂商施行“美国优先”策略。该法案全名为“保障国家人工智能获取与创新法案”,简称AI GAIN,要求规定人工智能(AI)芯片制造商在供应外国客户前,须优先满足美国国内对先进芯片的订单。 NVIDIA公司也针对这个法案发布声明,强调美国过去、现在和将来都是其主要市场,从来没有为了服务其他国家而剥夺美国客户的权益。 NVIDIA表示,这项法案试图解决一个不存在的问题,将限制任何使用主流算力芯片产业的全球竞争。 虽然它可能有良好的意图,但该法案只是人工智能扩散规则的另一种变体,并将对美国领导力和美国经济产生类似的影响。 根据NVIDIA的财报,2024财年中美国客户销售占比49.9%,中国公司占比28%,新加坡公司占比18%。 查看评论
早前Google宣布自 2026 年开始将逐步要求应用程序开发者必须进行身份认证,只有携带经认证后的开发者签名的应用程序才可以在Android上侧载安装,也就是直接通过 APK 安装应用程序的方式会受到限制。 Google实施这种策略的理由是防止恶意应用开发者通过匿名的方式传播恶意软件,即便用户从 Google Play 以外获得的 APK 也不能随意安装,除非开发者完成Google的身份验证要求。 不少用户认为Google公司这是别有目的,因为这种措施会导致 Android 生态系统也逐渐变得封闭,不过Google高管表示侧载是 Android 系统的基础,新要求并非限制而是确保安全性。 不过Google也确实为开发者和爱好者留了个门:如果用户通过 ADB 方式连接 Android 设备并侧载安装应用,则不要求应用程序开发者必须经过认证,这种方式将允许爱好者和开发者们进行调试。 通过 ADB 安装应用程序对非专业用户来说并不是个简单的事情,这也是Google允许这种安装方式的原因,因为恶意行为者显然无法要求大量用户都通过 ADB 侧载安装应用。 目前还不清楚Google是否会长期保留这项侧载政策,毕竟实施签名验证也还需要一段时间才会生效,说不好到时候Google会要求通过 ADB 侧载安装也必须校验开发者签名。 查看评论
路透社报道,特朗普政府计划出台规定,限制或可能禁止中国无人机以及中、重型车辆的进口,此前美国已经针对汽车和卡车采取了打击措施,理由是国家安全疑虑。 美国商务部在周五表示,计划最快在本月出台相关规定,以应对涉及无人机及其供应链的信息和通讯技术带来的国家安全风险,以及针对来自中国等“外国对手”国家重一万磅以上的载具。对于具体的进口规则细节,商务部尚未给出说明。商务部与中国驻美大使馆目前均未立即置评。 中国进口无人机占据了美国商用无人机销售的大部分,其中超过一半来自全球最大无人机制造商大疆(DJI)。拟议对无人机和重型车辆的限制,是在此前已计划对汽车和其他卡车进口施加类似规定的基础上进一步展开。 拜登政府于今年1月最终敲定了规定,将自2026年底起基本禁止所有中国汽车和卡车进入美国市场,以打击来自中国的车辆软件和硬件。商务部当时还表示,今后可能对无人机系统等下达限制,例如机载电脑、通信与飞控系统、地面控制站、操作软件和数据存储装置。 美国针对无人机及相关组件的国家安全调查已于今年7月启动,针对中、重型车辆及配件的调查则在今年4月启动,结果可能导致加征更高关税。 2025年6月,美国总统特朗普签署行政命令,加强针对具有安全威胁的无人机的防御,同时推动美国本土无人机制造。去年12月,拜登签署立法,未来可能禁止大疆(DJI)和Autel出售新型无人机产品于美国市场。 查看评论
苹果“前方超燃”主题发布会已经定档9月10日凌晨1点,届时iPhone 17系列产品及众多新品将正式发布。目前,已经曝光的新品包括:iPhone 17、iiPhone 17 Air、Phone 17 Pro、iPhone 17 Pro Max、Apple Watch Ultra 3、Apple Watch Series 11、Apple Watch SE3、AirPods Pro 3等等。 据最新报道,iPhone 17系列将于北京时间9月12日晚上20点(太平洋时间9月12日早上5点)开启预购,并在9月19日正式开售。 价格方面,摩根士丹利最新分析称,苹果将在发布会上小幅上调iPhone 17系列的价格,这是自2017年以来的首次上调。 其中iPhone 17标准版不会调整,保持与前代一样的起始售价。iPhone 17系列的Pro、Pro Max型号将可能涨价4%–5%。 内存方面,iPhone 17标准版是8GB,17 Air、17 Pro和17 Pro Max都是12GB运存。 存储方面,标准版iPhone 17依然为128GB起步,此外提供256GB和512GB两种选项;而其它三款机型会从256GB起步,此外提供512GB和1TB存储版本。 芯片方面,iPhone 17将搭载A19 芯片;iPhone 17 Pro和Pro Max则采用更强大的A19 Pro芯片,具备6个GPU核心;iPhone 17 Air会搭载“缩水”版 A19 Pro,配有5个GPU核心。 具体来看,iPhone 17售价799美元起(国行预估5999元起),iPhone 17 Air售价949美元起(国行预估6999元起),iPhone 17 Pro售价1049美元(国行预估8999元)、iPhone 17 Pro Max售价1249美元(国行预估10999元)。 以下为详细预估配置一览: 查看评论
你可以不关心香蕉的价格,但很难忽视Nano Banana这根香蕉。在社交媒体和技术社区,用户正热衷于分享它的各种玩法,有人用它把桌面手办转换成真人 Cosplay,有人上传多张素材图,生成风格统一的合成画,还有人把孩子随手画的火柴人一键升格成电影级动态分镜。 Nano Banana的快速响应和自然度,让创作更像实时对话,而不是反复抽卡。这也是许多人第一次感到,AI图像生成变得像实时创作。用户不再需要反复调试结构化的咒语,而是通过简单的自然语言对话,就能对图像进行精确修改 。 再加上几秒内生成的速度,整个过程的流畅感是前所未有的 。这也直接带动了 Gemini App 的用户增长,在短时间内,Nano Banana为Gemini App带来了超过1000万新用户。 它的走红,甚至让一些人联想起了ChatGPT的发布时刻,人们经久不息的从各个角度讨论它、使用它、甚至是捕风捉影猜测它背后的技术实现,而Nano Banana的确给用户带来了类似ChatGPT初期的惊艳感,让大量非技术用户第一次体验AI能力的进化,到高质量、实时、交互式的图像生成/编辑。 Nano Banana究竟做对了什么? Nano Banana的好用,不是单一能力的提升,而是它从根本上改善了AI图像创作的流程。 过去,用户需要学习结构化的提示词才能获取较好的效果。现在,这个过程变成了一场流畅的对话,发出“给这个人戴上眼镜”或“把背景换成阴天”这样的指令,对画面进行精确的局部修改 ,Nano Banana能记住你们的对话,进行相应的响应。 这种记忆力也体现在角色一致性上。以往需要LoRA或Dreambooth等复杂微调技术才能实现的人物固定,现在用户只需用一张图定下角色,就能在后续的对话中,让同一个人出现在不同场景、摆出不同姿势 。在“长得像本人”这个核心需求上,Nano Banana已经与其他模型拉开了代差。 它还能将多张输入图像无缝融合成一个连贯的画面,把一张图里的物体自然地放进另一张图的场景里 。更深一层,与许多基于美学训练的模型不同,Nano Banana背后整合了Gemini家族的世界知识与推理能力 。这让它在执行指令时更聪明,比如能理解现实世界的概念,为你画的特定场景选择恰当的植物物种 。 让这一切体验真正落地的,是速度。数秒的响应时间,带来的不仅是效率,它鼓励用户快速尝试、快速失败、快速调整,用不断的试错来探索创意,而非追求一次成功。其团队成员将这种迭代的过程,称为真正的魔力所在 。 在团队的访谈和公开分享里,Nano Banana的几个方向被反复提及:文字渲染、交错生成、速度哲学,以及世界知识的引入。这些关键词,勾勒出了它的不同之处。 在很多人的直觉里,文字渲染是附属能力,能不能把广告牌上的字写对,好像无伤大雅。但对Nano Banana团队而言,这却是衡量整体性能的核心指标 。文字是一种高度结构化的视觉信息,一个笔画的细微偏差都会让人立刻识别出错误 。 当模型能正确渲染文字时,它也学会了如何在像素层面把控结构和细节,这一能力迁移到其他任务时,会带来整体质量的提升 。团队后来把文字渲染当作一种“代理指标”(Proxy metric),成为持续优化的抓手。 一些LLM从业者尤其表达了把文字渲染作为“代理指标”的带来的启发:找到合适的代理指标,能够成为牵动整体性能提升的杠杆。选择一个对精确度要求极高的任务,通过优化它来驱动整体能力提升。当模型要对齐到一个极端精细、结构化、容错率极低的子任务时,它被迫学会的底层能力,往往会溢出到更宽泛的任务里。 如果说文字渲染解决了画得对的问题,那么交错生成(Interleaved Generation)则改变了“怎么画”的过程。过去的图像生成更像是抽卡,彼此之间没有上下文联系 。Nano Banana引入的交错生成机制改变了这一点 。模型在同一个上下文里生成多张图,第二张能记住第一张,第三张能记住前两张 。这种串行方式让创作更像一个过程,上下文的连贯性,带来了比以往稳定得多的体验。 而要让这个充满过程感的创作体验不被割裂,速度是关键。在图像编辑中,完美几乎是不可能的。Nano Banana团队的共识是,与其追求一次性满足所有细节,不如强调速度 。因为只要生成足够快,用户完全可以毫无心理负担地快速迭代 。 除了流程上的革新,模型在内容理解的深度上也与过去不同。另一个被反复强调的点,是它在生成过程中引入了世界知识 。这使得它不仅能画出视觉上漂亮的图像,还能处理带有常识和背景要求的复杂指令 。例如,在一个80年代美国购物中心风格的场景里,模型不仅理解购物中心,还能在细节上符合那个年代的服饰、灯光和空间语法 。 这种能力的实现,也源于团队的融合。一方面,Gemini团队在推理、世界知识和上下文理解上的优势,为模型奠定了基础 。生成与理解并不是割裂的,团队在访谈中多次强调,图像理解和图像生成像“姐妹能力”,提升一端往往会推动另一端。 另一方面,Imagen团队在图像美学和自然度上的经验,帮助模型解决了“看上去是否真实、是否优雅”的问题 。二者结合,使得Nano Banana在一致性和美感之间找到了平衡。 Nano Banana团队也透露了未来的方向,他们追求的并不只是视觉质量的提升,而是让模型更聪明(smart) ,就是指当用户给出一个模糊或不完整的指令时,模型能够理解意图,甚至在结果上超越原始的要求 。团队成员Mostafa形容这种体验是,“我很高兴它没有完全听我的” 这有点类似模型不再只是被动执行,而是具备了一定的审美判断和创造力的Agent。 一些猜想 对于Nano Banana的底层架构,官方几乎没透露什么信息 。这种"黑箱"状态,也激发了技术社区讨论和推测。 一种观点认为,它可能沿用了MMDiT(多模态扩散Transformer)的路线 。这种设计通过统一的Transformer架构处理文本和图像,将不同模态的信息编码到同一个表示空间里,以实现更原生的跨模态生成 。 也有分析认为模型上层可能有Gemini 2.5这样的大语言模型负责语义理解和推理,而下层则连接一个专门优化过的扩散模型,用于完成高质量的图像输出,以此结合两者的优势 。 此外,一位个人简介为DeepSeek AI 研究员的小红书用户认为其设计思路更接近Janus或UniFluid的统一路线 。即在同一个Transformer主干上,同时接入负责理解的编码器和负责生成的解码器,从而高效地实现看图理解和文本出图的双向能力。 Nano Banana时刻? ChatGPT 时刻的核心,在于技术飞跃带来了零门槛的体验,并迅速转化为大众价值。Nano Banana 在很大程度上复刻了这一点。 但局限同样存在。模型卡片已经明确指出,Gemini 2.5 Flash Image 在长文本渲染和复杂细节的事实性呈现上仍有不足,作为 Gemini 2.5 Flash 的附加能力,它也继承了基础模型的普遍限制。所谓原生多模态,依旧偏向图像任务优化,而Google在底层实现上的克制披露,也让外界难以全面判断它的真正突破。 即便如此,Nano Banana 已经证明,图像生成正走向一个全新的阶段。Nano Banana 已经来了,Giant Banana 还会远吗? 查看评论
被传破产倒闭已久的造车新势力威马汽车,近日又重新出现在公众眼前。9月6日,威马汽车发布落款为翔飞汽车&新威马项目组的“致供应商白皮书”称,根据2025年4月3日法院裁定批准的重整计划,翔飞已接管威马四公司,正在全力以赴推动威马EX5和E5车型在温州基地快速恢复量产。 据蓝鲸新闻报道,记者通过该白皮书显示的沟通联系人了解到,目前威马温州基地已开始复产,部分车辆已下线并开始在卖了。 沟通联系人表示,“已下线十几台车了,主要用于铺市场。”,后续会有新的销售门店,届时也会开新闻发布会。至于具体何时,其坦言,这涉及公司核心机密的营销策略,不便透露。 前述联系人指出,目前工厂已有400多人,涵盖基础工人、班组长、车间主任等,按照正常体系机构在进行。 此前也有向前威马员工发了通知(如准备什么时候启动等),一边“召回”老员工,一边也在大力招聘,“我们现在各个岗位都在招。” 有前威马员工透露,两个月前曾被前领导问要不要回去,“想回一般都可以回去,会重新谈工资。”但其原来部门的人没有打算回去的,“回去也不稳定。” 据了解,新威马制定了分三步走的2025~2030经营发展规划,以实现跨越式发展: 1、复兴阶段(2025~2026):2025年9月复产EX5/E.5车型,确保年产销1万台,争取实现产销2万辆;同时海外破局,布局泰国KD工厂,开拓东南亚及中东市场。2026年量产10万台。 2、发展阶段(2027~2028):年销量跃升25-->40万台;高阶辅助驾驶车型量产,AI赋能研发、生产、营销全链条,启动IPO筹备。 3、跨越阶段(2029~2030):2030年产量挑战100万台,营收1200亿,构造智慧出行生态圈,成为行业新标杆。 查看评论
日前,腾讯混元宣布,混元翻译模型Hunyuan-MT-7B登顶 Hugging Face模型趋势榜第一位。官方表示,该模型和混元世界模型家族最新成员HunyunWorld-Voyager一起,拿下前三中的两席。 据了解,Hunyuan-MT-7B于9月1日开源,其总参数量仅7B,支持33个语种、5种民汉语言/方言互译,是一个能力全面的轻量级翻译模型。 在8月底结束的国际计算语言学协会(ACL)WMT2025比赛中,Hunyuan-MT-7B(参赛名称:Shy-hunyuan-MT)拿下了全部 31个语种比赛中的30个第1名,处于绝对领先地位。 这31个语种除了中文、英语、日语等常见语种,也包含捷克语、马拉地语、爱沙尼亚语、冰岛语等小语种。 腾讯混元表示,在业界常用的翻译能力测评数据集Flores200上,腾讯混元Hunyuan-MT-7B模型也有卓越的效果表现,明显领先于同尺寸模型,与超大尺寸模型效果对比也不逊色。 针对翻译场景,腾讯混元提出了一个完整的翻译模型训练范式,覆盖从预训练、到CPT再到监督调参、翻译强化和集成强化全链条,使得模型的翻译效果达到业界最优。 查看评论
近日,鲁豫在《热浪之外》节目中问棋士柯洁:“是否会再战AI?”柯洁幽默回应:“就想看我被虐吗?如果观众喜欢看我就下,只不过是把平常自己做的事情放在公众面前,下一百盘输一百盘。”柯洁表示,目前下棋很方便,只要在电脑上和AI下。对此,鲁豫提到:“下棋过程中,AI难道不会去搜集你的数据信息吗?” 柯洁表示人类已很难胜过AI,与其对抗不如专注人类赛事,更调侃称自己的棋手数据对AI毫无价值,因为水平太低了,“输进去反而污染数据库”。 柯洁坦然面对技术变革,心态豁达依旧。 据了解,2017年,柯洁以总比分0:3负于阿尔法狗(围棋AI程序AlphaGo),赛后,柯洁一度痛哭流泪。“我觉得我的十几年的努力一点意义都没有”。 据媒体报道,柯洁在2022年一场讲座上坦言,当时我们并没有意识到,围棋会有这么大的一个冲击。 柯洁表示,2015年左右,国内大部分棋手仍对围棋抱有非常乐观的态度。当时大家判断,可能在未来的10年、20年都不会见到AI战胜人类棋手,“现在来看,这是一种很无知、幼稚的想法。” 查看评论
据卫报报道,Shein 的英国分公司被指控将大部分收入转移给其新加坡母公司,以减少其在英国的税收负担。该公司曾考虑在伦敦证券交易所上市,募集资金 500 亿英镑,但预计将在香港上市。尽管去年的销售额达到 20 亿英镑,但仅缴纳了 960 万英镑的公司税。 根据英国公司注册局提交的账目,这笔款项相当于该公司 2024 年在英国实现的 3820 万英镑税前利润的 25%,符合英国公司税率。 然而,活动人士表示,相对于 Shein 20 亿英镑的销售额,这笔费用较低,因为约 84% 或 17.2 亿英镑的销售额作为采购成本转移到其母公司新加坡的 Roadget Business Pte Ltd。 公平税收基金会首席执行官保罗·莫纳汉表示:英国剩下的可供缴纳企业所得税的盈余非常少。 提到十多年前亚马逊、苹果和微软将利润转移到低税率国家的策略,这些策略曾遭到严厉批评。 莫纳汉表示:这感觉就像是税收领域的新狂野西部。如今的快时尚行业让人想起了过去几十年科技巨头们最严重的反税措施。 “需要问的是,Shein Distribution UK Ltd 在英国的销售中产生的经济价值有多少实际被记为英国利润并缴纳企业所得税,又有多少被记为避税天堂新加坡的利润。” “英国账目显示,该公司与新加坡的直属母公司存在大量关联交易,这些交易将大部分收入作为购买成本转回新加坡,而英国境内需纳税的盈余则相对较少。” “新加坡不仅拥有低于英国的25%的企业所得税率(17%),而且还提供特殊激励措施来吸引企业在那里设立,这些企业的利润税率可低至5%。我们从Shein之前的披露中得知,Roadget Business Pte Ltd就利用了这些优惠政策。” 公平税收基金会的数据显示,该公司新加坡业务的账目显示,从 2021 年到 2023 年底的三年内,其平均企业税率为 9.4%。 Shein 的一位发言人表示,这些指控荒谬至极,即使经过最基本的审查也会不攻自破。 该发言人表示:按照国际贸易的标准,我们的英国公司以符合现行市场条件和公平交易原则的价格从我们的委托人处购买产品进行转售,就像任何独立第三方一样。这种方法确保我们的交易公平合理,并符合全球惯例。这些是全球商业中最基本、最广泛接受的惯例之一,这些活动人士应该已经了解这一点。 “任何对我们的行业做过哪怕是最少研究的人都应该清楚,我们处于一个低利润、高产量的行业。” “Shein 遵守我们运营的每个市场的相关法律法规。我们在英国缴纳所有相关税款(如适用)。” Shein 新加坡业务的最终所有者位于避税天堂开曼群岛。 Shein 发言人表示:这是一种标准的、跨行业广泛使用的公司结构。 人们对 Shein 在英国缴纳的低企业税率的担忧,加剧了人们对其使用最低限度规则的担忧,该规则允许海外卖家将价值 135 英镑或以下的商品直接发送给英国购物者,而无需缴纳任何关税。 莫纳汉估计,如果 Shein 没有享受税收减免,其在向英国进口商品时将支付高达 2 亿英镑的关税。 英国财政大臣雷切尔·里夫斯正在审查这项规定,因为人们越来越担心中国零售商和制造商正在向英国倾销商品。 此前,美国于5月取消了针对中国制造商品的最低限度豁免政策。根据该政策,寄给个人的价值低于800美元(600英镑)的包裹可免征进口税。本周,美国也于本月晚些时候取消了针对所有国家商品的税收减免政策。 欧盟二月份表示,将逐步取消对低价值包裹的关税豁免。 本周有消息称,去年来自中国的包裹价值 30 亿英镑,占全球运往英国的所有小包裹的 51% 。 根据英国广播公司通过信息自由请求获得的英国税务海关总署数据,这一数字比 2023-24 年的 35% 有所上升。 查看评论
最近几年来苹果基于ARM自研的M系列处理器让人眼前一亮,不仅性能、IPC惊艳,而且能效也非常好,MacBook不用x86处理器也能打出一片天。这也让大家再一次强化了以往的认知——x86处理器性能强,但能效不如ARM处理器。 不过x86阵营的两大山头可不会这么认为,在IFA2025展会上,AMD公司代表也谈到了这个问题,表示x86能效不行的传闻早在去年其实就被推翻了。 AMD也不是唯一一个如此表态的,Intel公司之前就有过类似的表态,同样也不认为x86的能效会输给ARM处理器。 如果还有这种想法的人可以看看去年推出的Lunar Lake处理器,这是Intel为了回应MacBook所用的M处理器开发的高性能低功耗平台,从架构到封装再到产品线都有巨大变化,连内存都变成了整合型的。 Lunar Lake平台的办公本在轻薄、续航、发热等方面的表现可以说已经让人满意了,而且兼容性更是ARM平台不能比的。 从这一点上来说,AMD或者Intel否认x86能效不行是没问题的,实际上大家的观念也该更新了,不论是ARM还是x86,性能、功耗表现更取决于芯片工艺、架构,而不是简单的指令集区别,现在也没有什么CISC、RISC指令集鸿沟了。 当然,x86处理器能效崛起了也不代表一切就OK了,Lunar Lake这样的产品叫好不叫座,已经没有后续产品了,说到底了还是成本问题,先进封装、整合内存都是要钱的。 这方面来看,苹果还是有几把刷子的,M4的Macbook都能做到5000元档了,同价位的Wintel笔记本能打的一个也没有。 查看评论
日前,有博主分享了蔚来全新ES8预防开门杀的新手段,得到网友的一致好评。据其介绍,如果二排乘客在解开安全带的一瞬间,后排屏幕上就会显示侧后车门处盲区影像。 从照片中来看,盲区影像能够一眼看清后方路况,最大程度上预防下车开门杀情况的发生。 如果是后排左右两侧的乘客同时解开安全带,后排屏幕就会一分为二,分屏显示左右两侧车门的盲区影像。 博主进一步解释道,这个影像的时机很重要,因为解开安全带的时候乘客还在车里,所以目光很容易被屏幕吸引,就能有效避免开门杀。如果是下车开门的时候才有影像,很少会有人注意到。 并且,博主还介绍,前排也有类似设计,两侧的盲区影响,分别投在天际屏上。 对于蔚来的这一预防开门杀设计,不少网友都给出了好评,确实能够直观提醒乘客后方路况。还有网友建议,其它后排有屏幕的车企,也跟进此类安全设计。 查看评论
如果把当下最让人迷惑的科技产品拉个清单,AI 硬件网红们绝对榜上有名。从 699 美元的 Humane Ai Pin 到 200 美元的 Rabbit R1,这些 AI 创业公司都在兜售同一个美丽的谎言:你需要专门的硬件才能体验真正的 AI。今天,这个名单上又多了一个新成员——AI Key。 这是一款定位于“AI 助手”的外接硬件,厂商宣传它可随插随拔,通过 iPhone 的 USB 接口连接后,能够帮助你动动嘴操作手机上的应用和功能,从消息、地图到拍照、社交软件,几乎覆盖常见任务。 类似于手机 Agent,它的用法也并不复杂。 只需提出你的需求,确认它调用的应用,接着设备会自动模拟点击、滑动和输入操作。用户既可以盯着它执行,也可以完全交给它处理,并在需要时随时中止或修改。 值得注意的是,虽然苹果提供了如“快捷指令”这类系统级自动化工具,但第三方应用无法深度调用或控制其他应用的行为,这也解释了为什么市场上会出现这类试图填补空白的外接硬件。 外观小巧的它拥有三种配色:午夜黑、蛋奶白和达维粉,售价 89 美元,厂商承诺圣诞节前全球发货。创始人 Adam Cohen Hillel 在 X 平台表示,首批产品在短短 7 小时内几乎售罄。 AI key 的火爆并不令人意外,只是,问题也随之而来,为了把手机变成“AI 手机”,你真的需要额外插一个外设吗?基于此,我们还可以延伸出更深层的问题——我们真的需要为了 AI 而专门创造 AI 硬件吗? AI 硬件卷生卷死,但手机形态稳坐 C 位 尽管苹果高级副总裁埃迪·库多次强调,未来十年内 iPhone 可能被淘汰,但不可否认的是,当下最好的 AI 硬件形态依旧是手机。 你口袋里的 iPhone 16 Pro 搭载第二代 3 纳米制程芯片,能访问 ChatGPT、Claude、Gemini、DeepSeek 等人类历史上最强大的 AI 模型。而即便抛却云端大模型的加持,手机厂商们也纷纷在端侧模型上大作文章。 哪怕是被诟病在 AI 赛道掉队的苹果,最近也在 Hugging Face 上发布了 FastVLM 和 MobileCLIP2。 这些模型比以往版本快 85 倍、体积缩小 3.4 倍,让实时视觉语言模型(VLM)应用成为可能,甚至还能在浏览器里完全本地运行,实现实时视频字幕生成。 更不用说前阵子发布的 Google Pixel 10 系列手机,堪称买 AI 送手机,它不仅能本地运行 Gemini Nano 模型,还搭载了 Camera Coach 与 Auto Best Take 等功能,能够实时分析拍摄场景、光线与人物动作,自动优化照片甚至给出拍摄建议。 之所以能做到这一点,原因很简单:硬件素质摆在那里。 如果回首第一波涌现 AI 硬件的浪潮,Humane Ai Pin 和 Rabbit R1,均以颠覆者的姿态出现,试图通过“无屏/少屏”的理念,重塑个人计算的未来 。 前者 Ai Pin 由前苹果高管打造,秉承着“让技术成为你的仆人,而非你的主人”使命 。后者的 R1 则以其大胆的橙色设计和“大型动作模型”概念,承诺通过 AI 替用户完成复杂的应用内任务 。 然而,Humane Ai Pin 正式发货后,却被发现有着严重的过热和续航问题,最后卖身惠普。 而 Rabbit R1 同样高开低走,发货初期,R1 的 USB-C 接口对充电线极为挑剔,仅能兼容部分线缆,且电池续航极短,仅 1000 毫安时的电池容量,不仅是质量问题,更反映出初创公司在供应链和品控上的经验不足。 Reddit 论坛上一则评论甚至提到,R1 团队“意外订购了错误的内存部件” ,这一小插曲生动地揭示了硬件初创公司在供应链管理上所面临的混乱与脆弱性。 当初创公司在成本控制和供应链采购上无奈妥协,也就更容易导致了一个恶性循环:低端硬件无法提供流畅体验,用户差评导致口碑崩盘,反过来影响销售,使得公司难以通过规模化生产来降低成本,最终陷入财务困境,甚至破产。 倒也不是说像 R1 和 Ai Pin 没有价值,只是,它们的意义可能更多体现在 AI 交互模式的探索上。 它们所倡导的理念——主动代理、环境语音命令、统一的任务界面——是强大的。但这些概念不会在一个独立的盒子里茁壮成长,而是会被主导平台吸收,变成 iOS、Android 等系统的原生能力。 Rabbit R1 的滚轮、Humane Ai Pin 的投影、AI Key 的“钥匙”形态,这些看似奇怪的设计选择,实际上是在测试不同的交互假设,为行业排除错误选项。 我并不反对创新,也不认为所有的 AI 硬件创业都是无意义的。但我们需要诚实地面对一个现实:在手机已经如此强大的今天,任何试图通过外接配件来“增强”手机 AI 能力的产品,都面临着巨大的用户体验挑战。 真正的机会可能在别处:要么做手机永远做不到的事情,要么等待一个全新的计算平台出现。而不是给 iPhone 插个插件,然后告诉用户:看,这就是未来。 功能还是属性?我们对 AI 的根本误解 一个隐藏在 AI 硬件争论背后的技术哲学是,你到底把 AI 当作一个“功能”,还是当作一种“属性”。 功能是离散的、可分割的,需要专门的承载物。而属性是渗透性的、无处不在的,它改变的是整个系统的运作方式。 当 AI 作为功能,这种思路是把 AI 单独拎出来,打包成一个卖点。 比如聊天机器人、翻译器,或者 Rabbit R1 的 LAM、Humane Ai Pin 的激光投影。它们的逻辑是:先有了 AI 技术,再找个硬件来装进去。当用户要用,就得专门打开、专门交互。 问题在于,大部分“功能”在手机里早已存在,还做得更好,所以新硬件看起来像个“中间商”,缺乏真正的护城河。 另一种思路是把 AI 融进现有生态,让它成为系统自带的“属性”。 苹果的 Apple Intelligence 就是例子:优先通知、邮件摘要、照片清理、Siri 强化,都在原有体验里用 AI 长出来。Google 把 Gemini Nano 下放到本地设备,也是类似逻辑。 用户甚至感觉不到 AI 的存在,但效率和体验却被整体提升。 汽车诞生之初,被理所当然地称为“无马的马车 ”。人们的想象力局限于替代马匹,关注点在于它能否跑得像马一样快,会不会惊扰到路旁的牛群。 没有人能预见到,这个“铁皮怪物”将催生出高速公路网、现代物流、郊区文化,并彻底改变城市的形态和人们的生活半径。今天,我们对 AI 硬件的想象力,或许也同样被困在狭窄的框架里。 于是,当人工智能这个“新物种”出现时,我们的第一反应几乎是条件反射式的:它也需要一台“专属设备”。一个“AI 盒子”、“AI 终端”,或者至少,是一台“AI PC”。 这种想法,就像一个原始人第一次看到火,不是思考如何利用火的能量去烹饪、取暖、冶炼,而是琢磨着必须制造一根“火棍”,才能将火焰握在手中。 早在 1998 年,Eli Zelkha 和他的团队提出了“环境智能”这一概念,指的是一种能够“感知人类存在并做出响应”的智能环境系统。这些环境通过嵌入式设备(如传感器、执行器、AI 模块)实现与用户的无感交互,试图将技术融入生活而不是成为负担。 而真正理解 AI 的公司不会试图刻意创造“AI 设备”,而会让所有设备都变得 AI 化。 一个成熟的技术,不会终日将名字挂在嘴边。正如我们今天通常不会刻意说“电力台灯”或“互联网电脑”,因为电力和网络连接早已是这些设备的底层能力,是理所当然的存在。 同样,当 AI 真正普及时,它也会从一个被反复强调的“卖点”,下沉为所有智能设备的基础设施。 届时,你的汽车、冰箱、眼镜、甚至衣服,都将拥有不同形式的智能,它们彼此连接,协同运作,共同构成你的个人“环境智能”系统。 而当我们不再谈论 AI 硬件的那一天,才是 AI 无处不在的开始。 查看评论
9月7日,特斯拉CEO埃隆•马斯克在社交媒体发帖透露,刚和特斯拉AI5芯片设计团队完成一场非常出色的设计评审,称这款芯片将成为“史诗级”产品,他还预测下一代的AI6芯片有望成为迄今为止最出色的AI芯片。 马斯克还表示:“从研发两种芯片架构转向专注于一种,意味着我们所有的芯片人才都将集中精力打造这一款卓越的芯片。现在回想起来,这无疑是个显而易见的正确决策。” 马斯克还在评论区表示,他认为AI5可能是对于参数数量低于2500亿的模型来说最好的推理芯片,“它的硅片成本最低,性能功耗比也最高,AI6会更进一步。” 据今年7月份的相关报道,特斯拉AI5芯片将专注于车辆推理(例如自动驾驶)计算集群训练,有望于2026年底开始量产;特斯拉AI6芯片将采用可扩展设计,不仅适用于自动驾驶汽车和人形机器人,还可能扩展到AI数据中心。 此外,AI6首批样品预计将在三星电子位于韩国的代工和封装工厂开始生产,随后,三星位于美国得克萨斯州的代工厂将进行AI6芯片的量产,三星的得州工厂于2025年投入运营。 查看评论
微软公司周六表示,由于红海多条国际电缆遭切断,其 Azure 云平台的客户可能会面临网络延迟加剧的情况。该公司在网上发布的状态更新中称,往返于亚洲与欧洲、且需途经中东地区的数据传输正受到影响,并补充表示其工程团队正采取措施缓解当前状况。不过,该通知未说明电缆是如何被切断的。 微软表示:“海底光纤修复需要一定时间,因此在此期间,我们将持续监控、重新平衡并优化传输路径,以降低对客户的影响。” 红海是重要的通信通道,可通过埃及连接欧洲、非洲与亚洲。由于也门胡塞武装持续在该地区袭击船只,修复该区域的海底电缆可能会面临较大困难。 查看评论
加拿大航空的乘务员于周六以压倒性多数拒绝了一项薪资协议。目前,这场激烈的薪资纠纷预计将通过调解解决,因员工无法再采取合法的罢工行动。该乘务员工会表示,加拿大航空及旗下子公司加拿大胭脂航空(Air Canada Rouge)的乘务员中,有 99.1% 投票反对批准公司提出的薪资方案。 此前,加拿大航空乘务员曾无视加拿大政府终止罢工的努力,发起了一场持续四天的罢工,导致 50 万名乘客滞留。8 月 19 日,劳资双方谈判代表曾达成一项临时协议,罢工才得以结束。 加拿大航空于周六表示,公司已与加拿大公共雇员工会(CUPE)达成一致,目前不得发起任何劳资纠纷行动,因此不会出现罢工或闭厂情况,航班将继续正常运营。 此次罢工也让北美乘务员的一项核心诉求受到关注:他们希望薪资能覆盖从签到上岗到签退离岗的全部工作时长。加拿大航空及美国联合航空等多家美国航司的乘务员,一直对当前的薪酬结构提出异议 —— 目前的薪酬体系主要仅对飞机飞行期间的工作时间进行支付。 国际乘务员协会主席萨拉・尼尔森表示,公众对加拿大航空乘务员罢工的支持,也为该协会旗下的美国成员提供了助力。国际乘务员协会代表美国联合航空的乘务员,这些乘务员近期也拒绝了一项临时协议,部分原因正是为了争取 “地面工作时间薪资”。 尼尔森称:“加拿大航空乘务员这场鼓舞人心的抗争意义重大,也为相关诉求的推进注入了动力。” 查看评论
沃伦・巴菲特表示,他对卡夫亨氏(Kraft Heinz)计划分拆为两家公司的决定感到 “失望”—— 这一举措实质上是在逆转他 2015 年协助推动的合并案,而该合并最终成为了他最重大的投资失误之一。 周二,巴菲特在与《财经论坛》(Squawk Box)的非公开电话沟通中提到,他同样失望的是,此次分拆无需经过股东投票表决。 伯克希尔哈撒韦公司目前持有卡夫亨氏 27.5% 的股份,市值约 89 亿美元,是这家食品巨头目前最大的股东。 巴菲特表示,在卡夫亨氏做出最终决定前,伯克希尔哈撒韦的首席执行官继任者格雷格・阿贝尔(Greg Abel)已向卡夫亨氏管理团队直接表达了反对意见。 对于伯克希尔而言,公开(甚至私下)批评其所持股份公司的管理层,是极为罕见的情况 —— 该公司几乎一直以被动投资者的身份参与投资。 华尔街与巴菲特持相同的失望态度。 卡夫亨氏于周二清晨宣布分拆计划后,其股价当日一度下跌 7.6%;不过后续收复了部分失地,在因节假日缩短的当周,最终仅下跌 2.4%。 巴菲特的不满是否会促使伯克希尔减持或清仓卡夫亨氏股份? 巴菲特并未排除这一可能性,他表示:“我们将采取任何我们认为符合伯克希尔最佳利益的行动。” 但他补充道:“如果有人接洽我们,希望收购我们持有的股份,除非向卡夫亨氏的其他股东提供相同报价,否则我们不会接受大宗收购要约。” 也就是说,除非有人有意收购整个公司,否则不会考虑单独出售股份。 贝基・奎克透露,巴菲特对未来一年卡夫亨氏为推进分拆计划需额外支出 3 亿美元管理费用的做法表示不满,且他认为这笔投入不会带来多大成效。 巴菲特表示:“当初将两家公司合并,显然不是个明智的决定,但我认为现在拆分也无法解决问题。” 2013 年,伯克希尔与巴西 3G 资本管理公司(3G Capital Management)联手,以 233 亿美元收购了亨氏公司。 两年后,卡夫食品与亨氏合并;2015 年 7 月交易完成时,伯克希尔持有新公司超过 3.25 亿股股份,市值约 240 亿美元。 尽管合并初期,伯克希尔持有的股份市值表现良好,2016 年曾升至约 300 亿美元,但在随后三年间大幅下滑,自 2020 年起便在 100 亿美元左右波动。 巴菲特在 2015 年致股东的信中提到,伯克希尔当时购入这些股份的成本为 98 亿美元,因此目前整体亏损约 10 亿美元。 为更贴合市场价值,伯克希尔在今年第二季度对该笔投资计提了 38 亿美元减值;2019 年,该公司也曾对这笔投资计提 30 亿美元减值。 2019 年,巴菲特在直播采访中,曾对伯克希尔参与卡夫亨氏合并案表达过遗憾,称自己为一家优质公司 “支付了过高价格”。 自合并完成以来,卡夫亨氏的股价已累计下跌 69%。 此次分拆并非完全出乎意料。 今年 7 月曾报道,卡夫亨氏 “正考虑剥离其大部分食品杂货业务,包括多个卡夫品牌”。 5 月,卡夫亨氏透露 “正在评估战略交易以释放股东价值” 后,两名伯克希尔高管随即辞去了卡夫亨氏董事会职务。 据一位分析师称,当时这些高管的辞职引发了市场猜测,认为伯克希尔可能开始减持股份,“给该股带来了抛售压力”。 如今,这种抛售压力变得更加严峻。 由于伯克希尔持有卡夫亨氏超过 10% 的股份,根据规定,其在公开市场的任何减持行为都需在两个工作日内报备,而这可能引发其他投资者跟风抛售。 并非只有巴菲特对此次分拆提出批评。 《金融时报》撰文指出:“卡夫亨氏的核心问题在于,它未能对消费者口味的变化做出回应。” 该报认为,此次分拆 “并非大胆的战略转向,更多是多年来重成本削减、轻创新导致业绩不佳的结果”。 有媒体将卡夫亨氏的此次重组比作 “制作香肠的过程…… 一如既往令人不快”。她表示:“尽管卡夫亨氏拥有众多品牌,但无休止的交易循环似乎只带来一种糟糕的结果”,还伴随着 “不切实际的乐观” 财务操作。 伯克希尔股票动态: 近四周走势 近十二周走势 伯克希尔主要美国持仓 ——2025 年 9 月 5 日 持仓数据主要来源于伯克希尔哈撒韦 8 月 14 日提交的 13F 文件(截至 2025 年 6 月 30 日),以下除外: 伊藤忠商事(Itochu):数据截至 2025 年 3 月 17 日 三菱商事(Mitsubishi):数据截至 2025 年 8 月 28 日 东京证券交易所股票价格已按汇率从日元换算为美元。 查看评论
英国将投入 1.82 亿英镑(约合 2.46 亿美元)建立五所技术学院,旨在培养国防岗位所需人才,并推动军事创新发展。英国政府于周六公布该计划,明确学院将重点培养潜艇工程师、网络战专家及焊工等专业人员。此外,该计划还将为数千门短期课程提供资金支持,助力国防领域雇主更快提升现有员工及新入职人员在关键技术领域的技能水平。 该计划的申请通道预计将于今年年底开放,五所学院将于 2026 年正式启用。 英国国防大臣约翰・希利(John Healey)在声明中表示:“这是数十年来规模最大的国防技能培养计划。正是英国本土工人的专业能力,让英国企业在国防创新与国防工业领域保持领先优势。” 英国首相斯塔默领导的工党政府定于周一公布其国防工业战略。斯塔默已将国防投资列为核心计划之一,目标是到 2035 年将军事开支提升至国内生产总值(GDP)的 3.5%,其中包括向高校提供专项拨款。 周五,斯塔默对英国内阁进行了改组,此次改组旨在促进经济增长,并从增加的军事开支中获取经济收益。本周,斯塔默还访问了英国宇航系统公司(BAE Systems Plc)位于格拉斯哥附近的戈万造船厂 —— 此前该公司获得了挪威一份价值 100 亿英镑的合同,将为挪威建造 26 型护卫舰,该型号护卫舰主要用于探测、追踪并打击潜艇。 查看评论
当地时间9月6日,万国邮政联盟在官网发布消息说,美国8月底暂停小额包裹免税待遇当天,寄往美国的包裹量骤减81%;全球已有88家邮政运营商全面或部分暂停对美包裹寄递。美国总统特朗普7月30日签署行政令,规定从8月29日起暂停对价值800美元及以下的进口包裹给予免税待遇,届时小额包裹需缴纳适用的所有税费。 万国邮联说,各邮政运营商通过万国邮联电子网络交换的数据显示,上述行政令生效当天,从万国邮联成员国寄往美国的包裹量与一周前相比骤减81%。此外,88家邮政运营商告知万国邮联,已暂停部分或全部对美邮政服务,直到相关解决方案出台。 业内人士指出,美国取消低值免税待遇波及全球邮政网络,受冲击最大的将是依赖跨境电商的小微企业。 万国邮联国际局总局长目时正彦表示,万国邮联快速开发一项新的技术解决方案,以期帮助成员国邮政运营商恢复对美包裹寄递服务。据其官网介绍,自9月5日起,成员国的邮政运营商可通过应用程序编程接口(API)访问一个到岸成本计算器,并将其嵌入零售和柜台系统中。这一方案使邮政运营商能够在寄件地帮助客户计算并支付寄美包裹所需的关税。 万国邮联是负责国际邮政事务的联合国专门机构,总部设在瑞士首都伯尔尼,目前有192个成员国。 查看评论
“AI奥数”第二届大赛,英伟达团队(NemoSkills)曾夺下第一!这一次,AIMO2组委会再次重启赛题,OpenAI o3首次参赛,就拿下了最亮眼的成绩。陶哲轩激动表示,过去,这个比赛仅限于开源模型,计算资源也卡得比较紧。 庆幸的是,AIMO第二轮比赛中,NemoSkills和清华微软imagination research、以及o3同时参赛。 测试分为两种条件:一种给差不多的计算资源,另一种是放开算力随便跑。 结果也在意料之中,算力给得越足,模型表现越好。 在算力管够的情况下,OpenAI o3成绩直接飙到了47分(满分50分)。甚至,每道题给两次机会的话,还能冲满分。 另一个有意思的情况是,在计算资源相同的情况下,开源模型和商业模型的差异其实并不大。 今天,这份完整的研究测试报告正式放出。 报告地址:https://aimoprize.com/updates/2025-09-05-the-gap-is-shrinking 一起来看看,o3在具体实测中的表现。 奥数级难题,AI扛把子 对于科学可复现性,确保开源模型广泛可得至关重要。但开源模型与闭源模型之间的性能差距到底有多大? 在数学推理情境下,这次的测评提供了更细致的理解: 在奥数难度的数学推理上,商用和开源AI的差距在缩小。 开源即将追上商用模型。 去年,Epoch AI估计:当今最好的开源模型在性能和训练算力方面与封闭模型相当,但存在大约一年的差距 人工智能数学奥林匹克(AIMO)创立于2023年,旨在推动开源AI模型在高阶数学推理的的发展。 比赛传送门:https://www.kaggle.com/competitions/ai-mathematical-olympiad-progress-prize-2/overview 本阶段题目难度进一步提升,主要围绕各国奥赛级别(如英国数学奥林匹克BMO、美国数学奥林匹克USAMO)。 AIMO2私榜的前五名队伍及其成绩如下(括号内为公榜成绩): NemoSkills:34/50(公榜:33/50) imagination-research:31/50(公榜:34/50) Aliev:30/50(公榜:28/50) sravn:29/50(公榜:25/50) usernam:29/50(公榜:25/50) Kaggle的“公榜”在赛事全程向参赛者可见,为了避免数据泄露,并不会公开数据。 由于在单一榜单上反复评测(即便题目不公开)也可能间接泄露信息,Kaggle还会提供一个包含相似难度题目的“私榜”,仅在赛末对模型进行一次性评估,以确定最终名次。 考虑到相较AIMO1题目难度显著上升,这样的成绩相当亮眼。 不过,一个有趣而关键的问题仍待回答:当闭源AI模型“上场”解AIMO的竞赛题时,会交出怎样的答卷? 对比,AIMO与OpenAI等合作开展了一项实验,将OpenAI的o3模型未发布的版本o3-preview,应用于AIMO2公共排行榜中50道奥林匹克竞赛级数学题。 这次对比了通用型模型o3-preview,和开源的AIMO2竞赛中针对数学专门优化的Top 2模型。 此外,这次还引入“AIMO2-combined”这一参照系: 将参赛的2000多支Kaggle队伍中各自最优模型的解题结果合并,只要有至少一个模型解出某题,即计为该题被解决。 从绝对意义上看,不考虑由算力成本带来的限制,AIMO基准上,o3-preview高算力版本接近达到“饱和”,即便它是通用模型、并未专门针对数学进行优化。 这一成绩令人印象深刻,超乎预期。 这表明在推理性能方面,最强的开源模型与最强的闭源模型之间,仍存在显著差距。 但如果把算力成本纳入考量,差距会显著缩小。 在50题基准上,o3-preview低算力版本单次运行的平均成本为每题略低于1美元。 这一成本高于在自有的8×H100机器上运行全部五个获胜模型的成本,并与在商业租赁的8×H100 GPU上运行单个获胜模型的成本大致相当;虽然难以进行精确的价格对比,但成本的数量级相近。 AIMO2原始前五模型的合并分为38/50,较o3-preview低算力版本落后5分,这表明在仅就算力进行调整、限定于50道题的前提下,推理性能大致相近。 接下来,将依次概述o3-preview的表现、冠亚军队伍的表现,以及AIMO2-combined的整体表现。 算力足够,o3一次拿近满分 AIMO在三种不同的参数设置下运行o3-preview:低算力、中等算力、高算力。 这些设置既影响o3-preview的内部思考与推理层次,也带来不同的硬件成本。 需要说明的是,低算力与中等算力版本在概念上,对应为同一个基础模型在两种参数下运行。 而高算力版本,还使用了一个学习得到的打分函数来挑选最佳答案。 这种在固定采样率下进行的“采样-排序”(sample-and-rank)机制带来更好的表现。 与Kaggle竞赛相同,测试在严格条件下进行,确保公开榜测试集保持无数据污染且没有信息泄露。 每道题仅尝试一次。 低算力与中等算力版本各返回一个答案;而采用采样-排序机制的高算力版本会返回若干答案,并附带一个评分。 根据算力版本不同,OpenAI模型的得分如下: o3-preview(高算力版本,计入排名第一与排名第二的答案):50/50 o3-preview(高算力版本,仅计入排名第一的答案):47/50 o3-preview(中等算力版本):46/50 o3-preview(低算力版本):43/50 即便将NemoSkills的AIMO2冠军模型,迁移到比Kaggle更强的硬件上运行,o3-preview的低算力版本仍然多解出7题。 中等算力版本解出了与低算力版本相同的题目,并额外多解出3题,总计46/50。 高算力版本在仅计入排名第一答案时得分47/50;若同时计入排名第二的答案则为50/50。 这表明,o3-preview在原则上,具备为全部50道题产生正确答案的能力。 这一结果与AIMO2中,全部2k+支Kaggle参赛队伍的最佳模型组合分相当——后者总计也解出47/50。 8块H100,英伟达AI仅提1分 此前,拿下第一和第二名的团队——NemoSkills和imagination-research,再次参与了重估。 为了更好了解模型的全部潜力,团队获准访问一台8×H100 GPU,总计640GB显存的机器。 在AIMO2中,为了让模型能在Kaggle平台上运行,赛事对参赛队伍施加了资源限制: 每支队伍提供4块L4 GPU,总计96 GB 显存(VRAM)。 在本次评测中,组委会移除了各队为适配Kaggle资源限制,让模型得以在50道公开榜题目上充分发挥其全部能力。 最终结果如何? · NemoSkills得分35/50,较其在Kaggle公开榜的33/50有所提升; · imagination-research也得到35/50,较其在Kaggle公开榜的34/50提升。 开源与闭源,差距再次缩小 不过,在报告与比较分数时需要谨慎。 AIMO2-combined的47/50分大致类似于一种“pass@2k+”类型的分数(亦即“多样本通过率”): 在每题2k+次尝试中,只要至少有一次解答正确即可计为通过,且不再进行其他排序。 更一般地,常用的“pass@n”类型分数指某个(固定黑箱的)模型被查询n次,只要正确解包含在这n个输出中,就据此报告该分数(即使模型内部还能运行更多次)。 多次查询之间不允许保留模型状态。 当然,2k+次提交对应的模型并不相同;而严格讲,pass@n要求底层是同一个模型,因此pass@2k+只是一个近似分数。 o3-preview的低算力与中等算力分数,以及高算力版本的47/50,均属于pass@1类型分数。 在这三个算力级别中,o3-preview低算力版本未能解出的7道数学题包括:2道几何、2道代数和3道组合。 尽管o3-preview表现非常强,但有一道名为“RUNNER”(见下方图表)的问题尤为突出: 该题被NemoSkills解出,但o3-preview的低算力与中等算力版本未能解出,而在高算力版本中其正确答案仅排名第二。 相反,另一道题“EIGHTS”在高算力版本中以排名第一的答案被解出。 该题未被AIMO2前五名模型解出,却被若干其他排名较低的AIMO2模型解出。 以上这些结果,皆具鲁棒性。 原因在于:题目数量多且难度高,多数达到国家数学奥赛水平,少部分略易或略难,接近IMO难度级别。 对所有o3-preview版本的评测,都在一个很短的时间窗口内(数小时)完成。 并且AIMO获得了原始API输出的访问权限,便于复核与分析。 这些结果代表了基于AI的推理,在极具挑战性的领域迈出的一个里程碑式进展。 顺便提一句,AIMO Progress Prize 3(AIMO3)将于2025年秋季启动。 难度等级将再次提升,题目将以国际数学奥林匹克(IMO)水平为中心。关于时间安排、奖金池以及改进后的竞赛形式的完整细节将适时公布。 查看评论
您可以订阅此RSS以获取更多信息