86-0532-83136898        info@jinsanyang.com
Chinese   English

产品中心

hth华体会全站入口:OpenAI称已找到幻觉根源特朗普宴请硅谷CEO马斯克黄仁勋没来电商AI模特用了罪犯面孔Hunt Good周报

来源:hth华体会全站入口    发布时间:2025-09-08 06:48:22
华体会HTH 体育登录:

  微软 Copilot 成近期增长最快 AI 聊天机器人,175% 增幅遥遥领先

  虽然 ChatGPT 仍是用户数量最多的 AI 聊天机器人,但 Copilot 的强劲增长尤其引人注目。

  根据 Comscore( 一家总部在美国的信息和分析公司 )的数据,ChatGPT 在桌面端拥有 3600 万用户,移动端为 2530 万用户,总体保持领先。而 Copilot 紧随其后,桌面端用户达到 2310 万,移动端用户为 880 万。Google Gemini 则以移动端 1420 万用户排名第三。

  Comscore 高级副总裁 Smriti Sharma 提到,ChatGPT 较早进入市场并迅速积累大规模用户群,因此上涨的速度趋于稳定。而 Copilot 和 Gemini 尚处于增长早期阶段,增速自然较高。

  但是,数据还显示,超过 85% 的移动端用户倾向于专注使用一种AI工具,ChatGPT 用户的忠诚度表现最为突出。

  据彭博社援引知情人士消息称,DeepSeek 正在开发一款具备更高阶 Agent 能力的 AI 模型,并 预计将于今年年底发布 。

  DeepSeek 在今年 1 月发布 R1,以极低的构建成本在基准测试中取得了与 OpenAI 相媲美的成绩,一举成名。之后,DeepSeek 便很少有新的发布,同期竞争对象像阿里千问、腾讯混元、字节豆包等,则是一直在频繁更新模型。

  这款预计年底发布的新智能体,并非普通聊天机器人,其设计目标是能够以最少的人工干预,执行编写和调试代码、研究旅行计划、启动工作流等多步骤复杂任务,并通过自主学习不断进步。

  内部人士称,梁文锋的目标是打造一项「基础性」技术,而非一个华而不实的演示品。据知情的人偷偷表示,他正在推动团队,争取在今年四季度发布这款新模型。

  据英国《金融时报》援引多位知情人士消息,ChatGPT 的开发商 OpenAI,最早将于明年首次生产其自研的人工智能芯片,以应对其对计算能力无休止的需求,并减少对芯片巨头英伟达的依赖。

  此次合作的另一方是美国半导体巨头博通(Broadcom)。博通首席执行官 Hock Tan 在上周四的财报电话会议上,在不透露客户姓名的情况下,宣布已获得第四个主要定制 AI 芯片客户,并有价值 100 亿美元的订单承诺。

  知情人士确认,这位新客户正是 OpenAI。Hock Tan 表示,这一笔交易带来了「立竿见影且相当可观的需求」,并将从明年开始「非常强劲地」为该客户出货芯片。

  据一位项目知情的人偷偷表示,OpenAI 计划将这款芯片用于内部,而非对外销售。这一策略与 Google、Amazon 和 Meta 等科技巨头类似,它们都已设计自己的专用芯片(被称为 XPU,例如 Google 有自己的 TPU)来运行 AI 工作负载。

  奥特曼此前也曾表示,为满足 ChatGPT 和最新模型 GPT-5 带来的巨大需求,公司需要更加多的算力,并计划在未来 5 个月内将其计算集群规模翻倍。

  Mangione 模特 面孔以AI形式出现在Shein的商品页面,用于宣传其T恤产品

  Mangione 目前正在接受审判,检方已表示若罪名成立,将寻求死刑判决。Shein 迅速撤下了该商品,并表示此事件由第三方供应商引发,现已展开内部调查。

  AI 专家指出,这款 AI 模特的图像中存在很明显的技术瑕疵,包括皮肤纹理异常、光线问题以及手臂部分的奇怪变形。

  更令人震惊的是,通过面部识别技术,AI 模特与 Mangione 的真实法院照片匹配度高达 99.9%。虽然明明肉眼就可以辨识出图像中的人物,但人们好像还是更相信技术。

  Simo 在官方博客中表示,该平台旨在利用 AI 技术帮企业与求职者实现完美匹配, 为企业和个人之间搭建一个连接桥梁,使企业能找到熟悉 AI 技术的员工,同时帮助个人将 AI 技能转化为就业机会。

  OpenAI 首席执行官 Sam Altman 在一次媒体晚宴中透露,Simo 将负责一系列新应用的开发,其中就包括这款招聘平台和可能的别的产品,例如浏览器和社会化媒体应用。

  OpenAI 还计划通过 OpenAI Certifications 认证项目提升 AI 技能的可信度和标准化。就像思科、华为、以及亚马逊这一些企业推出的认证项目一样, 涵盖了从基础技能到高级领域(如定制化 AI 工作和提示工程),并且能通过 ChatGPT 的学习模式实现无缝化认证体验。

  不过 LinkedIn 的地位也没那么容易撼动,首席产品官 Tomer Cohen 最近在接受媒体采访时提到,LinkedIn 将在本月底推出一个由AI驱动的「招聘助手」, 多项突破性的 AI 功能,例如 AI 智能职位搜索、简历写作辅助等。

  周二,宇树科技在 X 发文称,其预计将在 2025 年 10 月至 12 月期间向证券交易所提交上市申请文件,届时公司的相关运营数据将正式披露。

  宇树方面表示,以 2024 年为例,旗下四足机器人、人形机器人和组件产品的销售额分别占约 65%、30% 和 5%。

  其中,约 80% 的四足机器人被应用于研究、教育和消费领域;20% 则被用于工业领域,如检查与消防;人形机器人完全用于研究、教育和消费领域。

  今年 7 月,据中国证监会官网显示,杭州宇树科技股份有限公司(「宇树科技」)开启上市辅导,辅导机构为中信证券。这表明,宇树科技真正开始启动 IPO。

  而据「投中网」消息,按照规划,IPO 辅导至少三个月。对此,宇树将在今年 9-10 月参与辅导考试,10-12 月进行上市综合评估。对此,报道分析称宇树正式登陆科创板「得到明年了」。

  继迪士尼和环球影业之后,又一家娱乐巨头对 AI 图像生成公司 Midjourney 提起了诉讼。

  本周四,华纳兄弟正式对 Midjourney 提起版权侵权诉讼,指控该公司允许用户生成包括蝙蝠侠、史酷比和兔八哥在内的受版权保护的角色形象,从而侵犯了其知识产权。

  华纳兄弟在诉状中措辞严厉,称「Midjourney 觉得自身可以凌驾于法律之上」,并指控其做出了「经过计算且以利润为导向的决定,对版权所有者不提供任何保护」。

  该诉讼涵盖了华纳兄弟娱乐及其子公司,包括DC漫画、卡通网络和汉纳-巴伯拉动画等。诉状还以 Midjourney 近期发布的视频模型为例,称其曾短暂限制用户生成受版权保护的角色动画,但随后又解除了限制,华纳认为此举表明 Midjourney 明知其行为存在不当之处,仍有意为之。

  围绕AI 训练数据和生成内容的法律不确定性非常大,在最近的最近一段时间里,有多起 AI 公司的案件,都是围绕着版权。

  七月底,Meta 甚至被 成人影片行业的两家公司起诉,诉讼文件中提到 Meta 长期通过盗版途径,下载受版权保护的成人影片内容,用于训练 AI 模型,包括 Meta Movie Gen 和大型语言模型 LLaMA,以及其他依赖视频数据的 AI 工具。

  本周早一点的时候,Anthropic 宣布与作家群体达成 15 亿美元的和解协议,此前该公司因没有经过授权使用书籍,训练其 Claude 聊天机器人而被起诉。这一金额也创下了 AI 版权案件的最高和解纪录。

  而据路透社报道,9 月 5 日,苹果公司被两位作家起诉,指控其在训练 其「OpenELM」大型语言模型 时,没有经过授权使用了受版权保护的书籍。

  OpenAI 近日发表研究论文,深入探讨了语言模型产生幻觉,这一顽固挑战的最终的原因 。OpenAI 指出,模型为何会产生幻觉,是因为当前的训练和评估程序,在机制上奖励了模型的猜测行为,而非承认其不确定性。尽管GPT-5的幻觉问题已显著减少,但这一根本性挑战依然存在。

  论文的核心观点是,目前主流的 AI 模型排行榜和评估标准,主要是根据准确率对模型进行排名。这种机制类似于一个选择题考试,如果模型遇到不确定的问题,选择猜测仍有几率得分,而回答「我不知道」则必定是零分。

  因此,模型被激励在不确定时进行猜测,这虽然能提高其在排行榜上的准确率分数,但代价是大幅度的增加了产生幻觉(即犯错)的几率。

  OpenAI 认为,解决这一问题的直接方法,是更新普遍的使用的评估标准,改变其计分方式。新的评分体系应该对「自信的错误」施加比「承认不确定性」更重的惩罚,并为模型恰当地表达不确定性给予部分分数。

  OpenAI 强调,仅仅增加几个新的、能感知不确定性的测试是不够的,而是需要全面改革主流的评估体系,否则模型将继续学习猜测。

  该研究还澄清了关于幻觉的一些常见误解。例如,幻觉并非不可避免,因为模型可以学会在不确定时「弃权」;同时,避免幻觉并不一定需要更大的模型,因为小模型有时更容易清楚自己的知识边界。OpenAI表示,产生幻觉的统计学机制是可被理解的,并非一个「神秘的故障」。

  周五,特朗普在白宫设宴款待了全球顶级科技公司的 CEO 们。据《华尔街日报》报道,晚宴的形式类似于特朗普的内阁会议,与会者轮流发言,感谢并赞扬总统在促进芯片制造和人工智能投资方面所做的努力。

  奥特曼称赞特朗普是一位「亲商、亲创新的总统」,认为没有他的领导,美国就无法引领世界。库克则感谢特朗普「奠定了基调」,将在美国继续投资 6000 亿美元,并将部分关键制造业带回本土。 Meta 也表示将在 2028 年前,在美国投资至少 6000 亿美元。

  晚宴上,特朗普还就多个话题与 CEO 们进行了互动。他向科技公司承诺,其政府正在努力解决 AI 发展所需的,大规模数据中心的电力供应问题。

  此次晚宴也有些知名人士缺席,包括特斯拉 CEO 马斯克和英伟达 CEO 黄仁勋。据报道,黄仁勋更倾向于在一对一的会面中与白宫做沟通,以便总统能有足够时间专注于实质性问题。

  Google DeepMind 团队发布了一款全新开源嵌入模型 EmbeddingGemma,该模型以体积小、性能优异和离线运行能力为特色。它能满足移动电子设备和本地 AI 应用的需求,拥有308M参数,支持多语言文本嵌入生成,可在不联网的情况下高效运行。

  EmbeddingGemma 拥有紧凑的 308M(3 亿) 参数,与同等规模的流行嵌入模型相比,在检索、分类和聚类等任务中表现出色。

  EmbeddingGemma 基于 Gemma 3 架构并经过 100 多种语言的训练,通过量化感知训练(QAT)技术,其内存占用可降至 200MB 以下 。此外,模型利用Matryoshka 表示学习(MRL)技术,允许开发者从一个模型中,获得从 768 到 128 等不同维度的嵌入输出,以平衡质量、速度和存储成本。

  它的主要使用在场景是,为移动电子设备优先的 RAG 工作流提供高质量的检索能力,可以在没有网络连接的情况下,实现对个人文件、邮件和通知的语义搜索,或打造个性化的离线聊天机器人。

  本周四,OpenAI 宣布为 ChatGPT 网页版用户推出期待已久的对话分支(branching)功能。该功能允许用户在现有对话的任意节点上,创建一个保留了该节点之前全部上下文的,全新并行对话,而原始对话保持不变 。

  这一更新解决了 AI 模型线性对话界面的一个长期局限。此前,如果我们想在对话中途,尝试不同的想法或方向,只可以通过修改并覆盖现有提示,或者是完全重开一个新对话来完成。

  分支功能则让探索假设场景,变得更加轻松高效。例如,一个经营销售团队可以在同一个初始对话的基础上,创建不同的分支来分别测试正式、幽默等不一样的风格的广告文案。

  这个功能是受到了开发者的积极响应,他们将其比作程序员使用的版本控制管理系统「Git」。正如 Git 允许开发者创建代码分支,以测试新功能而不影响主代码库,对话分支也让用户都能够在保留原始工作的同时,自由地试验不同的想法。

  清华大学等机构在 2024年的一项研究也曾指出,线性对话界面在处理头脑风暴、项目分析等多层级任务时效率低下,会增加用户的认知负担。

  此外,ChatGPT 的「Project」项目功能向免费用户全面开放,并对单个项目文件上传数量的上限,进行了提升。 免费用户可上传最多五个文件供 ChatGPT 参考,而 Plus 订阅和 Pro 订阅的上限分别为 25 和 40 个。

  通过「项目」,用户不但可以整理对话,还能够设置定制指令,限制 AI 参考的信息或文件,逐步提升使用体验。

  腾讯混元世界团队推出 HunyuanWorld-Voyager 模型,号称「业界首个支持原生 3D 重建的超长漫游世界模型」。

  该模型聚焦于 AI 在空间智能领域的应用扩展,将为虚拟现实、物理仿真、游戏开发等领域提供高保线D 场景漫游能力。

  据官方介绍,混元 Voyager 突破了传统视频生成在空间一致性和探索范围上的局限,能够生成长距离、世界一致的漫游场景,支持将视频直接导出为 3D 格式。

  混元 Voyager「3D 输入- 3D 输出」的特性,与此前已开源的混元世界模型 1.0 高度适配,可进一步扩展 1.0 模型漫游范围,并可对生成的场景做风格化控制和编辑。混元 Voyager 还可支持视频场景重建、3D 物体纹理生成、视频风格定制化生成、视频深度估计等多种 3D 理解与生成应用。

  技术方面,混元 Voyager 首次通过空间与特征结合的方式,支持原生的 3D 记忆和场景重建;在输入端加入 3D 条件保证画面视角精准,输出端直接生成 3D 点云。同时 Voyager 还引入了可扩展的世界缓存机制,基于 1.0 模型生成的初始 3D 点云缓存,将其投影到目标相机视图,为扩散模型提供指导。

  值得一提的是,该模型在斯坦福大学李飞飞团队发布的世界模型基准测试 WorldScore 上位居综合能力首位,超越现有开源方法,在视频生成和 3D 重建任务中均表现出色。在视频生成和视频 3D 重建两个任务上,Voyager 也均取得更好的结果。

  正文还记得前段时间,打开摄像头,就能实时 AI 生成各种各样背景的 MirageLSD 吗?Kaparthy 都曾发文说自己作为此公司的天使投资人,对此感觉到很兴奋 。

  最近,此公司 Decart 又整了个新活,基于之前的 Mirage LSD 技术,推出新的 Oasis 2.0 模型,在官方账号里面,提到这是 Decart 最先进的 AI 模型,能够实时转换游戏世界和风格,并且支持 1080p,30fps。

  只需输入 /oasis start 并提供一个提示词,玩家就会立刻被传送。威尼斯、印度、纽约或巴黎的 Minecraft;探索丛林或南极洲;穿越到狂野西部或中世纪时代;参观糖果乐园、月球、僵尸末日场景。

  或者切换风格——动漫、像素艺术、《侠盗猎车手》、《使命召唤》……任何你能想到的内容。

  Transformer 之父质疑 AI 发展趋势:科学创新是否被商业化牺牲?

  人工智能领域的奠基性论文《Attention Is All You Need》的首席作者阿希什·瓦斯瓦尼(Ashish Vaswani)正在重新审视 AI 的未来发展路径,并对当下的技术商业化趋势表达了深切忧虑。

  这篇在 2017 年发表的论文首次提出了 Transformer 架构,成为现代人工智能革命的技术基石,使 ChatGPT 等大语言模型得以实现。然而,瓦斯瓦尼担心,目前 AI 领域越来越集中于短期改进和商业利益,可能限制了科学探索的空间。

  瓦斯瓦尼在今年年初,决定彻底转型自己的 AI 初创公司 Essential AI Labs,从企业工具研发转向基础研究。

  他在自己的公司的官方网站上说, 全球AI技术的开发正被少数几家科技巨头所垄断,这种封闭的研发模式可能阻碍了 AI 在教育、医疗等领域的潜力应用。

  而在 他们近期发表的论文显示,AI 模型在预训练(pre-training)阶段就能学会「反思」并纠正自身错误,这比许多研究者认为的要早得多(一般是在候后训练 post-training 阶段)。

  瓦斯瓦尼认为,这一发现可能意味着,通过改进预训练阶段,可以更低成本地提升模型能力,从而让资源较少的公司或个人也有机会开发自己的模型,打破少数公司的垄断。

  他和 Transformer 的另一位共同作者加里·马库斯(Gary Marcus)表示,当前的 AI 实验室应当停止专注于现有架构的微调,去尝试全新的研究方向;AI 发展的下一次重大突破,需要超越 Transformer 架构。

  普林斯顿大学计算机科学家 Arvind Narayanan 与 Sayash Kapoor,在今年早一点的时候发布了一篇引发争议的论文,提出将 AI 视为一种「普通技术」,而非具有超凡智能的革命性技术。

  两位作者觉得,当前对AI的极端预测——无论是乌托邦式的经济飞跃与人类永生,还是反乌托邦式的全面失业与灭绝威胁,都误解了其真实潜力。

  该论文预测,AI 将遵循过去技术革命的轨迹,其经济影响是渐进的,而非颠覆性的。作者指出,AI 的实际应用速度落后于创新速度,因为企业和个人需要时间来调整工作流程,这与一个世纪前工厂电气化耗时数十年的过程类似。

  他们认为,AI 不会大规模地「窃取」工作岗位,而是会改变工作的性质,未来更多的工作将转变为配置、监控和控制 AI 系统,就像工业革命时工人从手动织布转向监督机器一样。

  尽管这篇论文因其冷静的中间立场观点而非常关注,但也存在一些争议。有评论认为,该论文可能过于轻视 AI 对劳动力市场的潜在冲击,并对其无法在说服力等方面,超越人类的预测显得过于自信。

  知名投资人 Ross Gerber:AI 不是泡沫,巴菲特抛售苹果是愚蠢的

  科技投资人、Gerber Kawasaki 财富与投资管理公司 CEO 罗斯·格伯(Ross Gerber),近日在接受 Business Insider 采访时表示,当前的 AI 热潮与千禧年初的互联网泡沫完全不同,同时他尖锐地批评了沃伦·巴菲特削减苹果公司股份的决定。

  格伯认为,AI 领域的繁荣并非泡沫,因为头部科技公司的估值,与其疯狂的盈利能力是相匹配的。他指出,Alphabet( 互联网巨头谷歌的全资控股公司 )去年的净利润超过 1000 亿美元,而英伟达的利润也在持续高速增长。

  格伯强调,AI 拥有提升生产力和收益的巨大潜力,这与他称之为「时间浪费者」的智能手机形成了鲜明对比。

  对于巴菲特在过去 18 个月中出售了近 70% 苹果股份的行为,格伯直言此举是「愚蠢的」(dumb)。他认为,这次出售不仅触发了巨额的应税收益,而且从长远来看,市场上没有比苹果更好的投资标的。

  截至今年6月底, 格伯 的投资组合中苹果仍是其主要持股之一,价值约 7800 万美元。

  格伯还批评伯克希尔·哈撒韦的投资组合是“属于过去的完美组合,但绝不是未来的”,并以其对卡夫亨氏的投资为例,指出这些“没人想要的旧品牌”无法创造真正的经济价值 。

  欢迎加入 APPSO AI 社群,一起畅聊 AI 产品,获取,解锁更多 AI 新知

产品中心