攻壳智能体
探索发现最新、热门的智能体和AI工具
工欲善其事,必先利其器。攻壳智能体是专注于智能体和AI工具的门户网站,我们致力于为用户介绍最新、热门的智能体和AI工具,帮助用户快速找到适合自己的学习、工作、生活的AI利器。
工欲善其事,必先利其器。攻壳智能体是专注于智能体和AI工具的门户网站,我们致力于为用户介绍最新、热门的智能体和AI工具,帮助用户快速找到适合自己的学习、工作、生活的AI利器。
攻壳智能体每日更新AI行业资讯报道,为你带来最新、最热、最全的AI信息。
攻壳智能体工作日每日更新AI行业资讯报道,为你带来最新、最热、最全的AI信息。
今天,由 OpenAI 前 CTO Mira Murati 成立于今年 2 月的人工智能初创公司 Thinking Machines Lab,发了第一篇文章 ——《克服 LLM 推理中的不确定性》(Defeating Nondeterminism in LLM Inference)。这篇博客属于 Thinking Machines Lab 新提出的博客栏目 Connectionism,意为「连接主义」。该公司表示:「我们相信,分享才能让科学更好地发展。Connectionism 将涵盖与我们的研究一样广泛的主题:从核函数数值计算到提示工程。Connectionism 这一名称可以追溯到 AI 的早期年代。它曾是 20 世纪 80 年代的一个研究分支,专注于神经网络及其与生物大脑的相似性。」
《华尔街日报》当地时间 10 日报道称,OpenAI 已与 Oracle 甲骨文签订了一份价值 3000 亿美元的算力购买订单,这是有史以来最大的云计算合同之一。该笔交易将于 2027 年正式生效,为期约为 5 年,平均每年金额规模达到 600 亿美元。Oracle 在今年 6 月的时候在一份披露文件中表示已达成一份从 2027 年起每年可创造 300 亿美元收入的交易;OpenAI 和 Oracle 今年 7 月表示美国境内的“星际之门”项目电力容量将新增 4.5GW。这两项信息指向的均是该笔 3000 亿美元交易。
今日上午,阿布扎比穆罕默德·本·扎耶德人工智能大学(MBZUAI)联合AI创企G42推出的新低成本推理模型K2 Think,相关论文已arXiv预印本平台发表,昨天下午模型在Hugging Face、GitHub上开源。K2 Think有320亿个参数,基于阿里巴巴的开源模型Qwen 2.5构建,性能超过参数规模是其20倍的OpenAI和DeepSeek旗舰推理模型。在复杂数学任务基准测试中,研究人员计算了K2 Think在AIME24、AIME25、HMMT25和OMNI-Math-HARD中的平均得分,超过GPT-OSS、DeepSeek V3.1、Qwen3 235B-A22B等一众开源模型。
腾讯发布全新AI CLI工具CodeBuddy Code,并宣布CodeBuddy IDE国际版开启公测,无需邀请码,面向所有用户开放使用。至此,腾讯云成为业内首家同时支持插件、IDE和CLI三种形态的AI编程工具厂商,覆盖从专业开发者到零基础用户的全场景需求。用户可免费使用CodeBuddy国内版全系列产品,无缝调用DeepSeek等大模型;国际版支持GPT、Gemini等主流模型,IDE与CLI共用额度(测试期间赠送部分体验额度)。
上海市市场监管局联合相关部门制定了《上海市支持人工智能赋能广告业创新发展的若干措施》,旨在推动人工智能技术在广告产业的应用;该措施提出,对具备自主创新能力、实现行业应用且获得市场认可的“AI+数字广告”智能体研发项目,市、区两级将给予最高不超过1200万元的支持。
今天,谷歌开源一款全新的开放式嵌入模型EmbeddingGemma。该模型以小博大,拥有3.08亿个参数,专为端侧AI设计,支持在笔记本、手机等设备上部署检索增强生成(RAG)、语义搜索等应用程序。EmbeddingGemma的一大特征是能生成隐私性良好的高质量嵌入向量,即使在断网情况下也能正常运行,且性能直追尺寸翻倍的Qwen-Embedding-0.6B。
据彭博社援引知情人士消息称,DeepSeek 正在开发一款具备更高阶 AI Agent 功能的 AI 模型。说得直白一些,就是要让 AI 从聊天机器人进化成真正能干活的 AI 助手,帮助你完成从规划旅行到编写和调试代码等各类复杂任务。模型核心特征:
据知情人士透露,DeepSeek 创始人梁文锋正在推动团队,争取在今年四季度发布这款新模型。
Anthropic 宣布已经完成了新一轮 130 亿美元融资,投后估值达 1830 亿美元,约为这家人工智能初创公司 3 月份上次融资时的三倍。这也是目前科技行业第二大规模的私募融资,仅次于 2025 年 3 月 OpenAI 历史性的 400 亿美元融资。这最新一轮融资为 Anthropic 的 F 轮融资,由 Iconiq、富达管理研究公司 (Fidelity Management & Research Co.) 和光速创投 (Lightspeed Venture Partners) 领投。Anthropic 表示,Altimeter、General Catalyst 和 Coatue 等其他多方投资者也参与其中。
今天,混元3D世界模型系列最新成员——HunyuanWorld-Voyager(简称混元Voyager)正式发布,这也是业界首个支持原生3D重建的超长漫游世界模型。该模型聚焦于AI在空间智能领域的应用扩展,将为虚拟现实、物理仿真、游戏开发等领域提供高保真的3D场景漫游能力。 混元Voyager突破了传统视频生成在空间一致性和探索范围上的局限,能够生成长距离、世界一致的漫游场景,支持将视频直接导出为3D格式。
美团开源560B MoE大模型Longcat-Flash-Chat,激活18.6B参数即追平DeepSeek-V3.1,TerminalBench编程测试与Claude 4 Sonnet比肩。模型首创“零计算专家”与Shortcut MoE架构,20T token 30天完成训练,万卡利用率98.48%,推理成本0.7美元/百万token。美团GN06团队2023收购光年之外,年内研发投入211亿元,AI助手已覆盖外卖、编程等场景。普通用户可访问美团最新推出的AI聊天助手 LongCat 进行体验。
据OpenAI官方消息,OpenAI正式发布语音模型GPT-Realtime,并对Realtime API进行全面升级,将其从测试阶段推进至正式生产环境。此次更新旨在助力企业和开发者打造更可靠、适用于实际生产的语音智能体。GPT-Realtime是OpenAI迄今最先进的语音转语音模型,采用端到端Speech-to-Speech架构,无需文本转换步骤,可直接处理和生成语音。价格方面,GPT-Realtime使用成本降低20%,音频输入token每百万个32美元,音频输出token每百万个64美元,缓存输入token每百万个0.40美元 。
腾讯混元今天午间宣布开源端到端视频音效生成模型 Hunyuan-Foley,用户只需输入视频和文字,就能为视频匹配电影级音效。根据官方介绍,HunyuanVideo-Foley 不仅打破了 AI 生成的视频只能“看”不能“听” 的局限,让无声 AI 视频成为历史,更是真正做到了“看懂画面、读懂文字、配准声音”,带来沉浸式视听体验。这款音效生成工具可广泛应用于短视频创作、电影制作、广告创意和游戏开发等场景。
今天,谷歌推出了Gemini 2.5 Flash Image,这款模型是谷歌最先进的图像生成和编辑模型。这一模型的核心亮点是其图像编辑能力。谷歌称,这一模型可将多个图像混合到单个图像中,保持高度角色一致性,还能使用自然语言进行有针对性的修改,并充分利用Gemini的世界知识。诺贝尔奖得主、谷歌DeepMind CEO Demis Hassabis用自己的照片为新模型做宣传,展示Gemini 2.5 Flash Image的角色一致性。他将自己的一张照片背景做了修改,切换为古典风格,但是人物的容貌没有出现改变。这款模型在上周其实已经以“Nano Banana”的代号出现在大模型竞技场中,并获得了用户200多万票的认可。如今正式揭晓后,Gemini 2.5 Flash Image在文生图与图像编辑两个场景均拿下了全球第一,在图像编辑榜单上更是获得1362的高分,较第二名的领先幅度接近15%。
最新消息,xAI向OpenAI和苹果公司正式提起反垄断诉讼,指控苹果在Apple Store里操纵应用排名榜单,偏袒OpenAI和ChatGPT,同时打压马斯克自家的Grok。在这份长达61页的起诉书中,马斯克指控两家公司于去年签署的合作协议,是在联手垄断AI市场,构成了不正当竞争。协议规定,苹果会将ChatGPT集成到iOS、iPadOS和macOS中,使其成为苹果设备上唯一的生成式AI聊天机器人。
腾讯元宝今日宣布已正式接入 DeepSeek V3.1 最新版,电脑版、网页版抢先体验。据官方介绍,本次模型更新,带来两大突破:
百度蒸汽机(MuseSteamer)音视频一体化模型今日完成 2.0 版本升级,在行业内首次实现多人有声视频一体化生成。其 Turbo 版、Lite 版、Pro 版及全系有声版现已全面开放,用户可通过百度搜索“百度蒸汽机”或登录“绘想”平台体验,企业用户可在千帆平台享受高性能视频生成服务。2.0 版本基于多模态时空规划、中文场景深度优化以及音视端到端建模等领先的技术能力,实现多人音视频一体化生成、复杂运镜、电影级的人物细腻表演、丰富镜头表现和流畅画质等。
阿里通义千问宣布推出 Qwen-Image-Edit,Qwen-Image的图像编辑版本。Qwen-Image-Edit基于我们20B的Qwen-Image模型进⼀步训练,成功将Qwen-Image的独特的文本渲染能力延展至图像编辑领域,实现了对图片中文字的精准编辑。此外,Qwen-Image-Edit将输⼊图像同时输⼊到Qwen2.5-VL(实现视觉语义控制)和VAE Encoder(实现视觉外观控制),从而兼具语义与外观的双重编辑能⼒。如需体验最新模型,欢迎访问 Qwen Chat (chat.qwen.ai)并选择“图像编辑”功能。
在今天的百度 AI Day 开放日上,百度文库联合百度网盘发布全球首个全端通用智能体「GenFlow 2.0」。该产品支持超 100 个专家智能体同时工作,宣称 3 分钟并行完成超 5 项复杂任务,生成速度超主流同类型产品 10 倍,做到「分钟级交付、过程可干预、记忆可追溯」。
市场流传,国内领先的大模型公司深度求索(DeepSeek)已于昨日(8月14日)完成超过7亿美元的C轮融资。据企查查消息,本轮融资完成后,深度求索估值已突破80亿美元,成为全球估值最高的AI大模型初创企业之一。不过截至目前,此消息并未得到DeepSeek的相关回应。是市场传言还是真融资了,让子弹再飞一会儿。不过,值得关注的是,该消息源透露了这轮融资的投资方:由国家级产业投资基金领投,多家顶级风险资本、科技巨头投资部门以及主权财富基金等共同参与。据了解,融得资金将主要用于以下领域:下一代基础大模型的研发;高性能算力基础设施的建设与优化;引进关键人才;全球市场拓展与生态建设
谷歌 Gemini AI 助手 App 版现已支持“记忆”与“临时聊天”功能,开启记忆功能后,Gemini 会记住并学习用户的对话内容,在持续的聊天中记住用户分享的信息和偏好,最终让 Gemini“像老友一样熟悉用户的所有背景,实现更自然的对话”。临时聊天概念类似网页浏览器的“无痕模式”,可让用户与 Gemini 的对话不影响未来的聊天记录,在该模式下用户可与 Gemini 探讨一些私人问题,或头脑风暴一个不同于平常风格的想法。
近日,市场再度传出深度求索(DeepSeek)下一代大模型DeepSeek-R2的发布消息,预计时间窗口为8月15日至30日。受此消息影响,8月12日早盘,人工智能概念股集体拉升,寒武纪等个股涨幅显著。8月13日,接近DeepSeek人士向腾讯科技表示,该消息不实,并确认DeepSeek-R2在8月内并无发布计划。
MiniMax发布「全球首个Agent Remix Marketplace」,并开启15万美金全球挑战赛!你的每个工作/学习/生活idea 皆可转化为商业价值,每个人都是“个体GDP创造者”。
什么是Remix Marketplace?
1. 一键提效:点击“Remix”,对已发布成熟作品一键再创作,支付100 Credits + 修改成本即可完成全栈项目复刻,无需从零冷启动,效率立提10倍
2. 躺赚积分:点击右上角“分享”,发布你的Agent作品至Gallery,勾选“允许他人Remix”,划重点:你的作品每被Remix一次,即坐享100 credits收益!
3. 涨粉利器:发布作品至“Gallery广场”,直连创作者X等社媒账号,让流量汇聚到你的个人品牌
Wan2.2-I2V-Flash 正式上线!它不仅将电影级视觉呈现装进模型,更在生成速度与性价比上实现全面跃升,致力于为用户带来更快速、更专业、更稳定的图生视频体验。
🎯 相比 Wan2.1,Wan2.2-I2V-Flash 推理速度提升 12 倍,创作效率跃升。
🎯 指令遵循能力大幅提升:各种特效提示词直出,运镜精准控制,指令落地更精准。
🎯 风格化图像稳定输出:对各类风格化图像均能稳定保持风格,并实现合理自然的动态效果。
不仅保持功能升级优势,还有更快的速度、更低的价格、更高的稳定性和更强的表现力!用户可通过阿里云百炼调用API体验。
近日,AI视频生成公司「爱诗科技」完成B轮融资,总金额超过6000万美元。该轮融资由阿里巴巴领投,达晨财智、深创投、北京市AI基金、湖南电广、巨人网络和Antler跟投。据了解,这也是国内视频生成领域单次最大融资额。爱诗在融资和增长上的猛势,是如今国内视频生成赛道集体狂飙的一个缩影,目前爱诗旗下产品PixVerse的全球用户已经迈过1亿大关。就在4个月前,这个数字还是6000万。同样起飞的还有商业化。爱诗科技创始人兼CEO王长虎告诉《智能涌现》,公司产品的订阅收入已经覆盖成本。
生数科技正式将其视频大模型Vidu的Q1参考生图功能向大众用户开放。此次Vidu Q1参考生图功能的推出,旨在助力行业突破多主体一致性技术难题,推动Vidu升级为真正的“商业生产力”,实现从AI图像生成到视频生成的完整商业生产链闭环,引领AI多模态创作进入“生产级应用”新纪元。Vidu Q1参考生图以“参考够多,还原够真”为核心,主要包括五大亮点:
今天上午,在百度Wave Summit深度学习开发者大会上,百度正式发布深度思考模型文心大模型X1.1、大模型开发框架飞桨框架V3.2、智能代码助手文心快码3.5S以及一系列开发组件更新。相比于深度思考模型文心X1,文心大模型X1.1的事实性能力提升34.8%,指令遵循能力提升12.5%,智能体能力提升9.6%,在多项基准测试中超越DeepSeek-R1-0528。目前,用户可以在文心一言官网、文小言APP使用文心大模型X1.1。文心大模型X1.1已正式上线百度智能云千帆平台,对企业客户及开发者全面开放使用。
阿里通义今日正式推出通义千问系列最新的语音识别模型 Qwen3-ASR-Flash,它基于Qwen3基座模型,经海量多模态数据以及千万⼩时规模的ASR(自动语音识别)数据训练构建而成。Qwen3-ASR-Flash实现了⾼精度⾼鲁棒性的语⾳识别性能,⽀持11种语⾔和多种⼝⾳。与众不同的是,Qwen3-ASR-Flash⽀持⽤户以任意格式提供⽂本上下⽂,从⽽获得定制化的 ASR 结果,同时还⽀持歌声识别。
Cognition AI 获新一轮融资估值达 100 亿美元人工智能初创公司Cognition AI ,在一轮约 4 亿美元的融资中估值达到 102 亿美元,这笔交易凸显出投资者对 AI 驱动软件开发持续高涨的热情。本轮融资由彼得·蒂尔支持的创投基金 Founders Fund 领投,包括 Lux Capital、乔·朗斯代尔的 8VC、埃拉德·吉尔、Definition Capital 和 Swish Ventures 等现有投资方跟投。Cognition 旗下编程工具 Devin(号称"全球首位 AI 软件工程师")的年经常性收入,从 2024 年 9 月的约 100 万美元攀升至 6 月的约 7300 万美元。公司表示,自 7 月收购编程初创公司 Windsurf 以来,其总收入已翻番。
即梦图片 4.0 正式发布,首次支持多模态生图,同一模型实现文生图、图像编辑、组图生成。能够通过自然语言灵活控制画面细节。
即梦 AI 表示,即梦图片 4.0 正在逐步扩量中,在未来几天会覆盖全部用户,请耐心等待。
荷兰半导体设备巨头ASML正式成为法国AI明星公司Mistral AI的第一大股东,一口气砸下13亿欧元(约108亿元人民币)真金白银。这次ASML领投Mistral AI 的C轮融资总额17亿欧元(约142亿元人民币),直接把这家成立时长两年半的公司估值推高到100亿欧元(约835亿元人民币),一举成为欧洲最值钱的AI公司。
具身智能公司自变量机器人(X Square Robot)完成近 10 亿元 A+ 轮融资,本轮由阿里云、国科投资领投,国开金融、红杉中国、渶策资本跟投,老股东美团、联想之星、君联资本追投。自变量机器人成立于 2023 年 12 月,本轮前已完成 7 轮融资,总金额超 10 亿元。这是阿里云首次投资具身智能企业。此前,阿里集团已经陆续投资了逐际动力、星动纪元、宇树机器人、星海图、灵心巧手等多家具身智能及产业链企业。一位从业者曾告诉我们,在去年上半年,阿里投完一圈基座大模型公司后,重点关注具身智能,“投了几乎所有具身智能公司”。
今天,月之暗面发布 Kimi K2 模型的最新版本 0905,进一步提升其在真实编程任务中的表现:Agentic Coding 能力提升:在公开基准测试和真实的编程任务中均展现出更好的性能前端编程体验升级:提升了前端代码的美观度和实用性扩展上下文长度:从 128K 升级到 256K,为复杂长线任务提供更好的支持提供高速版 API:支持高达 60-100 Token/s 的输出速度。
法国人工智能初创公司Mistral AI正在敲定一笔20亿欧元的投资,该公司估值因此达到120亿欧元(约合140亿美元)——此估值包含新注入资金,这巩固了其作为欧洲最具价值科技初创企业之一的地位。这家OpenAI的竞争对手正在开发开源语言模型、一款面向欧洲用户的名为"Le Chat"的聊天机器人以及其他人工智能服务。公司由前DeepMind研究员Arthur Mensch以及前Meta研究员Timothée Lacroix和Guillaume Lample于2023年联合创立。今年初夏,该公司曾洽谈从阿布扎比基金MGX等投资者处筹集最多10亿美元的股权。
日前,开发了 Arc 与新一代 AI 浏览器 Dia 的初创公司 The Browser Company,被软件公司 Atlassian宣布以 6.1 亿美元全现金收购。收购的时间点很巧,就在同一周,谷歌 Chrome 在美国反垄断案中获准「留在谷歌」,摆脱了被强制拆分的风险。The Browser Company 是一家 2019 年在纽约成立的初创公司,目标很直白:重塑上网体验。他们最早因 Arc 出圈,靠这个大胆重塑浏览器界面的产品吸引了一批用户。当时 Arc 以开源 Chromium 为底,推出侧栏与「Spaces」的工作流组织方式,内置笔记与白板,并在 2023 年引入 OpenAI 和 Anthropic 的 AI 能力,一度被一些人追捧为「全新上网方式」「Chrome 的真正替代」。然而,团队很快发现,Arc 的学习曲线过陡,始终没能进入主流。2024 年,该公司「砍掉」Arc 的迭代,转向从零打造一款 AI 原生浏览器 Dia。他们判断,在未来 5 年,AI 主导的人机界面可能会直接「取代传统浏览器」:
谷歌最新的 AI 实验项目“Nano Banana”突然在上周爆火,然后谷歌宣布在 Gemini 上线了 Gemini 2.5 Flash Image 集成。昨晚,谷歌实验室副总裁 Josh Woodward 在 X 上透露,自该功能上线以来,累计已完成超 2 亿次图像编辑,带动超 1000 万新用户尝试 Gemini 应用。对于这款产品的受欢迎程度,他形容称内部“TPU 严重过载,SRE 警报不停。”
据市象今日报道,字节跳动近期为旗下 Seed 部门发放期权津贴,主要覆盖大模型方向的技术员工。按照综合绩效、职级不同,员工每月可获得价值 9/11/13.5 万元的字节期权,按月归属,首批津贴连续发放 18 个月。报道还称,此次增发第一笔期权的计算价格为 189.9 美元一股,低于字节跳动最新的期权回购价格 200 美元。这意味着相关员工能够获得更多数量的期权,按照传闻的字节跳动回购价格计算,首批 18 个月期权价值约为 170 万到 256 万元。
人工智能巨头OpenAI同意以11亿美元全股票交易收购产品测试初创公司Statsig,这将是OpenAI历史上最大的收购交易之一。周二,据OpenAI官方博客表示,作为收购的一部分,Statsig创始人兼首席执行官Vijaye Raji将加入OpenAI,担任应用首席技术官,向最近接管该部门的前Instacart负责人Fidji Simo汇报。Raji将负责ChatGPT和Codex的产品工程工作。Statsig成立于2021年,专门为软件开发者构建测试和标记潜在新功能的工具。该平台为A/B测试、功能标记和实时决策提供服务,客户包括OpenAI、Eventbrite和SoundCloud等科技公司。今年早些时候,Statsig完成1亿美元融资,估值达到11亿美元。OpenAI此次收购价格与其最新估值相符,显示出对该平台技术价值的认可。
据知名苹果爆料人、彭博社记者马克·古尔曼(Mark Gurman)最新爆料,苹果机器人技术领域首席人工智能研究员Jian Zhang已跳槽至Meta的机器人工作室Meta Robotics Studio。据知情人士透露,苹果基础模型团队还有3名AI研究员也在准备离开,其中John Peebles、Nan Du即将跳槽到OpenAI,Zhao Meng则选择加入Anthropic。据公开报道统计,自Meta开启硅谷AI人才争夺战以来,苹果已经流失了包括基础模型团队前负责人庞若鸣在内的至少10名AI人才。然而,知情人士透露称,苹果AI人才流失预计还将继续,还有数名员工正在积极应聘其他公司职位。他们认为,市场对苹果智能反应平淡以及苹果可能转向第三方模型的战略,导致内部员工士气低落。
今天,腾讯优图实验室正式开源智能体框架Youtu-Agent。它主打「开箱即用」,让专业开发者和AI爱好者都能快速上手,轻松搭建属于自己的智能体应用。「开箱即用」的背后,Youtu-Agent拥有三大核心优势:
阿里通义团队今天宣布推出了新一代智能体开发框架 —— AgentScope 1.0!AgentScope 1.0 是一款以开发者为核心,专注于多智能体开发的开源框架。它的核心目标是解决智能体在构建、运行和管理中的难题,提供一套覆盖“开发、部署、监控”全生命周期的生产级解决方案,让智能体应用的开发更简单、运行更安全、监控更透明。
为实现这一目标,通义实验室构建三层技术架构:AgentScope 核心框架(https://github.com/agentscope-ai/agentscope)负责智能体的构建与应用编排;AgentScope Runtime (https://github.com/agentscope-ai/agentscope-runtime) 提供安全、可靠的智能体运行和部署环境;AgentScope Studio (https://github.com/agentscope-ai/agentscope-studio) 提供可视化的开发与监控工具。
腾讯混元团队今天带来一个在国际机器翻译比赛拿下30个第1名的翻译模型Hunyuan-MT-7B,它总参数量仅7B,支持33个语种、5种民汉语言/方言互译,是一个能力全面的轻量级翻译模型。 同时开源的还有一个翻译集成模型 Hunyuan-MT-Chimera-7B (奇美拉),是业界首个翻译集成模型,它能够根据原文和多个翻译模型给出的不同内容,再生成一个更优的翻译结果,不仅原生支持Hunyuan-MT-7B,也支持接入 deepseek 等模型,对于一些有专业翻译需求的用户和场景,可以提供更加准确的回复。
智谱宣布自 9 月 1 日起推出 Claude Code 开发者专属套餐「GLM Coding Plan」—— 每月 20~100 元,适用于智谱最新旗舰模型 GLM-4.5 及 GLM-4.5-Air。据介绍,这一套餐首期主推 Claude Code,未来将拓展到更多 Coding 工具。IT之家从官方获悉,目前 GLM-4.5 已接入包括 Claude Code、Cline、Gemini CLI、Grok CLI、CodeGeeX、Kilo Code、Roo Code、Trae 在内的多款主流编程工具。
上海广播电视台(上海文广集团)第一财经旗下中国领先的企业数字增长服务集团——上海应帆数字科技有限公司(下称 “应帆科技”)宣布完成亿元级战略 A 轮融资。此轮投资人涵盖政府产业引导基金、多元产业投资机构以及科技供应链企业等。本轮募集资金将主要用于加大应帆科技在人工智能应用领域的投入,夯实自主研发核心优势,深化AI驱动型企业数字增长服务在更多垂直场景的战略布局。
即梦AI携手火山引擎全面开放API服务,包括文生图3.0、文生图3.1、图生图3.0、视频生成3.0pro、数字人OmniHuman、动作模仿DreamActor M1等多款即梦AI同源前沿模型,为企业级用户提供丰富优质的图像及视频生成和编辑服务。开发者无需额外申请,通过自助下单即可快速完成接入。据了解,即梦AI系列模型,是即梦AI基于Seedream、Seedance等字节跳动自研模型,针对产品内不同应用场景和用户多样化需求,持续调优开发而来。目前,这些模型已经在即梦AI产品上得到大规模验证,能够适配故事短片创作、营销物料制作、游戏素材设计、多媒体课件制作、自媒体玩法拓展等多种应用场景,助力创意高效落地。
自9月1日起,《人工智能生成合成内容标识办法》正式落地,新规要求所有AI生成的文字、图片、视频等内容必须标明身份,旨在规范AI生成内容,防止虚假信息传播。腾讯、抖音、快手、B站、微博、DeepSeek、昆仑万维等平台迅速响应,均对上述《办法》出台细化规则。
今天阶跃星辰正式发布最强开源端到端语音大模型 Step-Audio 2 mini,该模型在多个国际基准测试集上取得 SOTA 成绩。它将语音理解、音频推理与生成统一建模,在音频理解、语音识别、跨语种翻译、情感与副语言解析、语音对话等任务中表现突出,并率先支持语音原生的 Tool Calling 能力,可实现联网搜索等操作。一句话总结,Step-Audio 2 mini “听得清楚、想得明白、说得自然”。模型现已上线 GitHub、Hugging Face 等平台,欢迎大家下载、试用并反馈。
具身智能机器人公司智平方(AI² Robotics)近期完成新一轮A系列融资,规模为数亿元。本轮由深创投超过亿元领投,老股东敦鸿资产、国投的持续加码,还吸引华熙生物和一家大型零售企业以产业资本的身份参与投资。智平方表示,这是该公司半年以来完成的7轮数亿级融资中规模较大的一轮。本轮融资资金将用于GOVLA大模型及AlphaBot系列机器人的持续迭代、自建产线扩容与全球市场拓展。据悉,智平方成立于2023年年初,公司以通用具身机器人大脑为核心,软硬一体,为行业输出具身智能机器人产品、方案和服务。
9月1日,国际市场调研机构沙利文(Frost&Sullivan)发布了最新的《中国GenAI市场洞察:企业级大模型调用全景研究,2025》。报告显示,2025年上半年,中国企业级市场大模型的日均总消耗量为10.2万亿Tokens,其中,阿里通义占比17.7%,字节豆包占比14.1%,DeepSeek占比10.3%,前三名合计占比超40%。
周四,微软人工智能部门正式推出其首批两款自研 AI 模型 ——MAI-Voice-1 语音模型与 MAI-1-preview 通用模型。据微软介绍,全新的 MAI-Voice-1 语音模型仅需单块 GPU,就能在 1 秒内生成时长 1 分钟的音频;而 MAI-1-preview 模型则“让用户提前窥见 Copilot 未来功能的发展方向”。目前,微软已将 MAI-Voice-1 应用于多项功能中:例如在“Copilot Daily”功能里,AI 主持人会通过该模型播报当日热点新闻;同时,它还能生成播客风格的对话内容,帮助用户理解各类话题。普通用户可在 Copilot Labs 平台亲自体验 MAI-Voice-1:不仅能输入希望 AI 表达的内容,还可自定义语音音色与说话风格。
本周四,马斯克的 xAI 正式推出了旗下的最新代码模型 Grok Code Fast 1。该模型也被认为是 Grok 4 的代码版本,旨在为「agentic 编程」(AI 自动执行编程任务)提供极速且经济的解决方案。在这一范式内,AI 在 IDE 内会自动调用工具(如 grep、终端、文件编辑)并完成代码任务。xAI 宣布在大量平台上免费提供一周的 grok-code-fast-1,包括 GitHub Copilot、Cursor、Cline、Roo Code、Kilo Code、opencode 和 Windsurf。
橙果视界(深圳)科技有限公司(下称“「橙果视界」”)宣布完成数千万元新一轮融资,由云天使基金领投,力合创投和金沙江联合资本跟投。本轮融资将用于进一步扩大行业数据规模,推进垂直行业后训练模型迭代,进一步加快全链路营销智能体在多行业的业务落地,持续探索能感知、决策、创造并执行的商业大脑。此前,「橙果视界」已获得设计领域上市公司矩阵股份投资。「橙果视界」成立于2024年5月,是一家AI营销公司,支撑“洞察-策略-内容-运营”全链路智能协同。公司产品包括DataG、PhotoG、VoyaAI,提供从精准洞察、创意内容、社媒营销到全球化增长的AI整合营销解决方案,目前已经和消费电子、美妆、快消、时尚等多领域国际头部品牌达成深度合作。
Tech星球独家获悉,夸克正在研发一款全新的AI产品,其App名为“造点”。据悉,“造点”是一款融合AI创作与内容互动表达的平台。 此外,Tech星球还独家了解到,夸克在教育学习领域也将有新动作,计划单独推出“夸克学习”App,该产品将进一步完善夸克在教育学习功能板块的布局。而且,夸克的AI硬件业务“夸克AI眼镜”的适配App,也正在加快研发中。
日前,北京奇点灵智科技有限公司(以下简称“奇点灵智”)宣布完成数千万元天使轮融资。本轮融资由星连资本(Z基金)领投,所获资金将用于升级基于大模型与多模态技术的智能教学系统,完善教育内容框架及硬件体验,通过场景化创新持续提升用户价值。奇点灵智是一家专注儿童教育赛道的AI硬件创新企业,致力于通过深度融合大模型与多模态技术,构建新一代智能学习基座。其首款产品"AI英语伴学机器人"聚焦3-8岁儿童,通过寓教于乐的方式,将个性化学习与主动探索的理念融入到家庭教育场景,塑造儿童英语能力成长的智能起点。
阿里巴巴旗下的瓴羊发布首个数据分析Agent,Quick BI里的“智能小Q”升级为一名由问数、解读和报告三大核心Agent组成的“超级数据分析师”,最快只需10秒即可帮助用户快速获取数据、解读数据,最快只需20分钟即可完成一份兼具洞察和深度的数据报告,帮助业务人员了解问题的症结以及确定决策方向。
Anthropic 推出了“Claude for Chrome”,这是一个可以直接作为 Chrome 浏览器扩展程序使用的 AI 智能体(agent),能在侧边栏与用户对话,并获取当前浏览器的上下文信息;可协助用户安排日程、回复邮件、甚至找房等任务。目前仅向 1000 名被选中的 Claude Max 套餐用户开放测试,其他用户可订阅 Max 套餐(月费 100 或 200 美元)进入候补名单。之所以范围受限,是因为 AI 操控浏览器存在安全风险(如“提示注入攻击”),需通过小规模测试收集反馈以强化安全措施。默认禁止访问金融、成人或盗版内容网站,执行高风险操作前会征得用户许可
阿里云宣布开源全新多模态视频生成模型通义万相 Wan2.2-S2V,仅需一张静态图片和一段音频,即可生成面部表情自然、口型一致、肢体动作丝滑的电影级数字人视频。据介绍,该模型单次生成的视频时长可达分钟级,大幅提升数字人直播、影视制作、AI 教育等行业的视频创作效率。
梅卡曼德宣布完成新一轮近5亿元融资。本轮融资由雄安基金、大洋电机、华创资本、中金保时捷基金、上河动量基金、南翔创投、海河基金、河北结构调整基金、天创资本等投资。本轮资金将用于加速梅卡曼德具身智能“眼脑手”全栈技术的持续进化,拓展产品线与场景应用,并进一步提升全球商业化与客户服务能力。其中,大洋电机作为产业投资方,双方将探索在业务场景应用、前瞻业务研发等方面的深入合作。
AI 玩具公司跃然创新(Haivivi)近期完成 2 亿元 A 轮系列融资。本轮融资由中金资本旗下基金、红杉中国、华山资本、愉悦资本领投,招银国际等参投,香港科技大学工学院原院长高秉强创立的 Brizan Ventures 等老股东加注。
Haivivi 已获得奥特曼、小猪佩奇、奶龙等知名 IP 的 AI 玩具授权,同时在开发自研 IP。今年下半年, Haivivi 将陆续发布十几个 IP 产品。8 月 27 日,Haivivi 将正式推出旗下第二代 AI 玩具产品——CocoMate 系列,硬件部分直接嵌入玩偶本体,并且支持拆卸。首批发售的 CocoMate 将包含奥特曼 IP 限定款——赛罗和迪迦——及 Haivivi 原创 IP “泡泡” 礼盒。
今日,由前阿里云P10高管、原OLAP产品线总经理占超群(花名离哲)创立的质变科技,继推出AI-Ready Data Cloud之后,正式发布另一核心产品——首款类人决策智能体Bloom。质变科技获得高瓴创投与光速光合联合投资的数千万美元天使轮融资,心流资本FlowCapital担任长期独家财务顾问。占超群及其核心团队主要来自于阿里云,曾主导打造中国市场份额与技术领先的阿里云云原生数据仓库产品,拥有深厚的超大规模高可靠数据基础设施基因。
据 The Verge 报道,Meta 首席 AI 官Alexandr Wang宣布,Meta 已与 Midjourney 达成合作,将获得其美学技术许可,用于 Meta 未来的模型和产品中。这一合作还涉及双方研究团队的技术协作。作为知名的 AI 图像和视频生成工具提供商,Midjourney 在相关领域技术先进。而 Meta 近期大力投入 AI 研发,试图追赶 OpenAI 和谷歌等竞争对手。公司创始人扎克伯格此前不惜重金从其他公司招揽 AI 人才,Alexandr Wang正是在 Meta 以 143 亿美元收购他联合创立的 Scale AI 后,加入 Meta 担任要职。
钉钉、通义实验室语音团队今天宣布,联手推出新一代语音识别大模型 Fun-ASR,能听懂家装、畜牧等十大行业黑话,并支持企业专属模型定制训练。目前,Fun-ASR 已被集成进钉钉的多个功能模块,包括会议字幕与同传、智能纪要、语音助手等。目前 Fun-ASR 已被集成进钉钉的多个功能模块,包括会议字幕与同传、智能纪要、语音助手等,旨在构建一套稳定、高效、易扩展的语音识别基座,尤其适用对企业级语境理解、识别准确率有较高要求的场景。
阿里巴巴今天正式发布面向全球用户的Agentic编程平台 Qoder。Qoder 集成了全球顶尖的编程模型,提供最强的上下文工程能力,可一次检索10万个代码文件。基于强大的编程智能体,可实现 AI 自主研发,大幅提升真实软件的开发效率。使用 Qoder开发一个电商网站的前后端,可将原本需要数天的工作缩短到十分钟。
综合媒体报道,谷歌已经与Meta达成一项价值超过100亿美元的云计算合同,标志着两家硅谷顶尖公司首次在云计算领域展开大规模合作。知情人士表示,该协议为期六年,交易主要围绕人工智能基础设施展开。根据协议,Meta将使用谷歌云的服务器、存储、网络和其他服务。Meta首席执行官扎克伯格7月份曾表示,公司将斥资数千亿美元建设几个大型人工智能数据中心。然而,Meta的AI业务近来颇显混乱,市场怀疑该公司不断重组人工智能部门可能加剧内部动荡,并折射出该公司更深层次的文化和执行问题。与谷歌的合作将帮助Meta填补其在当前的算力缺口,按照工程测算,Meta的自有数据中心建设至少将到2030年才能完全投入使用。
OpenAI在法庭文件中表示,马斯克今年曾试图说服扎克伯格参与收购OpenAI的竞标。OpenAI称,马斯克将扎克伯格列为与他讨论过可能为收购OpenAI提供融资的人士之一。OpenAI在文件中称,扎克伯格和Meta均未签署意向书,也未参与这笔974亿美元的收购要约。OpenAI董事会于2月正式拒绝了马斯克的收购要约。马斯克十年前与山姆·奥特曼共同创立了OpenAI,随后又创立了竞争对手初创公司xAI。他与OpenAI陷入法律纠纷,多次试图阻挠该初创公司重组为更传统的营利性企业的计划。
深度求索今天宣布正式发布 DeepSeek-V3.1。本次升级包含以下主要变化:
混合推理架构:一个模型同时支持思考模式与非思考模式;
更高的思考效率:相比 DeepSeek-R1-0528,DeepSeek-V3.1-Think 能在更短时间内给出答案;
更强的 Agent 能力:通过 Post-Training 优化,新模型在工具使用与智能体任务中的表现有较大提升。
官方 App 与网页端模型已同步升级为 DeepSeek-V3.1。用户可以通过“深度思考”按钮,实现思考模式与非思考模式的自由切换。
DeepSeek API 也已同步升级,deepseek-chat 对应非思考模式,deepseek-reasoner 对应思考模式,且上下文均已扩展为 128K。同时,API Beta 接口支持了 strict 模式的 Function Calling,以确保输出的 Function 满足 schema 定义。(详见官方文档:https://api-docs.deepseek.com/zh-cn/guides/function_calling)
另外,我们增加了对 Anthropic API 格式的支持,让大家可以轻松将 DeepSeek-V3.1 的能力接入 Claude Code 框架。(详见官方文档:https://api-docs.deepseek.com/zh-cn/guides/anthropic_api)
今天,字节跳动Seed团队开源了Seed-OSS系列模型,这些模型专为长上下文、推理、Agent和通用场景设计,将上下文窗口扩展至512k,是业界常见上下文窗口(128k)的4倍,GPT-5上下文窗口的2倍,相当于1600页文本。Seed-OSS系列模型是推理模型,专门针对推理任务进行了优化,还允许用户灵活地控制思维预算。字节Seed团队共开源了Seed-OSS的三个版本,分别为:
指令微调后的Seed-OSS-36B-Instruct在通用知识、Agent、编程、长上下文等领域的基准测试中,取得同量级开源模型中的7项SOTA(性能最佳)表现,整体能力超过了Qwen3-32B、Gemma3-27B、gpt-oss-20B等模型,与Qwen3-30B-A3B-Thinking-2507在大部分领域旗鼓相当。
8月21日,“《财富》中国科技50强”榜单推出。华为、DeepSeek、宇树科技等企业悉数在列。据财富官方介绍,DeepSeek是中国最具代表性的人工智能大模型产品。其自主研发的DeepSeek-R1大模型,在MMLU基准测试中的得分达到88.5。DeepSeek在全球开源大模型下载量排名中稳居前10位。截至2025年6月,DeepSeek月活跃用户达到1.63亿,位居全球人工智能生成内容应用首位。2024年,宇树科技全球四足机器人销量达到1.8万台,全球市场份额为23%,位列第二,仅次于波士顿动力公司。
OpenAI首席财务官Sarah Friar表示,公司未来可能进行IPO;OpenAI在7月首次实现单月收入破10亿美元,面临的最大问题是算力始终不够用。OpenAI正在考虑未来是否可以帮助其他企业使用人工智能所需的数据中心和实体基础设施,这项新的收入来源或可部分抵消OpenAI所面临的巨大成本。Friar同时指出,与微软的合作关系正在“发生变化”,但未来数年内微软仍是关键合作方,因双方在知识产权上深度绑定。
比尔·盖茨支持的机器人初创公司Field AI在两轮融资中筹集了4.05亿美元,投资来自英伟达的风险投资部门和亚马逊创始人杰夫·贝佐斯的家族办公室。据一位知情人士透露,最新一轮融资对这家成立两年的初创公司的估值为20亿美元。由于讨论财务信息,这位知情人士要求不具名。除了NVentures和Bezos Expeditions之外,这轮融资还包括来自Khosla Ventures、淡马锡、Canaan Partners和英特尔资本的投资。三星和微软(505.72, -4.05, -0.79%)创始人盖茨的投资基金Gates Frontier此前曾投资过该公司。
L4级自动驾驶企业白犀牛近日完成了B+轮融资。至此,白犀牛的B轮融资总额累计近5亿人民币。本轮融资中,老股东顺丰、线性资本继续跟进,以骏资本、三六零基金、华泰紫金等机构也加入成为新股东。据悉,本轮资金将重点投向车规级无人车产品研发、AI技术的持续迭代和商业场景的拓展等三大领域。值得注意的是,本轮融资后,白犀牛B轮总融资金额已近5亿元。并且本轮是顺丰自2024年8月首次注资后,一年内的第三次投资。
昨晚,DeepSeek官方悄然上线了全新的V3.1版本,上下文长度拓展到128k。本次开源的V3.1模型拥有685B参数,支持多种精度格式,从BF16到FP8。综合公开信息和国内大咖karminski3的实测,V3.1此次更新亮点有:
据外媒今日报道,Meta周二宣布重组AI部门,将超级智能实验室拆成4个团队,原通用人工智能基础团队即将解散。这可能会进一步加剧Meta内部围绕AI技术的动荡。知情人士透露,预计一些AI高管将会离职,Meta还在考虑缩减整个AI部门的规模,可能包括裁减职位或将员工调至公司其他部门,因为其AI部门员工数已增至数千人,目前讨论仍在进行中,尚未就裁员做出最终决定。Meta新AI团队已讨论将下一个AI模型“封闭化”,这将与其长期奉行的开源理念背道而驰。知情人士称,新团队已决定放弃Meta之前的前沿模型Behemoth,并从头开始开发新模型。由于性能测试令人失望,Behemoth 的发布于去年春季被推迟。此外,Meta将从仅使用自有技术驱动其AI产品,转向积极探索使用第三方AI模型。这可能包括基于其他可免费获取的开源AI模型进行构建,或从其他公司获得闭源模型的授权。
周二,Firecrawl 宣布完成由 Nexus 领投的 A 轮融资,Shopify 首席执行官 Tobias Lütke 和现有投资者 Y Combinator 参与跟投。Firecrawl 为开发者和 AI 智能体提供广受欢迎的开源网络爬虫工具,并通过 API 提供商业支持版本。该产品已拥有 35 万开发者用户,在 GitHub 上收获近 5 万星标,客户包括 Shopify、Replit、Zapier 以及"全球部分顶级对冲基金"。值得一提的是,公司目前已经实现盈利。
据消息,Databricks 正以 1000 亿美元估值完成新一轮融资。本轮融资规模约为 10 亿美元且认购火爆。该消息显示,以数据分析产品闻名的 Databricks 之所以未出售更多权益,是因为在 1 月份以 620 亿美元估值完成破纪录的 100 亿美元融资后,其运营资金已十分充裕(这一纪录后来被 OpenAI 在 3 月 400 亿美元的融资打破)。本轮融资由 Thrive 与 Databricks 早期投资方 Insight Partners 共同领投 ,这两家机构也主导了上一轮融资。自 2013 年成立以来,该公司已累计融资约 200 亿美元。该公司将大力投资其 AI Agent 数据库,并向所有客户全面开放该产品。这款名为 Lakebase 的产品于 6 月在其年度技术大会上发布。
OpenAI首席执行官萨姆·奥尔特曼(Sam Altman)最新警告称,美国可能低估了中国在人工智能(AI)方面取得进展的复杂性和严重性,并表示仅靠出口管制可能不是可靠的解决方案。奥尔特曼近日罕见接受了一些媒体的公开采访。他表示,自己对于中国AI取得的进步有些担忧,“我很担心中国(的实力)。”他警告说,美中人工智能竞赛已经深深纠缠在一起,而且其影响远比单纯“谁领先”这种排行榜要大得多。
情感语音交互模型初创公司宇生月伴近日完成新一轮融资,由靖亚资本和小苗朗程领投,菡源资产(上海交大母基金)跟投,心流资本FlowCapital担任长期财务顾问。本轮融资将用于语音模型的持续优化、产品矩阵拓展及国际化商业落地。作为国内首家聚焦“情感语音交互”的模型公司,宇生月伴正重新定义AI时代的语音交互范式。宇生月伴由上海交通大学计算机学院特聘教授、听觉认知与计算声学研究中心负责人钱彦旻教授创办,并获校方千卡集群算力资源支持。联合创始人梅杰系浙大背景的连续创业者,曾成功创办多家科技公司,具备深厚的产品化与市场化经验,带领团队实现从技术原型到商业落地的快速闭环。
据外媒《华尔街日报》报道,AI编程独角兽Cognition获得近5亿美元(折合人民币约36亿元)新融资,估值达到98亿美元(折合人民币约704亿元)。Cognition是AI编程领域的“当红炸子鸡”,去年3月发布首个能自主编程的“AI程序员”Devin,今年7月收购竞争对手Windsurf。这家创企此前的融资总额达到3亿美元(折合人民币约22亿元)。Cognition成立于2023年,由华裔Scott Wu、Steven Hao和Walden Yan联合创立,创始人均为国际信息学奥林匹克(IOI)金牌得主。Scott Wu毕业于麻省理工学院,获计算机科学和数学学位,Steven Hao本科毕业于MIT计算机和数学专业,此前曾在Scale AI担任高级AI系统工程师,Walden Yan毕业于哈佛大学。
本周四,谷歌正式发布了 Gemma 3 的最新一款模型。Gemma 3 270M 是一款紧凑型、拥有 2.7 亿个参数的小体量语言模型,专为特定任务的微调而设计,具备强大的指令跟踪和文本结构化能力。它继承了 Gemma 3 系列的先进架构和强大的预训练功能,同时为小尺寸模型带来了强大的指令执行能力。谷歌展示的 IFEval 基准测试成绩所示,在同级模型上,Gemma 3 270M 树立了新的性能水平,使复杂的 AI 功能更容易应用于设备端和研究应用。
加拿大AI大模型初创公司Cohere已完成5亿美元融资,估值来到68亿美元。这轮融资由Radical Ventures和Inovia Capital领投,超额认购。其他参与投资的既有投资者包括AMD Ventures、NVIDIA、PSP Investments和Salesforce Ventures,新投资者则包括安大略省医疗养老基金(HOOPP)等。与此同时,这家AI实验室宣布,已聘请Meta前AI研究副总裁Joelle Pineau出任其新设立的首席AI官。Pineau也是麦吉尔大学的一名教授,她此前负责Meta的基础AI研究(FAIR)实验室,并于今年5月从Meta离职。
今天,OpenAI研究科学家、Deep Research项目研究主管孙之清在X平台上官宣加盟了Meta超级智能实验室(MSL)。在OpenAI期间,孙之清参与了ChatGPT Agent、OpenAI o3、o4-mini等项目的研发工作。今年7月,他才刚在OpenAI Agent的发布会上露面。同样加盟MSL不久的思维链之父、前OpenAI成员Jason Wei转发了他与孙之清的最新合照,配文是:“老朋友,新实验室。”Jason Wei参与了o3和深度研究的研发工作,应该与孙之清有较为密切的合作关系。
腾讯混元最新推出 Hunyuan-GameCraft,基于HunyuanVideo底模的高动态交互式游戏视频生成框架,简单来说,它是一个“游戏视频生成工具”,只需要输入一张图 + 文字描述+动作指令(按键盘方向键),就能输出高清动态游戏视频。无论是第一人称跑酷,还是第三人称探险,它都能实时生成流畅画面,仿佛你真的在游戏世界里自由穿梭。
马斯克旗下人工智能公司xAI联合创始人伊戈尔·巴布什金(Igor Babuschkin)发文称,这是他在xAI的最后一天,他将离开这家于2013年和马斯克共同创办的公司,他为这家公司的成长感到自豪。巴布什金透露,他将开启人生的新篇章,成立Babuschkin Ventures,该基金支持AI安全研究,并支持AI和代理系统领域的初创企业。
在创办xAI之前,伊戈尔曾在谷歌DeepMind任高级研发工程师,在OpenAI 也有任职经历。在 DeepMind 期间,他参与开发了 AlphaStar,这一突破性的AI系统在电子游戏《星际争霸》中击败了顶尖玩家。在OpenAI,他曾参与了GPT-4等ChatGPT背后核心技术的研发,随后又转战回到谷歌。作为xAI工程团队的灵魂人物,巴布什金曾主导该公司技术架构搭建与超级计算集群建设,助力xAI在短短两年内跻身全球AI模型开发第一梯队。
据媒体报道,苹果正在筹划一项雄心勃勃的计划,将推出包括桌面机器人、带显示器的智能音箱和家庭安全摄像头在内的全新AI设备阵容。其中,桌面机器人是其AI战略的核心,计划于2027年推出,它将搭载逼真的Siri语音助手,能够融入多人对话。而配备显示屏的智能音箱则计划于明年推出。家庭安全被视为另一个重要增长机会。新的摄像头产品将构建苹果安全系统的核心,能够实现家庭功能自动化,帮助增强苹果产品生态系统对消费者的粘性。
据媒体报道,人工智能明星初创公司Perplexity提出以345亿美元收购谷歌的Chrome浏览器,挑战谷歌在网络搜索领域的主导地位。Perplexity的报价远高于其自身约180亿美元的估值。包括大型风险投资基金在内的多家投资者已同意全额支持这笔交易。对于Chrome的企业价值,市场估算差异很大,但近期的区间为200亿至500亿美元。美国地方法官Amit Mehta去年裁定谷歌非法垄断搜索市场,预计本月将就如何恢复竞争作出裁决。Mehta正在考虑是否迫使谷歌出售Chrome。媒体分析指出,Perplexity的收购提议可能是在向法官表明,一旦他下令出售,市场上已有潜在买家。
据英国《金融时报》最新报道,OpenAI正准备投资脑机接口创企Merge Labs,要和马斯克正面“硬刚”。该创企计划以85亿美元(约合人民币610.2亿元)的估值,共融资2.5亿美元(约合人民币17.9亿元)。知情人士透露,OpenAI联合创始人兼CEO萨姆·阿尔特曼(Sam Altman)很支持该项目,并计划担任该公司的联合创始人。不过相关谈判尚处于早期阶段,据报道,阿尔特曼不会以个人身份进行投资。他们补充说,阿尔特曼将联合创办MergeLabs,但不会在这个新项目中担任日常管理职务。
总部位于美国旧金山的面向消费者、将 AI 智能体引入群聊场景的 Continua 公司宣布完成 800 万美元种子轮融资,本轮融资由 GV 领投,Bessemer Venture Partners 及多位天使投资人跟投。Continua 成立于 2023 年,由前 Google 资深工程师、Google Goggles 和 Google Glass 创始团队成员 David Petrou 创立,主营业务是在 SMS、iMessage 与 Discord 群聊中部署 AI 智能体,通过自动提醒、投票、日历邀请、生成待办文档等功能提升多人协作效率。
据彭博社统计,AI独角兽已达498家,总估值2.7万亿美元,超过谷歌市值,其中100家成立不足两年。Scale AI 28岁联合创始人亚历山大·王成世界最年轻亿万富翁;Anthropic、CoreWeave、DeepSeek、Anysphere、Figure AI、Perplexity、Safe Superintelligence、Thinking Machines Lab 等十余家公司创始人或高管新晋十亿级富豪。新贵多保持私营,借风投、主权基金等融资,并通过股权抵押、二级交易、并购快速变现;旧金山湾区亿万富翁数已超越纽约。
在 OpenAI 推出开放模型和 GPT-5 之后,Anthropic 也接连发布了一系列人工智能相关消息。该公司今日宣布,其 Claude Sonnet 4 模型在 Anthropic API 中支持的上下文 token 数量已提升至 100 万,这一数字是之前上限的五倍。此次升级后的“长上下文”功能,使得开发者能够将更大规模的数据集一次性输入到 Claude 中。Anthropic 表示,100 万 token 的窗口能够处理包含超过 7.5 万行代码的完整代码库,或者同时处理数十篇长篇研究论文。
华为于8月12日在2025金融AI推理应用落地与发展论坛上,正式发布AI推理创新技术UCM,这项突破性成果有望降低中国AI推理对HBM(高带宽内存)技术的依赖,提升国内AI大模型推理性能。华为推出的UCM(推理记忆数据管理器)是一款以KV Cache为中心的推理加速套件,融合多类型缓存加速算法工具,通过分级管理推理过程中产生的KV Cache记忆数据,扩大推理上下文窗口,实现高吞吐、低时延的推理体验。华为此次与中国银联共同发布AI推理最新应用成果,将完善中国AI推理生态的关键部分。据证券时报最新获悉,华为计划于2025年9月正式开源UCM,届时将在魔擎社区首发,后续逐步贡献给业界主流推理引擎社区,并共享给业内所有Share Everything(共享架构)存储厂商和生态伙伴。
智谱 AI 宣布推出全球 100B 级效果最佳的开源视觉推理模型 GLM-4.5V(总参数 106B,激活参数 12B),并同步在魔搭社区与 Hugging Face 开源。这是我们在通向 AGI 道路上的又一探索性成果。GLM-4.5V 基于智谱新一代旗舰文本基座模型 GLM-4.5-Air,延续 GLM-4.1V-Thinking 技术路线,在 41 个公开视觉多模态榜单中综合效果达到同级别开源模型 SOTA 性能,涵盖图像、视频、文档理解以及 GUI Agent 等常见任务。
8月12日,昆仑万维为大家带来了自研世界模型Matrix系列中Matrix-Game交互世界模型的升级版本——「Matrix-Game 2.0」,同样实现了通用场景下的交互式实时长序列生成的世界模型。并且为促进交互式世界模型领域的发展,「Matrix-Game 2.0」全面开源,是业内首个在通用场景上实现实时长序列交互式生成的世界模型开源方案。
近日,戴盟机器人(Daimon Robotics)完成亿元级天使++轮融资,由招商局创投领投,东方嘉富、架桥资本跟投。本轮融资将助力戴盟加速全球领先的视触觉感知与灵巧操作技术的落地应用,持续引领具身智能技术的产业化进程。此前,戴盟还先后完成了昆仲资本独投的天使轮融资,以及国中资本、金鼎资本、联想创投和招银国际联合投资的天使+融资。天使轮、天使+轮与天使++轮累计融资金额达数亿元,刷新触觉传感领域天使轮融资的最高纪录。
据《金融时报》报道,为了获得芯片出口许可证,英伟达、AMD与特朗普政府达成了一项不同寻常的安排,其中包括将其中国芯片销售收入的15%上缴美国政府。据一名美国官员等知情人士透露的消息,这两家芯片制造商同意了这一财务安排,以便获得中国市场出口许可证。这些许可证在上周获批。这名美国官员表示,英伟达、AMD分别同意将其在中国销售H20、MI308芯片收入的15%上缴美国政府。两名知情人士称,特朗普政府尚未决定如何使用这笔资金。
伯恩斯坦分析师估计,根据英伟达在今年早些时候出口管制生效前的业绩指引,公司在2025年本可向中国销售大约150万颗H20芯片,创造约230亿美元的收入。对此,英伟达并未否认已同意这一安排,其表示:“我们遵守美国政府为我们参与全球市场所制定的规则。”
L4 级实时数据收集与交付智能体 Sheet0 宣布完成了 500 万美元的融资,该公司计划将筹集的资金用于技术迭代、产品打磨及团队扩张,以加速打造“属于 Agent 的 Google.com”。Sheet0 由连续创业者王文锋于 2023 年创立,当前团队规模不足 10 人;其核心业务是通过自然语言指令,为超级个体、知识工作者以及各类 AI Agent 提供“又准又快”的公开互联网数据抓取、清洗与结构化交付服务。
星海图即将开源全球首个开放场景高质量真机数据集Galaxea Open-World Dataset,及其G0-快慢双系统全身智能VLA模型。成立不到两年,星海图已完成7轮融资、累计近15亿元人民币,最新1亿美元A4/A5轮由今日资本与美团系共同领投,公司估值正快速冲向10亿美元,是目前机器人独角兽中最有特点的一家公司。
百川智能发布开源医疗增强大模型Baichuan-M2。宣布超越OpenAI 8月6日开源两款大模型——主打部署成本超低和医疗能力,在所有开源模型中,登顶全球第一。据悉,Baichuan-M2在HealthBench上得到60.1分,以32B的较小尺寸不仅反超OpenAI 最新开源模型gpt-oss120b(得分57.6),力压Qwen3-235B、Deepseek R1、Kimi K2等开源大模型。
昆仑万维正式发布SkyReels-A3模型,基于“DiT(Diffusion Transformer)视频扩散模型+插帧模型进行视频延展+基于强化学习的动作优化+运镜可控”,其能实现任意时长的全模态音频驱动数字人创作。当前SkyReels-A3模型已上线,欢迎登录SkyReels官网体验。SkyReels-A3模型在以下四个方向上为用户带来新体验:Text Prompt(文本提示词输入)支持画面变化;更自然的动作交互,包括和商品的交互、说话时的手部动作等;运镜的运用和控制更高级,让艺术场景如音乐/MV等拥有更高的艺术美感;
深圳波洛斯科技有限公司(下称“波洛斯”)近日完成数千万A轮融资,由瀚联半导体产业基金(下称“瀚联基金”)独家战略投资。本轮融资将加速波洛斯在智能语音增强与智能语音交互技术的研发创新,以及推动产品在更多领域的市场渗透。波洛斯成立于2018年,研发团队来自中科院及产业界机构,拥有多年算法和集成电路的经验。目前,波洛斯通过MCU+DSP+NPU三核异构的音频AI芯片及声学信号处理算法、神经网络降噪算法、双工通话算法等技术为核心的产品体系,为用户提供高性能和高性价比的国产音频芯片及方案。产品广泛应用于各类行业智能终端、IPC、AIPC、AI玩具、便携式扩声、对讲设备等AI硬件,有效缩短AI工程化链条,降低AI技术应用门槛与开发难度。