全球AI动态周报-截止6月15日
作者:小编 | 发布时间: 2025-06-19 | 次浏览
Google 正在逐步调整其 AI 模型使用政策。自5月起,面向开发者的 AI 测试平台 Google AI Studio 已停止向免费用户提供 Gemini2.5Pro 系列模型的调用权限。官方回应称,这是转向全新 基于 API 密钥的使用系统 的一部分,未来开发者将需自行提供 API 密钥接入模型服务。
在当前过渡阶段,Google 依然为开发者提供 基于 Google Cloud 的免费 API 密钥,并强调 Google AI Studio 的免费套餐“短期内不会消失”。不过,多位开发者已发现,尝试使用 Gemini2.5Pro 时会遭遇 HTTP429错误提示,明确指出该系列模型不支持免费层级调用。
目前免费用户仍可访问Gemini2.0系列模型,但在能力和表现上,该系列与最新的 Gemini2.5存在明显差距。这一政策调整引发了开发者社区的普遍关注和讨论,特别是对使用 Gemini2.5Pro 进行高性能测试、原型开发的用户来说影响较大。
在最新发布的iOS26、iPadOS26和 macOS26Tahoe 系统中,苹果公司为其 “图乐园” 功能进行了重磅升级,成功整合了 ChatGPT 的图像生成能力。这一创新不仅让用户在创作时享受更丰富的艺术风格选择,还能够将想象力与人工智能相结合,创造出美丽的视觉作品。
OpenAI在其“12Days of OpenAI”活动中宣布了对ChatGPT Projects功能的重大更新,为用户带来了更强大的项目管理和AI交互体验。作为ChatGPT的核心功能之一,Projects旨在帮助用户更高效地组织和管理AI驱动的工作流。本次更新引入了多项创新特性,包括深度研究、语音模式、改进的记忆功能以及移动端增强支持,标志着ChatGPT在个性化与协作场景中的全新突破。
近日,OpenAI 宣布推出其最新的 o3-pro AI 模型,这款新模型旨在为企业提供更加可靠和精准的响应。o3-pro 是 o 系列推理模型的进阶版,支持更多的软件工具集成,特别适合那些需要高细节和准确度的企业与开发者。
然而,o3-pro 的响应速度较之前的模型有所减缓。OpenAI 表示,由于 o3-pro 拥有更丰富的工具可供使用,处理复杂问题时需要的时间也会相应延长。“o3-pro 的响应时间通常会比 o1-pro 慢。我们建议在需要可靠性而非速度的情况下使用它,等待几分钟的时间是值得的。”OpenAI 在邮件中这样说道。
目前,o3-pro 尚不支持图像生成功能,并且 OpenAI 暂时禁用了临时聊天以解决技术问题。虽然一些用户反馈 o3-pro 在工作表现上相当出色,但由于运行成本高,仍可能影响部分开发者的试用意愿。
OpenAI宣布对其旗舰推理模型o3的价格下调80%,同时推出高性能的o3-pro模型。此举大幅降低了开发者成本,引发AI市场新一轮竞争。
Ø新定价使o3的成本与GPT-4o相当甚至更低,显著提升了其市场吸引力。
OpenAI同步推出了o3-pro模型,定位于高可靠性需求的复杂任务,定价如下:
Øo3-pro已在ChatGPT Pro和Team用户的模型选择器中上线,逐步向企业与教育用户开放。
谷歌宣布其最新图像生成模型Imagen4正式集成至 Gemini 平台,为用户带来更强大的图像创作能力。根据近期网络信息,Imagen4在图像细节、文本渲染和色彩表现上实现显著突破,成为当前 AI 图像生成领域的领先技术之一。本文将从技术亮点、功能应用及用户反馈等角度,全面解析 Imagen4的登陆对 Gemini 生态的深远影响。
升级后的DeepSeek R1-0528现已支持OpenRouter上的本地工具调用,这一重大改进使开发者能够将本地工具无缝集成到AI工作流中。
与R1-0528主模型更新同步,DeepSeek还推出了精简版模型DeepSeek-R1-0528-Qwen3-8B,基于阿里巴巴的Qwen3-8B模型。这款轻量级模型对计算资源需求显著降低,仅需单块40GB至80GB内存的GPU(如Nvidia H100)即可运行。尽管规模较小,它在某些基准测试中仍超越了Google的Gemini2.5Flash和OpenAI的o3-mini,成为硬件资源有限的爱好者和开发者的理想选择。
这款精简模型同样通过OpenRouter提供,体现了DeepSeek对AI可访问性的承诺。通过OpenRouter的免费API层,开发者可以无财务负担地试验R1-0528的功能,促进全球范围内的创新。
在“Force 原动力大会” 上,字节跳动旗下的火山引擎正式推出了豆包大模型1.6和视频生成模型 Seedance1.0pro。该模型支持文字和图片输入,能够生成1080P 高品质视频,且在多个评测榜单上都取得了优异的成绩,超越了诸如 Veo3和可灵2.0等众多竞争者。随着视频内容消费的不断增长,这一技术无疑为相关行业的发展提供了新动力。
更值得一提的是,豆包1.6的使用成本大幅下降,按 “输入长度” 进行定价,使得企业在使用过程中能大大节省费用。具体来说,在0-32K 输入区间,豆包1.6的输入费用仅为0.8元 / 百万 tokens,综合成本仅为豆包1.5的三分之一。Seedance1.0pro 的使用成本同样惊人,每生成一条5秒的1080P 视频仅需3.67元,这使其在行业内的价格极具竞争力。
在人工智能蓬勃发展的当下,字节跳动旗下火山引擎正式推出MCP 服务,为企业开发带来强劲助力。
MCP 服务深度链接 Agent 开发体系、大模型工具生态与云服务,与 TRAE、火山方舟、扣子等产品紧密打通,为开发者提供超 200 种丰富服务选择。通过 MCP,开发者能便捷操控火山引擎云服务组件,从计算、网络到存储,快速部署各项环境资源,大幅缩短将创意转化为成熟产品的周期,推动企业开发流程的高效化、智能化。
字节跳动火山引擎发布了两款全新的豆包语音大模型,旨在提升语音识别和语音生成的智能水平。这两款模型分别是豆包・语音播客模型和豆包・实时语音模型,均在多项技术指标上实现了显著的突破。
智谱AI宣布,全新企业级超级助手Agent CoCo正式上线。这款智能助手以“懂你懂企业,能干能交付”为核心理念,致力于为企业带来前所未有的工作效率提升。
CoCo具备三大显著的企业级特性。首先,它以交付为导向,全流程辅助工作,确保每一项任务都能以最终成果为衡量标准,真正做到用结果说话。其次,CoCo引入了独特的记忆机制,能够根据每位员工的职能和需求,主动提供个性化的服务,成为每位员工的专属秘书。这一机制还能根据用户的工作重点,主动跟踪行业动态,确保信息的及时性和准确性。最后,CoCo具备无缝嵌入企业现有系统的能力,它能够融合企业已有的数据资源和系统工具,打造出一个真正懂企业的智能助手。
值得一提的是,CoCo的记忆机制不仅让每位员工的需求得到精准满足,还能通过主动服务,让员工在忙碌的工作中感受到更多的关怀和支持。这种个性化的服务体验,将进一步提升员工的工作满意度和忠诚度。
6月12日,Manus AI宣布推出全新“聊天模式”(Chat Mode),对所有用户完全免费且无使用限制。这一功能的发布标志着Manus在AI生产力工具领域的又一重要突破,为用户提供了从简单对话到复杂任务的无缝体验。
这一更新不仅降低了AI工具的使用门槛,也展现了Manus在全球AI市场中的雄心。面对ChatGPT等巨头的竞争,Manus的免费策略与多功能生态(包括近期推出的文本到视频和图像生成工具)或将成为其突围的关键。
近日,阿里通义实验室宣布开源全新预训练框架MaskSearch,通过创新的检索增强掩码预测(RAMP)方法和强化学习技术,显著提升AI在复杂问题解决中的表现。这一框架让AI学会主动搜索与多步推理,为智能搜索和问答系统开辟了新的可能性。
MaskSearch的推出标志着AI推理技术迈向了更智能、更自主的新阶段。阿里通义实验室表示,未来将进一步优化MaskSearch的训练流程,探索更高效的强化学习算法,并扩展其在多模态推理任务中的应用。
对于开发者而言,MaskSearch不仅是一个强大的预训练框架,更是一个可扩展的平台,未来有望支持更多任务类型和模型架构。
近日,Krea AI正式宣布推出其首款图像生成模型Krea1,以卓越的美学控制力和画质表现,为AI图像生成树立了全新标准。
为了让更多用户体验这一突破性技术,Krea AI已开放Krea1的免费测试版,无需复杂注册或付费即可上手试用。这一举措不仅降低了技术门槛,也为广大创作者和开发者提供了探索AI艺术创作的机会。无论是专业设计师还是普通用户,都可以通过Krea1的实时生成和编辑功能,快速将创意转化为视觉作品。
15、小红书全新开源大模型 “dots.llm1” 震撼登场,参数量达 1420 亿!
近日,小红书的hi lab 团队正式推出了其首个开源文本大模型 ——dots.llm1。这一新模型以其卓越的性能和庞大的参数量引起了业界的广泛关注。
dots.llm1是一款大规模的混合专家(MoE)语言模型,拥有惊人的1420亿个参数,其中激活参数达到140亿。经过11.2TB 的高质量数据训练,这款模型的性能可以与阿里巴巴的 Qwen2.5-72B 相媲美。这意味着 dots.llm1不仅在文本生成方面具有极高的准确性和流畅度,还能支持更复杂的自然语言处理任务。
据最新消息,xAI开发的Grok人工智能正式接管了X的推荐算法,这一变化不仅将重塑用户的内容体验,还为粉丝较少的小号用户和新人带来了前所未有的机遇。
对于希望在X平台崭露头角的内容创作者来说,Grok算法的引入无疑是一个重大利好。建议创作者:
Ø紧跟热点趋势:结合Grok对实时数据的分析,发布与热门话题相关的内容能显著提升曝光率。
Ø增强互动性:积极与粉丝互动,发布引发讨论的话题,有助于提升内容的推荐权重。
Grok接管X推荐算法标志着平台内容分发机制的重大升级,为小号用户和新手创作者提供了公平竞争的机会,同时通过智能化的评论排序优化了社区互动体验。这一变革不仅展现了AI技术在社交媒体领域的巨大潜力,也为X平台的未来发展注入了新的活力。
17、豆包App“一句话P图”功能全新升级,基于SeedEdit 3.0实现全面优化
豆包App在智能修图领域迎来重大升级,其“一句话P图”功能基于最新图像编辑模型SeedEdit3.0实现了全面优化,为用户带来了更为丰富多样的修图玩法。
此次升级后的豆包App支持多种P图操作,极大地满足了用户不同的修图需求。用户可以轻松实现一键添加或替换文字,为照片增添独特的文字元素,让青春记忆变得“图文并茂”,更具纪念意义。
此外,豆包App还支持分局部图像编辑增强功能。用户可以对画面的局部进行修改,同时保持主体稳定不变。比如,用户可以对照片中人物的肤色进行微调,或者对背景的色彩进行优化,而不会影响到照片中的主体内容。
18、MiniMax Agent上线!图像生成+多语言支持 长任务处理更智能
MiniMax官方宣布其AI生产力工具MiniMax Agent迎来重大升级,新版本已正式上线。此次更新涵盖智能图像搜索、稳定的图像生成、多语言支持以及多样化的文档导出功能,为用户带来更高效、更智能的体验。
MiniMax Agent此次更新还新增了对中文、日文和韩文字体的支持,特别针对Python绘图功能进行了优化。用户现在可以直接生成包含多语言标签的图表,适用于数据可视化、报告生成等场景。这一功能填补了此前AI工具在亚洲语言支持上的空白,为中日韩用户提供了更本地化的体验。
根据数字市场数据公司Similarweb的数据,在过去三年中,HuffPost桌面和移动网站的自然搜索流量下降了一半以上,而《》(Washington Post)的降幅也与此接近。
Business Insider上个月裁员约21%,该公司首席执行官芭芭拉·彭(Barbara Peng)称此举旨在帮助该出版物“承受住我们无法控制的极端流量下降”。根据Similarweb的数据,在2022年4月至2025年4月期间,其网站的自然搜索流量下降了55%。
在今年早些时候的一次全公司会议上,The Atlantic的首席执行官尼古拉斯·汤普森(Nicholas Thompson)表示,该出版物应预计来自谷歌的流量将趋近于零,同时该公司需要改进其商业模式。
谷歌去年推出的AI Overviews功能削弱了流向度假指南、健康提示以及产品评测网站等特色内容的流量;该功能在搜索结果页面顶部总结搜索内容。该公司上个月在美国推出的AI Mode预计将带来一记更沉重的打击;该功能旨在与ChatGPT等展开直接竞争。AI Mode以一种聊天机器人式的对话回应用户查询,提供的链接则少得多。
“谷歌正在从搜索引擎转变为答案引擎,”汤普森在接受《华尔街日报》( The Wall Street Journal)采访时说。“我们得制定新的策略。”
《》的出版人兼首席执行官威廉·刘易斯(William Lewis)表示,搜索领域中免点击答案的迅速发展“是对新闻业的一个严重威胁,不应低估”。刘易斯是《华尔街日报》出版商道琼斯公司(Dow Jones)的前任首席执行官。
他说,《》正在“紧急行动”,以连接此前被忽视的受众,寻求新的收入来源,并为一个“后搜索时代”做准备。
根据Similarweb的数据,在《》(New York Times),该报桌面和移动网站来自自然搜索的流量占比从三年前的近44%下滑至2025年4月的36.5%。
Similarweb的数据显示,《华尔街日报》4月份的自然搜索流量与三年前相比有所上升,不过其在总流量中的占比从29%降至24%。
道琼斯及《华尔街日报》的首席营销官雪莉·韦斯(Sherry Weiss)表示,随着搜索领域格局的变化,该公司正专注于与读者建立信任并获取习惯性流量。
韦斯表示:“在流量引荐生态系统持续演变的背景下,我们公司致力于确保客户出于需求而主动直接访问我们的平台。”
谷歌高管此前表示,公司仍致力于为网站输送流量,并指出,在看到AI概览后点击相关链接的用户往往会在那些网站上停留更长时间。这家搜索巨头还表示,公司对新闻网站的链接会给予优先展示,而且当用户搜索热门新闻时,也不一定会显示AI概览。然而,如果是对于较旧文章和生活方式类报道中包含的内容的查询,则可能会生成概览。
数字新闻重创了曾经利润丰厚的纸质出版物,这些出版物曾依靠分类广告、广告和订阅收入赖以生存。
Facebook和Twitter等社交媒体平台曾帮助将在线流量导向出版商,但最终放弃了优先推送新闻内容的做法。尽管谷歌多次对其强大的算法进行了一些调整,导致了一些动荡,但在过去十多年里,搜索引擎始终是稳定的流量驱动因素。
“AI过去并非改变一切的因素,但未来它将会改变一切。这是压垮骆驼的最后一根稻草,”Dotdash Meredith的首席执行官尼尔·沃格尔(Neil Vogel)表示。该公司旗下拥有《人物》(People)和《南方生活》(Southern Living)等品牌。
沃格尔表示,在2021年Dotdash与Meredith合并时,谷歌搜索贡献了该公司流量的约60%。但现如今,这一比例约为三分之一。公司总体流量正在增长,这得益于公司推出包括时事通讯简报和MyRecipes食谱库等举措。
许多在线新闻媒体实际上早已面临着公众信任度下降和市场竞争加剧等严峻趋势。随着搜索流量的减少,它们更加重视通过诸如举办线下会议等业务与读者直接建立联系。
《大西洋月刊》的首席执行官汤普森在近期接受的一次采访中表示,《大西洋月刊》正致力于通过改进应用程序、增加纸质杂志的发行量以及加大对活动的投入来建立与读者的联系。该公司表示,其订阅和广告收入双双实现增长。
在出版商努力应对AI如何改变搜索的同时,他们也在寻求保护其版权内容的途径。作为新一代聊天机器人基础的大语言模型是通过从开放网络上搜集的海量数据进行训练的,其中也包括新闻文章。
一些媒体公司已经对特定的AI初创公司提起了法律诉讼,同时也与其他AI公司签订了授权协议。举例来说,《》就以侵犯版权为由起诉了OpenAI和微软(Microsoft),并在最近又宣布与亚马逊(Amazon)达成了一项AI授权协议。《华尔街日报》的母公司新闻集团(News Corp)与OpenAI达成了一项内容协议,并对Perplexity提起了一项诉讼,目前案件尚在审理中。
尽管谷歌表示其在苹果公司(Apple)设备上的总搜索量有所增加,但苹果公司的一位高管上个月在联邦法庭上表示,这家iPhone制造商的浏览器Safari中的谷歌搜索量最近出现了二十年来的首次下降。
6月10日,在安徽合肥举办的2025年中国网络文明大会网络法治分论坛上,在中央网信办网络法治局、网络管理技术局指导下,中国网络空间安全协会会同60余家会员单位发布《推动人工智能安全可靠可控发展行业倡议》。
据介绍,当前,人工智能技术突飞猛进,在赋能经济社会发展的同时,也面临数据安全、伦理规范、风险管控等前所未有的挑战。该倡议旨在响应《生成式人工智能服务管理暂行办法》《人工智能生成合成内容标识办法》等政策要求,推动行业自律,强化技术研发、应用推广和生态建设中的安全可控要求,为人工智能健康发展营造良好环境。
倡议提出,坚持法治引领,保障全程合规;构建安全底座,完善治理能力;筑牢技术根基,强化可靠可控;优化算法性能,保障可靠运行;守护数据安全,夯实发展基石;重视人才培育,提升全民素养;坚守伦理价值,引领技术向善;共享治理经验,推动公平普惠。
近日,上海警方侦破一起利用人工智能技术编造、传播网络谣言损害企业权益案,抓获8名犯罪嫌疑人。据悉,该团伙利用AI“洗稿”,杜撰涉霸王茶姬的不实文章,以此博流量、涨粉丝进而获取广告收益。
近年来,AI大模型技术不断突破,便利了人们的生活和工作。但AI大模型生动真实的模仿能力,也让其成为资本市场虚假“小作文”的推手。造谣者利用AI生成谣言主要有两种方式,一是利用AI软件生成不实图文、研报等,在网上进行传播;二是通过“语料污染”,让AI“说谎”,如DeepSeek爆火后,造谣者通过批量发布虚假信息,污染AI大模型的训练数据,再利用AI问答截图上网传播,形成“谣言—AI回答—更多谣言”的虚假信息闭环传播。
从造谣目的来看,有的是利用谣言博取流量,有的则可能涉嫌操纵市场。无论出于何种目的,这些谣言不仅会误导投资者决策判断,扰乱资本市场秩序,引发信任危机,还可能影响企业经营,损害企业利益和声誉。比如,在上述案例中,受不实信息影响,霸王茶姬部分区域门店单日营业额同比下降超20%。
因此,多措并举加强对AI谣言的治理,对于减少市场异常波动、保护中小投资者利益、维护市场公开和公平的环境具有重要意义。
印尼通信和数字部副部长(Komdigi)Nezar Patria出席了6月12日在伦敦举行的2025年AI峰会。在活动中,Nezar专注于两个领域的人工智能(AI)革命。
Nazar参加了与新闻界的人工智能革命有关的深入讨论。随着技术的快速发展,媒体格局中需要面对许多挑战。人工智能非但不被用作威胁,也不重要。
Nezar与其他参与者一起探索了人工智能的潜力如何保持新闻界的完整性,优先考虑准确性,并保持基于人工智能的内容的道德。
在会议期间,Nezar试图了解使用AI的风险,例如错误信息,虚假信息或其他问题的出现。讨论的结果将有助于Komdigi在社论室中保持AI的潜力。
Nazar还参加了名为Space Meets AI的讨论环节。在讨论中,太空领域的专家讨论了人工智能基础设施在探索宇宙中的采用或利用。
23、110页诉状直指AI侵权:迪士尼与环球影业联手状告Midjourney,旨在建立AI许可机制
近日,全球娱乐产业巨头迪士尼和环球影业对人工智能公司Midjourney提起版权诉讼,这标志着好莱坞大型公司首次正式卷入生成式人工智能的法律纠纷,引发全球关注。
两家公司在长达110页的诉状中指出,Midjourney涉嫌非法利用其庞大的版权库,生成并传播了大量未经授权的知名角色副本,包括《星球大战》中的角色、《小黄人》、《怪物史莱克》、《冰雪奇缘》中的雪宝以及《狮子王》中的角色等。诉状中详细提供了Midjourney生成图像与原版影视素材的对照示例,强调即便用户输入“超级英雄战斗场景”等模糊提示,也能生成与蜘蛛侠、功夫熊猫等经典角色极其相似的图像。
迪士尼和环球影业方面强调,Midjourney的行为并非“合理使用”法律豁免,而是通过大规模抓取网络公开素材进行训练。更严重的是,Midjourney持续忽视此前提出的“停止侵权”要求,并未采取任何技术措施加以遏制。
近日,上海财经大学在沪举办了“匡时财经教育大模型” 发布会暨数智新财经论坛,正式推出了这一创新型智能教育平台。该大模型旨在精准满足财经教育的多样化需求,标志着学校在将财经教育与人工智能 (AI) 深度融合方面迈出了重要一步。
上海财经大学统计与数据科学学院的张立文教授介绍,这一大模型充分依托学校丰富的财经学科背景与先进的技术探索,力求构建一个服务于各类财经教育场景的智能化平台。通过整合经典教材、专业书籍、学术论文及企业级金融数据,该项目建立了一个涵盖经济、金融、会计、统计等多个核心学科的高质量、多模态语料库,并且形成了标准化的财经知识图谱。
中国科学院自动化研究所的科研人员近期取得了重要突破。他们首次证实,多模态大语言模型在训练过程中能够自发“理解” 事物,其理解方式与人类的认知非常相似。这一发现不仅为我们探索人工智能的思维机制开辟了新路径,还为未来开发能够像人类一样理解世界的人工智能系统奠定了基础。这项研究成果已在《自然・机器智能》杂志上发表。
在这项研究中,科研团队借鉴人类大脑的认知原理,设计了一个有趣的实验:让大模型与人类一起玩 “找不同” 游戏。他们从1854种常见物品中挑选出三个物品的概念,要求参与者找出最不搭的一个。通过分析470万次的判断数据,科研人员首次绘制出大模型的 “思维导图”,即 “概念地图”。
研究显示,科学家总结了66个代表人工智能 “理解” 事物的关键视角,这些视角不仅易于解释,且与人脑中负责物体加工的神经活动模式高度一致。更重要的是,能同时处理文字和图片的多模态模型在 “思考” 和选择方面与人类的方式更为接近。
26、美众院问题特设委员会两党成员推出法案,旨在保护美国人工智能不受外国威胁
美国众议院美国与中国战略竞争特设委员会两党成员推出一项法案,旨在保护美国人工智能不受外国威胁。
包括众议院中国问题特设委员会主席、密歇根州共和党联邦众议员约翰·穆勒纳尔(John Moolenaar)、该特设委员会资深成员、伊利诺伊州联邦众议员拉贾·克斯希纳莫蒂(Raja Krishnamoorthi)和伊利诺伊州共和党联邦众议员达林·拉胡德(Darin LaHood)在内的一组两党议员6月12日联袂提出了《先进人工智能安全准备法案》(Advanced AI Security Readiness Act)。众议院情报特设委员会国家安全局与网络小组委员会资深成员、新泽西州联邦众议员乔什·戈特海默(Josh Gottheimer)陪同他们推出这项法案。
众议院中国问题特设委员会的声明表示,《先进人工智能安全准备法案》将对国家安全产生范围广泛的影响,包括:
• 通过预防和减缓间谍活动和知识产权盗窃,巩固美国在人工智能领域的领导地位。
特设委员会主席穆勒纳尔在声明中说:“简而言之:美国必须赢得人工智能竞赛。人工智能是一项对美国经济和国家安全至关重要的战略资产,--这不仅仅只是又一个技术潮流,它有着巨大力量,我们也应当这样对待它。”