# 人工智能
81 条原始信息大语言模型架构演进与推理期优化 2025至2026年,开源权重LLM架构持续演进,代表性模型如DeepSeek V3/V3.2/R1、Qwen3与Kimi K2在技术上不断取得突破。核心架构的改进聚焦于注意力机制的变体(从MHA、GQA到MLA、稀疏注意力及线性注意力混合架构),以及用于高效部署的KV Cache技术(如开源社区推出的极速缓存层LMCache)。在提升模型推理能力方面,行业正重点探索基于强化学习的推理训练(如GRPO和RLVR算法)以及推理期扩展(Inference-Time Scaling)计算策略。同时,模型评估体系也进一步完善,涵盖多项选择基准、验证器、排行榜与LLM评委(LLM Judges)机制。
Claude Code 泄露事件与社区逆向解析热潮 近期AI圈发生重大安全风波,黑客组织APT 41宣称窃取并泄露了Claude 4.6模型权重,并向Anthropic勒索4100亿美元赎金。与此同时,Claude Code(v2.1.88)源码惨遭泄露,引发了广泛的开发者逆向工程热潮。社区不仅深入剖析了其底层逻辑,包括CLAUDE.md指令优先级、MEMORY.md的上下文注入链路,还破解并重置了隐藏的/buddy宠物系统。此事件催生了大量衍生工具,如连夜开发的反封号反追踪工具、可视化指南项目claude-howto,以及能自动将文档转化为Claude技能的Skill_Seekers。对此,Anthropic紧急采取了针对8100个仓库的DMCA下架措施并从npm撤回源码,Claude Code之父也随后作出了公开回应。
AI智能体框架扩展与多模态开源项目进展 开源生态中多智能体(Multi-Agent)协作与工作流编排框架表现活跃,微软推出了支持Python和.NET的agent-framework,社区更新了主打大模型驱动开发的ChatDev 2.0,以及强调伴随用户成长的hermes-agent。在特定领域与基础大模型方面,头部科技企业相继开源前沿成果,包括微软的前沿语音AI模型VibeVoice和谷歌的时间序列基础模型TimesFM。此外,各种旨在赋能AI系统的实用工具备受开发者关注,如桥接图像/PDF与大模型的PaddleOCR、英伟达的模型优化与压缩库Model-Optimizer、PyTorch构建块OLMo-core、AI舆情与热点监控助手TrendRadar,以及实现全自动切割、翻译与配音的视频工具VideoLingo。
AI资源公益共享生态的繁荣与波动 技术社区中维持着极为活跃的AI资源共享文化,频繁开展包含Grok Super Heavy、Gemini Ultra企业号、ChatGPT Pro直充Token、GLM Coding Plan体验卡以及大量Codex账号的抽奖与分发活动。然而,提供免费调用额度的AI公益站生态正经历显著的内卷与洗牌。一方面,包括AcMio、荷塘、星辰AI及冰の公益站在内的平台仍在持续发放邀请码供用户白嫖测试;另一方面,由于高昂的精力投入、稳定性挑战以及外部资源变动(如Sora下架引发号池断供),部分一度火热的站点(如真好记、Einzieg)被迫宣告拉闸跑路,折射出个人维护公益AI算力服务所面临的巨大可持续性压力。