# 人工智能
78 条原始信息大语言模型架构演进与推理能力跃升。当前研究高度聚焦于开放权重模型(Open-Weight LLMs)的底层突破,重点探讨了从传统注意力机制向稀疏注意力及混合架构的演化路径,并对DeepSeek V3/V3.2和Qwen3等领先模型的架构设计进行了深度剖析。在能力演进方面,推理模型(Reasoning Models)成为新阶段的核心,业界正加速探索推理时间扩展(Inference-Time Scaling)技术以及强化学习(如GRPO、RLVR)在提升大模型推理逻辑中的关键作用。此外,面向底层构建与评测,从零实现KV Cache等关键组件的教程,以及涵盖基准测试、验证器、排行榜和LLM裁判(LLM Judges)的4种核心LLM评估方法被系统性梳理。
AI Agent生态爆发与深度工作流优化。开发者正致力于解决智能体协作与多线程任务分配的痛点,特别针对Claude Code和Codex推出了精简分流、优先并行的工作流优化方案(如Agent.md V3)。围绕Claude生态的工具迅速繁荣,涌现出集成上百种插件技能的claude-skills以及提供丰富复制粘贴模板的claude-howto指南。同时,Agent技术正全面深入垂直领域,代表性开源项目包括自动化科学发现的AI-Scientist-v2、构建AI对冲基金团队的ai-hedge-fund、跨平台综合信息提炼的last30days-skill,以及主打可视可信框架的agentscope和面向金融分析的数据平台OpenBB。
API环境紧缩、公益站困境与开源多模态基础设施替代。受官方大规模封号行动的强烈冲击,底层接口调用环境急剧恶化,导致大量提供免费共享服务的公益API站因号池枯竭而集中“陨落”,目前仅有少数站点(如NihaoAPI、b022hub)在艰难扩容维持,折射出当前API生态的高危现状。在闭源接口受限的背景下,开发者加速转向开源基础设施与多模态项目寻找替代方案。支持单图实时视频换脸的Deep-Live-Cam、开源前沿语音AI项目VibeVoice、全面兼容多种LLM的开源聊天平台onyx,以及专注结构化知识存储与语义检索的图原生上下文开发平台trustgraph等项目,成为当前弥补生态缺失的重要基石。