<?xml version="1.0" encoding="UTF-8" ?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
<channel>
  <title>AI 大模型观察</title>
  <link>https://ifnodoraemon.github.io/</link>
  <description>专注 AI 大模型技术研究与实践的技术博客</description>
  <language>zh-CN</language>
  <pubDate>Wed, 22 Apr 2026 06:27:45 GMT</pubDate>
  <atom:link href="https://ifnodoraemon.github.io/feed.xml" rel="self" type="application/rss+xml" />
  <item>
    <title>拒绝榜单刷分：如何构筑契合业务的 LLM 评估体系</title>
    <link>https://ifnodoraemon.github.io/articles/llm-evaluation-guide/</link>
    <guid>https://ifnodoraemon.github.io/articles/llm-evaluation-guide/</guid>
    <pubDate>Wed, 22 Apr 2026 00:00:00 GMT</pubDate>
    <description>不再迷恋堆砌代码，建立大模型评估思维才是核心。本文深度剖析 LLM-as-a-Judge 的底层偏差、Ragas 算分的数学机制，以及如何用概率思维重塑 CI/CD 防线。</description>
  </item>
  <item>
    <title>大模型量化实战手册：从零开始，四条路线全覆盖</title>
    <link>https://ifnodoraemon.github.io/articles/quantization-hands-on-guide/</link>
    <guid>https://ifnodoraemon.github.io/articles/quantization-hands-on-guide/</guid>
    <pubDate>Wed, 22 Apr 2026 00:00:00 GMT</pubDate>
    <description>告别理论焦虑，手把手教你量化大模型。从直接下载预量化模型，到自己用 AWQ/GPTQ/GGUF 动手压缩权重，再到 vLLM FP8 零校准生产部署和 QLoRA 微调——四条路线，每条都有可直接复制的完整代码和命令。</description>
  </item>
  <item>
    <title>AI 关键技术的历史抉择：为什么每次都选了「那一个」？</title>
    <link>https://ifnodoraemon.github.io/articles/ai-history-choices/</link>
    <guid>https://ifnodoraemon.github.io/articles/ai-history-choices/</guid>
    <pubDate>Wed, 15 Apr 2026 00:00:00 GMT</pubDate>
    <description>回顾 AI 七十年发展史上的六次关键技术岔路口，剖析每一次「历史选择」背后的算力约束、数据红利与可扩展性逻辑。</description>
  </item>
  <item>
    <title>vLLM 在线推理服务实战：从架构原理到 Token 计费，一文搞定生产部署</title>
    <link>https://ifnodoraemon.github.io/articles/vllm-serving-guide/</link>
    <guid>https://ifnodoraemon.github.io/articles/vllm-serving-guide/</guid>
    <pubDate>Tue, 14 Apr 2026 00:00:00 GMT</pubDate>
    <description>深入浅出解析 vLLM 核心架构（PagedAttention、连续批处理、APC 前缀缓存、推测解码），面向在线推理服务场景，手把手教你搭建 OpenAI 兼容 API、调优性能参数、搭建 Token 计费体系。附完整 Docker 部署方案与 Prometheus 监控配置。</description>
  </item>
  <item>
    <title>NVIDIA GPU 驱动栈全视野解析：从内核模块到容器运行时的包关系图谱</title>
    <link>https://ifnodoraemon.github.io/articles/nvidia-gpu-package-architecture/</link>
    <guid>https://ifnodoraemon.github.io/articles/nvidia-gpu-package-architecture/</guid>
    <pubDate>Sun, 05 Apr 2026 00:00:00 GMT</pubDate>
    <description>深度拆解 Linux 下 NVIDIA GPU 烦杂的驱动包结构。本文为您详解 nvidia-dkms、libnvidia、nvidia-utils 与 driver metapackage 之间的五层架构，并按「Docker 模型服务器」、「个人桌面」、「DGX 算力集群」等核心场景提供企业级安装最佳实践和避坑指南。</description>
  </item>
  <item>
    <title>大模型量化精度全景图：从 FP32 到 1-bit，精度损失到底有多大？</title>
    <link>https://ifnodoraemon.github.io/articles/quantization-precision-guide/</link>
    <guid>https://ifnodoraemon.github.io/articles/quantization-precision-guide/</guid>
    <pubDate>Tue, 31 Mar 2026 00:00:00 GMT</pubDate>
    <description>全面对比 FP32、BF16、FP16、FP8、INT8、INT4、NF4、FP4、1.58-bit 等所有主流量化精度格式，用真实 Benchmark 数据告诉你：每降低一级精度，模型到底会&quot;变蠢&quot;多少。含 FP8 vs INT8 深度技术对比。</description>
  </item>
  <item>
    <title>做 AI Agent 的 7 条运行时实践</title>
    <link>https://ifnodoraemon.github.io/articles/agent-runtime-practices/</link>
    <guid>https://ifnodoraemon.github.io/articles/agent-runtime-practices/</guid>
    <pubDate>Sun, 15 Mar 2026 00:00:00 GMT</pubDate>
    <description>基于一个真实数据分析智能体项目，总结 7 条可复用的 Agent Runtime 实践，包括状态暴露、工具设计、上下文治理、guardrail、delegate 和 trace 审计。</description>
  </item>
  <item>
    <title>MCP 协议深度解析：AI 的「USB-C 接口」</title>
    <link>https://ifnodoraemon.github.io/articles/mcp-guide/</link>
    <guid>https://ifnodoraemon.github.io/articles/mcp-guide/</guid>
    <pubDate>Thu, 12 Mar 2026 00:00:00 GMT</pubDate>
    <description>从架构原理到实战开发，完整解析 Model Context Protocol。含 Python SDK 实战、安全机制、生态对比。</description>
  </item>
  <item>
    <title>Skills 深度解析：给 AI 编程助手装上「专业大脑」</title>
    <link>https://ifnodoraemon.github.io/articles/skills-guide/</link>
    <guid>https://ifnodoraemon.github.io/articles/skills-guide/</guid>
    <pubDate>Thu, 12 Mar 2026 00:00:00 GMT</pubDate>
    <description>从核心原理到跨平台实战，完整解析 AI 编程助手的 Skills 系统。涵盖 SKILL.md 机制、六大平台对比、实战编写指南与最佳实践。</description>
  </item>
  <item>
    <title>大模型提示工程实践指南</title>
    <link>https://ifnodoraemon.github.io/articles/prompt-engineering-guide/</link>
    <guid>https://ifnodoraemon.github.io/articles/prompt-engineering-guide/</guid>
    <pubDate>Mon, 09 Mar 2026 00:00:00 GMT</pubDate>
    <description>深入探讨如何设计高效的提示词，提升大模型的输出质量与准确性。涵盖 Few-Shot、Chain-of-Thought、ReAct 等核心技巧与实战案例。</description>
  </item>
  <item>
    <title>2026 年 AI 大模型六大趋势深度解析</title>
    <link>https://ifnodoraemon.github.io/articles/ai-trends-2026/</link>
    <guid>https://ifnodoraemon.github.io/articles/ai-trends-2026/</guid>
    <pubDate>Sat, 07 Mar 2026 00:00:00 GMT</pubDate>
    <description>从 Thinking 推理模式到 Agent 化应用，深度剖析 2026 年 AI 大模型领域最值得关注的六大发展趋势。</description>
  </item>
  <item>
    <title>从零搭建 AI Agent 应用</title>
    <link>https://ifnodoraemon.github.io/articles/build-ai-agent/</link>
    <guid>https://ifnodoraemon.github.io/articles/build-ai-agent/</guid>
    <pubDate>Thu, 05 Mar 2026 00:00:00 GMT</pubDate>
    <description>手把手教你使用 LangChain 和 Claude API 构建智能代理系统。包含完整代码与架构设计。</description>
  </item>
  <item>
    <title>RAG 检索增强生成实战</title>
    <link>https://ifnodoraemon.github.io/articles/rag-in-practice/</link>
    <guid>https://ifnodoraemon.github.io/articles/rag-in-practice/</guid>
    <pubDate>Tue, 03 Mar 2026 00:00:00 GMT</pubDate>
    <description>从向量数据库选型到 Embedding 策略，完整构建一套企业级 RAG 系统。含 Pinecone、Weaviate 对比实测。</description>
  </item>
  <item>
    <title>2026 年主流大模型横评：GPT-5.4 vs Claude Opus 4.6 vs Gemini 3.1 Pro</title>
    <link>https://ifnodoraemon.github.io/articles/model-comparison-2026/</link>
    <guid>https://ifnodoraemon.github.io/articles/model-comparison-2026/</guid>
    <pubDate>Sun, 01 Mar 2026 00:00:00 GMT</pubDate>
    <description>从推理能力、编码水平、上下文窗口到 API 定价，全方位对比 2026 年三大主流大模型的实际表现与选型策略。</description>
  </item>
  <item>
    <title>多模态大模型入门指南</title>
    <link>https://ifnodoraemon.github.io/articles/multimodal-guide/</link>
    <guid>https://ifnodoraemon.github.io/articles/multimodal-guide/</guid>
    <pubDate>Sat, 28 Feb 2026 00:00:00 GMT</pubDate>
    <description>探索 GPT-5.4、Gemini 3.1 Pro 等多模态模型的图文理解能力，附带图像分析、视频理解等实际应用案例。</description>
  </item>
  <item>
    <title>大模型微调全流程详解</title>
    <link>https://ifnodoraemon.github.io/articles/fine-tuning-guide/</link>
    <guid>https://ifnodoraemon.github.io/articles/fine-tuning-guide/</guid>
    <pubDate>Wed, 25 Feb 2026 00:00:00 GMT</pubDate>
    <description>LoRA、QLoRA、Full Fine-tuning 三种方案对比，从数据准备到模型部署的完整工作流与最佳实践。</description>
  </item>
</channel>
</rss>
