Hugo Zhu's Blog

如何对会议纪要 Agent 进行 Benchmark？完整指南与实践

从评估指标设计到自动化测试的全流程实战

Posted on January 7, 2026 | 7 minutes | 1307 words

在 AI Agent 应用日益普及的今天,会议纪要生成是最常见的落地场景之一。然而,如何科学地评估一个会议纪要 Agent 的性能,却是许多开发者面临的难题。本文将详细介绍如何构建一个完整的 benchmark 体系,包括评估维度设计、数据集准备、指标计算和自动化测试流程。

Agent强化学习的最佳实践：并行任务处理与性能优化

从单线程到高性能并发：构建可扩展的AI Agent系统

Posted on January 3, 2026 | 9 minutes | 1901 words

在2026年的AI应用场景中，Agent系统已经成为解决复杂任务的核心技术。无论是代码生成助手、自动化运维系统，还是智能客服机器人，如何让Agent高效地处理多个任务并从经验中学习，直接决定了系统的实用性和用户体验。本文将深入探讨Agent强化学习的工程实践，重点解决一个关键问题：如何让Agent并行处理任务以提升性能？

NotebookLM的核心能力与构建之道

深入解析Google AI笔记应用的关键技术与实现架构

Posted on January 3, 2026 | 7 minutes | 1402 words

当Google在2023年推出NotebookLM时，它重新定义了我们与知识交互的方式。这款AI驱动的笔记应用不仅仅是一个文档管理工具，更是一个能够理解、总结、对话和创作的智能助手。那么，NotebookLM究竟具备哪些关键能力？我们如何构建类似的系统？本文将深入剖析其核心技术架构。

[Read More]

AI LLM RAG NotebookLM Google NLP TTS 多模态

智谱开源Slime：企业AI应用的强化学习利器

从技术框架到商业价值，深度解析Slime如何降低企业AI落地门槛

Posted on January 3, 2026 | 4 minutes | 669 words

当企业决策者在考虑如何让AI真正产生业务价值时，一个核心挑战始终存在：如何让AI系统持续学习和优化，而不是停留在"静态模型"阶段？ 智谱AI开源的Slime框架，正是为解决这一痛点而生的强化学习后训练系统。

如果说预训练模型是AI的"基础教育"，那么强化学习就是让AI在真实业务场景中"实战成长"的关键。Slime不仅仅是又一个开源框架，它代表着企业级AI应用从"能用"到"好用"的范式转变。

[Read More]

AI 强化学习 Slime 企业AI SGLang Megatron LLM 机器学习

Claude Code自动修正生成代码的原理解析：Agent Loop最佳实践

深入理解AI代码助手如何通过反馈循环实现自我修正与持续优化

Posted on December 24, 2025 | 6 minutes | 1107 words

在AI辅助编程的时代，Claude Code等智能代码助手已经成为开发者的得力助手。但你是否好奇过：为什么Claude Code能够自动发现并修正生成代码中的错误？这背后的"Agent Loop"机制究竟是如何工作的？本文将深入剖析Claude Code的自动修正原理，并分享Agent Loop的最佳实践。

如何用 AI 将个人网站转化为专业的 Google 求职简历

利用 AI 工具打造吸引 Google 招聘人员的简历

Posted on December 23, 2025 | 12 minutes | 2424 words

在科技行业求职，特别是向 Google 这样的顶级科技公司投递简历时，如何将个人网站上丰富的项目经验、技术博客和开源贡献转化为一份专业、精准的简历是关键。传统方式需要手动整理、提炼和格式化，既费时又容易遗漏重点。本文将介绍如何利用 AI 工具，特别是大语言模型（LLM），智能地将个人网站内容转化为符合 Google 招聘标准的专业简历。

多模态AI驱动的B2B订单归一化：从非标准文档到MES系统的智能工作流

使用大模型视觉识别与代码生成能力实现订单处理自动化

Posted on December 20, 2025 | 11 minutes | 2256 words

传统制造企业在数字化转型过程中，面临着一个普遍而棘手的问题：来自不同客户的订单文档格式千差万别，有PDF、Excel、Word、扫描件、甚至手写订单。这些非标准化的订单数据需要人工录入MES（制造执行系统）才能启动生产流程，不仅效率低下，而且容易出错。

随着GPT-4V、Claude 3.5 Sonnet等多模态大模型的成熟，我们终于有了一个优雅的解决方案：结合视觉识别能力、自然语言理解和代码生成能力，构建一个智能的订单归一化工作流。在这个工作流中，AI Agent承担大部分繁重工作，人类只需在关键节点进行验证和确认，实现真正的人机协作自动化。

[Read More]

AI 多模态 LLM B2B MES 自动化 Agent 文档解析

小学标准化试卷AI批改Agent最佳工程实践

从行业数据到AI-Ready数据的转型范式

Posted on December 20, 2025 | 9 minutes | 1819 words

在教育科技领域,AI自动批改试卷已经从概念走向现实应用。本文通过一个小学标准化试卷高准确度批改的Agent实践案例,系统性地总结了如何将传统行业数据转化为AI-Ready格式的工程范式,为类似场景提供可复用的方法论。

[Read More]

AI OCR agent 教育科技计算机视觉数据工程 best-practices

构建高质量订单文档分类器：智能导流到专业Agent

从意图识别到精准路由的完整解决方案

Posted on December 20, 2025 | 9 minutes | 1761 words

在现代企业的订单处理流程中，不同类型的订单文档往往需要不同的处理逻辑和专业知识。传统的人工分类方式效率低下且容易出错，而基于规则的自动化系统又难以应对复杂多变的业务场景。本文将介绍如何利用大语言模型（LLM）构建一个高质量的订单文档分类器，实现智能路由到专业Agent的完整解决方案。

API、MCP和Skills：三个概念的本质区别

用餐厅的故事，理解AI时代的三种交互模式

Posted on December 19, 2025 | 3 minutes | 454 words

当我们谈论AI应用开发时，经常会听到API、MCP（Model Context Protocol）和Skills这三个词。它们看起来都是让程序之间"对话"的方式，但究竟有什么不同？让我用一个简单的餐厅比喻来解释。

想象你要解决"吃饭"这个问题，有三种不同的方式可以选择。每种方式代表了不同的技术范式，适用于不同的场景。

[Read More]

AI API MCP Skills Agent 技术科普