📝 技术博客
记录技术学习的点点滴滴,分享开发经验与思考
Mermaid 图表测试:各种图表类型展示
测试博客系统的 Mermaid 图表渲染功能,包含流程图、时序图、类图、甘特图等多种图表类型的示例。
React 18 新特性深度解析:并发渲染与自动批处理
深入探讨 React 18 带来的革命性变化,包括并发渲染、自动批处理、Suspense 改进等核心特性,以及这些特性如何提升应用性能和用户体验。
Spring Boot 3.x 微服务架构最佳实践
基于 Spring Boot 3.x 构建企业级微服务架构的完整指南,涵盖服务发现、配置管理、链路追踪、容错处理等核心话题。
Vue 3 Composition API 进阶技巧与最佳实践
Composition API 是 Vue 3 的核心特性之一,本文分享在实际项目中使用 Composition API 的进阶技巧和最佳实践经验。
MySQL 8.0 性能优化实战:索引设计与查询调优
数据库性能直接影响应用体验,本文深入分析 MySQL 8.0 的性能优化策略,包括索引设计原则、查询优化技巧和监控方法。
Docker 容器化部署完全指南:从开发到生产
容器化已成为现代应用部署的标准实践,本文详细介绍如何使用 Docker 构建、部署和管理应用容器,从开发环境到生产环境的完整流程。
Redis 缓存策略与分布式锁实现
Redis 在现代应用架构中扮演重要角色,本文详细讲解 Redis 的缓存策略选择、分布式锁实现方案以及常见的性能优化技巧。
AI 大模型集成实战:从 API 调用到智能应用开发
随着 AI 技术的快速发展,如何将大模型集成到实际应用中成为热门话题。本文分享大模型 API 集成的实践经验和应用开发技巧。
Next.js 14 App Router 深度解析与实践应用
Next.js 14 的 App Router 带来了全新的路由体验,本文深入分析其工作原理、最佳实践以及在实际项目中的应用场景。
从RAG到Advanced RAG:基于Spring AI与LangChain4j构建高级检索增强系统
记录“法律智能助手”项目如何从一个基础RAG框架,逐步升级为具备查询理解、智能路由和多源检索能力的Advanced RAG系统。
盘活数据库连接:Spring Boot AI应用中SSE流式响应的性能优化实战
复盘项目中因SSE流式响应导致的数据库连接池泄漏问题,分享如何通过优化JWT验证逻辑,根治连接泄漏并显著提升API响应速度。
告别PDF中文乱码:iText与Spring Boot的终极解决方案
结合项目实战经验,提供一个详尽、可复现的解决方案,通过多层回退的字体加载策略,彻底解决Java iText库生成PDF时的中文乱码和不显示问题。
现代Spring Boot应用安全基石:从零实现JWT认证
详细介绍如何在Spring Boot 3项目中整合Spring Security 6,从零开始构建一套完整、安全、生产级的JWT认证系统。
AI项目踩坑实录:当两个向量表在同一个数据库中“狭路相逢”
分享在AI项目中由于并用Spring AI和LangChain4j两个框架,导致出现两个向量表并引发数据关联问题的真实案例及解决方案。
让AI拥有“记忆”:为你的Spring Boot聊天应用构建健壮的历史记录功能
从数据库设计、后端API开发到前端状态管理,全过程分享如何为AI聊天应用设计并实现一套完整、可扩展的聊天历史功能。
AI沟通的艺术:如何通过提示词工程驯服你的大语言模型
分享在“法律智能助手”项目中,通过迭代式重构,运用五步法(赋予角色、明确指令、定义结构、提供示例、增加约束)优化合同审查任务提示词的实践经验。
LoRA/PEFT 低成本高效率微调实战:从原理到生产部署
系统讲解 LoRA/PEFT 的工作原理、适用场景与局限,给出基于 Hugging Face 的端到端微调、推理与部署实践,覆盖监督微调、QLoRA、全量/部分参数冻结策略与评测指标设计。
Hugging Face 工具链高频操作指南:Datasets/Transformers/PEFT/Accelerate/TRL 一网打尽
面向工程实践的 Hugging Face 工具链用法清单,覆盖模型加载、分布式训练、数据集处理、评测、推理加速与仓库管理,提供可复制的最佳实践脚手架。
开源模型选型与对比:BERT、Qwen、DeepSeek 的能力边界与应用落地
从任务类型、推理能力、中文表现、部署成本与生态工具五个维度,对 BERT、Qwen、DeepSeek 进行横评,给出不同业务场景的选型建议与落地清单。
Agent Skills:构建智能AI代理的核心能力体系
系统性地探讨Agent Skills的设计哲学、实现模式和最佳实践。从单一职责原则到Function Calling、ReAct、MCP等实现模式,深入讲解如何构建生产级的Agent技能体系。
Claude Code完全使用教程:让AI成为你的编程伙伴
从零开始系统性介绍如何高效使用Claude Code,包括在Cursor中的配置、智能代码生成、代码重构、Bug修复、测试生成等核心功能,以及高级技巧和实战案例。
OpenCode使用教程:开源AI编程助手的完整指南
全面介绍OpenCode这款开源AI编程助手的安装、配置、使用技巧和高级定制方法。支持多种模型(OpenAI、Claude、本地LLM),完全开源,隐私优先,可离线使用。
AI Agent 内存体系设计:从短期记忆到长期知识的完整架构
深入探讨 AI Agent 内存体系的设计原理、实现模式和最佳实践,涵盖从对话级别的短期记忆到跨会话的长期知识存储的完整技术栈。
AI Agent 安全最佳实践:构建可靠的智能体系统
AI Agent 正在从实验性工具走向生产应用,深入探讨 AI Agent 安全的核心威胁模型、OWASP 安全指南,以及构建安全 Agent 系统的最佳实践。
AI 应用 CI/CD 流水线最佳实践
将 AI/LLM 应用纳入现代软件工程流程是确保产品质量和开发效率的关键。详细介绍如何构建完整的 AI 应用 CI/CD 流水线,包括 RAG 管道测试、LLM 集成测试、提示词部署工作流、模型版本管理以及生产环境监控。
AI 代码审查工具生态全景:智能化代码质量保障
AI 代码审查工具正在革新代码审查流程,通过自动化分析、上下文理解和智能建议,让代码审查更高效、更全面。全面介绍当前主流的 AI 代码审查工具,包括它们的功能特点、集成方式和最佳实践。
AutoGPT 演进分析:从开源实验到 AI Agent 范式
AutoGPT 的出现标志着 AI Agent 研究的一个重要里程碑。深入分析 AutoGPT 的技术演进历程、核心架构变化、关键创新点,以及它对整个 AI Agent 生态系统的影响。
中国大语言模型生态全景:主流模型对比与选型指南
中国大语言模型产业在近年来经历了爆发式增长,从阿里巴巴的通义千问到百度的文心一言,从智谱 GLM 到 DeepSeek。全面梳理中国主流大语言模型的产品线、技术特点、定价策略和适用场景。
Function Calling 进化论:从工具调用到智能代理的完整演进
Function Calling(函数调用/工具使用)是现代 AI Agent 的核心能力之一。深入解析 function calling 的技术演进、主流框架的实现差异,以及如何构建生产级的工具调用系统。
GraphRAG 全解析:从局部到全局的知识推理革命
微软研究院发布的 GraphRAG 通过构建知识图谱,将分散的文档连接成有结构的信息网络,实现了从"局部检索"到"全局理解"的质的飞跃。深入剖析GraphRAG的架构设计、核心算法、最佳实践。
Kubernetes AI 工作负载调度:大规模模型服务架构实践
深入探讨 Kubernetes 上的 AI 工作负载调度策略,包括 GPU 资源管理、模型服务部署、批处理任务调度以及成本优化等核心主题。
LLM 微调成本分析:全参数微调、LoRA 与 QLoRA 对比指南
从 GPU 内存需求、训练时间、云服务成本、性能对比等多个维度,深入分析全参数微调、LoRA 和 QLoRA 三种主流方法的成本效益,帮助你在不同场景下做出最优选择。
AI Token 优化实战:成本控制与性能提升的完整指南
从 Token 计数与定价模型、上下文压缩技术、缓存策略、Prompt 优化、请求批处理等多个维度,系统性地讲解如何将 AI 应用的成本降低 70-90%,同时保持甚至提升响应质量。
MCP 深度实战:AI Agent 工具交互的标准化革命
Anthropic 推出的 Model Context Protocol (MCP) 是一个开放标准,旨在统一 AI 应用与外部工具、数据源的交互方式。从协议设计、SDK 使用、生产部署等多个维度,深入解析 MCP 的核心技术。
多模态 RAG 技术全景:从文本到图像的检索增强生成
多模态 RAG 通过融合不同模态的检索和理解能力,为 AI 系统提供了更全面的知识访问能力。深入探讨多模态 RAG 的技术架构、核心算法、实现方案和最佳实践。
提示词 A/B 测试方法论:系统化优化 LLM 应用质量
系统化的 A/B 测试方法可以将提示词优化从艺术转变为科学,通过数据驱动的方式持续提升应用质量。详细介绍提示词测试框架、实验设计方法、评估指标体系、统计显著性检验,以及生产环境监控的最佳实践。
RAGAS 深度实践:构建企业级 RAG 评估体系
RAGAS 是当前最流行、最专业的 RAG 评估框架,它提供了一系列标准化指标,帮助开发者从忠实度、答案相关性、上下文精度、上下文召回率等多个维度评估 RAG 系统。
向量数据库深度对比:生产环境选型指南(2025)
从架构特性、性能基准、成本分析、混合搜索能力等维度,对主流向量数据库进行深度对比,并提供基于不同场景的选型建议。