1464 words

7 minutes

YOLOv11 行人与车辆检测模型训练全记录

2026-04-20

ai

zhen

YOLOv11 行人与车辆检测模型训练全记录#

摘要：目标检测是计算机视觉的核心任务之一，在自动驾驶、智能交通等领域具有重要应用。本文以YOLOv11为基础模型，详细记录了从环境配置、数据集构建、模型训练到视频部署的完整流程。实验结果表明，在515张交通场景图片（含412张训练、103张验证）上训练80轮后，模型整体mAP50达到0.905，其中汽车检测mAP50为0.939，行人检测mAP50为0.871，推理速度达145 FPS。本文重点分析了数据规模对模型性能的决定性作用，并总结了训练过程中遇到的典型问题及解决方案。

关键词：YOLOv11；目标检测；行人检测；车辆检测；数据扩充；WSL2

1. 引言#

近年来，基于深度学习的目标检测算法发展迅速，YOLO系列凭借其端到端、实时性高的特点成为工业界和学术界的常用工具。YOLOv11在YOLOv8的基础上引入了C3K2模块、C2PSA注意力机制和SPPF多尺度融合，进一步提升了检测精度与速度。

本文旨在通过一次完整的行人与车辆检测模型训练实践，探讨小规模数据集下模型性能的瓶颈，以及数据扩充带来的显著提升。本文记录的所有实验均在个人笔记本（WSL2 + Ubuntu 24.04）上完成。

2. 实验环境与配置#

2.1 硬件与操作系统#

项目	配置
操作系统	Windows 11 + WSL2 (Ubuntu 24.04)
CPU	AMD Ryzen 9 7940HS
GPU	NVIDIA GeForce RTX 5070 Laptop (8GB)
内存	32GB DDR5

2.2 软件环境#

Python 3.11
PyTorch 2.11.0+cu128 (CUDA 12.8)
Ultralytics 8.4.33
OpenCV, Matplotlib

2.3 环境配置步骤#

类别	图片数	实例数	精确率(P)	召回率(R)	mAP50	mAP50-95
全部	103	355	0.926	0.807	0.905	0.668
汽车 (car)	70	192	0.908	0.871	0.939	0.760
行人 (person)	76	163	0.944	0.742	0.871	0.577

数据集	图片数	行人mAP50	汽车mAP50
初始数据集	141	0.330	0.657
扩充数据集	515	0.871	0.939

dxfaker's site

YOLOv11 行人与车辆检测模型训练全记录#

1. 引言#

2. 实验环境与配置#

2.1 硬件与操作系统#

2.2 软件环境#

2.3 环境配置步骤#

3. 数据集准备#

3.1 初始数据集（小规模）#

3.2 数据扩充#

4. 训练#

5. 实验结果#

5.1 验证集性能#

5.2 与初始模型的对比#

5.3 视频检测性能#

7. 结论#