pytorch人工智能技术（干货YOLOv5的PyTorch实现多视图3D人体数据集等AI开源项目）

威哥 2023-06-20 09:06:52 64

pytorch人工智能技术（干货YOLOv5的PyTorch实现多视图3D人体数据集等AI开源项目）性能：使用 1 GPU在COCO数据集上训练 (如果你使用2 GPUs 设置 --nproc_per_node=2)环境要求：数据集：模型训练：

文末彩蛋：七月在线干货组最新升级的《2021大厂最新AI面试题 [含答案和解析更新到前121题]》免费送！

项目一：YOLOv5-PyTorchYOLOv5的PyTorch实现

项目地址：

https://github.com/Okery/YOLOv5-PyTorc

pytorch人工智能技术（干货YOLOv5的PyTorch实现多视图3D人体数据集等AI开源项目）(1)

YOLOv5的PyTorch实现。该存储库具有两个功能：

纯python代码，无需构建即可立即使用PyTorch 1.4运行
简化构造并易于理解模型的工作原理

环境要求：

Windows或Linux，Python≥3.6
PyTorch≥1.4.0
matplotlib-可视化图像和结果
pycocotools-用于COCO数据集和评估；Windows版本在这里
nvidia dali（仅Linux）-更快的数据加载器

数据集：

该存储库支持VOC和COCO数据集。
如果要训练自己的数据集，则可以：

编写相应的数据集代码
将您的数据集转换为COCO样式

PASCAL VOC 2012（下载）：http://host.robots.ox.ac.uk/pascal/VOC/voc2012/
MS COCO 2017：http://cocodataset.org/

模型训练：

使用 1 GPU在COCO数据集上训练 (如果你使用2 GPUs 设置 --nproc_per_node=2)

性能：

在单个RTX 2080Ti GPU上测试COCO 2017

pytorch人工智能技术（干货YOLOv5的PyTorch实现多视图3D人体数据集等AI开源项目）(2)

项目二：weibo-public-opinion-datasets持续维护的微博舆情数据集

项目地址：

https://github.com/nghuyong/weibo-public-opinion-datasets

新浪微博是中国最大的公共社交媒体平台。最新和最受欢迎的社交活动将尽快在微博上公开和讨论。因此，建立一个实时，全面的微博舆情数据集具有重要意义。

目前，在给定指定关键词和指定期限的情况下，微博推文数据集的构建方法有两种：（1）应用微博提供的高级搜索API；（2）遍历所有微博用户，收集指定时间段的所有推文，然后使用指定的关键字过滤推文。

但是，对于第一种方法，由于微博搜索API的限制，一次搜索的结果最多包含1000条推文，这使得构建大型数据集变得困难。至于第二种方法，尽管我们可以构建几乎没有遗漏的大规模数据集，但是遍历数十亿微博用户需要非常长的时间和大量的带宽资源。另外，大量的微博用户是不活跃的，遍历他们的主页是没有意义的，因为他们在指定的时期内可能不会发布任何推文。

为了缓解这些局限性，我们提出了一种新的方法来构建微博推文数据集，该方法可以构建具有高构建效率的大规模数据集。具体来说，我们首先建立并动态维护一个高保密性的微博活跃用户池（仅占所有用户的一小部分），然后我们仅遍历这些用户并在指定时期内使用指定的关键字收集其所有推文。

基于初始种子用户并通过社交关系不断扩展，我们首先建立了一个包括超过2.5亿用户的微博用户池。活跃的微博用户池是基于微博用户池构建的，遵循4条规则：

pytorch人工智能技术（干货YOLOv5的PyTorch实现多视图3D人体数据集等AI开源项目）(3)

项目三：occlusion_person具有详细遮挡标签的多视图3D人体姿势估计数据集

项目地址：

https://github.com/zhezh/occlusion_person

该数据集是相关的工作“AdaFuse: Adaptive Multiview Fusion for Accurate Human Pose Estimation in the Wild”，该出版物已发布在IJCV上。该论文位于（arXiv：2010.13302）。

pytorch人工智能技术（干货YOLOv5的PyTorch实现多视图3D人体数据集等AI开源项目）(4)

以前的基准测试没有为图像中的关节提供遮挡标签，这阻止了我们对遮挡的关节进行数值评估。另外，基准中的遮挡量是有限的。为了解决这些限制，我们建议构建此综合数据集Occlusion-Person。我们采用UnrealCV来渲染3D模型中的多视图图像和深度图。

特别是，将十三种不同衣服的人体模型放置在九个不同的场景中，例如客厅，卧室和办公室。人体模型由从CMU Motion Capture数据库中选择的姿势驱动。我们故意使用诸如沙发和书桌之类的物体遮挡某些身体关节。每个场景中放置了八台摄像机，以渲染多视图图像和深度图。我们提供15个关节的3D位置作为地面真实情况。

图像中每个关节的遮挡标签是通过将其深度值（可在深度图中获得）与3D关节在相机坐标系中的深度进行比较而获得的。如果两个深度值之间的差小于30cm，则不会遮挡关节。否则，它将被遮挡。下表将此数据集与现有基准进行了比较。特别是在我们的数据集中，约有20％的身体关节被遮挡。

pytorch人工智能技术（干货YOLOv5的PyTorch实现多视图3D人体数据集等AI开源项目）(5)

pytorch人工智能技术（干货YOLOv5的PyTorch实现多视图3D人体数据集等AI开源项目）(6)

完全下载所有部分后，您应该具有以下文件：

pytorch人工智能技术（干货YOLOv5的PyTorch实现多视图3D人体数据集等AI开源项目）(7)

项目四：coco-minitrainminicoco数据集

项目地址：

https://github.com/giddyyupp/coco-minitrain

COCO minitrain是针对COCO的精选小型训练集（25K图像≈train2017的20％）。这对于超参数调整和降低消融实验的成本很有用。minitrain的对象实例统计信息与train2017的那些匹配。在minitrain上训练的模型的val2017性能与在train2017上训练的同一模型的性能强烈正相关。

COCO minitrain是COCO train2017数据集的子集，包含25K图像（约占train2017集的20％）和跨80个对象类别的约184K注释。我们从全套样本中随机采样了这些图像，同时尽可能保留了以下三个数量：

每个类中对象实例的比例，
小型，中型和大型物体的整体比例，
小型，中型和大型物体的每类比率。

对象检测器性能。在minitrain上训练模型并在val2017上进行评估：

pytorch人工智能技术（干货YOLOv5的PyTorch实现多视图3D人体数据集等AI开源项目）(8)

在Minitrain vs Train2017上训练的对象检测器性能。模型在val2017上进行评估：

pytorch人工智能技术（干货YOLOv5的PyTorch实现多视图3D人体数据集等AI开源项目）(9)

下图比较了train2017和minitrain上的物体检测结果。该图还显示了train2017和minitrain结果之间的正相关。对于COCO评估指标AP和AP50，皮尔逊相关系数分别为0.74和0.92。此图基于上表。 BaseModel与具有ResNet-101主干的HoughNet模型相对应。

pytorch人工智能技术（干货YOLOv5的PyTorch实现多视图3D人体数据集等AI开源项目）(10)