Tips & Tools:
- 在线查看图片: https://gifgit.com
- 标注数据集: www.makesense.ai 或者 cvat.org
开源数据集
VOC 2007 & 2012
官网: https://host.robots.ox.ac.uk/pascal/VOC/
PyTorch
中:torchvision.datasets.VOCSegmentation()
图片和标注信息:.xml
文件
COCO 2014 & 2017
官网: https://cocodataset.org
图片和标注信息:.json
文件
PyTorch加载数据集
import torchvision
from PIL import ImageDraw
coco_dataset = torchvision.datasets.CocoDetection(root=r"xxx", annFile="xxx.json") # 采用COCO格式
img, info = coco_dataset[0] # 取第一张图片
img_handler = ImageDraw.ImageDraw(img)
for annotation in info:
x_min, y_min, width, height = annotation['bbox']
img_handler.rectangle((x_min, y_min), (x_min + width, y_min + height)) # 可视化bbox
img.show()