PyTorch中,你可以使用torchvision.transforms
模块中的预定义函数来对图像进行增强。以下是一些常用的图像增强参数及其设置方法:
-
RandomHorizontalFlip
:随机水平翻转图像。transform = transforms.Compose([ transforms.RandomHorizontalFlip() ])
-
RandomRotation
:随机旋转图像。transform = transforms.Compose([ transforms.RandomRotation(degrees=10) # degrees表示旋转的角度范围 ])
-
ColorJitter
:随机调整图像的亮度、对比度、饱和度和色调。transform = transforms.Compose([ transforms.ColorJitter(brightness=0.2, contrast=0.2, saturation=0.2, hue=0.1) ])
-
RandomResizedCrop
:随机裁剪图像并调整大小。transform = transforms.Compose([ transforms.RandomResizedCrop(size=(224, 224)) # size表示目标图像的大小 ])
-
ToTensor
:将图像转换为PyTorch张量。transform = transforms.Compose([ transforms.ToTensor() ])
-
Normalize
:对图像进行归一化处理。transform = transforms.Compose([ transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]) ])
你可以根据需要组合这些增强参数,例如:
transform = transforms.Compose([ transforms.RandomHorizontalFlip(), transforms.RandomRotation(degrees=10), transforms.ColorJitter(brightness=0.2, contrast=0.2, saturation=0.2, hue=0.1), transforms.RandomResizedCrop(size=(224, 224)), transforms.ToTensor(), transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]) ])
请注意,这些参数的默认值可能不适用于所有情况。你可以根据需要调整它们的值以获得最佳性能。