Estoy haciendo un proyecto de visión por computadora y necesito aplicar el aumento de datos. Tengo 3 clases: dos clases con 500 imágenes y una clase con 1000 imágenes. Voy a generar múltiples versiones de las imágenes con aumento de datos, ¿debo aplicar, por ejemplo, 3 transformaciones aleatorias en las dos primeras clases para tener un total de 2000 imágenes y aplicar solo una transformación en la clase final para tener 2000 clases en total? Finalmente, si el aumento de datos se aplica a todo el conjunto de datos, sepárelo en tren y pruébelo o sepárelo y luego aplique el aumento en el conjunto de datos del tren. Gracias

-1
SSSSSSSSS 23 mar. 2021 a las 19:50

1 respuesta

La mejor respuesta

El aumento de datos se aplica solo al conjunto de entrenamiento. No toque el equipo de prueba.

Aplicar el aumento de forma aleatoria en el entrenamiento. Entonces, una imagen en particular puede o no ser aumentada en una época en particular.

No es necesario tratar las clases por separado para tratar el desequilibrio de clases. El desequilibrio de clases se maneja con funciones de pérdida apropiadas como cross-entropy < / a> o función de pérdida focal en retinanet.

0
Abhi25t 23 mar. 2021 a las 17:06