Tengo un conjunto de datos, en el que estoy trabajando en la parte de Limpieza de datos, donde uno de los atributos o características tiene los valores con varias unidades. por ejemplo, algunos de los valores son los siguientes. 1 kilogramo; 6 libras; 900 gms; 32 oz; etc. Si uso el escalador estándar, entonces no será justo ya que los valores y sus unidades son diferentes, por lo que no puedo tratarlos como están. Sugiera cómo manejar dichos datos.

0
Mayank Tripathi 26 jun. 2020 a las 01:05

2 respuestas

La mejor respuesta

En primer lugar, recomendaré cambiar el valor diferente a la misma unidad. Por ejemplo, puede hacer que todo el valor en kg o lo que mejor le convenga, y luego realizar la escala estándar.

1
sharmajee499 26 jun. 2020 a las 00:10

Gracias a todos. Investigué un poco y descubrí que necesito convertir las diversas unidades en unidades estándar y que siguen las normas internacionales referidas a las Unidades SI https://www.nist.gov/pml/weights-and-measures/metric-si/si-units, y la misma sugerencia ha dado por @ sharmajee499. Seguir adelante con este enfoque ... aunque esto va a ser una gran cantidad de código manual, pero parece que no hay una forma directa corta y fácil. Por favor, publique si tiene alguna solución mejor.

0
Mayank Tripathi 26 jun. 2020 a las 04:09