Eginsoft

Conocimiento basado en la gestión de bases de datos

Que es codificar, estandarizar y normalizar

CODIFICAR básicamente significa asignar un código a un literal. Esto, resulta absolutamente necesario si queremos extraer alguna conclusión estadística y el dato recogido se ha introducido sin seguir norma alguna. Imaginemos que hemos hecho una encuesta y hemos recogido el género del entrevistado anotando “MUJER”·o “HOMBRE” según procediera. Este ejemplo tan burdo, nos permite ilustrar lo que significa codificar. En este caso, imaginemos también que hemos recogido 500 cuestionarios. Cuando finalizamos la grabación de estos datos –sin considerar el esfuerzo extra que estamos haciendo en grabación al grabar el literal cada vez y no un código-, entonces, obtenemos la siguiente frecuencia del contenido del campo:

LITERAL FRECUENCIA
HOMBRE 42%
HMBRE 0,3%
H 2,7%
MUJER 47%
MJER 0,5%
M 7,5%

En realidad, el porcentaje de mujeres es de un 55% frente al 45% de hombres, pero si no codificamos tendremos que hacer lo que acabamos de hacer mentalmente, codificar de forma que podamos cuantificar.

En el siguiente ejemplo podemos ver una muestra de esta codificación:

Nombre Variable P1
Texto Extra Género.
Tipo de Variable Categoría Es necesario definir el tipo de variable, para que el sistema pueda guardar la información de forma correcta, además de para poder realizar de una manera efectiva los controles lógicos y de Filtro
Valores Válidos 1-2 Serían los valores numéricos válidos para la grabación de esta variable
Definición de códigos
1 Hombre Asignamos el valor 1, para los hombres
2 Mujer Asignamos el valor 2, para las mujeres

 

Siempre que tengamos que realizar cualquier proyecto, es necesaria la codificación de estos campos para poder dejar correctamente realizada tanto la máscara de grabación, como la estructura necesaria en la BBDD dedicada al proyecto en curso.

Cuando la codificación no es posible a priori (el caso de género es bien sencillo, pero imaginaros que estamos recogiendo los nombres de medicamentos que usa habitualmente la población. En este caso, podríamos precodificar varios, los mas frecuentes y dejar una opción “Otros” donde especifiquemos el medicamento citado para una posterior codificación.

ESTANDARIZAR: Para cualquier codificación o normalización puede ser que necesitemos separar los campos, por ejemplo, si hemos grabado el nombre y los apellidos de una persona en un campo llamado “Nombre Completo”, deberemos separar estos campos previamente, en 3 campos; “Nombre”, “Apellido1”·y “Apellido2”, de forma que podamos tratar cada dato por separado.

Pero también, estandarizar significa escribir de la misma forma literales que significan lo mismo pero que han sido escrito de diferente forma. Por ejemplo: Con dos literales, uno “ASPIRINA” y otro “ASPRINA”·como respuesta a fármacos utilizados en un estudio farmacológico, sería conveniente escribir ambos como “ASPIRINA” si nuestro objetivo es el de cuantificar – por ejemplo, extraer el número de menciones de dicha respuesta.

En definitiva, estandarizar supone aplicar una estructura aplicando unas reglas definidas previamente.

La NORMALIZACIÓN, consiste en la asignación de códigos y formas de escritura administrativamente aceptados. Esto sucede sobre todo con los municipios y las vías. En cualquier caso, hay que subrayar que estos dos términos, estandarización y normalización, son a menudo utilizados indistintamente para lo mismo “¿Qué diferencia hay entre codificar, estandarizar y normalizar?”

DATABASE MARKETING: ESTANDARIZAR Y NORMALIZAR

La estandarización y normalización normalmente se utiliza en procesos de Database Marketing.

Pongamos un ejemplo:

Codificación y normalización

Para comprender mejor las diferencias se recomienda acceder al artículo ,“¿Qué diferencia hay entre codificar, estandarizar y normalizar?”

 

, , , , , ,

Comments are currently closed.