Saltar la navegación

3. Procedimiento de análisis descriptivo

¿Cómo se hace?

El análisis descriptivo de datos busca examinar un conjunto de variables aleatorias para conocerlo en detalle y transformarlo en información concreta, a través de una serie de procesos y técnicas ejecutadas en pasos secuenciales. Estos pasos permiten:

  • Recopilar y extraer datos de múltiples fuentes.
  • Clasificarlos, almacenarlos y depurarlos dentro de un repositorio.
  • Medirlos y modelarlos con una serie de modelos matemáticos.
  • Evaluar, interpretar y visualizar los resultados obtenidos.

Antes de llevarlo a cabo, independientemente de la metodología elegida, es conveniente:

  • Establecer un objetivo claro y específico del análisis, es decir, cuál es la información que se pretende obtener.
  • Seleccionar los conjuntos de datos con los que trabajar, pertinentes para el análisis, tanto de fuentes de datos internas, que se suelen conocer y donde están ordenados, como externas, que no se suelen conocer y pueden incluir datos no estructurados.
  • Asegurar que los datos recopilados son relevantes para que el resultado del análisis sea efectivo. Preparar los datos suele consumir más tiempo que los demás pasos, aunque existen plataformas que agilizan este proceso.
  • Validar la calidad de los datos, tanto de los válidos como de los inválidos, los cuales habrá que corregir y normalizar si se quieren utilizar. Durante este paso, también podemos depurar los datos aplicando filtros.

Una vez cubiertos estos pasos previos, hay varias formas de hacer análisis descriptivo de datos:

  • Usando parámetros estadísticos: medidas de posición de tendencia central (media, mediana, moda), medidas de posición de tendencia no central (cuartiles), medidas de dispersión absoluta (desviación típica), rango (va del dato más grande al más pequeño y solo contempla estos dos, por lo que no filtra datos poco relevantes), medidas de dispersión relativa (coeficiente de variación), medidas de forma de la distribución de los datos (coeficiente de asimetría con respecto a la media, coeficiente de curtosis).
  • Usando gráficos que resuman los datos, mejor cuanto más visuales. Hay varios tipos de gráficos, que se usan en función del tipo de datos analizados: diagrama de barras (barras separadas), diagrama de sectores, diagrama acumulativo de frecuencias, histograma (barras adosadas), polígono acumulativo de frecuencias, diagrama de tallo y hojas (permite observar los datos y da una idea de su distribución).
  • Usando tablas, de uno u otro tipo según los datos analizados y las relaciones entre ellos.

Una vez que el análisis descriptivo se ha llevado a cabo, lo aconsejable es profundizar más y examinar otras variables que puedan tener relación con la que se estudia, mediante un análisis diagnóstico, para explicar el porqué de los resultados anteriores al mostrar patrones e identificar relaciones causa-efecto.

Creado con eXeLearning (Ventana nueva)