Unidad de Análisis Estadístico


 

El Metodo Estadístico

 

'Un genio es alguien que descubre identidades entre hechos contradictorios.'

Ernesto Sábato

 

El método científico se basa en dos tipos de razonamientos: el inductivo y el deductivo.

El método deductivo procede de lo general a lo particular. El método inductivo procede justo a la inversa, observando unos pocos elementos, se infieren propiedades que luego se extrapolan al resto de los elementos.

En ciencias matemáticas, mediante el método inductivo, el investigador observa propiedades, que luego con la ayuda de razonamientos lógicos basados en el conjunto de axiomas colocados al principio de la teoría, extiende a todos los elementos. Por ejemplo en el Teorema de Pitágoras, observando la relación entre la suma de los cuadrados de los catetos y el cuadrado de la hipotenusa en un pequeño número de triángulos rectángulos observa que:

a2 = b2 + c2

Posteriormente y con la ayuda de los postulados de Euclides y el teorema de Tales, extiende esta propiedad a todos los triángulos rectángulos.

Pero en las ciencias experimentales, donde no hay ese conjunto de axiomas, no cabe más que obtener nuevas observaciones para contrastar dichas propiedades, es el llamado método estadístico.

Breve esquema del método estadístico.

 

 

Problema real.

Una investigación empírica suele iniciarse con un interrogante del tipo:

¿Cuál es la relación entre? o ¿Qué diferencias existen entre?

En esta etapa hay que definir el problema en términos precisos indicando:

  • El ámbito de la investigación, es decir, la población.

  • Las variables que hay que observar y medir.

Esta fase es fundamental ya que las conclusiones sólo pueden aplicarse a los miembros de la población definida y la validez de las conclusiones depende en general de las variables observadas.

 

Construcción de un modelo estadístico.

Los modelos estadísticos pueden clasificarse en función de la información que utilizan y del objetivo que pretenden.

Cuando sólo se estudia un fenómeno en un instante en el tiempo, se dicen que los modelos son estáticos o transversales.

Cuando estudiamos la evolución de un fenómeno a lo largo del tiempo se dicen dinámicos o longitudinales.

Si sólo se dispone de la información de una variable se llaman modelos extrapolativos.

En general, los modelos estadísticos usan una descomposición de los valores de una o varias variables respuesta o dependientes en una parte sistemática o predecible y otra parte aleatoria o no predecible:

R(t)= X(t) + U(t)

Donde R(t) es la respuesta observada, X(t) es la parte predecible y U(t) es la parte aleatoria y no predecible.

Por tanto un modelo estadístico va a englobar en la parte predecible o determinista el efecto de la variable o variables explicativas y en la parte aleatoria el efecto de los factores no controlados.

 

Recogida de información muestral.

Una vez construido el modelo, tendremos que medir los valores de las variables de interés.

Esta recogida de información se puede hacer en general de dos formas:

  • Por muestreo probabilístico.

  • Con un diseño de experimentos.

El muestreo probabilístico se emplea en modelos extrapolativos (univariantes)

El diseño de experimentos consiste en fijar los valores de ciertas variables y observar la respuesta de otras.

Más adelante y con esta información daremos una medida de probabilidad de como esta información confirma o no la hipótesis inicial.

 

Depuración de la muestra.

En la práctica es inevitable que entre el 2% y el 5% de las observaciones contengan errores de medición, por lo tanto antes de iniciar la siguiente fase (estimación de parámetros) conviene utilizar técnicas de análisis de datos para identificar valores anómalos, errores de medición ... etc y depurarlos.

 

Estimación de parámetros.

Los modelos estadísticos en general dependen de ciertas constantes desconocidas denominadas parámetros.

La fase de estimación, consiste en utilizar la muestra para decidir que valores vamos a asignar a los parámetros desconocidos, así como cuantificar el error cometido en su estimación.

Los métodos de estimación son muy variados y normalmente se ven involucradas técnicas de maximización y minimización, las técnicas más habituales son:

  • Método de los momentos.

  • Método de máxima verosimilitud.

  • Método de los mínimos cuadrados.

  • Método Montecarlo.

  • Polinomios de Lagrange.

  • Mínimos cuadrados ponderados.

 

Contrastes de simplificación.

En esta fase estudiaremos si el modelo puede simplificarse, por ejemplo ¿el valor de un determinado parámetro puede ser cero?

Se utilizan las técnicas de contraste de hipótesis para determinar el número de parámetros estadísticamente significativos que va a contener nuestro modelo.

 

Crítica y diagnosis del modelo.

Hasta esta etapa los resultados se han obtenido suponiendo que el modelo es el correcto . En esta etapa se investiga la concordancia entre las observaciones y los valores predichos por el modelo, asignando una medida de probabilidad a dicha concordancia.

De especial interés es comprobar que la parte aleatoria es realmente aleatoria.

 

Subir