Unidad de Análisis Estadístico


 

Introducción al Muestreo

 

Conceptos fundamentales:

 

Población o Universo:

Población: Una población es un conjunto de elementos (sujetos, objetos, entidades abstractas, etc.) que poseen una o más características en común, podemos encontrar dos tipos de poblaciones dependiendo del número de elementos de que consten:

  • Poblaciones finitas: formadas por un número finito de elementos.

  • Poblaciones infinitas: formadas por un número infinito de elementos.

El hecho de que las poblaciones, por lo general, sean infinitas o estén formadas por un gran número de elementos, hace que la descripción exacta de sus propiedades sea un objetivo prácticamente inaccesible. Por esta razón, lo habitual es trabajar con “muestras”.

 

Muestra:

  • Muestra: una muestra es un subconjunto de elementos de una población.
    Para extraer conclusiones validas e imparciales referidas a todos los elementos de la población a partir de la observación de sólo unos pocos elementos, es necesario, que la muestra utilizada sea representativa de la población; esto se consigue mediante las “técnicas de muestreo”.

  • Tamaño muestral: es el número de elementos que constituyen la muestra. Los elementos que componen la muestra se seleccionarán de la población generalmente de forma aleatoria, por tanto una muestra de tamaño “n” puede interpretarse como una variable aleatoria n-dimensional cuya distribución de probabilidad dependerá de la distribución de probabilidad F(X) de la población y del tamaño muestral “n”.

 

Parámetro:

  • Parámetro: es un valor numérico que describe una característica de una población. Los parámetros son valores numéricos constantes (es decir, no son variables) , definida una población cualquiera y un parámetro en ella, ese parámetro sólo puede tomar un valor numérico concreto. Habitualmente los parámetros de interés serán la media y los porcentajes.

 

Estadístico o Estimador:

  • Estadístico: un estadístico es un valor numérico que describe una característica de una muestra. Su valor concreto depende de los valores de la muestra seleccionada en la que es calculado. Es evidente que de una población cualquiera es posible extraer más de una muestra diferente del mismo tamaño, por tanto el valor de un estadístico varía de una muestra a otra. Un estadístico no es un valor numérico constante (como lo es un parámetro), sino que es una variable: su valor concreto depende de la muestra en la que es calculado.

Algunos de los estadísticos principales son: la media muestral, la varianza muestral, el total muestral y la cuasivarianza muestral, la proporción muestral, el mayor y menor valor de la muestra.

Un estadístico que se utiliza para estimar un parámetro desconocido de la población recibe el nombre de estimador.

 

Variable aleatoria:

  • Variable aleatoria: es una variable que puede tomar un cierto número de valores, con una probabilidad asociada a cada valor. Por tanto dicha variable aleatoria seguirá una “distribución” determinada.

Una muestra proporciona una estimación de la magnitud (parámetro) a estudiar, pero si se extrae otra muestra según las mismas reglas de selección, se obtendrá sin duda otro resultado para la estimación de la magnitud (parámetro) estudiada. Por tanto “el estimador” es una “variable aleatoria”.
La distribución del estimador viene dada por el conjunto de los resultados obtenidos a partir del conjunto de las muestras posibles; el carácter aleatorio proviene de la extracción aleatoria de la muestra.

 

Muestreo:

  • Muestreo: el término muestreo se refiere al proceso seguido para seleccionar una muestra de una población.
    El muestreo puede ser de dos tipos:
  • Muestro probabilístico: puede calcularse la probabilidad asociada a cada una de las muestras que es posible extraer de una determina población, cada elemento poblacional posee una probabilidad conocida de pertenecer al la muestra. Este tipo de muestro por estar basado en la teoría de la probabilidad permite obtener una idea sobre el grado de representatividad de una muestra. Por tanto, sólo él proporciona una base adecuada para inducir las propiedades de una población a partir de una muestra. Este tipo de muestreo es el que vamos a considerar nosotros en todo momento.
  • Muestreo no probabilístico: en el cual no estamos interesados.

Existen varios métodos de muestreo que tratan de aprovechar ciertas características de la población objetivo, con el fin de conseguir una mayor precisión en sus estimaciones sin incrementar el tamaño muestral. A continuación describimos dos de los mas sencillos.

 

Muestreo Aleatorio Simple:

Del universo se extrae una muestra de tamaño “n”, dando a cada unidad la misma probabilidad de ser extraída. La muestra se puede extraer:

  • Con reposición: cuando una unidad seleccionada en una extracción se devuelve a la población y puede participar en las siguientes extracciones, pudiéndose extraer dicha unidad dos veces o más. La composición de la población siempre es la misma y el elemento puede ser seleccionado nuevamente. Al no modificarse la composición de la población el elemento puede ser elegido en cada extracción con la misma probabilidad.
  • Sin reposición: una vez extraída una unidad, no se la vuelve a tomar en cuenta para las siguientes extracciones. La población se modifica después de cada extracción y las probabilidades de elegir cada elemento no permanecen constantes.

El muestreo aleatorio simple es la base del método del muestreo.

 

Muestreo Estratificado:

La estratificación tiene como objetivo principal aumentar la precisión global de la estimación sin incrementar el tamaño muestral.

Estratificar una población consiste en dividirla, “antes” de la extracción de la muestra, en subconjuntos homogéneos (respecto de caracteres determinados a priori), llamados estratos.

Los estratos deberán ser homogéneos en sí y heterogéneos entre sí respecto de la característica en estudio. La selección de la muestra se efectúa de manera independiente en el interior de cada estrato. Esto conlleva a que la varianza en cada estrato sea pequeña. Se trata de que los estratos sean lo más homogéneos posibles dentro de cada uno de ellos, es decir, que exista en cada uno la menor variabilidad posible y de que haya grandes diferencias de unos a otros estratos.

En lugar de extraer la muestra totalmente al azar, se extrae parte de la muestra en cada estrato.

Una vez dividido la población en estratos, se deberá repartir la muestra entre dichos estratos. El reparto o afijacion de la muestra a través de los estratos dependerá de la distribución de la característica en estudio que deberá ser conocida a prior.

Existen muchas maneras de repartir la muestra, pero las más importantes son:

  • Afijación uniforme: Consiste en asignar el mismo número de unidades muestrales a cada estrato. Da la misma importancia a todos los estratos, en cuanto al tamaño de la muestra. Favorece a los estratos de menor tamaño y perjudica a los grandes, en cuanto a precisión.

  • Afijación proporcional: La muestra se distribuye proporcionalmente a los tamaños de los estratos, es la indicada cuando no tenemos información sobre la distribución de la característica en estudio.

  • Afijación de varianza mínima: El reparto de la muestra se hace de forma que para un tamaño fijo de n unidades, la varianza sea mínima. Cuanto mayor sea la variabilidad de estrato, más elementos cogeremos de tal forma que la varianza global sea mínima.

  • Afijación óptima: Consiste en minimizar la varianza para un coste fijo

 

Definiciones

Error de estimación: llamamos error de estimación a la diferencia entre el valor estimado del parámetro ( usualmente la media ) y el verdadero valor del parámetro que en general será desconocido. El error de estimación va medido en las mismas unidades que el parámetro que deseamos estimar, por ejemplo años, kilos ... etc.

Intervalo de confianza: al estimar un parámetro, es usual indicar un intervalo de valores en el que se tiene una determinada probabilidad (confianza) que contenga el verdadero valor del parámetro que se esta estimado.>

Nivel de confianza: Es el grado de confianza que tenemos de que el intervalo dado contenga el verdadero valor del intervalo.

En la ecuación mostrada a continuación, se muestra como están ligados estos tres conceptos.

 

 

 

Programas de calculo de tamaño de muestral disponibles:

Debido a las características del lenguaje de programación Java Script, se aconseja utilizarlos con la maxima cautela.

Estimación del tamaño muestral en M.A.S.
Varianza conocida
Varianza no conocida
Estimación del tamaño muestral en muestreo estratificado
Varianza conocida
Varianza no conocida

Subir