miércoles, 25 de noviembre de 2009

MUESTREO

Concepto de muestreo

El muestreo es una herramienta de la investigación científica. Su función básica es determinar que parte de una realidad en estudio (población o universo) debe examinarse con la finalidad de hacer inferencias sobre dicha población. El error que se comete debido a hecho de que se obtienen conclusiones sobre cierta realidad a partir de la observación de sólo una parte de ella, se denomina error de muestreo. Obtener una muestra adecuada significa lograr una versión simplificada de la población, que reproduzca de algún modo sus rasgos básicos.

Muestra: En todas las ocasiones en que no es posible o conveniente realizar un censo, lo que hacemos es trabajar con una muestra, entendiendo por tal una parte representativa de la población. Para que una muestra sea representativa, y por lo tanto útil, debe de reflejar las similitudes y diferencias encontradas en la población, ejemplificar las características de la misma.

Cuando decimos que una muestra es representativa indicamos que reúne aproximadamente las características de la población que son importantes para la investigación.

a. Población Los estadísticos usan la palabra población para referirse no sólo a personas si no a todos los elementos que han sido escogidos para su estudio. b. Muestra Los estadísticos emplean la palabra muestra para describir una porción escogida de la población. Matemáticamente, podemos describir muestras y poblaciones al emplear mediciones como la Media, Mediana, la moda, la desviación estándar. Cuando éstos términos describen una muestra se denominan estadísticas.


Una estadística es una característica de una muestra, los estadísticos emplean letras latinas minúsculas para denotar estadísticas y muestras. 2. - Tipos de muestreo Los autores proponen diferentes criterios de clasificación de los diferentes tipos de muestreo, aunque en general pueden dividirse en dos grandes grupos: métodos de muestreo probabilísticos y métodos de muestreo no probabilísticos.

Terminología

*

Población objeto: conjunto de individuos de los que se quiere obtener una información.
*

Unidades de muestreo: número de elementos de la población, no solapados, que se van a estudiar. Todo miembro de la población pertenecerá a una y sólo una unidad de muestreo.
*

Unidades de análisis: objeto o individuo del que hay que obtener la información.
*

Marco muestral: lista de unidades o elementos de muestreo.
*

Muestra: conjunto de unidades o elementos de análisis sacados del marco.


Muestreo probabilístico

Los métodos de muestreo probabilísticos son aquellos que se basan en el principio de equiprobabilidad. Es decir, aquellos en los que todos los individuos tienen la misma probabilidad de ser elegidos para formar parte de una muestra y, consiguientemente, todas las posibles muestras de tamaño n tienen la misma probabilidad de ser elegidas. Sólo estos métodos de muestreo probabilísticos nos aseguran la representatividad de la muestra extraída y son, por tanto, los más recomendables. Dentro de los métodos de muestreo probabilísticos encontramos los siguientes tipos:

El método otorga una probabilidad conocida de integrar la muestra a cada elemento de la población, y dicha probabilidad no es nula para ningún elemento.

Los métodos de muestreo no probabilisticos no garantizan la representatividad de la muestra y por lo tanto no permiten realizar estimaciones inferenciales sobre la población.

(En algunas circunstancias los métodos estadísticos y epidemiológicos permiten resolver los problemas de representatividad aun en situaciones de muestreo no probabilistico, por ejemplo los estudios de caso-control, donde los casos no son seleccionados aleatoriamente de la población.)

Entre los métodos de muestreo probabilísticos más utilizados en investigación encontramos:


1. Muestreo aleatorio simple

2. Muestreo estratificado

3. Muestreo sistemático

4. Muestreo polietápico o por conglomerados

MUESTREO ALEATORIA SIMPLE

El procedimiento empleado es el siguiente: 1) se asigna un número a cada individuo de la población y 2) a través de algún medio mecánico (bolas dentro de una bolsa, tablas de números aleatorios, números aleatorios generados con una calculadora u ordenador, etc.) se eligen tantos sujetos como sea necesario para completar el tamaño de muestra requerido.

Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad práctica cuando la población que estamos manejando es muy grande.

MUESTREO ALEATORIO SITEMATICO

Este procedimiento exige, como el anterior, numerar todos los elementos de la población, pero en lugar de extraer n números aleatorios sólo se extrae uno. Se parte de ese número aleatorio i, que es un número elegido al azar, y los elementos que integran la muestra son los que ocupa los lugares i, i+k, i+2k, i+3k,...,i+(n-1)k, es decir se toman los individuos de k en k, siendo k el resultado de dividir el tamaño de la población entre el tamaño de la muestra: k= N/n. El número i que empleamos como punto de partida será un número al azar entre 1 y k.

El riesgo este tipo de muestreo está en los casos en que se dan periodicidades en la población ya que al elegir a los miembros de la muestra con una periodicidad constante (k) podemos introducir una homogeneidad que no se da en la población. Imaginemos que estamos seleccionando una muestra sobre listas de 10 individuos en los que los 5 primeros son varones y los 5 últimos mujeres, si empleamos un muestreo aleatorio sistemático con k=10 siempre seleccionaríamos o sólo hombres o sólo mujeres, no podría haber una representación de los dos sexos.

MUESTREO ALEATORIO ESTRATIFICADO

Trata de obviar las dificultades que presentan los anteriores ya que simplifican los procesos y suelen reducir el error muestral para un tamaño dado de la muestra. Consiste en considerar categorías típicas diferentes entre sí (estratos) que poseen gran homogeneidad respecto a alguna característica (se puede estratificar, por ejemplo, según la profesión, el municipio de residencia, el sexo, el estado civil, etc.). Lo que se pretende con este tipo de muestreo es asegurarse de que todos los estratos de interés estarán representados adecuadamente en la muestra. Cada estrato funciona independientemente, pudiendo aplicarse dentro de ellos el muestreo aleatorio simple o el estratificado para elegir los elementos concretos que formarán parte de la muestra. En ocasiones las dificultades que plantean son demasiado grandes, pues exige un conocimiento detallado de la población. (Tamaño geográfico, sexos, edades,...).

La distribución de la muestra en función de los diferentes estratos se denomina afijación, y puede ser de diferentes tipos:

Afijación Simple: A cada estrato le corresponde igual número de elementos muéstrales.

Afijación Proporcional: La distribución se hace de acuerdo con el peso (tamaño) de la población en cada estrato.

Afijación Optima: Se tiene en cuenta la previsible dispersión de los resultados, de modo que se considera la proporción y la desviación típica. Tiene poca aplicación ya que no se suele conocer la desviación.


MUESTREO ALEATORIO CONGLOMERADOS

Los métodos presentados hasta ahora están pensados para seleccionar directamente los elementos de la población, es decir, que las unidades muéstrales son los elementos de la población.

En el muestreo por conglomerados la unidad muestral es un grupo de elementos de la población que forman una unidad, a la que llamamos conglomerado. Las unidades hospitalarias, los departamentos universitarios, una caja de determinado producto, etc., son conglomerados naturales. En otras ocasiones se pueden utilizar conglomerados no naturales como, por ejemplo, las urnas electorales. Cuando los conglomerados son áreas geográficas suele hablarse de "muestreo por áreas".

El muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto numero de conglomerados (el necesario para alcanzar el tamaño muestral establecido) y en investigar después todos los elementos pertenecientes a los conglomerados elegidos.

Refuerzo:
http://docs.google.com/present/edit?id=0AcbVB_Jxr6M9ZGR4NWh0cjhfMTczaGNiNDZiaGI&hl=es

TEORIA DE LA PROBABILIAD

¿Qué es una distribución de probabilidad?

Muestra todos los resultados posibles de un experimento y la probabilidad de cada resultado.

¿Cómo generamos una distribución de probabilidad?


Supongamos que se quiere saber el numero de caras que se obtienen al lanzar cuatro veces una moneda al aire

Es obvio que, el hecho de que la modena caiga de costado se descarta.

Los posibles resultados son: cero caras, una cara, dos caras, tres caras y cuatro caras.

La distribución de probabilidades esta muy relacionado con el tipo de variables. Nosotros conocemos dos tipos de variables:


a.Variable discreta, y

b.Variable continúa.

Las principales distribuciones de variables discretas se presentaran a continuación. Una distribución de probabilidades para una variable aleatoria discreta es un listado mutuamente excluyente de todos los resultados numéricos posibles para esa variable aleatoria tal que una probabilidad específica de ocurrencia se asocia con cada resultado.

El valor esperado de una variable aleatoria discreta es un promedio ponderado de todos los posibles resultados, donde las ponderaciones son las probabilidades asociadas con cada uno de los resultados.



Donde: Xi = i-ésimo resultado de X, la variable discreta de interés.

P(Xi) = probabilidad de ocurrencia del i-ésimo resultado de X

La varianza de una variable aleatoria discreta (s 2) se define como el promedio ponderado de los cuadros de las diferencias entre cada resultado posible y su media (los pesos son las probabilidades de los resultados posibles).



Donde: Xi = i-ésimo resultado de X, la variable discreta de interés.

P(Xi) = probabilidad de ocurrencia del i-ésimo resultado de X

Las distribuciones de probabilidades discretas más importantes son:

1.Distribución Binomial, y

2.Distribución de Poisson

DISTRIBUCION BINOMIAL

La distribución binomial es una distribución de probabilidades que surge al cumplirse cinco condiciones:


1.Existe una serie de N ensayos,

2.En cada ensayo hay sólo dos posibles resultados,

3.En cada ensayo, los dos resultados posibles son mutuamente excluyentes,

4.Los resultados de cada ensayo son independientes entre si, y

5.La probabilidad de cada resultado posible en cualquier ensayo es la misma de un ensayo a otro.
Cuando se cumple estas condiciones, la distribución binomial proporciona cada resultado posible de los N ensayos y la probabilidad de obtener cada uno de estos resultados.

Para este tipo de distribución de probabilidad, la función matemática es la siguiente:



Donde: P(X) = probabilidad de X éxitos dados los parámetros n y p

n = tamaño de la muestra

p = probabilidad de éxito

1 – p = probabilidad de fracaso

X = numero de éxitos en la muestra ( X = 0, 1, 2, …….. n)

El término indica la probabilidad de obtener X éxitos de n observaciones en una secuencia específica. En término indica cuantas combinaciones de los X éxitos entre n observaciones son posibles.

Entonces dado el número de observaciones n y la probabilidad de éxito p, la probabilidad de X éxitos es:

P(X) = (numero de de secuencia posibles) x (probabilidad de un secuencia especifica)

Por eso que llegamos a la función matemática que representa esta distribución.


DISTRIBUCION DE POISSON

Se dice que existe un proceso de Poisson si podemos observar eventos discretos en un área de oportunidad – un intervalo continuo (de tiempo, longitud, superficie, etc.) – de tal manera que si se reduce lo suficiente el área de oportunidad o el intervalo,


1.La probabilidad de observar exactamente un éxito en el intervalo es constante.

2.La probabilidad de obtener más de un éxito en el intervalo es 0.

3.La probabilidad de observar un éxito en cualquier intervalo es estadísticamente independiente de la de cualquier otro intervalo.
Esta distribución se aplica en situaciones como:


•El numero de pacientes que llegan al servicio de emergencia de un hospital en un intervalo de tiempo.

•El numero de radiaciones radiactivas que se recibe en un lapso de tiempo,

•El numero de glóbulos blancos que se cuentan en una muestra dada.

•El numero de partos triples por año
Su utilidad en el área de la salud es muy amplia.

La expresión matemática para la distribución de Poisson para obtener X éxitos, dado que se esperan l éxitos es:



Donde: P(X) = probabilidad de X éxitos dado el valor de l

l = esperanza del número de éxitos.

e = constante matemática, con valor aproximado 2.711828

X = número de éxitos por unidad

La distribución de Poisson se considera una buena aproximación a la distribución binomial, en el caso que np <> 100 y p < l =" np." color="#33cc00">

Distribuciones continua (curva normal):

http://personal5.iddeo.es/ztt/Tem/t21_distribucion_normal.htm

Alguno ejemplos de distribucion binomial y de poisson:
http://www.vadenumeros.es/sociales/ejemplos-distribucion-binomial.htm

http://docs.google.com/viewer?a=v&q=cache:Xyb2BQg-AycJ:www.ugr.es/~jsalinas/weproble/T3res.PDF+ejercicios+resueltos+de+distribucion+binomial&hl=es&gl=ec&pid=bl&srcid=ADGEESgpChtlfEpMbLWIK1hsKAWtBMDlYRewY0ywZUo045z5EMY5uKNygrupLeiBbaAHFHgSmrCsQAXD11hnmRqfHoJX49VssHPuZb_h-zOgoojYE9VTQk6T-jSn6M67slULv6WrYIM5&sig=AHIEtbQfMd9A13mYIWxiTitXoq3nn9vpbw

http://docs.google.com/present/edit?id=0AcbVB_Jxr6M9ZGR4NWh0cjhfMTMxZ2c5OGN0ZDY&hl=es






ESTADISTICA DESCRIPTIVA


Con estas medidas se persigue reducir en pocas cifras significativas el conjunto de observaciones de una variable y describir con ellas ciertas características de los conjuntos, logrando una comparación más precisa de los datos que la que se puede conseguir con tablas y gráficas.

MEDIDAS DE TENDENCIA CENTRAL

Los promedios son una medida de posición que dan una descripción compacta de como están centrados los datos y una visualización más clara del nivel que alcanza la variable, pueden servir de base para medir o evaluar valores extremos o raros y brinda mayor facilidad para efectuar comparaciones.

Es importante poner en relieve que la notación de promedio lleva implícita la idea de variación y que este número promedio debe cumplir con la condición de ser representativo de conjunto de datos.

El promedio como punto típico de los datos es el valor al rededor del cual se agrupan los demás valores de la variable.

MEDIA ARITMÉTICA

Es una medida matemática, un número individual que representa razonablemente el comportamiento de todos los datos.

Características de la Media:

1. En su cálculo están todos los valores del conjunto de datos por lo que cada uno afecta la media.

2. La suma algebraica de las desviaciones de los valores individuales respecto a la media es cero.

3. La suma del cuadrado de las desviaciones de una serie de datos a cualquier número A es mínimo si A = X

4. Aunque es confiable porque refleja todos los valores del conjunto de datos puede ser afectada por los valores extremos, y de esa forma llegar a ser una medida menos representativa, por lo que si la distribución es asimétrica, la media aritmética no constituye un valor típico.

LA MODA

Es el valor de un conjunto de datos que ocurre más frecuentemente, se considera como el valor más típico de una serie de datos.

Para datos agrupados se define como Clase Modal el intervalo que tiene más frecuencia.

La moda puede no existir o no ser única, las distribuciones que presentan dos o más máximos relativos se designan de modo general como bimodales o multimodales.

Características de la Moda.

1. Representa más elementos que cualquier otro valor

2. No está afectada por los valores extremos pero para datos continuos es dudoso su cálculo.

3. La moda para una distribución de frecuencias de datos agrupados no puede ser calculada exactamente, el valor de la moda puede ser afectado por el método de agrupación de los intervalos de clase.

4. La moda no permite conocer la mayor parte de los datos

5. Algunas veces el azar interviene de manera importante y hace que un valor no representativo se repita frecuentemente.

6. Puede usarse para datos cuantitativos como cualitativos

7. La moda como estadístico, varía mucho de una muestra a otra

8. Cuando se tienen dos o más modas es difícil su interpretación

9. Tiene la ventaja de que los datos desproporcionados con respecto al resto no la distorsionan, pero no se presta para un tratamiento matemático.

LA MEDIANA

Es el valor de la observación que ocupa la posición central de un conjunto de datos ordenados según su magnitud. Es el valor medio o la media aritmética de los valores medios. La mediana es un valor de la variable que deja por debajo de él un número de casos igual al que deja por arriba.

Geométricamente la mediana es el valor de la variable que corresponde a la vertical que divide al histograma en dos áreas iguales.

Cuando determinados valores de un conjunto de observaciones son muy grandes o pequeños con respecto a los demás, entonces la media aritmética se puede distorsionar y perder su carácter representativo, en esos casos es conveniente utilizar la mediana como medida de tendencia central.

Características de la mediana

1. Es un promedio de posición no afectado por los valores extremos.

2. No está definida algebraicamente

3. Cuando la localización del elemento central puede ser determinada y los límites de clase mediana son conocidos, la mediana para la distribución de frecuencias puede ser calculada por interpolación, no importando que ésta contenga intervalos abiertos, cerrados, iguales o diferentes.

4. La suma de los valores absolutos, sin considerar el signo, de las desviaciones individuales respecto a la mediana es mínimo.

5 La mediana en caso de una distribución asimétrica, no resulta desplazado del punto de tendencia central.

6. Si el universo tiene curtosis excesiva la mediana como estadístico, varía menos que cualquier otra medida.

7. Si la mediana se calcula por interpolación y hay lagunas en los valores de la clase mediana o los datos son irregulares, esta medida no es buena ya que su ubicación puede resultar falsa.

8. Si se desea ubicar las condiciones de un elemento en una clase, la mediana resulta se indicada, ya que por comparación pone en evidencia si un elemento está en la mitad superior a ella o en la inferior.


MEDIA GEOMÉTRICA

Útil cuando la variable cambia a lo largo del tiempo, esto es, en el calculo del promedio de tasas, razones, proporciones geométricas y relaciones de variables. Se utiliza en Matemáticas Financieras y Finanzas para promediar números índices, tasas de cambio, etc.

La media Geométrica de una serie de números es la raíz n-ésima del producto de esos números

M = n e (x 1 * x 2 * x 3 *.....*x n )

Se ve afectada por todos los números y valores extremos pero en menor grado que la Media Aritmética, su valor siempre es menor que el de ésta.

MEDIDAS DE DISPERSIÓN

Un rasgo principal de los datos es su dispersión o amplitud, que se refiere a su variabilidad, a la evaluación de cuán separados o extendidos están estos datos o bien cuanto difieren unos de otros.

Variación: es el grado en que los datos numéricos tienden a extenderse al rededor de un valor, generalmente el valor medio

LOS CUARTILES

Son valores que dividen a la distribución en n partes iguales

Cuartiles, cuatro partes iguales: Q1, Q2, Q3

Deciles, diez pares iguales : D1, D2..........D9

Percentiles o centiles, cien partes iguales: P1, P2.....P99

Los cuantiles permiten hacer un análisis minucioso de la distribución, se utilizan generalmente cuando se quiere ubicar un dato dentro del conjunto. Por ejemplo. Pertenece el dato x al 50% superior ?, al 10% inferior? , al 50 % central?, etc.


RANGO

Mide la dispersión de la totalidad de los datos. Es la más obvia de las mediadas ya que es la distancia entre los valores máximo y mínimo.

El rango o recorrido da alguna idea del grado de variación que ocurre en la población, pero con frecuencia los resultados pueden ser engañosos, pues este depende de los valores extremos e ignora la variación de las demás observaciones. Está afectado por ocurrencias raras o extraordinarias.

VARIANZA

Otro tratamiento para evadir la suma cero de las desviaciones de las observaciones respecto a su Media Aritmética, consiste en recurrir al proceso de elevar al cuadrado estas desviaciones y sumar los cuadrados, dividiendo la suma por el número de casos, a esta cantidad se le denomina varianza, y es la más importante de las medidas de variación porque tiene la ventaja de no prescindir de los signos de las desviaciones, pero al igual que la desviación media los valores extremos pueden distorsionarla

s 2 = S ( xi - X ) 2 / n

s 2 = S fi (xi-X ) 2 / S fi

S 2 = S (xi-X) 2 / ( n)

S 2 = S fi ( xi-X ) 2 / ( S fi )

S 2 * = S (xi-X) 2 / ( n-1)

S 2 *= S fi ( xi-X ) 2 / ( S fi -1)

En inferencia, con una muestra tomada de una población grande se pretende descubrir cuanto varían los datos al rededor de la media poblacional, si embargo cuando no se conoce la media de la población se estima a partir de la media aritmética de la muestra y esto hace que parezca menos variable de o que es en realidad, al dividir por n-1 se está compensando por la variabilidad más pequeña que se observa en la muestra, por lo que S 2 * , la suma de cuadrados dividida por n-1 es considerado un estimador más eficiente para la varianza poblacional.

DESVIACION ESTANDAR

Cuando se utiliza la varianza como medida de dispersión, para salvar el problema de trabajar con distintas dimensiones en la media y en la medida de variabilidad es necesario definir la Desviación estándar como la raíz cuadrada de l varianza.

La Desviación Estándar es útil para describir cuanto se apartan de la media de la distribución los elementos individuales. Una medida de ello se denomina puntuación estándar número de desviaciones a las que determinada observación se encuentra con respecto a la media.

Puntuación estándar de xi = (xi - X) / s

Al comparar distribuciones también hacemos uso de la calificación estándar.

Característica de la Desviación Estándar:

1. Es afectada por el valor de cada observación

2. Como consecuencia de considerar desviaciones cuadráticas pone mayor énfasis en las desviaciones extremas que en las demás desviaciones.

3. Si en el eje X de la distribución de frecuencias normal, se mide a ambos lados de la media una distancia igual a :

Una desviación estándar se forma un intervalo en el cual se encuentra el 68.27% de los valores centrales de la variable

Dos desviaciones estándar, se forma un intervalo donde se encuentra el 95.43% de los valores centrales

Tres desviaciones estándar, se forma un intervalo que contiene el 99.73% de los valores centrales

4. Al construir la tabla de frecuencias de una variable discreta y calcular a partir de ella la desviación estándar no hay pérdida de información por lo que la desviación para los datos observados es igual que para los datos tabulados.

En la construcción de una tabla de una variable continua hay pérdida de información por el agrupamiento de los valores en intervalos y se traduce en la discrepancia entre el valor de la desviación observada y tabulada.
Resumen:

viernes, 6 de noviembre de 2009

INTRODUCCION

La bioestadística, de forma general , es la aplicación de la estadística a la biología y de forma más frecuente a la medicina. Debido a que las cuestiones a investigar en biología y medicina son de naturaleza muy variada , la bioestadística ha expandido sus dominios para incluir cualquier cuantitativo , no sólo estadístico , modelo que pueda ser usado para responder a estas necesidades

miércoles, 4 de noviembre de 2009

CLASIFICACIÓN DE VARIABLES Y TIPO DE GRAFICAS CORRESPONDIENTES

TIPOS DE VARIABLES
  • VARIABLES CUALITATIVAS O CATEGÓRICAS
  • VARIABLES CUALITATIVAS ORDINALES
  • VARIABLES CUANTITATIVAS
VARIABLES CUALITATIVAS O CATEGORICAS

Una de las aplicaciones más sencillas de una tabla, se presenta cuando se describe el comportamiento de los datos de una variable categórica; el objetivo de este tipo de tablas es colocar en evidencia la frecuencia o recuento de cada una de las categorías, permitiendo hacer una comparación directa de los resultados, lo cual se observa claramente en variables com el sexo y todas aquellas respuestas se limitan a un grupo o clase o simplemente puede ser un si o un no.
Para su medición se usa escalas nominales, donde los valores son identificados con palabras. A veces los posibles valores de una variable cualitativa pueden estar predeterminados de antemano, asignando un código numérico (etiqueta) a cada categoría. A este proceso se lo llama codificación.
En general este tipo de variables sólo permite operaciones de igualdad o desigualdad.
Distinguimos dos tipos de variables cualitativas o categóricas nominales:
  • Dicotómicos o binarias: sano/enfermo, hombre/mujer.
  • Policotómicas (con varias categorias): grupo sanguineo,(A/B/O/AB).

VARIABLES CUALITATIVAS ORDINALES
Son aquellas cuyos posibles valores se encuentran jerarquizados y ordenados.
El tipo de escala utilizado se denomina ordinal. Se puede realiza con estas variables no sólo operaciones de igualdad y desigualdad, sino también operaciones de orden (ordenar los diferentes valores). Ejemplos: el grado de disnea, el grado de dolor, la intensidad del hábito tabáquico medida en la siguiente escala: nunca fumador/ex­-fumador/fumador activo.

VARIABLES CUATINTATIVAS
Los números utilizados para codificarlas realmente equivalen con exactitud a los valores verdaderos de datos. Los datos son realmente numéricos. Existen los siguientes tipos de variables cuantitativas:

  • Discretas: Sólo pueden tomar valores numéricos aislados. Sus valores pueden ser finitos o no y se puede asimilar a los números enteros. Ejemplo: número de hijos.
  • Continuas: Son numéricas y además pueden teóricamente valer cualquier cantidad intermedia entre dos posibles valores. Es decir, teóricamente podría tomar valores con un número de decimales que tiende al infinito. Ejemplos: peso, talla.


REPRESENTACIÓN GRÁFICA


REPRESENTACIÓN GRÁFICA DE LAS VARIABLES CUALITATIVAS Y CUANTITATIVAS DISCRETAS


Las variables cualitativas, cuantitativas discretas y las variables medidas en escala ordinal se pueden presentar mediante los siguientes tipos de gráficos: a) diagrama de barras, y b) superficies representativas. Las superficies representativas a su vez se pueden clasificar según sean sus formas geométricas o geográficas. Las más usadas son el diagrama de sectores y los cartogramas.


a) DIAGRAMA DE BARRAS
Para su construcción se necesita unos ejes de coordenadas. El eje de abscisas se asigna a los valores de la variable y el de ordenadas, a la escala de frecuencias que pueden ser absolutas y relativas. Sea cual sea la frecuencia considerada la escala siempre debe iniciarse en cero y coincidir con el cero de coordenadas.


b) SUPERFICIES REPRESENTAIVAS
Las superficies representativas se pueden clasificar en diferentes tipos según las áreas o volúmenes que nos interese utilizar, de todas manera en la práctica las más utilizada es el diagrama de sectores. En ocasiones pueden resultar adecuados los cilíndricos en forma de tarta, las pirámides, los cubos, los prismas e incluso los pictogramas y cartogramas.
Diagramas de sectores
Se construye representando cada valor de la variable estudiada mediante una porción de círculo. Estos sectores deben ajustarse proporcionalmente a la frecuencia de aparición de los valores de la variable, para ello es preciso calcular los grados del ángulo de su sector circular mediante una regla de tres simple.
Pictogramas
Son representaciones gráficas en las que se utilizan las superficies enmarcadas en un dibujo o pintura. En la práctica, dichos gráficos se concentran en la utilización de muñecos esquemáticos dentro de los cuales señalan diferentes valores de variables; a veces se puede recurrir a una serie de muñecos para representar la tendencia de una variable en el tiempo.
Cartograma
Se lo puede definir como aquel gráfico que utiliza una superficie representativa relacionada con mapas geográficos. En la práctica se emplea como soporte de impacto visual un mapa en el que se indican las zonas que corresponden a cada uno e los valores de la variable estudiada.


REPRESENTACIÓN GRÁFICA DE LAS VARIABLES CUANTITATIVAS CONTINUAS
Se pueden representar mediante los siguientes tipos de gráficos: a) hitogramas, b) polígonos de frecuencia y c) curvas de frecuencias acumuladas.


a) HISTOGRAMA
Es el más utilizado para las variables continuas dad su relativa sencillez de construcción.
La sistemática para elabora un histograma es la siguiente:
1. Los valores de la variable deben agruparse en intervalos.
2. Se fijan los límites exactos de cada uno de los intervalos de la variable en el eje de abscisas, no es imprescindible que el cero concuerde con el inicio del eje.
3. Sobre el eje de ordenadas se construye la escala de frecuencias; aquí sí es necesario que el cero coincida con el inicio del eje.
4. Sobre el eje de abscisas se levantan tanto rectángulos como intervalos existan.


b) POLÍGONO DE FRECUENCIAS
Este gráfico se construye sobre el histograma, por ello es condición previa indispensable haber realizado el histograma de la variable continua en cuestión.
Para elabora un polígono de frecuencias se sigue la siguiente sistemática: en primer lugar, se marcan los puntos medios de los intervalos en la base superior de los rectángulos que forman el histograma. A continuación se unen entre sí estos puntos medios. Por último, para cerrar esta línea quebrada se unen el punto medio del primer intervalo con el teórico punto medio del intervalo con el teórico punto medio del intervalo anterior al primero y el punto medio el último intervalo con el teórico punto medio del intervalo posterior a él. El último paso se podrá realizar siempre y cuando todos los intervalos tengan la misma amplitud.


c) CURVA DE FRECUENCIAS ACUMULADAS
Es utilizado para representar variables continuas con frecuencias acumuladas para ello es necesario el histograma acumulado y la curva de frecuencias acumuladas. Aunque teóricamente se citan como dos gráficas distintas las dos son necesarias, ya que para trazar una curva de frecuencias acumuladas es necesario construir el histograma acumulado.
La sistemática que se sigue para construir ambas graficas es la siguiente: en primer lugar se confecciona el histograma acumulado. Una vez construido, ya se puede graficar la curva de frecuencias acumuladas. Para ello se deben unir límites superiores exactos de cada intervalo por el extremo más alto de los rectángulos que conforman el histograma acumulado.

Quieres aprender más:

http://docs.google.com/Doc?docid=0AcbVB_Jxr6M9ZGR4NWh0cjhfNzJjeDJxaGJnZg&hl=es