martes, 13 de octubre de 2009

CAPITULO DOS


organización de datos:

conceptos generales
Fila de datos: consiste en datos recolectados que no han sido organizados en numéricamente por ejemplo: las alturas de 100 estudiantes por letra alfabética.
Organización u ordenación de datos: una ordenación de datos es un conjunto de datos numéricos en orden creciente o decreciente y a la diferencia de que existen entre el dato mayor y menor se le llama rango, de ese conjunto de datos. Así, si la mayor altura de entre 100 estudiantes era 74 pulgadas, y la menor era de 60 pulgadas. El rango seria:
Rango = dato mayor - dato menor= 74–60= 14 pulgadas.

distribución de frecuencias:

Una distribución de frecuencias es una tabla de resumen en la que los datos se disponen en agrupamientos o categorías convenientemente establecidas de clases ordenadas numéricamente

Distribuciones de frecuencias unidimensionales con los datos no agrupados.
Definiciones en general…
.
Una distribución de frecuencias unidimensional unitaria de la característica x al conjunto de los r datos distintos y ordenados de menor a mayor (xl' xz, ..., xi' •••, xr) de forma que ninguno esta repetido.
Construcción de la tabla de distribución de frecuencias
· selección del número de clases (k)
Criterio para definir el número:
Fórmula
§ k = "n
§ k = 1 + 3.322 log n
Entre 5 y 20 intervalos
· obtención de los intervalos de clase
Rango: (r) = (x max - x min) IV = [x min; x max]
Ancho intervalo (
): r / k
§ igual para todos los ii
§ diferente
· establecimiento de los límites de clase
 cifras significativas:
el mismo número que poseen las observaciones (redondear si es necesario)
una cifra significativa más que las que poseen las observaciones
 valor del límite inferior del primer inter. y lim. superior del último
li1 = x min lsk = x max. [li1 " xi " lsk]
li1 " x min lsk " x max. [li1 " xi " lsk]
[lii " xi < mi =" (lii" fi =" número" fir =" fir" fi =" número" fir =" fi" x =" “altura" k = "n = " r =" (x" k =" 27.8" 11 =" 2.53" fi =" fi" fir =" fir">


rango:
en
estadística descriptiva se denomina rango estadístico o recorrido estadístico al intervalo de menor tamaño que contiene a los datos; es calculable mediante la resta del valor mínimo al valor máximo; por ello, comparte unidades con los datos. Permite obtener una idea de la dispersión de los datos.
Por ejemplo, para una serie de datos de carácter cuantitativo como es la estatura tal y como:
x1 = 185,x2 = 165,x3 = 170,x4 = 182,x5 = 155
Es posible ordenar los datos como sigue:
x(1) = 155,x(2) = 165,x(3) = 170,x(4) = 182,x(5) = 185
Donde la notación x (i) indica que se trata del elemento i-ésimo de la serie de datos. De este modo, el rango sería la diferencia entre el valor máximo (k) y el mínimo; o, lo que es lo mismo:
w = x (k) − x (1)
En nuestro ejemplo, con cinco valores, nos da que w = 185-155 = 30.


Algo que responde a la identificación de la dispersión de los datos de una muestra es el rango, el cual se define como la diferencia entre el dato mayor menos el dato menor de un conjunto de datos. Su obtención es sumamente sencilla, sin embargo se considera que no es una medida muy significativa, su aplicación es más útil en la llamada estadística no pará métrica. Una expresión para el rango puede ser vista como:
Podemos retomar el ejemplo planteado en el se observaba que las muestras tienen diferente dispersión, aunque su media y mediana eran iguales, por lo que una forma de marcar su diferencia es a través del rango.
Para la primera muestra (0, 45, 50, 55, 100), el dato menor es 0 y el dato mayor es 100, por lo que sus valores se encuentran en un rango de:
Rango = 100 – 0 =100
Mientras que para la segunda muestra (47, 49.5, 50, 51.5, 52), el dato menor es 47 y el dato mayor es igual a 52 por lo que su rango correspondiente es igual a:
Rango = 52 – 47= 5
Lo que indica que la segunda muestra es más homogénea ya que sus datos están dispersos en un menor rango.
Es también común identificar el rango como recorrido
.

frecuencia:
Frecuencia es una
medida que se utiliza generalmente para indicar el número de repeticiones de cualquier fenómeno o suceso periódico en la unidad de tiempo. Para calcular la frecuencia de un evento, se contabilizan un número de ocurrencias de este teniendo en cuenta un intervalo temporal, luego estas repeticiones se dividen por el tiempo transcurrido.
Según el
sistema internacional, el resultado se mide en hertzs (hz), en honor a heinrich rudolf hertz. Un hertz es aquel suceso o fenómeno repetido una vez por segundo, 2 hz son dos sucesos (períodos) por segundo, 3 hz son tres sucesos (períodos) por segundo, 4 hz son cuatro sucesos (períodos) por segundo, 5 hz son cinco sucesos (períodos) por segundo, con esto demostramos teóricamente que casi siempre hay una relación en el número de hertz con las ocurrencias. Esta unidad se llamó originariamente como ciclo por segundo (cps) y aún se sigue utilizando. Otras unidades para indicar la frecuencia son revoluciones por minuto (rpm) y radianes por segundo (rad/s). las pulsaciones del corazón o el tempo musical se mide como golpes por minuto (bpm, del inglés beats per minute).
un método alternativo para calcular la frecuencia es medir el tiempo entre dos repeticiones (
periodo) y luego calcular la frecuencia (f) recíproca de esta manera:
donde t es el periodo de la señal.
frecuencias de ondas
la frecuencia tiene una relación inversa con el concepto de
longitud de onda (ver gráfico 1 y 2), a mayor frecuencia menor longitud de onda y viceversa. la frecuencia f es igual a la velocidad v de la onda dividido por la longitud de onda λ (lambda):
en el caso especial de ondas
electromagnéticas en el vacío, se tiene que v = c, siendo c la velocidad de la luz en el vacío, y por tanto se tiene:
cuando las ondas viajan de un medio a otro, como por ejemplo de
aire a agua, la frecuencia de la onda se mantiene constante, cambiando sólo su longitud de onda y la velocidad.
aparte de que puede variar por el
efecto doppler, la frecuencia es una magnitud invariable en el universo. es decir, no se puede modificar por ningún proceso físico excepto por su velocidad de propagación o longitud de onda...
se llama frecuencia a la cantidad de veces que se repite un determinado valor de la variable.
se suelen representar con
histogramas y con diagramas de pareto.
en estadística se pueden distinguir hasta cuatro tipos de frecuencias
frecuencia absoluta (ni) de una variable estadística xi, es el número de veces que aparece en el estudio este valor. a mayor tamaño de la muestra, aumentará el tamaño de la frecuencia absoluta; es decir, la suma total de todas las frecuencias absolutas debe dar el total de la muestra estudiada (n).
frecuencia relativa (fi), es el cociente entre la frecuencia absoluta y el tamaño de la muestra (n). es decir,
siendo el fi para todo el conjunto i. se presenta en una tabla o nube de puntos en una
distribución de frecuencias (ver fig.1 y (fig.2).
si multiplicamos la frecuencia relativa por 100 obtendremos el
porcentaje o tanto por ciento (pi) que presentan esta característica respecto al total de n, es decir el 100% del conjunto.
frecuencia absoluta acumulada (ni), es el número de veces ni en la muestra n con un valor igual o menor al de la variable. la última frecuencia absoluta acumulada deberá ser igual a n.
frecuencia relativa acumulada (fi), es el cociente entre la frecuencia absoluta acumulada y el número total de datos, n. es decir,
con la frecuencia relativa acumulada por 100 se obtiene el porcentaje acumulado (pi)), que al igual que fi deberá de resultar al final el 100% de n.
se llama frecuencia a la cantidad de veces que se repite un determinado valor de la variable.
se suelen representar con
histogramas y con diagramas de pareto.



intervalos de clase:

símbolos
intervalo de clase
límites de clase
límite inferior de la clase
límite superior de la clase
Intervalo de clase abierto
Los intervalos son los límites a los extremos a los que llega una función. Son utilizados a modo de resumen cuando la cantidad de datos es muy grande. Los límites extremos de cada clase se les llaman límite inferior y superior de clase respectivamente.
Existen 3 clases de intervalos
· abiertos: se colocan entre paréntesis (por ejemplo (-3;5)). esto quiere decir que la función no toca los puntos -3 y 5 sino que llega a -2.99999 y a 4.9999.
· cerrados: se expresan entre corchetes (por ejemplo [-3;5]). esto significa que la función empieza en -3 y termina en 5).
· semi abiertos: se expresan con un paréntesis de un lado y un corchete del otro (por ejemplo (-3; 5]; esto quiere decir que la función empieza en -2.99999 y termina en 5).


limites reales de clase
Los límites inferiores y superiores son los valores mínimos y máximo de una distribución.
Límites reales de clase o límites verdaderos:
Limite superior mas limite inferior divididos

Limite inferior: 38
Límite real inferior: 38
Límite real superior: 98



tamaño de los intervalos de clase
Los intervalos de clase pueden ser de tres tipos, según el tamaño que estos presenten en una distribución de frecuencia:
a) clases de igual tamaño,
b) clases desiguales de tamaño
c) clases abiertas.
Tamaño o anchura de un intervalo de clase
n anchura de clase: diferencia entre los limites reales de clase
n tamaño de clase
n longitud de clase (c)


marca de clase
Se le llama marca de clase a los valores representativos de todos los valores incluidos en el intervalo respectivo; equivale a la semisuma de los límites inferior y superior de un intervalo
La marca de clase es el punto medio de cada intervalo. La marca de clase es el valor que representa a todo el intervalo para el cálculo de algunos parámetros.se representa por ci.
En un estudio estadístico, valor representativo de cada intervalo. Tomamos como marca de clase el punto medio de cada intervalo y lo calculamos sumando los extremos del intervalo y dividiéndolo entre 2.


frecuencia relativa
Es la relación o cociente entre la frecuencia absoluta y el número total de observaciones.
Es la proporción entre la frecuencia de un intervalo y el número total de datos.
La frecuencia absoluta, es una medida que está influida por el tamaño de la muestra, al aumentar el tamaño de la muestra aumentará también el tamaño de la frecuencia absoluta. Esto hace que no sea una medida útil para poder comparar. Para esto es necesario introducir el concepto de frecuencia relativa, que es el cociente entre la frecuencia absoluta y el tamaño de la muestra. La denotaremos por fi

Donde n = tamaño de la muestra

n distribución de frecuencias relativas, distribución porcentual o tabla de frecuencias relativas.
n histograma de frecuencias relativas o histogramas porcentuales
n polígonos de frecuencias relativas o polígonos porcentuales



frecuencia relativa acumulada
Al igual que en el caso anterior la frecuencia relativa acumulada es la frecuencia absoluta acumulada dividido por el tamaño de la muestra, y la denotaremos por fi

Porcentaje acumulado:
Análogamente se define el porcentaje acumulado y lo vamos a denotar por pi como la frecuencia relativa acumulada por 100.
n frecuencia relativa acumulada o frecuencia porcentual acumulada
n los resultados son distribuciones de frecuencias relativas acumuladas o distribuciones porcentuales acumuladas
Polígonos de frecuencias relativas acumuladas u ojivas porcentuales
distribuciones empíricas
Distribución empírica
Los percentiles empíricos se calculan a partir de la función de distribución empírica definida por los
Valores de la serie con la que se trabaja ordenada desde el valor menor al mayor, y asignando a cada valor
Ordenado su probabilidad calculada según la expresión:
prob (c£xi) = i/(n +1 ).
donde ”i” representa el número de orden que ocupa el valor “x” en la serie de datos ordenada en
orden creciente y “n” el número total de datos. la probabilidad correspondiente al 20, 40, 50, 60 ó 80 por
ciento se obtienen por interpolación lineal, considerando las probabilidades asignadas a cada dato
ordenado.


graficas
Una gráfica es una representación de datos, generalmente numéricos, mediante líneas, superficies o símbolos, para ver la relación que esos datos guardan entre sí. También puede ser un conjunto de puntos, que se plasman en
coordenadas cartesianas, y sirven para analizar el comportamiento de un proceso, o un conjunto de elementos o signos que permiten la interpretación de un fenómeno.
La
estadística gráfica es una parte importante y diferenciada de una aplicación de técnicas gráficas, a la descripción e interpretación de datos e inferencias sobre éstos. Forma parte de los programas estadísticos usados con los ordenadores. Autores como Edward r. tufte han desarrollado nuevas soluciones de análisis gráficos.
Existen diferentes tipos de gráficas, por ejemplo, las gráficas circulares, las gráficas de barras o columnas, y las gráficas lineales. Estas son las gráficas más comunes.
Las gráficas se pueden clasificar en:
numéricas: con imágenes visuales que sirven para representar el comportamiento o la distribución de los datos cuantitativos de una población.
lineales: en este tipo de gráfico se representan los valores en dos ejes cartesianos ortogonales entre sí. las gráficas lineales se recomiendan para representar series en el tiempo, y es donde se muestran valores máximos y mínimos; también se utiliza para varias muestras en un diagrama.
de barras: se usan cuando se pretende resaltar la representación de porcentajes de datos que componen un total. una gráfica de barras contiene barras verticales que representan valores numéricos, generalmente usando una hoja de cálculo. las gráficas de barras son una manera de representar frecuencias; las frecuencias están asociadas con categorías. una gráfica de barras se presenta de dos maneras: horizontal o vertical. el objetivo es poner una barra de largo (alto si es horizontal) igual a la frecuencia. la gráfica de barras sirve para comparar y tener una representación gráfica de la diferencia de frecuencias o de intensidad de la característica numérica de interés.
gráficas circulares: gráficas que nos permiten ver la distribución interna de los datos que representan un hecho, en forma de porcentajes sobre un total. se suele separar el sector correspondiente al mayor o menor valor, según lo que se desee destacar.
histogramas: se emplea para ilustrar muestras agrupadas en intervalos. está formado por rectángulos unidos a otros, cuyos vértices de la base coinciden con los límites de los intervalos y el centro de cada intervalo es la marca de clase que representamos en el eje de las abscisas. la altura de cada rectángulo es proporcional a la frecuencia del intervalo respectivo.


histogramas:
En
estadística, un histograma es una representación gráfica de una variable en forma de barras, donde la superficie de cada barra es proporcional a la frecuencia de los valores representados. En el eje vertical se representan las frecuencias, y en el eje horizontal los valores de las variables, normalmente señalando las marcas de clase, es decir, la mitad del intervalo en el que están agrupados los datos.
Se utiliza cuando se estudia una variable continua, como franjas de edades o altura de la muestra, y, por comodidad, sus valores se agrupan en clases, es decir, valores continuos. En los casos en los que los datos son cualitativos (no-numéricos), como sexto grado de acuerdo o nivel de estudios, es preferible un
diagrama de sectores.
Los histogramas son más frecuentes en
ciencias sociales, humanas y económicas que en ciencias naturales y exactas. Y permite la comparación de los resultados de un proceso.
Tipos de histograma
diagramas de barras simples
Representa la frecuencia simple (absoluta o relativa) mediante la altura de la barra la cual es proporcional a la frecuencia simple de la categoría que representa.
diagramas de barras compuesta
se usa para representar la información de una
tabla de doble entrada o sea a partir de dos variables, las cuales se representan así; la altura de la barra representa la frecuencia simple de las modalidades o categorías de la variable y esta altura es proporcional a la frecuencia simple de cada modalidad.
diagramas de barras agrupadas
Se usa para representar la información de una tabla de doble entrada o sea a partir de dos variables, el cual es representado mediante un conjunto de barras como se clasifican respecto a las diferentes modalidades.


polígono de frecuencias
Es un gráfico de líneas que se usa para presentar las frecuencias absolutas de los valores de una distribución en el cual la altura del punto asociado a un valor de las variables es proporcional a la frecuencia de dicho valor.
ojiva porcentual
Es un gráfico acumulativo, el cual es muy útil cuando se quiere representar el rango porcentual de cada valor en una distribución de frecuencias.
En los gráficos las barras se encuentran juntas y en la tabla los números poseen en el primer miembro un corchete y en el segundo un paréntesis, por ejemplo: (10-20]
Construcción de un histograma
paso 1
Determinar el rango de los datos. Rango es igual al dato mayor menos el dato menor.
paso 2
Obtener los números de clases, existen varios criterios para determinar el número de clases (o barras) -por ejemplo la
regla de sturgess-. Sin embargo ninguno de ellos es exacto. Algunos autores recomiendan de cinco a quince clases, dependiendo de cómo estén los datos y cuántos sean. Un criterio usado frecuentemente es que el número de clases debe ser aproximadamente a la raíz cuadrada del número de datos. Por ejemplo, la raíz cuadrada de 30 (número de artículos) es mayor que cinco, por lo que se seleccionan seis clases.
paso 3
Establecer la longitud de clase: es igual al rango entre el número de clases.
paso 4
Construir los intervalos de clases: los intervalos resultan de dividir el rango de los datos en relación al resultado del paso 2 en intervalos iguales.
paso 5
Graficar el histograma: en caso de que las clases sean todas de la misma amplitud, se hace un gráfico de barras, las bases de las barras son los intervalos de clases y altura son la frecuencia de las clases. Si se unen los puntos medios de la base superior de los rectángulos se obtiene el polígono de frecuencias.
El histograma de una imagen representa la frecuencia relativa de los niveles de gris de la imagen. Las técnicas de modificación del histograma de una imagen son útiles para aumentar el contraste de imágenes con histogramas muy concentrados.
Sea u una imagen de tamaño nxn, la
función de distribución del histograma es: fu (l) = (numerodepixeles (i, j) talesqueu (i, j) < = l) / n2 Ejemplos de otros tipos de representaciones gráficas: hay histogramas donde se agrupan los datos en clases, y se cuenta cuántas observaciones (frecuencia absoluta) hay en cada una de ellas. En algunas variables (variables cualitativas) las clases están definidas de modo natural, p.e sexo con dos clases: mujer, varón o grupo sanguíneo con cuatro: a, b, ab, o. en las variables cuantitativas, las clases hay que definirlas explícitamente (intervalos de clase). Se representan los intervalos de clase en el eje de abscisas (eje horizontal) y las frecuencias, absolutas o relativas, en el de ordenadas (eje vertical). A veces es más útil representar las frecuencias acumuladas. O representar simultáneamente los histogramas de una variable en dos situaciones distintas. Otra forma muy frecuente, de representar dos histogramas de la misma variable en dos situaciones distintas. En las variables cuantitativas o en las cualitativas ordinales se pueden representar polígonos de frecuencia en lugar de histogramas, cuando se representa la frecuencia acumulativa, se denomina ojiva.


POLIGONOS DE FRECUENCIA
Es un gráfico de líneas que se usa para presentar las frecuencias absolutas de los valores de una distribución en el cual la altura del punto asociado a un valor de las variables es proporcional a la frecuencia de dicho valor

frecuencia relativa:
frecuencia relativa (fi), es el cociente entre la frecuencia absoluta y el tamaño de la muestra (n). es decir,
Siendo el fi para todo el conjunto i. se presenta en una tabla o nube de puntos en una
distribución de frecuencias (ver fig.1 y (fig.2).
Si multiplicamos la frecuencia relativa por 100 obtendremos el
porcentaje o tanto por ciento (pi) que presentan esta característica respecto al total de n, es decir el 100% del conjunto.

frecuencia acumulada
La frecuencia acumulada es la suma de las frecuencias absolutas de todos los valores inferiores o iguales al valor considerado. La frecuencia acumulada se representa por fi.

pareto

El principio de pareto es también conocido como la regla del 80-20 y recibe este nombre en honor a
Wilfredo pareto, quien lo enunció por primera vez.
Pareto enunció el principio basándose en el denominado
conocimiento empírico. observó que la gente en su sociedad se dividía naturalmente entre los «pocos de mucho» y los «muchos de poco»; se establecían así dos grupos de proporciones 80-20 tales que el grupo minoritario, formado por un 20% de población, ostentaba el 80% de algo y el grupo mayoritario, formado por un 80% de población, el 20% de ese mismo algo.
Estas cifras son arbitrarias; no son exactas y pueden variar. Su aplicación reside en la descripción de un fenómeno y, como tal, es aproximada y adaptable a cada caso particular.
El principio de pareto se ha aplicado con éxito a los ámbitos de la política y la
economía. se describió cómo una población en la que aproximadamente el 20% ostentaba el 80% del poder político y la abundancia económica, mientras que el otro 80% de población, lo que pareto denominó «las masas», se repartía el 20% restante de la riqueza y tenía poca influencia política. Así sucede, en líneas generales, con el reparto de los bienes naturales y la riqueza mundial.












domingo, 11 de octubre de 2009

ejemplos:


EJEMPLOS
MUESTRA SISTEMATICA MUESTRA PONDERADA








1.Muestra aleatoria simple

Ejemplo: cogiendo papeletas numeradas de un sombrero. Si tenemos un fichero de ordenador sobre la población, la computadora hará la selección al azar. Cuando la población es muy grande y ya consiste en grupos naturales, los miembros de los cuales se enumeran en un archivo, puede ser práctico hacer el muestreo en etapas (cluster sampling), seleccionando primero algunos grupos y entonces seleccionando la muestra final sólo desde los miembros de estos grupos seleccionados. Por ejemplo, si la población consiste en toda la gente en un país, usted puede primero seleccionar al azar algunas subdivisiones del país y después seleccionar la muestra final entre la gente en estas subdivisiones. Si usted se prepone entrevistarse con esta gente en sus hogares, usted ahorrará así mucha hora de viajar.


2. Muestra sistemática.



Si la razón que se pretende es 1/n, empezamos escogiendo el primer elemento al azar entre los primeros n objetos de la población, y tras ello extraemos cada n-avo objeto. Si tenemos una lista de objetos de la población el procedimiento será muy fácil incluso sin una computadora, y el resultado será así representativo, excepto en la situación inusual que una característica importante de los casos sucede a la repetición en cada n casos.
3. Muestra aleatoria ponderada. Cuando la población incluye un grupo muy pequeño pero esencial, hay el riesgo de que ningún miembro de ese grupo quede dentro de una muestra aleatoria. Tales grupos claves de usuarios de productos son, entre otros, gente corto de vista, duro de oído o con la capacidad reducida del movimiento, véase una lista de tal gente. Otras minorías a menudo significativas originan de religiones, de nacionalidades y de lenguas.
Para asegurar por lo menos algunos de una minoría clave (marcada con x en el diagrama a la derecha) en la muestra, podemos incrementar deliberadamente la razón de la muestra sobre este grupo de especial importancia. Por supuesto que esto generará un desequilibrio en las mediciones que se obtengan a partir de la muestra ponderada, pero será fácil restaurar el equilibro original. Esto se hace así cuando se combinan los resultados; por ejemplo, al calcular la media de todas las mediciones daremos a las mediciones de cada grupo su peso apropiado correspondiente a los porcentajes genuinos en la población.


Muestras no aleatorias
Las muestras no aleatorias (o "no probabilísticas") { son seleccionadas por cualquier procedimiento que no da todos casos en la población las oportunidades iguales de caer en la muestra. A veces el contexto del estudio permite o facilita un cierto método de muestreo, a veces el investigador tiene la posibilidad de escoger el método
Cualquier es el procedimiento, es siempre posible que favorecerá ciertos tipos de casos en la población más que los otros, es decir producirá una muestra sesgada.
En estudios descriptivos la presencia de sesgo es una desventaja grave que usted encontrará más adelante en su proyecto, en cuándo
valorar el muestreo y en cuándo escribir el capítulo final de su informe. Por lo tanto puede ser prudente pensar de él por adelantado, cuándo escoger el método de muestreo.
Al valorar una muestra no-aleatorio que usted debe preguntar usted mismo: ¿Serán los resultados de la muestra el mismo que usted conseguiría de la población? ¿Es cierto que el criterio que usted ha utilizado en seleccionar la muestra (e.g. la buena voluntad de la gente de participar) no tiene ninguna correlación con esas variables que usted desee registrar de la muestra? Si hay correlación, su muestra está sesgada y usted debe considerar el construir de una muestra nueva con menos correlación.
Como contraste, muestras no aleatorias se pueden utilizar en proyectos de investigación y del desarrollo, a condición de que el sesgo sistemático posible sea compensado más adelante. Por ejemplo, es común usar al muestreo de conveniencia cuándo escoger clientes potenciales a un grupo de trabajo para desarrollar un
concepto del producto preliminar. La selección de personas será probablemente sesgada, tan bien como las propuestas del grupo de trabajo, pero las propuestas serán rectificadas ulteriormente cuando son evaluadas de nuevo por un otro grupo de gente más grande.ejemplo, si hacemos una encuesta telefónica por la mañana, las personas que no tienen teléfono o que están trabajando, no podrán formar parte de la muestra
Entre los tipos comunes de muestras no aleatorias se incluyen:




1. Muestra de conveniencia.
ejemplo la gente en una reunión, podría ser designado como muestra. Este es un método fácil y barato, pero el sesgo suele ser imposible de estimar. El método es popular en las demostraciones de cursos sobre métodos, donde los datos obtenidos de la muestra no se usarán. Asimismo, esto es un método posible cuando usted necesita a algunos clientes potenciales asistir al desarrollo de producto, a condición de que los resultados obtenidos sean probados más adelante con una muestra mejor escogida de la clientela-objetivo.
2. Muestra de voluntarios es creada cuando todos los miembros de la población tienen la oportunidad de participar en la muestra. Si usted inserta una forma de cuestionario en un periódico o en una página del Internet y pide que la gente dé sus opiniones sobre un asunto, usted conseguirá una muestra de voluntarios. Un otro ejemplo es la
respuesta de los clientes que llega a una empresa.
Una muestra de voluntarios puede ser una alternativa práctica cuando no hay lista de los miembros de la población de quien una muestra aleatoria se podría escoger, o cuando es difícil de contactar a la gente en una muestra porque sus direcciones no se saben. La desventaja es que es difícil determinar la presencia del sesgo, es decir si las opiniones u otras características interesantes de los voluntarios se desvían de ésos de la población. Cuando en vista de esta pregunta, hay dos cuestiones que plantearse:
¿Qué es la población que usted apunta? ¿Es cierto que todos los miembros de la población concernida tenían las mismas oportunidades de ser incluidos en la muestra?
¿Hay cualquier razón por qué puedan diferir los voluntarios del resto de la población? ¿Por ejemplo, tienen ellos, o por lo menos algunos de ellos, una razón especial para ofrecerse?
Si usted, por ejemplo, quiere obtener una muestra de gente que ha comprado su último producto, usted puede incluir en el paquete del producto un formulario franqueo-pagada donde la gente puede dar sus nombres y direcciones. ¿Qué sucedería si usted pidió además que los respondedores dieran sus opiniones del producto? Usted conseguiría probablemente respuestas sobre todo de la gente que tiene una opinión fuerte de su producto, positiva o negativa. La gente sin opinión definida de su producto quizás no incomodaría contestar. La muestra sería así sesgada, y usted tendría que considerar si tal tendencia podría ser aceptable para sus fines.
3. Muestra - bola de nieve. Cuando se entrevista a miembros de un grupo, podemos pedir a las personas que nos indiquen otros individuos en ese grupo que podrían dar información sobre ese tema; podríamos también pedirles que nos indicasen personas que compartan sus puntos de vista y también otras que sean de opinión opuesta. Entonces entrevistaremos a nuevos individuos y continuaremos del mismo modo hasta que no obtengamos nuevos puntos de vista de nuevos entrevistados. Este es un buen método por ejemplo para recoger los distintos puntos de vista existentes en un grupo, pero su inconveniente es que no obtenemos una idea exacta de la distribución de las opiniones.
4. Una muestra que consiste en todos los casos disponibles. A veces el investigador es interesado en una población de que sólo unos pocos casos o especímenes están disponibles para el estudio, y estos entonces deben servir como una muestra de la población. Tales muestras típicas son:
4a. Casos restantes
4b. Casos permitidos.
Los casos restantes entre el material histórico o arqueológico, cuando ha desaparecido una parte grande de material relevante antes de que reciben los investigadores, se pueden mirar como una clase de muestra de conveniencia incluso cuando es la realidad histórica y no la conveniencia que selecciona la muestra. Si la destrucción del material, durante el tiempo hasta el estudio, no ha sido al azar ni proporcional pero en lugar de alguna manera parcial o selectivo, el material sobreviviente será sesgado y el investigador debe valorar el sesgo probable. Usted debe preguntarse si cualquiera de los factores siguientes ha afectado diferentemente en la preservación de tipos diferentes de la materia:
¿El material a veces se ha seleccionado para cualquier propósito, por ejemplo para ser mantenido en archivos, bibliotecas o museos?
¿Algunos objetos en el material a veces se han substituido por nuevos?
¿Qué clases de cosas fueron mirados generalmente como basura, o al contrario, como digno y apropiado ser preservado?
¿Hay factores físicos que pueden haber afectado diferentemente en la preservación de varios grupos de material?
Los casos permitidos. Al estudiar las empresas privadas sucede a menudo que la gerencia no permitirá colectar información desde ciertas unidades en la organización. La decisión de la administración es motivada quizás por su juicio sobre los objetivos del estudio, pero del punto de vista científico tal muestra a menudo parecerá gravemente sesgada.
Métodos de muestreo inadecuados
Sobrepasar los límites de la población. No tenemos que incluir elementos que no sean miembros de la población en nuestra muestra. Por ejemplo, en muestreo bola-de-nieve sucede a menudo que alguna gente entrevistada nomina a candidatos que no pertenecen a la misma población. Por supuesto, usted tiene a menudo la opción de alterar sus delimitaciones originales.
Muestra de casos típicos. La meta de estudiar un grupo heterogéneo es a menudo encontrar cuál es común y típico de la mayoría de los casos en el grupo. A este efecto loable, el muestreo se ha utilizado a veces para seleccionar los casos más típicos en la muestra, y todos los casos extraordinarios son dejados fuera. En la figura en el derecho, los casos típicos se marcan con puntos, y los casos excepcionales están marcados con los símbolos + y x.
Sin embargo, seleccionar una muestra de casos típicos no es muy recomendable porque cuándo escoger los casos "típicos" los prejuicios del investigador (que pueden ser erróneos) influencian demasiado los resultados de la investigación. El investigador puede, sin notarlo, seleccionar sobre todo tales casos que corroboren sus preconcepciones o hipótesis. Para resumir, si usted desea precisar los especímenes medios o los casos más comunes de la población, un método mejor es
clasificar todos los artículos de la población, o una muestra escogida al azar, y encuentra el tipo más frecuente. Cuando es necesario, usted puede entonces continuar el estudio de esta clase, que en adelante se convierte en la población nueva del estudio.
Muestra de especialistas. Puede ser que parezca una idea sensible de preguntar directamente ésos, a menudo pocos, personas que saben mucho sobre el asunto, en vez de preguntar una muestra grande de legos escogidos al azar cuyo conocimiento puede ser esporádico y cuyos opiniones pueden divergir. Así, podríamos por ejemplo:
Investigar las preferencias de consumidores sobre los aparatos domésticos, entrevistando a vendedores.
Estudiar estilos de vida de arrendatarios mediante un cuestionario a propietarios o a administradores de casas o caseros.
Desarrollar un nuevo modelo del coche de familia de modo que unos conductores de carreras lo proban y evalúen.
Valorar la atmósfera de trabajo en una compañía entrevistando a los directores.
La ventaja a entrevistar a especialistas es que usted necesita entrevistar apenas unas pocas personas y en la discusión usted consigue rápidamente al punto. Sin embargo, usted no debe pensar que los "especialistas" puedan ser tomados como muestra de "no especialistas". Son dos poblaciones diferentes. No debiéramos generalizar los resultados de "especialistas" a ninguna otra población.
Si usted entonces desea además recolectar las opiniones de los consumidores medios, usted debe definir éstos como una población segunda y seleccionar una muestra adecuada de ella, también. Una alternativa deberá hacer dos proyectos distintos de estos dos exámenes. Una posibilidad es hacer estos dos exámenes en sucesión. Podríamos tal vez continuar transformando los resultados a partir de los especialistas en hipótesis que más tarde verificaríamos con una muestra apropiada de la población "real" o de no especialistas, que serían en los ejemplos citados, respectivamente, los consumidores y los arrendatarios. En otras palabras, podríamos usar la entrevista de los especialistas como un estudio preliminar sólo.
Muestreo normativo. El aspecto normativo es aceptable en los proyectos del
desarrollo que apuntan a mejorar objetos similares en el futuro, pero es mejor guardarlo fuera del muestreo porque no es compatible con los principios de la representatividad y de la generalización.
El estudio normativo de una "muestra de los mejores obras" es algo bastante tradicional en historia del arte. La idea es que éstos representan lo más auténtico de su época. Tal selección deliberada por parte del investigador tiene no obstante riesgos serios. Es evidente que no son típicos de la era y no representan las obras de arte medias. Esto no sugiere que usted no los debe estudiar, pero si usted lo hace, no le llama una "muestra" si usted quiere decir que los grandes amos o sus obras son la población de su estudio. Cf.
Delimitar la población de estudio.
Más tarde en la fase de análisis de sus datos que usted puede mantener fácilmente el aspecto normativo, usando los métodos de
estudio de caso normativo , comparación normativa , clasificación normativa , y estudio pedagógico del desarrollo, de modo que no es necesidad de mezclar el procedimiento de muestreo con consideraciones normativas.

INTRODUCCION, A LA ESTADISTICA PARA ADMINISTRACION Y DIRECCION DE EMPRESAS


INTRODUCCION, A LA ESTADISTICA PARA ADMINISTRACION Y DIRECCION DE EMPRESAS

El método estadístico en la interpetracion de los hechos económicos Las ramas de 10 estadísticas y sus métodos científicos La estadística la ciencia que estudia las regularidades que se observan en una serie de fenómenos que piden expresarse através de la información numérica.
la estadística descriptiva su método es el deductivo ya que plantea un conjunto de datos ordenados y genéricos y va extrayendo conclusiones particulares de los mismos.el calculo probabilidades también emplea el método deductivo ya que en esencia es un razonamiento puramente matemático


  1. Las herramientas matemática y modelizadoras en as que se apoyara la inferencia estadística para su formulación y desarrollo la inferencia estadística emplea el método inductivo basándose en el conjunto de instrumental matemático-deductivo que le proporciona el calculo deprobabilidades.
    De manera muy general podemos decir que las etapas de toda investigación estadística son las siguientes:
    1.-definición de los objetivos que se persiguen con la investigación
    2.-recogida de los datos estadísticos para llegar a conocer los parámetros poblacionales
    a) encuesta censal:consiste en preguntar a todos el 100%
    b) encuesta muestral: consiste en investigar solo una parte del todo este asu ves es de un costo reducido,un corto periodo d ejecución en comparación con los censos, y la calidad de los datos observados puede controlarse mejor que en estos al ser volúmenes mas reducidos.
    Los resultados obtenidos se infieren al total de población.

    3.-descripción y estimación de los parámetros poblacionales
    La estadística descriptiva y el estudio de los hechos económicos Vista la evolución histórica de la estadística descriptiva podemos concluir con las siguientes reflexiones:

    1.- el origen de la palabra estadística, en términos filológicos, estadista que proviene asu ves del latín estatus
    2.- es una estadística económica que no contiene incertidumbre con lo que esta ausenta la probabilidad como medida de aquella
    3.-enseña como debe hacer un análisis primario y básico de un conjunto de datos que provienen de haber efectuado una instigación censal o muestral de un determinado fenómeno económico.
    El calculo de probabilidades como herramienta matemática de inferencia estadística. la estadística moderna
    La unión de ambas tendencias se produce a principios del siglo xx, consolidándose a lo largo del mismo por lo que conocemos como la inferencia estadística aplicada ala económica cuyo estudio requiere un conocimiento previo del cuerpo fundamental del calculo de probabilidades ya que nos proporcionara los instrumentos matemáticos necesarios para que, siguiendo la lógica inductiva, las conclusiones de una muestra las generalicemos ala población ala que pertenece.

La inferencia estadística como método de estudio de los hechos económicos

Dentro del desarrollo de la inferencia hay que considerar tres corrientes metodologìcas
v la inferencia clásica que arranca con Laplace gauss
v inferencia bayeciana la esencia del enfoque bayeciano esta en su famoso teorema que combina todo tipo de información priori sobre los distintos estados de la naturaleza con la información muestral en sentido clásico para obtener o inferir el modelo de distribución a posteriori.
v tercera corriente de enorme aplicación en el campo económico-empresarial es lo que se conoce como teoría de la decisión función de perdida en el que se apoya el decisor para cuantificar sus expectativas y racionalizar el tratamiento de la incertidumbre económica.
No cabe duda que la aparición y difusión de los potentes ordenadores personales ha revolucionado la aplicación y difusión de los métodos estadísticos aplicados ala economia.existen multitud de aplicaciones de fácil manejo que permiten dar un tratamiento descriptivo aun conjunto de datos económicos en un tiempo record.
Distribuciones de frecuencias unidimensionales

Conceptos fundamentales
Se entiende por población, universo 0 colectivo cualquier conjunto de personas, objetos, animales, plantas, instituciones 0 entes en general que son portadores de una serie de características que nos interesa estudiar.

Deben de estar definidas con absoluta precisión se clasifican en finitas e infinitas
Muestra: todo subconjunto representativo de la población
Atributo: es toda característica poblacional no susceptible de ser medida numéricamente una escala nominal cuando los números que le asignamos solo se emplean para diferenciar las distintas categorías.
Variables: son las características poblacionales susceptibles de tomar valores numéricos a los que se les pueda aplicar 10· que se conocen como escalas de intervalos y de razón 0 proporción las variables también pueden ser discretas 0 continuas según tomen un mimero finito 0 infinito numerable, 0 bien infinito no numerable de
Valores en un determinado intervalo de su campo de variaci6n.

tareas a desarrollar en las grandes etapas de la investigación estadística


Grafico etapas y tareas de toda investigación estadística





1:ETAPA: DEFINICION DE OBJETIVOS


Tareas:

• Identificaci6n de características cualitativas 0 cuantitativas que se desean estudiar.
• Definici6n de la poblacion portadora de las características a investigar.
• Identificar el marco 0 listado de unidades poblacionales especificando sus soportes (magnético, papel, documentos, etc.) y su accesibilidad.
• Decidir si la investigaci6n va a ser censal 0 muestral determinando tamaño de la muestra y presupuesto necesario


Especificar el ámbito del estudio y la forma de recoger los datos:
entrevistas personales, por correo, por teléfono mixtas.




2:Etapa: Recogida de los datos estadísticos


Tareas:
• Diseño del cuestionario
• Diseño muestral de acuerdo con el marco disponible
• Diseño del material auxiliar de la encuesta
• Recogida de los datos.
• Tratamiento de los datos.





3:Etapa: Estimación y descripción de los parámetros poblacionales especificados en los objetivos

Tareas:
• Análisis descriptivo primario.
• Estimaci6n de errores muéstrales y no muéstrales.
• Análisis especiales multivariantes.

LOS TIPOS DE MUESTREO QUE SE ESTUDIAN SON:

1.-MUESTREO ALEATORIO SIMPLE (M.A.S)
2.-MUESREO ESTATIFICADO
3.-MUESTREO POR CONGLOMERADOS
4.-MUESTREO SISTEMATICO
5.-MUESTREO POLIETAPICO O COMPLEJO
6.-POR ESTAS RAZONES EN LA PRACTICA HAY QUE ACUDIR AL MUESTREO POLIETAPICO O COMPLEJO
7.-MUESTREO NO PROBABILISTICO

LA UNICA VENTAJA DE UTILIZAR UN MUESTREO NO PROBABILISTICO OR CUOTAS ES QUE ABARATA MUCHO LA RECOGIDA DE INFORMACION


jueves, 8 de octubre de 2009

TEMARIO

FACULTAD DE CONTADURÍA Y CIENCIAS ADMINISTRATIVAS

TERCER SEMESTRE




PROGRAMA DE LA ASIGNATURA ESTADÍSTICA I CLAVE:

PLAN 2002 CRÉDITOS: 10

LICENCIATURA: TRONCO COMÚN SEMESTRE: 3°

ACADEMIA: MATEMÁTICAS HRS. CLASE: 2

REQUISITOS:NINGUNO HRS. SEMANA: 5

TIPO DE ASIGNATURA OBLIGATORIA X OPTATIVA


OBJETIVO GENERAL DEL CURSO:
AL FINALIZAR EL CURSO EL ALUMNO APLICARA Y EVALUARA LOS PRINCIPIOS ESTADÍSTICOS PARA RESOLVER PROBLEMAS GENERALES.


TEMAS:
HORAS SUGERIDAS


I INTRODUCCIÓN. 5

1.1 La estadística, Clasificación y Objetivos
1.2 Definición de Estadística Descriptiva
1.3 Escalas de Medida
1.4 La población, Muestra, Tipos de muestreo
1.5 Casos de aplicación

II PRESENTACIONES ESTADÍSTICAS Y ANÁLISIS 8

Introducción
2.1 Organización de datos
2.2 Distribuciones de Frecuencias
2.2.1 Rango
2.2.2 Frecuencia
2.2.3 Intervalos de clase
2.2.4 Límites reales de clase
2.3 Tamaño de un intervalo de clase
2.4 Marca de Clase
2.5 Frecuencia Relativa
2.6 Frecuencia Relativa Acumulada
2.7 Distribuciones Empíricas
2.8 Gráficas
2.8.1 Histogramas
2.8.2 Polígonos de Frecuencia
2.8.3 Frecuencia Relativa
2.8.4 Frecuencia Acumulada
2.8.5 Pareto
2.9 Casos de aplicación

III MEDIDAS DE TENDENCIA CENTRAL 8

Introducción
3.1 Media Aritmética
3.2 Media Ponderada
3.3 Media Geométrica
3.4 Media Armónica
3.5 La Mediana
3.6 La Moda
3.7 La Relación entre la Media, Mediana y Moda
3.8 Cuartiles, Deciles y Percentiles
3.9 La Media Aritmética para Datos Agrupados
3.10 La Mediana para Datos Agrupados
3.11 La Moda para Datos Agrupados
3.12 Cuartiles, Deciles, Percentiles para Datos Agrupados
3.13 Gráficas
3.14 Casos de aplicación

IV MEDIDAS DE VARIABILIDAD 10

Introducción
4.1 Rango
4.2 Rangos Modificados para datos no agrupados y agrupados
4.3 La Varianza y Desviación Estándar para datos no agrupados y agrupados
4.4 Uso de la Desviación Estándar para datos no agrupados y agrupados
4.5 Coeficiente de Variación
4.6 Coeficiente de Asimetría
4.7 Curtosis
4.8 Casos de aplicación

V PROBABILIDAD 24

5.1 Introducción
5.2 Conceptos y Definiciones
5.3 Enfoques de la Probabilidad
5.4 Técnicas de conteo
5.5 Independencia y Dependencia Estadística
5.6 Reglas de la Probabilidad
5.7 Teorema de Bayes
5.8 Casos de aplicación

VI VARIABLES ALEATORIAS Y DISTRIBUCIONES DE PROBABILIDAD 20

6.1 Introducción
6.2 Conceptos y Definiciones
6.3 Distribuciones probabilidad discreta
6.3.1 Binomial
6.3.2 Poisson
6.3.3 Hipergeométrica
6.4 La distribución de Poisson como una aproximación a la Binomial
6.5 Distribución de Probabilidad Continua
6.5.1 Introducción
6.5.2 Conceptos y Definiciones
6.5.3 La distribución Normal y distribución Normal Estandarizada
6.5.4 La distribución normal como una aproximación de la Binomial
6.6 Distribución Uniforme
6.7 Casos de aplicación

EVALUACIÓN
TOTAL 75





BIBLIOGRAFÍA BÁSICA:


1.-
CASTILLO PADILLA J. GÓMEZ ARIAS J. (1998), Estadística Inferencial Básica, Ed. Iberoamericana.
2.-
BERENSON, LEVINE, KREHBIEL (2006) (
(2006) (4a Ed), Estadística para Administración, Prentice Hall
3.-
LEOANRD KASMIER (1999), Estadística Aplicada a la Administración y Economía, Ed. Mc. Graw Hill.
4.-
LIND D. MASON R., MARSHAL W., (2001), Estadística para la Administración y Economía, Ed. Mc. Graw Hill.
5.-
LINCOLN L. CHAO. (2002), Estadística para las Ciencias Administrativas, Ed. Mc. Graw Hill.
6.-
LEVIN I. RICHARD, (1999), Estadística para Administradores, Ed. Pearson.
7.-
LOHR L. SHARON (2000), Muestreo: Diseño y Análisis, Ed. Thomson.
8.-
GONZALEZ SANTOYO F. Probabilidad y Estadística para la Gestión Empresarial, Ed. FEGOSA.
9.-
TRIOLA F. MARIO,(2000), Estadística Elemental, Ed. Pearson.
10.-
WALPOLE, MYERS., (2001), Probabilidad y Estadística, Ed. Pearson.
11.-
MENDENHAL. SINCICH, (2000), Probabilidad y Estadística, Ed. Prentice Hall.
12.-
MASSON, LIND, (1999), Estadística para Administración y Economía, Ed. Alfaomega.
13.-
DENISS D. WACKERLY, MENDENHALL W. SCHEAFFER, (1999), Estadística Matemática con Aplicaciones Ed. Thomson.
14.-
JHONSON R. KUBY PATRICIA, (1999), Estadística Elemental lo Esencial, Ed. Thomson.


BIBLIOGRAFÍA COMPLEMENTARIA:
1.-
ATO MANUEL Y LÒPEZ JUAN J., Fundamentos de Estadística con SYSTAT, Mèxico; Addison Wesley Iberoamericana 1996, 630 pp
2.-
BRIGHTAM H. y SCHNEIDER H.,Statistics for Business Solving, U. S. A.; .; South-Western, 1992, 794 pp
3.-
HANKE JOHN. E. y REITSCH Arthur G., Estadística para Negocios, México; Irwin McGraw-Hill, 1997, 955 pp.
4.-
KAZMIER L. Y A. DIAZ MATA, Estadística Aplicada a la Administración y Economía, México: McGraw-Hill, 1998. 411 pp.
5.-
KOHLER HEINZ, Estadística para Negocios y Economía, México; Cecsa, 1996, 1052 pp.
6.-
JOHNSON R., Estadística Elemental, México; Trillas, 1990, 516 pp.
7.-
MENDENHALL W. y R.L.SHEAFFER, Estadística Matemática con Aplicaciones, México; Iberoamérica, 2002, 854 pp.
8.-
SPIEGEL M., Estadística, (2a. ed.), México; McGraw-Hill, 1991, 556 pp
9.-
WEIMER RICHARD E., Estadística, México; Cecsa, 1996, 842 pp.


TÉCNICAS DE ENSEÑANZA SUGERIDAS:
Exposición oral (X)

Exposición audiovisual (X)

Ejercicios dentro de clase (X)

Seminarios (X)

Lecturas obligatorias (X)

Trabajos de investigación (X)

Prácticas de taller o laboratorio (X)

Prácticas de campo (X)

Otras (X)


ELEMENTOS DE EVALUACIÓN:
Exámenes parciales (X)

Exámenes finales (X)

Trabajos y tareas fuera del aula (X)

Participación en clase (X)

Asistencia a prácticas (X)

Otras (X)





















PERFIL PROFESIOGRÁFICO DEL DOCENTE:
ESTUDIOS REQUERIDOS:
TENER LA LICENCIATURA EN ADMINISTRACIÓN, CONTADURÍA, INFORMÁTICA, MATEMÁTICAS, ACTUARÍA O INGENIERÍA.


EXPERIENCIA PROFESIONAL DESEABLE:
TENER EXPERIENCIA EN EL ÁREA DE PLANEACIÓN, INVESTIGACIÓN O SIMILARES, DURANTE TRES AÑOS COMO MÍNIMO.
OTROS REQUERIMIENTOS:
ACREDITAR CURSOS DE DIDÁCTICA. TENER EXPERIENCIA EN LA IMPARTICION DE ASIGNATURAS DEL ÁREA DE MATEMÁTICAS.