La estadistica conceptos basicos

  • Published on
    01-Dec-2014

  • View
    8.040

  • Download
    9

DESCRIPTION

 

Transcript

1. UNIVERSIDAD PERUANA DE LAS AMRICASFACULTAD DE CIENCIAS EMPRESARIALESPROGRAMA DE ESTUDIOS PROFESIONALES POR EXPERIENCIA LABORALESTADSTICA APLICADA A LOS NEGOCIOS IUNIDAD N I:LA ESTADSTICA: CONCEPTOS BSICOS.Profesor:Tito R. Navarro GuerreroLA ESTADSTICAEs una ciencia que nos proporciona un conjunto de mtodos y tcnicas que nos permite recolectar, clasificar, analizar, presentar y describir datos en forma adecuada a fin de tomar decisiones frente a una incertidumbre o predecir o afirmar algo de la poblacin en estudio.Divisin de la EstadsticaEst dividida en dos grandes reas:Estadstica DescriptivaEs el conjunto de mtodos estadsticos que implican la recoleccin, clasificacin, presentacin y caracterizacin de un conjunto de datos, con el fin de analizarlos y describirlos.Estadstica InferencialEs el conjunto de mtodos y/o tcnicas que nos proporciona la teora necesaria para afirmar algo acerca de la poblacin o tomar decisiones generales en base a una informacin parcial obtenida mediante tcnicas descriptivas. Es la que permite tomar decisiones y/o predecir fenmenos con respecto a las caractersticas de la poblacin en estudio. POBLACINEs el conjunto de todos los elementos (personas, animales, plantas, objetos, etc.) que contienen una o ms caractersticas observables. Cada elemento de una poblacin de le denomina unidad estadstica o unidad anlisis. Por ejemplo: los estudiantes del programa PEL de la Universidad Peruana de las Amricas; los trabajadores del Banco de la Nacin; los automviles que circulan en Lima Metropolitana y el Callao; etc. son ejemplos de poblaciones.MUESTRAEs una parte representativa o subconjunto representativo de la poblacin. Al nmero de elementos de la muestra se le denomina tamao de la muestra y al procedimiento de obtener la muestra se le llama muestreo. Por ejemplo: seleccionar a 60 estudiantes del programa PEL de la Universidad Peruana de las Amricas; contar el nmero de vehculos que circulan por la avenida Garcilaso de la Vega en la cuadra 18 entre las 10 y 11 de la maana del da 20 de Abril del 2010; seleccionar 100 amas de casa del distrito de San Juan de Lurigancho; etc. son ejemplos de muestras. PARMETROEs una medida descriptiva que resume alguna caracterstica de la poblacin. Los parmetros ms utilizados son: La media poblacional (), la varianza poblacional (2), la desviacin estndar poblacional (), la proporcin poblacional (). Por ejemplo: Promedio mensual del nmero de pares de zapatos producidos en Lima Metropolitana y el Callao del ao 2009.ESTADGRAFO O ESTADSTICOEs una medida resumen o caracterstica de la muestra. Los estadsticos ms utilizados son: La media muestral ( x ), la varianza muestral (s2), la desviacin estndar muestral (s), la proporcin muestral (p). El valor del estadstico de la muestra se usa para estimar el valor del parmetro poblacional cuando ste se desconoce. Por ejemplo: Promedio mensual del nmero de pares de zapatos producidos por el 25 %de los productores de zapatos en Lima Metropolitana y el Callao del ao 2009.DATOS Son valores recopilados de cualquier nmero de observaciones relacionadas sobre una o ms caractersticas de una poblacin o de una muestra.FUENTES DE DATOS Son los registros existentes y/o mtodos (encuestas, estudios experimentales, etc.) que sirven para obtener informacin con fines de trabajo estadstico.VARIABLESSon caractersticas definidas sobre las unidades de anlisis que conforman una poblacin y que pueden tomar diferentes valores. Todas las variables tienen una escala de registro llamada unidad de medida. Por ejemplo: edad de los alumnos del programa PEL de la Universidad Peruana de las Amricas; nmero de hijos de los trabajadores del Banco de la Nacin; ingreso mensual de los trabajadores del Hospital Rebagliati; peso de los recin nacidos del Hospital Materno-Infantil San Bartolom; etc.TIPOS DE VARIABLESSe dividen en: Categricas y cuantitativas.1.- Variables Categricas o CualitativasSon aquellas que expresan una categora, cualidad o atributo. Sus datos se expresan mediante una palabra. Por ejemplo: estado civil, lugar de nacimiento, profesin, etc. Las variables categricas pueden ser: Nominales u Ordinales.Variables Categricas Nominales.-son aquellas que se expresan en categoras sin ningn tipo de orden o clasificacin. No hay jerarquas. Por ejemplo: estado civil, sexo, nacionalidad, etc.Variables Categricas Ordinales.-son aquellas que se expresan en categoras con algn tipo de clasificacin u orden. Por ejemplo: clase social, tipos de educacin, rango de los militares, etc.2.- Variables CuantitativasSon aquellas que se expresan por una cantidad. El dato puede resultar de la operacin de contar o medir. Por ejemplo: ingreso familiar, nmero de hijos, produccin mensual de una empresa, etc.Las variables cuantitativas pueden ser: Discretas o ContinuasVariables Cuantitativas Discretas.- son aquellas que resultan de la operacin de contar y se representan por nmeros enteros o naturales. Por ejemplo: nmero de hijos por familia, nmero de personas por vivienda, nmero de trabajadores por empresa, etc.Variables CuantitativasContinuas.- son aquellas que se obtienen por medicin o comparacin con un patrn de medida y se representan por cualquier nmero real. Por ejemplo: tiempo de servicios, ingresos monetarios, edad, peso, estatura, etc. ESCALAS DE MEDICINEs un instrumento de medida con el que se asigna valores (categoras o nmeros) a las unidades estadsticas para una variable definida.TIPOS DE ESCALAS DE MEDIDASe dividen en: Nominal, Ordinal, De intervalo yDe razn.Escala Nominal.- son los nombres o clases que se utilizan para organizar los datos en categoras separadas y distintas. Por ejemplo: la variable sexo asigna a la persona dos valores masculino y femenino; la variable estado civil asigna a la persona varios valores como soltero, casado, conviviente, viudo y divorciado; etc. Usando computadoras, a los valores de la variable en esta escala se les asigna nmeros que se les llama etiquetas (labels) y como la asignacin que se hace de ellas es por la informacin disponible o por el criterio de quienes las eligen, la agrupacin puede variar. Por ejemplo: en la variable forma de ingreso a una empresa podra considerarse el siguiente etiquetado: por concurso (1), por invitacin (0) o bien: por concurso (3), por invitacin (2), por prcticas profesionales (1), otras formas (0); y se observa que el orden de los etiquetados no afecta la informacin.Escala Ordinal.- son las modalidades o valores de la variable que se pueden ordenar en forma ascendente o descendente. Por ejemplo: la variable niveles de educacin asigna a la persona varios valores como inicial, primaria, secundaria y superior; la variable estatus econmico asigna a la persona valores como clase baja, clase media baja, clase media, clase media alta, clase alta; etc.En este tipo de escala tambin se usan etiquetas para asignar valores a la variable cuando se usan computadoras. Escala de intervalo.- son los valores de la variable que se les puede asignar nmeros que, adems de poseer las caractersticas de las escalas ordinales, permiten establecer diferencias entre ellos; sin embargo, el punto cero es arbitrario y no se trata de un cero absoluto. Por lo tanto, los valores no pueden compararse usando razones. Por ejemplo: la variable temperatura, en grados Celsius, asigna a las personas valores como 36.8 , 37.0 , 38.6, etc., los cuales permiten establecer diferencias entre ellas pero no podemos decir que la persona con 40 de fiebre sea dos veces ms afiebrada que la que tiene 20. Escala de razn.- llamada tambin escala de cociente o de proporcin, son los valores de la variable que se les puede asignar nmeros que, adems de poseer las caractersticas de las escalas de intervalo, pueden compararse usando razones; es decir, tienen cero absoluto. Por ejemplo: las variables edad, peso, estatura, etc. asignan a las personas valores que, adems de poder establecer diferencias entre ellas, se pueden hacer comparaciones de razones ya que una persona puede tener el doble de edad, el doble de peso o el doble de estatura que otra persona; asimismo, las variables ingreso, inventario de artculos, etc. asignan valores dentro de una escala de razn.ORGANIZACIN Y PRESENTACIN DE DATOSRepresentacin tabular de la informacin de variables de tipo categricoCuando la variable es de tipo categrico, la organizacin y presentacin de los datos se hace de la siguiente manera:1)Se determina el nmero de clases que la variable est tomando.2)Se obtienen las frecuencias absolutas (fi) para cada clase, las cuales son el nmero de veces que se presenta cada clase.3)Se obtienen las frecuencias relativas (hi) para cada clase, las cuales estn definidas por el cocientefin, donde n es el nmero total de datos.4)Se obtienen las frecuencias relativas porcentuales (%) para cada clase, las cuales son las frecuencias relativas multiplicadas por 100.En el siguiente cuadro se presenta la tabla de frecuencias de los resultados de un estudio de mercado a 150 hogares de la clase media del distrito de San Borja para conocer la marca de jabn de tocador que usan.Cuadro 1. Marca de jabn de tocador que usan los hogares de la clase media de San BorjaMarca de jabnN de Hogares (fi)Frecuencia relativa (hi)Frecuencia relativa porcentual (hix100%)Camay500.3333Palmolive250.1717Rexona180.1212Lux250.1717Nivea150.1010Henio de Pravia170.1111Total1501.00100Representacin grfica de la informacin de variables de tipo categricoPara representar grficamente un conjunto de datos estadsticos referidos a variables de tipo categrico se utilizan diferentes formas grficas, siendo las ms usadas: el grfico de barras y el grfico de sectores circulares.El grfico de barras son rectngulos, separados unos de otros, donde cada uno representa una clase que toma la variable y cuya altura corresponde a las frecuencias (absolutas o relativas) de dicha clase. Estos grficos pueden ser: de barras simples, de barras compuestas y de barras mltiples (dobles, triples, etc.).El grfico de sectores circulares son crculos, enteros o entrecortados, donde las categoras o clases que toma la variable estn representadas por un sector circular que es un rea circular igual al rea total del crculo multiplicada por la frecuencia relativa de la clase que toma la variable. Cuando este tipo de grfica se representa en un espacio tridimensional se le llama de pastel. En la prctica, estos grficos de sectores circulares se obtienen dividiendo el crculo, desde su centro, en un nmero de sectores circulares igual al nmero de clases que toma la variable, y en donde cada sector circular es el valor del ngulo central del crculo que se obtiene mediante la siguiente frmula: x= 360 (hi), para todo i. A continuacin se dan algunos ejemplos de estos grficos.Grfico 1. Barras simplesNmero de hogares que usan jabn de tocador en San Borja604020 camaypalmolive rexonaluxnvea heno de praviaGrfico 2. Barras doblesTipos de aceites consumidos en el ao 2007 y 200860%40%20% 2007 2008Leyenda:Aceite vegetal:Aceite compuesto: Grfico 3. Barras compuestasTipos de aceites consumidos en el ao 2007 y 2008 100% 50% 2007 2008Leyenda: Aceite vegetal: Aceite compuesto:Grfico 4. Grfico circularPorcentaje de hogares que usan jabn de tocador en San Borja henio de pravia (11%)nvea (10%) Camay (33%) lux (17%)PPalmolive (17%) rexona (12%)Representacin tabular de la informacin de variables de tipo cuantitativo discretoLa forma ms simple de organizar las observaciones de una variable discreta, cuando algunas de ellas se repiten, consiste en ordenar los valores diferentes que toma la variable en forma ascendente y luego proceder a construir una tabla de distribucin de frecuencias de tales observaciones. Las frecuencias que se obtienen son como las obtenidas anteriormente (absolutas, relativas y relativas porcentuales) pero adems se incluyen las llamadas frecuencias acumuladas de las antes mencionadas (absolutas acumuladas, relativas acumuladas y relativas porcentuales acumuladas), las cuales se obtienen acumulando sucesivamente las frecuencias de los valores anteriores a la del valor que se desea obtener la acumulacin.En el siguiente cuadro se presenta una tabla de distribucin de frecuencias de los resultados de un estudio a 200 hogares del Callao para ver el nmero de celulares que tienen.Cuadro 2. Nmero de celulares que hay en los hogares del CallaoN de celulares(xi)Nmero de hogares (fi)Frecuencias relativas(hi)Frecuencias relativas porcentuales(hix100%)Frecuencias absolutas acumuladas(Fi)Frecuencias relativas acumuladas(Hi)Frecuencias porcentualesAcumuladas(Hix100%)0300.1515300.15151900.45451200.60602500.25251700.85853300.15152001.00100Total2001.00100Representacin grfica de la informacin de variables de tipo cuantitativo discretoUn conjunto de datos estadsticos referidos a variables de tipo discreto se representan grficamente mediante una grfica de lneas cuyo eje horizontal corresponde a los diferentes valores de la variable y el eje vertical a las frecuencias correspondientes de dichos valores diferentes, la cual se representa por un segmento vertical levantado desde cada valor diferente; tal como se muestra a continuacin.Grfico 5. Nmeros de celulares que hay en los hogares del Callao N de hogares 100 75 50 25 0 1 23 CelularesRepresentacin tabular de la informacin de variables de tipo cuantitativo continuoEl procedimiento para construir una tabla de distribucin de frecuencias cuando la variable es de tipo continuo es el siguiente:1)Determinar el rango R de la variable, el cual es la diferencia del valor mximo de los datos con el valor mnimo de los mismos; es decir: R=xmx-xmn2)Determinar el nmero K de intervalos o clases, el cual se obtiene aplicando por lo general la regla de Sturges que est dada por: K=1+3.3 log n dondeKes el nmero de intervalos ynes el total de las observaciones, redondeando el valor al entero ms cercano3)Determinar el tamao o amplitud W de los intervalos, el cual es la longitud del intervalo de clase y se obtiene como el cociente del rango entre el nmero de intervalos; es decir:W= RK Si el nmero resultante no es exacto se redondea al valor superior ms cercano segn las cifras decimales de los datos.4)Determinar los lmites de cada intervalo, donde el lmite inferior del primer intervalo es el valor mnimo de los valores observados y el lmite superior de este primer intervalo se obtiene sumando la amplitud del intervalo a dicho valor mnimo; este valor sera su vez el lmite inferior de la clase siguiente y as se obtienen los dems lmites superiores e inferiores como se obtuvo el primero. Se usa preferentemente la notacin de intervalos cerrados por la izquierda y abiertos por la derecha, excepto el ltimo que se considerar cerrado tanto por la izquierda como por la derecha.5) Finalmente, se procede al conteo y registro de los datos para as construir la tabla de distribucin de frecuencias respectiva.Cuando los datos discretos presentan una gran dispersin que hara utilizar un gran nmero de clases, se prefiere procesarlos como datos continuos.MARCAS DE CLASEEs el punto medio xide los valores extremos de cada intervalo de clase; es decir:Xi = xmx+xmn2 Representacin grfica de la informacin de variables de tipo cuantitativo continuoA partir de la tabla de distribucin de frecuencias de variables continuas se pueden construir los siguientes grficos: los histogramas de frecuencias, los polgonos de frecuencias y las ojivas.El histograma de frecuencias es una representacin grfica medianterectngulos adyacentes donde en el eje horizontal se representan los intervalos de clase y en el eje vertical serepresenta los valores de las frecuencias (absolutas o relativas).El polgono de frecuencias es un polgono asociado a las frecuencias absolutas o relativas que se forma uniendo los puntos medios de los rectngulos del histograma de frecuencias, incluyendo los dos intervalos adicionales a los intervalos extremos, uno en el lado izquierdo y el otro en el lado derecho.La ojiva es un polgono asociado a las frecuencias absolutas acumuladas o relativas acumuladas que se forma de manera anloga a la del polgono de frecuencias A continuacin se muestran ejemplos de lo anteriormente expuesto:Cuadro 3. Ventas (en kgs.) de pollo en un establecimiento del mercado central de Lima Metropolitana Ventas(kgs.)Marcas de clase (xi)Frec.absol.(fi)Frec.abs. acum.(Fi)Frec.relat.(hi)Frec. rel. acum.(Hi)Frecuenciaporcentual(hix100%)Frec. porc.acumulada(Hix100%)[22 27>24.5550.140.141414[27 32>29.57120.200.342034[32 37>34.512240.340.683468[37 42>39.57310.200.882088[42 47>44.53340.090.97997[47 - 52]49.51350.031.003100Total351.00100Grfico 6. Ventas (en kgs.) de pollo en un establecimiento del mercado central de Lima Metropolitana Das10 5 22 27 32 37 42 47 52VentasGrfico 7. Ventas (en kgs.) de pollo en un establecimiento del mercado central de Lima Metropolitana Das 10 517 22 27 32 37 42 47 52 57 VentasGrfico 8. Ventas (en kgs.) de pollo en un establecimiento del mercado central de Lima MetropolitanaDas4030201017 22 27 32 37 42 47 52 57VentasObservaciones:Cuando el tamao de la muestranes mayor o igual a 30 (n30), las frecuencias relativas (hi) se pueden tomar como aproximaciones de las probabilidades de que un valor de la variable considerada en la poblacin sea la clase de la variable categrica o sea el valor de la variable discreta o bien pertenezca al intervalo de clase de la variable continua respectivamente donde est dicha frecuencia relativa. Matemticamente, esto quiere decir que:hiP (a =C)bien hi P(b = X) bienhi P(c [xi-1, xi]) donde a es el valor de la clase C de la variable categrica, b es el valor Xde la variable discretayces un valor que est en el intervalo [xi-1, xi] de la variable continua.El rea total que determinan los rectngulos del histograma de frecuencias es igual al rea que est bajo el polgono de frecuencias en las variables cuantitativas continuas.PRCTICA DIRIGIDA N 1LA ESTADSTICA: CONCEPTOS BSICOS Profesor:Tito R. Navarro GuerreroIdentifique y seale la poblacin y muestra en cada una de las siguientes proposiciones:Obtener el nivel educativo de 150 trabajadores de la Telefnica.Obtener el nmero de llamadas que ingresan a Radio Programas del Per sobre opinin pblica, el da 20 de Marzo del presente ao, durante 10 minutos dentro del horario de 4 a 5 de la tarde.Conocer la marca de pasta de dientes que usan 180 hogares del distrito de Lince.Conocer los aos de servicios eingresos de 300 trabajadores administrativos y de servicios de los hospitales de salud de Lima Metropolitana y el Callao.Obtener el porcentaje de desempleo de 2 000 personas mayores de 20 aos de Lima Metropolitana y el Callao.2.Clasifique las siguientes variables por su escala de medicin y luego categorcelas ya sea directamente y/o en forma codificada (etiquetada). a) tiempo de servicios. b)nivel educativo.c)color de ojos.d)sexo.e) temperatura ambiental.e)nmero de hijos por familia. f)estado civil. g) gastos en consumo de agua. h)tiempo de fabricacin de camisas.k) peso. l)produccin de aceite comestible. ll)ventas de gas natural para vehculos. 3.Clasifique las siguientes variables por su tipo: cualitativa (nominal u ordinal) o cuantitativas (discreta o continua). a) marcas de impresoras.b)la estatura (en cms.) de nios de un centro educativo.c) consumo (en kws.) de energa elctrica por vivienda. d)los alumnos poseen o no calculadoras cientficas.e)nmero mensual de matrimonios.f) la vida til (en horas) de los focos de 100 watts.g)afiliacin poltica de los congresistas peruanos.4.Clasifique las variables del ejercicio 2 por su tipo: cualitativa (nominal u ordinal) o cuantitativa (discreta o continua).5.Se realiz un estudio a 180 hogares del distrito de Lince para conocer la marca de pasta dental que usan. Los resultados fueron los siguientes:Colgate 41, Kolynos 70, Dento 35, Splendid 20, Otros 10. a) Identifique la variable y su tipo, as como la poblacin y la muestra.b) Construya una tabla de frecuencias de la informacin obtenida.c) Construya el grfico de barras de las frecuencias absolutas. d) Construya un grfico circular con las frecuencias relativas porcentuales.6.En Junio del 2005 y del 2006, la inversin extranjera en el Per de acuerdo al sector de destino fue como sigue:Comunicaciones 45% y 48%, Minera 20% y 17%, Industria 12% y 15%, Energa 8% y 7%, Finanzas 6% y 5%, Comercio 5% y 4%, Otros 4% y 4%. a) Identifique la variable medida y su tipo, as como la poblacin y la muestra. b) Construya un grfico de barras para comparar la informacin obtenida. 7.Se hizo una encuesta a 26 trabajadores de una empresa de manufactura para conocer su nivel educativo: primaria incompleta (PI), primaria completa (PC), secundaria incompleta (SEI), secundaria completa (SEC), superior incompleta (SUI), superior completa (SUC). Los resultados fueron los siguientes:PI, SEI, SEI, PC, SUC, SUI, SUI, SUI, PI, PI, SEI, SEC, SEC, SEI, PI, PI, PC, PC, PI, SEC, SEI, SUC, SUI, SEC, PC, SEI. a)Identifique la variable y su tipo, as como la poblacin y la muestra.b)Construya una tabla de distribucin de frecuencias de la informacin obtenida. c) Construya un grfico de barras y otro circular para la informacin obtenida.8.Se pregunt a 20 amas de casa sobre el nmero de celulares que hay en el hogar. Los resultados fueron: 0, 1, 1, 2, 3, 2, 1, 1, 1, 1, 2, 1, 3, 0, 2, 1, 2, 3, 1, 0. a)Identifique la variable y su tipo, as como la poblacin y la muestra b)Construya una tabla de distribucin de frecuencias de la informacin obtenida. c)Construya el grfico de lneas de las frecuencias absolutas. d)Cuntos hogares tienen a lo ms un celular? e)Qu porcentaje de hogares poseen hasta dos celulares?f)Qu porcentaje de hogares poseen ms de un celular?9.Los siguientes datos son el nmero de accidentes automovilsticos que ocurren en 35 cruces ms transitados de Lima Metropolitana durante el ltimo fin de semana del mes de Noviembre del 2002:4, 0, 1, 6, 1, 2, 5, 7, 2, 8, 5, 5, 6, 4, 7, 4, 6, 8, 6, 7, 5, 4, 8, 6, 8, 5, 6, 5, 6, 5, 4, 6, 5, 7, 3. a)Identifique la variable y su tipo, as como la poblacin y la muestra. b)Construya una tabla de distribucin de frecuencias de la informacin obtenida. c)Construya el grfico de lneas de las frecuencias relativas. d)Cuntos cruces ms transitados han tenido ms de5 accidentes?e) Qu porcentaje de cruces ms transitados han tenido menos de4 accidentes? f) Qu porcentaje de cruces ms transitados han tenido a lo ms 2 accidentes?10.Una agencia de empleos temporales registr el salario neto semanal de cincuenta trabajadores obteniendo los siguientes valores: 68.10 26.15 63.70 34.10 71.75 48.66 79.51 35.18 28.10 49.2438.18 32.15 29.90 60.12 47.11 53.33 40.26 31.17 29.66 35.0158.56 31.24 52.02 41.63 39.54 69.54 69.40 33.09 32.05 26.70 44.40 83.74 37.20 25.65 46.42 45.89 47.29 30.09 33.81 40.10 73.78 30.33 50.12 59.39 33.55 39.19 38.70 48.62 38.69 55.17 a) Identifique la variable y su tipo, as como la poblacin y la muestra. b) Construya la tabla de distribucin de frecuencias de la informacin obtenida.c) Construya el histograma y el polgono de las frecuencias absolutas.d) Construya la ojiva de las frecuencias relativas acumuladas.e) Interprete adecuadamente los resultados a partir de la tabla construida. 11.El consumo de agua, en metros cbicos, de 30 viviendas en el mes de Enero fue como sigue: 4.3 7.8 6.1 15.7 12.8 17.2 3.5 16.1 12.4 6.9 18.0 11.5 13.4 6.55.9 14.3 8.7 13.0 9.2 12.8 3.0 4.2 11.2 16.2 7.0 4.5 7.8 15.9 16.5 8.4. a) Identifique la variable y su tipo, as como la poblacin y la muestra.b) Construya la tabla de distribucin de frecuencias de la informacin obtenida. c) Construya el histograma y el polgono de las frecuencias relativas.d) Construya la ojiva de las frecuencias absolutas acumuladas. e) Interprete adecuadamente los resultados a partir de la tabla construida. 12.Se han tomado las ventas en miles de soles de 40 supermercados de nuestro pas correspondiente al mes de Octubre del ao pasado. Los resultados fueron: 168 160 168 175 175 160 165 154 163 165 168 168 158 149 160 161 162 166 163 159 178 169 158 163 171 170 165 150 167 164 162 165 163 156 174 165 173 172 168 168. a) Identifique la variable y su tipo, as como la poblacin y la muestra.b) Construya la tabla de distribucin de frecuencias de la informacin obtenida. c) Construya el histograma y el polgono de las frecuencias absolutas.d) Construya la ojiva de las frecuencias absolutas acumuladas.e)Interprete adecuadamente los resultados a partir de la tabla construida. 13.Los siguientes datos proporcionan los ingresos anuales en miles de dlares de 50 personas: 7.9 10.3 45.7 9.5 43.0 56.0 38.0 6.7 48.0 30.5 25.0 40.0 30.0 25.5 50.0 17.1 25.5 43.5 31.659.0 41.5 13.5 12.0 9.2 42.0 41.9 35.0 11.7 55.3 27.0 58.4 57.0 29.6 38.5 26.0 16.5 18.0 24.9 20.0 28.0 28.5 36.4 39.5 5.0 9.0 5.0 6.9 7.0 12.0 8.3. a)Identifique la variable y su tipo, as como la poblacin y la muestra.b)Construya la tabla de distribucin de frecuencias de la informacin obtenida.c)Construya el histograma y el polgono de las frecuencias relativas. d)Construya la ojiva de las frecuencias relativas acumuladas.e)Interprete adecuadamente los resultados a partir de la tabla construida.14.En la siguiente tabla de distribucin de frecuencias, un agente de seguros ha ordenado los datos mensuales correspondientes a la cantidad de dlares de las plizas de seguros que ha vendido durante los tres ltimos aos.Venta mensualFrecuenciaVenta mensualFrecuencia[10 000 12 000>2[18 000 20 000>6[12 000 14 000>4[20 000 22 000>8[14 000 16 000>7[22 000 24 000>2[16 000 18 000>5[24 000 26 000]1 a) Identifique la variable y su tipo, as como la poblacin y la muestra.b) Construya el histograma y el polgono de las frecuencias relativas. c) Construya la ojiva de las frecuencias relativas acumuladas. d) Interprete adecuadamente los resultados a partir de la tabla construida. ESTADSTICA APLICADAA LOS NEGOCIOS IUNIDAD N II:MEDIDAS DE TENDENCIA CENTRAL Y DE VARIACINProfesor: Tito R. Navarro GuerreroMEDIDAS DE TENDENCIA CENTRAL MUESTRALESSon valores de la variable que estn situados en el centro o alrededor del punto medio de un conjunto de datos. Este valor tambin se le denomina indicador estadstico o estadstico o estadgrafo.Las medidas de tendencia central ms importantes son: la media aritmtica, la mediana,la moda y los cuartiles. La media aritmtica o media muestral o promedio muestral.- es un valor o medida de tendencia central en una muestra de datos de variables cuantitativas que se toma como si fuera el valor que tuvieran cada uno de los datos obtenidos; es decir, una sustitucin o aproximacin de cada datomuestral, y se representa por el smbolo x. Por ejemplo,si los datos fueran 2, 3 y 4, entonces, se puede decir que cada unode ellos podra tomar el valor 3, ya que 2 +3 +43 =3+3+33. El valor 3 es la media aritmtica xdel conjunto {2, 3, 4} de datos muestrales. La mediana muestral.-es un valor o medida de tendencia central en una muestra de datos de variables categricas ordinales o cuantitativas que divide al conjunto de datos, previamente ordenados en forma creciente o decreciente, en dos partes iguales; es decir, el 50% de los datos ordenados estar a su izquierda y el otro 50% a su derecha, y se representa por el smbolo Me. Por ejemplo, el nmero 2.5es la mediana Me del conjunto{1, 1, 2, 3, 4, 5} de datos muestrales, ya que tres datos estn a su izquierda y los otros tres a su derecha.La moda muestral.-es un valor o medida de tendencia central en una muestra de datos de variables tanto categricas como cuantitativas que se repite con mayor frecuencia, y se representa por el smbolo Mo. Si el conjunto de datos tiene una moda se llama unimodal, si tiene dos modas se llamabimodal, y al conjunto de datos que tiene ms de dos modas se llamamultimodal. Por ejemplo, el nmero 1 es la moda Mo del conjunto{1, 1, 2, 3, 4, 5}de datos muestrales, ya queel 1 es el dato que ms se repite.Los cuartiles muestrales.-son valores o medidas de tendencia central en una muestra de datos de variables categricas ordinales o cuantitativas que dividen al conjunto de datos, previamente ordenados en forma creciente o decreciente, en cuatro partes iguales, y se representan por los smbolos Q1, Q2 y Q3, donde Q1 se llama primer cuartil, Q2 se llama segundo cuartil o mediana y Q3 se llama tercer cuartil.El primer cuartil o cuartil inferior muestral Q1.-es un valor o medida de tendencia central que supera a no ms del 25% de las n observaciones y que es superado por no ms del 75% de las n observaciones, previamente ordenadas. El segundo cuartil o cuartil medio muestral Q2.-es un valor o medida de tendencia central que coincide con el valor de la mediana Me, anteriormente descrita.El tercer cuartil o cuartil superior muestral Q3.-es un valor o medida de tendencia central que supera a n o ms del 75% de las n observaciones y que es superado por no ms del 25% de las n observaciones, previamente ordenadas.Frmulas para calcular la media aritmtica o media muestralxa) Para datos cuantitativos no agrupados x = xn,dondexes el valor del dato no agrupado,n es el total de los datos yel smbolosignifica sumar.b) Para datos cuantitativos agrupadosx =( xi fi )n,dondexies la marca de clase del intervalo i,nes el total de los datos y el smbolosignifica sumar los productos entre parntesis. En la prctica, para calcular el valor dela media muestral xpara datos cuantitativos agrupados se debe formar una columna en la tabla de los datos agrupados, despus de la columna de las frecuencias absolutas, donde se exprese losproductosxi fi,y luego sumar todos los valores de dicha columna. Este total ser elnumerador de la frmula dada. Procedimiento para calcular la mediana muestral Mea)Para datos categricos ordinales y cuantitativos discretos agrupados1) Se forma la columna de las frecuencias absolutas acumuladas.2) Se divide el totalnde los datos entre 2. 3) Se busca este valor en la columna de las frecuencias absolutas acumuladas.4) La mediana Me se encuentra en la clase donde se ubica el valor hallado. b)Para datos cuantitativos no agrupados1) Se ordenan los datos en forma creciente o decreciente.2) Si el nmero de datos es impar, la mediana Me es el valor que est situado exactamente a la mitad de los datos.3) Si el nmero de datos es par, la mediana Me es la media aritmtica de los dos valores que estn a la mitad del conjunto de datos ordenados.c)Para datos cuantitativos continuos agrupados 1) Se forma la columna de las frecuencias absolutas acumuladas. 2) Se divide el totalnde los datos entre 2. 3) Se busca este valor en la columna de las frecuencias absolutas acumuladas.4)La mediana Me se encuentra en el intervalo donde se ubica el valor hallado.5)Se calcula el valor de Me utilizando la siguiente frmula: Me= Li + A. [ n2F(Me-1)f(Me) ], donde Lies el lmite inferior del intervalo de clase donde se encuentra la mediana, A es la longitud del intervalo de clase donde se encuentra la mediana, F(Me 1)es la frecuencia absoluta acumulada del intervalo de clase anterior al intervalo de clase donde se encuentra la mediana yf(Me)es la frecuencia absoluta del intervalo de clase donde se encuentra la mediana.Procedimiento para calcular la moda muestral Moa)Para datos categricos (o cualitativos) nominales u ordinales Se determina la categora (o las categoras) que ms se repite (o repiten).b)Para datos cuantitativos no agrupados y cuantitativos discretos agrupados Se determina el valor (o los valores) del conjunto de datos que ms se repite (o repiten).c)Para datos cuantitativos continuos agrupados 1)Se identifica el intervalo de clase con mayor frecuencia absoluta (clase modal). 2)La moda Mo se encuentra en la clase modal. 3)Se calcula el valor de Mo utilizando la siguiente frmula: Mo= Li + A. [d1d1 +d2],donde Lies el lmite inferior de la clase modal, Aes la longitud de la clase modal, dies la diferencia de las frecuencias absolutas de la clase modal con la del intervalo de clase anterior yd2es la diferencia de las frecuencias absolutas de la clase modal con la del intervalo de clase siguiente. Procedimiento para calcular el primer cuartil muestral Q1 a)Para datos categricos ordinales y cuantitativos discretos agrupados 1) Se forma la columna de las frecuencias absolutas acumuladas.2) Se divide el total n de los datos entre 4.3) Se busca este valor en la columna de las frecuencias absolutas acumuladas. 4) El primer cuartilQ1 se encuentra en la clase donde se ubica el valor hallado.b) Para datos cuantitativos no agrupados 1) Se ordenan los datos en forma creciente o decreciente. 2) Si el nmero de datos es impar, el primer cuartil Q1es el valor que est situado en la cuarta parte del conjunto de los datos ordenados.3) Si el nmero de datos es par, el primer cuartil Q1 es la media aritmtica de los dos valores que estn en la cuarta parte de los datos ordenados.c)Para datos cuantitativos continuos agrupados 1) Se forma la columna de las frecuencias absolutas acumuladas.2) Se divide el total n de los datos entre 4.3) Se busca este valor en la columna de las frecuencias absolutas acumuladas.4) El primer cuartil Q1 se encuentra en el intervalo donde se ubica dicho valor. 5) Se calcula el valor de Q1 utilizando la siguiente frmula: Q1 = L1 +A. [ n4 + F(Q1- 1)fQ1 ],dondeLies el lmite inferior del intervalo de clase donde se encuentra el primer cuartil, A es la longitud del intervalo de clase donde se encuentra el primer cuartil, F(Q1- 1)es la frecuencia absoluta acumulada del intervalo de clase anterior al intervalo de clase donde se encuentra el primer cuartil yfQ1 es la frecuencia absoluta del intervalo de clase donde se encuentra el primer cuartil.Procedimiento para calcular el segundo cuartil muestral Q2Como el segundo cuartil es la mediana muestral, ya est dado all el procedimiento para calcularlo. Procedimiento para calcular el tercer cuartil muestral Q3a)Para datos categricos ordinales y cuantitativos discretos agrupados 1) Se forma la columna de las frecuencias absolutas acumuladas. 2) Se multiplica el total n de los datos por34. 3) Se busca este valor en la columna de las frecuencias absolutas acumuladas.4) El tercer cuartil Q3 se encuentra en la clase donde se ubica el valor hallado.b)Para datos cuantitativos no agrupados 1) Se ordenan los datos en forma creciente o decreciente. 2) Si el nmero de datos es impar, el tercer cuartil Q3 es el valor que est situado en la tres cuartas partes del conjunto de los datos ordenados. 3) Si el nmero de datos es par, el tercer cuartil Q3 es la media aritmtica de los dos valores que estn en la tres cuarta parte de los datos ordenados.c)Para datos cuantitativos continuos agrupados 1) Se forma la columna de las frecuencias absolutas acumuladas.2) Se multiplica el total n de los datos por34. 3) Se busca este valor en la columna de las frecuencias absolutas acumuladas.4) El tercer cuartil Q3 se encuentra en el intervalo donde se ubica dicho valor.5) Se calcula el valor de Q3 utilizando la siguiente frmula: Q3 = L1 + A. [ 3n4+F(Q3- 1) fQ3 ],donde L1 es el lmite inferior del intervalo de clase donde se encuentra el tercer cuartil, A es la longitud del intervalo de clase donde se encuentra el tercer cuartil, F(Q3- 1)es la frecuencia absoluta acumulada del intervalo de clase anterior al intervalo de clase donde se encuentra el tercer cuartil yfQ3es la frecuencia absoluta del intervalo de clase donde se encuentra el tercer cuartil.Ventajas y desventajas de las medidas de tendencia centralVentajas de la media aritmticaa)Es una medida que tiene en cuenta toda la informacin suministrada.b)Es la ms estable de las medidas de tendencia central.c)Puede ser utilizada como dato para anlisis estadsticos posteriores.Desventajas de la media arimticaNo es conveniente utilizarla cuando los datos se aglomeran en los extremos del conjunto de datos ordenados habiendo poca informacin en las partes centrales de la distribucin. Los datos estn fuertemente sesgados. En este caso se prefiere utilizar la mediana. Ventajas de la mediana muestralLa mediana se utiliza cuando los datos estn fuertemente sesgados.No est afecta a los valores extremos de los datos.Se utiliza tambin en las variables categricas ordinales.Desventajas de la mediana muestralEs una medida que no tiene en cuenta los valores que toman las variables en los extremos de los datos ordenados en la muestra.Ventajas de la moda muestrala)Se puede calcular tanto para datos categricos como para los cuantitativos. b)No est afectada por los valores extremos de los datos ordenados.Desventajas de la moda muestralEs muy difcil de interpretar o comparar cuando la distribucin es multimodal.Comparaciones entre la media aritmtica, la mediana y la modaSi en la distribucin de frecuencias x=Me=Mo,entonces, la distribucin es simtrica.Si en la distribucin de frecuencias xMeMo,entonces, la distribucin es asimtrica o sesgada, y puede ocurrir los siguientes casos: Si Mo Si x < Me< Mo,entonces, la distribucin es sesgada a la izquierda.MEDIDASDE VARIACIN ODISPERSIN MUESTRALESSon medidas que explican cuan dispersos estn los datos muestrales entre s. Estas medidas pretenden caracterizar el conjunto de datos segn su forma de distribucin. Son medidas que expresan segmentos de recta en el conjunto de nmeros reales que definen los valores en el conjunto de datos muestrales; en algunos casos, estos segmentos se obtienen con referencia a una medida de tendencia central (especialmente la media aritmtica).Entre estas medidas de variacin o dispersin se tienen: el rango muestral, la varianza muestral, la desviacin estndar muestral y el coeficiente de variacin.El rango muestral.- es la longitud o distancia entre el dato mayor y el menor, y se representa por la letra R; es decir: R=xmx.xmn.La varianza muestral.- es una medida de variacin que mide la dispersin cuadrtica de los datos con respecto a la media aritmtica, y se representa por el smbolo s2. Su unidad de medida es el cuadrado de la unidad de medida utilizada para medir los datos.Clculo de la varianza muestralPara datos cuantitativos no agrupadosSe aplica la frmula general: s2= (xx)2n.Pero, en la prctica, es ms usual aplicar la siguiente frmula derivada de la anterior: s2= x2n(x)2, donde xes el valor del dato observado, xes la media muestral ynes el tamao de la muestra (el smbolo significa sumar).Para datos cuantitativos (discretos o continuos) agrupadosSe aplica la frmula general:s2=fi (xi x)2n.Pero, en la prctica, es ms usual aplicar la siguiente frmula derivada de la anterior:s2= fi (xi)2n(x)2,donde xies el valor del dato observado, xes la media muestraly nes el tamao de la muestra (el smbolo significa sumar). Esta ltima frmula implica construir dos columnas ms en la tabla de distribucin de frecuencias: la columna de los productosfi xiy la columna de los productosfi (xi)2 y luego sumar todos los valores de cada una de esas columnas para usarlas en las expresiones dadas en la frmulas, recordando la frmula para obtener x.La desviacin estndar muestral.-es la raz cuadrada de la varianza muestral, y se representa por la letra s; es decir: s =s2 Es la ms completa entre las medidas de dispersin porque interviene la unidad de medida que se usa para medir los datosyel nmero total de ellos.El coeficiente de variacin muestral.- es una medida de dispersin relativa que proporciona una estimacin de la magnitud de la desviacin estndar respecto a la magnitud de la media, y generalmente est expresado en porcentaje, y se representa por las letras CV. Matemticamente, esto se expresa por: CV= sx .100%Observamos que el coeficiente de variacin no est expresado en ninguna unidad de medida, ya que sta se cancela cuando se divide la desviacin entre la media muestral correspondiente. Por tal motivo, es til para comparar distribuciones con unidades de medida diferentes para ver as cul de ellas es ms variable. Desventaja del coeficiente de variacinUna desventaja del coeficiente de variacin es que deja de ser til cuando la media muestral es un valor cercano a cero.PRCTICA DIRIGIDA N 2MEDIDAS DE TENDENCIA CENTRAL Y DE VARIACIN Profesor:Tito R. Navarro GuerreroCon referencia al ejercicio 5 de la prctica dirigidaN 1, calcular la moda de la distribucin, y con referencia al ejercicio 7de la misma prctica dirigida, calcular los cuartiles muestrales y la moda correspondiente. 2. Con referencia a los ejercicios 8 al 14 de la prctica dirigida N 1, calcular las diferentes medidas de tendencia central y de variacin para cada uno de ellos. Interprete los resultados. As mismo, compare la variabilidad relativa entre ellos mediante sus coeficientes de variacin.3.Se realiz una encuesta en viviendas que dan alojamiento en el Cuzco sobre el nmero de habitaciones por vivienda, y se obtuvo la siguiente informacin:2 3 4 3 2 3 4 2 3 3 3 2 2 2 2 4 4 2 3 3 5 3 4 5 2 3.Calcular las diferentes medidas de tendencia central y de variacin. Interprete los resultados.4.Los siguientes datos corresponden al nmero de pasajeros que salen del pas durante 30 das del mes de Julio del 2008:35 38 30 32 39 40 42 45 43 37 38 30 39 38 31 37 32 38 35 39 33 32 36 37 39 40 40 33 31 35 Calcular las diferentes medidas de tendencia central y de variacin. Interprete los resultados.5.Una cadena de restaurantes de comidas rpidas contrat los servicios de una empresa de televisin para que pasen sus anuncios publicitarios, obteniendo los siguientes resultados:Nmero de veces que la persona observa el aviso01234Nmero de personas3205401300600380 Calcular las diferentes medidas de tendencia central y de variacin. Interprete los resultados.6.En la siguiente tabla se ha registrado los aos de antigedad de una muestra de automviles de los profesores y administrativos de la Universidad.Antigedad[02>[24>[46>[68>[810>[1012]Autos de prof.1015121085Autos de adm.31015201810 Calcular las diferentes medidas de tendencia central y de variacin para cada una de las distribuciones de frecuencias. Interprete los resultados. As mismo, compare la variabilidad relativa entre las dos distribuciones.7.Un analista realiz un estudio de 50 empresas sobre los gastos semanales (en dlares) en propaganda turstica. La informacin que obtuvo fue la siguiente: 2230 1290 2500 3200 3150 3560 3860 3760 3490 4520 4020 4100 4080 4200 3550 2800 2990 3000 3600 4180 4000 2800 2770 2990 2400 2670 2800 2950 2840 2960 3020 3100 3500 3600 4200 4350 2900 3250 3780 3600 3450 3800 3900 3780 2770 3120 3200 2900 3500 3800 Elabore primero una tabla de distribucin de frecuencias y luego calcule las medidas de tendencia central y de variacin. Interprete los resultados. 8.La siguiente informacin seala el tiempo de vida til (en miles de horas) de 80focos de luz de100 watts. 670 340 530 450 470 520 680 730 610 550 650 620 540 410 590 260 580 820 740 410 700 380 500 360 670 320 630 520 620 350 340 740 530 510 550 480 600 760 510 350 440 330 450 610 530 210 680 850 600 420 430 280 560 790 840 490 820 220 620 550 720 680 400 370 650 730 570 390 460 570 560 600 450 560 750 400 510 700 740 760Elabore primero una tabla de distribucin de frecuencias y luego calcule las medidas de tendencia central y de variacin. Interprete los resultados.9.El tiempo que 30 operarios demoraron en ejecutar una tarea fue registrados en minutos, obtenindose: 7.0 9.0 11.47.210.2 13.5 17.0 14.0 14.5 8.09.1 9.413.1 8.510.415.5 12.0 11.0 11.29.6 9.2 9.515.6 8.4 10.8 13.0 12.5 12.4 10.5 7.8 Elabore primero una tabla de distribucin de frecuencias y luego calcule las medidas de tendencia central y de variacin. Interprete los resultados.