Distribución de Frecuencias Bidimensionales

  • Published on
    03-Oct-2015

  • View
    51

  • Download
    6

DESCRIPTION

Distribucin de Frecuencias Bidimensionales

Transcript

<ul><li><p>- 1 - </p><p>7. DISTRIBUCIN DE FRECUENCIAS BIDIMENSIONALES </p><p>Este captulo est enfocado al anlisis bivariado que tiene por objeto describir de manera conjunta </p><p>dos variables pertenecientes a una poblacin o muestra. Dos variables (X, Y) est compuesta por un </p><p>par de valores (xi , yi) en los que xi son valores de la variable X e yi son valores de la variable Y. </p><p>Con mayor frecuencia todo anlisis Estadstico relaciona dos o ms variables enfrentndose a lo siguiente: </p><p> Cmo estn distribuidos de manera conjunta el nivel de ingresos con el nivel de gastos? </p><p> Cmo saber si existe covarianza entre los siguientes pares de variables: los impuestos y la renta, </p><p>los benficos empresariales y el volumen de ventas, los salarios y la cualificacin profesional? </p><p> Cmo saber si existe correlacin entre el precio y la produccin de un bien, los gastos en </p><p>publicidad y sus beneficios por ventas, los costos y el nmero de empleados? </p><p> Cmo saber se existe correlacin entre el nivel de gastos y la edad y adems con el estado civil? </p><p> Qu relacin existe entre el ingreso familiar e inters de los alumnos por seguir estudios </p><p>universitarios? </p><p> Existe relacin entre el tiempo dedicado al estudio, ya sea individual o colectivo, y el </p><p>aprovechamiento logrado por los alumnos en cada una de las materias? </p><p>Tan pronto como empezamos a indagar acerca de las relaciones entre las variables, nos adentramos en </p><p>el campo de la correlacin, covariacin y regresin. Donde una de las dos variables es la variable </p><p>independiente y la otra ser la variable dependiente. </p><p>7.1. VARIABLES BIDIMENSIONALES </p><p>7.1.1. Diagrama de dispersin </p><p>El diagrama dispersin son puntos cardinales representados por los valores de la variable X en el </p><p>eje de las abscisas y los valores de la variable Y en el eje de las ordenada. </p><p>Generalmente la variable X representa la variable independiente y la variable Y la variable </p><p>dependiente. El punto que viene determinado por la media de X y la media de Y constituye el </p><p>centroide o centro de gravedad de la nube de puntos. </p></li><li><p>- 2 - </p><p> EJEMPLO 7.1. Graficar el diagrama de dispersin de las siguientes variables X = Nmero de trabajadores Y = Produccin expresado en millones de unidades </p><p>Empresa N de Trabajadores Produccin </p><p>1 50 10 </p><p>2 30 5 </p><p>3 60 25 </p><p>4 60 30 </p><p>5 95 50 </p><p>6 120 70 </p><p>7 72 40 </p><p>8 27 8 </p><p>9 50 25 </p><p>10 40 35 </p><p>11 53 15 </p><p>12 43 20 </p><p>0</p><p>10</p><p>20</p><p>30</p><p>40</p><p>50</p><p>60</p><p>70</p><p>80</p><p>0 20 40 60 80 100 120 140</p></li><li><p>- 3 - </p><p>7.2. TABLAS ESTADSTICAS DE DOBLE ENTRADA </p><p>La tabla de doble entrada aplicado a variables cuantitativas se denomina tabla de correlacin a </p><p>variables cualitativas o mixtas recibe el nombre de tabla de contingencia. El procedimiento para la </p><p>construccin de la distribucin de frecuencias bidimensional se realiza tabulando de manera cruzada </p><p>de variables. </p><p>Por tanto, para la tabla de doble entrada se utiliza el siguiente formato universal de frecuencias </p><p>absolutas conjuntas, porcentuales conjuntas y marginales, vase las tablas 7.1 y 7.2 </p><p> TABLA 7.1 DOBLE ENTRADA FRECUENCIAS ABSOLUTAS </p><p>Var</p><p>iab</p><p>le X</p><p>Variable Y </p><p> y1 y2 yj yr fi x1 f11 f12 f1j f1r f1 x2 f21 f22 f2j f2r f2 </p><p>xi fi1 fi2 fij fir fi </p><p>xk fk1 fk2 fkj fkr fk fj f1 f2 fj fr f= n </p><p> TABLA 7.2 DOBLE ENTRADA FRECUENCIAS PORCENTUALES </p><p>Var</p><p>iab</p><p>le X</p><p>Variable Y </p><p> y1 y2 yj yr pi x1 p11 p12 p1j p1r p1 x2 p21 p22 p2j p2r p2 </p><p>xi pi1 pi2 pij pir pi </p><p>xk pk1 pk2 pkj pkr pk pj p1 p2 pj pr 100 </p><p>Tambin es posible realizar una sola tabla de doble entrada en la que contenga las frecuencias </p><p>absolutas y porcentuales segn los requerimientos de la investigacin. </p><p>Para el caso, los valores agrupados en intervalos, estas sern correspondidas por las marcas de </p><p>clase o centro del intervalo. Si los valores no son numricos estarn representados por sus </p><p>atributos, propiedades o cualidades. </p></li><li><p>- 4 - </p><p>7.2.1. Frecuencia conjunta </p><p>En la tabla 7.1 la frecuencia absoluta conjunta denotando por fij indica el nmero de veces que se </p><p>repite el par ordenado (xi , yi) de valores de la variable (X, Y). </p><p>En la tabla 7.2 la frecuencia porcentual conjunta denotada por pij indica el porcentaje de </p><p>observaciones que hay en el par ordenado (xi , yi). Se obtiene dividiendo la frecuencia absoluta </p><p>conjunta con el nmero total de observaciones y el resultado multiplicar por 100. </p><p>La frecuencia relativa conjunta se obtiene dividiendo la frecuencia porcentual conjunta sobre </p><p>100 e indica la proposicin de observaciones que hay en el par ordenado repite el par ordenado </p><p>(xi , yi) y se representa por frij. </p><p>Propiedades de la frecuencia conjunta </p><p> Propiedad 7.1. La suma de todas las frecuencias absolutas conjuntas, extendida a </p><p>todos los pares ordenados (xi , yi) es igual al total de las observaciones. </p><p> Propiedad 7.2. La suma de todos los porcentajes de los pares ordenados (xi , yi) da el </p><p>100% </p><p> Propiedad 7.3. La suma de las frecuencias relativas conjuntas, extendida a todos los </p><p>pares ordenados (xi , yi) es la unidad. </p><p>7.2.2. Frecuencia marginal </p><p>En las tablas de doble entrada 7.1 y 7.2, las ltimas filas y columnas representan las frecuencias </p><p>marginales. La frecuencia absoluta marginal de X, denotado por fi indica el nmero de veces que </p><p>se repite el valor xi de X, sin tener en cuenta el valor de la variable Y. </p></li><li><p>- 5 - </p><p>Mientras que la frecuencia absoluta marginal de Y, indica el nmero de veces que se repite el </p><p>valor de yi de Y, sin tener en cuenta el valor de la variable X. </p><p>La frecuencia porcentual marginal de X, indica el porcentaje de observaciones del valor xi de X, </p><p>sin tener en cuenta el valor de la variable Y. </p><p>De la misma manera la frecuencia porcentual marginal de Y </p><p>Propiedades de la frecuencia marginal </p><p> Propiedad 7.4. La suma de las frecuencias absolutas marginales tanto de X como de </p><p>Y, es igual al total de observaciones. </p><p> Propiedad 7.5. La suma de las frecuencias porcentuales marginales tanto de X como </p><p>de Y da el 100%. </p><p> Propiedad 7.6. La suma de las frecuencias relativas marginales tanto de X como de Y </p><p>es la unidad. </p><p>7.2.3. Medias y varianzas marginales </p><p> La media marginal de X </p><p> La media marginal de Y </p></li><li><p>- 6 - </p><p> La varianza marginal de X </p><p> ( )</p><p> [ </p><p>]</p><p> La varianza marginal de Y </p><p> ( )</p><p> [ </p><p>]</p><p>7.2.4. Frecuencia condicional </p><p>Del total de observaciones de la tabla de doble entrada solo interesa analizar una fila o columna </p><p>de datos, esta situacin condiciona la i-sima frecuencia de la variable X con respecto a la </p><p>variable Y o viceversa. Por tanto se tiene dos maneras de condicionar las variables (X, Y). </p><p>La variable X condicionada a Y = yj se denota por: </p><p>Es un subconjunto de las frecuencias absolutas conjuntas fij de los valores xi de la variable X </p><p>referente a un yi valor fijo de la variable Y. La distribucin de frecuencias absolutas de esta nueva </p><p>distribucin es exactamente la columna j de la tabla de doble entrada. </p><p> Donde la totalidad de las observaciones cumple: </p><p> Es decir: </p><p>( ) {( ) } </p><p> Por tanto las frecuencias porcentuales condicionadas sern: </p></li><li><p>- 7 - </p><p>Llamada tambin porcentaje de columna vase la siguiente tabla: </p><p>TABLA 7.3 FRECUENCIA CONDICIONADA X|Y=yj </p><p>X|Y = yj fi|j pi|j </p><p>x1 f1|j p1|j </p><p>X1 f2|j p2|j </p><p>Xi fi|j pi|j </p><p>Xk fk|j pk|j </p><p> fj 100 </p><p>Analgicamente para la variable Y condicionada a X = xi se denota por: </p><p>La distribucin de frecuencias absolutas de esta nueva distribucin es la fila i de la tabla de doble </p><p>entrada: </p><p>Donde la totalidad de observaciones se cumple: </p><p>Es decir: </p><p>( ) {( ) } </p><p> Por tanto las frecuencias porcentuales condicionadas sern: </p><p> TABLA 7.4 FRECUENCIA CONDICIONADA Y|X=xi </p><p>X|Y = xi y1 y2 yi yk </p><p>fj|i f1|i f2|i fj|i fr|i fi </p><p>pj|i p1|i p2|i pj|i pr|i 100 </p></li><li><p>- 8 - </p><p>7.2.5. Medias y varianzas condicionales </p><p> La media de la variable X condicionada a Y=yj est dado por </p><p> La media de la variable Y condicionada a X=xi est dado por </p><p> La varianza de la variable X condicionada a Y=yj est dado por </p><p> ( )</p><p> La varianza de la variable Y condicionada a X=xi est dado por </p><p> ( )</p><p>7.2.6. Independencia estadstica </p><p>En la tabla de doble entrada, dos variables estadsticas X e Y son independientes si la frecuencia </p><p>relativa conjunta es igual al producto de las frecuencias relativas marginales. </p><p> ( ) </p><p>En trminos de frecuencia conjunta se tiene: </p><p>Despejando fij: </p><p>Para X|Y = yj </p><p>Es lo mismo: </p><p>Es decir las filas de frecuencias relativas condicionadas coinciden entre s, y a su vez con las </p><p>frecuencias relativas de la marginal de Y. </p></li><li><p>- 9 - </p><p>Para Y|X = yi </p><p>Es lo mismo: </p><p>Es decir las filas de frecuencias relativas condicionadas coinciden entre s, y a su vez con las </p><p>frecuencias relativas de la marginal de Y. </p><p> EJEMPLO 7.2. En la fbrica se registran los siguientes datos: </p><p>Obrero X Y Obrero X Y Obrero X Y </p><p>1 4 1 22 2 4 43 1 2 </p><p>2 5 2 23 3 1 44 4 1 </p><p>3 1 4 24 4 2 45 4 2 </p><p>4 1 1 25 2 4 46 2 3 </p><p>5 3 2 26 2 3 47 2 2 </p><p>6 1 2 27 2 2 48 1 3 </p><p>7 5 1 28 1 3 49 1 2 </p><p>8 4 3 29 1 2 50 2 2 </p><p>9 3 1 30 3 1 51 2 2 </p><p>10 1 2 31 3 4 52 4 1 </p><p>11 1 3 32 3 3 53 1 2 </p><p>12 1 2 33 2 3 54 1 3 </p><p>13 4 1 34 2 1 55 5 1 </p><p>14 3 2 35 1 4 56 5 2 </p><p>15 1 3 36 1 4 57 3 2 </p><p>16 5 1 37 3 2 58 3 1 </p><p>17 1 3 38 5 1 59 4 2 </p><p>18 2 1 39 5 2 60 2 3 </p><p>19 3 2 40 1 3 61 2 2 </p><p>20 2 2 41 1 2 62 4 1 </p><p>21 2 1 42 1 2 </p><p> Dnde: X = Aos de antigedad del obrero de la fabrica y = Cantidad de artculos defectuosas que elabora el obrero </p><p>Construir: a. La tabla de frecuencia de doble entrada b. La distribucin marginal de X e Y </p><p>c. La distribucin condicionada X|Y =3 e Y|X=2 </p></li><li><p>- 10 - </p><p>a. </p><p>a.1. Tabla de doble entrada de frecuencias absolutas </p><p> Artculos defectuosos 1 2 3 4 </p><p>Antigedad </p><p>1 1 9 7 3 20 2 3 6 4 2 15 3 4 5 1 1 11 4 5 3 1 0 9 5 4 3 0 0 7 </p><p> 17 26 13 6 n=62 </p><p>a.2. Tabla de doble entrada de frecuencias porcentuales </p><p> Artculos defectuosos 1 2 3 4 </p><p>Antigedad </p><p>1 2 14 11 5 32 2 5 10 6 3 24 3 6 8 2 2 18 4 8 5 2 0 15 5 6 5 0 0 11 </p><p> 27 42 21 10 100 b. </p><p>b.1. Distribucin marginal de X </p><p> fi pi </p><p>Antigedad </p><p>1 20 32 2 15 24 3 11 18 4 9 15 5 7 11 </p><p> 62 100 Interpretacin: </p><p> p1=32, indica que el 32% delos obreros tienen una antigedad de 1 aos en la fbrica </p><p>y equivale a 20 obreros de los 62. </p><p> p2=24, indica que el 24% delos obreros tienen una antigedad de 2 aos en la fbrica </p><p>y equivale a 15 obreros de los 62. </p><p> p3=18, indica que el 18% delos obreros tienen una antigedad de 3 aos en la fbrica </p><p>y equivale a 11 obreros de los 62. </p><p> p4=15, indica que el 15% delos obreros tienen una antigedad de 4 aos en la fbrica </p><p>y equivale a 9 obreros de los 62. </p><p> p5=11, indica que el 11% delos obreros tienen una antigedad de 5 aos en la fbrica </p><p>y equivale a 7 obreros de los 62. </p></li><li><p>- 11 - </p><p>b.2. Distribucin marginal de Y </p><p> fj pj </p><p>Artculos defectuosos </p><p>1 17 27 2 26 42 3 13 21 </p><p>4 6 10 </p><p> 62 100 Interpretacin </p><p> f1 =17, indica que 17 obreros elaboran 1 artculos defectuosos y corresponde a p1 =27% </p><p> f2 =26, indica que 26 obreros elaboran 2 artculos defectuosos y corresponde a p2 =42% </p><p> f3 =13, indica que 13 obreros elaboran 3 artculos defectuosos y corresponde a p3 </p><p>=21% </p><p> f4 =6, indica que 6 obreros elaboran 4 artculos defectuosos y corresponde a p4 </p><p>=10% </p><p>c. </p><p>c.1. Frecuencia condicionada X|Y=3 </p><p> Artculos defectuosos X|Y=3 f 3|i p 3|1 </p><p>Antigedad </p><p>1 7 </p><p>2 4 </p><p>3 1 </p><p>4 1 </p><p>5 0 </p><p> f3 = 13 100,0 Interpretacin: </p><p> p1|3=53,8; indica que del grupo de obreros que elaboran exclusivamente 3 artculos </p><p>defectuosos, el 53,8% de ellos tienen un ao de antigedad. </p><p> p2|3=30,8; indica que del grupo de obreros que elaboran exclusivamente 3 artculos </p><p>defectuosos, el 30,8% de ellos tienen 2 aos de antigedad. </p><p> p3|3=7,7; indica que del grupo de obreros que elaboran exclusivamente 3 artculos </p><p>defectuosos, el 7,7% de ellos tienen 3 aos de antigedad. </p></li><li><p>- 12 - </p><p> p4|3=7,7; indica que del grupo de obreros que elaboran exclusivamente 3 artculos </p><p>defectuosos, el 7,7% de ellos tienen 4 aos de antigedad. </p><p> p5|3=0; indica que del grupo de obreros que elaboran exclusivamente 3 artculos </p><p>defectuosos, ninguno de ellos tienen 5 aos de antigedad. </p><p>c.2. Frecuencia condicionada Y|X=2 </p><p> Artculos defectuosos Y|X=2 f j|2 p 3|1 </p><p>Antigedad </p><p>1 3 </p><p>2 6 </p><p>3 4 </p><p>4 2 </p><p> f2 = 15 100,0 Interpretacin: </p><p> p1|2=20,0; indica que del grupo de obreros con 2 aos de antigedad el 20%elaboran </p><p>un artculo defectuoso. </p><p> p2|2=40,0; indica que del grupo de obreros con 2 aos de antigedad el 20%elaboran </p><p>2 artculos defectuosos. </p><p> p3|2=26,7; indica que del grupo de obreros con 2 aos de antigedad el 20%elaboran </p><p>3 artculos defectuosos. </p><p> p4|2=13,3; indica que del grupo de obreros con 2 aos de antigedad el 20%elaboran </p><p>4 artculos defectuosos. </p><p>7.3. GRFICOS PARA LAS TABLAS DE DOBLE ENTRADA </p><p>7.3.1. Grfico de barras en 3D </p><p>En el plano cartesiano para cada punto (xi , yi) se levantan paraleleppedos rectangulares cuyas </p><p>alturas son proporcionales a sus frecuencias conjuntas correspondientes. Si todas las frecuencias </p><p>fueran unitarias, entonces habra que recurrir a un diagrama de dispersin. </p><p> Artculos defectuosos 1 2 3 4 </p><p>Antigedad </p><p>1 1 9 7 3 2 3 6 4 2 3 4 5 1 1 4 5 3 1 0 5 4 3 0 0 </p></li><li><p>- 13 - </p><p>En base a la tabla anterior del EJEMPLO 7.2 se elabor la grfica siguiente: </p><p>7.3.2. Grfico de barras mltiples </p><p>En base a los valores de la variable X, consiste en levantar barras agrupadas en funcin a los </p><p>valores de la variable Y. Estas barras pueden ser horizontales o verticales proporcional a sus </p><p>frecuencias absolutas o porcentuales. </p><p> hombres Mujeres </p><p>Moroso 15 35 </p><p>No moroso 55 45 </p><p>Con los datos de la tabla se construy la grfica: </p><p>4</p><p>3</p><p>2</p><p>10</p><p>2</p><p>4</p><p>6</p><p>8</p><p>10</p><p>12</p><p>34</p><p>5</p><p>Articulos defectuosos </p><p>Fre</p><p>cue</p><p>nci</p><p>as </p><p>Antigedad </p><p>0</p><p>10</p><p>20</p><p>30</p><p>40</p><p>50</p><p>60</p><p>Hombres Mujeres</p><p>Fre</p><p>cue</p><p>nci</p><p>as </p><p>Moroso</p><p>No moroso</p></li><li><p>- 14 - </p><p>7.3.3. Grfico de barras apiladas </p><p>En base a los atributos de la variable X, consiste en levantar barras apiladas proporcional a la </p><p>frecuencia conjunta de los atributos de la variable Y. La suma de cada barra apilada representa a </p><p>la frecuencia marginal. </p><p> hombres Mujeres </p><p>Moroso 15 35 </p><p>No moroso 55 45 </p><p>Total 70 80 </p><p> BIBLIOGRAFIA </p><p> [1] CORIA D. (2012) Anlisis de datos estadsticos. 1ra edicin, Bolivia. </p><p>0</p><p>10</p><p>20</p><p>30</p><p>40</p><p>50</p><p>60</p><p>70</p><p>80</p><p>90</p><p>Hombres Mujeres</p><p>Fre</p><p>cue</p><p>nci</p><p>as </p><p>No moroso</p><p>Moroso</p></li></ul>