7 conceptos basicos de estadistica

  • Published on
    28-Jul-2015

  • View
    882

  • Download
    2

Transcript

Documento elaborado por: HAROLD IVN MERA MARTNEZ Instructor SENA CGA. CONCEPTOS ESTADSTICOS BSICOS INTRODUCCIN En este documento se elabor con el propsito de facilitar la conceptualizacin de los principales trminos estadsticos y contar con las formulas bsicas para el desarrollo de la competencia. ESTADISTICA Ciencia que estudia los hechos colectivos, mediante la observacin numrica, el anlisis matemtico y la interpretacin lgica, investigando especialmente sus causa y leyes empricas. Conjunto de mtodos aplicados en la recoleccin, clasificacin, presentacin e interpretacin de datos numricos, obtenidos de la observacin de hechos que permiten, a la vez, inferir conclusiones lgicas. ESTADISTICA DESCRIPTIVA Describe el comportamiento de un hecho, a travs de la recoleccin, ordenamiento, clasificacin, presentacin mediante cuadros y grficas, anlisis e interpretacin y utilizacin de medidas. Conjunto de instrumentos que colaboran en la depuracin de datos, en su presentacin clara y en su simplificacin para la interpretacin, anlisis y publicacin. ESTADISTICA INDUCTIVA O INFERENCIAL Tcnicas aplicadas en investigaciones parciales, denominadas MUESTRAS, que permiten la obtencin de ciertos resultados mediante la aplicacin de medidas; considerados como estimadores de los valores estadsticos de la poblacin es decir parmetros. IMPORTANCIA DE LA ESTADISTICA - Se considera la estadstica como una herramienta de vital importancia, en la toma de decisiones, ya que suministra informacin para la valoracin de planes y programas. - En la vida cotidiana interpretamos y usamos datos, muchas veces sin tener conocimiento de lo que es la estadstica, pero nos permite aprovechar la informacin. CAMPOS DE APLICACIN La estadstica tiene un vasto campo de aplicacin, tanto en las empresas industriales como en las comerciales. - Permite obtener una visin general de la empresa y de algunos aspectos particulares. - Facilita descubrir el efecto en las distintas manifestaciones econmicas. - Ayuda a analizar y a separar lo que es normal de lo que no lo es, es decir, permite ejercer control en muchas de as actividades u operaciones de la empresa. Es importante para la planeacin de operaciones, el control de calidad, determinacin de mercado, en la elaboracin de presupuestos, control de inventarios, etc. POBLACIN Totalidad o conjunto de medidas, o recuento de todos los elementos que presentan una caracterstica comn (Finita. Infinita). Documento elaborado por: HAROLD IVN MERA MARTNEZ Instructor SENA CGA. ELEMENTO Objeto que va ser sometido a estudio, debe ser claramente definida, entendida por todos, adems debe permitir ser contada o medida. CARACTERSTICA Rasgo o caractersticas de los elementos que conforman la poblacin deben ser comunes a todos los elementos. - Cualitativas o Atributos expresadas mediante palabra, sexo (M, F), Aficiones (Canto, Baile,...). - Cuantitativas o Variables expresadas en forma numrica, peso, valor, tiempo. Discretas: Valores enteros. Continuas: Admiten fracciones. CENSO Investigacin de la totalidad de los elementos que constituyen la poblacin objetivo. Censo de poblacin, vivienda, agropecuarios o industrial. El censo es en muchos casos impracticable: Cuando el nmero de observaciones es demasiado grande o infinita, siendo imposible investigar la totalidad de los elementos. Cuando de requiere demasiado tiempo en la observacin presentndose desactualizacin al momento de utilizarla Cuando los costos son elevados. Cuando el elemento sometido a prueba pede ser destruido (control de calidad). Cuando no se cuenta con el personal necesario para realizar las observaciones. MUESTRA Parte seleccionada de la poblacin, que posee una caracterstica igual a la que no fue seleccionada. Subconjunto de elementos, que resulta de la aplicacin de algn proceso estadstico; con el objeto de investigar las caractersticas de los elementos de la poblacin. Se utiliza el muestreo cuando no se puede realizar el censo. Es menos costosa, ms rpido, requiere menos personal y que puede proporcionar mayor precisin en los resultados. MUESTREO ALEATORIO: Cuando la probabilidad de seleccin de todos los elementos es igual. Muestreo Aleatorio Simple. Muestreo Estratificado. Muestreo Sistemtico. Muestreo por Conglomerados. Documento elaborado por: HAROLD IVN MERA MARTNEZ Instructor SENA CGA. MUESTREO NO PROBABILISTICO: Las unidades no son seleccionadas al azar, sino en forma caprichosa. Muestreo Voluntario. Muestro de Juicios. Muestreo por Cuotas. PARAMETROS O ESTIMADORES Parmetros: Medidas aplicadas a las caractersticas de la poblacin. (Media, proporcin, razn). Estimadores: Medidas aplicadas a las caractersticas de una muestra. INVESTIGACION ESTADISTICA FUENTES DE INFORMACION - Fuentes Internas: Son las que se producen o registran la interior de la empresa (ventas, produccin, horas), muchas veces no se les da la importancia que tienen y solo se consideran como operaciones corrientes y rutinarias. - Fuentes Externas: Son aquellas que nos suministran datos e informacin que no podemos obtener de la fuente interna o primaria, boletines, revistas, publicaciones especializadas o informes realizados por otras personas o instituciones. CLASES DE INVESTIGACION - Investigacin Descriptiva: Se realiza sobre hechos reales con el fin de explicar de modo sistemtico, sus caractersticas. Comprende etapas como: recoleccin, clasificacin, descripcin anlisis e interpretacin de datos. Puede referirse al anlisis de datos provenientes de fuentes secundarias: Caractersticas de un mercado. Problemas Sociales. Investigaciones Econmicas. Comportamiento de los Consumidores. - Investigacin Experimental: Corresponde a una observacin rigurosamente controlada. Determinando las relaciones causa efecto. Debe quedar claro que el experimento es una situacin provocada, necesitando de un diseo adecuado. La primera tiene su base en realidades fsicas y la segunda son abstracciones. ETAPAS DE UNA INVESTIGACION 1- Formulacin del Problema. 2- Formulacin de objetivos. 3- Unidad de Investigacin. 4- Formulacin de la Hiptesis. 5- Mtodos de Investigacin.( Censo Diseo Muestra) Documento elaborado por: HAROLD IVN MERA MARTNEZ Instructor SENA CGA. 6- Recoleccin de Datos. 7- Clasificacin. Tabulacin. Descripcin. Resultados. 8- Generalizacin. 9- Informe Final. 1- Planteamiento del Problema El planteamiento del problema, plantea la necesidad de realizar la investigacin. La decisin de realizar una investigacin surge cuando se siente la necesidad de disear correctivos o fijar polticas a corto o largo plazo, y cuando no se dispone de informacin adecuada. Se requiere la elaboracin de un plan de investigacin, que permita la recoleccin y anlisis de resultados. 2- Formulacin de Objetivos Deben ser claramente definidos, indicando la que se desea hacer. - Qu se va a investigar? - Cmo se va a realizar? - Cmo se pueden obtener los datos? - Cul sera el diseo del muestreo? - Cul sera la cobertura? - Dnde se realizar? - A quin va dirigida? 3- La Unidad de Investigacin Se tendr definida cuando los objetivos de la investigacin se han determinado con precisin Elemento de Estudio la claridad del objetivo nos dar una visin perfecta de lo que se va a hacer: - El fin de la observacin. - La eleccin de la unidad. - La lista de los elementos y de las caractersticas. - El momento en que se va a realizar. - El mtodo de observacin. - Las condiciones en que se desarrollar. - La eleccin de las medidas. 4- Formulacin de Hiptesis Son supuestos que se hacen en una investigacin para ser comprobados. Son aquellos supuestos hechos respecto a valores de la poblacin o parmetros y cuya comprobacin requiere aplicacin de mtodos estadsticos, media, proporcin, razn, etc. 5- Mtodos de Investigacin Documento elaborado por: HAROLD IVN MERA MARTNEZ Instructor SENA CGA. Se tendr en cuenta el nmero de unidades a investigar, su dispersin geogrfica, el grado de variabilidad, el costo, el tiempo, el tamao de la poblacin, para determinar si la investigacin ser total (Censo) o parcial (Muestra). El diseo de la encuesta por muestreo nos ayudar a controlar la cantidad de informacin y en la decisin sobre el mtodo ms indicado para la investigacin. Al disear un cuestionario se deben considerar ciertos aspectos: - Incluir nicamente las preguntas que son necesarias. - Usar preguntas claras y concisas. - No hacer preguntas que estemos seguros que no van a ser contestadas. - Iniciar con preguntas generales y luego seguir con las especficas- Las preguntas en lo posible deben ser cerradas. Antes de aplicar el cuestionario es necesario realizar una prueba para ajustarlo, conociendo las reacciones de los informantes, el tiempo necesario. 6- Recoleccin de Datos Es la aplicacin de instrumentos de medicin. Es necesario la supervisin permanente del trabajo de los encuestadores. 7- Clasificacin, tabulacin y descripcin de resultados 8- Anlisis de Datos Aplicacin de medidas que permitan la obtencin de estimadores, que faciliten la comprobacin de hiptesis. 9- Elaboracin de Informe Partes: - Introduccin. - Conclusiones. - Apndices. VARIABLES Discretas: son aquellos datos que nicamente aceptan valores enteros. ix Manera de simbolizar el valor de cada observacin. Donde i = 1,2 .n m El nmero de valores que toma la variable en una tabla de frecuencias. n Tamao de la muestra. N Nmero de elementos de la poblacin. if Frecuencia absoluta, nmero de veces que se repite el valor de la variable. Su suma debe ser igual a n. Documento elaborado por: HAROLD IVN MERA MARTNEZ Instructor SENA CGA. nf i / Frecuencia relativa, valores fraccionarios entre 0 y 1, la suma de todas las frecuencias debe ser 1. iN Frecuencia absoluta acumulada, se obtiene acumulando frecuencias absolutas. iH Frecuencia relativa acumulad, se obtiene acumulando las frecuencias relativas. Continuas: son aquellos datos que aceptan como valores fracciones o decimales. ix Valor promedio entre el lmite inferior y superior Inter. maxx Valor mximo que toma la variable. minx Valor mnimo que toma la variable. Rango Recorrido diferencia entre le valor mximo y mnimo de la variable. minmax xxRango m Nmero de intervalos 5< m >16 nLogm 10322.31 c Amplitud del rango mRangoc / MEDIDAS DE TENDENCIA CENTRAL Generalmente denominadas promedios y pretenden reducir al conjunto de datos a un solo nmero representativo. - Media Aritmtica (Media Geomtrica, media cuadrtica, media cbica, media armnica, cuarteles, deciles) - Mediana. - Moda. Si se calculan con valores de una poblacin parmetros. Si se aplican a los valores de una muestra estimadores. LA MEDIA ARITMTICA X, Documento elaborado por: HAROLD IVN MERA MARTNEZ Instructor SENA CGA. nxX i n Total de observaciones del a muestra o censo. ix Valores de del a variable Donde i = 1, 2, 3,, n Indica la suma de los elementos X Media para el conjunto. MEDIA PONDERADA nfxX ii a- Se multiplica cada valor de la variable por su respectiva frecuencia. b- Se usan los anteriores productos y se divide por n o N. DESVIACIONES Diferencias que se obtienen entre los valores de una variable y un punto fijo, por lo general la media. CON RESPECTO A LA MEDIA ARITMETICA ii fXx )( La sumatoria de las desviaciones respecto de la media aritmtica es cero. PROPIEDADES DE LA MEDIA ARITMETICA La suma de las desviaciones con respecto a la medio es cero. 0)( ii fXx La media aritmtica de una constante es la misma constante. knnknk La media aritmtica de una constante por una variable es igual a la constante por la media aritmtica de la variable. Documento elaborado por: HAROLD IVN MERA MARTNEZ Instructor SENA CGA. kXnxknkx i MEDIANA Es el valor de la variable que divide la frecuencia total en dos partes iguales. DATOS NO AGRUPADOS 1- Se ordenan los datos. 2- Se determnale valor de posicin central 21na- Si n es impar. 21nMe b- Si n es par, se promedia el valor de la variable en las posiciones superior e inferior al valor de: 21nMe y entonces 211 xxMe i DATOS AGRUPADOS 1- Se obtienen las frecuencias absolutas acumuladas. 2- Se divide entre 2 el nmero total de las observaciones 2n. 3- Se busca el resultado anterior en la columna de las frecuencias absolutas acumuladas. a- Cuando observamos el valor de 2n en la columna de las frecuencias absolutas acumuladas, entonces el valor 2n es 1jN y el inmediatamente superior ser jN 21nN j . Documento elaborado por: HAROLD IVN MERA MARTNEZ Instructor SENA CGA. b- Cuando el valor 2n no esta en al columna de las frecuencias absolutas acumuladas entonces 1jN ser el valor inmediatamente inferior a 2n y jN el inmediatamente superior 21nN j . MODA Md Mediada de posicin que sacrifica una mayor cantidad informacin que la mediana, y se define como el valor de la variable con mayor frecuencia. Puede ser unimodal, bimodal, plurimodal. Si X = Me = Md Distribucin Simtrica. X > Me > Md Distribucin Asimtrica. X < Me < Md Distribucin Asimtrica. Relacin X, Me, Md 1- En una distribucin simtrica y unimodal X = Me = Md se prefiere la media. 2- Cuando la distribucin es simtrica o ligeramente asimtrica se debe utilizar la media, si no la ms adecuado es la Mediana. 3- X Md = 3 ( X Me) Md = 3 Me 2 X MEDIA GEOMETRICA Mg Se aplica en aquellos casos en que la variable muestra un crecimiento exponencial o geomtrico (poblacin, ingresos o tasas de crecimiento o inters). DATOS NO AGRUPADOS nnni xxxMgxMg ...21 MgLogniMgnxLogxLogxLogMgLognxLogMgLog1010... 10110110101010 Ejemplo: Determinar la poblacin promedio de una regin 1983 6 millones 1993 8.6 millones 2003 10.2 millones Documento elaborado por: HAROLD IVN MERA MARTNEZ Instructor SENA CGA. a- entre 1983 y 1993. b- entre 1993 y 2003. c- entre 1983 y 2003. a- nxLogMgLog i 1010 26.86 101010LogLogMgLog 2712649.110 MgLog 8563.010 MgLog MgLogMg 1010 1833.710 8563.0 MgMg nixMg 2 6.86Mg 1833.7Mg Documento elaborado por: HAROLD IVN MERA MARTNEZ Instructor SENA CGA. b- c- DATOS AGRUPADOS Para estas variables las formulas cambian un poco, pues los datos deben estar ponderados. n nfnnfnfn nfinixxxMgxMg ...21 21 nxLogMgLog i 1010 22.106.8 101010LogLogMgLog 2943098.110 MgLog 971549.010 MgLog MgLogMg 1010 3658.910 971549.0 MgMg nixMg 2 2.106.8 Mg 3658.9Mg nixMg 3 2.106.86 Mg0738.8Mg nxLogMgLog i 1010 32.106.86 10101010LogLogLogMgLog 3721249.210 MgLog 907083.010 MgLog MgLogMg 1010 0738.810 907083.0 MgMg Documento elaborado por: HAROLD IVN MERA MARTNEZ Instructor SENA CGA. MgLognniiMgnxLogfxLogfxLogfMgLognxLogfMgLog1010... 1011021101101010MEDIA ARMONICA Se aplica de manera muy especial en casos en que la variable esta expresando tasas o velocidades. DATOS NO AGRUPADOS ixnMa 1 DATOS AGRUPADOS iixfnMa MEDIDAS DE DISPERSION Las mediadas de dispersin nos indican cmo se distribuyen los valores observados a ambos lados del promedio o del valor central o tpico. RANGO O RECORRIDO Es la diferencia entre le valor mximo y mnimo que toma la variable. R = X mx X mn VARIANZA S2, 2 Es la medida de los cuadrados, de las diferentas entre los valores de la variable y su media aritmtica. nXxS i 22 )( DATOS NO AGRUPADOS Documento elaborado por: HAROLD IVN MERA MARTNEZ Instructor SENA CGA. nXxS i 22 )( nnXxS i 222 222 XnxS i DATOS AGRUPADOS nfXxS ii 22 )( nnXfxS ii 222 222 XnfxS ii DESVIACION TIPICA O ERROR ESTANDAR S, La varianza presenta el inconveniente de que el resultado corresponde a la unidad en que esta medida la variable peor elevada al cuadrado. 222 2 )(nXxSSS i