Ir al contenido principal

Estadística aplicada a la investigación social


UNIDAD #1 APLICACIÓN DE LA ESTADÍSTICA EN LA INVESTIGACIÓN SOCIAL

1.1        La importancia de la cuantificación en la investigación social:
Las investigaciones sociales consisten en estudiar nuestra realidad social y a partir de este estudio crear nuevos conocimientos por medio de distintas técnicas e instrumentos. En este sentido, la cuantificación es impredecible en los procesos investigativos cuando se pretende representar de forma numérica alguno de los elementos del problema a estudiar. Por lo que, su importancia radica en que a través de la cuantificación aplicada por algún tipo de análisis estadística, se permite estudiar, limitar, establecer su punto de parte y hacia cual dirección va el problema estudiado.

1.2        Conceptos de población, muestreo, muestra y unidades de observación:
Ø Población, es un conjunto de seres vivos de una especie que habita en un determinado lugar. Se utiliza también para referirse al conjunto de viviendas de forma similar al término localidad. La población es un conjunto de individuos que viven en un preciso lugar, inclusive en el planeta en general, esto se refiere a los espacios y obra de una localidad u otra división política a la acción y las consecuencias de poblar.
Ø Muestreo, es el procedimiento a través del cual  es seleccionada una muestra que es un subconjunto de elementos de una población, es decir, una porción de elementos extraídos de una población previamente definida a partir de una población. El muestreo se refiere a esa reducción de elementos que componen a un universo o población, para así poder cumplir con la investigación correspondiente.  
Ø Muestra, es una parte o una porción de un producto que permite conocer la calidad del mismo. La muestra estadística es el subconjunto de los individuos de una población estadística. Estas muestras permiten inferir las propiedades del total del conjunto.
Ø Unidades de observación, es cualquier elemento concreto, a partir del cual pueda obtenerse información. Antes de comenzar su investigación, el analista de la realidad debe tener muy claro que información necesita y donde la buscara. Debe definir pues las unidades de observación que pretenda estudiar.

1.3         Variables y datos:
Ø Variable: es una palabra que representa a aquello que varía o que está sujeto a algún tipo de cambio. Se trata de algo que se caracteriza por ser inestable, inconstante y mudable. Una variable es un símbolo que permite identificar a un elemento específico dentro de un determinado grupo. Este conjunto suele ser definido como el conjunto universal de la variable y cada pieza incluida en el constituye un valor de la variable.
Ø Datos: son números que representan las modalidades de las variables. Los datos pueden ser clasificados según diferentes criterios, uno de los cuales se basa en las modalidades que representan. Se dirá que son datos dicotómicos los que provienen de variables que solo admiten dos modalidades.

UNIDAD #2 RECOPILACIÓN DE DATOS

 2.1 El instrumento de investigación (validez y confiabilidad):
Un instrumento de investigación es la herramienta utilizada por el investigador para recolectar la información de la muestra seleccionada y poder resolver el problema de la investigación, que luego facilita resolver el problema de mercadeo. Los instrumentos están compuestos por escalas de medición. Existen 3 actividades para recolectar los datos:
1)     Seleccionar: el instrumento debe ser válido y confiable
2)     Aplicar: es decir, obtener las observaciones y mediciones de las variables que son de interés para nuestro estudio.
3)     Preparar: las mediciones obtenidas deben ser analizadas correctamente, se denomina “codificación de datos”.

2.2 Tipos de variables estadísticas:
Una variable estadística es cada una de las características o cualidades que poseen los individuos de una población. 
Ø Variable cualitativa: se refiere a características o cualidades que no pueden ser medidas con números.
·        Nominal: Presenta modalidades no numéricas que no admiten un criterio de orden.
·        Ordinal: Presenta modalidades no numéricas, en la que existe un orden.
Ø Variable cuantitativa: es la que se expresa mediante un número, por lo tanto se pueden realizar operaciones aritméticas con ella.
·        Discreta: Es aquella que solo puede tomar un número finito de valores entre dos valores cualesquiera de una característica.
·        Continua: Es aquella que puede tomar un número infinito de valores entre dos valores cualesquiera de una característica.  


 2.3 Escala de medición nominal, ordinal, de intervalo o de razón:
Las escalas son consecuencias de la medición, puede llevarse según diferentes conjuntos de reglas.
Ø Nomina. Una escala de medición es nominal si los datos son etiquetas o categorías que se usan para definir un atributo de un elemento. Los datos nominales pueden ser numéricos o no numéricos.
Ø Ordinal. Una escala de medición es ordinal si los datos pueden usarse para jerarquizar u ordenar las observaciones. Los datos pueden ser numéricos o no numéricos.
Ø Intervalo. Una escala de medición es de intervalo si los datos tienen las propiedades de los datos ordinales y los intervalos entre observaciones se expresan en términos de una unidad de medición fija. Los datos tienen que ser no numéricos.
Ø Razón. Una escala de medición es de razón si los datos tienen las propiedades de los datos de intervalo y el cociente (o razón) entre dos medidas tiene sentido. Los datos tiene que ser no numéricos.

UNIDAD #3 AGRUPACIÓN Y ORDENADOR DE DATOS

1.1        Por frecuencia:
Son tablas en que se dispone las modalidades de la variable por filas. En las columnas se dispone el número de ocurrencias por cada valor, porcentaje, etc. La finalidad de las agrupaciones en frecuencias es facilitar la obtención de la información que contienen los datos. Es la representación conjunta de los datos en forma de tabla o subgrupo de datos correspondientes a un fenómeno en estudio y su ordenamiento en base al número de observaciones que corresponden a cada dato o a cada grupo de datos adecuados según cronología geográfica, análisis cuantitativo o cualitativo.

1.2        Por valores absolutos:
El valor absoluto de un número real es su valor numérico sin tener en cuenta su signo, sea este positivo o negativo. El valor absoluto está vinculado con las nociones de magnitud, distancia y norma en diferentes contextos matemáticos y físicos.

1.3        Por valores relativos:
De un dato, se obtiene al dividir la frecuencia absoluta de cada dato entre el número total de datos. De un intervalo se obtiene al dividir la frecuencia absoluta de cada intervalo entre el número total de datos. Valor relativo es aquel que se expresa como un porcentaje, resultante de la razón o proporción entre dos cantidades.
1.4        Índices
Un número índice es una medida estadística que nos permite estudiar los cambios que se producen en una magnitud simple o compleja con respecto al tiempo o al espacio. Al periodo inicial se le denomina periodo base o referencia y se le asigna el valor 100, en cambio la situación que deseamos comparar se denomina periodo actual o corriente.

1.5        Presentación de los datos, tablas y graficas (graficas de barra, poligonales, abiertas, histogramas, graficas de pastel, pictogramas):
Ø Grafica de barra. Es una forma de grafica que utiliza barras para indicar la frecuencia de ocurrencia de las observaciones. Para construirla se constituye el eje por las frecuencias absolutas y el eje X por los límites inferior y superior de cada clase, dejando un espacio entre barra y barra.
Ø Poligonales. Es una gráfica del tipo de las gráficas de líneas trazadas sobre las marcas de clase y se traza uniendo con segmento de recta, de izquierda a derecha, las parejas ordenadas que se forman, al considerar como abscisa la marca de clase (eje horizontal) y como ordenada la frecuencia del intervalo representado (eje vertical).
Ø Histograma. Las barras no van separadas, y que se rotula con los limites inferiores de cada clase o intervalo excepto el ultimo que deberá llevar también el límite superior centradas en la marca de clase.
Ø Graficas de pastel. Esta grafica es creada con frecuencias y porcentajes, permite resaltar segmentos de cada clase determinada.
Ø Pictogramas. Las gráficas de pictogramas utilizan iconos para ofrecer una visión general más atractiva de pequeños conjuntos de datos discretos.

UNIDAD #4 MEDIDAS DE TENDENCIA Y DE DISPERSIÓN

4.1 Media, media ponderada, mediana y moda:
Ø Media: La medida más evidente que podemos calcular para describir un conjunto de observaciones numéricas es su valor medio. La media no es más que la suma de todo los valores de una variable dividida entre el número total de datos de los que dispone. Su fórmula es, 
Ø Media Ponderada: En está, para cada uno de los valores de xi se asigna un factor wi de peso, que depende de la importancia que el investigador desee darle.
Ø  Mediana: Es valor de la observación que ocupa la posición central de un conjunto de datos ordenados según su magnitud. La mediana es un valor de la variable que deja por debajo de él un número de casos iguales al que deja por arriba.
Ø Moda: Es el valor de un conjunto de datos que ocurre con más frecuentemente, se considera como el valor más típico de una serie de datos.

  4.2 Desviación media, varianza y desviación estándar:
Ø Desviación media: La desviación media, es la media aritmética de las desviaciones absolutas de cada una de las observaciones con respecto a su valor central, la media aritmética o la mediana. Cuanto mayor es su valor, mayor es la dispersión de los datos.
Ø Varianza: Otro tratamiento para evadir la suma cero de las desviaciones de las observaciones respecto a su media aritmética, consiste en recurrir al proceso de elevar al cuadrado estas desviaciones y sumar los cuadrados, dividiendo la suma por el número de casos, a esta cantidad se le denomina varianza.
Ø Desviación estándar: La desviación estándar es útil para describir cuanto se apartan de la media de la distribución los elementos individuales. Una medida de ellos se denomina puntuación estándar número de desviaciones a las que determinada observación se encuentra con respecto a la media.

 4.3 Distribuciones empíricas y teóricas, normal y binomial:
Ø La distribución empírica asociada a una muestra es la ley de probabilidad sobre el conjunto de las modalidades, que afecta a cada observación con el peso. La media, la varianza y la desviación estándar pueden ser vistas como características probabilistas de la distribución empírica.
Ø Las distribuciones teóricas, son las funciones que se asigna a cada suceso definido sobre la variable aleatoria, la probabilidad de que dicho suceso ocurra. Muestra todos los resultados posibles de un experimento y la probabilidad de cada resultado.
Ø Se llama distribución normal a una de las distribuciones de probabilidad de variable continua que con más frecuencia aparece en fenómenos reales.
Ø La distribución binomial es una distribución de probabilidad discreta que mide el número de éxitos en una secuencia de n ensayos independientes de Bernoulli con una probabilidad fija p de ocurrencia del éxito entre los ensayos.



   UNIDAD #5 POBLACIÓN Y MUESTRA

5.1 Concepto de población y muestra:
Ø Población es un conjunto de seres vivos de una especie que habita en un determinado lugar. Se utiliza también para referirse al conjunto de viviendas de forma similar al término localidad. La población es un conjunto de individuos que viven en un preciso lugar, inclusive en el planeta en general, esto se refiere a los espacios y obra de una localidad u otra división política, a la acción y las consecuencias de poblar.
Ø Una muestra es una parte o una porción de un producto que permite conocer la calidad del mismo. La muestra estadística es el subconjunto de los individuos de una población estadística, estas muestran permiten inferir las propiedades del total del conjunto.

  5.2 Tipos de muestra:
Su función básica es determinar que parte de una realidad en estudio (población o universo) debe examinarse con la finalidad de hacer inferencias sobre dicha población.
Ø Probabilístico (aleatorio): En este tipo de muestreo, todos los individuos de la población pueden formar parte de la muestra, tienen probabilidad positiva de formar parte de la muestra.
Ø No probabilístico (no aleatorio): En este tipo de muestreo, puede haber clara influencia de la persona o personas que seleccionan la muestra o simplemente se realiza atendiendo a razones o comodidad.
Ø Aleatorio simple: Todos los individuos tienen la misma probabilidad de ser seleccionados.
Ø Aleatorio estratificado: El criterio a seguir en la formación de los estratos será formarlos de tal manera que haya la máxima homogeneidad en relación a la variable a estudio dentro de cada estrato y la máxima heterogeneidad entre los estratos.
Ø Aleatorio sistemático: Es un tipo de muestreo aleatorio simple en el que los elementos se seleccionan según un patrón que se inicia con una elección aleatoria.
Ø Aleatorio por conglomerados: Un conglomerado se considera una agrupación de elementos que presentan características similares a toda la población.
Ø Por cuotas: En este tipo se fijan unas cuotas, que consisten en un número de individuos que reúnen unas determinadas condiciones.
Ø Casual o incidental: Se trata de un proceso en el que el investigador selecciona directa e intencionalmente los individuos de la población.

5.3 Probabilística:
Es aquella muestra en la que sus elementos han sido seleccionados aleatoriamente, esto es mediante n realizaciones de un experimento aleatorio. El procedimiento de muestreo probabilístico es el que, dada sus ventajas, más se utiliza, pudiendo conocerse previamente en él la probabilidad de obtención de cada una de las muestras que sean seleccionables.

 5.4 No probabilística:
Es la técnica de muestreo donde los elementos son elegidos a juicio del investigador. No se conoce la probabilidad con la que se puede seleccionar a cada individuo. Se utiliza cuando es imposible o muy difícil obtener la muestra por métodos de muestreo probabilístico.  

5.5 Error:
La estimación de un valor de interés, como la media o el porcentaje, estará generalmente sujeta a una variación entre una muestra y otra. Estas variaciones en las posibles muestras de una estadística pueden, teóricamente ser expresadas como errores muéstrales, sin embargo normalmente en la practica el error exacto es desconocido. El error muestral se refiere en términos más generales al fenómeno de la variación entre muestras.

5.6 Determinación del tamaño de muestra:

Existen diversas maneras para obtener el tamaño de una muestra dependiendo de los datos con los que se cuente; en caso de contar con la cantidad de personas a las que le realizaremos el estudio (por ejemplo, el número de habitantes en x cuidad), se dice que se cuenta con un universo finito, en esta ocasión abordaremos esta clase de universo y como obtener el tamaño ideal de una muestra, se hace uso de la siguiente fórmula propuesta por Murray y Larry. 

 n=(Z^(2  ) Z^2)/(e^2 (N-1)+Z^2 O^2 )

n= Es el tamaño de la muestra poblacional a obtener
N= Es el tamaño de la población total
Z= Es el valor obtenido mediante niveles de confianza, su valor es constante, por lo general se tiene dos valores dependiendo el grado de confianza que se desee, siendo 99% el valor más alto (este valor equivale a 2.58) y 95% (1.96) el valor mínimo aceptado para considerar la investigación como confiable
e= Representa al límite aceptable de error muestral, generalmente va del 1% (0.01) al 9% (0.09) siendo 5% (0.5) el valor estándar usado en las investigaciones.

UNIDAD #6 FUNCIONES DE REGRESIÓN Y COEFICIENTE DE CORRELACIÓN 


6.1 Funciones de regresión y coeficiente de correlación:
Si todos los valores de las variables cumplen exactamente una relación exacta, entonces se dice que las variables están perfectamente correlacionadas o que hay una correlación perfecta entre ellas o, más sencillamente, que existe una función o una fórmula que las relaciona.
Averiguar la correlación entre dos variables se refiere siempre a hallar una medida de la relación entre esas dos variables. Cuando se trata de dos variables solamente, se habla de correlación simple y cuando se trata de más de dos variables se habla de correlación múltiple. Hallar una regresión entre dos variables se refiere siempre a hallar una fórmula o ecuación que represente la relación aproximada entre esas dos variables.

6.2 Funciones lineales y no lineales:

Ø Una función lineal es una función polinómica de primer grado; es decir, una función cuya representación en el plano cartesiano es una línea recta. Esta función se puede describir como: f(x)=mx+b donde m y b son constantes reales y x es una variable real. La constante m es la pendiente de la recta, y b es el punto de corte de la recta con el eje y. En el contexto de análisis matemático la función lineal son aquellas con b=0 de forma: f(x)=mx
Ø Funciones no lineales
v Un tipo de función no lineal se llama variación inversa. En estas funciones, la variable dependiente es igual a una constante multiplicada por la inversa de la variable independiente.
v Otro tipo de función no lineal es la función cuadrática. En una función cuadrática, la variable independiente (x) se multiplica a si misma
v Otro tipo de función no lineal es la función exponencial, en estas funciones, la variable independiente es una exponente en la ecuación. Las funciones exponenciales son usadas en cosas relacionadas con el crecimiento o la disminución de una población o la descomposición radiactiva.


      6.3 Ecuación de regresión lineal, no lineal y múltiple:

Ø Lineal: y=ß01x+£
ß0 y ß1, son los parámetros del modelo.
£ es una variable aleatoria, llamada error, que explica la variable en y que no se puede explicar con la relación no lineal entre x y y. Los errores £, se consideran variables aleatorias independientes distribuidas normalmente con media cero y desviación estándar σ. Esto implica que el valor medio o valor esperado de y, denotado por E(y/x), es igual a ß01x.
Ø No lineal: La regresión no lineal es un problema de inferencia para un modelo tipo y=f(x, θ)+£.
La función exponencial tiene la forma y=abx. Como x es el exponente, si b es mayor que 1, la salida crecerá muy rápido por cada pequeño incremento del valor de entrada.
La función cuadrática más simple tiene la ecuación y=x2
Ø Múltiple: El modelo que se plantea en regresión múltiple es el siguiente; yi1X1i2X2i+…ßKXki+ui donde x1, x2,xk son las variables independientes o explicativas. La variable respuesta depende de las variables explicativas y de una componente de error que se distribuye según una norma ui=N(0,σ2)


6.4 Elaboración de graficas de dispersión y cálculo de coeficiente de correlación
Editor SPSS
Como es obvio lo primero que hay que hacer es escribir o leer los datos de un archivo.

Además de los datos correspondientes a tres variables (dos cuantitativas y una cualitativa) aparece en el cuadro anterior la primera selección que debemos hacer cuando deseamos construir con SPSS un diagrama de dispersión. En el menú Gráficos seleccionamos Dispersión/Puntos     

Por defecto SPSS tiene marcada la opción de Dispersión simple, opción que nos permite construir un gráfico para representar la relación entre dos variables cuantitativas (en nuestro caso dedicación al trabajo y satisfacción familiar). Aceptamos la opción por defecto.
En el cuadro Diagrama de dispersión simple es necesario seleccionar de la lista de variables (rectángulo de la izquierda) la variable que vamos a insertar en el Eje X y la variable que insertaremos en el Eje Y. Una vez seleccionadas dichas variables pulsamos en los botones respectivos.
 Y finalmente aceptar.

Comentarios

Entradas más populares de este blog

PARADIGMAS EN PSICOLOGÍA DE LA EDUCACIÓN

  Paradigma Conductual Se origino en las primeras décadas del siglo XX. Su fundador fue J.B. Watson quien propuso su programa en un texto seminal escrito en 1913 al que domino la psicología desde el punto de vista de un conductista. Su fundamento teórico esta basado en que a un estimulo le sigue una respuesta, siendo esta el resultado de la interacción entre el organismo que recibe el estimulo y el medio ambiente. Edward Lee Thorndike es el precursor de la psicología conductista estadounidense. •El aprendizaje se componía de una serie de conexiones entre un estimulo y una respuesta, que se fortalecía cada vez que generaba un estado de cosas satisfactorio para el organismo (ley del efecto).                       Paradigma cognitivo El cognitivismo se desarrollo desde principios del siglo XX y se enfoca principalmente en la educación y en el aprendizaje significativo.   Considera al ser humano como un organismo que realiza una actividad basada fundamentalmente en el procesamiento d

Tipos de comunidad

                                      Definición de  Comunidad Es un grupo de seres humanos que comparten elementos en común, como idioma, costumbres, ubicación geográfica, visión del mundo o valores, por ejemplo. Dentro de una comunidad se suele crear una identidad común mediante la diferenciación de otros grupos o comunidades.  COMUNIDAD URBANA Son el conjunto de individuos organizados y establecidos en un mismo territorio que, por su extensión y desarrollo, forma las ciudades. Se refiere al espacio físico construido con diversas edificaciones (vivienda, fábricas, edificios, bodegas) e infraestructura de servicios (drenaje, tuberías de agua, tendidos eléctricos); habitan poblaciones mayores de 2 500 personas. Las actividades que se realizan en las ciudades son muy diversas, siendo el comercio la más importante, ya que en ella se llevan a cabo numerosas transacciones para compra y venta de productos que vienen del campo o que van hacia él. COMUNIDAD RURAL Comu