UNIDAD #1 APLICACIÓN DE LA ESTADÍSTICA EN LA
INVESTIGACIÓN SOCIAL
1.1
La importancia de la cuantificación en la investigación
social:
Las investigaciones sociales consisten en estudiar nuestra
realidad social y a partir de este estudio crear nuevos conocimientos por medio
de distintas técnicas e instrumentos. En este sentido, la cuantificación es
impredecible en los procesos investigativos cuando se pretende representar de
forma numérica alguno de los elementos del problema a estudiar. Por lo que, su
importancia radica en que a través de la cuantificación aplicada por algún tipo
de análisis estadística, se permite estudiar, limitar, establecer su punto de
parte y hacia cual dirección va el problema estudiado.
1.2
Conceptos de población, muestreo, muestra y unidades de
observación:
Ø Población, es
un conjunto de seres vivos de una especie que habita en un determinado lugar.
Se utiliza también para referirse al conjunto de viviendas de forma similar al término
localidad. La población es un conjunto de individuos que viven en un preciso
lugar, inclusive en el planeta en general, esto se refiere a los espacios y
obra de una localidad u otra división política a la acción y las consecuencias
de poblar.
Ø Muestreo, es el procedimiento a
través del cual es seleccionada una
muestra que es un subconjunto de elementos de una población, es decir, una
porción de elementos extraídos de una población previamente definida a partir
de una población. El muestreo se refiere a esa reducción de elementos que
componen a un universo o población, para así poder cumplir con la investigación
correspondiente.
Ø Muestra, es una parte o una
porción de un producto que permite conocer la calidad del mismo. La muestra
estadística es el subconjunto de los individuos de una población estadística.
Estas muestras permiten inferir las propiedades del total del conjunto.
Ø Unidades de observación, es
cualquier elemento concreto, a partir del cual pueda obtenerse información.
Antes de comenzar su investigación, el analista de la realidad debe tener muy
claro que información necesita y donde la buscara. Debe definir pues las
unidades de observación que pretenda estudiar.
1.3 Variables y datos:
Ø Variable:
es una palabra que representa a aquello que varía o que está
sujeto a algún tipo de cambio. Se trata de algo que se caracteriza por ser
inestable, inconstante y mudable. Una variable es un símbolo que permite
identificar a un elemento específico dentro de un determinado grupo. Este
conjunto suele ser definido como el conjunto universal de la variable y cada
pieza incluida en el constituye un valor de la variable.
Ø Datos: son números que representan las modalidades de las
variables. Los datos pueden ser clasificados según diferentes criterios, uno de
los cuales se basa en las modalidades que representan. Se dirá que son datos
dicotómicos los que provienen de variables que solo admiten dos modalidades.
UNIDAD #2 RECOPILACIÓN DE DATOS
2.1
El instrumento de investigación (validez y confiabilidad):
Un
instrumento de investigación es la herramienta utilizada por el investigador para
recolectar la información de la muestra seleccionada y poder resolver el
problema de la investigación, que luego facilita resolver el problema de
mercadeo. Los instrumentos están compuestos por escalas de medición. Existen 3
actividades para recolectar los datos:
1) Seleccionar:
el instrumento debe ser válido y confiable
2) Aplicar:
es decir, obtener las observaciones y mediciones de las variables que son de
interés para nuestro estudio.
3) Preparar:
las mediciones obtenidas deben ser analizadas correctamente, se denomina
“codificación de datos”.
2.2 Tipos de variables estadísticas:
Una
variable estadística es cada una de las características o cualidades que poseen
los individuos de una población.
Ø Variable
cualitativa: se refiere a características o cualidades que no pueden ser
medidas con números.
·
Nominal: Presenta modalidades no
numéricas que no admiten un criterio de orden.
·
Ordinal: Presenta modalidades no
numéricas, en la que existe un orden.
Ø Variable
cuantitativa: es la que se expresa mediante un número, por lo tanto se pueden
realizar operaciones aritméticas con ella.
·
Discreta: Es aquella que solo puede
tomar un número finito de valores entre dos valores cualesquiera de una
característica.
·
Continua: Es aquella que puede tomar un
número infinito de valores entre dos valores cualesquiera de una
característica.
2.3 Escala de medición nominal, ordinal, de
intervalo o de razón:
Las escalas son consecuencias de la medición, puede
llevarse según diferentes conjuntos de reglas.
Ø Nomina.
Una escala de medición es nominal si los datos son etiquetas
o categorías que se usan para definir un atributo de un elemento. Los datos
nominales pueden ser numéricos o no numéricos.
Ø Ordinal.
Una escala de medición es ordinal si los datos pueden usarse
para jerarquizar u ordenar las observaciones. Los datos pueden ser numéricos o
no numéricos.
Ø Intervalo. Una escala de medición es de intervalo si los datos tienen
las propiedades de los datos ordinales y los intervalos entre observaciones se
expresan en términos de una unidad de medición fija. Los datos tienen que ser
no numéricos.
Ø Razón. Una escala de medición es de razón si los datos tienen las
propiedades de los datos de intervalo y el cociente (o razón) entre dos medidas
tiene sentido. Los datos tiene que ser no numéricos.
UNIDAD #3 AGRUPACIÓN Y ORDENADOR DE DATOS
1.1
Por frecuencia:
Son tablas en que se dispone las modalidades de la variable
por filas. En las columnas se dispone el número de ocurrencias por cada valor,
porcentaje, etc. La finalidad de las agrupaciones en frecuencias es facilitar
la obtención de la información que contienen los datos. Es la representación
conjunta de los datos en forma de tabla o subgrupo de datos correspondientes a
un fenómeno en estudio y su ordenamiento en base al número de observaciones que
corresponden a cada dato o a cada grupo de datos adecuados según cronología
geográfica, análisis cuantitativo o cualitativo.
1.2
Por valores absolutos:
El valor absoluto de un número real es su valor numérico
sin tener en cuenta su signo, sea este positivo o negativo. El valor absoluto está
vinculado con las nociones de magnitud, distancia y norma en diferentes
contextos matemáticos y físicos.
1.3
Por valores relativos:
De un dato, se obtiene al
dividir la frecuencia absoluta de cada dato entre el número total de datos. De
un intervalo se obtiene al dividir la frecuencia absoluta de cada intervalo
entre el número total de datos. Valor relativo es aquel que se expresa como un
porcentaje, resultante de la razón o proporción entre dos cantidades.
1.4
Índices
Un número índice es una medida
estadística que nos permite estudiar los cambios que se producen en una
magnitud simple o compleja con respecto al tiempo o al espacio. Al periodo
inicial se le denomina periodo base o referencia y se le asigna el valor 100,
en cambio la situación que deseamos comparar se denomina periodo actual o
corriente.
1.5
Presentación de los datos, tablas y graficas (graficas de
barra, poligonales, abiertas, histogramas, graficas de pastel, pictogramas):
Ø Grafica
de barra. Es una forma de grafica que utiliza barras para
indicar la frecuencia de ocurrencia de las observaciones. Para construirla se
constituye el eje por las frecuencias absolutas y el eje X por los límites
inferior y superior de cada clase, dejando un espacio entre barra y barra.
Ø Poligonales.
Es una gráfica del tipo de las gráficas de líneas trazadas
sobre las marcas de clase y se traza uniendo con segmento de recta, de
izquierda a derecha, las parejas ordenadas que se forman, al considerar como
abscisa la marca de clase (eje horizontal) y como ordenada la frecuencia del
intervalo representado (eje vertical).
Ø Histograma.
Las barras no van separadas, y que se rotula con los limites
inferiores de cada clase o intervalo excepto el ultimo que deberá llevar
también el límite superior centradas en la marca de clase.
Ø Graficas
de pastel. Esta grafica es creada con frecuencias y porcentajes,
permite resaltar segmentos de cada clase determinada.
Ø Pictogramas.
Las gráficas de pictogramas utilizan iconos para ofrecer una
visión general más atractiva de pequeños conjuntos de datos discretos.
UNIDAD #4 MEDIDAS DE TENDENCIA Y DE DISPERSIÓN
4.1 Media, media ponderada, mediana y moda:
Ø
Media: La medida más evidente que
podemos calcular para describir un conjunto de observaciones numéricas es su
valor medio. La media no es más que la suma de todo los valores de una variable
dividida entre el número total de datos de los que dispone. Su fórmula es,
Ø
Media
Ponderada: En está, para cada uno de los valores de xi se asigna un
factor wi de peso, que depende de la importancia que el investigador
desee darle.
Ø
Mediana: Es valor de la observación que ocupa la
posición central de un conjunto de datos ordenados según su magnitud. La
mediana es un valor de la variable que deja por debajo de él un número de casos
iguales al que deja por arriba.
Ø Moda: Es el valor de un conjunto de datos que
ocurre con más frecuentemente, se considera como el valor más típico de una
serie de datos.
4.2 Desviación media, varianza y desviación
estándar:
Ø
Desviación
media: La desviación media, es la media aritmética de las desviaciones absolutas
de cada una de las observaciones con respecto a su valor central, la media
aritmética o la mediana. Cuanto mayor es su valor, mayor es la dispersión de
los datos.
Ø
Varianza:
Otro
tratamiento para evadir la suma cero de las desviaciones de las observaciones
respecto a su media aritmética, consiste en recurrir al proceso de elevar al
cuadrado estas desviaciones y sumar los cuadrados, dividiendo la suma por el
número de casos, a esta cantidad se le denomina varianza.
Ø
Desviación
estándar: La desviación estándar es útil para describir cuanto se apartan de la
media de la distribución los elementos individuales. Una medida de ellos se
denomina puntuación estándar número de desviaciones a las que determinada
observación se encuentra con respecto a la media.
4.3
Distribuciones empíricas y teóricas, normal y binomial:
Ø La distribución empírica asociada
a una muestra es la ley de probabilidad sobre el conjunto de las modalidades,
que afecta a cada observación con el peso. La media, la varianza y la
desviación estándar pueden ser vistas como características probabilistas de la
distribución empírica.
Ø Las distribuciones teóricas,
son las funciones que se asigna a cada suceso definido sobre la variable
aleatoria, la probabilidad de que dicho suceso ocurra. Muestra todos los
resultados posibles de un experimento y la probabilidad de cada resultado.
Ø Se llama distribución normal a
una de las distribuciones de probabilidad de variable continua que con más
frecuencia aparece en fenómenos reales.
Ø La distribución binomial es
una distribución de probabilidad discreta que mide el número de éxitos en una
secuencia de n ensayos independientes de Bernoulli con una probabilidad fija p
de ocurrencia del éxito entre los ensayos.
UNIDAD #5 POBLACIÓN
Y MUESTRA
5.1 Concepto de población y muestra:
Ø Población
es un conjunto de seres vivos de una
especie que habita en un determinado lugar. Se utiliza también para referirse
al conjunto de viviendas de forma similar al término localidad. La población es
un conjunto de individuos que viven en un preciso lugar, inclusive en el
planeta en general, esto se refiere a los espacios y obra de una localidad u
otra división política, a la acción y las consecuencias de poblar.
Ø Una muestra es una parte o una porción de un producto que
permite conocer la calidad del mismo. La muestra estadística es el subconjunto
de los individuos de una población estadística, estas muestran permiten inferir
las propiedades del total del conjunto.
5.2 Tipos de
muestra:
Su función básica es
determinar que parte de una realidad en estudio (población o universo) debe
examinarse con la finalidad de hacer inferencias sobre dicha población.
Ø Probabilístico (aleatorio): En este tipo de muestreo, todos los individuos de la
población pueden formar parte de la muestra, tienen probabilidad positiva de
formar parte de la muestra.
Ø No probabilístico (no aleatorio): En este tipo de muestreo, puede haber clara influencia de
la persona o personas que seleccionan la muestra o simplemente se realiza
atendiendo a razones o comodidad.
Ø Aleatorio simple: Todos los individuos tienen la misma probabilidad de ser
seleccionados.
Ø Aleatorio estratificado: El criterio a seguir en la formación de los estratos será formarlos
de tal manera que haya la máxima homogeneidad en relación a la variable a
estudio dentro de cada estrato y la máxima heterogeneidad entre los estratos.
Ø Aleatorio sistemático: Es un tipo de muestreo aleatorio simple en el que los
elementos se seleccionan según un patrón que se inicia con una elección
aleatoria.
Ø Aleatorio por conglomerados: Un conglomerado se considera una agrupación de elementos
que presentan características similares a toda la población.
Ø Por cuotas: En
este tipo se fijan unas cuotas, que consisten en un número de individuos que
reúnen unas determinadas condiciones.
Ø Casual o incidental: Se trata de un proceso en el que el investigador selecciona
directa e intencionalmente los individuos de la población.
5.3 Probabilística:
Es aquella muestra en la que
sus elementos han sido seleccionados aleatoriamente, esto es mediante n
realizaciones de un experimento aleatorio. El procedimiento de muestreo
probabilístico es el que, dada sus ventajas, más se utiliza, pudiendo conocerse
previamente en él la probabilidad de obtención de cada una de las muestras que
sean seleccionables.
5.4 No
probabilística:
Es la técnica de muestreo
donde los elementos son elegidos a juicio del investigador. No se conoce la
probabilidad con la que se puede seleccionar a cada individuo. Se utiliza
cuando es imposible o muy difícil obtener la muestra por métodos de muestreo
probabilístico.
5.5 Error:
La estimación de un valor de
interés, como la media o el porcentaje, estará generalmente sujeta a una
variación entre una muestra y otra. Estas variaciones en las posibles muestras
de una estadística pueden, teóricamente ser expresadas como errores muéstrales,
sin embargo normalmente en la practica el error exacto es desconocido. El error
muestral se refiere en términos más generales al fenómeno de la variación entre
muestras.
5.6 Determinación del tamaño de muestra:
Existen diversas maneras para
obtener el tamaño de una muestra dependiendo de los datos con los que se
cuente; en caso de contar con la cantidad de personas a las que le realizaremos
el estudio (por ejemplo, el número de habitantes en x cuidad), se dice que se
cuenta con un universo finito, en esta ocasión abordaremos esta clase de
universo y como obtener el tamaño ideal de una muestra, se hace uso de la
siguiente fórmula propuesta por Murray y Larry.
n= Es el tamaño de la muestra poblacional a obtener
N= Es el tamaño de la población total
Z= Es el valor obtenido mediante niveles de confianza, su valor
es constante, por lo general se tiene dos valores dependiendo el grado de
confianza que se desee, siendo 99% el valor más alto (este valor equivale a
2.58) y 95% (1.96) el valor mínimo aceptado para considerar la investigación
como confiable
e= Representa al límite aceptable de error muestral,
generalmente va del 1% (0.01) al 9% (0.09) siendo 5% (0.5) el valor estándar
usado en las investigaciones.
UNIDAD #6 FUNCIONES DE
REGRESIÓN Y COEFICIENTE DE CORRELACIÓN
6.1 Funciones de regresión y coeficiente de correlación:
Si todos los valores de las variables cumplen exactamente
una relación exacta, entonces se dice que las variables están perfectamente
correlacionadas o que hay una correlación perfecta entre ellas o, más
sencillamente, que existe una función o una fórmula que las relaciona.
Averiguar la correlación entre dos variables se refiere
siempre a hallar una medida de la relación entre esas dos variables. Cuando se
trata de dos variables solamente, se habla de correlación simple y cuando se
trata de más de dos variables se habla de correlación múltiple. Hallar una
regresión entre dos variables se refiere siempre a hallar una fórmula o ecuación
que represente la relación aproximada entre esas dos variables.
6.2 Funciones lineales
y no lineales:
Ø Una función lineal es una función polinómica de primer
grado; es decir, una función cuya representación en el plano cartesiano es una
línea recta. Esta función se puede describir como: f(x)=mx+b donde m y b son
constantes reales y x es una variable real. La constante m es la pendiente de
la recta, y b es el punto de corte de la recta con el eje y. En el contexto de
análisis matemático la función lineal son aquellas con b=0 de forma: f(x)=mx
Ø Funciones no lineales
v Un tipo de función no lineal se llama variación inversa. En estas funciones, la variable
dependiente es igual a una constante multiplicada por la inversa de la variable
independiente.
v Otro tipo de función no lineal es la función cuadrática. En una función cuadrática, la
variable independiente (x) se multiplica a si misma
v Otro tipo de función no lineal es la función exponencial, en estas funciones, la
variable independiente es una exponente en la ecuación. Las funciones
exponenciales son usadas en cosas relacionadas con el crecimiento o la
disminución de una población o la descomposición radiactiva.
6.3 Ecuación de regresión lineal, no lineal
y múltiple:
Ø Lineal: y=ß0+ß1x+£
ß0 y ß1,
son los parámetros del modelo.
£ es una variable
aleatoria, llamada error, que explica la variable en y que no se puede explicar
con la relación no lineal entre x y y. Los errores £, se consideran variables
aleatorias independientes distribuidas normalmente con media cero y desviación
estándar σ. Esto implica que el valor medio o valor esperado de y, denotado por
E(y/x), es igual a ß0+ß1x.
Ø No lineal: La
regresión no lineal es un problema de inferencia para un modelo tipo y=f(x, θ)+£.
La función exponencial
tiene la forma y=abx. Como x es el exponente, si b es mayor que 1, la salida
crecerá muy rápido por cada pequeño incremento del valor de entrada.
La función cuadrática más
simple tiene la ecuación y=x2
Ø Múltiple: El
modelo que se plantea en regresión múltiple es el siguiente; yi=ß1X1i+ß2X2i+…ßKXki+ui
donde x1, x2,xk son las variables
independientes o explicativas. La variable respuesta depende de las variables
explicativas y de una componente de error que se distribuye según una norma ui=N(0,σ2)
6.4 Elaboración de graficas de dispersión y cálculo de
coeficiente de correlación
Editor SPSS
Como es obvio lo primero que hay que hacer es escribir o
leer los datos de un archivo.
Además de los datos
correspondientes a tres variables (dos cuantitativas y una cualitativa) aparece
en el cuadro anterior la primera selección que debemos hacer cuando deseamos
construir con SPSS un diagrama de dispersión. En el menú Gráficos seleccionamos
Dispersión/Puntos
Por defecto SPSS tiene marcada
la opción de Dispersión simple, opción que nos permite construir un gráfico
para representar la relación entre dos variables cuantitativas (en nuestro caso
dedicación al trabajo y satisfacción familiar). Aceptamos la opción por
defecto.
En
el cuadro Diagrama de dispersión simple es necesario seleccionar de la lista de
variables (rectángulo de la izquierda) la variable que vamos a insertar en el
Eje X y la variable que insertaremos en el Eje Y. Una vez seleccionadas dichas
variables pulsamos en los botones respectivos.
Y finalmente aceptar.
Comentarios
Publicar un comentario