Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad

Estadística en Psicología: Obtención y Análisis de Datos, Apuntes de Estadística

La estadística en psicología permite tomar una distancia de los casos individuales para poner énfasis en características compartidas, sin dejar de lado al individuo. los procedimientos estadísticos, la organización de datos, estadística descriptiva y estadística inferencial. Se incluyen conceptos como población, unidad de análisis, variables, medidas resumen, medidas de dispersión, probabilidad y modelos de probabilidad.

Tipo: Apuntes

2020/2021

Subido el 10/05/2022

francisco-marinic
francisco-marinic 🇦🇷

1 documento

1 / 21

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
sPor lo general, en la psicología nuestro objeto de estudio a medir no es observable (ej.
Autoestima, inteligencia)
El objeto de estudio de la psicología: el comportamiento humano.
Esos objetos no observables, se miden de forma indirecta.
Terminan siendo objeto que se definen de manera muy distinta de acuerdo con la teoría con la
cual miramos ese objeto.
Ventajas: nos ha permitido hacer investigaciones mas acordes y cercanas a la forma de
investigar que de otras ciencias. Nos permite tomar decisiones mas justas.
La estadística nos permite indagar en estas cuestiones colectivas, estos factores que afectan a
la conducta humana de manera colectiva. Ubica al individuo en similitud con otros.
La estadística es importante en psicología porque:
Permite obtener conclusiones mas precisas sobre hechos psicológicos. Permite tomar
decisiones
Otorga claridad y precisión al pensamiento. Permite construir razonamientos y realizar
inferencias.
Es una herramienta clave en la investigación. Confirmar o rechazar hipótesis.
Nos permite mantenernos actualizados.
Nos permite comprender e interpretar información de nuestra vida cotidiana
LA ESTADISTICA EN PSICOLOGIA SI BIEN PERMITE TOMAR DISTANCIA DE LOS CASOS
INDIVIDUALES PARA PONER ACENTO EN CARACTERISTICAS COMPARTIDAS, ESTO NO
IMPLICA DEJAR DE LADO AL INDIVIDUO, IMPLICA SITUARLO EN RELACION AL GRUPO
La definición de estadística
Es un conjunto de técnicas que sirven para obtener datos, presentarlos organizadamente,
describirlos, analizarlos, y luego generalizar, en ausencia de la información completa.
Cuando hacemos estadística buscamos, lo que queremos es ver que cosas se repiten, cual es el
patrón.
Se busca lograr menor cantidad de categorías conceptuales y relacionales.
PROCEDIMIENTOS ESTADISTICOS: Permiten la reducción y abstracción de datos.
La estadística se puede dividir en:
DESCRIPTIVA: permite resumir un conjunto grande de información que proviene de una
muestra.
Ej: porcentaje, media, (SON DATOS QUE RESUMEN)
Permite presentar la info de manera accesible. EJ: PROMEDIO, GRAFICOS
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15

Vista previa parcial del texto

¡Descarga Estadística en Psicología: Obtención y Análisis de Datos y más Apuntes en PDF de Estadística solo en Docsity!

sPor lo general, en la psicología nuestro objeto de estudio a medir no es observable (ej. Autoestima, inteligencia) El objeto de estudio de la psicología: el comportamiento humano. Esos objetos no observables, se miden de forma indirecta. Terminan siendo objeto que se definen de manera muy distinta de acuerdo con la teoría con la cual miramos ese objeto. Ventajas: nos ha permitido hacer investigaciones mas acordes y cercanas a la forma de investigar que de otras ciencias. Nos permite tomar decisiones mas justas. La estadística nos permite indagar en estas cuestiones colectivas, estos factores que afectan a la conducta humana de manera colectiva. Ubica al individuo en similitud con otros. La estadística es importante en psicología porque: Permite obtener conclusiones mas precisas sobre hechos psicológicos. Permite tomar decisiones Otorga claridad y precisión al pensamiento. Permite construir razonamientos y realizar inferencias. Es una herramienta clave en la investigación. Confirmar o rechazar hipótesis. Nos permite mantenernos actualizados. Nos permite comprender e interpretar información de nuestra vida cotidiana LA ESTADISTICA EN PSICOLOGIA SI BIEN PERMITE TOMAR DISTANCIA DE LOS CASOS INDIVIDUALES PARA PONER ACENTO EN CARACTERISTICAS COMPARTIDAS, ESTO NO IMPLICA DEJAR DE LADO AL INDIVIDUO, IMPLICA SITUARLO EN RELACION AL GRUPO La definición de estadística Es un conjunto de técnicas que sirven para obtener datos, presentarlos organizadamente, describirlos, analizarlos, y luego generalizar, en ausencia de la información completa. Cuando hacemos estadística buscamos, lo que queremos es ver que cosas se repiten, cual es el patrón. Se busca lograr menor cantidad de categorías conceptuales y relacionales. PROCEDIMIENTOS ESTADISTICOS: Permiten la reducción y abstracción de datos. La estadística se puede dividir en: DESCRIPTIVA: permite resumir un conjunto grande de información que proviene de una muestra. Ej: porcentaje, media, (SON DATOS QUE RESUMEN) Permite presentar la info de manera accesible. EJ: PROMEDIO, GRAFICOS

Sus objetivos serán: resumir, sintetizar info, volverla manejable La función es extraer información interpretarla, a partir de un conjunto de datos que es tan grande que si no se resume de alguna forma no se podría incorporar esa información. INFERENCIAL: Responde al interrogante de si eso que observamos en la muestra, aplica para lo que no hemos observado. Comprende un conjunto de procedimientos que permiten extender las conclusiones que se obtienen en la muestra al resto de la población. Busca extender las conclusiones que se tomaron en unos sujetos a otros sujetos que no fueron observados. Se encargará de decirnos bajo qué condiciones se extenderán los hallazgos a casos no observados. SACAR CONCLUSIONES EN AUSENCIA DE LA INFO COMPLETA. POBLACION: conjunto o totalidad de elementos (unidades de análisis) sobre los que se investiga o se hacen estudios (son objetos de estudio). Pueden ser finitas (el número de elementos que la componen es limitado, y se puede tener acceso a todos o casi todos de esos elementos) I nfinitas (Es elevado el número de unidades) Hipotética ( No se sabe cuanto es la unidad de análisis ni hoy ni ayer ni mañana etc., EJ: VICTIMAS DE TRATA, no sabemos cuántas son las Vic, pero se puede deducir.) CENSO (relevamiento exhaustivo de las unidades de análisis. SE OBSERVA LA VARIABLE (características de interés) en todos los elementos de la población. NO SE SACA MUESTRA. MUESTRA: una pequeña porción de la población, subconjunto de elementos sobre la que se realiza el estudio. Muestreo : conjunto de procedimientos para seleccionar la muestra. LA MUESTRA DEBE: ser parte de la población y tener características similares. Ser representativa, “cuando puede representar bien a todos los elementos que no están en análisis” Toda la información que surge de una muestra se le llama estimador o estadístico valor calculado sobre los datos de una muestra. Siempre que hable de datos de una muestra o todos será ESTADSITICO O ESTIMADOR , si hablo de datos de una población se llamara PARAMETRO (si hay inferencia)

NUMEROS REFLEJAN CANTIDAD. El número no es arbitrario. Las categorías expresan cantidad de atributo, permiten expresar proporcionalidad entre los valores.

ETAPAS DE UN PROCESO ESTADISTICO

El primer paso tras plantear la pregunta que da pie a la investigación consiste en diseñar un estudio efectivo para recopilar datos que ayuden a responder esa pregunta. Este paso equivale a decidir que procesos debes utilizar para obtener los datos que necesitas. La realización de un análisis estadístico incluye las siguientes etapas.

  1. Identificar el problema a resolver Que información queremos obtener, nos va a permitir obtener análisis estadísticos adecuados. La pregunta nos lleva a identificar cuáles son las variables.
  2. Obtener la muestra de datos
  3. Organizar esos datos
  4. Analizar los datos organizados
  5. Interpretar la información que surge del análisis
  6. Tomar decisiones Presentación de los datos Estadísticos Una vez se plantea la pregunta principal de la investigación, necesariamente hay que definir las variables a investigar, estas variables van a tener distintos niveles de medición, luego de esto, prosigue la plantación de la hipótesis (no en todos los análisis estadísticos se plantea una hipótesis, cuando hacemos un estudio descriptivo lo único que buscamos hacer es conocer el estado de una variable en una determinada muestra, no implica extender mi investigación, no planteo hipótesis), se debe tener una completa recolección de información, de datos. Administrar los instrumentos que elijamos para recaudar información. Una vez obtenida esa info, y administrada, se debe codificar esa información e incorporarla en una matriz de datos, para que podamos llevar adelante el análisis de datos. Dicho análisis implica una toma de decisiones, elegir qué tipo de análisis hay que hacer, en función de cual es mi problema y en que medida e evaluado mis variables (ordinales, nominales, proporcionales, etc.). Una vez conseguido los análisis hay que presentarlos, (tablas, gráficos)

En las variables CUALITATIVAS

Al ser variables cualitativas, el número es arbitrario, lo más que podemos hacer es comparar las categorías. Se comparan frecuencias (cantidad de casos), porcentaje de categorías.

En las variables CUANTITATIVAS

En estas variables el numero empieza a ser tal cual es. Aquí en vez de comparar categorías, comparamos intervalos (FRECUENCIA), porcentajes y proporciones, también podemos calcular INDICES.

Herramientas para presentar DATOS

Las tablas y figuras nos permiten presentar una gran cantidad de información de manera eficiente y hacer que esos datos sean mas comprensibles. El propósito de presentar tablas y gráficos es facilitar la comprensión de los lectores. El diseño de estas tablas no debe ser tomado a la ligera. EL tipo de medida predomina el tipo de grafico o tabla

Estadística descriptiva - ORGANIZACIÓN DE LOS DATOS

NOMINALES

Cuando se llega al paso de analizar los datos, una vez ya plasmados en una matriz de datos, el primer paso en un análisis es la tabla de frecuencias ES UNA MANERA DE PRESENTAR LA INFO RESUMIDA. En una columna de la tabla se presentan las categorías de la variable (nominales=cualitativas) y en la otra el conteo de casos que asume cada valor de la variable. (cuantos casos toma esa categoría de la variable) El conteo de casos (el total de caso de cada categoría de la variable) se llama frecuencias absolutas simples , se simboliza con la letra f. Para determinar qué proporción asume cierta frecuencia absoluta en determinada variable se debe sacar la frecuencia relativa simple. Esta se haya dividendo la frecuencia absoluta elegida por la cantidad de casos que existan. Se representa con la letra f ’.

Estadística descriptiva - ORGANIZACIÓN DE LOS DATOS

ORDINALES

Cuando trabajamos con datos de niveles de medición mas elevados (como ordinal intervalar o proporcional) se puede calcular otro tipo de frecuencia. Cuando vamos sumando las frecuencias absolutas simples, nos encontramos con la frecuencia absoluta acumulada. Sumamos el resultado en cada nivel de las categorías. En el ultimo nivel de las categorías siempre da el total de casos. Se simboliza con la letra F. También se puede

Amplitud Intercuartílica (AIQ): es la distancia entre los cuartiles 1 y 3, se simboliza AIQ, es la diferencia entre Q3 Y Q1. Desvío (Xi-M): Toma a la media como punto de referencia. Es la diferencia entre cada observación, ósea cada caso, y la media, cuanto cada caso se aleja o se acerca de la media. No se puede usar la suma de desvíos como un indicador de dispersión (ya que el desvío es una medida de dispersión)

Varianza ( S^2 ¿ : La varianza es la suma de los cuadrados de la diferencia entre cada observación

y la media dividido por el total de observaciones menos 1 Elimina el signo negativo para que la sumatoria de desvíos no de cero. Desviación estándar (S): Su función es eliminar el cuadrado de la varianza, es la raíz cuadrada de la varianza.

Medidas de Forma

Simetría: Presenta aproximadamente la misma cantidad de caso hacia ambos lados en la distribución. Asimétrica: los casos no se distribuyen de manera proporcional hacia un lado o el otro del centro de la distribución. Curtosis: Indica el grado de dispersión o concentración que presentan los valores alrededor de la zona central de la distribución. Según el grado de curtosis existen 3 tipo, mesocúrtica =0, leptocúrtica -0, platicúrtica +0)

Estadística descriptiva - ORGANIZACIÓN DE LOS DATOS

INTEREVALARES y Proporcionales

Representación gráfica de los datos Para variables CUANTITATIVAS usamos un histograma. (frecuencias absolutas o relativas simples) Otro grafico que se utiliza es el polígono de frecuencias. (frecuencias absolutas o relativas simples) O también una OJIVA de Galton (frecuencia absoluta o relativa acumulada)

¿Como simplifico los datos? Utilizando intervalos podemos condensar la información, simplificar las categorías en rangos (ej: EDAD- 20 A 22) el rengo seria la cantidad de números que hay entre uno y el otro, en este caso 2 valores cada intervalo. ¿Pero, cómo se arma esos intervalos? En primer paso hay que determinad de que amplitud deben ser esos intervalos, haciendo un cálculo, tomando como referencia cuantos intervalos quiero tener (el mayor valor menos el menor valor de la tabla y dividirlos por la cantidad de intervalos que quiero tener) MARCA DE CLASE Valor medio entre los límites que representa la clase, cada intervalo va a tener un nume ro que los representa Limite inferior + limite superior / 2 : LIMITES APARENTES Son estos limites que podemos ver en el rango de cada intervalo. LIMITES EXACTOS Es DADO como; al limite inferior le restamos -0.5, y al límite superior +0.5. (si un rango es, 48-50, los limites exactos serian, 47.5 y 50.5) Puntuaciones en PSICOLOGIA En psicología trabajamos con datos psicométricos, Un test arroja puntuaciones. Resultado inicial de un test, es el resultado bruto directo u original. Ese puntaje viene dado en el test, dependiendo de los ítems, etc. El puntaje bruto debe estar estandarizado, se transforma en puntaje z o, percentiles o en puntaje t. Esta traducción la haremos a través del baremo. Un baremo es una tabla de equivalencia entre puntaciones originarias y transformadas que permiten la comparación de los resultados individuales con los de un grupo de referencia.

Modelo de probabilidad

Es una anticipación acerca de lo que se espera que suceda El modelo no es arbitrario, se tienen suficientes razones para suponer que el modelo se sostiene Es una aproximación a lo que sucede en la realidad Su objetivo es simplificar la realidad y usarlo para asignar probabilidades a los diferentes resultados posibles.

Un modelo de probabilidad permite calcular probabilidades de manera sencilla bajo

ciertos supuestos.

Distribución Binomial Se usa para modelar fenómenos aleatorios que pueden dar solo 2 resultados. Estos resultados se llaman éxito y fracaso. Distribución de probabilidad Normal Se usa para modelar la mayoría de los fenómenos naturales, sociales o psicológicos, modelar fenómenos que no tienen una distribución uniforme, fenómenos donde no es igualmente probable obtener cualquier resultado. La mayoría de las observaciones se centra en los valores medios. Los valores extremos son poco frecuentes. Es la distribución apropiada para variables continuas. Es imposible enumerar todas las categorías en una variable de este tipo, las categorías son infinitas. No calculamos probabilidades para valores simples, sino probabilidades acumuladas, representadas gráficamente en el área bajo la curva El calculo de probabilidades bajo el modelo normal es complejo. La representación gráfica: UNIMODAL Y SIMETRICA Ej de variables: peso del niño al nacer, IQ, altura, etc. Puntaje Z Es el lenguaje que se utiliza cuando estamos ante modelos de distribución normal. Permiten la comparación de fenómenos muy disimiles. Es un lenguaje universal, es la transformación de un lenguaje original a este lenguaje Z. Son valores que no tienen unidad de medida.

Mide la distancia a la que se encuentra una observación particular de la media, expresada como desvió estándar de la media. Es una medida estandarizada de lo cerca/lejos que se encuentra una observación en particular de la media. X: puntaje original X (CON PALITO ARRIBA): la media S: Distribución estándar de la distribución de origen Toda variable que pueda modelarse con una distribución normal puede transformarse a puntaje Z y así hallar la probabilidad asociada a diferentes intervalos

Prueba de Hipótesis

Una hipótesis vendría a ser la respuesta tentativa a la pregunta inicial de una investigacion. En la estadística inferencial, la hipótesis vendría a ser, la pregunta tentativa, vendría a ser la pregunta que si la información que se encuentra en la muestra se puede generalizar en la población. Esa pregunta tratamos de responder a través de la prueba de hipótesis. Eso se comprueba a través de la probabilidad. La Prueba de hipótesis tiene como objetivo principal ayudarnos a decidir en contextos de incertidumbre. Sirve para analizar diferencias y tomar decisiones A veces usamos prueba de hipótesis para analizar variables. Consiste en una metodología paso a paso que nos permitirá hacer inferencias con respecto al valor especifico de un parámetro de la población mediante el análisis de diferencias entre los resultados que observamos de una realidad (obtenidos de la muestra) y los resultados que esperaríamos obtener si alguna hipótesis subyacente fuera verdadera.

Zona de Rechazo: Conjunto de resultados posibles de un experimento que tienen una baja probabilidad de verificarse de ser cierta H0. Puntos críticos: valores que separan la zona de aceptación por la zona de rechazo. NIVEL DE SIGNIFICACION (VALOR DE P) Probabilidad de hallar el valor muestral en la zona de rechazo H0, si H0 es verdadera. /---------------------------------------------------------------------/ Niveles mas usados en ciencias sociales (psicología) El 0,5 significa hay un 5% de probabilidades de encontrar el resultado en una muestra. Si dan estos resultados significa que estamos en condiciones de rechazar la H

Dirección de hipótesis alternativa

Relaciones SIMETRICAS

Es una relacion simétrica cuando no es posible o no interesa señalar o saber que variable ocurre primero. Estas relaciones simétricas también se llaman co-variacion o de variación conjunta. Solo nos limitamos a decir que las variables están relacionadas

Relaciones ASIMETRICAS

Podemos identificar una variable que es anterior a la otra Una variable va a ser el antecedente y la otra la consecuente. (causa y efecto) También se llaman variables independientes que es la causa, y dependiente quien recibe el efecto de esa variable.

Intensidad de la relacion

Es una medida de la fuerza con que los cambios en una variable afectan a la otra ( relaciones asimétricas) Es una medida de la frecuencia con que los cambios en una variable acompañan a los de la otra. (Relaciones Simétricas ) Relaciones entre variables nominales En una TABLA DE CONTINGENCIA 3X Los números que no son total se llaman Frecuencias CONJUNTAS , y los que son el TOTAL son FRECUENCIAS MARGINALES Entre los GRÁFICOS, podemos usar grafico de barras apiladas. Otro grafico puede ser el grafico de MOSAICOS. ¿Para qué hacemos esa tabla? Esa tabla es la base de los estadísticos que nos van a hablar de cómo es la relacion entre esas variables.

Prueba de independencia de atributos Es un coeficiente, esta prueba evalúa si dos atributos, variables, fenómenos, son

independientes o están relacionados, esta prueba se llama Chi cuadrado ( x^2 )

Permite determinar si las frecuencias absolutas obtenidas de una información difieren significativamente (se refiere a que tan probable es encontrar un resultado como este si la hipótesis nula fuera verdadera) o no de las que se estarían esperando, teniendo en cuenta, una determinada hipótesis planteada de interrelación sobre las categorías de las variables consideradas. Cuando hacemos análisis de relaciones entre variables nominales el modelo de probabilidad en el cual se basa es el modelo de probabilidad de chi cuadrado. Modelo de probabilidad CHI CUADRADO Esta prueba es muy usada porque nos permite evaluar muchas cosas tales como: Independencia Probar la supuesta dependencia entre variables de dos variables cualitativas de una población. Inferencia de Proporción Realizar inferencias sobre más de dos proporciones de una población. Inferencia de Varianza Hacer inferencias sobre la varianza de la población. Bondad de Ajuste Evaluar credibilidad de datos muestrales, que provengan de una población cuyos elementos se ajusten a un tipo especifico de distribución de probabilidad.

Tiene en cuenta la forma en la que se distribuyen las observaciones en las 4 celdas de la tabla. La concentración de las observaciones en las diagonales de la tabla es una señal de la asociación. Correlaciones BIVARIADAS

Relaciones entre variables ordinales y continuas

Cuando trabajamos con variables ORDINALES superiores (intervalares y proporcionales), también podemos evaluar la DIRECCION. Se pueden hacer juicios de orden de las categorías Se pueden señalar si sus valores van creciendo o decreciendo Dirección DIRECTA: Se habla de una dirección directa cuando las dos variables cambian en la misma dirección, a medida que aumenta una aumenta la otra. INVERSA: Las dos variables van a cambiar juntas, pero en direcciones contrarias, cuando una aumenta la otra disminuye. RELACIONES ENTRE VARIABLES ORDINALES Cuando tenemos dos variables de nivel ordinal (o superior)

Coeficiente de Correlación por rangos de Spearman

Es un coeficiente que nos permite ver la intensidad de la relacion entre dos variables de nivel ordinal o superior. Como se calcula:

  1. Se transforman los valores de las variables en rangos, de mayor a menor.
  2. Al máximo valor de la variable corresponde el rango 1 y así sucesivamente.
  3. Una vez ordenados, se determina, para cada caso, la diferencia entre el rango de una variable y de la otra.
  4. Se calcula la distancia entre los ordenamientos. Este coeficiente de darnos la intensidad de una relacion, nos va a hablar de una dirección.

Variables INTERVALARES Y PROPORCIONALES

Cuando tenemos 2 variables de nivel intervalar o superior Coeficiente de correlación R de PEARSON Utilizado para analizar la intensidad de la relacion lineal entre 2 variables Las dos variables deben ser de nivel intervalar o superior El coeficiente mide que tan bien se aproxima el conjunto de datos a una función lineal (LINEAL: Relaciones con tendencia creciente o decreciente, pero que sigue un camino a una línea recta) Este coeficiente se puede graficar con el DIAGRAMA DE DISPERCION Diagrama de Dispersión Representa los puntos de encuentro de las variables