Snippets

Alonso Silva Satisfacción personal, libertad para elegir, y tramo socioeconómico al que perteneces

Created by Alonso Silva

Satisfacción personal, libertad para elegir, y tramo socioeconómico al que perteneces

Nota: La base de datos que se utiliza a continuación puede ser obtenida aquí, gracias a que el PNUD dejó a libre disposición los datos obtenidos en la encuesta realizada para el libro "Desiguales: Orígenes, cambios y desafíos de la brecha social en Chile". ¡Muchísimas gracias!.

Advertencia: No utilizé los ponderadores para que la muestra sea representativa de Chile, de hecho no sé cómo hacerlo pero espero que los resultados no cambien mucho.

En este post, me focalizo en sólo tres preguntas de dicha base de datos (en el futuro espero obtener resultados más interesantes con las otras preguntas, así que si tiene sugerencias, no dude en escribirlas en los comentarios). Primero necesito descargar los datos e importar algunos paquetes necesarios para trabajar con los datos (no se asuste y siga leyendo más abajo).

# Importar algunos paquetes que necesitaremos más adelante
import numpy as np
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
%matplotlib inline
df = pd.read_csv('PNUD_DES_2016_publica.csv')
# Tabla de ingresos
dict = {'Tramo del ingreso': [1, 2, 3, 4, 5, 6],
        '1 persona': ['0 a \$105.000', '\$105.001 a \$152.000', '\$152.001 a \$267.000', '\$267.001 a \$544.000', '\$544.001 a \$1.100.000', '\$1.100.001 o más'],
        '2 personas': ['0 a \$171.000', '\$171.001 a \$247.000', '\$247.001 a \$434.000', '\$434.001 a \$880.000', '\$880.001 a \$1.780.000', '\$1.780.001 o más'],
        '3 personas': ['0 a \$227.000', '\$227.001 a \$328.000', '\$328.001 a \$580.000', '\$580.001 a \$1.180.000', '\$1.180.001 a \$2.370.000', '\$2.370.001 o más'],
        '4 personas': ['0 a \$278.000', '\$278.001 a \$401.000', '\$401.001 a \$705.000', '\$705.001 a \$1.450.000', '\$1.450.001 a \$2.900.000', '\$2.900.001 o más'],
        '5 personas': ['0 a \$325.000', '\$325.001 a \$470.000', '\$470.001 a \$825.000', '\$825.001 a \$1.700.000', '\$1.700.001 a \$3.400.000', '\$3.400.001 o más'],
        '6 y más personas': ['0 a \$370.000', '\$370.001 a \$530.000', '\$530.001 a \$940.000', '\$940.001 a \$1.900.000', '\$1.900.001 a \$3.800.000', '\$3.800.001 o más']
}
df1 = pd.DataFrame(dict)

Las tres preguntas en que me focalizaré son las siguientes:

Pregunta 6.- Considerando todas las cosas, ¿cuán satisfecho o insatisfecho está usted con su vida en este momento? Por favor use esta tarjeta en que 1 significa que usted está "completamente insatisfecho" y 10 significa que usted está "completamente satisfecho"

Pregunta 7.- Imagine una escalera de 10 escalones donde en la parte de abajo, el primer escalón, están las personas que no tienen libertad de elegir y/o decidir sobre su vida y en el escalón más alto, el décimo, están los que tienen más libertad de elegir y/o decidir sobre su vida. ¿En qué escalón está usted hoy?

Pregunta 67.- ¿En cuál de los siguientes rangos estima usted que se ubica el ingreso mensual total de su hogar (incluya sueldos, pensiones, rentas, etc.)? Considere el ingreso líquido de todas estas personas juntas.

df1

<div> <style> .dataframe thead tr:only-child th { text-align: right; }

.dataframe thead th {
    text-align: left;
}

.dataframe tbody tr th {
    vertical-align: top;
}

</style> <table border="1" class="dataframe"> <thead> <tr style="text-align: right;"> <th></th> <th>1 persona</th> <th>2 personas</th> <th>3 personas</th> <th>4 personas</th> <th>5 personas</th> <th>6 y más personas</th> <th>Tramo del ingreso</th> </tr> </thead> <tbody> <tr> <th>0</th> <td>0 a \$105.000</td> <td>0 a \$171.000</td> <td>0 a \$227.000</td> <td>0 a \$278.000</td> <td>0 a \$325.000</td> <td>0 a \$370.000</td> <td>1</td> </tr> <tr> <th>1</th> <td>\$105.001 a \$152.000</td> <td>\$171.001 a \$247.000</td> <td>\$227.001 a \$328.000</td> <td>\$278.001 a \$401.000</td> <td>\$325.001 a \$470.000</td> <td>\$370.001 a \$530.000</td> <td>2</td> </tr> <tr> <th>2</th> <td>\$152.001 a \$267.000</td> <td>\$247.001 a \$434.000</td> <td>\$328.001 a \$580.000</td> <td>\$401.001 a \$705.000</td> <td>\$470.001 a \$825.000</td> <td>\$530.001 a \$940.000</td> <td>3</td> </tr> <tr> <th>3</th> <td>\$267.001 a \$544.000</td> <td>\$434.001 a \$880.000</td> <td>\$580.001 a \$1.180.000</td> <td>\$705.001 a \$1.450.000</td> <td>\$825.001 a \$1.700.000</td> <td>\$940.001 a \$1.900.000</td> <td>4</td> </tr> <tr> <th>4</th> <td>\$544.001 a \$1.100.000</td> <td>\$880.001 a \$1.780.000</td> <td>\$1.180.001 a \$2.370.000</td> <td>\$1.450.001 a \$2.900.000</td> <td>\$1.700.001 a \$3.400.000</td> <td>\$1.900.001 a \$3.800.000</td> <td>5</td> </tr> <tr> <th>5</th> <td>\$1.100.001 o más</td> <td>\$1.780.001 o más</td> <td>\$2.370.001 o más</td> <td>\$2.900.001 o más</td> <td>\$3.400.001 o más</td> <td>\$3.800.001 o más</td> <td>6</td> </tr> </tbody> </table> </div>

Leyendo el manual y diccionario de variables de la encuesta (disponible aquí), nos damos cuenta que estos tramos corresponden, utilizando la encuesta CASEN 2015, a cortes de la distribución correspondientes a: el 15% de menores ingresos, el siguiente 25%, el siguiente 30%, el siguiente 15%, el siguiente 10%, y el 5% de mayores ingresos. Esto ya es interesante porque puede calcular inmediatamente en cuál tramo se encuentra.

Veamos a cuanta gente se entrevisto para dicha encuesta.

len(df)
2613

Dicho número coincide con la información del manual y diccionario de variables anteriormente mencionado.

Satisfacción personal

Veamos algunos datos estadísticos de la pregunta 6 que se refiere a cuán satisfecha están las personas con su vida. Por si acaso, la pregunta era:

Pregunta 6.- Considerando todas las cosas, ¿cuán satisfecho o insatisfecho está usted con su vida en este momento? Por favor use esta tarjeta en que 1 significa que usted está "completamente insatisfecho" y 10 significa que usted está "completamente satisfecho"

df_p6 = df['p6'][df['p6'].apply(lambda x: x not in [88, 99])]
df_p6.hist(bins=10, range=(.5,10.5))
plt.title("Satisfaccion personal")
df_p6.describe()
count    2612.000000
mean        7.353752
std         2.028439
min         1.000000
25%         6.000000
50%         8.000000
75%         9.000000
max        10.000000
Name: p6, dtype: float64

png

De los datos hemos excluído las personas que respondieron 'no sabe (88)/no responde (99)' (Nota: de hecho, es sólo una persona como podemos ver en la variable 'count' que sólo se diferencia por 1 del número total de entrevistados, 2.613, anteriormente visto).

Lo primero que me sorprende es que la mayoría de las personas están bastante satisfechas de su vida. Si nos fijamos, el promedio es de 7.35/10 y la mediana (50% de la gente sobre la mediana/50% de la gente debajo de la mediana) es de 8/10. Siempre había escuchado con escepticismo este hecho pero esta encuesta parece confirmarlo.

Libertad para elegir

Veamos algunos datos estadísticos de la pregunta 7. Por si acaso, la pregunta era:

Pregunta 7.- Imagine una escalera de 10 escalones donde en la parte de abajo, el primer escalón, están las personas que no tienen libertad de elegir y/o decidir sobre su vida y en el escalón más alto, el décimo, están los que tienen más libertad de elegir y/o decidir sobre su vida. ¿En qué escalón está usted hoy?

df_p7 = df['p7'][df['p7'].apply(lambda x: x not in [88, 99])]
df_p7.hist(bins=10, range=(.5,10.5))
plt.title("Libertad para elegir")
df_p7.describe()
count    2612.000000
mean        7.972052
std         2.014783
min         1.000000
25%         7.000000
50%         8.000000
75%        10.000000
max        10.000000
Name: p7, dtype: float64

png

Nuevamente me sorprende el hecho de que la mayoría de las personas siente que tiene bastante libertad de elegir y decidir sobre su vida. Personalmente, hubiera pensado que sólo gente extremadamente rica se siente con total libertad de elegir y decidir sobre su vida, pero observando los datos, la moda (o sea el valor más frecuente) es 10/10, el promedio es 7.97/10 y la mediana es 8/10.

De los datos nuevamente hemos excluído las personas que respondieron 'no sabe (88)/no responde (99)' (Nota: de hecho, es sólo una persona como podemos ver en la variable 'count' que sólo se diferencia por 1 del número total de entrevistados 2.613 anteriormente visto. De puro curioso miré, pero no es la misma persona de la pregunta 6).

Tramo socioeconómico

Veamos ahora algunos datos estadísticos sobre la pregunta 67. Por si acaso, esa pregunta era:

Pregunta 67.- ¿En cuál de los siguientes rangos estima usted que se ubica el ingreso mensual total de su hogar (incluya sueldos, pensiones, rentas, etc.)? Considere el ingreso líquido de todas estas personas juntas.

df_p67 = df['p67']
df_p67.hist(bins=6, range=(.5,6.5))
plt.title("Tramo socioeconomico")
df_p67.describe()
count    2613.000000
mean        4.107157
std         2.226459
min         1.000000
25%         2.000000
50%         4.000000
75%         5.000000
max         9.000000
Name: p67, dtype: float64

png

Los datos parecen seguir los porcentajes esperados aunque el tramo 6 está un poco sobrerepresentado (quizás si alguién se anima a utilizar los ponderadores eso se resuelve).

Lo que me interesa de la pregunta 67 es más que nada buscar la correlación posible entre tramo socioeconómico y satisfacción personal, y entre tramo socioeconómico y libertad para elegir. Como no cuesta nada, veamos la correlación también entre satisfacción personal y libertad para elegir.

Correlaciones cruzadas

df[['p6', 'p7', 'p67']].corr()

<div> <style> .dataframe thead tr:only-child th { text-align: right; }

.dataframe thead th {
    text-align: left;
}

.dataframe tbody tr th {
    vertical-align: top;
}

</style> <table border="1" class="dataframe"> <thead> <tr style="text-align: right;"> <th></th> <th>p6</th> <th>p7</th> <th>p67</th> </tr> </thead> <tbody> <tr> <th>p6</th> <td>1.000000</td> <td>0.308680</td> <td>0.136008</td> </tr> <tr> <th>p7</th> <td>0.308680</td> <td>1.000000</td> <td>0.024011</td> </tr> <tr> <th>p67</th> <td>0.136008</td> <td>0.024011</td> <td>1.000000</td> </tr> </tbody> </table> </div>

Al ver las correlaciones, nos damos cuenta que no hay correlación (o es bastante insignificante) entre libertad para elegir (p7) y tramo socioeconómico al que perteneces (p67), $r=0.02$ (lo cuál me sorprende bastante como había señalado con anterioridad). Similarmente, es bastante baja la correlación entre satisfacción personal (p6) y tramo socioeconómico (p67), $r=0.14$ (con dinero o sin dinero, ...). Entre las correlaciones, la más significativa (aunque tampoco demasiado alta) parece ser la correlación entre satisfacción personal (p6) y libertad para elegir (p7). Para tener una idea de que quieren decir dichas correlaciones vea esta página y encuentre dichos valores con 'slide me'.

Conclusión

La idea de este post era sólo analizar algunas preguntas que me interesaron de la encuesta realizada por el Programa de las Naciones Unidas para el Desarrollo y utilizadas para la publicación del libro "Desiguales: Orígenes, cambios y desafíos de la brecha social en Chile". Además, es una base de datos pequeña que me permite jugar y visualizar datos sin la necesidad de utilizar la nube u otros subterfugios. Espero en el futuro poder analizar otras preguntas de la encuesta que me parecen igualmente interesantes.

¡Nos vemos!

Este notebook se puede descargar aquí


Comments (0)

HTTPS SSH

You can clone a snippet to your computer for local editing. Learn more.