jueves, 10 de mayo de 2018

Proyección Poblacional 2010 - 2020 por Radio Censal

Proyección Poblacional 2010 - 2020 por Radio Censal





A partir de las proyecciones poblacionales realizadas por el INDEC, y que están disponibles a nivel departamental, realizamos las proyecciones para la máxima desagradeción geográfica del registro censal: el radio censal.

Las proyecciones se realizaron para cada año, comenzando en 2010 y finalizando en 2020. Es decir, para el período intercensal. Si bien las proyecciones disponibles están hasta 2025, en 2020 se va a efectuar el nuevo censo, por lo que (esperando que se publiquen los resultados en tiempo y forma) carece de sentido utilizar las proyecciones una vez pasado tal año de referencia censal.

La proyección para cada año (poblacional, no de hogar ni de vivienda) está disponible para cada uno de los 52.289 radios censales (urbanos, mixtos y rurales). El procedimiento de proyección es lineal, utilizando el patrón de distribución del último período conocido, el del censo 2010. Por lo tanto, las proyecciones son lineales y absolutas.

Es oportuno aclarar que estas proyecciones son de máxima utilidad cuando las necesidades están relacionadas con estimar absolutos actualizados. Como se parte de una proporción inicial (Censo 2010), las proporciones no cambian (como dijimos, la proyección es lineal) pero sí se actualizan los absolutos, por lo tanto son ideales para trabajar en la evolución y crecimiento absoluto de población en general o de grupos determinados (grupos etarios, en situación de distintos fenómenos o factores, etc). La fortaleza de este procedimiento es actualizar los números absolutos a casi 10 años del último Censo.





Es preciso aclarar que para el año 2010, en el archivo de descarga, hay dos estimaciones. La estimación A es para el número de personas por radio que fue publicado como "dato provisorio" y con el que se han realizado gran parte de los trabajos en este blog (y en general). La estimación "2010 B" es la proyección para los datos definitivos y revisados del último Censo (y publicados tardíamente).

Finalmente, el link de abajo es para descargar el archivo xls con los datos poblacionales por radio censal para el período 2010 - 2020. A usar y difundir.

DESCARGAR

5 comentarios:

  1. Buenas. Cual fue el método utilizado? Podrias publicar mas detalladamente? Hay fuertes diferencias incluso con la propias estimaciones del Indec (cuadro "Población estimada al 1 de julio de cada año calendario por sexo, según partido. Provincia de Buenos Aires. Años 2010-2025"). Ej: Para 2018, segun tu estimacion, Tres de Febrero = 375385, pero segun Indec = 343961, una diferencia de 31424. Como se explica? Saludos

    ResponderEliminar
    Respuestas
    1. Hola Unknown (la próxima poné tu nombre, así sé q quién le estoy respondiendo).
      Respecto al método. Si lees el post, vas a ver que se explica que los números finales por radios censal (recalco, por radio censal), son el resultado del prorrateo de los totales por departamento (máximo nivel de desagregación censal que aglutina radios bajo jurisdicción oficial) que el INDEC proyectó hasta 2015. Como verás, mucho misterio no hay.
      Respecto a las "fuertes diferencias". Yo trabajo con la base por radio censal, donde están los datos de los +/- 54mil radios censales. El total de estos radios para una jurisdicción departamental, difícilmente coincidan con os totales que publica el INDEC en sus proyecciones. Las razones son varias. Si analizás las diferencias por proyecciones intercensal con los resultados de los últimos censos, vas a darte cuenta que existen diferencias más importantes en el propio INDEC (insisto, cosa entendible, dado que las proyecciones tiene un nivel de error incierto).
      Espero haber sido un poco más claro.

      Eliminar
  2. Buenas, sólo venía a agradecerte por publicar estas proyecciones que andaba necesitando para un proyecto. Ya estaba dispuesto a ponerme a hacer las cuentas. De fondo, quiero estimar -también por radio censal- otras características como la población activa, nivel de instrucción, etc etc (la mayor cantidad posible de datos del censo) pero entiendo que ya tienen otras complicaciones. Esto es un buen comienzo.

    Gracias!
    Tomi

    ResponderEliminar
    Respuestas
    1. Hola Tomás. Se pueden estimar cantidades de las variables que quieras del Censo. Te recomiendo este sitio (https://idiscontinuos.wordpress.com/2015/03/21/convirtiendo-bases-redatam-a-spss/), ahí vas a ver una herramienta que te va a permitir armar la base total del Ceso según radio censal, con las variables que quieras (exporta REDATAM a SPSS y vas a poder trabajar más rápido). Como ya tenés los totales poblacionales (10-20), vas a poder proyectar las subpoblaciones en base a las proporciones de la base que armes a partir de esa herramienta. Se entendió? Cualquier cosa, consultame. Saludos

      Eliminar
    2. Clarísimo! Gracias por el dato. Pude armar la base del censo en csv por Python, así que tengo esa parte resuelta. Corriendo un algoritmo de ensamble de regresiones, predice bastante bien (r2 cercano al 0.8) las elecciones del 2019 en CABA (¡con los datos censales del 2010!). Seguro hagamos estimaciones o ampliemos a las mesas del conurbano para seguir jugando un poco con las herramientas. Te comparto cuando tengamos algo escrito. Saludos!

      Eliminar