Acerca de
Provee un acceso conveniente a mas de 17 millones de registros de la base de datos del Censo 2017. Los datos fueron importados desde el DVD oficial del INE usando el Convertidor REDATAM creado por Pablo De Grande y ademas se proporcionan los mapas que acompanian a estos datos. Estos mismos datos en DVD posteriormente quedaron disponibles en las Bases de Datos del INE.
Despues de la primera llamada a library(censo2017)
se le pedira al usuario que descargue la base usando censo_descargar_base()
y se puede modificar la ruta de descarga con la variable de entorno CENSO_BBDD_DIR
. La variable de entorno se puede crear con usethis::edit_r_environ()
.
La documentacion esta disponible en https://docs.ropensci.org/censo2017/.
Publico objetivo
Estudiantes, academicos e investigadores que necesiten un acceso conveniente a datos censales directamente en R o RStudio.
Requerimientos de instalacion
Esta libreria necesita 3.5 GB libres para la crear la base de datos localmente. Una vez creada la base, esta ocupa 1.0 GB en disco.
Valor agregado sobre los archivos SHP y REDATAM del INE
Esta version de la base de datos del Censo 2017 presenta algunas diferencias respecto de la original que se obtiene en DVD y corresponde a una version DuckDB derivada a partir de los Microdatos del Censo 2017 en formato DVD.
La modificacion sobre los archivos originales, que incluyen geometrias detalladas disponibles en Cartografias Censo2017, consistio en unir todos los archivos SHP regionales en una unica tabla por nivel (e.g en lugar de proveer R01_mapa_comunas
, …, R15_mapa_comunas
combine las 15 regiones en una unica tabla mapa_comunas
).
Los cambios concretos respecto de la base original son los siguientes:
- Nombres de columna en formato “tidy” (e.g.
comuna_ref_id
en lugar deCOMUNA_REF_ID
). - Agregue los nombres de las unidades geograficas (e.g. se incluye
nom_comuna
en la tablacomunas
para facilitar los filtros). - Aniadi la variable
geocodigo
a la tabla dezonas
. Esto facilita mucho las uniones con las tablas de mapas en SQL. - Tambien inclui las observaciones 16054 to 16060 en la variable
zonaloc_ref_id
. Esto se debio a que era necesario para crear una llave foranea desde la tablamapa_zonas
(ver repositorio Cartografias Censo2017) y vincular elgeocodigo
(no todas las zonas del mapa estan presentes en los datos del Censo).
Ademas de los datos del Censo, inclui la descripcion de las variables en formato tabla (y no en XML como se obtiene del DVD). La ventaja de esto es poder consultar rapidamente lo que significan los codigos de variables y su etiquetado, por ejemplo como explico en la historia del proyecto.
Relacion de Censo 2017 con Chilemapas
Todos los datos de estos repositorios contemplan 15 regiones pues los archivos del Censo se entregan de esta forma y este paquete esta 100% orientado a facilitar el acceso a datos.
Por su parte, chilemapas se centra unicamente en los mapas y tambien usa las cartografias del DVD del Censo para entregar mapas simplificados (de menor detalle y mas livianos). Chilemapas cuenta con una transformacion de codigos para dar cuenta de la creacion de la Region de Niuble.
En resumen, censo2017 permite construir estadisticas demograficas y chilemapas ayuda a mostrarlas en un mapa usando ggplot2 (u otro paquete como tmap).
Cita este trabajo
Si usas censo2017
en trabajos academicos u otro tipo de publicacion por favor usa la siguiente cita:
Mauricio Vargas (2020). censo2017: Base de Datos de Facil Acceso del Censo
2017 de Chile (2017 Chilean Census Easy Access Database). R package version
0.1. https://docs.ropensci.org/censo2017/
Entrada para BibTeX:
Contribuciones
Para contribuir a este proyecto debes estar de acuerdo con el Codigo de Conducta de rOpenSci. Me es util contar con mas ejemplos, mejoras a las funciones y todo lo que ayude a la comunidad. Si tienes algo que aportar me puedes dejar un issue o pull request.
Aportes
Si quieres donar para aportar al desarrollo de este y mas paquetes Open Source, puedes hacerlo en Buy Me a Coffee.