Profesor Francisco Urdinez y el estudiante de postgrado Andrés Cruz, lideran publicación sobre “R” para datos políticos

twitter_EcVVyE1XsAAiXCb.jpg

El profesor del ICP, Francisco Urdinez, junto al estudiante de postgrado de nuestro Instituto, Andrés Cruz, editarán en formato físico y en inglés el manual "R for Political Data Science. A Practical Guide", proyecto en el que han estado trabajando durante los últimos años, y que estará disponible en noviembre bajo el sello editorial de Chapman & Hall/CRC The R Series. 

Este manual de lenguaje R actualmente está en español y formato online , y su objetivo es exactamente cómo se indica: ser un manual de referencia para usar el lenguaje R, que viene acompañado con ejemplos basados en casos de la región.

Pero, ¿Qué es R?. La utilización de este lenguaje para los economistas y cientistas políticos es regular, y comienza su aplicación desde los primeros años de carrera, aunque no es muy conocido en otras profesiones. R Core Team, lo define como un lenguaje de programación especialmente desarrollado para realizar análisis estadístico. Es una forma ordenada de pedir el computador que realice ciertas operaciones con el objetivo de extraer conclusiones a partir de datos duros. Este software se ejecuta en varias plataformas como Windows, MacOS y UNIX.

El académico reconoció que también tuvo que aprender a manejar este software, ya que durante su doctorado utilizó solo Stata: “Lo aprendí para enseñar econometría en Métodos Cuantitativos II, en el doctorado. Me pidieron que lo hiciera en R, entonces cuando realice toda esa adaptación, y en el proceso de estudiar, me di cuenta de que no había manuales escritos en español, mientras que los disponibles en inglés, eran muy pocos orientados a nuestra disciplina”.

Hace dos años Francisco Urdinez y Andrés Cruz comenzaron el proceso de elaboración: “Y así naturalmente empezamos a transforma las 12 clases del ramo, cada clase en un capítulo. La clase tiene una parte teórica y una práctica, por lo que cada capítulo está dividido en una discusión teórica para contextualizar y un caso aplicado en R”.

“Cuando empezamos a avanzar con Andrés quisimos hacer algo más ambicioso, pero los dos estábamos ocupados, entonces invitamos a los alumnos para que contribuyeran. Nosotros escribimos buena parte de los capítulos y ellos otros, también escribimos en co-autorías para dividir tareas. Logramos 15 capítulos y ahí arrancamos un proceso de pulir”, agregó el académico.

El libro tiene 17 capítulos y está organizado en tres secciones: “Introducción a R”, “Modelos” y “Aplicaciones”. En “Introducción a R”, podemos encontrar 4 capítulos: R básico, Gestión de datos, Visualización de datos y Carga de datos. En tanto la parte correspondiente a “Modelos”, consta de 6 capítulos: Modelos lineales, Selección de casos basada en regresiones, Datos de panel, Modelos logísticos, Modelos de supervivencia, e Inferencia causal. Por último, la tercera parte, “Aplicaciones”, se compone de 6 capítulos: Gestión avanzada de datos políticos, Minería web, Análisis de texto cuantitativo, Redes, Análisis de componentes principales y, Mapas y datos espaciales.

Varios académicos han tenido acceso previamente a este manual y destacan su utilidad especialmente para los estudiantes de la disciplina: "Este libro es un gran recurso para los métodos de aprendizaje de los estudiantes, así como para los investigadores que migran a R. Presenta una amplia gama de temas, incluidos los fundamentos de R, modelos estadísticos convencionales, análisis de texto, redes y mapas. Y ¡hay más! Los ejemplos basados en América Latina hacen que el libro sea sustancialmente interesante y agradable”, señaló Aníbal Pérez-Liñán, University of Notre Dame.

Por su parte, el profesor de nuestro Instituto y de la Escuela de Gobierno UC, Juan Pablo Luna, señaló que "como otros que carecían de la capacidad de trabajar en R, me estaba quedando atrás con respecto a mi capacidad de producir análisis empíricos de vanguardia para mi investigación. Este libro y su pedagogía aplicada y ejemplos redujeron significativamente los costos de ponerse al día. Lo recomiendo encarecidamente, tanto como un libro y como una guía para cualquier persona interesada en aprender R por su cuenta ".

 

TABLA DE CONTENIDOS


I Introduction to R

1. Basic R
Andrés Cruz

2. Data Management
Andrés Cruz

3. Data Visualization
Soledad Araya

4. Data Loading
Soledad Araya and Andrés Cruz


II Models

5. Linear Models
Inés Fynn and Lihuen Nocetto

6. Case Selection Based on Regressions
Inés Fynn and Lihuen Nocetto

7. Panel Data
Francisco Urdinez

8. Logistic Models
Francisco Urdinez

9. Survival Models
Francisco Urdinez

10. Causal Inference
Andrew Heiss


III Applications

11. Advanced Political Data Management
Andrés Cruz and Francisco Urdinez

12. Web Mining
Gonzalo Barría

13. Quantitaive Text Analysis
Sebastián Huneeus

14. Networks
Andrés Cruz

15. Principal Component Analysis
Caterina Labrín and Francisco Urdinez

16. Maps and Spatial Data
Andrea Escobar and Gabriel Ortiz

twitter_EbEtzrMWkAAFm97.png