Bienvenidos y bienvenidas a la primera edición de “En foco estadístico”, un nuevo espacio del INDEC que tiene como objetivo acercarte la producción estadística, pero desde la mirada de un técnico del Instituto. Hay muchos mitos alrededor de la producción estadística y creemos que puede interesar que la conozcamos desde adentro.

¿Cómo trabaja el INDEC? Por esa razón, invitamos a la directora nacional de Difusión y Comunicación del Instituto, Silvina Viazzi, para que conduzca esta entrevista. No queremos adelantar mucho, así que le damos la bienvenida para que nos cuente el tema que vamos a desarrollar en esta edición de “Foco estadístico”. Hola Silvina, ¿cómo estás? 

Muy bien, muchas gracias. Hola, equipo. Y hola ahí, a vos que nos estás escuchando del otro lado. Por aquí hay mucho entusiasmo en iniciar este ciclo de conversaciones con un tema relevante para la producción estadística: los datos masivos.

En esta ocasión, vamos a enfocarnos en un tipo en particular de datos, los registros administrativos. Y justamente, para este primer podcast en foco, estamos nada menos que con el director técnico del INDEC, Pedro Lines. Hola, Pedro, ¿cómo estás? 

Hola, Silvina, ¿cómo estás? Aquí todo bien. Un placer ser el primer entrevistado de este espacio. 

Muchísimas gracias, Pedro. Antes de hacer foco, me gustaría contarles a quienes nos escuchan y no te conocen algo sobre vos. Pedro es licenciado y magíster en Economía, es experto en Cuentas Nacionales e Internacionales y, creo sumando distintos períodos, tiene una trayectoria de más de 15 años en el INDEC.

Recuerdo que, hasta hace pocos años, Pedro dirigió la actualización de procedimientos de la balanza de pagos de la Argentina a partir del último manual internacional, y hoy se difunde con el sistema de intercambio de datos más moderno.

Hoy hablamos con vos, Pedro, porque, además, sos especialista en el tema en que queremos hacer foco, que tiene que ver con las formas y las fuentes con las que el Instituto recopila información y produce estadísticas.

Cuando se habla del INDEC, una de las primeras imágenes que nos viene a la memoria es la de un encuestador o la de un censista en la puerta de una vivienda completando un formulario de preguntas. Pero esta forma de recolección de información está cambiando, ¿no? 

Sí, está cambiando. Como sabemos, el negocio del INDEC y de los institutos de estadística es producir información estadística a partir de datos. Los datos los podemos obtener de diferentes formas. Tradicionalmente, los conseguíamos a través de la indagación. Y la información estadística tiene que cumplir ciertos requisitos. Tiene que ser íntegra, cubrir a todo el fenómeno, tiene que ser consistente, coherente, tiene que ser puntual, oportuna. Y todo lo cubríamos tradicionalmente con indagaciones que las hacíamos de forma presencial a toda la población objetivo.  

Eso era muy costoso, básicamente son indagaciones exhaustivas que nosotros llamamos “censos”. Y para bajar los costos de esa forma de captura de datos, pasamos a lo que se llaman encuestas “por muestreo probabilístico”, donde vamos a un número menor de respondentes e inferimos el total de la población a partir de esa muestra. Eso también es costoso, y ahora aparece una nueva opción: los registros administrativos, que nos reducen los costos y aseguran la cobertura. No sé si todos estamos al tanto de que, a medida que pasa el tiempo con la modernidad, tenemos más restricción de los ciudadanos a responder las encuestas. Cada vez más, la tasa de no respuesta está aumentando. Y eso genera problemas de sesgo y de precisión en las estimaciones que hacemos. Entonces, nos encontramos ante esta nueva herramienta, que nos permite conseguir información del total de la población en forma más oportuna. 

Entonces, Pedro, ¿cómo explicarías de manera sencilla es qué es un registro administrativo? 

Un registro administrativo es un conjunto de datos que se obtienen de formularios diseñados por organismos administrativos de acuerdo a una ley, regulación o norma. Están asociados, fundamentalmente, a un tema regulatorio. Lo bueno que tienen los registros administrativos es que están tabulados, siempre vienen de la misma forma, se actualizan periódicamente, y uno puede tener una trazabilidad de esa actualización. Entonces, uno periódicamente tiene información nueva a un costo muy bajo. 

Bien. Y entonces, ¿cuál es el uso que actualmente tienen estos registros administrativos para la producción estadística?  

Te voy a dar ejemplos de registros administrativos que todos conocemos. Por ejemplo, el registro de las personas, que está bajo el RENAPER, el registro automotor, el registro de la propiedad inmueble, los registros impositivos, los registros educativos. Por ejemplo, en el registro de las personas, podemos ver cuántas personas hay en el país, de qué edad, qué sexos. En el registro automotor podemos ver qué autos hay por modelo, por edad de los autos. No hace falta que vayamos a hacer una encuesta a las familias para preguntarles sobre la edad media del parque automotor. Ya directamente, esa información la conseguimos del registro automotor. Entonces, con eso bajamos los costos y podemos reutilizar los recursos de un encuestador para indagar sobre otras temáticas.  

En la práctica, ¿cómo se procesan los registros administrativos para darle utilidad estadística, Pedro? 

Básicamente, lo que nosotros tenemos que convertir es esos registros administrativos en registros estadísticos, para que nos den información estadística. Eso conlleva la utilización de muchas técnicas estadísticas y matemáticas para estandarizar. Porque la información de los registros administrativos fue pensada con fines regulatorios y no con fines estadísticos; entonces por ahí no está estandarizados los conceptos y las clasificaciones. Básicamente, entonces, el arduo trabajo que tiene el INDEC cuando conseguimos registros administrativos es la estandarización para producir información estadística.  

¿Y no se podría hacer al revés? ¿Por ejemplo, pedirles a los organismos que crean estos grandes registros administrativos que usen los conceptos y los clasificadores, o el diseño de registros que usa el Instituto, para que así les sea más sencillo poder darle uso estadístico?

 Por supuesto, estamos trabajando con ello. En este período estamos haciendo muchos convenios de cooperación con los diferentes organismos que producen registros administrativos, para poder asegurar que ya en el diseño del registro estén incorporados conceptos estadísticos, básicamente los clasificadores estadísticos, para que todos podamos hablar el mismo idioma. Básicamente, asegurar que estamos comparando “bananas con bananas y peras con peras”.  

Perfecto. Ahora bien, yo recuerdo que estamos recibiendo algunas de las consultas de nuestros usuarios y oyentes del podcast semanal, “Mucho más que un número”, sobre el uso de big data. ¿Podríamos decir, entonces, que el big data, o los datos masivos, están relacionados con los registros administrativos? O, en otras palabras, ¿los registros administrativos son una clase de big data?  

Mirá, el big data, básicamente, son datos masivos. Muchos registros administrativos tienen muchos datos. Lo que lo diferencia al big data es que no tiene una estructura, no tiene una actualización periódica. Te puedo dar ejemplos de big data: búsquedas en Google. Cuando hacemos una búsqueda, no hay un patrón; en cambio, los registros administrativos están tabulados, hay columnas específicas que tienen que estar llenadas periódicamente para ser actualizadas. A diferencia del big data, que por ejemplo, tenemos información del sensor de tráfico: no pasa siempre la misma cantidad de autos, las patentes no están todas estandarizadas. Entonces, el big data es un nuevo desafío, sobre todo porque los datos no están estructurados. Sería un gran desafío poder usarla, pero todavía estamos recién desarrollando las técnicas para explotar esos datos y generar información. Porque lo que tiene el big data es que tiene muchos datos. El tema es cómo generar información a partir de esos datos. Es mucho más fácil generar información a partir de los datos de los registros administrativos porque están tabulados, están ordenados. 

Es clarísimo Pedro. Ahora bien, si los registros administrativos son una clase de datos masivos, ¿es lo mismo que el concepto de datos abiertos? O, dicho de otra forma, ¿nosotros podemos difundir los registros administrativos como datos abiertos? 
 
No, porque los registros administrativos tienen información nominada. 
 
Okay… 
 
Cuando hablamos de datos abiertos es disponibilizar los datos a la población, al ciudadano, y hacer un acceso equitativo de los datos pero siempre preservando los secretos, que pueden ser secreto fiscal, estadístico, comercial o bancario. Entonces, los datos abiertos tienen que tener en cuenta no violar ninguno de estos secretos. En los registros administrativos la información está nominada. Muchas veces tenemos información personal y muchas veces datos sensibles. Entonces no podríamos disponibilizar esa información. Por eso estamos trabajando desde el Instituto con las diferentes autoridades, empezar a trabajar un concepto que se llama 'la rectoría de los datos', o 'la gobernanza de los datos', para asegurar la privacidad de las personas y asegurar los secretos que están detrás de todos los datos. 
 
Claro, voy a ponerme en el lugar de quienes nos están escuchando y pueden tener dudas. Cuando vos realizás un trámite, en ese mismo registro dejás tus datos personales. Entonces, cuando el INDEC los recibe dentro de un registro completo, ¿qué pasa con esa información personal? ¿Qué es lo que hace el INDEC para garantizar la privacidad de los datos individuales? 
 
Para asegurar que no estamos violando ninguno de los secretos trabajamos con algoritmos que enmascaran la información y hacen que las computadoras macheen la información sin que el analista pueda identificar a las personas, o al registro individualizado. 
 
Ahora vamos acercando el foco de nuestro tema de hoy. ¿Te puedo pedir que me identifiques cuáles son las ventajas bien concretas de contar con registros administrativos para uso estadístico? 
 
Básicamente nos aseguran la cobertura. Si estamos analizando un fenómeno que está cubierto íntegramente por el registro, ahí no tenemos una respuesta. Tenemos el 100% del universo, a diferencia de una encuesta o una indagación cuando vamos a las casas y golpeamos la puerta, muchas veces no nos abren. En el registro están todos. Entonces nos aseguramos cobertura, que es lo más importante. Y nos aseguramos que eso se actualiza periódicamente. Y nos aseguramos reducción de costos. Y también reducimos el costo de responder. A veces es más engorroso estar respondiendo encuestas de diferentes índoles. Entonces muchas veces cuando vamos a los hogares o a las empresas dicen "esa información yo ya la di, ¿por qué me la piden de vuelta?". Entonces, mucha gente es reticente a darnos ese dato. Entonces, podemos bajar los costos de recolección, y también el costo de responder de las personas. Entonces, hacemos mucho más eficiente el proceso y se hace con mucha más rapidez el proceso de producción estadística. 

 
Y podríamos también tener mayor variedad de información, ¿verdad? 
 
Por supuesto, ahí también tengo que ser justo. Con los registros administrativos podemos tener información que está dentro del registro. Lo que permiten las encuestas, o los censos, es agregar preguntas que no están en el registro. Entonces siempre lo que tienen las encuestas es que son más ricas porque uno puede indagar más sobre un fenómeno. Uno puede diseñar a medida cosas. En los registros administrativos tenemos que usar lo que está. Podemos persuadir al organismo que tiene un registro de agregar un campo. Pero eso no es sencillo, es costoso. Entonces los registros son más rígidos el tema de la variedad de información extra que le podemos solicitar. Nos sirven básicamente de infraestructura estadística como marco muestral para hacer encuestas sobre fenómenos puntuales e ir al hueso. Otra cosa que me estoy olvidando de los registros administrativos, a diferencia de las encuestas, es que nos pueden dar información de pequeñas áreas. Acuérdense que cuando hacemos una encuesta como estas, probabilísticas, las particularidades de una pequeña área no se pueden captar bien. Salvo que tenga una muestra enorme y muy costosa. Entonces los registros administrativos tienen la ventaja de darnos información de clasificaciones detalladas y de estadísticas de áreas pequeñas. 
 
Por ejemplo, de un pueblo, de una localidad de pocos habitantes, ¿no? 
 
Por ejemplo, si yo quiero ver la evolución del tendido de cloacas en una localidad, las encuestas me captan cosas generales que pasan en toda la localidad. Pero si pasan en algún barrio de una localidad, si la muestra no fue pensada para que tenga representatividad a nivel de barrio no me va a captar el fenómeno que está pasando en ese barrio. Como el registro administrativo cubre a todos tengo toda la información barrio por barrio. Está todo geolocalizado. Por ejemplo, si yo quiero ver conexiones de agua potable, el registro administrativo de Aysa me va a dar una muy buena información. Y si Aysa está haciendo una fuerte inversión en un barrio en agua, lo voy a captar bien en el registro de Aysa, no así en una encuesta. 
 
Perfecto. Entonces podríamos concluir, Pedro, en que los registros son complementarios para obtener un menú completo de estadísticas que sean obviamente útiles para todos los ciudadanos, ¿verdad? 
 
Sí, para mí los registros administrativos son como el esqueleto. Es la infraestructura básica que necesitamos para después ir con encuestas específicas e ir al hueso. Pero los registros administrativos nos van dando información continua sobre las generalidades del país y de cosas particulares de áreas pequeñas. Si vemos algún fenómeno en área pequeña, ahí sí generamos una muestra probabilística de esa área para indagar que las características que contextualizan ese fenómeno en esa área pequeña. Porque muchas veces cuando hacemos las encuestas, el dominio de estimación es mucho más amplio. Es un dominio de estimación a nivel de localidad o de provincia, no a nivel de un barrio. Entonces, un registro administrativo nos permite identificar algunos fenómenos para después hacer una muestra probabilística para caracterizar ese fenómeno. 
 
Fantástico, bien claro. Ahora, la incorporación de estos registros podría llevarnos a pensar que los censos tal como los conocemos (los censos de población, me estoy refiriendo), podrían modificarse, ¿no? 
 
Es así, de hecho. Vemos en varios países 'ronda censal 2020', ya la llaman 'censos basados en registros'. Entonces básicamente se trabaja con los registros de las personas, registros de viviendas, etc. etc. Y después se complementan con encuestas. Las encuestas, cuando son exhaustivas, cuando una encuesta cubre a toda la población, es un censo. Adonde supuestamente iríamos en el futuro, si seguimos la tendencia de los países centrales, es basarnos en registros y después hacer encuestas complementarias para calibrar ese registro y mejorarlo. Entonces tendríamos como censos fraccionados. Podríamos tener un stock de personas, que es el stock de viviendas y de personas a un año basado en un registro, y vamos haciendo encuestas para validar esa información. Y esas encuestas podemos no hacerlas todas en un mismo momento del tiempo sino ir rotándolas. Y entonces, esa foto que tradicionalmente teníamos cada 10 años en los censos, podría estar actualizándose constantemente con ayuda de los registros, y calibrada y mejorada con encuestas; validada, mejor dicho, con encuestas.  
 
Pedro, si me permitís, queremos cambiar un poquito el foco. Parte de tu trayectoria laboral transcurrió en el exterior. Sabemos que hace unos años trabajaste en Qatar, para la Oficina Nacional de Estadística de ese país. De esa experiencia, ¿hay algo que puedas aplicar en el INDEC, o que aporte al salto de calidad que está dando el Instituto? 
 
En los países donde no hay informalidad y todo está muy reglamentado y regulado, tenemos registros administrativos para todo. Y sabemos que la calidad es muy buena, y tienen mucho detalle. Entonces por ejemplo para todo lo que es el empleo, si uno quiere vivir en esos países y no es nacional, o sea, no tiene la nacionalidad del país, no puede estar ahí salvo que tenga un permiso de trabajo que tiene que estar avalado por el Ministerio de Trabajo y el Ministerio del Interior. O sea que el Ministerio del Interior y el Ministerio de Trabajo tienen grandes bases de datos con toda la información de los residentes que no tienen nacionalidad.  
 
Interesantísimo. Muchísimas gracias, Pedro. Te voy a hacer una última pregunta más de tono personal: ¿qué significa para vos trabajar en el INDEC
 
Para mí es familia. Yo entré al INDEC cuando tenía 22 años, como estudiante. Me desarrollé y evolucioné dentro del INDEC, así que para mí es estar en familia. Es trabajo en equipo, es compromiso. Es mi vida casi. La verdad que es un equipo genial y uno no puede estar más cómodo que trabajar en familia, trabajando en lo que le gusta. Y eso es el INDEC: el INDEC es una gran familia. 
 
Es muy gratificante escucharte decir eso, Pedro. Muchas gracias por tu testimonio y por ayudarnos a comprender la importancia del uso de registros administrativos para la producción estadística oficial.  Hasta aquí nuestra conversación con el director técnico del INDEC, Pedro Lines. Pedro, estás invitado, si quisieras  despedirte con algún mensaje para nuestros oyentes, el micrófono es todo tuyo. 
 
Bueno, Silvina, gracias por la entrevista. Lo que quería decir básicamente es que las estadísticas las hacemos todos. Así que todos tenemos que poner nuestro granito de arena para tener mejor información. Con mejor información, los hacedores de política pueden tomar mejores decisiones, así que entre todos ayúdennos a conseguir mejores estadísticas y más estadísticas, ¿no?  
 
Así es. Nuevamente, gracias. Y muchas gracias también a nuestros oyentes, porque si llegaron hasta aquí, recuerden que las estadísticas están en todos lados, y acá las ponemos en foco.