Hoja de ruta

Innovar con Ciencia de Datos en el sector público

Innovar con
Ciencia de Datos
en el sector público

¿Cómo innovar con datos en la gestión pública?

Proponemos una hoja de ruta que esté anclada en el marco normativo y particularidades de Argentina.

Reproducir vídeo

Fernando Schapachnik
Director Ejecutivo de la Fundación Sadosky

Es necesario entender cuál es la mejor herramienta, su alcance, ventajas y riesgos.

Reproducir vídeo

Laura Marés
Coordinadora Ejecutiva de la Fundación Sadosky

Identificar sesgos en los datos es importante para incluir a todos los sectores de la población.

Reproducir vídeo

Victoria Dumas
Equipo de Ciencia de Datos e IA

¿Qué necesitamos para comenzar?

Co-creación de servicios y políticas públicas

Proponemos el pensamiento de diseño como metodología para la innovación pública porque nos permite distinguir y analizar cada momento del proceso para tomar decisiones que ratifiquen o modifiquen nuestro camino.

Respuestas alternativas a preguntas frecuentes

Compartimos algunas respuestas sobre el contexto, la implementación y las implicancias del uso de Ciencia de Datos e Inteligencia Artificial. Es importante comprender desde dónde se habla para poder formular requerimientos y acompañar el proceso.

Los datos describen una parte de lo que sucede. Son un recurso de gran relevancia que, cuando se articulan con tecnologías digitales, generan oportunidades para promover cambios sociales, políticos y económicos.

Campo interdisciplinario que hace uso de diferentes tecnologías y métodos para procesar y analizar datos, para identificar patrones y tendencias, y predecir fenómenos futuros.

No existe una única definición, pero para nuestro caso nos sirve pensar en la IA como sistemas que pueden, para un determinado conjunto de objetivos definidos por personas, generar predicciones, recomendaciones o decisiones que pueden influenciar ambientes reales o virtuales.

Una serie de pasos o estructuras que pueden transformar información de entrada en un producto o información de salida.

Conjunto de técnicas y algoritmos que pueden utilizarse para “entrenar” a un programa informático de modo que reconozca automáticamente patrones en un conjunto de datos.

La big data o los macrodatos son grandes conjuntos de datos que se asocian a características como volumen, variedad, velocidad, veracidad, entre otras.

El uso de datos como un proceso de innovación pública

A partir de la integración de los abordajes metodológicos y los conceptos, comenzamos un recorrido para instrumentar herramientas innovadoras de Ciencia de Datos e Inteligencia Artificial en el desarrollo y la implementación de políticas públicas.

¿Dónde estamos y qué hacemos?

Recomendaciones

Herramientas tecnológicas

Hacer foco en el problema o necesidad que queremos resolver y después buscar las mejores herramientas posibles para la solución.

La CDIA por sí sola no resuelve problemas. Es una herramienta que forma parte de un conjunto de estrategias para abordar un problema, en general, complejo.

Equipo de trabajo

Identificar cuál es el ecosistema de actores que estará en diálogo constante con la implementación: funcionarias/os, equipo técnico, población destinataria.

Es importante identificar los propósitos e intereses de cada grupo interviniente. También es importante identificar los posibles riesgos que se pueden manifestar en la práctica para poder gestionarlos.

Calidad de los datos

Analizar los datos existentes, comprenderlos en su totalidad, saber quién los recolectó, con qué propósito, qué significa la información de cada campo e identificar si faltan datos.

Es fundamental asegurarnos de que los datos que vamos a usar en el proyecto sean de buena calidad y conocer sus limitaciones. En el sector público tenemos que pensar en los procesos de apertura, anonimización y seguridad de los datos.

Infraestructura y equipamiento

Pensar en una herramienta de Ciencia de Datos e Inteligencia Artificial implica tener en cuenta el mantenimiento de la misma a futuro.

Es necesaria una infraestructura robusta para que el proyecto tenga continuidad más allá de la permanencia del equipo. Debemos contar con buena conectividad, acceso a servidores, sólida documentación del proyecto y constantes revisiones.

Normativas

Revisar que la herramienta cumpla con la normativa vigente sobre acceso y protección de datos.

Debemos asegurar que la herramienta sea segura y se adecue a las legislaciones vigentes en materia de seguridad y privacidad.

Transparencia

Garantizar el efectivo ejercicio del derecho de acceso a la información pública y la participación ciudadana.

Es central contar con instancias planificadas para explicar a la población el uso de los datos y los resultados de los algoritmos. Además, evaluar qué partes de los desarrollos de estas herramientas y de los datos pueden ser de acceso público.

Sesgos y riesgos

Crear y usar herramientas que no discriminen ni dejen afuera a ningún sector de la población.

En la gran mayoría de los casos, los datos que vamos a utilizar provienen de la sociedad. Las relaciones sociales son subjetivas, están atravesadas por prejuicios y por asimetrías de poder; por eso, debemos identificar si existe algún sesgo en nuestros datos.

Herramientas tecnológicas

La CDIA por sí sola no resuelve problemas. Es una herramienta que forma parte de un conjunto de estrategias para abordar un problema, en general, complejo.

Equipo de trabajo

Es importante identificar los propósitos e intereses de cada grupo interviniente. También es importante identificar los posibles riesgos que se pueden manifestar en la práctica para poder gestionarlos.

Calidad de los datos

Es fundamental asegurarnos de que los datos que vamos a usar en el proyecto sean de buena calidad y conocer sus limitaciones. En el sector público tenemos que pensar en los procesos de apertura, anonimización y seguridad de los datos.

Infraestructura y equipamiento

Es necesaria una infraestructura robusta para que el proyecto tenga continuidad más allá de la permanencia del equipo. Debemos contar con buena conectividad, acceso a servidores, sólida documentación del proyecto y constantes revisiones.

Normativas

Debemos asegurar que la herramienta sea segura y se adecue a las legislaciones vigentes en materia de seguridad y privacidad.

Transparencia

Es central contar con instancias planificadas para explicar a la población el uso de los datos y los resultados de los algoritmos. Además, evaluar qué partes de los desarrollos de estas herramientas y de los datos pueden ser de acceso público.

Sesgos y riesgos

En la gran mayoría de los casos, los datos que vamos a utilizar provienen de la sociedad. Las relaciones sociales son subjetivas, están atravesadas por prejuicios y por asimetrías de poder; por eso, debemos identificar si existe algún sesgo en nuestros datos.

Créditos

Autoría

María Vanina Martínez
Directora del Programa de Ciencia de Datos e Inteligencia Artificial (PCDIA) de la Fundación Sadosky. Doctora de Ciencias de la Computación (University of Maryland) e investigadora del CONICET.

Victoria Gisel Dumas
Consultora del PCDIA de la Fundación Sadosky. Doctora en Ciencias Químicas (Universidad de Buenos Aires) y profesora de Visualización y Comunicación en la Maestría en Ciencia de Datos de la Universidad de San Andrés.

Marianela Sarabia
Consultora del PCDIA de la Fundación Sadosky. Magister en Economía Aplicada para el Desarrollo (UniTo & SciencesPo), y profesora de Políticas Públicas y Machine Learning (Universidad Nacional de Guillermo Brown).

Ivana Feldfeber Kisilevsky
Consultora del PCDIA de la Fundación Sadosky. Posgrado en Ciencia de Datos, Aprendizaje Automático y sus Aplicaciones (Universidad Nacional de Córdoba) y Directora Ejecutiva del Observatorio de Datos con Perspectiva de Género “DataGénero”.

Autoría

María Vanina Martínez
Directora del Programa de Ciencia de Datos e Inteligencia Artificial (PCDIA) de la Fundación Sadosky. Doctora de Ciencias de la Computación (University of Maryland) e investigadora del CONICET.

Victoria Gisel Dumas
Consultora del PCDIA de la Fundación Sadosky. Doctora en Ciencias Químicas (Universidad de Buenos Aires) y profesora de Visualización y Comunicación en la Maestría en Ciencia de Datos de la Universidad de San Andrés.

Marianela Sarabia
Consultora del PCDIA de la Fundación Sadosky. Magister en Economía Aplicada para el Desarrollo (UniTo & SciencesPo), y profesora de Políticas Públicas y Machine Learning (Universidad Nacional de Guillermo Brown).

Ivana Feldfeber Kisilevsky
Consultora del PCDIA de la Fundación Sadosky. Posgrado en Ciencia de Datos, Aprendizaje Automático y sus Aplicaciones (Universidad Nacional de Córdoba) y Directora Ejecutiva del Observatorio de Datos con Perspectiva de Género “DataGénero”.

Colaboración

Manuela Cerdeiro
Fundación Sadosky

Lucas Somacal
Fundación Sadosky

Inés Roggi
Fundación Sadosky

Daniel Yankelevich
Fundar

Mariano Cervelini
Fiscalía de la Provincia
de Buenos Aires

Marta Kisilevsky
Ministerio de Educación de la Nación

Gabriela Reta
Universidad Nacional de General Sarmiento

María del Mar Monti
Ministerio de Defensa de la Nación

Edición

Laura Ramírez Rivillas
Fundación Sadosky

Alejandra Stafetta
Fundación Sadosky

Federico Rey
Fundación Sadosky

Diseño y desarrollo

Alicia Viana
Fundación Sadosky

Jaqueline Schaab
Fundación Sadosky

Video y edición

Facundo Manini
Fundación Sadosky

Autoridades de la Fundación Dr. Manuel Sadosky

Daniel Filmus
Presidente

Fernando Schapachnik
Director Ejecutivo