Seminario sobre Ética en Ciencia de Datos
Diagrama de temas
-
Descripción
La toma de decisiones basada en datos ha creado oportunidades, pero también presenta nuevos desafíos éticos y amplía el conjunto de posibles riesgos, como por ejemplo la reproducción de desigualdades y discriminación por razón de género, raza o clase social, entre otras. La perpetuación de las inequidades y los perjuicios a la privacidad. Los resultados que brindan los algoritmos de aprendizaje automático son tan fiables como los datos en los que se basan y las decisiones que se toman durante el diseño de los mismos.
En los últimos años se ha producido conocimiento en este sentido, desde métodos y métricas que permiten evaluar la equidad de las soluciones, pasando por propuestas metodológicas para mitigar y reducir los impactos del sesgo, particularmente los que se producen cuando no se toma en cuenta la perspectiva de género. Las discusiones acerca de estos temas están cada vez más presentes en la agenda de gobiernos, la academia y la sociedad civil, y necesitan de un abordaje interdisciplinario que sepa identificar el impacto social que la aplicación de estas técnicas puede tener. Esta es una línea de trabajo incipiente en Uruguay.
El seminario tiene como objetivo presentar algunos debates actuales sobre cómo pensar la ciencia de datos desde una perspectiva ética. No existe un enfoque único para la ética en ciencia de datos, cada proyecto requiere de una consideración específica – en función de sus objetivos y alcances – sobre qué pasos se pueden tomar para evitar efectos sociales no deseados y perjudiciales. Sin embargo, podemos aprender sobre algunos problemas – que ya se registran – y empezar a revisar qué estrategias están disponibles para mitigar los posibles riesgos y sesgos.
-
Sesión 1 - presencial 20/5/2022 (14 hs) - A cargo de Lorena Etcheverry (Universidad de la República)
- Reflexión sobre los efectos sociales de las soluciones informáticas y los consensos sociales
- Sesgos en soluciones basadas en datos: el sesgo en seres humanos
- Sesgos en los modelos: cómo són, cómo detectarlos
- Métricas de evaluación que recompensen equidad en lugar de rendimiento superficial
- Privacidad, k-anonymity
-
Sesión 2 - virtual 17/6/2022 (14 hs) - A cargo de Luciana Benotti, Laura Alemany Alonso, Lucía González (Universidad de Córdoba, Argentina)
- data statements como metodología para documentación de datasets de NLP
- herramientas de exploración y métricas para 2 datasets de NLP que usaremos en la sesiones 3 y 4
- frameworks para visualización de modelos de NLP
- The language interpretability tool https://pair-code.github.io/
lit/
-
Sesión 3 - virtual 5/8/2022 (14 hs) - A cargo de Luciana Benotti, Laura Alemany Alonso, Lucía González (Universidad de Córdoba, Argentina)
-
word embeddings y sesgos de género
-
word embeddings y sesgos de género
-
Sesión 4 - presencial 12/8/2022 (14 hs) -Lugar: sala de máquinas a definir 4to piso Facultad de IngenieríaA cargo de Luciana Benotti y Laura Alemany Alonso (Universidad de Córdoba, Argentina)
- Taller hands-on sobre las herramientas vistas en las charlas anteriores
- Taller hands-on sobre las herramientas vistas en las charlas anteriores