CAETI

Centro de Altos Estudios en Tecnología Informática

Buenos Aires
Ingeniería de Software
Investigación y desarrollo de software para la validación de la calidad de datos abiertos e identificación de patrones para predicciones

Detección de errores ortogra´ficos para la validación de la calidad en datos abiertos gubernamentales para la métrica del factor syntactic correctness

 Año: 2022
 Idioma: Español
Resumen

Este trabajo se enfoca en la importancia de la calidad de los datos abiertos gubernamentales, que se encuentran en los portales de sitios web públicos. Se realiza un estudio comparativo de las distintas herramientas actuales para la detección de corrección de errores ortográficos, y luego, se trabaja con la mejor opción analizada en el desarrollo de un prototipo de software que permite la validación de aspectos de calidad de datos en este contexto. El aporte de este trabajo es el estudio comparativo de herramientas, como así también, un software para efectuar la validación automática de los archivos gubernamentales (datasets). Cabe destacar que la verificación de la calidad del dato se realiza a través de la métrica para la detección de errores ortográficos, utilizando el concepto del factor Syntactic Correctness en los campos del tipo cadena de texto que conforman al dataset analizado. El diseño del prototipo permitió una mejor identificación de falencias en un dataset (esto se explica en la sección de análisis de resultados), como así también, permite que los usuarios logren un estudio rápido y detallado de los errores ortográficos identificando el número de registro y el nombre del campo en el que se encuentran. Detectar estas falencias a tiempo, permitirá evitar análisis erróneos con los datos gubernamentales publicados a los ciudadanos, y, además, mejorar la interpretación de los datos brindados por el gobierno para obtener informes con un valor agregado a la población. Por todo esto, es necesario efectuar una mayor concientización en dichos aspectos de calidad.

Integrantes

María Roxana Martínez (Autor)

Christian Aníbal Parkinson (Autor)

Archivos
  • Roxana Martínez, Christian Parkinson (2022). Detección de errores ortogra´ficos para la validación de la calidad en datos abiertos gubernamentales para la métrica del factor syntactic correctness en Ciências socialmente aplicáveis [livro eletrônico]: integrando saberes e abrindo caminhos: vol. III / Organizadores Jorge José Martins Rodrigues, Maria Amélia Marques. –Curitiba, PR: Artemis, 2022.

    iii- Martinez-Parkinson - Detección de errores ortográficos en Ciências Socialmente Aplicáveis - 2022.pdf      
Contacto

SEDE BUENOS AIRES:
Dirección
Av. Montes de Oca 745
Ciudad Autónoma de Buenos Aires
C1270AAH
República Argentina

SEDE ROSARIO:
Dirección Ovidio Lagos 944
2000 – Rosario
República Argentina