Sistema colaborativo para el etiquetado de datos
Collaborative system for data labeling

Impacto

Downloads

Downloads per month over past year



González Palacios, Gemma and Salvador Crespo, Adrián (2022) Sistema colaborativo para el etiquetado de datos. [Trabajo Fin de Grado]

[thumbnail of 1898300215 - GEMMA GONZÁLEZ PALACIOS 85207_GEMMA_GONZALEZ_PALACIOS_Sistema_para_etiquetado_de_datos.pdf]
Preview
PDF
Creative Commons Attribution Non-commercial.

1MB



Abstract

Actualmente, al utilizar técnicas de aprendizaje automático es necesario pasar por una etapa de etiquetado manual de datos para entrenar al software. Este proceso de etiquetado puede resultar muy tedioso y ocupar una gran cantidad de tiempo porque en muchas ocasiones debe realizarse de manera manual.
Este proyecto consiste en implementar un sistema colaborativo para etiquetar datos de forma más eficiente y fiable. La estrategia que hemos decidido para desarrollar este sistema es implementar un servicio de CAPTCHA. Este tipo de servicios suele funcionar presentando un reto que normalmente consiste en seleccionar los elementos dentro de un conjunto de datos que cumplen una condición determinada, por lo que las respuestas que envían los usuarios que realizan estos retos pueden servir para clasificar esos elementos que han seleccionado. Sin darse cuenta, los usuarios a los que el reto haya verificado como reales, están realizando un proceso de etiquetado de datos.

Resumen (otros idiomas)

Currently, when using machine learning techniques, it is necessary to go through a stage of manual data labeling to train the software. This data labeling process can be very tedious and take a lot of time because often it is done manually. This project consists of implementing a collaborative system to label data more efficiently and reliably. The strategy we have decided to develop this system is to implement a CAPTCHA service. This type of service usually works by presenting a challenge that generally consists of selecting the elements within a set of data that meet a certain condition, so the answers sent by users who perform these challenges can be used to classify those elements they have selected. Without being aware, users who have been verified as real by the challenge are performing a data labeling process.

Item Type:Trabajo Fin de Grado
Additional Information:

Trabajo de Fin de Grado en Ingeniería Informática, Departamento de Sistemas Informáticos y Computación, Facultad de Informatica UCM, Curso 2021/2022.
Todos los recursos del proyecto están disponibles en el siguiente enlace: https://github.com/AdriSC/tfg

Directors:
Directors
Martín Martín, Enrique
Riesco Rodríguez, Adrián
Uncontrolled Keywords:Etiquetado de datos, CAPTCHA, Python, JavaScript, Bootstrap, Django
Palabras clave (otros idiomas):Data labeling, CAPTCHA, Python, JavaScript, Bootsrap, Django
Subjects:Sciences > Computer science
Título de Grado:Grado en Ingeniería Informática
ID Code:75036
Deposited On:11 Oct 2022 15:39
Last Modified:11 Oct 2022 15:39

Origin of downloads

Repository Staff Only: item control page