Anonimitat de dades en Python
Belmonte García, David
Navarro-Arribas, Guillermo, dir. (Universitat Autònoma de Barcelona. Departament d'Enginyeria de la Informació i de les Comunicacions)
Universitat Autònoma de Barcelona. Escola d'Enginyeria

Títol variant: Data anonymity in Python
Títol variant: Anonimidad de datos en Python
Data: 2021
Resum: Avui dia les dades són una part molt important de la nostra societat i la seva privacitat encara ho és més. Aquest projecte es centra sobre un aspecte concret de la privacitat: l'anonimitat, que estudia com evitar la re-identificació dels individus en un conjunt de dades, tot i haver esborrat els camps identificadors. L'anonimitat permet que les dades es puguin compartir més fàcilment, almenys des d'un punt de vista legal, amb altres empreses o persones per al seu posterior estudi, com és el cas de la mineria de dades, que no requereix conèixer específicament a ningú sinó més aviat identificar patrons que són comuns per a un conjunt de registres de les dades. En aquest article s'explica el funcionament d'uns mètodes que permeten aplicar anonimitat a un conjunt dades, com s'han desenvolupat aquests mètodes a Python i quins han sigut els resultats dels experiments fets sobre les funcions desenvolupades, els quals han sigut comparats amb els resultats dels mateixos experiments fets sobre els mateixos mètodes provinents d'una llibreria del llenguatge de programació R.
Resum: Nowadays, data is a very important part of our society and its privacy even more. This projects focuses on one specific aspect of privacy: anonymity, which studies how to avoid reidentification of individuals in a dataset, even when the identifier fields are removed. Anonymity allows data to be shared more easily, at least from a legal perspective, with other companies or people to study it, as it is the case of data mining which doesn't require knowing any specific individuals, but rather it identifies common patterns in a set of registers inside the data. In this article we explain how some methods that apply anonymity to a dataset work, how these methods were developed in Python and which were their results after running a series of experiments on the functions, which were compared to the results obtained from running the same experiments on the same functions from a library from the R programming language.
Resum: Hoy día los datos son una parte muy importante de nuestra sociedad y su privacidad aún lo es más. Este proyecto se centra sobre un aspecto concreto de la privacidad: la anonimidad, que estudia cómo evitar la reidentificación de los individuos en un conjunto de datos, a pesar de haber borrado los campos identificadores. La anonimidad permite que los datos se puedan compartir más fácilmente, al menos desde un punto de vista legal, con otras empresas o personas para su posterior estudio, como es el caso de la minería de datos, que no requiere conocer específicamente a nadie sino más bien identificar patrones que son comunes para un conjunto de registros de los datos. En este artículo se explica el funcionamiento de unos métodos que permiten aplicar anonimidad a un conjunto datos, como se han desarrollado estos métodos en Python y cuáles han sido los resultados de los experimentos hechos sobre las funciones desarrolladas, los cuales han sido comparados con los resultados de los mismos experimentos hechos sobre los mismos métodos provenientes de una librería del lenguaje de programación R.
Drets: Aquest document està subjecte a una llicència d'ús Creative Commons. Es permet la reproducció total o parcial, la distribució, i la comunicació pública de l'obra, sempre que no sigui amb finalitats comercials, i sempre que es reconegui l'autoria de l'obra original. No es permet la creació d'obres derivades. Creative Commons
Llengua: Català
Titulació: Grau en Enginyeria Informàtica [2502441]
Pla d'estudis: Enginyeria Informàtica [958]
Document: Treball final de grau ; Text
Àrea temàtica: Menció Tecnologies de la Informació
Matèria: Anonimització ; Privacitat ; Sdcmicro ; Dades ; Python ; Pandas ; Anonymization ; Privacy ; Data ; Anonimización ; Privacidad ; Datos



12 p, 815.1 KB

El registre apareix a les col·leccions:
Documents de recerca > Treballs de Fi de Grau > Escola d'Enginyeria. TFG

 Registre creat el 2021-07-26, darrera modificació el 2023-07-22



   Favorit i Compartir