¿Qué son los datos públicos?
Los datos públicos son información digital recopilada por organismos gubernamentales. Los ciudadanos pueden acceder a este tipo de datos y a menudo se utilizan para identificar áreas de necesidad, seguir el progreso de los objetivos sociales y proporcionar una defensa del cambio positivo basada en datos.
Es importante recordar que los distintos países tienen diferentes definiciones legales de lo que constituyen datos públicos. Básicamente, algunos países tienen definiciones amplias que utilizan datos públicos y datos abiertos como sinónimos, mientras que otros consideran que los datos públicos son un subconjunto de los datos abiertos.
Definición de datos públicos
Conseguir que todos se pongan de acuerdo sobre una única definición de datos públicos al inicio de un proyecto ayudará a evitar confusiones y a prevenir expectativas desajustadas sobre la accesibilidad de los datos.
Por comodidad, muchas organizaciones internacionales utilizan la entrada del glosario del NIST para definir el concepto de datos públicos.
«El término ‘información pública’ significa cualquier información, independientemente de su forma o formato, que un organismo revele, difunda o ponga a disposición del público».
¿Cómo utilizar los datos públicos?
Si quieres acceder a los datos públicos y utilizarlos, el primer paso es localizar los datos que necesitas. Por suerte, la mayoría de los organismos gubernamentales y muchas organizaciones públicas tienen portales en línea específicamente diseñados para compartir datos públicos.
Una vez localizados los conjuntos de datos adecuados , tu siguiente paso será leer la documentación y los metadatos del conjunto de datos para saber cómo están formateados. Durante este paso, también debes comprobar y asegurarte de que no existen restricciones en el uso de los datos que interfieran con tu objetivo.
Una vez adquiridos los datos, tendrás que elegir la herramienta adecuada para analizarlos. Dependiendo de la estructura y el formato de los datos, puede que tengas que utilizar hojas de cálculo, software estadístico como IBM SPSS, o lenguajes de programación como Python o R para explorar los datos y buscar patrones.
Se pueden utilizar herramientas de visualización como Tableau o Power BI para ayudarte a ti y a las partes interesadas a comprender los patrones y tendencias que hayas descubierto durante el análisis. (Durante este paso, puede que tengas que considerar las limitaciones de los datos públicos y cómo pueden afectar a tu interpretación).
¿Quién puede utilizar los datos públicos?
La idea que subyace a los datos públicos es que sean accesibles a todo el mundo. Aunque el objetivo es la apertura, algunos tipos de datos públicos pueden tener restricciones.
Por ejemplo:
- Puede que tengas que registrarte o aceptar unas condiciones de uso antes de poder acceder a determinados conjuntos de datos.
- Los datos que contienen información sensible pueden publicarse en formato anónimo para proteger la privacidad.
- Puede haber tarifas de acceso a conjuntos de datos especializados y de gran valor.
- Los datos públicos gratuitos pueden tener restricciones que limiten o prohíban su reutilización comercial.
Ejemplos de repositorios públicos de datos
Un repositorio público de datos es una plataforma centralizada que almacena, gestiona y distribuye datos públicos. La mayoría de los repositorios enlazan con la fuente original y proporcionan información sobre el formato de los datos y la política de uso aceptable.
He aquí algunos ejemplos de repositorios populares donde puedes acceder a datos públicos:
Tipos de datos públicos
Los datos de los portales de datos públicos suelen categorizarse según la fuente del conjunto de datos, su contenido, sus restricciones de uso y los formatos en que pueden descargarse.
La categorización permite a los usuarios localizar conjuntos de datos brutos o procesados relevantes para sus preguntas o proyectos de investigación.
Los datos brutos se recogen directamente de la fuente. A menudo están incompletos o desestructurados y pueden contener errores o redundancias. En su forma bruta, los datos pueden no ser adecuados para tomar decisiones o realizar análisis, porque pueden ser demasiado complejos, voluminosos o difíciles de entender.
Los datos procesados, que también pueden denominarse datos cocinados, son el resultado de refinar los datos brutos para hacerlos utilizables. El procesamiento puede consistir en limpiarlos (eliminar errores o duplicados), transformarlos (convertir los datos a otro formato o estructura) y organizarlos de forma que faciliten el análisis y la toma de decisiones.
Datos públicos vs. datos abiertos, datos privados
Los datos públicos son información recopilada por organismos gubernamentales y puesta a disposición del público.
Los conjuntos de datos públicos suelen ser accesibles, pero puede haber restricciones en cuanto a los requisitos de acceso y la reutilización de los datos. Algunos ejemplos de datos públicos son los datos de gasto público, las estadísticas de salud pública y los datos meteorológicos.
En algunos países, los datos abiertos se consideran un término paraguas que incluye tanto los datos públicos y datos que recopilan las organizaciones cívicas y las instituciones de investigación.
En este contexto, los datos abiertos describen conjuntos de datos a disposición del público, de uso gratuito y sin restricciones. Normalmente se puede acceder a los conjuntos de datos abiertos en formatos legibles por máquina, como valores separados por comas (CSV) o JavaScript Object Notation (JSON), para facilitar su análisis.
Losdatos privados son información destinada a uso interno, operaciones empresariales o necesidades personales. El acceso a los datos privados está restringido a los usuarios autorizados.
Casos de uso de los datos públicos
Los datos públicos pueden utilizarse para una amplia gama de fines. Pueden utilizarse para ayudar a:
- Los profesionales sanitarios rastrear enfermedades e identificar posibles riesgos para la salud.
- Los profesionales de las finanzas identifican las tendencias del mercado y las oportunidades de inversión.
- Los ingenieros de aprendizaje automático (ingenieros ML) y los científicos de datos entrenan grandes modelos lingüísticos (LLM).
- Los funcionarios públicos elaboran políticas basadas en pruebas.
- Los empleados de organizaciones sin ánimo de lucro analizan los datos públicos para realizar un seguimiento de los avances en los objetivos sociales y medioambientales.
Ventajas e inconvenientes de los datos públicos
Los datos públicos ofrecen numerosas ventajas, pero también tienen ciertos inconvenientes. Por lo general, los beneficios potenciales superan a los inconvenientes cuando se han establecido normas adecuadas de calidad de los datos, prácticas de tratamiento responsables y se ha tomado conciencia de los posibles problemas.
Pros
- Promueve la transparencia y la responsabilidad
- Apoya las decisiones políticas basadas en pruebas
- Puede inspirar soluciones creativas a los retos
- Fomenta las asociaciones entre diferentes sectores gubernamentales y económicos
- Puede utilizarse para impulsar cambios positivos en las comunidades
Cons
- Los datos pueden contener errores, incoherencias o información obsoleta
- Los datos pueden ser malinterpretados o mal utilizados
- Requieren un manejo responsable
- Pueden tener restricciones que limiten su acceso, uso o redistribución
- Pueden requerir muchos recursos
Desafíos en el acceso a los datos públicos
Aunque los datos públicos sin restricciones suelen tener el mayor potencial de uso generalizado e impacto positivo, los datos públicos con acceso restringido aún pueden tener un valor significativo.
Muchos países han establecido soluciones que permiten a los ciudadanos solicitar el acceso a los registros gubernamentales y a otra información en poder de organismos gubernamentales o autoridades públicas.
En Estados Unidos, por ejemplo, se puede acceder a muchos tipos de datos públicos a los que no se puede acceder a través de un portal gubernamental mediante una solicitud de Libertad de Información (FOI).
Lo esencial
Los datos públicos son una poderosa herramienta para impulsar cambios positivos en muchos aspectos de la sociedad. Su uso fomenta la colaboración y capacita a personas y organizaciones para utilizar los datos públicos para el bien social.
Sin embargo, es importante recordar que los datos públicos no son lo mismo que los datos abiertos en algunos países.
La conclusión es que, aunque todos los datos abiertos pueden denominarse datos públicos, los datos públicos no siempre son datos abiertos. Esta distinción es importante para comprender los derechos y responsabilidades asociados al uso de conjuntos de datos públicos.
Preguntas frecuentes
¿Qué son los datos públicos?
¿Qué tipo de datos son públicos?
¿Cómo funcionan los datos públicos?
¿Cuál es la diferencia entre datos abiertos y datos públicos?
¿Son gratuitos los datos públicos?
Referencias
- Public Information – Glossary | CSRC (Csrc.nist)
- IBM SPSS Statistics (Ibm)
- Business Intelligence and Analytics Software | Tableau (Tableau)
- Power BI – Data Visualization | Microsoft Power Platform (Microsoft)
- Data.gov Home – Data.gov (Data)
- The official portal for European data (Data.europa)
- GitHub – awesomedata/awesome-public-datasets: A topic-centric list of HQ open datasets. (Github)
- Dataset Search (Datasetsearch.research.google)
- What is raw data (source data or atomic data) and how does it work? | Definition from TechTarget (Techtarget)
- FOIA.gov – Freedom of Information Act: How to Make a FOIA Request (Foia)