Por la transparencia: adopta a un senador

En el día de hoy, las webs del Congreso de los Diputados y del Senado han publicado las declaraciones patrimoniales realizadas por sus señorías. El problema es que la publicación se ha realizado en formato pdf con imágenes incrustadas, que es inútil para el tratamiento de la información.

Script para extraer los datos de los senadores de la novena legislatura

Continuando con la necesidad del scraping como acto jurídico y político opendata, y dentro del Proyecto Praeter Orwell, hago público el script que utilizo para arañar la web del Senado en la parte correspondiente a datos de senadores.

Utilizo la misma operativa que en el script ya publicado para la extracción de datos de la web del Congreso, consistente en 4 funciones cuyos cometidos son los de (1) descargar una página web y generar su árbol, (2) generar una lista de todas las urls de las páginas públicas de los senadores, (3) extraer los datos relevantes de la página pública de un senador y generar un diccionario con los datos y (4) construir el archivo de valores separados por comas.

El funcionamiento del script es muy sencillo. Descárguelo y ejecute en la línea de comandos la orden $ python senadores_novena.py. En el directorio donde haya usted ejecutado la orden se creará un archivo csv de nombre «fecha_senadores_novena_legislatura.csv», que puede abrir con cualquier programa de hoja de cálculo.

El resultado del script lo puede comprobar en este enlace a Google Docs.

A continuación, el código del script:

Script para extraer los datos de correo electrónico, blog, Twitter, Facebook y Youtube de los diputados del Congreso

Uno de los cometidos del Proyecto Praeter Orwell es el de poner a disposición pública, de una manera estructurada en archivos de valores separados por comas, los datos que se hallan repartidos por las webs de organismos oficiales.

Para realizar esta labor, utilizo técnicas de scraping mediante scripts que escribo en lenguaje Python. A continuación publico el script que utilizo para generar el archivo csv con los datos de los nombres y apellidos, partido político, correos electrónicos, dirección de blog, de página de Facebook, y de cuentas de Twitter y Youtube extraídas de la web del Congreso de los Diputados. El resultado es este archivo.

El script consta de las típicas importaciones, generación del nombre del archivo en el que almacenaremos los datos y 4 funciones: get_tree(url), get_urls_diputados(), extraer_datos(url) y crear_csv(urls, outfile), que paso a explicar.

La oportunidad del software libre: capacidades, derechos e innovación

En el año 2009 tuve la oportunidad de trabajar, bajo la coordinación de Antonio Lafuente, con Luis Casas Luengo, Jesús González-Barahona y Pablo Machón en un texto que titulamos "La oportunidad del Software Libre: capacidades, derechos e innovación". El encargo del informe fue de la Escuela de Organización Industrial (Ministerio de Industria) y su objeto era realizar un estudio sobre La viabilidad de una política de implantación del Software Libre en las administraciones públicas.

La Audiencia de Barcelona cambia de criterio declarando no infractores los enlaces a “descarga directa” y pone contra las cuerdas a la Ley Sinde

El pasado 3 de marzo, la web elrincondejesus.com fue condenada por la Audiencia Provincial de Barcelona al pago de 3.587 euros a SGAE al considerar que los enlaces a archivos alojados en páginas de descarga directa constituían una infracción de los derechos gestionados por esa entidad.

Extracto del auto de la Audiencia Nacional sobre la trama parasitaria de la SGAE

Del auto de fecha 4 de julio de 2011 del Juzgado Central de Instrucción nº 5 de Madrid, extraigo el segundo de los antecedentes de hecho, donde se explica el entramado a través de cual los directivos de la Sociedad General de Autores y Editores se apropiaban (presuntamente) del dinero de los socios:

Praeter Orwell

Praeter Orwell es un proyecto que propone un marco básico para desarrollar posteriormente aplicaciones de control del poder político por parte de los ciudadanos mediante la gestión de la información jurídica proviniente de las personas y de organismos públicos.

Primera versión de la Ontología Move Commons

Move Commons es una herramienta para poder describir proyectos sociales en función de cuatro características y cuatro entornos. Se trata de un proyecto de la Asociación Comunes y según su web: "Move Commons consiste en una sencilla herramienta que permite que iniciativas, colectivos y ONGs puedan declarar los principios en los que se basan".

Derecho de reunión de #acampadasol: instancia para solicitarlo o por qué la ortografía no tiene nada que ver con la democracia

Me contaba mi tío José María González-Cotera que en una ocasión, durante la época de la Transición y en una de las obras de las que él era responsable como ingeniero, ocurrió una anécdota cuya moraleja es aplicable a lo sucedido esta madrugada en la #acampadasol.

#nolesvotes: por un voto responsable

1.- OBJETIVO DE #NOLESVOTES. Las personas que apoyamos a la iniciativa #nolesvotes desde sus inicios, a la vista de la catarata de tergiversaciones vertidas por políticos y medios de comunicación, queremos recordar y subrayar que la iniciativa en ningún modo promueve la abstención, y que surgió para hacer una llamada al ejercicio del voto responsable el próximo 22-M. La iniciativa pide específicamente que no se vote a los partidos que responden a intereses distintos a los de la ciudadanía: PP, PSOE y CiU, pero recomienda que en su lugar se examinen otras opciones.

Páginas

Suscribirse a Derecho de Internet RSS