Script para extraer los datos de correo electrónico, blog, Twitter, Facebook y Youtube de los diputados del Congreso

Uno de los cometidos del Proyecto Praeter Orwell es el de poner a disposición pública, de una manera estructurada en archivos de valores separados por comas, los datos que se hallan repartidos por las webs de organismos oficiales.

Para realizar esta labor, utilizo técnicas de scraping mediante scripts que escribo en lenguaje Python. A continuación publico el script que utilizo para generar el archivo csv con los datos de los nombres y apellidos, partido político, correos electrónicos, dirección de blog, de página de Facebook, y de cuentas de Twitter y Youtube extraídas de la web del Congreso de los Diputados. El resultado es este archivo.

El script consta de las típicas importaciones, generación del nombre del archivo en el que almacenaremos los datos y 4 funciones: get_tree(url), get_urls_diputados(), extraer_datos(url) y crear_csv(urls, outfile), que paso a explicar.

La oportunidad del software libre: capacidades, derechos e innovación

En el año 2009 tuve la oportunidad de trabajar, bajo la coordinación de Antonio Lafuente, con Luis Casas Luengo, Jesús González-Barahona y Pablo Machón en un texto que titulamos "La oportunidad del Software Libre: capacidades, derechos e innovación". El encargo del informe fue de la Escuela de Organización Industrial (Ministerio de Industria) y su objeto era realizar un estudio sobre La viabilidad de una política de implantación del Software Libre en las administraciones públicas.

La Audiencia de Barcelona cambia de criterio declarando no infractores los enlaces a “descarga directa” y pone contra las cuerdas a la Ley Sinde

El pasado 3 de marzo, la web elrincondejesus.com fue condenada por la Audiencia Provincial de Barcelona al pago de 3.587 euros a SGAE al considerar que los enlaces a archivos alojados en páginas de descarga directa constituían una infracción de los derechos gestionados por esa entidad.

Extracto del auto de la Audiencia Nacional sobre la trama parasitaria de la SGAE

Del auto de fecha 4 de julio de 2011 del Juzgado Central de Instrucción nº 5 de Madrid, extraigo el segundo de los antecedentes de hecho, donde se explica el entramado a través de cual los directivos de la Sociedad General de Autores y Editores se apropiaban (presuntamente) del dinero de los socios:

Praeter Orwell

Praeter Orwell es un proyecto que propone un marco básico para desarrollar posteriormente aplicaciones de control del poder político por parte de los ciudadanos mediante la gestión de la información jurídica proviniente de las personas y de organismos públicos.

Primera versión de la Ontología Move Commons

Move Commons es una herramienta para poder describir proyectos sociales en función de cuatro características y cuatro entornos. Se trata de un proyecto de la Asociación Comunes y según su web: "Move Commons consiste en una sencilla herramienta que permite que iniciativas, colectivos y ONGs puedan declarar los principios en los que se basan".

Derecho de reunión de #acampadasol: instancia para solicitarlo o por qué la ortografía no tiene nada que ver con la democracia

Me contaba mi tío José María González-Cotera que en una ocasión, durante la época de la Transición y en una de las obras de las que él era responsable como ingeniero, ocurrió una anécdota cuya moraleja es aplicable a lo sucedido esta madrugada en la #acampadasol.

#nolesvotes: por un voto responsable

1.- OBJETIVO DE #NOLESVOTES. Las personas que apoyamos a la iniciativa #nolesvotes desde sus inicios, a la vista de la catarata de tergiversaciones vertidas por políticos y medios de comunicación, queremos recordar y subrayar que la iniciativa en ningún modo promueve la abstención, y que surgió para hacer una llamada al ejercicio del voto responsable el próximo 22-M. La iniciativa pide específicamente que no se vote a los partidos que responden a intereses distintos a los de la ciudadanía: PP, PSOE y CiU, pero recomienda que en su lugar se examinen otras opciones.

Enlazar no es delito: la Audiencia Provincial de Madrid confirma el sobreseimiento del caso Indicedonkey

Nos acaba de ser notificada resolución de fecha 10 de marzo de 2011 de la Audiencia Provincial de Madrid (Sección Primera) mediante la que se confirma la dictada por el Juzgado de Instrucción nº 1, que ordenaba sobreseer y archivar el procedimiento seguido contra los administradores de la web indicedonkey. El Auto considera que la actividad de este tipo de páginas web no constituye delito alguno.

Cómo reclamar el canon indebidamente cobrado por SGAE y demás entidades de gestión

Parte I: Acción a ejercer

Etiquetas:

Páginas

Suscribirse a Derecho de Internet RSS