03 julio 2010

De viaje

Mañana salgo de viaje, el primero de este año. Nos vamos a un lugar cuya topografía tiene el espléndido aspecto de la figura que les pongo abajo. Vamos a trabajar pero hemos dejado un par de días libres al final, a ver si les traigo alguna foto decente.


26 junio 2010

El ridgeback noruego fotografiado

Un fotógrafo ruso (o algo así) llamado Igor consigue algo que los criptozoólogos persiguen hace décadas sin éxito: una imagen nítida de dos crías de ridgeback. Además no es un fake. Más fotos sorprendentes en su web.

Foto de Igor Siwanovicz (fuente)

24 junio 2010

Especial de Nature sobre el mal de Chagas

Nature publica un suplemento de acceso libre sobre el mal de Chagas. Traduzco el párrafo de presentación:
El mal de Chagas es un de las más olvidadas enfermedades tropicales aunque existen millones de personas infectadas. Sólo hay dos fármacos para su tratamiento, ambos con más de 40 años de existencia y ninguno idóneo. Según la movilidad de la población ha aumentado en el mundo, la enfermedad de Chagas se ha extendido desde América Latina hasta convertirse en una amenaza general. Este suplemento expone avances en la comprensión y el tratamiento de la enfermedad de Chagas tras 101 años de historia y destaca los desafíos que aún deben cumplirse.
Según la OMS:
El mal de Chagas es una enfermedad grave, en ocasiones mortal, causada por el protozoo parásito Trypanosoma cruzi. Sus primeros síntomas son fiebre, fatiga, inflamación de los ganglios y dolor cardiaco, pero con el paso de los años la infección puede provocar una debilitación crónica resultante de la destrucción del músculo cardiaco. Se registra principalmente en América Latina, donde se estima que durante el decenio de 1980 estaban infectados más de 20 millones de personas.
Es posible pedir un ejemplar impreso gratuitamente y hay un foro público para comentarios.
Dos posts en este blog sobre enfermadades olvidadas:
Uno de los vectores de la enfermedad es este insecto hematófago de nombre Triatoma infestans

21 junio 2010

Un solo artículo multiplica por 20 el factor de impacto de una revista

La revista que está en segundo lugar de acuerdo con el factor de impacto en la categoría "ciencia" es Acta Crystallographica - Section A. Esta revista tenía hasta ahora valores de FI entre 1,5 y 2,5 pero en esta edición ostenta un espectacular 49,9 ¿qué ha pasado?
No es un error sino que en el año 2008 publicó un artículo titulado A short history of SHELX firmado por George Sheldrick de la Universidad of Göttingen. En dicho artículo se hace una revisión del desarrollo de SHELX, una aplicación informática usada para el análisis de moléculas, cuya primera versión se escribió allá por 1970. Un artículo de 10 páginas con una estructura inusual (Introducción, Discusión y Conclusiones) que ha sido citado las veces que ven abajo: 6606 (según el ISI). Le harán un regalo supongo.

19 junio 2010

Mapas en formato digital y de acceso libre

Después de una temporada de trabajo, hemos hecho público un lugar en internet sin nombre concreto pero que podríamos definir como una IDE (Infraestructura de Datos Espaciales) con servicios de catálogo y descarga. Nuestro objetivo es dar un servicio a la comunidad facilitando el acceso libre a mapas. Esta IDE es muy simple conceptualmente ya que solamente incluye un buscador de mapas (entiéndase "mapa"en sentido amplio), un despliegue de sus metadatos (información básica quién y cómo hizo el mapa) y un punto de descarga vía http.
La cosa surgió ante la evidencia de que mucha gente que trabaja con mapas necesita información que tal vez exista o tal vez no pero que, en cualquier caso, debe buscar con un enorme desperdicio en tiempo y esfuerzo.
Si montamos un sistema que facilite ese acceso estaremos reduciendo costes y aumentando la eficacia, algo que entiendo es siempre positivo.

La aplicación
El sistema está funcionando sobre Geonetwork opensource, una aplicación de catálogo libre y de código abierto cuyo objetivo es, precisamente, facilitar el acceso a datos espaciales. La forma de buscar más simple es introducir palabras clave en la ventana de búsqueda (arriba a la izquierda). Por ejemplo: "NDVI 2000-2009" devolverá entre otros el mapa siguiente.

Componente Principal 1 de los NDVI de la Península Ibérica para el periodo 2000-2009
Si nos interesa podemos examinar sus metadatos o descargarlo directamente a nuestro ordenador. Es importante destacar que lo que descargamos no es una imagen (lo que vemos sí, está puesta para que la gente se haga una idea de lo que ha encontrado) sino los datos digitales que forman en mapa. En el caso anterior, se trata de una matriz de un millón de celdas más o menos cada una de las cuales contiene un valor entero. La imagen no es más que la representación gráfica de esa matriz pero no es útil para hacer cálculos, que necesitan los valores numéricos.
Este matiz es esencial para entender el objetivo de este servicio: ofrecer la información real, no una imagen pictórica más o menos afortunada.

El servidor
Todo esto está funcionando en un servidor virtual sobre VMWare con Debian GNU/Linux como sistema operativo.

Los datos
¿Qué datos hay disponibles para descargar? En este momento tenemos algo más de 100 Gb de mapas. Hemos empezado ofreceindo información ambiental que hemos considerado importante y que o no existía o estaba un tanto escondida o dispersa. Destacan los mapas climáticos de la España peninsular, de los que hay varios miles (luego lo explico), así como mapas de distribución potencial de vegetación actual y futura, algo de límites administrativos, límites de las hojas cartográficas de España a diferentes escalas, índices de actividad fotosintética y algunos procesamientos estadísticos de la información básica (componentes principales), modelos digitales de elevaciones, mapas de radiación solar sobre el terreno...
Para enterarse bien de lo que hay y, sobre todo, de cómo buscarlo, hemos hecho un wiki llamado Geocatálogo donde se explica lo más relevante de los datos originales, métodos seguidos y forma de búsqueda. Es muy importante examinar este wiki antes de ponerse a trabajar con Geonetwork para comprender bien el alcance de los datos existentes. Por ponerles un ejemplo, hemos elaborado mapas climáticos. Cada series está formada por 36 mapas: temperaturas mínimas, temperaturas máximas y precipitaciones de cada mes del año (3x12=36). La serie básica corresponde al periodo 1961-1990 pero hay mucho más ya que se han elaborado series que reflejan lo que los modelos de cambio climático global prevén para el futuro. Así, hemos construido series de maoas para las combinaciones de:
  • modelos globales: CGCM2, ECHAM4 y HADAM3H
  • escenarios IPCC: A2 y B2
  • horizontes temporales: 2011-2040, 2041-2070 y 2071-2100.
 Por lo tanto, es posible localizar y descargar las precipitaciones medias del mes de enero para el periodo 2011-204o previstas por el modelo ECHAM4 para el escenario B2, por ejemplo. Comprenderán que es conveniente leer primero el wiki para no perderse.
¿Qué no van a encontrar aquí? Vamos a seguir poniendo datos ambientales de diverso tipo pero nuestra idea es poner mapas de valor añadido. Por ejemplo, tenemos prohibido poner los datos de las estaciones meteorológicas ya que firmamos un compromiso con la Agencia Estatal de Meteorología en ese sentido pero ese compromiso no afecta a productos derivados y los mapas entran en ese concepto. No vamos a poner cartografía básica (los mapas convencionales de curvas de nivel, por ejemplo) ya que eso es competencia de otros organismos como el CNIG (Centro Nacional de Información Geográfica) u otras agencias estatales o autonómicas.

La licencia
Toda la información generada por nosotros está bajo licencia Creative Commons 3.0 Attribution, es decir, puede usarse libremente con cualquier fin (comerciales o no), pueden hacerse trabajos derivados, puede copiarse y redistribuirse con el único requisito de citar la procedencia. Algunos mapas no son nuestros pero suelen tener una licencia similar que, en cualquier caso, figura en los metadatos.

Trabajar con la información
Los datos están en formatos compatibles con sistemas de información geográfica: shapefile para datos vectoriales y ascii grid para datos raster. Los SIG son aplicaciones para trabajar con datos geográficos (desde puntos tomados con GPS hasta imágenes de satélite que, por cierto, tenemos también algunas) y disponer y manjar uno es requisito imprescindible para aprovechar la información. Los hay libres y en concreto yo recomendaría gvSIG en la versión tuneada por Oxford Archaeology descargable aquí.

Imagen ortorrectificada de la zona de las Villuercas en Extremadura; los datos incluyen 14 bandas espectrales, desde el verde hasta el infrarrojo térmico (sensor ASTER)

Lamentablemente sólo somos dos personas para esta historia y ninguno de nosotros tiene una dedicación completa sino al contrario, muy parcial (especialmente en mi caso, que sigo con mis clases, investigación y proyectos). La aplicación Geonetwork ha necesitado un esfuerzo importante en revisión de código, optimización y limpieza y corrección de errores, así como en la creación de nuevos programas para la verificación de metadatos y publicación de la información. También la seguridad informática ha sido un aspecto que hemos tenido que cuidar mucho ya que estos servidores son una golosina para ciertos impresentables (de hecho apenas dos días en la red y ya hemos tenido el primer ataque por fuerza bruta procedente de un país del Este de Europa).
Contando con que el tiempo es escaso y nuestra reacción probablemente lenta, quedamos a vuestra disposición en cuanto a sugerencias (qué datos echais de menos y podrían ponerse), ideas nuevas (por ejemplo, tengo en mente la idea de hacer un directorio de datos espaciales fiables que no estén en nuestro servidor pero no sé cómo implementarlo de forma que sea práctico, fácilmente actualizable y con poco mantenimiento) y, por qué no, contribuciones con nuevos mapas digitales que hagan más completa la colección. Os agradecería también que difundiérais esta información allá donde considereis oportuno ya que cuanta más gente use esto más sentido tendrá el trabajo realizado (y el que nos espera). Estais en vuestra casa, servíos vosotros mismos.

18 junio 2010

Aquel artículo en PLoS ONE

Hace casi dos años hicimos una apuesta algo arriesgada: publicar un buen trabajo en una revista sin factor de impacto llamada PLoS ONE. El artículo es de acceso libre y publiqué en este blog una versión comentada de su origen, elaboración y resultadosen tres partes bajo en título común Cómo se hizo "Las pardelas tienen GPS pero no le hacen caso". Dediqué la primera parte a debatir sobre la revista y su política de publicación. Luego entré a explicar el artículo en dos partes más: el espacio y el tiempo.
Los motivos de enviar el artículo a PLoS ONE fueron dos, uno altruista y otro egoísta. El que suena mejor es el primero, claro: todas las revistas de la Public Library of Science son de acceso abierto. La licencia es Creative Commons Attribution, lo que significa que todo el mundo (literalmente) puede leer los artículos gratuitamente y hacer con ellos lo que quiera (trabajos derivados, por ejemplo) sin más requisito que citar a los autores. Es gratis para todos menos para los que publican, que debemos pagar una cantidad no despreciable. Echando cuentas, sin embargo, llegas a la conclusión de que es más barato pagar tú por que pongan tu artículo en abierto que la alternativa de una revista que sólo puede ser leída por suscripción, algo que no todos se pueden permitir.
El segundo motivo es menos guay: pensamos que el acceso libre supone un mayor número de citas potenciales. Es posible que tu artículo no sea citado por nadie o tal vez sólo por tí mismo (vean Ciencia oscura) pero al menos que no sea por estar en una revista inaccesible.
PLoS ONE no tenía factor de impacto y había dudas de que llegara a tenerlo porque parecía que la revisión no era especialmente fuerte ya que se sólo se rechaza un 30-35% de los artículos enviados y el número de artículos publicados es elevado: 2700 en el 2008 y casi 4000 en el 2009. Se asumía que si los artículos eran suficientemente citados eso era un indicador de que el nivel era adecuado para una revista científica "seria".
El tiempo ha confirmado esa cuestión y hoy PLoS ONE aparece en la última edición del JCR (Journal Citation Reports) con un factor de impacto de 4,35. El JCR es esa lista de revistas chachis donde es obligatorio publicar para que tu curriculum investigador tenga una pátina de respetabilidad (con razón o sin ella, que eso es otra cuestión).
Según SCImago, PLoS ONE ha acumulado 3979 citas en los últimos tres años para un total de 1306 artículos.
Nube de etiquetas de PLoS ONE (hecha con Wordle)

Grab this Widget ~ Blogger Accessories
 
º