09 noviembre 2006

Recovecos de Internet

De protocolos e identificadores en Internet, más una sugerencia para bibliografías

Sí, hoy es un apunte tecnológico. Menos bonito que el Tassili de hace unos días pero tal vez útil. Los protocolos son a Internet más o menos como los idiomas al lenguaje: diferentes formas de transmitir información sobre un mismo canal de comunicación.
Así, todos usamos el protocolo http para “navegar” y poder leer, entre otras cosas, estas páginas. Los diferentes navegadores nos permiten la tarea sin saber en realidad absolutamente nada del funcionamiento interno del protocolo. Lo mismo ocurre cada vez que accedemos a los correos en el servidor de turno, para lo cual suele usarse un protocolo específico llamado POP3.
Otro ampliamente utilizado es el ftp, diseñado para la transferencia de ficheros entre ordenadores. Probablemente el ftp sea el que menos ha cambiado ya que esencialmente sigue siendo el mismo que hace 30 años sólo que ahora ya no se ejecuta necesariamente desde una ventana de texto sino que hay aplicaciones que nos facilitan la tarea.
Los usuarios de a pie ya no conocemos ni usamos protocolos que hace años eran de uso obligado, como el telnet, que permite acceder remotamente y en modo texto a otro ordenador. Telnet sigue operativo tanto en Windows como en Linux aunque el modo de trabajo original ha sido sustituido por alternativas más cómodas.
Hoy les comentaré brevemente un pseudoprotocolo que puede resultarnos útil en nuestro trabajo si estamos interesados en el acceso a documentos a través de la red. Aunque parezca aburrido no abandonen todavía.

Supongan que hay un trabajo en la revista Emerging Themes in Epidemiology que se titula Migration and health: fact, fiction, art, politics. Si yo quiero recomendarles que lo lean, la opción más habitual es decirles que accedan a

http://www.ete-online.com/content/3/1/15

Esto es el URL, que define dónde está el objeto al que queremos acceder. O más bien, donde estaba cuando se escribió la dirección porque puede haber cambiado. En ese caso recibiríamos el famoso “404 File not found”.
El problema es que el sistema basado en URL no identifica al objeto sino al lugar donde está almacenado y ese lugar no es permanente por lo que es inadecuado para citas académicas de documentos y cualquier otra que deba perdurar. Los enlaces rotos son, además de una molestia, un feo síntoma de falta de atención y mantenimiento. Este problema cada vez es más grave y ha sido objeto de artículos específicos (ver citas al final).


Para superar este problema podemos utilizar los DOI, siglas de Digital Object Identifier, un identificador único, público y persistente de cada “objeto” existente en la red.
Encuentro que este cambio de URL a DOI tiene su utilidad en los trabajos científicos y muy especialmente en las tesis doctorales y en los curricula, donde los tribunales deberían tener acceso directo a los trabajos citados. Una cita completa podría ser algo así:
Tam, Clarence C., 2006, Migration and health: fact, fiction, art, politics, Emerging Themes in Epidemiology, 3:15. [DOI:10.1186/1742-7622-3-15]
La primera parte identifica perfectamente el trabajo mediante los campos clásicos pero para localizar el artículo habría que invertir un buen rato rastreando la revista, el número, etc. En los tiempos que vivimos podemos facilitarle la jugada al lector y añadirle el DOI. Es más, si las tesis doctorales y los curricula comienzan a editarse y distribuirse en CD de una santa vez, el DOI podría ser utilizado directamente para acceder al trabajo desde el propio ordenador añadiéndole el enlace adecuado.
¿Cómo se hace eso? Pues hay dos vías equivalentes. La más simple es teclear

http://dx.doi.org/
seguido del DOI. La dirección URL pertenece a la IDF (International DOI Foundation) y resuelve el identificador llevándonos directamente al documento. Por tanto:

http://dx.doi.org/10.1186/1742-7622-3-15

les llevará al artículo antes mencionado.
Pero puede ser más cómodo y fácil todavía si usan Mozilla Firefox como navegador ya que hay un pequeño aditamento de apenas 4 kb que hace la función de evitar teclear el URL. Se llama Mozilla Handle/DOI Protocol Handler y sirve para que la cosa funcione utilizando directamente:

doi://10.1186/1742-7622-3-15

Por la expresión parecería que DOI es un protocolo, por eso comencé el post hablando del http, ftp.... En realidad no lo es, es sólo una especie de alias, pero nos da igual: es un recurso útil que se ha generalizado hasta el extremo de que CrossRef, por ejemplo, ha superado los 20 millones de DOI en apenas 6 años.
Yo he decidido, a partir de ahora, completar mis referencias, anímense. La mayoría de los que lo lean no sabrán qué es pero no importa, queda muy moderno :-p


Bibliografía sobre el “problema 404”

Wren, J.D. (2004) “404 not found: the stability and persistence of URLs published in MEDLINE” Bioinformatics, 20: 668-672. [http://dx.doi.org/10.1093/bioinformatics/btg465]

Lawrence, S. et al. (2001) “Persistence of Web References in Scientific Research” Computer, 34: 26-31. [http://dx.doi.org/10.1109/2.901164]


Actualización: otra opción que acabo de probar es añadir el buscador de DOIs a la barra de buscadores de Firefox que aparece en la esquina superior derecha del navegador. Para hacerlo sólo hay que cargar la extensión OpenSearchFox y, tras reiniciar el navegador, abrir la página http://dx.doi.org/, pinchar en la ventana de búsqueda con el botón derecho y elegir "Añadir buscador OpenSearch". El resultado es un nuevo "motor de búsqueda":


4 comentarios:

AJ dijo...

Gracias por el añadido para Firefox que no lo conocía. El DOI si que lo he usado para alguna que otra página web y para mi tesis y otro proyecto que edité en CD-ROM.

Lo de incluirlo en los curricula me parece una gran idea para facilitar la evaluación y que no se puedan confundir. A ver si alguien se lo apunta y lo incorporan a los modelos tipo de curriculum como otro campo más a rrellenar.

Un saludo,
AJ

Silvano dijo...

La verdad es que yo lo desconoc'ia por completo, as'i que me has dejado con la duda de c'omo se registra un DOI. No me ha costado encontrar en:
http://www.medra.org/en/guide.htm
lo siguiente (lo he traducido, disculpad los fallos que pueda haber cometido)[a prop'osito, con tanto registro no me ha quedado claro si se trata de algo gratuito o no]:
Para registrar DOIs, hay que seguir los siguientes pasos:

1. Rellenar el formulario de petici'on de cuenta y enviarlo. En el campo "Request reason" (raz'on de la petici'on), puedes escribir el tipo de documentaci'on a la que quieres asignar DOIs (por ejemplo: DOIs a una serie de art'iculos en l'inea en mi p'agina web www.xyz.org)

2. Nuestra agencia de ventas Siscom contactar'a contigo y, despu'es de que t'u hayas confirmado la certeza de la petici'on llegar'as a ser un usuario de mEDRA, te enviar'a el contrato para unirse al sistema de rigistro DOI. Los costes y ?main provisions? est'an est'an en la p'agina de t'erminos y condiciones

3. Una vez que se haya firmado el contrato, te ser'a dada por nuestro Servicio de Administraci'on tu prefijo DOI, as'i como un nombre de usuario personal y una clave de acceso al 'Area de Usuarios Registrados del sitio web.

4. En este punto ya est'as preparado para registrar tu primer DOI.
Para hacer esto, primero tienes que establecer el sufijo DOI.
Despu'es, tienes que compilar los metadatos relacionados, Afterwards, you have to compile the related metadata, de acuerdo con el ONIX DOI Metadata Schema, seleccionando el tipo de objeto a ser identificado en las restantes especificaciones.
Para completar el registro, es necesario enviar el metadata a mEDRA, escogiendo una de las tres modalidades, diferentes por el nivel de autonom'ia y asistencia reservada al usuario en el momento de la compilaci'on.

5. Finalmente, podr'as ver los resultados de tus registros DOI.

Ana dijo...

Gracias por toda la info. Jamás lo he usado pero voy a probar en los proyectos que tengo entre manos.

Angel dijo...

La verdad es que no me he preocupado de mirar cómo se registran los DOI porque me veo claramente en el "sector usuario" y no en el de dar el servicio.
La idea es que hay que formar parte de una "Registration Agency" http://doi.org/registration_agencies.html
o bien llegar a un acuerdo con ellos.
En las FAQ hay explicaciones al respecto:
http://doi.org/faq.html#3

Grab this Widget ~ Blogger Accessories
 
º