De protocolos e identificadores en Internet, más una sugerencia para bibliografías
Sí, hoy es un apunte tecnológico. Menos bonito que el Tassili de hace unos días pero tal vez útil. Los protocolos son a Internet más o menos como los idiomas al lenguaje: diferentes formas de transmitir información sobre un mismo canal de comunicación.
Así, todos usamos el protocolo http para “navegar” y poder leer, entre otras cosas, estas páginas. Los diferentes navegadores nos permiten la tarea sin saber en realidad absolutamente nada del funcionamiento interno del protocolo. Lo mismo ocurre cada vez que accedemos a los correos en el servidor de turno, para lo cual suele usarse un protocolo específico llamado POP3.
Otro ampliamente utilizado es el ftp, diseñado para la transferencia de ficheros entre ordenadores. Probablemente el ftp sea el que menos ha cambiado ya que esencialmente sigue siendo el mismo que hace 30 años sólo que ahora ya no se ejecuta necesariamente desde una ventana de texto sino que hay aplicaciones que nos facilitan la tarea.
Los usuarios de a pie ya no conocemos ni usamos protocolos que hace años eran de uso obligado, como el telnet, que permite acceder remotamente y en modo texto a otro ordenador. Telnet sigue operativo tanto en Windows como en Linux aunque el modo de trabajo original ha sido sustituido por alternativas más cómodas.
Hoy les comentaré brevemente un pseudoprotocolo que puede resultarnos útil en nuestro trabajo si estamos interesados en el acceso a documentos a través de la red. Aunque parezca aburrido no abandonen todavía.
Supongan que hay un trabajo en la revista Emerging Themes in Epidemiology que se titula Migration and health: fact, fiction, art, politics. Si yo quiero recomendarles que lo lean, la opción más habitual es decirles que accedan a
http://www.ete-online.com/content/3/1/15
Esto es el URL, que define dónde está el objeto al que queremos acceder. O más bien, donde estaba cuando se escribió la dirección porque puede haber cambiado. En ese caso recibiríamos el famoso “404 File not found”.
El problema es que el sistema basado en URL no identifica al objeto sino al lugar donde está almacenado y ese lugar no es permanente por lo que es inadecuado para citas académicas de documentos y cualquier otra que deba perdurar. Los enlaces rotos son, además de una molestia, un feo síntoma de falta de atención y mantenimiento. Este problema cada vez es más grave y ha sido objeto de artículos específicos (ver citas al final).
Para superar este problema podemos utilizar los DOI, siglas de Digital Object Identifier, un identificador único, público y persistente de cada “objeto” existente en la red.
Encuentro que este cambio de URL a DOI tiene su utilidad en los trabajos científicos y muy especialmente en las tesis doctorales y en los curricula, donde los tribunales deberían tener acceso directo a los trabajos citados. Una cita completa podría ser algo así:
Tam, Clarence C., 2006, Migration and health: fact, fiction, art, politics, Emerging Themes in Epidemiology, 3:15. [DOI:10.1186/1742-7622-3-15]La primera parte identifica perfectamente el trabajo mediante los campos clásicos pero para localizar el artículo habría que invertir un buen rato rastreando la revista, el número, etc. En los tiempos que vivimos podemos facilitarle la jugada al lector y añadirle el DOI. Es más, si las tesis doctorales y los curricula comienzan a editarse y distribuirse en CD de una santa vez, el DOI podría ser utilizado directamente para acceder al trabajo desde el propio ordenador añadiéndole el enlace adecuado.
¿Cómo se hace eso? Pues hay dos vías equivalentes. La más simple es teclear
http://dx.doi.org/
seguido del DOI. La dirección URL pertenece a la IDF (International DOI Foundation) y resuelve el identificador llevándonos directamente al documento. Por tanto:
http://dx.doi.org/10.1186/1742-7622-3-15
les llevará al artículo antes mencionado.
Pero puede ser más cómodo y fácil todavía si usan Mozilla Firefox como navegador ya que hay un pequeño aditamento de apenas 4 kb que hace la función de evitar teclear el URL. Se llama Mozilla Handle/DOI Protocol Handler y sirve para que la cosa funcione utilizando directamente:
Por la expresión parecería que DOI es un protocolo, por eso comencé el post hablando del http, ftp.... En realidad no lo es, es sólo una especie de alias, pero nos da igual: es un recurso útil que se ha generalizado hasta el extremo de que CrossRef, por ejemplo, ha superado los 20 millones de DOI en apenas 6 años.
Yo he decidido, a partir de ahora, completar mis referencias, anímense. La mayoría de los que lo lean no sabrán qué es pero no importa, queda muy moderno :-p
Bibliografía sobre el “problema 404”
Wren, J.D. (2004) “404 not found: the stability and persistence of URLs published in MEDLINE” Bioinformatics, 20: 668-672. [http://dx.doi.org/10.1093/bioinformatics/btg465]
Lawrence, S. et al. (2001) “Persistence of Web References in Scientific Research” Computer, 34: 26-31. [http://dx.doi.org/10.1109/2.901164]
Actualización: otra opción que acabo de probar es añadir el buscador de DOIs a la barra de buscadores de Firefox que aparece en la esquina superior derecha del navegador. Para hacerlo sólo hay que cargar la extensión OpenSearchFox y, tras reiniciar el navegador, abrir la página http://dx.doi.org/, pinchar en la ventana de búsqueda con el botón derecho y elegir "Añadir buscador OpenSearch". El resultado es un nuevo "motor de búsqueda":