10 años de presencia en internet

Imagen de Martín Anaya, Felipe

Antecedentes

Este año se han cumplido 10 años de presencia de Amigos de Serrablo en Internet bajo el dominio www.serrablo.org. En este tiempo otras muchas webs han salido, algunas han desaparecido y otras languidecen, pero muy pocas de nuestra índole tienen esta trayectoria.

Antigüedad del dominio serrablo.org

Los inicios de Internet poco tienen que ver con lo que es ahora, de hecho parece que ha pasado mucho tiempo, pero no es así. El usuario era un mero espectador. Nos limitábamos a poner paginas html mas o menos “bonitas”, que vistas ahora en perspectiva dejan bastante que desear. Basta con echar un vistazo al archivo de internet para hacerse una idea.

Éramos ciber renacentistas que hacíamos de todo, programación, apartado gráfico, administración de sistemas, etc. Sin las herramientas actuales, el mantenimiento de un sitio web resultaba un tanto penoso.

Notación XML y correspondiente DTD de la revista SerrabloLa intención inicial era dar a conocer la labor de la asociación en sus principales ámbitos de actividad, recuperación del patrimonio cultural, las iglesias mozárabes, el Museo etnológico y el Museo de dibujo. Se seleccionaron textos de la Guía de Serrablo y se ubicaron cada uno bajo su epígrafe correspondiente en la página principal.

Ahora bien, como el principal medio de difusión de las actividades de la asociación era, y es, la revista Serrablo, nos propusimos volcar a la web cada numero tras su publicación.

Con una media de 14 artículos por cada número de la revista, aunque de una periodicidad trimestral, enseguida vimos que no se podía hacer “a mano”. Bueno, si se podía, pero un cambio de maquetación después de hacerlo, que afectara a todas las páginas era un pequeño suplicio.

Realizamos algunos intentos de generar las páginas automáticamente “en casa” mediante una base de datos Oracle y algunos scripts (programas). Esto daba unos resultados aceptables a nivel global, es decir, generábamos una pagina por cada articulo (podíamos generar un numero de la revista concreto o todos a la vez), pero no se trataba el cuerpo, quedando este fuera de cualquier procesamiento automático.

Al poco tiempo entro en escena XML, que es según la Wikipedia

XML, sigla en inglés de Extensible Markup Language («lenguaje de marcas ampliable»), es un metalenguaje extensible de etiquetas desarrollado por el World Wide Web Consortium (W3C). Es una simplificación y adaptación del SGML y permite definir la gramática de lenguajes específicos (de la misma manera que HTML es a su vez un lenguaje definido por SGML). Por lo tanto XML no es realmente un lenguaje en particular, sino una manera de definir lenguajes para diferentes necesidades. Algunos de estos lenguajes que usan XML para su definición son XHTML, SVG, MathML.

XML no ha nacido sólo para su aplicación en Internet, sino que se propone como un estándar para el intercambio de información estructurada entre diferentes plataformas. Se puede usar en bases de datos, editores de texto, hojas de cálculo y casi cualquier cosa imaginable.

XML es una tecnología sencilla que tiene a su alrededor otras que la complementan y la hacen mucho más grande y con unas posibilidades mucho mayores. Tiene un papel muy importante en la actualidad ya que permite la compatibilidad entre sistemas para compartir la información de una manera segura, fiable y fácil.

Wikipedia

http://es.wikipedia.org/wiki/XML

Es decir, con XML y acompañado de la definición de una gramática (DTD: Document Type Definition) que determina la estructura y sintaxis de un documento XML teníamos el control absoluto sobre la información contenida en cada número de la revista. Ya solo nos faltaba tratar estos ficheros mediante un procesador XSLT (en concreto Saxon) para generar las paginas de forma que quedaba totalmente separado el contenido de la presentación, paradigma ampliamente buscado en la publicación en Internet y en otros ámbitos de la informática.

Estamos hablando del año 1999 y 2000, en el que todo esto era casi un proyecto de I+D.

Pero aunque esta generación y publicación fuera automática, no dejaba de ser muy costosa la codificación manual de cada artículo ya que por la forma de trabajar de la asociación en la revista, la fuente, el origen del trabajo, era el papel de la propia revista. Había que escanear cada página y pasar un software de reconocimiento óptico de caracteres (OCR) para mas tarde formatear el texto conforme a la DTD. Además de que la diversidad de artículos obligaba bastante a menudo a hacer cambios en la DTD para poder “encajar” las cosas.

Pese a todo, teníamos muy controlada la revista, pero el resto de apartados de la web seguía fuera de todas estas herramientas y procesos automáticos.

Lo hemos estado haciendo así hasta hace poco mas de dos años, cuando ya nos dimos cuenta de que ahora hay poderosas herramientas y libres que facilitan esta tarea.

Y es que el camino recorrido estos últimos años hasta llegar a la Internet actual esta jalonado por hitos protagonizados por el movimiento de Software libre (Open Source). Ha habido una sinergia maravillosa entre el software libre y el desarrollo de Internet. Aunque el software libre también abarca aplicaciones de escritorio, entre las que destacaría Gimp, OpenOffice o el propio Linux, se podría decir que Internet la mueve el Software Libre desde el momento que un altísimo porcentaje de servidores de Internet proporcionan servicios adscritos a este movimiento.

Software libre (en inglés free software) es la denominación del software que brinda libertad a los usuarios sobre su producto adquirido y por tanto, una vez obtenido, puede ser usado, copiado, estudiado, modificado y redistribuido libremente. Según la Free Software Foundation, el software libre se refiere a la libertad de los usuarios para ejecutar, copiar, distribuir, estudiar, cambiar y mejorar el software; de modo más preciso, se refiere a cuatro libertades de los usuarios del software: la libertad de usar el programa, con cualquier propósito; de estudiar el funcionamiento del programa, y adaptarlo a las necesidades; de distribuir copias, con lo que puede ayudar a otros; de mejorar el programa y hacer públicas las mejoras, de modo que toda la comunidad se beneficie.

Wikipedia

http://es.wikipedia.org/wiki/ Código_libre

Otra idea atractiva del Software Libre es que culturalmente se alinea con la filosofía de las ONG’s y asociaciones como la nuestra ya que es creado sin la intención de generar beneficios.

En la asociación “hemos sufrido” con un par de aplicaciones importantes, la gestión de los socios y el catalogo del museo de dibujo. Cuando hemos necesitado modificar algo de estos programas, realizadas hace ya algunos años, nos ha resultado imposible y nos hemos visto obligados a hacer ingeniería inversa para poder migrar a otras plataformas.

Pero ¿qué hay detrás de www.serrablo.org?

Plataforma web

Software

Componentes de una plataforma LAMPToda la plataforma está auspiciada en servicios y hardware de la empresa zaragozana Instrumentación y componentes. El software es la típica instalación LAMP (Linux, Apache, MySql y PHP)

Si al principio teníamos la web en ficheros html estáticos debajo de un servidor web (Apache), ahora toda la información esta volcada en una base de datos que gestiona Drupal.

Drupal

Drupal es un sistema de gestión de contenido modular y muy configurable.

Es un programa de código abierto, con licencia GNU/GPL, escrito en PHP, desarrollado y mantenido por una activa comunidad de usuarios. Destaca por la calidad de su código y de las páginas generadas, el respeto de los estándares de la web, y un énfasis especial en la usabilidad y consistencia de todo el sistema.

El diseño de Drupal es especialmente idóneo para construir y gestionar comunidades en Internet. No obstante, su flexibilidad y adaptabilidad, así como la gran cantidad de módulos adicionales disponibles, hace que sea adecuado para realizar muchos tipos diferentes de sitio web.

El sitio principal de desarrollo y coordinación de Drupal es drupal.org en el que participan activamente varios miles de usuarios de todo el mundo. [Fte http://drupal.org.es/drupal]

Drupal Hispano

http://drupal.org.es/drupal

Como dice la definición anterior, Drupal es un sistema modular que proporciona inicialmente, las funcionalidades básicas de una web dinámica, gestión de usuarios y perfiles, contenidos, foros, internacionalización, menús,... Alrededor de esta base, la comunidad ha ido aportando módulos para cubrir sus necesidades.

Por otro lado, la apariencia de las páginas con Drupal se gestiona mediante la selección de un theme (conjunto de hojas de estilo, imágenes y scripts) que determinan la identidad de la web; (otra vez el paradigma de la separación de contenido y presentación). Pues bien, en el sitio oficial de Drupal existen actualmente 5309 módulos y 339 themes. Con estos números nuestra aproximación a Drupal ha sido un tanto medrosa. Empezamos con lo básico y hemos ido incorporando módulos poco a poco.

Modulos Drupal

E-Publish:
Permite gestionar la revista Serrablo
Webform:
Gestión de formularios, como el formulario de inscripción de socios.
Events:
Ubica una pagina en una fecha y muestra el calendario de eventos
GMap:
Nos permite utilizar Google Maps para situar localizaciones de Serrablo en un mapa.
Search
Faceted Search
Fantástico modulo que permite navegar por los conceptos relevantes de nuestras páginas, autor, fecha de publicación, temática, ...
XML Sitemap:
Ayuda a los motores de búsqueda a indexar el sitio web
Google Analitycs:
Proporciona estadísticas de uso de nuestra web.
Drake:
Permite integrar Drupal con una aplicación ad-hoc para el catalogo del Museo de Dibujo
FCKeditor:
Editor para entrada de contenidos sin necesidad de conocer html.
Otros módulos:
pathauto, Page Title, Meta tags, jQuery Update

Organización

Guía De Serrablo

Dado que la Guía de Serrablo (Jose Garcés Romeo) abarca todo lo realizado por la asociación, se tomo como punto de partida para establecer los enlaces principales seleccionando los apartados mas relevantes: Quienes somos?, Arte Mozárabe, Museo de Dibujo, Museo Etnológico y Rutas de Serrablo.

Para esto hemos utilizado el modulo book que permite enlazar y anidar paginas como si de capítulos y secciones de un libro se tratara.

Como es muy fácil editar las paginas, nos permite tener una Guía de Serrablo actualizada, ya que cualquier persona con los permisos adecuados, puede hacerlo.

Revista Serrablo

El modulo e-Publish nos permite organizar los números de la revista en ediciones sobre las que situar los artículos. Como el modelo es muy similar al real, es muy fácil hacerlo. Este módulo además facilita la presentación de los diferentes números de la revista.

En este apartado es importante señalar que hemos abordado la digitalización completa de la revista con el fin último de hacerla accesible a todo el mundo y de fácil consulta.

Esta trabajo se esta planteando en diferentes fases y esta previsto que esté completada a lo largo del primer semestre de 2009. Es un proceso manual y farragoso en su primera etapa, ya que precisa escaneado y edición de los textos de los artículos, labor que están llevando a cabo Noemí López Peco y Sara Ricart.

En una segunda etapa ya lo tenemos todo automatizado mediante herramientas y procesos informáticos; se convierten estos textos a html puro y se importan en contenidos en Drupal.

Otros

El margen de una página con los premios recibidos y otra con las publicaciones realizadas o participadas por la asociación, cabe resaltar el catálogo del Museo de Dibujo Julio Gavín – Castillo de Larrés.

Para este catálogo on-line se realizo una aplicación utilizando el framework de desarrollo CakePHP partiendo de una base de datos Access. En su día estábamos satisfechos porque al menos los fondos del museo se pueden consultar. Pero al ser una aplicación ad-hoc, la integración con Drupal hay que forzarla con el modulo puente Drake. Esta pendiente utilizar dos de los módulos mas poderosos de Drupal, Content Construction Kit (CCK) y Views, para hacer esta integración mas real y limpia.

Estadísticas y uso de la plataforma

Estadísticas de uso proporcionadas por Google AnalyticsComo se puede observar en el gráfico, las estadísticas de acceso son modestas. Con una media de 240 visitas por día con picos de 350 durante los últimos 30 días, el 83% de las visitas vienen de motores de búsqueda, el 12% de otras webs que nos enlazan y un 5% son tráfico directo.

Una de las ultimas tendencias de Internet, lo que han llamado la web 2.0, da al usuario mayor protagonismo (entre otros aspectos técnicos). En este sentido, en nuestra web es posible enviar comentarios en cualquier artículo, pero son escasos los comentarios recibidos. 20 socios nuevos se han dado de alta a través de la web durante este año, uno causo baja.

En cuanto a los contenidos, actualmente tenemos unas 1300 páginas y 150 autores.

Hacia donde vamos

Dadas las pobres estadísticas, da la sensación de que la plataforma esta infrautilizada. En alguna ocasión ha surgido la posibilidad de abrir un blog, pero seria necesario más personal para darle mayor dinamismo que dos o tres entradas mensuales. ¡Queda echa la invitación!

Objetivos

  • Completar la recuperación digital de la revista Serrablo.
  • Poner on-line los fondos de la biblioteca de la Asociación y la del Museo de Dibujo.
  • Aprovechar la plataforma para la gestión de socios, en lugar de hacerlo con una obsoleta aplicación vb, existen aplicaciones open source para esto. Por este lado hemos estado probando CiviCRM, pero la migración de datos es compleja y no hemos podido culminar nada.
  • Se está procediendo en la actualidad a la digitalización de todas las obras para actualizar el catalogo. Una vez realizada esta operación estaremos en condiciones de abordar el catalogo on-line, aprovechando la plataforma para gestionar y mostrar el catalogo del Museo de Dibujo en un único sitio.

Comentarios

Hay que ver lo que dan de

Hay que ver lo que dan de sí diez años. Sólo una sugerencia: Reemplazad Carencias por Objetivos y ya tenéis diez años más de visitas garantizadas.

Mucha suerte y enhorabuena.

Hecho. Gracias por la

Hecho. Gracias por la sugerencia Fernando.