Archive for the internet Category

En busca del método para la investigación documental web.

Posted in CIENCIA Y TECNOLOGÍA, comunidades virtuales, inteligencia colectiva, internet on agosto 23, 2012 by zewx

Por Alfonso Esparza C.

En el recorrido por el magnífico volumen de ensayos The Handbook of Internet Studies, editado en 2011 por Mia Consalvo y Charles Ess, trabajos como el de Niels Brügger “Web archiving: between past, present and future” cobran especial interés por su sistemática insistencia en la necesidad de un trabajo transdisciplinario que integre necesidades y experiencias en un modelo de trabajo creativo, en que tendrían un rol de primer orden las instituciones de preservación documental con programas y proyectos de documentación digital en proceso, para unificar iniciaivas, compartir experiencias, y evitar la duplicidad de funciones compatibles y factibles para ser compartidas, y sobre todo, no cometer errores de método que tienen un alto costo.

En el camino hacia la consolidación de las investigaciones de internet como objeto de estudio el ensayo de Brügger propone como punto de partida considerar al documento web como medio y como texto. La pregunta metodológica es si un nuevo tipo de documento debe ser tratado de una manera distinta de otros medios y textos. Para el autor la respuesta es afirmativa: en primer lugar porque se caracteriza por ser dinámico, efímero, cambiante, fundamentalmente diferente de los llamados medios masivos convencionales, a los que puede integrar en su contenido, y requiere nuevos métodos de investigación.

Estrategias de documentación web

Brügger  define sucintamente documentación web como cualquier forma deliberada y propositiva de preservar material publicado en ese medio, y distingue dos grandes géneros: micro y macro documentación. La pequeña escala emprendida por amateurs es micro archivar, a partir de necesidades de corto plazo, por una necesidad utilitaria para preservar un objeto de estudio en particular, como lo haría, por ejemplo,  un investigador o un estudiante al archivar los periódicos en versión digital en línea.

En contraste, macro archivar es un desarrollo de escala mayor que llevan a cabo instituciones con una especialización técnica y presupuesto a su disposición, con el fin de preservar materiales de interés para el patrimonio cultural en general. Aplica a grandes bibliotecas y museos que cuentan con equipo y software especializado.

El autor empieza por fijar un principio taxonómico para el material web, con dos características genéricas: es digital y se publica en internet. Puede clasificarse entonces como un subgrupo, por un lado un medio digital (junto con otros documentos electrónicos, consolas de juegos de computadora, CD-ROM/DVDs, etcétera) y por el otro lado, su existencia en internet, distribuido a través de una infraestructura de telecomunicaciones, mediante una serie de protocolos, hardware/software, etcétera que hacen posible una publicación con un sentido de transmisión, que está sucediendo simultáneamente en múltiples puntos.

En un análisis comprehensivo del material web como una unidad significante delimitada, se identifican cinco niveles analíticos, donde en un extremo se abarca todo el material que está presente en la red como un todo, y en el otro, la escala de un solo elemento, por ejemplo, una imagen o un hipervínculo en una página electrónica.

Una estratificación de cinco niveles el material a preservarse puede ser cualquier cosa desde la WWW como un todo a una “esfera web” a un sitio o un elemento en una página, siendo cada uno de estos cinco estratos un contexto mutuamente relacionado (WWW-esfera web- sitio web-página-web-elemento web).

Entre las diferentes capas del material documental una de las más importantes es la “esfera web”, conjunto de recursos digitales dinámicamente definidos distribuidos en múltiples sitios relacionados con un evento central, concepto o tema; el sitio web como unidad coherente de páginas, y una página electrónica individual.

El autor hace además una distinción entre material público y no-público, que resulta crítica en una investigación documental. En estas categorías se puede diferenciar según varias consideraciones:

1) Material no público o semi público: material documental mantenido en una intranet o sistema privado y que es accesible a un grupo reducido de personas; 2) material pre-público: bosquejos, diseños preliminares, versiones beta, borradores, dummies, etcétera; 3) material público que se ha publicado en otros medios como los impresos (periódicos, revistas, libros, bitácoras, etcétera) o se haya transmitido en estaciones convencionales de radio o televisión.

Especialmente en lo que respecta al periodo temprano de la historia de la WWW hay material preservado en medios no digitales, sin haber sido publicado pero que puede rastrearse desde la red almacenándose en otros medios, como los catálogos cinematográficos, entre muchos otros ejemplos.

Breve historia de la documentación web.

El simple acto de colocar un archivo de html en un servidor web conectado a internet para ser publicado, es ya de entrada una forma de preservación de un documento. La irrupción de la WWW en el mundo de los medios implicaba de entrada aunque con un alto componente arbitrario, la intención de preservar datos, documentos y archivos, hojas de cálculo, despliegues de pantalla, gráficas, etcétera, como respuesta a necesidades inmediatas. El quehacer académico documental no estaba animado entonces por una reflexión de lo realizado en el pasado ni se le consideraba como parte de un esfuerzo sistemático de salvaguardar los materiales de un patrimonio cultural digital.

Mucho de lo creado en esta primera fase está en poder de sus autores o desperdigado en internet, con varios ejemplos emblemáticos que ilustran esta circunstancia, como la primera pantalla web publicada por Tim Berners-Lee, en 1990, una reliquia extraviada.

Paradójicamente es este modelo amateur de documentación en la que se archiva gran parte de esa “prehistoria” de micro documentación que se suma a los documentos registrados en medios no digitales.

¿Bibliotecas estáticas de publicaciones digitales?

En el mismo periodo en que se documentaba de manera amateur por parte de individuos y pequeñas organizaciones, se fragua de manera concomitante un creciente profesionalismo e intenciones claramente formuladas de preservar la herencia cultural nacional publicada en internet.

El autor pone énfasis en la importancia de una innovación tecnológica toral en el desarrollo de la documentación web, los robots de búsqueda, que potencian las iniciativas de preservación documental.

Por ese entonces, a mediados de los noventa se formuló la idea de archivar virtualmente cualquier publicación de interés documental, sin importar su contenido o quién lo colocó en línea. Pero no sólo material similar a una publicación impresa, sino también el material dinámico multimedia.

Sin embargo, estas iniciativas emergen desde instituciones documentales como bibliotecas y hemerotecas, con criterios totalmente basados en la cultura de la biblioteconomía, al equiparar los documentos web con el material factible para ser impreso y encuadernado como los libros y los periódicos. Un ejemplo de esta aproximación es el Electronic Publications Pilot Project (EPPP) dirigido por la Biblioteca Nacional de Canadá en 1994, donde el criterio era seleccionar de todo documento web que tuviera la apariencia de publicación impresa, eran archivados y catalogados como tales, con los estándares convencionales de las bibliotecas públicas.

Más tarde esta misma institución los documentos en línea publicados en formatos como blogs y sitios web en general, son archivados con técnicas de selección y convenios de envíos de contenidos por parte de editores de publicaciones en internet relevantes para el archivo.

El Internet Archive fue creado en 1996 como organización no lucrativa, localizada en The Presidio, en San Francisco, Estados Unidos, con el propósito de preservar las colecciones históricas existentes en formato digital, y entre otros medios la web. Esta colección es construida con una estrategia de búsquedas en internet, subcontratada a una empresa privada, con criterios de vincular los datos y las estadísticas de rastreo de uso, es decir que se archiva lo que se vincula y lo que consumen los usuarios, de allí que la iniciativa sea transnacional de origen. La técnica de preservación empleada es la “instantánea” (snapshot), y cada ocho días es almacenado todo el material que se localiza mediante los buscadores con este método.

El Internet Archive dio inicio con un ejercicio bien delimitado, con la técnica basada en el evento, con las campañas presidenciales de 1996, en que se documentó todo lo vertido en los sitios web de los candidatos. Más allá de su “utilidad” estratégica, demostró la necesidad y potencial de la documentación web, en un momento en que su valor no era tan evidente.

Otros proyectos pioneros de preservación documental web es Kulturaw3, iniciado por la Real Biblioteca de Suecia, cuyo objetivo fundamental sería archivar todo lo relativo a este país y su cultura. Fue lanzado en 1996 con una primera cosecha documental en 1997, con la técnica de “instantánea”.

El archivo Pandora creado ese mismo año por la Biblioteca Nacional de Australia, con la técnica de selección con el enfoque de preservar “significativos sitios web de Australia y publicaciones en línea basadas en web”. Un limitado conjunto de sitios son seleccionados, archivados y catalogados, siendo una de las primeras iniciativas inspiradas en las colecciones de biblioteca, como el proyecto canadiense EPPP.

El Archivo Danés de Internet Netarchive.dk es una estrategia compartida entre la Biblioteca Universitaria del Estado y la Real Biblioteca, creado en 2005, luego de reformarse el fundamento constitucional.

En 2003 once de las más grandes bibliotecas nacionales de EE.UU. y el Internet Archive unieron fuerzas en la creación del Consorcio Internacional de Preservación de Internet. En 2004 el European Archive fue creado basado en la asociación entre bibliotecas, museos y otros órganos de preservación documental, que ha desarrollado desde entonces un circuito de conocimiento de las más recientes experiencias en la materia.

Una metodología dinámica, siempre subjetiva

El autor argumenta que una característica distintiva de archivar material publicado en web, independientemente de la estrategia del proceso, es una reconstrucción dinámicamente creada, la cadena de decisiones y criterios, incluso antes del arranque desde el URL de inicio, la selección entre las distintas estrategias y formas de archivar, en general y en detalle, implica que el documento archivado está basado en una decisión estrictamente subjetiva, por un individuo o institución.

Cuándo y desde dónde iniciar la selección y la ruta de búsqueda, y si serán incluidos o excluidos tipos específicos de archivos (imágenes, sonidos, flash, registro de chat o videoconferencia, hipervínculos activos, etcétera); si el material será recolectado de otros servidores, cómo será preservado este material; si será desde una perspectiva empírica y muy selectiva, o una planificada, de largo plazo, de escala regional, nacional o transnacional.

Aunque la problemática es la punta de un iceberg, se suma un elemento no menos relevante, que es el carácter cambiante y no estático del material que circula en la web, porque incluso los periódicos en línea con formato web podrían modificar sustancialmente o quitar de circulación un documento, y quedar disponible en versiones en cache o textos fantasmas del original, además de las deficiencias inherentes a la deliberada omisión en el proceso de selección. Hay sin embargo otras dos severas fuentes de error: las relacionadas con el tiempo, y los generados por problemas tecnológicos durante el proceso de documentar-archivar.

También destaca Brügger que el documento web está en riesgo de ser sujeto de la siguiente paradójica doble inconsistencia: por un lado el archivo no es exactamente como estaba realmente publicado originalmente en internet, porque en el proceso de guardar siempre se pierde algo. Por el otro lado, el archivo puede ser exactamente como nunca fue, porque siempre se obtiene algo diferente, siendo una gran paradoja que el documento preservado nunca es como la web “en vivo”, ya que el texto escrito, imágenes/gráficos, sonidos, imágenes dinámicas podrían faltar o algunas de las posibilidades de interactividad podrían no ser funcionales en la versión archivada.

Versiones de las versiones…

El proceso de archivar, en última instancia crea una versión única, pero no una copia del documento originalmente publicado, de lo cual se coligen dos consecuencias: se ha soslayado la relevancia de que un mismo sitio web “guardado” en distintos archivos en idéntica fecha y hora, difiere sustancialmente uno de otro.

La segunda consecuencia es que un documento nunca es la versión de un original y no se puede esperar encontrarlo en la forma en que fue publicado; tampoco se puede encontrar el original entre las distintas versiones, ni se puede reconstruir a partir de éstas.

La labor de los académicos especializados llevaría a un punto cercano a la crítica del texto, según la filología de manuscritos, en tanto que se trabajaría con versiones de un documento, en que las variantes son comparadas entre sí, en ausencia de algún original “autorizado” disponible. De allí que algunos de los métodos de la filología clásica del texto probablemente son relevantes para lo que Brügger y sus colegas llaman “filología web”, aunque es preciso, subraya, que debe ser analizado con la especificidad del material de medios incorporados en el documento web.

Al ahondar en el análisis el autor despliega una serie de características únicas a tomar en cuenta en el proceso de documentación:

–        Es un texto de varias capas, en el sentido de que puede ser examinado en niveles que se extienden desde el texto inmediatamente percibido (las unidades significantes que se ven y escuchan), hasta la variedad de elementos textuales subyacentes que no son percibidos de manea inmediata (el código fuente: HTML, XML, etcétera), así como las capas de la comunicación por internet (los modelos de protocolo TCP/IP, OSI o similar).

–        La escritura digital hace posible que el documento web archivado pueda ser continuamente re-escrito, en un sentido distinto al empleado tradicionalmente en los manuscritos, ya que la continua reescritura se da mayormente después de que el texto fue archivado, e incluso, en la perspectiva de una preservación documental de largo plazo, “migrar” a otros formatos.

–        La escritura digital permite en muchos casos comparar documentos archivados automáticamente.

–        Versiones idénticas del mismo material pueden existir en distintos archivos, muchas veces en sitios web pequeños y poco complicados, rara vez actualizados.

El futuro de la archivonomía web

Resulta imperativo el trabajo transdisciplinario entre las instituciones con iniciativas de preservación documental web y las comunidades de investigación de internet y establecer mecanismos de cooperación que no han sido aún establecidos.

La colaboración puede basarse en una variedad de formas, siendo tres las más obvias:

–        Las colaboraciones pueden se integradas en el día a día del quehacer académico en las operaciones del archivo web, por ejemplo al asociar al proyecto a un consejo asesor en que participen investigadores de internet y otros usuarios.

–        La colaboración puede ser ocasional, con relación a proyectos de investigación específicos o tareas concretas de archivar, por ejemplo, con investigadores que ya cooperan con instituciones que realizan programas de preservación documental web, en la planeación del proyecto de archivo, y no después de que se ha avanzado.

–        Estos dos tipos de colaboraciones pueden tener lugar en una escala global, con relación a proyectos transnacionales de investigación.

En lo que toca a la interacción entre los archivos y los investigadores se presentan tres desafíos que deben ser mencionados, advierte Brügger:

1) Debe ser iniciado un rastreo y preservación dirigidos de material heterogéneo que no ha sido hecho público, posiblemente con otros institutos dedicados a la preservación patrimonial como los museos.

2) Las instituciones dedicadas a la preservación documental web deben empezar a experimentar de manera más sistemática con las otras dos formas de archivo en la red: captura de pantallas y la entrega-distribución de material. Ambas tareas tienen la perspectiva de preservar tanto material como sea posible del patrimonio cultural de relevancia histórica y antropológica.

3) Las discusiones deben ser iniciadas de acuerdo con los alcances del software analítico utilizado en la web en vivo, que puedan ser aplicados al material archivado, teniendo en cuenta la composición específica de cada componente.

Finalmente, no menos trascendental es que la comunidad de investigadores de internet confronte a la brevedad el desafío de difundir el conocimiento sobre registro documental web tanto entre las otras disciplinas de las ciencias y humanidades (ciencia política, sociología, lingüística, literatura, artes, comunicación, historia, etcétera), tan sólo porque desde hace algunos años internet ha sido una parte integral de la infraestructura de comunicación de nuestras sociedades y el pensamiento contemporáneo.

Anuncios

Hacia una filología en los estudios documentales en la web / primera parte

Posted in CIENCIA Y TECNOLOGÍA, comunidades virtuales, internet on julio 10, 2012 by zewx

Por Alfonso Esparza

En el curso de una investigación de más largo aliento sobre los usos sociales de las telecomunicaciones en los últimos 30 años, la revisión de las fuentes arrojó una evidencia empírica que después comprobé: los estudios mismos de los medios electrónicos en red han cambiado, y como otras disciplinas han encontrado legitimidad en la sistematización de los modelos de análisis del objeto de estudio. En la lectura de materiales diversos, obtenidos de internet, algunos que datan de mediados y fines de los años 90 y otros tan recientes como el año 2011, me encontré con la serie de manuales de comunicación y medios de Wiley-Blackwell, con un grueso volumen: The handbook of internet Studies, editado por Mia Consalvo y Charles Ess, publicado en 2011.

Sus casi quinientas páginas no tienen el menor desperdicio, reúnen una familia de ensayos imprescindibles para entender este objeto de estudio que cambia “en tiempo real”, híbrido por excelencia, que se ha acomodado a la impronta de “nuevo medio”, aunque toma elementos de algunos tan antiguos como la escritura, y hoy tan comunes como la telefonía o la radio, que después del asombro casi mágico de los primeros días, en pocas décadas se integran a la vida social, transformándola en el camino.

La forma en que se almacena y distribuye la información en Internet y cómo impacta la vida de las personas, son los ejes de atención para la mayoría de especialistas de este volumen, muchos de los con más de 30 años de experiencia en las tecnologías digitales.

Esta lectura me llevó en un vuelo rasante por mi propia experiencia, a partir de 1996 con la incursión en el uso, publicación y desarrollo de contenido semillero de comunidades virtuales con las herramientas disponibles en Internet. Estaba ante el nacimiento de la web, encontré sentido en una visión de perspectiva sobre la importancia del conocimiento que empezaba a circular, de manera libre y desordenada, con un potencial sumamente pretencioso como plataforma multimedio de publicación global.

La lectura de estas dos piezas abrieron esa óptica, que ahora considero una asignatura indispensable para los académicos cuyo objeto de estudio es internet, explica que en la organización del conocimiento que se publica y circula en Internet desde hace por lo menos 25 años, hasta hace muy poco concitó el interés de preservación y la organización óptima de estos materiales, con lo cual se abren las puertas a una aventura problemática de gran envergadura, dentro de la cual se apetece una buena revisada.

Antes y después de internet

La lectura de estos dos ensayos y sopesar el contenido del grueso volumen por abordar, remite a la importancia del planteamiento transdisciplinario para la preservación del acervo digital en web en nuestro idioma (por no mencionar la tarea no menos importante de las leguas indígenas), habida cuenta de la compleja problemática metodológica y conceptual de la archivonomía para el multimedio digital en web, con un interesante e indispensable debate en la definición de lo que es un documento web, sus componentes, y metodologías para ser archivado, consultado por el público en general y los especialistas, investigadores y comunidades académicas en particular, en la medida en que incide, como efecto mariposa, desde el trabajo de gabinete de rastreo y registro de fuentes, hasta las grandes políticas nacionales de preservación patrimonial.

Es una problemática múltiple, que de entrada presenta un diferenciador paradigmático del documento web: el “efecto streaming” o del famoso “tiempo real”, es decir, la web “en vivo”, cambiante, que se metamorfosea a cada momento, y que en cada vez mayor proporción es un componente de información “volátil”, un flujo flotante en la comunicación binaria inscrita en la dinámica de chats, comunidades virtuales, weblogs, redes sociales, y por otro lado. No menos complicada resulta la estimación de la parte del conocimiento almacenada en sistemas cerrados o parcialmente restringidos, en ambientes de servicios propietarios (correos electrónicos, mensajeros instantáneos, e intranets, etcétera), que serían dos puntas de un iceberg que apenas se empieza a dimensionarse con una visión transdisciplinaria de largo plazo.

En el año 94 del siglo pasado se editó el primer mensaje en hipertexto que se hizo público en Internet, y con ello, su autor, Tim Berners-Lee, dio nacimiento a la WWW, y en ese momento y en los siguientes diez años, los usuarios de esta tecnología, principalmente académicos, no consideraron un plan consistente ni pudieron en marcha metodologías adecuadas para archivar y organizar la información con fines de preservarla como documentos historiográficos de este conocimiento generado en la incipiente era de la web, como en su momento se emprendió la organización de materiales en otros formatos electrónicos predigitales como audio y video en distintos formatos de cinta analógica, almacenados y organizados en la forma de videotecas y fonotecas, con metodologías muy semejantes a la de todo acervo documental.

Bajo el espíritu libertario y autónomo con que se gestó internet, se plantearon estándares de arquitectura topológica y protocolos necesarios para la comunicación mediada por computadora (TCP/IP y HTML, entre otros) y la necesidad de estandarizar los códigos y lenguajes en el rico despliegue visual de contenidos, típico de la web, una tarea admirable que continúa sin descanso, y con la activísima participación del mismo Berners-Lee. Sin embargo, los documentos y en general el conocimiento vertido en publicaciones en línea, la mayor parte único, se dejó al libre albedrío de individuos y organizaciones, con un criterio que no iba más allá de la metáfora visual de las “carpetitas” aportado por los sistemas de cómputo personal comerciales, Windows y MAC, sin otro destino que otra carpeta en algún servidor, y la arquitectura designada por ingenieros y web masters.

Pero sería equivocado pensar que no había interés e iniciativas muy importantes para archivar y preservar materiales producidos en la WWW, al contrario, se optó por un método bastante laborioso y manual en gran parte, la única manera que se entendía y que se hizo incluso hasta la era del CD-ROM, y se hace con el DVD, exactamente como las cinematecas y videotecas, incluso los discos duros, embodegarlos como las viejas bibliotecas y hemerotecas. Los documentos en web se archivaron recurriendo a la impresión en papel, para llenar carpetas, estas sí físicas, y metros y metros cuadrados de espacio en bodegas. Pero al pasar el tiempo, una parte importante de ese material, ya no está disponible en la misma web, cambió de ubicación o fue modificado, además de no ser copia fiel del original, sino una versión entre muchas, pero además siendo prácticamente imposible imprimir los elementos dinámicos del contenido, porque se adoptan criterios como por ejemplo, eliminar deliberadamente ciertos componentes como algunas imágenes, para “economizar”. Sencillamente se excluye la parte dinámica de la web, y con la Web 2.0 esta problemática se potencia de manera sustantiva.

Historia de la documentación web

Hasta hace unos años se emprendieron esfuerzos consistentes para cubrir esta deficiencia, y tanto los principales usuarios de estas bases de datos, la comunidad académica, y las instituciones, han emprendido incluso programas nacionales para la preservación de archivos en formato web, considerados como indispensables bajo el amparo de una política pública de patrimonio cultural, pero siempre con criterios heterogéneos, al libre albedrío o necesidades de los involucrados en los proyectos específicos.

El problema es complicado de resolver, aun con las herramientas hoy a disposición de cualquiera, porque con un ejemplo muy sencillo, que propone Brügger en su ensayo, ante la necesidad de “archivar/guardar” la edición completa de un periódico o cualquier publicación electrónica en línea de una fecha determinada, se puede hacer con herramientas de grabación “en vivo”, pero precisamente por esa condición, cuando se termine de guardar o grabar en directo, a una velocidad aceptable de ancho de banda, que tardaría un par de horas, al concluir se tendría una versión distinta de la que está en línea al término del proceso, que cambió en ese breve lapso de tiempo, en un grado que hace altamente inestable el resultado. Y aquí es donde vale la pena recurrir a las reflexiones de estos autores.

El ensayo de Barry Wellman es una visión histórica muy concisa de los estudios de internet, en pocas páginas devela tres fases: la “prehistoria”, la era de los expertos, marcada por el desarrollo de herramientas de groupware; la era del nacimiento de la WWW, los motores de búsqueda y el crecimiento de la población usuaria; y una la era del análisis y las políticas de preservación documental de internet.

Cita dos antecedentes míticos: el profético Network nation, en 1978, de Roxanne Hiltz y Murray Turoff, que vinculaba las ciencias sociales con las comunicaciones computarizadas, cuando no existía la palabra “internet”.  Hasta los primeros años de la década de los 90 este desarrollo y usufructo del mismo era privativo de los grupos de científicos en informática, que diseñaban y compartían herramientas bajo la familia de groupware, con las hojas y aplicaciones donde reinaba el modelo Lotus, y el conocimiento se generaba y se quedaba en los laboratorios, como compendia otro hito bibliográfico de esta “prehistoria”: Connections, de Sara Kiesler. El esplendor de este momento llegó a su punto máximo con las herramientas de telepresencia. Todo estaba listo para el despliegue social de internet con su glamorosa hija, la web.

En lo que Wellman llama la primera era de los estudios de internet, el desarrollo y “personalidad” de la red era determinada por los eruditos, muchos menores de treinta años, que decidieron ir más allá de compartir entretenidas piezas de groupware, al darse cuenta que la comunicación mediada por computadoras aportaba una conectividad sin igual. Sin embargo, nuestro autor cuestiona la visión aislada que llama “parroquiana” y utópica, al pensar que lo que sucedía en internet sólo era valioso para el medio mismo, al que se daba una categoría de transformación profunda, igualitaria, democratizadora y global, sin considerar las asimetrías geopolíticas en la adopción de estas herramientas y las diferencias de poder y estatus que pueden condicionar la interacción online.

En esta etapa entra en escena los distopianos, posmodernos próceres del ludismo que consideraban este nuevo medio deshumanizante y pernicioso, que podría sustituir las relaciones humanas. Ni panacea ni caja de Pandora, porque lejos de que las simples interacciones equivalgan a una comunidad, como muchos “twitteros” y “facebookeros” pregonan, y lejos de ser una maldición, como querían los apocalípticos, y para Wellman es innegable que internet es “una red social basada en computadoras, de hecho el componente más amplio del mundo, una red en la cual todos los puntos se conectan, directa indirectamente”.

Escribe que la segunda era de los estudios de internet empieza alrededor de 1998 cuando entidades gubernamentales, intereses comerciales y académicos apetecieron registros sistemáticos de lo que se publicaba en internet, pero esta euforia, se frenó como un coitus interruptus de los especuladores bursátiles que pregonaban una “nueva realidad”: primero el espantajo del Y2K y después con la burbuja de las empresas “punto com” en el 2000. Menciona un curioso efecto de este desplome económico y psicológico, con el impacto en la revista Wired, una especie de biblia exaltada del iluminismo tecnológico, con McLuhan como santón, que pasó de tener 240 páginas en 1996, que se redujeron a 180 en septiembre de 2001 para llegar a las 148 páginas  en septiembre de 2003, convirtiéndose en una publicación estilo mecánica popular del internet.

Sin embargo había dos elementos salvavidas para la explosión de la burbuja con la caída estrepitosa del NASDAQ (índice de cotizaciones de empresa tecnológicas que se creía lideraría la “nueva economía” de una “nueva sociedad”), tanto la guerra de navegadores Netscape vs. Explorer, que a la larga benefició la experiencia del usuario, y el desarrollo y refinamiento de los motores de búsqueda, primero entre muchos otros, Altavista, Lycos, Yahoo y el gigante Google, verdaderos motores de expansión y aprendizaje para mejorar, madurar y anidar en las nacientes comunidades virtuales y amasar el futuro fenómeno de YouTube, Blogger, Facebook, Twitter, entre decenas de competidores y emuladores, y una familia de miles de aplicaciones multiplicándose, configuradas para que el uso mejore la herramienta (dejamos para otra ocasión el debate sobre el software libre).

La tercera etapa de los estudios de internet, montada en este crecimiento exponencial, al grado de que se sustituye “naturalmente” en el camino comunidades virtuales por redes sociales y cibernautas por usuarios, a secas, como los ferrocarriles, la energía eléctrica, las carreteras, el teléfono, el uso del espectro radioeléctrico, y la convergencia digital, el hipermedio en la nube de la banda ancha. Estamos en el umbral de una conciencia clara sobre la necesidad de documentación y análisis, y la construcción de las herramientas conceptuales, metodológicas y técnicas, ante un medio único en su tipo, cuya característica es la volatilidad mutable.

Quedaba claro, sin embargo, que no se trataba de una nueva realidad o una nueva sociedad, sino de una herramienta poderosa que cambiaría para siempre la forma en que las personas se comunican y obtienen información y conocimiento, pero también lo producen y lo circulan en redes planetarias: 2 mil 267 millones 233 mil 742 de personas con acceso a internet (Internet World Stats (IWS) http://www.internetworldstats.com/ 31 de diciembre de 2011).

Llegó el momento de la documentación y el análisis, de los programas y las iniciativas, las políticas públicas nacionales, las grandes universidades y centros documentales emblemáticos.

Es aquí donde Niels Brügger explica con fino detalle la historiografía de los estudios de la archivonomía web: quien pone la mira analítica en el corazón del debate sobre el quehacer del investigador social en internet: la web documentada se discute básicamente como un medio y como texto, y se plantea dos preguntas nodales: si el documento web archivado es un nuevo tipo de documento, y si la respuesta es afirmativa: ¿debe este documento ser tratado en forma diferente cuado se usa como objeto de estudio?

En una segunda parte abordaremos este interesante estudio de Brügger, en que revisa la muy fresca historia de la archivonomía micro y macro de la web, las diferentes estrategias de archivo de documentos web, con ejemplos emblemáticos, y lo más importante de su ensayo, por un lado la visión filológica en el estudio y uso de documentos publicados en este medio, y el carácter específico de texto multicapas, sus propuestas de reglas y principios, con un enfoque eminentemente transdisciplinario.