person:brewster kahle

  • BBC - Future - Why there’s so little left of the early internet
    http://www.bbc.com/future/story/20190401-why-theres-so-little-left-of-the-early-internet

    Tew, who now runs the meditation and mindfulness app Calm, indeed became a millionaire. But the homepage he created has also become something else: a living museum to an earlier internet era. Fifteen years may not seem a long time, but in terms of the internet it is like a geological age. Some 40% of the links on the Million Pixel Homepage now link to dead sites. Many of the others now point to entirely new domains, their original URL sold to new owners.

    The Million Dollar Homepage shows that the decay of this early period of the internet is almost invisible. In the offline world, the closing of, say, a local newspaper is often widely reported. But online sites die, often without fanfare, and the first inkling you may have that they are no longer there is when you click on a link to be met with a blank page.

    You could, quite reasonably, assume that if I ever needed to show proof of my time there it would only be a Google search away. But you’d be wrong. In April 2013, AOL abruptly closed down all its music sites – and the collective work of dozens of editors and hundreds of contributors over many years. Little of it remains, aside from a handful of articles saved by the Internet Archive, a San Francisco-based non-profit foundation set up in the late 1990s by computer engineer Brewster Kahle.

    It is the most prominent of a clutch of organisations around the world trying to rescue some of the last vestiges of the first decade of humanity’s internet presence before it disappears completely.

    Dame Wendy Hall, the executive director of the Web Science Institute at the University of Southampton, is unequivocal about the archive’s work: “If it wasn’t for them we wouldn’t have any” of the early material, she says. “If Brewster Kahle hadn’t set up the Internet Archive and started saving things – without waiting for anyone’s permission – we’d have lost everything.”

    One major problem with trying to archive the internet is that it never sits still. Every minute – every second – more photos, blog posts, videos, news stories and comments are added to the pile. While digital storage has fallen drastically in price, archiving all this material still costs money. “Who’s going to pay for it?” asks Dame Wendy. “We produce so much more material than we used to.”

    “The Internet Archive first started archives pages in 1996. That’s five years after the first webpages were set up. There’s nothing from that era that was ever copied from the live web.” Even the first web page set up in 1991 no longer exists; the page you can view on the World Wide Web Consortium is a copy made a year later.

    “I think there’s been very low level of awareness that anything is missing,” Webber says. “The digital world is very ephemeral, we look at our phones, the stuff on it changes and we don’t really think about it. But now people are becoming more aware of how much we might be losing.”

    We consider the material we post onto social networks as something that will always be there, just a click of a keyboard away. But the recent loss of some 12 years of music and photos on the pioneering social site MySpace – once the most popular website in the US – shows that even material stored on the biggest of sites may not be safe.

    #Archive #Web_archive #Brewster_Kahle #Internet_Archive

  • Pour conserver la mémoire du web, Internet Archive durcit ses méthodes
    par Julien Lausson pour numerama le 25 avril 2017
    https://www.numerama.com/tech/252324-pour-conserver-la-memoire-du-web-internet-archive-durcit-ses-method

    Depuis plus de vingt ans maintenant, la fondation américaine Internet Archive poursuit une mission démesurée : explorer et mémoriser le web afin de « permettre à tous d’accéder au savoir, gratuitement et pour toujours ». Ainsi, chaque semaine, elle enregistre 300 millions de nouvelles pages dans sa base de données, de façon à ce que chacun puisse les consulter ultérieurement.

    Mais pour la fondation américaine, il y a un problème. Et ce souci s’appelle robots.txt. « Les fichiers robots.txt ont été inventés il y a plus de 20 ans afin d’aider les ‘robots’, surtout ceux des moteurs de recherche, à savoir quelles sont les sections d’un site web qui devraient être explorées et indexées pour la recherche », explique Internet Archive. Or, ce petit fichier baptisé robots.txt entrave le bon fonctionnement de son projet.

    Pour Internet Archive, la question d’un changement complet de philosophie se pose. L’archivage du web ne doit plus se faire en tenant compte des déclarations des fichiers robots.txt qui s’adressent avant tout aux moteurs de recherche. Il doit se faire en prenant en compte le point de vue de l’utilisateur, de façon à lui montrer le web tel qu’il est aujourd’hui. Et tel qu’il était autrefois.

    #WWW #Web #Tech #mémoire #archivage #référencement https://archive.org

    • Les archives de l’Internet accusées de diffusion pirate par des auteurs
      par Antoine Oury pour actualitte le 29 janvier 2018

      Archive.org, l’Internet Archive, est sans aucun doute l’un des sites les plus précieux d’internet : pour les chercheurs dans de nombreux domaines, il est carrément incontournable. Depuis les années 1990, cette plateforme archive les pages web, mais rassemble aussi les collections numérisées de plusieurs bibliothèques, surtout américaines. L’Open Library, un site satellite qui propose des livres numériques sous droit, souvent indisponibles, en prêt, est désormais attaquée par des auteurs qui lui reprochent une diffusion pirate de livres numériques.

      Néanmoins, la plateforme a donné son point de vue à travers un texte signé par Brewster Kahle, un des fondateurs de l’Open Library. Dans ce post https://blog.archive.org/2018/01/24/digital-books-on-archive-org, Kahle explique qu’une grande partie des ouvrages des bibliothèques, qui participent activement à l’Open Library, datent d’avant 1923, ce qui signifie qu’ils sont dans le domaine public. Pour le reste, certains ouvrages sont présents à des fins d’accessibilités, numérisés et traités par le consortium Daisy pour les publics empêchés de lire. Certes, quelques ouvrages publiés entre 1923 et 1961 sont aussi présents dans l’Open Library, mais cela ferait suite à une autorisation spéciale qui s’appliquerait aux livres indisponibles.

      Pour le reste, Kahle assure de la bonne volonté de l’Open Library, et confirme qu’il est possible de faire retirer un titre contrevenant avec un simple message. Sauf que la page d’accueil de l’Open Library fait bel et bien apparaitre des titres visiblement encore sous droits...

      En somme, la vie juridiquement très mouvementée de l’Internet Archive et de l’Open Library risque encore de connaître quelques soubresauts... Certes, Internet Archive est reconnu comme une bibliothèque par certaines juridictions aux États-Unis et pourrait peut-être prétendre au fair use, cette exception au copyright à des fins d’éducation et de préservation du patrimoine, mais rien n’est moins sûr.

      https://www.actualitte.com/article/patrimoine-education/les-archives-de-l-internet-accusees-de-diffusion-pirate-par-des-auteurs/87020

      #Patrimoine #éducation #archivage vs #piratage #open_librairie #Fair_Use https://archive.org

  • Living Books About History
    https://livingbooksabouthistory.ch/fr/book/histories-of-the-internet-and-the-web

    Sélection d’articles historiques sur internet par Valérie Schafer et Alexandre Serres

    Il y a tout juste cinquante ans, en 1966, Charles Herzfeld débloquait à l’Advanced Research Projects Agency les financements qui permettront au département de l’IPTO (Information Processing Techniques Office) de lancer le projet Arpanet ; il y a vingt-cinq ans, en 1991, le Britannique Tim Berners-Lee annonçait en ligne, dans les Newsgroups, espaces de discussion de la communauté Usenet1, l’invention du Web ; il y a vingt ans, en 1996, Brewster Kahle créait Internet Archive, fondation qui se donnait alors pour mission d’archiver le Web mondial... Récente, l’histoire d’Internet est tournée vers un objet en mouvement permanent, ni clos, ni stabilisé2. Elle est également confrontée à la mémoire vivante de ses acteurs, au regard que porte son époque sur cette innovation, qui incarne pour beaucoup la « révolution numérique », et aux définitions plus ou moins larges de son périmètre.

    Afin de ne pas discriminer entre plusieurs acceptions et approches de l’Internet et de son histoire, cette anthologie rend compte d’une variété de tendances historiographiques et de travaux. Certains prennent étroitement pour cadre d’étude le réseau des réseaux et ses aspects protocolaires. D’autres proposent une analyse plus large des cultures numériques. Les acteurs techniques, mais aussi les visionnaires des premiers temps sont à l’honneur, notamment dans les sources rassemblées dans la première partie de ce Living Book. Mais, les suivantes font également place à des aspects économiques, sociaux et politiques, pour ne pas adopter une approche exclusivement technicienne et internaliste de cette histoire. En effet, les acteurs qui ont fait l’histoire d’Internet ne sont pas seulement ceux qui en ont conçu l’architecture technique et que célèbre l’Internet Hall of Fame de l’Internet Society, même si leur rôle a été décisif et fondateur (voir le texte de Leiner, Cerf et al.). Contribuent aussi à cette histoire ceux qui, par leur vision éclectique, décalée, politisée, engagée, en ont forgé les imaginaires et cultures, à l’instar de John Perry Barlow et de sa retentissante déclaration d’indépendance du Cyberespace en 1996. Des travaux, notamment ceux d’Eric von Hippel3, ont mis en valeur l’idée que les innovations et usages numériques sont le produit d’une co-construction et ne peuvent être appréhendés selon une vision purement descendante (top/down). Les utilisateurs sont également des acteurs à part entière de cette histoire. Ce sont ceux des premiers temps, puis les early adopters confrontés dans les années 1990 à l’arrivée des néophytes sur les réseaux qu’ils ont contribué à développer (voir le texte de Nicolas Auray)4. Ce sont enfin ceux qui découvrent la Toile, créant leurs pages personnelles (article d’Olivier Trédan), consultant les annuaires (texte de Tom Haigh) ou s’appropriant des cultures numériques spécifiques (article de Jason Eppink).

    #Histoire_numérique #Valérie_Schafer #Alexandre_Serres #Histoire_internet

    • avec un certain @stephane dedans : )

      Quand peut-on dire que le Web arrive en France, selon vous ?

      Valérie Schafer : L’Isoc France (Internet society) considérait 1996 comme l’an I du Web, car on assiste à une croissance des noms de domaines. C’est aussi l’année de lancement de Wanadoo par France Télécom, celle des premiers procès aussi contre les FAI ; 1996 est vraiment une année clé, et c’est celle des premières archives du Web par la Fondation Internet Archive et Brewster Kahle. Mais il y a, bien sûr, une histoire de l’internet en amont en France, et également une histoire du Web. C’est par exemple en 1994 que Stéphane Bortzmeyer, alors au CNAM (Conservatoire national des arts et métiers), crée un site dédié à l’Armada de la liberté, une exposition de bateaux.

  • #ARCHIVAGE – Une #bibliothèque_digitale préserve le contenu à durée de vie déterminée du Web | Big Browser
    http://bigbrowser.blog.lemonde.fr/2013/03/01/archivage-une-bibliotheque-digitale-preserve-le-contenu-a-du

    La première partie donne la parole à Brewster Kahle, fondateur d’Internet Archive, un projet à but non lucratif qui travaille depuis 1996 à permettre un accès universel à toutes les données existantes (sons, vidéo, textes, logiciels et pages web), par tout le monde. Aujourd’hui, la plus grande bibliothèque digitale du monde, a ses locaux à San Francisco, dans une ancienne église dont l’intérieur a été recyclé mais quasiment pas réaménagé.

    La page Wayback Machine présentée dans le documentaire est un exemple de l’ampleur du travail réalisé par l’équipe depuis vingt ans. Il s’agit d’un outil permettant de surfer sur le Web « tel qu’il était avant » comme l’explique M. Kahle. Consulté par 500 000 personnes par jours, Wayback permet de visualiser des pages de tous les sites internet archivées au minimum tous les deux mois.

    Le Monde.fr est par exemple archivé (puisque tous les sites y sont), il est donc possible de consulter, entre autres, la une du site du 19 octobre 1996, du 27 juin 2001 ou du 27 mars 2009. Un voyage pour le moins fascinant.

    Le bibliothécaire digital explique l’importance d’archiver le Web car malgré son caractère infini, chaque donnée qui y figure a une durée de vie. Les serveurs d’Internet Archive stockent en ce moment 10 petabytes de contenu, soit 1 000 terabytes.

    Brewster Kahle ajoute qu’il existe deux copies partielles de la bibliothèque virtuelle afin de garantir sa préservation et éviter que se reproduise l’épisode de l’incendie de la bibliothèque d’Alexandrie, quand l’intégralité de son précieux contenu est partie en fumée. Une partie d’Internet Archive se trouve donc dans... la nouvelle bibliothèque d’Alexandrie et une autre à Amsterdam.

    http://vimeo.com/59207751#at=0

  • Internet Archive Starts Seeding 1,398,875 Torrents | TorrentFreak
    http://torrentfreak.com/internet-archive-starts-seeding-1398635-torrents-120807

    The Internet Archive has just enriched the BitTorrent ecosystem with well over a million torrent files, and that’s just the start of “universal access to all knowledge.” The torrents link to almost a petabyte of data and all files are being seeded by the Archive’s servers. Founder Brewster Kahle told TorrentFreak that turning BitTorrent into a distributed preservation system for the Internet is the next step.

  • Brewster Kahle, Internet Archive : “Le meilleur du web est déjà perdu” (InternetActu)
    http://www.internetactu.net/2011/06/28/brewster-kahle-internet-archive-le-meilleur-du-web-est-deja-perdu

    On essaie de construire la bibliothèque d’Alexandrie, 2e version. La première version avait deux limites que l’on voudrait éviter cette fois-ci : d’abord, pour consulter, on devait se déplacer à Alexandrie, merveilleux centre de la connaissance du monde ancien. A présent nous voulons rendre cette connaissance accessible à tous, qu’il s’agisse d’un enfant kenyan – ou français – qui s’intéresserait aux mathématiques et voudrait accéder d’où il veut, quand il veut, aux conférences de la Sorbonne ou de Harvard. C’est un projet gigantesque… je ne pense pas qu’il y ait un risque de saturation.
    L’autre limite bien connue de la bibliothèque d’Alexandrie, hé bien c’est d’avoir… brulé. (...)

    • « Je suis très inquiet de l’oubli du passé. Plus exactement, il ne sera pas oublié, il sera juste insignifiant. Dans les bibliothèques du futur, nos enfants apprendront uniquement avec ce qui est a portée de leurs doigts ; notre mission, en tant qu’adultes, c’est d’y mettre le meilleur ; aujourd’hui ils apprennent avec internet, mais il ne contient pas le meilleur : pour le mettre entre les mains de nos enfants, il faut le numériser. Il y a bien des choses qui s’opposent à cette tentative : de vieilles idées pour la plupart, comme le copyright, qui ont besoin d’être actualisées, de telle façon que les gens soient payés, certes, mais payés en fonction de cette nouvelle conception de l’accès ; sinon les œuvres finissent par disparaître. »

      <3

  • Brewster Kahle, Internet Archive : “Le meilleur du web est déjà perdu”

    http://www.internetactu.net/2011/06/28/brewster-kahle-internet-archive-le-meilleur-du-web-est-deja-perdu

    Retranscription d’un entretien pour l’émission Place de la Toile. Sur l’archivage d’internet, l’oubli, la mémoire, la nécessité de standards ouverts, la mise en ligne de livres tombés dans le domaine public, les droits de copie...

  • The Technium : When Hard Books Disappear
    http://www.kk.org/thetechnium/archives/2011/06/when_hard_books.php

    à propos de l’Internet Archive de Brewster Kahle - qui stocke aussi des livres physiques dans des containers spéciaux :

    A prudent society keeps at least one specimen of all it makes, forever. It still amazes me that after 20 years the only publicly available back up of the internet is the privately funded Internet Archive. The only broad archive of television and radio broadcasts is the same organization. They are now backing up the backups of books. Someday we’l realize the precocious wisdom of it all and Brewster Kahle will be seen as a hero.

    #livres #archive #histoire #civilisation