Les illusions dans la vie courante, L'illusion du Gogol

par Jean Marie Champeau 11 Janvier 2022, 17:17 vie courante

L'illusion du Gogol

 

Le nom de l'entreprise Google a pour origine le terme mathématique «googol» ou gogol en français, qui désigne 10100

Bien qu'il soit facile de l'écrire en base dix, par un 1 suivi de cent 0, il est énorme, bien supérieur au nombre de particules dans l'Univers connu qui serait d’environ 1080.

 

Ce terme symbolise les buts que Google s'est fixé: «organiser l'immense volume d'information disponible sur le Web et dans le monde».

 

En effet, si en 2012, Google a indexé plus de 30000 milliards (1012) de documents et gère à peu près 3,5 milliards de requêtes de recherche quotidiennement, il reste minime par rapport à un gogol. 

 

L’idée, donc, est d’indexer et donc d’enregistrer la totalité des liens vers les informations du Web. Ce qui conduit la firme a prendre quelques libertés avec les droits d’auteur.  

Comment Google s'est fait prendre «la main dans le sac»


Le 16 juin 2019, The Wall Street Journal a rapporté que Genius, le site Internet des paroles de chansons, avait déclaré avoir surpris Google en flagrant délit de vol des paroles de leur site Web sans aucune attribution ni aucun paiement. 

 

Google nie mais va enquêter sur la situation.

 

 

 

 

 

La façon dont Genius a attrapé Google était plutôt maligne. Deux formes d'apostrophes ont été utilisées dans les paroles :

 

 

En comparant attentivement les paroles des deux sites, on voit que tout est absolument identiques, y
compris les apostrophes. Cela prouve bien le copié-collé.

 

 

 

 

Cette suite d'apostrophes signifie en Morse : « Red Handed », l'équivalent de « la main dans le sac » en français.

La solidité d’internet


Au lendemain de la Seconde Guerre mondiale, les deux grandes puissances que sont les Etats-Unis et l’URSS s’opposent sans jamais directement s’affronter. C’est la Guerre froide. 

 

En 1958, le président américain Eisenhower demande aux militaires de créer une agence de développement de projets technologiques dans la perspective de protéger le territoire de la menace soviétique. Cette entité va imaginer un réseau de communication électronique décentralisé, en maillage, capable de continuer à fonctionner, même lorsque qu'une partie de celui-ci est détruit.


En 1961, Léonard Kleinrock, du MIT, théorise le concept de transmission par paquets qui consiste à découper des données informatiques de façon à pouvoir les transmettre de manière discontinue et par des chemins multiples, tout en permettant à un destinataire de les reconstituer en en rassemblant les différentes parties.


Au début des années 70, Vinton Cerf, de l’université de Stanford, développe un protocole de transmission qui autorise l'interconnexion de plusieurs réseaux. Le protocole IP vient de naître.

Internet Protocol
réseau
réseau


Internet protocol, abrégé en IP, est une famille de protocoles de communication de réseaux informatiques conçus pour être utilisés sur Internet. 

 

Ce protocole doit permettre de partager des ressources en utilisant la commutation de paquets à travers des nœuds du réseau.
Le protocole IP n’est pas un protocole orienté «connexion» déterministe qui définit un chemin fixe de communication lors de l’établissement de la connexion entre deux machines. 

 

Les paquets IP peuvent emprunter des chemins différents pour parvenir à leur destinataire. Chaque paquet est donc acheminé de façon autonome sur le réseau, sur la meilleure route disponible au moment de sa transmission.

 

La solidité d’Internet réside dans le fait que le chemin de la transmission des données peut être choisi par n’importe quelle machines décentralisant la décision du routage.

L’illusion du data center
un datacenter
un datacenter

Rien que l’appellation est déjà antinomique avec le principe de l’Internet. 

En effet rien n’est plus éloigné du concept Internet que la centralisation.

 

On ne peut pas supprimer la vulnérabilité inhérente à tout site de stockage des données. Tout au plus peut-on la diminuer en augmentant la sécurité. Ce qui veut dire qu’un jour un incident majeur se produira détruisant les informations stockées.

 

La possibilité d’acheminement décentralisé des informations ne sert plus à rien s’il n’y a plus d’informations à acheminer.

un noeud du réseau
un noeud du réseau

Il est de coutume de dire que la résistance d’une chaîne est limitée à son maillon le plus faible mais je pense que le problème est un peu différent. 

 

Le maillon qui va lâcher n’est pas plus faible que les autres, il supportera seulement plus de contraintes que ses collègues car il se trouvera à un noeud du réseau.

 

De même que la centralisation du stockage, l’indexation sur un seul opérateur va à l’encontre du principe de décentralisation d’Internet. Tôt ou tard il deviendra, comme dans l’image des chaines, un noeud du système.

Si ces opérateurs sont en eux-mêmes des centralisateurs des indexations, tous l’un a près l’autre atteindront une masse critique avant de s’effondrer. La solution, conforme au principe de la décentralisation d’internet, garant de la solidité du système, devrait passer par la collaboration redondante des opérateurs

L’illusion de la totalité                 
ça déborde
ça déborde
                     

Jamais il ne sera possible d’emmagasiner la totalité des liens des informations du réseau. Plus les bases de données d’un opérateur d’indexation s’enrichissent plus elles sont vulnérables. 

 

Tôt ou tard, concentrant de plus en plus de requêtes, l’opérateur constituera de lui même, un goulot d’étranglement contraire au principe de décentralisation d’Internet. 

 

Là aussi la solution passera par la collaboration redondante des moyens de stockage et du traitement des requêtes faute de quoi une limite critique de rupture sera forcément atteinte.

ACCUEIL

 

Photos


Visualisation d'un gogol.

Par Yot, Hidro add transparency. — Travail personnel, CC BY-SA 3.0, https://commons.wikimedia.org/w/index.php?curid=2080137


Visualisation des multiples chemins à travers une portion d'Internet.

Par The Opte Project Originally from the English Wikipedia; description page is/was here. CC BY 2.5, https://commons.wikimedia.org/w/index.php?curid=1538544

 

Transit du trafic IP entre un ordinateur et un serveur.

Par Mro — Travail personnel, CC BY-SA 3.0, https://commons.wikimedia.org/w/index.php?curid=10866945

 

les apostrophes

https://img.bfmtv.com/c/630/420/d81/c2cf884f8882c50ef41cc312aaafc.png

 

un data center

https://fr.freepik.com/photos/affaires" Affaires photo créé par DCStudio – fr.freepik.com

 

Le nœud du réseau

https://fr.freepik.com/photos/technologie Technologie photo créé par freepik – fr.freepik.com

 

 

Ca déborde

https://fr.freepik.com/vecteurs/fond Fond vecteur créé par vectorpouch – fr.freepik.com

 

 

Pour être informé des derniers articles, inscrivez vous :
commentaires

Haut de page