Veiller le deepweb, nouvel objectif stratégique des organisations ?

4 Juin, 2018

Veiller le deepweb : explosion du big data oblige, institutions et entreprises prennent peu à peu conscience de la mine d’informations précieuses que recèle le deepweb, ou web profond.

Veiller le deepweb élargit le potentiel d’accès à l’information. Un résultat situé entre 80 et 96% sur l’ensemble des données en circulation sur Internet.

Aussi appelé web invisible, le deepweb se compose de toutes les données non indexées en circulation sur Internet. C’est-à-dire toutes celles qui ne remontent pas ‘’à la surface’’, par une requête simple sur les moteurs de recherche généralistes type Google. Cela comprend tous les contenus des réseaux sociaux, des webmails, des sites payants. De façon générale, veiller le deepweb vise à accéder à des contenus nécessitant une authentification de l’utilisateur, c’est-à-dire une identification par login et mot de passe.

« KB Crawl se positionne sur ce secteur depuis plus de dix ans, intégrant à sa solution une fonction capable de veiller le deepweb, explique Bruno Etienne. Nous pouvons crawler des moteurs de recherche spécifiques, y compris internes à des sites, y compris complexes et multicritères. C’est un service très spécifique, qui va au-delà des solutions de veille basiques. Il permet une surveillance sur mesure, que l’utilisateur configure selon ses besoins particuliers ».

Les clients demandeurs de veiller le deepweb sont ceux qui ont besoin d’identifier des signaux faibles. Pour anticiper d’éventuelles fraudes ou menaces, ou plus simplement pour surveiller des tendances. Pour des organisations qui font de la veille innovation, crawler le deepweb permet ; de surveiller les sites de concurrents, les bases documentaires brevets, les bases de données universitaires, les sites de crowdfunding liés à la recherche. La veille tarifaire aussi utilise les informations dites « grises » du deepweb (cf article « Comment accéder à l’information grise pour obtenir une veille stratégique complète »), pour observer l’évolution des prix des produits, par exemple, sur chacun des moteurs de recherche de sites concurrents. Dans un autre registre – celui des services étatiques liés à la sécurité, la criminalité, les fraudes, etc. Il peut s’agir de scruter des forums et des groupes de discussion, des réseaux sociaux, pour y surveiller des activités illicites, potentiellement dangereuses ou menaçantes. La veille des médias sociaux s’avère aussi de plus en plus stratégique pour des organisations qui doivent gérer leur e-réputation.

Ainsi veiller le deepweb constitue-t-il un nouveau continent d’exploration pour les veilleurs. A ne pas confondre – comme c’est pourtant souvent le cas, y compris dans la presse spécialisée, avec le darkweb (ou darknet). Ce dernier est un Internet parallèle. Il fonctionne sur le principe d’anonymisation de la zone d’origine des échanges, et constitue le lieu privilégié de la cybercriminalité et des trafics en tous genres. On y accède par le biais de réseaux informatiques mondiaux décentralisés. Le plus célèbre étant Tor (acronyme de « The Onion Router »). « Pour l’heure il est techniquement impossible de veiller le darkweb de façon automatisée, affirme Bruno Etienne. Car pour infiltrer les réseaux du darkweb, hyper-contrôlés, il faut forcément appliquer une démarche humaine. Les hackers qui y sévissent veillent à la sûreté des échanges. Et ils ont toujours un coup d’avance ! ».

Si veiller le darkweb reste utopique en 2018, l’accès aux milliards de pages du deepweb est devenu une possibilité sur laquelle les organisations à fort enjeu économique ou stratégique ne peuvent plus faire l’impasse.



Big data Collecte Deepweb Digital Évolution Information grise Internet Moteur de recherche Signaux faibles Veille stratégique