Skip to main content

Exploitez les données du BigData et du Web invisible pour votre veille

Le volume de données produit tous les jours sur internet dépasse aujourd’hui tout ce que l’on pouvait imaginer en termes de volumes et de rapidité. Exploiter les données du BigData pour sa veille stratégique est devenu un véritable enjeu d’intelligence économique.

En 2016, il y avait près de 4 milliards d’utilisateurs d’internet. Et la nouveauté importante de ces 4 dernières années c’est que près de la moitié de ces utilisateurs sont en Asie, ce qui fait que les langues asiatiques sont désormais aussi présentes que l’anglais. Les sites en chinois représentent à eux seuls plus de 20% des sites internet, devenant ainsi la 2ème langue parlée sur le Web après l’anglais.

A l’heure de la mondialisation, ces sources d’informations en langues étrangères sont une mine d’or pour les entreprises qui se heurtent malheureusement à la barrière de la langue pour les exploiter. D’où l’intérêt de s’équiper de la solution de veille IXXO Web Mining pour pouvoir rechercher parmi toutes ces sources de données sans difficulté.

Quelles sont les caractéristiques des données du BigData pour votre veille ?

Malheureusement, beaucoup d’entreprises se contentent d’exploiter les données immédiatement visibles dans les moteurs de recherche gratuits (Google, Bing…) qui n’indexent pourtant qu’une faible partie du Web. On estime que le volume de données contenues dans le Web invisible (ou « Deep Web ») serait de l’ordre des 2/3 de l’ensemble du Web. Ces ressources supplémentaires, en plus d’être volumineuses, représentent souvent un intérêt supplémentaire pour les entreprises qui trouvent parfois des données très pertinentes pour leur veille concurrentielle ou leur veille technologique.

Imaginez que vous puissiez analyser les échanges d’ingénieurs chinois sur un forum de discussion (en chinois) non indexés par ces moteurs de recherche ? Imaginez qu’un de vos concurrents au Brésil ait échangé des documents (en portugais) via des plateformes d’échange non indexées par les moteurs de recherche gratuits (Google, Bing…) ?

Ça vous paraît surréaliste, ce sont pourtant 2 exemples parmi tant d’autres de ce que nos clients ont pu faire grâce aux fonctionnalités d’IXXO Web Mining. Et la vraie question à se poser aujourd’hui, c’est quel est le coût réel pour l’entreprise de ne pas avoir accès à ces informations ?

BigData : pourquoi autant de volume de données dans le Web invisible ?

A la base, les moteurs de recherche indexent réellement moins de la moitié d’un site internet classique. D’autant plus lorsque les sites ont des volumes de données gigantesques dans des bases de données comme la NASA ou PubMed Central® (archives gratuites en texte intégral de la littérature des revues biomédicales et des sciences de la vie).

De plus, beaucoup de sites contiennent désormais des pages dynamiques générées à la demande ou excluent parfois l’indexation par les robots pensant se mettre ainsi à l’abri des regards.

Cartographie BigData

Exploiter les données du Big Data, c’est être capable d’aller chercher des informations dans le Web profond et de scanner ces sources d’informations même si elles sont en langues étrangères.

Le logiciel de veille Ixxo Beyond Data intègre donc des algorithmes intelligents permettant de découvrir toutes ces données « cachées », de les récupérer et de les stocker en fonction de vos thématiques de recherche.

BigData aux Smart Data 

Le big data n’est finalement pas le graal à atteindre, ce n’est qu’une étape. Si nos outils de web mining ont cette capacité à constituer rapidement un fonds documentaire conséquent, il faut pouvoir en extraire la substantifique moelle. C’est ainsi que l’intelligence artificielle intervient, pour extraire les données utiles et limiter le bruit informationnel. Ainsi les analystes disposent d’informations directement utiles au quotidien, de données extraites de ces contenus et ainsi utilisez ces Smart Data dans vos projets. 

Découvrez en vidéo comment exploiter les données du BigData avec le logiciel IXXO Web Mining

Contactez-nous pour exploiter les données
du BigData sans plus attendre

Contactez-nous