Abstract :
[fr] Spygraph est un crawler configurable (focused crawler en anglais) développé en Python (Viseur, 2022). Il permet d’explorer un ensemble de sites web, de manière plus ou moins ciblée, puis d’exporter les hyperliens et les domaines découverts. L’outil facilite l’exploration itérative d’écosystèmes d’affaires, au travers des sites web des membres, dans un premier temps de manière divergente (par exemple pour découvrir de nouveaux acteurs jusqu’à alors inconnus), dans un second temps de manière convergente (pour concentrer l’analyse sur un ensemble validé de sites web). L’exportation des résultats de l’exploration peut se faire sous la forme d’un fichier de tableur (CSV) et d’un fichier de graphe (DOT, GML). Une première version du logiciel exportait les graphes au format DOT uniquement. Les formats CSV et DOT permettaient notamment une analyse dans le logiciel libre Gephi. Une version ultérieure permet l’exportation au format GML. Ce dernier est exploitable au sein du logiciel igraph. igraph est un ensemble d’outils d’analyse de réseaux, libre et gratuit, programmable en R, Python, Mathematica et C/C++. Deux cas d’utilisation sont présentés : d’une part, l’utilisation, avec Spygraph, à l’aide du langage Python, d’autre part, l’analyse d’un fichier au format GML, exporté depuis Spygraph, directement dans R. L’objectif est de générer, après le crawl, premièrement, un ensemble de métriques (p. ex. degree, betweeness centrality et pagerank), deuxièmement, une prévisualisation des communautés. Une comparaison des différentes approches d’analyse est proposée en guise de conclusion.