Documentation du code¶
-
class
moteurs_clustering.cluster.Cluster(donnees, nom='')¶ Représentation d’un cluster générique.
-
__init__(donnees, nom='')¶ Initialise un cluster avec un nom et une liste de données.
Paramètres: - donnees (list) – les données du cluster.
- nom (str) – le nom du cluster.
-
ajoute_donnee(donnee)¶ Ajoute une donnée au cluster.
Paramètres: donnee – la donnée à ajouter.
-
ajoute_donnees(donnees)¶ Ajoute une liste de données au cluster.
Paramètres: donnees (list) – les données à ajouter.
-
-
class
moteurs_clustering.cluster_mean.ClusterMean(donnees, nom)¶
Bases: moteurs_clustering.cluster.Cluster
Représentation d’un cluster utilisé dans l’algorithme du k-means.
ClusterMean.__init__(donnees, nom)¶Initialise le cluster avec un nom et une liste de données.
Paramètres:
- donnees (list) – les données du cluster.
- nom (str) – le nom du cluster.
ClusterMean.ajoute_donnee(donnee)¶Ajoute une donnée au cluster.
Paramètres: donnee – la donnée à ajouter.
ClusterMean.ajoute_donnees(donnees)¶Ajoute une liste de données au cluster.
Paramètres: donnees (list) – les données à ajouter.
ClusterMean.centre(dist_f)¶Recentre le noyau du cluster en fonction des données qu’il contient.
Paramètres: dist_f – la fonction de distance entre deux données.
ClusterMean.vide(garde_noyau=False)¶Vide la liste des données du cluster avec l’option de garder le noyau.
-
class
moteurs_clustering.cluster_hierarchique.ClusterHierarchique(donnees, gauche=None, droite=None)¶
Bases: moteurs_clustering.cluster.Cluster
Représentation d’un cluster utilisé dans l’algorithme de clustering hiérarchique.
ClusterHierarchique.__init__(donnees, gauche=None, droite=None)¶
Paramètres:
- donnees (list) – les données du cluster.
- gauche (ClusterHierarchique) – le sous-cluster de gauche.
- droite (ClusterHierarchique) – le sous-cluster de droite.
ClusterHierarchique.ajoute_donnee(donnee)¶Ajoute une donnée au cluster.
Paramètres: donnee – la donnée à ajouter.
ClusterHierarchique.ajoute_donnees(donnees)¶Ajoute une liste de données au cluster.
Paramètres: donnees (list) – les données à ajouter.
ClusterHierarchique.est_terminal()¶Teste si le cluster courant est terminal (c’est-à-dire s’il n’a pas de sous-clusters ni à gauche ni à droite).
Retourne: Truequand le cluster courant est terminal.
ClusterHierarchique.repr_hierarchie(level=0)¶Représentation sous forme de string de la hiérarchie de laquelle le cluster courant est la racine.
-
class
moteurs_clustering.clustering.Clustering¶ Classe générique pour le clustering.
Devra être sous-classée selon le type de clustering.
-
__init__()¶
-
fini(anciens_clusters)¶ Teste si les clusters ont changé par rapport aux anciens clusters (à implémenter différemment pour le clustering k-means et le clustering hiérarchique).
Paramètres: anciens_clusters (list) – la liste des anciens clusters.
-
initialise_clusters(donnees)¶ Initialise les clusters (à implémenter différemment pour le clustering k-means et le clustering hiérarchique).
Paramètres: donnees (list) – les données à regrouper dans des clusters.
-
itere(donnees)¶ Regroupe les données dans des clusters de façon itérative.
Paramètres: donnees (list) – les données à regrouper dans des clusters.
-
revise_clusters()¶ Révise les clusters (à implémenter différemment pour le clustering k-means et le clustering hiérarchique).
-
-
class
moteurs_clustering.clustering_kmeans.ClusteringKMeans(k, dist_f)¶
Bases: moteurs_clustering.clustering.Clustering
K-means clustering.
ClusteringKMeans.__init__(k, dist_f)¶
Paramètres:
- k – le nombre de clusters à construire.
- dist_f – la fonction de distance entre deux données.
ClusteringKMeans.affiche_clusters()¶Affiche les clusters construits par l’algorithme.
ClusteringKMeans.fini(anciens_clusters)¶Teste si les clusters ont changé par rapport aux anciens clusters.
C’est le cas si les noyaux ont changé depuis l’itération précédente.
Paramètres: anciens_clusters (list) – la liste des anciens clusters.
ClusteringKMeans.initialise_clusters(donnees)¶Initialise les clusters.
Paramètres: donnees (list) – les données à regrouper dans des clusters.
ClusteringKMeans.itere(donnees)¶Regroupe les données dans des clusters de façon itérative.
Paramètres: donnees (list) – les données à regrouper dans des clusters.
ClusteringKMeans.noyaux(clusters)¶Extrait les noyaux d’une liste de clusters.
Paramètres: clusters (list) – une liste de clusters dont les noyaux doivent être retournés. Retourne: la liste des noyaux des clusters.
ClusteringKMeans.revise_clusters()¶Révise les clusters.
-
class
moteurs_clustering.clustering_hierarchique.ClusteringHierarchique(type_lien, dist_f)¶
Bases: moteurs_clustering.clustering.Clustering
Clustering hiérarchique.
ClusteringHierarchique.__init__(type_lien, dist_f)¶
Paramètres:
- lien (str) – le type de distance entre deux clusters, ‘single’ ou ‘complete’.
- dist_f – la fonction de distance entre deux données.
ClusteringHierarchique.affiche_clusters()¶Affiche les clusters découverts par l’algorithme.
ClusteringHierarchique.calcule_distance(cluster1, cluster2)¶Calcule la distance entre deux clusters.
ClusteringHierarchique.fini(anciens_clusters)¶Teste si les clusters ont changé par rapport aux anciens clusters.
C’est le cas si leur nombre a diminué.
Paramètres: anciens_clusters (list) – la liste des anciens clusters.
ClusteringHierarchique.fusionne_clusters(cluster1, cluster2)¶Fusionne deux clusters.
Le nouveau cluster contiendra
cluster1à gauche etcluster2à droite.
Paramètres:
- cluster1 – un noeud qui ira à droite du nouveau cluster.
- cluster2 – un noeud qui ira à gauche du nouveau cluster.
Retourne: le nouveau cluster.
ClusteringHierarchique.initialise_clusters(donnees)¶Initialise les clusters.
Paramètres: donnees (list) – les données à regrouper dans des clusters.
ClusteringHierarchique.itere(donnees)¶Regroupe les données dans des clusters de façon itérative.
Paramètres: donnees (list) – les données à regrouper dans des clusters.
ClusteringHierarchique.revise_clusters()¶Révise les clusters.