Documentation du code

class moteurs_clustering.cluster.Cluster(donnees, nom='')

Représentation d’un cluster générique.

__init__(donnees, nom='')

Initialise un cluster avec un nom et une liste de données.

Paramètres:
  • donnees (list) – les données du cluster.
  • nom (str) – le nom du cluster.
ajoute_donnee(donnee)

Ajoute une donnée au cluster.

Paramètres:donnee – la donnée à ajouter.
ajoute_donnees(donnees)

Ajoute une liste de données au cluster.

Paramètres:donnees (list) – les données à ajouter.
class moteurs_clustering.cluster_mean.ClusterMean(donnees, nom)

Bases: moteurs_clustering.cluster.Cluster

Représentation d’un cluster utilisé dans l’algorithme du k-means.

ClusterMean.__init__(donnees, nom)

Initialise le cluster avec un nom et une liste de données.

Paramètres:
  • donnees (list) – les données du cluster.
  • nom (str) – le nom du cluster.
ClusterMean.ajoute_donnee(donnee)

Ajoute une donnée au cluster.

Paramètres:donnee – la donnée à ajouter.
ClusterMean.ajoute_donnees(donnees)

Ajoute une liste de données au cluster.

Paramètres:donnees (list) – les données à ajouter.
ClusterMean.centre(dist_f)

Recentre le noyau du cluster en fonction des données qu’il contient.

Paramètres:dist_f – la fonction de distance entre deux données.
ClusterMean.vide(garde_noyau=False)

Vide la liste des données du cluster avec l’option de garder le noyau.

class moteurs_clustering.cluster_hierarchique.ClusterHierarchique(donnees, gauche=None, droite=None)

Bases: moteurs_clustering.cluster.Cluster

Représentation d’un cluster utilisé dans l’algorithme de clustering hiérarchique.

ClusterHierarchique.__init__(donnees, gauche=None, droite=None)
Paramètres:
ClusterHierarchique.ajoute_donnee(donnee)

Ajoute une donnée au cluster.

Paramètres:donnee – la donnée à ajouter.
ClusterHierarchique.ajoute_donnees(donnees)

Ajoute une liste de données au cluster.

Paramètres:donnees (list) – les données à ajouter.
ClusterHierarchique.est_terminal()

Teste si le cluster courant est terminal (c’est-à-dire s’il n’a pas de sous-clusters ni à gauche ni à droite).

Retourne:True quand le cluster courant est terminal.
ClusterHierarchique.repr_hierarchie(level=0)

Représentation sous forme de string de la hiérarchie de laquelle le cluster courant est la racine.

class moteurs_clustering.clustering.Clustering

Classe générique pour le clustering.

Devra être sous-classée selon le type de clustering.

__init__()
fini(anciens_clusters)

Teste si les clusters ont changé par rapport aux anciens clusters (à implémenter différemment pour le clustering k-means et le clustering hiérarchique).

Paramètres:anciens_clusters (list) – la liste des anciens clusters.
initialise_clusters(donnees)

Initialise les clusters (à implémenter différemment pour le clustering k-means et le clustering hiérarchique).

Paramètres:donnees (list) – les données à regrouper dans des clusters.
itere(donnees)

Regroupe les données dans des clusters de façon itérative.

Paramètres:donnees (list) – les données à regrouper dans des clusters.
revise_clusters()

Révise les clusters (à implémenter différemment pour le clustering k-means et le clustering hiérarchique).

class moteurs_clustering.clustering_kmeans.ClusteringKMeans(k, dist_f)

Bases: moteurs_clustering.clustering.Clustering

K-means clustering.

ClusteringKMeans.__init__(k, dist_f)
Paramètres:
  • k – le nombre de clusters à construire.
  • dist_f – la fonction de distance entre deux données.
ClusteringKMeans.affiche_clusters()

Affiche les clusters construits par l’algorithme.

ClusteringKMeans.fini(anciens_clusters)

Teste si les clusters ont changé par rapport aux anciens clusters.

C’est le cas si les noyaux ont changé depuis l’itération précédente.

Paramètres:anciens_clusters (list) – la liste des anciens clusters.
ClusteringKMeans.initialise_clusters(donnees)

Initialise les clusters.

Paramètres:donnees (list) – les données à regrouper dans des clusters.
ClusteringKMeans.itere(donnees)

Regroupe les données dans des clusters de façon itérative.

Paramètres:donnees (list) – les données à regrouper dans des clusters.
ClusteringKMeans.noyaux(clusters)

Extrait les noyaux d’une liste de clusters.

Paramètres:clusters (list) – une liste de clusters dont les noyaux doivent être retournés.
Retourne:la liste des noyaux des clusters.
ClusteringKMeans.revise_clusters()

Révise les clusters.

class moteurs_clustering.clustering_hierarchique.ClusteringHierarchique(type_lien, dist_f)

Bases: moteurs_clustering.clustering.Clustering

Clustering hiérarchique.

ClusteringHierarchique.__init__(type_lien, dist_f)
Paramètres:
  • lien (str) – le type de distance entre deux clusters, ‘single’ ou ‘complete’.
  • dist_f – la fonction de distance entre deux données.
ClusteringHierarchique.affiche_clusters()

Affiche les clusters découverts par l’algorithme.

ClusteringHierarchique.calcule_distance(cluster1, cluster2)

Calcule la distance entre deux clusters.

ClusteringHierarchique.fini(anciens_clusters)

Teste si les clusters ont changé par rapport aux anciens clusters.

C’est le cas si leur nombre a diminué.

Paramètres:anciens_clusters (list) – la liste des anciens clusters.
ClusteringHierarchique.fusionne_clusters(cluster1, cluster2)

Fusionne deux clusters.

Le nouveau cluster contiendra cluster1 à gauche et cluster2 à droite.

Paramètres:
  • cluster1 – un noeud qui ira à droite du nouveau cluster.
  • cluster2 – un noeud qui ira à gauche du nouveau cluster.
Retourne:

le nouveau cluster.

ClusteringHierarchique.initialise_clusters(donnees)

Initialise les clusters.

Paramètres:donnees (list) – les données à regrouper dans des clusters.
ClusteringHierarchique.itere(donnees)

Regroupe les données dans des clusters de façon itérative.

Paramètres:donnees (list) – les données à regrouper dans des clusters.
ClusteringHierarchique.revise_clusters()

Révise les clusters.