Was ist der Unterschied zwischen hierarchischem Clustering und zufälliger Gesamtstrukturklassifizierung?


Antwort 1:

First-Clustering ist ein unbeaufsichtigter ML-Algorithmus, der mit unbeschrifteten Daten arbeitet. Random Forest ist ein überwachter Lernalgorithmus, der mit beschrifteten Daten (sowohl Regression als auch Klassifizierung) arbeitet.

Zweitens: So funktionieren sie

Hierarchisches Clustering gruppiert Daten in Hierarchien auf zwei Arten: von oben nach unten und von unten nach oben.

Von oben nach unten - Wir beginnen mit einem Cluster (der alle Daten enthält) und gehen nach unten. Dabei wird iterativ ein neuer Cluster erstellt, der bei jedem Schritt am wenigsten mit anderen Daten übereinstimmt, bis wir für jeden Datenpunkt einen Cluster haben.

Bottom Up- Wir beginnen mit n Clustern für n Datenpunkte und kombinieren dann bei jedem Schritt iterativ 2 Cluster mit maximaler Ähnlichkeit zu einem einzigen, bis wir einen einzelnen Cluster haben.

So funktioniert Random Forest-

सौरभ Singhs Antwort auf Wie funktioniert zufälliger Wald für die Regression?