Seite 2 von 2

Hierarchisches Clustering / Dendrogramme

19. März 2023 / Matthias Steube / Keine Kommentare

Im Bereich des Unsupervised Learnings gibt es verschiedene Ansätze, um Muster in Daten zu erkennen. Einer dieser Ansätze ist das hierarchische Clustering.

Beim hierarchischen Clustering werden die Datenpunkte schrittweise zu Gruppen zusammengefasst, wobei ähnliche Datenpunkte in der gleichen Gruppe landen. Dabei wird eine Hierarchie von Gruppen gebildet, die sich entweder von oben nach unten (agglomeratives Clustering) oder von unten nach oben (divisives Clustering) aufbaut.

Clustering-Verfahren

18. Februar 2023 / Matthias Steube / Keine Kommentare

Clustering ist ein Prozess, bei dem ähnliche Elemente oder Objekte aus einem Datensatz in Untergruppen zusammengefasst werden. Dies geschieht häufig, um Daten zu analysieren oder zu visualisieren. Clustering kann auch verwendet werden, um ähnliche Dinge zu finden oder abzugrenzen. Unternehmen können so etwa Kundendaten clustern, um bessere Geschäftsentscheidungen zu treffen.

Cluster-Verfahren sind eine Form des maschinellen Lernens. Wir betrachten hier Cluster-Verfahren als unüberwachtes Lernen (unsupervised learning), bei dem die Einteilung in Klassen nur aufgrund der vorhandenen Daten und ohne speziellen Lernschritt erfolgt. Demnach sind die Daten in dem Datensatz nicht benannt, weshalb Algorithmen prädikative Methoden einsetzen müssen, um Muster, Beziehungen und Verbindungen in dem unverarbeiteten Datensatz zu identifizieren.

Was ist Machine Learning?

29. Januar 2023 / Matthias Steube / Keine Kommentare

Maschinelles Lernen ist der Erwerb von neuem Wissen, das durch ein künstliches System erzeugt wird. Auf ähnliche Weise wie ein Mensch generiert der Computer Wissen anhand von Erfahrung und kann eigenverantwortlich Lösungen für neue und unerforschte Probleme ermitteln.

Machine Learning ist ein Teilbereich der künstlichen Intelligenz (Engl.: Artificial Intelligence (AI)), der sich mit dem Erlernen von Mustern aus Daten beschäftigt. Durch das Training von Algorithmen mit großen Datensätzen können Machine-Learning-Systeme automatisch nach Mustern in Daten suchen und diese erkennen. Das ermöglicht es den Systemen, Aufgaben zu erledigen, die für Menschen schwierig oder sogar unmöglich wären, da die zugrundeliegenden Daten zu umfangreich sind.

Unterschied zwischen deskriptiver und induktiver Statistik

28. Januar 2023 / Matthias / Keine Kommentare

Statistik ist ein unverzichtbares Werkzeug für Data Science. Statistische Methoden sind notwendig, um Daten zu sammeln, zu analysieren und Schlussfolgerungen aus ihnen zu ziehen. Ohne Statistik wäre es unmöglich, die komplexen Datensätze zu verstehen, die bei der Data Science eingesetzt werden. In diesem Artikel führe ich in die Grundlagen der Wahrscheinlichkeit ein.

Zettabyte

24. Januar 2023 / Matthias / Keine Kommentare

Haben Sie schon einmal von dem Begriff Zettabyte gehört? Wir leben in einer digitalen Zeit, in der die Informationen immer weiter zunehmen. Ein großes Problem dabei ist, dass wir die Datenmenge kaum noch überblicken können. Ein Beispiel hierfür ist das Zettabyte. In diesem Blog-Post erkläre ich, was es mit dem Zettabyte auf sich hat und wie gigantisch die Datenmenge wirklich ist.

Data Science – Einstieg

21. Januar 2023 / Matthias / Keine Kommentare

Data Science (Datenwissenschaften) ist ein wissenschaftlicher Bereich, der sich dem Entdecken von Erkenntnissen aus Daten widmet. Mit mathematischen Techniken und Algorithmen werden Lösungen für komplexe Geschäftsprobleme erarbeitet. Die so gewonnenen Erkenntnisse können in verschiedenen Bereichen eingesetzt werden, um Entscheidungen zu treffen und Prozesse zu optimieren.

Matthias Steube

Seite 2 von 2

Hierarchisches Clustering / Dendrogramme

Clustering-Verfahren

Was ist Machine Learning?

Unterschied zwischen deskriptiver und induktiver Statistik

Zettabyte

Data Science – Einstieg

Benchmark

Letzte Posts

Letzte Kommentare

Archive

Kategorien