AI & Data Science Blog

Das A bis Z der künstlichen Intelligenz

AGI

Künstliche allgemeine Intelligenz (Artificial General Intelligence, AGI) bezeichnet eine Form der künstlichen Intelligenz, die in der Lage ist, zu verstehen, zu lernen und Wissen in einem breiten Spektrum von Aufgaben und Bereichen anzuwenden, ähnlich wie ein Mensch. Im Gegensatz zur engen KI, die sich auf spezifische Aufgaben konzentriert, kann sich die AGI an eine Vielzahl von Problemen anpassen, Kreativität zeigen und Problemlösungsfähigkeiten aufweisen, die im Allgemeinen mit menschlicher Intelligenz in Verbindung gebracht werden.

AGI stellt eine potenzielle Zukunftstechnologie dar, die nach Ansicht ihrer Befürworter in der Lage ist, den Menschen bei den meisten wirtschaftlich produktiven Aufgaben zu übertreffen und möglicherweise neue wissenschaftliche Durchbrüche zu erzielen. Obwohl es sich bei der AGI derzeit um ein theoretisches Konzept handelt, hat sie das Potenzial, zahlreiche Bereiche zu revolutionieren, von der wissenschaftlichen Entdeckung bis zur wirtschaftlichen Produktivität. Die Machbarkeit von AGI und der Zeitplan für ihre Entwicklung sind unter Forschern umstritten. OpenAI und DeepMind, die weltweit führenden KI-Forschungsorganisationen, haben sich jedoch beide ausdrücklich zur Entwicklung von AGI verpflichtet.

Bias

Voreingenommenheit ist, einfach ausgedrückt, eine unfaire Bevorzugung oder Voreingenommenheit einer Person oder Gruppe gegenüber einer anderen. Sie kann zu einer ungleichen Behandlung oder einem Mangel an Fairness bei der Entscheidungsfindung führen. Im Zusammenhang mit künstlicher Intelligenz und maschinellem Lernen liegt eine Voreingenommenheit vor, wenn das Computersystem auf der Grundlage der Daten, auf die es trainiert wurde, Entscheidungen trifft, die eine Gruppe oder ein Ergebnis gegenüber einer anderen Gruppe bevorzugen und damit bestehende Ungleichheiten oder Stereotypen widerspiegeln.

Beispiele für solche Verzerrungen sind KI-gestützte Strafverfolgungssoftware, die bei ähnlichen Verbrechen für schwarze Straftäter längere Haftstrafen empfiehlt als für weiße Straftäter, oder Gesichtserkennungssoftware, die weiße Gesichter besser erkennt als schwarze Gesichter. Diese Unzulänglichkeiten sind häufig auf soziale Ungleichheiten in den von diesen Systemen verwendeten Trainingsdaten zurückzuführen. Heutige KI-Systeme funktionieren in erster Linie als Musterreplikatoren, die große Datenmengen mithilfe neuronaler Netze verarbeiten, um Muster zu erkennen. Wenn die Trainingsdaten ein Ungleichgewicht enthalten, wie z. B. eine höhere Anzahl weißer Gesichter im Vergleich zu schwarzen Gesichtern oder historische Strafverfolgungsdaten, die ein Ungleichgewicht zwischen schwarzen und weißen Straftätern zeigen, können maschinelle Lernsysteme unbeabsichtigt diese Vorurteile erlernen und aufrechterhalten, wodurch Ungleichheiten automatisiert werden.

Data Labeling

Häufig benötigen maschinelle Lernsysteme menschliche Kommentatoren, um Daten zu beschriften oder zu beschreiben, bevor sie für das Training verwendet werden können. Bei der Entwicklung selbstfahrender Autos beispielsweise müssen menschliche Mitarbeiter Dashcam-Videos mit Anmerkungen versehen, indem sie Autos, Fußgänger, Fahrräder usw. einzeichnen, um dem System beizubringen, verschiedene Straßenelemente zu erkennen.

Diese Aufgabe wird häufig an Leiharbeiter im globalen Süden delegiert, die in unsicheren Beschäftigungsverhältnissen arbeiten und Löhne erhalten, die kaum über dem Armutsniveau liegen. In einigen Fällen kann diese Arbeit sehr belastend sein. So mussten kenianische Arbeiter Inhalte mit Gewalt, explizitem Material und Hassreden ansehen und kennzeichnen, um ChatGPT zu trainieren, die Beschäftigung mit solchen Themen zu vermeiden.

Multivariate Analysen

Multivariate Analysen sind statistische Methoden, die verwendet werden, um die Beziehung zwischen mehreren Variablen zu untersuchen. Im Gegensatz zu univariaten Analysen, die sich nur auf eine Variable konzentrieren, betrachten multivariate Analysen mehrere Variablen gleichzeitig.

Multivariate Analysen können verwendet werden, um komplexe Datenmuster zu identifizieren, Zusammenhänge zwischen Variablen zu untersuchen, Vorhersagemodelle zu erstellen und Hypothesen zu testen. Einige Beispiele für multivariate Analysemethoden sind die lineare Regression, die Faktorenanalyse, die Clusteranalyse und die Diskriminanzanalyse.

Prädikatorvariable

Eine Prädiktorvariable ist eine unabhängige Variable in einem statistischen Modell, die verwendet wird, um Vorhersagen über eine abhängige Variable zu treffen. In der Data Science werden Prädiktorvariablen häufig verwendet, um Vorhersagemodelle zu erstellen, die auf historischen Daten basieren. Diese Modelle können dann verwendet werden, um Vorhersagen über zukünftige Ereignisse oder Trends zu treffen. Beispielsweise könnte die Anzahl der Stunden, die eine Person pro Woche arbeitet, eine Prädiktorvariable sein, die verwendet wird, um das Einkommen dieser Person vorherzusagen. Andere Beispiele für Prädiktorvariablen könnten Alter, Geschlecht, Bildungsniveau oder geografische Region sein.

Text-to-Speech (TTS)

„Text-to-Speech“ (TTS), auf Deutsch „Text-zu-Sprache“, bezeichnet eine Technologie, die geschriebenen Text in gesprochene Sprache umwandelt. TTS-Systeme ermöglichen es Computern, Texte laut vorzulesen, wodurch sie in vielen Anwendungen, einschließlich Sprachassistenten, E-Book-Readern und Navigationssystemen, eingesetzt werden.

Moderne TTS-Systeme verwenden häufig neuronale Netzwerkarchitekturen, insbesondere Deep Learning, um natürlicher klingende menschliche Stimmen zu erzeugen. Dies unterscheidet sich von älteren Systemen, die auf konkatenierte Audiosegmente angewiesen waren und oft weniger natürlich klangen.

Die Qualität und Natürlichkeit von TTS-Systemen haben sich in den letzten Jahren erheblich verbessert, und sie können heute in verschiedenen Sprachen, Dialekten und Stimmlagen Sprache generieren. Einige fortschrittliche Systeme sind sogar in der Lage, Emotionen oder besondere Betonungen in die generierte Sprache einzufügen.