Direkt zum Seiteninhalt springen

KI-Glossar

Mann zeigt mit Zeigefinger auf digitalen Code.

A

Algorithmus

Ein Algorithmus ist eine genaue Beschreibung von Schritten, um eine vordefinierte Aufgabe zu lösen. Ein Algorithmus verarbeitet eine definierte Eingabe und ist nach einer endlichen Zeit abgeschlossen. Zudem ist ein Algorithmus deterministisch, das heißt, die gleiche Eingabe erzeugt auch die gleiche Ausgabe.

B

Bias

Ein Bias beschreibt eine Verzerrung in einem KI-System, durch die inadäquate Entscheidungen getroffen werden. Ein Bias kann durch einseitige oder fehlerhafte Daten oder eine inkorrekte Verarbeitung entstehen. Eine mögliche Folge kann die Diskriminierung einer Personengruppe durch das System sein.[1] Ein Bias kann in einem KI-System auch gewollt sein, um tatsächliche Verzerrungen oder eine strukturelle Diskriminierung in der Realität abzubilden.

[1] Siehe https://www.volkswagenstiftung.de/aktuelles-presse/geschichten-aus-der-foerderung/programmierte-vorurteile.

 

Big Data

Der Begriff Big Data beschreibt große Datenmengen, die sich durch die folgenden vier Eigenschaften auszeichnen:

  1. Volume: Die Daten fallen in sehr großen Mengen an.
  2. Velocity: Die Daten fallen in einer sehr hohen Rate an und müssen sehr schnell verarbeitet werden.
  3. Variety: Es gibt eine Vielzahl an Daten, die häufig unstrukturiert sein können und aus verschiedenen Quellen stammen.
  4. Veracity: Die Zuverlässigkeit der Daten ist aufgrund der hohen Verarbeitungsgeschwindigkeit und der Vielfalt der Daten nicht immer gegeben.[2]

[2] Klein et al. (2013): Big Data, Informatik-Spektrum.

 

Black-Box-Modelle

Black-Box-Modelle des maschinellen Lernens sind Modelle, bei denen innere Prozesse nicht einsehbar sind. Die Funktionsweise des Modells ist nur durch Beobachtung der Ein- und Ausgaben möglich.

 

Business Intelligence

Business Intelligence (BI) ist eine Kombination aus Prozessen, Richtlinien, Kultur und Technologien zur Erfassung, Bearbeitung, Speicherung und Analyse von Daten aus internen und externen Quellen, um Informationen zu übermitteln, Wissen zu schaffen und Entscheidungen zu treffen.[3] Während BI in der Regel Daten und Zusammenhänge beschreibt, verwendet KI die Daten, um beispielsweise darüber hinaus neue Erkenntnisse zu generieren und Entscheidungen automatisiert zu fällen.

[3] Foley, É., u. Guillemette, M. G. (2010): What is Business Intelligence? International Journal of Business Intelligence Research.

C

D

Deep Learning

Deep Learning beschreibt einen Teilbereich des maschinellen Lernens, bei dem künstliche neuronale Netze eingesetzt werden. Diese umfassen eine Eingabe- und Ausgabeschicht sowie eine Anzahl von Zwischenschichten (Hidden Layers).

Die einzelnen Schichten bestehen aus einer Vielzahl künstlicher Neuronen, das heißt Nervenzellen, die miteinander verbunden sind und auf Input von Neuronen aus der jeweils vorherigen Schicht reagieren. Je komplexer das Netz ist (gemessen an der Anzahl der Schichten von Neuronen, der Verbindungen zwischen den Neuronen sowie der Neuronen pro Schicht), desto höher ist der mögliche Abstraktionsgrad – und desto komplexere Sachverhalte können verarbeitet werden.

E

Explainable AI (Erklärbare KI)

Eine künstliche Intelligenz ist dann erklärbar, wenn für eine konkrete Einzelentscheidung der KI ihre wesentlichen Einflussfaktoren aufgezeigt werden können. Ein Beispiel ist die Bilderkennung, bei der nachvollzogen werden kann, mit welchem Gewicht die einzelnen Teile des Bildes in die Klassifikation eingegangen sind.

F

Framework

Ein Framework ist, ähnlich zu einer Library, ein Programmiergerüst, das dem oder der Entwickler/-in vorimplementierte Bausteine liefert. Der Unterschied zur einer Library ist, dass ein Framework zudem auch den Programmfluss steuert, während eine Library nur Funktionalität zur Verfügung stellt.

G

H

I

J

K

Künstliche Intelligenz (KI)

Künstliche Intelligenz ist ein Teilgebiet der Informatik und der Überbegriff für Anwendungen, bei denen Maschinen menschenähnliche Intelligenzleistungen erbringen. Darunter fallen unter anderem Algorithmen des regelbasierten Lernens, das maschinelle Lernen (Machine Learning) und das Verarbeiten natürlicher Sprache (Natural Language Processing).

Die Grundidee besteht darin, durch Maschinen eine Annäherung an wichtige Funktionen des menschlichen Gehirns zu schaffen, diese betreffen das Lernen, Urteilen und Problemlösen.[4]

[4] Siehe https://news.sap.com/germany/2018/03/was-ist-kuenstliche-intelligenz/.

L

Library (Bibliothek)

Eine Library ist ein Programmiergerüst, das Entwicklern und Entwicklerinnen vorimplementierte Bausteine liefert. Dadurch müssen Entwickler und Entwicklerinnen den Algorithmus nicht von Grund auf selbst implementieren. Hierdurch kann der Entwicklungsaufwand stark reduziert werden.[5]

Der Unterschied zwischen Library und Framework liegt im Umfang. Libraries sind meistens spezielle funktionale Einheiten, wie beispielsweise eine Library für XML Parsen.

[5] Siehe https://www.itwissen.info/Framework-framework.html.

M

Machine Learning (Maschinelles Lernen)

Machine Learning ist ein Teilgebiet der künstlichen Intelligenz, in dem Modelle aus Beispielen lernen und das Gelernte auf unbekannte Daten generalisieren. Dabei lernt ein Computer, eigenständig Regeln oder Features aus Daten abzuleiten, um eine bestimmte Aufgabe (z. B. Klassifikation) zu erfüllen.

Der Algorithmus kann beispielsweise anhand von Bildern lernen, zwischen Hunden und Katzen zu unterscheiden, und diese Klassifikation auf neue Bilder anwenden. Die Daten können entweder strukturiert vorliegen, etwa in Tabellenform, oder unstrukturiert als Freitext, Bild oder Sprache.

Machine Learning lässt sich in drei Kategorien unterteilen:

  1. Reinforcement Learning (Bestärkendes Lernen)
  2. Supervised Learning (Überwachtes Lernen)
  3. Unsupervised Learning (Unüberwachtes Lernen)[6]

[6] Siehe https://news.sap.com/germany/2018/03/was-ist-kuenstliche-intelligenz/.

N

Natural Language Processing (NLP) (Text- und Sprachverarbeitung)

Mithilfe von Natural Language Processing kann eine Maschine die menschliche Sprache lesen, verstehen und deren Bedeutungsinhalt ableiten.

NLP wird beispielsweise bei automatisierten Übersetzungen oder als natürlich-sprachliche Schnittstelle bei smarten Assistenten (z. B. im Smart Home) verwendet.

 

Neuronen

Neuronen sind Nervenzellen, das heißt elektrisch erregbare Zellen, die mithilfe elektrischer und chemischer Signale Informationen im Nervensystem weitergeben und verarbeiten. Künstliche Neuronen sind Modelle, die beispielsweise Aktivierungsmuster als Teil künstlicher neuronaler Netzwerke repräsentieren.

 

Neuronale Netze

Künstliche neuronale Netze bilden das Herzstück von Deep-Learning-Algorithmen. Künstliche neuronale Netzwerke bestehen aus künstlichen Neuronen (Nervenzellen), einer Art Abstraktion biologischer Neuronen. Genauso wie biologische Neuronen empfangen künstliche neuronale Netzwerke einen Input (z. B. ein Bild), der durch eine Verschaltung einer Vielzahl von Neuronen in einer Eingangsschicht über Zwischenschichten (Hidden Layers) bis hin zur Ausgangsschicht weitergeleitet wird und in einem Output (z. B. einer Klassifikation) mündet.

Neuronale Netze können „lernen“, das heißt basierend auf Trainingsdaten (z. B. Bildern) die Genauigkeit ihres Outputs laufend verbessern. Ein effektiv trainiertes System kann ein präsentiertes Bild präzise als Bild eines Hundes oder einer Katze klassifizieren. Sind diese Modelle erst einmal auf Genauigkeit getrimmt, sind sie leistungsstarke Werkzeuge. Aufgaben in der Sprach- oder Bilderkennung können im Vergleich zur manuellen Identifikation durch menschliche Experten und Expertinnen Minuten statt Stunden dauern. Eines der bekanntesten neuronalen Netze ist AlphaGO.[7]

[7] Siehe https://www.ibm.com/cloud/learn/neural-networks.

 

Nutzende

Oft werden „Nutzende“, „Anwendende“ und „Bewertete“ synonym verwendet. Tatsächlich kann „Nutzende“ sowohl „Bewertete“ bezeichnen als auch „Bewertende“ und ist damit sprachlich unpräzise, wenn es beispielsweise um die Zuschreibung von Verantwortung innerhalb der KI-Anwendung geht. Anwendende sind die Menschen, die mithilfe des Systems zu Entscheidungen kommen.

O

Overfitting

Wenn ein KI-Modell zu genau auf die verwendeten Trainingsdaten abgestimmt ist und dadurch nicht mehr die hinter den Daten liegende Systematik abbildet, spricht man von Overfitting. Overfitting führt somit dazu, dass die KI nicht sinnvoll eingesetzt werden kann, da sie beispielsweise keine zutreffenden Vorhersagen für neue Datensätze erzeugt.[8]

[8] Siehe https://link.springer.com/referenceworkentry/10.1007%2F978-0-387-30164-8_623.

P

Q

Qualitätsmaße

Ob und wie gut ein KI-Modell seinen Zweck erfüllt, kann man mit verschiedenen Indikatoren messen. Als Qualitätsmaß kann beispielsweise die sogenannte Accuracy dienen, also der Anteil der identifizierten Daten. Die „False-Positive-Rate“ bezeichnet den Anteil der zu Unrecht identifizierten Objekte, also beispielsweise Hundebilder, die als Katzenbilder gelabelt wurden.

Umgekehrt beschreibt die „False-Negative-Rate“ den Anteil der zu Unrecht nicht erkannten Objekte.[9]

[9] Eine gute Erklärung verschiedener Qualitätsmaße befindet sich hier: https://medium.com/analytics-vidhya/confusion-matrix-accuracy-precision-recall-f1-score-ade299cf63cd (abgerufen am 14.02.2022, in Englisch).

R

Reinforcement Learning (Bestärkendes Lernen)

Reinforcement Learning (Bestärkendes Lernen) beschreibt ein Lernverfahren, in dem das Training aufgrund eines sehr reduzierten Trainingssignals stattfindet. In der Regel wird nur ein Wert zurückgegeben, der ausdrückt, wie richtig oder falsch die Ausgabe war. Das Lernverfahren muss daraus selbstständig ableiten, wie es die Parameter des Modells anpasst.

Veranschaulichend dargestellt ist es die Implementierung eines Lernverfahrens, das beim Trainieren von Hunden angewendet wird. Einem Hund kann man nicht sagen, wie es sein Verhalten ändern soll. Stattdessen bestärkt man das gewünschte Verhalten durch Belohnung und unterdrückt unerwünschtes Verhalten durch Bestrafung.

S

Semi-strukturierte Daten

Semi-strukturierte Daten unterliegen keiner allgemeingültigen Struktur beziehungsweise keinem Datenmodell, beinhalten jedoch intern ersichtliche, eindeutige Strukturinformationen.

Zu den semi-strukturierten Daten kann man beispielsweise JSON- oder XML-Dokumente, aber auch Meta-Daten von E-Mails oder Bild‑, Audio- und Videodateien zählen.

 

Strukturierte Daten

Strukturierte Daten sind Daten, die eine gemeinsame Struktur und ein gemeinsames Datenmodell aufweisen. Dadurch lassen sich strukturierte Daten in Tabellenform darstellen, wie beispielsweise in einer CSV-Datei
oder einer relationalen Datenbank.[10]

[10] Siehe Dieterich, P. (2017): Evaluierung verschiedener Technologien zur Speicherung und Verknüpfung von strukturierten und unstrukturierten Daten.

 

Supervised Learning (Überwachtes Lernen)

Supervised Learning (Überwachtes Lernen) dient der Vorhersage einer bestimmten Zielvariable (z. B. der Wahrscheinlichkeit, eine seltene Erkrankung zu entwickeln). Dazu lernt das Modell basierend auf Trainingsdaten (z. B. einer Reihe medizinischer Merkmale), Zusammenhänge zu einer vordefinierten Zielvariable (Diagnose der seltenen Erkrankung) herzustellen, um diese richtig vorhersagen zu können. Nach ausreichendem Training ist der Algorithmus in der Lage, beispielsweise die Wahrscheinlichkeit, die seltene Erkrankung zu bekommen, basierend auf medizinischen Merkmalen mit einer hohen Präzision anzugeben.[11]

[11] Siehe https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6082635/.

 

Synthetische Daten

Synthetische Daten sind künstlich erzeugte Daten, die einen Datensatz erweitern oder auch ersetzen können. Letzteres findet verstärkt Anwendung bei sensiblen Daten, die dadurch beispielsweise zum Training von KI‑Algorithmen im Gesundheits- oder Finanzbereich verwendet werden können. Häufig werden synthetische Daten erzeugt, indem zunächst die (parametrische) Verteilung der Daten anhand von echten Daten gelernt beziehungsweise modelliert wird, um damit aus Zufallszahlen neue synthetische Datenpunkte zu generieren.

Daraus folgt, dass die generierten synthetischen Daten den Rohdaten hinsichtlich statistischer Eigenschaften ähnlich sind und idealerweise die gleichen Ergebnisse bei einer Datenanalyse ausgeben.

Vor allem im Zusammenhang mit Datenschutz gewinnen synthetische Daten zunehmend an Relevanz, da sie keine personenbezogenen Informationen mehr enthalten.[12]

[12] Siehe https://www.stiftung-nv.de/sites/default/files/synthetische_daten.pdf.

T

Testdaten

Im Gegensatz zu Trainingsdaten, die zum „Trainieren“ eines KI-Modells verwendet werden, dienen Testdaten dazu, ein Machine-Learning-Modell zu evaluieren. Die zum Test verwendeten Daten werden nicht zum Trainieren eines Modells verwendet, sondern zur Bestimmung der Qualität des Modells. Test- und Trainingsdaten ähneln sich in ihrer Struktur, müssen aber nicht aus derselben Datenerhebung stammen.

 

Trainingsdaten

Die Beispieldaten, anhand derer ein KI‑Modell Muster oder Zusammenhänge „lernt“, werden Trainingsdaten genannt. Im Laufe des Trainingsprozesses werden die Parameter des KI-Modells basierend auf dem Trainingsdatensatz angepasst.

U

Unstrukturierte Daten

Unstrukturierte Daten sind Daten ohne eindeutig erkennbare (bzw. maschinenlesbare) Strukturinformationen, die keinem Datenmodell unterliegen. Aufgrund dessen hängt die Informationsgewinnung stark von der Interpretation des Empfängers ab. Häufig liegen unstrukturierte Daten in natürlicher Sprache vor, wie beispielsweise in E-Mails oder Textdokumenten. Aber auch Bild-, Audio- und Videomaterial zählen zu unstrukturierten Daten.

 

Unsupervised Learning (Unüberwachtes Lernen)

Beim Unsupervised Learning (Unüberwachtes Lernen) erhält ein Machine-Learning-Modell Daten, aus denen es eigenständig Muster, Zusammenhänge oder versteckte Gruppierungen erkennen soll. Hier wird keine Vorhersage für eine vordefinierte Zielvariable getroffen (wie beim überwachten Lernen). So kann der Computer beispielsweise in einem Datensatz mit Bildern von Hunden und Katzen eigenständig lernen, Hunde von Katzen zu unterscheiden.

Anwendung findet unüberwachtes Lernen zum Beispiel in der Warenkorbanalyse, bei der ein Computer erkennt, welche Kunden und Kundinnen welche Produkte präferieren und zeitgleich kaufen. So kann beispielsweise ein Einzelhändler gezielt Produktvorschläge an die Kunden und Kundinnen richten.[13]

[13] Siehe http://datajobstest.com/data-science-repo/Unsupervised-Learning-Guide-[Zoubin-Ghahramani].pdf.

V

W

X

X – Z

Y

Z

Wir verwenden auf dieser Webseite Cookies, um Zugriffe auf unsere Webseite anonymisiert zu analysieren. Für mehr Informationen lesen Sie bitte unsere Datenschutzerklärung.

Ich stimme zu