Large Language Model (LLM)
Ein Large Language Model (LLM) ist eine spezifische Form der Künstlichen Intelligenz, die darauf trainiert ist, menschliche Sprache zu verstehen und eigenständig Texte zu formulieren.
Dafür wird das Modell mit großen Datenmengen an Texten gefüttert, die es während des Trainings analysiert und woraus es Muster, Strukturen, Bedeutungen und Zusammenhänge in der Sprache abstrahieren kann.
Mit diesem Verständnis kann es Texte generieren, Fragen beantworten, übersetzen, zusammenfassen oder Dialoge führen, die oft recht authentisch und natürlich klingen.
Ein LLM ist durch Milliarden von Parametern, d.h. Gewichtungen in mathematischen Formeln, definiert, die im Laufe des Trainings mit Daten angepasst werden.
Diese Parameter entscheiden maßgeblich darüber, welche Komplexität an Zusammenhängen und Muster das Modell erkennen und nutzen kann. Bekannte Beispiele für LLMs sind die GPT-Modelle von OpenAI, Googles Gemini oder Claude von Anthropic.
Im operativen Einsatz kommen Large Language Models z.B. in Chatbots, Suchmaschinen, Übersetzungsdiensten oder Kreativ-Tools zum Einsatz.