GPT-2

GPT-2 ist ein gängiges Sprachmodell, das auf Deep Learning basiert und von OpenAI zur Textgenerierung entwickelt wurde. Es ist Open-Source und wurde anhand von über 1,5 Milliarden Parametern trainiert, um die nächste Textsequenz für einen bestimmten Satz zu generieren.

Das Modell ist in der Lage, Sprachaufgaben wie Lesen, Zusammenfassen und Übersetzen aus einem Rohtext zu lernen. Zu diesem Zweck sind keine domänenspezifischen Trainingsdaten erforderlich. Im Vergleich zu seinem Vorgänger GPT verfügt GPT-2 über die zehnfachen Parameter sowie die zehnfache Datenmenge.

Quellen:

https://www.kdnuggets.com/2021/02/gpt2-gpt3-openai-showdown.html#:~:text=GPT%2D2%20is%20an%20acronym,text%20for%20a%20given%20sentence. (englisch)