02.07.2026

KI-gestützte Absatzprognose: Mehrwert oder Hype für den Mittelstand?

KI-Prognosen werden als Revolution im Supply Chain Management angekündigt und zugleich als überteuerte Komplexität ohne messbaren Nutzen abgetan. Beide Positionen verfehlen die eigentliche Frage: Unter welchen Bedingungen liefert KI-Absatzprognose messbar bessere Ergebnisse als statistische Methoden, und unter welchen nicht? Dieser Artikel beantwortet genau das, nüchtern und ohne Marketingsprache, mit drei konkreten Entscheidungskriterien für SCM-Leiter und Geschäftsführer im FMCG-Mittelstand.

Die Zahl der Mittelständler, die KI-gestützte Planung einführen, steigt, doch der nachweisbare Effekt auf das Ergebnis bleibt oft hinter den Erwartungen zurück. Die BVL-Trendstudie 2025/26 und die BCG-Studie Supply Chain Planning 2026 beschreiben dieselbe Lücke zwischen KI-Adoption und messbarem Nutzen. Diese Lücke entsteht nicht, weil KI schlecht wäre, sondern weil sie in Kontexten eingesetzt wird, für die sie nicht die beste Lösung ist. Die KI-Prognose, also die Absatzprognose auf Basis von Machine-Learning-Modellen, ist für eine bestimmte Klasse von Problemen deutlich überlegen und für andere überdimensioniert. Dieser Artikel zeigt, was KI-Prognosen leisten, was statistische Methoden nicht können, wo KI keinen Mehrwert bringt, und liefert drei Kriterien für die eigene Entscheidung. Die Leitfrage ist nicht, ob KI, sondern wann KI.

Was KI-Absatzprognosen leisten und warum sie in bestimmten Situationen überlegen sind

KI-Prognosen sind nicht generell besser als statistische Methoden. Die statistische Prognose, also die Absatzprognose auf Basis mathematisch definierter Modelle wie exponentieller Glättung oder Holt-Winters, ist transparent und für stabile Muster sehr gut geeignet. Die methodische Trennlinie zwischen beiden behandelt der Artikel zu Absatzprognose-Methoden im Mittelstand im Detail. KI ist für eine spezifische Klasse von Problemen besser geeignet: hohe Nachfragevariabilität, externe Signale und komplexe Wechselwirkungen. Drei Stärken erklären den Mehrwert.

Stärke 1: Externe Signale nativ integrieren

Statistische Methoden arbeiten primär mit der historischen Abverkaufsreihe. Externe Signale, also planungsrelevante Daten außerhalb der eigenen Absatzhistorie wie Wetter, Feiertage oder Promotions, müssen dort manuell ergänzt werden. KI-Modelle können solche Signale als native Planungsvariablen einbetten und lernen, welches Signal für welchen Artikel relevant ist.

Der Mehrwert ist dann messbar, wenn externe Signale die Nachfrage nachweislich beeinflussen, etwa im Getränkegroßhandel bei Wetter oder im Lebensmittelgroßhandel bei Tourismus- und Feiertagsmustern. Wo die Nachfrage dagegen kaum von äußeren Faktoren abhängt, bleibt dieser Vorteil ungenutzt. Die Fraunhofer-IML-Forschung zum Machine Learning in der Bedarfsplanung beschreibt die Einbettung externer Kovariaten als eine der zentralen Stärken lernender Verfahren. Welche Rolle die Datenbasis dabei spielt, behandelt der Artikel zur Datenbasis für KI-Absatzprognosen.

Die Prüffrage: Welcher Anteil Ihrer manuellen Bestellkorrekturen der letzten zwölf Monate war durch externe Faktoren verursacht?

Stärke 2: Nicht-lineare Muster erkennen

Statistische Methoden modellieren überwiegend lineare Zusammenhänge, also Trend, Saisonalität und Glättung. Die reale Nachfrage enthält aber oft nicht-lineare Muster: Wechselwirkungen zwischen Promotion und Saison, Kategorieeffekte oder Substitution zwischen Artikeln, wenn ein Angebot den Absatz eines anderen Produkts verdrängt. Solche Muster lassen sich mit einem linearen Modell nur schwer abbilden.

KI-Modelle können diese Zusammenhänge aus den Daten lernen, ohne dass jemand sie vorab explizit definiert. Dem steht eine klare Grenze gegenüber: Je dünner die Datenbasis, desto größer das Risiko des Overfitting, also des Fehlers, bei dem ein Modell die Trainingsdaten zu genau lernt und bei neuen Daten versagt. KI-Modelle brauchen deshalb mehr Daten als statistische Methoden, um stabil zu arbeiten. Die Fraunhofer-IML-Forschung zum Machine Learning ordnet diese Fähigkeit zur Mustererkennung als Kernvorteil ein, der aber an eine ausreichende Datengrundlage gebunden ist.

Stärke 3: Skalierung bei hohem Sortimentsvolumen

Bei statistischen Methoden auf Artikelebene müssen die Parameter je Artikel gepflegt oder über Regeln gesetzt werden. Bei einem kleinen, einheitlichen Sortiment ist das gut machbar. Bei mehreren Tausend Artikeln mit unterschiedlichen Mustern wird die manuelle Pflege zum Engpass, und veraltete Parameter führen zu schleichend schlechteren Prognosen.

KI-Modelle lernen die Parameter automatisch aus den Daten, ohne Kalibrierung je Artikel. Der Mehrwert entsteht damit vor allem bei großen Sortimenten mit 3.000 oder mehr aktiven Artikeln und unterschiedlichen Nachfragemustern je Kategorie. Bei einem überschaubaren Sortiment mit einheitlichem Verhalten rechtfertigt dieser Skalierungsvorteil den Aufwand dagegen selten. Wie sich Artikel nach Wert und Variabilität für die passende Methode einordnen lassen, behandelt der Artikel zur ABC-XYZ-Analyse.

Die Prüffrage: Wie viele Artikel pflegen Sie heute manuell, und wie aktuell sind deren Dispositionsparameter tatsächlich?

Wann KI-Absatzprognosen keinen Mehrwert liefern und was dann wirklich hilft

KI-Prognosen haben strukturelle Grenzen. Sie zu kennen ist genauso wichtig wie die Stärken, weil ein Einsatz am falschen Ort Aufwand erzeugt, ohne die Prognose zu verbessern. Drei Situationen zeigen, wann statistische Methoden die bessere Wahl sind oder wann keine Methode das eigentliche Problem löst.

Grenze 1: Zu dünne Datenbasis

KI-Modelle brauchen mehr historische Daten als statistische Methoden. Als Orientierungswert gelten mindestens zwei bis drei Jahre bereinigte Absatzhistorie für stabile Modelle. Liegt weniger als eineinhalb Jahre vor oder ist die Reihe von vielen Lücken durchsetzt, steigt das Overfitting-Risiko, und eine statistische Methode liefert die stabileren Ergebnisse. Der Fall der Sparse Data, also zu weniger Datenpunkte für eine zuverlässige Mustererkennung, ist ein Grenzfall für beide Ansätze, trifft KI aber härter.

Ein Sonderfall sind Neuartikel. Für sie hilft weder KI noch Statistik, weil beide auf Vergangenheitsdaten angewiesen sind, die es noch nicht gibt. Hier ist die Analogiemethode die einzige tragfähige Option, wie sie der Artikel zur Neuproduktprognose im GFGH beschreibt. Die Fraunhofer-IML-Forschung zur Optimierung der Bedarfsprognose betont, dass die Methodenwahl der Datenlage folgen muss, nicht umgekehrt.

Die Prüffrage: Haben Sie für Ihre A-Artikel mindestens 24 Monate lückenlose, bereinigte Absatzhistorie?

Grenze 2: Stabile Nachfrage ohne externe Treiber

Für Artikel mit stabiler, gut prognostizierbarer Nachfrage liefern statistische Methoden bereits sehr gute Ergebnisse. Das sind die X-Artikel aus der ABC-XYZ-Systematik, deren Nachfrage einem konstanten oder klaren Saisonmuster folgt. Hier bringt KI keinen messbaren Forecast Value Added, also keine Verbesserung der Prognosequalität gegenüber der einfachen Ausgangsprognose. Der Forecast Value Added misst genau das: ob ein Planungsschritt die Prognose gegenüber einem naiven Ausgangswert wirklich verbessert.

In diesem Fall ist ein KI-Modell überdimensioniert. Es erzeugt zusätzlichen Implementierungs- und Pflegeaufwand, ohne bessere Prognosen zu liefern. Als Orientierungswert gilt: Wenn der mittlere prozentuale Prognosefehler, gemessen als MAPE, für diese Artikel bereits niedrig liegt, ist der Wechsel zu KI selten gerechtfertigt. Die bessere Investition ist dann, die statistische Methode sauber zu pflegen, statt sie zu ersetzen.

Die Prüffrage: Kennen Sie den aktuellen MAPE Ihrer stabilen A-Artikel, und wissen Sie, wie viel Verbesserung überhaupt möglich wäre?

Grenze 3: Fehlende Erklärbarkeit als Akzeptanzblockade

Die dritte Grenze ist keine methodische, sondern eine der Akzeptanz. KI-Modelle gelten oft als Blackbox: Der Disponent sieht das Ergebnis, aber nicht die Begründung. Fehlt die Erklärbarkeit, also die Fähigkeit des Systems, nachvollziehbar zu machen, welche Faktoren zu welcher Prognose geführt haben, sinkt das Vertrauen. Die Folge ist eine hohe Override-Rate, weil Disponenten Prognosen überschreiben, die sie nicht nachvollziehen können, auch wenn diese richtig sind.

Damit verliert die beste Prognose ihren Wert, bevor sie wirkt. Die PWC Digital Supply Chain Survey 2025 nennt Erklärbarkeit als einen der wichtigsten Akzeptanzfaktoren für KI-gestützte Planung. Eine Explainability-Funktion, die pro Artikel die wichtigsten Einflussfaktoren zeigt, ist deshalb keine Kür, sondern eine Mindestanforderung. Wie sich Vertrauen in systemgenerierte Vorschläge aufbaut, behandelt der Artikel zum Umgang mit Bestellvorschlägen, die Funktionsanforderungen an eine Lösung der Artikel zur Demand-Planning-Software.

Die Prüffrage: Könnten Ihre Disponenten einer Prognose vertrauen, deren Zustandekommen sie nicht sehen?

KI-Absatzprognose einführen oder nicht? Drei Kriterien für die eigene Entscheidung

Die Entscheidung für oder gegen KI-Prognose ist keine Technologiefrage, sondern eine Eignungsfrage. Drei Kriterien helfen, den eigenen Kontext einzuordnen, bevor überhaupt eine Lösung betrachtet wird. Sie lassen sich nacheinander prüfen, und schon eine klare Antwort verändert die Richtung der Entscheidung.

Kriterium 1: Nachfragevariabilität und externe Treiber

Das erste Kriterium betrifft die Struktur der eigenen Nachfrage. Entscheidend ist, welcher Anteil der A-Artikel eine hohe Nachfragevariabilität hat und wie viel davon nachweislich durch externe Signale getrieben ist. Als Orientierungswert gilt: Wenn ein erheblicher Teil der umsatzstarken Artikel hohe Variabilität mit externen Treibern zeigt, hat KI-Prognose strukturellen Mehrwert.

Ist die Variabilität dagegen gering oder vollständig durch bekannte Saisonmuster erklärbar, reicht eine statistische Methode. Der Variationskoeffizient aus der ABC-XYZ-Analyse ist hier das praktische Messinstrument, um Artikel objektiv einzuordnen, statt nach Gefühl zu entscheiden. Die Fraunhofer-IML-Forschung zum Machine Learning verweist auf die Nachfragestruktur als primäres Auswahlkriterium.

Die Prüffrage: Welcher Anteil Ihrer A-Artikel hat hohe Variabilität, und welcher davon ist durch externe Signale erklärbar?

Kriterium 2: Reife der Datenbasis

Das zweite Kriterium ist die Datenbasis, und es ist ein hartes Ausschlusskriterium. Die Mindestanforderung für KI sind als Orientierungswert 24 bis 36 Monate bereinigte Absatzhistorie, mit gekennzeichneten Stockouts und Promotions und ohne größere Strukturbrüche. Ist diese Grundlage nicht vorhanden, rechnet auch das beste Modell auf verzerrten Daten.

In diesem Fall ist die Reihenfolge eindeutig: erst die Datenbasis bereinigen, dann KI evaluieren. Wer diesen Schritt überspringt, kauft eine Lösung, die er noch nicht sinnvoll nutzen kann, und riskiert eine Enttäuschung, die intern schwer zu korrigieren ist. Die BCG-Studie Supply Chain Planning 2026 hält fest, dass Datenqualität und Prozessreife über den Nutzen entscheiden, nicht die Wahl des Modells. Wie die Datenbasis geprüft und aufbereitet wird, behandelt der Artikel zur Datenbasis für KI-Absatzprognosen.

Kriterium 3: Prozessreife und Erklärbarkeit

Das dritte Kriterium betrifft die Organisation. Eine KI-Prognose entfaltet Mehrwert nur, wenn ein Planungsprozess sie tatsächlich in Entscheidungen übersetzt. Fehlt ein strukturierter Abgleich zwischen Vertrieb, Einkauf und Disposition, bleibt die beste Prognose folgenlos. Der Artikel zu S&OP im Mittelstand beschreibt, wie sich dieser Abstimmungsprozess ohne Großkonzern-Aufwand aufbauen lässt.

Hinzu kommt die Erklärbarkeit als technische Mindestanforderung. Ohne nachvollziehbare Begründung entsteht keine Akzeptanz, und ohne Akzeptanz keine Nutzung. Prozessreife und Erklärbarkeit gehören deshalb zusammen: Das eine sorgt dafür, dass die Prognose organisatorisch ankommt, das andere dafür, dass die Menschen ihr vertrauen. Welche Funktionsanforderungen daraus für eine Softwareauswahl folgen, behandeln der Artikel zu Demand Planning im Mittelstand.

Die Prüffrage: Hat Ihr Team den Prozess, um KI-Prognosen systematisch in Bestellentscheidungen zu überführen, oder fehlt dafür noch die Demand-Planning-Grundlage?

Nicht ob KI, sondern wann KI

KI-Absatzprognose ist kein Allheilmittel, aber in den richtigen Situationen messbar überlegen. Ob der eigene Betrieb dazugehört, entscheidet sich an drei Kriterien: einer Nachfrage mit hoher Variabilität und externen Treibern, einer bereinigten Datenbasis und einer Prozessreife, die Erklärbarkeit einschließt. Wer alle drei erfüllt, hat gute Voraussetzungen. Wer eines verfehlt, weiß, was zuerst zu tun ist.

Drei Sofortschritte lohnen sich. Erstens den Anteil der A-Artikel mit hoher Nachfragevariabilität bestimmen, als erste Einschätzung des KI-Potenzials. Zweitens die Datenbasis prüfen: Sind 24 Monate bereinigte Absatzhistorie mit gekennzeichneten Stockouts und Promotions vorhanden? Drittens die Prozessreife einschätzen: Gibt es einen Planungsprozess, der KI-Prognosen in Bestellentscheidungen übersetzt?

Die Frage ist nie, ob KI generell besser ist als Statistik. Sie ist, ob ein Werkzeug zur eigenen Anforderung passt. Wer alle drei Fragen mit Ja beantwortet, für den ist ein Pilot der nächste logische Schritt. Wer eine mit Nein beantwortet, hat mit dieser Antwort die eigentliche Aufgabe schon gefunden, und sie heißt nicht KI, sondern Datenbasis oder Prozess. Erst wenn die Grundlagen stehen, entscheidet die Technologie über das Ergebnis.

Weiterführende Quellen

FAQ

Was ist der Unterschied zwischen KI-Prognose und statistischer Absatzprognose?

Eine statistische Prognose beruht auf mathematisch definierten Modellen wie exponentieller Glättung, Holt-Winters oder ARIMA. Sie ist transparent, gut dokumentiert und für stabile, saisonale Muster sehr geeignet. Eine KI-Prognose beruht auf Machine-Learning-Modellen, die nicht-lineare Muster, Wechselwirkungen und externe Signale erkennen, ohne dass diese Zusammenhänge explizit programmiert werden. Keine der beiden ist generell besser. Statistische Methoden sind für stabile Nachfrage die richtige Wahl, KI-Modelle für hohe Variabilität mit externen Treibern und große Sortimente.

Wann ist KI-Prognose besser als statistische Methoden?

KI-Prognose ist überlegen, wenn drei Bedingungen zusammenkommen: eine hohe Nachfragevariabilität, ein nachweisbarer Einfluss externer Signale wie Wetter oder Promotions und ein großes Sortiment mit unterschiedlichen Mustern je Kategorie. In diesen Fällen kann KI nicht-lineare Zusammenhänge und externe Treiber nutzen, die statistische Methoden nur schwer abbilden. Bei stabiler Nachfrage ohne externe Einflüsse liefert eine statistische Methode dagegen vergleichbar gute Ergebnisse bei geringerem Aufwand, dort ist KI überdimensioniert.

Was ist Forecast Value Added, und wie messe ich den Mehrwert einer KI-Prognose?

Forecast Value Added (FVA) misst, ob ein Planungsschritt die Prognosequalität gegenüber einem einfachen Ausgangswert verbessert. Als Ausgangswert dient meist ein naiver Forecast, etwa der Absatz der Vorperiode. Ein Planungsschritt hat positiven FVA, wenn seine Prognose näher am tatsächlichen Absatz liegt als dieser naive Wert. Für den KI-Mehrwert bedeutet das: KI lohnt sich, wenn sie mehr FVA liefert als die bisherige statistische Methode. Liegt der FVA-Unterschied nahe null, bringt der Wechsel keinen messbaren Vorteil und rechtfertigt den Aufwand nicht.

Was ist Overfitting, und warum ist es bei dünner Datenbasis ein Problem?

Overfitting ist ein Fehler, bei dem ein Machine-Learning-Modell die Trainingsdaten zu genau lernt, einschließlich zufälliger Schwankungen, und bei neuen Daten schlechter abschneidet. Das Modell hat dann die Vergangenheit auswendig gelernt, statt die zugrunde liegenden Muster zu erfassen. Bei dünner Datenbasis ist das Risiko besonders hoch, weil zu wenige Datenpunkte vorliegen, um echte Muster von Zufall zu trennen. Deshalb brauchen KI-Modelle mehr Daten als statistische Methoden. Bei weniger als eineinhalb bis zwei Jahren Historie liefert eine einfachere statistische Methode oft die stabileren Prognosen.

Was bedeutet Erklärbarkeit bei KI-Prognosen?

Erklärbarkeit, auch Explainability genannt, ist die Fähigkeit eines Systems, für jede Prognose nachvollziehbar zu machen, welche Faktoren zu welchem Wert geführt haben, etwa Wetter, Aktion, Saison oder Trend. Sie ist wichtig, weil KI-Modelle sonst als Blackbox erscheinen: Der Disponent sieht das Ergebnis, aber nicht die Begründung. Fehlt die Erklärbarkeit, sinkt das Vertrauen, und die Override-Rate steigt, weil Prognosen überschrieben werden, auch wenn sie richtig sind. Eine Treiber-Ansicht pro Artikel ist deshalb eine Mindestanforderung für die Akzeptanz im Betrieb.

Wie viele Daten brauche ich für eine sinnvolle KI-Absatzprognose?

Als Orientierungswert gelten 24 bis 36 Monate bereinigte Absatzhistorie für stabile KI-Modelle. Bereinigt bedeutet, dass Stockout-Perioden nicht als Nullnachfrage erscheinen, Promotionszeiträume gekennzeichnet sind und keine größeren Strukturbrüche die Reihe verzerren. Wichtiger als die reine Länge ist die Qualität: Eine kürzere, saubere Historie ist wertvoller als eine lange mit vielen Lücken. Liegt die Datenbasis darunter oder ist sie stark lückenhaft, sollte sie zuerst bereinigt werden, bevor eine KI-Prognose evaluiert wird, weil das Modell sonst auf verzerrter Grundlage rechnet.

Kann KI-Prognose auch bei Neuartikeln ohne Absatzhistorie helfen?

Nein, bei echten Neuartikeln ohne eigene Historie hilft KI nicht, weil sie wie jede datenbasierte Methode auf Vergangenheitsdaten angewiesen ist, die noch nicht existieren. Für Neuartikel ist die Analogiemethode die tragfähige Option: Ein bestehender Artikel mit ähnlichem Nachfragemuster dient als Schätzgrundlage. Sobald genügend eigene Absatzdaten vorliegen, üblicherweise nach mehreren Monaten, kann die Prognose schrittweise auf statistische oder KI-Methoden umgestellt werden. KI entfaltet ihren Wert also erst, wenn der Artikel eine belastbare eigene Historie aufgebaut hat.