Incrementality für PMax: Wie man Holdout-Tests aufsetzt und Ergebnisse richtig interpretiert

Performance-Max-Kampagnen gehören inzwischen zu den wichtigsten Instrumenten moderner Google-Ads-Strategien. Gleichzeitig erschwert der hohe Automatisierungsgrad zu verstehen, welchen tatsächlichen Mehrwert diese Kampagnen erzeugen. Marketingteams sehen oft steigende Conversion-Zahlen, ohne sicher beurteilen zu können, ob diese Conversions wirklich durch Werbung entstanden sind oder ohnehin erfolgt wären. Incrementality-Tests helfen dabei, den tatsächlichen zusätzlichen Effekt von Werbung zu messen. Holdout-Experimente gelten als eine der zuverlässigsten Methoden, um den realen Beitrag von PMax-Kampagnen zu bestimmen und echte Nachfrage von Attributions-Effekten zu unterscheiden.

Warum Incrementality bei Performance-Max-Kampagnen entscheidend ist

Performance Max nutzt Machine-Learning-Algorithmen, um Budgets automatisch über verschiedene Kanäle wie Suche, Display, YouTube, Shopping und weitere Google-Inventare zu verteilen. Diese Automatisierung verbessert die Effizienz, erschwert jedoch die Unterscheidung zwischen tatsächlich neu erzeugter Nachfrage und Conversions, die auch ohne Werbung stattgefunden hätten. Klassische Attributionsberichte überschätzen häufig die Wirkung von Kampagnen, da sie Interaktionen im späteren Verlauf der Customer Journey überbewerten.

Incrementality-Tests konzentrieren sich auf den Unterschied zwischen zwei vergleichbaren Gruppen: einer Gruppe, die Werbung sieht, und einer Gruppe, die bewusst davon ausgeschlossen wird. Die Leistungsdifferenz zwischen diesen Gruppen zeigt, wie viele zusätzliche Conversions tatsächlich durch Werbung entstanden sind. Anders formuliert: Incrementality zeigt, welche Ergebnisse verschwinden würden, wenn eine Kampagne nicht mehr aktiv wäre.

Gerade bei PMax-Kampagnen ist diese Unterscheidung besonders wichtig. Diese Kampagnen erfassen häufig Marken-Suchanfragen, Remarketing-Traffic oder wiederkehrende Nutzer. Ohne Incrementality-Analyse kann es so aussehen, als würde die Kampagne Wachstum erzeugen, obwohl sie lediglich Nutzer erreicht, die ohnehin konvertiert hätten.

Typische Messprobleme bei automatisierten Kampagnen

Automatisierung reduziert zwar manuellen Aufwand, führt aber auch zu geringerer Transparenz. Performance Max entscheidet eigenständig, wo Anzeigen erscheinen und welche Zielgruppen angesprochen werden. Dadurch wird es schwieriger zu erkennen, welcher Teil des Systems tatsächlich Wert schafft. Standardberichte zeigen selten, ob eine Kampagne das Verhalten eines Nutzers wirklich beeinflusst hat.

Ein weiteres Problem entsteht durch Überschneidungen zwischen verschiedenen Kampagnen. Beispielsweise können Brand-Search-Kampagnen, Remarketing-Kampagnen und PMax-Kampagnen gleichzeitig dieselben Nutzer erreichen. Attributionsmodelle schreiben Conversions häufig der letzten Interaktion zu, was die Bewertung der tatsächlichen Leistung verzerren kann.

Incrementality-Experimente lösen dieses Problem durch einen kontrollierten Vergleich. Anstatt nur Attributionsdaten zu analysieren, beobachten Marketingteams reale Unterschiede im Verhalten von Gruppen mit und ohne Werbekontakt. Dadurch entsteht ein klareres Bild über den tatsächlichen Effekt der Kampagne.

Wie man Holdout-Tests für PMax-Kampagnen einrichtet

Ein Holdout-Test teilt Traffic oder Zielgruppen in zwei Segmente: eine Testgruppe, die Werbung erhält, und eine Kontrollgruppe, die davon ausgeschlossen wird. Beide Gruppen sollten hinsichtlich Größe, Verhalten und historischer Leistung möglichst ähnlich sein. Je vergleichbarer diese Gruppen sind, desto zuverlässiger wird das Experiment.

Bei PMax-Kampagnen wird häufig ein geografischer Holdout-Test verwendet. Bestimmte Regionen erhalten weiterhin Werbung, während andere Regionen bewusst ausgeschlossen werden. Nach einem festgelegten Zeitraum lassen sich Kennzahlen wie Conversions, Umsatz oder Registrierungen zwischen beiden Gruppen vergleichen.

Auch die Dauer des Tests spielt eine wichtige Rolle. Experimente, die nur wenige Tage laufen, liefern selten stabile Ergebnisse, da normale Schwankungen das Resultat verfälschen können. In vielen Fällen sollte ein Holdout-Test mindestens drei bis vier Wochen laufen, damit sich der Kampagnen-Algorithmus stabilisieren kann und aussagekräftige Daten entstehen.

Best Practices für ein zuverlässiges Testdesign

Zufällige Zuweisung ist ein entscheidender Faktor bei der Aufteilung der Test- und Kontrollgruppen. Wenn Regionen mit unterschiedlicher Kaufkraft oder saisonalen Effekten ungleich verteilt werden, spiegeln die Ergebnisse möglicherweise wirtschaftliche Unterschiede wider und nicht den Einfluss der Werbung.

Während der Testphase sollte auch das Budget möglichst stabil bleiben. Größere Änderungen bei Budget, Creatives oder Zielgruppensignalen können zusätzliche Variablen einführen, die das Ergebnis verfälschen. Idealerweise bleibt die Kampagnenstruktur während des gesamten Experiments unverändert.

Darüber hinaus empfiehlt es sich, mehrere Leistungskennzahlen gleichzeitig zu analysieren. Conversions, Umsatz pro Nutzer und Kosten pro Akquisition liefern zusammen ein deutlich aussagekräftigeres Bild über den tatsächlichen Mehrwert der Kampagne als eine einzelne Kennzahl.

Wie man Ergebnisse von Incrementality-Tests richtig interpretiert

Nach Abschluss des Tests werden die Ergebnisse der Test- und Kontrollgruppe miteinander verglichen. Die zentrale Frage lautet, wie groß der Unterschied zwischen beiden Gruppen ist. Wenn die Regionen mit PMax-Werbung deutlich mehr Conversions erzielen als die Holdout-Regionen, stellt diese Differenz den inkrementellen Effekt dar.

Ein einfaches Beispiel: Wenn die Testregionen 1.200 Conversions erzielen und die Kontrollregionen unter vergleichbaren Bedingungen 1.000 Conversions erreichen, dann hat die Kampagne rund 200 zusätzliche Conversions erzeugt. Diese Zahl repräsentiert den tatsächlichen zusätzlichen Effekt der Werbung.

Ebenso wichtig ist jedoch der Kostenfaktor. Die inkrementellen Kosten pro Akquisition ergeben sich aus den zusätzlichen Werbekosten geteilt durch die zusätzlichen Conversions. Diese Kennzahl zeigt, ob das Wachstum zu einem wirtschaftlich sinnvollen Preis erzielt wurde.

Wie Incrementality-Erkenntnisse in Marketingstrategien umgesetzt werden

Die Ergebnisse solcher Tests helfen bei strategischen Entscheidungen über Budgetverteilung und Kampagnenstruktur. Wenn eine PMax-Kampagne eine starke inkrementelle Wirkung bei akzeptablen Kosten zeigt, kann eine Budgeterhöhung sinnvoll sein. Umgekehrt kann eine geringe inkrementelle Wirkung darauf hindeuten, dass die Kampagne hauptsächlich bestehende Nachfrage abfängt.

Incrementality-Analysen zeigen außerdem, in welchen Bereichen Automatisierung besonders effektiv arbeitet. Wenn zusätzliches Wachstum vor allem bei neuen Nutzersegmenten oder nicht markenbezogenem Traffic entsteht, können Marketingteams diese Signale stärker priorisieren.

Regelmäßige Tests bleiben dennoch wichtig, da sich Marktbedingungen kontinuierlich verändern. Wettbewerbsdruck, saisonale Effekte und Veränderungen im Nutzerverhalten können die inkrementelle Leistung beeinflussen. Durch wiederkehrende Holdout-Experimente behalten Marketingteams den tatsächlichen Beitrag ihrer PMax-Kampagnen im Blick.