Wat is attributie precies? En op welke manier schrijft het data-driven attributiemodel waarde toe aan kanalen binnen de customer journey? Deze twee vragen beantwoorden wij in dit artikel over de verschillende attributiemodellen en een uitgebreide toelichting over het data-driven attributiemodel. Aan de hand van een praktijkvoorbeeld.

Wat is attributie?

Attributie is een methodiek waarmee online marketeers waarde toekennen aan elk contactmoment dat een bijdrage heeft geleverd aan een uiteindelijk conversie, zoals het online kopen of afnemen van een dienst.  Zodoende levert conversie-attributie een overzicht op van de invloed die diverse ‘touchpoints’ en interacties met online kanalen gehad hebben op het keuzeproces van de consument.

Één van de attributiemodellen die gebruikt wordt is het data-driven attributiemodel. Hiermee wordt aan de hand van data waarde toegekend aan contactpunten door te evalueren in welke mate elk contactpunt bijdraagt aan de conversie. Dit is een vernieuwd model van Google, waarbij de impact van het contactpunt gemeten wordt op basis van beschikbare data.

Deze (veranderingen in) prestaties kunnen vervolgens gebruikt worden om de online strategie te bepalen en online marketing kanalen of campagnes aan te sturen.

Verschillende attributiemodellen voor online marketing

Er zijn verschillende modellen binnen online marketing, die bepalen hoe waarde wordt geattribueerd. Een aantal hiervan zijn te zien in onderstaande afbeelding.

De keuze voor een attributiemodel verschilt. Zo kan de keuze bijvoorbeeld gebaseerd zijn op basis van de activiteiten van uw bedrijf, of op basis van de kanalen die u inzet. Binnen Google Analytics wordt meestal het ‘laatste niet-direct klik’ attributiemodel toegepast. Binnen dit model wordt de volledige waarde toegekend aan het laatste kanaal waaruit door is geklikt, voorafgaand aan de conversie.

De Customer Journey en het last-click attributiemodel

De vier fases van de customer journey

Bij OrangeValley hanteren wij vier customer journey fasen waarin de doelgroep zich kan bevinden:

  • Touch: Waarin de doelgroepen in aanraking komen met het merk;
  • Tell: De fase waarin het merk voor doelgroepen top of mind moet blijven of aangespoord wordt een aankoop te overwegen;
  • Sell: De fase om de doelgroep te overtuigen en de daadwerkelijke aankoop te voltooien;
  • Care De fase waarin de relatie met bestaande klanten wordt onderhouden

Voor attributie worden de eerste drie fasen van de customer journey meegenomen, aangezien de conversie wordt gedaan (lees: afgesloten) in de derde fase.

Aan de hand van deze conversie kan waarde worden toegekend. De care fase kan, afhankelijk van het product of de service, overgaan in een nieuwe Touch – Tell – Sell of Tell – Sell. Dit kan bijvoorbeeld doordat een klant na een aankoop is ingeschreven voor de e-mail nieuwsbrief en zo een relatie met het merk onderhoudt. Een klant kan naar aanleiding van de e-mail een blog lezen, op de hoogte worden gehouden van nieuwe collecties of aanvullende producten toegereikt krijgen. De nieuwsbrief kan aanleiding zijn voor de ontvanger om over te gaan tot een aankoop van een aanvullend product.

Het belangrijkste binnen de customer journey lijkt in bovenstaand voorbeeld de derde fase te zijn, aangezien daar daadwerkelijk het product of de service gekocht wordt. Om die reden wordt vaak waarde toegeschreven aan contactpunten in deze laatste fase met het laatste niet-direct klik attributiemodel. Echter, zónder de contactpunten die daarvoor optraden, zou deze conversie wellicht niet hebben plaatsgevonden. Daarom is het belangrijk om ook te kijken naar de kanalen die ook van waarde zijn tijdens de ‘reis’ naar de uiteindelijke conversie. Het data-driven attributiemodel maakt het mogelijk om deze kanalen waarde toe te kennen.

Voorbeeld: Schoenen, de customer journey en het data-driven attributiemodel

Stel u zich voor dat u, tijdens het scrollen door uw Facebook timeline, een advertentie tegenkomt met nieuwe hardloopschoenen. Een paar dagen later leest u een blog met daarin een aantal sportoutfits met schoenen van dit merk. Vervolgens besluit u op uw vrije avond na het sporten op zoek te gaan naar nieuwe hardloopschoenen, waarbij u achtereenvolgens op de termen ‘hardloopschoenen’, ‘zwarte hardloopschoenen’ en een specifieke merknaam voor sportschoenen zoekt. Hierdoor komt u terecht op pagina’s met veel verschillende schoenen, al weet u nog niet precies wat u zoekt. U besluit de zoektocht even te staken. Na twee dagen besluit u na een rondje hardlopen weer verder te gaan met uw zoektocht. Uw huidige paar schoenen rent immers toch niet zo lekker. U wilt dan ook graag hardloopschoenen met goede demping en zoekt op ‘hardloopschoenen met goede demping’. U komt vervolgens een model sportschoenen tegen dat interesse wekt en u zoekt op dit model schoenen via ‘merk X ultrabounce’. Aangezien u nu niet in de gelegenheid bent om deze te kopen, besluit u nog even te wachten met de aankoop. Weer twee dagen later zit u ‘s ochtends in de trein, wanneer u zich beseft dat u de schoenen nu wel echt moet kopen, wil u de schoenen nog inlopen voor de volgende hardloopwedstrijd. U zoekt op ‘ultrabounce’, want dat was het model waar u interesse in had. U komt een vriend tegen in de trein en vergeet dat u aan het shoppen was. Wanneer u ‘s avonds opnieuw in de trein zit en door de Facebook timeline scrollt, ziet u ineens de schoenen die u ‘s ochtends had bekeken. U besluit de schoenen snel te bestellen, zodat u de schoenen nog op tijd binnen hebt voor uw volgende hardloopsessie.

Aan de hand van dit voorbeeld (hierboven samengevat in een visualisatie) zijn er verschillende vragen die u wil beantwoorden wanneer u met online marketing voor het schoenenmerk verantwoordelijk bent. Hoe bepaalt u hoe waardevol elk touchpoint binnen deze customer journey was? En wat voor invloed heeft het als een van deze contactpunten niet op zou zijn getreden? Hoeveel waarde voegt het artikel op de blog toe? Dat zijn een aantal vragen waarop u antwoord wil krijgen wanneer u de bijdrage van uw online marketing kanalen wil optimaliseren.

De waardetoekenning van data-driven attributie
De vraag is nu: Hoe wordt een data-driven attributiemodel (en daarmee de waardetoekenning) bepaald? Bij het data-driven attributiemodel wordt de waarde proportioneel bepaald, door het weglaten van het contactpunt in het conversiepad. Bijvoorbeeld: Wat is de verandering in de conversieratio wanneer bezoekers niet met display advertenties in aanraking gekomen zijn? Dit wordt ook wel een counterfactuele analyse genoemd.

Om het gehele data-driven attributiemodel samen te stellen, worden vier lagen doorlopen: (1) exposure, (2) frequency, (3) recency en (4) frequency at each value of recency. Om deze vier lagen uit te leggen wordt gebruik gemaakt van de voorbeeldsituatie met de schoenen. Hierin komen meerdere contactpunten voor die verdeeld zijn over display advertising, generic paid search, branded paid search, email en retargeting .

Laag 1 – Exposure

In de eerste laag wordt waarde toegekend op basis van de verandering van de conversieratio wanneer het kanaal zich niet voordoet in het conversiepad. Het voorbeeld van het kopen van schoenen levert een conversieratio van 5 procent op. Stel dat in dit conversiepad generic paid search niet plaatsvindt, dan zou het om een conversieratio van 2.5 procent gaan, gezien de beschikbare data. Er wordt in dit geval een waarde van (5 procent minus 2.5 procent is) 2.5procent toegekend aan generic paid search, voor het totaal van de contactpunten van dit kanaal. Generic paid search komt in dit conversiepad vier keer voor, dus wordt er per contactpunt (2.5 procent gedeeld door vier) 0,625 procent toegeschreven.

In de eerste laag wordt waarde toegekend op basis van de verandering van de conversieratio wanneer het kanaal zich niet voordoet in het conversiepad. Het voorbeeld van het kopen van schoenen levert een conversieratio van 5 procent op. Stel dat in dit conversiepad generic paid search niet plaatsvindt, dan zou het om een conversieratio van 2.5 procent gaan, gezien de beschikbare data

Hetzelfde proces wordt vervolgens voor elk kanaal doorlopen. Hierna worden scores genormaliseerd, zodat het uiteindelijke pad uitkomt op een totale waarde van 1 (ook wel 100 procent).

Genormaliseerd:

Scores worden genormaliseerd, zodat het uiteindelijke pad uitkomt op een totale waarde van 1 (ook wel 100 procent)

Laag 2 – Frequency

In deze laag wordt de waarde gebaseerd op hoe de mogelijkheid voor een conversie verandert, wanneer een contactpunt van hetzelfde soort kanaal zich een bepaald aantal keer voordoet. In onderstaand voorbeeld levert vier keer generic paid search in het pad een conversieratio op van vijf procent. Wanneer deze maar 3 van de 4 keer voorkomt, is het conversieratio 4 procent. Dit wil zeggen dat de verandering 1 procent is door het weglaten van de vierde generic paid search.

In dit voorbeeld levert vier keer generic paid search in het pad een conversieratio op van vijf procent.

Laag 3 – Recency

In de derde laag wordt waarde toegekend op basis van het voordoen van het contactpunt in een specifiek tijdsbestek. Als generic paid search contactpunten worden weggehaald uit een deel van het pad (in dit geval recency 5-7), verlaagt het conversieratio met anderhalf procent. Bij recency zijn bepaalde ranges samengesteld, bijvoorbeeld 5-7 dagen, om gebrek van data te reduceren en waarschijnlijkheid te vergroten. Doordat het contactpunt op een ander moment plaatsvindt, kan de impact op de eindconversie verschillen.

Bij recency zijn bepaalde ranges samengesteld, bijvoorbeeld 5-7 dagen, om gebrek van data te reduceren en waarschijnlijkheid te vergroten. Doordat het contactpunt op een ander moment plaatsvindt, kan de impact op de eindconversie verschillen.

Laag 4 – Frequency at each value of recency

In de laatste laag wordt waarde toegekend op basis van hoe vaak een contactpunt met een kanaal zich voordoet binnen een bepaald tijdsbestek. Wanneer generic paid search tweemaal voorkomt binnen de recency van 5-7, zorgt dit voor een conversieratio van vijf procent. Wanneer generic paid search eenmalig voorkomt binnen dezelfde recency, zorgt dit voor een conversieratio van vier procent. Het toevoegen van het contactpunt generic paid search binnen het tijdsbestek 5-7 zorgt dus voor een verhoging van het conversieratio van een procent.

Het toevoegen van het contactpunt generic paid search binnen het tijdsbestek 5-7 zorgt in dit voorbeeld voor een verhoging van het conversieratio van een procent.

Net als bij recency, kan bij frequency at each value of recency de waarde per contactpunt verschillen .

Toepassen van het data-driven attributiemodel

Voorafgaand is beschreven hoe deze lagen worden doorlopen voor een kanaal (generic paid search) binnen een specifiek pad. Attribution 360 is een nieuw product van Google, waarbij het doel is om data-driven attributiemodel toe te passen. Met behulp van Attribution 360 kan het doorlopen van de lagen gedaan worden voor alle kanalen en voor alle mogelijke paden. Hierbij wordt echter wel rekening gehouden met paden waar minder bezoekers via komen. Zo worden minder populaire paden berekend met behulp van wereldwijde gemiddeldes. Er zijn nog een aantal punten die belangrijk zijn bij het toepassen van het data-driven attributiemodel, die ik kort zal benoemen.

Niet-converterende paden

Attribution 360 maakt het ook mogelijk om niet-converterende paden mee te nemen. Dit is interessant, aangezien de meeste paden niet resulteren in een conversie. Hierdoor worden er inzichten verkregen over welke samenstellingen van paden minder presteren voor het behalen van conversies. Dit kan vervolgens gebruikt worden voor het bepalen van de inzet van kanalen.

Finalized windows

Bij data-driven attributie komt het voor dat er al een pad is gestart, maar dat de conversie nog niet heeft plaatsgevonden. Daarom geldt bij het data-driven attributiemodel een periode van 30 dagen waarin de conversie alsnog plaats kan vinden. Het is dus belangrijk om nog een maand te wachten met analyseren voordat er conclusies worden getrokken over de prestaties. Zo kunt u vanaf 1 mei gaan analyseren wat er in de maand maart is gebeurd.

Kostendata

In Attribution 360 kan er ook kostendata worden toegevoegd, waardoor budgetten voor campagnes geoptimaliseerd kunnen worden.

Impact van het toepassen van het data-driven attributiemodel

Kiezen voor een ander attributiemodel is overigens niet simpelweg het aanklikken van een ander model. De keuze voor het data-driven attributiemodel vraagt overigens om een andere kijk op het conversiepad en daarmee om een consequente en doordachte implementatie. In dit artikel wordt vooral beschreven hoe het data-driven attributiemodel werkt, maar daarnaast is het belangrijk om bewust te zijn van de impact op andere aspecten. Hierbij kunt u denken aan veranderingen in de data, de manier van analyse en de samenwerking tussen verschillende contactpunten binnen de customer journey.

Op dit moment is het mogelijk om te kijken hoe het data-driven model zou werken binnen Google Analytics 360 via de Model Comparison Tool. Echter zijn er binnen deze tool enkele beperkingen, zoals de zichtbaarheid van alleen de laatste vier contactpunten en de grens van minimaal 400 conversies in de afgelopen maand.

Conclusie

In vergelijking met last non-direct click geeft het gebruik van data-driven een ander beeld. Met behulp van het last non-direct click zou alle waarde van het conversiepad van het voorbeeld worden toegeschreven aan de remarketing, de laatste klik. Nu, door middel van het data-driven attributiemodel, wordt deze waarde verdeeld over de verschillende stappen in de customer journey, waaronder generic paid search. Hierdoor is er veel meer mogelijk wat betreft het inzichten verwerven middels data. Zo worden er bijvoorbeeld niet-converterende paden ook meegenomen en kan kostendata worden toegevoegd.

OrangeValley is een van de drie erkende Attribution 360 partners in Nederland.