Model atrybucji oparty na danych Google nie jest doskonały, ale jest postępem

Myślenie Oparte Na Danych“jest napisany przez członków społeczności medialnej i zawiera świeże pomysły na cyfrową rewolucję w mediach.

Dzisiejszy felieton napisał Dymitr Kazanski, szef produktu na Amerykę Północną w MGID.

Ostatnie kliknięcie jest najczęściej używanym atrybutem. Dlaczego? Ponieważ jest to bardzo proste – ale jest również wyraźnie wadliwe.

Na ścieżkę użytkownika w lejku wpływa wiele punktów kontaktu, w tym wyświetlenia reklam, które są wyświetlane lub słyszane, a nie klikane. Przypisanie wszystkich punktów do ostatniego kliknięcia jest tak dobre, jak przypisanie wszystkich punktów za poziom sprawności do ostatniego treningu.

Założę się, że nie pamiętasz, kiedy ostatnio kliknąłeś reklamę Geico. Ale jeśli mieszkasz w USA, możesz łatwo wypełnić puste miejsca w następującym zdaniu: “15-minutowe połączenie może zaoszczędzić 15% lub więcej na ___ ____________.”

Następnym razem, gdy będziesz potrzebować ubezpieczenia samochodu, Najprawdopodobniej niż nie, wpiszesz w przeglądarce “Geico”, po czym możesz kliknąć pierwszy link, który zobaczysz: link AdWords. Oferta ubezpieczeniowa, którą otrzymujesz, będzie liczona jako lead przez Geico, ale oto ważne pytanie: czy reklama, którą kliknąłeś, zasługuje na pełne uznanie za lead?

Google AdWords, który obsługuje sześć modeli atrybucji, ostatnio zmienił domyślne z ostatniego kliknięcia na złożony model Google nazywa ” data-driven attribution.”Nazwa jest raczej niefortunna. Wszystkie modele atrybucji, w tym ostatnie kliknięcie, są oparte na danych. Google równie dobrze może nazwać to modelem atrybucji “zasilanym energią elektryczną”.

Zasadniczo idea atrybucji opartej na danych brzmi świetnie. Przykład podany przez Google wydaje się wskazywać model, który koreluje konwersje z określonymi zdarzeniami, takimi jak kliknięcia poszczególnych reklam. Kredyt jest następnie rozłożony na zdarzenia, które najbardziej korelują z konwersjami. 

Niestety niewiele wiadomo o tym, jak model jest zbudowany i jak dokładnie działa. To czarna skrzynka, która może być zasilana przez regresję lub sieć neuronową, między innymi – kto wie.

Jako ktoś, kto pracuje z modelowaniem predykcyjnym, zastanawiam się, czy model “atrybucji opartej na danych” Google uwzględnia kontekst i interakcje.

W przykładzie dostarczonym przez Google, możliwe jest, że reklama “Bike tour New York” może mieć silniejszą korelację z konwersjami niż “Bike tour Brooklyn waterfront” w całym ruchu. Jednak gdy ruch pochodzi z obszaru Nowego Jorku, bardziej konkretne reklamy, takie jak “Bike tour Brooklyn waterfront”, mogą działać lepiej. 

Po drugie, nowy domyślny model atrybucji nie wyjaśnia, w jaki sposób wyświetlenia reklam, które nie powodują kliknięć, liczą się do atrybucji, jeśli w ogóle.

Google wspomina “eksperymenty holdback” jako sposób na kalibrację modelu i osiągnięcie przyrostowości, co jest zachęcające. Moim zdaniem ściśle kontrolowane eksperymenty wstrzymujące są złotym standardem atrybucji i pomiaru przyrostowości. Działa to w następujący sposób:

  • Pewien procent, powiedzmy 10%, grupy docelowej jest powstrzymywany jako kontrola. Użytkownicy z grupy kontrolnej nie są narażeni na wyświetlanie reklam.
  • Po zakończeniu kampanii reklamodawca dzieli się listą kupujących z dostawcą.
  • Część uczestników kontroli group i tak skończy się konwersją. Różnica w procentach (i wartości pieniężnej) konwersji między grupą kontrolną a grupą narażoną reprezentuje rzeczywisty przyrost kampanii.

W praktyce to badanie atrybucji będzie trudne do wdrożenia. Zwykle wiąże się to z rozwiązywaniem tożsamości zarówno przekonwertowanych użytkowników, jak i narażonych użytkowników. To oczywiste wyzwania związane z prywatnością. Oczywiście Google nie może wykonać tego typu badań dla każdej kampanii, ale przynajmniej takie badania wydają się być wykorzystywane do kalibracji.

Nowe domyślne rozwiązanie atrybucji powinno odpowiedzieć na pytanie, który z elementów kampanii Google przyczynił się do największej liczby konwersji. Nie odpowie jednak na pytanie o przyrost ani na pytanie, które składniki łącznych wydatków reklamodawców przyniosły najwięcej konwersji.

Jest to jednak krok we właściwym kierunku.

Follow MGID (@ MGID) oraz AdExchanger (@ adexchanger ) na Twitterze.