it-roy-ru.com

Как декодировать Google Gclids

Теперь я понимаю, что первоначальным ответом на это, вероятно, будет "вы не можете" или "использовать аналитику", но я продолжу в надежде, что у кого-то есть больше понимания, чем это.

В Google AdWords с тегом "autotagging" добавляется "gclid" (предположительно "идентификатор клика Google"), чтобы перейти на рекламируемый сайт. Он появляется в веб-журнале, поскольку является параметром запроса, и он используется аналитиками, чтобы связать это посещение с рекламой/кампанией.

Я хотел бы извлечь любую полезную информацию из gclid, чтобы провести собственный анализ нашего трафика. Причины этого:

  • Статистика несовершенна, но если мы сопоставляем их, мы точно знаем, какие предположения мы сделали и как они были рассчитаны.
  • Мы можем связать данные с остальными нашими данными и получить гораздо более точную статистику по коэффициенту конверсии.
  • Нам не нужно полагаться на javascript для конверсий.

Теперь ясно, что gclid закодирован в base64 (или некотором близком варианте), и некоторые его части отличаются больше, чем другие. Кроме того, я не смог определить, к чему это относится.

Кто-нибудь знает, как я могу подойти к расшифровке, или кто-нибудь уже связал gclids с кампаниями или даже аккаунтами?

Я разговаривал с парой людей в Google, и, несмотря на их девиз "не будь злым", они совершенно не хотели обсуждать возможность разглашения этой информации даже в рамках соглашения о неразглашении. Кажется, им нравится монополия, которую они имеют над нашей веб-статистикой.

19
Draemon

Безусловно, самое простое решение - вручную пометить ваши ссылки параметрами отслеживания кампании Google Analytics (utm_source, utm_campaign, utm_medium и т.д.), А затем извлечь эти данные.

Gclid зависит не только от учетной записи AdWords/кампании/и т.д. Если вы дважды нажмете на одно и то же объявление AdWords, оно может дать вам разные gclids, потому что с этим конкретным кликом также связаны все виды данных о сессиях и затратах.

Gclid, вероятно, не на 100% случайный, правда, но я был бы очень удивлен и обеспокоен, если бы было возможно извлечь все ваши данные Adwords из этого числа. Это будет ОГРОМНЫЙ недостаток безопасности (т. Е. Произвольный пользователь может просматривать ваши данные AdWords). Скорее всего, псевдослучайный gclid создается с каждым показом, и если на это объявление нажимают, gclid регистрируется в Adwords (в ​​противном случае он выбрасывается). Затем Google Analytics использует это число для сверки данных с Adwords после факта. Кроме этого, нет никакого внутреннего значения в самом числе gclid.

Что касается вашего последнего замечания, попытка взлома или обратного инжиниринга этой информации прямо запрещена как в Условиях предоставления услуг Google Analytics, так и в Google Adwords, и является основанием для постоянного бана. Кроме того, в TOS, с которым вы согласились при подписке на эти услуги, говорится, что вы не можете использовать ваши данные так, как вам хочется. Google предоставляет бесплатный сервис, поэтому есть строки Если вам не нравится полный контроль над вашими данными, есть множество других решений. Тем не менее, вы будете платить за такой контроль.

Google зарабатывает почти все свои деньги от продажи рекламы. Adwords является их крупнейшим продуктом для зарабатывания денег. Они не собираются давать вам конфиденциальную информацию о том, как это работает. Они не знают, кто вы, или что вы собираетесь делать с этой информацией. Неважно, если вы подпишете NDA, и у них есть право обратиться к вам в суд; если вы передадите эту информацию конкуренту, ваша жизнь не будет достаточной для того, чтобы вернуть деньги, которые вы потеряли.

Извините, что сломал это вам, но "Не будь злым" или нет, Google - это бизнес, а не благотворительность. Они не стали одной из самых успешных компаний в мире, отдав свой алгоритм поиска первому парню, который попросил об этом.

23
Chris

Параметр gclid кодируется в Protocol Buffers , а затем в варианте Base64.

Смотрите это руководство по декодированию gclid и его интерпретации, включая (Apache-licensed) PHP функцию, которую вы можете использовать.

Внутри него есть три закодированных параметра, один из которых является меткой времени. Другие 2 пока не известны.

Что касается понимания того, что означают эти другие параметры, может быть полезно сравнить его с параметром ei, который закодирован очень похожим образом (в основном, буфер протокола с удаленными ключами). Параметр ei также имеет метку времени с микросекундами и двумя другими целыми числами.

17
andre

К вашему сведению, я только что опубликовал краткий анализ некоторых данных glcid с моих сайтов на этот пост . В gclid определенно есть какая-то структура, но ее трудно расшифровать.

8
Brandon Checketts

Я думаю, что вы можете получить все вкусности, связанные с gclid через Google AdWords API. В частности, вы можете запросить отчет об эффективности кликов.

https://developers.google.com/adwords/api/docs/appendix/reports#click

4
shep

Я работал над этой проблемой и в нашей компании. Мы хотели бы получить лучшее представление о том, что делают наши AdWords, но мы разочарованы ограничениями в Google Analytics.

Наше текущее решение - искать в журналах доступа Apache запросы GET, используя регулярное выражение:

.*[?&]gclid=([^$&]*)

Если это существует, то мы смотрим на строку реферера, чтобы получить ключевое слово:

.*[?&]q=([^$&]*).*

Альтернативный вариант - изменить свой веб-журнал Apache, чтобы начать регистрировать cookie-файл __utmz, который устанавливает Google, и в нем должно быть фрагмент для ключевого слова в utmctr. Google __utmz cookie, и вы сможете найти много информации.

Насколько точна строка реферера? Не 100%. Брандмауэры и устройства безопасности уберут это. Но разбирая его самостоятельно, вы получаете больше гибкости, чем Google Analytics. Было бы неплохо отправить gclid в AdWords и получить данные обратно, но эта функция не выглядит доступной.

Правка: так как я написал это, мы также создали наши собственные теги, которые добавляются к каждому URL назначения в качестве параметра запроса. Каждый тег - это просто хэш md5 текста, группы объявлений и названия кампании. Мы берем его, используя регулярное выражение из журнала доступа, и ищем его в базе данных SQL.

4
Jeff Wu

Ну, это не ответ, но подход похож на то, как вы решите любую проблему с криптографией.

Возможность 1: они просто случайные, в этом случае вы облажались. Это аналог одноразовой накладки.

Возможность 2: они "что-то значат". В этом случае вы должны контролировать окружающую среду.

  1. Получить хорошую базу данных о них. Найти gclids для вашего сайта и другие. Запишите все случаи, когда произошли все клики, и любые другие потенциально полезные данные.
  2. Взломать! Как вы уже начали, начните регрессировать собранные данные с вашими известными, и посмотрите, можете ли вы найти шаблоны, использующие методы расшифровки
  3. Начните собирать случайные gclid'ы и посмотрите, куда они вас приведут.

Я бы не надеялся, что это будет успешно, но я желаю вам удачи!

1
Gregg Lind

Вот мысль: есть ли вероятность, что gclid - это просто криптографический хеш, а именно bit.ly или какой-либо другой сокращатель URL?

В этом случае содержимое хешированного текста будет записано в базу данных и заменено уникальным идентификатором.

В конце концов, gclid сокращает кучу длинных текстов.

Принимает этот пример: www.example.com?utm_source=google&utm_medium=cpc

Преобразуется в это: www.example.com?gclid=XDF

так же, как сокращение URL.

Чтобы восстановить криптографический хеш, понадобился бы заменительный шифр ... не такая простая задача: https://crypto.stackexchange.com/questions/300/reverse-engineering-a-hash

Может быть, некоторые глубоко копаться в журналах, искать шаблоны и т. Д ...

0
Jareau Almeyda

Похоже, мой представитель слабый, поэтому я просто опубликую другой ответ, а не комментарий.

Это не ответ, ясно. Просто высказываю некоторые мысли.

При включении автоматической пометки в Adwords параметры gclid не добавляются к целевым URL-адресам. Скорее они добавляются к целевым URL во время выполнения серверами отслеживания кликов Google. Итак, происходит одно из двух:

  1. Серверы кликов хранят gclid вместе с идентификаторами сущности Adwords, чтобы в дальнейшем Google Analytics могла их найти.

  2. У gclid есть идентификаторы сущностей, которые каким-то образом закодированы, чтобы Analytics могла их декодировать.

С точки зрения производительности кажется маловероятным, что Google реализовал бы что-то похожее на вариант 1. Принудительное использование Google Analytics "присоединения" gclid к идентификаторам AdWords кажется исключительно неэффективным в масштабе.

0
Taylor

Это не программный способ декодирования параметра GCLID. Скорее всего, вы просто пытаетесь определить кампанию, группу объявлений, ключевое слово, место размещения, рекламу, которая привела к клику и конверсии. Для этого вы можете загрузить GCLID в AdWords в качестве отдельного типа конверсии, а затем сегментировать по типу конверсии, чтобы перейти к критериям, которые инициировали конверсию. Эти шаги:

  1. В пользовательском интерфейсе AdWords выберите Сервис-> Конверсии-> Добавить конверсию с источником "Импорт из кликов".
  2. Посетите раздел справки AdWords об импорте конверсий https://support.google.com/adwords/answer/7014069 и создайте файл массовой загрузки со своими значениями GCLID, назначив новые конверсии "Импорт из клики "тип конверсии
  3. Загрузите конверсии в AdWords в Инструменты-> Конверсии-> Действия с конверсиями (Загрузка) в левой навигационной панели.
  4. Перейдите на вкладку кампании, Сегмент-> Конверсии-> Название конверсии.
  5. Найдите новое имя конверсии в списке сегментов, откуда и произошла конверсия. Продолжайте этот процесс на вкладке групп объявлений и ключевых слов, пока не узнаете критерии происхождения GCLID.
0
TJ Wilkinson

Другой подход заключается в том, чтобы просто посмотреть на данные реферера, которые, по крайней мере, предоставят ключевое слово, по которому был произведен поиск.

0
Ophir Prusak