euhenio
Аськи нет
info@promosite.ru
blog.promosite.ru
беспочвенные фантазии о поисковых системах и бизнесе



Последние камменты:

задачка про вероятности

04:36 / 07.09.2010
dima5ty


16:33 / 06.09.2010
euhenio


09:53 / 06.09.2010
dima5ty


09:13 / 06.09.2010
euhenio

кстати, для частотности запросов

05:37 / 07.09.2010
dima5ty


16:13 / 06.09.2010
euhenio


11:56 / 06.09.2010
G00DMAN


10:05 / 06.09.2010
dima5ty



Разделы::

Последние камменты по времени

Комментаторы

Баги и предложения

Раздел "Фсем Фтыкать!"

15:44 - Friday, 20th August 2010

переделал пруфлинки в просмотре аффилиатов

поскольку (в целях борьбы?) отменили группировку для нескольких domain я в сервисе аффилиатов переделал пруфлинки с domain на просто поиск домена.

Сейчас я использую ту фичу, что по запросу вида domain.ru всегда первым выдается сайт domain.ru (у него и цифра релевантности существенно выше была при таких запросах), и то же самое при перечислении нескольких через "или" - искомые сайты сверху.

В выдаче по запросу domain1.ru | domain2.ru на первых двух будут эти сайты, если они не аффилированы. Если они аффилированы - на 1-2 местах останется только один сайт из двух. Перед использованием не мешает проверить нахождение двух доменов по отдельности.

__

PS что, яндексоиды, будете корячить выдачу дальше? и вкусно причмокивайте.

Раздел Фсем Фтыкать!, URL сообщения: http://blog.promosite.ru/comments.php?1281
камментов нет, комментировать

19:13 - Thursday, 29th July 2010

аффилиаты (клоны) в Яндексе

копия из http://forum.searchengines.ru/showthread.php?t=526579

поиск аффилиатов - клонов по основному домену: http://tools.promosite.ru/use/clones.php

я недавно пропарсил много запросов по тестовому XML: http://blog.promosite.ru/comments.php?1264

пока вот товарищ не сказал, что он спалил: http://forum.searchengines.ru/showthread.php?t=523795

В том числе в этом тестовм ХМЛ было много прикольных данных -

1. тег <clon> с ID аффилиата

2. теги <geo> <geoa> с географией сайта

3. цифра редевантности

Я спарсил около 42 тыс. запросов (все ашмановские сеорейтовские запросы и 20+ тыс самых популярных по частотности), по каждому топ1000 результатов.

В сумме получилось почти 2 млн. разных хостов, что составляет примерно 20% от всех доменов в яндексе. Учитывая, что тут речь шла о наиболее популярных запросах, этот набор сайтов - почти все топовые популярные сайты. (у Ашманова в сеорейте подобраны разные коммерческие запросы по всем темам).

Пока что я сделал - поиск аффилиатов - клонов по основному домену.

велкам: http://tools.promosite.ru/use/clones.php

пару дней работает без ограничений, потом для использования нужно будет зарегистрироваться.

также будет АПИ для контор.

Для чего все это нужно?

Если в вам приходит потенциальный клиент, имеющий аффилированные сайты - можно в результате получить кучу проблем. Типа вы продвигаете сайт, а в топах вместо него аффилиат, который продвигает другая контора. А вашего подопечного нет и вы ничего не получите.

В любом случае полезно проверить подопытного на возможные проблемы.

В данный момент ищутся только аффилиаты по уже спарсенной базе. Но те данные уже закрыты.

Но я скоро сделаю поиск аффилиатов по полностью открытым данным. И, возможно, внедрю его в сервис.

велкам, ищите свои клоны: http://tools.promosite.ru/use/clones.php

Щито это?

аффилированные сайты - это сайты, которые Яндекс по разным причинам считает принадлежащими одной компании. Это в основном делается ручками - с учетом контактов на сайте и т.п. Это борьба Яндекса с "забиванием" топа сайтами, может быть и разными, но принадлежащими одной конторе.

Основной результат состоит в том, что по одному запросу может находиться только один аффилиат из группы (самый релевантный). Остальные (менее релевантные) вычищаются из выдачи. Причем из группы зоофилированных сайтов по разным запросам будет находиться то один, то другой, но не оба вместе. Попробуйте, например, поискать лавпланет - тут еще представлена малая доля клонов.

Но аффилиация может делаться не только с помощью кривых ручек, но также и с помощью их кривых алгоритмов. :)

* они, аффилиаты, на то и аффилиаты, что по одному запросу показаться может только один аффилиат из группы. Поэтому логично, что все стопроцентов = полный список аффилиатов никто не определит. Т.е., есть случаи, когда я точно знаю, что аффилиаты есть, но какие именно - не знаю. Потому, что остальные аффилиаты случайно не попали в выборку.

А выборка та большая - примерно 2 млн. доменов (10% от всего яндекса по хостам), найденных по 42 тыс. поисковых запросов (топ 1000), когда был во второй раз открыт показ клонов, гео, и релевантности в цифрах. Первый раз был тут и был давно отменен.

Я скоро сделаю определялку аффилиатов на открытых данных, но тогда очень полезно будет ввести список запросов, по которым сайт продвигается. И это будет платный сервис.

Откуда дровишки?

Данные из пропарсенных что-то около 2 млн доменов по 42 тыс запросов по тестовому ХМЛ, когда были открыты разные кошерные данные, как-то: география, аффилиаты, и, конечно, цифра релевантности ))

Каким образом подтвердить аффилированность?

Яндекс, сцуко, похоже борется с возможностями определения аффилиатов. И вообще со всеми возможностями.

в древние незапамятные времена определить аффилированность было просто: берешь, задаешь запрос типа host:domain1.ru | host:domain2.ru, и если в результатах видишь только один домен из двух (при этом каждый из хостов отдельно находится нормально) - перед вами аффилиаты. Т.е., по одному запросу второй аффилированный сайт вычищается из выдачи.

Но сейчас стало посложнее. Яндекс решил, что нужно разгруппировывать домены при поиске host: rhost: и тому подобное. И если раньше и в обычной выдаче модно было увидеть только один домен из двух, то теперь ты вынужден копаться в страницах внутри домена. Ну да, это чуток менее удобно, чем смотреть сразу сгруппированные данные.

Но, кстати, если у вас есть Яндекс-ХМЛ, то в нем все фишки с группировкой остались прежними. И вот тот запроос выше "пруфлинк" можно задать в яндекс-ХМЛ и волшебным образом увидеть один результат из двух аффилирванных.

А если вам лениво лазить в ХМЛ - можно просмотреть все разгруппированные страницы обоих сайтов в обычной выдаче. И операторы host, rhost, url не спасают. И, что мегазабавно: при задании оператора url: через "или" по аффилиатам находятся оба аффилиата. Это настолько они борются с определением клонов, ага ))

вот для примера топ клонов. Число num = число клонов с одинаковым ID аффилиата:

домен число клонов

balance-transfers-promotions.co.cc 11550

842-job.mnogonado.net 2073

beetteam.ucoz.ru 1061

sportzone.ru 992

megaline-file.ucoz.kz 903

izumi.podberi-tv.ru 735

rabota.dagestan.slando.ru 592

batink.webasyst.net 584

cheltools.chelyabinsk-info.ru 451

mylovein.net 394

ufa-trud.ru 384

vsekinolenty.ru 381

sanosipovka.ru 379

ussuriysk.irr.ru 376

zifalon.ru 362

shazycreep.prostoprint.com 358

adwords.google.be 355

bancat.ru 343

publiks.ru 332

tecktonik.nxt.ru 306

ehmz.opt.ru 294

nevskiy-palace.ru 293

a-frankfurt.com 250

singapore-obnovlenie.ru 231

arenda-ratlina.imotiburgas.com 226

nomer.plati.ru 206

vbangkok.ru 204

vchelyabinsk.ru 200

torgi24.vsem.ru 198

znakomstvo.kharkov-reklama.com.ua 196



Раздел Фсем Фтыкать!, URL сообщения: http://blog.promosite.ru/comments.php?1271
Камменты: 6, комментировать

16:34 - Wednesday, 28th July 2010

сегодня webeffector прислал письмо, ыыы

"Рекомендации по бюджету, проверка региона и другие обновления!"

меня там удивили цифры. Они там раскрыли процент выполнения по бюджетам.

То, что у РБС называется "доля отработки", а у сеопульта "процент стояния", у них почти ОДИНАКОВОЕ с точностью до пары процентов!!!

Судя по всему, у них там ничего ни от чего не зависит.

В случае с эффектором забавно - если бюджет = рекомендованному, то отработка 61%, а если бюджет в два (2, sic!) раза выше, от отработка 65%.

Хорошая прибавка, чо :)

Судя по всему, во всех таких системах рулят юзеры, которые продвигают заведомо легкие запросы за заведомо большое бабло (успешно причем!). Надо срочно заводить свою автопродвигалку нах!

В подписях к графику написано (% запросов в топ10), что эффектор НЕ взвешивает запросы по конкурентности при расчете отработки, взвешивал бы - было б еще меньше... :)

Смешно у них там.

PS и интересно было бы смотреть взвешенную по конкурентности отработку от бюджета в цифрах.

Подозреваю, что именно такие конкурентные запросы скрываются от внешнего взгляда, ибо стыдно нах.

Раздел Фсем Фтыкать!, URL сообщения: http://blog.promosite.ru/comments.php?1270
камментов нет, комментировать

12:11 - Tuesday, 1st June 2010

XML: новейшие поломки и отключения операторов

Сегодня, кстати, был ссылочный апдейт, который апометр не увидел из-за того, что Яндекс коварно сломал оператор url и вместе с ним host, rhost в XML.

т.е., из выдачи они работают, а из ХМЛ - нет, выдают только обвязку (типа найдено столько-то результатов), а самих результатов не выдают.

Что смешно - в основном ХМЛ используют для поиска внутри сайта, и в примерах приведен оператор host, а тут бац - и он не работает :)

Блядь, то понос, то золотуха. Не трогайте свой ХМЛ!

А теперь инсайд :)

Я в ХМЛ позвонил, спросить чо ваще, может отключили сознательно. Мне сказали, что нет, сломалось, но сказали, возможно, что скоро оператор url будет закрыт в XML. Человек даже как бе не хотел его поэтому смотреть.

Так что готовьтесь парсить выдачу. Я, правда, не уверен, что именно он сказал - оператор будет закрыт ваще или закрыт только из ХМЛ. Так что и в выдаче могут закрыть.

Раздел Фсем Фтыкать!, URL сообщения: http://blog.promosite.ru/comments.php?1241
камментов нет, комментировать

20:35 - Friday, 26th March 2010

новейшие изменения в яндексе и в XML

сейчас несколько дней идут сплошные перетряски выдачи, яндексоиды комментируют, что были технические проблемы.

При этом число страниц 22-го вечером подпрыгнуло ровно вдвое, так же как и число страниц "еще с сайта". При этом есть примеры сайтов, проиндексированных одновременно с www и без, типа каждая страница имеет дубль и все они одновременно находятся в выдаче. Думаю, с этим связано, причем массовое явление. :)

А в ХМЛ изменения такие:

1. ВЫДАЕТСЯ УРЛ СОХРАНЕНКИ! тег saved-copy-url - и можно спокойно парсить там наличие своих ссылок, не дергая для этого яндекс-выдачу, раньше урл сохраненки только там был.

2. вместо цифирок в ID документов стали использовать и буковки. doc id="13-23-4-Z86F030531D40920C" Судя по всему, шестнадцатиричные [первая буква не считается :)]. Бля, могли парсилки поломаться жеж!

Раздел Фсем Фтыкать!, URL сообщения: http://blog.promosite.ru/comments.php?1208
камментов нет, комментировать

- стр. 1, в прошлое>>



Aug<-  ->Jul
ПнВтСрЧтПтСбВс