<?xml version="1.0" encoding="windows-1251"?>
<rss version="2.0" xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:wfw="http://wellformedweb.org/CommentAPI/" xmlns:dc="http://purl.org/dc/elements/1.1/">
<channel>
<title>беспочвенные фантазии о поисковых системах и бизнесе</title> 
<link>http://blog.promosite.ru/</link> 
<description>Всякие разные наблюдения и мысли о поисковых системах, за неделю</description> 
<language>ru</language> 
<managingEditor>info@promosite.ru</managingEditor> 
<generator>руки 1.3</generator> 
<item>
<title>кстати, для частотности запросов (Комментарии: 4)</title> 
<guid isPermaLink="true">http://blog.promosite.ru/comments.php?1286</guid> 
<link>http://blog.promosite.ru/comments.php?1286</link> 
<category>Разное</category> 
<comments>http://blog.promosite.ru/comments.php?1286#comm</comments> 
<description>
&lt;p&gt;по горизонтальной оси - сколько раз встретился запрос в базе (уникальность).
&lt;p&gt;по вертикальной - сколько таких запросов было.
&lt;p&gt;&lt;a href=&quot;http://fotki.yandex.ru/users/etrofimenko/view/291660/&quot; target=_blank&gt;&lt;img src=&quot;http://img-fotki.yandex.ru/get/4605/etrofimenko.b/0_4734c_20e21996_XL.jpg&quot; alt=&quot;&quot; border=&quot;0&quot;&gt;
&lt;p&gt;&lt;/a&gt;
&lt;p&gt;Аппроксимация степенной функцией дает зависимость 1/x^2 с хорошей точностью.</description> 
<pubDate>Mon, 06 Sep 2010 05:04:15 GMT</pubDate> 
<author>info@promosite.ru - euhenio</author>
<wfw:commentRSS>http://blog.promosite.ru/rss20-comments.php?1286</wfw:commentRSS> 
</item><item>
<title>задачка про вероятности (Комментарии: 7)</title> 
<guid isPermaLink="true">http://blog.promosite.ru/comments.php?1285</guid> 
<link>http://blog.promosite.ru/comments.php?1285</link> 
<category>Разное</category> 
<comments>http://blog.promosite.ru/comments.php?1285#comm</comments> 
<description>
&lt;p&gt;Допустим, некто (я) собирает статистику запросов Яндекса долбежкой прямого эфира. Долбит не много, но постоянно, годами.
&lt;p&gt;И накопилось около 40 млн. уникальных запросов.
&lt;p&gt;Из которых только 10 млн. запросов попали в базу 2 и больше раза.
&lt;p&gt;Из которых 4.7 млн. запросов попали в базу 3 и больше раза
&lt;p&gt;Из которых 3.3 млн. запросов попали в базу 4 и больше раза
&lt;p&gt;и т.д.
&lt;p&gt;Очевидно, что те запросы, которые попали в базу один раз - не очень воспроизводимы. Т.е., они могут быть случайными и не повториться. А могут и повториться - но узнать это можно только потом.
&lt;p&gt;Но и те запросы, которые попали в базу пару раз - не очень хорошо соответствуют вордстату.
&lt;p&gt;Те, которые три раза - получше соответствуют. И т.д. Лучше всего пропорциональны частотные запросы.
&lt;p&gt;***
&lt;p&gt;И хочется каждому запросу присвоить не просто частоту, полученную умножением на коэффициент, а диапазон частот &amp;quot;от и до&amp;quot;, в который попадает частота запроса с некоей граничной вероятностью (ну там, 95%, например). И для одиночных &amp;quot;случайных&amp;quot; запросов знать верхнюю граничную частоту.
&lt;p&gt;***
&lt;p&gt;И думаю: может, задача-то стандартная и уже давно решена?</description> 
<pubDate>Sun, 05 Sep 2010 19:26:23 GMT</pubDate> 
<author>info@promosite.ru - euhenio</author>
<wfw:commentRSS>http://blog.promosite.ru/rss20-comments.php?1285</wfw:commentRSS> 
</item><item>
<title>+апы геопривязки в tools.promosite.ru = апдейт апометра:) (комментариев нет)</title> 
<guid isPermaLink="true">http://blog.promosite.ru/comments.php?1283</guid> 
<link>http://blog.promosite.ru/comments.php?1283</link> 
<category>Разное</category> 
<comments>http://blog.promosite.ru/comments.php?1283#comm</comments> 
<description>
&lt;p&gt;Изменения в &lt;a href=&quot;http://tools.promosite.ru/&quot; target=_blank&gt;апометре&lt;/a&gt;:
&lt;p&gt;1. сменил название: загадочный &amp;quot;метод комдира&amp;quot; на понятный &amp;quot;апдейт сохраненки&amp;quot;. :)
&lt;p&gt;2. добавил апдейты гео.
&lt;p&gt;Как определяется - есть набор регионов, по региону ищем разные запросы (типа domain, rhost - для уменьшения числа найденных сайтов  до 1-20 тыс., чтобы прюнинг не находил &amp;quot;много&amp;quot;, а находил поточнее). По каждому региону ищем с параметром rstr.
&lt;p&gt;===немножко стран:
&lt;p&gt;Россия
&lt;p&gt;Общероссийские
&lt;p&gt;Украина
&lt;p&gt;Беларусь
&lt;p&gt;США
&lt;p&gt;Европа
&lt;p&gt;===и немножко городов:
&lt;p&gt;Москва
&lt;p&gt;Санкт-Петербург
&lt;p&gt;Екатеринбург
&lt;p&gt;Челябинск
&lt;p&gt;Владивосток
&lt;p&gt;И (сюрприз!) в районе 4-5 утра число найденных страниц прилично меняется, приличным я считаю изменение на 1% и изменение по 3 регионам из 11. Я отмечаю это в апометре как &amp;quot;апдейт геопривязки&amp;quot;.
&lt;p&gt;Начал собирать данные раз в 10 минут с начала июля, а сейчас воткнул в апометр.
&lt;p&gt;К тому же (сюрприз!) больше половины происшедших за то время &amp;quot;изменений без выкладывания индекса&amp;quot; происходили из-за (вместе с) изменения в геопривязке (ну, без выкладывания индекса, ессно) - &lt;a href=&quot;http://tools.promosite.ru/updates/&quot; target=_blank&gt;http://tools.promosite.ru/updates/&lt;/a&gt;
&lt;p&gt;А из оставшейся половины еще несколько случаев, когда число геопривязанных страниц меняется в 16-20 вечера одного дня, а на другой день я пробиваю утром и вижу изменение выдачи. Это те случаи, когда на серче начинаются крики про апдейт вечером, и что сеопульт показывает шторм :)
&lt;p&gt;Общее число геопривязанных страниц не всегда увеличивается, часто и уменьшается тоже. Конечно, привязываются сайты, просто на страницах изменения лучше видны.
&lt;p&gt;И вопросы - какую стату еще выводить? например, можно по отдельным регионам из перечисленных писать, чо как поменялось.
&lt;p&gt;Изменение числа страниц считается так - новое число страниц делим на старое по каждому региону, из полученных 11 чисел берем среднее геометрическое. Абсолютное изменение - это когда одно их 11 отношений меньше 1, берем вместо него 1/x.
&lt;p&gt;PS грядут другие апдейты апометра.
&lt;p&gt;PPS еще один сюрприз - за это время был один случай, когда геопривязку откатили обратно, числа вернулись, я его удалил, но все может повторяться.</description> 
<pubDate>Mon, 30 Aug 2010 04:55:50 GMT</pubDate> 
<author>info@promosite.ru - euhenio</author>
<wfw:commentRSS>http://blog.promosite.ru/rss20-comments.php?1283</wfw:commentRSS> 
</item><item>
<title>переделал пруфлинки в просмотре аффилиатов (комментариев нет)</title> 
<guid isPermaLink="true">http://blog.promosite.ru/comments.php?1281</guid> 
<link>http://blog.promosite.ru/comments.php?1281</link> 
<category>Фсем Фтыкать!</category> 
<comments>http://blog.promosite.ru/comments.php?1281#comm</comments> 
<description>
&lt;p&gt;поскольку (в целях борьбы?) &lt;a href=&quot;http://blog.promosite.ru/comments.php?1280&quot; target=_blank&gt;отменили группировку для нескольких domain&lt;/a&gt; я в &lt;a href=&quot;http://tools.promosite.ru/use/clones.php&quot; target=_blank&gt;сервисе аффилиатов&lt;/a&gt; переделал пруфлинки с domain на просто поиск домена.
&lt;p&gt;Сейчас я использую ту фичу, что по запросу вида &lt;strong&gt;domain.ru&lt;/strong&gt; всегда первым выдается сайт domain.ru (у него и цифра релевантности существенно выше была при таких запросах), и то же самое при перечислении нескольких через &amp;quot;или&amp;quot; - искомые сайты сверху.
&lt;p&gt;В выдаче по запросу &lt;strong&gt;domain1.ru | domain2.ru&lt;/strong&gt; на первых двух будут эти сайты, если они не аффилированы. Если они аффилированы - на 1-2 местах останется только один сайт из двух. Перед использованием не мешает проверить нахождение двух доменов по отдельности.
&lt;p&gt;__
&lt;p&gt;PS что, яндексоиды,  будете корячить выдачу дальше? и вкусно причмокивайте.</description> 
<pubDate>Fri, 20 Aug 2010 11:44:03 GMT</pubDate> 
<author>info@promosite.ru - euhenio</author>
<wfw:commentRSS>http://blog.promosite.ru/rss20-comments.php?1281</wfw:commentRSS> 
</item><item>
<title>яндекс не борется с оптимизаторами, да? (комментариев нет)</title> 
<guid isPermaLink="true">http://blog.promosite.ru/comments.php?1280</guid> 
<link>http://blog.promosite.ru/comments.php?1280</link> 
<category>Урродыбл</category> 
<comments>http://blog.promosite.ru/comments.php?1280#comm</comments> 
<description>
&lt;p&gt;для демонстрации аффилированности сайтов мне &lt;a href=&quot;http://etrofimenko.ya.ru/replies.xml?parent_id=3945&amp;amp;item_no=3932&amp;amp;with_parent=1&quot; target=_blank&gt;подсказали использовать оператор domain&lt;/a&gt; - выдача для него не разгруппировывалась по страницам домена.
&lt;p&gt;И при использовании конструкции вида &lt;strong&gt;domain:site1 | domain:site2&lt;/strong&gt; можно было видеть оба сайта или один из них в удобном виде - по одной странице с домена.
&lt;p&gt;Ну я и внедрил такой пруфлинк в &lt;a href=&quot;http://tools.promosite.ru/use/clones.php&quot; target=_blank&gt;сервис проверки аффилиатов&lt;/a&gt; - для ручной проверки пар сайтов на аффилированность, убедиться людям нужно, что данные правильные.
&lt;p&gt;И вот неожиданно - оно перестало работать как раньше. Т.е. теперь оно тоже разгруппирует, и нужно копаться в большом числе страниц. Неудобно.
&lt;p&gt;И ведь что интересно: сам оператор domain группирует.
&lt;p&gt;&lt;a href=&quot;http://yandex.ru/yandsearch?text=domain%3A1pointhall&amp;amp;lr=213&quot; target=_blank&gt;domain:1pointhall&lt;/a&gt; - группирует по домену
&lt;p&gt;&lt;a href=&quot;http://yandex.ru/yandsearch?text=domain%3Avchelyabinsk&amp;amp;lr=213&quot; target=_blank&gt;domain:vchelyabinsk&lt;/a&gt; - группирует
&lt;p&gt;Это когда по одной штуке. А если два домена через &amp;quot;или&amp;quot;:
&lt;p&gt;&lt;a href=&quot;http://yandex.ru/yandsearch?text=domain%3Avchelyabinsk+|+domain%3A1pointhall&amp;amp;lr=213&quot; target=_blank&gt;domain:vchelyabinsk | domain:1pointhall&lt;/a&gt; - не группирует, надо копаться в страницах.
&lt;p&gt;Раньше-то они если и не объясняли, то хотя бы логика была: люди же, типа, набирая host:, наверное, хотят все страницы с домена получить? И вот вам разгруппировка тогда. Это чтобы мы подумали, что они так думают.
&lt;p&gt;А сейчас - какая логика? одна штука domain - группировка есть, две штуки через или - нету.
&lt;p&gt;Палки в колеса вставляете?
&lt;p&gt;Ну ничо, будем юзать ХМЛ. Да и в страницах люди полазят, только нагрузят больше ))</description> 
<pubDate>Fri, 20 Aug 2010 07:42:56 GMT</pubDate> 
<author>info@promosite.ru - euhenio</author>
<wfw:commentRSS>http://blog.promosite.ru/rss20-comments.php?1280</wfw:commentRSS> 
</item>  </channel>
  </rss>