<?xml version="1.0" encoding="windows-1251"?>
<rss version="2.0" xmlns:content="http://purl.org/rss/1.0/modules/content/">
<channel>
<title>беспочвенные фантазии о поисковых системах и бизнесе</title> 
<link>http://blog.promosite.ru/</link> 
<description>Всякие разные наблюдения и мысли о поисковых системах, за неделю</description> 
<language>ru</language> 
<managingEditor>info@promosite.ru</managingEditor> 
<generator>руки 1.3</generator> 
<item>
<title>а у Яху 500-600 поисковых факторов</title> 
<guid isPermaLink="true">http://blog.promosite.ru/comments.php?1205</guid> 
<link>http://blog.promosite.ru/comments.php?1205</link>
<category>Поисковики</category> 
<comments>http://blog.promosite.ru/comments.php?1205#comm</comments> 
<description>
&lt;p&gt;а у Яху 500-600 поисковых факторов, по сравнению с яндексовыми ~250:
&lt;p&gt;&lt;a href=&quot;http://learningtorankchallenge.yahoo.com/datasets.php&quot; target=_blank&gt;http://learningtorankchallenge.yahoo.com/datasets.php&lt;/a&gt;
&lt;p&gt;&lt;span style=&quot;background:#eeeeee; font-size:smaller&quot;&gt;&lt;blockquote&gt;&lt;p&gt;
# features  519 596 &lt;/blockquote&gt;&lt;/span&gt;
</description> 
<pubDate>Tue, 09 Mar 2010 12:38:59 GMT</pubDate> 
<author>info@promosite.ru - euhenio</author> 
</item><item>
<title>конкурс Yahoo Learning to Rank Challenge</title> 
<guid isPermaLink="true">http://blog.promosite.ru/comments.php?1204</guid> 
<link>http://blog.promosite.ru/comments.php?1204</link>
<category>Фсем Фтыкать!</category> 
<comments>http://blog.promosite.ru/comments.php?1204#comm</comments> 
<description>
&lt;p&gt;Yahoo Learning to Rank Challenge &lt;a href=&quot;http://learningtorankchallenge.yahoo.com/instructions.php&quot; target=_blank&gt;http://learningtorankchallenge.yahoo.com/instructions.php&lt;/a&gt;
&lt;p&gt;&lt;a href=&quot;http://users.livejournal.com/_foreseer/47272.html&quot; target=_blank&gt;сообщил тов. Гулин&lt;/a&gt;.
&lt;p&gt;&lt;span style=&quot;background:#eeeeee; font-size:smaller&quot;&gt;&lt;blockquote&gt;&lt;p&gt;
Yahoo запустил свой конкурс, очень похожий на прошлогоднюю Интернет-Математику. Интерес представляет их описание submission. В качестве submission принимается текстовый файл, по строчке на запрос.&lt;/blockquote&gt;&lt;/span&gt;

&lt;p&gt;Имхо, яндекоиды со своими матрикснетами просто обязаны участвовать :)</description> 
<pubDate>Tue, 09 Mar 2010 11:59:26 GMT</pubDate> 
<author>info@promosite.ru - euhenio</author> 
</item><item>
<title>Поисковые технологии 2010</title> 
<guid isPermaLink="true">http://blog.promosite.ru/comments.php?1202</guid> 
<link>http://blog.promosite.ru/comments.php?1202</link>
<category>Фсем Фтыкать!</category> 
<comments>http://blog.promosite.ru/comments.php?1202#comm</comments> 
<description>
&lt;p&gt;Закончился ашмановский закрытый семинар &lt;a href=&quot;http://www.search-conf.ru&quot; target=_blank&gt;Поисковые технологии 2010&lt;/a&gt;.
&lt;p&gt;Я там был как участник, мы такие когда пришли - Ашманов такой - во, типа, оптимизатор пришел - а я такой - я, типа, разработчик поисковых систем :)
&lt;p&gt;Конечно, изначально знали как оптимизатора, а вот еще один сильно секретный оптимизатор тоже был :), мы его с трудом спалили. В заявке я привел &lt;a href=&quot;http://www.a-gde.ru&quot; target=_blank&gt;www.a-gde.ru&lt;/a&gt; - помеленьку определяем коммерческость запроса. Пытается мнения и отзывы отделить, но там плохо, а коммерческость ничего себе определяется.
&lt;p&gt;Итак.
&lt;p&gt;19:00 - 21:00 заезд, расселение, шашлык, глинтвейн, ночное катание.
&lt;p&gt;&lt;a href=&quot;http://fotki.yandex.ru/users/etrofimenko/view/253906/&quot; target=_blank&gt;&lt;img src=&quot;http://img-fotki.yandex.ru/get/3910/etrofimenko.9/0_3dfd2_909a9415_XS.jpg&quot; alt=&quot;&quot; border=&quot;0&quot;&gt;
&lt;p&gt;&lt;/a&gt;
&lt;p&gt;&lt;a href=&quot;http://fotki.yandex.ru/users/etrofimenko/view/253900/&quot; target=_blank&gt;&lt;img src=&quot;http://img-fotki.yandex.ru/get/3810/etrofimenko.9/0_3dfcc_1a80a37f_XS.jpg&quot; alt=&quot;&quot; border=&quot;0&quot;&gt;
&lt;p&gt;&lt;/a&gt;
&lt;p&gt;&lt;a href=&quot;http://fotki.yandex.ru/users/etrofimenko/view/253901/&quot; target=_blank&gt;&lt;img src=&quot;http://img-fotki.yandex.ru/get/3910/etrofimenko.9/0_3dfcd_f2241ab5_XS.jpg&quot; alt=&quot;&quot; border=&quot;0&quot;&gt;
&lt;p&gt;&lt;/a&gt;
&lt;p&gt;&lt;a href=&quot;http://fotki.yandex.ru/users/etrofimenko/view/253902/&quot; target=_blank&gt;&lt;img src=&quot;http://img-fotki.yandex.ru/get/3809/etrofimenko.9/0_3dfce_5c16b79b_XS.jpg&quot; alt=&quot;&quot; border=&quot;0&quot;&gt;
&lt;p&gt;&lt;/a&gt;
&lt;p&gt;&lt;a href=&quot;http://fotki.yandex.ru/users/etrofimenko/view/253905/&quot; target=_blank&gt;&lt;img src=&quot;http://img-fotki.yandex.ru/get/3907/etrofimenko.9/0_3dfd1_40792f54_XS.jpg&quot; alt=&quot;&quot; border=&quot;0&quot;&gt;
&lt;p&gt;&lt;/a&gt;
&lt;p&gt;============Первый день 26 февраля. Будущее поисковых машин
&lt;p&gt;_________________
&lt;p&gt;&amp;quot;Табличный поиск&amp;quot; - Виктор Лавренко (Нигма)
&lt;p&gt;&lt;a href=&quot;http://fotki.yandex.ru/users/etrofimenko/view/253890/&quot; target=_blank&gt;&lt;img src=&quot;http://img-fotki.yandex.ru/get/3911/etrofimenko.9/0_3dfc2_41d1a3f3_XS.jpg&quot; alt=&quot;&quot; border=&quot;0&quot;&gt;
&lt;p&gt;&lt;/a&gt;
&lt;p&gt;В общем, Нигма, оказывается, умный поисковик.
&lt;p&gt;1. использует движок FF с добавками, чтобы оценивать, какие слова визуально близко друг к другу.
&lt;p&gt;2. группирует страницы по маске урла в смысловые группы - типа страницы фильмов отдельно, актеров отдельно и т.д. и использует этот смысл в показе.
&lt;p&gt;3. смысл этот - не смысл, а название ключа. Для разных страниц в группе смотрится (с анализм хтмл шаблона), какие тексты остаются и какие меняются в пределах группы, и те, что меняются - значение ключа, а что остаются - название ключа. Из этих ключей и значений и получается табличный поиск.
&lt;p&gt;_________________
&lt;p&gt;&amp;quot;Рейтинг онлайн-СМИ на основе дублирования новостей&amp;quot; - Александр Антонов (Корпорация Галактика)
&lt;p&gt;&lt;a href=&quot;http://fotki.yandex.ru/users/etrofimenko/view/253887/&quot; target=_blank&gt;&lt;img src=&quot;http://img-fotki.yandex.ru/get/3809/etrofimenko.9/0_3dfbf_1ac0a0da_XS.jpg&quot; alt=&quot;&quot; border=&quot;0&quot;&gt;
&lt;p&gt;&lt;/a&gt;
&lt;p&gt;_________________
&lt;p&gt;&amp;quot;Лексический анализ: от шаблонов к семантике&amp;quot; - Даниил Скатов (Диктум)
&lt;p&gt;&lt;a href=&quot;http://fotki.yandex.ru/users/etrofimenko/view/253891/&quot; target=_blank&gt;&lt;img src=&quot;http://img-fotki.yandex.ru/get/3807/etrofimenko.9/0_3dfc3_706303c7_XS.jpg&quot; alt=&quot;&quot; border=&quot;0&quot;&gt;
&lt;p&gt;&lt;/a&gt;
&lt;p&gt;Много всего про разбор предложения с определением частей речи, согласования и прочего. Я, правда, не понял, применимо ли это к коротким текстам (типа запросов) и предполагается ли, что текст изначально правильный (или умеет ошибки анализировать). Выясню отдельно.
&lt;p&gt;_________________
&lt;p&gt;&amp;quot;Некоторые подходы в задачах классификации запросов&amp;quot; - Марина Хоруженко (Рамблер)
&lt;p&gt;&lt;a href=&quot;http://fotki.yandex.ru/users/etrofimenko/view/253888/&quot; target=_blank&gt;&lt;img src=&quot;http://img-fotki.yandex.ru/get/3809/etrofimenko.9/0_3dfc0_def01379_XS.jpg&quot; alt=&quot;&quot; border=&quot;0&quot;&gt;
&lt;p&gt;&lt;/a&gt;
&lt;p&gt;Доклад о выделении специфических запросов - поиск цитат, навигационные запросы для того, чтобы по разному их отрабатывать. 3-5 из тысячи - цитаты. Для каждого запроса есть список факторов, на которых обучаются обучалки. Факторы вроде - длина запроса, число заглавных букв, число знаков препинания, стоп-слова, т.д. Еще используется аналих поведения юзера.
&lt;p&gt;_________________
&lt;p&gt;&amp;quot;Группировка результатов поиска по тематике, определение тематики документа&amp;quot; - Андрей Коваленко (Meta.ua)
&lt;p&gt;&lt;a href=&quot;http://fotki.yandex.ru/users/etrofimenko/view/253899/&quot; target=_blank&gt;&lt;img src=&quot;http://img-fotki.yandex.ru/get/3813/etrofimenko.9/0_3dfcb_c8aa878f_XS.jpg&quot; alt=&quot;&quot; border=&quot;0&quot;&gt;
&lt;p&gt;&lt;/a&gt;
&lt;p&gt;Они пристегнули свой каталог к определению тематики запроса. В результате по каждому запросу выдача группируется по по тематикам. То, чего я всегда хотел :) на момент доклада новая выдача не была выложена. Кроме того, сбоку открывается рубрикатор, где каждая ссылка ограничивает поиск тематикой (только уж очень широкий список тематик :)). Но самые основные тематики определяет качественно. Урл там есть специальный, по которому все показывается :)
&lt;p&gt;_________________
&lt;p&gt;&amp;quot;Реферирование одного документа, найденного по запросу, нескольких документов, ранжированный реферат поисковой выдачи&amp;quot; - Андрей Калинин (Поисковые технологии)
&lt;p&gt;&lt;a href=&quot;http://fotki.yandex.ru/users/etrofimenko/view/253889/&quot; target=_blank&gt;&lt;img src=&quot;http://img-fotki.yandex.ru/get/3813/etrofimenko.9/0_3dfc1_8244bdbb_XS.jpg&quot; alt=&quot;&quot; border=&quot;0&quot;&gt;
&lt;p&gt;&lt;/a&gt;
&lt;p&gt;Ничего не запомнил, но подробный обзор всех методов реферирования, начиная с самых древних. Всем разработчикам поиска втыкать!
&lt;p&gt;_________________
&lt;p&gt;Круглый стол &amp;quot;Будущее поиска&amp;quot;
&lt;p&gt;&lt;a href=&quot;http://fotki.yandex.ru/users/etrofimenko/view/253918/&quot; target=_blank&gt;&lt;img src=&quot;http://img-fotki.yandex.ru/get/3813/etrofimenko.9/0_3dfde_bba332cf_XS.jpg&quot; alt=&quot;&quot; border=&quot;0&quot;&gt;
&lt;p&gt;&lt;/a&gt;
&lt;p&gt;&lt;a href=&quot;http://fotki.yandex.ru/users/etrofimenko/view/253919/&quot; target=_blank&gt;&lt;img src=&quot;http://img-fotki.yandex.ru/get/3910/etrofimenko.9/0_3dfdf_d443976e_XS.jpg&quot; alt=&quot;&quot; border=&quot;0&quot;&gt;
&lt;p&gt;&lt;/a&gt;
&lt;p&gt;Анатолий Орлов, получается, был с презентацией :)
&lt;p&gt;&lt;a href=&quot;http://fotki.yandex.ru/users/etrofimenko/view/253917/&quot; target=_blank&gt;&lt;img src=&quot;http://img-fotki.yandex.ru/get/3910/etrofimenko.9/0_3dfdd_448f35dc_XS.jpg&quot; alt=&quot;&quot; border=&quot;0&quot;&gt;
&lt;p&gt;&lt;/a&gt;
&lt;p&gt;Ночью можно кататься
&lt;p&gt;&lt;a href=&quot;http://fotki.yandex.ru/users/etrofimenko/view/253916/&quot; target=_blank&gt;&lt;img src=&quot;http://img-fotki.yandex.ru/get/3808/etrofimenko.9/0_3dfdc_32a1edac_XS.jpg&quot; alt=&quot;&quot; border=&quot;0&quot;&gt;
&lt;p&gt;&lt;/a&gt;
&lt;p&gt;===========Второй день 27 февраля. Проблемы индексации и релевантности
&lt;p&gt;_________________
&lt;p&gt;&amp;quot;Анализ графа ссылок для фильтрации нецензурных изображений&amp;quot; - Евгений Харитонов (Яндекс)
&lt;p&gt;&lt;a href=&quot;http://fotki.yandex.ru/users/etrofimenko/view/253894/&quot; target=_blank&gt;&lt;img src=&quot;http://img-fotki.yandex.ru/get/3813/etrofimenko.9/0_3dfc6_236f82f3_XS.jpg&quot; alt=&quot;&quot; border=&quot;0&quot;&gt;
&lt;p&gt;&lt;/a&gt;
&lt;p&gt;Есть метод определения дублей картинок, нечувствительный к слабым изменениям каринки. Он склеивает копии. Дальше есть граф хтмл-страниц, где картинки вставлены, и сами картинки. Если в контенте страниц есть порно - это дает плюс в классификацию картинки как порно. Если на странице есть порно-картинка (а порно текстов нет) - это дает плюс в классификацию страницы как порно. И так много раз. Я так понял, что они обучались на том же множестве, что и определяли точность с полнотой. Учитывая при этом, что точность и полнота около 60% - я так понял, что никаких реальных результатов не достингнуто. И еще линейная зависимость между точностью и полнотой.
&lt;p&gt;Да, спалил темку про продвижение по картикам :)
&lt;p&gt;_________________
&lt;p&gt;&amp;quot;Архитектура краулера вертикального (тематического) поиска&amp;quot; - Михаил Долинин (Рамблер)
&lt;p&gt;&lt;a href=&quot;http://fotki.yandex.ru/users/etrofimenko/view/253892/&quot; target=_blank&gt;&lt;img src=&quot;http://img-fotki.yandex.ru/get/3812/etrofimenko.9/0_3dfc4_25b311db_XS.jpg&quot; alt=&quot;&quot; border=&quot;0&quot;&gt;
&lt;p&gt;&lt;/a&gt;
&lt;p&gt;Мне абсолютно неинтересно, как там чего индексируется.
&lt;p&gt;_________________
&lt;p&gt;&amp;quot;Виды поискового спама&amp;quot; - Михаил Волович (Ашманов и Партнеры)
&lt;p&gt;&lt;a href=&quot;http://fotki.yandex.ru/users/etrofimenko/view/253886/&quot; target=_blank&gt;&lt;img src=&quot;http://img-fotki.yandex.ru/get/3808/etrofimenko.9/0_3dfbe_5859b13a_XS.jpg&quot; alt=&quot;&quot; border=&quot;0&quot;&gt;
&lt;p&gt;&lt;/a&gt;
&lt;p&gt;Боян в части сателлитов и дорвеев. Рассмативает серьезно сателлиты и сайты несуществующих фирм. Но все равно поисковики их не могут реально детектить.
&lt;p&gt;_________________
&lt;p&gt;&amp;quot;Максимизация вероятностных метрик ранжирования. Алгоритм MatrixNet&amp;quot; - Андрей Гулин (Яндекс)
&lt;p&gt;&lt;a href=&quot;http://fotki.yandex.ru/users/etrofimenko/view/253893/&quot; target=_blank&gt;&lt;img src=&quot;http://img-fotki.yandex.ru/get/3912/etrofimenko.9/0_3dfc5_7e1a8a65_XS.jpg&quot; alt=&quot;&quot; border=&quot;0&quot;&gt;
&lt;p&gt;&lt;/a&gt;
&lt;p&gt;Выложена, как я понял, исправленная презентация (участники Гулину указали на какие-то ошибки в формулах). Самое интересное для меня, я понял, что Матрикснет понимал не так, как надо. Я думал, что статистики в 1 млн. асессорских оценок мало, а ее на самом деле много. Сегалович на пальцах объяснял, что много матриц, руками показывал :)
&lt;p&gt;Лекции Воронцова
&lt;p&gt;_________________
&lt;p&gt;&amp;quot;Синтаксический анализ по-нижегородски&amp;quot; - Владимир Окатьев (Диктум)
&lt;p&gt;&lt;a href=&quot;http://fotki.yandex.ru/users/etrofimenko/view/253897/&quot; target=_blank&gt;&lt;img src=&quot;http://img-fotki.yandex.ru/get/3812/etrofimenko.9/0_3dfc9_a2bd25ed_XS.jpg&quot; alt=&quot;&quot; border=&quot;0&quot;&gt;
&lt;p&gt;&lt;/a&gt;
&lt;p&gt;Примерно на ту же тему, что и первый доклад от Диктума. Мне не близко.
&lt;p&gt;_________________
&lt;p&gt;&amp;quot;Метрики для интегральной оценки качества поиска&amp;quot; - Андрей Иванов (Ашманов и Партнеры)
&lt;p&gt;Андрей показал свои индикаторы на analyzethis. Я, правда, думаю, что на общий анализатор типа &amp;quot;по гамбургскому счету&amp;quot; поисковики не согласятся. Рассказали о накрутках этих анализаторов, среди поисковиков тоже есть накрутчики :)
&lt;p&gt;_________________
&lt;p&gt;&amp;quot;Интернет-математика. Конкурс по машинному обучению&amp;quot; - Павел Карпович (Яндекс)
&lt;p&gt;&lt;a href=&quot;http://fotki.yandex.ru/users/etrofimenko/view/253895/&quot; target=_blank&gt;&lt;img src=&quot;http://img-fotki.yandex.ru/get/3912/etrofimenko.9/0_3dfc7_be142a80_XS.jpg&quot; alt=&quot;&quot; border=&quot;0&quot;&gt;
&lt;p&gt;&lt;/a&gt;
&lt;p&gt;Рассказал про &lt;a href=&quot;http://imat2010.yandex.ru/&quot; target=_blank&gt;новый конкурс за 2010 - про предсказание пробок на дорогах&lt;/a&gt;. Да, спалил, какие участники в &lt;a href=&quot;http://imat2009.yandex.ru/results&quot; target=_blank&gt;ИМ-2009&lt;/a&gt; были алгоритмами Яндекса - это &lt;strong&gt;Joker, -F, alexeigor и Победа&lt;/strong&gt;. Я уже забыл, какие из них соответтсвовали каким алгоритмам. :)
&lt;p&gt;_________________
&lt;p&gt;&amp;quot;10 неправильных способов сравнивать качество поисковиков&amp;quot; - Сергей Протасов (Рамблер)
&lt;p&gt;&lt;a href=&quot;http://fotki.yandex.ru/users/etrofimenko/view/253898/&quot; target=_blank&gt;&lt;img src=&quot;http://img-fotki.yandex.ru/get/3809/etrofimenko.9/0_3dfca_7c7ba87c_XS.jpg&quot; alt=&quot;&quot; border=&quot;0&quot;&gt;
&lt;p&gt;&lt;/a&gt;
&lt;p&gt;Сергей показал, почему каждый их способов не годится для анализа качества поиска :) При этом как один из методов анализа - показ чужих результатов (других СЕ) в своем дизайне - чтобы нивелировать влияние дизайна.
&lt;p&gt;У Рамблера, кстати, ожидается выкатка нового алгоритма, и нынешний Рамблер отстает от лидеров на 10%, а вот новый алгоритм лучше, чем лидеры на 5%.
&lt;p&gt;В презентации про это есть, значит, можно говорить :)
&lt;p&gt;_________________
&lt;p&gt;Круглый стол &amp;quot;Измерение качества поиска&amp;quot;
&lt;p&gt;******
&lt;p&gt;Презентации выложены на &lt;a href=&quot;http://www.search-conf.ru/programm2010&quot; target=_blank&gt;http://www.search-conf.ru/programm2010&lt;/a&gt; .</description> 
<pubDate>Tue, 02 Mar 2010 15:51:56 GMT</pubDate> 
<author>info@promosite.ru - euhenio</author> 
</item><item>
<title>ааа! Яндекс-XML не отдает больше 20 результатов...</title> 
<guid isPermaLink="true">http://blog.promosite.ru/comments.php?1201</guid> 
<link>http://blog.promosite.ru/comments.php?1201</link>
<category>Поисковики</category> 
<comments>http://blog.promosite.ru/comments.php?1201#comm</comments> 
<description>
&lt;p&gt;Блин, а я привык по 50 брать.
&lt;p&gt;И больше того: на обычной выдаче 50 отдает!
&lt;p&gt;Верните взад, пожалуйста! Яндекс, чо вам, жалко 50?</description> 
<pubDate>Tue, 02 Mar 2010 10:25:39 GMT</pubDate> 
<author>info@promosite.ru - euhenio</author> 
</item><item>
<title>кто против релевантности all? давайте примеры!</title> 
<guid isPermaLink="true">http://blog.promosite.ru/comments.php?1200</guid> 
<link>http://blog.promosite.ru/comments.php?1200</link>
<category>Разное</category> 
<comments>http://blog.promosite.ru/comments.php?1200#comm</comments> 
<description>
&lt;p&gt;по поводу моей &lt;a href=&quot;http://forum.promosite.ru/viewtopic.php?t=1191&quot; target=_blank&gt;ненависти к релевантности all в НЧ-запросах&lt;/a&gt;, у меня anatolix попросил примеров, а я как-то в ХМЛ при поиске не смотрю, но олловую релевантность и так уже вижу.
&lt;p&gt;Чтобы в ХМЛ не лазить, сдалал инструментик, показывает relevance priority: &lt;a href=&quot;http://tools.promosite.ru/anatolix.php&quot; target=_blank&gt;http://tools.promosite.ru/anatolix.php&lt;/a&gt;
&lt;p&gt;Я там накидал примеров, но лучше больше :)
&lt;p&gt;Давайте тоже свои примеры! Или хотя бы можно полазить по relevance priority, это прикольно.</description> 
<pubDate>Mon, 01 Mar 2010 16:18:45 GMT</pubDate> 
<author>info@promosite.ru - euhenio</author> 
</item><item>
<title>ггг, Адлабз :)</title> 
<guid isPermaLink="true">http://blog.promosite.ru/comments.php?1199</guid> 
<link>http://blog.promosite.ru/comments.php?1199</link>
<category>Разное</category> 
<comments>http://blog.promosite.ru/comments.php?1199#comm</comments> 
<description>
&lt;p&gt;по-моему, вставлять рефссылки в статьи сеокомпании - какой-то очевидный ахтунг.
&lt;p&gt;вот тут: &lt;a href=&quot;http://www.adlabs.ru/posts/160/&quot; target=_blank&gt;http://www.adlabs.ru/posts/160/&lt;/a&gt; (корпоративный блог) начиная со слов &amp;quot;Полностью автоматизированные системы типа SeoPult, WebEffector пока не покорили рынок, хотя и не оставляют попыток это сделать&amp;quot; - идут рефки на сеопульт, эффектор, сапу.
&lt;p&gt;Они не догадались зарегаться в блогуне и мирелинксе - там тоже рефералки есть :)
&lt;p&gt;И причем даже не важно, автор лично или сама компания вставила. Это как бы говорит нам, что доходы компании сопоставимы с реферальскими доходами, поэтому рефералкой нельзя пренебречь. :)
&lt;p&gt;Ы.</description> 
<pubDate>Sun, 28 Feb 2010 18:18:30 GMT</pubDate> 
<author>info@promosite.ru - euhenio</author> 
</item><item>
<title>Нигма, оказывается, умная</title> 
<guid isPermaLink="true">http://blog.promosite.ru/comments.php?1198</guid> 
<link>http://blog.promosite.ru/comments.php?1198</link>
<category>Поисковики</category> 
<comments>http://blog.promosite.ru/comments.php?1198#comm</comments> 
<description>
&lt;p&gt;Разбирает, и вроде успешно, пары ключ-значение в текстах на странице. Если значение меняется внутри страниц одного типа.
&lt;p&gt;Кластеризует страницы по урлам.
&lt;p&gt;Лавренко что-то там  спалил со словами &amp;quot;ну, здесь же оптимизаторов нет&amp;quot;. :)</description> 
<pubDate>Fri, 26 Feb 2010 09:58:03 GMT</pubDate> 
<author>info@promosite.ru - euhenio</author> 
</item><item>
<title>опасаясь контрразведки, избегая жизни светской</title> 
<guid isPermaLink="true">http://blog.promosite.ru/comments.php?1195</guid> 
<link>http://blog.promosite.ru/comments.php?1195</link>
<category>Отдых (курилка)</category> 
<comments>http://blog.promosite.ru/comments.php?1195#comm</comments> 
<description>
&lt;p&gt;под английским псевдонимом...
&lt;p&gt;я разработчик поисковых систем, а вы не знали? :) Потом покажу. :)
&lt;p&gt;Поеду на &lt;a href=&quot;http://www.search-conf.ru/&quot; target=_blank&gt;http://www.search-conf.ru/&lt;/a&gt; (Ашмановский семинар типа для разработчиков и т.п. поиска).
&lt;p&gt;Горные лыжи в перерывах и все такое.</description> 
<pubDate>Wed, 24 Feb 2010 12:42:52 GMT</pubDate> 
<author>info@promosite.ru - euhenio</author> 
</item><item>
<title>почему они все такие - ч. 2</title> 
<guid isPermaLink="true">http://blog.promosite.ru/comments.php?1191</guid> 
<link>http://blog.promosite.ru/comments.php?1191</link>
<category>Поисковики</category> 
<comments>http://blog.promosite.ru/comments.php?1191#comm</comments> 
<description>
&lt;p&gt;Ну и вот.
&lt;p&gt;В далеком научном прошлом был хороший принцип: &amp;quot;отрицательный результат - тоже результат&amp;quot;. Это не всегда получается, но к этому нужно стремиться.
&lt;p&gt;Пример: Вася-Петя экспериментально выясняет нечто. Если нечто удалось - отлично. Если не удалось - упс, положительного результа нет, а отрицательный ничего не означает - время потрачено зря. Ну, тут все понятно - это про правильную постановку экспериментов. Избегаем неправильной постановки экспериментов.
&lt;p&gt;Так и с поиском то же самое. Юзер задал запрос (он, кстати, привык по умолчанию, что слова в документе должны быть близко к словам в запросе - порядок и дальность) - и &lt;strong&gt;ничего не нашлось. Это результат или нет?&lt;/strong&gt;
&lt;p&gt;Конечно, это результат. Это означает, что нужно переформулировать запрос (или насильно включить специальный режим &amp;quot;мягкого&amp;quot; поиска).
&lt;p&gt;Отрицательный результат не менее важен, чем положительный.
&lt;p&gt;Теперь начнем высер.
&lt;p&gt;Я недавно видел какую-то стату по запросам в яху, по которой получалось, что на 6% запросов дается пустой ответ - ничего не найдено. Не знаю, сколько было аналога в яндексе (когда были живы контекстные ограничения), но думаю, больше (у яндекса база меньше, значит, пустых ответов на НЧ запросы больше). Допустим, 10% &amp;quot;ничего не найдено&amp;quot; было - разумно.
&lt;p&gt;И я уже себе представляю это в красках. Сидит в яндексе какой-нибудь хуй. Которому дали задание &amp;quot;углубить и расширить&amp;quot;. Чтобы увеличить удовлетворение пользователя, нах! Степень удовлетворения рисуеццо на графике. Ну, там, меры всякие, DCG и pfound и все такое. И у гугля оно выше, за это менеджеру отдельно вставляют.
&lt;p&gt;И тут этого менеджера пробивает мысль! Хуяк! Это как это мы на 10% запросов выдаем пустой ответ! (удовлетворение юзера от такой выдачи по их мерам равно нулю).
&lt;p&gt;И возникает мысль. Давайте выдавать, &lt;strong&gt;если ничего не найдено - не пустой результат, а какую-нибудь околорелевантную хуйню&lt;/strong&gt;. На ней же удовлетворение будет всяко выше нуля.
&lt;p&gt;PROFIT!!!
&lt;p&gt;...вот так просто: берем и на дороге находим 10% бумажной эффективности. От показа разной хуйни тогда, когда следует показать &amp;quot;ничего не найдено&amp;quot;.
&lt;p&gt;...так в Яндексе появилась релевантность &amp;quot;all&amp;quot; примерно 2 года назад.
&lt;p&gt;Если нужна справка - см. в яндекс-ХМЛ, там есть несколько типов релевантности - &lt;strong&gt;фразовая phrase&lt;/strong&gt; (совпадает порядок слов), &lt;strong&gt;стриктовая strict&lt;/strong&gt; (слова не очень далеко друг от друга с контекстными ограничениями и с кворумами-весами), и &lt;strong&gt;вся-остальная-хуйня all&lt;/strong&gt; (слова есть вообще в документе и она очень-очень мягкая). Она и раньше существовала, но вылезать во всех местах в выдаче она стала как раз вот тогда.
&lt;p&gt;Этот приоритет нужно только в ХМЛ смотреть.
&lt;p&gt;Но, конечно, идея &amp;quot;показывать любую околорелевантную хуйню, когда ничего не найдено&amp;quot; не вписывается в план и общую формулу. Значит, план надо переписать.
&lt;p&gt;... и &amp;quot;all&amp;quot;-документы появляются в выдаче наравне с релевантными документами. Это давно еще было.
&lt;p&gt;Пробейте свои любимые НЧ - и посмотрите в ХМЛ. Обнаружите удивительную связь нерелевантных результатов с &lt;strong&gt;relevance priority=&amp;quot;all&amp;quot;&lt;/strong&gt;
&lt;p&gt;_______________________________
&lt;p&gt;Ну а юзер что? Юзер заходит, видит, что на его НЧ вместо разумного ответа (ничего нет = переформулируйте запрос) выдается какая-то помойка, где слова из запроса разбросаны по всему документу.
&lt;p&gt;И думает: ну его на хрен, такой поиск, херню какую-то ищет.
&lt;p&gt;_______________________________
&lt;p&gt;Потому, что для юзера отрицательный результат тоже важен. Его бла-бла-бла с релевантностью all не интересует. Пусть даже она около- и на ту же тему.</description> 
<pubDate>Wed, 17 Feb 2010 12:01:46 GMT</pubDate> 
<author>info@promosite.ru - euhenio</author> 
</item><item>
<title>Сделал в апометре - отдельно по конкурентности</title> 
<guid isPermaLink="true">http://blog.promosite.ru/comments.php?1189</guid> 
<link>http://blog.promosite.ru/comments.php?1189</link>
<category>Фсем Фтыкать!</category> 
<comments>http://blog.promosite.ru/comments.php?1189#comm</comments> 
<description>
&lt;p&gt;Сделал показ степени изменений при апдейтах, разбитую по запросам разной конкурентности.
&lt;p&gt;В апометре (&lt;a href=&quot;http://tools.promosite.ru/updates/details.php?data=2010-02-16&quot; target=_blank&gt;сегодня, внизу страницы&lt;/a&gt;) и в виджете (&lt;a href=&quot;http://tools.promosite.ru/widget.php&quot; target=_blank&gt;вид&lt;/a&gt; и &lt;a href=&quot;http://www.yandex.ru/?add=10156&quot; target=_blank&gt;ссылка для установки на яндекс&lt;/a&gt;) теперь графики степени изменения выдачи для нескольких групп запросов - от ВЧ конкурентных до никому не нужных.
&lt;p&gt;В виджете только один график &lt;a href=&quot;http://www.yandex.ru/?add=10156&quot; target=_blank&gt;http://www.yandex.ru/?add=10156&lt;/a&gt; , в апометре несколько - отдельно взвешенное изменение, отдельно невзвешенное. И в апометре еще степень изменения выдачи для разной длины запроса (число слов).
&lt;p&gt;Надо теперь подумать, как удобнее показывать на сайте.
&lt;p&gt;И да: обновляются эти картинки в 9-30, а не сразу после апа. Когда все 5К+ запросов скачаются из хмля.
&lt;p&gt;Эти же данные доступны и при листании в глубину, они же давно собирались. Пролистав вглубь, видим, что иногда апдейты (как сегодня) бывают осмысленные, с явно более сильным изменением конкурентных запросов, а иногда бессмысленные (когда по всем запросам изменения примерно одинаковы). А иногда бывало даже - что по редким запросам изменения сильнее (я так думаю, это от подкруток учета текстового).
&lt;p&gt;Причем там еще есть взвешенные изменения (когда глубокие пары учитываются с меньшим весом), и оно, например, сегодня не показывает осмысленных изменений ).
&lt;p&gt;Ну и по длине запросов разные изменения бывают. Надо как-нть сесть, пролистать в глубину.
&lt;p&gt;***
&lt;p&gt;Пока что в день релиза не кажет графиков (когда текстовго апа нет), но сделаю.
&lt;p&gt;___________________
&lt;p&gt;UPD сделал показ в дни релизов.
&lt;p&gt;+ &lt;a href=&quot;http://tools.promosite.ru/updates/details.php?data=2009-11-27#details&quot; target=_blank&gt;пример, когда для низкочастотки сильнее расколбас&lt;/a&gt;
&lt;p&gt;+ &lt;a href=&quot;http://tools.promosite.ru/updates/details.php?data=2009-11-25#details&quot; target=_blank&gt;пример, когда только по длине запроса сильнее расколбас&lt;/a&gt;</description> 
<pubDate>Tue, 16 Feb 2010 10:55:43 GMT</pubDate> 
<author>info@promosite.ru - euhenio</author> 
</item><item>
<title>конструкции поиска НПС больше нет в яндексе</title> 
<guid isPermaLink="true">http://blog.promosite.ru/comments.php?1186</guid> 
<link>http://blog.promosite.ru/comments.php?1186</link>
<category>Фсем Фтыкать!</category> 
<comments>http://blog.promosite.ru/comments.php?1186#comm</comments> 
<description>
&lt;p&gt;Оператору для поиска удобных НПС в яндексе &lt;a href=&quot;http://yandex.ru/yandsearch?text=%D1%81%D0%BB%D0%BE%D0%B2%D0%BE+-%D1%81%D0%BB%D0%BE%D0%B2%D0%BE&amp;amp;lr=213&quot; target=_blank&gt;слово -слово&lt;/a&gt; пришел конец.
&lt;p&gt;Заодно показали, что &lt;a href=&quot;http://help.yandex.ru/search/?id=1111369&quot; target=_blank&gt;операторы поиска&lt;/a&gt; и &lt;a href=&quot;http://help.yandex.ru/search/?id=1111313&quot; target=_blank&gt;примеры&lt;/a&gt; теперь новые. Двоеточий каких-то понаставили вместо знаков =. Наверное, какой-то любитель трубопаскаля теперь рулит, а = и кавычки удалил как пережиток прошлого )
&lt;p&gt;Оператора &amp;quot;минус&amp;quot; там нет, но &lt;a href=&quot;http://yandex.ru/yandsearch?text=%D0%BE%D0%BA%D0%BD%D0%B0+-%D0%BF%D0%BB%D0%B0%D1%81%D1%82%D0%B8%D0%BA%D0%BE%D0%B2%D1%8B%D0%B5&amp;amp;lr=213&quot; target=_blank&gt;сам по себе он работает&lt;/a&gt;. Т.е., минус теперь применяется и к текстам ссылок.</description> 
<pubDate>Fri, 12 Feb 2010 05:56:30 GMT</pubDate> 
<author>info@promosite.ru - euhenio</author> 
</item><item>
<title>Яндекс-адреса для всех независимо от тИЦ</title> 
<guid isPermaLink="true">http://blog.promosite.ru/comments.php?1184</guid> 
<link>http://blog.promosite.ru/comments.php?1184</link>
<category>Поисковики</category> 
<comments>http://blog.promosite.ru/comments.php?1184#comm</comments> 
<description>
&lt;p&gt;Пришло письмо.
&lt;p&gt;Однако к определению региона оно не относится - это только про адреса, и немного для гостиниц.
&lt;p&gt;Для указания региона сайта - тиц все равно нужен.
&lt;p&gt;&lt;span style=&quot;background:#eeeeee; font-size:smaller&quot;&gt;&lt;blockquote&gt;&lt;p&gt;
Добрый день!
&lt;p&gt;Закончилось бета-тестирование раздела &amp;quot;Адреса и организации&amp;quot; в сервисе Яндекс.Вебмастер, во время которого добавлять и редактировать данные об организации можно было лишь для сайтов с ТИЦ &amp;gt; 10. Теперь это можно сделать для сайтов с любым ТИЦ.
&lt;p&gt;Кроме того, появилась возможность указать дополнительные данные об организации из наиболее популярных рубрик. Например, владелец гостиницы может сообщить количество номеров и расстояние до моря, а хозяин боулинга – количество дорожек, наличие детских шаров и караоке. Все эти данные будут показаны на карточке компании при поиске по Яндекс.Картам, а для сайтов гостиниц еще и в результатах поиска.
&lt;p&gt;Более подробно о добавлении организаций можно почитать здесь: &lt;a href=&quot;http://help.yandex.ru/webmaster/?id=1108685&quot; target=_blank&gt;http://help.yandex.ru/webmaster/?id=1108685&lt;/a&gt;
&lt;p&gt;&lt;/blockquote&gt;&lt;/span&gt;
</description> 
<pubDate>Thu, 11 Feb 2010 12:20:06 GMT</pubDate> 
<author>info@promosite.ru - euhenio</author> 
</item>  </channel>
  </rss>