Мы переехали!
Ищите наши новые материалы на SvobodaNews.ru.
Здесь хранятся только наши архивы (материалы, опубликованные до 16 января 2006 года)

 

 Новости  Темы дня  Программы  Архив  Частоты  Расписание  Сотрудники  Поиск  Часто задаваемые вопросы  E-mail
18.11.2024
 Эфир
Эфир Радио Свобода

 Новости
 Программы
 Поиск
  подробный запрос

 Радио Свобода
Поставьте ссылку на РС

Rambler's Top100
Рейтинг@Mail.ru
 Интернет
[13-08-02]
Ведущий Александр Костинский

Кубок по поиску в Интернете

Беседа Александра Костинского с Еленой Колмановской, Ильей Сегаловичем и Юрием Поляком

Александр Костинский: Миллионы людей во всем мире ищут в Интернете информацию. Чтобы облегчить им задачу созданы мощные поисковые машины. Однако при запросе мало-мальски известной фамилии или значимого события на вас обрушивается буквально лавина ненужной информации. Как из нее отобрать полезную? Можно ли научиться эффективно искать в Интернете? Оказывается, есть люди, которые удивительно быстро и качественно ищут информацию в Сети. А можно ли определить из них лучшего?

Оказывается, можно. Уже два раза в русскоязычном Интернете компания Яндекс провела Кубок по поиску в Интернете. В соревнованиях участвовало больше тысячи человек, а следили за ним десятки тысяч.

В нашей сегодняшней передаче о Кубке расскажут его организаторы Елена Колмановская, Илья Сегалович и специалист по поиску в Интернете Юрий Поляк.

Александр Костинский: Что такое кубок по поиску в Интернете?

Елена Колмановская: Кубок по поиску в Интернете - это соревнование для тех, кто Интернет любит, для тех, кто по долгу службы или интереса ради ищет в нем информацию. Это соревнование, которое придумал "Яндекс".

Илья Сегалович: Суть в том, что есть компьютерные игры, есть компьютерные игры с использованием Интернета, есть интеллектуальные компьютерные игры с использованием Интернета и часть из них проходит в соревновательном ключе.

Александр Костинский: А какие задания давались?

Илья Сегалович: Есть такая работа - поиск в Интернете. Она ежедневная для людей, которые в Интернете находятся постоянно. Для них она - часть обычной деятельности, примерно как набор текстов на компьютере или, на совсем бытовом уровне - чистка картошки. Само по себе умение простое, но его тоже нужно приобрести. В этом умении есть свои мастера. И вот нам захотелось понять, действительно ли это - умение, действительно ли это некоторое искусство, в котором есть средний уровень и есть достижения. Задача была отсечь все лишнее. Это не должно было быть соревнованием в эрудиции, это не должно было быть соревнованием в скорости печатания на компьютере. Это должно быть соревнование именно в том, что принято называть - "поиск в Интернете".

Юрий Поляк: Я бы хотел еще сказать, что здесь, кроме человека, который ищет, еще важный элемент - сама поисковая машина. Лучший результат достигается, когда человек наилучшим образом использует возможности поисковой машины. Илья совершенно правильно сказал о skills, умении, высоком уровне работы с этими машинами, но это - редкость. Как известно больше 70% запросов по статистике тех же поисковых систем дают в ответ сотни, тысячи и десятки тысяч возможных ссылок. Соревнования по кубку России по поиску в Интернете учат именно так формулировать вопрос, с учетом особенностей поисковой системы, чтобы ответ был обозримым, информативным и по возможности правильным.

Александр Костинский: Два раза проходили соревнования, как они точно назывались?

Елена Колмановская: Открытый кубок России по поиску в Интернете.

Александр Костинский: В них мог участвовать любой человек, из Америки, из Китая?

Елена Колмановская: У нас было сформулировано так: любой человек, владеющий русским языком и клавиатурой может принимать участие в этом конкурсе.

Александр Костинский: И сколько таких нашлось?

Елена Колмановская: Каждый раз около тысячи.

Александр Костинский: Это много, это настоящие большие соревнования.

Елена Колмановская: Мы тоже так думаем.

Илья Сегалович: Вообще регистрировалось больше людей. В Интернете принято регистрироваться. Есть такое ощущение, если не зарегистрируешься, то чего-нибудь пропустишь, приз не дадут. Поэтому оба раза регистрировалось тысячи по четыре-пять. Но реально людей, которые физически принимали участие, отвечали на вопросы, надеясь выиграть этот кубок, оба раза было примерно по тысяче.

Александр Костинский: Что они надеялись выиграть кроме замечательного кубка?

Елена Колмановская: У нас была такая позиция, что главное, что человек здесь выигрывает, это почет и звание. Поэтому победитель кубка получал звание - "Человек, который нашел все". А дальше, по ходу проведения кубка, сами образовывались призы. Мы их специально не искали. Первый раз призы были: плоский монитор, видеокамеры, не помню, что-то еще третье. На втором кубке у нас уже были большие спонсоры и там первый приз - поездка на Формулу-1 в Монако.

Александр Костинский: Видимо, была какая-то система отбора? Какая? Олимпийская или какая-то другая?

Елена Колмановская: У нас существует три тура. В первом туре участвуют все желающие. Первый тур - это 20 вопросов, на каждый вопрос дается три минуты на ответ. Соответственно это занимает час. Первый тур мы обычно проводим в 6 или 7 игр, потому что разным людям удобно играть в разное время суток и в разные дни недели. При этом каждый участник имеет право участвовать хоть во всех играх, а зачет делается по лучшему результату. После первого тура первые сто мест проходят во второй тур. Второй тур проводился в два дня. Делается это опять же для того, чтобы скомпенсировать часовые пояса, чтобы учистники имели возможность сходить на работу или в Интернет-кафе. И дальше первые восемь мест, которые победили после второго тура, идут играть в финал. Финал всегда очный.

Илья Сегалович: Наша задача была на первом туре сделать его максимально широким. Масса людей находится в разных часовых поясах, кто-то в Америке, кто-то во Владивостоке, кто-то в Москве. Всех удовлетворить в одну секунду невозможно. Поэтому мы провели много туров и придумали такую систему, чтобы уравнять их в шансах. Плюс первый тур идеологически был направлен на скорость печатания, а второй и на эрудицию. Сначала мы искали тех, кто умеет искать, а потом среди тех, кто умеет быстро искать тех, кто умеет быстро думать.

Юрий Поляк: Как раз время привести примеры каких-то вопросов, тем более, что Илья уже сказал, вопросы выбирались очень тщательно, к ним предъявлялись суровые требования. Они не должны быть банальными, они не должны быть заигранными. Ну и, наконец, они должны допускать разумный, короткий ответ.

Елена Колмановская: И что еще важно, что копированием вопроса в строку поиска не получается ответ. Все-таки человек должен подумать, что и как спросить.

Александр Костинский: Вы предварительно проверяли это?

Илья Сегалович: Каждый вопрос, мало того, что он готовился, он проверялся, ему выставлялись балы, эти балы осреднялись, чтобы скомпенсировать разницу.

Елена Колмановская: Все игры первого тура должны были быть равноценными, иначе кто-то получал преимущество, а это неправильно.

Илья Сегалович: Я не знаю насколько интересно рассказывать про требования, я навскидку помню их. Не должно быть очень скучно. Не должно быть двадцать вопросов типа какова площадь Никарагуа, какова площадь Гватемалы, какова площадь Конго? Во-вторых, это не должно быть тривиально. У нас была такая идея. Что вопросы на эрудицию не должны составлять 100%, их должно быть по возможности меньше. А вопросов на реальные факты из реальной жизни их должно быть больше. Это не всегда получалось, но общая тенденция была такая.

Александр Костинский: Человек должен не знать ответ, а найти его в Сети.

Илья Сегалович: Да, есть вопросы, которые нереально знать. Классический пример. Как зовут слониху в киевском зоопарке? Это знать невозможно.

Александр Костинский: У вас был такой вопрос?

Илья Сегалович: Да, был.

Юрий Поляк: Или вряд ли кто-то знает, сколько цыплят ежегодно съедается на пивном фестивале в Мюнхене.

Елена Колмановская: Каков срок беременности у бегемота? Какое имя носил основатель компании Philips? Какое отчество у Ивана Сусанина? Кстати, довольно сложный вопрос. Отчество у него было Осипович. Как зовут дочь 125 императора Японии?

Илья Сегалович: Как звали собаку Павлова? Мой любимый вопрос.

Елена Колмановская: Для чего Испания в начале ХХ века закупала русскую водку?

Юрий Поляк: А для чего?

Елена Колмановская: Для крепления малаги.

Александр Костинский: Слабовата была малага?

Елена Колмановская: Конечно.

Елена Колмановская: Причем надо сказать, что туры немного отличались по постановке задачи. Если в первом туре игра на скорость и там задача найти ответ в Интернете. Если этот ответ в Интернете есть, а в качестве ответа человек должен был написать сам ответ, и страницу откуда ответ взят. Если ответ в Интернете существует, то он принимается. Он при этом может быть неправильным относительно Большой советской энциклопедии.

Юрий Поляк: Но зато были разные варианты воинского звания Глена Миллера, или ответы на вопрос сколько времени господин Ульянов сидел в шалаше.

Илья Сегалович: Разные варианты мы принимали. Это действительно не так критично, если кто-то назвал его полковником, переводя слово colonel, а кто-то генерал-майором, это вопрос неточности перевода, это мы принимали. А вот была проблема с фоменковскими сайтами, есть такой замечательный ученый или не ученый, уж я не знаю, у которого своя история.

Александр Костинский: А люди оттуда черпали информацию?

Илья Сегалович: Потому что их расплодилось у нас в Интернете. Если посчитать исторические сайты, то процентов тридцать это сайты последователей учения Фоменко. Они вышли в Интернет и поэтому у них много такого бреда.

Александр Костинский: И у них Эверест высотой 15 сантиметров?

Юрий Поляк: Условно говоря, так.

Елена Колмановская: У них Эверест совпадает по названию с тем, что условно говоря является не горой, а впадиной.

Александр Костинский: У них Юлий Цезарь жил вместе с князем Игорем и они боролись за Константинополь.

Илья Сегалович: И вообще это одно и то же лицо.

Юрий Поляк: И они вместе ходили пить чай к Чингисхану.

Просто немного в сторону, хочу сказать. Эти вопросы кубка являются ценным методическим пособием для тех преподавателей, которые занимаются обучением поиску в Интернете. Вот скажем, доцент Федотов из Петербурга дает своим студентам такое задание, на основе вопросов кубка по поиску (не ограничиваясь, естественно тремя минутами) найти все возможные варианты и выбрать из них самый достоверный.

Александр Костинский: Пять тысяч зарегистрировалось, тысяча реально играла, и из этой тысячи вы отобрали чуть больше ста человек.

Елена Колмановская: Примерно 120.

Александр Костинский: И что дальше было?

Елена Колмановская: 120 человек играли второй тур. Второй тур устроен следующим образом: дается некоторый текст. Обычно это три текста на разные темы. Про биологию, про музыку и про что-то еще. Это текст, в котором пропущены места. Выглядит это примерно так: "Среди растений семейства ...(какого?) наиболее известны, в частности лекарственные, в частности ...(название?), содержащее ценный тип химического соединения..." и так далее. Надо было заполнить пробелы поиском в Интернете. Но здесь не требовалось указание страниц. Здесь могла работать эрудиция.

Александр Костинский: А в течение какого времени?

Елена Колмановская: Вопросов было три, три таких разных текста. На каждый давалось полчаса.

Юрий Поляк: Три темы. Но вставить нужно было 120 понятий.

Александр Костинский: Это вообще непросто.

Илья Сегалович: Весьма непросто. Я не выбираю половины этих вопросов.

Александр Костинский: Что есть люди, которые ищут в Интернете лучше вас?

Илья Сегалович: Безусловно. Там потрясающие ребята.

Елена Колмановская: Во-первых, нам эти вопросы оба раза составлял Анатолий Белкин, который командор интеллектуального клуба "Неспроста", это человек, который играет в "Что? Где? Когда?". И он всегда составляет очень интересные вопросы, которые устроены таким образом, что сначала нужно прочесть текст, потом поймать ту ниточку, за которую она разматывается и от заполнения начальных полей становится легче заполнять следующие. Во-вторых, в отличие от первого тура, здесь все-таки есть понятие - правильный ответ. Здесь недостаточно найти в Интернете. Эти вопросы устроены так, что, как от решения хорошей интеллектуальной задачи, люди получают удовольствие, просто от процесса решения.

Александр Костинский: И по результатам этих заданий второго тура сколько человек продолжили борьбу?

Елена Колмановская: Мы строим полную картину победителей. Первые восемь победителей приглашаются в финал, но мы еще шесть следующих человек зовем просто присутствовать на финале. И на финале среди этих шести случайным образом разыгрывается девятое место в финале.

Александр Костинский: Какие же задания были тогда в финале?

Илья Сегалович: Финал мы старались сделать как можно более разнообразным и интересным. В данном случае нам хотелось понять, какие бывают поиски, для чего они делаются, и под них сформулировать разные задачи. Например, наша классификация, которая совпадает с международной, такова: есть навигационные запросы, запросы, в которых человеку просто необходимо попасть в нужную точку (например, найти сайт какой-нибудь организации или человека). В навигационных запросах - один ответ, человеку нужно попасть в одну точку, найти один Интернет-адрес, ему не нужен список. Следующий тип запроса - транзакционный. Условно говоря, когда человеку нужно решить коммерческую задачу: купить билеты, продать компьютер, обменять квартиру. В этом случае, вообще говоря, человеку не нужен адрес, более того, он знает, о чем он спрашивает, Он прекрасно знает какие бывают квартиры и компьютеры, его задача найти несколько предложений и среди них выбрать самое лучшее. Задача номер три, она самая распространенная, когда человеку нужно найти какую-нибудь информацию вообще. Нужно дать содержательный ответ на вопрос. Очень часто ответ лежит не на одной страничке, а на нескольких.

Александр Костинский: Как называется такой тип запросов?

Илья Сегалович: Это у нас - информационный запрос.

Елена Колмановская: Организационно третий тур выглядит так. Сначала все девять человек играют многоборье. У них три задачи. На первую задачу 20 минут или полчаса, потом вторая задача, потом третья задача. Потом подводятся итоги, выявляются три победителя и три победителя бегут забег призеров. Каждый раз финал проходит в Интернет-кафе. Там есть линия компьютеров. Линия заряжается. Человек получает вопрос на первом компьютере, как только он получает правильный ответ, он получает пароль для входа в следующий. И так он движется по линейке из шести или семи вопросов и очень хорошо видно кто на каком месте.

Александр Костинский: Тот, кто пересекает финишную черту, это и есть чемпион?

Елена Колмановская: "Человек, который нашел все".

Александр Костинский: Кто был победителем в первых соревнованиях?

Елена Колмановская: В первом кубке "Человеком, который нашел все" стал Антон Носик, второе место получил Алексей Чарыков и третье Кирилл Савицкий, а во втором кубке чемпионом стал Владимир Степанов, человек из Москвы, из газеты "Вести", а второе и третье место заняли ребята из Питера Антон Губанов и Георгий Глазов.

Во втором кубке мы в качестве транзакционной задачи выбрали задачу с маршрутом, и выглядело это примерно так. Вы - Дед Мороз, которому надо из города Великий Устюг Вологодской области приехать в город Урюпинск Волгоградской области. Приехать надо до нуля часов 31 декабря, иначе подарки не успеешь раздать. Соответственно, в какой самый поздний момент ты можешь выехать из Великого Устюга?

Юрий Поляк: Побеждает, естественно, самый короткий маршрут по времени с приложением всех расписаний автобусов, электричек и т.д.

Илья Сегалович: Задача, обеспечить Деду Морозу наиболее ленивое время провождение, чтобы он как следует отдохнул, выспался и вышел в самый последний момент.

Александр Костинский: И в последнюю секунду раздал всем подарки.

Елена Колмановская: Мы финал играли в декабре, поэтому очень естественно было иметь задачку про Деда Мороза.

Юрий Поляк: Кстати, с этим вопросом из восьми участников справились один или двое, в отличие от другого вопроса, когда нужно было найти всех наполеоновских маршалов или все города с закусочными Макдональдс.

Илья Сегалович: Информационные вопросы оказались интереснее. В первом розыгрыше надо было найти как можно больше фактов из биографии некоторого человека, а во втором кубке, было задание, продолжи список Мюрат, Ней.

Юрий Поляк: Это ладно, а если надо найти названия волжских теплоходов.

Илья Сегалович: Это несложно на самом деле, сложный был вопрос про цвета геологической карты. Оказалось, что только одна страничка на весь российский Интернет, в которой перечислены цвета карты.

Александр Костинский: У вас ни один из призеров первого кубка не был призером второго. Это не совсем Формула-1, где все время побеждает Шумахер. Участвовали те же самые люди во втором кубке или они не пробились?

Илья Сегалович: И играли, и участвовали, и были в финале. У нас примерно половина финалистов второго кубка были финалистами первого.

Юрий Поляк: Восьмерки пересекались.

Илья Сегалович: Восьмерки пересекались очень сильно.

Елена Колмановская: Чарыков был в финале, просто он не вышел в забег призеров. Победитель второго кубка Степанов был в первом финале четвертым или пятым.

Александр Костинский: Когда вы проводили этот финал, вы близко познакомились с 15 человеками первого финала и еще дополнительно 5-7 человеками второго финала. Что можно сказать об этих людях?

Елена Колмановская: Эти люди отличаются тем, что они умеют сосредоточиваться. Все-таки большое умение потратить время на постоянное последовательное решение задачи. В частности, среди людей, которые играют в кубок много чтогдекогдашников. Это довольно естественно, потому что близко.

Илья Сегалович: Лена, прости, но это в той или иной степени люди профессиональные именно в поиске в Интернете. Антон Носик, человек, который очень давно в российском Интернете, еще один участник - аспирант в области, которая требует постоянного поиска. Это патентный поиск. Все люди абсолютно на ты с компьютером. Смотреть как Чарыков лупит по клавишам одно удовольствие, это фантастика.

Елена Колмановская: Алексей Чарыков, вообще-то музыкант, закончил консерваторию.

Александр Костинский: Он просто играет на клавиатуре?

Елена Колмановская: Выглядит примерно так.

Илья Сегалович: Они абсолютные профессионалы в компьютерах, великолепно эрудированные ребята и они все много ищут в Интернете.

Проблема для нас - командная игра. Когда люди садятся вдесятером, отвечая за одного. Это намного удобнее и быстрее, особенно во втором туре, когда нужно заполнить много полей, и все поля видны одновременно. Я начинаю отвечать на вторую половину вопроса, вы на первую, знакомая тетя Клава со второго этажа берет в руки энциклопедию, Саша, приятель из шестого подъезда, достает четыре словаря и так далее. Мы, безусловно, не могли обеспечить полную чистоту.

Елена Колмановская: Поэтому финал очный.

Илья Сегалович: Все что мы могли сделать, мы могли отсечь людей, которые проходили группой. Мы анализировали схожесть ответов, для этого дела у нас был написан специальный алгоритм, анализировалась манера в которой были сделаны ошибки, плюс мы посмотрели на IP-адреса.

Елена Колмановская: Ко второму кубку мы уже более аккуратно сформулировали запрет на командную игру, и был интересный прецедент. У нас прошло два человека, которые получились совпадающими по нашему алгоритму.

Илья Сегалович: Причем интересно, что они пробились в эту сотню. Как они нам рассказывали потом, они узнали за 15 минут, что сидят в одной организации.

Елена Колмановская: Совпали во втором туре.

Илья Сегалович: Они включили спикерфоны и стали помогать друг другу, и мы это поняли. Мы поняли, что на первые вопросы они отвечали очень похоже, а дальше им стало неудобно и они разъединились.

Елена Колмановская: И мы им честно послали письмо, что у нас есть сильные основания полагать, что вот так, так и так. Скажите пожалуйста, мы правы или нет? Они ответили, да, ребята, вы правы. Действительно мы сами - дураки, мы понимаем, это потом оказалось неудобно. Мы сказали, извините, мы вас не берем в финал. Хотите, приходите зрителями.

Илья Сегалович: Ситуация трагическая, но у нас правила были, что тут сделаешь?

Александр Костинский: Вы сами улучшили понимание, что такое хороший поиск в Интернете?

Илья Сегалович: Конечно, та выборка, которая у нас есть, весьма ценна. На ее базе нам многие специалисты по поисковым системам предлагают делать какие-то корпуса, тестовые системы. Мы все время об этом думаем, все время это у нас в работе, и качество поиска мы постоянно оттачиваем и проверяем с использованием материала, который у нас накопился. Нам это очень полезно. Примерно треть вопросов и даже больше, мы хотели, чтобы их было больше половины, - это не энциклопедические вопросы, не на эрудицию, на них нет ответа в энциклопедии. Как зовут слониху в киевском зоопарке - ни в одной энциклопедии не написано. Есть ли билет во второй половине дня на Мадагаскар из Москвы - тоже нигде не написано. Это можно только сегодня узнать, сейчас. Это информационные вопросы, не энциклопедические.

Елена Колмановская: И с кем встречался Путин и куда у него следующий визит - нет таких энциклопедий.

Илья Сегалович: Поэтому Интернет - уникальное, универсальное средство, включающее в себя и энциклопедии.

Александр Костинский: Когда будет третий кубок по поиску, если он будет?

Елена Колмановская: Осенью, в конце сентября, начале октября.

Юрий Поляк: Я хотел спросить. За этим замечательным фасадом вероятно стоит огромная работа, людские ресурсы, деньги и прочее, ведь это не само по себе берется?

Илья Сегалович: Пришлось написать программное обеспечение, которое способно принимать сразу тысячу ответов односекундно, и оно не должно падать, и оно должно быть устойчивым, оно должно быть защищенным. Так случилось, что на первом кубке наш бывший сотрудник чуть-чуть не попал в финал, занял девятое место. Он, благодаря своему старому паролю, или зная пароль какого-то из сотрудников, зашел через модемный пул, получил доступ во внутреннюю сеть, нашел интерфейс проверки, исправил себе два вопроса, поднял результат на два очка и оказался седьмым. Но дело в том, что он не знал, что мы уже разослали письма первой восьмерке. Мы не выкладывали в Сеть результат просто потому что чисто организационно не успели.

Александр Костинский: То есть, попался жулик.

Илья Сегалович: Он бы не попался. Чистая случайность. Мы стали публиковать списки и смотрим, боже мой, восьмерка была другая, мы другим людям слали приглашение. Мы просто в ужасе. Стали срочно проверять.

Александр Костинский: Главный принцип безопасности: сети ломают изнутри, а не снаружи.

Илья Сегалович: Нам это соревнование было в удовольствие. Мы хотели получить удовольствие, мы хотели доставить удовольствие другим. Похоже, нам это удалось. Понятно, что не один человеко-месяц на это ушел, особенно первый кубок, который делался с нуля, второй уже легче. Много крови и пота, но удовольствие было.

После того, как мы это провели, сразу же после второго тура к нам пришли люди из Тюменской области, у них был школьный турнир, после этого к нам пришли люди из московского сообщества учителей математических классов, они формально как-то называются (2-я, 57-я, все эти замечательные школы), там много хороших учителей. Они к нам пришли и сказали: помогите нам сделать такой кубок.

Александр Костинский: Между этими школами?

Илья Сегалович: Нет, они организуют чуть ли не всероссийские олимпиады. Мы подписались проводить всемосковский школьный чемпионат. Осенью он тоже начнется. Школы должны подавать заявки, примерно по нашей формуле, но организация чуть другая. Чуть проще вопросы. По сути, первый тур и забег. Но уже два соревнования на программном обеспечении "Яндекса" прошло.

Александр Костинский: Кубок по поиску в Интернете пошел вширь, в народ?

Илья Сегалович: В народ идет вовсю.

Юрий Поляк: Даже приходилось встречать газетные заметки под заголовками "Поиск в Интернете - это национальный вид спорта", "элемент новой национальной культуры" и так далее, наверное, тут некоторое преувеличение, поскольку на миллионы пользователей было всего тысяча участников.

Александр Костинский: Но пять тысяч зарегистрировалось.

Юрий Поляк: Мы видели, что это чисто затратное мероприятие, но энтузиазм "Яндекса" стал теми дрожжами, которые пробудили общую массу. Если энтузиазма хватит на то, чтобы дальше проводить кубок, то это замечательно. Дай бог, чтобы это движение саморазвивалось дальше.


Все ссылки в тексте программ ведут на страницы лиц и организаций, не связанных с радио "Свобода"; редакция не несет ответственности за содержание этих страниц.


Другие передачи месяца:


c 2004 Радио Свобода / Радио Свободная Европа, Инк. Все права защищены