Типичный день? У меня не было такого уже давно. Обычно на неделе я совершаю поездку или две, анализирую код, устраиваю мозговой штурм с производственной или бизнес-командой, участвую в обсуждениях с членами лаборатории (это для меня как кислород), читаю так много, как возможно, получаю сотни электронных писем, и сам пишу несколько , и все время стараюсь рационально сбалансировать и расставить приоритеты . Баланс, возможно, это самое незаметное и, в то же время, самое важное.
RS: Что, по вашему, не так с веб-поиском сегодня?
GF: Мне легче обозначить, каким должен быть поиск, и затем показать различия. Если бы веб-поиск был совершенен, он бы выдавал ответ на каждый запрос, и это происходило бы так, будто на вопрос отвечает умнейший человек в мире, у которого есть под рукой вся справочная информация, и все это выполняется меньше, чем за мгновение. Другими словами, SE был бы искусственным интеллектом, таким умным, что если правильный ответ теоретически может быть найден в стремящихся к бесконечности ресурсах, он бы нашел его. Если бы верного ответа не существовало, тогда SE делала бы следующее: выдавала наиболее близкий по смыслу ответ, или даже объяснение, почему ваш запрос не может получить идеальных результатов. (И, кстати, если нам удастся реализовать вышесказанное на моем веку, я признаю себя большим счастливчиком. Теперь вы понимаете, насколько масштабна задача по созданию такого поиска).
Альтернативный интерфейс (например, для мобильных телефонов), голосовое сопровождение и броские графические результаты - это все хорошо, но, в конце концов, они представляют относительно простую технологическую проблему, если сравнить это все с задачами, которые необходимо решать для реализации нашего гипотетического SE. То, что имеет определяющее значение, обычно скрыто под капотом.
Сегодня поисковые системы практически не понимают языки и слова. Они пользуются статистическими свойствами слов и ссылок, однако это совсем не похоже на осмысленное понимание. SE не понимают желаний пользователя, не могут отличить целевого поиска от просмотра, и полностью игнорируют тонкости связей между различными концепциями. Более того, им совершенно недостает мудрости, они очень скудоумны, когда дело касается отделения пустяков от чего-то действительно важного.
RS: Вы до сих пор видите необходимость в таргетированных ботах и фокусированных базах данных?
GF: Конечно. Различные типы данных имеют различные представления о своевременности. Более того, кроме структурированных и неструктурированных данных, существует целый океан данных, лучше всего характеризуемый, как многоструктурный. Пока первые две группы данных стоят на месте, нишевые сервисы всегда займут нишу, простите за тавтологию. Я не думаю, что огромная монолитная база данных когда-либо синхронизирует все остальные базы. Более того, то, что мы называем сейчас поисковой системой, постепенно разовьется в более изощренную SE, которая будет обмениваться своими данными с другими источниками.
RS: Как исследовательские лаборатории Yahoo улучшают поиск?
GF: Проникнуть в сознание пользователя очень важно и для нас, и для поисковой команды, с которой мы сотрудничаем на постоянной основе. Я думаю, выполняя эту задачу, мы сможем достичь максимальных результатов в короткие сроки. Я также думаю, что существующие SE только чуть прикоснулись к тому океану возможностей, который открывается при работе с залинкованными данными. Введение 64-битного железа также изменит горизонты SE, и мы намерены развивать, также, и это направление. В долгосрочной перспективе наша цель - предельно приблизиться к модели "совершенной SE". Пока что мы очень далеки от этого, но повода для расстройства нет - ведь нам известны основные ключевые этапы, ведущие к реализации большой цели.
RS: Каково ваше мнение о попытке размещения структурированных данных в виде библиотечного каталога, библиографических записей или индексированных статей в неструктурированной базе данных? Иными словами, какова роль структурированных данных в неструктурированном веб-мире? Как можем мы соединить оба типа ресурсов, и в тоже время позволить пользователям использовать преимущества всех добавочных возможностей, которые реализуют структурированная база и механизм поиска в ней?