MatrixNet

Система поисковой поддержки, разработанная отечественными специалистами Яндекса для ускорения, улучшения и автоматизации процесса, в качестве посредника между поисковой машиной и сайтами.

Что такое MatrixNet (Матрикснет)?

По существу, если коротко — это самообучающаяся ИС (интеллектуальная система) для релевантного поиска по Яндексу.

MatrixNetПодробности:

ИС такого рода содержит сборник алгоритмов и программ, включающий элементы отладки с обратной связью, создающие эффект самообучения. Как, например, другие ИС — для распознавания речи, изображений, диагностики.
Релевантный поиск — это нахождение информации, наиболее соответствующей смыслу запроса и максимально приближенной к ожиданиям пользователя.

Ускорение и обновление

Для ускоренной работы поисковиков создаются БД, в которых каждому документу присваивается индекс. Быстро перебирая и находя подходящие индексы, поисковик выдаёт на-гора и соответствующие им документы.
Регулярное обновление индексов, сопряжённое с запуском специального апдейтового алгоритма, обновляющего основной алгоритм Матрикснета, называют апдейтом.

Совершенствование поисковой машины

Единого подхода в мире нет, и поисковые машины работают по-разному: одни всю индексацию производят вручную, другие (как Nigma) только автоматически. Некоторые индексируют и ранжируют лишь отдельные слова (иероглифы). Каждый развивает ноу-хау.

Яндекс практикует комбинированные приёмы индексации: предварительный индекс тексту по ключевым фразам и словам присваивает поисковая машина (паук, веб-спайдер), позже его в ручном режиме уточняют асессоры — рабочие специалисты поисковика.

Асессоры также оценивают и степень соответствия страниц, присваивая ранг релевантности. С появлением новых текстов, старое ранжирование постоянно «разжижается» вставками индексов, имеющих как относительно более низкий, так и относительно более высокий ранг.

Облегчая бремя перелопачивающих сайты людей, программисты MatrixNet регулярно вводят новые алгоритмы, уточняя оценочные критерии предварительного ранжирования. Посредничая между поисковой машиной и асессорами, ИС, по утверждениям разработчиков, автоматизирует нахождение релевантных текстов по «многим тысячам параметров». Хорошо ли это?

Алгоритмирование

Скорость выдачи с внедрением Матрикснет явно возросла. Вопросы же качества работы алгоритма, особенно поначалу, вызывали много нареканий. Говорят, «русские сами себе создают сложности, чтобы затем их героически преодолевать». Хотя, у ИС Google Instant (американского аналога) примерно та же ситуация (его внедрение прошло раньше).

В чём состоят реальные проблемы, говорить сложно — прикладная архитектура ИИ составляет коммерческую тайну. Специалисты поговаривают, что «многие тысячи факторов ранжирования», накопленные поначалу — это «поведенческие факторы», в то время как базовые вопросы алгоритмирования ясного очерчивания не получили. А позже задействовали «метод исключения» из выборки топов подозрительных по множеству параметров текстов.

Как бы то ни было, Матрикснет выстоял, пережил первые сложности, продолжает развиваться.

Индивидуализация и обезличивание поиска

Напоследок об одной из проблем самообучающихся ИС. Бывает «слишком хорошо — тоже нехорошо».

МатрикснетДа, Матрикснет оперирует множеством разнообразнейших критериев ранжирования, сочетая при этом опыт общего понимания смыслов с учётом круга интересов, особенностей поведения, места расположения данного пользователя.

Но, иногда остро заточенная под пользователя ИС идёт вразрез с его интересом или неудобна по техническим причинам. Скажем, бывший депутат райсовета, после отпуска, во время которого его компьютером пользовалась дочка, решил стать политологом-международником, заинтересовался англоязычными новостями «изнутри» США. А ему и что Яндекс, и что Гугл на англоязычный запрос выдают русские новости на русском о русских в США, или на английском о России, да ещё с уклоном — то в коммунальное хозяйство, то в гламур и мультики.

В таких случаях рекомендуют отключить историю поиска в ПС, почистить кэш-память компьютера, изменить в поисковике координаты своего места расположения или прибегнуть к услугам какой-нибудь не столь «ангажированной» системы поиска.


Перейти к списку статей