Google MUM: новый этап в области искусственного интеллекта для понимания информации
Когда Панду Наяк рассказывает людям, что работает над поиском Google, его часто спрашивают: «Осталась ли ещё работа»? Ответ всегда решительный и короткий — «Да»! Он и его команда пытаются решить бесчисленное множество проблем, чтобы поиск Google работал лучше. Сегодня мы расскажем вам, как они обращаются именно к тому, с чем многие из нас могут себя ассоциировать: о необходимости вводить и выполнять множество поисковых запросов, чтобы получить нужный ответ.
Возьмём следующий сценарий: вы поднялись на гору Адамс. Теперь вы решили покорить гору Фудзи следующей осенью, и хотите узнать об отличиях, чтобы заранее подготовиться. Google может помочь вам в этом, но для этого потребуется выполнить много тщательно продуманных запросов — придётся искать высоту горы, среднюю температуру осенью, сложность пешеходных троп, необходимое снаряжение и многое другое. И только спустя нескольких поисковых запросов вы всё же сможете получить нужный ответ.
Но если бы вы разговаривали с экспертом по туризму, достаточно было бы задать всего один вопрос: «Что мне сделать по-другому, чтобы подготовиться»? И получили бы продуманный ответ, который учитывает все нюансы задачи и направит на многие вещи, которые так же следует учитывать.
Этот пример не уникален — многие из нас ежедневно решают всевозможные задачи, требующие нескольких шагов поиска в Google. Специалисты выявили, что в среднем люди задают восемь запросов для решения сложных задач, подобных этой.
Поисковые системы ещё недостаточно совершенны, чтобы отвечать так, как это сделали бы эксперты. Но с новой технологией, называемой многозадачной унифицированной моделью или MUM, Google приближаемся к этому, и уже совсем скоро сможет помочь нам даже с такими типами сложных задач. В будущем вам потребуется выполнять гораздо меньше поисковых запросов.
Помощь, когда нет простого ответа
MUM может изменить то, как Google помогает нам в решении сложных задач. Как и BERT, MUM построена на архитектуре трансформера, но в 1000 раз мощнее. MUM не только понимает язык, но и генерирует его. Она обучена 75 разным языкам и выполняет множество задач одновременно, что позволяет получать более полное понимание информации, чем в предыдущих нейросетях. MUM является мультимодальной нейросетью, поэтому она понимает информацию в текстах и изображениях, а в будущем может расшириться до большего количества, включая видео и аудио.
При ответе на вопрос о походе на гору Фудзи: MUM может понять, что вы сравниваете две горы, поэтому информация о высоте и маршруте может быть актуальной. Она также может понять, что в контексте туристических походов, подготовка может включать в себя такие вещи, как способы тренировки, а также поиск подходящего снаряжения.
MUM может получать информацию, основанную на глубоком знании мира, поэтому может отметить, что, хотя обе горы находятся примерно на одной высоте, осень — это сезон дождей на горе Фудзи, поэтому вам может понадобиться водонепроницаемая куртка. MUM также сможет отобразить полезные темы для более глубокого изучения — например, лучшее снаряжение или полезные упражнения для тренировки, указав на соответствующие статьи, видео и изображения.
Устранение языковых барьеров
Язык может быть серьезным препятствием для доступа к информации. MUM может разрушить эти границы, передавая знания на разных языках. Она обучается из источников, в том числе, написанных на отличном языке от того, на котором вы пишете поисковый запрос, и помогать донести эту информацию.
Скажем, есть полезная информация о горе Фудзи, написанная на японском языке. Сегодня вы, вероятно, не найдете её, если не будете искать на японском языке. Но MUM может передать знания из источников на других языках и использовать их для поиска наиболее релевантных результатов на вашем языке. Поэтому в будущем при поиске информации о посещении горы Фудзи, вы можете увидеть такие результаты, как место с лучшим видом на гору, горячие источники и сувенирные магазины вокруг — эта информация чаще всего встречается при поиске на японском языке.
Понимание информации различных типов
MUM является мультимодальной нейросетью, это означает, что она может одновременно понимать информацию различных форматов, таких как веб-страницы, изображения и многие другие. В конце концов, вы сможете сфотографировать свои ботинки и спросить: «Могу ли я использовать их для похода на гору Фудзи»? MUM поймёт изображение и свяжет его с вопросом, чтобы дать ответ, подходят они или нет, а затем направит вас на список рекомендованного снаряжения.
Ответственное применение искусственного интеллекта в поиске
Всякий раз, когда специалисты поиска Google делают шаг вперёд с помощью искусственного интеллекта, чтобы сделать информацию в мире более доступной, делается это ответственно. Каждое улучшение проходит тщательное тестирование и оценку, гарантируя, что результаты будет более релевантные и полезные. Люди, которые делятся качеством поиска, помогают понять, насколько хорошо результаты помогают находить информацию.
Так же, как тщательно тестировались все возможности BERT, запущенные в 2019 году, MUM пройдёт тот же путь перед применением этой модели в поиске. В частности, будут искаться шаблоны, которые могут указывать на погрешности в машинном обучении, чтобы избежать их в конечном итоге. Также будут применены уроки из последних исследований, чтобы обеспечить максимальную эффективность работы поиска.
В ближайшие месяцы и годы Google добавит в продукты функции и улучшения на базе MUM. Хотя только начинается изучение всех возможностей MUM, это важный этап на пути к будущему, в котором поисковая система сможет понимать все способы передачи и интерпретации информации людьми.
О том, как нейронные сети поселились в поиске
Оригинал статьи: https://blog.google (Панду Наяк, сотрудник и вице-президент поиска Google).
Рейтинг статьи:
По оценкам 31 пользователей