Блог

Как создать идеальный поисковый запрос в Brand Analytics

Идеальный поисковый запрос удовлетворяет одновременно двум критериям: полнота (покрывает все упоминания искомого объекта) и релевантность (в поток не попадают упоминания, не относящиеся к искомому объекту). В данном уроке команда аналитиков Brand Analytics впервые раскрывает секреты составления поисковых запросов высшего уровня. Пошаговое руководство, подкрепленное примерами из практики аналитического центра, поможет освоить технологии поиска самых сложных брендов.

Часть 1. Как составлять поисковые запросы

Создание поисковых запросов – это особое искусство, которое требует высочайшей степени точности, с одной стороны (от грамотности его составления зависит объем базы данных, который нам будет доступен), и творческое видение, с другой стороны (зачастую следует погрузиться в среду исследуемого бренда, чтобы выяснить пользовательские ассоциации, жаргонные названия объекта мониторинга).

Шаг 1Кириллица и латиница

Стартуем с основного названия бренда – в большинстве случаев нам нужны как  кириллическое, так и латинское написание. Рассмотрим составление поискового запроса на примере автомобильного бренда Mitsubishi. Через запятую указываем 2 варианта написания – Митсубиси (кириллический вариант) и Mitsubishi (на латинице). Запятая в данном случае означает логический знак «или» — таким образом, в наш поток попадают упоминания, где есть хотя бы один из вариантов написания.

Запрос Митсубиси, Mitsubishi

 

Шаг 2Орфография

На втором шаге для каждого запроса составляем палитру всевозможных вариантов написаний с учетом опечаток пользователей и различных способов транслитерации. В простых случаях (Милка, Milka) официальное название совпадает с разговорным употреблением слова, однако, большинство как зарубежных, так и отечественных брендов предполагают не единственный способ написания. Рассмотрим разнообразие опечаток и транслитерации на примере Mitsubishi.

В кириллическом варианте написания Митсубиси различные интерпретации возможны в двух частях слова (выделены жирным шрифтом). Сочетание «тс» зачастую заменяется «тц» или «ц», а вместо «с» в конце слова используют «ш». Для того чтобы не потерять ни один из множества вариантов удобно использовать следующую матрицу (в строках отражены варианты написания первого сложного сочленения букв «тс», в столбцах – второго).

 

Митсубиси

 

с

ш

Митсубиси

тс

Митсубиси

Митсубиши

тц

Митцубиси

Митцубиши

ц

Мицубиси

Мицубиши

 

Таким же способом мы подбираем возможные опечатки для латинского варианта. Нетипичное скопление согласных предрасполагает к пропускам букв: сочетание ts по близости звучания иногда заменяется буквами с, tcztzs, а сочетание sh – schc. Каждый из запросов по отдельности тестируем в строке поиска (кнопка «Показать результаты») для оценки популярность каждого способа написания. В запрос включаем те варианты, по которым есть поток.

Запрос      МитсубисиМитсубишиМитцубисиМитцубишиМицубисиМицубиши, Mitsubishi, Misubishi, Mitcubishi, Mizubishi, Micubishi, Mitzubishi, Mitsubisi, Mitcubisi, Micubisi, Mitzubisi

 

Шаг 3. Жаргонизмы

Кроме опечаток и вариативной транслитерации пользователи зачастую используют жаргон в обсуждениях бренда, изменяют слова с помощью сокращения или добавления разнообразных суффиксов. Например, Митсубиси часто сокращают до Митсу или Митсубы, что в дальнейшем трансформируется в Митсуху и даже Митсубиську. Стоит отметить, что каждый из данных запросов также стоит расширить вариантами написания и проверить в предварительном поиске на частоту упоминаний.

Запрос    (дополнение «Жаргон») МитсубаМитсухаМитсубиськаМитсуМитцубаМитцуха,  МитцубиськаМитцуМитсушенькаМитцушка

Шаг 4. Связанные объекты

Для аудита информационного поля бренда мониторинг основного названия не всегда бывает достаточен. В некоторых случаях название компании прочно ассоциируется с ее первыми лицами, с отдельными продуктами, с известным в народе рекламным слоганом. Если эти объекты имеют отличные от основной торговой марки названия и при этом конкурируют с ней по узнаваемости, их стоит включить в поисковый запрос. Например, компания Apple прочно ассоциируется со Стивом Джобсом, а слоган «Не тормози – сникерсни» — с шоколадкой Snickers.

В полюбившемся нам примере Mitsubishi жизненно важно включить названия основных модельных рядов, т.к. они идентифицируют общую торговую марку, имея при этом уникальные названия PajeroOutlander и Lancer. Для каждой из дополнительных марок повторяем процедуру шагов 1-3, чтобы учесть разнообразие вариантов написания.

Запрос    (дополнение «Модели») Паджеро, Пажеро, Пахеро,  Pajero, Аутлендер, Аутлендэр, Аутлэндер, Аутлэндэр, Outlander,Ланцер, Лансер, Ланцэр, Лансэр, Lancer

 

Шаг 5. Уникальные хэштеги

Финальной вишенкой на торте поискового запроса являются  хэштеги и аккаунты бренда в социальных сетях. В случае если их написание отличается от уже включенных вариантов названий, дополнение запроса хэштегами и id аккаунтов в социальных сетях позволит собрать максимально полную базу упоминаний бренда. В примере с Mitsubishi мы включаем только те хэштеги и id сообществ, написания которых отсутствуют в исходном запросе.

Запрос    (дополнение «Хэштеги») MMCRussia, SochiMitsu, LancerX, “#OutlanderSport”, “#PajeroSport”, “#Аутлендерспорт”, MitsubishiRussia, mitsucarrus, “#Паджероспорт”, “#MitsubishiMotors

Таким образом, следуя по шагам приведенной схемы, даже в самых сложных примерах можно составить поисковый запрос высочайшего уровня полноты. Готовые поисковые запросы также удобно проверять по опорным точкам: «Все ли варианты написания (кириллица/латиница, транслитерация, опечатки) учтены?» «Учтены ли жаргонизмы?» «Есть ли значимые связанные объекты (персоны, слоганы, продукты)?» «Включены ли уникальные хэштеги?»

Часть 2. Использование слов «минус»

Для составителя поисковых запросов такие названия брендов, как Hyundai, Volvo или Lamborghini, — настоящий подарок: для получения точного запроса достаточно учесть различные варианты написания брендов. Для уникальных названий подобный широкий запрос будет являться полным и релевантным одновременно, т.е. позволяет находить все упоминания искомого бренда без лишней информации.

Однако реальный рынок не всегда бывает так благосклонен к аналитикам: многие названия неоднозначно идентифицируют бренд. Например, ГАЗ может относиться как к отечественной автомобильной группе, так и к топливу, к агрегатному состоянию и т.п. Сектор газа может обозначать как музыкальную группу, так и палестинскую территорию.

Ключевой вопрос, которым задается аналитик, при составлении поискового запроса для бренда с неуникальным названием: какова доля релевантных упоминаний в широком запросе? Для оценки уровня чистоты запроса удобно использовать предварительный поиск (кнопка «Показать результаты» внизу) и смотреть долю упоминаний в списке, идентифицирующую искомый бренд. Если при тестировании широкого запроса встречаются иные сущности с тем же названием, однако доля релевантного потока больше, следует использовать слова «минус», исключающие ненужные объекты из поиска.

Рассмотрим применение блока слов «минус» при составлении полного и релевантного запроса для автомобильного бренда Форд. Для этого сначала тестируем широкий запрос, состоящий из кириллического и латинского написания бренда.

Запрос      Форд, Ford

Предварительная оценка результатов поиска по широкому запросу показывает, что запрос является полным, но не чистым (встречаются упоминания других объектов с идентичным названием). Т.к. в данном случае подавляющее большинство упоминаний относится к автомобильному бренду, мы используем подход слов «минус», чтобы исключить отдельные нерелевантные сообщения.

Помимо автомобильного бренда, слово Форд (Ford) обозначает распространенную английскую фамилию. В потоке упоминаний встречаются следующие личности с данной фамилией: основатель автомобильного концерна Генри Форд, дизайнер Том Форд, актёр Харрисон Форд, режиссёр Джон Форд и писатель Мэдокс Форд. Среди перечисленных публичных персон непосредственное отношение к искомому бренду имеет лишь Генри Форд, другие же личности из мира искусства подлежат исключению из поискового запроса.

Другие объекты
  • Генри Форд (Henry Ford), промышленник
  • Том Форд (Tom Ford), дизайнер
  • Харрисон Форд (Harrison Ford), актер
  • Джон Форд (John Ford), режиссёр
  • Мэдокс Форд (Madox Ford), писатель
  • Фрэнсис Форд Коппола (Ford Coppola), режиссёр

Чтобы отключить поиск по нерелевантным объектам при создании темы, необходимо добавить их названия (в данном случае – имена) в блок слов «минус». Однако, простое добавление имен Том, Харрисон, Джон и Мэдокс в слова «минус» не совсем корректно. Мы можем исключить релевантные упоминания типа «Джон Траволта стал новым лицом бренда Форд». Чтобы исключить ошибки такого рода, необходимо сузить расстояние между именем и фамилией исключаемых лиц. В системе Brand Analytics для этой цели необходимо заключить имя и фамилию в кавычки и после тильды указать максимальное возможно число промежуточных слов и перестановок. Например, для исключения личности Тома Форда из поиска, прописываем словосочетание следующим способом: «Том Форд»~2. Это означает, что между именем и фамилией может быть не более двух слов (например, второе имя/отчество) и перестановок (будут исключены комбинации и Том Форд, и Форд Том). Стоит отметить, что такая перестраховка при исключении персон требуется в случае распространенных имен (Том, Джон), в более уникальных случаях (Харрисон, Мэдокс) достаточным будет добавить в слова «минус» только имена. Кроме того, каждый запрос необходимо тестировать на варианты написания (см. часть 1).

Запрос      Форд, Ford
Слова«минус» «Том Форд»~2, «Tom Ford»~2, «Джон Форд»~2, «John Ford»~2, Харрисон, Харисон, Хариссон, Гаррисон,      Гарисон, Гариссон, HarrisonHarisonHarisson, Мэдокс, Мадокс, Madox, Коппола, Coppola

Таким образом, грамотное использование слов «минус» позволяет, сохраняя полноту сбора данных, добиваться высокой точности поисковых запросов.

Часть 3. Использование слов «плюс»

Исключение нерелевантных сущностей с помощью слов «минус» довольно удобно, однако при определенных условиях этот подход оказывается неприменимым для создания поискового запроса, например:

1)    невозможно ограничить список нерелевантных сущностей (по широкому запросу Иванов помимо главы администрации в поток попадают бесчисленные персоны с такой же фамилией);

2)    невозможно подобрать ключевые слова для идентификации исключаемых объектов (например, для сорта пива «Львовское» по широкому запросу Львовское поиск выдает множество нерелевантных сообщений с соответствующим прилагательным, в каждом случае относящимся к различным ключевым словам – Львовское отделение, Львовское консульство, Львовское издание).

Чтобы выбрать нужный подход («минус» или «плюс»), на этапе тестирования широкого запроса необходимо ответить на ключевой вопрос «Какова доля релевантных сообщений в предварительном потоке?» Если нерелевантных объектов в потоке немного и их можно идентифицировать ключевым словосочетаниями, тогда мы используем подход слов «минус» (см. часть 2). Если же поток очень грязный, т.е. в нем преобладают нерелевантные упоминания, которые нельзя исключить словами «минус», на помощь приходит метод уточнений, или слов «плюс». Рассмотрим их работу на примере еще одного автомобильного бренда «Волга».

Первым шагом тестируем широкий запрос Волга, Volga в предварительном поиске (кнопка «Показать результаты»). Оцениваем поток на чистоту – большая доля упоминаний идентифицирует не искомый бренд, а другие объекты: река Волга, университет ВолГУ, различные местные компании с Волгой в составе названия,  деревня Волга, бренды стиральной машины, пианино и т.д.

Другие объекты
  • река Волга
  • университет ВолГУ
  • компании «Волга-Инфо», ТЦ «Русь на Волге»,

«Волга-Ньюс», «Волга-Тур», бумкомбинат «Волга»

  • журнал «Волга»
  • личности Дарья Волга, Василий Волга

Анализ контекста упоминаний позволяет сделать вывод о том, что подход минус «слов» здесь неуместен: исключение сообщений об одной реке представляется нетривиальной задачей, ведь зачастую в сообщениях не фигурирует слово река (на берегу Волги, мост через Волгу, идет по Волге и т.п.).

Для составления полного и точного запроса в данном случае необходимо собрать максимальный набор уточняющих слов (слов «плюс»). В нашем примере уточняющие слова – это слова, наиболее часто употребляемые в контексте автомобильного бренда Волга. Для поиска слов «плюс» также удобно пользоваться предварительным поиском. В текстах релевантных сообщений ищем характерные слова, идентифицирующие автомобильный бренд – например, Волга с пробегом, за рулем Волги, Волга обогнала Мерседес.

Оценка контекста позволяет выявить следующие категории слов «плюс», с помощью которых можно создать полный и чистый поисковый запрос.

Категория Уточняющие слова
Товарная группа автомобиль, авто, машина, автомашина, легковушка,  легковой, седан,  транспорт
Модели ГАЗ-21, ГАЗ-22, ГАЗ-24, ГАЗ-3102, ГАЗ-3105, ГАЗ-3110, ГАЗ-3111, 02-я, 24-я, Volga Siber
Части руль, педаль, багажник, мотор, двигатель
Связи пробег, лошадиные силы, лс, дтп, дорога, водитель  
Действия водить, ехать, обгонять
Конкуренты Жигули, Ауди, Вольво, BMW, Mercedes
Хэштеги #Волга1960#Волга777,  #gaz21, #Волгагаз, #Волга21

Включение уточняющих слов в запрос производится через пробел (логический знак «и»), между комбинациями ставится запятая (логический знак «или») – таким образом, ведется поиск всех сообщений содержащих название бренда хотя бы с одним из уточняющих слов.

Запрос      Волга автомобильВолга машинаВолга автоВолга транспортВолга легковаяВолга ГАЗ,  Волга рульВолга двигательВолга пробегВолга лошадиныйВолга лсВолга водитель,  Волга ехатьВолга АудиВолга ЖигулиВолга БМВВолга обгонятьВолга водить, Volga Siber, Volga BMW, Volga ГАЗ, Volga авто, “#Волга1960”, “#Волга777”,  “#gaz21”

 

Финальное тестирование запроса

Перед сохранением темы жизненно важно провести контрольную проверку запроса с помощью кнопки «Показать результаты». Эта операция поможет исключить возможные ошибки: предварительная оценка чистоты и полноты выдачи по составленному запросу позволит отшлифовать запрос с помощью дополнительных слов «плюс» и слов «минус».  Финальный запрос, таким образом, будет отражать максимально релевантные данные. Рассмотрим процедуру тестирования финального запроса на примере бренда «Мерседес».

Запрос      МерседесМэрседесМэрсэдесМерсэдэсМэрсэдэсМерседэсМерсМэрсМерин, Mercedes, Mercedez, ”#MercedesBenz”, ”#Mercedesbenzclub”, ”#МерседесБенц
Слова«минус» «Сивый мерин»~0, кобыла, «Старый мерин»~2, шайрский, «Сергей Меринов»~2, «Алексей Меринов»~2

Составленный запрос система предварительно оценивает в 110 тыс. сообщений в неделю. Доступная выдача в 60 последних сообщений демонстрирует полную релевантность (все сообщения относятся к автомобильному бренду). Однако эти 60 сообщений – лишь верхушка айсберга, большая же его масса скрыта под водой. Будет ли результат таким чистым для оставшихся 110 тыс. сообщений? Чтобы проверить, не скрыты ли толще потока пласты нерелевантных упоминаний, мы добавляем уточняющие слова, характеризующие автомобильный бренд в блок слов «минус». Так, в предварительной выдаче находим слова, употребляемые в контексте автомобиля Мерседес: руль, Ауди, обогнал, бронированный и т.д. Все эти уточняющие слова на этапе проверки добавляются в блок слов «минус» — таким изящным способом мы можем детально рассмотреть «рискованные» части выдачи, в которых нет слов, наиболее часто ассоциируемых с брендом.

Запрос      Мерседес, Мэрседес, Мэрсэдес, Мерсэдэс, Мэрсэдэс, Мерседэс, Мерс, Мэрс, Мерин, MercedesMercedez, ”#MercedesBenz, ”#Mercedesbenzclub”, ”#МерседесБенц
Слова    «минус» для коррекции финального запроса «Сивый мерин»~0, кобыла, «Старый мерин»~2, «Сергей Меринов»~2, «Алексей Меринов»~2, шайрский, машина, авто, автомобиль, транспорт, Макларен, Ауди, Audi, БМВ, BMW, бронированный, Бенц, Benz, Бенс, Бенз, руль, ездить, водитель, двигатель, салон, водить, Форд

 

Кроме того, каждую такую проверку можно проводить по отдельным типам источников (меняя галочки в области поиска «микроблоги», «отзывы» и пр.). При тестировании запроса Мерседес таким способом удалось найти дополнительные слова «минус» — в выдаче были найдены блоки упоминаний об актрисах Мерседес Масон и Мерседес Ламбре, романе Кинга «Мистер Мерседес»,  а также ЖК «Мерседес». Это те самые финальные вишенке на торте нашего поискового запроса: убираем из блока «минус» уточняющие слова автомобильной темы и вносим нерелевантных двойников «Мерседес».

Запрос      МерседесМэрседесМэрсэдесМерсэдэсМэрсэдэсМерседэсМерсМэрсМерин, Mercedes, Mercedez, ”#MercedesBenz”, ”#Mercedesbenzclub”, ”#МерседесБенц
Слова«минус» «Сивый мерин»~0, «Старый мерин»~2, шайрский, «Сергей Меринов»~2, «Алексей Меринов»~2, кобыла, «Мерседес Масон»~2, «Мерседес Ламбре»~2, «Мистер Мерседес»~0, «ЖК Мерседес»~2

И в заключении – обобщенная схема составления поискового запроса.

 
 

Запись опубликована в рубрике Обучающие материалы. Добавьте в закладки постоянную ссылку.
Комментариев: 0
Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

*

*

CAPTCHA изображение