Экспертное мнение

Современные специализированные инструменты отличаются важнейшим признаком

«Современные специализированные инструменты отличаются важнейшим признаком: они делают большую часть работы аналитика автоматически и с огромной скоростью, и они позволяют быстро находить такие зависимости, которые аналитик мог бы и не заметить». Интервью с Александром Дмитриевым, ведущим системным архитектором Клиентского центра IBM.

alt

Александр, какие бизнес-задачи может решить анализ социальных медиа, а в каких случаях он совершенно бесполезен? Каковы преимущества и ограничения этого метода?

Сначала расскажу о трудностях. Анализ социальных медиа с научной точки зрения пока не отработан методологически. Есть целый ряд проблем, связанных с математическим аппаратом, лежащим в основе анализа. Чтобы полученные в результате анализа данные были релевантными, то есть им можно было бы доверять и на их основе делать какие-то выводы, нужно соблюдение целого ряда параметров. При анализе соцмедиа и соцсетей это сделать крайне сложно. Например, трудно контролировать выборку – то есть понимать, кого мы анализируем, правду ли эти персоналии пишут, отражает ли текст в социальных сетях реальность или является вымыслом. Очень сложно контролировать, так называемую, репрезентативность, то есть соблюсти условие, при котором процентное соотношение различных типов объектов в жизни соответствовало бы процентному соотношению представленных ими данных в анализе. Если привести аналогию, мы приезжаем в незнакомый город, где живут сто человек. Предположим, что с научной точки зрения достаточно выборки в десять человек для составления портрета жителя города. Но вот незадача. Девяносто из них – молчуны и домоседы, работящие и скромные, все живут абсолютно одинаково, не посещают единственный местный бар, рано ложатся спать и т.д. А десять жителей постоянно сидят в баре и почти не бывают дома. Мы приехали в город, остановились у бара – вошли и опросили десять человек об их образе жизни, понаблюдали за ними. Какой портрет среднего жителя города мы составим? Правильная или репрезентативная выборка должна была бы включать одного завсегдатая бара и девять домоседов. Но мы не смогли попасть в закрытые дома и опросили тех, кто доступен. Это мое видение основных проблем и ограничений при анализе соцсетей.

Подобные ограничения принципиальны, и любой анализ социальных медиа должен учитывать эти моменты при проведении исследований.

Но есть и приятная сторона. Социальные медиа позволяют решать большое количество практических задач для бизнеса, в частности находить новые, возникающие области интереса к продуктам и сервисам. Также анализ соцмедиа позволяет находить новых клиентов, формировать новые и привлекательные предложения для различных типов клиентов, проводить сегментацию типов клиентов. Все это очень нужно и важно для финансовых, банковских структур, для политических организаций. Поэтому, несмотря на все сложности, анализ соцмедиа весьма актуален. Другой вопрос – как это правильно делать. Но это уже тема отдельного разговора.

Какие специальные инструменты используются для анализа социальных медиа?

Для анализа соцмедиа, собственно говоря, вроде бы можно использовать традиционные аналитические инструменты. Что надо сделать? Написать программы (боты), которые бы собирали с разных сайтов и источников информации в сети текстовую и другую (графическую, цифровую) информацию. Затем отфильтровать специализированные данные и шум, упорядочить и классифицировать полученные данные. Затем найти корреляции в этих данных и построить гипотезы. Что это такое?

Предположим, мы анализируем те письма, что пишут клиенты банка на сайте, посвященном проблемам банка. Там кто-то жалуется, кто-то благодарит, кто-то вообще пишет, что называется, «не в тему», скажем, о стрижке болонок и пуделей. Мы можем скачать все эти тексты, выбрать фрагменты, которые связаны с недовольством (по ключевым словам и фразам, например «отвратительное обслуживание» или «большое спасибо за помощь»). Находим, что статистически недовольство вызывает работа операторов колл-центра банка при вопросах, связанных с «замораживанием» банковских карт, а также неудобными часами работы отделений. Ура, результат получен – далее организационные меры: операторов научить, с проблемой разобраться, часы работы подвинуть.

Но в жизни не все так просто. Специализированный инструментарий IBM позволяет выловить “дальние”, скрытые связи, построить так называемое дерево влияющих на нужный нам параметр факторов и указать соотношение степеней влияния тех или иных факторов на нужный. Кроме того, этот инструментарий позволяет за счет огромного количества встроенных математических моделей и методов, автоматически, без участия человека, обрабатывать огромное количество статистических гипотез, выбирать наиболее значимые и представлять уже для окончательного анализа специалисту. Таким образом, современные специализированные инструменты отличаются важнейшим признаком: они делают большую часть работы аналитика автоматически и с огромной скоростью, и они позволяют быстро находить такие зависимости, которые аналитик мог бы и не заметить, и в первую очередь новые или необычные зависимости. Ведь применение традиционного инструментария предполагает, что аналитик сначала строит какие-то предположения, гипотезы на основании своего опыта работы в данной индустрии, и потом уже применяет инструментарий для проверки этой гипотезы. Передовая аналитика с элементами искусственного интеллекта как бы переворачивает задачу с головы на ноги: «прогоняет» все возможные корреляции – и выдает наиболее значимые для финального анализа. В этом отличие новых инструментов.

Какие у Вас были самые интересные и запоминающиеся кейсы в практике?

Такая аналитика уже вышла на ту часть знаменитой кривой жизненного цикла продукта, когда интерес переходит в реальные проекты. Клиентский центр IBM в Москве участвует в большом количестве проектов, и, хотя методика анализа и инструментарий во всех проектах примерно одинаковы, в каждом проекте есть своя специфика. Ведь один из ключевых моментов, который не совсем очевиден для многих – невозможно заранее сказать, есть ли в больших данных, которые накоплены у многих организаций, «полезные» данные, или это просто «мусор». Поэтому обычно проекты разбиваются на пилотную стадию, где выявляется, есть ли «золото» в руде. А потом уже модель – и анализ ставится на поток.

Если говорить об интересных кейсах, то их множество. Например, по огромному количеству данных о сотрудниках крупного банка можно построить профиль, соответствующий той или иной должности, что является огромным подспорьем для отдела кадров. Можно выявить характерные признаки неплательщиков и отловить их на ранней стадии, что экономит большие деньги для кредитного отдела банка. Можно определить, почему вдруг ломается дорогостоящее оборудование и предсказывать это заранее, направляя ремонтную бригаду в нужную точку до того, как произойдет поломка – это также очень большие деньги для серьезного производства. А можно проанализировать соцмедиа и выявить точки культурного взаимодействия для развития отношений между двумя странами. Все эти проекты прошли через руки и умы специалистов Клиентского центра. Что касается социальных исследований, вот пример совместной работы ВЦИОМ и IBM по заданию правительства Южной Кореи, который получил высокую оценку от заказчика.

Существует ли граница между личным пространством и информацией, доступной для исследований? Можно ли собирать информацию без вторжения в личное пространство и конфиденциальные данные?

Юридически граница обозначена в законе о персональных данных и должна соблюдаться абсолютно четко.

Данные можно собирать без вторжения в личное пространство, так как если человек согласился на передачу и обработку собственных данных.

То есть если для конкретных целей кто- то считает, что его данные нужно и можно обработать и дает согласие, зафиксированное по правилам – да анализируйте, сколько душе угодно.
Есть еще один момент: данные можно деперсонифицировать. Вместо номеров паспортов, скажем, проставить по порядку цифры 1, 2, 3… и т.д. Вместо имен – буквы А, Б, В, … и т.д. Тогда мы при анализе можем выявить нужные и интересные, но общие зависимости, которые не относятся к конкретной персоне и не затрагивают ее личного пространства. Опять-таки, самое главное при всех этих процедурах – четко соблюсти законодательство.

Что отличает анализ публикаций в социальных медиа от других подходов к изучению предпочтений потребителей. Способен ли этот метод составить конкуренцию традиционным опросам?

В мире маркетологов и социологов идут баталии и жаркие дискуссии по поводу ответа на этот вопрос. Но как ни странно, с практической точки зрения все достаточно просто. Никто не отменял традиционных методов анализа – фокус-групп, опросов, экспертных оценок, интервью и т.д. Просто появился еще один интересный инструмент, обладающий как достоинствами, так и недостатками. Достоинство – скорость получения результата, возможность автоматизации анализа, возможность обучения модели в режиме реального времени, возможность выявлять новые, еще неизвестные тенденции и явления. Недостатки уже перечислил в ответе на первый вопрос – сложность контроля соответствия результата и реалий, невозможность доступа к закрытым или не проявляющим себя в соцсетях группам. С моей точки зрения, наиболее интересным является сочетание традиционных и инновационных методов.

Как исследовать данные социальных медиа, чтобы результат заслуживал доверия? Нужно ли подкреплять такую аналитику другими исследованиями?

Ответ на этот вопрос весьма прост: да, конечно нужно. Но есть одна проблемка в реальной жизни – ограничение по бюджету и времени. Иногда быстрый, хотя и не абсолютно точный результат очень важен, ведь в основном анализ данных нужен для того, чтобы принять правильное бизнес-решение. Вовремя принятое бизнес-решение зачастую настолько важно, что именно новый аналитический инструментарий, позволяющий быстро просеивать гору больших данных и выдавать результат является той самой привлекательной чертой, за которую бизнес платит деньги.

© 2020 Ассоциация исследовательских компаний «Группа 7/89». Все права защищены.

Поиск