Ответ
Анализ данных для тех кто не любит математику Опции темы
Старый 27.08.2014, 10:27
  #1
Tallulah
 
Регистрация: 23.07.2014
Сообщений: 74

Анализ данных для тех кто не любит математику
Сегодня только и слышно «измерить», «большие данные» или «аналитика».

«Нельзя улучшить то, что нельзя измерить» - это настоящий боевой клич современного движения, управляемого данными.

Но в эру такого бума данных нас подстерегает опасность, а именно, неправильное использование данных или «потеря данных».

Беспокойство о цифрах

С вами такое случалось? Вам показывали огромное количество каких-то данных, но вы не вполне понимали, какое отношение они имеют к бизнесу?

Я знаю многих, кто периодически просматривает отчеты с финансовыми данными, статистику по социальным медиа или метрики Google Analytics. Я видел много отчетов, в которых одна таблица идет за другой, а, в итоге, клиент не понимает, что от него требуется или вовсе зацикливается на совершенно иных делах.

Вся прелесть данных в том, что они должны придать вам ощущение контроля, помочь лучше понять, что происходит с вашим брендом.

Мне нравится такая философия. Я хочу, чтобы люди были более спокойными, меньше волновались, когда они видят цифры. Я очень хочу уметь писать об анализе данных без лишней пустой информации. В первую очередь, потому что я знаю многих людей, которых пугает аналитика. Я просто хочу дать понять, что аналитика вовсе не устрашающее занятие. Именно по этой причине я решил поделиться своим простым методом работы с наборами данных.

Почему я считаю, что у меня достаточно знаний, чтобы рассуждать на эту тему?

У меня плохо с математикой. Я не статистик и не Бог в Excel (даже не смотря на 9 лет работы с этим приложением).

Но я получаю удовольствие от исследования рынка и цифровых областей исследования, я вырос вместе с этим. Я понял, что мне нравится анализировать качественные и количественные данные – исследования, фокус-группы, аналитика, статистика социальных медиа.

Я каждый день встречаюсь с людьми, которые тоже не любят математику. Предполагаю, что именно по этой причине они и не хотят браться за анализ данных.

Но послушайте, уж если я смог, сможете и вы. По крайней мере, я покажу вам, как вы можете победить цифры.

Определение «анализа»

Как-то один из моих первых боссов сказал мне, что я «неплохо обращаюсь с цифрами».

Эта его фраза озадачила меня на несколько лет. Я не понимал, как я мог провалиться в математике, но хорошо разбираться в количественном анализе. Теперь я осознаю, что анализ данных – это не совсем та математика, что мы учили в школе. Анализ – это, скорее, поиск шаблонов и выявление выгоды в столбцах цифр.

Если снова вернуться в мое прошлое, то в колледже я был ленивым студентом. Мой мозг каким-то естественным образом пытался найти простейшее решение, чтобы справиться с тем огромным потоком информации. Я думаю, что моя работа научила меня этому еще лучше.

Сначала просьба «научить» анализу ставила меня в тупик. Мой бывший босс был уверен, что нельзя «научить логике», нужно родиться с этим.

Я был вынужден учить других анализу данных, и это заставило меня разбить на части свой собственный мыслительный процесс. Я организовал его как 4 шаговую структуру, которую я использую, чтобы работать с наборами данных.

Доверьтесь мне. Все, что вам потребуется:

1. Составить список
2. Рассортировать
3. Объединить в группы
4. Отслеживать

Список – сортировка – группы – отслеживание.

Запомните. Это не сложно.

Процесс

1. Составить список

Список – это самая трудная и скучная часть анализа. Неважно, что нам нужно сделать: создать инфографику или найти слабые точки в показателях работы, необходимо собрать все данные, которые, как вам кажется, могли бы оказаться важными.

Под словом «список» я подразумеваю скопировать или напечатать всю имеющуюся информацию. Это можно сделать в Excel или аналогичном табличном приложении. В таблицах намного проще работать с отдельными ячейками.





Сам анализ тоже довольно скучная и однообразная работа. И вы ничего не сможете выяснить, если перед вами не будет всех возможных имеющихся данных. Также, вы не можете точно прогнозировать, к какому именно результату вы придете, поэтому лучше всего начать с довольно внушительного объема информации. Пусть данные удивят вас. На самом деле, вы можете только представлять, какие результаты вас ждут.

Дополнительные материалы для чтения: Посмотрите работу Сары Слобин «7 ½ шагов к успешной инфографике». Она рассказывает о ценности достоверных данных.





*Списки означают не только численные данные, но и качественные данные. В рыночном исследовании есть такое понятие, как «кодовая книга». Это такой забавный способ выразить мысль, что нужно «составить список из хорошей выборки качественных данных и организовать их таким образом, чтобы их было легче считать». Это просто более систематический способ выяснить, какие данные чаще обнаруживаются.

Если вам лень этим заниматься, можете сделать облако слов (см. wordle.net). Вы сможете понять, какие данные следует включать в список.

Если в вас проснулась творческая натура, можете просто записать все данные. Я иногда поступаю так с качественными данными, когда мне нужно привести мысли в порядок (по аналогии с интеллект-картами).

2. Сортировка

Так мы просеиваем данные. Это самый основной и простой способ установить любую схожесть, с той информацией, что у вас имеется.





Это своеобразное знакомство с вашей ситуацией. Когда вы сортируете разные параметры, вы начинаете понимать, какие из них «сильные», «ценные», «слабые». Какие параметры важны и нужны для работы?

Найдите как можно больше разных параметров: время, производительность, пропорция. Введите другие цифры и величины, которые определяют ваши данные.

Работая с качественной информацией (например, комментарии Facebook, описания статей), чаще всего вы будете сортировать частоту. То есть, насколько часто ответ появляется в выборке? Именно в таких случаях, кодовая книга и оказывается очень полезной. Это документ, из которого видно, как одинаковые ответы группируются вместе. Вы же поймете, какие идеи чаще всего упоминаются.

Для этого очень удобна функция условного форматирования в Excel. Я рекомендую воспользоваться всеми ее преимуществами.

Почему? Дело в том, что вы сможете выбирать целую колонку данных, а программа автоматически создаст заливку ячеек цветовыми градиентами, которые визуально покажут, насколько сильны цифры по отношению друг к другу.

3. Группы





Наш мозг естественным образом пытается найти шаблоны для потока информации. А создание групп – это возможность увидеть ситуацию с разных сторон.

Могу поспорить, когда вы смотрели на ряды цифр, вы уже пытались как-то их классифицировать, увидеть причины, почему одни цифры были более сильными.

Составляя список параметров, вы видите, какие из них (объективно) объединяются в одну группу. Обычно я составляю список всех параметров, которые находятся справа от цифр (мужчины, женщины, время суток, день недели, тип индустрии).

Да, снова списки. Анализ – это довольно нудное занятие. С этим нужно поработать, чтобы случилось волшебство.





После этого, я закрашиваю некоторые поля цветом. Наш мозг устроен таким образом, что цвет он воспринимает быстрее, чем форму. То есть, будет проще изучать шаблоны по цвету, чем каждый раз читать цифры. Именно поэтому, у меня всегда получается сетка всех цветов радуги, когда мне нужно проанализировать данные.

4. Отслеживать

А теперь нам нужно начать копать еще глубже.





Моя философия в отношении данных такова, что «данные – это всегда отношения». Само по себе число не имеет никакого смысла.

Еще один фундаментальный способ внести в данные дополнительный ингредиент – это время. Мне нравится представлять, что данные начинают жить, когда я с ними работаю. Я вижу, как они дышат, или двигаются и растут.

Как это сделать. Нужно просто организовать точное время выполнения шагов 1-3. Возьмите набор данных и измерьте полностью одинаковые параметры в динамике по времени или различным ситуациям. Если вы работаете с Excel (или другими таблицами), просто скопируйте и рассортируйте названия колонок, как вам хочется.

Предположим, вы измеряли «температуру» месяц назад. Вам нужно сделать это еще раз. И, возможно, в следующем месяце. Сейчас вы проводите «сопоставительный анализ».

Посмотрите на изменения и разницу в данных.





Возможно, то, что вы увидите, вас не впечатлит, но доверьтесь мне. Иногда, изначальные шаблоны, которые вы видели в первом наборе данных, не меняются (или не будут меняться), но в этом и есть вся суть.

Затем вы начнете задаваться вопросом: что происходило в тот период, что привело к сдвигу данных (или, наоборот, застою данных).

У вас появится объективное стремление посмотреть и на другие (вероятно, внешние) факторы, которые влияют на ваш бизнес или показатели производительности. Возможно, со временем вы даже начнете находить свою «среднюю» производительность.

Поищите ответы и на другие вопросы: Сейчас ситуация лучше, чем на прошлой неделе? Лучше, чем в прошлом году? Показатели выше или ниже, чем у ближайших конкурентов? Показатели отличаются у мужчин и женщин, посетивших сайт? Цифры аналогичны или отличаются от набора данных в другой стране?





Надеюсь, что эта статья вам помогла, хотя бы немного.

Анализ данных не должен вас пугать.

Не нужно быть великим математиком, чтобы сделать это. Нужно просто быть логичным и приложить немного усилий.
Нравится 0   Не нравится 0
Пожаловаться на это сообщение 0  
Ответить с цитированием

Ответ
 
 

Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
Полная настройка базы данных mysql CapBlackHo Работа 3 02.04.2015 21:22
5 плагинов для сбора данных о ваших клиентах Tallulah Сервисы 0 28.07.2014 10:41
11 миксов данных Raven, которые нельзя пропустить Jungle Сервисы 0 13.07.2014 22:12
Хранение данных - тогда и теперь Rattata Сервисы 0 30.03.2014 22:18
Европа любит халявные торренты и онлайн-трансляции Blade Файлообмен 6 17.02.2014 07:36

Метки
excel, анализ данных, аналитика, отчеты


Здесь присутствуют: 1 (пользователей: 0, гостей: 1)
 
Опции темы

Быстрый переход


Текущее время: 16:24. Часовой пояс GMT +3.