Print 9.35 pt 9.35 pt

Дайте мне Биг Дату… да побольше!!!

Автор: Антон Анферов
04 марта в 13:00

Вот уже заканчивается 15-й год, как я начал заниматься Шестью Сигмами и Бережливым производством. 10 лет с момента первой сертификации. Есть смысл оглянуться и посмотреть, что происходит. Что я и сделал.

Ранее разрозненные куски мозаики встали по местам. И вот к какому занятному выводу я пришёл.

Нынешняя тенденция к развёртыванию обширнейших сложных систем сбора данных является следствием всеобщего снижения культуры обращения с самими данными, что вместе с желанием и потребностью все-таки контролировать происходящее в бизнесе выражается в бессилии создать ёмкие функциональные системы сбора данных. Вместо этого, в большинстве случаев, громоздится система замеров всего и вся с максимально возможной частотой.

И наступает иллюзия контроля… а вместе с ней – иллюзия покоя.

Да, разумеется, есть те, кто действительно нуждается в обработке больших массивов данных и Биг даты. Но количество этих ребят тонет на фоне представителей первого типа.

Нет, я не выступаю против цифровизации как таковой. Вот только цифровизация, на мой взгляд, не значит обвешать всё и вся датчиками, что, к сожалению, я вижу в современной тенденции.

Начиная с «родного» LG, с которого начался мой путь в Сигму, и заканчивая крупными отечественными холдингами, ситуация повторяется.

Например, приезжаешь на такое предприятие, начинаются проекты. В какой-то момент встаёт вопрос сбора данных. И вот он, звёздный час местных работников: «Да у нас лучшая система сбора данных!». Конечно, они так не говорят, но размер букв, читаемых на их лицах, куда больше 72 кегля.

Варианты разные, но всегда с гордостью:

  • Мы можем любые данные с любого процесса каждую секунду/минуту/час собирать.

  • (приносят данные) вот выгрузка данных за 3 года… посекундная.

  • Мы за эту систему много денег заплатили.

Ну, и так далее. Ах да, много денег, обычно, это десятки миллионов.

Далее ты смотришь на этот ужасающий эксель, где все данные вперемешку, собранные одним куском, и понимаешь, что вот эти 30 столбцов по 30-40 тысяч данных в каждом - просто бесполезная информация,  которую, в лучшем случае, придётся день-два причёсывать. А в худшем – лезть в мозги этой системы и нюансы техпроцессов для вычленения из этих данных хотя бы 30-40 полезных строк.

Вот не поверите, далеко не всегда получается выцепить из 100-тысячного экселя эти самые 30-40 полезных строчек.

Несомненно, есть приятные исключения. И да, это лучше, чем топать и собирать все вручную. Это понятно.

Но вот ведь в чем парадокс. Компании тратят эти десятки миллионов, чтобы создать огромные системы сбора информации, серверы к ним, хранилища. Вот только не делается главный шаг: адаптация этой системы под нужды предприятия.

В итоге все эти никому не нужные данные хранятся, как груда мусора.

Или даже нужные, но непригодные для анализа. Потому что культуры и понимания, как работать с данными, нет.

А что есть? Есть вторая тенденция. Закупить какого-нибудь супер-пупер ПО, желательно разрекламированного или модного.

Например, тот же старик Минитаб, который за 50 лет своего существования обзавёлся всего десятком переводов и разных дизайнов одного и того же  (серьёзно, возьмите 14-й Минитаб и 17-й, разницы почти не найдите).

А дальше человек с гордым званием «аналитик» вгоняет всю эту портянку данных в тот же Минитаб, жмёт на заученные/подсмотренные/подсказанные кнопки (обычно регрессию или корреляцию) и ждёт чуда. Минитаб протяжно и жалобно кряхтит от такого объёма данных (помним, что старичку 50 лет), но мужественно выводит какие-то результаты.

Чуда почему-то не происходит. Например, результаты анализа показывают зависимости, противоположные всем учебникам. Или железобетонные зависимости перестают вдруг быть таковыми. В лучшем случае находятся закономерности, которые давным-давно и так всем понятны и вызывают разве что смех, мол, «открыл Америку, тоже мне».

И на то есть причины, о которых я не буду тут особо рассказывать (долго). На мастер-классе как раз и поговорим, кому будет интересно. 

Что происходит дальше, думаю, все представляют. «Врагами народа» объявляется или Минитаб, который «не подходит», либо вообще сами инструменты Сигмы, которые «не работают». Иногда даже, хоть и редко, костерят создателей системы сбора данных (впрочем у них нет шансов построить эту систему правильно на сколь-либо долгий период). И хоть бы кто сказал: «да я сам баран, не могу толком и внятно скомпоновать данные под запрос». Или: «да мы в компании вообще не представляем, что с этими данными делать». Нет же.

Для чего я все это пишу.

Увы, тенденция эта не случайная. И не первая.

Как только появляются автоматизированные системы, соответствующие способности мозга начинают атрофироваться. 

И примеров множество. 

  • так было с устным счётом и системой Трахтенберга после изобретения калькулятора. Зачем насиловать мозги, если можно кнопки потыкать.

  • так было с умением построить хороший маршрут после создания навигатора.

  • так отпала необходимость в энциклопедических знаниях после появления Интернета.

И так далее.

В этом нет, наверное, ничего плохого, так как это естественный процесс. Но что важно: все эти изобретения все равно требуют некого минимального уровня владения исходным навыком, а именно тем, который заменила техника. Калькулятор не избавил нас от правил порядка вычислений, навигатор – от понятий широта и долгота, Интернет – от базового набора знаний образованного человека. Так же и в нашем случае с анализом данных от автоматизированных систем сбора данных.

В этой среде должен быть хотя бы базовый уровень грамотности, а он, к сожалению, не наблюдается. И это та проблема, которую уже сейчас надо решать. К моей большой радости это означает, что Шесть Сигма, коей я посвятил столько лет, скоро станет сильно востребована. Как минимум теми, кому надоело копаться в кучах мусорных данных.