С момента появления на свет чуть ли не каждое действие современного человека фиксируется компьютерными программами. Получаемые в результате этого гигантские базы данных могли бы изменить мир к лучшему.
Ничто так хорошо не демонстрирует силу компьютерных технологий в Нью-Йорке, как... отработанное растительное масло. Городские власти ухитрились с помощью компьютеров вычислить рестораны и кафе, которые сливают масло в канализацию, засоряя ее.
Это достижение — заслуга отдела аналитики в управлении стратегического планирования мэрии. Здесь проблемы решаются с помощью математики и обработки огромного объема данных. А в Нью-Йорке — как и любом мегаполисе — этого добра хватает. Тут данные и о расходе электричества, и о налоговых платежах, и о срабатывании автоматических систем пожаротушения, и о количестве инфарктов, и об уровне загрязнения воздуха.
Каждый день через компьютер руководителя отдела Майкла Флауэрса проходит один терабайт информации — объем, равный 21 миллиону книг. Благодаря анализу этих данных мэрия смогла найти тех, кто сливает в канализацию отработанное растительное масло — в трубах оно образует сгустки и закупоривает их. Раньше злоумышленников искали инспекторы — как правило, безуспешно. Но в результате анализа информации нашлась простая закономерность: рестораны, расположенные рядом с канализационными люками и не пользующиеся услугами по вывозу отработанного масла, являются самыми вероятными виновниками засора.
Аналитики составили список подозреваемых и отправили в инспекцию. И точно: в 95 процентах случаев выяснилось, что именно те сливали масло в канализацию.
Проблема, дорого обходившаяся городскому бюджету, была решена с помощью информационных технологий.
«Большие данные» — так называют гигантские массивы информации, накапливаемые человечеством ежесекундно. Их компьютерный анализ открывает огромные перспективы. Сделать мир удобнее, выявить скрытые закономерности, найти решения, основанные на безграничном массиве объективных сведений.
Происходящая сейчас информационная революция затрагивает все сферы жизни — медицину, политику, транспорт, торговлю.
Например, сотрудники немецкой компании «Блю Йондер» из города Карлсруэ каждый день буквально заглядывают в будущее. Фирма прогнозирует продажи в супермаркетах — это помогает планировать закупки и сократить количество непроданных продуктов, которые приходится выбрасывать.
Сердце компании — алгоритм обработки данных, созданный под руководством профессора Технологического института Карлсруэ, специалиста по физике высоких энергий Михаэля Файндта. Раньше он занимался «большими данными» в Европейском центре ядерных исследований (CERN) в Швейцарии. Большой адронный коллайдер — самая крупная информационная фабрика в мире. Ее производительность — один петабайт (1015 байт) данных в секунду. За один час коллайдер выдает больше информации, чем накопило человечество за всю свою историю до 2000 года.
Но и супермаркеты не отстают. Для одного заказчика «Блю Иондер» еженощно рассчитывает 500 миллионов прогнозов — об объеме продаж во всех филиалах сети на три недели вперед. Каждое утро свежие данные автоматически загружаются в компьютерную систему заказчика, регулирующую оптовые закупки.
Но автоматизм этой программы не значит, что люди не важны. Наоборот, именно они проводят первичную обработку информации. Ведь при прогнозировании продаж надо учесть сотни параметров: отчеты с кассовых аппаратов, описание товара (цвет, размер), цены, сезон отпусков, большие события (типа чемпионата мира по футболу), рекламные акции, действия конкурентов. Кроме переменных есть и постоянные факторы. Например, первая суббота после зарплаты — в такие дни продажи отдельных товаров всегда растут.
Перед построением первичного прогноза надо «для разминки» загрузить в программу порцию параметров. Система должна скомбинировать данные так, чтобы результат был максимально близок к реальным объемам продаж. Итоговую величину специалисты называют «истинной». По ней и «калибруется» программа.
С точки зрения математики программа учится оптимально координировать переменные. На деле же она изучает поведение человека. Чтобы суметь прогнозировать человеческие поступки в будущем.
Этот процесс называется «самообучением машин». Каждый поисковый запрос в интернете, каждый платеж кредитной картой, каждый звонок по мобильному — на базе всей этой информации программы сами наращивают свою производительность.
Прогнозы компании «Блю Пондер» относительно продаж в супермаркетах на 40 процентов точнее оценок самых лучших маркетологов. Похожие алгоритмы работают в Голливуде: там уже научились с поразительной точностью просчитывать будущие кассовые сборы фильма — на основе одного лишь сценария, еще до начала съемок. Некоторые программы ставят диагнозы точнее врачей — например «Изабель», выявляющая болезнь с 96-процентной точностью после анализа демографических данных и симптомов.
«По сравнению с компьютерами людская интуиция неконкурентоспособна», — говорит профессор Файндт.
«Большие данные» появляются там, где объединяются современные технологии: мощнейшие компьютеры, сверхъемкие запоминающие устройства, «умное» программное обеспечение, быстрый интернет, а также всевозможные датчики.
Масштабы этого массива поражают. Каждый час на «Фейсбук» загружается 15 миллионов фотографий. Каждый день «Гугл» обрабатывает три миллиарда запросов. Один-единственный современный авиационный двигатель со всеми своими датчиками производит 20 терабайт информации — за один рейс.
Информационная паутина — самый быстрорастущий «организм» на земле. Ее размах ограничен лишь емкостью компьютерных накопителей. А потенциал применения данных поистине безграничен.
В Англии, например, разработан ковер для домов престарелых — напольное покрытие с датчиками, фиксирующими походку пожилых людей. Как только идущий начинает терять равновесие, система отправляет сигнал персоналу.
В Бостоне (США) запущено приложение для смартфонов, регистрирующее выбоины в асфальте по сотрясению автомобиля и автоматически отправляющее сигналы в службу ремонта дорог.
В Австралии разработана система диагностики состояния недоношенных новорожденных. Программа выявляет малейшие изменения в работе организма малышей и подает сигнал тревоги — нередко уже за сутки до того, как опасность замечают врачи.
Есть и другие технологии. Например, «криминологическое прогнозирование» в США. Тоже обработка информации, только вместо огурцов и зубной пасты — грабежи и разбои. С ее помощью американская полиция вычисляет, где и в какое время суток наиболее велик риск уличных нападений. Первые результаты впечатляют.
Другой пример использования «больших данных» — «умные электросети». Технология, особо актуальная для стран, стремящихся увеличить долю альтернативных источников энергии. Она позволяет регулировать перепады напряжения в сети при подаче электричества от нестабильных источников типа ветрогенераторов и солнечных батарей. И запускать стиральные машины в тот момент, когда электричества достаточно. Все элементы этой системы — от настольной лампы до ветряной электростанции — собирают, передают и обрабатывают данные.
Так шаг за шагом информационные технологии проникают чуть ли не во все сферы жизни. Может, поэтому о них идут такие споры?
Еще в 2008-м Крис Андерсон, бывший главный редактор американского журнала «Вайред», высказал провокационную идею: сложные гипотезы — вчерашний день. Скоро будет достаточно загрузить данные в компьютер, и тот сам ответит на все вопросы. Благодаря машинам мир станет понятным и гармоничным.
Но есть и критики. «Солюционизм» — вера в то, что все мировые проблемы решаемы с помощью компьютеров. Так называет эту идеологию Евгений Морозов, российско-американский журналист. Он предостерегает: «информатизация» общества способна обернуться не спасением, а проклятием. Ведь компьютерные программы могут оказаться на службе не только у врачей, но и у диктаторов. Ясно одно: использование «больших данных» может вызвать самые неожиданные последствия.
Изучая кассовую отчетность, аналитики одной американской торговой сети сделали неожиданное открытие: по набору купленных товаров можно определить, ждет ли покупательница ребенка, — причем сами по себе эти товары не имеют прямого отношения к беременности. Среди них — обычные лосьоны без ароматизаторов и мультивитамины с минералами. Но последовательность, в которой они покупаются, очень показательна. По ней можно даже предсказать дату рождения ребенка.
Торговая сеть сделала адресную рассылку рекламы для будущих мам — и разразился скандал. В один из филиалов ворвался разъяренный мужчина и потребовал объяснить, почему компания шлет такие сообщения его несовершеннолетней дочери, которая никак не может быть беременной. Через пару дней мужчина узнал, что скоро станет дедушкой.
Иногда обнаруживаются очень странные совпадения. Например, канадская фирма по продаже автомобильных запчастей проанализировала миллиарды платежных данных покупателей. И выяснила, что у постоянных гостей одного бара очень высок риск обанкротиться. Но почему? Этого никто не мог понять, пока аналитики компании по обслуживанию кредитных карт не нашли связь между временем суток, в которое человек заправляет машину, и тем, планирует ли он в этот день крупные покупки.
«Мы привыкли думать, что люди непредсказуемы», — говорит Йохан Боллен из Университета Индианы (США). Но «большие данные» демонстрируют, что мы не так уж уникальны, как нам кажется».
Анализ массивов информации позволяет найти не только сходство между людьми, но и микроскопические различия.
Американская компания «БлюКай», например, специализируется на сборе информации о том, как люди ищут сведения в интернете. Ее задача — максимальная «индивидуализация» рекламы. То есть реклама автомобилей должна быть адресована только тем, кто ищет машину. А авиакомпаний — тем, кто планирует отпуск. «Рекламодатели хотят покупать доступ к конкретным людям, а не к веб-страницам в целом», — говорит основатель фирмы Омар Тавакол.
В архиве компании собраны данные на более чем 150 миллионов пользователей интернета из США. Всем им показывают рекламу, максимально подходящую под их поисковые запросы. Для этого используются так называемые «аукционы в режиме реального времени». В момент загрузки страницы ее рекламные площади автоматически выставляются на торги. И через какие-то доли секунды на сайте уже красуется информация о достоинствах машин или продаже авиабилетов. В американском секторе интернета проходят 80 миллиардов таких «аукционов» в день.
Они возможны только благодаря детальной классификации пользователей. Специалисты «БлюКай» делят их на микрогруппы по 30 тысячам критериев. Например: молодые любители телесериалов из сельских районов Техаса. Или: киноманы из Лос-Анджелеса, интересующиеся природой. Чем конкретнее аудитория, тем эффективнее реклама.
«Среднестатистические потребители» компанию «БлюКай» не интересуют. Для нее это «прошлый век». Новые технологии позволяют выявлять точечные параметры даже в гигантском массиве данных.
Адресными могут быть также и цены. Аналитики одного туристического портала обнаружили, что владельцы компьютеров «Эппл» тратят на гостиницы на треть процентов больше, чем пользователи «Виндоуз». После чего компания стала рассылать им рекламные предложения с 11-процентной наценкой.
В казино похожие методы используются для определения «болевого порога» богатых игроков — максимальной суммы, которую те готовы проиграть. Получается, что «умные» машины заставляют нас осознавать, насколько мы разные.
У 38-летнего жителя Берлина Ральфа Белуши анализ данных поставлен на отлично — благодаря новым весам, измеряющим как массу, так и содержание жира в организме, пульс и концентрацию углекислого газа в воздухе. Еще у него есть датчик уровня кислорода в крови. И электронный браслет, который регистрирует циклы сна и подсчитывает шаги. По вечерам немец загружает данные на свой смартфон, чтобы проверить, насколько он близок к цели — десять тысяч шагов в день. Он ведет дневник самочувствия, где отмечает любое недомогание.
Свой рацион он регулирует просто. Когда весы показывают содержание жира в организме меньше 12,8 процента, то можно есть все, даже шоколад. Но если выше — пора садится на диету. Почему именно столько процентов? «Сам не знаю, — говорит он. — Установил опытным путем».
На маньяка он не похож. Спортивный, открытый, оптимист. Работает старшим директором в компании «Занокс» — одном из крупнейших европейских агентств по интернет-рекламе. Зачем так «оцифровывать» свою жизнь? Что это, стремление к контролю? Или желание изучить себя с помощью технологий?
Электронное «самонаблюдение» — это только начало. На горизонте уже маячит «персонифицированная медицина». Пока она существует лишь в теории. «Современные технологии позволяют собирать очень подробную информацию о любом человеке», — говорит американский врач Эрик Тополь, один из идеологов «новой медицины». Вероятность инфаркта, уровень холестерина, генетические особенности, риск спортивной травмы... Измерить возможно все. А с помощью датчиков можно регистрировать любые параметры в режиме реального времени.
В будущем индивидуальными должны стать и методы лечения, дозировка лекарств, медицинские нормы. Звучит заманчиво. Но только не для ученых и врачей. «Придется перестроить всю систему медицинской диагностики», — говорит Тополь. Но как ориентироваться во множестве непохожих друг на друга индивидуальностей? Наука тоже должна быть «индивидуализированной», считает Тополь. Она больше не будет заниматься выявлением общих закономерностей. Ее объектом станут лишь отдельные случаи. И каждая история болезни будет уникальной.
Но учреждения и организации, действующие на основе принципа усреднения и обобщения, столкнутся с серьезными проблемами. Это и страховые агентства, и больницы, и налоговые инспекции, и школы. Для работы с индивидуализированными данными им потребуется полная перестройка.
Бен Вейбер, глава бостонской компании «Соушиометрик Солюшнз», уже начал такую перестройку. Пока что в сфере организации труда. Каждому сотруднику исследуемой фирмы он предлагает повесить на шею серую напичканную датчиками коробочку размером с телефон — для измерения отношений в коллективе.
Датчики точно регистрируют длительность разговоров с коллегами, дистанцию во время общения, местонахождение в офисе, позу, жесты и даже интонацию, по которой можно судить о настроении. Из собранных данных складывается детальная картина взаимоотношений. По ней видно, что эффективность работы обеспечивает один главный фактор: личные контакты. Разговоры с глазу на глаз. Общение в столовой, коридорах, на кухне.
Например, в колл-центре одного банка не было общего обеденного перерыва для сотрудников («операторы всегда должны быть на связи»). Вейбер убедил руководство банка разрешить отдельным бригадам устраивать 15-минутные перерывы — и продуктивность тут же возросла. Результат — 15 миллионов долларов экономии расходов.
В другой компании Вейбер сделал еще одно открытие. Он выделил среди персонала четырех человек, после общения с которыми продуктивность работы каждого из 54 сотрудников резко возрастала. Сами они работали не слишком эффективно, но явно мотивировали остальных.
Точность социометрии так высока, что на ее основе Вейбер может давать точечные рекомендации. Иногда для повышения продуктивности и удовлетворенности сотрудников (а эти параметры взаимосвязаны) достаточно лишь передвинуть кофеварку, чтобы возле нее могло собираться больше служащих.
Компаниям пора прогнать дорогих бизнес-консультантов, которые советуют им одну реорганизацию за другой, считает Вейбер. Лучше вводить небольшие новшества и с помощью социометрии проверять, как они влияют на настроения и производительность труда. Так можно выбрать эффективную стратегию, которая должна «стимулировать стихийное общение».
Так неужели информационные технологии, призванные сделать людей абсолютно предсказуемыми, помогут нам стать более спонтанными? На самом деле наша сильная сторона не интеллект, а способность к импровизации. Привносить в мир нечто неожиданное, незапрограммированное.
Информационные технологии будут поддерживать порядок. А человек — вносить в него элемент хаоса. Кто знает, может, так мы разделим обязанности с машинами в грядущую эпоху «больших данных».
(с) Кристоф Куклик