Авторские блоги и комментарии к ним отображают исключительно точку зрения их авторов. Редакция ЛІГА.net может не разделять мнение авторов блогов.
01.03.2017 14:31

BIG DATA: большое будущее или большие проблемы?

Chief Strategy Officer of Thync

Уже к 2020 году онлайн досье на каждого жителя земли будет сравнимо с электронной библиотекой в 5000 книг. И если всего несколько лет назад, исчисляемые террабайтами и зеттабайами данные хаотично накапливались, не находя практического применения, то сегодн

Скорость проникновениячеловека во всемирную сеть растет в геометрической прогрессии и каждое действиев ней оставляет след, выраженный двоичным кодом: google ежесекундно получает более60 000 поисковых запросов, более миллиарда пользователей социальной сети Facebook ежеминутно отправляют 30 миллионов сообщений и просматриваетпорядка трёх миллионов видео.

Добавим ко всему этому миллионыбанковских транзакций, проскроленных интернет страниц, купленных в online -магазинах товаров, даже просто опубликованных фото ивысказанных в сети мнений.  

Уже к 2020 году онлайн досьена каждого жителя земли будет сравнимо с электронной библиотекой в 5000 книг. Иесли всего несколько лет назад ,исчисляемые террабайтами и зеттабайами данные хаотичнонакапливались, не находя практического применения, то сегодня в арсеналеаналитиков появились такие программные решения, как Spark и Hadoop . Эра накопления big data завершилась, уступив местоэре обработки и анализа результатов.

Возможности big data более емко раскрываются в трендовойсегодня концепции интернета вещей ( IoT ). К примеру, вы (и еще несколькомиллионов таких, как вы) носите на запястье фитнес-браслет, фиксирующийжизненные показатели организма. Подключаясь к интернету, данные гаджетастановятся достоянием всемирной сети. В медицинской сфере анализ таких данных даетвозможность оценить показатели здоровья целых социальных групп, определитьпроблемные точки, улучшить качество терапии и предложить экономически эффективныеметоды лечения. Уже сегодня Google Flu Trends позволяет анализироватьданные распространения простудных заболеваний ,а в обозримом будущем с п омощью big data медицина сможетлокализировать и гасить очаги мировых эпидемий и совершенствовать эффективностьлекарственных препаратов по результатам потоковой аналитики от пациентов. И этолишь одна точка приложения усилий. По прогнозам аналитиков, к 2025 году болеетридцати миллиардов привычных нам бытовых устройств будут подключены кинтернету. И если сегодня, по различным аналитическим подсчетам, рынок IoT оценивается в 600 - 900 миллиардов долларов, ток 2025 объемы рынка имеют потенциал роста до пяти-шести триллионов долларов.

Но у каждой медали две стороны. Темная сторона big data – открытостьличной информации пользователя. В обозримом будущем система будет знать о насвсе: рост, вес, состояние банковской карты, депрессивное настроение, политическиевзгляды и сексуальные предпочтения… Анализ таких данных в глобальном масштабепозволит отслеживать перемещения и контакты, получать рычаги давления, средствадля шантажа и даже манипулировать социальными настроениями общества в целом.

Ярким примером может служить недавняя история английскойкомпании Cambridge Analytica, которой мировые СМИ приписывали манипуляции вполитическом маркетинге. Используя метод психологического таргетированияпрофилей пользователей соцсетей, Cambridge Analytica получила возможностьформировать общественное мнение, повлияв тем самым на результаты Brexit и обеспечив победу Трампа на президентскихвыборах в Америке. Вопрос корректности выводов относительно действий CambridgeAnalytica остается открытым, но потенциальные возможности в манипулированиисознанием больших социальных групп через анализ их личных данных – лакомыйкусочек для многих. На уровне бизнесаиспользование такой информации дает возможности расширения клиентской базы иувеличения продаж, на более высоком уровне big data позволяет мониторитьсоциальные настроения, прогнозировать теракты, вспышки насилия и даже этническиеконфликты… Согласитесь, маловероятно, что, имея на руках такой мощный ресурс,лидеры мнений и власть имущие откажут себе в удовольствии им воспользоваться.

Наши смартфоны, планшеты,электронные книги – это огромный опросник, который мы вольно или невольно постояннозаполняем. Анализ поисковых запросов в привязке к аккаунту позволяетправоохранителям вычислить потенциально опасных членов общества и предвосхититьпреступления. Агентство Национальной Безопасности США ежедневно отслеживаетоколо двух миллиардов телефонных звонков, электронных писем и личных сообщений.С помощью анализа больших данных можно отследить траектории перемещенийчеловека, определить кто с кем встречается и насколькостабильны эти связи. В 2014 году группой ученых Сингапура было опубликованолюбопытное исследование. На основании данных о месторасположении более шестисоттысяч мобильных устройств, ученые прогнозировали траектории перемещений и выстраивалисоциальные контакты исследуемых. В результате, уникальными оказались более 60%результатов. Исследование носило красноречивое название: «Not So Unique in the Crowd:a Simple and Effective Algorithm for Anonymizing Location Data».

По прогнозам консалтинговойкомпании Ganter , уже к 2018 году около 50% всех правовых нарушений будутсвязаны с вторжением в личное пространство и некорректным использованием личныхданных. Алгоритмы защиты и анализа личной информации сегодня далеки отсовершенства и вопрос цифровой этики целиком и полностью лежит на человеке.Польский студент Кембриджа и один из авторов того самого методапсихологического таргетирования Михаил Козинский в ответ на массовоенедовольство, обрушившееся на него после президентских выборов в Америке,сказал: «Тут нет моей вины. Это не я соорудил бомбу, я лишь показал, что онисуществуют».

Если Вы заметили орфографическую ошибку, выделите её мышью и нажмите Ctrl+Enter.
Последние записи
Контакты
E-mail: blog@liga.net