Тилль Стимберг, Hewlett Packard Enterprise - о стремительном росте «цифровой вселенной» и способах с ней совладать

1 окт 2019

Портал TAdviser опубликовал самые интересные факты из выступления на MERLION IT Solutions Summit Тилля Стимберга, директора департамента гибридных решений компании HPE.

Портал TAdviser


Тилль Стимберг, директор департамента гибридных решений компании Hewlett Packard Enterprise (HPE), в ходе выступления на MERLION IT Solutions Summit рассказал, почему каждой компании в ближайшее время обязательно понадобятся стратегия обработки данных и собственная Edge-стратегия.

Активный рост объема «цифровой вселенной» заставляет переходить к зеттабайтам

В сентябре 2019 г. компания HPE стала одним из ключевых партнеров MERLION IT Solutions Summit – масштабной международной ИТ-конференции, которую ежегодно проводит дистрибуторская компания MERLION.

Доклад Тилля Стимберга, директора департамента гибридных решений компании HPE, с которым он выступил на пленарном заседании саммита, носил многозначительное название «Иголки в стоге сена». С помощью такого яркого образа эксперт хотел привлечь внимание аудитории к проблеме стратегии управления данными. Точнее, к необходимости наличия такой стратегии, которая следует из двух предпосылок.

Тилль Стимберг, Hewlett Packard Enterprise - о стремительном росте «цифровой вселенной» и способах с ней совладать

Тилль Стимберг, директор департамента гибридных решений компании HPE

Первая предпосылка - известный всем рост количества данных. Один только магазин Walmart генерирует данные на уровне 40 петабайт. Этот объем составляют, главным образом, записи баз данных, относящиеся к учету складских запасов, - привычные структурированные данные, для которых точность и актуальность имеют значение с некоторыми допусками.

«Если данные о бананах на складе устареют на два часа, никто не погибнет», - прокомментировал Тилль Стимберг.

Вторая предпосылка – постоянный рост количества источников данных. Объем «цифровой вселенной» активно наращивают неструктурированные данные – так называемый USG (User Generated Content) - контент, порождаемый пользователем. Его объемы таковы, что пора менять приставку – переходить к зеттабайтам, ведь только в одной социальной сети Facebook ежедневно производится 4 петабайта пользовательского контента.

«Масштабы создаваемых данных весьма серьезные, однако, их точность и актуальность по-прежнему не имеют критически важного значения», - считает Стимберг.

Еще один хороший пример – беспилотные автомобили. К 2020 г. их количество в мире должно достигнуть миллиона, при этом каждый будет производить ежедневно по 40 тыс. петабайт данных. Причем, все это колоссальное количество данных будет иметь различную природу. Скажем, изображения с фронтальной камеры поступают со скоростью 20 Мб/с, данные с фронтального сенсора радара – со скоростью 100 КБ/с, данные лидара – 10 Кб/с и т.д.

«Сегодня мы переходим в новую эру: началась цифровизация аналогового мира. Беспилотный автомобиль, умные часы, умный магазин, которому не нужен человек-продавец, умный фитнес-зал, которому не нужен человек-тренер, - все эти элементы привычного мира получают возможность существовать автономно за счет того, что научились обмениваться цифровыми данными», - рассказывает Тилль Стимберг.

Тилль Стимберг, Hewlett Packard Enterprise - о стремительном росте «цифровой вселенной» и способах с ней совладать

Цифровизация аналоговой реальности. Источник: HPE, сентябрь, 2019 г.

Время Edge-компьютинга уже наступило

«Критически важно в этой связи, что данных не просто намного больше. Они другого типа – неструктурированные, «аналоговые», и анализировать их могут только компьютеры, люди этого не смогут. Однако именно эти данные, обрабатываемые в автоматическом режиме и в реальном масштабе времени, становятся основанием для принятия решений. Беспилотный автомобиль – хороший пример: он сам решает, остановиться или нет», - уверен представитель HPE.

Иными словами, последствия цифровизации «аналогового мира» выходят на принципиально иной уровень осмысления: решающее значение имеет не только объем данных, но и типы доступных для анализа данных, а также способ их порождения и методы обработки.

Следует иметь в виду и то, что время традиционных ЦОДов быстро проходит: сегодня наибольшее количество данных генерируется и обрабатывается в ЦОДе, однако через два-три года ситуация радикально изменится: к 2022 году 75% данных будет обрабатываться за пределами корпоративного ЦОДа.

«Надо готовиться к тому, что данные будут обрабатываться на уровне периферии (Edge). При этом понятие периферии наполняется различным содержанием в разных сферах деятельности: роботизированное производство – в промышленности, умный фитнес-центр – в индустрии здоровья. Время Edge-компьютинга уже наступило. И на этом этапе человек не способен анализировать колоссальные объемы данных вручную. Так же как не удастся передавать эти объемы данных на обработку в ЦОД, как это принято сегодня. Нужны новые архитектурные подходы и новые технологии обработки данных», - поясняет Стимберг.

Собственно, образ иголки и стога сена подразумевает практический вопрос: почему каждой компании обязательно понадобятся в ближайшее время стратегии обработки данных и собственная Edge-стратегия?

Современная техника не справляется с ростом объемов данных. Что делать?

Сегодня на архитектурном уровне Edge проявилась серьезная проблема: темпы роста объемов данных существенно опережают темпы вычислительных возможностей современной компьютерной техники. Как оптимизировать ИТ-инфраструктуру в соответствии с нынешними вызовами?

Тилль Стимберг, Hewlett Packard Enterprise - о стремительном росте «цифровой вселенной» и способах с ней совладать

Сравнительная динамика роста объема данных и вычислительной мощности. Источник: HPE, сентябрь, 2019 г.

По мнению Тилля Стимберга, развитие ИТ-архитектуры движется по некоторой спирали: от централизованной обработки данных – к сетям и распределенной обработке, которая с течением времени охватила мобильные устройства.

«Теперь умные устройства отправляют данные на обработку в облако, не загружая собственные вычислительные мощности, - поясняет эксперт. - Наступает эра вычислений, распределенных между облаками и периферийным уровнем Edge».

Специфическая характеристика этого нового состояния заключается в том, что лишь малая часть производимых цифровых данных - только 6% - сегодня участвует в обработке, а 94% генерируемых данных не используется, потому что пока не создано механизмов для их обработки.

Такое состояние – вызов для ученых и исследователей и одновременно – новые возможности, в том числе, бизнес-перспективы.

«Google и Facebook – это лидеры уходящей эпохи, которые сумели поставить на службу своему бизнесу умную мобильность. Но наступает новая эпоха Edge, и она открывает новые возможности. Тот, кто их сумеет использовать, станет лидером в этом новом мире», - уверен представитель HPE.

Впечатляющие результаты новых технологий

Новый мир Edge и облаков – процессно-центричный. В начале 2010-х компания HPE начала в HP Labs серьезные исследования в рамках проекта The Machine, который предполагал создание новой компьютерной архитектуры, ориентированной на ресурсоемкие задачи машинного обучения. Эта архитектура включала новую операционную систему, новый тип ОЗУ на мемристорах (пассивных элементах, способных изменять свое сопротивление в зависимости от протекающего через него заряда) и шину данных, работающую по технологиям кремниевой фотоники. Поскольку мемристоры используются в качестве и ОЗУ, и накопителя данных, это снимает ограничения современной DRAM и флэш-памяти и позволяет достичь сверхвысоких скоростей передачи данных.

Новые подходы, по словам Тилля Стимберга, открывают впечатляющие возможности: в лабораторных условиях тестируются системы с емкостью памяти, превышающей 160 Тбайт. Задачи из области машинного обучения, которые на традиционной компьютерной технике считаются несколько часов, а порой и дней, в системе HPE обрабатываются за несколько секунд: сотни терабайт данных анализируются в памяти за одну операцию сканирования набора данных.

В качестве коммерческого продукта архитектурное решение обработки в памяти больших наборов данных с широкими возможностями масштабирования реализовано в серверном продукте HPE Superdome Flex. Эта модульная платформа для обработки больших данных in-memory стала настоящим прорывом в области вычислительных систем для поддержки критически важных приложений, аналитики в реальном времени и высокопроизводительных вычислений с интенсивной обработкой данных.

«Я думаю, что множество технологий в будущем будут совместимы с нашей технологией Superdome», - говорит Тилль Стимберг.

Помимо собственных научно-исследовательских разработок, для создания эффективных ИТ-решений для нового цифрового мира HPE занимается приобретением других компаний. В числе недавних приобретений - технология компании Nimble Storage под названием InfoSight, реализующая методы ИИ для управления ИТ-инфраструктурой.

«InfoSight – это технология, которая позволяет собирать данные с разнообразных датчиков, сенсоров, установленных на оборудовании производства HPE и его окружении в ЦОД, в единую глобальную базу данных. Дальше с помощью методов машинного обучения и ИИ выявляются определенные шаблоны и схемы, которые помогают системному администратору оптимизировать инфраструктуру, спрогнозировать отказы и предотвратить их до того, как они произойдут», - рассказывает Стимберг.

Другие недавние приобретения HPE связаны с технологиями аналитики. Они дают возможность использовать большие данные, ИИ, машинное обучение, и при этом быстро разворачивать необходимую инфраструктуру, в которой комбинируются периферийные (Edge) и облачные вычисления. «Изюминка» компании MapR – ее уникальная файловая система. HPE планирует использовать платформу MapR Data Platform для расширения аналитических инструментов другой недавно приобретённой компании BlueData, а также использовать API компании для хранения данных, управления и контроля процессов обработки.

В качестве примера инфраструктурных решений нового поколения Тилль Стимберг привел платформенное решение для беспилотных автомобилей. Данная платформа позволяет собирать данные в режиме реального времени от датчиков, установленных на автомобиле. Ее отличительная черта – поддержка работы с разными автопроизводителями и страховыми компаниями.

«Данные, порождаемые автомобилями, будут принадлежать автопроизводителям, но их коллеги смогут их покупать. Например, они будут полезны производителю другого беспилотного автомобиля - того, который следует в дорожном потоке за первым, ведь ему будут очень полезны сведения о «соседе», чтобы наилучшим образом скорректировать собственное управление», - объясняет Тилль Стимберг.

Тилль Стимберг, Hewlett Packard Enterprise - о стремительном росте «цифровой вселенной» и способах с ней совладать

Платформенное решение HPE для беспилотных автомобилей учитывает взаимодействие разных авто. Источник: HPE, сентябрь, 2019 г.

По мере цифровизации «аналогового мира» открываются новые горизонты обработки данных. А выбор конкретных методов этой обработки напрямую зависит от выбранных способов применения методов в ИИ в интересах бизнеса конкретной компании.

«Если вы этого не сделаете, то этим займутся ваши конкуренты. А все происходящее на уровне периферии я бы назвал «Экономикой вещей». Этим нужно заниматься и получать дополнительные конкурентные преимущества», - резюмирует Тилль Стимберг.

Сайт использует cookie. Подробнее