Информация

Машинное обучение - мифы и реальность 2020

История машинного обучения (Machine Learning, ML) уходит корнями в 50-е годы прошлого века. Долгое время работа специалистов из этой сферы была скорее теоретического, чем прикладного характера. Объяснялось это отсутствием необходимого мощного и производительного «железа». Искусственному интеллекту (Artificial intelligence, AI) требуются колоссальные вычислительные мощности. Во времена, когда компьютеры занимали целые спортзалы, взять нужные ресурсы было негде.

С ростом производительности и удешевлением «железа» ситуация изменилась. Сегодня никого не удивишь серверами с памятью на сотни гигабайт и процессорами с десятками ядер. По меркам предприятий, такие решения обходятся сравнительно недорого. Неудивительно, что искусственный интеллект в целом и машинное обучение в частности развиваются очень быстро.

Source: Franki Chamaki, Unsplash.com

Source: Franki Chamaki, Unsplash.com

Согласно исследованию IDC, в 2019 году капитализация отрасли ML достигла почти $38 млрд. К 2023 году сумма увеличится до $98 млрд. Ежегодный рост составит более, чем 28%. Именно 2020 год определит ключевые направления для инвестиций крупнейших корпораций. Машинное обучение сейчас в стадии бурного развития, и это влечёт за собой повышенный спрос на опытных специалистов и производительные серверы.

Практическое использование

Предположим, нужно рассчитать максимальную сумму кредита на расширение бизнеса для конкретного юридического лица. Если о фирме ничего не известно, сделать это трудно. Остаётся положиться на интуицию или прибегнуть к статистике, то есть проанализировать похожие случаи из прошлого.

Человек – не компьютер. Люди не способны быстро анализировать внушительные объёмы данных. Исследования либо отнимают много времени, либо носят поверхностный характер. Зато машины выполняют гигантское число операций в секунду и учитывают неочевидные факторы, в том числе и личные вкусовые предпочтения.

Главная задача машинного обучения – давать прогноз на основе фактических данных. Чем больше исходной информации – тем точнее анализ. Огромную роль также играют признаки ("что учитывать?") и алгоритмы обработки ("как действовать?"). На этих трёх китах держится ML.

Вернемся к примеру. Если банк воспользуется машинным обучением и разработает ПО для мгновенного анализа кредиторов, эффективность операций по выдаче займов вырастет на порядок. При условии постоянного увеличения данных и усовершенствования программного комплекса погрешность машинного прогнозирования или оценки от нейросети, сведётся к минимуму.

Идея выглядит простой и элегантной, но в реальной жизни ML пока далеко до идеала. Однако многие компании постепенно внедряют искусственный интеллект в свою деятельность. Скажем, Yelp применяет машинное обучение для работы с изображениями, а популярная социальная сеть Facebook – для создания чатботов.

Из общих трендов заслуживают внимания распознавание лиц и поиск для коммерческих интернет-площадок. Первое направление широко востребовано в Китае, где государство щедро финансирует проекты по госбезопасности. Второе нацелено на создание максимального удобства для пользователей и на увеличение прибыли.

Что умеет искусственный интеллект?

Когда ML получило толчок к развитию, блогеры и журналисты начали сеять в обществе панику слухами о том, что искусственный интеллект скоро вытеснит целый ряд специалистов – от врачей и журналистов до аналитиков и маркетологов. Однако до времён, когда машины составят серьёзную конкуренцию людям, ещё далеко.

Благодаря ML компьютеры могут прогнозировать результаты, запоминать и воспроизводить данные, однако пока они не выходят за рамки поставленных задач и не способны интеллектуально развиваться. Максимум их возможностей – выбрать лучшее из имеющегося, а не предложить что-то взамен.

В настоящее время возможности AI крайне ограничены. Компьютер – беспрекословный исполнитель, созданный делать то, что ему скомандует человек. Любые возможные отклонения от этой нормы надо рассматривать как упущение создателей, а не как наличие интеллекта у вычислительной машины. Так что если и станет возможным «восстание машин», то лишь по вине их разработчиков.

IT-инфраструктура

Для обслуживания систем машинного обучения нужна разветвлённая IT-инфраструктура. Без мощных серверов сложные вычисления немыслимы. В области серверных решений сейчас наблюдаются следующие тенденции:

Облака

Логотипы популярных облачных сервисов

Облачные сервисы для ML предоставляют десятки компаний. Гиганты индустрии – такие, как Microsoft Azure, Google Cloud и Amazon Web Services – не исключение. К преимуществам этого типа площадок для машинного обучения можно отнести высочайший уровень производительности и применение инновационных технологий.

Главный недостаток облаков – размытая ценовая политика. Клиенты, привлечённые дешевой почасовой оплатой, редко вчитываются в условия пользовательских соглашений. И в результате получают счета за услуги больше ожидаемых, с не всегда понятными дополнительными начислениями. Скрытые платежи и манипуляции со стоимостью давно стали обыденностью в индустрии облачных вычислений.

Готовые серверы

На рынке встречаются два вида готовых серверов: с предустановленным ПО или без него. Софт и комплектующие подбираются с расчётом на ML.

Несомненный плюс типовых выделенных ML-серверов – простота внедрения: купил, настроил, пользуешься. Минус – не слишком гибкое масштабирование.

Если потребуется сделать апгрейд, велика вероятность столкнуться с трудностями.

Самостоятельная сборка сервера

Сервер рекомендуется собирать из «железа» для пользовательского рынка, что облегчит апгрейд в будущем. Принцип простой: купить самый мощный процессор, SSD на 1 Тб, 64 или даже 128 Гб памяти, профессиональную материнскую плату, предтоповую или топовую видеокарту и качественный блок питания вместе с корпусом. Стоимость машины под ML составит минимум 3000-3500 долл.

Source: Caspar Camille Rubin, Unsplash.com

Source: Caspar Camille Rubin, Unsplash.com

Кастомный удалённый сервер

Как и в предыдущем случае, сервер собирается с нуля, но устанавливается в дата-центре. Клиент составляет список комплектующих, специалисты собирают машину, инсталлируют ПО и отправляют заказчику данные для доступа. Этот вариант гораздо предпочтительнее, чем размещение компьютера в офисе.

Надёжный дата-центр гарантирует время непрерывной работы (аптайм) серверов до 99,99%. Вероятность перебоев с интернетом и электричеством минимальна, при этом постоянно создаются резервные копии критически важных данных. Серверная функциональность при необходимости быстро расширяется, комплектующие меняются на более производительные.

Сетап кастомного оборудования под заказ у хостера или в дата-центре выходит дешевле самостоятельных усилий. При наличии нужного «железа» на складе, от заказа до подключения к сети обычно уходит 1-7 дней. К тому же, клиенту предлагается широкий выбор настроенных серверов, доступных сразу после оплаты. Всё это делает сотрудничество с хостинг-компаниями удобным и выгодным для клиента.

Создать Тикет

  • ${$translate(error)}
  • ${$translate(error)}
  • ${$translate(error)}