Машинное обучение: история, развитие, основные концепции и алгоритмы

Машинное обучение (ML)¹ – это не просто модное слово, а мощная технология, которая уже сегодня меняет наш мир. От рекомендаций фильмов на стриминговых сервисах до систем беспилотного вождения – ML проникает во все сферы жизни, делая их умнее и эффективнее. Но что же это такое на самом деле? Как оно появилось и как работает? В этой статье мы простыми словами расскажем об истории, основных понятиях и применении машинного обучения.
Что такое машинное обучение
Машинное обучение – это раздел искусственного интеллекта, который учит компьютеры опираться на данные, а не следовать строго заданным инструкциям. Представьте, что вы хотите научить ребенка отличать кошек от собак. Вы не будете писать ему подробную инструкцию, как выглядит каждая порода. Вместо этого вы покажете ему много картинок кошек и собак, и со временем он сам научится их различать. Машинное обучение работает похожим образом: мы даем алгоритму много данных (например, фотографии кошек и собак), и он сам находит в них закономерности, чтобы потом правильно определять новые объекты.
Главное отличие машинного обучения от традиционного программирования в том, что в ML мы не прописываем каждое правило вручную. Вместо этого алгоритм сам строит модель, которая позволяет ему делать прогнозы или принимать решения на основе данных. Это особенно полезно для задач, где правила слишком сложны или постоянно меняются.
Машинное обучение и искусственный интеллект – в чем разница?
Часто машинное обучение путают с искусственным интеллектом (ИИ). Важно понимать, что:
- Искусственный интеллект (ИИ) – это широкая область компьютерных наук, цель которой – создание машин, способных имитировать человеческий интеллект. Это может быть решение проблем, понимание языка, распознавание образов и многое другое. ИИ – это зонтичный термин, под которым скрывается множество технологий.
- Машинное обучение (ML) – это часть искусственного интеллекта. Это один из подходов к созданию ИИ, который фокусируется на том, чтобы дать системам возможность учиться на данных без явного программирования. То есть, не весь ИИ – это машинное обучение, но все машинное обучение – это ИИ.
Проще говоря: ИИ – это большой дом, а машинное обучение – это одна из комнат в этом доме, где происходит процесс обучения компьютеров.
Задачи машинного обучения
Выделяют такие задачи машинного обучения:
- Регрессия – прогнозирование исходя из подборки объектов с разными параметрами.
- Классификация – выявление групп объектов в зависимости от представленных характеристик.
- Кластеризация – разделение информации на похожие категории по аналогичным параметрам.
- Идентификация – отделение данных с определёнными характеристиками от общего массива информации.
- Извлечение знаний – исследование зависимостей между несколькими показателями одинакового явления либо события.
- Прогнозирование – дача прогнозов на будущее по результатам анализа машинным обучением информации за конкретный период времени.
Чтобы ML могло справиться с задачей, создают модель, способную действовать аналогично человеку при заранее заданных параметрах. Для более эффективного решения задач их постоянно меняют, то есть проводят дообучение. Во время него модель запоминает признаки, которые могут повлиять на решение задачи. Так, модель, отличающая виды домашних животных, может усвоить, что у кошек, в отличие от собак, чаще всего нет шерсти на ушах. Сложность в том, что некоторые признаки сложно описать словами. Поэтому их выделение порой более ценно, чем решение самой задачи.
Image by Freepik
История развития машинного обучения
Машинное обучение прошло долгий и интересный путь от простых идей до сложных систем, которые мы видим сегодня. Давайте рассмотрим ключевые этапы его развития.
Появление машинного обучения
Основы машинного обучения зародились ещё в середине прошлого столетия. В это время учёные стали искать, как сделать так, чтобы компьютеры обучались на основе данных.
В 1956 году математик Артур Сэмюэл предложил первую формальную концепцию ML и разработал программу, умеющую играть в шашки подобно человеку.
Это был один из ранних примеров использования умных алгоритмов для достижения хороших результатов в задачах, для решения которых нужны интеллектуальные усилия.
Период экспертных систем
В 1960-х и 1970-х годах учёные трудились над созданием экспертных систем. Эти системы были призваны моделировать знания специалистов в разных областях. Их суть заключалась в использовании баз знаний и набора правил, которые были получены от экспертов.
Например, система MYCIN², созданная в 1970-х годах, использовалась для выявления инфекционных патологий крови. Пользователи вводили симптомы и результаты анализов, а MYCIN, опираясь на свою базу знаний, ставила диагноз и давала рекомендации по лечению.
Особенности экспертных систем:
- Основаны на правилах. Работают по принципу "если-то", где каждое правило прописано человеком-экспертом.
- Моделируют человеческие знания. Пытаются воспроизвести процесс принятия решений специалиста в конкретной области.
- Ограниченная адаптивность. Не могли обобщать знания и адаптироваться к новым, непредвиденным ситуациям, так как были "заточены" под конкретные задачи и данные.
Несмотря на свой вклад в развитие ИИ, экспертные системы имели существенный недостаток: они были негибкими и не могли обучаться на новых данных, что ограничивало их практическое применение.
Появление статистического обучения
В 1980-х годах активно развивались статистические методы и появлялись более мощные компьютеры, что привело к существенному прорыву в сфере машинного обучения. Умные алгоритмы стали работать на основе статистических моделей и способов оптимизации. В это время появились важнейшие алгоритмы, включая обратное распространение ошибки.
Статистические методы машинного обучения стали использовать в различных областях, например распознавании образов и компьютерном зрении. Нейросети и методы обратного распространения нашли применение для классификации и прогнозирования.
Развитие нейросетей
В 1990-х годах нейросети развивались не очень активно. Очередной виток их становления пришёлся на начало 2000-х годов. Внедрение новейших графических процессоров помогло существенно усилить вычислительные мощности при решении задач и способствовало развитию глубоких нейросетей.
В 2012 году исследователи из Университета Торонто придумали алгоритм глубокого обучения. Он выиграл в популярном конкурсе по распознаванию изображений ImageNet³. Это достижение открыло новый этап в сфере ML.
Эра глубокого обучения и больших данных
В последние годы соцсети, интернет и цифровые технологии быстро развивались. Это привело к появлению больших массивов данных для обработки, а также глубокого обучения. Оно работает на основе большого количества информации и сложной архитектуры, что позволяет решать трудные задачи генерации, классификации, распознавания и сегментации контента.
Глубокое обучение – это вид машинного обучения, основанный на нейросетях с огромным количеством слоёв (глубоких сетей). В отличие от типичных методов ML, требующих определения признаков вручную, глубокое обучение позволяет модели самостоятельно извлекать внутренние представления данных. Оно способно к обработке и анализу трудной иерархической совокупности информации, например, текста, звука и картинок.
Глубокое машинное обучение активно применяют в следующих сферах:
- Компьютерное зрение – для распознавания образов, например лиц, и классификации изображений
- Обработка естественного языка – для анализа и создания текстового контента, автоматического перевода, генерации ответов на вопросы.
- Медицина – для выявления, прогнозирования и лечения разных заболеваний, анализа медицинских изображений, интерпретации итогов обследования.
- Рекомендательные системы – для создания персонализированных предложений для пользователей, например, по приобретению товаров.
- Финансовая аналитика – для составления прогнозов в отношении финансовых рынков, выявления возможного мошенничества.
Конечно, это неполный перечень сфер, где используют глубокое машинное обучение и работающие на его основе нейросети. Отметим, что развитие ML даёт большие возможности для его применения в разных отраслях.
Image by aleksandarlittlewolf on Freepik
Модели машинного обучения
Работа умных систем зависит от того, какая модель машинного обучения используется. Модель машинного обучения – это по сути математическая функция или алгоритм, который учится на данных и затем используется для выполнения задач, таких как прогнозирование или классификация. Давайте рассмотрим основные типы моделей.
Линейные модели
Линейные модели – это самые простые модели в машинном обучении. Они основаны на идее, что между входными данными и результатом существует прямая, линейная зависимость. Например, если мы хотим предсказать цену дома на основе его площади, линейная модель будет искать такую прямую линию, которая лучше всего описывает эту зависимость. Уравнение такой модели может выглядеть как y = ax + b, где y – это предсказываемая цена, x – площадь, a и b – параметры, которые модель находит в процессе обучения.
Применение:
- Прогнозирование цен (например, на недвижимость, акции);
- Простые задачи классификации (например, определение, относится ли объект к одной из двух категорий).
Несмотря на свою простоту, линейные модели редко используются для решения сложных задач, так как реальные зависимости часто не являются строго линейными.
Нейросети и глубокое обучение
Нейросети – это более сложные модели, вдохновленные структурой человеческого мозга. Они состоят из множества взаимосвязанных "нейронов" (математических функций), организованных в слои: входной, один или несколько скрытых и выходной. Каждый нейрон в одном слое связан с нейронами следующего слоя через так называемые "веса".
Глубокое обучение – это подраздел машинного обучения, который использует нейросети с большим количеством скрытых слоев (глубокие нейросети). Чем больше слоев, тем сложнее закономерности может уловить модель. Современные нейросети могут использовать тысячи и даже миллионы параметров, что позволяет им решать очень сложные задачи.
Применение:
- Распознавание изображений и лиц;
- Обработка естественного языка (перевод, генерация текста);
- Распознавание речи;
- Медицинская диагностика.
Сложные модели с множеством параметров
Помимо нейросетей, существуют и другие сложные модели, которые также используют огромное количество параметров для решения комплексных задач. Эти модели могут быть комбинациями различных алгоритмов или иметь очень сложную внутреннюю структуру. Их главная особенность – способность улавливать тонкие и неочевидные закономерности в больших объемах данных.
Применение:
- Рекомендательные системы (например, в онлайн-магазинах или стриминговых сервисах);
- Системы автономного вождения;
- Прогнозирование финансовых рынков.
Развитие вычислительных мощностей, особенно графических процессоров (GPU⁴) и тензорных процессоров (TPU⁵), сделало возможным обучение таких сложных моделей, что привело к значительному прогрессу в машинном обучении.
Из чего состоит машинное обучение
Модель ML, допустим, глубинная нейросеть, работает аналогично «чёрному ящику». На вход к ней поступают условия задачи, а после обработки, на выходе, получается произвольный ответ. Допустим, если человек задаёт переводчику фразу на одном языке, то нейросеть воспринимает это как условие, а затем выдаёт готовый перевод, то есть необходимый результат.
Важно обучить нейросеть так, чтобы она выдавала ответы, предельно близкие к верным. А для этого надо найти корректные значения параметров её работы. Когда они будут настроены правильно, нейронная сеть сможет хорошо решать и аналогичные задачи, даже если никогда не знала, как это сделать.
Для решения задач нейросети потребуются:
- Данные – это примеры решений и всё, что необходимо для обучения, например, расчёты, тексты, исторические события. Такую информацию собирают несколько лет и соединяют в большие массивы – датасеты⁶, имеющиеся практически у всех ИТ-компаний. Пример сбора данных – капча⁷, которая просит пользователя, например, выбрать все изображения колодцев и запоминает верные ответы.
- Признаки – параметры или качества. Это то, на что должна обращать внимание машина во время обучения. Допустим, стоимость акций, картинка животного или частота слов. Если параметров немного, и они чётко определены или показаны, обучаться будет проще. Однако, чтобы решать трудные задачи, актуальные модели должны учитывать несколько миллионов параметров, решающих, как входы трансформируются в выходы.
- Алгоритмы – способы решения задач. К одной задаче можно применить очень много алгоритмов машинного обучения. Надо выбрать наиболее точный и результативный.
Виды машинного обучения
Для машинного обучения нужно много данных. В идеале информация, усваиваемая моделью, должна описывать все вероятные варианты развития событий. Однако на практике это невозможно, так как мир постоянно меняется. Поэтому надо сделать так, чтобы тренировочный набор был максимально приближён к реалиям.
Стратегию обучения выбирают исходя из поставленной задачи и актуальных данных для обучения. Вот какие типы машинного обучения бывают:
- Классическое обучение;
- Обучение с подкреплением;
- Ансамбли;
- Нейросети и глубокое обучение.
Рассмотрим каждый из них подробнее.
Image by Freepik
Классическое обучение
Классическое обучение делится на два основных подхода: обучение с учителем и обучение без учителя.
Обучение с учителем (Supervised Learning)
Это самый распространённый вид обучения, при котором модель учится на данных, где для каждого примера уже известен правильный ответ (так называемая "метка"). Представьте, что вы учите ребенка различать фрукты. Вы показываете ему яблоко и говорите: "Это яблоко". Затем показываете банан и говорите: "Это банан". Ребенок учится на этих примерах. Аналогично, модели машинного обучения получают набор данных, где каждый объект уже "размечен" правильным ответом. Задача модели – найти зависимость между входными данными и этими метками, чтобы потом правильно предсказывать ответы для новых, ранее не виденных данных.
Примеры применения обучения с учителем:
- Классификация спама. Модель обучается на письмах, которые уже помечены как "спам" или "не спам", чтобы потом самостоятельно определять нежелательные сообщения;
- Распознавание языков и рукописных текстов. Обучение на размеченных образцах текста или почерка;
- Обнаружение мошеннических операций. Анализ транзакций, помеченных как "мошеннические" или "обычные", для выявления подозрительной активности;
- Оценка платёжеспособности заёмщика. Прогнозирование вероятности возврата кредита на основе исторических данных о заёмщиках;
- Медицинская диагностика. Выявление возможных патологий на снимках пациентов, где снимки уже размечены врачами.
Важно, чтобы модель не просто "зазубрила" тренировочные данные (это называется "переобучением"), а научилась обобщать закономерности, чтобы давать правильные ответы на новых данных.
Image by Freepik
Обучение без учителя (Unsupervised Learning)
В отличие от обучения с учителем, здесь модель получает данные без каких-либо предварительных меток или правильных ответов. Задача модели – самостоятельно найти скрытые структуры, закономерности или группы в этих данных. Это похоже на то, как если бы вы дали ребенку коробку с разными игрушками и попросили его разложить их по группам, не говоря, по какому принципу. Ребенок сам решит, например, разделить их по цвету, размеру или типу.
Примеры применения обучения без учителя:
- Кластеризация – разделение клиентов на сегменты по схожим покупательским привычкам для персонализации маркетинга;
- Сжатие данных – уменьшение объема данных при сохранении важной информации (например, сжатие изображений);
- Обнаружение аномалий – выявление необычных или подозрительных паттернов в данных, которые могут указывать на мошенничество или неисправности.
Обучение без учителя особенно полезно, когда ручная разметка данных слишком дорога или невозможна из-за их огромного объема.
Обучение с подкреплением (Reinforcement Learning)
Это относительно трудный вид обучения, где ИИ должен не просто анализировать данные, а действовать сам в среде, приближённой к реальной, например, видеоигре. Система учится путём проб и ошибок, получая "награду" за правильные действия и "наказание" за неправильные. Цель – максимизировать награду в долгосрочной перспективе. Это похоже на то, как дрессируют собаку: за выполнение команды она получает лакомство, что закрепляет правильное поведение.
Применение:
- Робототехника;
- Игровые ИИ;
- Управление ресурсами.
Ансамбли (Ensemble Learning)
Ансамбли – это группы алгоритмов, которые используют много методов ML и исправляют ошибки друг друга. Идея в том, что несколько "слабых" моделей, работающих вместе, могут дать гораздо более точный результат, чем одна "сильная" модель. Это как команда экспертов, где каждый вносит свой вклад, и их совместное решение оказывается лучше, чем решение любого из них по отдельности.
Для их получения существует три основных способа:
- стекинг (Stacking⁸) – алгоритмы обучаются по отдельности, а затем их результаты передаются на вход последнему алгоритму, который принимает окончательное решение;
- бэггинг (Bagging⁹) – один алгоритм многократно обучается на случайных подборках данных из исходного набора, а затем для ответов рассчитывается усреднённое значение;
- бустинг (Boosting¹⁰) – алгоритмы обучаются по очереди, при этом каждый из них учитывает ошибки предшественника, пытаясь их исправить.
Применение:
- Поисковые алгоритмы;
- Компьютерное зрение;
- Распознавание лиц;
- Прогнозирование в различных областях.
Нейросети и глубокое обучение
Нейросети и глубокое обучение, как мы уже упоминали, являются самым сложным способом обучения ИИ. Нейросети работают аналогично человеческому мозгу, состоящему из нейронов, регулярно создающих между собой новые связи. Условно их можно представить как сеть с большим количеством входов и только одним выходом.
Нейросеть состоит из трёх слоёв:
- входного;
- одного или нескольких скрытых;
- выходного.
Каждый нейрон связан с нейронами предшествующего слоя через некие веса. Число слоёв и нейронов неограниченно. Это позволяет нейросети моделировать довольно сложные закономерности, недоступные линейным моделям.
Искусственный интеллект собирает данные со всех входов, анализируя их вес по определённым критериям, затем проводит необходимое действие и выдаёт результат. Сперва он выходит случайным, но спустя несколько циклов получается точнее. Качественно обученная нейронная сеть работает как обычный алгоритм или более точно.
Важным достижением в области искусственного интеллекта стало машинное обучение, которое учит нейросети на нескольких уровнях абстракций.
Применение машинного обучения
Машинное обучение сегодня применяется практически во всех сферах нашей жизни, делая процессы более эффективными, а решения – более точными. Вот лишь некоторые из ключевых областей, где ML играет важную роль:
Здравоохранение
Диагностика заболеваний. ML-модели анализируют медицинские изображения (рентген, МРТ, КТ) для выявления патологий, часто с точностью, превышающей человеческую. Например, они могут обнаруживать раковые клетки на ранних стадиях.
Разработка лекарств. Ускорение процесса поиска новых молекул и соединений, предсказание их эффективности и побочных эффектов.
Персонализированная медицина. Подбор индивидуальных планов лечения на основе генетических данных пациента, истории болезни и реакции на предыдущие терапии.
Финансы
Обнаружение мошенничества. Анализ транзакций в реальном времени для выявления подозрительной активности и предотвращения мошенничества.
Кредитный скоринг. Оценка кредитоспособности заёмщиков на основе большого объема данных, что позволяет банкам принимать более обоснованные решения.
Торговля на бирже. Прогнозирование движения цен на акции и другие активы, автоматизация торговых стратегий.
Розничная торговля и электронная коммерция
Рекомендательные системы. Предложение товаров и услуг, которые могут заинтересовать покупателя, на основе его предыдущих покупок и просмотров (например, "с этим товаром часто покупают...").
Прогнозирование спроса. Оптимизация запасов и логистики, предсказание, какие товары и в каком количестве будут востребованы.
Персонализированный маркетинг. Создание индивидуальных рекламных предложений для каждого клиента.
Транспорт и логистика
Беспилотные автомобили. Системы машинного зрения и принятия решений позволяют автомобилям безопасно передвигаться без участия водителя.
Оптимизация маршрутов. Построение наиболее эффективных маршрутов для доставки товаров, сокращение времени и затрат.
Управление трафиком. Анализ данных о движении для предотвращения пробок и оптимизации потоков транспорта.
Производство
Прогнозирование отказов оборудования. Мониторинг состояния машин и предсказание возможных поломок, что позволяет проводить профилактическое обслуживание и избегать простоев.
Контроль качества. Автоматическая проверка продукции на дефекты с помощью компьютерного зрения.
Оптимизация производственных процессов. Повышение эффективности и снижение затрат за счет анализа данных о работе оборудования и производственных линиях.
Image by Freepik
Обработка естественного языка (NLP¹¹)
Голосовые помощники: Siri, Google Assistant, Алиса – все они используют ML для понимания и генерации человеческой речи.
Машинный перевод. Автоматический перевод текстов с одного языка на другой.
Анализ тональности. Определение эмоциональной окраски текста (положительная, отрицательная, нейтральная), что важно для анализа отзывов клиентов или новостей.
Искусство и творчество
Генерация контента. Создание музыки, текстов, изображений и даже видео с помощью ML-моделей.
Улучшение изображений. Повышение качества фотографий, реставрация старых снимков, применение художественных стилей.
Машинное обучение в бизнесе: пример Сбер Бизнес Софт
Многие компании активно внедряют машинное обучение для оптимизации своих процессов и создания новых продуктов. Например, Сбер Бизнес Софт использует ML для решения различных задач, таких как:
- Автоматизация клиентской поддержки: чат-боты и виртуальные ассистенты на базе ML помогают быстро отвечать на типовые вопросы клиентов, разгружая операторов.
- Персонализация предложений для бизнеса: анализ данных о клиентах позволяет предлагать им наиболее релевантные продукты и услуги.
- Оптимизация внутренних процессов: ML помогает в анализе больших данных для принятия более эффективных управленческих решений, прогнозирования рисков и оптимизации операционной деятельности.
Это лишь малая часть того, на что способно машинное обучение. С каждым годом появляются новые области применения, и ML продолжает трансформировать наш мир.
Проблемы машинного обучения
Несмотря на высокую эффективность машинного обучения и нейросетей, существуют некоторые проблемы их применения. Прежде всего, следующие:
1. Для успешного обучения нейросетей и любых трудных алгоритмов требуются большие объёмы данных и технические ресурсы, например, особые помещения, серверы, интернет с хорошей скоростью без перебоев и много электричества.
Чтобы получить необходимую информацию, порой нужно несколько лет работы и миллионы рублей. Такие деньги в развитие машинного обучения могут вкладывать только большие корпорации, работающие в сфере ИТ-технологий. Открытых датасетов— обработанных и структурированных массивов данных — немного, а цена на них велика.
2. По мере увеличения мощностей для сбора и обработки датасетов растут и вредные выбросы, производимые крупными дата-центрами.
3. Данные необходимо не просто собрать, но ещё и разметить так, чтобы машина правильно выявила объект и его признаки. Это относится к числовым данным, текстам и картинкам. Чтобы сделать это человеческими усилиями, нужны большие вложения.
4. Даже если информации много, и она постоянно обновляется, то во время обучения может обнаружиться, что алгоритм нерабочий. Проблема может быть и в самих данных, и в варианте действий, когда машина справилась с определённой задачей, но не может это использовать, чтобы решить задачи с другими условиями.
5. Хотя глубокое обучение развито очень сильно, пока искусственный интеллект не умеет генерировать нечто новое, выходить за границы представленных условий и оказаться выше своих возможностей. Проще говоря, он неспособен превзойти человеческий мозг.
Машинное обучение значительно упрощает и улучшает жизнь человека. Его используют в промышленности, торговле, маркетинге, здравоохранении и других сферах деятельности. Это помогает улучшить результаты работы предприятий, вовремя реагировать на изменения, снизить нагрузку на работников и минимизировать убытки.
ООО «Сбер Бизнес Софт» предлагает решения на основе ИИ для применения в промышленности, сельском хозяйстве, торговле, строительной сфере и государственном секторе.
Заполните форму обратной связи – специалист свяжется с вами, чтобы подобрать сервис, работающий в интересах вашего бизнеса.
Часто задаваемые вопросы (FAQ)
Как машинное обучение изменяет подход к решению бизнес-задач?
Машинное обучение позволяет компаниям переходить от следования строгим инструкциям к принятию решений на основе данных. Это дает возможность автоматизировать сложные процессы, такие как прогнозирование спроса, оценка рисков и персонализация предложений, делая бизнес-операции более точными и эффективными.
Какие основные этапы включает процесс обучения модели машинного обучения?
Процесс обучения модели начинается со сбора и подготовки больших массивов данных (датасетов). Затем определяются ключевые признаки, на которые модель будет обращать внимание, и подбирается подходящий алгоритм для решения конкретной задачи, будь то классификация или прогнозирование.
Как алгоритмы машинного обучения справляются с прогнозированием в условиях неопределенности?
Алгоритмы машинного обучения анализируют исторические данные за определенный период, чтобы выявить скрытые закономерности и зависимости. На основе этих данных модель строит прогнозы, которые помогают принимать более обоснованные решения, даже когда правила слишком сложны или постоянно меняются.
Почему для успешного машинного обучения важен сбор и подготовка данных?
Качество и объем данных напрямую определяют точность работы модели, поскольку она учится именно на этих примерах. Данные необходимо не только собрать, но и правильно разметить, чтобы машина могла корректно выявить объекты и их признаки, что является фундаментом для всего процесса обучения.
Какие проблемы могут возникать при внедрении машинного обучения в бизнес-процессы?
Основные проблемы связаны с необходимостью больших объемов качественных данных и значительных вычислительных ресурсов для их обработки. Также могут возникать сложности с "нерабочим" алгоритмом, который хорошо решает одну задачу, но не способен адаптироваться к новым, изменившимся условиям.
¹ ML (от англ. Machine Learning) – машинное обучение.
² Экспертная система, спроектированная для диагностирования бактерий, вызывающих тяжелые инфекции, а также для рекомендации необходимого количества антибиотиков в зависимости от массы тела пациента.
³ ImageNet – это крупная открытая база данных изображений, размеченных по категориям, используемая для обучения и тестирования алгоритмов компьютерного зрения.
⁴ GPU (Graphics Processing Unit, графический процессор) – специализированный вычислительный чип, изначально созданный для обработки и вывода графики в компьютерных играх и 3D-приложениях.
⁵ TPU (Tensor Processing Unit, тензорный процессор) – это специализированный процессор, разработанный Google для ускорения операций, связанных с машинным обучением, особенно в нейросетях.
⁶ Датасет – это набор данных, используемый для обучения, тестирования или проверки алгоритмов машинного обучения.
⁷ Капча – это тест, предназначенный для проверки, что пользователь является человеком, а не автоматизированной программой (ботом).
⁸ Stacking – от английского stack («укладывать в стопку, складывать»)
⁹ Bagging – от английского bootstrap aggregating («бутстреп-агрегирование»)
¹⁰ Boosting – от английского boost («усиливать, ускорять»).
¹¹ NLP – от английского Natural Language Processing («обработка естественного языка»).