Научно-образовательный журнал для студентов и преподавателей «StudNet» №10/2020
ВЛИЯНИЕ ТЕХНОЛОГИИ ОБРАБОТКИ БОЛЬШИХ ДАННЫХ НА РАЗВИТИЕ СФЕРЫ ЭЛЕКТРОННОЙ ТОРГОВЛИ
THE IMPACT OF BIG DATA PROCESSING TECHNOLOGIES ON THE DEVELOPMENT OF E-COMMERCE
УДК 339.54
Киселев А.В., студент, 2 курс, факультет «Международная школа бизнеса и мировой экономики» РЭУ им. Г.В. Плеханова Россия, г. Москва Kiselev A.V., kis.aleksey.ru@yandex.ru
Аннотация
В представленной работе рассматривается перспективность внедрения и использования современных технологий обработки больших данных компаниями, специализирующимися в сфере электронной торговли. На основании проведенного анализа сделан вывод об однозначной необходимости применения вышеуказанных технологий, в частности внедрения программ машинного обучения, компаниями, стремящимися сохранить либо увеличить долю на рынке электронной торговли.
Аппо1айоп
The study examines the prospects of introduction and use of modern big data processing technologies for the industry of e-commerce. Based on the analysis, there was made a conclusion that using of such technologies is a mast for the companies those are striving to maintain or increase their market share in e-commerce.
Начиная с 2010-х годов электронная торговля становится ведущим компонентом практически каждого бизнеса, реализующего товары, как на внутреннем, так и на внешних рынках.
Согласно определению, электронная торговля это - автоматизированная торгово-закупочная деятельность, производящаяся через Интернет и базирующаяся на:
- электронном обмене данными между компанией и потребителями услуги;
- возможности проведения электронных платежей;
- технологиях машинного обучения для обработки больших данных Big
Фактически, успех электронной торговли вызван несколькими ведущими факторами:
- существенным снижением цены товара за счет уменьшения числа посредников между производителем и конечным потребителем продукции;
- эффективными поисковыми системами, выстроенными компаниями, позволяющими сокращать время подбора необходимого товара по параметрам и в целом снижать издержки неполноты информации.
Исходя из этого, можно говорить, о том, что общество за последние годы приняло и активно использует имеющиеся технологии электронной торговли, ввиду тех очевидных преимуществ, которые получает каждый потребитель и производитель товара. Данное утверждение подтверждается и статистическими данными (рис.1).
Рост доли электронной торговли в общем мировом товарообороте с фактических 7,5% в 2015 году до прогнозируемых 17, 5% в 2021 году свидетельствует о существенной заинтересованности предпринимателей в развитии данной формы коммерции.
Рис.1 Доля электронной торговли в общих объемах мировой
торговли.
Очевидно, что новые вызовы, стоящие перед сферой электронной торговли требуют новых решений. В частности значительное увеличение числа пользователей приводит к непременному росту объемов данных, которые должны в непрерывном режиме анализироваться компаниями. С одной стороны, это позволяет обеспечивать бесперебойную работу сервисов, с другой улучшает конкурентные преимущества компании, которая может предоставлять клиентам более качественные услуги. Общий объем данных производимых пользователями с 2015 по 2025 год по прогнозам увеличится в более чем 13 раз (рис.2).
Анализ больших данных - это использование передовых методов анализа, в частности технологий машинного обучения в отношении очень больших, разнообразных наборов данных, которые включают структурированные, полу структурированные и неструктурированные данные из разных источников и в разных размерах от терабайтов до зетабайтов.
Сама сфера электронной торговли является высоко конкурентной, при этом типизация продукции предлагаемая на различных сайтах может быть практически идентичной, из-за этого клиент не может сделать выбор, услуги какой из компаний использовать исключительно на основе стандартных факторов, таких как цена товара, линейка продукции и тд. В связи с этим, именно эффективная обработка и интерпретация поступающих данных позволяет компаниям получать колоссальные преимущества.
Последовательно остановимся на каждом из заявленных пунктов.
Согласно аналитике McKinsey, до 35% выручки компании Amazon (крупнейшая компания электронной коммерции в мире) генерируется на основе отлаженного механизма рекомендаций пользователям. В частности, клиенты получают предложения о продукции на основе тех товаров (либо категорий товаров), которые пользователь просматривал ранее.
Рис. 2 Объем информации, созданной во всем мире с 2005 по 2025 гг.
(В зетабайтах)
Такая сегментация рынка на рынок каждого отдельного потребителя возможна благодаря внедрению различных технологий машинного обучения. Для примера более подробно остановимся на одном из возможных
использующихся методов - «методе К-ближайших соседей». Он заключается в получении предсказания о выборе потребителя, на основе прямых и косвенных признаков, таких как предыдущие покупки, локация, поисковые запросы на сайте, предыдущие оценки товаров. Прежде всего, по уже имеющимся данным, уникальные значения, присвоенные каждому пользователю разделяются на категории и располагаются в координатном пространстве, на определенном расстоянии от точки 0.0 в соответствии с выявленными предпочтениями потребителя и приобретённым товаром. Далее модель обучается на имеющихся данных и верифицируется на тестовой выборке, после чего корректируется экспертным методом, исходя из получаемой ошибки. После обучения модели, для каждого нового пользователя может быть предсказан тот продукт, который он с набольшей долей вероятности может приобрести: исходя из его действий на сайте, ему также будет присвоена определенная точка в координатном пространстве, которая при соотнесении с точками других пользователей, ближайших к нему, позволит дать корректный результат.
Например, (рис. 3) если компания рассматривает 2 товара А и В, и имеет некоторого нового потребителя С, то на основе ранее приобретенных товаров другими потребителями, делается предсказание об отношении пользователя С к группе А и, следовательно, в его большей заинтересованности в данном товаре. На этой основе компания могла бы сделать пользователю комплементарное предложение данного товара при совершаемой покупке.
• Товар класса А О Товар класса В
Рис.3. Иллюстрация простейшего метода K-ближайших соседей, K=3
Под моделированием жизненного цикла клиента понимается получение прогноза чистой прибыли компании по всем будущим отношениям с потребителем, начиная с его первой покупки или посещения сайта, до потери клиента. Простейшей формулой для расчета модели жизненного цикла является: Средняя стоимость заказа * Число повторяющихся заказов * Средняя длительность жизненного цикла клиента
Так как компании стремятся получить высокую точность прогноза, часто используются большие сложные модели, основанные на применении нейросетей. На основе информации о жизненном цикле клиента в компании, появляется возможность значительно лучшего планирования стратегии - появляются конкретные ориентиры вероятной прибыли.
В заключении следует остановиться на перспективности внедрения данных технологий компаниями электронной торговли. Очевидно, что крупные компании имеют существенное преимущество во внедрении технологий big data, так как на начальном этапе для разработки или приобретения качественного программного обеспечения необходимы существенные финансовые вложения. По экспертным оценкам они варьируются от 35 до 100 тыс $, в зависимости от объёмов и сложности проекта для средних компаний. Крупнейшие же компании, инвестируют значительно большие финансовые средства, например Amazon на 2018 год в разработку искусственного интеллекта инвестировал около 870 млн $.
Вместе с тем, следует отметить высокую окупаемость инвестиций в технологии хранения и обработки больших данных и искусственного интеллекта. Средний ROI внедренных в бизнес проектов составляет 65%, что позволяет говорить об окупаемости вложений в срок до 2 лет. Этим подтверждается заявленное ранее утверждение о том, что инвестиции в технологии big data и ИИ будут только увеличиваться, а их влияние расти.
Источники:
Sources: