Повышение интерпретируемости моделей прогнозирования электропотребления горно-добывающих предприятий с помощью аддитивного объяснения Шепли

П. В. Матренин; А. И. Степанова

Том 271

Страницы:

154-167

Скачать том:

RUS ENG

Научная статья

Энергетика

Повышение интерпретируемости моделей прогнозирования электропотребления горно-добывающих предприятий с помощью аддитивного объяснения Шепли

Авторы:

П. В. Матренин¹

А. И. Степанова²

Об авторах

1 — канд. техн. наук Ведущий научный сотрудник Уральский федеральный университет имени первого Президента России Б.Н.Ельцина ▪ Orcid ▪ Elibrary ▪ Scopus ▪ ResearcherID
2 — Младший научный сотрудник Уральский федеральный университет имени первого Президента России Б.Н.Ельцина ▪ Orcid

Дата отправки:

2023-11-10

Дата принятия:

2024-06-03

Дата публикации онлайн:

2024-10-16

Дата публикации:

2025-02-25

Аннотация

Цель исследования – повышение уровня доверия пользователей систем прогнозирования графиков нагрузки предприятий путем применения методов объяснимого искусственного интеллекта, которые позволяют получить не только прогноз, но и его обоснование. Объект исследования – комплекс шахт и горно-обогатительных комбинатов предприятия, покупающего электроэнергию на оптовом рынке электроэнергии и мощности. Использованы почасовые данные электропотребления за два года, график плановых ремонтов и остановов оборудования, метеорологические данные. Применены ансамбли деревьев решений для прогнозирования временных рядов, выполнен анализ влияния различных факторов на точность прогнозирования. Предложен алгоритм интерпретации результатов прогноза с помощью метода аддитивного объяснения Шепли. Средняя по модулю относительная ошибка прогнозирования составила 7,84 % с учетом метеорологических факторов, 7,41 % с учетом метеорологических факторов и плана нагрузки, сформированного экспертом. Ошибка прогноза эксперта составляла 9,85 %. Полученные результаты показывают, что повышенная с учетом дополнительных факторов точность прогноза электропотребления повышается еще больше при совмещении методов машинного обучения и экспертной оценки. Создание такой системы возможно только при применении моделей объяснимого искусственного интеллекта.

Область исследования:

Энергетика

Ключевые слова:

прогнозирование электропотребления горно-обогатительные предприятия оптовый рынок электроэнергии и мощности объяснимый искусственный интеллект ансамблевые модели вектор Шепли

Финансирование

Исследование выполнено при финансовой поддержке Министерства науки и высшего образования Российской Федерации в рамках Программы развития Уральского федерального университета имени первого Президента России Б.Н.Ельцина в соответствии с программой стратегического академического лидерства «Приоритет-2030».

Введение

Прогнозирование электропотребления необходимо для планирования режимов энергетической системы [1, 2]. Многие страны вводят экономические стимулы для развития ценозависимого потребления электроэнергии [3]. Одним из инструментов, стимулирующих предприятия планировать свои суточные графики электропотребления, является оптовый рынок электроэнергии и мощности [4]. При подключении на такой рынок горные предприятия могут получать выгоду от более низких тарифов, чем при подключении к розничному рынку при учете точного прогнозирования электропотребления, так как тарифы на оплату электрической энергии включают плату за отклонения фактического графика электропотребления от планового. Графики потребления рассматриваемых предприятий часто имеют высокую апериодическую составляющую электрической нагрузки, для учета которой необходимо принимать во внимание множество производственных факторов, поэтому процесс прогнозирования электропотребления является трудозатратным [5-7]. Задача прогнозирования электропотребления становится важной не только для системного оператора, но и экономически актуальной для крупных предприятий.

Методы краткосрочного (1-3 сут.) прогнозирования графика электропотребления можно разделить на детерминированные (статистические) и машинного обучения. К первым относятся сезонные модели [8] и методы на основе авторегрессии, среди которых чаще других используются ARMA и ARIMA [9, 10]. К группе методов с использованием авторегрессии можно отнести и алгоритмы, применяющие различные виды фильтрации сигналов, такие как фильтр Калмана [11] или вейвлет-преобразование, на основе которых строится прогноз.

Методы машинного обучения способны учитывать большое количество факторов, в том числе метеорологических [12-14] и производственных [15], и зависимости между ними [16]. Преимущества применения методов машинного обучения по сравнению с детерминированными показаны в работах [5, 17, 18]. Как правило, наилучшие результаты достигаются с помощью нейросетевых моделей [19-21], включая рекуррентные [5, 22, 23] и глубокие нейронные сети [24-26], ансамбли деревьев решений [6, 13, 27].

Прогнозирование электропотребления промышленных предприятий отличается от прогнозирования крупных энергосистем (города или региона) главным образом менее выраженной периодичностью графика и большей дисперсией, что связано с суммированием электропотребления большого числа объектов при работе с крупными энергосистемами. Средняя ошибка прогноза электропотребления регионов России находится в пределах 1-2 %, как показано в работах, например для объединенной энергосистемы Урала [27], Алтайского края [14], Сибири [28]. Для промышленных предприятий такая точность часто является недостижимой из-за необходимости точного учета разных параметров технологического процесса. В работе [29] показано, что для ряда предприятий невозможно построить приемлемый прогноз без использования точных данных о загруженности предприятия. Однако не на всех предприятиях возможно спланировать загрузку в виде почасового графика с высокой точностью. Например, в угледобывающей промышленности это невозможно из-за комплекса геологических и технологических факторов [5, 30]. Более реалистичен учет плановых ремонтов и остановов наиболее энергоемкого оборудования [16], где использование данных о плановых ремонтах оборудования снизило ошибку прогноза с 7 до 5,5 %.

Исследований, посвященных краткосрочному прогнозированию электропотребления горных предприятий [5, 6, 30], на порядок меньше, чем крупных энергетических систем. В них не учитываются метеорологические и производственные факторы. В работах [31, 32] рассматривается задача прогнозирования помесячных значений потребления предприятий, которая существенно отличается от краткосрочного почасового планирования.

Важная причина, затрудняющяя промышленное внедрение машинного обучения, которой уделяется недостаточное внимание, – низкий уровень доверия к результатам моделей, так как принципы работы не интерпретируемы. Пользователю приходится принимать результаты без объяснения. Проблемой внедрения машинного обучения является негативное влияние ошибок и искажений во входных данных на точность прогноза, которые невозможно отследить [33].

Цель работы – исследование и разработка способов интерпретации результатов моделей краткосрочного прогнозирования электрической нагрузки горного предприятия с помощью методов объяснимого искусственного интеллекта. Задачи работы – сбор и предварительная обработка данных горного предприятия; построение модели краткосрочного прогнозирования электрической нагрузки на базе машинного обучения; исследование влияния метеорологических и производственных факторов на точность прогнозирования; анализ методов объяснимого искусственного интеллекта и выбор алгоритма интерпретации результатов; применение выбранного алгоритма и анализ полученных результатов.

Методы

Исходные данные

Использованы данные электропотребления горного предприятия, расположенного в Якутии. Рассматриваемый комплекс охватывает шахты, горно-обогатительные фабрики и административные корпуса. Изначальная выборка данных включала получасовые значения электропотребления за два года без пропусков, полученные из автоматизированной системы коммерческого учета электроэнергии (АСКУЭ) предприятия, прогнозные значения потребления, составленные специалистом предприятия вручную, и данные о плановых ремонтах отдельных энергоемких агрегатов (или комплексов) предприятия. Использование данных за два года объясняется наличием оцифрованных показателей и обновлением состава энергоемкого оборудования на предприятии. В выборку добавлены метеорологические данные – скорость ветра, температура воздуха, атмосферное давление, относительная влажность, взятые из архива сайта rp5.ru. Табл.1 содержит сведения об исходных данных и выполненной над ними предобработке. Получасовые значения электропотребления попарно суммированы для получения часовых значений, так как именно временной ряд с почасовыми значениями подается в сбытовую компанию или напрямую системному оператору как график прогноза электропотребления предприятия.

Таблица 1

Исходные данные для исследования

Наименование	Шаг дискретизации по времени, ч	Источник
Электрическая нагрузка, МВт·ч	0,5	АСКЭУ
Ручной прогноз нагрузки, МВт·ч	1	Отдел главного энергетика
Скорость ветра, м/с	3	rp5.ru
Температура воздуха, °C	3	rp5.ru
Атмосферное давление, мм рт. ст.	3	rp5.ru
Относительная влажность, %	3	rp5.ru
Ремонты	–	Отдел главного энергетика

Для метеорологических данных применена линейная интерполяция. В данной работе используются фактические метеоданные вместо прогнозных из-за отсутствия открытого доступа к архивам именно прогнозных значений погоды. Это упрощение основано на том, что метеорологические факторы не основные, а дополнительные, и учитываются при прогнозе электропотребления предприятия, а также на достаточно высокой точности метеопрогноза на сутки вперед.

Данные о плановых ремонтах, изначально представленные списком интервалов времени ремонтов по каждому агрегату или комплексу, сформированы построением матрицы R, где элемент r_ij равен единице, если в i-й момент времени (час) j-йагрегат по плану находился в состоянии ремонта, иначе значение равно нулю. Число агрегатов для объекта m = 23.

На рис.1 приведен фрагмент почасового графика электропотребления за два месяца. Для наглядности график начинается от уровня 100 МВт·ч.

Рис. 1. Фрагмент графика электропотребления предприятия

Формирование выборки для применения машинного обучения

В прогнозировании временных рядов с помощью моделей машинного обучения одним из основных факторов, влияющих на результат, является выбор признаков [14, 16, 34]. Прогнозирование электропотребления, как правило помимо прочих признаков, использует предыдущие значения для прогнозирования последующих:

y_{i}^{*} = f (g (y_{i - h}, y_{i - h - 1}, ..., y_{i - h - w}), X),

где y^*_i – прогнозное электропотребление в i-й момент времени; f – прогнозирующая модель; g – функция, которая задает правило выбора ретроспективных фактических значений электропотребления; h – горизонт прогнозирования; w – ширина окна ретроспективных данных; X – прочие признаки (например, номер часа или дня недели, метеорологические факторы, производственные факторы и т.д.).

При использовании нейросетевых, особенно рекуррентных, моделей возможна обработка всех значений временного ряда y_i-h,y_i-h-1, ...., y_i-h-w [5, 6, 21]. Однако для промышленных предприятий достаточно применять ретроспективные значения временного ряда, отстоящие от прогнозируемого часа на величину, кратную 6, 12 или 24 ч, что связано с производственными технологическими циклами. Это позволяет существенно упростить модель и снизить риск ее переобучения из-за избыточного количества признаков [6, 16, 35].

В ходе предварительного корреляционного анализа определено, что для прогнозирования достаточно использовать часы с шагом 12 и глубиной ретроспективы три дня. Например, для прогноза составляющей суточного графика электропотребления 28.10.2023 19:00-20:00 будут использоваться данные электропотребления 27.10.2023 19:00-20:00 и 07:00-08:00, 26.10.2023 19:00-20:00 и 25.10.2023 19:00-20:00. Таким образом, выражение принимает вид:

y_{i}^{*} = f (y_{i - 24}, y_{i - 36}, y_{i - 48}, y_{i - 60}, y_{i - 72}, X),

при этом X содержит следующие признаки: номер i-го часа (от 0 до 23); номер дня месяца, на который приходится прогноз (от 1 до 31); номер дня недели, на который приходится прогноз (1-7); номер месяца, на который приходится прогноз (1-12); прогноз нагрузки, сформированный экспертом вручную y^e_i (в представленной работе проведены результаты прогнозирования с его учетом и без его использования); скорость ветра в i-й час; температура воздуха в i-й час; атмосферное давление в i-й час; относительная влажность воздуха в i-й час; плановые ремонты, вектор r_ij, j = 1, … m.

В результате полный вектор признаков содержит 37 значений (5 значений электропотребления; 4 календарных признака; прогноз эксперта; 4 метеорологических фактора; 23 признака, связанных с ремонтами оборудования). В ходе исследования проверялись различные комбинации признаков, чтобы определить их влияние на точность прогноза. Предобработка данных, построение и тестирование моделей машинного обучения было выполнено на языке программирования Python 3 с применением open-source библиотек Pandas и Scikit-Learn.

Используемые методы машинного обучения

Задача краткосрочного прогнозирования электропотребления предприятий успешно решается с помощью искусственных нейронных сетей и ансамблей деревьев решений. В предыдущих исследованиях авторов данной статьи показано, что ансамблевые модели градиентного и адаптивного бустинга, случайного леса демонстрируют одинаковую точность с моделями, использующими нейронные сети, но при этом имеют более высокую скорость обучения и отличаются простотой в настройке гиперпараметров [6, 16, 33]. В статьях [27, 29] для прогнозирования электропотребления успешно применены именно ансамбли деревьев решений.

Поэтому в настоящей работе выбраны ансамблевые методы: случайный лес (Random Forest) и адаптивный бустинг (AdaBoost), экстремальный градиентный бустинг (XGBoost) [36]. Указанные методы использованы для построения ансамблей из регрессионных деревьев решений. Одно дерево можно представить в виде

y_{i}^{*} = t (Z_{i}),

где t – иерархическая система правил, каждое из которых сравнивает значение определенного признака с пороговым значением.

Случайный лес строит регрессионную модель как ансамбль из k деревьев решений, каждое из которых независимо от остальных обучается на своем случайно выбранном подмножестве экземпляров из обучающей выборки:

y_{i}^{*} = \frac{1}{k} \sum_{j = 1}^{k} t_{j} (Z_{i}) .

Адаптивный бустинг и экстремальный градиентный бустинг, в отличие от случайного леса, строят ансамбли итерационно. Каждая следующая модель в ансамбле зависит от результатов предыдущих. В итоге формируется модель

y_{i}^{*} = \sum_{j = 1}^{k} w_{j} t_{j} (Z_{i}),

где w_j – вес j-й модели (в данном случае дерева решений).

Адаптивный бустинг после добавления каждой новой модели в ансамбль корректирует веса экземпляров обучающей выборки, увеличивая их пропорционально величине отклонения выхода модели от истинного значения. При градиентном бустинге градиент ошибки текущего ансамбля является критерием оптимизации для построения каждой новой модели ансамбля. При этом существуют различные реализации градиентного бустинга, включая экстремальный [36].

Анализ применимости методов объяснимого искусственного интеллекта

Использование систем, предлагающих эксперту решения без объяснений на основе неинтерпретируемых алгоритмов, ограничено, поскольку они не вызывают доверия у пользователей и могут содержать скрытые риски непредвиденных критических ошибок. С целью решения такой проблемы развивается направление исследований, в котором для совершенствования взаимодействия пользователя и интеллектуальных систем применяются методы объяснимого искусственного интеллекта (XAI, eXplainable Artificial Intelligence). Объяснимый искусственный интеллект направлен на создание интеллектуальных систем, способных интерпретировать свои результаты и объяснять их пользователю [37, 38]. Концепция XAI предполагает следование принципам объяснимости (интеллектуальная система должна объяснять свои результаты), значимости (объяснение должно адаптироваться для пользователей), точности (объяснение должно правдиво описывать то, как модель получила результат), пределов знания (интеллектуальная система должна понимать границы своей применимости и не пытаться решить задачи, которые выходят за ее возможности).

Направления применения XAI можно разделить на создание самоинтерпретируемых моделей и методов апостериорного объяснения полученных результатов. Например, дерево решений при небольшой глубине является интерпретируемой моделью, поскольку представляет собой систему правил. Для сложных задач в настоящее время применяются модели, которые не являются интерпретируемыми, в них используется второй подход – применение методов апостериорного объяснения. Среди таких методов объяснения отметим метод локально интерпретируемого не зависящего от модели объяснения LIME [39]. Метод предполагает построение локальной суррогатной модели, объясняющей работу объясняемой модели в узкой окрестности рассматриваемого входного экземпляра. Локальная суррогатная модель – это простая интерпретируемая модель, такая как дерево решений или линейная регрессия, которая обучается предсказывать выход объясняемой модели в данной окрестности. Недостаток метода – необходимость подбора, настройки и обучения суррогатной модели, а также неявное нарушение принципа точности, так как гипотеза о том, что объяснение суррогатной модели соответствует механизму принятия решения объясняемой модели, является в каждом конкретном случае непроверяемым предположением.

Для сверточных нейронных сетей используются методы, основанные на отображении активации класса (CAM), такие как Grad-CAM [40]. Ограничением метода является возможность его применения только для сверточных нейронных сетей, так как он основан на обработке карт признаков, которые формируют каждый сверточный слой, и вычислении градиентов, производных от выходных результатов модели по отношению к картам признаков.

Если пользователь интеллектуальной системы поддержки принятия решения является экспертом в решаемой задаче, то отображение признаков, повлиявших на формирование решения с указанием значимостей (весов) признаков, повышает доверие к системе и вероятность эффективной совместной работы с ней. Поэтому именно в таких направлениях, как диагностика, планирование или прогнозирование, где моделью пользуется эксперт, актуально применение метода аддитивного объяснения на основе вектора Шепли (SHAP) [41]. Аддитивное объяснение Шепли основано на алгоритме теоретически оптимальных значений Шепли из теории игр. Определяется вклад каждого из игроков в итоговый выигрыш. Если заменить игроков на признаки, а выигрыш на результаты модели машинного обучения, то получится алгоритм определения влияния каждого признака на результат модели. При использовании алгоритма SHAP значимость j-го признака для модели f при анализе экземпляра входных данных Z_i вычисляется как:

φ_{j} (f, Z_{i}) = \sum_{S \subseteq P / {j}} \frac{|S|! (m - |S| - 1)!}{m!} [f_{S \cup {j}} (Z_{i, S \cup {j}}) - f_{S} (Z_{i, S})],

где m – число признаков; S – подмножество признаков; P – множество всех возможных комбинаций признаков; i – экземпляр входных данных; j – индекс признака. Если признак не используется, то его значение заменяется усредненным значением. В результате происходит оценка важности j-го признака путем анализа его влияния на результаты модели с ним и без него при различных наборах остальных признаков.

Использование методов LIME и SHAP в электроэнергетике пока находится на начальном этапе. В статье [42] оба метода применены для прогнозирования генерации солнечной электростанции. Прогнозированию электропотребления с использованием SHAP посвящена работа [43], но в ней объектом является крупная энергетическая система, а не предприятие.

В настоящей работе впервые предложены и апробированы положения об интеллектуальной системе краткосрочного прогнозирования электрической нагрузки горно-добывающего предприятия с учетом метеорологических факторов и ремонтов оборудования, дающая пользователю обоснование прогноза с помощью аддитивного объяснения Шепли. Проведен анализ полученных объяснений и описано взаимодействие специалиста по планированию электрической нагрузки с интеллектуальной системой.

Обсуждения

Результаты прогнозирования электропотребления

Показатели моделей, использующих методы AdaBoost, XGBoost, Random Forest для прогноза электропотребления, сравнивались с ошибками прогноза нагрузки, сформированного экспертом вручную: средней по модулю ошибкой (MAE – mean absolute error) – 16,53 МВт·ч; средней по модулю ошибкой (MAPE – mean absolute percentage error) – 9,85 %; с корнем средней квадратичной ошибки (RMSE – root mean square error) – 21,18 МВт·ч. Выборка данных для построения модели была разделена на обучающую и тестовую в отношении 90:10.

Проведены эксперименты с построением моделей машинного обучения для прогноза электропотребления горного предприятия при учете разных признаков.

В первом эксперименте в качестве признаков выбраны:

номер i-го часа (от 0 до 23);
номер дня месяца, на который приходится прогноз (от 1 до 31);
номер дня недели, на который приходится прогноз (1-7);
номер месяца, на который приходится прогноз (1-12);
ретроспективные мощности потребления (потребление_1, потребление_2, потребление_3, потребление_4, потребление_5 – ).

В табл.2 представлены результаты прогнозирования электропотребления для данной группы признаков. Использованы обозначения: max_depth – максимальная глубина деревьев решений в ансамбле; n_estimators – количество деревьев в ансамбле. Лучший результат MAPE для тестовой выборки показал метод AdaBoost – 9,68 %. По сравнению с MAPE прогноза эксперта, проведенного вручную (9,85 %), точность повысилась на 0,17 %. Можно заключить, что без дополнительного учета параметров технологических процессов и метрологических факторов применение моделей с использованием методов машинного обучения не улучшает точность прогноза электропотребления, однако позволяет уменьшить время получения результата. Для составления графика потребления эксперт затрачивает 2-4 ч, в то время как обучение занимает до 5 мин.

Таблица 2

Прогнозирование электропотребления предприятия с учетом ретроспективы потребления

Метод	MAE, МВт·ч		MAPE, %		RMSE, МВт·ч		max_depth	n_estimators
Метод	Обучающая	Тестовая	Обучающая	Тестовая	Обучающая	Тестовая	max_depth	n_estimators
AdaBoost	10,28	15,80	8,88	9,68	12,51	20,96	7	200
XGBoost	9,09	18,45	8,34	11,58	12,84	23,79	3	150
Random Forest	10,60	17,07	9,96	10,89	15,30	23,56	7	7

Во втором эксперименте к признакам, выбранным для первого, был добавлен вектор r_ij, j = 1, … m плановых ремонтов (табл.3).

Таблица 3

Прогнозирование электропотребления предприятия с учетом ретроспективы потребления и плановых ремонтов

Метод	MAE, МВт·ч		MAPE, %		RMSE, МВт·ч		max_depth	n_estimators
Метод	Обучающая	Тестовая	Обучающая	Тестовая	Обучающая	Тестовая	max_depth	n_estimators
AdaBoost	10,27	17,15	8,93	10,40	12,51	22,23	7	200
XGBoost	10,71	17,24	9,76	10,72	15,06	22,63	2	150
Random Forest	11,28	18,26	10,61	11,39	16,32	24,34	6	150

Лучший результат MAPE для тестовой выборки, как и для первого эксперимента, показал метод AdaBoost – 10,40 %. Учет фактора плановых ремонтов ухудшил точность прогноза на 0,55 %, хотя ожидалось повышение точности прогноза при дополнительном учете факторов производственного процесса. Дополнительные эксперименты с различными вариантами группирования ремонтов (объединения признаков) не привели к повышению точности. Это связано с тем, что плановые ремонты не совпадали с фактическими. Например, если ремонт агрегата по плану 2 ч с 10:00 до 12:00, он мог быть проведен в другое время (с 14:00 до 16:00) или иметь другую продолжительность (с 10:00 до 17:00).

В перспективе возможно учитывать не все ремонты, а только спланированные с высокой точностью, например ремонты, которые длятся несколько дней. В этом случае будет уменьшено стохастическое влияние коротких ремонтов на график электропотребления.

В третьем эксперименте к признакам, выбранным для первого эксперимента, были добавлены метеорологические параметры в i-й час: скорость ветра; температура воздуха; атмосферное давление; относительная влажность воздуха (табл.4).

Таблица 4

Прогнозирование электропотребления предприятия с учетом ретроспективы потребления и метеорологических факторов

Метод	MAE, МВт·ч		MAPE, %		RMSE, МВт·ч		max_depth	n_estimators
Метод	Обучающая	Тестовая	Обучающая	Тестовая	Обучающая	Тестовая	max_depth	n_estimators
AdaBoost	9,44	13,14	8,17	8,17	11,39	17,66	7	200
XGBoost	8,12	12,89	7,57	7,85	11,49	17,18	3	150
Random Forest	8,79	13,59	8,37	8,73	12,70	18,93	8	150

В четвертом эксперименте учтены плановые ремонты и метеорологические факторы (табл.5). Лучший результат MAPE для тестовой выборки показал метод AdaBoost – 8,38 %. Несмотря на то, что, по сравнению с MAPE прогноза эксперта, проведенного вручную, повышение точности составляет 1,48 %, это вызвано учетом метеорологических факторов. Несоответствие фактических ремонтов плановым не позволяет применять данные о плановых ремонтах для построения модели.

Таблица 5

Прогнозирование электропотребления предприятия с учетом ретроспективы потребления, плановых ремонтов и метеорологических факторов

Метод	MAE, МВт·ч		MAPE, %		RMSE, МВт·ч		max_depth	n_estimators
Метод	Обучающая	Тестовая	Обучающая	Тестовая	Обучающая	Тестовая	max_depth	n_estimators
AdaBoost	8,31	13,57	8,03	8,38	11,22	18,10	7	200
XGBoost	7,93	14,73	7,38	9,13	11,29	19,26	3	150
Random Forest	8,72	14,38	8,32	9,04	12,56	19,57	8	150

В пятом эксперименте использовались не только ретроспективные данные о потреблении и метеорологические факторы, но и прогноз нагрузки, сформированный экспертом вручную (табл.6). Кроме того, для обоснования применимости ансамблевых моделей дополнительно проведены вычислительные эксперименты с использованием нейронных сетей долговременной краткосрочной памяти: Gated Recurrent Unit (GRU), архитектура и подход к выбору гиперпараметров которых описаны в работе [5]. Лучший результат MAPE для тестовой выборки показал метод XGBoost – 7,41 %. По сравнению с MAPE прогноза эксперта, проведенного вручную (9,85 %), точность повысилась на 2,44 %. В интеллектуальной системе внедрение прогноза эксперта может быть реализовано двумя способами: внесением экспертных поправок в график, полученный моделью; уточнением экспертного графика моделью.

Первый способ является более предпочтительным, так как в этом случае экономится время, затрачиваемое экспертом на составлении планового графика электропотребления.

Таблица 6

Прогнозирование электропотребления предприятия с учетом ретроспективы потребления, метеорологических факторов и прогноза нагрузки, сформированного экспертом

Метод	MAE, МВт·ч		MAPE, %		RMSE, МВт·ч		max_depth	n_estimators
Метод	Обучающая	Тестовая	Обучающая	Тестовая	Обучающая	Тестовая	max_depth	n_estimators
AdaBoost	8,06	13,63	6,79	8,35	9,67	17,91	7	200
XGBoost	8,29	11,94	7,29	7,41	11,85	16,53	2	150
Random Forest	9,50	13,14	8,26	8,30	13,71	17,84	5	150
GRU	8,11	13,16	7,15	8,31	11,52	17,80	–	–

На рис.2 представлены сопоставления фактического и прогнозного потребления. Из анализа графиков можно заключить, что при добавлении плана потребления, сформированного экспертом, модель машинного обучения может точнее предсказать резкие апериодические изменения потребления, выделенные красными овалами. В перспективе можно провести дополнительные изыскания по поиску и формализации производственных факторов технологических процессов, вызывающих данные изменения, а также внедрение этих факторов как дополнительных признаков в модель машинного обучения.

В табл.7 представлены сводные результаты экспериментов. Абсолютное и относительное улучшения прогноза рассчитывались относительно MAPE прогноза эксперта, проведенного вручную (9,85 %). Учет дополнительных факторов позволяет повысить точность. С учетом ретроспективы потребления и метеорологических факторов точность прогноза повышается на 20,34 %. При дополнительном учете плана потребления, сформированного экспертом, точность прогноза повышается на 24,75 %.

Таблица 7

Прогнозирование электропотребления предприятия с учетом различных факторов

Эксперимент	Учитываемые факторы	Модель	MAPE, %	Абсолютное улучшение прогноза	Относительное улучшение прогноза
1	Ретроспектива потребления	AdaBoost	9,68	0,17	1,70
2	Ретроспектива потребления, плановые ремонты	AdaBoost	10,40	–0,55	–5,54
3	Ретроспектива потребления, метеорологические факторы	XGBoost	7,85	2,00	20,34
4	Ретроспектива потребления, метеорологические факторы, плановые ремонты	AdaBoost	8,38	1,48	14,97
5	Ретроспектива потребления, метеорологические факторы, план потребления, сформированный экспертом	XGBoost	7,41	2,44	24,75

Рис.2. Сопоставление фактического (1) и прогнозного (2) потребления с учетом ретроспективы потребления и метеорологических параметров (а); ретроспективы потребления, метеорологических параметров и плана потребления, сформированного экспертом (б)

Объяснение результатов

Применение метода Шепли позволяет получать формализованное отображение признаков, повлиявших на формирование прогноза о величине электропотребления для каждого часа с указанием значимостей (весов) признаков, которые могут быть интерпретированы экспертом.

На рис.3 представлено отображение признаков, повлиявших на прогноз электропотребления для одного из часов в зимний период в третьем эксперименте, в котором учитывались ретроспектива потребления и метеорологические факторы. Признаки выстраиваются по порядку убывания влияния на результат отклонения прогнозируемого электропотребления f(x) от среднего значения E[f(х)]. Таким образом, для данных на рис.3 можно заключить, что отклонение значения f(x), составившего 177,665 МВт·ч от среднего значения 136,496 МВт·ч, обосновано высоким потреблением за 24, 36 и 48 ч до прогнозируемого часа и низкой температурой воздуха.

Признаки, повлиявшие на прогноз электропотребления для другого часа в зимний период в том же эксперименте, представлены на рис.4. Отклонение значения f(x), составившего 213,972 МВт·ч от среднего значения 136,496 МВт·ч, обосновано аномально низкой температурой воздуха и высоким потреблением за 24, 36 и 72 ч до прогнозируемого часа.

Рис.3. Отображение признаков, повлиявших на прогноз электропотребления f (x) = 177,665 МВт·ч

Признаки, повлиявшие на прогноз электропотребления в зимний период в том же эксперименте с другим распределением значимости метеорологических признаков, отображены на рис.5. Отклонение значения f(x), составившего 190,858 МВт·ч от среднего значения 136,496 МВт·ч, обосновано потреблением за 24, 36, 72 ч до прогнозного часа, температурой воздуха, а также значениями скорости ветра и давлением. Анализ признаков, получаемых с помощью метода Шепли, подтверждает необходимость учета метеорологических факторов при построении модели прогноза электропотребления.

На рис.6 представлены результаты для пятого эксперимента, где учитывался план потребления, сформированного экспертом, для того же часа, анализ прогноза факторов которого представлен на рис.3. Наибольший вклад в значение f(x), составившее 180,863 МВт·ч, внес именно план, сформированный экспертом. При этом вклад метеорологических факторов может иметь ключевое значение также и при учете плана потребления, сформированного экспертом (рис.7) для того же часа, анализ прогноза факторов которого представлен на рис.4.

Рис.4. Отображение признаков, повлиявших на прогноз электропотребления f (x) = 213,972 МВт·ч

Рис.5. Отображение признаков, повлиявших на прогноз электропотребления f (x) = 190,858 МВт·ч

Рис.6. Отображение признаков, повлиявших на прогноз электропотребления f (x) = 180,863 МВт·ч

Рис.7. Отображение признаков, повлиявших на прогноз электропотребления f (x) = 227,987 МВт·ч

Проведенные эксперименты показывают, что метод аддитивного объяснения Шепли для каждого выходного значения модели машинного обучения позволяет показать влияние признаков в наглядном виде, понятном для эксперта, что повышает интерпретируемость результатов модели. Отметим, что данный результат не позволяет говорить о выполнении требований к объяснимому искусственному интеллекту, представленных выше. Однако метод Шепли считается одним из наиболее перспективных методов объяснимого искусственного интеллекта, поэтому его развитие в задачах прогнозирования в перспективе позволит повысить доверие экспертов по планированию электропотребления к системам с использованием методов машинного обучения.

Заключение

Предложен подход к созданию интеллектуальной системы краткосрочного прогнозирования электрической нагрузки горного предприятия с учетом метеорологических факторов и плановых ремонтов оборудования. Учет метеорологических факторов в дополнении к ретроспективе потребления позволяет повысить точность прогноза на 20,34 %.

Из-за несоответствия фактических ремонтов плановым точность прогноза при учете плановых ремонтов уменьшается по отношению к точности прогноза, сформированного экспертом, на 0,55 %. В дальнейших исследованиях планируется учитывать только ремонты, длящиеся больше 12 ч, чтобы минимизировать влияние неточного прогноза ремонтов на результат обучения модели.

Применение плана, сформированного экспертом в дополнение к ретроспективе потребления и метеорологическим факторам, позволяет повысить точность прогноза до 24,75 %. При разработке информационной системы план, сформированный экспертом, может быть учтен с помощью функции внесения экспертных поправок, а также анализа ретроспективы разницы экспертных поправок и результатов модели. В дальнейших исследованиях также планируется точнее формализовать экспертный опыт.

Предлагаемый подход к созданию информационной системы включает также модель, которая даёт пользователю обоснование прогноза с помощью аддитивного объяснения Шепли. Результаты объяснения позволяют эксперту проанализировать влияние факторов на результат прогнозирования. Это не только сможет упростить введение экспертных поправок, но позволит ускорить внедрение информационной системы. Практическая значимость исследования заключается в повышении точности краткосрочного прогнозирования электропотребления промышленных предприятий за счет учета ремонтов и остановов оборудования и создания условий для отраслевого внедрения информационных систем на основе машинного обучения с помощью алгоритмов объяснимого искусственного интеллекта, повышающих уровень доверия пользователей.

Планируется апробировать предложенную систему с использованием методов машинного обучения и моделей объяснимого машинного обучения на данных других промышленных предприятий с большим объемом доступных показателей по количеству признаков и глубине ретроспективы; конкретизировать и формализовать производственные факторы для их учета в виде признаков модели; модифицировать алгоритм аддитивного объяснения Шепли для повышения интерпретируемости его результатов применительно к рассматриваемой задаче; проанализировать влияние точности прогноза электропотребления на затраты предприятия на электропотребление.

Литература

Park S., Ruy S., Choi Y. et al. Data-Driven Baseline Estimation of Residential Buildings for Demand Response // Energies. 2015. Vol. 8. Iss. 9. P. 10239-10259. DOI: 10.3390/en80910239
Almuhaini S.H., Sultana N. Forecasting Long-Term Electricity Consumption in Saudi Arabia Based on Statistical and Machine Learning Algorithms to Enhance Electric Power Supply Management // Energies. 2023. Vol. 16. Iss. 4. № 2035. DOI: 10.3390/en16042035
Faria P., Vale Z. Demand Response in Smart Grids // Energies. 2023. Vol. 16. Iss. 2. № 863. DOI: 10.3390/en16020863
Канапелько Р.А. Российская и зарубежная практика взаимодействия корпоративных и властных структур оптового рынка электроэнергии и мощности // Экономика и бизнес: теория и практика. 2019. № 2. С. 47-51. DOI: 10.24411/2411-0450-2019-10364
Matrenin P.V., Manusov V.Z., Khalyasmaa A.I. et al. Improving Accuracy and Generalization Performance of Small-Size Re-current Neural Networks Applied to Short-Term Load Forecasting // Mathematics. 2020. Vol. 8. Iss. 12. № 2169. DOI: 10.3390/math8122169
Антоненков Д.В., Матренин П.В. Исследование ансамблевых и нейросетевых методов машинного обучения в задаче краткосрочного прогнозирования электропотребления горных предприятий // Электротехнические системы и комплексы. 2021. № 3 (52). С. 57-65. DOI: 10.18503/2311-8318-2021-3(52)-57-65
Непша Ф.С., Красильников М.И., Перевалов К.В. Применение цифровой платформы для построения интеллектуаль-ных систем управления энергоснабжением предприятий горной промышленности // Автоматизация и IT в энергетике. 2021. № 5 (142). C. 26-34.
Jianjun Fan, Xinzhong Liu, Zhimin Li et al. Power load forecasting research based on neural network and Holt-winters method // IOP Conference Series: Earth and Environmental Science. 2021. Vol. 692. № 022120. DOI: 10.1088/1755-1315/692/2/022120
Potapov V., Khamitov R., Makarov V. et al. Short-Term Forecast of Electricity Load for LLC «Omsk Energy Retail Company» Using Neural Network / 2018 Dynamics of Systems, Mechanisms and Machines (Dynamics), 13-15 November 2018, Omsk, Russia. IEEE, 2018. DOI: 10.1109/Dynamics.2018.8601430
Chodakowska E., Nazarko J., Nazarko Ł. ARIMA Models in Electrical Load Forecasting and Their Robustness to Noise // Energies. 2021. Vol. 14. Iss. 23. № 7952. DOI: 10.3390/en14237952
Sharma S., Majumdar A., Elvira V., Chouzenoux É. Blind Kalman Filtering for Short-Term Load Forecasting // IEEE Transactions on Power Systems. 2020. Vol. 35. Iss. 6. P. 4916-4919. DOI: 10.1109/TPWRS.2020.3018623
Madhukumar M., Sebastian A., Xiaodong Liang et al. Regression Model-Based Short-Term Load Forecasting for University Campus Load // IEEE Access. 2022. Vol. 10. P. 8891-8905. DOI: 10.1109/ACCESS.2022.3144206
Серебряков Н.А. Применение ансамбля глубоких нейронных сетей в задачах краткосрочного прогнозирования по-часового электропотребления гарантирующего поставщика электроэнергии // Электротехнические системы и комплексы. 2021. № 2 (51). С. 52-60. DOI: 10.18503/2311-8318-2021-2(51)-52-60
Caro E., Juan J., Nouhitehrani S. Optimal Selection of Weather Stations for Electric Load Forecasting // IEEE Access. 2023. Vol. 11. P. 42981-42990. DOI: 10.1109/ACCESS.2023.3270933
Sergeev N., Matrenin P. Improving Accuracy of Machine Learning Based Short-Term Load Forecasting Models with Cor-relation Analysis and Feature Engineering / 2023 IEEE 24th International Conference of Young Professionals in Electron Devices and Materials (EDM), 29 June – 3 July 2023, Novosibirsk, Russia. IEEE, 2023. P. 1000-1004. DOI: 10.1109/EDM58354.2023.10225058
Habbak H., Mahmoud M., Metwally K. et al. Load Forecasting Techniques and Their Applications in Smart Grids // Energies. 2023. Vol. 16. Iss. 3. № 1480. DOI: 10.3390/en16031480
Ryu S., Noh J., Kim H. Deep Neural Network Based Demand Side Short Term Load Forecasting // Energies. 2017. Vol. 10. Iss. 1. № 3. DOI: 10.3390/en10010003
Szczepaniuk H., Szczepaniuk E.K. Applications of Artificial Intelligence Algorithms in the Energy Sector // Energies. 2023. Vol. 16. Iss. 1. № 347. DOI: 10.3390/en16010347
Lizhen Wu, Chun Kong, Xiaohong Hao, Wei Chen. A Short-Term Load Forecasting Method Based on GRU-CNN Hybrid Neural Network Model // Mathematical Problems in Engineering. 2020. Vol. 2020. Iss. 1. № 1428104. DOI: 10.1155/2020/1428104
Zhuofu Deng, Binbin Wang, Yanlu Xu et al. Multi-Scale Convolutional Neural Network With Time-Cognition for Multi-Step Short-Term Load Forecasting // IEEE Access. 2019. Vol. 7. P. 88058-88071. DOI: 10.1109/ACCESS.2019.2926137
Weicong Kong, Zhao Yang Dong, Youwei Jia et al. Short-Term Residential Load Forecasting Based on LSTM Recurrent Neural Network // IEEE Transactions on Smart Grid. 2019. Vol. 10. Iss. 1. P. 841-851. DOI: 10.1109/TSG.2017.2753802
Потапов В.И., Грицай А.С., Тюньков Д.А., Синицин Г.Э. Использование нейронной сети для построения кратко-срочного прогноза электропотребления ООО «Омская энергосбытовая компания» // Известия Томского политехнического университета. Инжиниринг георесурсов. 2016. Т. 327. № 8. С. 44-51.
Cai M., Pipattanasomporn M., Rahman S. Day-ahead building-level load forecasts using deep learning vs. traditional time-series techniques // Applied Energy. 2019. Vol. 236. P. 1078-1088. DOI: 10.1016/j.apenergy.2018.12.042
Ye Hong, Yingjie Zhou, Qibin Li et al. A Deep Learning Method for Short-Term Residential Load Forecasting in Smart Grid // IEEE Access. 2020. Vol. 8. P. 55785-55797. DOI: 10.1109/ACCESS.2020.2981817
Zhuofu Deng, Binbin Wang, Yanlu Xu et al. Multi-Scale Convolutional Neural Network With Time-Cognition for Multi-Step Short-Term Load Forecasting // IEEE Access. 2019. Vol. 7. P. 88058-88071. DOI: 10.1109/ACCESS.2019.2926137
Ahmad N., Ghadi Y., Adnan M., Ali M. Load Forecasting Techniques for Power System: Research Challenges and Survey // IEEE Access. 2022. Vol. 10. P. 71054-71090. DOI: 10.1109/ACCESS.2022.3187839
Клюев Р.В., Моргоева А.Д., Гаврина О.А. и др. Прогнозирование планового потребления электроэнергии для объе-диненной энергосистемы с помощью машинного обучения // Записки Горного института. 2023. Т. 261. С. 392-402.
Rusina A.G., Filippova T.A., Kalinin A.E., Terlyga N.S. Short-Term Electricity Consumption Forecast in Siberia IPS Using Climate Aspects / 2018 19th International Conference of Young Specialists on Micro/Nanotechnologies and Electron Devices (EDM), 29 June – 3 July 2018, Erlagol, Russia. IEEE, 2018. P. 6403-6407. DOI: 10.1109/EDM.2018.8435002
Моргоев И.Д., Дзгоев А.Э., Клюев Р.В., Моргоева А.Д. Прогнозирование потребления электроэнергии предприятиями народнохозяйственного комплекса в условиях неполноты информации // Известия Кабардино-Балкарского научного центра РАН. 2022. № 3 (107). С. 9-20. DOI: 10.35330/1991-6639-2022-3-107-9-20
Antonenkov D.V., Solovev D.B. Mathematic simulation of mining company’s power demand forecast (by example of «Neryungri» coal strip mine) // IOP Conference Series: Earth and Environmental Science. 2017. Vol. 87. Iss. 3. № 032003. DOI: 10.1088/1755-1315/87/3/032003
Моргоева А.Д., Моргоев И.Д., Клюев Р.В., Гаврина О.А. Прогнозирование потребления электрической энергии про-мышленным предприятием с помощью методов машинного обучения // Известия Томского политехнического университета. Инжиниринг георесурсов. 2022. Т. 333. № 7. С. 115-125. DOI: 10.18799/24131830/2022/7/3527
Вялкова С.А., Моргоева А.Д., Гаврина О.А. Разработка гибридной модели прогнозирования потребления электриче-ской энергии для горно-металлургического предприятия // Устойчивое развитие горных территорий. 2022. Т. 14. № 3 (53). С. 486-493. DOI: 10.21177/1998-4502-2022-14-3-486-493
Khalyasmaa A., Matrenin P. Initial Data Corruption Impact on Machine Learning Models’ Performance in Energy Con-sumption Forecast / 2021 Ural-Siberian Smart Energy Conference (USSEC), 13-15 November 2021, Novosibirsk, Russian Federation. IEEE, 2021. 5 p. DOI: 10.1109/USSEC53120.2021.9655724
Bouktif S., Fiaz A., Ouni A., Serhani M.A. Optimal Deep Learning LSTM Model for Electric Load Forecasting using Feature Selection and Genetic Algorithm: Comparison with Machine Learning Approaches // Energies. 2018. Vol. 11. Iss. 7. № 1636. DOI: 10.3390/en11071636
Манусов В.З. Нейронные сети: прогнозирование электрической нагрузки и потерь мощности в электрических сетях. От романтики к прагматике. Новосибирск: Изд-во НГТУ, 2018. 303 с.
Tianqi Chen, Guestrin C. XGBoost: A Scalable Tree Boosting System / KDD’16: Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 13-17 August 2016, San Francisco, CA, USA. New York: As-sociation for Computing Machinery, 2016. P. 785-794. DOI: 10.1145/2939672.2939785
Ahmed I., Jeon G., Piccialli F. From Artificial Intelligence to Explainable Artificial Intelligence in Industry 4.0: A Survey on What, How, and Where // IEEE Transactions on Industrial Informatics. 2022. Vol. 18. Iss. 8. P. 5031-5042. DOI: 10.1109/TII.2022.3146552
Adadi A., Berrada M. Peeking Inside the Black-Box: A Survey on Explainable Artificial Intelligence (XAI) // IEEE Access. 2018. Vol. 6. P. 52138-52160. DOI: 10.1109/ACCESS.2018.2870052
Ribeiro M.T., Singh S., Guestrin C. «Why Should I Trust You?»: Explaining the Predictions of Any Classifier / The 2016 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies. Pro-ceedings of the Demonstrations Session, 12-17 June 2016, San Diego, CA, USA. Stroudsburg: Association for Computational Lin-guistics, 2016. P. 97-101. DOI: 10.48550/arXiv.1602.04938
Selvaraju R.R., Cogswell M., Das A. et al. Grad-CAM: Visual Explanations from Deep Networks via Gradient-Based Locali-zation // International Journal of Computer Vision. 2020. Vol. 128. Iss. 2. P. 336-359. DOI: 10.1007/s11263-019-01228-7
Lundberg S.M., Su-In Lee. A unified approach to interpreting model predictions / NIPS’17: Proceedings of the 31st Interna-tional Conference on Neural Information Processing Systems, 4-9 December 2017, Long Beach, CA, USA. Red Hook: Curran Asso-ciates Inc., 2017. P. 4768-4777. DOI: 10.48550/arXiv.1705.07874
Kuzlu M., Cali U., Sharma V., Güler Ö. Gaining Insight Into Solar Photovoltaic Power Generation Forecasting Utilizing Explainable Artificial Intelligence Tools // IEEE Access. 2020. Vol. 8. P. 187814-187823. DOI: 10.1109/ACCESS.2020.3031477
Hengbo Liu, Ziqing Ma, Linxiao Yang et al. SADI: A Self-Adaptive Decomposed Interpretable Framework for Electric Load Forecasting Under Extreme Events / ICASSP 2023 – 2023 IEEE International Conference on Acoustics, Speech and Signal Processing, 4-10 June 2023, Rhodes Island, Greece. IEEE, 2023. 5 p. DOI: 10.1109/ICASSP49357.2023.10096002

Повышение интерпретируемости моделей прогнозирования электропотребления горно-добывающих предприятий с помощью аддитивного объяснения Шепли

Аннотация

Финансирование

Введение

Методы

Исходные данные

Формирование выборки для применения машинного обучения

Используемые методы машинного обучения

Анализ применимости методов объяснимого искусственного интеллекта

Обсуждения

Результаты прогнозирования электропотребления

Объяснение результатов

Заключение

Литература

Похожие статьи