Применение графовых нейронных сетей для имитации четырехшаговой транспортной модели

Cover Page

Cite item

Full Text

Abstract

Обоснование. Широко распространенной моделью для моделирования транспортных потоков является четырехшаговая модель. Существует исследование [1], ставящее своей задачей имитацию четырехшаговой модели графовыми нейронными сетями. Было показано, что за счет применения нейронных сетей можно снизить время моделирования с десятков секунд до сотен миллисекунд. Тем не менее качество моделирования остается недостаточно высоким. Делается предположение, что путем адаптации структуры нейронной сети под особенности входных данных (путем отделения обработки узлов — зон и остановок — и ребер — дорожных участков, которые во входных данных представлены одним и тем же набором признаков) удастся увеличить показатели качества модели.

Цель — построение графовой нейронной сети, аппроксимирующей четырехшаговую транспортную модель.

Методы. В качестве базовых слоев при построении нейронной сети полагаются полносвязные и графовые сверточные (слои GCN [2]). Предлагается два варианта сетей: с дополнительными слоями для узлов и с отдельной обработкой узлов.

Подробная схема нейронной сети с дополнительными слоями представлена на рисунке 1. Она поделена на три части. Первая часть отвечает за преобразование с использованием полносвязного слоя отдельно вершин-ребер и отдельно вершин-узлов. Во второй части вспомогательные слои используются после слоев GCN, используя обновленные признаки для узлов (случай полносвязного слоя) или как признаки для узлов, так и признаки для ребер (случай сверточного слоя). Таким образом, имеется возможность модификации признаков узлов для более удачного их представления в дальнейшем процессе агрегации. Третья часть неизменна и ответственна за формирование ответа в виде one-hot-вектора с дальнейшим выбором элемента с максимальным значением.

 

Рис. 1. Схема нейронной сети с дополнительными слоями для узлов

 

Подробная схема нейронной сети с отдельной обработкой узлов представлена на рисунке 2. Синие стрелки характеризуют отличия от предыдущей схемы, подчеркивая, что узлы модифицируются только вспомогательными слоями. Красные стрелки используются только в случае, когда в качестве вспомогательного слоя используется сверточный слой.

 

Рис. 2. Схема нейронной сети с отдельной обработкой узлов

 

В данной сети узлы обрабатываются совершенно независимо от основного слоя GCN. Это выражается в том, что на вспомогательных слоях используются узлы с предыдущего вспомогательного слоя (или исходные узлы на начальном этапе), а не результат обработки первым сверточным слоем.

Результаты. Для эксперимента рассматриваются нейронные сети, состоящие из 5 слоев и обучающиеся в течение 100 эпох. В качестве функции потерь использовалось отрицательное логарифмическое правдоподобие. Сравнение ведется со сверточной графовой сетью [2] и сетью внимания на графах (GAT) [3].

На рисунке 3 приведен график функции потерь для различных реализаций графовых нейронных сетей.

 

Рис. 3. График функции потерь для различных моделей графовых нейронных сетей

 

Сеть GCN с линейными слоями для узлов показывает лучшую обучаемость на первых двадцати эпохах при сравнении с исходной GCN. Однако после тридцатой эпохи исходная сеть GCN несколько превосходит данную модификацию.

Значительно лучший результат, превосходящий результат базового GCN, удается достичь, используя в качестве вспомогательного слоя сверточный.

Выводы. Модели с применением сверточных слоев в качестве вспомогательных демонстрируют лучшие показатели качества. Вспомогательные сверточные слои позволяют выгодным образом представлять данные об узлах таким образом, что основные слои обучаются лучше и за меньшее количество эпох.

Таким образом, подтвердилось предположение о зависимости качества и скорости обучения графовой нейронной сети от способа обмена сообщений, а именно от индивидуальности подхода к обработке узлов и ребер по отдельности.

Full Text

Обоснование. Широко распространенной моделью для моделирования транспортных потоков является четырехшаговая модель. Существует исследование [1], ставящее своей задачей имитацию четырехшаговой модели графовыми нейронными сетями. Было показано, что за счет применения нейронных сетей можно снизить время моделирования с десятков секунд до сотен миллисекунд. Тем не менее качество моделирования остается недостаточно высоким. Делается предположение, что путем адаптации структуры нейронной сети под особенности входных данных (путем отделения обработки узлов — зон и остановок — и ребер — дорожных участков, которые во входных данных представлены одним и тем же набором признаков) удастся увеличить показатели качества модели.

Цель — построение графовой нейронной сети, аппроксимирующей четырехшаговую транспортную модель.

Методы. В качестве базовых слоев при построении нейронной сети полагаются полносвязные и графовые сверточные (слои GCN [2]). Предлагается два варианта сетей: с дополнительными слоями для узлов и с отдельной обработкой узлов.

Подробная схема нейронной сети с дополнительными слоями представлена на рисунке 1. Она поделена на три части. Первая часть отвечает за преобразование с использованием полносвязного слоя отдельно вершин-ребер и отдельно вершин-узлов. Во второй части вспомогательные слои используются после слоев GCN, используя обновленные признаки для узлов (случай полносвязного слоя) или как признаки для узлов, так и признаки для ребер (случай сверточного слоя). Таким образом, имеется возможность модификации признаков узлов для более удачного их представления в дальнейшем процессе агрегации. Третья часть неизменна и ответственна за формирование ответа в виде one-hot-вектора с дальнейшим выбором элемента с максимальным значением.

 

Рис. 1. Схема нейронной сети с дополнительными слоями для узлов

 

Подробная схема нейронной сети с отдельной обработкой узлов представлена на рисунке 2. Синие стрелки характеризуют отличия от предыдущей схемы, подчеркивая, что узлы модифицируются только вспомогательными слоями. Красные стрелки используются только в случае, когда в качестве вспомогательного слоя используется сверточный слой.

 

Рис. 2. Схема нейронной сети с отдельной обработкой узлов

 

В данной сети узлы обрабатываются совершенно независимо от основного слоя GCN. Это выражается в том, что на вспомогательных слоях используются узлы с предыдущего вспомогательного слоя (или исходные узлы на начальном этапе), а не результат обработки первым сверточным слоем.

Результаты. Для эксперимента рассматриваются нейронные сети, состоящие из 5 слоев и обучающиеся в течение 100 эпох. В качестве функции потерь использовалось отрицательное логарифмическое правдоподобие. Сравнение ведется со сверточной графовой сетью [2] и сетью внимания на графах (GAT) [3].

На рисунке 3 приведен график функции потерь для различных реализаций графовых нейронных сетей.

 

Рис. 3. График функции потерь для различных моделей графовых нейронных сетей

 

Сеть GCN с линейными слоями для узлов показывает лучшую обучаемость на первых двадцати эпохах при сравнении с исходной GCN. Однако после тридцатой эпохи исходная сеть GCN несколько превосходит данную модификацию.

Значительно лучший результат, превосходящий результат базового GCN, удается достичь, используя в качестве вспомогательного слоя сверточный.

Выводы. Модели с применением сверточных слоев в качестве вспомогательных демонстрируют лучшие показатели качества. Вспомогательные сверточные слои позволяют выгодным образом представлять данные об узлах таким образом, что основные слои обучаются лучше и за меньшее количество эпох.

Таким образом, подтвердилось предположение о зависимости качества и скорости обучения графовой нейронной сети от способа обмена сообщений, а именно от индивидуальности подхода к обработке узлов и ребер по отдельности.

×

About the authors

Самарский университет

Author for correspondence.
Email: raishab@yandex.ru

студент

Russian Federation, Самара

References

  1. Makarov N. Development of a deep learning surrogate for the four-step transportation model // Transportation Systems Engineering, Technical University of Munich. 2021.
  2. Kipf T.N., Welling M. Semi-supervised classification with graph convolutional networks // arXiv. 2016. ID 02907.
  3. Veličković P., Cucurull G., Casanova A., et al. Graph attention networks // arXiv. 2017. ID 10903.

Supplementary files

Supplementary Files
Action
1. JATS XML
2. Рис. 1. Схема нейронной сети с дополнительными слоями для узлов

Download (117KB)
3. Рис. 2. Схема нейронной сети с отдельной обработкой узлов

Download (125KB)
4. Рис. 3. График функции потерь для различных моделей графовых нейронных сетей

Download (140KB)

Copyright (c) 2024 Хабибулин Р.М.

Creative Commons License
This work is licensed under a Creative Commons Attribution 4.0 International License.