Образование

Студенческий проект «Система геолокации объектов маршрутизации сетей связи общего пользования»

Введение.

         В рамках проектной деятельности, являющейся обязательным элементом образовательной траектории, студенческой командой МИЭМ НИУ ВШЭ при кураторстве Фонда развития сетевых технологий «ИнДата» проведены исследования по эффективной выборке и использованию данных геолокации объектов маршрутизации, на основе которых реализован сервис «Система геолокации объектов маршрутизации сетей связи общего пользования».

Работа выполнена студентами 3-4 курса бакалавриата Алексеем Егоровым, Анной Подгук, Александром Половцевым, Виктором Чертовым и студентом 1-го курса магистратуры Ильёй Клейном. Кураторы проекта – сотрудники ФРСТ «ИнДата» Павел Храмцов, Дмитрий Коваленко, Роман Хананов и Александр Алёхин.

В работе были рассмотрены два подхода к формированию моделей данных и отображению узлов сети на географической карте, а также осуществлён процесс формирования уточнённой базы данных, содержащей информацию о геокоординатах объектов маршрутизации.

Проблематика.

Корректное решение задачи определения степени близости ресурсов сети к потребителю требует максимально достоверных для конкретной территории исходных данных. Основной проблемой использования существующих баз геоданных является существенная погрешность и ошибки геопривязки. В частности, на территориях евразийского континента популярные базы данных имеют существенные проблемы с точностью геопривязки IP-адресов. Это отрицательно сказывается на качественном формировании маршрутных политик и в конечном счёте негативно влияет на скорость доставки контента.

Этапы проекта. Уточнённая база данных.

Проект реализован в два этапа. На первом этапе исследования была сформирована база данных с поддержкой механизма отслеживания истории изменения атрибутов записей для хранения уточненных данных об объектах маршрутизации на территории РФ, набор скриптов, выполняющих добавление новых записей в базу, а также интерфейс для получения данных из нее для отображения на картографической подложке. В качестве основного источника данных использовались данные интернет-регистратуры RIPE NCC, содержащиеся в базе данных RIPE DB.  RIPE NCC распределяет интернет-ресурсы на территории Европы, Ближнего Востока и Центральной Азии.

Для проведения исследования использовались данные об объектах route и автономных системах, к которым привязаны route. В процессе визуализации геоданных на картографической подложке для проверки правильности отрисовки точек (автономных систем) и линий (связей между автономными системами) на карте РФ была использована предоставленная курирующей организацией тестовая база данных, содержащая информацию о 100 автономных системах, в т. ч. их географические координаты, а также таблица связей между автономными системами. 

На втором этапе данные дополнились информацией из RIPE Atlas  – глобальной сети датчиков, которые производят активные измерения состояния глобальной сети. Датчики подключаются напрямую к маршрутизатору, и именно их координаты дополнительно собирались. Достоинство RIPE Atlas заключается в том, что содержащаяся информация значительно более актуальна, чем в самой RIPE DB. Однако, есть и недостатки – установка датчиков добровольна, а это значит, что в этом сервисе собирается не абсолютно полная информация по маршрутизаторам сети, поскольку не все компании-операторы связи по разным причинам готовы устанавливать у себя такие датчики. RIPE ATLAS использует сведения, поступающие с датчиков, закрепленных за определенными автономными системами. А в них соответственно содержится информация о стране и координатах нахождения данного IP-блока. 

Однако, по упомянутым причинам не все IP-префиксы, объявленные в RIPE DB, можно обнаружить через датчики в RIPE ATLAS. Для устранения подобных пробелов в данных, а также для сравнения с уже имеющимися адресами, использовался модуль Whois, с помощью которого можно получить адрес, где зарегистрирован данный объект. 

 Таким образом, через координаты или адрес определяется регион, где расположен данный блок, который в свою очередь может быть отображён на карте.

Визуализация.

Визуализация объектов маршрутизации позволяет наглядно представить сложные сетевые структуры и процессы передачи данных, облегчая понимание и анализ маршрутной информации, например, в контексте выявления нарушений в работе автономной системы. В ходе выполнения проекта были реализованы два подхода к отображению объектов маршрутизации на географической карте.

Первый подход заключался  в отображении объектов маршрутизации в виде точек на карте. Такое отображение помогает понять, к какой автономной системе могут относиться IP адреса, находящиеся в рассматриваемом регионе. Также в этом случае удобно отображать статистику по конкретным маршрутизаторам, что может помочь оператору, например, в поиске конкретного неисправного узла сети.  В большинстве случаев одному оператору принадлежат несколько автономных систем, поэтому при отображении на карте они образуют кластеры. Такой подход к визуализации может быть приемлемым, если отображаемых объектов немного (в этом случае рассматриваются исключительно автономные системы). В противном случае на карте будет отображаться избыточное количество точек, из-за чего зрительное восприятие информации затруднится. Кроме того, этот способ визуализации не даёт полного представления о рассматриваемых узлах сети, поскольку, например, к IP-префиксам и автономным системам не применимо понятие точного местоположения, а сами IP-адреса часто могут менять своё истинное местоположение. 

В ходе проекта были реализованы функции отрисовки точек и линий на карте, кластеризации точек и вывода на экран информации о каждой автономной системе (рис.1).

Рис.1 Отображение автономных систем в виде точек на карте

Рис.1 Отображение автономных систем в виде точек на карте

сами AS, но и отображали линиями связи между ними. В дальнейшем от отображения связей пришлось отказаться в силу чрезвычайного загромождения карты, хотя опционально это решение осталось в рабочей реализации.

Второй подход к визуализации заключался в отображении объектов маршрутизации по принадлежности к регионам, т.е. методом отображения площадей. Он позволяет визуализировать статистику не по конкретным узлам сети, а по всем узлам сети заданного региона, что предоставляет возможность оценивать гораздо больший объём информации о состоянии и уровне защищенности объектов маршрутизации конкретного региона потому, что: 

1) автономная система – это множество и ее правильнее соотносить с множеством точек или регионом, т.к. она обслуживает, как правило, регион.

2)  у оператора связи, как правило, область обслуживания – это макро-регион (субъект федерации/область/край), поэтому для оператора связи именно такой подход более органичен.

При данном формате отображения объектов маршрутизации аналитики сетевых данных могут оперативно отслеживать инциденты и решать проблемы, касающиеся различных маршрутизаторов, которые могут возникнуть в конкретном регионе. Также в этом случае можно сравнительно легко узнавать в каком регионе располагается заданный IP/префикс/автономная система. Такие возможности могут быть использованы для получения информации о том, как организован трафик до конечного пользователя, а также для определения региона, в котором зарегистрирован тот или иной IP-адрес. Очевидно, что при рассмотренном подходе отображение выглядит менее нагруженным и визуально более понятным для пользователя, но, в сравнении с предыдущим случаем, приходится некоторым образом жертвовать географической точностью (рис.2)

Рис.2 Отображение объектов маршрутизации по принадлежности к регионам

Рис.2 Отображение объектов маршрутизации по принадлежности к регионам

Заключение.

Проведённые в ходе выполнения проекта исследования и разработки показали эффективность обоих подходов к формированию уточнённой базы данных геолокации объектов маршрутизации и их визуализации на карте. Каждый из них может с успехом использоваться для своих конкретных целей: один – для более полного понимания о расположении автономных систем и их связях на территории страны, а второй – для комплексного анализа информации об автономных системах по регионам. При этом для их совместного использования может быть разработана многослойная структура визуализации, поддерживающая отслеживание изменений базы данных во времени и позволяющая оценивать ситуацию в сети с различных позиций, что в результате быть может быть реализуемо как элемент сервиса поддержки управленческих решений для оператора сети связи.