Середа, 02.07.2025, 14:23

Гость

Мішатронік

Меню сайту

Наше опитування

Статистика

Онлайн всього: 1

Гостей: 1

Користувачів: 0

Поддержка чётности длины пути и задача о проверке двудольности графа в онлайн

По аналогии с длиной пути до лидера, так же можно поддерживать чётность длины пути до него. Почему же это применение было выделено в отдельный пункт?

Дело в том, что обычно требование хранение чётности пути всплывает в связи со следующей задачей: изначально дан пустой граф, в него могут добавляться рёбра, а также поступать запросы вида "является ли компонента связности, содержащая данную вершину, двудольной?".

Для решения этой задачи мы можем завести систему непересекающихся множеств для хранения компонент связности, и хранить у каждой вершины чётность длины пути до её лидера. Тем самым, мы можем быстро проверять, приведёт ли добавление указанного ребра к нарушению двудольности графа или нет: а именно, если концы ребра лежат в одной и той же компоненте связности, и при этом имеют одинаковые чётности длины пути до лидера, то добавление этого ребра приведёт к образованию цикла нечётной длины и превращению текущей компоненты в недвудольную.

Главная сложность, с которой мы сталкиваемся при этом, — это то, что мы должны аккуратно, с учётом чётностей, производить объединение двух деревьев в функции $\rm union\_sets$ .

Если мы добавляем ребро $(a,b)$ , связывающее две компоненты связности в одну, то при присоединении одного дерева к другому мы должны указать ему такую чётность, чтобы в результате у вершин $a$ и $b$ получались бы разные чётности длины пути.

Выведём формулу, по которой должна получаться эта чётность, выставляемая лидеру одного множества при присоединении его к лидеру другого множества. Обозначим через $x$ чётность длины пути от вершины $a$ до лидера её множества, через $y$ — чётность длины пути от вершины $b$ до лидера её множества, а через $t$ — искомую чётность, которую мы должны поставить присоединяемому лидеру. Если множество с вершиной $a$ присоединяется к множеству с вершиной $b$ , становясь поддеревом, то после присоединения у вершины $b$ её чётность не изменится и останется равной $y$ , а у вершины $a$ чётность станет равной $x \oplus t$ (символом $\oplus$ здесь обозначена операция XOR (симметрическая разность)). Нам требуется, чтобы эти две чётности различались, т.е. их XOR был равен единице. Т.е. получаем уравнение на $t$ :

$x \oplus t \oplus y = 1,$

решая которое, находим:

$t = x \oplus y \oplus 1.$

Таким образом, независимо от того, какое множество присоединяется к какому, надо использовать указанную формулу для задания чётности ребра, проводимого из одного лидера к другому.

Приведём реализацию DSU с поддержкой чётностей. Как и в предыдущем пункте, в целях удобства мы используем пары для хранения предков и результата операции $\rm find\_set$ . Кроме того, для каждого множества мы храним в массиве ${\rm bipartite}[]$ , является ли оно всё ещё двудольным или нет.

void make_set (int v) {
 parent[v] = make_pair (v, 0);
 rank[v] = 0;
 bipartite[v] = true;
}
 
pair<int,int> find_set (int v) {
 if (v != parent[v].first) {
 int parity = parent[v].second;
 parent[v] = find_set (parent[v].first);
 parent[v].second ^= parity;
 }
 return parent[v];
}
 
void add_edge (int a, int b) {
 pair<int,int> pa = find_set (a);
 a = pa.first;
 int x = pa.second;
 
 pair<int,int> pb = find_set (b);
 b = pb.first;
 int y = pb.second;
 
 if (a == b) {
 if (x == y)
 bipartite[a] = false;
 }
 else {
 if (rank[a] < rank[b])
 swap (a, b);
 parent[b] = make_pair (a, x ^ y ^ 1);
 bipartite[a] &= bipartite[b];
 if (rank[a] == rank[b])
 ++rank[a];
 }
}
 
bool is_bipartite (int v) {
 return bipartite[ find_set(v) .first ];
}

Алгоритм нахождения RMQ (минимум на отрезке) за $O(\alpha(n))$ в среднем в оффлайне

Формально задача ставится следующим образом: нужно реализовать структуру данных, которая поддерживает два вида запросов: добавление указанного числа ${\rm insert}(i)$ ( $i = 1 \ldots n$ ) и поиск и извлечение текущего минимального числа ${\rm extract\_min}()$ . Будем считать, что каждое число добавляется ровно один раз.

Кроме того, считаем, что вся последовательность запросов известна нам заранее, т.е. задача — в оффлайне.

Идея решения следующая. Вместо того, чтобы по очереди отвечать на каждый запрос, переберём число $i = 1 \ldots n$ , и определим, ответом на какой запрос это число должно быть. Для этого нам надо найти первый неотвеченный запрос, идущий после добавления ${\rm insert}(i)$ этого числа — легко понять, что это и есть тот запрос, ответом на который является число $i$ .

Таким образом, здесь получается идея, похожая на задачу о покраске отрезков.

Можно получить решение за $O(\log n)$ в среднем на запрос, если мы откажемся от ранговой эвристики и будем просто хранить в каждом элементе ссылку на ближайший справа запрос ${\rm extract\_min}()$ , и использовать сжатие пути для поддержания этих ссылок после объединений.

Также можно получить решение и за $O(\alpha(n))$ , если мы будем использовать ранговую эвристику и будем хранить в каждом множестве номер позиции, где оно заканчивается (то, что в предыдущем варианте решения достигалось автоматически за счёт того, что ссылки всегда шли только вправо, — теперь надо будет хранить явно).

Алгоритм нахождения LCA (наименьшего общего предка в дереве) за $O(\alpha(n))$ в среднем в оффлайне

Алгоритм Тарьяна нахождения LCA за $O(1)$ в среднем в режиме онлайн описан в соответствующей статье. Этот алгоритм выгодно отличается от других алгоритмов поиска LCA своей простотой (особенно по сравнению с оптимальным алгоритмом Фарах-Колтона-Бендера).

Хранение DSU в виде явного списка множеств. Применение этой идеи при слиянии различных структур данных

Одним из альтернативных способов хранения DSU является сохранение каждого множества в виде явно хранящегося списка его элементов. При этом, у каждого элемента также сохраняется ссылка на представителя (лидера) его множества.

На первый взгляд кажется, что это неэффективная структура данных: при объединении двух множеств мы должны будем добавить один список в конец другого, а также обновить лидера у всех элементов одного из двух списков.

Однако, как оказывается, применение весовой эвристики, аналогичной описанной выше, позволяет существенно снизить асимптотику работы: до $O(m + n \log n)$ для выполнения $m$ запросов над $n$ элементами.

Под весовой эвристикой подразумевается, что мы всегда будем добавлять меньшее из двух множеств в большее. Добавление ${\rm union\_sets}()$ одного множества в другое легко реализовать за время порядка размера добавляемого множества, а поиск лидера ${\rm find\_set}()$ — за время $O(1)$ при таком способе хранения.

Докажем асимптотику $O(m + n \log n)$ для выполнения $m$ запросов. Зафиксируем произвольный элемент $x$ и проследим, как на него воздействовали операции объединения ${\rm union\_sets}$ . Когда на элемент $x$ воздействовали первый раз, мы можем утверждать, что размер его нового множества будет как минимум $2$ . Когда на $x$ воздействовали второй раз — можно утверждать, что он попадёт в множество размера не менее $4$ (т.к. мы добавляем меньшее множество в большее). И так далее — получаем, что на элемент $x$ могло воздействовать максимум $\lceil \log n \rceil$ операций объединения. Таким образом, в сумме по всем вершинам это составляет $O (n \log n)$ , плюс по $O(1)$ на каждый запрос — что и требовалось доказать.

Приведём пример реализации:

vector<int> lst[MAXN];
int parent[MAXN];
 
void make_set (int v) {
 lst[v] = vector<int> (1, v);
 parent[v] = v;
}
 
int find_set (int v) {
 return parent[v];
}
 
void union_sets (int a, int b) {
 a = find_set (a);
 b = find_set (b);
 if (a != b) {
 if (lst[a].size() < lst[b].size())
 swap (a, b);
 while (!lst[b].empty()) {
 int v = lst[b].back();
 lst[b].pop_back();
 parent[v] = a;
 lst[a].push_back (v);
 }
 }
}

Также эту идею добавления элементов меньшего множества в большее можно использовать и вне рамок DSU, при решении других задач.

Например, рассмотрим следующую задачу: дано дерево, каждому листу которого приписано какое-либо число (одно и то же число может встречаться несколько раз у разных листьев). Требуется для каждой вершины дерева узнать количество различных чисел в её поддереве.

Применив в этой задаче эту же идею, можно получить такое решение: пустим обход в глубину по дереву, который будет возвращать указатель на ${\rm set}$ чисел — список всех чисел в поддереве этой вершины. Тогда, чтобы получить ответ для текущей вершины (если, конечно, она не лист) — надо вызвать обход в глубину от всех детей этой вершины, и объединить все полученные ${\rm set}$ в один, размер которого и будет ответом для текущей вершины. Для эффективного объединения нескольких ${\rm set}$ в один как раз применим описанный выше приём: будем объединять два множества, просто добавляя по одному элементы меньшего множества в большее. В итоге мы получим решение за $O (n \log^2 n)$ , поскольку добавление одного элемента в ${\rm set}$ производится за $O (\log n)$ .

Хранение DSU с сохранением явной структуры деревьев. Переподвешивание. Алгоритм поиска мостов в графе за $O(\alpha(n))$ в среднем в онлайне

Одно из мощных применений структуры данных "системы непересекающихся множеств" заключается в том, что она позволяет хранить одновременно как сжатую, так и несжатую структуру деревьев. Сжатая структура может использоваться для быстрого объединения деревьев и проверки на принадлежность двух вершин одному дереву, а несжатая — например, для поиска пути между двумя заданными вершинами, или прочих обходов структуры дерева.

При реализации это означает, что помимо обычного для DSU массива сжатых предков ${\rm parent}[]$ мы заведём массив обычных, несжатых, предков ${\rm real\_parent}[]$ . Понятно, что поддержание такого массива никак не ухудшает асимптотику: изменения в нём происходят только при объединении двух деревьев, и лишь в одном элементе.

С другой стороны, при применении на практике нередко требуется научиться соединять два дерева указанным ребром, не обязательно выходящим из их корней. Это означает, что у нас нет другого выхода, кроме как переподвесить одно из деревьев за указанную вершину, чтобы затем мы смогли присоединить это дерево к другому, сделав корень этого дерева дочерней вершиной ко второму концу добавляемого ребра.

На первый взгляд кажется, что операция переподвешивания — очень затратна и сильно ухудшит асимптотику. Действительно, для переподвешивания дерева за вершину $v$ мы должны пройтись от этой вершины до корня дерева, обновляя везде указатели ${\rm parent}[]$ и ${\rm real\_parent}[]$ .

Однако на самом деле всё не так плохо: достаточно лишь переподвешивать то из двух деревьев, которое меньше, чтобы получить асимпотику одного объединения, равную $O (\log n)$ в среднем.

Более подробно (включая доказательства асимптотики) см. алгоритм поиска мостов в графе за $O(\log n)$ в среднем в онлайне.

Историческая ретроспектива

Структура данных "система непересекающихся множеств" была известна сравнительно давно.

Способ хранения этой структуры в виде леса деревьев был, по всей видимости, впервые описан Галлером и Фишером в 1964 г. (Galler, Fisher "An Improved Equivalence Algorithm"), однако полный анализ асимптотики был проведён гораздо позже.

Эвристики сжатия путей и объединения по рангу, по-видимому, разработали МакИлрой (McIlroy) и Моррис (Morris), и, независимо от них, Триттер (Tritter).

Некоторое время была известна лишь оценка $O(\log^* n)$ на одну операцию в среднем, данная Хопкрофтом и Ульманом в 1973 г. (Hopcroft, Ullman "Set-merging algomthms") — здесь $\log^* n$ — итерированный логарифм (это медленно растущая функция, но всё же не настолько медленно, как обратная функция Аккермана).

Впервые оценку $O (\alpha(n))$ , где $\alpha(n)$ — обратная функция Аккермана — получил Тарьян в своей статье 1975 г. (Tarjan "Efficiency of a Good But Not Linear Set Union Algorithm"). Позже в 1985 г. он вместе с Льювеном получил эту временную оценку для нескольких различных ранговых эвристик и способов сжатия пути (Tarjan, Leeuwen "Worst-Case Analysis of Set Union Algorithms").

Наконец, Фредман и Сакс в 1989 г. доказали, что в принятой модели вычислений любой алгоритм для системы непересекающихся множеств должен работать как минимум за $O(\alpha(n))$ в среднем (Fredman, Saks "The cell probe complexity of dynamic data structures").

Впрочем, следует также отметить, что есть несколько статей, оспаривающих эту временную оценку и утверждающих, что система непересекающихся множеств с эвристиками сжатия пути и объединения по рангу работает за $O(1)$ в среднем: Zhang "The Union-Find Problem Is Linear", Wu, Otoo "A Simpler Proof of the Average Case Complexity of Union-Find with Path Compression".

Форма входа

Пошук

Друзі сайту

Codeforces, спротивне програмування

GitHub - Система контролю версій

GitLab - Система контролю версій

Bitbucket - Система контролю версій

Trello - Система менеджменту

Firebase, платформа по розробці додатків

Календар