Субота, 18.01.2025, 10:47
Гость

Мішатронік

Мобільна версія | Додати у вибране  | Мій профіль | Вихід | RSS |
Меню сайту
Наше опитування
Вам легко дається програмування
Всього відповідей: 2
Статистика

Онлайн всього: 1
Гостей: 1
Користувачів: 0


Поддержка чётности длины пути и задача о проверке двудольности графа в онлайн

По аналогии с длиной пути до лидера, так же можно поддерживать чётность длины пути до него. Почему же это применение было выделено в отдельный пункт?

Дело в том, что обычно требование хранение чётности пути всплывает в связи со следующей задачей: изначально дан пустой граф, в него могут добавляться рёбра, а также поступать запросы вида "является ли компонента связности, содержащая данную вершину, двудольной?".

Для решения этой задачи мы можем завести систему непересекающихся множеств для хранения компонент связности, и хранить у каждой вершины чётность длины пути до её лидера. Тем самым, мы можем быстро проверять, приведёт ли добавление указанного ребра к нарушению двудольности графа или нет: а именно, если концы ребра лежат в одной и той же компоненте связности, и при этом имеют одинаковые чётности длины пути до лидера, то добавление этого ребра приведёт к образованию цикла нечётной длины и превращению текущей компоненты в недвудольную.

Главная сложность, с которой мы сталкиваемся при этом, — это то, что мы должны аккуратно, с учётом чётностей, производить объединение двух деревьев в функции \rm union\_sets.

Если мы добавляем ребро (a,b), связывающее две компоненты связности в одну, то при присоединении одного дерева к другому мы должны указать ему такую чётность, чтобы в результате у вершин a и b получались бы разные чётности длины пути.

Выведём формулу, по которой должна получаться эта чётность, выставляемая лидеру одного множества при присоединении его к лидеру другого множества. Обозначим через xчётность длины пути от вершины a до лидера её множества, через y — чётность длины пути от вершины b до лидера её множества, а через t — искомую чётность, которую мы должны поставить присоединяемому лидеру. Если множество с вершиной a присоединяется к множеству с вершиной b, становясь поддеревом, то после присоединения у вершины b её чётность не изменится и останется равной y, а у вершины a чётность станет равной x \oplus t (символом \oplus здесь обозначена операция XOR (симметрическая разность)). Нам требуется, чтобы эти две чётности различались, т.е. их XOR был равен единице. Т.е. получаем уравнение на t:

 

 x \oplus t \oplus y = 1,

решая которое, находим:

 

 t = x \oplus y \oplus 1.

Таким образом, независимо от того, какое множество присоединяется к какому, надо использовать указанную формулу для задания чётности ребра, проводимого из одного лидера к другому.

Приведём реализацию DSU с поддержкой чётностей. Как и в предыдущем пункте, в целях удобства мы используем пары для хранения предков и результата операции \rm find\_set. Кроме того, для каждого множества мы храним в массиве {\rm bipartite}[], является ли оно всё ещё двудольным или нет.

 

void make_set (int v) {
 parent[v] = make_pair (v, 0);
 rank[v] = 0;
 bipartite[v] = true;
}
 
pair<int,int> find_set (int v) {
 if (v != parent[v].first) {
 int parity = parent[v].second;
 parent[v] = find_set (parent[v].first);
 parent[v].second ^= parity;
 }
 return parent[v];
}
 
void add_edge (int a, int b) {
 pair<int,int> pa = find_set (a);
 a = pa.first;
 int x = pa.second;
 
 pair<int,int> pb = find_set (b);
 b = pb.first;
 int y = pb.second;
 
 if (a == b) {
 if (x == y)
 bipartite[a] = false;
 }
 else {
 if (rank[a] < rank[b])
 swap (a, b);
 parent[b] = make_pair (a, x ^ y ^ 1);
 bipartite[a] &= bipartite[b];
 if (rank[a] == rank[b])
 ++rank[a];
 }
}
 
bool is_bipartite (int v) {
 return bipartite[ find_set(v) .first ];
}

 

 

 

Алгоритм нахождения RMQ (минимум на отрезке) за O(\alpha(n)) в среднем в оффлайне

Формально задача ставится следующим образом: нужно реализовать структуру данных, которая поддерживает два вида запросов: добавление указанного числа {\rm insert}(i) (i = 1 \ldots n) и поиск и извлечение текущего минимального числа {\rm extract\_min}(). Будем считать, что каждое число добавляется ровно один раз.

Кроме того, считаем, что вся последовательность запросов известна нам заранее, т.е. задача — в оффлайне.

Идея решения следующая. Вместо того, чтобы по очереди отвечать на каждый запрос, переберём число i = 1 \ldots n, и определим, ответом на какой запрос это число должно быть. Для этого нам надо найти первый неотвеченный запрос, идущий после добавления {\rm insert}(i) этого числа — легко понять, что это и есть тот запрос, ответом на который является число i.

Таким образом, здесь получается идея, похожая на задачу о покраске отрезков.

Можно получить решение за O(\log n) в среднем на запрос, если мы откажемся от ранговой эвристики и будем просто хранить в каждом элементе ссылку на ближайший справа запрос {\rm extract\_min}(), и использовать сжатие пути для поддержания этих ссылок после объединений.

Также можно получить решение и за O(\alpha(n)), если мы будем использовать ранговую эвристику и будем хранить в каждом множестве номер позиции, где оно заканчивается (то, что в предыдущем варианте решения достигалось автоматически за счёт того, что ссылки всегда шли только вправо, — теперь надо будет хранить явно).

 

 

 

Алгоритм нахождения LCA (наименьшего общего предка в дереве) за O(\alpha(n)) в среднем в оффлайне

Алгоритм Тарьяна нахождения LCA за O(1) в среднем в режиме онлайн описан в соответствующей статье. Этот алгоритм выгодно отличается от других алгоритмов поиска LCA своей простотой (особенно по сравнению с оптимальным алгоритмом Фарах-Колтона-Бендера).

 

 

 

Хранение DSU в виде явного списка множеств. Применение этой идеи при слиянии различных структур данных

Одним из альтернативных способов хранения DSU является сохранение каждого множества в виде явно хранящегося списка его элементов. При этом, у каждого элемента также сохраняется ссылка на представителя (лидера) его множества.

На первый взгляд кажется, что это неэффективная структура данных: при объединении двух множеств мы должны будем добавить один список в конец другого, а также обновить лидера у всех элементов одного из двух списков.

Однако, как оказывается, применение весовой эвристики, аналогичной описанной выше, позволяет существенно снизить асимптотику работы: до O(m + n \log n) для выполнения mзапросов над n элементами.

Под весовой эвристикой подразумевается, что мы всегда будем добавлять меньшее из двух множеств в большее. Добавление {\rm union\_sets}() одного множества в другое легко реализовать за время порядка размера добавляемого множества, а поиск лидера {\rm find\_set}() — за время O(1) при таком способе хранения.

Докажем асимптотику O(m + n \log n) для выполнения m запросов. Зафиксируем произвольный элемент x и проследим, как на него воздействовали операции объединения {\rm union\_sets}. Когда на элемент x воздействовали первый раз, мы можем утверждать, что размер его нового множества будет как минимум 2. Когда на x воздействовали второй раз — можно утверждать, что он попадёт в множество размера не менее 4 (т.к. мы добавляем меньшее множество в большее). И так далее — получаем, что на элемент x могло воздействовать максимум \lceil \log n \rceil операций объединения. Таким образом, в сумме по всем вершинам это составляет O (n \log n), плюс по O(1) на каждый запрос — что и требовалось доказать.

Приведём пример реализации:

 

vector<int> lst[MAXN];
int parent[MAXN];
 
void make_set (int v) {
 lst[v] = vector<int> (1, v);
 parent[v] = v;
}
 
int find_set (int v) {
 return parent[v];
}
 
void union_sets (int a, int b) {
 a = find_set (a);
 b = find_set (b);
 if (a != b) {
 if (lst[a].size() < lst[b].size())
 swap (a, b);
 while (!lst[b].empty()) {
 int v = lst[b].back();
 lst[b].pop_back();
 parent[v] = a;
 lst[a].push_back (v);
 }
 }
}

Также эту идею добавления элементов меньшего множества в большее можно использовать и вне рамок DSU, при решении других задач.

Например, рассмотрим следующую задачу: дано дерево, каждому листу которого приписано какое-либо число (одно и то же число может встречаться несколько раз у разных листьев). Требуется для каждой вершины дерева узнать количество различных чисел в её поддереве.

Применив в этой задаче эту же идею, можно получить такое решение: пустим обход в глубину по дереву, который будет возвращать указатель на {\rm set} чисел — список всех чисел в поддереве этой вершины. Тогда, чтобы получить ответ для текущей вершины (если, конечно, она не лист) — надо вызвать обход в глубину от всех детей этой вершины, и объединить все полученные {\rm set} в один, размер которого и будет ответом для текущей вершины. Для эффективного объединения нескольких {\rm set} в один как раз применим описанный выше приём: будем объединять два множества, просто добавляя по одному элементы меньшего множества в большее. В итоге мы получим решение за O (n \log^2 n), поскольку добавление одного элемента в {\rm set} производится за O (\log n).

 

 

 

Хранение DSU с сохранением явной структуры деревьев. Переподвешивание. Алгоритм поиска мостов в графе за O(\alpha(n)) в среднем в онлайне

Одно из мощных применений структуры данных "системы непересекающихся множеств" заключается в том, что она позволяет хранить одновременно как сжатую, так и несжатую структуру деревьев. Сжатая структура может использоваться для быстрого объединения деревьев и проверки на принадлежность двух вершин одному дереву, а несжатая — например, для поиска пути между двумя заданными вершинами, или прочих обходов структуры дерева.

При реализации это означает, что помимо обычного для DSU массива сжатых предков {\rm parent}[] мы заведём массив обычных, несжатых, предков {\rm real\_parent}[]. Понятно, что поддержание такого массива никак не ухудшает асимптотику: изменения в нём происходят только при объединении двух деревьев, и лишь в одном элементе.

С другой стороны, при применении на практике нередко требуется научиться соединять два дерева указанным ребром, не обязательно выходящим из их корней. Это означает, что у нас нет другого выхода, кроме как переподвесить одно из деревьев за указанную вершину, чтобы затем мы смогли присоединить это дерево к другому, сделав корень этого дерева дочерней вершиной ко второму концу добавляемого ребра.

На первый взгляд кажется, что операция переподвешивания — очень затратна и сильно ухудшит асимптотику. Действительно, для переподвешивания дерева за вершину v мы должны пройтись от этой вершины до корня дерева, обновляя везде указатели {\rm parent}[] и {\rm real\_parent}[].

Однако на самом деле всё не так плохо: достаточно лишь переподвешивать то из двух деревьев, которое меньше, чтобы получить асимпотику одного объединения, равную O (\log n) в среднем.

Более подробно (включая доказательства асимптотики) см. алгоритм поиска мостов в графе за O(\log n) в среднем в онлайне.

 

 

 

 

Историческая ретроспектива

Структура данных "система непересекающихся множеств" была известна сравнительно давно.

Способ хранения этой структуры в виде леса деревьев был, по всей видимости, впервые описан Галлером и Фишером в 1964 г. (Galler, Fisher "An Improved Equivalence Algorithm"), однако полный анализ асимптотики был проведён гораздо позже.

Эвристики сжатия путей и объединения по рангу, по-видимому, разработали МакИлрой (McIlroy) и Моррис (Morris), и, независимо от них, Триттер (Tritter).

Некоторое время была известна лишь оценка O(\log^* n) на одну операцию в среднем, данная Хопкрофтом и Ульманом в 1973 г. (Hopcroft, Ullman "Set-merging algomthms") — здесь \log^* n — итерированный логарифм (это медленно растущая функция, но всё же не настолько медленно, как обратная функция Аккермана).

Впервые оценку O (\alpha(n)), где \alpha(n) — обратная функция Аккермана — получил Тарьян в своей статье 1975 г. (Tarjan "Efficiency of a Good But Not Linear Set Union Algorithm"). Позже в 1985 г. он вместе с Льювеном получил эту временную оценку для нескольких различных ранговых эвристик и способов сжатия пути (Tarjan, Leeuwen "Worst-Case Analysis of Set Union Algorithms").

Наконец, Фредман и Сакс в 1989 г. доказали, что в принятой модели вычислений любой алгоритм для системы непересекающихся множеств должен работать как минимум за O(\alpha(n))в среднем (Fredman, Saks "The cell probe complexity of dynamic data structures").

Впрочем, следует также отметить, что есть несколько статей, оспаривающих эту временную оценку и утверждающих, что система непересекающихся множеств с эвристиками сжатия пути и объединения по рангу работает за O(1) в среднем: Zhang "The Union-Find Problem Is Linear", Wu, Otoo "A Simpler Proof of the Average Case Complexity of Union-Find with Path Compression".

 

 

Форма входа
Пошук
Друзі сайту
Календар
«  Січень 2025  »
ПнВтСрЧтПтСбНд
  12345
6789101112
13141516171819
20212223242526
2728293031

Єдина Країна! Единая Страна!