Disjoint Sets (Cousera Data Structure week3) - 機械学習エンジニアの備忘録

CouseraのData Strucureコースのweek3の内容です。
www.coursera.org

前回のweek3の内容の記事はこちら
rikeiin.hatenablog.com

Disjoint-setは以下の操作を持つデータ構造である

f:id:rikeiin:20180428215229p:plain
f:id:rikeiin:20180428215301p:plain
f:id:rikeiin:20180428215438p:plain

f:id:rikeiin:20180428220453p:plain

↓

f:id:rikeiin:20180428220528p:plain

メリット
- Unionの実行時間がO(1)
デメリット
- 末尾を探すためにリストを走査する必要があるため、Findの実行時間がO(1)
- ｘのリストの末尾とｙのリストの先頭を定数時間で取得できる場合のみUnionの実行時間はO(1)

f:id:rikeiin:20180428223100p:plain
f:id:rikeiin:20180428223204p:plain

f:id:rikeiin:20180428225415p:plain

union by rank heuristicを使うことでUnionとFindの実行時間がO(log n)になる

木の高さを短くする方法。例えば以下の図の例でFind(6)を実行する場合、ノード6からルートノードまで親を辿っていく必要があるが、その際12と3もルートノードも同時にわかるので以下の様に木を変形できる。

f:id:rikeiin:20180428232818p:plain

O(log n)の操作をn回繰り返すときの計算量をlog*nと定義する。
f:id:rikeiin:20180430161203p:plain

f:id:rikeiin:20180430161247p:plain

つまり一回の操作の時間計算量は漸近的にO(log*n)となり、実質的にlog*n < 5のときは定数時間とみなせる。