
SQLの分析関数であるCUME_DIST()は、特定の行が全体データセットの中でどの程度高い値を持つかを示す。1980年代後半に登場したOracle SQLで初めて使用され、その後他のRDBMSでも採用された。
目次
この記事の目次
- CUME_DIST()とは
- CUME_DIST()の歴史
- CUME_DIST()の内部仕組み
- CUME_DIST()とPERCENT_RANK()の比較
- まとめ
CUME_DIST()とは

CUME_DIST()は、指定されたカラムの値がデータセットの中でどの程度高い位置にあるかを表す関数である。
これはパーティション内での相対的なランク評価に利用され、具体的には学業成績や売上高を百分位順位で表示する際に有用だ。
CUME_DIST()の歴史

CUME_DIST()は、1980年代後半に発行されたOracle SQLで初めて使用され、その後他のデータベースシステムでも採用が進んだ。
SQL:2003規格で標準化されて以降、多くの企業や開発者がこの関数を利用し始めている。
CUME_DIST()の内部仕組み

CUME_DIST()は、指定されたカラムに対してパーティションを定義し、その範囲内で順序付けを行う。
次に各データポイントが全体の中で占める割合を計算し、それに基づいて相対的な順位を出力する。
CUME_DIST()とPERCENT_RANK()の比較

CUME_DIST()は、指定されたカラムの値がデータ全体の中でどの程度高い位置にあるかを表す。
これに対してPERCENT_RANK()は、各レコードのランキングが全体のランキングと比べてどれだけ前進または後退しているかを示す。
まとめ
SQLの分析機能においてCUME_DIST()は重要な役割を果たしており、データ解析や統計学的な処理を行う際には必ず活用されるべき関数である。
※本記事はIT用語辞典の手書きドラフトです。公開前に最新情報・出典を確認のうえ加筆修正してください。

コメント