データベースのインデックスの基本と種類とOracleやSQL Serverでの特長について

投稿日：2019年7月28日更新日：2020年11月1日

(０)目次＆概説

(１) データベースのインデックスとは
 (２) インデックスはどのような場面で使う？
(３) インデックスの主要な方式
　 (３-１) B木
　 (３-２) B+木
　 (３-３) ビットマップ
 (４) 各DB製品毎のインデックス概要
　 (４-１) Oracleの場合
　 (４-２) SQLServerの場合

(１) データベースのインデックスとは

データベースの性能を向上させる技術です。「検索対象項目」と「レコード格納位置ポインタ」の情報を用いて、位置を特定して直接アクセスを行う事で検索速度を向上させます。インデックスが設定されていない場合はテーブルのフルスキャンする（最初から最後まで１件ずつ見る）ため、時間が掛かってしまいます。ただし、インデックスを設定すると検索対象の表の更新速度が下がるというデメリットもあるので、最適な使い方を見極める必要があります。

＞目次にもどる

(２) インデックスはどのような場面で使う？

インデックスは以下のようなケースで使用します。

①検索対象表の行数が多い場合　
⇒行数が少ないと、テーブルのスキャン時間よりもインデックスの検索の方が時間が掛かるため

②検索対象表の更新(UPDATE)が少ない場合
③検索対象表の追加(INSERT)や削除(DELETE)が少ない場合
⇒INSERT、UPDATE、DELETEを行うとインデックスの調整が必要となるため、大量の更新が発生するテーブルに多数のインデックスを設けると更新処理の性能に影響してしまいます。

＞目次にもどる

(３) インデックスの主要な方式

(３-１) B木

ツリー状の構造をしており、中央値を根（root）にしつつ、その「子」ノードで左側がrootより小さい値、右側がrootよりも大きい値のキー値とデータを保持します。

同様の規則で更に分解した、リーフノードがあります。データの保持は分岐点（子）と、先端（リーフノード）にて保持しています。
強みとして、子ノードにもデータを持てるため、アクセス頻度が高いノードをより根（root）の近くに置く事で速度向上が見込めます。

＞目次にもどる

(３-２) B+木

B木と似ているが、違いとしては以下の通り。
(1) 子ノードではキー値のみを保持して、データはリーフノード（端）にまとめて保持しています。
(2) リーフノードのデータ同士がポインタで接続されているため、範囲での検索スピードが向上する

強みとしては、リーフノードが全てポインタで接続されているため、フルスキャン時に１つの直線的な経路で全てのデータにアクセスできる点です(速い)。

＞目次にもどる

(３-３) ビットマップ

テーブルと対になるビットマップの情報を利用する方式です。テーブルのあるカラムAの値を並べた表（ビットマップ）を作り、レコード毎にカラムAの値の場所にフラグを立てたようなイメージです。
実データの比較をすることなく、ビットの検索のみでレコードを特定できるため、カーディナリティが低い場合は高速で、テーブルをJOINする場合もビット同士のANDやORを行うだけで抽出ができるため高速になります。

＞目次にもどる

(４) 各DB製品毎のインデックス概要

(４-１) Oracleの場合

Oracleでは「B木索引」や「ビットマップ索引」や「ファンクション索引」などがあります。「B木」に関してはSQLの組み方によってはインデックスが効かなくなる可能性があるため注意が必要です。例えば、WHERE句を「OR」で複数指定した場合です。また「B木」と「ビットマップ」の強み弱みを整理すると以下のようになります。

	カーディナリティ低	カーディナリティ高
非定型SQL	ビットマップ	–
定型SQL	–	B木

＞目次にもどる

(４-２) SQLServerの場合

SQL Serverのインデックスは大きく２種類に分類されます(クラスタ化／非クラスタ化)。代表的な種類とその特徴は以下の通りです。

クラスタ化	Clustered	テーブルに１個のみ設定可能（ソートして格納するため）で、主キー作成時に自動的に作成される。B木のリーフノードにデータを保持し、インデックスのキーでソートされた状態でディスクに格納されている。
非クラスタ化	Nonclustered	テーブルに９９９個まで設定可能で、一意キー作成時に自動的に作成される。クラスタ化インデックスと組み合わせて使用可能。結合条件で頻繁に利用される列に対して利用されます。
非クラスタ化　∟複合	Unique	複数の列の組み合わせにより作成されているインデックス。ルート～中間～リーフノードに値を保持するため、速度が低下する恐れがある。
非クラスタ化　∟付加	Filtered	上記の複合インデックスで、リーフノードでのみ値を保持したバージョン。

＞目次にもどる