性能改善！SQL規約とパフォーマンスチューニング

SQLパフォーマンスチューニングとは？
SQLパフォーマンスチューニングにおいて重要なポイントをご紹介
SQL NG実装例と改善策
まとめ

SQLパフォーマンスチューニングとは？

　システム開発の中で、特に下流工程で検出される性能問題は、開発者にとって大きな課題となります。その一つが、データベースの効率的な操作を阻むSQLの性能問題です。これを解決するための手法が、SQLパフォーマンスチューニングです。
SQLパフォーマンスチューニングは、データベースの効率を最大限に引き出すためのSQLの書き方やデータベースの設定方法を研究し、適用するプロセスです。これには、クエリの最適化やデータベース設計の最適化など、さまざまな手法が含まれます。
　具体的には、クエリの最適化では、インデックスの使用、結合の種類の選択、サブクエリと結合の使用、クエリの再構築などが行われます。また、データベース設計の最適化では、テーブルの正規化、データ型の選択、インデックスの設計などが行われます。
これらの手法を適切に適用することで、データベースのパフォーマンスを向上させ、システム全体の効率を高めることが可能となります。SQLパフォーマンスチューニングは、システムの性能を最大限に引き出すための重要なスキルであり、開発者にとって必須の知識と言えるでしょう。

SQLパフォーマンスチューニングにおいて重要なポイントをご紹介

インデックスの最適化

インデックスはSQLクエリのパフォーマンスを向上させる重要な要素です。不要なインデックスを削除することで、テーブル内のデータ更新クエリのパフォーマンスが向上します。

クエリの書き直し

クエリー・リライトを使用すると、SQLを自動的に書き換えてくれます。これにより、パフォーマンスが向上する可能性があります。

ジョインの順序

SQLのJOIN句の使い方を学び、効率的なクエリを書くための基本的な使い方から応用法までを理解することが重要です。

サブクエリの最適化

サブクエリは便利ですが、大量のデータを処理する場合や相関サブクエリを使用する場合は、パフォーマンスが低下する可能性があります。そのため、サブクエリの性能と最適化に注意が必要です。

データ型の使用

データ型は、データベースのパフォーマンスに影響を与えるため、適切なデータ型の選択が重要です。

並列処理の活用

クエリの実行を並列化して、処理速度を向上させます。

パーティショニング

パーティション化は、データの格納場所を分割することで、検索や更新のパフォーマンスを改善する方法です。

統計情報の更新

統計情報は、RDBMSがクエリの実行計画をどのように作成するかを決定するのに役立ちます。手動で更新する方法と自動で更新する設定があります。

キャッシュの利用

キャッシュを利用することで、SQL文を実行した際に検索したテーブルのレコードをバッファに一時的に記録し、次回実行時にバッファに保存したレコードを参照することで、探索時間を短縮し、パフォーマンスを向上させることができます。

ハードウェアの最適化

SQL処理におけるハードウェアリソースの効果的な利用には、CPU、メモリ、ディスクの最適化が含まれます。例えば、高速なSSDの使用やRAID構成の考慮が挙げられます。

本記事ではSQLの実装にフォーカスを当ててNG実装例と改善策をご紹介していきます。

SQL NG実装例と改善策

全行スキャンの使用

悪い実装例

SELECT * FROM employees;

良い実装例

SELECT * FROM employees WHERE department_id = 10;

解説

WHERE句を使用して必要な行だけを取得することで、全行スキャンのオーバーヘッドを避けることができます。

不要なデータの読み込み

悪い実装例

SELECT *
FROM customers
WHERE country = '日本';

良い実装例

SELECT id, name, country
FROM customers
WHERE country = '日本';

解説

SELECT * は全ての列を取得するため、必要のないデータも読み込み、処理速度が低下します。SELECT 句で必要な列のみを指定することで、データ読み込み量を減らし、処理速度を向上させます。

データ型

悪い実装例

SELECT *
FROM customers
WHERE age = '30';

良い実装例

SELECT *
FROM customers
WHERE age = 30;

解説

age 列は数値型であるにもかかわらず、文字列で比較しているため、暗黙的なデータ型変換が発生し、処理速度が低下します。age 列のデータ型に合致する数値型で比較することで、暗黙的なデータ型変換を回避し、処理速度を向上させます。

インデックスの活用

悪い実装例

SELECT id, name, city
FROM customers
WHERE city = '東京';

良い実装例

SELECT id, name, city
FROM customers
WHERE city = '東京'
INDEX (city);

解説

インデックスが使用されていないため、WHERE city = '東京' の条件検索に時間がかかります。WHERE 句の前に INDEX (city) を指定することで、インデックスを活用し、条件検索を高速化します。

インデックスの不適切な使用

悪い実装例

SELECT * FROM employees WHERE LOWER(last_name) = 'smith';

良い実装例

SELECT * FROM employees WHERE last_name = 'SMITH';

解説

関数を使用すると、インデックスが使用されない可能性があります。可能な限り、インデックス列をそのまま使用してください。

ORDER BY 句

悪い実装例

SELECT *
FROM customers
ORDER BY name;

良い実装例

SELECT *
FROM customers
ORDER BY name
INDEX (name);

解説

ORDER BY 句でソートする列にインデックスが使用されていないため、ソート処理に時間がかかります。ORDER BY 句でソートする列にインデックスを指定することで、ソート処理を高速化します。

サブクエリ

悪い実装例

SELECT *
FROM customers
WHERE id IN (
  SELECT customer_id
  FROM orders
  WHERE order_date > '2023-01-01'
);

良い実装例

SELECT customers.id, customers.name, orders.order_id, orders.order_date
FROM customers
INNER JOIN orders
ON customers.id = orders.customer_id
WHERE orders.order_date > '2023-01-01';

解説

サブクエリを使用しているため、処理が複雑になり、処理速度が低下します。サブクエリを結合処理に置き換えることで、処理をシンプル化し、処理速度を向上させます。

サブクエリの過度な使用

悪い実装例

SELECT *
FROM employees
WHERE department_id
IN (SELECT department_id FROM departments WHERE location_id = 1000);

良い実装例

SELECT *
FROM employees
JOIN departments
ON employees.department_id = departments.department_id
WHERE departments.location_id = 1000;

解説

サブクエリはパフォーマンスを低下させる可能性があります。可能な限りJOINを使用してください。

不要なループ処理

悪い実装例

DECLARE @count INT
SET @count = 0

WHILE @count < 100
BEGIN
  SELECT *
  FROM customers
  WHERE id = @count;

  SET @count = @count + 1
END

良い実装例

SELECT *
FROM customers
WHERE id IN (1, 2, 3, ..., 100);

解説

SQL文の中でループ処理を実行しているため、処理速度が低下します。IN 演算子を使用することで、ループ処理を回避し、処理速度を向上させます。

カーソル

悪い実装例

DECLARE cur CURSOR FOR
SELECT *
FROM customers;

OPEN cur;

FETCH NEXT FROM cur INTO @id, @name;

WHILE @@FETCH_STATUS = 0
BEGIN
  -- 処理
  FETCH NEXT FROM cur INTO @id, @name;
END

CLOSE cur;

良い実装例

SELECT *
FROM customers;

解説

カーソルを使用しているため、処理速度が低下します。カーソルを使用せずに、必要なデータを取得することで、処理速度を向上させます。

大量のデータの一括挿入

悪い実装例

INSERT INTO employees VALUES (1, 'John', 'Doe', ...);
INSERT INTO employees VALUES (2, 'Jane', 'Doe', ...);
...

良い実装例

INSERT INTO employees VALUES
(1, 'John', 'Doe', ...),
(2, 'Jane', 'Doe', ...),
...

解説

大量のデータを一括で挿入するときは、一度に複数の行を挿入することでパフォーマンスを向上させることができます。

JOINの不適切な使用

悪い実装例

SELECT * FROM employees JOIN departments ON employees.department_id = departments.department_id;

良い実装例

SELECT * FROM employees, departments;

解説

必要ないテーブルをJOINすると、パフォーマンスが低下します。必要なテーブルだけをJOINしてください。

複雑なJOIN

悪い実装例

SELECT customers.id, customers.name, orders.order_id, orders.product_id, products.name
FROM customers
INNER JOIN orders
ON customers.id = orders.customer_id
INNER JOIN products
ON orders.product_id = products.id;

良い実装例

SELECT customers.id, customers.name, orders.order_id, orders.product_id, products.name
FROM customers
INNER JOIN orders
ON customers.id = orders.customer_id
INNER JOIN products
ON orders.product_id = products.id
WHERE orders.order_date > '2023-01-01';

解説

複雑なJOINは処理速度を低下させます。WHERE 句でJOIN後のデータの絞り込み条件を指定することで、不必要なデータ処理を回避し、処理速度を向上させます。

LIKE 演算子の使い方

悪い実装例

SELECT *
FROM customers
WHERE name LIKE '%山田%';

良い実装例

SELECT *
FROM customers
WHERE name LIKE '山田%';

解説

文字列の前後に%（ワイルドカード）が使用されているため、悪い実装例は山田が含まれる全ての文字列にマッチします。そのため、悪い実装例は、良い実装例のクエリよりも多くの行を返す可能性が高いです。良い実装例は%が末尾にのみ使用されているため、山田で終わる文字列のみ抽出するため、パフォーマンスは良くなります。システムの要件次第ですが、一致条件を見直せる可能性がある場合はご検討ください。

BETWEEN 演算子の使い方

悪い実装例

SELECT *
FROM customers
WHERE age BETWEEN 20 AND 30;

良い実装例

SELECT *
FROM customers
WHERE age >= 20 AND age <= 30;

解説

BETWEEN 演算子または >= および <= 演算子を使用して年齢を比較しています。ただし良い実装例のクエリの方が、インデックスを活用できる可能性が高いため、わずかに効率的である可能性があります。インデックスは、データの検索速度を向上させるために使用されます。 BETWEEN 演算子はインデックスを活用できない場合がありますが、>= および <= 演算子はインデックスを活用できます。

CASE 式

悪い実装例

SELECT *
FROM customers
WHERE country = '日本'
CASE
  WHEN gender = '男性' THEN '男'
  WHEN gender = '女性' THEN '女'
END AS 性別;

良い実装例

SELECT *
FROM customers
WHERE country = '日本'
CASE gender
  WHEN '男性' THEN '男'
  WHEN '女性' THEN '女'
END AS 性別;

解説

2つとも、CASE 式を使用して性別を文字列に変換していますが良い実装例のクエリの方が、CASE 式の構文が簡潔であるため、わずかに効率的である可能性があります。

まとめ

　本記事で紹介した例は一部に過ぎませんが、これらはSQLのパフォーマンスを向上させるための一般的なガイドラインとなります。また、パフォーマンスチューニングは一度行ったら終わり、というものではありません。データベースの使用状況やデータ量が変わると、最適なパフォーマンスチューニングの手法も変わる可能性があります。そのため、定期的な見直しと調整が必要となります。
以上のことを踏まえ、SQLパフォーマンスチューニングを効果的に行うためには、一般的なガイドラインを理解するだけでなく、自身のデータベース環境を深く理解し、適切な手法を選択・適用する能力が求められます。