2026年 21月 4月日 - By Fabian Thorns
アプリケーション、コンテナ、仮想マシンは稼働中、さまざまなイベントに関する情報を継続的に生成しています。これらのイベントには、重大なエラーから、サーバーがリクエストに正常に応答したという単純な通知まで、あらゆるものが含まれます。マルチティア構成や動的なマイクロサービス環境では、このログデータを収集・分析することが大きな課題となります。DevOps Tools Engineer試験では、704.3の試験目標としてログ管理と分析が扱われています。
ログは、現代のコンピューティングシステムにおける基盤的な機能であり、システムの動作監視、障害や攻撃の診断、アクティビティ監査、コンプライアンス確保を実現する主要な仕組みです。ログとは本質的に、アプリケーション、オペレーティングシステム、インフラコンポーネントによって生成されるイベントを構造化して記録したものです。これらの記録は一般的に「ログ」と呼ばれ、「何が起きたのか」「いつ起きたのか」、そして多くの場合「なぜ起きたのか」といったコンテキスト情報を含みます。
アプリケーションログは、ソフトウェアシステム内部のロジックで生成されるイベントに焦点を当てています。これには、ユーザー操作、エラー、状態遷移、API呼び出し、パフォーマンスメトリクスなどが含まれます。ログは通常、log4j、logback、あるいは言語標準のフレームワークなど、アプリケーションコードに統合されたロギングライブラリを通じて出力されます。各ログエントリには一般的に、タイムスタンプ、重大度レベル(INFO、WARN、ERRORなど)、メッセージ、コンテキストメタデータといったフィールドが含まれます。
一方、システムログは、オペレーティングシステムやそのコンポーネントによって生成されるイベントを記録します。これには、カーネルメッセージ、サービスのライフサイクルイベント、認証試行、ハードウェア関連の通知などが含まれます。システムログは、ホスト環境の状態や挙動を把握するために不可欠であり、通常はシステムレベルのログサービスによって管理されます。
ログワークフローとライフサイクル
ログエントリのライフサイクルは、大きく4つの段階に分けられるパイプラインに沿って進行します。具体的には、「生成」「収集」「処理」「可視化」です。
生成フェーズでは、アプリケーションやシステムコンポーネントがログを出力します。これらのログは、ファイル、標準出力(stdout)、またはシステムログソケットに書き込まれる場合があります。
収集フェーズでは、FilebeatやFluent Bitなどのログエージェントやフォワーダーがログソースを監視し、データを集中管理システムへ転送します。これらのエージェントは軽量であり、分散環境でも効率的に動作するよう設計されています。
処理フェーズでは、ログデータの解析、フィルタリング、変換、エンリッチメント(付加情報の追加)が行われます。LogstashやFluentdなどのツールはパイプラインを適用し、ログフォーマットを正規化し、フィールドを抽出し、インデックス化に適した形へ整形します。
最後に、ログはElasticsearchやOpenSearchのようなシステムに保存・インデックス化され、高速な検索や分析が可能になります。KibanaやGrafanaといった可視化ツールは、ログデータを検索・探索するためのインターフェースを提供します。
このパイプラインにより、組織は未加工で非構造化なログエントリから、実用的なインサイトを得ることが可能になります。
LPI試験では、Logstash、Elasticsearch、Kibanaを組み合わせたElastic Stackがリファレンス実装として使用されています。これらのツールの中でも、特にLogstashは多くの設定を必要とし、この試験目標の中心的な存在となっています。
Elasticsearchは分散型の検索・分析エンジンであり、ログをインデックス化されたドキュメントとして保存し、全文検索や集約クエリを可能にします。ElasticsearchのフォークであるOpenSearchも、オープンなガバナンスモデルのもとで同様の機能を提供しています。
Logstashはデータ処理パイプラインであり、複数のソースからログを取り込み、フィルタを適用し、イベント情報をストレージへ出力します。解析や変換を行うための幅広いプラグインをサポートしています。
幸いにも、Logstashのドキュメントは非常に充実しています。まずは「Logstash Introduction」と「Getting Started with Logstash」から学習を始めるとよいでしょう。「How Logstash Works」では、Logstashパイプラインの主要要素がまとめられています。
これらの知識を身につけたら、最初のElastic Stack環境を構築してみましょう。stack-dockerでは、Elastic Stackの各コンポーネントをはじめ、多数のサービスをセットアップできるDocker Composeファイルが提供されています。このファイルを使うことで、Dockerの理解を深めつつ、Logstash、Elasticsearch、Kibana、さらに後ほど登場するFilebeatも構築できます。あるいは、Sébastien Pujadasによる「elk-docker」ガイドを利用してElastic Stack Docker環境を構築する方法もあります。
環境が整ったら、「Configure Logstash」ガイドを詳しく確認してください。各サブチャプターには、試験目標に関連する重要な内容が含まれています。
Filebeatは、変換よりもログ転送に重点を置いた、シンプルかつ効率的なツールです。ログファイルを1行ずつ読み込み、最小限のオーバーヘッドで転送します。
Filebeatのドキュメントでは、概要説明と推奨されるスタートガイドが提供されています。また、Logstashのドキュメントでは、Filebeatに対応する「Beats input plugin」について説明されています。
別のアーキテクチャとして、Fluentdエコシステムをベースにした構成もあります。Fluentdは統合ログ基盤として機能し、ログの収集、処理、転送を行えます。構造化ログをサポートしており、多数のバックエンドと連携できます。
Fluent BitはFluentdの軽量版であり、エッジ環境やコンテナ化されたワークロード向けに最適化されています。Kubernetesクラスターでコンテナログを収集する用途で広く利用されています。
近年ますます人気を高めているスタックとして、Grafana Labsが開発したLokiがあります。Elasticsearchとは異なり、Lokiはログ本文全体ではなくメタデータ(ラベル)のみをインデックス化する設計になっており、ストレージおよびインデックスコストを大幅に削減できます。
PromtailはLokiと組み合わせて使用されるログ収集エージェントです。ファイルやコンテナからログを収集し、ラベルを付与してからLokiへ送信します。
LPIでは、syslogを使用してLogstashへログデータを転送する方法についても理解が求められます。syslogに不慣れな場合は、Aaron Leskiwによるsyslog入門がよい出発点になります。また、syslog.conf(5)のmanページも確認しておくとよいでしょう。Logstashをsyslogサーバーとして動作させるには、「Syslog input」を設定する必要があります。
BeatsやSyslogのinputプラグインに加えて、Logstashの機能は多数のinput、output、filterプラグインによって拡張可能です。DevOps Tools Engineer試験で扱われる技術に関連するモジュールについて理解を深めるため、これらの一覧を確認してみてください。
Elasticsearchはログデータの保存を担います。一見すると地味に思えるかもしれませんが、ログ分析を効果的に行うためには、Elasticsearch内でインデックスやデータ保持ポリシーを適切に設定する必要があります。Elasticsearchドキュメントの「Getting Started」ガイドでは、Elasticsearchそのものの概要を学べます。その後、インデックス管理やデータ保持についてさらに理解を深めましょう。
データがElasticsearchに保存されると、Kibanaによって、記録された情報へグラフィカルにアクセスし、集約・分析・探索できるようになります。Kibanaのドキュメントでは、データのインタラクティブな探索方法、可視化ツールの利用方法、ダッシュボード作成方法などが解説されています。
Kibanaは、ElasticsearchやOpenSearchに保存されたログを探索するための高機能なインターフェースを提供します。ダッシュボード、可視化機能、KQLなどのクエリ言語をサポートしています。
Grafanaは、Loki、Elasticsearch、Prometheusのような時系列データベースなど、複数のデータソースをサポートする柔軟な可視化プラットフォームです。ログ、メトリクス、トレースを統合したダッシュボードを作成できます。
Graylog2(一般的にはGraylogと呼ばれる)は、収集、処理、可視化を統合した別の集中ログ管理プラットフォームです。バックエンドとしてElasticsearchやOpenSearchを利用し、アラート機能やストリームベースのルーティング機能を備えた、扱いやすいインターフェースを提供します。
アプリケーションログやシステムログの仕組み、そして現代のログ管理スタックのアーキテクチャを理解することは、信頼性と可観測性を備えたシステム運用に不可欠です。従来のsyslogデーモンから、Elastic Stack、Fluentd、Lokiのような高度な分散プラットフォームまで、ログ管理は現代インフラにおける重要な柱へと進化しています。
次回は、LPI DevOps Tools v2.0 Engineer試験の最後の試験目標として、トレーシングとOpenTelemetryについて解説します。
ここまで本当によく学習を進めてきました。これからも構築し、実験し、スキルを磨き続けてください。そして、LPIが提供する無料の公式Learning Materialsを活用することで、さらに学習を深められることも忘れないでください。
<< このシリーズの前の記事を読む | このシリーズの次の記事を読む >>