Zero Touch Production という運用手法

ZTPとは何か

DevOpsなどの流行により本番環境にアクセスする機会が減り、本番環境へのアクセス機会がかなり減ってきている。

Infrastructure as Code と CI/CD による環境構築とデプロイの自動化
DataDog/Mackerel/Prometheus などの監視ツールによるログとメトリクスの中央管理
- 障害時にサーバーに乗り込んでコマンドを叩く必要がなくなってきている

個人の端末に認証情報を持つ危険性
- 漏洩してしまうと…
- 特に最近ではその端末が各家庭のネットワーク内で動いている
- 最小権限の原則
  - 権限の強さ付与される時間は基本的に最小化されるべき
Googleの内部調査では障害全体の13%が本番環境に直接アクセスして操作を行ったことに起因しているという結果が出た
- 人間は間違える

Proxyを経由した本番環境アクセスの仕組みを構築して実現しているらしい

ZTP実現イメージ

※画像は参考資料として最後にリンクを貼っているbuilding-secure-reliable-systemsから。

以下のようなコマンドを通してオペレーションを実行するイメージらしい。

$ tool-proxy-cli –proxy_address admin-proxy borg kill …

Googleが使っているという仕組みは特にOSSなどで提供されていない模様
Lyft社のClutch
- ZTPと似たモチベーションで作られている？
- CLIだけでなくGUIも提供してくれている
- https://github.com/lyft/clutch
Hashicorp社のBoundary
- ZTPというよりはZero Trust Networkのツールに近そう
- オペレーターに本番環境クレデンシャルを持たせないなど、部分的な実現はできる
- https://github.com/hashicorp/boundary