INTERVIEW

SRE

ものづくり部

荒木 大輔

DAISUKE ARAKI

IT分野のアウトソーシングサービス事業を行う企業で都市銀行のシステムオペレータとして3年従事。その後同企業内にて、ソフトウェアハウスへ出向しITエンジニアキャリアがスタート。ソフトウェアハウス、小売企業情報システム子会社で受託開発・親会社の内製システム開発を経験した後、SREとして千にジョイン。

はいチーズ!からしか購入できない、オンリーワンの写真を届ける使命

SREとしてはいチーズ!シリーズの各プロダクトのシステムを安定運用し、それらを妨げる要因を排除することで、先生やユーザーに安心してサービスを利用していただくことがミッションです。

はいチーズ!は先生方の業務インフラの一部であり、保護者ユーザー数も270万人と多いサービスですので使命感をもって取り組んでいます。はいチーズ!のECのサーバーが停止したり、システムの挙動が遅かったりするとユーザーの購入体験が悪くなり、結果として写真を購入いただけないなどユーザーが困ります。はいチーズ!で撮影した我が子の写真は他のサービスからは購入することができないので、安心して使っていただけるシステムであることは何より大事なことだと思っています。

入社後真っ先に取り組んだのは現状の見える化です。負荷対策の対応を行い、事故が起こりづらい環境づくりに専念した1年でした。

270万人のユーザーが使う写真販売システムー。負荷対策との戦い

特に「はいチーズ!フォト」では大量の写真をクラウドサーバに保存しているため、システムに負荷がかかりやすい構造です。
AWSアカウントも多数あるため、一元管理でモニタリングできるようにしました。

またSLO(Service Level Objective)とSLI(Service Level Indicator)を設定し、システム稼働が可能な時間比率を表す「可用性」や、ユーザーからのリクエストに対する「エラー率」などの指標を定めて数値を測定するようにしています。

同時にサーバーのコスト削減も事業インパクトが大きく、利益率を意識しながら運用しています。
はいチーズ!フォトのサービスでは、年度切り替えの3月〜5月にかけて写真の販売期間終了を設定している園が多く、そのタイミングは特にサーバー負荷が高くなりやすいです。負荷がかかりやすいタイミングはある程度先読みできることもあり、時期に合わせた対策を行うようにしています。

インフラのプロフェッショナルとして、垣根を超えて各ステークホルダーと協力できる組織へ

当社のValueにある「Be an owner(当事者であれ)」は私が大切にしているスタンスでもあり、プロダクト開発の当事者として自分の責任範囲に囚われすぎず、積極的に首を突っ込んでいく姿勢でありたいと思っています。

千のSREメンバーは起きていることや課題に対して真摯に向き合っている印象があるのでビジネスマンとしても尊敬できる仲間です。少しでも自分の経験・知見を還元できればと思いますし、メンバーと一緒に成長していきたいと思います。