Title:
DevOps & Observability Platform Engineer (L2 Support) - Telecom BSS
Responsibilities:
- Ensure operational excellence for internal
DevOps and Observability platforms
through proactive monitoring, alert handling, and initial troubleshooting. - Conduct
complex troubleshooting
and develop
automation solutions
to enhance platform efficiency and resilience. - Actively manage application environments and ensure service continuity by following established
runbooks and escalation processes
. - Collaborate with L3 and development teams
on incident resolution, system improvements, and platform stability. - Participate in
on-call rotations
, lead service restoration, and contribute to
Root Cause Analysis (RCA)
and post-incident reviews. - Support
regular maintenance, deployments, and security patching
across production and pre-production environments. - Create and maintain
documentation, dashboards, and knowledge base articles
for operational readiness.
Requirements:
- 4-7 years
of experience in an
L2 or equivalent technical support role
, ideally within the
telecommunications sector (not mandatory). - Hands-on experience with
Docker, Kubernetes (K8s), and Helm
for managing containerized applications. - Proficiency in
CI/CD pipeline tools
(Jenkins, GitLab CI/CD, Azure DevOps) and
artifact management
(Nexus, Artifactory). - Strong understanding of
monitoring (Prometheus, Grafana)
and
centralized logging (ELK Stack, Splunk)
tools. - Skilled in
scripting (Bash or Python)
for automation and operational tasks. - Familiarity with
incident management (ServiceNow, JIRA)
,
ITIL processes
, and
basic Linux/Networking
. - Understanding of
telecom BSS/OSS systems
,
customer portals
, and
order workflows
. - Knowledge of
SRE practices
,
SLO/SLI management
, and
cloud platforms
(AWS EKS, etc.). - Excellent
problem-solving, communication skills
, and a
bachelor's degree
in a technical field.
-
Greater Tokyo Area BLOOMTECH, Inc+時価総額TOP100企業の7割以上が顧客の安定基盤、ハイブリッドワーク×フレックスタイム制で柔軟な働き方を実現、新製品のインフラ基盤をゼロから育てる面白さ。 · グローバル市場で戦う大手企業のグループ経営は、M&Aや海外展開により難易度がますます高まっています。 · 単なる保守運用にとどまらず、サービス設計から開発、長期的なブラッシュアップまで多岐にわたるフェーズに携わっていただきます。 · ...
-
Tokyo PowerX, Inc.PowerXのサービスにおける高いクオリティで実現し、より迅速に・スマートにビジネスを推進させるためのシステム開発・運用を行うSRE/DevOpsチームでは、優秀なソフトウェアエンジニアを求めています。 · ...
-
Tokyo 株式会社パワーエックスSRE/DevOpsチームでは、PowerXのサービスにおける重要な基盤を高いクオリティで実現し、より迅速に・スマートにビジネスを推進させるためのシステム開発・運用を行っています · 蓄電池を利用した新しいサービスにおける高い信頼性を実現するといったチャレンジ · 優秀なSWEと働くことのできる環境 · 自らが設計・技術選択を行い進めていくことができる · ...
-
Tokyo PlayStationPlayStation向けに提供しているネットワークサービス"PlayStation Network"を設計、構築、運用するエンジニアリングチームのメンバーを募集しています。 · ...
-
Tokyo Tailor業務システムを高速に構築できるプラットフォーム「Tailor Platform」を提供することで、より多くの人がプロダクトの作り手になることを支援しています。Headless ERP for Enterprisesエンタープライズ企業で使われる基幹システムをHeadless形式で提供するプロダクトです。 · Deployやサーバー構築の自動化やそのためのツール類の開発 · アプリケーションやミドルウエア、クラウドサービスの監視、パフォーマンスチューニング · ...
-
Tokyo TIER IVJob summary/ · /き/ · /き/ · , Autoware-equipped self-driving vehicles around the world to ensure safety and reliability. ...
-
Tokyo TailorERP · AWS、GCP · Terraform · ...
-
Tokyo PlayStation ¥3,600,000 - ¥12,000,000 per yearPlayStationNetworkの企画・設計・開発・運用を担っているエンジニアリング部門です。PlayStationのライフサイクルを構成する、クライアントソフトウェアからゲームコンテンツ配信・販売機能、オンラインゲーム機能、ソーシャルコミュニティ機能等のプラットフォームサービスまで、幅広くコンシューマーやゲームデベロッパーに提供しています。 · SITE RELIABILITY ENGINEERとしてサーバーサイドアプリケーション開発チームの一員としてサービスの信頼性、性能、効率およびセキュリティーの確保を担うこと。 · ...
-
〒- 東京都 品川区 西五反田, 株式会社ロジレス私たちは「ECロジスティクスを変革し、日本の未来をスケールする」というミッションのもと、約15兆円規模・成長率3.7%のEC市場に挑んでいます。人手不足や物流コスト増といった深刻な社会課題を解決し、エッチ事業者と倉庫事業者双方の生産性向上を実現することを目指しています。 · AWSを使うインフラ基盤を作って運用します. · モニタリングやログ分析などでシステムがどう動いているか確認します. · パフォーマンス最適化やボトルネック解消も担当します. · ...
-
東京都 中央区 日本橋本町, Thinkings株式会社 Remote job¥4,200,000 per year+Job summary · インフラ構築・運用の自動化や効率化、障害予防や影響を最小化するための監視やオブザーバビリティ基盤の構築と改善 · +Sonar ATSをはじめとする複数プロダクトの基盤となるインフラやCI/CD基盤の設計・構築・運用 · 各プロダクトのパフォーマンスやスケーラビリティの向上 · +SREもしくはインフラエンジニアとしての経験 3年以上 · + ...
-
東京都 千代田区 丸の内, 株式会社ユーザベース+自社プロダクト「Speeda」を支えるハイブリッドクラウドの構築・運用を行ったり、パフォーマンスや信頼性、スケーラビリティを高めるエンジニアを募集しています。 · +オンプレミス、GCP、AWSを利用したハイブリッドクラウドの構築 · 開発チームと共にマイクロサービスの開発、運用 · Toil削減 · Docker,Kubernetes,Istioの運用 · ...
-
東京都 港区 東新橋, 株式会社UPSTART Remote job¥10,000,000 - ¥18,000,000 per yearクラウドインフラ・データ分析基盤に深い知見を持つプロダクトマネージャーおよび、dotData 製品開発チームのリーダー陣と協力しながら、製品やサービスに求められる可用性、信頼性、セキュリティなど要件および仕様を明確にしながら、システムアーキテクチャを漸進的に進化させたり、最新のテクノロジーをフル活用して運用の自動化・効率化をしたり、継続的な運用改善を行い、安定した品質で多くのお客様に利用されるサービスを継続的にリリースする役割です。また、中長期にはエンジニアリングマネージャーとして組織面でチームをリードしていく役割やスタッフエンジニアとして技術面でのチー ...
-
東京都 中央区 銀座一丁目駅, 株式会社テックドクター Remote job+ · た, , . · + · . · . · ...
-
Tokyo TIER IV ¥5,800,000 - ¥16,500,000インター ヲUUV · ! · ...
-
Greater Tokyo Area BLOOMTECH, Inc ¥1,000,000 - ¥12,000,000 per yearハイブリット×フレックス勤務、業績好調の不動産テック企業、お客様からの信頼性向上を図るための貴重なポジションです。 · ■年収範囲: 年収:6,000,000~12,000,000円 · ...
-
Tokyo Tailor構築できるプラットフォーム「Tailor Platform」を提供することで、より多くの人がプロダクトの作り手になることを支援しています。エンタープライズ企業(当社では3,000人以上の大企業と定義しています)で使われる基幹システムをHeadless形式で提供するプロダクトです。 · フロントエンド・TailorPF上に構築されたバックエンドアプリケーションのCI/CD環境の構築 · 各種オペレーションを自動化するためのツールの開発、運用 · ...
-
神奈川県 横浜市 港北区 新横浜, NE株式会社 ¥6,000,000 - ¥8,000,000 per year· NEについて NE株式会社は、EC市場において業界トップシェアを誇る EC一元管理SaaS「ネクストエンジン」を運営しているソフトウェア企業です。現在6,500社を超える多くのEC事業者の成長を支援しており 2025年11月に東証グロース市場に上場いたしました。 ネクストエンジンは ...
-
東京都 品川区 西五反田, 株式会社エライク Remote job+ · 仕事内容 海外 e SIM アプリ「トリファ (trifa)」において、インフラ・信頼性・可用性を支える SRE 領域を担当していただきます。 SRE チーム立ち上げフェーズのため、運用改善・自動化・基盤整備を実務面から推進していただきます。 主な業務内容 ・ GCP / AWS を用いたインフラ設計・運用 ・ CI / CD パイプラインの改善・運用 ・ モニタリング・ロギング基盤の整備 · + · クラウド インフラ 運用経験 (3 年以上) IaC の実務経験 CI / CD と障害対応経験 可用性とセキュリティ意識した設計経験 · + ...
-
Tokyo OLTA株式会社 ¥7,500,000 - ¥12,000,000インフラ設計開発運用、サービスダウンタイム最小化、システムパフォーマンススケーラビリティー向上、顧客データ守りセキュリティ品質の向上IaCプロビジョニングモニタリング自動化効率化CI/CD環境開発者体験 · ...
-
東京都 港区 虎ノ門, 株式会社TERASS ¥2,000,000 - ¥2,800,000 per yearTERASS(今国) に:" · : · TERRA.. · SITE RELIABILITY ENGINEER) · :SRE( · ...
-
Tokyo LY Corporation「LINE」において、Messaging PlatformやDeveloper Product Platformの社内外の顧客が抱える課題を深いドメイン知識と技術力を持って、カスタマーサポート(CS)チーム、開発チームと連携しながら、問題解決と支援ツールの開発をお任せします。所定のサービスレベル指標(SLI)・サービスレベル目標(SLO)に基づいてプラットフォームの品質モニタリングと顧客に対してSLA管理を行います。 · 日常的に発生するCS運用業務の技術的な支援調査や問題解決対応情報開示請求依頼に対するデータ抽出情報開示請求のツール開発 · ...