Position Overview
This role plays a crucial part in ensuring the reliability, availability, performance, and scalability of our infrastructure and services. You will work closely with the development team to balance system stability and rapid release cycles.
We have established a global development system and are accelerating collaboration with engineers across our offices. In this environment, the bilingual (Japanese and English) SRE will play a vital role as a bridge between teams.
Key Responsibilities
- Design, build, and operate cloud infrastructure
- Plan and drive cost optimization and efficiency of cloud resources
- Improve operational efficiency by developing and implementing automation tools
- Set and measure Service Level Objectives (SLOs) and Service Level Indicators (SLIs)
- Monitor systems, set up alerts, and carry out incident response and improvements
- Handle incidents and perform post-mortem analysis
- Perform capacity planning and performance tuning
- Build and improve CI/CD pipelines
- Manage development tools' identity and access control
Team Structure
You will be assigned to the SRE/Infrastructure team under the Innovation & Engineering Division. The team currently has 8 members and is involved in SRE/Infrastructure tasks for several products, mainly centered around "CloudPlatform."
Career Growth
You will start by managing the SRE area for a single product or leading the SRE area. Depending on your goals, you can either aim to specialize as an SRE expert or move into a management role within the SRE team.
Given that the organization is rapidly expanding, there are many opportunities for career advancement into management roles.
Required Skills
- Experience designing and operating cloud infrastructure (AWS/Google Cloud/Azure, etc.)
- Practical experience in Linux/Unix system administration
- Experience with Infrastructure as Code (Terraform, Ansible, etc.)
- Hands-on experience with container technologies (Docker, Kubernetes)
- Experience in building and operating monitoring services
- Experience in building and operating CI/CD pipelines
- Basic knowledge of networking
- Business-level Japanese and English communication skills (This role involves acting as a bridge for a globally distributed hybrid team, requiring strong English proficiency and communication skills.)
Preferred Skills
- Experience in operating microservices architecture
- Experience analyzing cloud resource usage and implementing cost optimization
- Programming skills (Python, TypeScript, Shell scripts, etc.)
- Experience in database management
- Knowledge of security best practices
Ideal Candidate
- Able to understand objectives and work proactively while thinking independently
- Excellent communication skills and collaborative mindset
- Able to propose and implement automation or improvements to enhance team productivity
- Eager to learn and continually improve technical skills and knowledge
- Able to understand complex systems
- Strong documentation skills
Salary
Salary will be determined based on your previous work experience and skills.
Location
Tokyo or Osaka. Flexible working conditions (remote or in-office depending on the nature of the work). (Average office attendance: about 2 days per month)
-
Tokyo TG Japan Inc.. ¥6,000,000 - ¥12,000,000 per year「欧州系大手コンサルティングファーム」にて、SRE (Site Reliability Engineer) を募集しています。 · ...
-
Tokyo TG Japan Inc.. ¥15,000,000 - ¥20,000,000 per year· ! · 対象システムの自動化・運用管理・信頼性向上を支援するためのツールを設計・構築する · 対象システム向けのリリースパイプラインの構築および運用支援 · 開発/デリバリーチームの一員として、SREのプラクティスをソリューション設計に組み込む · 設計実装から停止廃止(デコミッショニング)に至るまでのシステムライフサイクル全体を管理する · ...
-
Tokyo BLOOMTECH, Inc ¥5,500,000 - ¥7,500,000 per year急拡大中の自社サービスを牽引するSRE(Site Reliability Engineering)ポジションを任せます。具体的には「どのようにしたらサービスをより多くの方に、より便利に使ってもらえるか」というユーザー視点に立ち、仮説・実行・検証のサイクルを回しながら、サービスの信頼性を高めて頂きます。 · SLA/SLO/SLIの設定・監視、モニタリング環境の改善 · OS、ミドルウェアなどの継続的アップデート · 障害対応およびボトルネック調査・対応 · AWSなど複数クラウドを使用したシステム環境の運用安定化 · アーキテクチャ改善(マイクロサービス ...
-
Tokyo CLPS Global ¥7,680,000 - ¥11,520,000 per yearシステム開発・運用プロジェクトにおいて、DevOps環境の構築・運用を担当いただきます。日本側クライアントとの技術調整・ドキュメント作成を行います。 · ...
-
〒- 東京都 品川区 西五反田, 株式会社ロジレス私たちは「ECロジスティクスを変革し、日本の未来をスケールする」というミッションのもと、約15兆円規模・成長率3.7%のEC市場に挑んでいます。人手不足や物流コスト増といった深刻な社会課題を解決し、エッチ事業者と倉庫事業者双方の生産性向上を実現することを目指しています。 · AWSを使うインフラ基盤を作って運用します. · モニタリングやログ分析などでシステムがどう動いているか確認します. · パフォーマンス最適化やボトルネック解消も担当します. · ...
-
Tokyo TIER IVJob summary/ · /き/ · /き/ · , Autoware-equipped self-driving vehicles around the world to ensure safety and reliability. ...
-
Tokyo Tailor ¥500,000 - ¥1,000,000 per year+プロダクトづくりの難しい部分を簡単にし、誰もがプロダクトの作り手になれる。これがテイラーが実現したい世界です。誰しもが自分のアイディアを簡単に具現化でき、ビジネスとエンジニアリングの境界を取り払い、多様な専門知識と技術を統合できる世界を目指しています。 · + · +Tailor Platformは業務システムを作るプラットフォームで、今までものごとの仕事をする人たちにとってもっと便利にすることを目標にしています。+ · ...
-
Tokyo PlayStation ¥3,600,000 - ¥12,000,000 per yearPlayStationNetworkの企画・設計・開発・運用を担っているエンジニアリング部門です。PlayStationのライフサイクルを構成する、クライアントソフトウェアからゲームコンテンツ配信・販売機能、オンラインゲーム機能、ソーシャルコミュニティ機能等のプラットフォームサービスまで、幅広くコンシューマーやゲームデベロッパーに提供しています。 · SITE RELIABILITY ENGINEERとしてサーバーサイドアプリケーション開発チームの一員としてサービスの信頼性、性能、効率およびセキュリティーの確保を担うこと。 · ...
-
Greater Tokyo Area BLOOMTECH, Inc ¥1,000,000 - ¥12,000,000 per yearハイブリット×フレックス勤務、業績好調の不動産テック企業、お客様からの信頼性向上を図るための貴重なポジションです。 · ■年収範囲: 年収:6,000,000~12,000,000円 · ...
-
Tokyo Tailorプロダクトづくりの難しい部分を簡単にすることで誰もがプロダクトの作り手になれる世界を作ることが目標です。 · Tailor Platformは、企業活動を革新するためのビジネスアプリケーション基盤を構築しています。 · Deployやサーバー構築の自動化やそのためのツール類の開発 · ...
-
Tokyo BLOOMTECH, Inc ¥8,000,000 - ¥18,000,000 per yearデカコーン(企業価値100億ドル以上のスタートアップ)を目指す当社ですが、この目標を実現するためには「グローバル×ディープテックで勝つ必要がある」とよく言われます。 · そのような中で、「日本発」の「グローバル×ディープテック」として、「デファクトとなるインフラ」を先陣をきってつくるべく、現在、開発チームの人員を中心に採用を急拡大しております。 · ...
-
東京都 中央区 銀座一丁目駅, 株式会社テックドクター Remote job+ · た, , . · + · . · . · ...
-
Tokyo W3Global ¥6,000,000 - ¥12,000,000 per year+This role plays a crucial part in ensuring the reliability, availability, · performance and scalability of our infrastructure and services. · +Design build and operate cloud infrastructure · ...
-
東京都 港区 虎ノ門, 株式会社TERASS ¥2,000,000 - ¥2,800,000 per yearTERASS(今国) に:" · : · TERRA.. · SITE RELIABILITY ENGINEER) · :SRE( · ...
-
Tokyo OLTA株式会社 ¥7,500,000 - ¥12,000,000インフラ設計開発運用、サービスダウンタイム最小化、システムパフォーマンススケーラビリティー向上、顧客データ守りセキュリティ品質の向上IaCプロビジョニングモニタリング自動化効率化CI/CD環境開発者体験 · ...
-
Tokyo LY Corporation ¥7,000,000 - ¥12,000,000 per yearポジション概要 · 「LINEギフト」を中心としたECサービスを支えるCREとして業務を行っていただきます。 · CREとは、エンジニアリングを通じてユーザーの信頼性を担保することを目的としてさまざまな開発業務を行うエンジニアです。これまでに延べ3,500万人以上のユーザーにご利用いただいている「LINEギフト」において、CREは非常に重要な役割を担っています。 · CREチームでは、テクニカルサポートとしてユーザーの問い合わせに回答するだけでなく、ユーザーの抱える課題に対して、技術的な視点からユーザーにとって使いやすいシステムとは何かを考えながら、継続 ...
-
神奈川県 横浜市 港北区 新横浜, NE株式会社 ¥6,000,000 - ¥8,000,000 per year· NEについて NE株式会社は、EC市場において業界トップシェアを誇る EC一元管理SaaS「ネクストエンジン」を運営しているソフトウェア企業です。現在6,500社を超える多くのEC事業者の成長を支援しており 2025年11月に東証グロース市場に上場いたしました。 ネクストエンジンは ...
-
Tokyo LINEヤフー株式会社 ¥7,000,000 - ¥10,000,000ポジション概要 · 「LINE」において、Messaging PlatformやDeveloper Product Platformの社内外の顧客が抱える課題を深いドメイン知識と技術力を持って、カスタマーサポート(CS)チーム、開発チームと連携しながら、問題解決と支援ツールの開発をお任せします。 · ...
-
Tokyo FyndBridge Consultants & Advisors ¥50,000 - ¥150,000 per yearWe are looking for a highly skilled and passionate L2 Operations Engineer/SME to join client's growing engineering team. You are expected to ensure the reliability, scalability, performance, and efficiency of our critical production systems. · You will bridge the gap between deve ...
-
Tokyo Placeton Inc ¥4,500,000 - ¥9,000,000 per yearEnsure the availability, scalability, and performance of data platforms and services. · Design, implement, and operate reliable, large-scale data systems in collaboration with engineering teams. · Develop automation scripts and tools (Python, Bash, PowerShell, Spark, etc.) to imp ...
-
Tokyo RakutenRakuten Card is hiring for Site Reliability Engineer to maintain IT platform supporting their business and contribute to system evolution.As a member of the unit, you will be assigned several areas of responsibility based on your experience and interests including promoting infra ...