- Ensure the availability, scalability, and performance of data platforms and services.
- Design, implement, and operate reliable, large-scale data systems in collaboration with
- Develop automation scripts and tools (Python, Bash, PowerShell, Spark, etc.) to improve
- Build and maintain monitoring and alerting systems (Grafana, Kibana, Splunk, Azure
- Participate in incident management, including troubleshooting, root cause analysis, and
- Maintain up-to-date technical documentation and share knowledge across the team.
- Manage day-to-day operations of the data platform and ensure compliance with internal
- Collaborate with vendors and offshore teams to ensure service quality and timely delivery.
- Contribute to team capability building, mentoring, and process improvement.
Experience & Skills
- 5+ years of experience as a Site Reliability Engineer (SRE) or in a similar data/platform
- Strong experience in hybrid-cloud environments (On-premises + Azure).
- Proficiency in scripting and programming languages such as Python, Spark, Bash, or
- Hands-on experience with monitoring and observability tools (Grafana, Kibana, ELK Stack,
- Strong knowledge of Azure cloud services (Data Lake, Synapse, Data Factory, SQL
- Solid understanding of SQL and familiarity with NoSQL databases.
- Working knowledge of infrastructure fundamentals (Network, DNS, Firewalls, Load
- Experience with containerization and orchestration tools (Docker, Kubernetes, AKS).
- Familiarity with Infrastructure-as-Code tools such as Terraform.
- Excellent analytical, problem-solving, and communication skills.
-
Greater Tokyo Area NetEase GamesNetEase Gamesは中国を中心に独自に成長を続けている、インターネットサービス、オンラインゲームを展開するIT企業です。インフラ&オペレーションエンジニア(SRE)は、ソフトウェアエンジニアリングの手法を活用してシステムを管理し、問題を解決し、運用の自動化を実現することで、雑務を減らしサービスの可用性を向上させる役割を担います。 · NetEaseインタラクティブエンターテインメント事業の運用業務を担当 · 各ゲームのサービスアーキテクチャ、性能要件、ビジネス状況に応じて、ゲームサーバーに適した基盤環境を設計・選定 · 各種運用指標を設定・監視し ...
-
Tokyo BLOOMTECH, Inc ¥5,500,000 - ¥7,500,000 per year急拡大中の自社サービスを牽引するSRE(Site Reliability Engineering)ポジションを任せます。具体的には「どのようにしたらサービスをより多くの方に、より便利に使ってもらえるか」というユーザー視点に立ち、仮説・実行・検証のサイクルを回しながら、サービスの信頼性を高めて頂きます。 · SLA/SLO/SLIの設定・監視、モニタリング環境の改善 · OS、ミドルウェアなどの継続的アップデート · 障害対応およびボトルネック調査・対応 · AWSなど複数クラウドを使用したシステム環境の運用安定化 · アーキテクチャ改善(マイクロサービス ...
-
Tokyo CLPS Global ¥7,680,000 - ¥11,520,000 per yearシステム開発・運用プロジェクトにおいて、DevOps環境の構築・運用を担当いただきます。日本側クライアントとの技術調整・ドキュメント作成を行います。 · ...
-
Tokyo BLOOMTECH, Inc ¥8,000,000 - ¥18,000,000 per yearデカコーン(企業価値100億ドル以上のスタートアップ)を目指す当社ですが、この目標を実現するためには「グローバル×ディープテックで勝つ必要がある」とよく言われます。 · そのような中で、「日本発」の「グローバル×ディープテック」として、「デファクトとなるインフラ」を先陣をきってつくるべく、現在、開発チームの人員を中心に採用を急拡大しております。 · ...
-
Engineering Manager
24時間前
Minato Mercari, Inc. ¥1,400,000 - ¥30,000,000 per yearエンジニアリングマネージャーはプロダクト開発体制やエンジニアリング組織の構築や改善、組織課題の解決にコミットし、エンジニアがより活躍できる場をつくります。率先してリーダーシップを発揮し、メルコインの急速な立上げをドライブしていただきます。 · ...
-
Tokyo Tailor ¥8,000,000 - ¥15,000,000 per yearテイラーは、プロダクトづくりの難しい部分を簡単にし、誰もがプロダクトの作り手になれる世界を作ることを目指しています。Tailor Platformは、エンタープライズ企業向けのHeadless ERP基盤です。 · ...
-
Tokyo Placeton Inc ¥6,000,000 - ¥12,000,000 per yearEnsure the availability, scalability, and performance of data platforms and services. · Design, implement, and operate reliable, large-scale data systems in collaboration with engineering teams. · Develop automation scripts and tools (Python, Bash, PowerShell, Spark, etc.) to imp ...
-
Tokyo Tailor ¥12,000,000 - ¥30,000,000 per yearプロダクトづくりの難しい部分を簡単にし、誰もがプロダクトの作り手になれる。Tailor Platformは業務システムを高速に構築できるプラットフォームで、エンタープライズ企業で使われる基幹システムをHeadless形式で提供するプロダクトです。 · ...
-
Tokyo Relocate ¥6,000,000 - ¥12,000,000 per yearAs an SRE at PayPay, we strive towards ensuring high availability and top-level performance so that our users can have flawless and reliable service exceeding expectations. · Analyze current technologies used in the company and develop monitoring and notification tools to improve ...
-
Tokyo TEKsystems ¥4,000,000 - ¥8,000,000 per yearWe are seeking a skilled Site Reliability Engineer (SRE) to help ensure the reliability, scalability, and performance of critical systems running on Microsoft Azure. · Maintain and enhance the reliability of systems hosted on Azure. · Collaborate with DevOps, Development, Infrast ...
-
Tokyo Specialized Group ¥400,000 - ¥1,200,000 per yearA fast-growing global AI company is building new enterprise products in the legal & corporate domain. Backed by large-scale funding and operating internationally, the company develops AI-driven platforms powered by NLP, LLMs, and autonomous agent technologies. · Design and build ...
-
Tokyo Placeton Inc ¥8,000,000 - ¥15,000,000 per yearEnsure the availability, scalability, and performance of data platforms and services. · Design, implement, and operate reliable, large-scale data systems in collaboration with engineering teams. · Develop automation scripts and tools (Python, Bash, PowerShell, Spark, etc.) to imp ...
-
Japan Oracle ¥4,000,000 - ¥12,000,000 per yearAs a Site Reliability Developer/Engineer, you will be responsible for the operation of production environments, including systems and databases, supporting critical business operations for Japan's governmental sovereign cloud environment. · Development of automation and optimizat ...
-
Tokyo BLOOMTECH, Inc ¥8,000,000 - ¥18,000,000 per year日本発、デカコーンを目指すスタートアップ企業 · 上場企業のグループなので安定の経営基盤あり · フルリモート×フレックス勤務 · 事業計画に即したエンジニア採用戦略の策定 · 書類・面談を通じた候補者の見極めと、最適な選考フローの構築 · 採用課題に即した採用広報戦略の設計、エンジニア向け発信の推進 · オンボーディングによる、早期の活躍支援 · 組織課題の解決と環境整備による、エンジニアにとって最適な開発文化の醸成 · 事業部付けエンジニアリングマネージャと連携した、AI活用等の開発組織制度の設計・推進 · パブリッククラウド、アーキテクチャ、フレー ...
-
London Netskope ¥1,500,000 - ¥2,000,000 per yearThe SRE team supports the Netskope suite of services. We are a team of software engineers focused on improving availability, latency, performance, efficiency, change management, monitoring, emergency response, and capacity planning of the engineering stacks. · Partner closely wit ...
-
Tokyo ZEALS ¥600,000 - ¥1,800,000 per yearWe're looking for a small group of elite teams to build the foundation of our global expansion. Ensuring our entire system and infrastructure are both functional and thoroughly available, designing infrastructure that can scale in tandem with our growing business needs, and conti ...
-
Tokyo スキルハウス・スタッフィング・ソリューションズ株式会社 ¥4,000,000 - ¥8,000,000 per yearTake full ownership of system architecture, DevOps, and operations — from new projects to stable delivery. Collaborate globally with overseas teams while shaping the platform locally in Japan. Make a real impact by supporting a service delivering 12,000+ travel experiences worldw ...
-
Tokyo スキルハウス・スタッフィング・ソリューションズ株式会社 ¥8,000,000 - ¥10,000,000 per yearA specialist platform for overseas local tours is looking for a Site Reliability Engineer to take full ownership of system architecture, DevOps, and operations — from new projects to stable delivery. The company is driving innovation in the travel industry through technology and ...
-
Tokyo SMALL WORLD / Work in Japan? ¥5,000,000 - ¥10,000,000 per yearManage and maintain infrastructure on GCP, Azure, and private cloud platforms. Deploy and scale applications efficiently across various environments. Implement robust monitoring and logging systems to ensure system reliability and visibility. · Manage and maintain infrastructure ...
-
Tokyo Specialized Group ¥5,000,000 - ¥10,000,000 per yearSenior Manager, Technical Sales/Engineering · We are looking for a Senior Manager in Technical Sales/Engineering for a leading company in the automotive industry. · OEMクライアントのエンジニアリングリーダーとの信頼関係を構築し、当社を自動車エレクトロニクスのリーダーとして位置付けます。 · 当社の技術ソリューションの利点を明確に伝え、OEM製品仕様に影響を与えます。 · 主要顧客アカウント ...
-
Tokyo AXS Full time¥1,800,000 - ¥2,500,000 per yearThe Site Reliability Engineer (SRE) II is responsible for designing, implementing, and maintaining scalable and reliable systems and applications. Focus on automation, monitoring, and incident response to ensure high system availability and performance. · Build and scale the tech ...