At Oracle Cloud Infrastructure (OCI), we build the more intelligent future of cloud. OCI Sovereign Cloud is a team of smart, motivated, and diverse people that are focused on bringing the world's most important work to OCI. We build and operate our government, classified, and sovereign cloud regions to be reliable and high performance, just like our public cloud. Our customers and their mission are the center of what we do. We strive to improve our knowledge of the challenges our customers face which we use to enhance our cloud capabilities and work together to deliver their mission.
As a Site Reliability Developer/Engineer, you will be responsible for the operation of production environments, including systems and databases, supporting critical business operations for Japan's governmental sovereign cloud environment. You will be focused on automation and optimization of operations for multiple production environments. You will recommend new and novel solutions to improve availability, performance, and supportability. This is an opportunity to bring a combination of deep technical knowledge with administration/analysis knowledge of Cloud Infrastructure to provide escalation support to a wide range of complex production environment problems related to immense growth, scaling, leveraging the cloud, extremely high performance, and high availability requirements. As a Site Reliability Developer/Engineer, you will also guide junior engineers to solve complex problems, take part in large-scale incident bridges and help to build and optimize processes and procedures.
We will expect you to solve complex problems related to infrastructure cloud services and build automation to prevent problem recurrence. Design, write, and deploy software to improve the availability, scalability, and efficiency of Oracle products and services. Design and develop designs, architectures, standards, and methods for large-scale distributed systems. Facilitate service capacity planning and demand forecasting, software performance analysis, and system tuning.
ResponsibilitiesResponsibilities
- Development of automation and optimization's focused on operational excellence.
- Deep dive, root cause and solve for systemic issues.
- Install, monitor, maintain, support, and optimize all production server hardware and software.
- Provide escalated technical support for complex technical issues which may include leading problem management cases and providing management status.
Coordinate escalated support cases and lead appropriate internal technical resources and/or third-party vendors to resolution and coordinate a storage infrastructure of Oracle system and database appliances. - Responsible for Oracle production environments; assist with server operating system and application upgrades, bug fixes, and patching; and work on standardization projects for both hardware and software under the Oracle technology stack while providing consistent system uptime as expected in a Cloud environment.
- Lead communications with key partners in solving complex technical problems.
- Provide technical guidance and leadership to junior members to enable them to grow in their careers.
Requirements:
- Native-level Japanese and business level English are required. Internal and global communication in English is common at OCl.
- Deep experience with Linux System Administration, Networking, Storage, Compute, and Virtualization
- Expertise and experience working with technologies such as Kubernetes, Terraform, Ansible, Chef and Puppet.
- Depth of knowledge in cloud platforms - AWS, GCP, Azure or other major providers.
- Experience participating in or running incident bridges of significant scale
- Demonstrated experience of working with strong customer focus, with a passion for delighting customers
- Experience in SRE, cloud technical support, cloud operations or similar
- Demonstrate ability to quickly learn new technical disciplines and then train others
Career Level - IC4
-
Tokyo CLPS Global ¥7,680,000 - ¥11,520,000 per yearシステム開発・運用プロジェクトにおいて、DevOps環境の構築・運用を担当いただきます。日本側クライアントとの技術調整・ドキュメント作成を行います。 · ...
-
Tokyo TG Japan Inc.. ¥15,000,000 - ¥20,000,000 per year· ! · 対象システムの自動化・運用管理・信頼性向上を支援するためのツールを設計・構築する · 対象システム向けのリリースパイプラインの構築および運用支援 · 開発/デリバリーチームの一員として、SREのプラクティスをソリューション設計に組み込む · 設計実装から停止廃止(デコミッショニング)に至るまでのシステムライフサイクル全体を管理する · ...
-
Tokyo TG Japan Inc.. ¥6,000,000 - ¥12,000,000 per year「欧州系大手コンサルティングファーム」にて、SRE (Site Reliability Engineer) を募集しています。 · ...
-
Tokyo BLOOMTECH, Inc ¥5,500,000 - ¥7,500,000 per year急拡大中の自社サービスを牽引するSRE(Site Reliability Engineering)ポジションを任せます。具体的には「どのようにしたらサービスをより多くの方に、より便利に使ってもらえるか」というユーザー視点に立ち、仮説・実行・検証のサイクルを回しながら、サービスの信頼性を高めて頂きます。 · SLA/SLO/SLIの設定・監視、モニタリング環境の改善 · OS、ミドルウェアなどの継続的アップデート · 障害対応およびボトルネック調査・対応 · AWSなど複数クラウドを使用したシステム環境の運用安定化 · アーキテクチャ改善(マイクロサービス ...
-
Tokyo PlayStation ¥3,600,000 - ¥12,000,000 per yearPlayStationNetworkの企画・設計・開発・運用を担っているエンジニアリング部門です。PlayStationのライフサイクルを構成する、クライアントソフトウェアからゲームコンテンツ配信・販売機能、オンラインゲーム機能、ソーシャルコミュニティ機能等のプラットフォームサービスまで、幅広くコンシューマーやゲームデベロッパーに提供しています。 · SITE RELIABILITY ENGINEERとしてサーバーサイドアプリケーション開発チームの一員としてサービスの信頼性、性能、効率およびセキュリティーの確保を担うこと。 · ...
-
Tokyo BLOOMTECH, Inc ¥8,000,000 - ¥18,000,000 per yearデカコーン(企業価値100億ドル以上のスタートアップ)を目指す当社ですが、この目標を実現するためには「グローバル×ディープテックで勝つ必要がある」とよく言われます。 · そのような中で、「日本発」の「グローバル×ディープテック」として、「デファクトとなるインフラ」を先陣をきってつくるべく、現在、開発チームの人員を中心に採用を急拡大しております。 · ...
-
Tokyo Tailorプロダクトづくりの難しい部分を簡単にし、誰もがプロダクトの作り手になれる。これがテイラーが実現したい世界です。 · ...
-
Tokyo OLTA株式会社 ¥7,500,000 - ¥12,000,000インフラ設計開発運用、サービスダウンタイム最小化、システムパフォーマンススケーラビリティー向上、顧客データ守りセキュリティ品質の向上IaCプロビジョニングモニタリング自動化効率化CI/CD環境開発者体験 · ...
-
Tokyo TIER IVJob summary/ · /き/ · /き/ · , Autoware-equipped self-driving vehicles around the world to ensure safety and reliability. ...
-
東京都 港区 虎ノ門, 株式会社TERASS ¥2,000,000 - ¥2,800,000 per yearTERASS(今国) に:" · : · TERRA.. · SITE RELIABILITY ENGINEER) · :SRE( · ...
-
Tokyo Tailor ¥500,000 - ¥1,000,000 per year+プロダクトづくりの難しい部分を簡単にし、誰もがプロダクトの作り手になれる。これがテイラーが実現したい世界です。誰しもが自分のアイディアを簡単に具現化でき、ビジネスとエンジニアリングの境界を取り払い、多様な専門知識と技術を統合できる世界を目指しています。 · + · +Tailor Platformは業務システムを作るプラットフォームで、今までものごとの仕事をする人たちにとってもっと便利にすることを目標にしています。+ · ...
-
Greater Tokyo Area BLOOMTECH, Inc ¥1,000,000 - ¥12,000,000 per yearハイブリット×フレックス勤務、業績好調の不動産テック企業、お客様からの信頼性向上を図るための貴重なポジションです。 · ■年収範囲: 年収:6,000,000~12,000,000円 · ...
-
Tokyo Tailor ¥100,000 - ¥200,000 per yearプロダクトづくりの難しい部分を簡単にし、誰もがプロダクトの作り手になれる。これがテイラーが実現したい世界です。 · Tailor Platformとは、業務システムを高速に構築できるプラットフォーム「Tailor Platform」を提供することで、より多くの人がプロダクトの作り手になることを支援しています。 ...
-
Tokyo LINEヤフー株式会社 ¥7,000,000 - ¥10,000,000ポジション概要 · 「LINE」において、Messaging PlatformやDeveloper Product Platformの社内外の顧客が抱える課題を深いドメイン知識と技術力を持って、カスタマーサポート(CS)チーム、開発チームと連携しながら、問題解決と支援ツールの開発をお任せします。 · ...
-
Tokyo LINEヤフー株式会社 ¥7,000,000 - ¥12,000,000ポジション概要 · 「LINEギフト」を中心としたECサービスを支えるCREとして業務を行っていただきます。 · CREとは、エンジニアリングを通じてユーザーの信頼性を担保することを目的としてさまざまな開発業務を行うエンジニアです。これまでに延べ3,500万人以上のユーザーにご利用いただいている「LINEギフト」において、CREは非常に重要な役割を担っています。 · CREチームでは、テクニカルサポートとしてユーザーの問い合わせに回答するだけでなく、ユーザーの抱える課題に対して、技術的な視点からユーザーにとって使いやすいシステムとは何かを考えながら、継続 ...
-
Tokyo LY Corporation ¥7,000,000 - ¥12,000,000 per yearポジション概要 · 「LINEギフト」を中心としたECサービスを支えるCREとして業務を行っていただきます。 · CREとは、エンジニアリングを通じてユーザーの信頼性を担保することを目的としてさまざまな開発業務を行うエンジニアです。これまでに延べ3,500万人以上のユーザーにご利用いただいている「LINEギフト」において、CREは非常に重要な役割を担っています。 · CREチームでは、テクニカルサポートとしてユーザーの問い合わせに回答するだけでなく、ユーザーの抱える課題に対して、技術的な視点からユーザーにとって使いやすいシステムとは何かを考えながら、継続 ...
-
Tokyo 株式会社MIXI ¥8,120,000 - ¥12,040,000技術でプロダクト・サービスの価値向上のサポートをする。運用上の問題をソフトウェア的に解決する、一般的なSREとは異なり、特定の業務領域に絞らず、MIXI GROUPにおけるフェーズの違う各事業の課題を解決するために動いているため、運用中のサービスに限らず支援している。 · ...
-
Tokyo 株式会社メディア工房 ¥6,000,000 - ¥9,000,000同社初の専任SREとして幅広い裁量で技術基盤をリードできる · メディア工房では、占い・美容メディア事業を中心に多様なWebサービスを展開しています。 · AWS環境をベースに、インフラ設計・運用から監視、自動化、信頼性向上のための仕組みづくりまで、幅広い領域を裁量を持って推進できるポジションです。 · ...
-
Tokyo TEKsystems ¥4,000,000 - ¥8,000,000 per yearWe are seeking a skilled Site Reliability Engineer (SRE) to help ensure the reliability, scalability, and performance of critical systems running on Microsoft Azure. · Maintain and enhance the reliability of systems hosted on Azure. · Collaborate with DevOps, Development, Infrast ...
-
Japan OracleWe build the more intelligent future of cloud and operate our government classified and sovereign cloud regions to be reliable and high performance just like our public cloud. · ...
-
Tokyo Placeton Inc ¥8,000,000 - ¥15,000,000 per yearEnsure the availability, scalability, and performance of data platforms and services. · Design, implement, and operate reliable, large-scale data systems in collaboration with engineering teams. · Develop automation scripts and tools (Python, Bash, PowerShell, Spark, etc.) to imp ...