【仕事内容】
「LLM推論基盤エンジニア【フルリモート可】」のポジションの求人です
【現状の課題】
国産LLM・VLMの自社開発を進める中で、推論・モデル軽量化などの性能最適化がボトルネックとなっています。
既存のフレームワークやGPU構成に依存しない、高速・安定・安価な基盤を構築することが急務です。
研究開発レベルの知見をプロダクトとして成立させる実装力を持つエンジニアを求めています。
【業務内容】
自社プロダクトで活用する大規模言語モデル(LLM)およびマルチモーダルモデル(VLM)の推論・学習の高速化を担当します。
製品開発チームやリサーチチームと協働しながら、実際のプロダクトに最適な形で技術を落とし込んでいただきます。
■具体的な業務内容
・LLM/VLM推論パイプラインの最適化(高速化・省メモリ化・分散処理)
・モデル圧縮、量子化、蒸留などによる軽量化手法の検討と実装
・推論基盤の設計(モデル並列・パイプライン並列・ロードバランシング)
・推論時間・コストの定量的改善に向けた性能計測と最適化サイクルの運用
※変更の範囲:開発関連業務
【チーム構成】
PaaSユニット
事業責任者(CEO)1名
プロダクトマネージャー 1名
【開発環境】
[組織体制]
・プロダクトマネージャー1名
・フロントエンドエンジニア1名
・バックエンドエンジニア1名
・機械学習エンジニア3名
[開発言語]
TypeScript、 、、Python
[コンテナ]
Docker
[IaC]
Terraform
[クラウド]
AWS, Azure
【ポジションの魅力】
・国産LLMを自社でフルスクラッチ開発している希少な環境
・研究成果を"動くプロダクト"として社会に届ける技術開発ができる
・OSSや論文に還元できるほどの技術的挑戦を実務で経験可能
・LLM/VLM領域の先端研究者と密に協働できる
【関連資料】
・Stockmark LLM特設LP
・業務AIの実装支援プラットフォーム「 SAT 」
【求める人材】
【必須要件】
※いずれか必須
・PyTorchやTensorFlowなどを用いたLLM/VLMの実装・最適化経験
・CUDA、NCCL、TensorRT、ONNX Runtimeなどを活用したGPU最適化知識
・モデル推論のパフォーマンス改善・メモリ削減の実務経験
・分散学習・推論に関する基礎理解(Data Parallel, Model Parallelなど)
・Python/C++などでの性能チューニング経験
【給与】
年収 755 ~ 1305 万円
想定年収 7,298,000円~12,794,000円
※月給×12ヶ月+リモートワーク準備一時金(入社時支給)5万円
月給:604,000円~1,062,000円<内訳>基本給:433,023円~772,620円
固定残業代45時間分:150,977円~269,380円 ※超過分は別途支給
顧客と向き合う手当:2万円
なお、経験・スキルに応じて変動の可能性があります
【勤務地】
東京都
港区南青山1丁目12-3 LIFORK MINAMI AOYAMA S209
【勤務時間】
10:00~19:00
【雇用・契約形態】
【休日・休暇】
完全週休二日(土日)祝日、有給休暇(入社時に付与)、年末年始休暇(6日)
-
Tokyo Stockmark Inc. ¥10 - ¥12 per year+Job summary · 国産LLMを自社でフルスクラッチ開発している希少な環境 · ResponsibilitiesLLM/VLM推論パイプラインの最適化(高速化・省メモリ化・分散処理) · モデル圧縮、量子化、蒸留などによる軽量化手法の検討と実装 · ...
-
Tokyo ストックマーク株式会社 ¥7,550,000 - ¥13,050,000国産LLM・VLMの自社開発を進める中で、推論・モデル軽量化などの性能最適化がボトルネックとなっています。既存のフレームワークやGPU構成に依存しない、高速・安定・安価な基盤を構築することが急務です。研究開発レベルの知見をプロダクトとして成立させる実装力を持つエンジニアを求めています。 · LLM/VLM推論パイプラインの最適化(高速化・省メモリ化・分散処理) · モデル圧縮、量子化、蒸留などによる軽量化手法の検討と実装 · 推論基盤の設計(モデル並列・パイプライン並列・ロードバランシング) · 推論時間・コストの定量的改善に向けた性能計測と最適化サイク ...
-
llm推論基盤エンジニア
2ヶ月前
Tokyo Michael Page ¥7,000,000 - ¥15,000,000 per year企業の意思決定とイノベーションを加速させるAIソリューションを提供する企業で、膨大なテキストデータを解析し、企業のアイデア創出と業務効率化をサポートするLLM推論基盤エンジニアを募集しています。 · 推論時間・コストの定量的改善に向けた性能計測と最適化サイクルの運用 · LLM/VLM推論パイプラインの最適化 · 推論基盤の設計 · モデル圧縮、量子化、蒸留などによる軽量化手法の検討と実装 · PyTorchやTensorFlowなどを用いたLLM/VLMの実装・最適化経験 · CUDA、NCCL、TensorRT、ONNX Runtimeなどを活用した ...
-
Tokyo Cybozu, Inc. ¥600,000 - ¥1,200,000 per year+自社クラウドサービスの『』では、OSSや自社製ミドルウェアを利用して、ペタバイトスケールのユーザーデータを扱っています。新基盤のストレージの開発・運用および社内の利用者への教育を行うメンバーを募集しています。 · +Ceph/Rookによるストレージインフラの開発/運用 · 既存インフラからの移行の設計/サポート · + ...
-
Tokyo 株式会社STANDARD ¥7,000,000 - ¥8,900,000 per year当社は自社プロダクトの創出・拡大を加速しており、その一環として、プロダクト開発を支えるスクラムチームの体制強化を目的に新たに募集いたします。 · ...
-
Tokyo Cybozu, Inc. ¥600,000 - ¥1,200,000 per year自社クラウドサービスの『』では、OSSや自社製ミドルウェアを利用して、ペタバイトスケールのユーザーデータを扱っています。 · 新基盤のストレージの開発・運用および社内の利用者への教育を行うメンバーを募集しています。 Ceph/Rookによるストレージインフラの開発/運用 · 自社製Kubernetes CSI pluginの開発 · 既存インフラからの移行の設計/サポート · ...
-
フルリモート可】バックエンドエンジニア
11時間前
Tokyo (株)バルカー・エフエフティ ¥7,500,000 - ¥9,000,000 per year1927年の創業以来、日本の基幹産業を支え続けてきたバルカーは今、大きな転換点を迎えています。 · ...
-
開発エンジニア(バックエンド/)/フルリモート可
11時間前
東京都 区, 株式会社Senyou Remote job会木,Web(python)팝엘세요 · python / vue.js ( 3 0 채 수 선 · Github 채섘을 code management · ...
-
phpエンジニア、フルリモート可
11時間前
東京都 文京区 本郷, 株式会社SunSunTech Remote jobWeb系、業務系システム・サービスの開発案件において、PHPを用いたシステム開発に携わっていただきます。 · ...
-
Tokyo クリエーションライン(株) ¥6,000,000 - ¥10,200,000生成AI/LLMを前提に、顧客のビジネス価値へ最短距離で迫るAIプロダクト開発と、開発現場の生産性を飛躍させるAI駆動開発支援にコミットするポジションです。 · RAGやエージェント実装、品質評価・運用改善まで一気通貫で担います。 ...
-
TypeScriptエンジニア・フルリモート可
11時間前
東京都 文京区 本郷, 株式会社SunSunTech Remote jobTypeScriptを用いたフロントエンド/バックエンド開発に携わっていただきます。高還元SES:単価を開示し、透明性のある報酬体系です。 · ...
-
cobolエンジニア、フルリモート可
11時間前
東京都 文京区 本郷, 株式会社SunSunTech Remote job金融・保険・官公庁などの業務系システム開発案件において、COBOLを用いたシステム開発に携わっていただきます。 · ...
-
Javaエンジニア、フルリモート可
11時間前
東京都 文京区 本郷, 株式会社SunSunTech Remote job+Javaを用いたシステム開発に携わっていただきます。案件はスキル · 希望に応じて選定し、キャリアパスに沿ったアサインを徹底しています。 · +高還元SES:単価を開示し、透明性のある報酬体系。業界トップクラスの還元率で働くほど収入に直結。 · 案件選択制:エンジニア本人の希望に合わせて参画案件を選べます。スキルアップ · 働き方の両面で自由度高く働けます。 · ...
-
c++エンジニア、フルリモート可
11時間前
東京都 文京区 本郷, 株式会社SunSunTech Remote job¥337,500 - ¥800,000 per yearC++を用いたシステム開発に携わっていただきます · 案件はスキル・希望に応じて選定し、キャリアパスに沿ったアサインを徹底しています · ...
-
c#エンジニア、フルリモート可
11時間前
東京都 文京区 本郷, 株式会社SunSunTech Remote jobC#を用いたシステム開発に携わっていただきます。案件はスキル・希望に応じて選定し、キャリアパスに沿ったアサインを徹底しています。 · ■参画案件例(1)大手ホスティングサービス会社でのフロントエンド開発、(2)大手不動産会社の顧客システム開発・改修案件、(3)画像処理検査システム開発案件です。 · ...
-
Pythonエンジニア、フルリモート可
11時間前
東京都 文京区 本郷, 株式会社SunSunTech Remote job+Pythonを用いたシステム開発に携わっていただきます。 · 案件はスキル・希望に応じて選定し、キャリアパスに沿ったアサインを徹底しています。 · ...
-
リモート可】データ基盤エンジニア
2ヶ月前
Tokyo (株)メソドロジック ¥6,000,000 - ¥8,000,000データ基盤エンジニアの仕事は、クライアント企業のデータモデリングを実施し、大量・複雑データを分散処理システムで高速処理を実施するデータの連携、蓄積、活用するためのアーキテクチャーを設計・構築することです。AWS、Azure、GCPでのクラウドサービスを活用したデータ分析基盤の構築、運用を実施し、エンタープライズでのデータ分析基盤の導入と運用を支援することです。 ...
-
週2リモート可 フルスタックエンジニア
4週間前
東京都 渋谷区 渋谷, スキルブリッジ株式会社 ¥2,000,000 - ¥2,800,000 per year【週2リモート可】フルスタックエンジニア · IT領域に特化した人材紹介サービスを展開している当社のエンジニア組織では、顧客となる企業/求職者に好機を提供するというミッション実現のため、日々ユーザー体験を安定して届け続けることが大きな役割となっています。 · ...
-
Tokyo xID,Inc.フルリモート・リードエンジニアのポジションを募集しています。xIDアプリやSmartPOSTなどの自社プロダクト開発に関与し、技術的な意思決定とチームの牽引を行う必要があります。 · ...
-
Tokyo 株式会社ベリサーブ (VeriServe Corporation) ¥8,000,000 - ¥10,900,000クラウド上のビジネス・アプリケーションを対象とした下記業務を行っていただきます。 · ・ソフトウェア・テスト · ・周辺システムの仮想化環境構築 · ・ソフトウェア・テストの自動化 · ・品質保証に必要なプロセスの構築、維持、改善 · 新しい技術に取り組むことが好きなこと · ソフトウェア開発経験 · アジャイル・プロセスでのプロジェクトに従事した経験 · ソフト開発・テストのリーディング経験 · APIの仕様策定に従事した経験 · マイクロサービスを活用したサービス企画あるいは開発経験 · ソフトウェア開発あるいはテストにおけるプロセス診断・改善の経験 ...
-
リモート可】フルスタックエンジニア
1ヶ月前
Tokyo (株)マイネット ¥7,500,000 - ¥12,000,000· 全社横断組織である技術課題プロジェクトチームのコアメンバーとして、複数のゲーム開発/運営チームが抱える技術課題解決をリードし、全社技術の発展をけん引いただけるフルスタックエンジニアを募集します。 · 新規開発における技術選定/検証、開発方針の策定 · 他職種の技術課題の解決支援、3DTAなど職種間を跨ぐスキルの研究開発 · ...