「LLM推論基盤エンジニア【フルリモート可】」のポジションの求人です
【現状の課題】
国産LLM・VLMの自社開発を進める中で、推論・モデル軽量化などの性能最適化がボトルネックとなっています。
既存のフレームワークやGPU構成に依存しない、高速・安定・安価な基盤を構築することが急務です。
研究開発レベルの知見をプロダクトとして成立させる実装力を持つエンジニアを求めています。
【業務内容】
自社プロダクトで活用する大規模言語モデル(LLM)およびマルチモーダルモデル(VLM)の推論・学習の高速化を担当します。
製品開発チームやリサーチチームと協働しながら、実際のプロダクトに最適な形で技術を落とし込んでいただきます。
■具体的な業務内容
・LLM/VLM推論パイプラインの最適化(高速化・省メモリ化・分散処理)
・モデル圧縮、量子化、蒸留などによる軽量化手法の検討と実装
・推論基盤の設計(モデル並列・パイプライン並列・ロードバランシング)
・推論時間・コストの定量的改善に向けた性能計測と最適化サイクルの運用
※変更の範囲:開発関連業務
【チーム構成】
PaaSユニット
事業責任者(CEO)1名
プロダクトマネージャー 1名
【開発環境】
[組織体制]
・プロダクトマネージャー1名
・フロントエンドエンジニア1名
・バックエンドエンジニア1名
・機械学習エンジニア3名
[開発言語]
TypeScript、 、、Python
[コンテナ]
Docker
[IaC]
Terraform
[クラウド]
AWS, Azure
【ポジションの魅力】
・国産LLMを自社でフルスクラッチ開発している希少な環境
・研究成果を"動くプロダクト"として社会に届ける技術開発ができる
・OSSや論文に還元できるほどの技術的挑戦を実務で経験可能
・LLM/VLM領域の先端研究者と密に協働できる
【関連資料】
・Stockmark LLM特設LP
・業務AIの実装支援プラットフォーム「 SAT 」
【求める人材】
【必須要件】
※いずれか必須
・PyTorchやTensorFlowなどを用いたLLM/VLMの実装・最適化経験
・CUDA、NCCL、TensorRT、ONNX Runtimeなどを活用したGPU最適化知識
・モデル推論のパフォーマンス改善・メモリ削減の実務経験
・分散学習・推論に関する基礎理解(Data Parallel, Model Parallelなど)
・Python/C++などでの性能チューニング経験
【給与】
年収 755 ~ 1305 万円
想定年収 7,298,000円~12,794,000円
※月給×12ヶ月+リモートワーク準備一時金(入社時支給)5万円
月給:604,000円~1,062,000円<内訳>基本給:433,023円~772,620円
固定残業代45時間分:150,977円~269,380円 ※超過分は別途支給
顧客と向き合う手当:2万円
なお、経験・スキルに応じて変動の可能性があります
【勤務地】
東京都
港区南青山1丁目12-3 LIFORK MINAMI AOYAMA S209
【勤務時間】
10:00~19:00
【雇用・契約形態】
【休日・休暇】
完全週休二日(土日)祝日、有給休暇(入社時に付与)、年末年始休暇(6日)
Show more Show less
-
Tokyo ストックマーク株式会社 ¥7,550,000 - ¥13,050,000国産LLM・VLMの自社開発を進める中で、推論・モデル軽量化などの性能最適化がボトルネックとなっています。既存のフレームワークやGPU構成に依存しない、高速・安定・安価な基盤を構築することが急務です。研究開発レベルの知見をプロダクトとして成立させる実装力を持つエンジニアを求めています。 · LLM/VLM推論パイプラインの最適化(高速化・省メモリ化・分散処理) · モデル圧縮、量子化、蒸留などによる軽量化手法の検討と実装 · 推論基盤の設計(モデル並列・パイプライン並列・ロードバランシング) · 推論時間・コストの定量的改善に向けた性能計測と最適化サイク ...
-
Tokyo Stockmark Inc. ¥10 - ¥12 per year+Job summary · 国産LLMを自社でフルスクラッチ開発している希少な環境 · ResponsibilitiesLLM/VLM推論パイプラインの最適化(高速化・省メモリ化・分散処理) · モデル圧縮、量子化、蒸留などによる軽量化手法の検討と実装 · ...
-
llm推論基盤エンジニア
3週間前
Tokyo Michael Page ¥7,000,000 - ¥15,000,000 per year企業の意思決定とイノベーションを加速させるAIソリューションを提供する企業で、膨大なテキストデータを解析し、企業のアイデア創出と業務効率化をサポートするLLM推論基盤エンジニアを募集しています。 · 推論時間・コストの定量的改善に向けた性能計測と最適化サイクルの運用 · LLM/VLM推論パイプラインの最適化 · 推論基盤の設計 · モデル圧縮、量子化、蒸留などによる軽量化手法の検討と実装 · PyTorchやTensorFlowなどを用いたLLM/VLMの実装・最適化経験 · CUDA、NCCL、TensorRT、ONNX Runtimeなどを活用した ...
-
Tokyo ストックマーク株式会社 ¥10,298,000 - ¥13,298,000当社プロダクト「Anews」におけるバックエンドおよびインフラ領域の設計・開発・運用改善を中心に、フルスタックに近い立ち位置でご活躍いただきます。 · 7年以上のソフトウェアエンジニア経験 · クラウド(AWS/GCP/Azureなど)を利用した開発・運用経験 · テックリードまたはリードエンジニアとして技術的に開発をリードした経験 · 「Anews」のデータ検索・配信基盤に関わる開発 · 検索処理(API)の設計・開発、運用 · データベース、検索エンジンへのデータ登録パイプラインの設計・開発、運用 · フルスタックエンジニア · クラウドコンピューテ ...
-
Tokyo ストックマーク株式会社 ¥6,290,000 - ¥12,794,000生成AIの活用を促進する新規事業Stockmark A Technologyのバックエンドからインフラ領域をお任せします。新サービス(PaaS)の1人目の主任エンジニアとして自律的に開発をリードし、検証から実装まで進める。ドキュメント解析エンジンの開発を行う機械学習エンジニアとコミュニケーションしつつ、リソース要件やインターフェースを定義して開発を進める。プロダクトマネージャーとコミュニケーションしつつ、課題を解決するための開発を進める · ビジネスドキュメント解析エンジンのAPIおよびそのインフラの検証・実装・製品運用 · マルチクラウド環境におけるイ ...
-
リモート可】データ基盤エンジニア
2週間前
Tokyo (株)メソドロジック ¥6,000,000 - ¥8,000,000データ基盤エンジニアの仕事は、クライアント企業のデータモデリングを実施し、大量・複雑データを分散処理システムで高速処理を実施するデータの連携、蓄積、活用するためのアーキテクチャーを設計・構築することです。AWS、Azure、GCPでのクラウドサービスを活用したデータ分析基盤の構築、運用を実施し、エンタープライズでのデータ分析基盤の導入と運用を支援することです。 ...
-
Tokyo 株式会社ベリサーブ (VeriServe Corporation) ¥8,000,000 - ¥10,900,000クラウド上のビジネス・アプリケーションを対象とした下記業務を行っていただきます。 · ・ソフトウェア・テスト · ・周辺システムの仮想化環境構築 · ・ソフトウェア・テストの自動化 · ・品質保証に必要なプロセスの構築、維持、改善 · 新しい技術に取り組むことが好きなこと · ソフトウェア開発経験 · アジャイル・プロセスでのプロジェクトに従事した経験 · ソフト開発・テストのリーディング経験 · APIの仕様策定に従事した経験 · マイクロサービスを活用したサービス企画あるいは開発経験 · ソフトウェア開発あるいはテストにおけるプロセス診断・改善の経験 ...
-
Tokyo サイボウズ株式会社 ¥6,000,000 - ¥15,000,000SREエンジニアを求めています。オンプレミス基盤の運用、ミドルウェアの保守・運用、開発などを行っています。また、ユーザ数やアクセス数に対応するために分析して最適化する開発も行っています。 · KVM・QEMU を活用して構築したクラウド基盤の開発、運用 · Nginx や keepalived などを使用する負荷分散、冗長化したシステムの管理 · 各種ミドルウェアの性能評価と改善 · ...
-
Tokyo (株)BeeX ¥8,000,000 - ¥14,000,000お客様の要件に合わせて適切なデータ基盤を自身で考え提案し、プロジェクトの立ち上げから構築後の保守運用までチームで対応することが可能です。またプロジェクトのリーダーを担っていただきますが、小規模なチーム構成、メンバー一人一人がプロジェクトへの貢献を考えて行動することが求められる環境のため、お客様折衝、プロジェクトの管理だけでなく、エンジニアとして新しい技術に触れ続けていけることが本ポジションの魅力です。基本的にフルリモート勤務でフルフレックス(コアタイムなし)のため、就業時間や仕事の進め方は調整次第で柔軟に対応することが可能です。 · ...
-
Tokyo 株式会社ベリサーブ (VeriServe Corporation) ¥6,000,000 - ¥8,000,000 per year自動車メーカーが開発するADASや自動運転システムに対し、システムやソフトウェア開発および検証を信頼性・安全性を軸に支援します。 ...
-
Tokyo 株式会社ベリサーブ (VeriServe Corporation) ¥6,000,000 - ¥8,000,000自動車メーカーが開発するADASや自動運転システムに対し、システムやソフトウェア開発および検証を信頼性・安全性を軸に支援します。 ...
-
Tokyo サイボウズ株式会社 ¥6,000,000 - ¥12,000,000· 自社クラウドサービスの『』では、OSSや自社製ミドルウェアを利用して、ペタバイトスケールのユーザーデータを扱っています。 · · Ceph/Rookによるストレージインフラの開発/運用 · 自社製Kubernetes CSI pluginの開発 · 既存インフラからの移行の設計/サポート ...
-
Tokyo 株式会社ベリサーブ (VeriServe Corporation) ¥8,000,000 - ¥10,000,000 per year自動車メーカーが開発するADASや自動運転システムに対し、システムやソフトウェア開発および検証を信頼性・安全性を軸に支援します。 ...
-
フルリモート可】データエンジニア
2週間前
Tokyo (株)メソドロジック ¥6,000,000 - ¥12,000,000同社は、米国Databricks社とパートナー契約を締結しています。クライアント企業のデータモデリングを実施し、大量・複雑データを分散処理システムで高速処理するためのデータの連携、蓄積、活用するためのアーキテクチャーを設計・構築します。また、AWS、Azure、GCPでのクラウドサービスを活用したデータ分析基盤の構築、運用を実施し、エンタープライズでのデータ分析基盤の導入と運用を支援します。 · データモデリング · 分散処理システムでの高速処理 · データの連携、蓄積、活用のためのアーキテクチャーの設計・構築 · AWS、Azure、GCPでのクラウド ...
-
Tokyo 株式会社ベリサーブ (VeriServe Corporation) ¥8,000,000 - ¥10,800,000開発支援エンジニアの仕事内容は、PMOや顧客への報告、ビジネスパートナーの管理など幅広い業務を担当する。初級エンジニアから上級エンジニアまで、さまざまなレベルのエンジニアが必要です。必須条件は、チームで何かしらの活動をした経験と、車載ソフト/ハード知識やソフトウェア開発プロセスに携わった経験が必要です。歓迎条件は、PLの経験や上級エンジニアの経験が必要です。給与は年収800~1080万円で、勤務地は東京都千代田区です。 ...
-
フルリモート可】データエンジニア
7日前
Tokyo 株式会社FOLIO ¥6,000,000 - ¥9,000,000フルリモート可データエンジニアの仕事です。FOLIOのデータ分析と戦略立案、全社的なデータ分析基盤の開発運用を行います。 · ...
-
Tokyo ストックマーク株式会社 ¥8,054,000 - ¥12,050,000フロントエンドエンジニアの開発を任せ、将来的にはフルスタックに開発を進めていただくことを期待しています。ユーザーが蓄積した情報をLLMを活用して要約し、インサイトに繋げるための機能の検討・設計・開発などを担当します。 · ...
-
Tokyo サイボウズ株式会社 ¥6,000,000 - ¥12,000,000· Ceph / Rook by · TopoLVM · self- made Kubernetes CSI plugin development of TopoLVM Ceph/Rook-based storage infrastructure development and operation · Self-made Kubernetes CSI plugin development · ...
-
リモート可】フルスタックエンジニア
2週間前
Tokyo 有限責任監査法人トーマツ ¥8,000,000 - ¥10,000,000リスクアドバイザリー事業部のIT/DX推進事業の急成長に伴い、事業拡大に貢献していただける方を募集しています。 · 大規模、複雑プロジェクトの技術リード · 課題解決 · クラウドサービスを活用したシステム開発技術、ツール、アーキテクチャー、プラットフォームの技術検証 · 整備 · IT/DX推進案件の開発方式の社内標準化 · 業務システム、またはインフラの開発、運用・保守経験(5年以上) · ITを活用したサービス、製品、システム及びソフトウェアの開発に係る十分な知識(応用情報技術者試験相当) · クラウドサービスを活用したシステム導入経験(AWS、A ...
-
Tokyo 株式会社ベリサーブ (VeriServe Corporation) ¥8,000,000 - ¥10,000,000自動車メーカーが開発するADASや自動運転システムに対し、システムやソフトウェア開発および検証を信頼性・安全性を軸に支援します。信頼性・安全性設計コンサルタントとして、自動運転システムに係るシステム定義手法の提案や信頼性・安全性分析活動の検討を行います。計画、工程管理や信頼性・安全性分析業務も行います。 ...
-
Tokyo (株)マイネット ¥7,500,000 - ¥12,000,000· 全社横断組織である技術課題プロジェクトチームのコアメンバーとして、複数のゲーム開発/運営チームが抱える技術課題解決をリードし、全社技術の発展をけん引いただけるフルスタックエンジニアを募集します。 · 新規開発における技術選定/検証、開発方針の策定 · 他職種の技術課題の解決支援、3DTAなど職種間を跨ぐスキルの研究開発 · ...