サイバーエージェント|ソフトウェアエンジニア(機械学習基盤)|GPU Kubernetesクラスタ開発・運用など株式会社サイバーエージェント
情報提供元
募集
仕事内容
■部署紹介 CIU(CyberAgent group Infrastructure Unit)は、サイバーエージェントグループ全体のインフラを支える組織です。Cycloud というブランドでプライベートクラウドを展開しており、OpenStack (IaaS)、AKE (KaaS)、ML Platform (機械学習基盤) など様々なサービスを提供しています。 ■仕事内容 機械学習基盤 ML Platformの開発・運用を行い、社内のAI系技術者やプロダクトの開発効率化・速度向上・コスト削減を支援しています。 ML PlatformではGPUインスタンスの払い出し、機械学習ジョブの実行、機械学習モデルのデプロイといった機能を提供しています。今後はこれらの他にもMLOpsを推進するための機能を開発していく予定です。 またこれらのサービスは基本的にKubernetes上のアプリケーションとして作られており、基礎的な機械学習の知識に加えてKubernetesに対する深い知識も必要になります。 サイバーエージェントは技術選定が自由であるため、ユーザーとなる社内プロダクトがパブリッククラウドを使うかCycloudを使うかは自由です。 その中でCycloudのML Platformを選択してもらうために、ユーザーの求めるUXや機能を備えたサービスを作るのが我々のミッションです。 具体的な仕事内容は下記になります。 【1. 大規模なGPU Kubernetes クラスタの開発、運用】 ・物理 GPU ノードのセットアップ(OS インストールやパラメーターチューニング) ・Kubernetes クラスタの構築・運用 ・定期的な Kubernetes クラスタのバージョンアップデート ・Kubernetes の最新バージョンに対するキャッチアップ ・大規模計算クラスタのための技術検証・導入(NVIDIA H100, RoCEv2/RDMA, NCCL など) 【2. AI 系の開発を支援する機械学習サービスの開発、運用】 ・GPU インスタンスや Jupyter Notebook を払い出すサービスの開発 ・各種機械学習フレームワークを用いたジョブシステムの開発(Pytorch/Tensorflow/etc.) ・機械学習モデルのサーバーレスデプロイシステムの開発 ・機械学習のためのノード間分散ジョブシステムの開発(MPI) ・Kubernetes カスタムコントローラー(Go)の開発 ・Kubeflow などの機械学習系エコシステムの検証・導入・コントリビュート 【3. ML Platform の規模拡大】 ・新規・既存社内ユーザーとの積極的なコミュニケーションや折衝 ・ユーザーサポート(Python の学習スクリプトの調査など) ・AI 系技術や最新 GPU に対するキャッチアップ ・GPU リソースの需要調査や増設に向けた選定・導入
働き方
勤務地
■東京都渋谷区宇田川町40番1号 Abema Towers
雇用形態
正社員
給与
※年俸制 ※年俸額は、経験・能力を考慮の上決定します(上記の想定年収額はあくまで目安) ※半期ごとの目標管理制度を導入しており、評価に応じて年俸を見直します。 ※選考の中で最終的なスキル・経験を加味した後、正社員・契約社員どちらかでの採用となります。
休日
■週休2日制(土曜・日曜)、祝日 ■夏期休暇(7月1日~11月30日までの期間に3日間)、年末年始休暇(12月29日~1月3日) 年次有給休暇(初年度10日間)、慶弔休暇、産前産後休暇、育児休暇、リフレッシュ休暇 など
特徴
転勤なし(勤務地限定)
学歴不問
急募!入社まで1カ月
服装自由
リモートワークOK
待遇・福利厚生
【保険】 健康保険(関東ITソフトウェア健康保険組合加入)、雇用保険、労災保険、厚生年金保険 【諸手当】 通勤交通費、家賃補助*(2駅ルール|どこでもルール) *勤務しているオフィスの最寄駅から各線2駅圏内に住んでいる正社員に対し月3万円、5年以上勤続している正社員に対してはどこに住んでいても月5万円の家賃補助を支給します。 【制度】 給与改定(年2回)、従業員持株会、社内融資制度、家賃補助制度、社内カウンセリング制度、慶弔見舞金制度、社内親睦会費補助制度など 毎月末の表彰式、サイバーエージェントグループ全社社員総会など、一体感を創る場を多数設けている活発な組織です。
応募条件
応募資格
【必須の経験・スキル】 以下全てを満たす経験をお持ちの方 - 計算機科学に対する基本的な知識および理解 - 機械学習や GPU に対する基本的な知識および理解 - Linux 環境における開発および運用経験 - Kubernetes などのコンテナオーケストレーションツールを用いた運用経験 - プログラミング言語を用いた 3 年以上の開発経験(Go が望ましい) 【歓迎する経験・知識】 以下の経験・知識を一つでもお持ちの方 - Kubernetes カスタムコントローラーの開発経験 - Kubernetes 各種認定資格の取得(CKA/CKAD/CKS/KCNA) - 最新の機械学習やフレームワークに対する知識および理解 - HPC を目的とした大規模計算クラスタに対する知識および理解 - MLOps の知識・実践経験 - Kubeflow, Kueue, MPI Operator の知識・運用経験(分散学習の経験) - Web API におけるセキュリティ対策の経験 - パブリッククラウド(GCP/AWS/etc.)の AI 系サービスを用いた開発経験 - フロント(React)の開発経験 - OSS コミュニティでの開発経験 【求める人物像】 - ソフトウェアからインフラまで幅広く興味があるエンジニアの方 - 向上心が高く、新しい技術の習得に対して抵抗がない方 - 良好なコミュニケーション能力により、チーム内や他部署と調整可能な方 - サービス、ユーザー中心で物事を考えられる方 - クラウドネイティブ技術に親和性のある方 - OSS のアップストリームを追従・貢献する気持ちのある方 <技術スタック> Python, Go, React, AWS, TensorFlow, Kubernetes, Jupyter, GCP
選考のポイント
▼書類選考 ▼面接(複数回) ▼内定
会社概要
会社名
株式会社サイバーエージェント
所在地
東京都渋谷区宇田川町40-1 Abema Towers
代表者
代表取締役 藤田 晋
上場市場名
ヘラクレス
事業内容
■概要: 東証プライム上場、「21世紀を代表する会社を創る」をビジョンに掲げる、インターネット総合サービス企業。広告代理事業、「Ameba」をはじめとするメディア事業、投資育成事業と、幅広い事業ドメインを持ち、国内だけでなく、北米、中国、東南アジア等に向けて積極的にグローバル展開を行う。
従業員数
5,344名
資本金
7,203百万円
売上高
294,497百万円
平均年齢
33.3歳
インタビュー
ユニークな福利厚生制度の数々
ミッションステートメントに「優秀な社員が長期にわたって働き続けられる環境を実現。」と記載があるように、社員の皆さんに働きやすい環境を提供したいと常に考えています。だからこそ、サイバーエージェントならではのユニークな福利厚生制度を用意しています。 ■休んでファイブ リフレッシュ特別休暇制度です。 ■部活動支援制度 社員間のコミュニケーションアップのための制度です。社内の各種クラブ活動、同好会など部署を横断した集まりに対し、補助金を支給します。 ダンス部、ゴルフ部、フットサルクラブ、タッチフット部、野球部、テニス部、麻雀部、フラワーアレンジメント部、サーフィン、キャンドル部など多種多彩。
この求人に応募した人はこちらも検討しています
特徴から探す
休日・働き方
募集・採用情報
会社・職場の環境
待遇・福利厚生
語学
仕事内容
社員の平均年齢
サイバーエージェント|ソフトウェアエンジニア(機械学習基盤)|GPU Kubernetesクラスタ開発・運用など
株式会社サイバーエージェント