募集職種詳細

開発(ハードウェア・ソフトウェア)

1597 【グローバルイノベーション/深層学習基盤開発G】Network Engineer (Machine Learning Platform)

職務内容
【事業・組織構成の概要】
私たちは、機械学習・コンピュータサイエンス・ソフトウェア工学の分野で深い経験を保有している、機械学習のソフトウェアエンジニアリングチームです。
刺激的な先端技術の開発に取り組み、新しい問題の探求をしつつも、結果を重視したプロジェクトの計画と実行のバランスを取りながら、世界最高峰の技術開発を行っています。

【職務内容】
業界をリードする大規模な機械学習プラットフォームの構築をするために、優れたネットワークエンジニアを探しています。機械学習プラットフォームにおいて、ネットワークの高速性と安定性はシステム全体に影響を与える重要な要素であり、機械学習プラットフォームを支えるネットワークを、信頼性が高く、高速なものにして頂きます。その実現のために、チームの一員として、システムをスムーズに稼働させるための設計や機能強化に携わって頂きます。

・ 大規模なネットワーク設計・構築・運用のライフサイクル全体への積極的な関与と推進
・ 徹底した自動化により、システムを持続的にスケールさせ、信頼性と速度を向上させる開発の推進
・ 他のチームメンバーやグループと協力して、要件や潜在的な問題を分析し、積極的に解決策を模索し開発・運用をリードすること
・ Enterprise GPUサーバーおよびEnterpriseストレージとの通信のトラブルシューティングと通信の最適化

【ポジションのアピールポイント・想定キャリアパス等】
従来の方式に捕らわれず深層学習インフラのあるべき姿・将来像を企画・設計・開発し、多数GPUを用いた機械学習プラットフォームの構築、サービス提供まで実現できる人材を募集します。本インフラの開発・運用に携わることで、先端の商用スイッチまたは商用ストレージ等へ精通することができるだけでなく、世界最高レベルの機械学習PFでの開発経験を得ることができます。

【ポジション募集の背景】
業界をリードする多数GPUを用いた大規模機械学習プラットフォームの開発の立ち上げに伴い、世界でトップレベルの分散学習インフラに育てるため、共に開発・運用してくれる人材を募集します。 
応募資格
【MUST スキル・経験・資格】
・ IPネットワークの設計・構築・開発・運用に関して3年以上の経験
・ キャリアクラスのルーター・スイッチの運用経験(Cisco/Mellanox等)
・ Java, C++, Go, Pythonの開発経験のいずれか
・ BGP/ECMP等におけるネットワークルーティングプロトコルの設計・開発およびトラブルシューティングの経験
・ コンピュータサイエンス/機械学習の修士号、または博士号、または同等の実務経験がある方

【WANT スキル・経験・資格】
・サービスプロバイダまたは大規模ネットワークでの開発・運用に関して5年以上の経験
・ネットワーク製品・技術またはプロトコルの開発経験
・大規模な分散システムの設計、分析、トラブルシューティングの興味・経験
・Spine/Leaf型のネットワークアーキテクチャの設計経験
・RoCE v2を用いたネットワークの設計・開発・運用・トラブルシューティングの経験
・CI/CDへの精通。特に、Git/Ansible/Jenkins 等に精通していること。

【求める人物像(ソフトスキル)】
・新しいテクノロジースタックへの技術を追い続けられるだけの強い技術への好奇心
・英語の技術文書が読めること
待遇
【採用形態・ランク】
・正社員を想定
・主任を想定

【想定報酬】
・年収680万 〜 800万円程度
・月給35.5万〜45.5万円程度(月額基本給 30万〜40万円程度を含む)
 ※前職年収を考慮、当社規定による
勤務地
神奈川県川崎市(玉川事業場)

職種一覧に戻る