職位描述

職責描述:
-負責大規(guī)模ai計算集群基礎設施和產(chǎn)品在私有化場景下的設計與研發(fā)工作
-構建異構多芯計算集群,優(yōu)化gpu資源調(diào)度、虛擬化混布等核心能力,有效提升多芯供應能力和集群資源效率
-基于標準kubernetes技術,負責云原生ai組件研發(fā)工作,包括訓練推理服務編排、gpu資源調(diào)度和混布、ai存儲、高性能網(wǎng)絡等
-基于ai計算集群基礎設施,設計和研發(fā)異構計算平臺和解決方案,支持開發(fā)、訓練、推理等多場景能力
-提升服務和產(chǎn)品的穩(wěn)定性,優(yōu)化服務性能和可擴展性
任職要求:
-計算機及相關專業(yè),本科及以上學歷
-熟悉kubernetes工作原理,熟悉調(diào)度器、資源擴展機制、容器運行時、容器網(wǎng)絡等技術,有kubernetes開發(fā)和維護經(jīng)驗
-對kubeflow、volcano、pytorch、gpu芯片架構有一定了解者優(yōu)先
-具備良好的溝通能力和團隊協(xié)作精神,嚴謹?shù)墓ぷ鲬B(tài)度,注重工程質(zhì)量,有獨立解決各種系統(tǒng)問題的能力
-善于學習新的知識,動手能力強,有強烈的責任心,喜歡鉆研技術
工作地點
地址:河南


職位發(fā)布者
HR
百度在線網(wǎng)絡技術(北京)有限公司


-
互聯(lián)網(wǎng)·電子商務
-
1000人以上
-
私營·民營企業(yè)
-
北京海淀區(qū)上地十街10號百度大廈