
MLE職位介紹
MLE的全稱是Machine Learning Engineer,即機(jī)器學(xué)習(xí)工程師。它主要負(fù)責(zé)用機(jī)器學(xué)習(xí)的算法對現(xiàn)實(shí)生活中的海量數(shù)據(jù)進(jìn)行建模,達(dá)到預(yù)測的目的,同時(shí)還需要考慮算法在計(jì)算機(jī)和硬件上的有效運(yùn)行。MLE還負(fù)責(zé)把一些機(jī)器學(xué)習(xí)的模型部署到計(jì)算機(jī)上,讓企業(yè)和消費(fèi)者等不同客戶來調(diào)用這個(gè)模型,從而解決一些生產(chǎn)上面的問題。
MLE主要分為模型開發(fā)和模型Infrastructure兩類工作:
01模型開發(fā)
比如開發(fā)Linear Regression或者Random Forest模型,開發(fā)出來之后根據(jù)用戶數(shù)據(jù)訓(xùn)練好,然后把模型放到硬件上部署,再不斷的測試。MLE工作涉及數(shù)據(jù)收集、清理、模型開發(fā)、訓(xùn)練、部署、測試、監(jiān)控和調(diào)優(yōu)。
02模型Infrastructure
MLE負(fù)責(zé)End to End的工作,包括數(shù)據(jù)收集、數(shù)據(jù)清理、建立數(shù)據(jù)Pipeline、模型訓(xùn)練、部署、上線、測試、監(jiān)控、調(diào)優(yōu)和迭代。MLE崗位起源于傳統(tǒng)SDE(軟件工程師)。隨著機(jī)器學(xué)習(xí)算法在企業(yè)中的應(yīng)用越來越廣泛,企業(yè)對于MLE的需求不斷增大。近年來Tech行業(yè)不斷整合業(yè)務(wù),MLE負(fù)責(zé)的模塊慢慢跟DS整合在一起。
MLE跟DS/DA的區(qū)別在哪?
01MLE與DS/DA的區(qū)別與聯(lián)系
MLE主要是負(fù)責(zé)從端到端整一套機(jī)器學(xué)習(xí)系統(tǒng)的開發(fā)、部署和調(diào)優(yōu),這塊不僅僅涉及到機(jī)器學(xué)習(xí)算法的開發(fā)訓(xùn)練,以及包括底層怎么樣去進(jìn)行硬件和軟件的調(diào)優(yōu)。
DS/DA主要負(fù)責(zé)機(jī)器學(xué)習(xí)系統(tǒng)鏈路的末端,當(dāng)MLE把模型開發(fā)部署好之后,DS、DA會對產(chǎn)品端進(jìn)行數(shù)據(jù)分析和測試。
比如MLE把模型開發(fā)好了,但是對產(chǎn)品端和用戶端其實(shí)不是很了解,不知道這個(gè)模型在實(shí)際生產(chǎn)過程中能不能行,能不能取得消費(fèi)者的信任。這個(gè)時(shí)候DS和DA就可以做一套A/B testing,把用戶的流量分為一半一半,一半使用MLE的模型,一半不用,來測試模型的效果到底有多大。
02大公司/小公司的MLE
大公司業(yè)務(wù)復(fù)雜,比如說Meta、Google、Amazon或者Uber等等,MLE在模型的開發(fā)上就需要很多人力,所以需要DS、DA協(xié)作,來了解模型的feature以及在用戶端能否解決實(shí)際問題;而小公司通常需要MLE負(fù)責(zé)全流程工作。
有些公司的MLE也會做很多A/B testing的工作,因?yàn)樗麄兏私饽P停@時(shí)就不需要DS和DA的崗位。但是在大廠,業(yè)務(wù)的邏輯過于復(fù)雜,MLE也未必了解產(chǎn)品端到底怎么去收集用戶數(shù)據(jù),分析用戶消費(fèi)觀念,所以需要專門的DS和DA崗位來收集和分析數(shù)據(jù)。以及有些DS也需要利用機(jī)器學(xué)習(xí)的算法進(jìn)行建模,去幫助產(chǎn)品端和用戶端達(dá)到數(shù)據(jù)分析的目的。
MLE就業(yè)市場需求
01MLE薪資情況
上圖是Google, Meta和Uber這三所大廠的主要薪資,等級從L3到L6。L3基本上是剛畢業(yè)的學(xué)生,面試表現(xiàn)好的PhD畢業(yè)生或者有幾年工作經(jīng)驗(yàn)的人,有可能拿到L4的offer,L4的offer比L3薪資差不多翻一倍。之后如果繼續(xù)在這個(gè)領(lǐng)域深耕,就有可能拿到L5的offer,估計(jì)需要七到十年的工作經(jīng)驗(yàn)。L6對應(yīng)的是Staff Data Scientist,需要十幾年以上的工作經(jīng)驗(yàn)。

舉個(gè)例子,Meta對于L3剛剛畢業(yè)的同學(xué)可以給到18.9w美金的總包。總包包括基礎(chǔ)工資、績效獎金,以及一部分股票和期權(quán),總體來說大廠的薪資是十分慷慨的。
02什么樣的公司需要MLE
幾乎所有的廠都需要MLE,因?yàn)楝F(xiàn)在是傳統(tǒng)互聯(lián)網(wǎng)行業(yè)向人工智能行業(yè)轉(zhuǎn)型的時(shí)期,大廠、中小型公司和初創(chuàng)公司都需要MLE,只是不同公司對MLE的要求有所不同。
舉一個(gè)例子,比如Uber的MLE崗位,主要是利用機(jī)器學(xué)習(xí)算法來做推薦系統(tǒng)的開發(fā)。具體來說,MLE會根據(jù)海量的用戶交互數(shù)據(jù)(e.g. 你在Uber端點(diǎn)了幾個(gè)按鈕,訂了幾個(gè)外賣,叫了幾輛出租車),來對你進(jìn)行用戶畫像的建模。比如,你是一個(gè)20歲到30歲的硅谷碼農(nóng),平常不愛花錢,但比較有錢等等,之后對你進(jìn)行相應(yīng)的廣告推薦。
再比如Meta,它的MLE需求相當(dāng)多樣和廣泛。首先,因?yàn)镸eta有很多種社交產(chǎn)品(Facebook和Instagram等等),MLE要負(fù)責(zé)進(jìn)行用戶的肖像建模,然后去針對性地推送。比如說你打開Facebook就有很多推送,推薦一些你可能認(rèn)識的朋友;打開Instagram也會有推送視頻。其次,對于Meta這個(gè)體量的公司,每天有上億用戶來訪問Meta的服務(wù)器,每個(gè)人每天能夠接收到的都是TB級別的數(shù)據(jù),MLE也需要對數(shù)據(jù)進(jìn)行采集和分析。除此以外,還有最近非常火的大語言模型,也是需要MLE去參與和負(fù)責(zé)的。
MLE的準(zhǔn)備建議
申請者一個(gè)常見的迷惑是:MLE一定要PhD才能申請嗎?事實(shí)上,MLE崗位本科生和碩士生也可以申請,關(guān)鍵在于比較強(qiáng)的Engineering background和機(jī)器學(xué)習(xí)知識。MLE非常注重你能不能把算法很好地寫進(jìn)代碼里面,以及很好地部署到生產(chǎn)環(huán)境和硬件上。因此需要同學(xué)們熟練掌握數(shù)據(jù)結(jié)構(gòu)與算法、計(jì)算機(jī)基礎(chǔ)、計(jì)算機(jī)網(wǎng)絡(luò)、機(jī)器學(xué)習(xí)算法、統(tǒng)計(jì)知識,并且積累刷題(如LeetCode)和項(xiàng)目經(jīng)驗(yàn)(如Kaggle)。準(zhǔn)備MLE面試的過程中,首先要強(qiáng)化數(shù)據(jù)結(jié)構(gòu)和算法的基礎(chǔ),因?yàn)檫@些是寫代碼和實(shí)現(xiàn)機(jī)器學(xué)習(xí)算法的核心。其次要掌握計(jì)算機(jī)網(wǎng)絡(luò)和計(jì)算機(jī)組成的知識,了解計(jì)算機(jī)之間的通信和硬件組成。再者還需要熟悉常見的機(jī)器學(xué)習(xí)算法和統(tǒng)計(jì)方法,理解它們的原理和應(yīng)用場景。最后則是要通過刷LeetCode等題庫來練習(xí)編碼能力,刷題越多越好。
時(shí)間線
7-8月簡歷修改,背景補(bǔ)充
8-10月開始投遞明年暑假的招聘
10-12月份陸續(xù)收到面試,很可能會拿到
明年暑假實(shí)習(xí)的Offer明年暑假開始實(shí)習(xí),干得好就很有可能拿到Return Offer
提醒:
01MLE和RS的面試區(qū)別
RS和MLE的側(cè)重點(diǎn)并不一樣,RS更加偏向數(shù)理分析,看重對模型的理解。比如說Transformer、Bert、GPT架構(gòu),或讓你解釋一下什么是Attention,問得會非常細(xì)。在準(zhǔn)備上,MLE則更側(cè)重刷題(包括system design),而RS更需要從模型算法角度進(jìn)行準(zhǔn)備。
02相對于PhD,Master找MLE會不占優(yōu)勢嗎?
其實(shí)PhD并不會有很大的優(yōu)勢。MLE不僅僅只強(qiáng)調(diào)對ML知識的掌握,也對Engineering知識有要求。如果一個(gè)PhD被招進(jìn)公司卻只會模型研究或者模型論文的實(shí)現(xiàn),對Engineering's Tool(如Github或SQL)全無了解,那么公司也不會太喜歡。
很多企業(yè)并不需要眾多的人員來開發(fā)模型,通常由5-10人PhD的專業(yè)團(tuán)隊(duì)負(fù)責(zé)。反倒是需要更多人把這套模型部署到產(chǎn)品端,which means需要Master畢業(yè)的MLE把model寫成代碼,訓(xùn)練起來然后部署到不同的網(wǎng)頁端和移動端。所以MLE是一個(gè)包容性很強(qiáng)的工種,本科生、Master、PhD都可以申請,只要證明自己的實(shí)力過關(guān),engineering skillset和ML基礎(chǔ)夠強(qiáng)就沒問題。
以上就是關(guān)于機(jī)器學(xué)習(xí)工程師的全部內(nèi)容~如需留學(xué)申請幫助,歡迎聯(lián)系傳兮留學(xué)~
管老師
首席教育顧問
IECA美國獨(dú)立教育協(xié)會專業(yè)升學(xué)顧問
英國杜倫大學(xué)翻譯學(xué)碩士
十一年美國本科/本轉(zhuǎn)高端申請經(jīng)驗(yàn)
趙老師
美研資深留學(xué)顧問
德國TU-Freiberg經(jīng)濟(jì)數(shù)學(xué)碩士
7年美研申請指導(dǎo)經(jīng)驗(yàn)
300+學(xué)生成功錄取案例
美本申請服務(wù)詳情
美研申請服務(wù)詳情
美轉(zhuǎn)申請服務(wù)詳情
美高申請服務(wù)詳情
熱門資訊