人工智能訓(xùn)練師:在數(shù)據(jù)海洋中練就“掘金術(shù)”
職教視野
人工智能訓(xùn)練師:在數(shù)據(jù)海洋中練就“掘金術(shù)”
耐心細(xì)致洗數(shù)據(jù)、掘金術(shù)模型訓(xùn)練數(shù)百次、人工調(diào)試參數(shù)到深夜,訓(xùn)練這是師數(shù)人工智能訓(xùn)練師的工作常態(tài),也是據(jù)海這一“新職業(yè)”的工匠精神所在。
從在校的洋中專業(yè)理論學(xué)習(xí),到參與校企合作項(xiàng)目、掘金術(shù)校內(nèi)人工智能工作坊深度實(shí)踐,人工再到勇于探索音頻領(lǐng)域現(xiàn)實(shí)應(yīng)用、訓(xùn)練獨(dú)立創(chuàng)業(yè)……寧波聲韻信息技術(shù)有限公司創(chuàng)始人、師數(shù)剛從寧波職業(yè)技術(shù)大學(xué)(以下簡(jiǎn)稱“寧職大”)人工智能技術(shù)應(yīng)用專業(yè)畢業(yè)半年多的據(jù)海00后創(chuàng)業(yè)者張哲屹看似年輕,但已是洋中人工智能訓(xùn)練師領(lǐng)域的“老手”。
張哲屹認(rèn)為:“人工智能不是掘金術(shù)高大上的理論,是人工需要像工匠一樣,在枯燥的訓(xùn)練數(shù)據(jù)海洋中通過千萬次的訓(xùn)練,去打磨出一個(gè)可用的模型?!?/p>
“十四五”期間,人力資源和社會(huì)保障部累計(jì)發(fā)布72個(gè)新職業(yè),其中就涵蓋“人工智能訓(xùn)練師”“智能制造工程技術(shù)人員”“虛擬現(xiàn)實(shí)工程技術(shù)人員”等新職業(yè)。
當(dāng)前,人工智能賦能千行百業(yè),創(chuàng)造出了更多細(xì)分的新崗位?!叭斯ぶ悄苡?xùn)練師”到底學(xué)什么?又有怎樣的就業(yè)方向和潛力?
“人工智能訓(xùn)練師”學(xué)什么?怎么學(xué)?
張哲屹告訴中青報(bào)·中青網(wǎng)記者,“對(duì)于這一新職業(yè),如果單指‘訓(xùn)練師’,只進(jìn)行模型的訓(xùn)練和調(diào)試,是不對(duì)的。這只是整個(gè)流程中比較靠后的環(huán)節(jié)?!?/p>
“從預(yù)處理階段的數(shù)據(jù)清洗和處理,到數(shù)據(jù)指標(biāo)設(shè)定和數(shù)據(jù)標(biāo)注,再到算法設(shè)計(jì)、建模,最后才是對(duì)成熟模型進(jìn)行訓(xùn)練、調(diào)優(yōu)?!睂幝毚笕斯ぶ悄芗夹g(shù)應(yīng)用專業(yè)主任曹瑛提到,“這些環(huán)節(jié)所需掌握的技能,學(xué)校都有對(duì)應(yīng)的課程?!崩鐧C(jī)器學(xué)習(xí)、人工智能數(shù)據(jù)服務(wù)、圖像處理技術(shù)、深度學(xué)習(xí)等,都是人工智能技術(shù)應(yīng)用專業(yè)的核心課程,“均從最基礎(chǔ)的原理展開教學(xué),幫助學(xué)生系統(tǒng)掌握神經(jīng)網(wǎng)絡(luò)等關(guān)鍵技術(shù)的核心邏輯”。
“例如,要訓(xùn)練同學(xué)視覺識(shí)別等方面技能的掌握情況,學(xué)校會(huì)設(shè)置‘工業(yè)零部件視覺檢測(cè)’項(xiàng)目。傳統(tǒng)的人工檢測(cè)方式,效率較低?!辈茜f,在教學(xué)中使用來源于真實(shí)業(yè)務(wù)場(chǎng)景的案例,再分解成一個(gè)個(gè)小任務(wù),去教會(huì)學(xué)生們整個(gè)流程所需的技能。
張哲屹就曾參加過學(xué)校與寧波鋼鐵有限公司合作的“鋼廠數(shù)據(jù)采集打標(biāo)服務(wù)”等校企合作項(xiàng)目,在實(shí)踐中進(jìn)一步鍛煉了其專業(yè)技術(shù)能力。
他還提到了學(xué)院的人工智能工作坊?!斑@里營(yíng)造了一種近乎實(shí)戰(zhàn)的研發(fā)氛圍,是我從一名學(xué)生向‘人工智能訓(xùn)練師’蛻變的關(guān)鍵期?!?/p>
以“數(shù)據(jù)標(biāo)注員”這一細(xì)分崗位為例,張哲屹認(rèn)為,正如有點(diǎn)調(diào)侃意味的“人工智能背后,有多少‘智能’就有多少‘人工’”之言,數(shù)據(jù)標(biāo)注在他看來是很重要的一個(gè)崗位。“以圖片的視覺識(shí)別模型為例,‘標(biāo)注’需要不斷訓(xùn)練模型對(duì)圖片中部分區(qū)域的框定準(zhǔn)確性,這是后續(xù)工作的基礎(chǔ)。一批‘標(biāo)注’質(zhì)量差的數(shù)據(jù),對(duì)于模型訓(xùn)練來說是毀滅性的?!彼J(rèn)為,“標(biāo)注”的質(zhì)量決定了整體模型的上限。
寧職大人工智能學(xué)院副院長(zhǎng)何頌頌介紹,學(xué)校人工智能技術(shù)應(yīng)用專業(yè)包括兩個(gè)方向:智能應(yīng)用和工業(yè)視覺?!按笠粌蓚€(gè)學(xué)期都是專業(yè)基礎(chǔ)課,這兩個(gè)方向的課程設(shè)置是一樣的。但大二、大三會(huì)有專門的專業(yè)課和實(shí)踐課,智能應(yīng)用方向有智能應(yīng)用開發(fā)、大數(shù)據(jù)應(yīng)用實(shí)戰(zhàn)等,工業(yè)視覺方向包含工業(yè)系統(tǒng)應(yīng)用項(xiàng)目實(shí)戰(zhàn)、計(jì)算機(jī)視覺應(yīng)用實(shí)戰(zhàn)等課程?!?/p>
南京信息職業(yè)技術(shù)學(xué)院(以下簡(jiǎn)稱“南信院”)在高職院校中最早成立人工智能學(xué)院,該校人工智能學(xué)院院長(zhǎng)何淼告訴中青報(bào)·中青網(wǎng)記者,自設(shè)立人工智能技術(shù)應(yīng)用專業(yè)以來,學(xué)校始終緊跟技術(shù)發(fā)展的市場(chǎng)趨勢(shì),更新專業(yè)培養(yǎng)方案。圍繞人工智能應(yīng)用開發(fā)技術(shù)鏈前端數(shù)據(jù)崗位群、末端應(yīng)用開發(fā)崗位群,形成人工智能學(xué)院的專業(yè)區(qū)分定位。
2024年,該校又率先新增了“人工智能數(shù)據(jù)工程技術(shù)專業(yè)”。何淼認(rèn)為,“前期人工智能技術(shù)應(yīng)用,更多是對(duì)傳統(tǒng)經(jīng)典算法的使用。隨著人工智能技術(shù)不斷發(fā)展,我們發(fā)現(xiàn)‘算法再好,沒有好的數(shù)據(jù)還是不行’。未來人工智能賦能千行百業(yè),都需要各個(gè)領(lǐng)域的高質(zhì)量數(shù)據(jù),這就催生出諸如‘人工智能數(shù)據(jù)工程師’等崗位。”因此,基于人工智能技術(shù)的數(shù)據(jù)基座邏輯,該院在專業(yè)設(shè)置方面已開始提前布局。
在競(jìng)賽考證中,充滿“技能值”
在剛結(jié)束不久的第五屆全國(guó)工業(yè)設(shè)計(jì)職業(yè)技能大賽決賽中,寧波職業(yè)技術(shù)大學(xué)人工智能技術(shù)應(yīng)用專業(yè)大二學(xué)生留梓菡拿下了人工智能訓(xùn)練師賽項(xiàng)學(xué)生組冠軍。
“這個(gè)比賽分考查理論和實(shí)操兩部分,有5個(gè)模塊,包括:智能家居搭建,數(shù)據(jù)信息處理,模型的調(diào)試和運(yùn)用,智能體搭建,圖片生成、聲音克隆等智能模型的生成。選手需要在4個(gè)半小時(shí)內(nèi),完成所有模塊的任務(wù),按點(diǎn)計(jì)分。”留梓菡說。
她提到,自己是在學(xué)校的人工智能工作坊中,獲取到一些校企合作項(xiàng)目和參與各種競(jìng)賽的信息資源。
張哲屹曾參加過第二屆全國(guó)工業(yè)和信息化技術(shù)技能大賽,那是他第一次深刻體會(huì)到“人工智能訓(xùn)練師”的含義。他記得,在老師們的指導(dǎo)下,“為了提升模型在特定工業(yè)場(chǎng)景下的識(shí)別精度,我們團(tuán)隊(duì)反復(fù)進(jìn)行了數(shù)百次的模型訓(xùn)練與迭代?!庇性S多個(gè)夜晚,團(tuán)隊(duì)成員一起盯著屏幕上的損失函數(shù)曲線,一行行地檢查預(yù)處理管線,一遍遍地調(diào)整超參數(shù)。
通常在大三時(shí),同學(xué)們會(huì)去考“人工智能訓(xùn)練師”這一證書?!皩W(xué)校人工智能技術(shù)應(yīng)用專業(yè)2024屆學(xué)生共163人,162人拿到了這個(gè)證書。”寧職大人工智能學(xué)院教師李超煒介紹道。
早在2021年,人力資源和社會(huì)保障部就已發(fā)布《人工智能訓(xùn)練師國(guó)家職業(yè)技能標(biāo)準(zhǔn)》,提出“人工智能訓(xùn)練師是指使用智能訓(xùn)練軟件,在人工智能產(chǎn)品實(shí)際使用過程中進(jìn)行數(shù)據(jù)庫(kù)管理、算法參數(shù)設(shè)置、人機(jī)交互設(shè)計(jì)、性能測(cè)試跟蹤及其他輔助作業(yè)的人員”。
該新職業(yè)包含數(shù)據(jù)標(biāo)注員、人工智能算法測(cè)試員兩個(gè)核心工種,共設(shè)五個(gè)等級(jí),依次為初級(jí)工、中級(jí)工、高級(jí)工、技師和高級(jí)技師。李超煒表示,“學(xué)生的專業(yè)技能和考這個(gè)證書的技能是一致的,基本上都能拿下三級(jí)/高級(jí)工的證書?!?/p>
浙江工商職業(yè)技術(shù)學(xué)院人工智能學(xué)院副院長(zhǎng)李福安告訴中青報(bào)·中青網(wǎng)記者,該校2025屆首屆人工智能技術(shù)應(yīng)用專業(yè)畢業(yè)生,在“人工智能訓(xùn)練師”高級(jí)工證書方面的下證率達(dá)到“全員通過”。李福安認(rèn)為,這個(gè)證書在一定程度上能反映學(xué)生們的基本技能水平,有助于其求職就業(yè)。
人工智能“新職業(yè)”需面向現(xiàn)實(shí)場(chǎng)景
隨著人工智能技術(shù)和產(chǎn)業(yè)迅速迭代升級(jí),新的專業(yè)、職業(yè)正在迅速豐富。何淼表示,“可以預(yù)估,未來人工智能產(chǎn)業(yè)的崗位肯定呈體系化布局,中職、高職、本科都會(huì)有差異化定位的新職業(yè)出現(xiàn)。職業(yè)教育需要更加及時(shí)地調(diào)整相應(yīng)的專業(yè)設(shè)置和更新技能人才培養(yǎng)的模式”。
他進(jìn)一步補(bǔ)充道,光是前期的數(shù)據(jù)采集處理和測(cè)試、數(shù)據(jù)集開發(fā)等環(huán)節(jié),就可能產(chǎn)生“人工智能數(shù)據(jù)服務(wù)員”“人工智能數(shù)據(jù)工程師”等崗位,未來甚至可能會(huì)有“人工智能數(shù)據(jù)集測(cè)試質(zhì)檢員”“數(shù)據(jù)資產(chǎn)交易員”等更細(xì)分的崗位?!霸凇丁?dāng)?shù)據(jù)要素×’三年行動(dòng)計(jì)劃(2024-2026年)》背景下,這些新職業(yè)都可能在數(shù)據(jù)市場(chǎng)化配置過程中應(yīng)運(yùn)而生?!?/p>
產(chǎn)教融合的培養(yǎng)體系之下,張哲屹敏銳地發(fā)現(xiàn)了音頻合成領(lǐng)域的痛點(diǎn):市面上的相關(guān)資料稀缺,且落地產(chǎn)品很少。于是,畢業(yè)后,他創(chuàng)立了公司,專注于實(shí)時(shí)語(yǔ)音轉(zhuǎn)換服務(wù)。短短3個(gè)月,公司運(yùn)營(yíng)的平臺(tái)用戶已突破3萬人。并且,為了推動(dòng)音頻領(lǐng)域AI的發(fā)展,張哲屹選擇開源數(shù)個(gè)核心訓(xùn)練成果,讓更多開發(fā)者能在此基礎(chǔ)上繼續(xù)探索。
面對(duì)AI“新職業(yè)”的廣闊前景,學(xué)校面向當(dāng)?shù)禺a(chǎn)業(yè)和現(xiàn)實(shí)需要辦學(xué),培養(yǎng)“直接能上手、入職就能干”的職業(yè)技能人才。
此前,寧職大啟動(dòng)了第二批“海康機(jī)器人工業(yè)視覺訂單班”的招募?!?024年首批學(xué)生通過訂單班培養(yǎng),已全部加入??翟趯幉ǖ貐^(qū)的核心經(jīng)銷商體系,以工業(yè)視覺工程師身份負(fù)責(zé)客戶現(xiàn)場(chǎng)方案調(diào)試、設(shè)備運(yùn)維及技術(shù)培訓(xùn)工作,服務(wù)領(lǐng)域覆蓋汽車零部件檢測(cè)、智能倉(cāng)儲(chǔ)分揀等新質(zhì)生產(chǎn)力領(lǐng)域?!辈茜f。
她強(qiáng)調(diào),正是基于首批合作在人才輸送精準(zhǔn)度、崗位適配性上的成功實(shí)踐,此次第二批訂單班在課程設(shè)置、實(shí)訓(xùn)安排上進(jìn)一步優(yōu)化,將更精準(zhǔn)對(duì)接??诞a(chǎn)業(yè)鏈上下游的人才需求。
相比于人工智能相關(guān)專業(yè)的本科生、研究生,職業(yè)院校的同學(xué)畢業(yè)后直接進(jìn)入大廠、車企、大型工業(yè)企業(yè)的難度比較大?!暗牵覀?yōu)橥瑢W(xué)們規(guī)劃的職業(yè)路徑就是,先進(jìn)入這些企業(yè)的下游集成商,在實(shí)際的AI應(yīng)用場(chǎng)景中鍛煉解決問題的能力、提升技能。這樣經(jīng)過幾年的工作經(jīng)驗(yàn)積累,同學(xué)們也有機(jī)會(huì)進(jìn)入到上游、更高層次的一些企業(yè)中,或者自己成為獨(dú)立的集成商?!焙雾烅炋寡?。
此外,寧波當(dāng)?shù)氐闹圃鞓I(yè)企業(yè)數(shù)量較多,許多公司正在進(jìn)行智能化改造,需要相應(yīng)的技術(shù)運(yùn)維人員,“學(xué)生們?nèi)ゴ祟惣缮唐髽I(yè),工作常態(tài)就是去各種行業(yè)的企業(yè)、工廠,為其搭建整體的智能化改造方案,并進(jìn)行技術(shù)運(yùn)維。”何頌頌說。這也是人工智能技術(shù)應(yīng)用專業(yè)賦能、跨界的生動(dòng)體現(xiàn)。
中青報(bào)·中青網(wǎng)記者 李思 來源:中國(guó)青年報(bào)
2026年01月09日 07版