通信界訊 在過去的一年里,Scale AI的重點(diǎn)已轉(zhuǎn)向美國和歐洲。他們正積極招募白領(lǐng)和語言專家,為日益興起的大語言模型提供訓(xùn)練數(shù)據(jù)。這一轉(zhuǎn)變無疑加劇了人們對未來職業(yè)的擔(dān)憂,這些白領(lǐng)和語言專家正在訓(xùn)練將來可能取代他們職業(yè)的人工智能競爭對手。
2月21日消息,隨著傳統(tǒng)職業(yè)人員如語言專家、創(chuàng)意作家和核物理學(xué)家等逐漸成為“數(shù)據(jù)標(biāo)注工”,他們的職業(yè)前景正變得岌岌可危,最終可能被他們所培訓(xùn)的人工智能系統(tǒng)所取代。
以下是翻譯內(nèi)容:
杰伊(Jay)高中時(shí)愛上了數(shù)學(xué),他的物理老師向他展示了復(fù)雜微積分的樂趣。大學(xué)時(shí)期,杰伊專攻物理和數(shù)學(xué),夢想有朝一日能將自己的知識(shí)傳授給下一代。這個(gè)機(jī)會(huì)出現(xiàn)在2022年10月,當(dāng)時(shí)25歲的杰伊加入了一個(gè)在線平臺(tái),以數(shù)學(xué)專家的身份為方程式打分。但他的工作不同于傳統(tǒng)教師,他的工作重心將聚焦于訓(xùn)練一個(gè)人工智能系統(tǒng),而這恰恰可能使他的專業(yè)知識(shí)變得不再那么重要。
為了保護(hù)自己的隱私,杰伊選擇了使用化名。他透露,他當(dāng)時(shí)幫助培訓(xùn)的系統(tǒng)由OpenAI開發(fā),他的工作是為該公司的大語言模型(LLM)提供專家指導(dǎo)。這一機(jī)器學(xué)習(xí)系統(tǒng)具備聊天機(jī)器人的會(huì)話能力,并試圖提升其在數(shù)學(xué)領(lǐng)域的解題能力。在葡萄牙的家中,杰伊負(fù)責(zé)評估人工智能模型在解決數(shù)學(xué)問題時(shí)的步驟是否正確,通過添加點(diǎn)贊或不滿的表情符號(hào)來提供反饋,甚至在必要時(shí)解釋模型出錯(cuò)的原因。
杰伊知道,他是在為薩姆·奧特曼(Sam Altman)領(lǐng)導(dǎo)的OpenAI訓(xùn)練算法,因?yàn)樗谎埣尤隣penAI的Slack工作頻道。在與《連線》分享的截圖顯示,杰伊是名為“數(shù)學(xué)培訓(xùn)師”的小組成員,該小組是由OpenAI研究員尤里·布爾達(dá)(Yuri Burda)建立的。但杰伊并非直接為OpenAI工作,他的雇主是全球最大的數(shù)據(jù)勞動(dòng)平臺(tái)之一Remotasks。這家公司是美國初創(chuàng)公司Scale AI的子公司,2021年的估值已超70億美元,其客戶涵蓋了OpenAI、Meta、微軟和美國陸軍等。
Scale AI與客戶密切合作,提供和管理他們需要的訓(xùn)練數(shù)據(jù),以建立自動(dòng)駕駛汽車或大語言模型背后的人工智能模型。通常情況下,這些寶貴的數(shù)據(jù)往往來源于與Scale AI緊密合作的Remotasks簽約員工。自2017年成立以來,這家數(shù)據(jù)巨頭已與全球數(shù)十萬名員工建立合作關(guān)系,尤其是在勞動(dòng)力成本相對較低的國家,如菲律賓。Remotasks表示,菲律賓員工主要致力于自動(dòng)駕駛汽車的計(jì)算機(jī)視覺訓(xùn)練,幫助車輛精準(zhǔn)識(shí)別周圍環(huán)境。
然而,在過去的一年里,Scale AI的重點(diǎn)已轉(zhuǎn)向美國和歐洲。他們正積極招募白領(lǐng)和語言專家,為日益興起的大語言模型提供訓(xùn)練數(shù)據(jù)。這一轉(zhuǎn)變無疑加劇了人們對未來職業(yè)的擔(dān)憂,這些白領(lǐng)和語言專家正在訓(xùn)練將來可能取代他們職業(yè)的人工智能競爭對手。
杰伊對自己在未來工作中充當(dāng)?shù)慕巧M(jìn)行了深入反思。他承認(rèn)自己在傳遞知識(shí)給人工智能,但他堅(jiān)信,人工智能模型難以復(fù)制人類在解決復(fù)雜數(shù)學(xué)問題時(shí)的獨(dú)特能力。他期望自己參與的工作能夠創(chuàng)造出與他水平相當(dāng)?shù)牧奶鞕C(jī)器人,共同探索數(shù)學(xué)的奧秘,而非取代他的人工智能。他說:“當(dāng)我開始訓(xùn)練這些模型時(shí),這正是我所期待的!
面對人工智能系統(tǒng)的崛起,Scale AI負(fù)責(zé)數(shù)據(jù)運(yùn)營的副總裁威洛·普里馬克(Willow Primack)強(qiáng)調(diào),隨著AI系統(tǒng)開始生成知識(shí)和內(nèi)容,Remotasks等公司正尋求不同領(lǐng)域的專家?guī)椭,以確保人工智能應(yīng)用的準(zhǔn)確性和可靠性。隨著生成式人工智能在科技行業(yè)的廣泛應(yīng)用,數(shù)據(jù)提供商急需一批能夠進(jìn)行“專家事實(shí)核查”的新承包商。
杰伊的時(shí)薪高達(dá)60美元,他在OpenAI推出ChatGPT之前的一個(gè)月加入了Remotasks。自那時(shí)起,該公司加速招聘專業(yè)“數(shù)據(jù)標(biāo)注工”。據(jù)《連線》雜志報(bào)道,2024年1月,Remotasks發(fā)布了招聘廣告,尋找能夠掌握20多種歐洲語言的人才,以及美國的創(chuàng)意作家、體育記者、化學(xué)專家和核物理學(xué)家。
普里馬克說:“如果讓生成性人工智能完全依賴自身,它們可能會(huì)產(chǎn)生幻覺。即便它們提供的答案是事實(shí),也有辦法改進(jìn),使其更加全面。專家的參與至關(guān)重要,他們提供的數(shù)據(jù)能夠真正提升人工智能的能力。”
普里馬克表示,盡管Scale AI在菲律賓擁有龐大的運(yùn)營規(guī)模,但該公司正逐步將重心轉(zhuǎn)向美國和以英語為母語的歐洲地區(qū),尋求更多專業(yè)承包商的加入。普里馬克不太愿意透露到底是什么促使了這種轉(zhuǎn)變,是特定的Scale AI客戶要求更多的專家數(shù)據(jù),還是該公司試圖預(yù)測下一代AI需要什么?她稱兩者兼而有之,并解釋說,專業(yè)承包商正為眾多客戶培訓(xùn)數(shù)據(jù),而不僅僅是為單一客戶服務(wù)。
對于這一轉(zhuǎn)變的影響,行業(yè)研究人員給出了自己的解釋。德國魏森鮑姆研究所的數(shù)據(jù)、算法系統(tǒng)和倫理研究小組負(fù)責(zé)人米拉格羅斯·米塞利(Milagros Miceli)指出,過去大多數(shù)人工智能技術(shù)都是在大型、多樣化的數(shù)據(jù)集上進(jìn)行訓(xùn)練的。然而,隨著版權(quán)問題的日益突出,許多知名出版商開始禁止數(shù)據(jù)收集,這使得數(shù)據(jù)收集變得更加困難。因此,付錢給專業(yè)承包商成為了一種可行的解決方案。
“去年,很多公司都在創(chuàng)建新的數(shù)據(jù),以避免版權(quán)投訴!泵兹忉尩,“如果你雇傭一名作家專門為訓(xùn)練你的模型而寫故事,并支付他們薪水,那么你就擁有了這些文本的所有權(quán),也就解決了版權(quán)問題!
自ChatGPT等生成式人工智能技術(shù)亮相以來,越來越多的研究預(yù)測,在美國和歐洲,那些通常由受過大學(xué)教育的人占據(jù)的職業(yè)將面臨顛覆性的變革,而這些人以前通常被認(rèn)為不會(huì)受到技術(shù)變革的影響。盡管存在這些擔(dān)憂,但專業(yè)承包商提供的高薪工作仍然極具吸引力,可能讓一些人難以放棄可能導(dǎo)致他們失業(yè)的培訓(xùn)工作。
目前,專業(yè)職位的薪酬因?qū)I(yè)知識(shí)而異。根據(jù)最新的招聘信息,傳染病專家在遠(yuǎn)程培訓(xùn)任務(wù)上的時(shí)薪最高可達(dá)40美元,而歷史學(xué)家的時(shí)薪為32美元。然而,受雇于特定語言訓(xùn)練算法的人往往得到的報(bào)酬更少。例如,一份招聘保加利亞作家的廣告給出的時(shí)薪為5.64美元,而會(huì)說芬蘭語的專家的時(shí)薪幾乎是保加利亞作家的五倍,達(dá)到23美元。
最近剛大學(xué)畢業(yè)的安娜(Ana)住在西班牙,她認(rèn)為Remotasks為像她這樣的作家提供17美元時(shí)薪“非常高”。這項(xiàng)工作包括監(jiān)督名為Catalan的聊天機(jī)器人,然后對其回答進(jìn)行排序或糾正。安娜說:“我們必須糾正拼寫錯(cuò)誤,還要看看答案是否過于美國化。”
當(dāng)提示與色情或暴力有關(guān)時(shí),由安娜來確保機(jī)器人拒絕回答。她還被要求確保人工智能不能回答諸如“我應(yīng)該把畢生的積蓄投資在哪里?”之類的問題。
對安娜來說,這份工作很劃算。因?yàn)榈靥幤h(yuǎn),她可以在媽媽靠近海灘的房子里工作。“我度過了最美好的夏天,”她說,并解釋了她在2023年5月、6月和7月為遠(yuǎn)程任務(wù)采用的靈活時(shí)間表!霸20個(gè)小時(shí)內(nèi),我賺的錢比以前工作40個(gè)小時(shí)還多!彼桓嬷ぷ髁鶄(gè)月左右。但到了8月焚滅,僅僅三個(gè)半月后,任務(wù)開始減少。最終,她的經(jīng)理也不再回復(fù)她的信息。
安娜的經(jīng)歷表明,雖然白領(lǐng)“數(shù)據(jù)標(biāo)注工”的薪資可能高于東南亞同行,但他們?nèi)匀幻媾R著不確定性。杰伊和安娜都說,Remotasks突然切斷了他們的聯(lián)系,他們覺得自己被拋棄了,而原因他們并不完全了解。工作了一年之后,杰伊說他突然無法再領(lǐng)取平臺(tái)上的任務(wù)了。普里馬克也稱,當(dāng)被問及項(xiàng)目為何突然終止時(shí),Remotasks的解釋是,他們有時(shí)會(huì)暫停一個(gè)項(xiàng)目,以評估數(shù)據(jù)集的質(zhì)量。但普里馬克承認(rèn),這種情況相當(dāng)罕見。
那年夏天,安娜的朋友們圍繞她的新職業(yè)展開了深入的討論,擔(dān)憂這一趨勢是否預(yù)示著人工智能將逐漸取代他們的工作。但今天,她認(rèn)為這只是人類進(jìn)步的又一個(gè)篇章,一個(gè)她也可以利用的篇章。對她而言,人工智能不是威脅,而是助力,是她可以積極利用的工具。她說:“假設(shè)你不想在烈日下在土豆地里工作9個(gè)小時(shí)。你要想出一種技術(shù),讓它變得更容易!
安娜現(xiàn)在把這些反思運(yùn)用到自己的工作中,成為一名文案,利用人工智能來為她出謀劃策。