導(dǎo)讀 數(shù)據(jù)標注工作在大語言模型的運行環(huán)境就像是一個內(nèi)容過濾器一樣,會對相關(guān)問題篩選出質(zhì)量比較高的回答,并且按照分數(shù)順序,最終將最高分數(shù)以
數(shù)據(jù)標注工作在大語言模型的運行環(huán)境就像是一個內(nèi)容過濾器一樣,會對相關(guān)問題篩選出質(zhì)量比較高的回答,并且按照分數(shù)順序,最終將最高分數(shù)以及最完美的回答呈現(xiàn)給用戶。這一部分的工作有的是依靠技術(shù)完成,有一部分則是需要依賴人工完成。
標注師日常的工作是對大模型生成的內(nèi)容進行評價以及反饋,通過人工標注的方式,讓大模型可以學(xué)習(xí)人類的思維方式,將大模型鍛煉得越來越聰明。百度智能源大模型標注師向記者介紹到:“和傳統(tǒng)的數(shù)據(jù)標注師要求不同,大模型標注師都需要本科以上學(xué)歷。我覺得主要是因為大模型數(shù)據(jù)涉及的知識面很廣,評判標準復(fù)雜,非??简灅俗r的語言理解能力和邏輯推理能力。在入職前兩個月,公司會對我們進行集體培訓(xùn)和考核,通過考核之后才能正式上崗。”