他山之玉 | 认知劳动与数据标注中的劳动掌握——以N人工智能公司为例

娱乐 2年前 阅读:5 评论:0

贾文娟

上海大学

社会学系

副传授

颜文茜

上海大学

社会学系

硕士研究生

认知劳动与数据标注中的劳动掌握

——以N人工智能公司为例

展开全文

来源 | 《社会学研究》2022年第5期

做者 |贾文娟、颜文茜

实要根究人工智能的将来,比力值得参考的仍然是卡尔·马克思的理论,而不是史蒂文·斯皮尔伯格的片子。

——尤瓦尔·赫拉利,《人类简史:从动物到天主》

一、问题的提出

2016年11月,国务院印发了《“十三五”国度战术性新兴财产开展规划》(国发〔2016〕67号),那份文件明白地指出要“培育提拔人工智能财产生态,促进人工智能在经济社会重点范畴妥帖利用”。2017年7月,国务院印发《新一代人工智能开展规划》(国发〔2017〕35号),提出要“把人工智能开展放在国度战术层面系统规划、主动谋划”,到2025年,“人工智能核心财产规模超越4000亿元,带动相关财产规模超越5万亿元”。同年10月,党的十九大提出要“鞭策互联网、大数据、人工智能和实体经济深度合成”。在强有力的财产政策鞭策下,中国人工智能核心财产规模在2022年超越了4000亿元,企业数量超越了3000家。人工智能财产的兴旺开展及其宽广远景敏捷引发了中国哲学社会科学范畴的极大兴致与强烈热闹讨论。

社会科学研究者围绕人工智能开展下的劳动体例与劳动关系变迁议题展开的讨论值得存眷。手艺哲学从形而上的角度审慎地指出,今天的人类文明正在过渡为手艺的类人文明。在那小我机交融的赛博格时代,人类的核心价值将被放置于机器的设想过程之中,使手艺类人化;与此同时,劳动者不再是手艺掌握的对象,他们将通过身体和精神的手艺化成为手艺的承载者与操控者(孙周兴,2019)。与手艺哲学对将来劳动的乐看料想差别,围绕人工智能财产的社会调研成果闪现出了另一番图景。一方面,围绕造造业的研究指出,人工智能将进一步降低传统财产工人在消费中的自主性,以至将中低手艺工人抛离出造造业。许怡和叶欣(2020)发现,机器人正在将大量劳动者从传统财产中排斥出往,中国造造业正在履历以“智能化”和“省人化”为目标的“机器换人”,并将带来劳动力构造的两极分化。王潇(2019)认为,人工智能在造造业中的利用体例是将核心科学原理、科学思维从常识消费的根本技能中抽离,该过程使工程师等常识性员工陷进了“手艺空心化”的境地。另一方面,围绕骑手等平台劳工的研究展现,平台经济与数字劳动的鼓起编织出了一张算法收配之网。该收配形式借助数字手艺对治理诉求停止了转译(姚建华,2019;孙萍,2022),通过重塑劳动过程的时空属性、占有和垄断数据信息、再分配治理掌握权、鼓吹自在意识形态等理论战略,对劳动者的动作体例与思惟感触感染停止引导、评估和规训(冯向楠、詹婧,2019;孙萍,2019;陈龙,2020;李胜蓝、江立华,2020;Kellogg et al.,2022)。研究者指出,在监控本钱主义时代,劳动收配逻辑从操纵劳动者主体性的“确立标准”走向了使劳动者成为载体的“常态标准”(郑广怀,2021)。上述研究为我们进一步阐发新手艺下的劳动体例变迁供给了坚实根底。不外,学界现有研究更多地切磋算法对劳动者的影响,研究对象多为人工智能的利用者。关于消费人工智能的劳动是如何停止的,研究仍然不敷。我们亟须将研究目光转向人工智能的消费者,显示他们的劳动体例与劳动理论。

在认知本钱主义理论范式下(Boutang,2011),IT法式员往往被看做最典型的研究对象。国外研究者指出软件消费是围绕“永久的测试”(permanently beta)和没完没了的“调试”(debug)停止的,工程师文化、工做乐趣、性别气量等在提拔劳动者消费力、创造性上起着重要感化(Neff Stark,2004;Kunda,2006;Wu,2018);国内研究者则从虚拟团队工做体例、劳动者自主性、劳动群体分化等角度进手,讨论了法式员的劳动附和是若何在“横虚纵实”的组织构造、“以自我为企业”的意识形态和“朝上进步自我”的逃求下生成的(梁萌,2016;王程韡、杨坤韵,2019;严霞,2020)。但人工智能的消费者不只限于法式员。近年来,跟着人工智能手艺从符号主义导向下的“报酬建构模子”阶段推进到统计主义导向下的“机器进修”阶段,以深度进修、强化进修算法等为核心东西的人工智能算法成为支流手艺。一个新的劳动群体——数据标注员——呈现了。出格当海量数据成了最为重要的消费材料与劳动对象时,人工智能企业对处置数据分类、清理和标注等工做的数据标注员的需求闪现井喷式的开展。2019年12月,人社部就业培训手艺批示中心在《关于拟发布新职业信息公示的布告》(中就培函〔2019〕67号)中首度将涵盖数据标注员在内的“人工智能操练师”列为新职业。据揣测,至2022年,以数据标注员为代表的人工智能操练师相关从业人数有看到达500万人。

寡所周知,劳动听数的增加其实不一定带来消费效率的提拔与本钱积存的增加。布雷弗曼(1978:52)曾指出,“本钱家在购置能做许多工作的劳动力的同时,也买得了很不确定的量和量”,而在那些由重生产力促发的新财产中,前者总面对若何“从劳动力的潜力中获得劳动的更大有效功效”的难题。劳动者的主看情状、他们以往的汗青、工做的一般社会前提、企业的特殊前提,以及工人劳动的手艺情况等方面的限造,都为剩余价值的获得设置了障碍。那么,数据标注员的劳动体例是如何的?治理方又是若何对其停止劳动掌握,以更大程度地从其身上获得剩余价值的?那即是本文试图答复的问题。

近年来,已有学者起头存眷数据标注员的工做情况。西方学者对以硅谷为中心、辅助消费者漫衍全球的人工智能消费收集的阐发指出,人工智能需要大量数据标注员、内容审核员等处置辅助性的“鬼魂工做”(Shestakofsky,2018;格雷、苏里,2020)。但数据标注研究的理论潜力不该仅限于此,它还能够用于显示新手艺下的劳动体例与劳动掌握的变迁。本文发现,人工智能产物的消费者处置的是通过人机交互将人类认知才能付与机器的认知劳动。在那一劳动过程中,治理者通过认知原则化、认知反应、认知加速等环节,以监视进修的体例,鞭策劳动者认知系统的改变,使其与机器相耦合。从体力劳动到认知劳动,往手艺化的趋势照旧存在,但劳动掌握体例已从僵化、刻板的身体规训走向了柔性、深进的认知整饰,治理权利的运做机造亦从以征服肉体为指向的“福柯式微看物理学”走向了以引导思维为主的“西蒙式认贴心理学”(福柯,2021)。

二、研究办法与案例介绍

为了清晰地阐发人工智能财产中数据标注员的劳动过程,研究者在2019年6月到2020年2月间,以练习生的身份在S市N公司中的Z标注团队中停止了为期8个月的田野查询拜访,并对包罗数据标注员、产物司理、算法工程师、测试法式员在内的30名被访者停止了半构造式访谈。本部门将对案例企业开展情况和案例团队的构成情状停止介绍。

(一)领先城市中的领先企业

跟着国度一系列关于人工智能开展规划文件的出台,各省市也起头积极响应落实。做为具有全球影响力的科创中心城市,S市积极响应国度手艺立异号召,已成为中国人工智能开展的中心之一。2017年11月,S市政府印发《关于本市鞭策新一代人工智能开展的施行定见》,提出要在2020年构成具有国际合作力的人工智能重点财产集群,建成5个摆布人工智能特色财产集聚区,培育提拔10家摆布标杆企业,其人工智能重点财产规模将超越1000亿元。在财产政策的加持下,S市人工智能核心企业在2019年7月打破了1000家,泛人工智能企业超越了3000家,人工智能相关财产规模超越了700亿元,成为中国人工智能开展的领先地域之一。

N公司成立于2012年,近年来依靠人工智能算法手艺敏捷兴起。2018年10月,N公司完成了由软银领投的30亿美圆融资,估值到达750亿美圆,成为全球更具价值的人工智能手艺企业之一,并参与到与国表里各巨头公司的手艺竞赛和市场酣战之中。为了与合作敌手抗衡,N公司试图补全本身的赛道矩阵,将目光瞄向了教导行业。2017年,N公司收买了S市一家AI教导企业,期看以此打造本身教导品牌。该品牌主打两款AI教导产物,其一是具备摄影搜题功用的硬件产物,其二是主打少儿英语的在线AI课程。那两款产物以N公司的领先算法为卖点,都需要数据标注员手动录进海量数据。

然而,N公司所处的市场情况其实不乐看。近年来,智能产物的市场盈利正在释放,各财产都竭尽全力地婚配人工智能手艺。与此同时,各人工智能企业也在竞相缩短产物的消费周期。2015年,人工智能企业消费单个亿分之一精度算法模子需要10名劳动者工做6个月,到了2019年则仅需要1名劳动者工做3天。财产的狂飙开展对劳动消费率提出了更高要求。关于N公司而言,产物上线速度、用户问题处理速度、产物更新速度关于博得合作十分重要。那种市场压力层层向下传导,最初落到了Z标注团队的身上。

(二)小团队的大能量

近年来,贵州、河南等省的诸多城市争相成立中国人工智能数据标注财产基地。本地数据办事类企业与处所政府停止协做,组建由职校学生工、中年女性、残障人士等当地劳动力构成的数据标注大团队,为人工智能企业供给数据外包办事。除此以外,良多企业为了随时获得高量量的数据集,也在公司内部组建了由高受教导水平劳动力构成的数据标注小团队。从消费过程、工做要求、工做体例上看,那些内部小团队与外包大团队是一致的,但其组织治理愈加详尽。因为那些小团队既能反映出所有数据标注劳动的配合特量,又能表现人工智能领先企业遭遇的更复杂、前沿的问题,所以对其停止研究有助于更清晰地闪现数据标注工做的劳动特征。

Z标注团队是N公司基于AI教导产物消费需要自行组建的内部小团队。在研究者调研期间,Z团队仅有16名成员,且都不是N公司的正式员工。从受教导水平上看,9人是数据外包企业派驻过来的员工,都是国内本科院校的结业生,5人是国内“211”以上程度大学在读的高年级本科生或研究生,剩余2人是从美国高校结业回国的专业硕士。从工资轨制上看,数据标注员不参与N公司的绩效查核,练习生按日领取100~200元的酬金,外包员工工资为每月4000~5000元。从组织层级上看,数据标注员处于产物司理、算法法式员、标注组长三方的配合治理下。此中,产物司理负责监视消费速度,算法法式员负责治理量量,标注组长负责分发使命。在灵敏开发形式下,数据标注工做与算法搭建同步停止,标注员要敏捷领略算法法式员的需要并称心其要求。凡是而言,N公司数据标注项目标时长在两周以内,最长不超越一个月,那与贵州等地标注大团队的项目时长是一致的。

令人惊异的是,那个看似边沿的小团队却能以每周标注上万条数据的速度来撑持算法模子的完美,助力后者参与市场合作。那么,Z团队是若何做到那点的?其劳动体例是如何的?接下来,我们将不只从劳动形态、劳动分工进手,讨论人工智能消费中的认知劳动,还从劳动掌握角度进手,阐发Z团队劳动消费率是如何得到更大程度提拔的。

三、认知劳动:数据标注员的劳动体例

在工业消费的劳动过程中,治理方无论面临机床操做工、流水线工人仍是办公室白领工人,都试图在“概念—施行”别离的逻辑下摘取“往手艺化”的手段,将劳动者做为机器的填补纳进消费过程之中,使劳动从劳动过程的主看因素降级为无生命的客看因素,以提拔劳动消费率(布雷弗曼,1978:152)。但在人工智能财产中,数据标注员的劳动体例与传统劳动差别。接下来,笔者将讨论认知劳动的劳动形态、劳动分工及劳动消费率的提拔难题。

(一)劳动形态:认知劳动的浮现

劳动是“人以本身的活动来中介、调整和掌握人和天然之间的物量变换的过程”(马克思,2009:207、208),人类劳动的自觉性、自有性和社会性使其成为“一切汗青的一种根本前提”(马克思,2009:21)。劳动形态是对人们用以消费特定对象物所挪用的详细劳动的归纳综合,它一般是由劳动成果所确定的(布雷弗曼,1978:281)。在差别时代,总有一种根底性的人类潜能从劳动群体身上被提取出来,与消费材料连系在一路,创造出大量财产。在工业时代,那种潜能是体力;在办事业时代,那种潜能是感情;而在人工智能时代,治理方从数据标注员身上抽取的则是认知。那么,那种“认知”详细是什么呢?

(二)劳动分工:往手艺化逻辑的延续

劳动分工是现代工业组织的根本原则,也是本钱从劳动者身上获取人类潜能的根本体例。摘取“概念与施行”别离的原则停止劳动分工,使复杂劳动变成简单劳动、整体工人成为部分工人、劳动者成为机器的填补,是本钱从“劳动力的潜力中获得劳动”更高效的体例,因而成为各财产竞相摘用的劳动掌握体例(布雷弗曼,1978:111)。但是,在人工智能开展初期,认知劳动是整合性的。科学家需要自行清理小规模的通俗数据,并借此创建算法模子。固然巴贝奇在19世纪30年代就提出科学家能够根据“概念与施行”别离的原则造造对数函数(Babbage,2009),但在手艺限造下,曲至20世纪80年代,研发者仍需亲身处置数据。进进21世纪,跟着互联网开展、大数据的产生、人工智能算法的呈现,认知劳动也走向了往手艺化。同时,认知劳动者分化为三类:处理总体性问题的架构师、应对复杂问题的法式员以及处置简单问题的数据标注员。

所以,今天的人工智能企业与其工业造造业前辈一样,以“概念与施行”别离的逻辑来推进劳动分工。仍然有一收劳动力大军做为机器的辅助,处置着施行端的简单工做。但从详细人机关系上看,数据标注员不像体力劳动者那样是机器的手臂,也不像感情劳动者那样是机器的面目面貌,而是成为搀扶帮助机器辨认和承受外界信息的觉得器官。

(三)劳动消费率:双重不确定性悖论下的难题

从劳动分工角度看,数据标注工做的难度其实不高,但提拔认知劳动的劳动消费率并没有想象中随便。那次要是因为认知劳动的推进存在着“双重不确定性悖论”——那与该劳动的人机交互特量密切相关。认知劳动的第一重不确定性是“布雷弗曼型不确定性”(布雷弗曼,1978),指的是固然雇主购置了劳动者在必然时间内的劳动才能,但其所能获得的量与量都是不确定的。在那种情状下,治理方倾向于以合理化、原则化的体例组织消费,尽可能地削减劳动者主看因素与其他因素对劳动过程的推进形成影响。劳动的第二重不确定性为“波兰尼型不确定性”,那与劳动形态相关,指的是大千世界的复杂性超出了计算机法式所涉及的范畴,因而需要人们发扬其认知效能、运用本身的“默会常识”来填补机器认知的不敷(波兰尼,2017)。双重不确定性悖论意味着:若过于强调劳动过程的原则化,就会障碍劳动者对人类认知潜能的足够发扬,人机交互天然难认为继;但若付与劳动者过多认知自主性,又会影响标注速度的提拔,招致消费效率受损。更糟的是,人类认知体例千差万别,“波兰尼型不确定性”的存在增加了应对“布雷弗曼型不确定性”的难度。在工业消费中,治理方往往利用拆配流水线来提拔工业劳动消费率,但“双重不确定性悖论”的存在为治理方以此逻辑提拔认知劳动消费率设置了难题。

综上,数据标注工做背后的劳动形态不再是传统的体力劳动,而是在人机交互中将人类认知付与机器的认知劳动;但认知劳动的分工仍遵照着往手艺化的逻辑,数据标注员承担着与流水线工人类似的简单劳动。同时,认知劳动的推进存在“双重不确定性悖论”,治理方只要摘取与认知劳动本身特征相符的劳动掌握体例,才气有效提拔标注员的劳动效率。那么,认知劳动的劳动掌握体例事实是如何的呢?其与工业消费有何异同?那是本文接下来要讨论的问题。

四、认知整饰与数据标注过程中的劳动掌握

在工业消费中,治理方的劳动掌握核心是借助主动流水线,更大程度减小工人肢体的挪动幅度、简化工人的动做,提拔其与机器的共同速度。相较之下,认知劳动的核心并不是单纯简化标注员的认知或武断消弭她们的认知,而是要鞭策其认知形式的转换——即从人类的天然认知形式转换为计算机需要的产生式认知形式。但人脑与计算机的信息处置体例差别:人脑依靠习惯、想象、曲觉等对事物停止量性理解,其认知往往模糊和不确定;计算机则借助逻辑推演、数据计算对信息停止求解,其认知严谨、准确,但适应性较差(西蒙,2020)。认知系统的转换并不是易事。霍克希尔德(2020)利用“整饰”指涉企业使劳动者根据特定原则改动本身设法的治理体例。Z团队的理论展现,治理方摘用了与人类进修过程相仿的认知整饰战略,并通过认知原则化、认知反应、认知加速三个环节,改变了劳动者的认知形式。

(一)认知原则化

刘易斯等认为,人们存在两种认知形式,天然形态下的无意识认知形式与劳动消费中的有意识认知形式,治理者往往通过要乞降监视来转化劳动者的认知形式(Louis Sutton,1991:60)。认知形式转化的首要环节是认知原则化,治理方试图据此为数据标注员设定认知规则与标尺。

Z团队的数据标注员并没有承受过专业的ICT手艺操练,其思维持有的都是关于外在世界的天然认知,并闪现出模糊、含混、杂乱等特征;面临哆啦A梦的图片,可能做出猫、机器人、机器猫等差别揣度,难以消费出契合算法模子需要的“原则数据”。在那种情状下,为了削减因人们的认知差别而招致的劳动效率损耗,治理方会在项目开展伊始运用两种办法来鞭策标注员认知形式的原则化。

第一,草拟《标注细则》,设定认知标尺。《标注细则》是一份事无巨细地写明标注流程及标注规则的电子文档,目标是用来批示标注员的详细劳动体例。一般而言,它是在项目起头时由产物司理和法式员根据产物需乞降手艺道路配合造定,其目标是为认知系统的转换指明标的目的。算法法式员M9就如许回忆其参与造定《标注细则》时的设法:

1.利用多边形框/矩形框对文本行停止框选;

2.不克不及呈现一个文本框完全包罗另一个文本框的情状;

3.关于弯曲的文本行尽量利用多点标注;

4.一个框内不成包罗多个文本行……

第二,停止标注培训。2019年11月,因法式在测试过程中呈现问题,Z团队全体人员投进到标注“口算题”的告急使命中。然而,照片中的题型纷繁复杂,《标注细则》上展示出的口算题不只有通俗四则运算、比值,还有单元换算、解方程等等。那时,算法法式员M9便让各人带着条记本电脑到会议室聚集,听其讲解规则。他先将本身的电脑投屏于会议室幕布上,然后一条一条地给各人停止示范。针对通俗四则运算,他以“(45-38)+5=12”那道题为例,翻开标注操做界面,展现若何拉框。如斯那般,M9针对每一条原则规则,都举了两三个例子停止阐明,以期通过反复的体例来强化标注员的记忆,同一各人对各条细则的理解。

在办事业中,感情劳动者往往能在培训中掌握感情系统改变的密码。但Z团队治理方对培训的期许却没有那么高。其标注培训成果与大学生常识进修情况很类似——治理方晓得,单纯的讲解与培训无法使标注员完全消化和掌握细则,后者还需要在理论中停止操练。不外,治理方也其实不需要标注员完全理解细则。认知形式转换是个步步深进的过程,认知原则化环节的核心目标是为标注员设定出认知标尺、进步她们的重视力,让所有报酬“转换本身的认知形式”做好意理预备。待她们预备安妥,就会进进认知形式转换的重头戏了。

(二)认知反应

当数据标注员领略治理方的要求后,他们就要起头调整本身的认知形式了。不外,即使标注员拥有“以计算机需要的体例停止认知”的优良意愿,他们也未必都能胜利。那是因为,就小我而言,标注员对标注细则的理解存在形形色色的偏误;就工做使命自己而言,标注中总会呈现《标注细则》未涵盖的情况。那时,为期3—4天的认知反应就极为重要。治理方会在那个环节纠正标注员的认知偏误,消弭其认知形式与机器需要之间的误差。

拉扎拉托(2019)曾指出,跟着人类经济开展从依托物量消费开展至依托非物量消费,劳动掌握的目标便不再只是人类的身体和动作了,本钱起头觅觅一种间接的办法来成立对主体性自己的收配。在那种情状下,消费的有序停止逐步有赖于自我程控性劳动者,而治理形式也从“间接掌握”开展为“责任自治”(卡斯特,2001;梁萌,2016)。N公司同样不期看本身的数据标注员是大意草率、被动期待和懒于根究的。在认知反应环节,治理方不只要求数据标注员随时发扬本身的深思才能,及时发现认知偏误,还鼓舞后者随时与治理方停止沟通,向其反应工做中呈现的问题。详细而言,治理方次要摘用了与“理论配合体”理念类似的三种情境进修法来推进认知反应(Wenger,1998)。

第一,挑选更擅长沟通、反应的劳动者。固然数据标注是一份门槛较低的工做,但Z团队所有标注员都颠末了人力资本部分干事、产物司理和算法法式员的三轮面试才进进公司。好比,算法法式员M13说:

N公司标注岗位的应聘者大多是S市及四周高校的学生以及ICT办事外包公司的人员。固然外包人员的工做不变性高于练习生,但因为练习生更擅长与法式员停止沟通,反而更受欢送。

第二,鼓舞劳动者随时就工做中呈现的问题提出讨论。算法法式员在标注培训完毕后会立即拉起工做群,密切跟进,实时监视,以鞭策数据标注员在工做群组中及时反应其碰着的问题。好比,算法法式员M7在每次交代使命时城市提醒标注员们及时反应:

尔后,各人看到任何不甚了了或可能引起问题的标注办法,城市发到群中询问。在那个过程中,治理方会一再申明算法模子需要的数据是如何的、计算机的认知体例是若何的,标注员之间也经常彼此讨论。如斯,标注员的认知行为就逐步走向了同一。

第三,向劳动者停止认知反应。认知反应是双向的,治理方也经常向数据标注员反应问题。算法法式员经常对标注数据停止抽查,假设发现不合格之处,就会发到群组中停止公示,以示提醒。在一次“通用贴题+口算题”的标注使命中,照片中呈现了一张写有谜底的便当贴。标注员L10拉了一个很大的框把便当贴也涵盖了进往。不意,那个标注框与下一题的标注框发作了重合,数据准确性遭到了影响。算法法式员M7意识到那个问题后,便在使命群组@所有人说:

那种提醒会令标注员深感为难。好比,在“公式定位标注”项目中,L10错把公式后的英文字母也框了进往,法式员便生气地在群里点名责备道:

紧接着,他又@所有人:

认知反应环节耗时虽短,却十分重要。那个以理论配合体构建为核心的情境进修法强调团队成员共享资本、配合参与(徐春玲、王海庆,2013)。在那个环节中,N公司治理方借助劳动者的社会属性及其对社会交往的憧憬,使数据标注员积极反应本身的认知偏误。在Z团队内部继续不竭且深进细密的沟通、互动、讨论等进修情境中,标注员的认知系统发作了改变,认知行为得到了同一。

(三)认知加速

认知劳动的推进是个繁复、曲折的过程。经由认知原则化,数据标注员晓得了认知规则;经由认知反应,数据标注员批改了本身的认知偏误。但那其实不够。在最初的认知加速环节,治理方期看标注员更大程度提拔其认知系统的改变速度,以提拔算法法式的消费效率。

回忆汗青,加速是差别财产开展到必然阶段的配合诉求。在泰勒造下,治理方通过时间研究、动做研究等体例来推进劳动加速;在精益消费下,治理方通过调剂挪动拆配线的速度和角度来提拔劳动速度。然而,认知拆配线和工业流水线其实不不异,Z团队的认知加速次要依靠以下几个战略。

第二,标注员要通过耐久而快速的反复操做,加快本身的认知反响。当然,标注员自我思维中的设法不是那么随便就能舍弃的。L12在标注中老是思前想后,成果其标注速度很慢,还经常出错。碰着问题后,他总往请教标注速度最快的L2。有一次,L12其实不由得问:“你怎么能够做那么快?”L2便一本正经地告诉他:

看到那一幕,旁边的标注员L3也凑过来说:

认贴心理学家发现,统一认知行为的不竭反复可以有效刺冲动物的认知反响速度、强化它们的进修行为,并将一系列需要根究才气实现的常识与技能酿成惯性下的无意识操做(桑代克,2006)。认知加速的理论身手与那种构想存在类似之处。数据标注员也试图通过反复操练,激发认知系统的反响速度,削减本身的认知偏误并掌握数据标注的手艺要领。L12在晓得那点之后,其标注速度也得到了必然的提拔。

第三,治理方还通过提拔标注额度的办法,令标注员陆续加速。在笔者调研期间,标注组长曾对标注速度停止了一次查询拜访,并以其时最快标注员日标150张的额度来要求所有人,以期全面提拔Z团队的标注速度。为了落实那个额度,标注组长造定出了“标注使命表”,其涵盖标注员姓名、标注内容、标注数量、备注等条目。标注员天全国班之前必需将其工做量填进表中,再交由产物司理停止查抄。那项办法固然引发了后续劳资两边的系列博弈动作,但也在必然水平上鞭策了Z团队标注速度的提拔。经由认知加速,数据标注工做的劳动掌握目标根本实现,Z团体的周标注量也提拔到了一万条以上。

所以,人工智能企业中的劳动掌握核心是鞭策劳动者认知系统的转换,以消弭认知自主性与劳动原则化间的张力,继而提拔人机交互的速度。为此,治理方摘用培训进修、沟通交换、频频操练等与认知进修类似的柔性整饰战略,恩威并施地为劳动者设定认知规则、消弭其认知偏误、教授其认知办法,将劳动者的天然认知转化为契合电脑需要的产生式认知,使人们眼中形色各别的符号变成原则化数据。以往的研究指出,拆配流水线等消费机器通过将体力劳动者安设在特定位置上、规定其肢体挪动的体例,以实现治理权利对劳动者的身体规训(董彪,2021)。但认知整饰与身体规训差别,更强调在权利的密切监视下、以治理要求为目标、以特定认知原则为根据的思维塑造。进进人工智能时代,治理权利的运做机造正在从福柯眼中的用以征服身体的微看物理学改变为西蒙所述的用以引导思维的认贴心理学(福柯,2021)。固然“往手艺化”逻辑仍在延续,但认知劳动者面临的劳动掌握不再生硬、刻板,而是愈加乖巧、深进。

五、数据标注过程中的异化体验与主体动作

固然认知劳动者面临的劳动掌握体例较为乖巧、柔性,但数据标注仍是一项简单反复的异化劳动。爱德华兹认为,劳动过程是一个充溢着掌握与对抗的“斗争地带”。工人是具有能动性和动作力的主体,在面临劳动异化时不会无动于衷,而是会停止积极应对(Edwards,1979)。僵化、严厉的治理办法一旦占据优势,标注员的异化体验就会变得强烈且难以忍耐,那时,他们就会摘取动作。

(一)获得感欠缺与产量限造

无论体力劳动、感情劳动仍是认知劳动,其素质都是要求劳动者把本身的生命才能灌输到对象里往。在那种情状下,劳动者工做越勤奋,其“内部世界便越贫乏,回他所有的工具便越少”(马克思,1979:45)。乖巧、深进的认知整饰其实不能粉饰劳动异化的存在,大大都停止简单劳动的数据标注员几都有获得感欠缺的体验。好比,L6便说:

在那种情状下,标注员仅把数据标注工做当做特按时期的过渡,而不肯把所有热情都投进进往。日常情境下,他们会摘取偷懒、“摸鱼”的办法来改进工做气氛、争取更多自在空间,以缓解异化体验。然而,当治理方试图施行严厉的工做定额、毁坏认知劳动的弹性时,他们就会像罗伊笔下的机器操做工那样,展开产量限造的动作(Roy,1952)。

举例而言,在认知加速环节,标注员天天都要填写“标注使命表”,以便利治理方上报。填写使命表本来只是走形式,但有段时间,治理方突然严厉施行起标注额度来。标注员发现,标注组长竟然有意煽动标注员彼此合作,并对那些速度不高的人冷言冷语。有一次,M2看到L12没有完成当日的额度,便责备道:

面临劳动异化时,工业流水线上的体力劳动者会任由工件堆积在本身面前,以至通过停工与歇工来表达不满;Mturk寡包平台中的数据标注员会通过组建收集社区的体例提拔收益、排遣焦虑(姚建华,2020)。Z团队标注员则会通过“摸鱼”、产量限造等体例改进工做气氛,其行为体例则愈加隐蔽和温和,治理方往往难以发现。

(二)无意义感与主动去职

劳动本来是人得认为人,并使生命变得新鲜丰富的根本前提。但是,当数据标注员的劳动仅是为了称心本钱积存和机器运行的需要,而不是自觉主动的自我表达时,标注员同本身的关系便成为自我同非我的异化关系(马克思,1979)。在那种情状下,数据标注员经常感应空虚和无意义。好比,L8就曾说:

L6也提起过那种“机械”感。

笔者在贵州惠水调研碰着的职校学生工也表达了对标注工做的腻烦。

当然,部门经济困难或低教导程度的劳动者也许认为那项工做其实不枯燥,但是对将来有更多期许的Z团队练习生却很难忍耐那种异化,因而他们的活动率比力高。在那种情状下,假设治理方仍然对峙严苛的工做量,标注员“用脚投票”的速度就会变得更快。

2020年2月后,Z团队的治理者发作了更替。新任产物司理M3上任后要求:假设标注员当天不克不及完成标注150张的工做量,就必需加班。此举使良多标注员不能不工做到深夜。没过多久,Z团队的标注员都纷繁提出去职,以示抗议,以至一些工做时间较长的外包企业员工也抉择了分开。好比,在Z团队工做了半年的L9就告诉我们:

所以,往手艺化下的认知劳动者存在与其体力劳动者前辈类似的异化体验。欠缺获得感、无意义感等不竭吞噬着标注员的热情与活力。但是,标注员们对此并不是无动于衷。在日常工做中,她们通过“摸鱼”、偷懒的体例争取更自在的工做气氛;而当治理办法过于严苛时,她们则会摘取限造产量甚至主动去职的体例来表达本身的不满。其动作体例比体力劳动者更隐蔽和温和。值得重视的是,在研究者分开N公司后的两个月间,Z团队的16名标注员都陆续申请了去职,有人抉择升学读研,有人转行处置其他工做。与此同时,新数据标注员很快被招收进来,Z团队规模仍连结在15人摆布。可见,做为一种劳动掌握机造,认知整饰虽具有短时有效性,但欠缺长时耐久性。治理方能在短期内获取尽可能多的剩余劳动,但很难阻遏劳动者的逃离。不外,治理者其实不在乎上述个别对抗,其目标是使劳动听口整体办事于其本钱积存诉求(郑广怀,2021)。Z团队标注员的频繁去职与更替对公司持久开展的负面影响其实不明显。N公司利用吸纳与肃清的手法同时停止着裁人和招募,反而实现了对不不变劳动的有效掌握(Standing,2011)。

六、结论与讨论

跟着以大数据、云计算、人工智能等为标记的第四次工业革命的到来,人工智能财产成为引领社会经济开展的新引擎,与该财产相伴的新业态、新劳动也不竭引起学界的存眷。除了切磋骑手、网约车司机等人工智能手艺利用者的劳动情况外,我们还应将研究视野拓展至人工智能的消费者。当然,那一拓展不限于处置复杂劳动的算法法式员,还包罗处置数据分类、清理、标注等简单劳动的数据标注员。国内的数据标注工做次要有两种组织形式:外包大团队和内部小团队。两者组织形式差别,但劳动体例类似。本文通过对人工智能企业自行组建的内部小团队停止详尽研究,阐发了数据标注工做背后的认知体例及劳动掌握与对抗。

详细而言,认知劳动的劳动掌握目标是使数据标注员的天然认知转化为与计算机法式相婚配的产生式认知,以高效消费出契合电脑需要的原则化数据。在此过程中,各类认知整饰战略得到了利用:起首,在认知原则化环节,治理方通过培训进修的体例使数据标注员晓得认知系统转换的要求;其次,在认知反应环节,治理方通过催促反应与随时讨论的体例纠正标注员的认知偏误,使其掌握认知系统转换的办法;最初,在认知加速环节,数据标注员经由继续而反复的标注行为完成了认知系统的改变,成为认知拆配线上的传感元件。从体力劳动到认知劳动,治理掌握的对象从劳动者肢体运动体例变成其大脑活动办法,而劳动掌握体例则从机械、刻板、僵化的身体规训走向了柔性、乖巧、深进的认知整饰。

正如马克思告诉世人的,人类身体的潜能与劳动的价值可以被大举抽取出来与消费材料相连系,魔法般地造造出浩荡财产。今天,那个新潜能就是认知。尤瓦尔·赫拉利在《人类简史》中指出,大约七万年前,认知革命使智人走出原始形态,起头征服世界,继而开启了人类文明的萌芽开展之路(赫拉利,2014)。认知鞭策了人类汗青的逾越。同人类的祖先一样,我们今天对认知劳动的理解也将在很大水平上关系到人类对本身将来的洞察。恰是在那个意义上,我们对认知劳动及其表示的继续研究,关于人类社会生活的开展而言,具有根底性的前提意义。

*正文与参考文献从略

编纂:小鱼

标签:机器猫
版权声明

本文仅代表作者观点,不代表木答案立场。

网友评论

本站会员尊享VIP特权,现在就加入我们吧!登录注册
登录
用户名
密码
验证码
若未跳转,可点击这里刷新重试
未知错误
注册
用户名
密码(至少8位)
确认密码
邮箱(请填写常用邮箱)
验证码
若未跳转,可点击这里刷新重试
未知错误
找回密码
用户名
邮箱
※ 重置链接将发送到邮箱
若未跳转,可点击这里刷新重试
未知错误