OpenAI重磅研究:ChatGPT可能影响80%工作岗位,收入越高影响越大

2023-04-16 00:00:04 views

Heavy research may affect jobs. The higher the income, the greater the impact. Virtual currency exchange platform digital currency's influence covers all income classes, and high-paying jobs may face greater risks. Will unemployment be far behind? Last week, when it was released, the new version of virtual currency exchange platform digital currency Virtual currency exchange platform digital currency Virtual currency exchange platform digital currency Home News Blockchain Blockchain Encyclopedia Home Encyclopedia Heavy research may affect jobs. The higher the income, the greater the impact. 比特币今日价格行情网_okx交易所app_永续合约_比特币怎么买卖交易_虚拟币交易所平台

来源:

ChatGPT 的影响涵盖所有收入阶层,且高收入工作可能面临更大的风险。

ChatGPT 来了,失业还会远吗?上星期在 GPT-4 发布时,ChatGPT 第一时间上线了新版本,OpenAI 首席执行官 Sam Altman 表示他对自家这种技术「有点害怕」。

和很多专家一样,Altman 担心人工智能技术的强大能力会制造过多虚假信息,另一方面,新技术也将改变经济、劳动力和教育环境。

有人开玩笑说 Sam Altman 每天背着的同一个包,里面有紧急关停 AI 的红色按钮。

此前,AI 作画已经让很多画师开始担忧自己的工作会被取代。昨天,OpenAI 研究人员提交的一篇报告引发了人们更加热烈的讨论,研究人员估计 ChatGPT 和使用该程序构建的未来应用可能影响美国大约 19% 的工作岗位,和他们至少 50% 的工作任务。

与此同时,80% 的美国劳动力至少有 10% 的工作任务在某种程度上将受到 ChatGPT 的影响。

该研究分析表明,像 GPT-4 这样的 LLM(大型语言模型)的影响可能是无处不在的。此外,工资较高的工作 —— 可能需要执行许多基于软件的任务 —— 会面临更多来自人工智能聊天机器人的潜在影响。

在职业影响方面,受影响最大的职业包括翻译工作者、作家、记者、数学家、财务工作者、区块链工程师等。

该研究还按行业细分了 ChatGPT 的影响。数据处理托管、出版业等行业最有可能受到影响。相比之下,体力劳动较多的行业 —— 食品、林业、社会援助等受到的潜在影响最小。

OpenAI 研究了美国超过 1000 个职业,并给他们贴上了执行这些工作所需的各种任务的标签。然后,研究人员使用人工注释器和 GPT-4 模型来评估访问由 ChatGPT 驱动的系统是否会将人类执行特定任务所需的时间减少至少 50%。

让我们看看这项研究具体在干什么:

论文地址:https://arxiv.org/pdf/2303.10130v1.pdf

研究介绍

我们先看总结,OpenAI 本次调查了 GPT 模型和相关技术对美国劳动力市场的潜在影响。他们根据人员职业与 GPT 能力的对应程度来进行评估,研究结果表明,大约 80% 的美国劳动力至少有 10% 的工作任务会受到 GPT 的引入影响,而大约 19% 的员工可能会看到至少 50% 的工作任务受到影响。这种影响涵盖所有工资水平,高收入工作可能面临更大的风险。值得注意的是,这种影响不仅限于近期生产率增长较高的行业。

通过分析他们发现,像 GPT-4 这样的大型语言模型带来的影响可能是普遍的。随着时间的推移,LLM 的能力不断提高,即使现在研究人员停止对新模型能力的开发,但它们带来日益增长的经济效应也会持续增长。该研究还发现,如果考虑到互补技术的发展,LLM 的潜在影响将显著扩大。这也恰恰说明了 GPT 正变得越来越通用。

为了分析,该研究还提出了一个新的标准来理解 LLM 的能力及其对工作潜在影响,该标准用来衡量关于 GPT 任务的总暴露数。

看完结论,接下来就该介绍数据集了。该研究使用 O*NET 27.2 数据集 (O*NET, 2023),该数据集包含 1016 个职业信息,表 1 提供了数据集示例,包含任务 ID、职位等。

此外,数据集还包括他们从美国劳工统计局获得的 2020 年 - 2021 年员工就业和工资数据。该数据集包括职业头衔、每种职业的工人数量等。

在方法上,该研究根据 exposure rubric 来展示结果,Exposure rubric 定义为访问 GPT 或 GPT 驱动的系统是否会将人类执行特定 DWA 或完成任务所需的时间减少至少 50%。(注:DWA 全称 Detailed Work Activities ,可以将其理解为完成任务所需要的动作,例如表 1,对于计算机系统工程师,其 DWA 包括监控电脑系统性能,确保正常运作。)

该研究对每个 O*NET 数据集的 DWA 和所有 O*NET 任务的子集获得人工注释,然后在任务和职业级别上汇总这些 DWA 和任务得分。为了确保这些注释的质量,该研究亲自标记了大量任务和 DWA 样本,并招募了经验丰富的人工注释者,他们在 OpenAI 的对齐工作中广泛审查了 GPT 输出。

下表为模型与人的一致性比较与皮尔逊相关系数。一致性分数是通过观察两组人在注释上达成一致的频率来确定的 (例如 E0, E1 或 E2)。在本文中,该研究使用 GPT-4, Rubric 1。

该研究为感兴趣的因变量构建了三个主要度量:(i)