人工智能时代前沿技术社区

首页 > 人工智能 > 热点

人工智能可以模拟数百万次经济来制定更公平的税收政策

深度强化学习已经训练了AI在Go和StarCraft等复杂游戏中击败人类。在经营经济方面做得更好吗?

作者: | 2020-05-11 21:57:29


收入不平等是经济学的首要问题之一。决策者必须解决的最有效工具之一就是税收政府根据人们的收入向人们收取钱款,并直接通过福利计划或通过使用其支付公共项目的费用间接分配。但是,尽管增加征税可以带来更大的平等,但是对人民征税过多会阻止他们工作或激励他们寻找避免缴纳税款的方法,这减少了总税额。

 1589205502450145.png

保持平衡并不容易。经济学家通常依赖难以验证的假设。人们的经济行为很复杂,很难收集有关它的数据。几十年来,经济研究一直在努力设计最佳的税收政策,但这仍然是一个悬而未决的问题。

美国商业技术公司Salesforce的科学家认为AI可以提供帮助。该团队开发了一个名为AI经济学家(AI Economist)的系统,该系统使用强化学习(DeepMindAlphaGoAlpahZero背后的同类技术)来识别模拟经济的最佳税收政策。该工具仍然相对简单,但这是朝以全新方式评估政策迈出的有希望的第一步。

在一个早期的结果中,认可机构发现了一项政策,就最大限度地提高生产率和收入平等而言,它比学术经济学家研究的最新累进税制框架公平16%。与当前美国政策相比,改善更大。

在模拟中,四个AI工人分别由他们自己的强化学习模型控制。他们与一个二维世界互动,收集木材和石头,然后与他人交换这些资源或使用它们来建造房屋,从而为他们赚钱。工人的技能水平不同,这使他们变得专精。低技能的工人学习如果他们收集资源,他们会做得更好,而高技能的工人则学习如果他们购买资源来建房,他们会做得更好。在每个模拟年份的末尾,所有工人的税率均由AI控制的决策者设计,该决策者正在运行自己的强化学习算法。决策者的目标是提高所有工人的生产率和收入。通过重复数百万次仿真,AI收敛于最佳行为。

两种强化学习模型都是从零开始,没有任何经济学理论知识,而是学习如何通过反复试验来行动-就像DeepMindAI在没有人工干预的情况下学习以超人水平玩GoStarCraft一样。

能从四名AI工作者那里学到很多东西吗?从理论上讲,是的,因为少数代理之间的简单交互很快会导致非常复杂的行为。(例如,尽管Go非常复杂,但仍然只涉及两个参与者。)即使如此,参与该项目的每个人都同意,如果该工具用于对现实场景进行建模,则增加仿真中的工作人员数量将是至关重要的。

游戏系统

AI的两倍剂量是关键。神经网络以前曾被用于控制模拟经济体中的主体。但是,使决策者成为AI也会导致工人和决策者不断适应彼此的行为的模型。这种动态环境对强化学习模型构成了挑战,因为在一种税收政策下学习的策略在另一种税收策略下可能无法很好地发挥作用。但这也意味着AI找到了游戏系统的方法。例如,一些工人学会了减税,方法是降低生产率以符合较低税率的条件,然后再提高税率。Salesforce小组说,工人和决策者之间的这种让步使模拟比以前的模型(在税收模型通常固定的情况下)所实现的结果更为现实。

AI经济学家提出的税收政策有点不寻常。不同于大多数现行的政策,这些政策要么是累进的(即,较高收入者应缴纳更多的税),或者是累进的(即较高收入者应缴少的税),但AI的政策将这两个方面融合在一起,对富人和穷人适用最高税率,对最低税率适用最低税率。给中等收入的工人。就像AI提出的许多解决方案一样,例如AlphaZero的一些制胜举动,其结果似乎违反直觉,而不是人类可能设计的。但它对经济的影响导致贫富差距缩小。

为了查看AI产生的税收政策是否会以类似的方式影响人类行为,该团队在通过Amazon Mechanical Turk雇用的100多名群众工人中进行了测试,他们被要求在模拟中控制工人。他们发现,该政策鼓励人类发挥与AI几乎相同的方式,这至少在原则上暗示AI经济学家可以用来影响实际的经济活动。

无休止的调整

AI驱动的仿真的另一个优势是您可以调整参数以探索不同的场景。例如,有可能通过增加诸如社会隔离和资源获取受限之类的约束,或者通过从劳动力中撤离人员,来模拟大流行的影响。Socher说:“如果未来看起来非常不同,则很难根据过去得出最佳的税收理论。”

LeBaron说,模拟能够为更改模型建模的能力是一个很大的优势:“看到工人根据税法进行调整很有趣。” 他说,这绕开了对现有税收模式的批评之一,在现行税收模式中,行为通常是固定的。

LeBaron的主要保留意见是该工具到目前为止仅限于少数代理商。他说:“有些人认为您只需几个特工就能获得深入的知识见解。” “我不是其中之一。” 他希望看到它模拟约100名工人,这也是Salesforce团队的目标。

但是LeBaron认为该工具已经可以用来对现有的经济模型进行理智检查:“如果我是决策者,我会把这件事看得一清二楚。” 他说,如果AI经济学家不同意其他模型,那么这可能表明其他模型缺少某些东西。

Salesforce团队合作的哈佛大学计算机科学家兼经济学家David Parkes也很乐观。他同意他们需要大大增加代理人数。但是,一旦他们做到了,并在模拟中添加了一些额外的功能(例如公司),他期望能够复制现有的理论结果。他说:“然后,它立即变得有用。”

牛津大学的经济学家多恩·法默(Doyne Farmer)对此并不那么相信。尽管他欢迎强化学习从游戏到经济学的跨越-“这是一个问题,即您是否可以像AlphaZeroGo一样调查政策”-但他认为,该工具真正有用还需要一段时间。他说:“现实世界太复杂了。”

研究小组认为,一些经济学家需要说服。为此,他们发布了代码,并邀请其他人通过代码运行自己的模型。从长远来看,这种开放性也将成为使此类工具值得信赖的重要组成部分,Socher说。他指出:“如果您使用AI来建议某些人缴纳较低或较高的税费,那么您最好能够说出原因。”