设为首页   加入收藏
   学术论坛
基于人工智能大模型技术开发税收行业模型和通用型税收风险监管模型研究
日期:2025-03-10    来源:南平市税务学会   

基于人工智能大模型技术开发税收行业模型和通用型税收风险监管模型研究

 

林章其  赖宇轩  骆敏丽

 

【摘要】ChatGPT3.5发布以来,全球人工智能大模型技术飞速发展。以人工智能大模型技术为基础的行业应用、场景应用正在不断深化和拓展,它正席卷着百行千业,重塑各行各业的业务模式、业务流程,引领行业变革。税务部门有必要及早布局人工智能大模型技术的应用,利用该项技术重塑税收业务模式和业务流程,尤其要在税收风险监管领域创新出一种跨行业、跨场景、跨事项、自动化的通用型税收分风险监管新模型,实现提升组织收入数量、质量,打击税收违法犯罪行为,震慑潜在税收违法行为,提升纳税人税法遵从度的目的。本文综述了人工智能大模型技术行业应用和场景应用的发展背景,介绍了当前国内税收风险监管的发展现状、存在的问题及通用型税收风险监管模型能够发挥的作用及其主要功能,分析了在建立税收行业大模型的基础上建立通用型税收风险监管子模型的可行性和必要性,最后根据人工智能大模型开发的一般原理和训练过程,探讨开发我国税收行业大模型和通用型税收风险监管子模型的具体实施路径和技术细节,为国家税务总局开展相关工作提供有益参考。

【关键词】人工智能大模型  税收行业模型  通用型税收风险监管模型  再训练  微调训练  对齐  评估  部署

 

一、研究背景

Chatgpt3.5发布以来,全球AI大模型技术飞速发展,尤其是FaceBook发布开源大模型后,各国科技企业积极投入人工智能技术的研发当中。当前知名的AI大模型主要有OpenAIChatGPTGoogleBERT,国内的有阿里的通义千问,华为的盘古大模型等。从模型分类上看,按应用领域和层级的不同,当前 AI 大模型可以分为L0级通用大模型、L1级行业大模型、L2级垂直大模型。L0级通用大模型是指可以在多个领域和任务上通用的大型AI大模型,它通过学习数量极其庞大的跨领域、跨学科数据完成“通识教育”,具备了各行各业的基本知识,如ChatGPT、文心一言等。L1级行业大模型通过学习本行业公开的数据或企业内部数据后能够适应和胜任行业内的大部分场景和业务,即成为了“某行业专家”,如IBM在金融行业开发的“IBM Watson”模型。L1级行业模型虽然对行业知识了解较为深刻,但在细分场景上仍可能出现精确度不高、无法完成特定任务的情形。L2级垂直大模型则是指针对特定细分场景、特定任务训练而来的大模型。它以特定场景、特定任务高度相关的数据作为语料进行训练,完成训练后可以提供在该领域上更精确、更有效的解决方案,类似于成为了“某领域教授”,如华为在气象预测领域开发“盘古气象大模型”。当前人工智能行业从业者普遍认为,人工智能大模型技术将会引领新一轮的工业革命,它将席卷百行千业,重塑业务模式、业务流程,并解决许多行业发展中以前难以解决的难题。目前,利用行业和垂直大模型技术进行行业改造和升级已经出现在诸多领域上,在医学领域,谷歌团队开发的AlphaFold预测超过35万个蛋白质结构,极大地加速了生物学研究的步伐;在电商领域,例如,阿里的“阿里小蜜”可以根据客户的问题,自动匹配最合适的答案,每天可以处理超过1亿次的咨询。税务部门应该积极拥抱新技术的发展和应用,利用该项技术重塑税收业务模式和业务流程,尤其要实现对税务评估、税务稽查、税务审计等业务的学习,创新出一种跨行业、跨场景、跨事项、自动化的通用型税收风险监管模式对税务部门而言无疑是最有意义和最具价值的,这有助于税务部门更好地完成主责主业,提高组织收入质量,并能有效打击税收违法犯罪行为,提升纳税人税法遵从度。

二、当前国内税收风险监管现状和不足

(一)国内税收风险监管的主要模式

2021年以来,我国税收征管积极向数字化转型,在风险监管领域税务部门逐渐建立了以数字驱动为主的常态化、规范化的风险分析与评估工作机制 (即常规风评机制),常规风评工作机制通过三层模型实现对风险纳税人的初筛、细筛和精准筛选。第一层为体温计通用模型,具有普适性的风险模型(如税负异常等),能完成风险纳税人的正负样本初筛,快速区分出风险纳税人和非风险纳税人。第二层为领域模型,具有细分贴合具体行业领域特点的模型(如白酒、加油站等)。第三层为重点群体模型,针对领域内涉及重点事项群体纳税人设置特定的精准筛选指标模型 (如股权转让风险、先进制造业研发费用加计扣除风险等)

(二)国内税收风险监管存在的不足

常规风评工作机制的上线解决了整体风控不接续,“开新地,荒熟地”的问题,它将传统的单主体、单业务、单事项的风险防控转变为跨主体、跨区域风险联动防控,让全国各地均专注于某个领域盯着打、守着防,并将风险分析的触角延伸到全国,成果全国共享。但是现实条件下仍然有常规风评无法解决的问题。一是模型的开发时间长。目前,风险建模的流程普遍为业务经验式建模,流程为:首先发现某个风险企业,其次整理一些风险线索,再到汇总形成风险指标,最终生成风险模型。从发现风险点到模型全国推广,开发周期短则三个月长则一年,开发效率有待提升。二是应对人员能力有限。税收征管数字化转型背景下,风险管理更多依赖于大数据,但很多税务干部不知道数据在哪里,不知道数据怎么用,也就无法快速精准的锁定风险。不同应对人员对适用政策的理解不同也导致同一风险事项最终出现不同的结果,加上不同省、市、地区之间的政策执行口径也存在差异,为风险应对带来了较多不确定性。如果能够利用大模型技术开发跨行业、跨场景、跨事项、自动化的通用型税收风险监控模型,实现自动化识别和防范纳税人涉税风险,进而为税务机关提供决策支持,将能够很好地解决以上难题。

三、通用型税收风险监管模型的定义及主要功能

(一)通用型税收风险监管模型的含义

通用型税收监管模型可以由税务部门构建单独构建,也可以是构建税收行业模型下的子模型和细分场景,它着力于打破传统的针对个别纳税人进行纳税评估或者依赖行业建模来识别风险纳税人的模式,它基于一套先进的人工智能学习算法,通过对各行各业检查、稽查、评估、审计案例的深度学习,解析数据特征、数据关联、数据规律,进而掌握不同类型风险纳税人可能存在的普遍特征及个性特征,最终实现跨行业、跨场景、跨事项、自动化识别税收风险的能力。

(二)通用型税收风险监管模型应当实现的主要功能

一是风险识别。通用型税收风险监管模型通过学习正面案例(正常行为模式),识别那些与正常行为显著不同的异常行为;通过学习反面案例(异常行为模式),抓取与反面案例特征相近的数据,从而自动识别出纳税人可能存在的偷逃漏税等税收风险。

二是风险评估。模型不仅可以识别风险,还能对风险进行量化评估,包括风险发生的可能性、潜在损失的大小以及风险对企业或税务机关的影响程度。

三是风险分类。根据风险的性质和严重程度,模型可以将风险分类,如高风险、中风险和低风险,如此分类有助于税务机关优先处理中高风险事项。

四是预警管理。建立预警机制后,模型可以对即将发生或正在发展的风险进行预警,使税务机关能够及时采取措施,防止风险的进一步扩大。

五是报告生成。模型能够自动生成详细的风险报告,包括风险概述、分析结果和建议措施,为税务机关提供直观的决策依据。

四、开发通用型税收风险监管模型的必要性和可行性分析

(一)必要性分析

一是跟进国家战略部署的必然要求。2024年我国政府工作报告中提出,深化大数据、人工智能等研发应用,开展“人工智能+”行动。这是政府工作报告中首次提出“人工智能+”,这意味着人工智能将广泛地应用于我国各个领域,并实现与传统行业深度融合。税务部门必须跟进中央战略部署,运用人工智能技术赋能税收行业,实现税收业务下各场景的价值增值和价值突破。

二是推动智慧税务发展的必然要求。《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要》提出,深化税收征管制度改革,推动税收征管现代化。中共中央办公厅、国务院办公厅印发的《关于进一步深化税收征管改革的意见》明确,要建设具有高集成功能、高安全性能、高应用效能的智慧税务。利用人工智能技术,建设税收行业模型、通用型税收风险监管模型是智慧税务建设的有机组成部分。

三是提高税收监管效能的必然途径。随着数字经济的到来和大数据技术的不断发展,税务机关收集和掌握的税收数据越来越多,因此可以从中分析和识别到更多的税收风险。利用人工智能技术建立通用型税收风险监管模型,可以帮助税务部门打破行业、事项等的限制,大规模精准识别税收风险,帮助税务部门准确打击偷逃漏税行为,实现更加精准和有效的监管。

(二)可行性分析

一是技术层面保障充分。目前国内市面上10亿参数规模以上的大模型数量已超100个,从百度的文心一言到阿里的通义千问,再到王小川的百川智能、王慧文的光年之外等,人工智能大模型技术已开始深度赋能电子信息、医疗、交通等领域。税务部门可以选择采买国内的通用模型算法和服务,借助大型互联网企业的技术能力完成税收行业再训练、微调训练、对齐和评估来获得税务行业模型和通用型税收风险监管模型。

二是税务人力资源充沛。税收监管模型构建的人力支出集中于模型训练过程中个训练阶段语料库、数据集的构建,训练中的调整优化以及部署上线前的人工测评。当前,全国税务人力资源丰富,总局可以从各省风险监管领域专家能手、“金税四期”项目组建设人员等中抽调优秀人才成立大模型构建项目组,来配合完成税收行业模型及通用风险监控子模型的开发。

三是成本效益趋近正比。以盘古气象大模型为例,毕恺峰使用200GPU卡花费2个月左右时间训练盘古气象大模型,按一张GPU 7.8/小时计算,训练成本超出200万。根据对华为、阿里、科大讯飞等的调研结果,行业大模型的训练成本比垂直大模型投入更高,大约在数十倍左右。但从长期效益来看,税务部门的行业模型如果开发成功将大大提高税务机关各任务场景的工作效率,尤其是税收风险监管模型的运用将在打击税收领域违法犯罪、组织财政收入,预防税款流失等方面起到不可估量的巨大作用。

五、通用型税收风险监管模型的训练原理和训练过程

“预训练(再训练)—微调—对齐—评估”方法是人工智能大模型的主流范式。L0级通用大模型、L1级行业大模型和L2级垂直大模型均是通过这种训练方法得到的,只是在训练策略和重点上会有所不同。

(一)通用型税收风险监管新模型的训练原理

通用型税收风险监管模型属于L2级的大模型,它主要基于税收行业模型,针对税收风险监管这个特定领域的任务进行微调和优化产生的,其训练原理是利用行业训练模型的得到的行业语言表示能力,结合税收风险监管相关知识进行训练,在税收风险监管任务相关的数据集上通过有监督学习来调整模型的参数以适应税收风险监管这个特定场景的需求,并通过特定的评估方法对模型进行调整优化来提高模型性能。

(二)通用型税收风险监管新模型的训练过程

首先,为了保障模型对税收行业知识和风险知识进行有效的学习,同时为保障数据安全,需要选择成熟、高效的国产模型作为算法基础。其次,针对训练各阶段对税收数据的要求,收集整理大量税收相关数据,来作为模型学习的语料库。第三,在再训练阶段,以无监督学习为主,结合有监督学习(主要针对税收风险监管模型)的方式完成行业再训练,使模型具有理解行业知识、行业特征、行业规律的能力,同时增强模型对税收风险识别评估领域知识的理解。第四,在完成再训练后,使用特定的标注数据对再训练模型进行微调,提高模型在行业任务及特定的风险识别评估领域上的准确性。第五,为了保证模型输出的结果符合设计者的意图、用户的期望,同时符合人类价值观、符合税收行业规则(即不让模型“胡说八道”),需要对模型进行对齐处理。最后,对模型开展泛化能力、预测精度、稳定性等评估,对发现的问题进行调整,调整后的模型即可部署上线。

六、开发税收行业模型和通用型税收风险监管模型面临的难题

要建立L2级通用型税收风险监管模型,可以采取两种策略。第一种策略是开发L1级税收行业模型,通用式税收风险监管模型作为其子模型。这种策略的优点在于模型可以学习足够丰富的税收专业知识,行业模型的专业知识面足够广、模型对税收行业的理解更加充分和深刻,同时模型还可以将这些知识泛化到对外的税务智能咨询问答、税收宣传内容创作;对内的政策、法规检索,税务公文写作等各个细分场景领域,实现多任务的并行处理,功能更为强大;缺点在于税收行业训练数据量庞大、训练算力要求高、训练时间长,语料库的准备更为复杂、需要标注的内容更多、参与训练的人力要求高。第二种策略是只开发亿级或者千万级参数的税收监管细分场景模型。这种模型的优点在于参数少,语料库小,开发成本低,算力要求低,训练时间短,投入模型训练的人力资源也相对较少;缺点在于单独构建税收风险监管模型,也需要从零开始构建模型,虽然税收监管模型需要的语料库规模小,但与训练税收行业模型一样,税收风险监管模型一样涉及税收政策、法规知识、行业知识等数据的收集、处理和训练工作,因为这样才能使税收监管模型对税收行业具有深刻的理解和认识能力。但是,如果只将这些语料和训练工作仅用于税收风险监管,则前期资源投入的利用效率太低,因此建议总局采取第一种策略,在构建L1级税收行业模型时,同步开发L2级通用型税收监管模型。文章以下部分以第一种开发策略为基础,阐述开发税收行业模型和通用型税收风险监管模型存在的一些困难和问题。

(一)算力要求高

利用人工智能大模型技术开发百亿参数级别的行业模型及通用型税收风险监管子模型,需要极高的计算能力和存储能力来支持其训练和推理过程。这意味着国家税务总局需要部署大规模的服务器集群或高性能计算(HPC)系统。这涉及到高性能算力芯片的采购及高昂的硬件成本问题。当前,欧美发达国家限制对华供应高端算力芯片,导致了国内高端算力芯片的稀缺,因此会给国家税务总局部署相应的算力平台带来了一定困难。同时,搭建算力平台还需要高效的计算架构来优化资源使用。在搭建算力平台时,如何有效地整合和管理分布在不同节点、不同芯片、不同板卡上的算力资源是一个重大挑战。不同的硬件平台之间可能存在兼容性问题,需要开发专门的软件和算法来确保算力的高效利用。同时,税收行业模型和通用型税收风险监管模型的训练过程涉及到大量的敏感数据,包括纳税人的交易记录、经营数据、纳税记录等。这些数据都在算力平台中进行训练,还需要确保数据在传输、存储和处理过程中的安全性和隐私性。

(二)模型开发难度大

税收行业模型训练和通用型税收风险监管模型训练过程漫长且复杂,需要专业的团队进行持续的调优和迭代。同时,由于模型规模庞大,可能会遇到训练不稳定、结果输出不精准等问题。因此,需要拥有大模型开发经验的大型互联网厂商配合税务部门,由其提供高效的训练算法和调试工具来支持模型的顺利训练。同时,由于税收行业的特殊性,还需要考虑如何将这些技术与税务专业知识相结合,因此对技术人员的专业能力和经验要求较高。目前,国内具备相关技能的人才相对稀缺,且培养周期较长,这可能导致项目在推进过程中遇到技术瓶颈或人才短缺的问题。

(三)语料库建设难度大

语料库的质量直接决定了大模型的训练效果和应用性能。税收行业具有很强的专业性,需要处理大量的税收法律、法规和政策性内容。只有给模型算法提供足够高质量的税收文本和数据才能显著提升模型在税务领域的理解和分析能力,并将这些能力应用于智能咨询、政策检索、税收宣传、风险监管等多个场景。但在构建税收行业语料库和风险监控预料库还存在一些困难和问题

一是数据质量不一。为了保证模型在税务领域具有高度的理解、分析能力以及精准的结果输出能力,需要给模型提供法律法规、政策文件、案例判例、12366知识库、外部门第三方涉税相关数据等作为训练的语料库,这些数据可能来源于不同的渠道和系统,不同来源的数据可能存在格式、标准、准确性等方面的问题,质量参差不齐,需要进行大量的清洗和整理工作。

二是隐私和数据安全问题。税收数据往往包含企业大量的敏感信息,如经营情况、财务状况等,同样税收数据包含大量个人敏感信息,如身份证号、收入情况、财产状况等,这些信息一旦泄露,将对企业的商业利益和个人隐私造成重大损害。这要求税务部门建立完善的数据共享机制和流程,采用先进的技术手段确保数据在传输过程中的安全性和完整性。同时,还需要加强数据使用方的监管和管理,确保数据在合法、合规的范围内使用。

三是需要持续更新维护。税收政策和法规经常发生变化,因此语料库需要持续更新和维护。这要求投入较多的人力和物力资源,以确保语料库的时效性和准确性。

四是合规性问题。在构建税收行业模型和通用型税收风险监管模型的过程中,需要遵守相关法律法规的规定,如《个人信息保护法》、《网络安全法》等。这些法律法规对数据收集、处理、存储和使用等方面提出了明确要求。模型开发完成后,需要进行合规性审查,确保模型在使用中输出的结果能够符合相关法律法规的要求、道德伦理的要求、税收行业准则的要求。同时,还需要建立完善的合规性管理机制,确保模型在后续使用过程中的合规性。

七、开发税收行业模型和通用型税收风险监管模型的实践路径探索

(一)基础模型的选择策略

当前,模型的选择及应用的实现途径主要有多种:第一种策略是调用互联网大模型API。第二种策略是自训练行业模型。

(二)再训练阶段

一是再训练阶段语料库的组织。二是再训练阶段的训练特征。三是再训练阶段的算力分析。

(三)微调训练阶段

一是微调训练阶段语料库的组织。二是正反案例的组织。三是微调训练阶段的训练特征。四是微调训练阶段的算力分析。

(四)对齐阶段

(五)评估阶段

 

(作者单位:国家税务总局南平市税务局)

 

 

【参考文献】(略)

 

 

(本文为节选,原文刊于福建省税务学会内刊《研究报告》2025年第3期)

 

 

 

 

上一页:成品油消费税的现实管征困境与改革路径思考——以福建省C区石化基地为例
下一页:探索绿色税收发展“新机制”画好共建共治共享“同心圆”——绿色税收“三共”治理的内在逻辑与福建实践 【收藏本页】 【打印】 【关闭】
地址:福建省福州市铜盘路30号 邮编:350003
联系电话:0591-87840097 Email:fjswxh@qq.com
技术支持:福州泰讯软件技术服务有限公司  建议使用分辨率为:1024*768
闽ICP备09045903号   闽公网安备 35010202000728号   Powered by SiteServer CMS