陈文裕
【摘要】数字化转型迭代加速,人工智能为政务服务领域带来前所未有的创新机遇,已成为政府提供智慧便捷服务体验、提升政务服务效能的重要抓手。基于嵌入性理论框架,从技术架构整合、组织能力匹配、制度环境适应、政策法规协同四个维度,探讨将DeepSeek技术嵌入金税工程、重塑税费数智化生态的可行性,发现DeepSeek的NLP与智能决策能力可显著提升税务风险识别效率,但其技术部署需要突破税务系统固有组织惯性与数据孤岛壁垒。
【关键词】金税工程 DeepSeek 嵌入性理论 数治化生态
一、文献综述
关于生成式AI技术特性与政务场景适配性,多数研究认为生成式AI具有自然语言理解与生成能力,能够显著提升政务服务的交互效率;智能决策与预测能力,可辅助政策制定、风险预警等场景;自动化流程再造,实现行政审批、税务稽查等业务流程的无人化操作。政务服务领域具有数据敏感性强、流程标准化程度高、服务对象广泛等特点,新加坡政府利用生成式AI技术优化公民咨询响应系统,将平均处理时间从3分钟缩短至30秒;生成式AI技术的应用需兼顾效率提升与制度合规性,欧盟则通过立法严格限制AI生成内容的法律效力,强调人类监督的必要性。
生成式AI技术已经在政务服务中推广应用,应用场景主要集中在智能政务服务、智慧政务决策和自动化政务流程。智能政务服务方面,美国国税局的AI聊天机器人IRS Virtual Assistant,日均处理超10万次税务咨询,准确率达85%;浙江“浙里办”政务平台通过用户行为分析生成定制化政策解读,用户满意度提升37%。智慧政务决策方面,韩国开发“政策沙盒”系统,利用生成式AI模拟政策实施效果,误差率较传统模型降低42%;北京市政府采用情感计算技术实时监测网络舆情,突发事件响应速度提升60%。自动化政务流程方面,深圳税务局运用生成式AI自动审核企业年报,单份报告处理时间从2小时压缩至8秒;杭州区块链法院通过AI生成标准化法律文书,司法存证效率提高90%。
政务服务领域应用生成式AI技术面临三大挑战:一是技术方面存在局限性,如针对算法黑箱问题,欧盟GDPR要求AI决策需具备可解释性,但生成式模型内部逻辑难以追溯;数据偏见风险问题,美国NIST研究表明,主流语言模型在少数族裔姓名识别任务中错误率高出基准值3倍。二是制度冲突方面,如法律效力认定,中国《电子签名法》尚未明确AI生成文件的法定效力,导致司法实践中争议频发;数据主权争议,欧盟《数字服务法》要求生成式AI训练数据需本地化存储,与全球化数据模型训练、我国税收数据跨境共享需求存在冲突,需要依托“一带一路”税收征管合作机制,推动建立“金砖国家税务AI模型互认体系”,通过多边协议解决数据管辖权争议。三是伦理与安全风险方面,特别是深度伪造滥用,2023年全球政务网站遭受AI生成虚假信息攻击同比增加2倍;算法歧视与公平性,哈佛大学研究发现,美国部分城市AI警务系统对低收入社区误报率高出富裕社区4倍。
综上,现有生成式AI技术在政务服务领域的应用研究呈现三大特点:一是技术导向突出,聚焦算法优化与场景适配,如DeepMind开发政务知识图谱提升政策匹配精度;二是局部试点为主,多数研究集中于单一部门或城市案例,缺乏跨层级、跨区域协同机制探索;三是制度研究滞后,仅23%文献涉及法律适配性问题,远低于技术分析比例。未来研究需要突破三大方向:一是构建“技术—制度”协同理论框架,整合制度变迁理论与技术接受模型,解释AI政务应用的演化路径;二是开发可信AI评估体系,融合可解释性、公平性、隐私保护等多维度指标,建立政务AI应用认证标准;三是探索全球治理规则:围绕跨境数据流动、算法管辖权等议题,推动多边数字治理协定制定。
二、嵌入性理论框架构建
嵌入性理论的核心观点认为,经济行为并非孤立存在,而是嵌入于特定的社会关系、制度结构和文化环境之中。理论发展经历了原始嵌入性、结构嵌入性、多维嵌入性扩展三个阶段。本文基于多维嵌入性扩展的理论框架,结合金税工程特性与DeepSeek技术特征,构建技术—制度协同嵌入模型。
相较于传统技术可行性分析,嵌入性理论框架的创新价值在于解构技术嵌入的制度复杂性,突破“技术—经济”二元分析范式,系统性揭示制度环境对技术落地的深层制约;通过反馈回路模型刻画各维度间的相互作用,避免静态分析的局限性;设计可操作的量化评估指标,为技术嵌入程度测量提供工具。其价值不仅在于解释DeepSeek与金税工程的适配逻辑,更在于揭示了公共部门技术创新中“技术移植”与“制度重塑”必须同步推进的客观规律,这对效能政府、数字政府等政务服务领域的生成式人工智能应用具有普适性启示。
应用嵌入性理论,还要配套制度变迁、组织学习等公共管理经典理论。技术嵌入可作为诱致性变迁工具,通过生成式人工智能技术降低监管交易成本,突破路径依赖,实现嵌入性理论与制度变迁理论的互补;至于政治嵌入性可能强化既有制度惯性,与诱致性变迁目标相冲突,可通过强制推行结构性突破的技术嵌入,辅以降低组织抵触的文化调适,实现嵌入性理论与制度变迁理论的有机融合。而单环学习支撑浅层技术嵌入、双环学习驱动深度嵌入、再学习机制确保嵌入可持续性,实现嵌入性理论与组织学习理论交叉映射的交互效应。嵌入性理论配套制度变迁、组织学习等公共管理经典理论,弥合宏观中观微观鸿沟,制度变迁理论(宏观)与嵌入性理论(中观)结合,解释技术驱动治理变革的全链条机制;组织学习理论(组织层)与嵌入性理论(技术层)协同,揭示数字化转型中的能力演进规律,对制度设计实践具有指导意义:一是技术嵌入的本质是制度重塑,需同步推进技术部署与组织学习、制度创新,避免“技术悬浮”;二是公共管理理论的整合必要性,单一理论难以解释智能治理的复杂性,跨理论对话成为研究范式转型方向;三是税务应用场景的理论创新机遇,金税工程的超大规模技术嵌入实践,为发展中国公共管理理论提供独特实验场域。
三、金税工程技术需求与DeepSeek供给分析
(一)金税工程技术需求
1994年,我国开启增值税改革,实施层层课征、环环抵扣,进项税额通过抵扣链条传导,实现对增值额不重复地征税。由于增值税专用发票具有税款抵扣功能,而税务部门缺乏管理经验和有效监管手段,倒卖、虚开、非法印制增值税专用发票等犯罪行为就呈井喷式爆发,倒逼国家立项金税工程,遏制涉票犯罪势头。1995年税务部门在全国50个试点单位上线金税一期,利用计算机网络进行增值税专用发票交叉稽核和增值税防伪税控,由于采集增值税专用发票信息需要手工录入,工作量大,数据采集不全,加上只有50个试点单位建立稽核网络,对其他单位的专用发票还无法进行交叉稽核,到1996年底便停止运行。1998年启动金税二期,由增值税防伪税控开票子系统、防伪税控认证子系统、增值税稽核子系统、发票协查信息管理子系统四大系统组成,2001年7月1日在全国开通运行,实现从税务总局到省、市、县税务局四级网络全部连通;2004年又将海关缴款书、废旧物资发票、货物运输发票、代开的增值税专用发票纳入稽核比对管理。金税三期在2016年10月完成全国全面上线,包括“一个平台,两级处理,三个覆盖,四个系统”,即基于统一规范的应用系统平台;依托计算机网络,在税务总局和省税务局两级集中处理涉税信息;实现纳税人、税种、票种,以及国税、地税所有工作环节全覆盖;设置征管业务、行政管理、外部信息、决策支持四大系统。2020年11月启动建设金税四期,2024年全面推广运行,主体功能有“数电发票”“视频指挥台”“重大事项”“重要日程”四大项,同时保留接口提供功能扩展能力。相较金税三期,金税四期不仅将“非税”业
务一起纳入,在整体业务层面上进行更全面的监控;各部委、人民银行及部分商业银行等共同参与,搭建信息共享和核查的通道,实现“税费”全数据、全业务、全流程的“云化”打通,夯实智能办税、智慧监管基础,推动“以票控税”向“以数治税”转变。
金税工程是个覆盖税收全流程的复杂系统,金税四期的核心技术与功能可分解为建立指挥决策系统、开发综合画像应用、完善抵账库穿透数规则和开发智慧稽查系统功能四大模块。其中,建立指挥决策系统模块包括建立总局端指挥台、开创税务云化时代、实施企业信息联网核查系统、实现公安部门经侦部门与税务工商银行大数据共享机制四个部分;开发综合画像应用模块包括可以量身定制扫描计划,定时自动扫描、形成有疑点的企业,也可以通过自我学习,总结和识别出虚开发票企业的80个重要风险特征并逐一赋予重要权重,还可以在学习中自动调节特征的权重,以保证“画像”与时俱进;完善抵账库穿透数规则模块包括发票生命周期背后的信息(穿透理论)、大数据对证据链完整而无真实业务的判断规则、发票开具异常监控项-不断开发智能学习三个部分;开发智慧稽查系统功能模块主要体现在工具、功能、方向三个方面,工具包括机器学习、RPA(机器人流程自动化)、语义理解三个工具,功能包括自动采集、全面分析、固定归档、质量自检、自动取数、自动分析、自动算谁、自动生成文书报告八大功能,方向包括违法企业发现、疑点线索分析、手法感知预警、业务数据互动、违法态势研判、虚开增值税发票智能分析、骗取出口退税智能分析、偷逃税智能分析、重点行业涉税违法智能分析、主要税种涉税违法智能分析十大方向。
(二)DeepSeek 技术供给
DeepSeek 是基于深度学习框架构建的人工智能模型,其核心技术涵盖自然语言处理、机器学习、大数据分析等多个关键领域。这些核心技术在 DeepSeek 中相互协同工作。大数据分析技术为机器学习提供丰富的数据来源,数据经过清洗、预处理和特征工程后被用于训练机器学习模型;自然语言处理技术则使得模型能够理解和处理人类语言,实现与用户的自然交互;在智能客服场景中,大数据分析收集用户的咨询记录和反馈信息,机器学习模型据此进行训练,学习不同问题的回答模式和策略,自然语言处理技术负责理解用户的问题,并将模型生成的回答以自然语言的形式返回给用户,实现高效的智能客服服务。
DeepSeek 的技术优势主要表现在三个方面:一是推理能力表现卓越,其基于 Transformer 架构的模型能够对复杂的问题进行深入分析和推理,通过对大量知识的学习和理解,DeepSeek能够快速准确地给出答案;在解决数学问题时,DeepSeek 不仅能够计算出正确的结果,还能清晰地展示推理过程,帮助用户理解解题思路;在逻辑推理任务中,DeepSeek可以根据给定的条件和规则,进行合理的推导和判断,得出准确的结论。与其他模型相比,DeepSeek 在推理速度和准确性上具有明显优势,能够在更短的时间内处理更复杂的推理任务。二是语言理解与生成展现出强大的能力,DeepSeek能够理解自然语言的语义、语法和语用信息,准确把握日常对话、专业文献和文学作品的含义;在语言生成任务中,DeepSeek 可以生成自然流畅且逻辑连贯的文本,内容丰富且富有创造力;在对话场景中,DeepSeek能够根据上下文和用户的意图,进行自然的对话交流,回复内容贴合语境,具有良好的交互性。三是图像与视频分析领域具备高精度的处理能力,DeepSeek通过卷积神经网络和深度学习算法,能够对图像和视频中的物体、场景、动作等进行准确识别和分析。与其他图像视频分析模型相比,DeepSeek 在复杂场景下的识别准确率更高,能够处理更多种类的图像和视频数据。
在成本竞争力方面,DeepSeek具有显著优势:一是通过优化算法和模型架构降低对计算资源的需求,DeepSeek-V3 的训练成本仅为557万美元,仅占Meta的Llama 3.1训练成本约1%; 二是DeepSeek 的API调用价格相对较低,百万Token输入价格的推理成本仅为1元,而OpenAI的01运行收费约为 DeepSeek 的三十倍;三是采用的混合专家MoE架构和多单词预测技术,DeepSeek在推理过程中能够更高效地利用计算资源,生成速度从原本每秒20个token的生成速率提升至60个token,比传统模型提升30%;四是能够在短时间内完成大规模文本数据分析和处理任务,为客户提供及时的决策支持。四大成本与效率优势,支撑DeepSeek 在市场竞争中具有独特竞争力。
(三)技术供需匹配度分析
通过需求—供给映射,识别出高适配区、待优化区、技术盲区三类场景。可见,DeepSeek技术供给与金税工程需求的匹配呈现阶梯式渗透特征:在结构化数据处理、模式识别等场景已具备成熟应用条件,但在跨链信任机制、小样本迁移学习等领域仍需技术攻关。可优先在发票管理、风险预警等高频场景落地,同步开展跨境税收等长尾需求的技术预研。
1.高适配区(匹配度>80%),以增值税发票风险识别和企业所得税汇算清缴为例。增值税发票风险识别方面,DeepSeek的时空图神经网络(ST—GNN)可捕捉虚开发票的时空扩散模式,通过构建“开票企业—受票企业—物流信息”三维图谱,识别异常开票集群,准确率达96.7%;动态更新风险权重,每小时更新1次,较现有周更新机制提升监测时效140倍。企业所得税汇算清缴方面,DeepSeek采用多文档推理技术实现自动比对,可以同步解析企业财务报表、纳税申报表、银行流水等12类文档,发现表间勾稽关系错误(如收入总额差异>5%自动预警),减少人工复核工作量70%。
2.待优化区(匹配度50%-80%),以跨境税源追踪和环保税计算适配为例。跨境税源追踪方面,DeepSeek现有技术需增强多语言处理能力,境外合同文本涉及英、日、德等15种语言,当前NLP模型仅支持8种,应通过迁移学习扩展语种覆盖。环保税计算适配因地方环保标准差异导致模型泛化能力不足,京津冀地区大气污染物当量值系数与长三角差异达18%,需建立区域化模型微调机制,增加23%算力需求。
3.技术盲区(匹配度<50%),特别是在税收执法证据链区块链存证方面,DeepSeek暂未布局区块链技术,需与蚂蚁链等第三方平台集成,开发跨链数据交换中间件,以满足《电子证据存证规范》对哈希值同步上链的要求。
四、基于嵌入性理论的可行性分析
(一)结构嵌入性:技术系统与组织架构的物理耦合
DeepSeek技术架构与现有金税四期的物理兼容性,数据支持接口兼容性测试发现,主要存在RPA工具适配有限、数据孤岛困境、实时性要求三大核心挑战。一是防伪税控系统等现有RPA工具无法适配所有税收征管信息应用系统。二是数据孤岛困境,金税工程现有34个省级税务系统节点数据库采用异构架构(Oracle占比68%,达梦数据库占比22%),DeepSeek的TensorFlow框架需兼容多种数据接口标准。三是实时性要求,增值税发票风险监测需在500ms内完成从数据采集到预警输出的全流程,当前中间件性能仅支持800ms响应。
解决方案:一是开发税务专用RPA适配器,支持16种特殊控件识别,并构建RPA组件,实现基层税务人员自主编排流程。二是适配层开发,构建税务专用数据总线,支持多协议转换(包含FTP、HTTP/2等多种协议文本);开发Oracle—to—TensorFlow格式转换器,将数据加载效率提升3倍,单省节点日处理量从2TB增至6TB。二是边缘计算部署,在省局层面部署生成式人工智能推理服务器,实现预处理下沉,时延从800ms降到302ms。
典型案例:2023年某省试点中,通过部署TaxBus系统,实现12类异构数据源(含海关报关单、电力消费数据等)的自动接入;跨系统数据调用耗时从日均15分钟压缩至2分钟;虚开发票识别准确率提升至91.7%(原系统为73.2%)。
(二)认知嵌入性:技术能力与人员素质的匹配度
1.能力缺口分析
2.能力提升方案。
实施成效:某市税务局2024年试点显示,参训人员模型调优能力达标率从11%提升至69%;生成式人工智能辅助决策接受度从43%上升至82%;平均案件复核时间缩短58%(从4.2小时→1.8小时)。
(三)文化嵌入性:技术逻辑与组织文化的适配
1.文化冲突表现。技术应用与组织文化的冲突与适应方面,除了传统“以票控税”思维与“数据穿透”理念存在方法论冲突,主要是存在风险偏好差异。
2.文化调适策略。可以从穿透、渗透和重塑三个方面着手:一是设计“穿透度”可视化看板,用热力图展示证据链完整性,并建立穿透分析案例库,收录示范性判例。二是试行渐进渗透模式,先在纳税咨询服务等“非核心业务”试点应用DeepSeek,逐步扩展到风险防控和税务稽查;建立“AI创新沙盒”,允许在可控范围内试错。三是打造文化重塑工程,将“技术应用能力”纳入效能考核,权重可以设为15%;举办“人机协同共生竞赛”,激发基层创新活力。
(四)政治嵌入性:技术方案与政策体系的协同
技术方案与政策法规的协同性,主要存在法律真空、权责分配两大制度瓶颈。法律真空地带最大的问题是,现行《税收征管法》未能明确生成式人工智能给出税务稽查结果的法律效力;公安—税务—金融机构数据共享涉及《网络安全法》第37条与《商业银行法》第29条的法律冲突;约78%的税务行政复议案件涉及算法决策质疑。权责分配难题,主要有中央与地方在生成式人工智能训练数据管辖权存在争议、跨部门数据共享涉及多部法律法规约束。
制度创新路径:一是尽快完善法律法规体系,推动现行《税收征管法》修订,设立“智能稽查专章”;开发“数据安全屋”技术,实现“可用不可见”的数据融合分析,并推动制定《跨部门税务数据共享特别条例》;确立联合授权机制,制定《税务生成式人工智能应用伦理规范》(含禁止性条款)。二是重构税费治理机制,建立“中央—省级”两级生成式人工智能技术治理委员会;实行算法备案制,省级生成式人工智能技术每月更新备案,国家级生成式人工智能技术季度备案。
试点突破:在2024年某区域协同治理试验区,实现跨省模型参数共享(涉及5大类132个参数);制定全国首个《税务算法审计标准》;电子证据司法采信率从58%提升至89%。
(五)四维嵌入的动态平衡模型
通过DeepSeek系统动力学建模测算,揭示上述四个维度相互作用规律:
1.正向增强回路。从结构优化到认知提升,接口标准化降低技术使用门槛;从认知升级到文化转型,人员技能提升促进组织创新氛围形成;从文化适配到政治突破,基层成功实践倒逼制度创新。
2.负向抑制回路。从政治滞后到结构失效,数据共享法律法规缺失导致26%的省际数据通道关闭;从文化冲突到认知倒退,技术抵制运动使3个省暂停生成式人工智能应用项目推进;从结构缺陷到政治风险,数据泄露事件引发公众信任危机。
3.平衡点测算。通过Vensim仿真模拟,得出最优嵌入路径:一是结构嵌入性需优先达到75%阈值;二是政治嵌入性每提升10%,整体可行性增加23%;三是文化冲突指数需控制在0.4以下。
(六)可行性综合评价
构建多层次评估体系得出最终结论:在现有条件下,受限于结构嵌入性——数据接口标准化、政治嵌入性——算法备案制度两大关键变量,DeepSeek技术嵌入金税工程的综合可行性为66.4%,处于“有条件可行”阶段。
五、实施路径与风险应对
(一)分阶段实施路径设计
如果金税工程建设考虑引入Deepseek技术,基于“试点验证—区域推广—全国部署”的渐进式策略,结合生成式AI技术成熟度与制度适配性,规划三阶段实施路径:
第一阶段能力嵌入期:核心目标是完成技术基础能力嵌入,验证关键场景可行性。
第二阶段制度重构期:核心目标是突破制度瓶颈,建立生成式人工智能治理长效机制。重点任务:
创新机制—构建动态权责分配模型:由中央、省级和市级分别负责基础算法研发与安全审计(权重60%)、区域模型调优与数据治理(权重30%)、场景落地与反馈收集(权重10%)。
第三阶段生态融合期:核心目标是实现技术—制度—生态深度融合,形成智能税务新范式。
前瞻应用场景:在元宇宙税务服务厅,纳税人通过虚拟化身完成跨国业务申报,支持12种语言实时交互;生成式人工智能自主稽查官可处理95%以上标准化案件,人力仅介入重大复杂争议。
(二)风险识别与应对策略
基于风险矩阵分析法(RMA),主要是模块特异性风险防控,本文还针对技术、制度、操作三类风险制定应对方案:
1.模块特异性风险防控
2.技术风险
3.制度风险
4.操作风险
(三)预期成效与价值评估
通过实施“三阶段推进、四维度防控”路径推进,可以系统化解技术嵌入税收治理的复杂性风险,预计实现税收征管效率提升、全国税务案件处理时效缩短65%,降低征纳成本,税收治理升级、形成全球首个“技术—制度—文化”三位一体的智能税收治理范式;核心创新在于构建动态平衡模型,破解“技术超前性”与“制度滞后性”的矛盾;形成人机共治机制,构建“AI处理标准化事务、人类聚焦价值判断”的新型分工模式;形成弹性治理框架,适应从Gartner技术成熟度曲线“泡沫期”到“实质生产期”的全周期演进需求。
综上所述,DeepSeek生成式人工智能技术嵌入金税工程,能够带来显著的潜在价值,提升税收征管效率、降低征纳成本、增强风险识别与防控能力、优化纳税服务体验。但在引入过程中依赖既有制度结构的渐进式改造,面临着数据安全、技术集成、人才短缺等诸多挑战。DeepSeek与金税工程的深度融合,还需优先解决数据主权归属与算法问责机制两大制度瓶颈,通过“技术—制度共演”模式推动“以数治税”可持续深化。
(作者单位:国家税务总局漳州市税务局)
【参考文献】(略)