TableAgent:首个国产可私有部署的企业级Code Interpreter
TableAgent公测地址:https://tableagent.DataCanvas.com
数字化时代,数据分析的重要性犹如空气般无处不在。商业数据分析是数字化管理、智能决策的基础,同时数据分析又是一个专业性极强的工作,描述性分析、诊断性分析、预测性分析,会让大多数只会用Excel的人望而生畏。九章云极DataCanvas公司自主研发的TableAgent数据分析智能体让大模型对个人生产力的赋能,从写纪要、做总结上升到新的台阶,只要会提问,就能成为一个高级的数据分析师,洞察数据奥秘。
2023年7月9日OpenAI发布了震撼全球的Code Interpreter插件,一时间人人都是数据分析师从梦想照进现实。其实早在6月28日九章云极DataCanvas公司就已经率先对外发布了TableGPT,如今Code Interpreter更名为Advanced Data Analysis,而TableGPT也带着一系列的重大升级以TableAgent为名重装上阵,面向社会开放公测。
TableAgent是在DataCanvas Alaya九章元识大模型基础上开发的能够实现私有化部署的企业级数据分析的智能体,有非常强大的意图理解能力、分析建模能力和洞察力。TableAgent在充分的理解用户意图后,自主的利用统计科学、机器学习、因果推断等高级建模技术从数据中挖掘价值,进而提供分析观点和指导行动的深刻见解。
●会话式数据分析,所需即所得
●私有化部署,数据安全
●支持企业级数据分析,大规模、高性能
●支持领域微调,专业化
●透明化过程,审计监督
人人都是数据分析师
TableAgent 本次升级的一大亮点是可以为企业提供私有化部署。Code Interpreter对国内众多企业用户的最大障碍是企业数据因为安全性、合规等种种原因,不能传输到线上的共有服务平台。TableAgent为企业提供私有化部署,系统部署在企业内部,数据不外流,从根本上解决了安全合规的问题,同时TableAgent也可以满足企业级数据的大规模、高性能分析的要求,这也是Code Interpreter目前的短板。
数据分析不同于对话、摘要、写作这一类的语言任务,他需要理解数据、理解用户的分析需求,需要能够自动的写代码、调试代码、运行代码,还要理解代码运行生成的数据结果进而从中获得对数据的深刻洞察。
尤其是代码生成任务,与一般的写作任务不同,写作可以容忍出现错别字,不会导致内容生成失败,但代码生成任务即便只是变量名错一个字符,都会导致整体无法运行,任务失败。因此基于代码生成来实现开放式数据分析对模型能力是极大的挑战。
我们看到目前做数据分析的大模型应用多数是基于固定指标体系或者是对现有分析系统接口的调用,这种技术路线的不需要生成代码,但开放性不足,用户的分析需求受限于现有指标体系的设计和分析系统的能力。TableAgent选择了难度更高的代码生成路线,创造性的提出专家模型组的方法来解决这些难题。
融合创新应用的新成果
九章云极DataCanvas公司自主研发的Alaya九章元识大模型是TableAgent背后的关键技术支撑。在Alaya基础大模型之上微调的Alaya-ZeroX模型组,通过一系列擅长不同能力的模型组合完成复杂的分析任务。不同参数规模的模型同时满足了对生成质量和推理性能的要求。
本次TableAgent发布带来的另外一个重要能力是专业化微调,不同行业不同企业在数据分析上有专业的语言背景和分析模型的独特需求,通用的分析工具很难满足专业化的要求,对此TableAgent为能够企业提供专业化微调。
TableAgent为此配套设计了T+(Table Family)系统,能够高效的实现定制化的微调工作,同时系统具有自我迭代的能力,系统性的体系支撑更高效的实现数据分析各个环节的升级,让用户在无感知的情况下即可获得不断升级的数据分析体验。
DataCanvas Table Family (T+)
●TableAgent:数据分析智能体
●TableBench:数据分析能力评测基准
●TableTuning:数据分析LM微调
●TableInstruct:数据分析指令集
●TableLive:自迭代引擎
●Alaya-ZeroX:数据分析GPT模型组
●DeepTables & YLearn:结构化数据深度学习、因果学习工具包
DataCanvas Table Family (T+) Conceptual Framework
TableAgent未来将进一步融合非结构化数据的分析能力,并与公司自研的DingoDB多模向量数据库、DataCanvas Alaya九章元识大模型联合创新。未来,将在复杂分析任务、自动化、人机交互、智能体协同等方面进一步升级。
作者:杨健