研究人员表示,现有的电子表格应用程序功能丰富,并在布局和格式方面为用户提供了大量选项,因此传统的AI大型语言模型难以应对电子表格处理场景。

微软还开发了专门针对电子表格应用程序(压缩电子表格)的AI模型,以便更好地理解和处理电子表格数据。

IT之家援引论文摘要称,该模型主要由三个模块组成:基于结构锚的压缩、反向索引转换、以及数据格式感知的聚合。


显著提升了电子表格表格检测任务的性能,在GPT4的上下文学习设置中比通用方法提升了25.6%;使用token的成本降低了96%,并且能够提供更优的处理结果。
目前还不清楚微软是否计划在何时向公众开放该模型。论文指出,该模型仍然存在一些局限性,无法有效处理使用背景颜色和边框的电子表格;目前无法压缩包含自然语言的单元格等。


