电子表格也迎来了自己的ChatGPT时刻。 就在这两天,一个名为TabPFN的表格处理模型登上Nature,随后在数据科学领域引发热烈讨论。 据论文介绍,TabPFN专为小型表格而生,在数据集样本量不超过10,000时性能达到新SOTA。
最终生成的表格图片,表格html文件和PP-Structure格式标注文件会保存在output指定路径下。 # 简单表格 python3 generate_data.py --output output/simple_table --num=1 # 单元格坐标为单元格内文字坐标的表格 python3 generate_data.py --output output/simple_table ...