有时候,我需要从pdf论文中抽取出表格中的数据来用于研究. 我可以拷贝表格内容,然后粘帖在Emacs buffer中,然而这些数据的格式一般都需要调整后才能用. 好在,Emacs有大量的工具可以帮助我们重整这种数据.
下面这段gif动画展示了我用来整理数据的那些工具(当然了,还有很多种其他方法可以完成同样的事情).
在这段动画中,我使用了下面这些工具
C-x h
选中整个bufferC-c |
运行org-table-create-or-convert-from-region
将选中区域转换成org表格. 光这样还不够,但至少它让数据变得更好看了.M-S-<left>
删掉那些不需要的列mc/mark-next-like-this
(multiple cursors 中的函数) 让我同时编辑每一行(我把该功能绑定到了M-.
)M-f
越过下一个单词shrink-whitespace
删除掉空格 (我把该功能绑定到了M-SPACE
)C-c -
运行org-table-insert-hline
来为我的表格添加一个水平分割线
这些动作将数据重新组织成了我所想要的形式,现在我可以使用 org-table-export
将表格导出成其他有用的形式了.