word怎么删除空白页最后一页不动前面(Python批量合并多个Word文档文件并逐一添加分页符的方法)

wufei123 发布于 2023-11-05 阅读(727)

现有多个Word文档文件,需将其按名称顺序合并为一个新的Word文件,且需保证每一次合并时,都另起一页(即新的Word文件一页中,不能出现两个及以上的原本单个Word文件的内容)[gf]2003[/gf][gf]2003[/gf]一般的,实现多个Word文件的合并,在Word中可以通过“插入”“文本”“对象”的方式进行,较为方便。

[gf]2003[/gf][gf]2003[/gf]在弹出的窗口中选择需要合并的Word文件即可[gf]2003[/gf][gf]2003[/gf]但是,这种方法工作量较大,且无法满足合并时另起一页的要求。

例如,如果原本有两个Word文件,每个文件中都仅有一页,一页中仅在第一行有内容(这里假设是一行数字),则合并后的新Word文件同样为一页,该页中包含两行数字,即无法另起一页合并[gf]2003[/gf][gf]2003[/gf]因此,本文就结合Python中python-docx(docx)模块与docxcompose模块,实现本文开头提及的需求。

[gf]2003[/gf][gf]2003[/gf]首先安装python-docx模块由于我用的是Anaconda,因此就直接在AnacondaPrompt (Soft)中加以安装[gf]2003[/gf][gf]2003[/gf]打开Anaconda Prompt (Soft)。

[gf]2003[/gf][gf]2003[/gf]在弹出的界面中输入:1conda install -c conda-forge python-docx[gf]2003[/gf][gf]2003[/gf]输入y,开始安装。

[gf]2003[/gf][gf]2003[/gf]随后即可安装完成[gf]2003[/gf][gf]2003[/gf]接下来安装docxcompose,还是一样的操作输入:1pip install docxcompose[gf]2003[/gf][gf]2003[/gf]安装完成后,即可开始代码的书写。

整体代码如下:1import os 2from docx import Document 3from docxcompose.composer import Composer 45originaldocxpath=F:/其他学生工作/2020就业联络员/2021.06派遣材料与调档函/地信1701就业派遣材料/6newdocxpath=F:/其他学生工作/2020就业联络员/2021.06派遣材料与调档函/地信1701.docx7 8allword=os.listdir(originaldocxpath)9allfilepath=[]10for filename in allword:11 allfilepath.append(originaldocxpath+filename)12master=Document(allfilepath[])13middlenewdocx=Composer(master)14num=15for word in allfilepath:16 worddocument=Document(word)17 worddocument.addpagebreak()18if num!=:19 middlenewdocx.append(worddocument)20 num=num+121middlenewdocx.save(newdocxpath)[gf]2003[/gf][gf]2003[/gf]首先,对代码加以初步介绍。

originaldocxpath为存放需要合并的Word文件路径,newdocxpath为需要合并入其中的Word文件,这里大家直接在目标路径下新建一个Word文件并重命名为需要的文件名即可[gf]2003[/gf][gf]2003[/gf]随后,通过os.listdir获取所有需要合并的Word文件文件名。

在这里需要注意,如果需要按照文件名称作为合并顺序,大家直接在资源管理器中调整文件排序方法为名称即可随后通过.append()逐一将文件名称与其路径合并[gf]2003[/gf][gf]2003[/gf]接下来,设立一个Word文件模板master。

其实这个模板就是限定了合并完成后的新Word文件的字体等格式,如果我们不设置模板,就会用docx模块中的默认模板,导致合并后的文件字体与合并前的文件字体不一致(内容是一致的,主要是字体等格式会出问题)在这里,为了保证合并完成后的新Word文件的字体等格式与合并前文件一致,直接用allfilepath[0](也就是即将要被合并的第一个文件)作为模板即可。

其次,将模板用Composer()激活(这里Composer函数个人认为就是激活的作用),从而将其作为模板格式,对多个待合并的文件加以约束[gf]2003[/gf][gf]2003[/gf]最后,由于需要保证每一次合并都另起一页,便用.addpagebreak()函数,在每一次合并前将这一待合并的文件末尾增添分页符。

同时,由于我们用了第一个待合并文件作为模板,因此后期只需要从第二个文件开始进行合并即可(可以理解为,文件一旦选择为模板,其自动完成了自身的合并)最后保存文件即可[gf]2003[/gf][gf]2003[/gf]综上,便完成了“按名称顺序合并为一个新的Word文件,且需保证每一次合并时,都另起一页”的需求。

但是需要注意,这一方法对于较为复杂的Word文件(例如含有文本框等形式内容的文件)不能实现合并,会报错;对于含有普通文字、图片等的Word文件而言,还是很方便的~

想了解更多精彩内容,快来关注疯狂学习GIS

亲爱的读者们,感谢您花时间阅读本文。如果您对本文有任何疑问或建议,请随时联系我。我非常乐意与您交流。

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。