翼度科技»论坛 编程开发 .net 查看内容

C# 将PDF文档转换为Markdown文档

4

主题

4

帖子

12

积分

新手上路

Rank: 1

积分
12
将PDF文件转换为Markdown格式是一个非常实用的需求,尤其是在需要将内容从固定布局的PDF文件中提取出来,并转换为更易于编辑和处理的文本格式时。本文将介绍如何通过C#代码将PDF文档转换Markdown(MD)文档。
 
需要用到第三方库 Spire.PDF for .NET。可以从以下链接下载产品包后手动添加引用,或者直接通过NuGet安装。
https://www.e-iceblue.cn/Downloads/Spire-PDF-NET.html
 
C# 将PDF转为Markdown文档

步骤:

  • 创建 PdfDocument 类的对象
  • 通过 LoadFromFile() 方法加载PDF文档;
  • 通过 SaveToFile(string filename, FileFormat.Markdown) 将加载的PDF文档转换为markdown文档。
示例代码:
  1. using Spire.Pdf;
  2. namespace PDFToMarkdown
  3. {
  4.     class Program
  5.     {
  6.         static void Main(string[] args)
  7.         {
  8.             //加载PDF文档
  9.             PdfDocument pdf = new PdfDocument();
  10.             pdf.LoadFromFile("测试.pdf");
  11.             //将PDF转换为MD文档
  12.             pdf.SaveToFile("PDF转Markdown.md", FileFormat.Markdown);
  13.             pdf.Close();
  14.         }
  15.     }
  16. }
复制代码

 
该Spire.PDF for .NET库支持多种在.NET 程序创建、读取、转换、打印PDF文档的操作,更多示例可以参考:
https://www.e-iceblue.cn/spirepdfnet/spire-pdf-for-net-program-guide-content.html
 
对于生成文档中的水印,点击申请临时授权移除并完整试用:
https://www.e-iceblue.cn/misc/temporary-license.html



来源:https://www.cnblogs.com/Yesi/p/18520083
免责声明:由于采集信息均来自互联网,如果侵犯了您的权益,请联系我们【E-Mail:cb@itdo.tech】 我们会及时删除侵权内容,谢谢合作!

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x

举报 回复 使用道具