Pandoc——通用文档转换器。在线试用Pandoc
(提示:从HTML源码转换为Markdown格式应设置为,from HTML to Markdown (strict)

如果你需要将文件从一种标记格式转换成另一种的话,那么Pandoc就是你的瑞士军刀。你需要从一个markdown格式文件生成一个man格式页面么?没问题。从LaTeX格式转换到Docbook格式?当然可以。从HTML格式转换到MediaWiki格式?是的,那也可以。Pandoc可以读取markdown格式及其reStructuredText(的子集)、textile格式HTML格式、以及LaTeX格式,而且它可以写纯文本(plain text)、markdownreStructuredTextHTMLLaTeXConTeXtPDFRTFDocBook XMLOpenDocument XMLODTGNU TexinfoMediaWiki markuptextilegroff man等格式页面,还有Emacs org-modeEPUB等格式电子书,以及S5Slidy格式的HTML幻灯片显示。使用markdown2pdf包装器脚本还支持PDF输出(以LaTeX格式为媒介)。

Pandoc知道许多有用的markdown语法扩展,包括文档元数据(document metadata,例如:title、author、date);脚注(footnotes);表格(tables);定义列表(definition lists);上标(superscript)和下表(subscript);删除线(strikeout);增强的排序列表(ordered lists,起始编号和编号样式都很重要);分隔的代码块(delimited code blocks);HTML块内部的markdown标记;以及TeX 数学(TeX math)。其他可选项包括“智能”标点、语法突出显示、自动生成目录、以及自动生成引文(使用citeproc-hs)。如果希望使用严格的markdown兼容性,那么可使用命令行标识来关闭所有这些扩展。

Pandoc包括一个Haskell库和一个独立的可执行文件。该库包括适用于每种输入和输出格式的独立模块,因此添加一种新的输入或输出格式,只需添加一个新模块。

Pandoc是自由软件,以GPL发放。 © 2006–2011 John MacFarlane.