古詩詞大全網 - 成語故事 - 如何制作PDF樣本?

如何制作PDF樣本?

PDF文件是目前比較流行的電子文檔格式,在辦公自動化(OA)等軟件的開發中,經常要用到該格式,但介紹如何制作PDF格式文件的資料非常少,在網上搜來搜去,都轉貼的是同壹段“暴力”破解的方法,代碼片斷如下:

StreamWriter pPDF=new StreamWriter(filePath);

ArrayList xRefs=new ArrayList();

float yPos =0f;

long streamStart=0;

long streamEnd=0;

long streamLen =0;

string strPDFMessage=null;

//PDF文檔頭信息

strPDFMessage="%PDF-1.1\n";

ConvertToByteAndAddtoStream(strPDFMessage);

xRefs.Add(mPDF.Length);

strPDFMessage="1 0 obj\n";

ConvertToByteAndAddtoStream(strPDFMessage);

strPDFMessage="<< /Length 2 0 R >>\n";

ConvertToByteAndAddtoStream(strPDFMessage);

strPDFMessage="stream\n";

ConvertToByteAndAddtoStream(strPDFMessage);

……

看了上面的制作辦法,我眼鏡都摔壞了三幅,如果用上面這樣原始的辦法能制作出滿意的PDF文件,那壹定是天才所為。後來,我從壹個網站(網址:/index.html)中看到了專門制作PDF文件的控件的介紹,暗喜之余,立馬下載試驗,果然非常輕松地制作出了想要的PDF文件,因為網站為英文,內容又多,讀起來非常費力,在解決了自己的問題後,看到許多網友還在為PDF文件制作而郁悶,遂決定將該內容翻譯為中文,由於本人英語水平壹般,許多地方又晦澀難懂,故翻譯質量不是很滿意,敬請斧正,但大部分能看懂。本文的目的壹是解決部分網友的燃眉之急,二是拋磚引玉,如果哪位仁兄願意將該網站中的內容準確翻譯出來,則是天下之大幸。

要用本文的方法生成PDF文件,需要兩個控件:itextsharp.dll和ICSharpCode.SharpZipLib.dll,由於示例代碼實在太多,我將代碼全部整理出來,放在另外壹個文件“示例代碼.doc”中,所有這些資源,我均放在了本人的ftp站點(ftp://202.107.251.26)上的“Pdf文件制作全攻略”文件夾中(文件夾中另外兩個rar壓縮文件為兩個控件的源代碼,供大家學習研究使用),妳可以到這裏下載相應的資源,或者直接到原網站下載。

為便於調試和敘述,所有例子均為DOS控制臺程序,windows程序使用方法完全壹樣,按照下面的步驟創建壹個可調試的項目:

1、 打開VS2003;

2、 單擊菜單“文件”→“新建”→“項目”,在項目類型中選擇“Visual C#項目”,在模板中選擇“控制臺應用程序”,輸入文件名稱如“MakePdf”,指定好存放路徑,然後點確定按鈕;

3、 在“解決方案資源管理器”中右鍵單擊“引用”,從彈出的菜單中選擇“添加引用”,在“.NET”選項夾中選擇“瀏覽”,添加前面提到的兩個應用,如下圖:

4、 在代碼窗口頂部添加兩個引用:

using iTextSharp.text;

using iTextSharp.text.pdf;

至此,準備工作完畢。

第壹部分 iText的簡單應用第壹章 創建壹個Document

利用iText五步創建壹個PDF文件:helloword。

第壹步,創建壹個 iTextSharp.text.Document對象的實例:

Document document = new Document();

第二步,為該Document創建壹個Writer實例:

PdfWriter.getInstance(document, new FileStream("Chap0101.pdf", FileMode.Create));

第三步,打開當前Document

document.Open();

第四步,為當前Document添加內容:

document.Add(new Paragraph("Hello World"));

第五步,關閉Document

document.Close();

完整的代碼見示例代碼0101。

在例中,不難看出,制作壹個PDF文件是非常簡單的。

註:如果妳將例中“document.Add(new Paragraph("Hello World"));”中的字符串“Hello Word”換成中文,如“這是我的第壹個PDF文件”,產生的結果壹定讓妳大失所望,因為生成的PDF文件中並沒有將中文顯示出來,不要擔心,在第9章中要專門講解字體問題,中文顯示也就迎刃而解了,如果不能正確顯示中文,也就沒有必要翻譯本文了。

下面對這幾步做詳細介紹。

第壹步 創建壹個Document實例:

iTextSharp.text.Document-object***有三個構造函數:

public Document();

public Document(Rectangle pageSize);

public Document(Rectangle pageSize,

int marginLeft,

int marginRight,

int marginTop,

int marginBottom);

第壹個構造函數以A4頁面作為參數調用第二個構造函數,第二個構造函數以每邊36磅頁邊距為參數調用第三個構造函數

u 頁面尺寸:

妳可以通過指定的顏色和大小創建妳自己的頁面,示例代碼0102創建壹個細長的淺黃色背景的頁面:

Rectangle pageSize = new Rectangle(144, 720);

pageSize.BackgroundColor = new Color(0xFF, 0xFF, 0xDE);

Document document = new Document(pageSize);

通常,妳不必創建這樣的頁面,而可以從下面頁面尺寸中選擇:

A0-A10, LEGAL, LETTER, HALFLETTER, _11x17, LEDGER, NOTE, B0-B5, ARCH_A-ARCH_E, FLSA 和 FLSE

大多數情況下使用縱向頁面,如果希望使用橫向頁面,妳只須使用rotate()函數:

Document document = new Document(PageSize.A4.rotate());

詳細代碼見示例代碼0103。

u 頁邊距:

當創建壹個文件時,妳還可以定義上、下、左、右頁邊距:

Document document = new Document(PageSize.A5, 36, 72, 108, 180);

在示例代碼0104中妳可以看到該文檔有壹個0.5英寸的左邊距和1英寸的右邊距,上邊距為1.5英寸,下邊距為2.5英寸。

說明:

當創建壹個矩形或設置邊距時,妳可能希望知道該用什麽度量單位:厘米、英寸或象素,事實上,默認的度量系統以排版單位磅為基礎得出其他單位的近似值,如1英寸=72磅,如果妳想在A4頁面的PDF中創建壹個矩形,妳需要計算以下數據:

21 厘米 / 2.54 = 8.2677 英寸

8.2677英寸* 72 = 595 磅

29.7 厘米 / 2.54 = 11.6929 英寸

11.6929英寸* 72 = 842 磅

默認邊距為36磅即半英寸。

如果妳修改了頁面尺寸,僅僅影響到下壹頁,如果妳修改了頁邊距,則影響到全部,故慎用。

關於頁面的初始值,請參考第三步。

第二步 創建Writer實例

壹旦創建了document,我們可以創建該文檔的多個Writer的實例,所有這些Writer實例均繼承自抽象類“iTextSharp.text.DocWriter”。

同時還有另外壹種情況,妳可以用iTextSharp.text.pdf.PdfWriter產生文檔PDF文件,如果妳想創建壹個TeX文檔,妳可以使用iTextSharp.text.TeX.TeXWriter包。

Writer類的構造函數是私有的,妳只能通過下面的方法創建壹個實例:

public static xxxWriter getInstance(Document document, Stream os);(xxx 是 Pdf 或 Xml)

妳可以通過下面的方法創建壹個實例:

PdfWriter writer = PdfWriter.getInstance(document, new FileStream("Chap01xx.pdf"));

但是妳幾乎永遠不會用到Writer實例(除非妳想創建高級PDF或者希望用壹些非常特殊的函數,如ViewerPreferences 或 Encryption)。所以通過下面的辦法得到實例已經足夠了: PdfWriter.getInstance(document, new FileStream("Chap01xx.pdf"));

在第壹步中創建壹個文檔時,第壹個參數意義不大,第二個參數可以是任何壹種流,到目前為止我們壹直使用System.IO.FileStream將Document寫入文件中,示例代碼0105用到了System.IO.MemoryStream(這不是壹個獨立的例子,妳必須在Servlet Engine中測試這些代碼。

第三步 打開Document

u 摘要

在妳寫入任何實際數據之前,妳可能希望通過以下幾種方法寫入壹些關於本文檔的摘要:

public boolean addTitle(String title)

public boolean addSubject(String subject)

public boolean addKeywords(String keywords)

public boolean addAuthor(String author)

public boolean addCreator(String creator)

public boolean addProducer()

public boolean addCreationDate()

public boolean addHeader(String name, String content)

妳可以選擇自己的標題、主題、關鍵字、作者、創建程序,但以下產品信息將始終被添加:iTextSharp (或者iTextSharp的引用)和創建時間(實際上這兩種方法是自動調用的)。

妳還可以將自定義的名稱添加為“報頭信息”,但是這對於PdfWriter沒有任何作用,如果看看實例代碼0101產生的pdf文件的“文檔屬性”,我們可以看到僅僅有PDF創建程序和產品日期,而示例代碼0106的“文檔屬性”框中有更多的信息。

打開document前要做的事:

妳只能在Open方法調用之前添加摘要,這是iText開發工具提供的壹個選擇。

在HTML中,報頭信息被放在文檔前面報頭標識中間,調用Open方法將導致報頭信息寫入流,因而在Document被打開後無法更改這些數據。

PDF報頭信息不包括摘要,看起來有類似於:

%PDF-1.2

該行顯示生成的文檔是壹個版本為1.2的PDF格式的文件,在PDF中,摘要保存在PdfInfo對象中,當文檔關閉時已經寫入PdfWriter中了,因此,沒有關於為什麽不能修改庫來滿足任何時候添加或更改摘要的技術原因

u 頁面初始化

Open方法在不同的Witer中同時會產生初始化事件,舉例來說,如果妳需要壹個水印或者頁眉頁角對象出現在文檔第壹頁的開始處,妳需要在打開文檔前添加這些,同樣的用於設置該文檔其他頁水印、頁眉、頁角、頁數和尺寸。

當調用下列方法:

public bool setPageSize(Rectangle pageSize)

public bool Add(Watermark watermark)

public void removeWatermark()

setting Header property

public void resetHeader()

setting Footer property

public void resetFooter()

public void resetPageCount()

setting PageCount property

產生的結果只能在下壹個新頁中看到(當在本頁調用初始化方法時),代碼見示例代碼0107,妳必須要準備壹張名為watermark.jpg的圖片,如下圖:

u 閱讀器參數:

妳可以通過下面的辦法為PDF文件指定壹些閱讀器 (如Adobe Reader) 參數:

public void setViewerPreferences(int preferences)

在示例代碼0108中,指定了下面壹些參數:

writerA.setViewerPreferences(PdfWriter.PageLayoutTwoColumnLeft);

writerB.setViewerPreferences(PdfWriter.HideMenubar | PdfWriter.HideToolbar);

writerC.setViewerPreferences(PdfWriter.PageLayoutTwoColumnLeft | PdfWriter.PageModeFullScreen | PdfWriter.NonFullScreenPageModeUseThumbs);

正如妳所看到的,參數可以使用以下壹些常量:

l 文件被打開時,頁面布局用到下面的其中壹個 :

PdfWriter.PageLayoutSinglePage – 同時只顯示壹個頁面

PdfWriter.PageLayoutOneColumn –單列顯示

PdfWriter.PageLayoutTwoColumnLeft –雙列顯示,奇數頁在左

PdfWriter.PageLayoutTwoColumnRight -雙列顯示,奇數頁在右

l 文件打開時,頁面模式用到下面其中之壹:

PdfWriter.PageModeUseNone – 既不顯示大鋼也不顯示縮略圖

PdfWriter.PageModeUseOutlines – 顯示大綱

PdfWriter.PageModeUseThumbs – 顯示縮略圖

PdfWriter.PageModeFullScreen – 全屏模式,沒有菜單、windows控件或者其他任何windows可見控件

l PdfWriter.HideToolbar – 當文檔激活時,是否隱藏閱讀程序(如Adobe Reader)的工具條

l PdfWriter.HideMenubar -當文檔激活時,是否隱藏閱讀程序的菜單.

l PdfWriter.HideWindowUI -當文檔激活時,是否隱藏閱讀程序的界面元素,如滾動條、導航條等,而僅僅保留文檔顯示

l PdfWriter.FitWindow – 是否調整文檔窗口尺寸以適合顯示第壹頁。

l PdfWriter.CenterWindow – 是否將文檔窗口放到屏幕中央

l 在全屏模式下,指定如何顯示界面元素(選擇壹個)

PdfWriter.NonFullScreenPageModeUseNone -既不顯示大鋼也不顯示縮略圖

PdfWriter.NonFullScreenPageModeUseOutlines – 顯示大鋼

PdfWriter.NonFullScreenPageModeUseThumbs – 顯示縮略圖

說明:妳只能在類PdfWriter中調用這些方法。

u 加密

打開文檔之前還要做的壹件事情就是加密(如果妳希望該文檔加密),要達到這個目的,妳可以使用下面的方法:

public void setEncryption(boolean strength, String userPassword, String ownerPassword, int permissions);

strength 是下面兩個常量之壹:

PdfWriter.STRENGTH40BITS: 40 位

PdfWriter.STRENGTH128BITS: 128位 (Acrobat Reader 5.0及以上版本支持)

UserPassword和ownerPassword 可以為空或零長度, 這種情況下, ownerPassword 將被隨機的字符串代替

Permissions 為下列常量之壹:

PdfWriter.AllowPrinting

PdfWriter.AllowModifyContents

PdfWriter.AllowCopy

PdfWriter.AllowModifyAnnotations

PdfWriter.AllowFillIn

PdfWriter.AllowScreenReaders

PdfWriter.AllowAssembly

PdfWriter.AllowDegradedPrinting

該功能參見示例代碼0109和示例代碼0110。

writer.setEncryption(PdfWriter.STRENGTH40BITS, null, null, PdfWriter.AllowCopy);

示例代碼0109產生的文件能夠被打開而無須密碼,但用戶不能打印、修改本文檔。

writer.setEncryption(PdfWriter.STRENGTH128BITS, "userpass", "ownerpass", PdfWriter.AllowCopy | PdfWriter.AllowPrinting);

打妳試圖打開示例代碼0110產生的文件時,將要求輸入密碼('userpass'),因為添加了AllowPrinting參數,妳可以打印該文檔而不會發生任何問題。

第四步 添加內容

在解釋第壹步到第三步的不同示例中,妳可能已經遇到了壹些對象如Phrase, Paragraph等 在接下來的幾章中,所有這些問題都將得到詳細解釋。

有時妳可能想壹個writer故意忽略document產生的行為,如示例代碼0111:

當我們創建了兩個writer: writerA 和 writerB:

PdfWriter writerA = PdfWriter.getInstance(document, new FileStream("Chap0111a.pdf", FileMode.Create));

PdfWriter writerB = PdfWriter.getInstance(document, new FileStream("Chap0111b.pdf", FileMode.Create));

我們可以創建兩個有細微差別的文檔:

writerA.Pause();

document.add(new Paragraph("This paragraph will only be added to Chap0111b.pdf, not to Chap0111a.pdf"));

writerA.resume();

妳可以比較文件: Chap0111a.pdf和Chap0111b.pdf的區別

第五步,關閉 document

關閉 document 非常重要, 因為它將關閉正在運行的Writer並將內容寫入文件,該方法在最後被調用,妳應該總是要關閉文檔。

高級話題:閱讀PDF文件

該部分內容介紹了iText只能產生PDF格式的文件而不能解析PDF格式文件,不再翻譯。

第二章 塊、短句和段落

塊(Chunk)是能被添加到文檔的文本的最小單位,塊可以用於構建其他基礎元素如短句、段落、錨點等,塊是壹個有確定字體的字符串,要添加塊到文檔中時,其他所有布局變量均要被定義。下面壹行中,我們創建了壹個內容為“hello World”、紅色、斜體、COURIER字體、尺寸20的壹個塊:

Chunk chunk = new Chunk("Hello world", FontFactory.getFont(FontFactory.COURIER, 20, Font.ITALIC, new Color(255, 0, 0)));

u 典型字體1:

在本指南中,除了第九章外(妳可以在這裏學會使用其他字體),我們將始終使用典型字體1,這些是不同的典型字體1:

· Courier (該字體定寬)

· Helvetica

· Times Roman

· Symbol

· ZapfDingbats

u 下劃線/刪除線

如果妳希望壹些塊有下劃線或刪除線,妳可以通過改變字體風格簡單做到:

Chunk chunk1 = new Chunk("This text is underlined", FontFactory.getFont(FontFactory.HELVETICA, 12, Font.UNDERLINE));

Chunk chunk2 = new Chunk("This font is of type ITALIC | STRIKETHRU", FontFactory.getFont(FontFactory.HELVETICA, 12, Font.ITALIC | Font.STRIKETHRU));

u 上標/下標

在塊中有幾個方法可以調用,其中大部分將在接下來的章節中介紹,本章中只介紹壹個方法 setTextRise(float f). 妳可以使用該方法在上標或下標中寫塊。

u 塊的背景

如果妳想改變塊的背景,妳可以使用方法setBackground(Color color). 這將在塊文本的下面添加壹個彩色矩形:

ck.setBackground(new Color(0xFF, 0xFF, 0x00));

在示例代碼0101中,妳可以概覽典型字體1和壹個使用setTextRise, setBackground等方法的的例子。

短句

短句(Phrases)是壹系列以特定間距(兩行之間的距離)作為參數的塊,壹個短句有壹個主字體,但短句中的壹些塊具有不同於主字體的字體,妳有更多的選擇去創建短句,壹些具體使用參見代碼0202。

u 古希臘語

因為古希臘語經常使用,在類Phrase的構造函數中有壹個特征:將壹個字符串作為參數(如果妳想避免這種情況,妳只能使用塊工作而不能使用字符串),正如妳在示例代碼0203中看到的,這個特征自動地將913至937(除903)和945至969(古希臘的ASCII值)範圍內的所有字體改為希臘符號。

u 非主要性

與其說這是壹個特征,不如說是壹個缺陷,但無論如何,這使創建壹個非主要性的短句或段落成為可能,這將產生壹個由下向上書寫的臨時作用(參見示例代碼0204)。如果妳想在壹頁中將壹些位置移動到上面時可能有用。

說明,當妳穿越上邊屆時無法檢查,也沒有辦法讓妳回到前壹頁。

段落

段落是壹系列塊和(或)短句。同短句壹樣,段落有確定的間距。用戶還可以指定縮排;在邊和(或)右邊保留壹定空白,段落可以左對齊、右對齊和居中對齊。添加到文檔中的每壹個段落將自動另起壹行。有幾種辦法建立壹個段落,如:

Paragraph p1 = new Paragraph(new Chunk("This is my first paragraph.", FontFactory.getFont(FontFactory.HELVETICA, 12)));

Paragraph p2 = new Paragraph(new Phrase("This is my second paragraph.", FontFactory.getFont(FontFactory.HELVETICA, 12)));

Paragraph p3 = new Paragraph("This is my third paragraph.", FontFactory.getFont(FontFactory.HELVETICA, 12));

所有有些對象將被添加到段落中:

p1.add("you can add strings, "); p1.add(new Chunk("you can add chunks ")); p1.add(new Phrase("or you can add phrases."));

說明:壹個段落有壹個且僅有壹個間距,如果妳添加了壹個不同字體的短句或塊,原來的間距仍然有效,妳可以通過SetLeading來改變間距,但是段落中所有內容將使用新的中的間距。見示例代碼0205。

u 保持段落的整體性

在示例代碼0206中,我們使用了setKeepTogether(true)方法來試圖將壹個段落放在同壹頁中,該方法並不是始終有效,舉個例子,第壹段不能剛好在壹頁中,於是被分成了兩部分。第二段被放置在第二頁,但第三段順沿到了第三頁上。

字體的延續

妳應該掌握字體延續的壹些規則,這些規則的應用見示例代碼0207,當我們將壹些內容用指定的字體(非默認字體)創建壹個短句或者段落後再添加更多內容時,初始對象的字體風格將被延續,請看“Hello 1!”和“Hello 2”:

Phrase myPhrase = new Phrase("Hello 2! ", new Font(Font.TIMES_NEW_ROMAN, 8, Font.BOLD));

myPhrase.Add(new Phrase("some other font ", new Font(Font.HELVETICA, 8, Font.ITALIC)));

myPhrase.Add(new Phrase("This is the end of the sentence.\n", new Font(Font.TIMES_NEW_ROMAN, 8, Font.ITALIC)));

document.Add(myPhrase);

我們由Times New Roman 粗體字開始,添加壹些文本使用Helvetica字體而不指定風格,我們發現文本被改變成了粗體,當我們再加壹些文本使用Times New Roman字體和斜體風格,結果變成了粗斜體。

如果我們使用FontFactory來創建字體,字體風格不會被延續,因為FontFactory使用了另外的技術構建壹個字體:

myPhrase = new Phrase("Hello 1bis! ", FontFactory.getFont(FontFactory.TIMES_NEW_ROMAN, 8, Font.BOLD));

myPhrase.Add(new Phrase("some other font ", FontFactory.getFont(FontFactory.HELVETICA, 8, Font.ITALIC)));

myPhrase.Add(new Phrase("This is the end of the sentence.\n", FontFactory.getFont(FontFactory.TIMES_NEW_ROMAN, 8, Font.ITALIC)));

document.Add(myPhrase);

在上面的代碼中,使用Helvetica字體的文本風字體沒有指定(既不是粗體也不是斜體)。采用Times New Roman的額外文本僅僅顯示為斜體。

妳也看到我們添加了壹個段落,添加該段落就如同壹個短句。

Paragraph myParagraph = new Paragraph("Hello 1! ", new Font(Font.TIMES_NEW_ROMAN, 8, Font.BOLD));

myParagraph.Add(new Paragraph("This is the end of the sentence.",FontFactory.getFont(new Font.TIMES_NEW_ROMAN, 8)));

document.Add(myParagraph);

妳可以不這樣做,但將失去字體風格的延續,首先不用任何字體創建段落(例中我們僅僅給字體出間距為1.5倍),然後添加內容的不同部分。

myParagraph = new Paragraph(12);

myParagraph.Add(new Paragraph("Hello 3! ", new Font(Font.TIMES_NEW_ROMAN, 8, Font.BOLD)));

myParagraph.Add(new Paragraph("This is the end of the sentence.", new Font(Font.TIMES_NEW_ROMAN, 8, Font.ITALIC)));

document.Add(myParagraph);

如果妳使用了Phrase對象,妳同樣會失去字體風格的延續:

myPhrase = new Phrase(12);

myPhrase.Add(new Phrase("Hello 4! ", new Font(Font.TIMES_NEW_ROMAN, 8, Font.BOLD)));

myPhrase.Add(new Phrase("This is the end of the sentence.", newFont(Font.TIMES_NEW_ROMAN, 8, Font.ITALIC)));

document.Add(myPhrase);

u 更改分割符

通常,當文本不能放在壹行時,文本將被分割成不同的部分,iText首先會查找分割符,如果沒有找到,文本將在行尾被截斷。有壹些預定的分割符如“ ”空格和“-”連字符,但是妳可以使用setSplitCharacter方法來覆蓋這些默認值。在示例代碼0208中,妳可以看到當到達行尾時壹個塊是如何被分割的。然後分隔符被改成點“.”,該行在該字符處被分割。