หลาย ๆ คนคงจะเคยใช้ไฟล์เอกสาร PDF (Portable Document Format) ไม่มากก็น้อย ไฟล์ PDF ได้ถือกำเนิดมาในปี 1993 โดย Adobe ใครรู้บ้างว่าทำไมโลกนี้จึงต้องมีไฟล์ประเภท PDF ทำไมไม่มีแค่รูปภาพเอกสาร หรือ Microsoft word … ผมมีเฉลยครับ ไฟล์ PDF ถูกออกแบบให้เป็นมาตรฐานที่เมื่อเวลาผ่านไป 20 ปี ไฟล์ PDF เดิมที่เราเคยเก็บไว้จะยังคงเปิดดูได้อยู่ โดยมีลักษณะเหมือนเดิม ทุกท่านลองนำไฟล์ Microsoft word จาก MS Word 2007 มาเปิดด้วย MS Word 2016 ดูก็จะรู้ครับ หรืออ่านความแตกต่างของ MS Word ได้ที่นี่ เนื่องจาก Microsoft Word ถูกพัฒนาความสามารถมากมายทำให้คุณลักษณะบางอย่างถูกดัดแปลง แล้ว PDF/A กับ PDF/A-3 ล่ะ คืออะไร แตกต่างจาก PDF อย่างไร แล้วทำไมกรมสรรพากรถึงเอามาใช้ในการทำ e-tax invoice อ่านลงไปเรื่อย ๆ ก็จะรู้ครับ
ภาพประวัติของไฟล์ PDF
ความเป็นมาของ PDF/A
PDF/A (PDF for Archiving) ได้รับการพัฒนาโดยคณะทำงานภายใต้การสนับสนุนของสมาคมเพื่อการจัดการสารสนเทศและภาพ (Association for Information and Image Management : AIIM) ซึ่งมีหน้าที่หลักในการพัฒนามาตรฐานสำหรับการจัดการสารสนเทศ การจัดการเอกสารและการสร้างภาพ โดยมีประธานคณะทำงานคือ Stephen Levenson จากสำนักงานของศาลสหรัฐอเมริกา (the Administrative Office of the U.S. Courts) คณะทำงานของ PDF/A เริ่มต้นพัฒนาในกลางปี 2002 และ ในปี 2005 “ISO Standard PDF/A” ได้รับการยอมรับว่าเป็นมาตรฐานสำหรับการจัดเก็บเอกสาร PDF ในระยะยาว ข้อกำหนดในส่วนแรกของมาตรฐานถูกกำหนดขึ้นโดยใช้ PDF version 1.4 เป็นพื้นฐานและเพิ่มกฎบางอย่างเข้าไป เช่น จะต้องทำให้การแสดงผลภาพของเอกสาร PDF ชัดเจน ไม่เกิดการบิดเบือนของภาพ และจะต้องแสดงผลได้โดยไม่อิงกับเทคโนโลยีของการพิมพ์หรือการแสดงผล รวมถึงจะต้องแสดงผลได้แม้ว่าอุปกรณ์นั้นจะมีประสิทธิภาพที่จำกัด
ลักษณะทั่วไปของ PDF/A
- มีพื้นฐานอยู่บน PDF Reference 1.4
- มี 2 แบบ คือ
- PDF/A-1a สำหรับเอกสารอิเล็กทรอนิกส์เช่น word processing spreadsheets
- PDF/A-1b สำหรับเอกสารที่ได้รับการสแกนจากกระดาษหรือแผ่นไมโครฟิล์มเล็ก ๆ
- ต้องการฟอนต์ฝังในเอกสาร ไม่อนุญาตการเชื่อมต่อกับภายนอก การฝังไฟล์ JavaScript หรือ multimedia ในเอกสาร
- สีจะต้องเป็นอิสระจากอุปกรณ์ หมายความว่าใช้มาตรฐานช่องว่างของสีที่เป็นที่รู้จัก ตัวอย่างมาตราฐานช่องว่างของสี เช่น sRGB (standard RGB)
- เรื่องความปลอดภัย PDF ทุกชนิดไม่อนุญาตให้มีการป้องกันด้วย password เนื่องจากในตอนนั้นคิดว่าคนเราจะจำ password ไม่น่าจะได้เมื่อเวลาผ่านไป 20 ปี
- ต้องการ metadata (รายละเอียดเกี่ยวกับเอกสาร) เช่น หัวเรื่อง ผู้แต่ง คำสำคัญ ปรากฏในเอกสาร จุดประสงค์ของการมี metadata เพื่อช่วยให้ผู้อ่านเอกสารค้นหาและจัดจำแนกง่ายขึ้น
ความเป็นมาของ PDF/A-3
หลังจากใช้ PDF/A มาได้หลายปีก็ได้กำหนดมาตรฐาน ISO Standard PDF/A-2 (ISO 19005-2) ออกมาในเดือนกรกฎาคม 2011 โดยมีคุณสมบัติเพิ่มเติมหลายอย่าง เช่น ให้สามารถฝังไฟล์แนบไว้ในไฟล์ PDF/A ได้ แต่จะต้องเป็นไฟล์ PDF/A และล่าสุดคณะกรรมการของ ISO ได้ออกมาตรฐานฉบับที่ 3 (ISO 19005-3) ในเดือนตุลาคม 2012 โดยมีชื่ออย่างเป็นทางการคือ
"Document management - Electronic document file format for long-term
preservation - Part 3: Use of ISO 32000-1 with support for embedded
files (PDF/A-3)"
เวอร์ชั่นนี้จะอยู่บนพื้นฐานของ ISO 32000-1 เช่นเดียวกับ PDF/A-2 โดย PDF/A-3 จะแบ่งออกเป็น 3 เกรดเหมือนกัน
PDF/A-3a จะสนใจเฉพาะส่วนของการเข้าใช้งานไฟล์ pdf
PDF/A-3b จะสนใจเกี่ยวกับความสมบูรณ์ของภาพที่แสดงผล คือจะต้องแสดงผลได้อย่างต่อเนื่อง คมชัด
PDF/A-3u ช่วยให้การค้นหา(search) และคัดลอก(copy) ข้อความที่เป็น Unicode บนเอกสารที่สร้างขึ้นแบบดิจิตอล รวมไปถึงเอกสารที่ได้จากการทำ OCR (optical character recognition)
PDF/A-3 โดยหลักแล้ว เพิ่มคุณสมบัติที่สำคัญ 1 อย่าง คือ สามารถฝังไฟล์เอกสารชนิดอื่นที่มาตรฐาน PDF/A ไม่ได้รองรับลงไปในไฟล์ PDF ได้ เช่น Excel, Word, HTML, CAD หรือ XML ถึงแม้ว่าจะขัดกับหลักการเริ่มต้นของ PDF แต่บริษัทจากหลายกลุ่มอุตสาหกรรมมีความต้องการให้ความสามารถนี้เกิดขึ้น เนื่องจากมีความต้องการเก็บไฟล์ต้นฉบับฝังเข้าไปกับไฟล์ PDF/A
มาตรฐานฉบับนี้จะรองรับเฉพาะการเปิดดูไฟล์ PDF/A บนโปรแกรมที่รองรับมาตรฐานนี้เท่านั้น สำหรับการจะเปิดดูไฟล์เอกสารแนบประเภทอื่นที่ไม่ได้อยู่ในมาตรฐาน PDF/A อาจจะต้องใช้วิธีการดึงไฟล์ที่แนบไว้ออกมาจาก PDF/A-3 แล้วเปิดด้วยโปรแกรมอื่นที่สามารถเปิดได้
การที่กรมสรรพากรเลือกให้ส่ง e-tax invoice ด้วย PDF/A-3 นี้ ก็เพื่อประโยชน์คือ
- คนอ่านได้ เนื่องจากเมื่อเปิด PDF/A-3 แล้วคนสามารถอ่านออกเหมือน PDF ทั่วไป
- เครื่องคอมพิวเตอร์อ่านออก เนื่องจากกรมสรรพากรบอกให้แนบไฟล์ XML ที่มีโครงสร้างตามที่ระบุไว้ที่เอกสาร “ข้อเสนอแนะมาตรฐานฯการใช้ข้อความ XML สำหรับการแลกเปลี่ยนข้อมูลอิเล็กทรอนิกส์ระหว่างหน่วยงาน (ขมธอ. 14-2560)” เพื่อให้ซอฟต์แวร์ของกรมสรรพากรอ่านข้อมูลได้

ภาพตัวอย่างไฟล์ PDF/A-3 ที่แนบไฟล์ XML ไว้ ตามแบบของ e-tax invoice ที่กรมสรรพากรต้องการ
ขอบคุณข้อมูลจาก