Mengapa File PDF yang Dihasilkan oleh Microsoft Word Begitu Besar?

Ketika dokumen Anda sebagian besar hanya berupa teks, maka sepertinya ukuran file untuk versi.docx dan.pdf seharusnya cukup mirip saat disimpan, tetapi tidak selalu demikian. Postingan SuperUser Q&A hari ini memiliki jawaban atas pertanyaan pembaca yang penasaran tentang perbedaan besar dalam ukuran file.

Sesi Tanya Jawab hari ini diberikan kepada kita atas izin SuperUser—subdivisi dari Stack Exchange, pengelompokan situs web Tanya Jawab berbasis komunitas.

Clip-art sarung tinju milik Clker.com.

Pertanyaan

Pembaca SuperUser Borek ingin tahu mengapa file PDF yang dihasilkan oleh Microsoft Word begitu besar:

Saya membuat dokumen Microsoft Word sederhana yang hanya berisi kalimat ini, tidak ada yang lain:

  • Ini adalah dokumen kecil.

Kemudian saya menyimpan dokumen sebagai file.docx dan.pdf. Berikut adalah ukuran file:

  • .docx: 12 kB
  • .pdf: 89 kB

Perbedaan antara kedua file sangat besar (secara teknis) dan sangat mengganggu saya ketika dokumen yang sebagian besar bersifat tekstual hanya puluhan kB dalam format.docx, tetapi berukuran ratusan kB ketika dikonversi ke file PDF. Apa yang sangat tidak efisien tentang format PDF? Apakah hanya Microsoft Word yang menggunakan beberapa algoritma keluaran yang mengerikan?

Omong-omong, pengaturan output PDF pada instalasi Microsoft Office saya diatur untuk membuat file sekecil mungkin:

Mengapa file PDF yang dihasilkan oleh Microsoft Word begitu besar?

Jawabannya

Kontributor SuperUser rene memiliki jawaban untuk kita:

Jika Anda membuka file PDF di Notepad++, Anda akan menemukan:

Dan objek itu direferensikan di sini di akhir instruksi /FontFile2:

Font yang digunakan oleh dokumen Microsoft Word disematkan ke dalam file PDF sehingga mandiri. Saya menggunakan dek slide ini dari Adobe untuk menguraikan instruksi PDF.

Jika Anda ingin mencegah font disematkan dalam file PDF, pastikan dokumen Microsoft Word Anda menggunakan salah satu dari 14 tipografi standar yang tersedia di PDF viewer (Sumber: Wikipedia ).

  • Times New Roman > Times (v3) (dalam regular, italic, bold, and bold italic)
  • Courier New > Courier (dalam regular, oblique, bold, dan bold oblique)
  • Arial > Helvetica (v3) (dalam regular, oblique, bold, dan bold oblique)
  • Simbol > Simbol
  • Wingdings > Zapf Dingbats

Punya sesuatu untuk ditambahkan ke penjelasan? Suarakan di komentar. Ingin membaca lebih banyak jawaban dari pengguna Stack Exchange yang paham teknologi lainnya? Lihat utas diskusi lengkapnya di sini.

Related Posts