Sunday, July 21, 2013

സ്കാൻ താളുകളെ പിഡിഎഫ് ആക്കൽ

ജെ.പി.ജി. രൂപത്തിൽ സ്കാൻ ചെയ്ത് കിട്ടുന്ന പുസ്തകങ്ങളെ  പരമാവധി വലുപ്പം കുറച്ച് ക്വാളിറ്റി നഷ്ടപ്പെടാതെ പി.ഡി.എഫ്. ആക്കി മാറ്റുന്ന ഒരു പദ്ധതി നടത്തുന്നു.

ഇത് ഇവിടെ എഴുതുന്നത്, ഞാൻ ചെയ്യുന്ന രീതി മറ്റുള്ളവർക്ക് ഉപകാരപ്പെടട്ടെ എന്ന് കരുതുന്നതിനു പുറമേ ഞാൻ ചെയ്യുന്ന രീതിയിൽ എന്തെങ്കിലും മെച്ചപ്പെടുത്തലുകൾ വരുത്താൻ സാധിക്കുമോ എന്ന് നിങ്ങളിൽ നിന്നും അഭിപ്രായങ്ങൾ ശേഖരിക്കാനും കൂടി വേണ്ടിയാണ്.

ഉപയോഗിക്കുന്ന സോഫ്റ്റ്വെയർ

  • ഒ.എസ്.: ഉബുണ്ടു 12.04
  • സ്കാൻടെയ്ലർ (scantailor) - ഇമേജ് ഫയലുകളെ പിഡിഎഫ് ആക്കുന്നതിനായി തയാറാക്കാൻ
  • കൺവെർട്ട് (convert) - ഫയലുകളെ ഒരു ഫോർമാറ്റിൽ നിന്ന് മറ്റൊന്നിലേക്ക് മാറ്റാൻ
    • ടിഫിൽ നിന്ന് ജെ.പി.ജി.
    • ജെ.പി.ജിയിൽ നിന്ന് പി.ഡി.എഫ്.
  • പിഡിഎഫ് ടൂൾകിറ്റ് (pdftk) -  കുറേ പി.ഡി.എഫ്. ഫയലുകളെ യോജിപ്പിച്ച് ഒറ്റ ഫയലാക്കാൻ

പ്രശ്നങ്ങളും പരിഹാരങ്ങളും


എനിക്ക് 64 സ്കാൻ ചെയ്ത ജെ.പി.ജി. ഫയലുകളാണ് ഇതിനായി ലഭിച്ചിരിക്കുന്നത് ഓരോന്നിന്റെയും പേര് ഇങ്ങനെയാണ് 001file.jpg, 002file.jpg എന്നു തുടങ്ങി 064file.jpg എന്നുവരെ. ഈ ഫയലുകളുടെ മൊത്തം വലുപ്പം 100 എം.ബിയുണ്ട്.

തുടക്കത്തിൽ ഞാനിത് കൺവെർട്ട് ഉപയോഗിച്ച് (താഴെക്കാണുന്ന നിർദ്ദേശം ഉപയോഗിച്ച്) നേരെ പി.ഡി.എഫ്. ആക്കാൻ ശ്രമിച്ചു.

convert *.jpg book.pdf


എന്റെ പഴയ കമ്പ്യൂട്ടർ ഇത്രയും ഫയലുകളുടെ പ്രോസസിങ് ഒരുമിച്ച് താങ്ങില്ലെന്ന് ബോദ്ധ്യപ്പെട്ടു. ഇതിനെ ഭാഗങ്ങളാക്കി pdf ആക്കുകയും പിന്നീട് ഒരുമിച്ച് ചേർക്കണമെന്നും തീരുമാനിച്ചു. അങ്ങനെ താഴെക്കാണുന്ന നിർദ്ദേശങ്ങളുപയോഗിച്ച് ആറ് പി.ഡി.എഫ്. ഫയലുകളുണ്ടാക്കുകയും പിഡിഎഫ് ടൂൾകിറ്റ് ഉപയോഗിച്ച് അതിനെ കൂട്ടിച്ചേർക്കുകയും ചെയ്തു.

convert 00*.jpg 1.pdf
convert 01*.jpg 2.pdf
convert 02*.jpg 3.pdf
convert 03*.jpg 4.pdf
convert 04*.jpg 5.pdf
convert 05*.jpg 6.pdf
convert 06*.jpg 7.pdf

pdftk 1.pdf 2.pdf 3.pdf 4.pdf 5.pdf 6.pdf 7.pdf cat output book.pdf

ഔട്ട്പുട്ട് കിട്ടിയ ഫയലിന്റെ (book.pdf) വലുപ്പം ജെ.പി.ജി. ഫയലുകളുടെ വലുപ്പത്തിന് തുല്യമാണെന്നതായിരുന്നു. ഇതിന് പരിഹാരമായി convert നിർദ്ദേശത്തിന് quality എന്നൊരു പരാമീറ്റർ നൽകി, ക്വാളിറ്റി കുറച്ച് ഫയൽ സൈസ് കുറക്കാം. മുകളിലെ കൺവെർട്ട് നിർദ്ദേശങ്ങൾ താഴെപ്പറയുന്ന മാതിരിയാക്കുക.

convert 00*.jpg -quality 18 1.pdf

ഇപ്പോൾ എനിക്ക് ഫയൽ സൈസ് 40 എം.ബിയായിക്കിട്ടി. എനിക്ക് ഫയൽസൈസ് ഒരു 10 എം.ബിയോടടുത്തെത്തിക്കണമെന്നുണ്ടായിരുന്നു. പക്ഷേ convert-ൽ ക്വാളിറ്റി ഇനിയും കുറക്കുമ്പോൾ പുസ്തകം വായിക്കാൻ മോശമാകുന്നു. ഇതിന് പരിഹാരമായി സ്കാൻ ടെയ്ലർ ഉപയോഗിക്കാമെന്നു വിചാരിച്ചു.

സ്കാൻ ചെയ്തുണ്ടാക്കുന്ന പുസ്തകത്താളുകളുടെ പല തരത്തിലുള്ള പ്രശ്നങ്ങൾ പരിഹരിക്കാനുതകുന്ന സോഫ്റ്റ്വെയറാണ് സ്കാൻ ടെയ്ലർ. എല്ലാ ഫയലുകളെയും ഒരേ വലുപ്പത്തിലാക്കുക (ഫയൽ സൈസല്ല, വീതിയും ഉയരവുമാണ് ഇവിടെ ഉദ്ദേശിക്കുന്നത്), ഒരേ ഡി.പി.ഐ. ആക്കുക, സ്കാൻ ചെയ്തപ്പോഴുണ്ടായ ചെരിവുകൾ പരിഹരിക്കുക, ഒരു സ്കാനിൽ ഒന്നിലധികം താളുകളുണ്ടെങ്കിൽ അവയെ വെവ്വേറെയാക്കുക, അനാവശ്യ ഭാഗങ്ങൾ ഒഴിവാക്കുക എന്നിങ്ങനെ പല കാരങ്ങൾ ഇതിലുണ്ട്. സ്കാൻ ടെയ്ലർ തരുന്ന ഔട്ട്പുട്ട് പി.ഡി.എഫ് ആക്കാൻ ഏറ്റവും യോഗ്യമാണെന്ന കേട്ടുകേൾവിയിൽ നിന്നാണ് ഞാനത് ഉപയോഗിച്ചത്.

സ്കാൻ ടെയ്ലർ തുറന്ന് ഈ ഫയലുകൾ ഇരിക്കുന്ന ഫോൾഡർ കാണിച്ചുകൊടുത്തു. എന്റെ ജെ.പി.ജി. ഫയലുകൾക്ക് കാര്യമായ പ്രോസസിങ് ഒന്നും ആവശ്യമില്ലാത്തതിനാൽ, 600 ഡി.പി.ഐയിൽ ഔട്ട്പുട്ട് തരാൻ പറഞ്ഞു. 001file.tif മുതൽ  064file.tif വരെ പേരുകളിൽ മറ്റൊരു ഫോൾഡറിൽ ഔട്ട്പുട്ട് കിട്ടി.

ഈ ടിഫ് ഫയലുകളെ കൺവെർട്ട് ഉപയോഗിച്ച് പി.ഡി.എഫ്. ആക്കാൻ നോക്കിയപ്പോഴും വലുപ്പം വളരെ കൂടുതലുള്ള പി.ഡി.എഫാണ് കിട്ടിയത്. അങ്ങനെ ആ ഫയലുകളെ വീണ്ടും കൺവെർട്ട് ഉപയോഗിച്ച് ജെ.പി.ജി. ആക്കി. കുറേ ഫയലുകളെ ഒരുമിച്ച് മാറ്റാൻ ടെർമിനലിൽ ഇങ്ങനെയൊരു ഫോർ ലൂപ്പ് ഉപയോഗിച്ചു.

for f in *.tif; do
  convert ./"$f" ./"${f%.tif}.jpg"
done

അതുവഴി ഈ ടിഫ് ഫയലുകളൊക്കെ അതേ പേരിലുള്ള ജെപെഗ് ഫയലുകളായി മാറി. ഇനിയവയെ താഴെക്കാണുന്ന നിർദ്ദേശങ്ങൾ ഉപയോഗിച്ച് ഏഴ് പി.ഡി.എഫ്. ഫയലുകളാക്കി മാറ്റുകയും pdftk ഉപയോഗിച്ച് കൂട്ടിച്ചേർക്കുകയും ചെയ്തു.

convert 00*.jpg -quality 8 1.pdf
convert 01*.jpg -quality 8 2.pdf
convert 02*.jpg -quality 8 3.pdf
convert 03*.jpg -quality 8 4.pdf
convert 04*.jpg -quality 8 5.pdf
convert 05*.jpg -quality 8 6.pdf
convert 06*.jpg -quality 8 7.pdf

pdftk 1.pdf 2.pdf 3.pdf 4.pdf 5.pdf 6.pdf 7.pdf cat output book.pdf

ഇപ്പോഴെനിക്ക് 10 എം.ബിയോളം വലുപ്പമുള്ള പി.ഡി.എഫ്. കിട്ടി. ഇവിടെ ക്വാളിറ്റി 8 ആക്കിയിട്ടും എനിക്ക് ആവശ്യമായ ക്വാളിറ്റി ഔട്ട്പുട്ടിനുണ്ടായിരുന്നു.


ചോദ്യങ്ങൾ

ഈ കരുക്കൾ ഉപയോഗിക്കാൻ ആർക്കെങ്കിലും കൂടുതൽ വിശദീകരണമോ മറ്റോ ആവശ്യമെങ്കിൽ ചോദിക്കാവുന്നതാണ്.

എന്റെ ചോദ്യങ്ങൾ ഇവയാണ്
  • ഞാൻ ഉപയോഗിക്കുന്ന ഈ രീതി മെച്ചപ്പെടുത്താൻ നിർദ്ദേശങ്ങളുണ്ടോ? ഇതിനേക്കാൾ മെച്ചപ്പെട്ട രീതികളുണ്ടോ? 
  • എനിക്ക് കിട്ടിയ ജെ.പി.ജി. ഫയലുകളേക്കാൾ മെച്ചപ്പെട്ട ഫലം, അതിനെ സ്കാൻ ടെയ്ലറിലൂടെ കടത്തിവിട്ടപ്പോൾ കിട്ടിയതെങ്ങനെ?
പരിചിതരായവരുടെ മറുപടി പ്രതീക്ഷിക്കുന്നു.