ജെ.പി.ജി. രൂപത്തിൽ സ്കാൻ ചെയ്ത് കിട്ടുന്ന പുസ്തകങ്ങളെ പരമാവധി വലുപ്പം കുറച്ച് ക്വാളിറ്റി നഷ്ടപ്പെടാതെ പി.ഡി.എഫ്. ആക്കി മാറ്റുന്ന ഒരു പദ്ധതി നടത്തുന്നു.
ഇത് ഇവിടെ എഴുതുന്നത്, ഞാൻ ചെയ്യുന്ന രീതി മറ്റുള്ളവർക്ക് ഉപകാരപ്പെടട്ടെ എന്ന് കരുതുന്നതിനു പുറമേ ഞാൻ ചെയ്യുന്ന രീതിയിൽ എന്തെങ്കിലും മെച്ചപ്പെടുത്തലുകൾ വരുത്താൻ സാധിക്കുമോ എന്ന് നിങ്ങളിൽ നിന്നും അഭിപ്രായങ്ങൾ ശേഖരിക്കാനും കൂടി വേണ്ടിയാണ്.
എനിക്ക് 64 സ്കാൻ ചെയ്ത ജെ.പി.ജി. ഫയലുകളാണ് ഇതിനായി ലഭിച്ചിരിക്കുന്നത് ഓരോന്നിന്റെയും പേര് ഇങ്ങനെയാണ് 001file.jpg, 002file.jpg എന്നു തുടങ്ങി 064file.jpg എന്നുവരെ. ഈ ഫയലുകളുടെ മൊത്തം വലുപ്പം 100 എം.ബിയുണ്ട്.
തുടക്കത്തിൽ ഞാനിത് കൺവെർട്ട് ഉപയോഗിച്ച് (താഴെക്കാണുന്ന നിർദ്ദേശം ഉപയോഗിച്ച്) നേരെ പി.ഡി.എഫ്. ആക്കാൻ ശ്രമിച്ചു.
convert *.jpg book.pdf
എന്റെ പഴയ കമ്പ്യൂട്ടർ ഇത്രയും ഫയലുകളുടെ പ്രോസസിങ് ഒരുമിച്ച് താങ്ങില്ലെന്ന് ബോദ്ധ്യപ്പെട്ടു. ഇതിനെ ഭാഗങ്ങളാക്കി pdf ആക്കുകയും പിന്നീട് ഒരുമിച്ച് ചേർക്കണമെന്നും തീരുമാനിച്ചു. അങ്ങനെ താഴെക്കാണുന്ന നിർദ്ദേശങ്ങളുപയോഗിച്ച് ആറ് പി.ഡി.എഫ്. ഫയലുകളുണ്ടാക്കുകയും പിഡിഎഫ് ടൂൾകിറ്റ് ഉപയോഗിച്ച് അതിനെ കൂട്ടിച്ചേർക്കുകയും ചെയ്തു.
convert 00*.jpg 1.pdf
convert 01*.jpg 2.pdf
convert 02*.jpg 3.pdf
convert 03*.jpg 4.pdf
convert 04*.jpg 5.pdf
convert 05*.jpg 6.pdf
convert 06*.jpg 7.pdf
pdftk 1.pdf 2.pdf 3.pdf 4.pdf 5.pdf 6.pdf 7.pdf cat output book.pdf
ഔട്ട്പുട്ട് കിട്ടിയ ഫയലിന്റെ (book.pdf) വലുപ്പം ജെ.പി.ജി. ഫയലുകളുടെ വലുപ്പത്തിന് തുല്യമാണെന്നതായിരുന്നു. ഇതിന് പരിഹാരമായി convert നിർദ്ദേശത്തിന് quality എന്നൊരു പരാമീറ്റർ നൽകി, ക്വാളിറ്റി കുറച്ച് ഫയൽ സൈസ് കുറക്കാം. മുകളിലെ കൺവെർട്ട് നിർദ്ദേശങ്ങൾ താഴെപ്പറയുന്ന മാതിരിയാക്കുക.
convert 00*.jpg -quality 18 1.pdf
ഇപ്പോൾ എനിക്ക് ഫയൽ സൈസ് 40 എം.ബിയായിക്കിട്ടി. എനിക്ക് ഫയൽസൈസ് ഒരു 10 എം.ബിയോടടുത്തെത്തിക്കണമെന്നുണ്ടായിരുന്നു. പക്ഷേ convert-ൽ ക്വാളിറ്റി ഇനിയും കുറക്കുമ്പോൾ പുസ്തകം വായിക്കാൻ മോശമാകുന്നു. ഇതിന് പരിഹാരമായി സ്കാൻ ടെയ്ലർ ഉപയോഗിക്കാമെന്നു വിചാരിച്ചു.
സ്കാൻ ചെയ്തുണ്ടാക്കുന്ന പുസ്തകത്താളുകളുടെ പല തരത്തിലുള്ള പ്രശ്നങ്ങൾ പരിഹരിക്കാനുതകുന്ന സോഫ്റ്റ്വെയറാണ് സ്കാൻ ടെയ്ലർ. എല്ലാ ഫയലുകളെയും ഒരേ വലുപ്പത്തിലാക്കുക (ഫയൽ സൈസല്ല, വീതിയും ഉയരവുമാണ് ഇവിടെ ഉദ്ദേശിക്കുന്നത്), ഒരേ ഡി.പി.ഐ. ആക്കുക, സ്കാൻ ചെയ്തപ്പോഴുണ്ടായ ചെരിവുകൾ പരിഹരിക്കുക, ഒരു സ്കാനിൽ ഒന്നിലധികം താളുകളുണ്ടെങ്കിൽ അവയെ വെവ്വേറെയാക്കുക, അനാവശ്യ ഭാഗങ്ങൾ ഒഴിവാക്കുക എന്നിങ്ങനെ പല കാരങ്ങൾ ഇതിലുണ്ട്. സ്കാൻ ടെയ്ലർ തരുന്ന ഔട്ട്പുട്ട് പി.ഡി.എഫ് ആക്കാൻ ഏറ്റവും യോഗ്യമാണെന്ന കേട്ടുകേൾവിയിൽ നിന്നാണ് ഞാനത് ഉപയോഗിച്ചത്.
സ്കാൻ ടെയ്ലർ തുറന്ന് ഈ ഫയലുകൾ ഇരിക്കുന്ന ഫോൾഡർ കാണിച്ചുകൊടുത്തു. എന്റെ ജെ.പി.ജി. ഫയലുകൾക്ക് കാര്യമായ പ്രോസസിങ് ഒന്നും ആവശ്യമില്ലാത്തതിനാൽ, 600 ഡി.പി.ഐയിൽ ഔട്ട്പുട്ട് തരാൻ പറഞ്ഞു. 001file.tif മുതൽ 064file.tif വരെ പേരുകളിൽ മറ്റൊരു ഫോൾഡറിൽ ഔട്ട്പുട്ട് കിട്ടി.
ഈ ടിഫ് ഫയലുകളെ കൺവെർട്ട് ഉപയോഗിച്ച് പി.ഡി.എഫ്. ആക്കാൻ നോക്കിയപ്പോഴും വലുപ്പം വളരെ കൂടുതലുള്ള പി.ഡി.എഫാണ് കിട്ടിയത്. അങ്ങനെ ആ ഫയലുകളെ വീണ്ടും കൺവെർട്ട് ഉപയോഗിച്ച് ജെ.പി.ജി. ആക്കി. കുറേ ഫയലുകളെ ഒരുമിച്ച് മാറ്റാൻ ടെർമിനലിൽ ഇങ്ങനെയൊരു ഫോർ ലൂപ്പ് ഉപയോഗിച്ചു.
for f in *.tif; do
convert ./"$f" ./"${f%.tif}.jpg"
done
അതുവഴി ഈ ടിഫ് ഫയലുകളൊക്കെ അതേ പേരിലുള്ള ജെപെഗ് ഫയലുകളായി മാറി. ഇനിയവയെ താഴെക്കാണുന്ന നിർദ്ദേശങ്ങൾ ഉപയോഗിച്ച് ഏഴ് പി.ഡി.എഫ്. ഫയലുകളാക്കി മാറ്റുകയും pdftk ഉപയോഗിച്ച് കൂട്ടിച്ചേർക്കുകയും ചെയ്തു.
convert 00*.jpg -quality 8 1.pdf
convert 01*.jpg -quality 8 2.pdf
convert 02*.jpg -quality 8 3.pdf
convert 03*.jpg -quality 8 4.pdf
convert 04*.jpg -quality 8 5.pdf
convert 05*.jpg -quality 8 6.pdf
convert 06*.jpg -quality 8 7.pdf
pdftk 1.pdf 2.pdf 3.pdf 4.pdf 5.pdf 6.pdf 7.pdf cat output book.pdf
ഇപ്പോഴെനിക്ക് 10 എം.ബിയോളം വലുപ്പമുള്ള പി.ഡി.എഫ്. കിട്ടി. ഇവിടെ ക്വാളിറ്റി 8 ആക്കിയിട്ടും എനിക്ക് ആവശ്യമായ ക്വാളിറ്റി ഔട്ട്പുട്ടിനുണ്ടായിരുന്നു.
ഇത് ഇവിടെ എഴുതുന്നത്, ഞാൻ ചെയ്യുന്ന രീതി മറ്റുള്ളവർക്ക് ഉപകാരപ്പെടട്ടെ എന്ന് കരുതുന്നതിനു പുറമേ ഞാൻ ചെയ്യുന്ന രീതിയിൽ എന്തെങ്കിലും മെച്ചപ്പെടുത്തലുകൾ വരുത്താൻ സാധിക്കുമോ എന്ന് നിങ്ങളിൽ നിന്നും അഭിപ്രായങ്ങൾ ശേഖരിക്കാനും കൂടി വേണ്ടിയാണ്.
ഉപയോഗിക്കുന്ന സോഫ്റ്റ്വെയർ
- ഒ.എസ്.: ഉബുണ്ടു 12.04
- സ്കാൻടെയ്ലർ (scantailor) - ഇമേജ് ഫയലുകളെ പിഡിഎഫ് ആക്കുന്നതിനായി തയാറാക്കാൻ
- കൺവെർട്ട് (convert) - ഫയലുകളെ ഒരു ഫോർമാറ്റിൽ നിന്ന് മറ്റൊന്നിലേക്ക് മാറ്റാൻ
- ടിഫിൽ നിന്ന് ജെ.പി.ജി.
- ജെ.പി.ജിയിൽ നിന്ന് പി.ഡി.എഫ്.
- പിഡിഎഫ് ടൂൾകിറ്റ് (pdftk) - കുറേ പി.ഡി.എഫ്. ഫയലുകളെ യോജിപ്പിച്ച് ഒറ്റ ഫയലാക്കാൻ
പ്രശ്നങ്ങളും പരിഹാരങ്ങളും
എനിക്ക് 64 സ്കാൻ ചെയ്ത ജെ.പി.ജി. ഫയലുകളാണ് ഇതിനായി ലഭിച്ചിരിക്കുന്നത് ഓരോന്നിന്റെയും പേര് ഇങ്ങനെയാണ് 001file.jpg, 002file.jpg എന്നു തുടങ്ങി 064file.jpg എന്നുവരെ. ഈ ഫയലുകളുടെ മൊത്തം വലുപ്പം 100 എം.ബിയുണ്ട്.
തുടക്കത്തിൽ ഞാനിത് കൺവെർട്ട് ഉപയോഗിച്ച് (താഴെക്കാണുന്ന നിർദ്ദേശം ഉപയോഗിച്ച്) നേരെ പി.ഡി.എഫ്. ആക്കാൻ ശ്രമിച്ചു.
convert *.jpg book.pdf
എന്റെ പഴയ കമ്പ്യൂട്ടർ ഇത്രയും ഫയലുകളുടെ പ്രോസസിങ് ഒരുമിച്ച് താങ്ങില്ലെന്ന് ബോദ്ധ്യപ്പെട്ടു. ഇതിനെ ഭാഗങ്ങളാക്കി pdf ആക്കുകയും പിന്നീട് ഒരുമിച്ച് ചേർക്കണമെന്നും തീരുമാനിച്ചു. അങ്ങനെ താഴെക്കാണുന്ന നിർദ്ദേശങ്ങളുപയോഗിച്ച് ആറ് പി.ഡി.എഫ്. ഫയലുകളുണ്ടാക്കുകയും പിഡിഎഫ് ടൂൾകിറ്റ് ഉപയോഗിച്ച് അതിനെ കൂട്ടിച്ചേർക്കുകയും ചെയ്തു.
convert 00*.jpg 1.pdf
convert 01*.jpg 2.pdf
convert 02*.jpg 3.pdf
convert 03*.jpg 4.pdf
convert 04*.jpg 5.pdf
convert 05*.jpg 6.pdf
convert 06*.jpg 7.pdf
pdftk 1.pdf 2.pdf 3.pdf 4.pdf 5.pdf 6.pdf 7.pdf cat output book.pdf
ഔട്ട്പുട്ട് കിട്ടിയ ഫയലിന്റെ (book.pdf) വലുപ്പം ജെ.പി.ജി. ഫയലുകളുടെ വലുപ്പത്തിന് തുല്യമാണെന്നതായിരുന്നു. ഇതിന് പരിഹാരമായി convert നിർദ്ദേശത്തിന് quality എന്നൊരു പരാമീറ്റർ നൽകി, ക്വാളിറ്റി കുറച്ച് ഫയൽ സൈസ് കുറക്കാം. മുകളിലെ കൺവെർട്ട് നിർദ്ദേശങ്ങൾ താഴെപ്പറയുന്ന മാതിരിയാക്കുക.
convert 00*.jpg -quality 18 1.pdf
ഇപ്പോൾ എനിക്ക് ഫയൽ സൈസ് 40 എം.ബിയായിക്കിട്ടി. എനിക്ക് ഫയൽസൈസ് ഒരു 10 എം.ബിയോടടുത്തെത്തിക്കണമെന്നുണ്ടായിരുന്നു. പക്ഷേ convert-ൽ ക്വാളിറ്റി ഇനിയും കുറക്കുമ്പോൾ പുസ്തകം വായിക്കാൻ മോശമാകുന്നു. ഇതിന് പരിഹാരമായി സ്കാൻ ടെയ്ലർ ഉപയോഗിക്കാമെന്നു വിചാരിച്ചു.
സ്കാൻ ചെയ്തുണ്ടാക്കുന്ന പുസ്തകത്താളുകളുടെ പല തരത്തിലുള്ള പ്രശ്നങ്ങൾ പരിഹരിക്കാനുതകുന്ന സോഫ്റ്റ്വെയറാണ് സ്കാൻ ടെയ്ലർ. എല്ലാ ഫയലുകളെയും ഒരേ വലുപ്പത്തിലാക്കുക (ഫയൽ സൈസല്ല, വീതിയും ഉയരവുമാണ് ഇവിടെ ഉദ്ദേശിക്കുന്നത്), ഒരേ ഡി.പി.ഐ. ആക്കുക, സ്കാൻ ചെയ്തപ്പോഴുണ്ടായ ചെരിവുകൾ പരിഹരിക്കുക, ഒരു സ്കാനിൽ ഒന്നിലധികം താളുകളുണ്ടെങ്കിൽ അവയെ വെവ്വേറെയാക്കുക, അനാവശ്യ ഭാഗങ്ങൾ ഒഴിവാക്കുക എന്നിങ്ങനെ പല കാരങ്ങൾ ഇതിലുണ്ട്. സ്കാൻ ടെയ്ലർ തരുന്ന ഔട്ട്പുട്ട് പി.ഡി.എഫ് ആക്കാൻ ഏറ്റവും യോഗ്യമാണെന്ന കേട്ടുകേൾവിയിൽ നിന്നാണ് ഞാനത് ഉപയോഗിച്ചത്.
സ്കാൻ ടെയ്ലർ തുറന്ന് ഈ ഫയലുകൾ ഇരിക്കുന്ന ഫോൾഡർ കാണിച്ചുകൊടുത്തു. എന്റെ ജെ.പി.ജി. ഫയലുകൾക്ക് കാര്യമായ പ്രോസസിങ് ഒന്നും ആവശ്യമില്ലാത്തതിനാൽ, 600 ഡി.പി.ഐയിൽ ഔട്ട്പുട്ട് തരാൻ പറഞ്ഞു. 001file.tif മുതൽ 064file.tif വരെ പേരുകളിൽ മറ്റൊരു ഫോൾഡറിൽ ഔട്ട്പുട്ട് കിട്ടി.
ഈ ടിഫ് ഫയലുകളെ കൺവെർട്ട് ഉപയോഗിച്ച് പി.ഡി.എഫ്. ആക്കാൻ നോക്കിയപ്പോഴും വലുപ്പം വളരെ കൂടുതലുള്ള പി.ഡി.എഫാണ് കിട്ടിയത്. അങ്ങനെ ആ ഫയലുകളെ വീണ്ടും കൺവെർട്ട് ഉപയോഗിച്ച് ജെ.പി.ജി. ആക്കി. കുറേ ഫയലുകളെ ഒരുമിച്ച് മാറ്റാൻ ടെർമിനലിൽ ഇങ്ങനെയൊരു ഫോർ ലൂപ്പ് ഉപയോഗിച്ചു.
for f in *.tif; do
convert ./"$f" ./"${f%.tif}.jpg"
done
അതുവഴി ഈ ടിഫ് ഫയലുകളൊക്കെ അതേ പേരിലുള്ള ജെപെഗ് ഫയലുകളായി മാറി. ഇനിയവയെ താഴെക്കാണുന്ന നിർദ്ദേശങ്ങൾ ഉപയോഗിച്ച് ഏഴ് പി.ഡി.എഫ്. ഫയലുകളാക്കി മാറ്റുകയും pdftk ഉപയോഗിച്ച് കൂട്ടിച്ചേർക്കുകയും ചെയ്തു.
convert 00*.jpg -quality 8 1.pdf
convert 01*.jpg -quality 8 2.pdf
convert 02*.jpg -quality 8 3.pdf
convert 03*.jpg -quality 8 4.pdf
convert 04*.jpg -quality 8 5.pdf
convert 05*.jpg -quality 8 6.pdf
convert 06*.jpg -quality 8 7.pdf
pdftk 1.pdf 2.pdf 3.pdf 4.pdf 5.pdf 6.pdf 7.pdf cat output book.pdf
ഇപ്പോഴെനിക്ക് 10 എം.ബിയോളം വലുപ്പമുള്ള പി.ഡി.എഫ്. കിട്ടി. ഇവിടെ ക്വാളിറ്റി 8 ആക്കിയിട്ടും എനിക്ക് ആവശ്യമായ ക്വാളിറ്റി ഔട്ട്പുട്ടിനുണ്ടായിരുന്നു.
ചോദ്യങ്ങൾ
ഈ കരുക്കൾ ഉപയോഗിക്കാൻ ആർക്കെങ്കിലും കൂടുതൽ വിശദീകരണമോ മറ്റോ ആവശ്യമെങ്കിൽ ചോദിക്കാവുന്നതാണ്.
എന്റെ ചോദ്യങ്ങൾ ഇവയാണ്
- ഞാൻ ഉപയോഗിക്കുന്ന ഈ രീതി മെച്ചപ്പെടുത്താൻ നിർദ്ദേശങ്ങളുണ്ടോ? ഇതിനേക്കാൾ മെച്ചപ്പെട്ട രീതികളുണ്ടോ?
- എനിക്ക് കിട്ടിയ ജെ.പി.ജി. ഫയലുകളേക്കാൾ മെച്ചപ്പെട്ട ഫലം, അതിനെ സ്കാൻ ടെയ്ലറിലൂടെ കടത്തിവിട്ടപ്പോൾ കിട്ടിയതെങ്ങനെ?