ജെ.പി.ജി. രൂപത്തിൽ സ്കാൻ ചെയ്ത് കിട്ടുന്ന പുസ്തകങ്ങളെ പരമാവധി വലുപ്പം കുറച്ച് ക്വാളിറ്റി നഷ്ടപ്പെടാതെ പി.ഡി.എഫ്. ആക്കി മാറ്റുന്ന ഒരു പദ്ധതി നടത്തുന്നു.
ഇത് ഇവിടെ എഴുതുന്നത്, ഞാൻ ചെയ്യുന്ന രീതി മറ്റുള്ളവർക്ക് ഉപകാരപ്പെടട്ടെ എന്ന് കരുതുന്നതിനു പുറമേ ഞാൻ ചെയ്യുന്ന രീതിയിൽ എന്തെങ്കിലും മെച്ചപ്പെടുത്തലുകൾ വരുത്താൻ സാധിക്കുമോ എന്ന് നിങ്ങളിൽ നിന്നും അഭിപ്രായങ്ങൾ ശേഖരിക്കാനും കൂടി വേണ്ടിയാണ്.
എനിക്ക് 64 സ്കാൻ ചെയ്ത ജെ.പി.ജി. ഫയലുകളാണ് ഇതിനായി ലഭിച്ചിരിക്കുന്നത് ഓരോന്നിന്റെയും പേര് ഇങ്ങനെയാണ് 001file.jpg, 002file.jpg എന്നു തുടങ്ങി 064file.jpg എന്നുവരെ. ഈ ഫയലുകളുടെ മൊത്തം വലുപ്പം 100 എം.ബിയുണ്ട്.
തുടക്കത്തിൽ ഞാനിത് കൺവെർട്ട് ഉപയോഗിച്ച് (താഴെക്കാണുന്ന നിർദ്ദേശം ഉപയോഗിച്ച്) നേരെ പി.ഡി.എഫ്. ആക്കാൻ ശ്രമിച്ചു.
convert *.jpg book.pdf
എന്റെ പഴയ കമ്പ്യൂട്ടർ ഇത്രയും ഫയലുകളുടെ പ്രോസസിങ് ഒരുമിച്ച് താങ്ങില്ലെന്ന് ബോദ്ധ്യപ്പെട്ടു. ഇതിനെ ഭാഗങ്ങളാക്കി pdf ആക്കുകയും പിന്നീട് ഒരുമിച്ച് ചേർക്കണമെന്നും തീരുമാനിച്ചു. അങ്ങനെ താഴെക്കാണുന്ന നിർദ്ദേശങ്ങളുപയോഗിച്ച് ആറ് പി.ഡി.എഫ്. ഫയലുകളുണ്ടാക്കുകയും പിഡിഎഫ് ടൂൾകിറ്റ് ഉപയോഗിച്ച് അതിനെ കൂട്ടിച്ചേർക്കുകയും ചെയ്തു.
convert 00*.jpg 1.pdf
convert 01*.jpg 2.pdf
convert 02*.jpg 3.pdf
convert 03*.jpg 4.pdf
convert 04*.jpg 5.pdf
convert 05*.jpg 6.pdf
convert 06*.jpg 7.pdf
pdftk 1.pdf 2.pdf 3.pdf 4.pdf 5.pdf 6.pdf 7.pdf cat output book.pdf
ഔട്ട്പുട്ട് കിട്ടിയ ഫയലിന്റെ (book.pdf) വലുപ്പം ജെ.പി.ജി. ഫയലുകളുടെ വലുപ്പത്തിന് തുല്യമാണെന്നതായിരുന്നു. ഇതിന് പരിഹാരമായി convert നിർദ്ദേശത്തിന് quality എന്നൊരു പരാമീറ്റർ നൽകി, ക്വാളിറ്റി കുറച്ച് ഫയൽ സൈസ് കുറക്കാം. മുകളിലെ കൺവെർട്ട് നിർദ്ദേശങ്ങൾ താഴെപ്പറയുന്ന മാതിരിയാക്കുക.
convert 00*.jpg -quality 18 1.pdf
ഇപ്പോൾ എനിക്ക് ഫയൽ സൈസ് 40 എം.ബിയായിക്കിട്ടി. എനിക്ക് ഫയൽസൈസ് ഒരു 10 എം.ബിയോടടുത്തെത്തിക്കണമെന്നുണ്ടായിരുന്നു. പക്ഷേ convert-ൽ ക്വാളിറ്റി ഇനിയും കുറക്കുമ്പോൾ പുസ്തകം വായിക്കാൻ മോശമാകുന്നു. ഇതിന് പരിഹാരമായി സ്കാൻ ടെയ്ലർ ഉപയോഗിക്കാമെന്നു വിചാരിച്ചു.
സ്കാൻ ചെയ്തുണ്ടാക്കുന്ന പുസ്തകത്താളുകളുടെ പല തരത്തിലുള്ള പ്രശ്നങ്ങൾ പരിഹരിക്കാനുതകുന്ന സോഫ്റ്റ്വെയറാണ് സ്കാൻ ടെയ്ലർ. എല്ലാ ഫയലുകളെയും ഒരേ വലുപ്പത്തിലാക്കുക (ഫയൽ സൈസല്ല, വീതിയും ഉയരവുമാണ് ഇവിടെ ഉദ്ദേശിക്കുന്നത്), ഒരേ ഡി.പി.ഐ. ആക്കുക, സ്കാൻ ചെയ്തപ്പോഴുണ്ടായ ചെരിവുകൾ പരിഹരിക്കുക, ഒരു സ്കാനിൽ ഒന്നിലധികം താളുകളുണ്ടെങ്കിൽ അവയെ വെവ്വേറെയാക്കുക, അനാവശ്യ ഭാഗങ്ങൾ ഒഴിവാക്കുക എന്നിങ്ങനെ പല കാരങ്ങൾ ഇതിലുണ്ട്. സ്കാൻ ടെയ്ലർ തരുന്ന ഔട്ട്പുട്ട് പി.ഡി.എഫ് ആക്കാൻ ഏറ്റവും യോഗ്യമാണെന്ന കേട്ടുകേൾവിയിൽ നിന്നാണ് ഞാനത് ഉപയോഗിച്ചത്.
സ്കാൻ ടെയ്ലർ തുറന്ന് ഈ ഫയലുകൾ ഇരിക്കുന്ന ഫോൾഡർ കാണിച്ചുകൊടുത്തു. എന്റെ ജെ.പി.ജി. ഫയലുകൾക്ക് കാര്യമായ പ്രോസസിങ് ഒന്നും ആവശ്യമില്ലാത്തതിനാൽ, 600 ഡി.പി.ഐയിൽ ഔട്ട്പുട്ട് തരാൻ പറഞ്ഞു. 001file.tif മുതൽ 064file.tif വരെ പേരുകളിൽ മറ്റൊരു ഫോൾഡറിൽ ഔട്ട്പുട്ട് കിട്ടി.
ഈ ടിഫ് ഫയലുകളെ കൺവെർട്ട് ഉപയോഗിച്ച് പി.ഡി.എഫ്. ആക്കാൻ നോക്കിയപ്പോഴും വലുപ്പം വളരെ കൂടുതലുള്ള പി.ഡി.എഫാണ് കിട്ടിയത്. അങ്ങനെ ആ ഫയലുകളെ വീണ്ടും കൺവെർട്ട് ഉപയോഗിച്ച് ജെ.പി.ജി. ആക്കി. കുറേ ഫയലുകളെ ഒരുമിച്ച് മാറ്റാൻ ടെർമിനലിൽ ഇങ്ങനെയൊരു ഫോർ ലൂപ്പ് ഉപയോഗിച്ചു.
for f in *.tif; do
convert ./"$f" ./"${f%.tif}.jpg"
done
അതുവഴി ഈ ടിഫ് ഫയലുകളൊക്കെ അതേ പേരിലുള്ള ജെപെഗ് ഫയലുകളായി മാറി. ഇനിയവയെ താഴെക്കാണുന്ന നിർദ്ദേശങ്ങൾ ഉപയോഗിച്ച് ഏഴ് പി.ഡി.എഫ്. ഫയലുകളാക്കി മാറ്റുകയും pdftk ഉപയോഗിച്ച് കൂട്ടിച്ചേർക്കുകയും ചെയ്തു.
convert 00*.jpg -quality 8 1.pdf
convert 01*.jpg -quality 8 2.pdf
convert 02*.jpg -quality 8 3.pdf
convert 03*.jpg -quality 8 4.pdf
convert 04*.jpg -quality 8 5.pdf
convert 05*.jpg -quality 8 6.pdf
convert 06*.jpg -quality 8 7.pdf
pdftk 1.pdf 2.pdf 3.pdf 4.pdf 5.pdf 6.pdf 7.pdf cat output book.pdf
ഇപ്പോഴെനിക്ക് 10 എം.ബിയോളം വലുപ്പമുള്ള പി.ഡി.എഫ്. കിട്ടി. ഇവിടെ ക്വാളിറ്റി 8 ആക്കിയിട്ടും എനിക്ക് ആവശ്യമായ ക്വാളിറ്റി ഔട്ട്പുട്ടിനുണ്ടായിരുന്നു.
ഇത് ഇവിടെ എഴുതുന്നത്, ഞാൻ ചെയ്യുന്ന രീതി മറ്റുള്ളവർക്ക് ഉപകാരപ്പെടട്ടെ എന്ന് കരുതുന്നതിനു പുറമേ ഞാൻ ചെയ്യുന്ന രീതിയിൽ എന്തെങ്കിലും മെച്ചപ്പെടുത്തലുകൾ വരുത്താൻ സാധിക്കുമോ എന്ന് നിങ്ങളിൽ നിന്നും അഭിപ്രായങ്ങൾ ശേഖരിക്കാനും കൂടി വേണ്ടിയാണ്.
ഉപയോഗിക്കുന്ന സോഫ്റ്റ്വെയർ
- ഒ.എസ്.: ഉബുണ്ടു 12.04
- സ്കാൻടെയ്ലർ (scantailor) - ഇമേജ് ഫയലുകളെ പിഡിഎഫ് ആക്കുന്നതിനായി തയാറാക്കാൻ
- കൺവെർട്ട് (convert) - ഫയലുകളെ ഒരു ഫോർമാറ്റിൽ നിന്ന് മറ്റൊന്നിലേക്ക് മാറ്റാൻ
- ടിഫിൽ നിന്ന് ജെ.പി.ജി.
- ജെ.പി.ജിയിൽ നിന്ന് പി.ഡി.എഫ്.
- പിഡിഎഫ് ടൂൾകിറ്റ് (pdftk) - കുറേ പി.ഡി.എഫ്. ഫയലുകളെ യോജിപ്പിച്ച് ഒറ്റ ഫയലാക്കാൻ
പ്രശ്നങ്ങളും പരിഹാരങ്ങളും
എനിക്ക് 64 സ്കാൻ ചെയ്ത ജെ.പി.ജി. ഫയലുകളാണ് ഇതിനായി ലഭിച്ചിരിക്കുന്നത് ഓരോന്നിന്റെയും പേര് ഇങ്ങനെയാണ് 001file.jpg, 002file.jpg എന്നു തുടങ്ങി 064file.jpg എന്നുവരെ. ഈ ഫയലുകളുടെ മൊത്തം വലുപ്പം 100 എം.ബിയുണ്ട്.
തുടക്കത്തിൽ ഞാനിത് കൺവെർട്ട് ഉപയോഗിച്ച് (താഴെക്കാണുന്ന നിർദ്ദേശം ഉപയോഗിച്ച്) നേരെ പി.ഡി.എഫ്. ആക്കാൻ ശ്രമിച്ചു.
convert *.jpg book.pdf
എന്റെ പഴയ കമ്പ്യൂട്ടർ ഇത്രയും ഫയലുകളുടെ പ്രോസസിങ് ഒരുമിച്ച് താങ്ങില്ലെന്ന് ബോദ്ധ്യപ്പെട്ടു. ഇതിനെ ഭാഗങ്ങളാക്കി pdf ആക്കുകയും പിന്നീട് ഒരുമിച്ച് ചേർക്കണമെന്നും തീരുമാനിച്ചു. അങ്ങനെ താഴെക്കാണുന്ന നിർദ്ദേശങ്ങളുപയോഗിച്ച് ആറ് പി.ഡി.എഫ്. ഫയലുകളുണ്ടാക്കുകയും പിഡിഎഫ് ടൂൾകിറ്റ് ഉപയോഗിച്ച് അതിനെ കൂട്ടിച്ചേർക്കുകയും ചെയ്തു.
convert 00*.jpg 1.pdf
convert 01*.jpg 2.pdf
convert 02*.jpg 3.pdf
convert 03*.jpg 4.pdf
convert 04*.jpg 5.pdf
convert 05*.jpg 6.pdf
convert 06*.jpg 7.pdf
pdftk 1.pdf 2.pdf 3.pdf 4.pdf 5.pdf 6.pdf 7.pdf cat output book.pdf
ഔട്ട്പുട്ട് കിട്ടിയ ഫയലിന്റെ (book.pdf) വലുപ്പം ജെ.പി.ജി. ഫയലുകളുടെ വലുപ്പത്തിന് തുല്യമാണെന്നതായിരുന്നു. ഇതിന് പരിഹാരമായി convert നിർദ്ദേശത്തിന് quality എന്നൊരു പരാമീറ്റർ നൽകി, ക്വാളിറ്റി കുറച്ച് ഫയൽ സൈസ് കുറക്കാം. മുകളിലെ കൺവെർട്ട് നിർദ്ദേശങ്ങൾ താഴെപ്പറയുന്ന മാതിരിയാക്കുക.
convert 00*.jpg -quality 18 1.pdf
ഇപ്പോൾ എനിക്ക് ഫയൽ സൈസ് 40 എം.ബിയായിക്കിട്ടി. എനിക്ക് ഫയൽസൈസ് ഒരു 10 എം.ബിയോടടുത്തെത്തിക്കണമെന്നുണ്ടായിരുന്നു. പക്ഷേ convert-ൽ ക്വാളിറ്റി ഇനിയും കുറക്കുമ്പോൾ പുസ്തകം വായിക്കാൻ മോശമാകുന്നു. ഇതിന് പരിഹാരമായി സ്കാൻ ടെയ്ലർ ഉപയോഗിക്കാമെന്നു വിചാരിച്ചു.
സ്കാൻ ചെയ്തുണ്ടാക്കുന്ന പുസ്തകത്താളുകളുടെ പല തരത്തിലുള്ള പ്രശ്നങ്ങൾ പരിഹരിക്കാനുതകുന്ന സോഫ്റ്റ്വെയറാണ് സ്കാൻ ടെയ്ലർ. എല്ലാ ഫയലുകളെയും ഒരേ വലുപ്പത്തിലാക്കുക (ഫയൽ സൈസല്ല, വീതിയും ഉയരവുമാണ് ഇവിടെ ഉദ്ദേശിക്കുന്നത്), ഒരേ ഡി.പി.ഐ. ആക്കുക, സ്കാൻ ചെയ്തപ്പോഴുണ്ടായ ചെരിവുകൾ പരിഹരിക്കുക, ഒരു സ്കാനിൽ ഒന്നിലധികം താളുകളുണ്ടെങ്കിൽ അവയെ വെവ്വേറെയാക്കുക, അനാവശ്യ ഭാഗങ്ങൾ ഒഴിവാക്കുക എന്നിങ്ങനെ പല കാരങ്ങൾ ഇതിലുണ്ട്. സ്കാൻ ടെയ്ലർ തരുന്ന ഔട്ട്പുട്ട് പി.ഡി.എഫ് ആക്കാൻ ഏറ്റവും യോഗ്യമാണെന്ന കേട്ടുകേൾവിയിൽ നിന്നാണ് ഞാനത് ഉപയോഗിച്ചത്.
സ്കാൻ ടെയ്ലർ തുറന്ന് ഈ ഫയലുകൾ ഇരിക്കുന്ന ഫോൾഡർ കാണിച്ചുകൊടുത്തു. എന്റെ ജെ.പി.ജി. ഫയലുകൾക്ക് കാര്യമായ പ്രോസസിങ് ഒന്നും ആവശ്യമില്ലാത്തതിനാൽ, 600 ഡി.പി.ഐയിൽ ഔട്ട്പുട്ട് തരാൻ പറഞ്ഞു. 001file.tif മുതൽ 064file.tif വരെ പേരുകളിൽ മറ്റൊരു ഫോൾഡറിൽ ഔട്ട്പുട്ട് കിട്ടി.
ഈ ടിഫ് ഫയലുകളെ കൺവെർട്ട് ഉപയോഗിച്ച് പി.ഡി.എഫ്. ആക്കാൻ നോക്കിയപ്പോഴും വലുപ്പം വളരെ കൂടുതലുള്ള പി.ഡി.എഫാണ് കിട്ടിയത്. അങ്ങനെ ആ ഫയലുകളെ വീണ്ടും കൺവെർട്ട് ഉപയോഗിച്ച് ജെ.പി.ജി. ആക്കി. കുറേ ഫയലുകളെ ഒരുമിച്ച് മാറ്റാൻ ടെർമിനലിൽ ഇങ്ങനെയൊരു ഫോർ ലൂപ്പ് ഉപയോഗിച്ചു.
for f in *.tif; do
convert ./"$f" ./"${f%.tif}.jpg"
done
അതുവഴി ഈ ടിഫ് ഫയലുകളൊക്കെ അതേ പേരിലുള്ള ജെപെഗ് ഫയലുകളായി മാറി. ഇനിയവയെ താഴെക്കാണുന്ന നിർദ്ദേശങ്ങൾ ഉപയോഗിച്ച് ഏഴ് പി.ഡി.എഫ്. ഫയലുകളാക്കി മാറ്റുകയും pdftk ഉപയോഗിച്ച് കൂട്ടിച്ചേർക്കുകയും ചെയ്തു.
convert 00*.jpg -quality 8 1.pdf
convert 01*.jpg -quality 8 2.pdf
convert 02*.jpg -quality 8 3.pdf
convert 03*.jpg -quality 8 4.pdf
convert 04*.jpg -quality 8 5.pdf
convert 05*.jpg -quality 8 6.pdf
convert 06*.jpg -quality 8 7.pdf
pdftk 1.pdf 2.pdf 3.pdf 4.pdf 5.pdf 6.pdf 7.pdf cat output book.pdf
ഇപ്പോഴെനിക്ക് 10 എം.ബിയോളം വലുപ്പമുള്ള പി.ഡി.എഫ്. കിട്ടി. ഇവിടെ ക്വാളിറ്റി 8 ആക്കിയിട്ടും എനിക്ക് ആവശ്യമായ ക്വാളിറ്റി ഔട്ട്പുട്ടിനുണ്ടായിരുന്നു.
ചോദ്യങ്ങൾ
ഈ കരുക്കൾ ഉപയോഗിക്കാൻ ആർക്കെങ്കിലും കൂടുതൽ വിശദീകരണമോ മറ്റോ ആവശ്യമെങ്കിൽ ചോദിക്കാവുന്നതാണ്.
എന്റെ ചോദ്യങ്ങൾ ഇവയാണ്
- ഞാൻ ഉപയോഗിക്കുന്ന ഈ രീതി മെച്ചപ്പെടുത്താൻ നിർദ്ദേശങ്ങളുണ്ടോ? ഇതിനേക്കാൾ മെച്ചപ്പെട്ട രീതികളുണ്ടോ?
- എനിക്ക് കിട്ടിയ ജെ.പി.ജി. ഫയലുകളേക്കാൾ മെച്ചപ്പെട്ട ഫലം, അതിനെ സ്കാൻ ടെയ്ലറിലൂടെ കടത്തിവിട്ടപ്പോൾ കിട്ടിയതെങ്ങനെ?
സ്കാൻ ടൈലറിനു് ഒരു യൂസർ ഗൈഡ് (മാനുവലല്ല) എഴുതിയുൺറ്റാക്കണമെന്നു കുറേ മാളായി വിചാരിക്കുന്നു. പക്ഷേ, സമയപരിമിതി മൂലം നടക്കുന്നില്ല. അതിനാൽ അവിടെനിന്നും ഇവിടെനിന്നുമായി ചില പോയിന്റുകൾ:
ReplyDelete1. സ്കാൻ ടൈലർ ഔട്ട്പുട്ടും JPEG ഫോർമാറ്റും
നമുക്കു് നല്ല പരിചയമുള്ള JPEG ഫോർമാറ്റ് പൊതുവേ നന്നായി കമ്പ്രസ്സ് ചെയ്യുമെന്നു് എല്ലാർക്കും അറിയാം. എന്നാൽ അതിൽ ചില പോരായ്മകളുമുണ്ടു്:
അടിസ്ഥാനപരമായി ഒരു ബഹുവർണ്ണ ഫോർമാറ്റിന്റെ ഒരു പിക്സലിന്റെ ഡാറ്റയിൽ 16ബിറ്റ്/32 ബിറ്റ് കളർ സ്പേസ് കൂടിഉൾപ്പെടും.ഇതിനെ ക്രോമിനൻസ് ഡാറ്റ എന്നു വിളിക്കാം. ക്രോമിനൻസ് ഇല്ലാത്ത ഒരു ഫയലിൽ (ഒരൊറ്റ നിറത്തിന്റെ പല തെളിച്ചവുമുള്ള ഗ്രേ സ്കെയിൽ ഇമേജിൽ) ആണെങ്കിൽ പോലും, ഒരു ബിറ്റിനു് 256 അല്ലെങ്കിൽ 16348 ലൂമിനൻസ് മൂല്യങ്ങളാവാം. ഓരോ പിക്സലിനും ഇത്തരം രണ്ടു ഘടകങ്ങൾക്കുവേണ്ടി 16/32 ബിറ്റുകളുടെ സ്ഥാനം സ്റ്റോറേജ് ആവശ്യമുണ്ടു്. സാധാരണ BMP പോലുള്ള ഫയലുകളിവയെ അങ്ങനെത്തന്നെ സ്റ്റോർ ചെയ്യുന്നു.
എന്നാൽ അടുത്തടുത്തുള്ള പിക്സലുകളുടെ സാമ്യം,ഇമേജിന്റെ പല മേഖലകളിലും ഒരേപോലെ ആവർത്തിക്കുന്ന പാറ്റേണുകൾ, ഒരേ നിറമോ/തെളിച്ചമോ ഉള്ള ഒരുപാടു പിക്സലുകൾ ഇവയുടെ എല്ലാം വിവരങ്ങൾ ചുരുക്കെഴുത്തുപട്ടികകളിലൂടെ സംഗ്രഹിച്ചിട്ടാണു് JPEG ഫയൽ ഉണ്ടാക്കുന്നതു്. തീരെ അവഗണിക്കാവുന്ന വിശദവിവരങ്ങൾ ഈ പ്രക്രിയയിൽ നഷ്ടപ്പെടുകയും ചെയ്യും. (ലോസ്സി ഫോർമാറ്റ്). എന്നാൽ ഇതുവഴി ഫയലിന്റെ വലിപ്പം ഗണ്യമായി കുറയ്ക്കാൻ കഴിയും.
എങ്കിൽപ്പോലും, ഇതു് എല്ലായ്പോഴും ഏറ്റവും നല്ല കമ്പ്രഷൻ റേറ്റ് ആയിക്കൊള്ളണമെന്നില്ല. ഒരൊറ്റ തെളിച്ചം മാത്രമുള്ള -അതായത് ഒന്നുകിൽ കടുംകറുപ്പു് അല്ലെങ്കിൽ തൂവെള്ള ഈ രണ്ടുതരം പിക്സലുകൾ മാത്രമുള്ള ഇമേജിലും JPEG ക്രോമിനൻസ്, ലൂമിനൻസ് എന്ന രീതിയിൽതന്നെയാണു് ഫയൽ ചുരുക്കാൻ പോകുന്നതു്. അതായതു് അത്തരം ശുദ്ധ ബ്ലാക്ക് ആൻഡ് വൈറ്റ് (ഗ്രേ സ്കെയിൽ പോലുമല്ല!)ഇമേജുകളുടെ JPEG പോലും യഥാർത്ഥത്തിൽ ഒരു ബഹുവർണ്ണചിത്രമാണു്. (കറുപ്പും കറുപ്പില്ലായ്മയും(വെളുപ്പ്) അല്ലാതെ മറ്റുനിറങ്ങളോ തെളിച്ചങ്ങളോ അതിൽ ഇല്ലെന്നുമാത്രം.
(ഇതും കൂടാതെ, JPEGന്റെ മറ്റൊരു ദോഷം അതിൽ ലേയറുകളോ ചാനലുകളോ വെവ്വേറെ ശേഖരിക്കാൻ പറ്റില്ല എന്നതാണു്. അതിനാൽ ട്രാൻസ്പേരൻസി (സുതാര്യത), മാസ്കിങ്ങ്, ഗ്രൂപ്പ് സെപ്പറേഷൻ തുടങ്ങിയ വിവരങ്ങൾ ശേഖരിക്കാൻ പറ്റില്ല. പക്ഷേ, അതു തൽക്കാലം നമ്മുടെ വിഷയത്തിനു പുറത്താണു്).
ഒരൊറ്റ തരം പിക്സലുകൾ മാത്രമുള്ള ചിത്രങ്ങൾ ശേഖരിക്കാൻ പിന്നെ ഏതുവഴിയാണു നല്ലതു്? TIFF.
എന്നാൽ, TIFF ഫോർമാറ്റുകൾ തന്നെ പലവിധമുണ്ടു്. (യഥാർത്ഥത്തിൽ ഒരു ഫോർമാറ്റ് എന്നതിനേക്കാൾ ഫോർമാറ്റ് പാക്കേജർ ആണു് TIFF എന്നു പറയുന്നതാവും ശരി.)
ReplyDeleteഅതിൽ ഒരു തരമാണു് Compressed monochrome TIFF.
Scan Tailor ഡിഫോൾട്ട് ഔട്ട്പുട്ട് ആയി നൽകുന്നതു് ഈ ഫോർമാറ്റാണു്. സാധാരണ ടെക്സ്റ്റു പുസ്തകങ്ങളും (വെക്ടർ അല്ലാത്ത) ലൈൻ ഡ്രോയിങ്ങുകളും സ്കാൻ ചെയ്യാൻ ഏറ്റവും നല്ല ഫോർമാറ്റ് ഇതാണു്.
ഇതിൽ ഒരു പിക്സലിനു് ഒരു ബിറ്റ് (ബൈറ്റല്ല, ബിറ്റ്!)മാത്രം മതി. കൂടാതെ, ആ ബിറ്റുകളെത്തന്നെ വീണ്ടും കമ്പ്രസ്സ് ചെയ്യുകയുമാവാം. ഏതുതരം കമ്പ്രഷനാണു വേണ്ടതു് എന്നും തീരുമാനിക്കാം. (JPEG/ZIP/Fax തുടങ്ങിയ വിവിധതരം കമ്പ്രഷൻ രീതികളുണ്ടു്.) JPEG കമ്പ്രഷൻ ഉപയോഗിച്ചാൽ തന്നെ കമ്പ്രഷൻ രീതി മാത്രമാണു് JPEG സ്വഭാവത്തിൽ നിന്നെടുക്കുന്നതു്. ബിറ്റ് സ്പേസ് (സ്റ്റോറേജ് ആവശ്യം) അപ്പോഴും മോണോക്രോം തന്നെയായിരിക്കും. കൂടാതെ ആവശ്യമെങ്കിൽ ലോസിനെസ്സ് സ്വല്പം കൂടി വർദ്ധിപ്പിച്ച് (at the expense of lose in quality) ഫയൽ വലിപ്പം വീണ്ടും കുറയ്ക്കുകയും ചെയ്യാം.
TIIFF-ൽ LZ (ZIP) കമ്പ്രഷൻ ഉപയോഗിച്ചാൽ പലപ്പോഴും JPEGനേക്കാളും ഫയൽ സൈസ് പിന്നെയും കുറയും. എന്നാൽ ഫയൽ തുറക്കുമ്പോൾ ഇമേജ് റെൻഡറിങ്ങിനു സമയം പ്രായേണ കൂടുതൽ വേണ്ടിവരും.
Multi-page, uncompressed, grey-scale തുടങ്ങിയ ബാക്കി TIFF ഇനങ്ങളെപ്പറ്റി വേണമെങ്കിൽ പിന്നെപ്പറയാം.
//അതിൽ ഒരു തരമാണു് Compressed monochrome TIFF.
DeleteScan Tailor ഡിഫോൾട്ട് ഔട്ട്പുട്ട് ആയി നൽകുന്നതു് ഈ ഫോർമാറ്റാണു്. സാധാരണ ടെക്സ്റ്റു പുസ്തകങ്ങളും (വെക്ടർ അല്ലാത്ത) ലൈൻ ഡ്രോയിങ്ങുകളും സ്കാൻ ചെയ്യാൻ ഏറ്റവും നല്ല ഫോർമാറ്റ് ഇതാണു്.//
ഞാൻ കളർ/ഗ്രേസ്കേൽ എന്ന ഓപ്ഷനാണ് സ്കാൻ ടെയ്ലറിന്റെ ഔട്ട്പുട്ട് മോഡായി തിരഞ്ഞെടുക്കുന്നത്. അപ്പോഴും ഇതേ ഫോർമാറ്റിൽത്തന്നെയാണോ ഔട്ട്പുട്ട് കിട്ടുന്നത്?
മറ്റൊരു ചോദ്യം. കൈയിലുള്ള സാധാരണ ജെപെഗിനെ സ്കാൻ ടെയ്ലർ ഉപയോഗിക്കാതെ ഈ ഫോർമാറ്റിലേക്ക് എങ്ങനെ മാറ്റാനാവും?
detailed writing as Comments in blogs is very inefficient... :( It is also not possible to correct spelling mistakes, especially with this Word-verification gadget. You do not need to use the Word-Veri. Instead, you can enable moderated comment publishing for older (one month or more) posts.
ReplyDelete:(
ഡീറ്റൈൽഡ് കമെന്റ് വേറൊരു പോസ്റ്റാക്കിയോ മറ്റോ ഇട്ട് ലിങ്ക് തന്നാൽ മതിയായിരുന്നില്ല?
ReplyDeleteഡീഫോൾട്ട് ആയിക്കിടന്നിരുന്ന, വേഡ് വെരിഫിക്കേഷൻ ഒഴിവാക്കിയിട്ടുണ്ട്.
ഇനി, സുനിലിന്റെ വർക്ക് ഫ്ലോ കുറേക്കൂടി ലളിതമാക്കാമോ എന്നു നോക്കാം.
ReplyDelete1. Give right Resolution data to Scan tailor.
സ്കാൻ ടൈലറിനു് ഇൻപുട്ട് ആയി കൊടുക്കുന്ന ഫയലുകളുടെ യതാർത്ഥ റെസൊലൂഷൻ എന്താണോ അതുതന്നെ കൊടുക്കുക. പുതിയ പ്രൊജക്റ്റ് തുറക്കുമ്പോൾ ആദ്യം വരുന്ന ചോദ്യങ്ങളിൽ ഒന്നു് ഈ റെസൊലൂഷൻ സെറ്റ് ചെയ്യുന്നതിനെക്കുറിച്ചാണു്. സ്കാൻ ചെയ്ത ഫയലുകളിൽ ഇവ മിക്കവാറും ശരിയായിത്തന്നെ വരും. എന്നാൽ ക്യാമറ ഉപയോഗിച്ച് ഫോട്ടോ എടുത്തതാണെങ്കിൽ, ഇതു നാം കണക്കുകൂട്ടി ഏകദേശം റൗണ്ട് ചെയ്തു് ഇടേണ്ടി വരും.
(ഇമേജിൽ കാണപ്പെടുന്ന ഒരു കടലാസ് പേജിന്റെ ക്രോപ്പ് ചെയ്ത രൂപത്തിൽ അതിന്റെ പിക്സൽ വീതിയെ യഥാർത്ഥപേജിന്റെ ഇഞ്ച് വീതികൊണ്ട് ഹരിക്കുക. ഇതിനെ 150/200/300/400/600 ഇവയിൽ ഏറ്റവും അടുത്തുള്ള സംഖ്യയെ സ്കാൻ ടൈലറിൽ റെസൊലൂഷനായി സെറ്റ് ചെയ്യുക.)
2. എന്നാൽ ഔട്ട്പുട്ട് റെസൊലൂഷൻ 600 DPI തന്നെ തെരഞ്ഞെടുക്കാവുന്നതാണു്. 1-ബിറ്റ് മോണോക്രോം ഫയലുകളിൽ ഉയർന്ന കമ്പ്രഷൻ സാദ്ധ്യമാവും എന്നതുകൊണ്ട് ഫയൽ സൈസ് JPEG പോലെ ക്രമാധികമായി (വർഗ്ഗാനുപാതത്തിൽ) ഉയരുകയില്ല.
3. സ്കാൻ ടൈലറിലേക്കു് സാദ്ധ്യമായിടത്തോളം ഒറിജിനൽ ഇമേജുകൾ തന്നെ കൊടുക്കുക. അതിനുമുൻപ് യാതൊരു കൺവേർഷനുകളും നടത്തേണ്ടതില്ല.
4. സ്കാൻ ടൈലർ ഔട്ട്പുട്ട് ഫയലുകൾ (1-bit TIFF) നേരേ PDF റൈറ്റർ സോഫ്റ്റ്വെയറിലേക്കു ഫീഡ് ചെയ്യാം. ഇടയ്ക്കുവെച്ച് JPEG ആക്കേണ്ടതില്ല.
5. PDF Writer സോഫ്റ്റ്വെയറിൽ റിസൊലൂഷൻ ആവശ്യത്തിനനുസരിച്ച് ക്രമീകരിക്കുക. പ്രിന്റ് ചെയ്യണമെങ്കിൽ 300 DPI, സ്ക്രീനിൽ സാമാന്യം ഭംഗിയായി കാണാൻ 150DPI. ഇത്ര മതി. കൂടാതെ, PDF ഔട്ട്പുട്ട് കളർ തെരഞ്ഞെടുക്കാതെ, മോണോക്രോം ആകണം എന്നതും ശ്രദ്ധിക്കുക. ഈ സെറ്റിങ്ങുകൾ സാധാരണ PDF ഔട്ട്പുട്ട് ഓപ്ഷൻസിൽ ലഭ്യമാണു്.
എന്നാൽ, പല പുസ്തകങ്ങളിലും കവർ പേജുകൾ, ഇടയ്ക്കു ചില ചിത്രങ്ങൾ എന്നിവ കാണാറുണ്ടു്. ഇവ കളർ ചിത്രങ്ങളോ ഗ്രേ സ്കെയിൽ ചിത്രങ്ങളോ ആവാം. (ലൈൻ സ്കെച്ചുകൾ പ്രശ്നമില്ല).
ReplyDeleteഇവയെ പ്രോസസ്സ് ചെയ്യേണ്ട രീതി സ്വ്അല്പം വ്യത്യസ്തവും ശ്രമകരവുമാണു്. സ്കാൻ ടൈലറിലെ അവസാനത്തെ ഔട്ട്പുട്ട് എന്ന സ്റ്റെപ്പിൽ ചില ട്വീക്കുകൾ ചെയ്യേണ്ടി വരും.
1. ചിത്രം പേജിന്റെ ഒരു ചെറിയ ഭാഗത്തുമാത്രമേ ഉള്ളൂ എങ്കിൽ Black & White എന്നതിനു പകരം മിക്സ്ഡ് എന്നു തെരഞ്ഞെടുക്കുക. ആ ഒരു ഭാഗം മാത്രമെടുത്ത് പിക്ചർ സോൺ ആയി അടയാളപ്പെടുത്താൻ പറ്റും. (നടുവിൽ വലിപ്പത്തിൽ കാണുന്ന പേജ് ഫ്രെയിമിന്റെ വലതരികത്തു മുകളിൽ ഇതു സെലക്റ്റ് ചെയ്യാം.)
2. പേജിൽ ഭൂരിഭാഗമോ മുഴുവനായോ ചിത്രമാണെങ്കിൽ കളർ/ ഗ്രേ സ്കെയിൽ എന്നു തെരഞ്ഞെടുക്കുന്നതാണു് നല്ലതു്.
ഇത്തരം പേജുകൾക്കു് 600DPIറെസലൂഷൻ തെരഞ്ഞെടുക്കരുതു്. കാരണം അവ TIFF ആണെങ്കിലും മോണോക്രോം ആയല്ല സേവ് ചെയ്യാൻ പോകുന്നതു്. അതുകൊണ്ടു് കമ്പ്രഷൻ വളരെ മോശമായിരിക്കും.
പകരം റെസൊലൂഷൻ 300 അല്ലെങ്കിൽ 150 ആയി കുറച്ച് പ്രോസസ്സ് ചെയ്യുക.
പക്ഷേ അപ്പോൾ ഒരു പ്രശ്നമുണ്ടു്. ഇത്തരം പേജുകളുടെ ഫൈനൽ PDF വലിപ്പം നാലിലൊന്നോ എട്ടിലൊന്നോ ആയി കുറയും!
അതിനെന്തുചെയ്യും? PDF ആക്കുന്നതിനുമുമ്പ് ഈ പേജുകളെ മാത്രം എടുത്ത് ഏതെങ്കിലും ഇമേജ് സോഫ്റ്റ്വെയർ ഉപയോഗിച്ച് 4 മടങ്ങോ എട്ടുമടങ്ങോ ആയി blow-up ചെയ്ത് JPEG ഫോർമാറ്റിലേക്കു മാറ്റുക.
കാരണം ഇത്തരം പേജുകൾക്കു് JPEG ഫോർമാറ്റ് ആണു് കൂടുതൽ അനുയോജ്യം.
സ്കാൻ ടൈലർ നല്ലൊരു സോഫ്റ്റ്വെയർ ആണു്. കഴിഞ്ഞ അഞ്ചുവർഷത്തിനുള്ളിൽ ഞാൻ കണ്ടുമുട്ടിയതിൽ ഏറ്റവും നല്ല ടൂൾ എന്നാനു് ഞാൻ അതിനു റേറ്റിങ്ങ് കൊടുത്തിരിക്കുന്നതു്.
ReplyDeleteഎന്നാൽ അതു പഠിച്ചു പരിശീലിക്കാൻ കുറച്ചധികം സമയം ആവശ്യമാണു്. പല ഫീച്ചറുകളും നാം ഒറ്റയടിക്കു മനസ്സിലാക്കില്ല.
1. ചിത്രങ്ങളെ സെലക്റ്റ് ചെയ്യുമ്പോൾ This page only, Allpages after this, All Selected pages, All pages എന്നീ ഓപ്ഷനുകളുണ്ടു്. Split/Deskew/Margin തുടങ്ങി എല്ലാ സ്റ്റേജുകളിലും ശരിയായി സെലക്റ്റ് ചെയ്യാൻ പഠിച്ചാൽ വളരെയധികം സമയം ലാഭിക്കാം. പല സെറ്റിങ്ങുകളും ചെയ്തതിനുശേഷം വേണം Apply to... ഉപയോഗിക്കാൻ.
2. ഇടയ്ക്കു് ഒരു പേജിനു മാത്രം വ്യത്യസ്തമായി മാനുവലായി സെലക്റ്റു ചെയ്യുകയും മറ്റുള്ളതെല്ലാം സോഫ്റ്റ്വെയറിനു തീരുമാനിക്കാൻ കൊടുക്കുകയും ചെയ്യാം.മാനുവലായി സെലക്റ്റ് ചെയ്തതിനെ ഓട്ടോമാറ്റിൿ ബാച്ച് ജോലികൾ വീൺറ്റും (നമ്മുടെ കൽപ്പനയില്ലാതെ) തിരുത്തിയെഴുതുകയില്ല.
3. സെലക്റ്റ് കണ്ടന്റ്, മാർജിൻ തുടങ്ങിയ സ്റ്റേജുകളിൽ വലത്തേ അറ്റത്ത് താഴെ ഒരു കോംബോ കാണാം. തംബ് നെയിലുകളുടെ സോർട്ടിങ്ങ് ഓർഡർ ഇതിൽ മാറ്റാം.അലങ്കോലമായിക്കിടക്കുന്ന (ക്രമത്തിലധികം ബോർഡറുകൾ സെലക്റ്റ് ആയ) പേജുകളും തെറ്റായി സ്പ്ലിറ്റ് ചെയ്ത പേജുകളും ഒക്കെ ഇങ്ങനെ ഒരുമിച്ച് ഒരേയിടത്തു കാണാം. നൂറുകണക്കിനുപേജുകളുള്ള ഒരു പുസ്തകത്തിൽ ഇതു വളരെ സൗകര്യപ്രദമായ കാര്യമാണു്.
4. മൗസ് ഉപയോഗിക്കുന്നതിനു പകരം, Q, W എന്നീ കീകൾ ഉപയോഗിച്ച് ഒരു പേജിൽ നിന്നു് മറ്റൊരു പേജിലേക്കു പോകാം. മാർജിൻ റീഫൈൻ ചെയ്യുമ്പോളും മറ്റും ഇതു് വളരെ ഉപയോഗക്ഷമമാണു്. (മൗസ് ആവശ്യമില്ലാതെ കൂടുതൽ ദൂരം ഓടിക്കേണ്ടതില്ല.)
ഇനിയുമുണ്ട് പല പ്രത്യേകസൗകര്യങ്ങളും. പക്ഷേ, പലതും സർപ്രൈസ് ആയി സ്വയം കണ്ടുപിടിക്കുന്നതാണു് രസം! :)
(തൽക്കാലം സമാപ്തം. മറ്റേ പുസ്തകം റെഡിയാണു്. ഉടനെ അപ്ലോഡ് ചെയ്യാം.)
രണ്ടാമത്തെ കമന്റിൽ:
ReplyDelete"അതിൽ ഒരു തരമാണു് Compressed monochrome TIFF.
Scan Tailor ഡിഫോൾട്ട് ഔട്ട്പുട്ട് ആയി നൽകുന്നതു് ഈ ഫോർമാറ്റാണു്. സാധാരണ ടെക്സ്റ്റു പുസ്തകങ്ങളും (വെക്ടർ അല്ലാത്ത) ലൈൻ ഡ്രോയിങ്ങുകളും സ്കാൻ ചെയ്യാൻ ഏറ്റവും നല്ല ഫോർമാറ്റ് ഇതാണു്. "
അതിൽ "സ്കാൻ ചെയ്യാൻ" എന്നതു് സ്റ്റോർ ചെയ്യാൻ എന്നു തിരുത്തണം.
പിന്നീട് സ്കാൻ ടൈലർ ഉപയോഗിച്ച് പ്രോസസ്സ് ചെയ്യുന്നുണ്ടെങ്കിൽ പ്രൈമറി ഫിസിക്കൽ സ്കാനിങ്ങിനു് ഏറ്റവും നല്ലതു് കളർ അല്ലെങ്കിൽ ഗ്രേ-സ്കെയിൽ ഫോർമാറ്റ് തന്നെയാണു്. (കാരണം: അച്ചടി മഷി പലപ്പോഴും ഒരേപോലെ യുണിഫോം ആയിട്ടല്ല അച്ചിൽ പുരളുക. പ്രത്യേകിച്ചും പഴയ കാലത്തെ പുസ്തകങ്ങളിൽ. ഗ്രേ-സ്കെയിൽ അല്ലെങ്കിൽ, അക്ഷരത്തിന്റെ മങ്ങിക്കാണുന്ന ഭാഗങ്ങളൊക്കെ സ്കാനർ സോഫ്റ്റ്വെയർ തൂവെള്ളയാക്കി മാറ്റിയെന്നുവരും. ഗ്രേയ്സ്കെയിൽ ആണെങ്കിൽ മങ്ങിയെങ്കിലും അവ കാണും. സ്കാൻ ടൈലറിന്റെ യഥാർത്ഥ മഹിമ ഇത്തരം ഭാഗങ്ങൾ കണ്ടുപിടിച്ച് അതെല്ലാം മുഴുവൻ കടുംകറുപ്പ് ആക്കിമാറ്റും എന്നതാണു്.)
വിശ്വേട്ടാ, കമന്റുകൾ ഒരു ബ്ലോഗ് പോക്സ്റ്റാക്കാനുല്ല വകുപ്പുണ്ട്.
ReplyDeleteഈ വിവരണങ്ങൾ ഒരു വൃത്തിയും ലാളിത്യവുമില്ലാത്ത വിധത്തിലാണു് എഴുതിയിട്ടിരിക്കുന്നതു് എന്നു് എനിക്കുതന്നെ നല്ല ബോദ്ധ്യമുണ്ടു്. എന്നാൽ ഇതൊക്കെ എടുത്ത് സ്കാൻ റ്റൈലറിനും ഇമേജ് പ്രോസസ്സിങ്ങിനു പൊതുവേയും ആയി ഒരു നല്ല സചിത്രമാനുവൽ വിക്കിബുക്സിൽ നാമെല്ലാവരും കൂടി തയ്യാറാക്കണം. അതു് കൈപ്പുസ്തകം പോലെ സൗജന്യമായി അച്ചടിച്ച് എമ്പാടും വിതരണം ചെയ്യുകയുമാവാം. നാട്ടിലെ സാധാരണക്കാർക്കു് ഉപകാരമാവട്ടെ.
ReplyDeleteവിശ്വേട്ടാ, വിവരങ്ങളെല്ലാം ഇവിടേയ്ക്ക് http://ml.wikibooks.org/wiki/Scan_Tailor പകര്ത്തിവച്ചോളൂ. വഴിയേ ക്രോഡീകരിക്കാം.
ReplyDelete1. "ഞാൻ കളർ/ഗ്രേസ്കേൽ എന്ന ഓപ്ഷനാണ് സ്കാൻ ടെയ്ലറിന്റെ ഔട്ട്പുട്ട് മോഡായി തിരഞ്ഞെടുക്കുന്നത്. അപ്പോഴും ഇതേ ഫോർമാറ്റിൽത്തന്നെയാണോ ഔട്ട്പുട്ട് കിട്ടുന്നത്?"
ReplyDelete2. "മറ്റൊരു ചോദ്യം. കൈയിലുള്ള സാധാരണ ജെപെഗിനെ സ്കാൻ ടെയ്ലർ ഉപയോഗിക്കാതെ ഈ ഫോർമാറ്റിലേക്ക് എങ്ങനെ മാറ്റാനാവും?"
1. സാധാരണ ബ്ലാക്ക്&വൈറ്റ് ടെക്സ്റ്റിനു് ഒരിക്കലും കളർ/ഗ്രേ സ്കെയിൽ തെരഞ്ഞെടുക്കരുതു്. അസഹ്യമായ വിധത്തിൽ ഫയൽ വലിപ്പം കൂടും. അത്ര അത്യാവശ്യമുള്ള പേജുകൾക്കു മാത്രമേ ഗ്രേ സ്കെയിൽ/കളർ ആവശ്യമുള്ളൂ.
2. ഈ കൺവേർഷനു് ഉപയോഗിക്കാവുന്ന ധാരാളം സോഫ്റ്റ്വെയറുകൾ ഉണ്ടു്. ഞാൻ സാധാരണ ഉപയോഗിക്കുന്ന ഒന്നു് (വിൻഡോസിൽ) ACDSee ആണു്. എന്നാൽ ഫോട്ടോഷോപ്പ്, ജിംപ്, paint.net എന്നിവയെല്ലാം ഇതിനുപയോഗിക്കാം. കമാൻഡ് ലൈൻ ക്ഷമയുണ്ടെങ്കിൽ, Imagemagick ആണു് ഇക്കാര്യത്തിലും ഏറ്റവും നല്ല ഉപാധി.
മനോജ്, ധൈര്യമായി ഇതൊക്കെ, (വല്ല ഉപയോഗവുമുണ്ടെങ്കിൽ) CC-SA അടിസ്ഥാനത്തിൽ എവിടെ വേണമെങ്കിലും ചേർത്തോളൂ. :)
ReplyDelete