Sunday, July 21, 2013

സ്കാൻ താളുകളെ പിഡിഎഫ് ആക്കൽ

ജെ.പി.ജി. രൂപത്തിൽ സ്കാൻ ചെയ്ത് കിട്ടുന്ന പുസ്തകങ്ങളെ  പരമാവധി വലുപ്പം കുറച്ച് ക്വാളിറ്റി നഷ്ടപ്പെടാതെ പി.ഡി.എഫ്. ആക്കി മാറ്റുന്ന ഒരു പദ്ധതി നടത്തുന്നു.

ഇത് ഇവിടെ എഴുതുന്നത്, ഞാൻ ചെയ്യുന്ന രീതി മറ്റുള്ളവർക്ക് ഉപകാരപ്പെടട്ടെ എന്ന് കരുതുന്നതിനു പുറമേ ഞാൻ ചെയ്യുന്ന രീതിയിൽ എന്തെങ്കിലും മെച്ചപ്പെടുത്തലുകൾ വരുത്താൻ സാധിക്കുമോ എന്ന് നിങ്ങളിൽ നിന്നും അഭിപ്രായങ്ങൾ ശേഖരിക്കാനും കൂടി വേണ്ടിയാണ്.

ഉപയോഗിക്കുന്ന സോഫ്റ്റ്വെയർ

  • ഒ.എസ്.: ഉബുണ്ടു 12.04
  • സ്കാൻടെയ്ലർ (scantailor) - ഇമേജ് ഫയലുകളെ പിഡിഎഫ് ആക്കുന്നതിനായി തയാറാക്കാൻ
  • കൺവെർട്ട് (convert) - ഫയലുകളെ ഒരു ഫോർമാറ്റിൽ നിന്ന് മറ്റൊന്നിലേക്ക് മാറ്റാൻ
    • ടിഫിൽ നിന്ന് ജെ.പി.ജി.
    • ജെ.പി.ജിയിൽ നിന്ന് പി.ഡി.എഫ്.
  • പിഡിഎഫ് ടൂൾകിറ്റ് (pdftk) -  കുറേ പി.ഡി.എഫ്. ഫയലുകളെ യോജിപ്പിച്ച് ഒറ്റ ഫയലാക്കാൻ

പ്രശ്നങ്ങളും പരിഹാരങ്ങളും


എനിക്ക് 64 സ്കാൻ ചെയ്ത ജെ.പി.ജി. ഫയലുകളാണ് ഇതിനായി ലഭിച്ചിരിക്കുന്നത് ഓരോന്നിന്റെയും പേര് ഇങ്ങനെയാണ് 001file.jpg, 002file.jpg എന്നു തുടങ്ങി 064file.jpg എന്നുവരെ. ഈ ഫയലുകളുടെ മൊത്തം വലുപ്പം 100 എം.ബിയുണ്ട്.

തുടക്കത്തിൽ ഞാനിത് കൺവെർട്ട് ഉപയോഗിച്ച് (താഴെക്കാണുന്ന നിർദ്ദേശം ഉപയോഗിച്ച്) നേരെ പി.ഡി.എഫ്. ആക്കാൻ ശ്രമിച്ചു.

convert *.jpg book.pdf


എന്റെ പഴയ കമ്പ്യൂട്ടർ ഇത്രയും ഫയലുകളുടെ പ്രോസസിങ് ഒരുമിച്ച് താങ്ങില്ലെന്ന് ബോദ്ധ്യപ്പെട്ടു. ഇതിനെ ഭാഗങ്ങളാക്കി pdf ആക്കുകയും പിന്നീട് ഒരുമിച്ച് ചേർക്കണമെന്നും തീരുമാനിച്ചു. അങ്ങനെ താഴെക്കാണുന്ന നിർദ്ദേശങ്ങളുപയോഗിച്ച് ആറ് പി.ഡി.എഫ്. ഫയലുകളുണ്ടാക്കുകയും പിഡിഎഫ് ടൂൾകിറ്റ് ഉപയോഗിച്ച് അതിനെ കൂട്ടിച്ചേർക്കുകയും ചെയ്തു.

convert 00*.jpg 1.pdf
convert 01*.jpg 2.pdf
convert 02*.jpg 3.pdf
convert 03*.jpg 4.pdf
convert 04*.jpg 5.pdf
convert 05*.jpg 6.pdf
convert 06*.jpg 7.pdf

pdftk 1.pdf 2.pdf 3.pdf 4.pdf 5.pdf 6.pdf 7.pdf cat output book.pdf

ഔട്ട്പുട്ട് കിട്ടിയ ഫയലിന്റെ (book.pdf) വലുപ്പം ജെ.പി.ജി. ഫയലുകളുടെ വലുപ്പത്തിന് തുല്യമാണെന്നതായിരുന്നു. ഇതിന് പരിഹാരമായി convert നിർദ്ദേശത്തിന് quality എന്നൊരു പരാമീറ്റർ നൽകി, ക്വാളിറ്റി കുറച്ച് ഫയൽ സൈസ് കുറക്കാം. മുകളിലെ കൺവെർട്ട് നിർദ്ദേശങ്ങൾ താഴെപ്പറയുന്ന മാതിരിയാക്കുക.

convert 00*.jpg -quality 18 1.pdf

ഇപ്പോൾ എനിക്ക് ഫയൽ സൈസ് 40 എം.ബിയായിക്കിട്ടി. എനിക്ക് ഫയൽസൈസ് ഒരു 10 എം.ബിയോടടുത്തെത്തിക്കണമെന്നുണ്ടായിരുന്നു. പക്ഷേ convert-ൽ ക്വാളിറ്റി ഇനിയും കുറക്കുമ്പോൾ പുസ്തകം വായിക്കാൻ മോശമാകുന്നു. ഇതിന് പരിഹാരമായി സ്കാൻ ടെയ്ലർ ഉപയോഗിക്കാമെന്നു വിചാരിച്ചു.

സ്കാൻ ചെയ്തുണ്ടാക്കുന്ന പുസ്തകത്താളുകളുടെ പല തരത്തിലുള്ള പ്രശ്നങ്ങൾ പരിഹരിക്കാനുതകുന്ന സോഫ്റ്റ്വെയറാണ് സ്കാൻ ടെയ്ലർ. എല്ലാ ഫയലുകളെയും ഒരേ വലുപ്പത്തിലാക്കുക (ഫയൽ സൈസല്ല, വീതിയും ഉയരവുമാണ് ഇവിടെ ഉദ്ദേശിക്കുന്നത്), ഒരേ ഡി.പി.ഐ. ആക്കുക, സ്കാൻ ചെയ്തപ്പോഴുണ്ടായ ചെരിവുകൾ പരിഹരിക്കുക, ഒരു സ്കാനിൽ ഒന്നിലധികം താളുകളുണ്ടെങ്കിൽ അവയെ വെവ്വേറെയാക്കുക, അനാവശ്യ ഭാഗങ്ങൾ ഒഴിവാക്കുക എന്നിങ്ങനെ പല കാരങ്ങൾ ഇതിലുണ്ട്. സ്കാൻ ടെയ്ലർ തരുന്ന ഔട്ട്പുട്ട് പി.ഡി.എഫ് ആക്കാൻ ഏറ്റവും യോഗ്യമാണെന്ന കേട്ടുകേൾവിയിൽ നിന്നാണ് ഞാനത് ഉപയോഗിച്ചത്.

സ്കാൻ ടെയ്ലർ തുറന്ന് ഈ ഫയലുകൾ ഇരിക്കുന്ന ഫോൾഡർ കാണിച്ചുകൊടുത്തു. എന്റെ ജെ.പി.ജി. ഫയലുകൾക്ക് കാര്യമായ പ്രോസസിങ് ഒന്നും ആവശ്യമില്ലാത്തതിനാൽ, 600 ഡി.പി.ഐയിൽ ഔട്ട്പുട്ട് തരാൻ പറഞ്ഞു. 001file.tif മുതൽ  064file.tif വരെ പേരുകളിൽ മറ്റൊരു ഫോൾഡറിൽ ഔട്ട്പുട്ട് കിട്ടി.

ഈ ടിഫ് ഫയലുകളെ കൺവെർട്ട് ഉപയോഗിച്ച് പി.ഡി.എഫ്. ആക്കാൻ നോക്കിയപ്പോഴും വലുപ്പം വളരെ കൂടുതലുള്ള പി.ഡി.എഫാണ് കിട്ടിയത്. അങ്ങനെ ആ ഫയലുകളെ വീണ്ടും കൺവെർട്ട് ഉപയോഗിച്ച് ജെ.പി.ജി. ആക്കി. കുറേ ഫയലുകളെ ഒരുമിച്ച് മാറ്റാൻ ടെർമിനലിൽ ഇങ്ങനെയൊരു ഫോർ ലൂപ്പ് ഉപയോഗിച്ചു.

for f in *.tif; do
  convert ./"$f" ./"${f%.tif}.jpg"
done

അതുവഴി ഈ ടിഫ് ഫയലുകളൊക്കെ അതേ പേരിലുള്ള ജെപെഗ് ഫയലുകളായി മാറി. ഇനിയവയെ താഴെക്കാണുന്ന നിർദ്ദേശങ്ങൾ ഉപയോഗിച്ച് ഏഴ് പി.ഡി.എഫ്. ഫയലുകളാക്കി മാറ്റുകയും pdftk ഉപയോഗിച്ച് കൂട്ടിച്ചേർക്കുകയും ചെയ്തു.

convert 00*.jpg -quality 8 1.pdf
convert 01*.jpg -quality 8 2.pdf
convert 02*.jpg -quality 8 3.pdf
convert 03*.jpg -quality 8 4.pdf
convert 04*.jpg -quality 8 5.pdf
convert 05*.jpg -quality 8 6.pdf
convert 06*.jpg -quality 8 7.pdf

pdftk 1.pdf 2.pdf 3.pdf 4.pdf 5.pdf 6.pdf 7.pdf cat output book.pdf

ഇപ്പോഴെനിക്ക് 10 എം.ബിയോളം വലുപ്പമുള്ള പി.ഡി.എഫ്. കിട്ടി. ഇവിടെ ക്വാളിറ്റി 8 ആക്കിയിട്ടും എനിക്ക് ആവശ്യമായ ക്വാളിറ്റി ഔട്ട്പുട്ടിനുണ്ടായിരുന്നു.


ചോദ്യങ്ങൾ

ഈ കരുക്കൾ ഉപയോഗിക്കാൻ ആർക്കെങ്കിലും കൂടുതൽ വിശദീകരണമോ മറ്റോ ആവശ്യമെങ്കിൽ ചോദിക്കാവുന്നതാണ്.

എന്റെ ചോദ്യങ്ങൾ ഇവയാണ്
  • ഞാൻ ഉപയോഗിക്കുന്ന ഈ രീതി മെച്ചപ്പെടുത്താൻ നിർദ്ദേശങ്ങളുണ്ടോ? ഇതിനേക്കാൾ മെച്ചപ്പെട്ട രീതികളുണ്ടോ? 
  • എനിക്ക് കിട്ടിയ ജെ.പി.ജി. ഫയലുകളേക്കാൾ മെച്ചപ്പെട്ട ഫലം, അതിനെ സ്കാൻ ടെയ്ലറിലൂടെ കടത്തിവിട്ടപ്പോൾ കിട്ടിയതെങ്ങനെ?
പരിചിതരായവരുടെ മറുപടി പ്രതീക്ഷിക്കുന്നു.

14 comments:

  1. സ്കാൻ ടൈലറിനു് ഒരു യൂസർ ഗൈഡ് (മാനുവലല്ല) എഴുതിയുൺറ്റാക്കണമെന്നു കുറേ മാളായി വിചാരിക്കുന്നു. പക്ഷേ, സമയപരിമിതി മൂലം നടക്കുന്നില്ല. അതിനാൽ അവിടെനിന്നും ഇവിടെനിന്നുമായി ചില പോയിന്റുകൾ:

    1. സ്കാൻ ടൈലർ ഔട്ട്പുട്ടും JPEG ഫോർമാറ്റും

    നമുക്കു് നല്ല പരിചയമുള്ള JPEG ഫോർമാറ്റ് പൊതുവേ നന്നായി കമ്പ്രസ്സ് ചെയ്യുമെന്നു് എല്ലാർക്കും അറിയാം. എന്നാൽ അതിൽ ചില പോരായ്മകളുമുണ്ടു്:

    അടിസ്ഥാനപരമായി ഒരു ബഹുവർണ്ണ ഫോർമാറ്റിന്റെ ഒരു പിക്സലിന്റെ ഡാറ്റയിൽ 16ബിറ്റ്/32 ബിറ്റ് കളർ സ്പേസ് കൂടിഉൾപ്പെടും.ഇതിനെ ക്രോമിനൻസ് ഡാറ്റ എന്നു വിളിക്കാം. ക്രോമിനൻസ് ഇല്ലാത്ത ഒരു ഫയലിൽ (ഒരൊറ്റ നിറത്തിന്റെ പല തെളിച്ചവുമുള്ള ഗ്രേ സ്കെയിൽ ഇമേജിൽ) ആണെങ്കിൽ പോലും, ഒരു ബിറ്റിനു് 256 അല്ലെങ്കിൽ 16348 ലൂമിനൻസ് മൂല്യങ്ങളാവാം. ഓരോ പിക്സലിനും ഇത്തരം രണ്ടു ഘടകങ്ങൾക്കുവേണ്ടി 16/32 ബിറ്റുകളുടെ സ്ഥാനം സ്റ്റോറേജ് ആവശ്യമുണ്ടു്. സാധാരണ BMP പോലുള്ള ഫയലുകളിവയെ അങ്ങനെത്തന്നെ സ്റ്റോർ ചെയ്യുന്നു.

    എന്നാൽ അടുത്തടുത്തുള്ള പിക്സലുകളുടെ സാമ്യം,ഇമേജിന്റെ പല മേഖലകളിലും ഒരേപോലെ ആവർത്തിക്കുന്ന പാറ്റേണുകൾ, ഒരേ നിറമോ/തെളിച്ചമോ ഉള്ള ഒരുപാടു പിക്സലുകൾ ഇവയുടെ എല്ലാം വിവരങ്ങൾ ചുരുക്കെഴുത്തുപട്ടികകളിലൂടെ സംഗ്രഹിച്ചിട്ടാണു് JPEG ഫയൽ ഉണ്ടാക്കുന്നതു്. തീരെ അവഗണിക്കാവുന്ന വിശദവിവരങ്ങൾ ഈ പ്രക്രിയയിൽ നഷ്ടപ്പെടുകയും ചെയ്യും. (ലോസ്സി ഫോർമാറ്റ്). എന്നാൽ ഇതുവഴി ഫയലിന്റെ വലിപ്പം ഗണ്യമായി കുറയ്ക്കാൻ കഴിയും.

    എങ്കിൽപ്പോലും, ഇതു് എല്ലായ്പോഴും ഏറ്റവും നല്ല കമ്പ്രഷൻ റേറ്റ് ആയിക്കൊള്ളണമെന്നില്ല. ഒരൊറ്റ തെളിച്ചം മാത്രമുള്ള -അതായത് ഒന്നുകിൽ കടുംകറുപ്പു് അല്ലെങ്കിൽ തൂവെള്ള ഈ രണ്ടുതരം പിക്സലുകൾ മാത്രമുള്ള ഇമേജിലും JPEG ക്രോമിനൻസ്, ലൂമിനൻസ് എന്ന രീതിയിൽതന്നെയാണു് ഫയൽ ചുരുക്കാൻ പോകുന്നതു്. അതായതു് അത്തരം ശുദ്ധ ബ്ലാക്ക് ആൻഡ് വൈറ്റ് (ഗ്രേ സ്കെയിൽ പോലുമല്ല!)ഇമേജുകളുടെ JPEG പോലും യഥാർത്ഥത്തിൽ ഒരു ബഹുവർണ്ണചിത്രമാണു്. (കറുപ്പും കറുപ്പില്ലായ്മയും(വെളുപ്പ്) അല്ലാതെ മറ്റുനിറങ്ങളോ തെളിച്ചങ്ങളോ അതിൽ ഇല്ലെന്നുമാത്രം.

    (ഇതും കൂടാതെ, JPEGന്റെ മറ്റൊരു ദോഷം അതിൽ ലേയറുകളോ ചാനലുകളോ വെവ്വേറെ ശേഖരിക്കാൻ പറ്റില്ല എന്നതാണു്. അതിനാൽ ട്രാൻസ്പേരൻസി (സുതാര്യത), മാസ്കിങ്ങ്, ഗ്രൂപ്പ് സെപ്പറേഷൻ തുടങ്ങിയ വിവരങ്ങൾ ശേഖരിക്കാൻ പറ്റില്ല. പക്ഷേ, അതു തൽക്കാലം നമ്മുടെ വിഷയത്തിനു പുറത്താണു്).

    ഒരൊറ്റ തരം പിക്സലുകൾ മാത്രമുള്ള ചിത്രങ്ങൾ ശേഖരിക്കാൻ പിന്നെ ഏതുവഴിയാണു നല്ലതു്? TIFF.

    ReplyDelete
  2. എന്നാൽ, TIFF ഫോർമാറ്റുകൾ തന്നെ പലവിധമുണ്ടു്. (യഥാർത്ഥത്തിൽ ഒരു ഫോർമാറ്റ് എന്നതിനേക്കാൾ ഫോർമാറ്റ് പാക്കേജർ ആണു് TIFF എന്നു പറയുന്നതാവും ശരി.)

    അതിൽ ഒരു തരമാണു് Compressed monochrome TIFF.
    Scan Tailor ഡിഫോൾട്ട് ഔട്ട്പുട്ട് ആയി നൽകുന്നതു് ഈ ഫോർമാറ്റാണു്. സാധാരണ ടെക്സ്റ്റു പുസ്തകങ്ങളും (വെക്ടർ അല്ലാത്ത) ലൈൻ ഡ്രോയിങ്ങുകളും സ്കാൻ ചെയ്യാൻ ഏറ്റവും നല്ല ഫോർമാറ്റ് ഇതാണു്.

    ഇതിൽ ഒരു പിക്സലിനു് ഒരു ബിറ്റ് (ബൈറ്റല്ല, ബിറ്റ്!)മാത്രം മതി. കൂടാതെ, ആ ബിറ്റുകളെത്തന്നെ വീണ്ടും കമ്പ്രസ്സ് ചെയ്യുകയുമാവാം. ഏതുതരം കമ്പ്രഷനാണു വേണ്ടതു് എന്നും തീരുമാനിക്കാം. (JPEG/ZIP/Fax തുടങ്ങിയ വിവിധതരം കമ്പ്രഷൻ രീതികളുണ്ടു്.) JPEG കമ്പ്രഷൻ ഉപയോഗിച്ചാൽ തന്നെ കമ്പ്രഷൻ രീതി മാത്രമാണു് JPEG സ്വഭാവത്തിൽ നിന്നെടുക്കുന്നതു്. ബിറ്റ് സ്പേസ് (സ്റ്റോറേജ് ആവശ്യം) അപ്പോഴും മോണോക്രോം തന്നെയായിരിക്കും. കൂടാതെ ആവശ്യമെങ്കിൽ ലോസിനെസ്സ് സ്വല്പം കൂടി വർദ്ധിപ്പിച്ച് (at the expense of lose in quality) ഫയൽ വലിപ്പം വീണ്ടും കുറയ്ക്കുകയും ചെയ്യാം.
    TIIFF-ൽ LZ (ZIP) കമ്പ്രഷൻ ഉപയോഗിച്ചാൽ പലപ്പോഴും JPEGനേക്കാളും ഫയൽ സൈസ് പിന്നെയും കുറയും. എന്നാൽ ഫയൽ തുറക്കുമ്പോൾ ഇമേജ് റെൻഡറിങ്ങിനു സമയം പ്രായേണ കൂടുതൽ വേണ്ടിവരും.

    Multi-page, uncompressed, grey-scale തുടങ്ങിയ ബാക്കി TIFF ഇനങ്ങളെപ്പറ്റി വേണമെങ്കിൽ പിന്നെപ്പറയാം.

    ReplyDelete
    Replies
    1. //അതിൽ ഒരു തരമാണു് Compressed monochrome TIFF.
      Scan Tailor ഡിഫോൾട്ട് ഔട്ട്പുട്ട് ആയി നൽകുന്നതു് ഈ ഫോർമാറ്റാണു്. സാധാരണ ടെക്സ്റ്റു പുസ്തകങ്ങളും (വെക്ടർ അല്ലാത്ത) ലൈൻ ഡ്രോയിങ്ങുകളും സ്കാൻ ചെയ്യാൻ ഏറ്റവും നല്ല ഫോർമാറ്റ് ഇതാണു്.//

      ഞാൻ കളർ/ഗ്രേസ്കേൽ എന്ന ഓപ്ഷനാണ് സ്കാൻ ടെയ്ലറിന്റെ ഔട്ട്പുട്ട് മോഡായി തിരഞ്ഞെടുക്കുന്നത്. അപ്പോഴും ഇതേ ഫോർമാറ്റിൽത്തന്നെയാണോ ഔട്ട്പുട്ട് കിട്ടുന്നത്?

      മറ്റൊരു ചോദ്യം. കൈയിലുള്ള സാധാരണ ജെപെഗിനെ സ്കാൻ ടെയ്ലർ ഉപയോഗിക്കാതെ ഈ ഫോർമാറ്റിലേക്ക് എങ്ങനെ മാറ്റാനാവും?

      Delete
  3. detailed writing as Comments in blogs is very inefficient... :( It is also not possible to correct spelling mistakes, especially with this Word-verification gadget. You do not need to use the Word-Veri. Instead, you can enable moderated comment publishing for older (one month or more) posts.
    :(

    ReplyDelete
  4. ഡീറ്റൈൽഡ് കമെന്റ് വേറൊരു പോസ്റ്റാക്കിയോ മറ്റോ ഇട്ട് ലിങ്ക് തന്നാൽ മതിയായിരുന്നില്ല?

    ഡീഫോൾട്ട് ആയിക്കിടന്നിരുന്ന, വേഡ് വെരിഫിക്കേഷൻ ഒഴിവാക്കിയിട്ടുണ്ട്.

    ReplyDelete
  5. ഇനി, സുനിലിന്റെ വർക്ക് ഫ്ലോ കുറേക്കൂടി ലളിതമാക്കാമോ എന്നു നോക്കാം.

    1. Give right Resolution data to Scan tailor.
    സ്കാൻ ടൈലറിനു് ഇൻപുട്ട് ആയി കൊടുക്കുന്ന ഫയലുകളുടെ യതാർത്ഥ റെസൊലൂഷൻ എന്താണോ അതുതന്നെ കൊടുക്കുക. പുതിയ പ്രൊജക്റ്റ് തുറക്കുമ്പോൾ ആദ്യം വരുന്ന ചോദ്യങ്ങളിൽ ഒന്നു് ഈ റെസൊലൂഷൻ സെറ്റ് ചെയ്യുന്നതിനെക്കുറിച്ചാണു്. സ്കാൻ ചെയ്ത ഫയലുകളിൽ ഇവ മിക്കവാറും ശരിയായിത്തന്നെ വരും. എന്നാൽ ക്യാമറ ഉപയോഗിച്ച് ഫോട്ടോ എടുത്തതാണെങ്കിൽ, ഇതു നാം കണക്കുകൂട്ടി ഏകദേശം റൗണ്ട് ചെയ്തു് ഇടേണ്ടി വരും.

    (ഇമേജിൽ കാണപ്പെടുന്ന ഒരു കടലാസ് പേജിന്റെ ക്രോപ്പ് ചെയ്ത രൂപത്തിൽ അതിന്റെ പിക്സൽ വീതിയെ യഥാർത്ഥപേജിന്റെ ഇഞ്ച് വീതികൊണ്ട് ഹരിക്കുക. ഇതിനെ 150/200/300/400/600 ഇവയിൽ ഏറ്റവും അടുത്തുള്ള സംഖ്യയെ സ്കാൻ ടൈലറിൽ റെസൊലൂഷനായി സെറ്റ് ചെയ്യുക.)

    2. എന്നാൽ ഔട്ട്പുട്ട് റെസൊലൂഷൻ 600 DPI തന്നെ തെരഞ്ഞെടുക്കാവുന്നതാണു്. 1-ബിറ്റ് മോണോക്രോം ഫയലുകളിൽ ഉയർന്ന കമ്പ്രഷൻ സാദ്ധ്യമാവും എന്നതുകൊണ്ട് ഫയൽ സൈസ് JPEG പോലെ ക്രമാധികമായി (വർഗ്ഗാനുപാതത്തിൽ) ഉയരുകയില്ല.

    3. സ്കാൻ ടൈലറിലേക്കു് സാദ്ധ്യമായിടത്തോളം ഒറിജിനൽ ഇമേജുകൾ തന്നെ കൊടുക്കുക. അതിനുമുൻപ് യാതൊരു കൺവേർഷനുകളും നടത്തേണ്ടതില്ല.

    4. സ്കാൻ ടൈലർ ഔട്ട്പുട്ട് ഫയലുകൾ (1-bit TIFF) നേരേ PDF റൈറ്റർ സോഫ്റ്റ്‌വെയറിലേക്കു ഫീഡ് ചെയ്യാം. ഇടയ്ക്കുവെച്ച് JPEG ആക്കേണ്ടതില്ല.

    5. PDF Writer സോഫ്റ്റ്‌വെയറിൽ റിസൊലൂഷൻ ആവശ്യത്തിനനുസരിച്ച് ക്രമീകരിക്കുക. പ്രിന്റ് ചെയ്യണമെങ്കിൽ 300 DPI, സ്ക്രീനിൽ സാമാന്യം ഭംഗിയായി കാണാൻ 150DPI. ഇത്ര മതി. കൂടാതെ, PDF ഔട്ട്പുട്ട് കളർ തെരഞ്ഞെടുക്കാതെ, മോണോക്രോം ആകണം എന്നതും ശ്രദ്ധിക്കുക. ഈ സെറ്റിങ്ങുകൾ സാധാരണ PDF ഔട്ട്പുട്ട് ഓപ്ഷൻസിൽ ലഭ്യമാണു്.

    ReplyDelete
  6. എന്നാൽ, പല പുസ്തകങ്ങളിലും കവർ പേജുകൾ, ഇടയ്ക്കു ചില ചിത്രങ്ങൾ എന്നിവ കാണാറുണ്ടു്. ഇവ കളർ ചിത്രങ്ങളോ ഗ്രേ സ്കെയിൽ ചിത്രങ്ങളോ ആവാം. (ലൈൻ സ്കെച്ചുകൾ പ്രശ്നമില്ല).

    ഇവയെ പ്രോസസ്സ് ചെയ്യേണ്ട രീതി സ്വ്അല്പം വ്യത്യസ്തവും ശ്രമകരവുമാണു്. സ്കാൻ ടൈലറിലെ അവസാനത്തെ ഔട്ട്പുട്ട് എന്ന സ്റ്റെപ്പിൽ ചില ട്വീക്കുകൾ ചെയ്യേണ്ടി വരും.

    1. ചിത്രം പേജിന്റെ ഒരു ചെറിയ ഭാഗത്തുമാത്രമേ ഉള്ളൂ എങ്കിൽ Black & White എന്നതിനു പകരം മിക്സ്ഡ് എന്നു തെരഞ്ഞെടുക്കുക. ആ ഒരു ഭാഗം മാത്രമെടുത്ത് പിക്ചർ സോൺ ആയി അടയാളപ്പെടുത്താൻ പറ്റും. (നടുവിൽ വലിപ്പത്തിൽ കാണുന്ന പേജ് ഫ്രെയിമിന്റെ വലതരികത്തു മുകളിൽ ഇതു സെലക്റ്റ് ചെയ്യാം.)

    2. പേജിൽ ഭൂരിഭാഗമോ മുഴുവനായോ ചിത്രമാണെങ്കിൽ കളർ/ ഗ്രേ സ്കെയിൽ എന്നു തെരഞ്ഞെടുക്കുന്നതാണു് നല്ലതു്.
    ഇത്തരം പേജുകൾക്കു് 600DPIറെസലൂഷൻ തെരഞ്ഞെടുക്കരുതു്. കാരണം അവ TIFF ആണെങ്കിലും മോണോക്രോം ആയല്ല സേവ് ചെയ്യാൻ പോകുന്നതു്. അതുകൊണ്ടു് കമ്പ്രഷൻ വളരെ മോശമായിരിക്കും.

    പകരം റെസൊലൂഷൻ 300 അല്ലെങ്കിൽ 150 ആയി കുറച്ച് പ്രോസസ്സ് ചെയ്യുക.
    പക്ഷേ അപ്പോൾ ഒരു പ്രശ്നമുണ്ടു്. ഇത്തരം പേജുകളുടെ ഫൈനൽ PDF വലിപ്പം നാലിലൊന്നോ എട്ടിലൊന്നോ ആയി കുറയും!

    അതിനെന്തുചെയ്യും? PDF ആക്കുന്നതിനുമുമ്പ് ഈ പേജുകളെ മാത്രം എടുത്ത് ഏതെങ്കിലും ഇമേജ് സോഫ്റ്റ്‌വെയർ ഉപയോഗിച്ച് 4 മടങ്ങോ എട്ടുമടങ്ങോ ആയി blow-up ചെയ്ത് JPEG ഫോർമാറ്റിലേക്കു മാറ്റുക.
    കാരണം ഇത്തരം പേജുകൾക്കു് JPEG ഫോർമാറ്റ് ആണു് കൂടുതൽ അനുയോജ്യം.

    ReplyDelete
  7. സ്കാൻ ടൈലർ നല്ലൊരു സോഫ്റ്റ്‌വെയർ ആണു്. കഴിഞ്ഞ അഞ്ചുവർഷത്തിനുള്ളിൽ ഞാൻ കണ്ടുമുട്ടിയതിൽ ഏറ്റവും നല്ല ടൂൾ എന്നാനു് ഞാൻ അതിനു റേറ്റിങ്ങ് കൊടുത്തിരിക്കുന്നതു്.

    എന്നാൽ അതു പഠിച്ചു പരിശീലിക്കാൻ കുറച്ചധികം സമയം ആവശ്യമാണു്. പല ഫീച്ചറുകളും നാം ഒറ്റയടിക്കു മനസ്സിലാക്കില്ല.

    1. ചിത്രങ്ങളെ സെലക്റ്റ് ചെയ്യുമ്പോൾ This page only, Allpages after this, All Selected pages, All pages എന്നീ ഓപ്ഷനുകളുണ്ടു്. Split/Deskew/Margin തുടങ്ങി എല്ലാ സ്റ്റേജുകളിലും ശരിയായി സെലക്റ്റ് ചെയ്യാൻ പഠിച്ചാൽ വളരെയധികം സമയം ലാഭിക്കാം. പല സെറ്റിങ്ങുകളും ചെയ്തതിനുശേഷം വേണം Apply to... ഉപയോഗിക്കാൻ.

    2. ഇടയ്ക്കു് ഒരു പേജിനു മാത്രം വ്യത്യസ്തമായി മാനുവലായി സെലക്റ്റു ചെയ്യുകയും മറ്റുള്ളതെല്ലാം സോഫ്റ്റ്‌വെയറിനു തീരുമാനിക്കാൻ കൊടുക്കുകയും ചെയ്യാം.മാനുവലായി സെലക്റ്റ് ചെയ്തതിനെ ഓട്ടോമാറ്റിൿ ബാച്ച് ജോലികൾ വീൺറ്റും (നമ്മുടെ കൽപ്പനയില്ലാതെ) തിരുത്തിയെഴുതുകയില്ല.

    3. സെലക്റ്റ് കണ്ടന്റ്, മാർജിൻ തുടങ്ങിയ സ്റ്റേജുകളിൽ വലത്തേ അറ്റത്ത് താഴെ ഒരു കോംബോ കാണാം. തംബ് നെയിലുകളുടെ സോർട്ടിങ്ങ് ഓർഡർ ഇതിൽ മാറ്റാം.അലങ്കോലമായിക്കിടക്കുന്ന (ക്രമത്തിലധികം ബോർഡറുകൾ സെലക്റ്റ് ആയ) പേജുകളും തെറ്റായി സ്പ്ലിറ്റ് ചെയ്ത പേജുകളും ഒക്കെ ഇങ്ങനെ ഒരുമിച്ച് ഒരേയിടത്തു കാണാം. നൂറുകണക്കിനുപേജുകളുള്ള ഒരു പുസ്തകത്തിൽ ഇതു വളരെ സൗകര്യപ്രദമായ കാര്യമാണു്.

    4. മൗസ് ഉപയോഗിക്കുന്നതിനു പകരം, Q, W എന്നീ കീകൾ ഉപയോഗിച്ച് ഒരു പേജിൽ നിന്നു് മറ്റൊരു പേജിലേക്കു പോകാം. മാർജിൻ റീഫൈൻ ചെയ്യുമ്പോളും മറ്റും ഇതു് വളരെ ഉപയോഗക്ഷമമാണു്. (മൗസ് ആവശ്യമില്ലാതെ കൂടുതൽ ദൂരം ഓടിക്കേണ്ടതില്ല.)

    ഇനിയുമുണ്ട് പല പ്രത്യേകസൗകര്യങ്ങളും. പക്ഷേ, പലതും സർപ്രൈസ് ആയി സ്വയം കണ്ടുപിടിക്കുന്നതാണു് രസം! :)

    (തൽക്കാലം സമാപ്തം. മറ്റേ പുസ്തകം റെഡിയാണു്. ഉടനെ അപ്‌ലോഡ് ചെയ്യാം.)

    ReplyDelete
  8. രണ്ടാമത്തെ കമന്റിൽ:
    "അതിൽ ഒരു തരമാണു് Compressed monochrome TIFF.
    Scan Tailor ഡിഫോൾട്ട് ഔട്ട്പുട്ട് ആയി നൽകുന്നതു് ഈ ഫോർമാറ്റാണു്. സാധാരണ ടെക്സ്റ്റു പുസ്തകങ്ങളും (വെക്ടർ അല്ലാത്ത) ലൈൻ ഡ്രോയിങ്ങുകളും സ്കാൻ ചെയ്യാൻ ഏറ്റവും നല്ല ഫോർമാറ്റ് ഇതാണു്. "

    അതിൽ "സ്കാൻ ചെയ്യാൻ" എന്നതു് സ്റ്റോർ ചെയ്യാൻ എന്നു തിരുത്തണം.

    പിന്നീട് സ്കാൻ ടൈലർ ഉപയോഗിച്ച് പ്രോസസ്സ് ചെയ്യുന്നുണ്ടെങ്കിൽ പ്രൈമറി ഫിസിക്കൽ സ്കാനിങ്ങിനു് ഏറ്റവും നല്ലതു് കളർ അല്ലെങ്കിൽ ഗ്രേ-സ്കെയിൽ ഫോർമാറ്റ് തന്നെയാണു്. (കാരണം: അച്ചടി മഷി പലപ്പോഴും ഒരേപോലെ യുണിഫോം ആയിട്ടല്ല അച്ചിൽ പുരളുക. പ്രത്യേകിച്ചും പഴയ കാലത്തെ പുസ്തകങ്ങളിൽ. ഗ്രേ-സ്കെയിൽ അല്ലെങ്കിൽ, അക്ഷരത്തിന്റെ മങ്ങിക്കാണുന്ന ഭാഗങ്ങളൊക്കെ സ്കാനർ സോഫ്റ്റ്‌വെയർ തൂവെള്ളയാക്കി മാറ്റിയെന്നുവരും. ഗ്രേയ്സ്കെയിൽ ആണെങ്കിൽ മങ്ങിയെങ്കിലും അവ കാണും. സ്കാൻ ടൈലറിന്റെ യഥാർത്ഥ മഹിമ ഇത്തരം ഭാഗങ്ങൾ കണ്ടുപിടിച്ച് അതെല്ലാം മുഴുവൻ കടുംകറുപ്പ് ആക്കിമാറ്റും എന്നതാണു്.)

    ReplyDelete
  9. വിശ്വേട്ടാ, കമന്റുകൾ ഒരു ബ്ലോഗ് പോക്സ്റ്റാക്കാനുല്ല വകുപ്പുണ്ട്.

    ReplyDelete
  10. ഈ വിവരണങ്ങൾ ഒരു വൃത്തിയും ലാളിത്യവുമില്ലാത്ത വിധത്തിലാണു് എഴുതിയിട്ടിരിക്കുന്നതു് എന്നു് എനിക്കുതന്നെ നല്ല ബോദ്ധ്യമുണ്ടു്. എന്നാൽ ഇതൊക്കെ എടുത്ത് സ്കാൻ റ്റൈലറിനും ഇമേജ് പ്രോസസ്സിങ്ങിനു പൊതുവേയും ആയി ഒരു നല്ല സചിത്രമാനുവൽ വിക്കിബുക്സിൽ നാമെല്ലാവരും കൂടി തയ്യാറാക്കണം. അതു് കൈപ്പുസ്തകം പോലെ സൗജന്യമായി അച്ചടിച്ച് എമ്പാടും വിതരണം ചെയ്യുകയുമാവാം. നാട്ടിലെ സാധാരണക്കാർക്കു് ഉപകാരമാവട്ടെ.

    ReplyDelete
  11. വിശ്വേട്ടാ, വിവരങ്ങളെല്ലാം ഇവിടേയ്ക്ക് http://ml.wikibooks.org/wiki/Scan_Tailor പകര്‍ത്തിവച്ചോളൂ. വഴിയേ ക്രോഡീകരിക്കാം.

    ReplyDelete
  12. 1. "ഞാൻ കളർ/ഗ്രേസ്കേൽ എന്ന ഓപ്ഷനാണ് സ്കാൻ ടെയ്ലറിന്റെ ഔട്ട്പുട്ട് മോഡായി തിരഞ്ഞെടുക്കുന്നത്. അപ്പോഴും ഇതേ ഫോർമാറ്റിൽത്തന്നെയാണോ ഔട്ട്പുട്ട് കിട്ടുന്നത്?"

    2. "മറ്റൊരു ചോദ്യം. കൈയിലുള്ള സാധാരണ ജെപെഗിനെ സ്കാൻ ടെയ്ലർ ഉപയോഗിക്കാതെ ഈ ഫോർമാറ്റിലേക്ക് എങ്ങനെ മാറ്റാനാവും?"


    1. സാധാരണ ബ്ലാക്ക്&വൈറ്റ് ടെക്സ്റ്റിനു് ഒരിക്കലും കളർ/ഗ്രേ സ്കെയിൽ തെരഞ്ഞെടുക്കരുതു്. അസഹ്യമായ വിധത്തിൽ ഫയൽ വലിപ്പം കൂടും. അത്ര അത്യാവശ്യമുള്ള പേജുകൾക്കു മാത്രമേ ഗ്രേ സ്കെയിൽ/കളർ ആവശ്യമുള്ളൂ.

    2. ഈ കൺവേർഷനു് ഉപയോഗിക്കാവുന്ന ധാരാളം സോഫ്റ്റ്‌വെയറുകൾ ഉണ്ടു്. ഞാൻ സാധാരണ ഉപയോഗിക്കുന്ന ഒന്നു് (വിൻഡോസിൽ) ACDSee ആണു്. എന്നാൽ ഫോട്ടോഷോപ്പ്, ജിംപ്, paint.net എന്നിവയെല്ലാം ഇതിനുപയോഗിക്കാം. കമാൻഡ് ലൈൻ ക്ഷമയുണ്ടെങ്കിൽ, Imagemagick ആണു് ഇക്കാര്യത്തിലും ഏറ്റവും നല്ല ഉപാധി.

    ReplyDelete
  13. മനോജ്, ധൈര്യമായി ഇതൊക്കെ, (വല്ല ഉപയോഗവുമുണ്ടെങ്കിൽ) CC-SA അടിസ്ഥാനത്തിൽ എവിടെ വേണമെങ്കിലും ചേർത്തോളൂ. :)

    ReplyDelete