e-book (DjVu) உருவாக்குவது எப்படி?

கட்டற்ற மென்பொருட்களைக் கொண்டு, ஒரு புத்தகத்தை Scan செய்து, அதை எவ்வாறு DjVu மின்புத்தகமாக மாற்றுவது என்றுபார்ப்போம்.

DjVu - pdfக்கான Open Source மாற்று என்று கூறப்படுகிறது. http://djvu.org/

DjVu கோப்புகளை உருவாக்க நாம் பயன்படுத்தப்போகும் டூல்கள் (எல்லாமே Open Source/Free Software)-

  1. DjVu Libre - Command-line tools, (Windows/Linux)
  2. ImageMagick, தேவைப்பட்டால், tiff/png இதர கோப்புகளை DjVu Libre ஏற்றுக்கொள்ளும் வடிவத்திற்கு மாற்ற. (Windows/Linux)
இவை இரண்டே போதும். மேலும் சில toolகள், நம் வசதிக்காக.
  1. Scan Tailor, தேவைப்பட்டால், scan செய்த பக்கங்களை நறுக்கி, நிமிர்த்தி சுத்தம்செய்ய. (Windows/Linux)
  2. gscan2pdf - linuxல் மட்டும், DjVu Libre CLIக்கு பதில் GUI.
ஒரு புத்தகம் அல்லது சில பக்கங்களை Scan செய்கிறோம். பின்பு அவற்றை சேர்த்து DjVu கோப்பாக மாற்ற கீழ்கண்ட வழிமுறைகளில் ஒன்றை பின்பற்றப் போகிறோம்.

வழிமுறை 1: லினக்ஸில் gscan2pdfஐப்பயன்படுத்தி GUI மூலமாக
  1. (optional) Scan Tailorஐ வைத்து தேவையில்லாத கறுப்புப்பகுதிகளை நீக்கி, நேர் செய்து Tiff கோப்புகளை மேம்படுத்திவைத்துக் கொள்கிறோம்.
  2. gscan2pdfல் அந்த tiff படங்களைத் திறந்து File->Save as... DjVu :)
gscan2pdfஇலேயே பக்கங்களை scan செய்யவும், நறுக்கி சீரமைக்கவும் வசதிகள் உண்டு. ஆனால் நான் பயன்படுத்திப் பார்த்ததில் அவை சரியாக வேலை செய்யவில்லை. ஸ்கேன்-டெய்லர் இந்த வேலைகளை சிறப்பாகச் செய்கிறது.

வழிமுறை 2: லினக்ஸ் அல்லது விண்டோஸில், DjVu Libre கட்டளைகள் மூலம்
  1. புத்தகத்தை ஸ்கேன் செய்து கொள்கிறோம். வழக்கம்போல Scan Tailorஐ வைத்து தேவையில்லாத கறுப்புப்பகுதிகளை நீக்கி, நேர் செய்து Tiff கோப்புகளை மேம்படுத்திவைத்துக் கொள்கிறோம்.
  2. கறுப்பு-வெள்ளை tiffகளை (Bi-Tonal Tiff) அப்படியே பயன்படுத்தலாம். வண்ணப் பக்கங்கள் இருந்தால் அவற்றை இமேஜ்-மேஜிக்-ஐக் கொண்டு NetPBM வடிவத்துக்கு மாற்றிக் கொள்கிறோம்(ppm - colour, pgm - grayscale)
  3. tiff/ppm/pgm -> தனித்தனி DjVu பக்கங்கள்.
  4. தனித்தனிப் பக்கங்களை இணைத்து ஒரே DjVu கோப்பு.

விரிவாகப்பார்ப்போம்.

வழிமுறை 1ல்
பெரிதாக ஒன்றும் இல்லை. gscan2pdfல் (மட்டமாகப் பெயர் வைத்திருக்கிறார்கள். ஆனால் நல்ல டூல்) பக்கங்களைத் திறந்து சேமிக்க வேண்டியது தான்.

இரு வழிமுறைகளிலும் பொதுவாக இருப்பது ஸ்கேன்-டெய்லர்.

இந்த ஸ்கேன்-டெய்லரை வைத்து, பக்கங்களை நேராக்கலாம், புத்தகத்தை விரித்து வைத்து இடது-வலது பக்கங்கள் ஒரே படத்தில் வரும்படி ஸ்கேன் செய்திருந்தால் அவற்றைத் தனித்தனியாகப் பிரிக்கலாம், முழுப் பக்கத்தில் எழுத்துக்கள் உள்ள பகுதியை மட்டும்வைத்துக்கொண்டு மற்றவற்றை நீக்கலாம். எல்லாவற்றையும் நாமாக manualஆகச் செய்யத்தேவையில்லை. Batch-modeல் அதே தானாக எல்லா பக்கங்களையும் திருத்தும், தேவைப்பட்டால் நாம் மேற்படி சரிசெய்யலாம்.

ஸ்கேன்-டெய்லர் விண்டோஸில் இருக்கு. உபுண்டு ரெப்பாஸிட்டரிகளில் இல்லை, நான் கம்பைல் செய்துகொண்டேன்.

வழிமுறை 2

படி1: ஸ்கேன்-டெய்லர்

மேலே குறிப்பிட்டது. பக்கங்களை சுத்தம் செய்து வைத்துக்கொள்வது.

படி 2: Tiffஐ NetPbmஆக மாற்றுதல்


முன்பே சொன்னதுபோல பக்கங்கள் bi-tonal tiffஆக இருந்தால் அப்படியே வைத்துக் கொள்ளலாம். வண்ணப்பக்கங்களை ppm ஆகா மாற்றிவைத்துக்கொள்ள வேண்டும். ஒரு புத்தகத்தை கருப்பு-வெள்ளையாக ஸ்கேன் செய்து வைத்திருக்கிறோம், அட்டைப்படம் மட்டும் கலரில் என்று வைத்துக் கொள்வோம். அட்டைப் படத்தை ppmஆக மாற்ற ImageMagickன் கட்டளைகளை -
$ convert page0001.tiff page0001.ppm
அவ்வளவுதான். (விண்டோஸிலும் இதேதான். கட்டளையை எங்கிருந்துகொடுக்கிறோம், tiff படம் எங்கே இருக்கிறது போன்றவற்றை, path விஷயங்கள், கவனித்துக் கொள்ள வேண்டும்)

மற்ற பக்கங்கள் tiffஆக இல்லாமல் pngஆகவோ, jpeg ஆகவோ இருந்தால் அவற்றையும் NetPbmஆக மாற்றிக் கொள்வது நல்லது.
$ convert page0002.png page0002.pbm
குறிப்பு: Netpbm formats: ppm - colour, pgm - grayscale, pbm - monochrome

படி 3: பக்கங்களை தனித்தனியாக DjVu கோப்பாக மாற்றிக்கொள்வது

இதற்கு DjVu Libreவில் உள்ள கட்டளைகளில் ஒன்றைப் பயன்படுத்திக் கொள்ளலாம்.
f:\djvu\> c44 page0001.ppm page0001.djvu

(c44 - போட்டோக்கள், வண்ணப்பக்கங்கள் - முதல்பக்கம், இவற்றிற்கு)
f:\djvu\> cpaldjvu page0002.ppm page0002.djvu

(cpaldjvu - சில வண்ணங்கள் மட்டும் உள்ள பக்கங்களுக்கு - எ.கா. Screenshots)
f:\djvu\> cjb2 page0003.tiff page0003.djvu
(cjb2 - கறுப்பு-வெள்ளைப் பக்கங்களுக்கு. Bitonal tiff / pbm files)

படி 4: அனைத்து DjVu கோப்புகளையும் இணைத்து மின்புத்தகமாக்குவது

இதற்கும் DjVu Libreவின் கட்டளை ஒன்றைப் பயன்படுத்துவோம்.
f:\djvu\> djvm -c myebook.djvu page0001.djvu page0002.djvu page003.djvu
இந்தக் கட்டளையைப் பிறப்பித்தவுடன் மேற்குறிப்பிட்ட மூன்று பக்கங்களும் இணைந்து myebook.djvu என்ற மின்புத்தகம் கிடைக்கும்.

இந்த மின்புத்தகத்தில் புதிதாக ஒருபக்கத்தை இணைக்க
f:\djvu\> djvm -i myebook.djvu page0004.djvu 4

கடைசியில் சொன்ன 4 - பக்கம் எண். கீழே உள்ள கட்டளை புத்தகத்திலிருந்து 2ஆவது பக்கத்தை நீக்கும்.
f:\djvu\> djvm -d myebook.djvu 2

~~~~~~

பி.கு.கள்

  • நான்கைந்து பக்கங்களுக்கு மேல் இருந்தால் Script/batch file எதாவது எழுதி வைத்துக் கொள்வது உத்தமம். page0001.djvu page0002.djvu ...... என நூற்றுக்கணக்கான பக்கங்களை command-lineல் கொடுக்க சில சுருக்குவழிகள் இருக்கின்றன. தேடிப்பாருங்கள்.

  • DjVuக்கு இலவசமாக நிறைய viewers, browser-plugins இருக்கின்றன. நல்ல editorகள் நான் தேடியவரை கிடைக்கவில்லை (gscan2pdf தவிற). உங்களுக்கு எதாவது தெரிந்தால் சொல்லுங்கள்.

  • நாம் மேலே உருவாக்கியது bundled djvu கோப்பு. அதாவது அதன் பக்கங்கள் அனைத்தும் அதற்குள் அடக்கம். Indirect file என்று ஒருவகை உண்டு. அதாவது myebook.djvuக்குள் வெறும் லின்க்குகள் மட்டும் இருக்கும். பக்கங்கள் வெளியே தனித்தனியாக இருக்கும். djvmcvt ஐ வைத்து ஒரு bundled documentஐ, Indirect documentஆக மாற்றலாம். ஆனால் உருவாக்கும்போதே தனித்தனியான djvu பக்கங்களை வைத்து Indirect DjVu புத்தகமாக எப்படி உருவாக்குவது என்று தெரியவில்லை. யாருக்காவது தெரிந்தால் சொல்லுங்கள்.
  • via ananth

0 comments:

Post a Comment