Xin chào các bạn!
Như đã biết, với những file sách dạng pdf khi đưa vào kindle để sử dụng thì thường trải nghiệm là khá tệ. Vì bản chất kindle vốn không hỗ trợ xử lý những file mang định dạng này. Như không có chế độ reflow, hoặc zoom rất rất chậm và lag.
Thế nên hôm nay mình sẽ chia sẻ với các bạn ba cách xử lý file PDF. Nhưng phải nói trước là để làm lại một file PDF chưa hẳn là đơn giản, và cần có kiên nhẫn. Vậy nên thường chỉ làm lại khi nó rất hay, hiếm và không hề có một định dạng thay thế nào khác.
Vậy trước khi làm lại, các bạn nên tìm kiếm trước đã nhé, chuyển sang định dạng Mobi hoặc Azw3 đọc rất tốt trên kindle rồi.
1. Sử dụng MWord
Đầu tiên phải xác định file PDF này có phải là file chuẩn làm từ văn bản text hay không. Đặc điểm nhìn vào cũng dễ nhận ra thôi, chữ văn bản giống như một bản đánh máy. Có thể bôi đen, copy . . . Với những file mà là bản Scan thì không thể dùng cách này, hoặc những file làm từ code nhưng không phải Unicode-8 thì thường cũng có lỗi. Và lúc đó các bạn phải dùng cách khác.
Về phương pháp này, bước thứ nhất nếu có header hay footer (dấu trang, tiêu đề sách, tên tác giả . . . lặp đi lặp lại trong phần rìa trên dưới sách). Thì các bạn phải xén bỏ nó trước. Và dùng một phần mềm khá nhẹ và đơn giản là . (briss-0.9)
Sau khi xén xong, các bạn click chuột phải vào file PDF đã crop. Chọn Open with -> Word
Lúc này file word mở ra đã khá ổn, tuy nhiên nó sẽ còn một số lỗi nếu để tự nhiên.
Như trong ảnh trên là lỗi 2 dấu ‘space’. Và đôi khi là lỗi xuống dòng khi chuyển trang. Với mỗi loại lỗi đều có cách sửa như dùng ‘replace’ trong word, hoặc chỗ xuống dòng sai thì sử dụng nút ‘del’. Hoặc nếu sau khi convert rồi chúng ta có thể xử bằng lệnh trong Calibre.
Cuối cùng là Save lại thành file Word.
Từ đây các bạn có thể convert sang azw3 để đọc, và đặc biệt là còn trình bày lại được. Đương nhiên là phải dựa vào kinh nghiệm làm sách của các bạn nữa. Các bạn có thể tìm đọc Cách làm Ebook. Và phương pháp này được nói rõ ràng cụ thể hơn.
Mẹo nhỏ là các bạn nên biên tập kĩ file word trước sau đó mới làm lại trong azw3.
2. Làm lại bằng KCC
Phương pháp này đặc biệt sử dụng tốt cho các file sách chữ to rõ ràng, chỉ là khoảng trắng lớn, hoặc đọc trong kindle đã rõ rồi nhưng nó hơi lag vì là dạng PDF. Đương nhiên với chỉ khoảng trắng thôi thì briss-0.9 đã đủ để xử lý rồi.
Ví dụ với file này:
Chúng ta cần sử dụng phần mềm Kindle Comic Converter (KCC) để làm lại. Và chương trình luôn đòi có Kindlegen. Các bạn chỉ cần click vào link phần mềm cho và lên amzon tải về và copy vào thư mục chứa.
Với mỗi tick cài đặt khi chỉ chuột vào đều có giải thích đơn giản bằng tiếng Anh các bạn đọc và làm theo là được nhé. Nhớ chọn đúng lựa chọn dòng máy. Ngoài làm lại PDF, nó còn làm truyện tranh từ CBR, CBZ, Folder ảnh. . .
Các bạn thả file vào xong bấm convert và chờ tiến trình xảy ra cho đến xong nhé.
Lúc này mở file ra và thành quả:
Lúc này chỉ cần copy vào kindle và đọc thôi. Chú ý là nếu muốn đọc và bôi đen, note, tra từ thì phương pháp này không thể đáp ứng nhé. Lúc đó các bạn phải tìm phương pháp khác.
3. Dùng phần mềm OCR
Có thể nói đây là phương pháp khó nhất, lâu nhất, cần làm cẩn thận nhất. Và thành quả đương nhiên là Xịn nhất.
Phần mềm đó đây (FineReaderOCR-ABBYY). Các bạn có thể tải bản portable về dùng thoải mái, hiện tại là phiên bản 15 nhé. Về giao diện thì phần mềm này khá dễ dùng, các nút thao tác cực kỳ trực quan. Có thể nhận diện cả tiếng Việt nhé.
Để nhập file các bạn bấm vào Open và chọn file PDF cần OCR nhé. Nhớ setting cả ngôn ngữ nữa.
Đây là toàn cảnh thao tác:
- là lựa chọn khu vực text chính.
- là chọn ảnh.
- Bấm vào khu vực bao có thể (+) thêm hoặc (-) đi khu vực mình muốn hoặc không muốn hiện.
- Xong xuôi bấm Recognize để chạy OCR
- thành quả ở phía bên phải.
Tuy nhiên như các bạn đã thấy. Có lỗi sai rất nhiều, nhất là với tiếng việt nữa. Phần bên phải có thể copy lại vào word và làm lại ebook rồi. Để xử lý các lỗi có một phương pháp rất mạnh, đó là Macro.
Một mẹo nhỏ, với file PDF rõ quá cũng không OCR chính xác được, các bạn có thể convert lại thành ảnh với độ phân giải thấp 150 dpi chả hạn. Nó sẽ giúp OCR chính xác hơn.
Ví dụ: https://pdftoimage.com/vi/
Rồi, chúc các bạn có thể xử lý ngon lành các file PDF cứng đầu nhé.
Made by Lamtaxy