Καλησπέρα
Επιχείρησα να κάνω αντιγραφή και επικόλληση ενός κειμένου από ένα αρχείο PDF σε ένα κειμενογράφο Ms office 2019. Το πρόβλημά μου είναι ότι κατά την επικόλληση τα γράμματα είναι ανακατεμένα για παράδειγμα στο κείμενο PDF αναγράφεται: Οι σχέσεις Ελλάδας – Ιράν και κατά την επικόλλησή γίνεται Οι ρυέρειπ Δλλάδαπ – Θοάμ
- Το αρχείο PDF ανοίγει κανονικά στο Ms office word αλλα όταν κανω μετατροπή σε word το πρόβλημα εξακολουθεί να υφίσταται
- Δόκιμα και στους παρακάτω διαδικτυακούς ιστοτοπους :
- Pdfzorro και Ilove PDF αλλα δυστυχώς τιποτα
Μηπως υπαρχει καποιος άλλος τροπος να μετατρέψω το PDF σε Word ;
Καλησπέρα
Χρησιμοποίησε κάποιο πρόγραμμα επεξεργασίες PDF για να αλλάξεις τη γραμματοσειρά του PDF σε κάποια συνηθισμένη (πχ Arial) και δοκίμασε πάλι να κάνεις αντιγραφή.
Ίσως το PDF έχει δημιουργεί σε κάποια γραμματοσειρά που δεν είναι Unicode.
Δυστυχως δεν δουλευει.... Δοκιμασα να το ανοιξω μεσω google chrome κανοντας Drag and Drop και να κανω print as pdf αλλα και παλι τιποτα. Ανοιξα το αρχειο μεσω Adove και απο τις ιδιωτητες ειδα οτι εχει τις εξης γραμματοσειρες : Arial, Calibri ,Courier New, Helvetica και trebouchet Ms. Μηπως γνωριζετε καποιο προγραμμα που μπορει να μεταρεψει τους χαρακτηρες σε UNICODE?
Το PDF format έχει αρκετά προβλήματα όσον αφορά το encoding, όπως custom encoding, custom fonts κ.α., ενώ και πολλές εφαρμογές που το χρησιμοποιούν παρουσιάζουν παρόμοια λάθη.
Δες αν για τη μετατροπή σε MS-Word υπάρχουν options όσον αφορά το encoding, και αν ναι δοκίμασε τα PDFDocEncoding και UTF-16BE, και με ή χωρίς BOM (θα πρέπει να γίνει μετατροπή σε Unicode βέβαια).
Αν δεν υπάρχουν encoding options, μπορείς να δοκιμάσεις μια εφαρμογή που βρήκα στο internet - δεν εγγυώμαι ότι λειτουργεί σωστά ή ότι η εφαρμογή ή το site είναι ασφαλή (αν σου δίνει επιλογή να εγκαταστήσεις και μια-δυό ακόμα... φοβερές εφαρμογές, εννοείται δεν το κάνεις):
Free PDF to Word Doc Converter v1.1
Τζιφος που λεμε και στο χωριο μου.... Παντως σε ευχαριστω πολυ και επισης τον @Γιώργος Τράντζας . θα το ψαξω περισσοτερο και αν καταφερω να βγαλω ακρη και θα επανέλθω με ανάλογο ποστ. Γενικα παντως πιστευω οτι ειναι ενας τρόπος (χαζος κατα την γνώμη μου) να προστατεύσουν ενα κειμενο απο την αυτούσια αντιγραφή.
Αν το αρχείο είναι κάτι δημόσιο και όχι προσωπικό, μπορείς να το ανεβάσεις για να κάνω κάποιες δοκιμές μήπως βρω λύση. Πιθανότητα δεν έχει γίνει σκόπιμα. Απλά κάτι έχει πάει λάθος με την κωδικοποιήση.
ναι φυσικα... Το εγγραφο ειναι δημοσιο και βρίσκεται εδω:
https://www.eliamep.gr/wp-content/uploads/en/2010/12/%CE%9D%CE%BF-14-%CE%9F%CE%B9-%CE%A3%CF%87%CE%AD%CF%83%CE%B5%CE%B9%CF%82-%CE%95%CE%BB%CE%BB%CE%AC%CE%B4%CE%B1%CF%82-%CE%99%CF%81%CE%AC%CE%BD1.pdf
Σε ευχαριστω πολυ και παλι
Η μόνη λύση που κατάφερα να βρω είναι να εξάγεις το κείμενο μέσω OCR. Ωστόσο, η μόνη υπηρεσία που εντόπιζε το κείμενο αποτελεσματικά ήταν η ABBYY FineReader Online, η οποία προσφέρει μικρό αριθμό σελίδων δωρεάν.
Δεν έχω Office 2019. Μια παλιότερη όμως έκδοση που χρησιμοποιώ (η οποία δεν εμφανίζει σωστά τα pdf) μου προσφέρει επιλογές encoding όταν πάω να το ανοίξω (File->Open). Εκεί υπάρχουν πολλές επιλογές, οπότε μπορείς να δοκιμάσεις όλες τις Greek και Unicode (που μάλλον δε δουλεύει), κι όχι μόνο τη default.
@Γιώργος Τράντζας Όταν μου απάντησες μου εδωσες μια καλη ιδεα που πραγματικά δεν την ειχα σκεφτεί . Το δοκίμασα στο Soda που χρησιμοποιώ αλλα δυστυχώς μου βγαζει 2 γραμματοσειρές οι οποίες δεν δουλεύουν. Το ABBYY FineReader Online εχει τρελές επιλογές και σχεδόν ολες τις γλώσσες του κοσμου απο οτι ειδα. Από αγγλικά μεχρι εσπεραντο και γλωσσες προγραμματισμού. Κουφάθηκα πραγματικά… αλλα ειναι πολυ ακριβο !!!! Πάντως σε ευχαριστώ πολύ. @Χρήστος Δρακάκης Το δοκίμασα αλλά τίποτα :-( . Ο μονος λογο που εκανα ερώτηση είναι ότι δοκίμασα αρκετα πραγματα και δεν δούλεψε τίποτα και ψιλοεκνευριστηκα 😊 :P . Ο τύπος το κλείδωσε πραγματικά καλά…
Please login or Register to submit your answer