Bonjour,
Je me permets de vous demander, si quelqu'un connaîtrait un programme de reconnaissance de caractère que je pourrais utiliser pour récupérer un planning reçu chaque semaine par fichier PDF...
Je m'explique, ma femme reçoit chaque semaine son planning sur un simple fichier PDF et je dois rentrer manuellement le planning sur son agenda (type agenda Google)...
J'aimerais savoir s'il existe un logiciel ou programme simple, pour Linux, afin que je puisse extraire ces données en fichier type Excel, ou bien type extension Outlook, ?
Est-ce que ce type existe ?, j'ai bien chercher, mais je n'ai pas trouvé de moyen très efficace...
Merci de votre réponse... En espérant avoir posté ce post au bon endroit....
Excellente journée à vous...
JP
demande d'information ? Programme OCR pour linux !
- userpen69
- Membre
- Messages : 16
- Inscription : 20 nov. 2022, 09:28
- Status : Hors-ligne
- dezix
- Membre hyper actif
- Messages : 3546
- Inscription : 04 juin 2016, 14:50
- Status : Hors-ligne
Salut,
Tu peux tester ocrfeeder
Ça fait longtemps que je n'ai plus utilisé cela,
il me semble que cela fonctionnait plutôt bien avec tesseract-ocr
Pour récupérer juste un peu de texte d'un pdf, il y a probablement plus pratique de l'OCR.
P.ex. qpdfview est une liseuse (graphique) qui permet de sélectionner/copier du texte dans un pdf.
Un PDF peut aussi être ouvert/édité avec libreoffice-draw
Dans synaptic ou https://packages.debian.org ou apt search/list recherche sur OCR tu va trouver d'autres outils ; idem pour PDF.
Il existe un convertisseur pdf vers texte => pdftotext fourni par poppler-utils
Regarde pdfgrep c'est une commande qui peut extraire les lignes de texte contenant un motif ;
Voilà toutes mes cartouches
ça me semble assez prometteur
Tu peux tester ocrfeeder
Ça fait longtemps que je n'ai plus utilisé cela,
il me semble que cela fonctionnait plutôt bien avec tesseract-ocr
Pour récupérer juste un peu de texte d'un pdf, il y a probablement plus pratique de l'OCR.
P.ex. qpdfview est une liseuse (graphique) qui permet de sélectionner/copier du texte dans un pdf.
Un PDF peut aussi être ouvert/édité avec libreoffice-draw
Dans synaptic ou https://packages.debian.org ou apt search/list recherche sur OCR tu va trouver d'autres outils ; idem pour PDF.
Il existe un convertisseur pdf vers texte => pdftotext fourni par poppler-utils
Regarde pdfgrep c'est une commande qui peut extraire les lignes de texte contenant un motif ;
Voilà toutes mes cartouches
ça me semble assez prometteur
**Simple Utilisateur** -- Debian stable - XFCE
- userpen69
- Membre
- Messages : 16
- Inscription : 20 nov. 2022, 09:28
- Status : Hors-ligne
Wow, merci Dezix, je vais tester un peu tout ça pour voir ce que ça donne, si je trouve ce qui fonctionne le mieux, je te tiendrais informé. Excellente journée; Mercidezix a écrit : ↑03 déc. 2022, 09:45 Salut,
Tu peux tester ocrfeeder
Ça fait longtemps que je n'ai plus utilisé cela,
il me semble que cela fonctionnait plutôt bien avec tesseract-ocr
Pour récupérer juste un peu de texte d'un pdf, il y a probablement plus pratique de l'OCR.
P.ex. qpdfview est une liseuse (graphique) qui permet de sélectionner/copier du texte dans un pdf.
Un PDF peut aussi être ouvert/édité avec libreoffice-draw
Dans synaptic ou https://packages.debian.org ou apt search/list recherche sur OCR tu va trouver d'autres outils ; idem pour PDF.
Il existe un convertisseur pdf vers texte => pdftotext fourni par poppler-utils
Regarde pdfgrep c'est une commande qui peut extraire les lignes de texte contenant un motif ;
Voilà toutes mes cartouches
ça me semble assez prometteur
Un novice passionné... Actuellement sur Kali Linux (base Debian)...