Доброго дня.
Власне, шукаю бібліотеку, для роботи з pdf файлами.
Потрібно реалізувати аналіз таблиць, які розміщені у pdf файлі. Формат таблиці приблизно такий:
_______________________________________________________________________
|Object | Message | Description | Solution |
_______________________________________________________________________
|Human | Headache | head is in pain | drink some pills |
| |_____________________________________________________________ | | | Sadness | Don't want to do a thing | visit friends, |
| | | never smiles. Looks sad | have a vacation |
Була б вдячна за приклади використання функцій, які можуть знадобитись.
Я новачок, тому прошу вибачення за нечітке чи елементарне питання.
Но давно не пользовался ими, так что надо проверять, работают ли они в вашем случае или нет.
Происследуйте функциональность, а если уже в тупик зайдете тогда, еще раз помогу.
pdfrw : Last update: 2012. Read and write PDF files; watermarking, copying images from one PDF to another. Includes sample code. Python 2.5–2.7. MIT License. https://code.google.com/p/pdfrw/
XPDF : Open source project. Contains several useful tools such as pdffonts and pdfinfo. XpdfReader
pdffonts : lists fonts used in a PDF file including information on font type, whether the font is embedded, etc. Part of the open-source Xpdf project. Licensed under GPL v2.
А также добавил в whishlist http://lessons2.ru, чтобы сделать пару практических уроков с заданиями по этому поводу.
перепробовали несколько упомянутых тут библиотек типа reportlab, в последних проектах используем http://weasyprint.org/ - генерит pdf из html, очень удобно. Правда, бывает приходится повозиться с установкой, не припомню уже с чем, но stackoverflow решает