вторник, 15 июля 2008 г.
воскресенье, 13 июля 2008 г.
svg2eps
Как бы замечателен ни был svg (и svgz), иногда нужно его конвертировать во что-то, с чем умеют работать старые программы и пакеты (офис, tex). В растр его легко переводит ImageMagic. А вот с другими, векторными, форматами — проблемы.
inkscape --help
inkscape --without-gui --file=SOURCE.SVG --export-eps=RESULT.EPS
вторник, 1 июля 2008 г.
Как извлечь картинки из *.doc?
MS Word, как известно, предоставляет возможность сохранить все изображения, используемые в документе, непосредственно внутри файла *.doc. При этом изображение в документе может довольно значительно отличатся от исходной картинки, которая была вставлена в документ.
Что делать, если необходимо "достать" картинку из документа Word в таком виде, в каком она была при вставке? Можно вернуть для рисунка все параметры (такие как размер, обрезка...) к исходному состоянию. Процесс мучительный, но даст почти нужный результат... при нажатии PrintScreen. Если картинок вытащить нужно много, то убить можно очень много времени.
Ещё можно поискать различного рода макросы и попытаться написать свою программу на основе спецификации...
Рациональнее воспользоваться возможностями новых форматов. Формат документов в Office 2007, как и ODF, представляет собой zip архив со всеми вложениями внутри. Извлечение картинок будем делать на примере ODF (Open Document Format). Microsoft скоро научит свой Office работать с этим форматом... А пока этого не произошло, нам понадобится OpenOffice.org
- Первым делом, открываем документ в OO Writter. Надо отметить, что большому документу потребуется много оперативной памяти и времени на преобразование, которое произойдёт на этом шаге.
- Сохраняем документ в формате *.odt и закрываем OpenOffice. Как уже отмечено, файл *.odt представляет собой просто zip архив, содержащий все "внутренности" документа как отдельные файлы.
- Переименовываем наш NewDocument.odt в NewDocument.zip и извлекаем из архива папку pictures... Там-то и будут находится нужные нам картинки.
java -jar /usr/share/java/writer2latex.jar -latex \ /путь/NewDocument.odf /путь/к/папке/для/рисунков/
Файл latex из документов с большим количеством картинок у меня так ни разу нормально и не сформировался, но картинки (как минимум растровые) вынимаются исправно и в нужном порядке.