вторник, 15 июля 2008 г.

Линуксойд

Sorce'ик не компилится,
Система в kernel panic.
Линуксойду видятся
сны in command line

воскресенье, 13 июля 2008 г.

svg2eps

SVG — прогрессивный формат векторной графики. Вообще говоря и анимации, но не будем настолько прогрессивны.
Inkscape — открытый и удобный редактор графики в этом формате.

Как бы замечателен ни был svgsvgz), иногда нужно его конвертировать во что-то, с чем умеют работать старые программы и пакеты (офис, tex). В растр его легко переводит ImageMagic. А вот с другими, векторными, форматами — проблемы.

Но после элементарного
inkscape --help
выяснилось, что Inkscape способен выступать в роли простого и быстрого конвертора:
inkscape --without-gui --file=SOURCE.SVG --export-eps=RESULT.EPS

вторник, 1 июля 2008 г.

Как извлечь картинки из *.doc?

MS Word, как известно, предоставляет возможность сохранить все изображения, используемые в документе, непосредственно внутри файла *.doc. При этом изображение в документе может довольно значительно отличатся от исходной картинки, которая была вставлена в документ.

Что делать, если необходимо "достать" картинку из документа Word в таком виде, в каком она была при вставке? Можно вернуть для рисунка все параметры (такие как размер, обрезка...) к исходному состоянию. Процесс мучительный, но даст почти нужный результат... при нажатии PrintScreen. Если картинок вытащить нужно много, то убить можно очень много времени.

Ещё можно поискать различного рода макросы и попытаться написать свою программу на основе спецификации...

Рациональнее воспользоваться возможностями новых форматов. Формат документов в Office 2007, как и ODF, представляет собой zip архив со всеми вложениями внутри. Извлечение картинок будем делать на примере ODF (Open Document Format). Microsoft скоро научит свой Office работать с этим форматом... А пока этого не произошло, нам понадобится OpenOffice.org

  • Первым делом, открываем документ в OO Writter. Надо отметить, что большому документу потребуется много оперативной памяти и времени на преобразование, которое произойдёт на этом шаге.
  • Сохраняем документ в формате *.odt и закрываем OpenOffice. Как уже отмечено, файл *.odt представляет собой просто zip архив, содержащий все "внутренности" документа как отдельные файлы.
  • Переименовываем наш NewDocument.odt в NewDocument.zip и извлекаем из архива папку pictures... Там-то и будут находится нужные нам картинки.
При этом методе картинки в архиве находятся вовсе не обязательно в том порядке, в котором они расположены в документе.. Если последовательность нужна, то рисунки из ODF можно извлечь при помощи writer2latex. В моём дистрибутиве Linux (Mandriva 2008.1), после установки соответствующего пакета, нужный результат получается такой командой:
java -jar /usr/share/java/writer2latex.jar -latex  \
/путь/NewDocument.odf /путь/к/папке/для/рисунков/

Файл latex из документов с большим количеством картинок у меня так ни разу нормально и не сформировался, но картинки (как минимум растровые) вынимаются исправно и в нужном порядке.