Игорь Белый (bujhm) wrote,
Игорь Белый
bujhm

Category:

docx в doc

- Выручай! - сказали мне в телефон. - Мне прислали вордовский файл, только он почему-то у меня не открывается. А мне надо срочно на него ответить, там вся работа стоит из-за этого.
Я поднялся на несколько этажей, вошёл в квартиру и сел за машину разбираться.

Итак, ситуация. Действительно, прислали вордовский файл. Но в формате 2007, с расширением docx. А на машине стоит только Word 2002 - который понятия не имеет, что это за дрянь в него пихают, и открывает исключительно мусор вместо текста.

Раньше эта проблема решалась просто - с помощью Google.Documents. Закачиваешь туда любой docx - и спокойно читаешь в броузере сохранённое. Но полгода назад сервис официально перестал принимать файлы в этом формате. Майкрософт, что ли подсуетился, не знаю.
Я полез смотреть, что пишут в Сети на эту тему. Тут же мне предложили два онлайновых сервиса, нахваливая их на все лады на 10 первых страницах поиска.
httр://docx-converter.com - предложил ввести свой e-mail и пообещал выслать отконвертированный файл. Шлёт уже второй час, куда дел съеденное - неизвестно.
httр://www.docx2doc.com - заглотив исходник, тут же выдал иконку готового документа, но... без возможности скачивания. Изволь платить бабло или жди 23 часа до разлочки.
В обоих случаях - бесстыжее говноедство.
На некоторых форумах умудрённые юзеры важно советовали отправиться на поклон Майкрософту и скачать официальную приблуду-конвертер для пожилых Вордов. Либо на русском (85 метров), либо на английском (25 метров). Ни та, ни другая установиться не пожелали и выдали мне единственное окошко: "Пакет установить не удалось. ОК?"
Иные просветлённые юзеры предлагали просто и без изысков изменить расширение файла в doc. Ворд сначала радостно подхватил этот знакомый файл, но тут же обиженно защёлкал челюстями: "а где, где мой установочный диск?! я не могу без установочного диска!! дайте!" Хрен знает, где твой установочный диск, поди взад. Снова мусор вместо текста.

Пришлось разбираться более вдумчиво. В итоге всё получилось, но с неожиданным алгоритмом.

1. Открыть файл docx архиватором. Я вскрыл его винраром, просто выбрав из контекстного меню команду "Открыть с помощью..." Формат docx - как выяснилось, по сути стандартный архив.
2. Найти внутри архива папку word, а внутри неё - файл document.xml. Там вообще много барахла зашито - таблица шрифтов, стили, настройки и чорта лысого. Нужен нам только один этот файл - именно он содежит текст.
3. Выкусить файл document.xml наружу, в какое-нибудь дисковое пространство. Ну просто взять мышкой и вытащить в Проводник, например.
4. Вручную перебить расширение этого файла на html. Проводник чего-нибудь вякнет, конешно, но это неважно.
5. Открыть document.html в любом броузере. Два раза кликнуть горемычного. Если поначалу откроются крокозябры, изобилующие буквой Р, просто выбрать вид кодировки Юникод (UTF-8). Текст доступен.

Один минус всё же есть: в тексте слетают переводы строк, поэтому он выдаётся одним слитым абзацем. Но для срочного решения нечастой проблемы этот вариант годится. Потом-то всё равно придётся решать - ставить этого нового монстра 2007 или ну его в жопу.

Update: Гугл снова стал понимать docx!
Tags: мудрость
Subscribe
  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

  • 50 comments
Previous
← Ctrl ← Alt
Next
Ctrl → Alt →
Previous
← Ctrl ← Alt
Next
Ctrl → Alt →