Форматы документов Office: экскурс в историю

XMLХорошо известные сейчас двоичные форматы файлов Office были разработаны 15 лет назад, в 1994 г.

Эти форматы (DOC, XLS и PPT) впервые появились с выхо­дом Microsoft Office 97. В то время важно было оптимизировать файлы для хранения на медленно работающих жестких дисках и дискетах. Главным недостатком этих форматов с течением времени стала невозможность лёгкого доступа к данным внутри файлов для многократного использования содержимого, создания документов и их интеграции в бизнес-процессы. Со временем вследствие своей популярности на рынке двоичные форматы Office стали основным средством обмена документами между различными продуктами, несмотря на то что они не были специально разработаны для этой цели.

В последующих версиях Office была реализована поддержка совместной работы над документами и более широкомасштабного обмена данными на основе функций для создания документов, учитывающая растущую популярность Интернета и веб-технологий. В частности, поддержка XML открыла дорогу для сложных сценариев управления доку­ментами и обмена данными. В Office 2000 был введен формат файлов HTML, в котором свойства документов были определены в виде XML-кода, в Office XP появилась первая базовая XML-схема (SpreadsheetML). В Office 2003 был реализован стандартный способ хранения и обмена данными, содержащимися в документах, с использованием дополнительных базовых схем (WordprocessingML и расширенной схемы SpreadsheetML), а также интеграцией собственных схем.

XML-схема Office 2003 распространялась по открытой безвозмездной лицензии. Технологии и документация, связанные с двоичными форматами, теперь также лицензируются бесплатно с обязательством не инициировать судебные иски, что позволяет любому разработчику свободно использовать содержащуюся в них интеллектуальную собст­венность корпорации Майкрософт для разработки собственного программного обес­печения, лицензируемого по любой модели.

С выходом Office 2007 новые форматы файлов на базе XML становятся стандартными в программах Word, Excel и PowerPoint. Новые форматы файлов представляют собой расширение схем WordprocessingML и SpreadsheetML, введенных в предыдущих версиях. Они обеспечивают более широкую интеграцию и взаимодействие между документами Office и корпоративными приложениями.

Для конечного пользователя Open XML означает, что документы открываются быстрее, стало возможно работать с большими документами, и даже если файл повредится - его всегда можно восстановить. Достаточно любопытный момент в Open XML - то, что любой документ можно открыть архиватором ZIP.