office open xml что это
Приступая к работе с Open XML версии пакета SDK 2.0 для системы Office
Настоящая документация является предварительной и может быть изменена. Пакет Пакет Open XML SDK 2.5 для Office упрощает управление пакетами Open XML и элементами схемы Open XML в пакете. Классы в пакете Пакет SDK 2.5 Open XML позволяют выполнять множество стандартных задач, необходимых при работе с пакетами Open XML, поэтому сложные операции можно осуществлять всего несколькими строками кода.
Использование классов в пакете Open XML SDK
Использование классов в Пакет SDK 2.5 Open XML простой. Когда вы установили Пакет SDK 2.5 Open XML, откройте существующий проект или приложение в Visual Studio или создайте новый проект или приложение. Затем в проект или приложение, добавьте ссылки на следующие компоненты.
DocumentFormat.OpenXml
WindowsBase
Добавление ссылки в проекте Microsoft Visual Studio 2008
В обозревателей решений щелкните правой кнопкой мыши узел Ссылки, а затем выберите команду Добавить ссылку. Если узел Ссылки не видно, щелкните Проект и выберите команду Показать все файлы.
В диалоговом окне Добавление ссылки нажмите кнопку .NET.
В столбце «Имя компонента» выберите компоненты (прокрутите список, если требуется), а затем нажмите кнопку ОК.
Чтобы выбрать несколько компонентов, удерживайте клавишу CTRL и щелкайте каждый нужный компонент.
Добавленные компоненты отображаются в разделе «Ссылки» в обозревателе решений.
Office Open XML
Первоначально формат создавался как замена прежнему двоичному формату документов, который использовали приложения Microsoft Office вплоть до версии Office 2003 включительно. В 2006 году формат Office Open XML был объявлен свободным и открытым форматом Ecma International. Он является форматом по умолчанию для приложений Microsoft Office 2007 и более поздних.
Две разные версии OOXML определены в ECMA-376 [1] [2] и в ISO 29500:2008. Полная поддержка формата ISO 29500 ожидается в Microsoft Office 2010.
Содержание
Стандартизация
Ecma International
Microsoft заявила, что Office Open XML будет открытым стандартом, и представила его на утверждение Ecma International (ECMA). 8 декабря 2005 года ECMA организовала технический комитет 45 (TC45), чтобы «выпустить формальный стандарт для офисных приложений, полностью совместимый с форматами Office Open XML, представленными Microsoft». Предложение также поддержали Apple Inc., Barclays Capital, BP, the British Library, Essilor, Intel, NextPage., Statoil ASA и Toshiba. [3]
ISO/IEC
5 сентября 2007 года принятие варианта OOXML как стандарта ISO/IEC 29500 было временно отклонено по результатам голосования. [4]
Публикация ISO/IEC DIS 29500 была отложена на период рассмотрения апелляций (30 дней). [13] [14]
В июле руководители ISO и IEC порекомендовали Technical Management Board отклонить апелляции, указав в качестве причины то, что проект стандарта был принят голосованием в соответствии с директивами ISO/IEC JTC 1. [15]
В августе ISO отклонила апелляции стран, выступающих против принятия OOXML как стандарта, так как они не смогли получить поддержку необходимого числа участников ISO для приостановления принятия стандарта [16]
В конце августа государственные IT‐организации Бразилии, ЮАР, Венесуэлы, Эквадора, Кубы и Парагвая опубликовали заявление о сомнениях в нейтральности ISO. [17] [18]
В Норвегии, где из 21 голоса «против» и двух голосов «за» получилось «за», 29 сентября 2008 года 13 членов технической комиссии в знак протеста вышли из состава Standard Norge (no). [19] [20] [21]
По данным собрания ISO/IEC JTC1/SC34, подкомиссии ISO/IEC JTC1, в начале октября SC34 отправила OASIS неопубликованный запрос на передачу ей контроля над стандартом ISO/IEC 26300 (ODF), обосновывая это стремлением к лучшей совместимости между стандартами. В Groklaw также обратили внимание на то, что 9 из 20 присутствовавших на собрании в июле являлись сотрудниками или консультантами Microsoft, либо членами ECMA TC45. В результате появились подозрения в попытке захвата Microsoft контроля над ODF. [22] [23] [24]
Поддержка в текстовых процессорах
Предыдущие версии MS Office
Большей популярностью на 2007 год пользуются его предшественники — двоичные форматы Microsoft Office 97—2003. Поддержка одной из версий OOXML (не соответствующая ISO/IEC 29500) появилась в Microsoft Office 2007. [6] Для работы с этим форматом в предыдущих версиях MS Office, Microsoft предлагает установить Microsoft Office Compatibility Pack, который обеспечивает «прозрачную» работу с форматами Office 2007 пакетов MS Office 2000, XP и 2003. [25]
Поддержка формата в других текстовых процессорах
В OpenOffice.org 3 версии присутствует частичная встроенная поддержка OOXML. Для решения данной проблемы существуют онлайн-конверторы, способные конвертировать формат DOCX в другие форматы. Также существует плагин (разработанный фирмой Novell), позволяющий открывать и сохранять файлы в этом формате в ОС семейств SUSE и Microsoft Windows. [26]
Поддержка формата OOXML в текстовом процессоре Corel Word Perfect ожидалась в середине 2007 года. [27]
Сведения о пакете Open XML SDK 2.5 для Office
Open XML это открытый стандарт для текстовых документов, презентаций и электронных таблиц, который может быть реализован в разных приложениях на различных платформах. Open XML позволяет точно представлять существующие текстовые документы, презентации и электронные таблицы, которые кодируются в двоичных форматах, используемых приложениями Microsoft Office. Причина популярности Open XML очевидна: теперь существуют миллиарды документов, но, к сожалению, данные в них тесно связаны с программой, в которой они были созданы. Цель стандарта Open XML снять зависимость документов от приложений Microsoft Office, в которых они были созданы, чтобы с ними можно было работать в других приложениях независимо от формата и без потери данных.
Структура пакета Open XML
Файл Open XML хранится в ZIP-архиве, чтобы уменьшить размер файла. Структуру файла Open XML можно просмотреть с помощью средства просмотра ZIP-файлов. Документ Open XML состоит из нескольких частей документа. Отношения между частями хранятся в частях документа. Формат ZIP поддерживает произвольный доступ к каждой части. Например, приложение может переместить слайд из одной презентации в другую без синтаксического анализа содержимого слайда. Также приложение может удалить все примечания из текстового документа без анализа его содержимого.
Части документа в пакете Open XML создаются в виде разметки XML. Поскольку XML это обычный структурированной текст, вы можете просмотреть содержимое части документа с помощью средства чтения текста или выполнить синтаксический анализ содержимого с помощью таких процессов, как XPath.
Текстовые документы описываются с помощью разметки WordprocessingML. Дополнительные сведения см. в разделе Работа с документами WordprocessingML (Open XML SDK). Документ WordprocessingML состоит из набора историй, где каждая история это одно из следующих:
основной документ (единственная обязательная история);
верхний и нижний колонтитулы;
Презентации описываются с помощью разметки PresentationML. Дополнительные сведения см. в разделе Работа с документами PresentationML (Open XML SDK). Пакет презентации может содержать следующие части документа:
Листы книги описываются с помощью разметки SpreadsheetML. Дополнительные сведения см. в разделе Работа с документами SpreadsheetML (Open XML SDK). Пакет книги может содержать следующие элементы:
часть книги (обязательная);
один или несколько листов;
Пакет Open XML SDK 1.0
Версия 1 пакета Open XML SDK упрощает управление пакетами Open XML. API-интерфейс Open XML SDK позволяет выполнять многие распространенные задачи, которые обычно выполняются с пакетами Open XML, поэтому сложные операции можно реализовать несколькими строками кода. Вот некоторые распространенные задачи:
Поиск несколькими строками кода можно выполнить поиск произвольных данных в коллекции листов Excel 2007.
Сборка документов вы можете создавать документы, объединяя части существующих документов программными средствами. Например, можно извлечь слайды из различных презентаций PowerPoint 2007 и создать из них одну презентацию.
Проверка несколькими строками кода можно проверить части документа в пакете или весь пакет на соответствие схеме.
Обновление данных с помощью объектной модели Open XML можно легко изменить данные в нескольких пакетах.
Конфиденциальность несколькими строками кода можно удалить примечания или другие личные данные из документа перед его публикацией.
Пакет Open XML SDK 2.0 для Microsoft Office
Пакет Open XML SDK 2.0 для Microsoft Office расширил поддержку строго типизированных классов от классов частей, которые представлены в версии 1.0, до XML-содержимого каждой части. Все функции, доступные в версии 1.0, по-прежнему поддерживаются. Версия 2.0 позволяет программно обрабатывать XML-содержимое частей. Пакет SDK поддерживает программирование в стиле LINQ to XML, который упрощает написание кода для работы с XML-содержимым, по сравнению с традиционной моделью программирования W3C XML DOM.
Пакет SDK поддерживает следующие распространенные задачи и сценарии:
Строго типизированные классы и объекты вместо использования общих функций XML для обработки данных XML, для чего требуется помнить имена всех элементов, атрибутов и значений, а также пространства имен, для решения тех же задач можно использовать пакет Open XML SDK, просто обрабатывая объекты, представляющие элементы, атрибуты и значения. Все типы схемы представлены как строго типизированные классы среды выполнения CLR, а все значения атрибутов представлены как перечисления.
Формирование, поиск и обработка содержимого технология LINQ встроена непосредственно в SDK. Таким образом вы можете создавать функциональные конструкции и запросы с лямбда-выражениями непосредственно для объектов, представляющих элементы Open XML. Кроме того, пакет SDK позволяет легко обходить и обрабатывать содержимое, предоставляя поддержку коллекций объектов, например таблиц и абзацев.
Проверка Open XML SDK 2.0 для Microsoft Office предоставляет возможности проверки, что позволяет проверять документы Open XML на соответствие различным вариантам формата Open XML.
Пакет Open XML SDK 2.5 для Office
Пакет SDK 2.5 Open XML предоставляет пространства имен и члены для поддержки Microsoft Office 2013. Open XML SDK 2.5 также может читать файлы в строгом формате ISO/IEC 29500. Строгий формат это подмножество переходного формат, который не содержит устаревшие функции это теоретически облегчает поддержку для новых разработчиков, поскольку формат более прост.
Пакет SDK поддерживает следующие распространенные задачи и сценарии:
Поддержка формата файлов Office 2013 Preview кроме классов Open XML SDK 2.0 для Microsoft Office, Пакет SDK 2.5 Open XML предоставляет новые классы, которые позволяют создавать приложения для обработки расширений файлов Open XML новых компонентов Office 2013.
Исправления Open XML SDK 2.0 для Microsoft Office в Пакет SDK 2.5 Open XML исправлены известные проблемы Open XML SDK 2.0 для Microsoft Office. К ним относятся потерянные пробелы в презентациях PowerPoint и проблема с настраиваемым пользовательским интерфейсом в документах Word, из-за которой указанный аргумент считался выходящим за допустимый диапазон.
Дополнительные сведения об этих и других новых возможностях Пакет SDK 2.5 Open XML см. в статье Новые возможности в Open XML SDK 2.5 для Office.
Форматы Open XML и расширения имен файлов
Начиная с Microsoft Office 2007, в Microsoft Office используются форматы файлов на основе XML, например DOCX, XLSX и PPTX. Эти форматы и расширения имен файлов применяются к Microsoft Word, Microsoft Excel и Microsoft PowerPoint. В этой статье описаны основные преимущества формата, описаны расширения имен файлов и описано, как можно делиться файлами Office с людьми, которые используют более ранние версии Office.
Каковы преимущества форматов Open XML?
Форматы Open XML имеют множество преимуществ не только для разработчиков и их решений, но и для отдельных людей и организаций любого размера.
Сжатие файлов Файлы сжимаются автоматически и в некоторых случаях могут быть на 75 процентов меньше. Формат Open XML использует технологию zip-сжатия для хранения документов, что позволяет сэкономить место на диске, необходимое для хранения файлов, и уменьшает пропускную способность, необходимую для отправки файлов по электронной почте, по сетям и через Интернет. Когда вы открываете файл, он автоматически обновляется. При сохранение файла он автоматически застекается снова. Для открытия и закрытия файлов в Office не нужно устанавливать специальные почтовые Office.
Улучшенные возможности восстановления поврежденных файлов. Файлы имеют модульную структуру, поэтому различные компоненты данных файла хранятся отдельно друг от друга. Это позволяет открывать файлы даже в том случае, если компонент в файле (например, диаграмма или таблица) поврежден.
Поддержка расширенных функций Многие из расширенных Microsoft 365 требуют, чтобы документ хранился в формате Open XML. Например, автоскрытиеи проверка доступности (вдвух примерах) можно работать только с файлами, которые хранятся в современном формате Open XML.
Улучшенная конфиденциальность и дополнительный контроль над персональными данными. К документам можно делиться конфиденциально, так как личные сведения и конфиденциальные бизнес-данные, такие как имена авторов, комментарии, отслеживаемые изменения и пути к файлам, можно легко найти и удалить с помощью инспектора документов.
Улучшенная интеграция и совместимость бизнес-данных. Использование форматов Open XML в качестве основы для обеспечения взаимосвязи данных в наборе продуктов Office означает, что документы, книги, презентации и формы могут быть сохранены в формате XML, который доступен для использования и лицензирования бесплатно. Office также поддерживает определяемую клиентом схему XML, улучшающую существующие Office типов документов. Это означает, что клиенты могут легко разблокировать информацию в существующих системах и действовать с ней в Office программах. Сведения, которые создаются в Office могут быть легко использованы другими бизнес-приложениями. Все, что нужно для открытия и редактирования файла Office, — это с помощью ZIP-редактора и редактора XML.
Прежде чем сохранять файл в двоичном формате, ознакомьтесь со статьей Могут ли разные версии Office одинаковыми файлами?
Как преобразовать файл из старого двоичного формата в современный формат Open XML?
Откройте файл в Приложение Office выберите файл > Сохранить как (или Сохранить копию,если файл хранится в OneDrive или SharePoint) и убедитесь, что для типа Сохранить как за установлен современный формат.
При этом будет создаваться новая копия файла в формате Open XML.
Что такое расширения имен XML-файлов?
При сохранение файла в виде шаблона вы видите такое же изменение. Расширение шаблона, используемее в более ранних версиях, уже существует, но теперь в его конце есть «x» или «м». Если файл содержит код или макрос, его необходимо сохранить с помощью нового формата XML-файла с поддержкой макроса, который добавляет в расширение файла «м» для макроса.
В следующих таблицах перечислить все расширения имен файлов по умолчанию в Word, Excel и PowerPoint.
Реализация стандарта Office Open XML (OOXML): О чём должны знать государственные учреждения
Государственные учреждения по всему миру всё больше осознают важность открытых стандартов в области ИКТ, поскольку последние способствуют реализации права на выбор и возможности взаимозамены использующих их систем, влияют на снижение расходов и двигают вперёд инновации. Сама идея того, что для государственного документооборота должен использоваться открытый формат, стала уже сама собой разумеющейся, а использование открытых стандартов рассматривается как неотъемлемая часть стратегий создания систем электронного правительства.
Нынешняя путаница с OOXML берёт своё начало в создании нескольких версий стандарта в рамках ИСО/МЭК
Понимание того, какие неприятные обстоятельства поспособствовали разработке OOXML, помогает объяснить сегодняшнюю неразбериху, связанную с данным форматом.
В первую очередь необходимо понимать, что, когда речь идёт о стандартах, успешность измеряется в том, какие проблемы стандарт позволяет решить и какие он предоставляет возможности для инноваций. Чаще всего среди причин создания и введения открытых стандартов в области ИКТ называют потребность в интероперабельности, обеспечение возможности выбора и гибкости.
В противоположность этому, формат OOXML возник как реакция Microsoft на проблему отсутствия у них подходящего стандарта, осознанную в середине 2005 года, когда госучреждения начали требовать открытых стандартов, Евросоюз призывал к открытию форматов документов и всеми были действительно осознаны риски зависимости от одного поставщика. Без наличия в офисном ПО поддержки формата документов, соответствующего некоторому открытому стандарту, использование Microsoft Office в госучреждениях в разных странах могло встать под угрозу, в особенности в связи с тем, что открытым стандартам стали давать предпочтение. Раздел описания целей стандарта OOXML затрагивает данную конфликтную ситуацию, пытаясь охватить как цели «точного представления ранее сформированного корпуса электронных документов, таблиц и презентаций, созданных с помощью приложений Microsoft Office» начиная с версии Office 97, так и цели «упрощения расширяемости и интероперабельности (совместимости)…» [6]
При такой поспешности и довольно нелепых попытках переработать существующий проприетарный стандарт под требуемые цели, OOXML был создан без достаточных усилий к достижению отраслевого консенсуса, без попытки вместе с конкурирующими сторонами выработать приемлемый для всех индустриальный стандарт.
По сути, для того чтобы добиться принятия спецификации в качестве международного стандарта ISO, Microsoft согласилась вынести части OOXML, которые были зависимыми от ОС Windows и могли бы успешно быть реализованы только самим Microsoft, в «Переходную» часть стандарта, использование которой должно было быть ограничено исключительно переводом старых документов Microsoft Office в новые. Было недвусмысленно заявлено, что эта «Переходная» часть спецификации не должна использоваться для создания новых документов.
Прежде чем члены ISO могли быть в достаточной степени удовлетворены, «Строгий» класс соответствия должен был включить десятки улучшений. Учитывая те поправки и улучшения, которые были внесены вместе с возникновением «Строгого» класса соответствия, при втором голосовании OOXML был принят. Конечным результатом стало утверждение спецификации OOXML в марте 2008 года в качестве стандарта ИСО/МЭК (ISO/IEC 29500) и признание двух его разновидностей — «Строгой» и «Переходной». Брайан Джонс, менеджер проекта Office в Микрософт, прокомментировал значимость «Строгой» и «Переходной» версий следующим образом:
Брайан Джонс, менеджер проекта Office в Микрософт
В противоположность этому, движущей силой при создании ODF было желание достичь совместимости (интероперабельности) офисного ПО и предоставить пользователям право выбора программного обеспечения.
Данный стандарт определяет характеристики основанного на XML независимого от прикладного ПО и операционной системы файлового формата цифровых документов, а также характеристики того ПО, которое будет читать, создавать и обрабатывать такие документы. [9]
Спецификация OASIS ODF 1.2
Результаты соответствующим образом подтверждают значимость открытых стандартов, поскольку сегодня все основные приложения для создания документов пользователей [10] поддерживают стандарт ODF.
Текущее состояние по реализации стандарта OOXML: неразбериха с разными версиями
После нескольких лет с того момента, как OOXML был одобрен ИСО в качестве международного стандарта, формат всё ещё продлжает существовать в нескольких редакциях, ни одна из которых в точности не соответствует тому, что использует Microsoft в своих офисных программных продуктах. Рассмотрим данные варианты OOXML:
Тот факт, что Microsoft, не реализуя «Строгую» версию стандрта, частным образом расширяет «Переходную» версию, означает, что те улучшения, которые позволили OOXML пройти стадию утверждения в ISO, на данный момент игнорируются. Данное расхождение стандарта ISO и реализации Microsoft вылилось в недавнее заявление Председателя собрания по разрешению конфликтов голосования (ballot resolution meeting) о том, что «Весь проект OOXML теперь несомненно движется к краху». [11]
Что из этого следует для госучреждений?
Хотя не все организации, использующие открытые стандарты, одинаковы, в целом они стараются избегать зависимости от конкретного поставщика, снижать затраты, повышать совместимость (интероперабельность), расширять доступ общественности к официальным документам и обеспечивать их долговременное хранение. Некоторые, но не все, также явно озвучивают цель способствования развитию конкуренции и даже способствования использованию открытых стандартов.
Не зависмо от того, к первой или второй области относятся цели того или иного госучреждения, до тех пор, пока со стороны Microsoft и других поставщиков ПО не будет полной поддержки «Строгой» версии OOXML (ISO/IEC 29500), госучреждения, полагающиеся на любые версии OOXML, могут расчитывать лишь на зависимость от конкретного проприетарного решения, которое не будет соответствовать их основным целям и запросам.