Краткое описание формата WXR

Без рубрики   26 сентября 2013  Автор статьи:  

WXR — формат, созданный для импорта и экспорта записей, комментариев и страниц из/в WordPress. Для того чтобы получить WXR файл своего сайта, достаточно нажать «Инструменты» и выбрать пункт «Экспорт».
wordpress-export-sample
После этого достаточно щелкнуть «Скачать файл экспорта», и все ваши комментарии, записи и страницы готовы к дальнейшей транспортировки. Сразу видно, что WXR файл представляет собой xml-файл со своей структурой. Давайте рассмотрим ее более подробно:




1.0

Импорт записей из xml файла http://evakfast.ru/import-zapisej-iz-xml-fajla/ Thu, 01 Jan 1970 00:00:00 +0000 admin
http://evakfast.ru/import-zapisej-iz-xml-fajla/

Инструменты — Импорт — WordPress]]>

63
1970-01-01 04:00:00
1970-01-01 00:00:00
open
open
import-zapisej-iz-xml-fajla
publish
0
0
post

0





Первая строчка нам говорит о том, что данный файл — это xml-документ. Вторая строчка показывает, что данный файл — это rss. Далее следует контейнер «channel», внутри которого мы будем помещать все элементы, которые есть у нас на сайте. Сначала указывается версия файла WXR, а также общая информация о сайте (в данном файле я ее удалил).

  • title — название сайта
  • link — ссылка на сайт
  • description — описание сайта
  • pubDate — дата создания WXR-документа
  • generator — имя или ссылка на программу, которая создала данный файл
  • language — язык, который используется в блоге
  • wp: wxr_version — версия WXR-документа
  • wp:base_site_url — адрес хостинг провайдера
  • wp:base_blog_ur — имя домена, на котором расположен сайт

После этого идет произвольное количество тегов category, которые содержат информацию о всех категориях:

  • wp:cat_name — название категории
  • wp:category_nicename — название категории для URL
  • wp:category_parent — необходимо указать всех родителей, если такие присутствуют (Много родителей будут в том случае, если данная категория принадлежит целой иерархии категорий)

Далее идут достаточно редко используемые параметры, поэтому мы сразу перейдем к основным полям у тега item:

  • title — заголовок
  • link — ссылка на элемент
  • description — описание
  • dc:creator — автор поста
  • category — здесь необходимо указать к каким категориям относится данный элемент
  • guid — глобальный идентификатор, который служит для идентификации записей RSS. Атрибут isPermaLink=false показывает, что данный идентификатор не является рабочей ссылкой
  • wp:post_id — уникальный идентификатор, который выдается странице или записи.
  • wp:post_date — дата публикации
  • wp:comment_status — открыты или закрыты комментарии для этой записи
  • wp:post_name — уникальное имя, которое можно применять для URL
  • wp:status — статус элемента, может быть: «publish», «draft», «pending»,»private»
  • wp:post_type — тип элемента, может быть «post», «page»,»media»

Далее идут комментарии, которые имеют примерно аналогичную структуру. На этом я заканчиваю описание формата WXR, но хочется отметить, что при импорте в WordPress, большинство тегов и параметров можно пропустить, тогда WordPress сам выставит их по умолчанию, поэтому достаточно просто генерировать такой xml файл для массовой заливки контента в WordPress.

Научиться программировать

  • на Delphi

  • на Java

  • на C++