Dec. 12th, 2013

troika_ptah: (Default)
 
С момента предыдущего поста прошло много времени, большинство вопросов, которые я там озвучил, уже нашли свои ответы.  Укажу лишь, что слишком большое значение придавал DDC и в целом проблемам классификации. 
 
Самым важным решением, которое расставило всё на свои места, оказался выбор стандарта метаданных. Им стал Dublin Core. DDC прекрасно туда встраивается, наряду с другими классификаторами.
 
Описание издания в соответствии со стандартом будет выглядеть примерно так (все элементы опциональны, все элементы могут повторяться):
  • Title — название книги;
  • Creator — автор;
  • Subject — тема, ключевые слова (по контролируемому тезаурусу);
  • Description1 — скрин обложки издания;
  • Description2 — полная библиографическая запись;
  • Description3 — аннотация;
  • Description4 — оглавление;
  • Publisher — издатель;
  • Contributor — внёсший вклад (здесь можно будет указывать людей и организации, которые оказали помощь в сканировании книги, распознании текста, внесли материальный вклад и пр.);
  • Date — дата издания (конкретный год или диапазон) (будет использован W3CDTF profile of ISO 8601 [W3CDTF]);
  • Type — тип ресурса, документа (например [Текст]) (по контролируемому тезаурусу);
  • Format1 — формат документа, файла (pdf, djvu, fb2, epub и пр.);
  • Format2 — количество страниц в электронной версии;
  • Identifier1 — DDC;
  • Identifier2 — ISBN/ISSN;
  • Identifier3 — WorldCat;
  • Identifier4 — VIAF;
  • Identifier5 — собственный идентификатор BLID (bookva library ID);
  • Source — источник документа (указание на человека/организацию, откуда был получен документ, включая гиперссылку на источник);
  • Language — язык документа (по контролируемому тезаурусу);
  • Relation — отношения (здесь указываются издания, находящиеся в «родственных отношения»)(можно указывать другие издания данной книги; исходное издание в случае с рецензией; отзывы на книгу и пр.);
  • Coverage — пространственное и/или временно́е покрытие (охват) документа (по специализированным тезаурусам, например TGN для географической привязки — http://www.getty.edu/research/tools/vocabularies/tgn/index.html);
  • Rights — авторские права (правовой статус).
Это основные элементы стандарта. Будут и дополнительные. Для авторов специализированного стандарта не нашёл, составил от себя предварительно такой (будет уточняться и правиться):
  • Name — основное имя автора, в большинстве случаев это фамилия, но не обязательно (см. тех же древних греков или священников) (по этому и следующему элементу необходимо также указывать варианты написания на различных языках, как это сделано в VIAF);
  • AdditionalName — имя+отчество, второе имя, указание на профессию при полном совпадении ФИО с другим автором, указание сана для священника и пр.;
  • Identifier1 — WorldCat;
  • Identifier2 — VIAF;
  • Identifier3 — собственный идентификатор BLID (bookva library ID);
  • BirthDate — дата рождения [W3CDTF];
  • DeathDate — дата смерти [W3CDTF];
  • Photo — фотография/портрет автора +метаданные (по стандарту Дублинского ядра);
  • About — очень краткая энциклопедическая информация об авторе в текстовом формате;
  • PenName — псевдоним с указанием на источник (текст+гиперссылка);
  • Dict — ссылка на словарную статью об авторе (текст+гиперссылка). В итоге формируется список ссылок на словарные статьи.
  • Link — ссылка на материал об авторе в сети (текст+гиперссылка). В итоге формируется список ссылок на аналитические материалы.
  • Edition — издания автора. (библиографическая запись — Description2; год (чтобы потом список изданий можно было отсортировать по дате выхода); гиперссылка на издание;
  • EditionAbout — издания об авторе; всё аналогично edition, только отдельным списком.
Переделка БД bookva.org в соответствии со стандартом Dublin Core намечена на первую половину 2014 года. Да, в итоге на каждого автора и издание будут ещё автоматом генерироваться машиночитаемые файлы метаданных в форматах RDF, JSON, OPDS.
 

Profile

troika_ptah: (Default)
troika_ptah

December 2013

S M T W T F S
1234567
891011 121314
1516171819 2021
22232425262728
293031    

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Jul. 27th, 2017 04:46 am
Powered by Dreamwidth Studios