About RDF of Cultural JapanのRDFについて
Cultural JapanのRDFは、世界の主要文化遺産機関およびポータル(ソース一覧参照)から、APIなどを利用して収集したデータを、ジャパンサーチ利活用スキーマに基づくモデルに変換したものです。変換の手順などは2020 IIIF WeekでのLT資料を参照してください。
RDF data in Cultural Japan is based on data collected from the world's major cultural heritage institutions and portals (source list). The source data is converted to Japan Search RDF Schema. See the LT material at the 2020 IIIF Week for details on the conversion.
変換結果RDFについてOn resulting RDF
RDFは取得元のソースデータに基づいてツールで生成しています。アイテムごとの個別調整はできず、正規化などの精度の限界があるため、適切な変換ができていないデータがあるかも知れません。
The RDF is generated by the tool based on the obtained source data. Because individual adjustments to each item are not possible, and there are limitations of the accuracy of normalization and other factors, some data might not be converted properly.
- アイテム型(
rdf:type
)は、主としてClassification、Keyword、Subject、Formatなどの値に基づいて生成しています。ただしこれらの値が得られない場合に、コレクションや所蔵館の主要アイテム、あるいは作者などに基づいてあらかじめ指定したデフォルト型を設定しているものがあります。このデフォルトと食い違う型のアイテムは、不適切なrdf:type
が付与されている可能性があります。 - 人名(
schema:creator
など)の値は、ジャパンサーチの正規化辞書の英語読みを基本に、データセットごとに補助辞書を用意して、正規化名(chname:)にマッピングしています。マッピングしきれなかった名前がある程度残っていると思われます。- 元データでの表記は、
jps:agential
/schema:description
で確認できます。
- 元データでの表記は、
- キーワード(
schema:about
)の値は、主としてメトロポリタン美術館CSVをマッピングした時に作成した対応表に基づき、英語キーワードを日本語化しています。Printのように版画にも写真プリントにもなり得るキーワードの場合、誤マッピングされてしまう可能性があります。 - 時間、場所もジャパンサーチと同様の正規化を行なっています。時間の表記はさまざまであるため、正規化ツールのパターンで捉えきれずに誤マッピングされる場合がまれにあります。
- 画像は、
schema:image
に作品識別のための画像(主としてサムネイル)を記述しています。- さらに比較的大きな画像があれば、
jps:accessInfo
/schema:associatedMedia
に記述します。大きめの画像でも1点のみが提供される場合は、schema:image
で記述しています(この場合associatedMedia
は通常付与しませんが、元データの提供方法によっては、同じURIが両方に記述される場合があります)。 - またサムネイル、中解像度、高解像度(印刷用)と3種類が提供されている場合は、サムネイルを
schema:image
、残りをassociatedMedia
に収め、さらに高解像度画像リソースにはHighResolutionImage型を与えて区別しています。 associatedMedia
の値は、画像以外に音声映像やPDFなどの場合があります。このときも、associatedMedia
の値に対してrdf:type
でそのタイプを付与します。またメディアのサムネイルが提供されない場合は、schema:image
は値を持ちません。
- さらに比較的大きな画像があれば、
- Item types (
rdf:type
) are generated based on the values of Classification, Keyword, Subject, Format, etc. When these values are not available, items may be assigned a pre-specified default type based on the collection, the source provider, or the author. If the actual item type differs from this default, an improper rdf:type might be assigned to the item. - Normalized Person name (e.g.
schema:creator
) is mapped based on the English name in Japan Search's dictionary, with an auxiliary dictionary for each dataset. It is likely that some names were not fully mapped.- The notation in the original data is recorded in
jps:essential
/schema:description
.
- The notation in the original data is recorded in
- Keyword (
schema:about
) is translated into Japanese primarily based on the mapping table used to describe the Metropolitan Museum of Art CSV. Some keywords like Print, which can be both woodblock print and photographic print, could be mapped to incorrect Japanese. - Time and place are normalized in the same way as Japan Search. Since time notations vary, the mapping tool might misinterpret the value.
- Image is described with
schema:image
in order to identify the work (mostly thumbnails) .- If relatively large images are available, they are described in
jps:accessInfo
/schema:associatedMedia
. If only the large image is provided, it is described inschema:image
(In this case, theassociatedMedia
is usually not assigned, however, sometimes both descriptions are used depending on how the original data is provided). - Also, if there are three types of images (thumbnail, medium resolution, and high resolution for printing) are provided, the thumbnail is described in
schema:image
, and the rest inassociatedMedia
. Ther higher resolution image resources can be distinguished by theHighResolutionImage
type assigned to them. - The resource of
associatedMedia
may be an audio-visual or a PDF rather than images. In this case, theassociatedMedia
value is also assigned a type byrdf:type
. If the thumbnail image of the media is not provided, theschema:image
has no value.
- If relatively large images are available, they are described in