コンテンツにスキップ

メタデータ

出典: フリー百科事典『ウィキペディア(Wikipedia)』
Metadataから転送)
21世紀においてメタデータは通常デジタル形式で存在するが、伝統的なカード目録にもメタデータが記載されている。カードには、図書館の蔵書に関する情報(著者・書名・主題など)が記載されている。
メタデータには層がある。このヒゲクリノイガ英語版ハーバリウムは、標本自体(物理的標本)と、それに関するメタデータから構成される。貼り付けられたバーコードは、この物理的標本に関するメタデータのデジタル記録を示している。
グライフスヴァルト大学における庭園実験の一部であるイボミズゴケ英語版の鉢のメタデータ。

メタデータ英語: Metadata)またはメタ情報(メタじょうほう)とは、データの特性を定義し、記述するデータ[1]。メタデータは対象のデータについて記述・説明・所在特定などを行い、データの検索・利用・管理を容易にする。例えば、書籍の題名・著者出版年月日は、その書籍に関するメタデータである。

データ資産は有限であるが、そのメタデータは無限である。メタデータの定義・類型化・構造化はメタデータの利用文脈における具体例に見ることができる。「メタデータ」という語は1960年代から用いられ始め、計算機科学や大衆文化において用いられた。

定義

[編集]

メタデータとは、「データに関するデータ」を意味する。メタデータは、データの一つ以上の側面について情報を提供するデータとして定義され、特定のデータの追跡や取り扱いを容易にするための基本情報を要約する目的で用いられる[2]。例として次のようなものが挙げられる。

  • データの作成手段
  • データの出典(ソース)
  • 作成日時
  • データの作成者(クリエイター/著者)
  • データが作成されたコンピュータ・ネットワーク上の位置
  • 使用された標準
  • データ品質

例えば、デジタル画像には、画像サイズ、色深度解像度、作成日時、シャッター速度その他のデータを記述するメタデータが含まれうる[3]。テキスト文書のメタデータには、テキストサイズ、著者、作成日時、短い要約などが含まれ得る。ウェブページ内のメタデータには、ページ内容の記述や、その内容に結び付けられたキーワード(「メタタグ」)が含まれ得る[4]。メタタグは1990年代後半まで、ウェブ検索の順位決定における主要因として用いられていたが、いわゆる「キーワード・スタッフィング」による不正使用(検索エンジンに実際以上の関連性があるかのように誤認させる手法)が横行したため、1990年代後半に依存度が低下した[4]

メタデータは、しばしばメタデータレジストリ英語版またはメタデータリポジトリ英語版と呼ばれるデータベースに格納・管理される[5]。しかし、文脈と基準がなければ、見ただけでそれがメタデータであると識別することは不可能な場合がある[6]。例えば、13桁の数字からなる値が多数入ったデータベースがあったとして、それだけでは計算結果なのか、方程式に代入すべき数値の一覧なのか判然としないため、数字自体が「データ」と受け取られる可能性がある。しかし、そのデータベースが蔵書ログであるという文脈が与えられれば、これらの13桁の数字はISBN、すなわち書籍の内容ではなく書籍を同定するための情報であると同定できる。

なお、「メタデータ」という語は1968年に フィリップ・バグレーが著書『プログラミング言語概念の延長』で造語したものであり、同書ではISO 11179英語版の「伝統的」意味合い、すなわち「構造メタデータ」(データ容器に関するデータ)として用いられていることが明確である。これは、図書館目録に通常見られるような、個々のデータ内容に関する情報(メタコンテンツ。タイトル・著者・出版社など)とは異なる[7][8]。以来、情報管理情報学情報技術図書館学地理情報システム等の分野でこの語は広く採用されている。これらの分野では、メタデータは一般に「データに関するデータ」と定義される[9]。この定義は広く受け入れられているが、各学問領域はそれぞれ、より特定的な説明や用法を採用している。

2013年、スレート (雑誌)は、アメリカ合衆国政府による「メタデータ」の解釈は広範であり、電子メールの件名などメッセージ内容を含み得ると報じた[10]

種類

[編集]

メタデータには多くの異なる類型が存在し、次のようなものがある。

  • 記述メタデータ:資源に関する記述的情報。検索や同定に用いられ、題名、要旨、著者、キーワードなどを含む。
  • 構造メタデータ:複合的なデータがどのように構成されているかを示す情報。デジタル資料の種類、版、関係性などの特性を記述する[11]
  • 管理メタデータ[12]:資料の管理を助ける情報。資料の種類、権限、作成時期と方法などを含む[13]
  • 参照メタデータ:統計データの内容と品質に関する情報。(統計データのタイプ英語版も参照)
  • 統計メタデータ[14]:プロセスデータとも呼ばれ、統計データを収集・処理・生成するプロセスを記述するデータ[15]
  • 法的メタデータ:クリエイター、著作権者またはパブリックライセンス英語版に関する情報を提供する。

メタデータは、一つの分類に厳密に拘束されるものではない。データは常に多様な観点から記述し得るためである。

メタデータの分類のための専門的で広く受け入れられたモデルも存在する。フランシス・ブレザートン英語版とシングレー(1994)は、「構造・制御メタデータ」と「ガイドメタデータ」の二つにメタデータを分類した[16]

構造メタデータは、表・列・キー・インデックスといったデータベースオブジェクトの構造を記述する。ガイドメタデータは、人間が特定の項目を見つけるのを助けるもので、通常は自然言語のキーワード集合である。

ラルフ・キンボール英語版は、メタデータを技術(内部)メタデータ、業務(外部)メタデータ、プロセスメタデータの三種に分類した。

米国情報標準化機構英語版はメタデータを以下のように記述、構造、管理の三種に区別する[9]

  • 記述メタデータ:題名、著者、主題、キーワード、出版社など、対象の検索・所在特定に用いられる情報である。
  • 構造メタデータ:対象の構成要素がどのように組織化されているかを記述する。例えば、書籍の章を形成するためにページがどのように順序づけられるかは構造メタデータの一例である。
  • 管理メタデータ:資源の管理を助ける情報を与える。管理メタデータは、ファイル形式、ファイルの作成時期と方法などの技術的情報を指す。管理メタデータの下位類型として、権利管理メタデータと保存メタデータがある。権利管理メタデータは知的財産権に関する情報、保存メタデータは資源を保存・保全するための情報を含む[17]

統計データリポジトリには固有のメタデータ要件があり、データの出所や品質のみならず[14]、その作成に用いられた統計的プロセスをも記述する必要がある。これは、統計データの生産過程を検証し改善するうえで統計コミュニティにとって特に重要である[15]

近年発展しつつある追加的なメタデータの型として、アクセシビリティメタデータがある。アクセシビリティメタデータは図書館にとって新しい概念ではないが、ユニバーサルデザインの進展によってその重要性が高まっている [18]:213–214

Cloud4AllやGPⅡといったプロジェクトは、ユーザーのニーズや嗜好、ならびにそれらに適合する情報を記述する共通の用語とモデルの欠如が、ユニバーサルアクセス解決策の提供における大きな欠落であることを指摘した[18]:210–211 。これらの種類の情報がアクセシビリティメタデータである[18]:214。Schema.orgは複数のアクセシビリティ特性を取り込んでいる[18]:214 。ウィキのウェブスキーマ/アクセシビリティのページは、いくつかの特性とその値を列挙している。

情報探索者の多様なアクセシビリティの要件を記述し標準化する取り組みは強化されつつあるが、確立されたメタデータスキーマへの採用は十分に進展していない。例えば、ダブリンコア(DC)の「オーディエンス」やMARC21の「リーディング・レベル」は、ディスレクシア(読字障害)のあるユーザーに適した資料を特定するために用い得るし、DCの「フォーマット」は、点字・音声・拡大文字といったフォーマットで利用可能な資料の識別に用い得るが、なお課題が残されている[18]:214

歴史

[編集]

メタデータには多様な目的がある。関連情報の発見資料の探索を助け、電子資料の組織化、デジタル識別、資源の保存・アーカイブにも資する。メタデータは、「関連する基準によって資料を見つけ、資料を同定し、類似資料を集約し、非類似資料を区別し、所在情報を与える」ことで、利用者が資料にアクセスできるようにする[17]インターネットトラフィック英語版を含む通信活動のメタデータは、多くの国の政府機関によってきわめて広範に収集されている。このデータはトラフィック分析英語版の目的で用いられ、監視社会に繋がる可能性もある[19]

メタデータは、1980年代に図書館が目録データをデジタルデータベースへ移行するまでは、主として紙の図書目録で用いられてきた[20]。2000年代以降データと情報のデジタル保存が進むにつれ、こうしたデジタルデータはメタデータ標準英語版を用いて記述されるようになった[21]

コンピュータシステムに関するメタデータの最初の記述は、1967年にMIT国際研究センター英語版の専門家デイヴィッド・グリフェルとスチュアート・マッキントッシュによって言及されたとされ、次のようなものである。「要するに、われわれはデータの主題とトークンコードに関する、対象言語での記述を持つ。同時に、データの関係および変換、規範とデータの間のought・is関係を記述する、メタ言語での記述も持つ」[22]

分野ごとに固有のメタデータ標準が存在する(例:博物館コレクション、デジタル音声ファイル、ウェブサイトなど)。データの内容と文脈を記述することは、その有用性を高める。例えばウェブページは、ページがどの言語(例:HTML)で記述されているか、作成に用いられたツールは何か、ページの主題は何か、その主題に関する追加情報をどこで得られるか、といったメタデータを含む。この種のメタデータは、読者の体験を改善し、利用者がオンラインでウェブページを見つけやすくする[23]CDには、ディスクに収録された演奏者、歌手作詞作曲者に関するメタデータが含まれる場合がある。

多くの国において、政府機関は電子メール電話、ウェブページ、動画トラフィック、IP接続、携帯電話位置情報に関するメタデータを日常的に保存している[24]

構造

[編集]

メタデータ・メタデータ記述を組み立てるために用いられる語彙は、通常は明確に定義されたメタデータスキーム(メタデータ標準英語版およびメタデータモデル英語版を含む)に基づいて、標準化されて構造化される。その際、統制語彙分類体系シソーラス、データ辞書、メタデータレジストリといったツールも重要になる。構造メタデータの共通性は、データモデルの開発やデータベース設計において最重要である。

構文

[編集]

メタデータの構文とは、メタデータのフィールドまたは要素を構成するための規則を指す[25]。単一のメタデータスキームも、複数のマークアップ言語やプログラミング言語で表現される際は各言語で異なる構文を要する。例えば、ダブリン・コアはプレーンテキスト、HTMLXMLRDFで表現できる[26]

ガイド系メタコンテンツの典型例としては、書誌分類、主題、デューイ十進分類法のクラス番号などが挙げられる。いかなる分類にも暗黙の主張が伴う。例えば、ある対象をデューイ分類514(トポロジー)として分類する場合、その暗黙の記述は “<book><subject heading><514>” となる。これは「主語-述語-目的語」のセット、より重要には「クラス-属性-値」のセットである。セットの最初の二要素(クラス、属性)は、定義済みの構造メタデータである。第三要素は値であり、統制語彙(マスターデータ英語版)から選ばれるのが望ましい。メタデータ要素とマスターデータ要素の組合せから、メタコンテンツ記述が形成される。メタデータもマスターデータも、メタコンテンツ記述を構成し得る語彙である。

メタデータ・マスターデータ双方に対して多くの標準や語彙があり 、例としては統一モデリング言語EDIFACT英語版XSD、デューイ十進分類法、国際十進分類法アメリカ議会図書館分類法SKOS英語版ISO 25964英語版パントン(パントン・マッチング・システム)()、リンネ式二名法(学名)などがある。索引付け・検索のいずれの場合でも、メタコンテンツ記述の構成要素に統制語彙を用いることがISO 25964によって推奨されている。「索引作成者と検索者の双方が同一の概念に対して同一の語を選択するよう(統制語彙によって)導かれるなら、関連文書は(より容易に)検索される(括弧内は訳者注)」からである[27]。これは、Googleのようなインターネット検索エンジンを考える際に特に重要である。検索エンジンはページをインデックス化し、複雑なアルゴリズムで文字列照合を行う。そこに知能や「推論」が生じているわけではなく、そのように見えるだけである。

階層型・線形・平面スキーマ

[編集]

メタデータスキーマは階層的になることがある。この場合、メタデータ要素間に関係が存在し、要素が入れ子構造を取り、親子関係が形成される。階層型メタデータスキーマの例としてIEEE LOM英語版が挙げられ、ここではメタデータ要素は上位のメタデータ要素に属し得る。

メタデータスキーマは一次元、すなわち線形のこともある。この場合、各要素は他の要素と完全に独立しており、一つの次元にのみ基づいて分類される。線形スキーマの例はダブリン・コアである。

また、メタデータ・スキーマは二次元、すなわち平面型である場合が多く、この場合各要素は互いに完全に独立・直交する二つの次元に基づいて分類される[28]

粒度

[編集]

データまたはメタデータがどの程度構造化されているかは粒度 (曖昧さ回避)英語版と呼ばれる。粒度はデータの詳細さを指し、粒度が高いメタデータは、より深く詳細で高度に構造化された情報を与え、より高度な技術的操作を可能にする。一方、粒度が低ければ作成コストは大幅に低減するが、提供される詳細は限定的となる。

また、粒度は作成・取得コストだけでなく、保守コストにも影響する。メタデータ構造の最新化ができないと、それに紐づいているデータへのアクセスも困難になる。高い粒度のメタデータはその分最新化コストも高くなるため、粒度はメタデータの作成・維持双方にかかるコストを勘案して設定されなければならない。

ハイパーマッピング

[編集]

メタデータスキーマが平面表現に収まらない場合、選択した観点に応じてメタデータを表示・閲覧するため、何らかのハイパーマッピングが必要となる。ハイパーマッピングは、地球情報学など、地理および地質情報のオーバーレイ層を重ねる用途で頻繁に適用される[29]

用途

[編集]
Vorbis commentを用いたOpus 音声ファイルのファイルメタデータの例。

一般的な種類のコンピュータファイルは、多くがメタデータを埋め込み可能である。文書(例:Microsoft OfficeOpenDocumentPDF)、画像(例:JPEGPNG)、動画(例:AVIMP4)、音声(例:WAVMP3)などが該当する。

メタデータは利用者が追加できるが、オーサリングアプリケーションや機器が利用者の関与なしに自動的に付与するメタデータも存在する。

ファイル内のメタデータは検索に有用である一方、共有時にはプライバシー上のリスクとなり得る。共有前にメタデータ削除ツール英語版を使うことはプライバシー保護のために有用である。

写真

[編集]

デジタル写真ファイルには、所有者、著作権・連絡先情報、使用カメラのブランドや機種、露出情報(シャッター速度、絞り値など)、さらにはキーワード等の記述情報をメタデータとして書き込むことができる。これにより、ファイルや画像はコンピュータ上やインターネット上で検索可能となる。色空間カラーチャンネル英語版、露出時間、絞りなどの一部のメタデータはカメラ(EXIF)によって生成され、他方で写真家やソフトウェアがコンピュータに取り込んだ後に入力するメタデータもある[30]。ほとんどのデジタルカメラは、機種名やシャッター速度等のメタデータを書き込み、一部はその編集も可能である[31]。この機能は、ニコンではニコン D3以降の多数のデジタル一眼レフカメラキヤノンではEOS 7D以降の新機種の多く、ペンタックスではペンタックス K-3英語版以降の多くのデジタル一眼レフカメラで利用可能である。キーワード付与により、ポストプロダクションでの整理が容易になる。フィルタを用いれば、評価や撮影時刻などの基準で写真を選択できる。GPS など測位機能を備えたデバイス(特にスマートフォン)では、撮影位置がメタデータに含まれる場合がある。

写真メタデータ標準は、次のような標準を策定する団体によって管理される(以下に限られない)。

動画

[編集]

動画では、内容(会話や場面)がコンピュータに直接は理解されないため、効率的な内容検索を可能にするメタデータが特に有用である。これは自動車ナンバー自動読取装置や車両認識ソフトウェアなどにおいて、ナンバープレートデータを保存し、レポートやアラートを作成する上でも有用である[33]

動画メタデータは主に二つの源泉から得られる。

  1. 運用上収集されるメタデータ:使用機器、ソフトウェア、日付、場所など、制作に関する情報。
  2. それ以外のメタデータ:検索エンジンでの可視性向上、発見可能性・視聴者エンゲージメントの改善、広告機会の提供などを目的とする情報[34]

アビッド・テクノロジーのMetaSyncや Adobe Bridgeは、メタデータにアクセスできるプロ向け動画編集ソフトの例である[35]

通信

[編集]

電話電子メールインスタントメッセージ等の通信における通話・送受信の時刻、発信元、発信先に関する情報は、メッセージ内容とは別のメタデータの一形態である。エドワード・スノーデンによる暴露後、アメリカ国家安全保障局のような一部の情報機関が、対象者か否かにかかわらず、何百万人ものインターネット利用者のオンラインメタデータを最大1年間にわたり大量に収集していた(あるいは現在もしている)とされたことは、論争の的となった。

地理空間メタデータ

[編集]

地理空間メタデータ英語版は、地理情報システムのファイル、地図、画像、その他の位置に基づくデータに関わる。地理情報システムでは、データベースファイルやシステム内で作成されたデータなど、地理データの特性・属性を記録するためにメタデータが用いられる。具体的には、データ作成者、収集時期、処理方法、利用可能な形式などの詳細を含み、データの効果的な利用に資する情報を提供する[36]

作成

[編集]

メタデータは自動または手作業のいずれでも作成され得る。初歩的なメタデータには、作成時刻、作成者、最終更新時刻、ファイルサイズ、拡張子などが含まれる。メタデータの対象には次のようなものがある。

  • 物理的なもの:書籍、CDDVD、紙地図、椅子植木鉢など
  • 電子ファイル:デジタル画像、電子文書、プログラムファイル、データベーステーブル等

メタデータエンジン英語版は、所与のドメイン知識内で使用されるデータおよびメタデータに関する情報を収集・保存・分析する[37]

データ仮想化

[編集]

データ仮想化英語版は2000年代に新たなソフトウェア技術として登場した。データ仮想化サーバでは、メタデータが永続的リポジトリとして保存され、企業内の各種システムアプリケーションにおけるビジネスオブジェクトを記録する。データ仮想化の支援においても、構造メタデータの共通性が重要である。

統計と国勢サービス

[編集]

標準化と調和の取り組みは、統計コミュニティにおけるメタデータシステム構築の産業的努力に利点をもたらしている[38][39]。欧州統計実務規範[40]やISO 17369:2013(SDMX英語版[38]など、複数のメタデータ指針・標準が、企業・政府機関・その他組織による統計データとメタデータの管理原則を提供する。ユーロスタット[41]欧州中央銀行制度[41]米国環境保護庁[42]のような機関は、統計業務プロセスの管理効率化を目指し、これらの標準・指針を実装している[41]

図書館情報学

[編集]

メタデータは、図書館において、デジタル・アナログ双方の資料目録編成手段として多様に用いられてきた。これにより、特定の書籍、DVD、雑誌など、図書館所蔵の任意の対象を分類・集約・同定・所在特定できる[43]。主題別に図書館資料を分類するデューイ十進分類法は、メタデータ利用の初期例である。1980年代までは、多くの図書館目録が、3×5 インチのカードを引出しに収め、書名・著者・主題・請求記号(書架上の物理的所在を示す英数字列の略記)を表示していた[44]。1980~90年代以降、多くの図書館は紙カードをコンピュータデータベースに置き換え、キーワード検索が容易かつ迅速になった。

古いメタデータ収集の別例として、米国国勢調査局の「長文質問票」がある。これは人口分布を把握するための人口統計データを作成する質問票である[45]。図書館は、統合図書館システムにおける目録でメタデータを用いるのが通例であり、書籍・逐次刊行物・DVD・ウェブページ・デジタル画像などの資源を目録化してメタデータを取得する。このデータは機械可読目録のメタデータ標準を用いて統合図書館システムに格納され、所蔵品の物理・電子的所在への誘導や、当該資料の記述提供を目的とする。

より新しく特化した図書館メタデータの事例として、電子印刷物リポジトリやデジタル画像ライブラリの設立がある。これらではメタデータ提供において非司書による利用に焦点が置かれるため、伝統的・一般的な目録手法には従わない。収録資料が多様であることから、分類学的分類、位置情報、キーワード、著作権表示といったメタデータ項目が特別に設けられることが多い。ファイルサイズや形式など標準的なファイル情報は、多くの場合自動的に含まれる[46]。図書館運営は、数十年来、国際標準化の主要テーマである。電子図書館のメタデータ標準には、ダブリン・コア、METS (メタデータ標準)英語版MODS (メタデータ標準)英語版DDI (メタデータ標準)英語版デジタルオブジェクト識別子URNPREMIS スキーマEML (メタデータ標準)英語版OAI-PMHなどがある。世界の主要図書館のメタデータ標準戦略から学べることは多い[47][48]

類似概念として、シンセットがある。これは同義語の集合であり、計算言語学語彙意味論の基本概念であり、英語の語彙データベースであるWordNetのものが有名である[49]が、EuroWordNet英語版[50]BabelNet[51]、国際ワードネットイニシアティブ[52]など他言語・多言語プロジェクトにも拡張されている。シンセットは自然言語処理の一部領域で重要な役割を果たすことが示されており、語彙項目と概念的意味の橋渡しとなる[53]

科学

[編集]
FAIRデータ英語版永続識別子の入門動画

学術論文のメタデータは、しばしば学術誌出版社PubMedWeb of Scienceといった引用データベースによって作成される。他方で、原稿中に含まれるデータや補足資料として付随するデータについては、メタデータが作成されることは比較的少ない[54][55]。ただし、出版後に生物医学系データベースなどへ投稿される場合があり、その際には原著者およびデータベースのキュレーターが、自動処理の支援を受けつつメタデータ作成の主体となる。あらゆる実験データに対する包括的なメタデータの作成は、研究データの「発見可能性」「アクセシビリティ」「相互運用性」「再利用性英語版」に関するFAIRデータ英語版指針の基盤である[56]

この種のメタデータは、活用・補完され、有用な形で公開され得る。OpenAlex英語版は 2 億点超の学術文献を統合する無償のオンライン目録であり、ソース、引用、著者情報、学術分野、研究トピックなどのメタデータを提供する。APIオープンソースのウェブサイトは、メタサイエンス科学計量学英語版、およびセマンティックウェブ様の論文照会を提供するツールとして利用できる[57][58][59]。開発中の別プロジェクトであるスコリアは、学術出版物のメタデータを用いて各種の可視化や集約機能を提供し、たとえばウィキデータの「メインサブジェクト」特性を用いてSARS-CoV-2の特定機能に関する文献を要約する簡易ユーザーインターフェースを提供する[60]

研究の現場においては、論文の作成における役割、貢献度、責任分担など、著者貢献に関する透明性に関するメタデータの導入が提案されている[61][62]

さらに、学術成果物に関して多様なメタデータが作成・補完され得る。たとえば、論文引用を「支持」「言及」「対照」などに区分して追跡・リンク付けしようとする取り組みがある[63]。他の例として、オルトメトリクス[64]の展開が挙げられる。これは評価やファインダビリティを助けるのみならず、Redditなどのソーシャルメディア上の議論、ウィキペディアにおける引用、ニュースメディアの報道を集約する[65]。加えて、元の知見が確認・再現されたか否かの提示を求める動きもある[66][67]

博物館

[編集]

博物館におけるメタデータとは、アーキビスト司書レジストラ (文化財)英語版キュレーター学芸員など、訓練を受けた文化資料記録の専門職が、美術作品・建築文化財およびそれらの画像を索引化・構造化・記述・同定し、または仕様化するために作成する情報を指す[68][69][70]。博物館では、対象物の同定やリソース検索・回収の目的で、記述メタデータが最も一般的に用いられる[69]

利用

[編集]

博物館や収蔵機関においてメタデータは、次の目的で開発・適用される。

  • 資料探索を容易にし、検索クエリを実行するため[70]
  • 博物館コレクションや文化財の各側面に関する情報を蓄積するデジタルアーカイブを構築し、アーカイブおよび管理目的に資するため[70]
  • デジタルコンテンツをオンライン公開することで、一般の閲覧者に文化財へのアクセスを提供するため[69][70]

標準

[編集]

多くの博物館・文化遺産機関は、作品や文化財の多様性を踏まえ、単一のモデルや標準では十分に記述・目録化できないことを認識している[68][69][70]。たとえば、彫刻された先住民の遺物は、美術作品、考古学的遺物、先住民文化遺産のいずれとしても分類され得る。博物館コミュニティにおけるアーカイブ、記述、目録化の標準化の初期段階は 1990 年代後半に始まり、CDWA英語版、Spectrum、CIDOC CRM英語版、Cataloging Cultural Objects(CCO)、CDWA Lite XML スキーマなどの標準が策定された[69]。これらの標準は、機械処理・公開・実装のためにHTMLおよびXMLマークアップ言語を用いる[69]。本来は書籍の記述のために開発された英米目録規則英語版(AACR)も、美術・建築・文化財に適用されている[70]。CCOのような標準は、博物館の収蔵品管理システム英語版に統合され、収蔵品・受入・貸借・保存管理の基盤となる[70]。もっとも、「急速に進化する標準と技術の状況」は、文化資料記録の専門職、特に技術的訓練を受けていない職種に課題をもたらす[71]。大半の収蔵機関や博物館は関係データベースを用いて文化財とその画像を分類する[70]。関係データベースとメタデータは、文化財や多面的な美術作品相互の複雑な関係、さらには対象と場所・人物・美術運動の関係を記録・記述するのに適している[69][70]。また、文化財とその画像を明確に区別できる点でも、関係データベースは有用である。文化財と画像の区別が不明瞭だと検索が混乱し不正確になり得るためである[70]

文化財

[編集]

対象物の物質性・機能・目的、寸法(高さ・幅・重量など)、保管要件(例:恒温恒湿環境)、ならびに博物館やコレクションのトピック(昭和鎌倉コレクション・近代インド美術など)は、文化資料記録の専門職が当該対象に付与するデータの記述深度に影響する[70]。確立された機関の目録実務、目標、専門性、およびデータベース構造も、文化財に付与される情報や分類方法に影響を与える[68][70]。さらに、多くの博物館は商用の標準化された収蔵品管理システムを用いており、これが学芸員による記述の方法を規定・制約する[71]。収蔵機関や博物館は、収蔵する文化財や美術作品の記述に統制語彙を用いる[69][70]ゲティボキャブラリーズプログラム英語版 やアメリカ議会図書館統制語彙は博物館コミュニティで高い評価を得ており、CCO標準でも推奨されている[70]。各博物館には、自館のコレクションの文脈に適合し、収蔵品管理システムの機能性を高める統制語彙の利用が推奨される[69][70]。統制語彙はデータベースにおける一貫性を高め、検索の精度向上に有用である[69][70]。メタデータ構造(統制語彙を含む)は、それが作られたシステムのオントロジーを反映する。しばしば、博物館におけるメタデータを通じた文化財の記述・分類プロセスは、作り手コミュニティの視点を十分に反映しない[68][72]

オンラインコンテンツ

[編集]

メタデータは、博物館におけるデジタル情報システムやアーカイブの構築において中心的役割を果たし、オンラインでのデジタルコンテンツ公開を容易にしてきた。これにより、地理的・経済的制約のために文化財へのアクセスが困難だった閲覧者にもアクセス機会が拡がった[69]。2000年代に入り、より多くの博物館がアーカイブ標準を採用し精緻なデータベースを構築する中で、博物館・アーカイブ・図書館情報学コミュニティでは、博物館データベース間のリンクトデータに関する議論が生じている[71] 。収蔵品管理システムやデジタル資産管理ツールは、ローカル(LAN)にも共有型にもなり得る[70]デジタルヒューマニティーズの研究者は、博物館データベースおよびコレクション間の相互運用性の利点を多数指摘する一方、その実現の困難さも認識している[71]

立法

[編集]

立法メタデータは、コーネル大学ロースクール英語版法律情報研究所英語版が2010年3月22・23日に開催したワークショップなど、law.govフォーラムで議論の対象となってきた。これらのフォーラムの文書は“立法および規制に関して想定されるメタデータの活用”と題されている[73]。議論では次のような主要論点が述べられている。

  • 一般的考慮事項
  • 文書構造
  • 文書内容
  • メタデータ
  • レイヤリング
  • 時点情報と事後的処理の比較

医療

[編集]

オーストラリアではヘルスケア領域におけるメタデータの応用に関する先駆的な研究が見られた。このアプローチは、世界保健機関の影響から独立して医学国際標準に準拠しようとする最初の試みであるが、これらの標準を支持する研究が存在するにもかかわらず、医学界はメタデータ標準に従う必要性を認めていない[74]

生物医学研究

[編集]

生物医学分子生物学の研究は、ゲノムメタゲノム配列決定、プロテオーム解析データ、研究過程で作成されるノートや計画など、大量のデータを生み出すことが多い[75]。各データ型には、そのメタデータの種類と作成プロセスが固有に伴う。ISA-Tab[76]のような一般的メタデータ標準は、研究者が実験メタデータを一貫した形式で作成・交換することを可能にする。特定の実験手法には、多くの場合、それぞれのメタデータ標準やシステムがある。たとえば質量分析法ではmzML[77]やSPLASH[78]が用いられ、XMLベースの標準としては、巨大分子構造と配列データのために、それぞれ蛋白質構造データバンクML[79]とSRA XML[80]が用いられる。

生物医学研究の成果は一般に査読済み論文として具現化され、これらの出版物自体もデータ源となる。

データウェアハウジング

[編集]

データウェアハウスは、組織の電子的に保存されたデータのリポジトリであり、データの管理・保管を目的として設計される。ビジネスインテリジェンスシステムがデータを用いてレポートを作成し分析を行い、経営に戦略的示唆を与えるのに対し、データウェアハウスはデータの収容と管理を主とする点で異なる[81]

メタデータはデータウェアハウスにおけるデータの格納方法に関して重要な役割を担う。データウェアハウスの目的は、組織内の各種業務システムから抽出したデータを標準化・構造化・一貫化・統合・正確化・クレンジングし、タイムリーに収容することである。抽出データは企業全体の視点を提供するようデータウェアハウス環境で統合され、報告・分析要件に資するよう構造化される。実体関連モデルなどのデータモデリング手法を用いて、構造メタデータの共通性を設計することは、あらゆるデータウェアハウス開発において重要である。データウェアハウスおよびビジネスインテリジェンスシステムの本質的構成要素は、メタデータ自体と、その管理・検索のためのツールである。ラルフ・キンボール英語版[82]は、メタデータを「データウェアハウスのDNA」と表現し、メタデータがデータウェアハウスの要素とそれらの連関を定義することを指摘している。

キンボールら[83]は、メタデータを主に三つに区分する。すなわち、技術メタデータ、業務メタデータ、プロセスメタデータである。技術メタデータは主として定義的であり、業務・プロセス・メタデータは主として記述的である。これらの区分は相互に重なり得る。

  • 技術メタデータ:データウェアハウスおよびビジネスインテリジェンスシステムにおけるオブジェクトとプロセスを技術的観点から定義する。リレーショナルエンジン内の表、項目、データ型、索引、パーティションなどのデータ構造に加え、データベース、ディメンション、測定、データマイニングモデルなどを規定するシステムメタデータを含む。ユーザに対するデータモデルおよび表示方法(レポート、スケジュール、配布先、ユーザ権限)も定義する。
  • 業務メタデータ:データウェアハウス内の内容を、利用者にとって分かりやすい語で記述する。保有データの内容、出所、意味、他データとの関係を示し、データウェアハウスおよびビジネスインテリジェンスシステムのドキュメンテーションとしても機能し得る。データウェアハウスを閲覧する利用者は主に業務メタデータを参照する。
  • プロセスメタデータ:データウェアハウス内の各種操作の結果を記述する。ETLプロセスではタスクの主要データ(開始時刻、終了時刻、CPU使用秒数、ディスク読み書き回数、処理行数など)が実行時に記録される。ETLやクエリのトラブルシューティングにおいて有用である。データウェアハウスおよびビジネスインテリジェンスシステムの構築・運用における事実測定であり、一部の組織はこの種のデータを収集・販売して収益化している。その場合、プロセスメタデータは、ファクト表・ディメンション表に対する業務メタデータとなる。プロセスメタデータの収集は、製品の利用者・利用製品・受けているサービス水準の把握を可能にするため、事業側の関心事となる。

インターネット

[編集]

ウェブページを定義するHTML形式は、基本的な記述テキスト・日付・キーワードから、ダブリン・コア、e-GMS英語版AGLS英語版のような高度なメタデータスキームまで[84]、多様なメタデータの包含を可能にする。ページやファイルは、地理座標系フォークソノミーを含め、座標によるジオタグ付けや分類・タグ付けも可能である。

メディアに識別子が設定されている場合、あるいは生成可能な場合には、映画などに関する情報(ファイルタグや説明)をインターネットから取得・スクレイピングできる[85]。各種オンラインデータベースは集約され、多様なデータのメタデータを提供する。協働構築されたウィキデータは、メディアだけでなく抽象概念や各種の対象・実体にも識別子を付与し、人間・機械が有用な情報を検索し、他の知識ベースやデータベースの知識と連結できるようにしている[60]

メタデータはページのヘッダ内、または別ファイルに含められることがある。マイクロフォーマットは、一般利用者には見えない形でページ上のデータにメタデータを付す手段を提供し、コンピュータ、ウェブクローラ、検索エンジンが容易にアクセスできるようにする。

多くの検索エンジンは、メタデータの悪用や検索エンジン最適化(SEO)による順位操作の実情を踏まえ、ランキングアルゴリズムでメタデータを扱うことに慎重である。ドクトロウによれば[86]、人々が自らのメタデータを作成する際に注意や配慮を欠くこと、またメタデータが作成者自身の目的推進のために利用される競争的環境の一部であることから、メタデータをランキングアルゴリズムで慎重に扱うことが正当化され得る。一方で、メタデータを実装したウェブページに検索エンジンが反応することを示す研究もあり[87]、Google は自社検索エンジンが解釈可能なメタタグを自社サイトで公表している[88]。エンタープライズ検索のスタートアップである Swiftype英語版は、サイト内検索における関連性シグナルとしてのメタデータの役割を認め、メタタグ2と呼ばれる独自拡張を公開している[89]

放送産業

[編集]

放送産業において、メタデータは音声映像の放送メディアに結び付けられ、次の目的に用いられる。

この種のメタデータは、ビデオサーバー英語版の仕組みにより映像メディアに結び付けられる。FIFAワールドカップオリンピックのような主要スポーツ中継では、キーワードを通じて各国の放送局へ映像コンテンツを配信するため、このメタデータが広く利用される。多くの場合、開催国のホストブロードキャスター[90]国際放送センターおよびビデオサーバーを通じてメタデータの編成を担う。メタデータは映像とともに記録され、メタデータオペレーター(ロガー)が、マルチカム (LSM)英語版IPDirector英語版のようなソフトウェアを用いてメタデータグリッド上でライブに付与・関連付ける[91][92]

生態学・環境

[編集]

生態学・環境分野のメタデータは、特定研究におけるデータ収集の「誰が・何を・いつ・どこで・なぜ・どのように」を記録することを目的とする。通常、収集主体(組織・機関)、データの種類、収集日、収集の理由、収集手法等の詳細を含む。メタデータは、当該分野のコミュニティで一般に用いられる形式(ダーウィンコア英語版Ecological Metadata Language英語版(EML)[93]、ダブリンコアなど)で作成されるべきである。メタデータ作成を支援する編集ツール(例:Metavist[94]Mercury (ソフトウェア)英語版、Morpho[95])が存在する。また、データの来歴(発生源、および実施された変換)と、データ成果物の引用方法(クレジット付与の方法)も記述されるべきである。

デジタル音楽

[編集]

1982年の発売当初、CDには、トラック数と各トラックの長さのみを含む TOC(Table of Contents)が収録されていた[96][97]。その14年後の1996年、CDレッドブック規格の改訂で、追加メタデータを格納するCD-TEXTが導入された[98]が、広範には普及しなかった。まもなく、パーソナルコンピュータがTOCに基づき外部ソース(例:CDDBGracenote)からメタデータを取得することが一般的になった。

2000年代には、デジタル音声ファイル等の音声ファイルフォーマットカセットテープやCDに取って代わった。デジタル音声ファイルには、ファイル名以上の情報を付与でき、これらの記述情報は一般にオーディオタグ・オーディオメタデータと呼ばれる。これを付加・編集する専用ソフトはタグエディタ英語版と称される。メタデータは、デジタル音声ファイルの命名、記述、目録化、所有権・著作権の表示に利用でき、検索エンジンがメタデータにアクセスすることで、グループ内から特定ファイルを容易に見つけられる。各種デジタル音声形式の発展に伴い、ファイル内部のどこに情報を格納するかの標準化が試みられた。

その結果、MP3Broadcast Wave FormatAIFFを含むほぼすべてのデジタル音声形式は、類似の標準化されたメタデータ格納領域を備えるようになった。圧縮・非圧縮のデジタル音楽では、メタデータはしばしばID3タグとして符号化される。TagLib英語版のような一般的エディタは、MP3、Ogg Vorbis、FLAC、MPC、Speex、WavPack、TrueAudio、WAV、AIFF、MP4、ASF 形式をサポートする。

クラウド・アプリケーション

[編集]

コンテンツへのメタデータ付与を含むクラウドアプリケーションの普及により、メタデータはインターネット上で一層利用可能になっている。

管理と運用

[編集]

保存

[編集]

メタデータは、記述対象データと同一のファイル・構造内に内部保存[99](埋め込みメタデータ)することも、対象データとは別のファイルやフィールドに外部保存することもできる。データリポジトリは、典型的にはメタデータをデータから切り離して保存するが、埋め込み方式を支援するよう設計することも可能である。各方式には長短がある。

  • 内部保存:メタデータは常に対象データとともに移動するため、データと一体で常に利用でき、ローカルで操作可能である。他方で、冗長性(正規化の阻害)を生み、システム全体のメタデータを一元管理できない。もっとも、データ変更時に容易に同期・更新できるため、一貫性の向上が主張されることもある。
  • 外部保存:すべてのコンテンツのメタデータを(例えばデータベースに)集約配置でき、検索・管理が効率化される。組織を正規化することで冗長性を回避できる。この方式では、情報転送時にメタデータをコンテンツと結合して送る(例:ストリーミングメディア)か、転送コンテンツからメタデータを参照する(例:ウェブリンク)ことができる。短所として、メタデータとデータが分離されるため、とりわけ別所にあるメタデータを参照する単独ファイルでは、片方の変更が他方に反映されず、両者の不整合が生じやすい。

メタデータは、人間可読形式またはバイナリ形式で保存できる。XMLのような可読形式は、特別なツールなしに理解・編集できる利点がある[100]。しかしテキスト系形式は、容量・通信時間・処理速度が最適化されないことが多い。バイナリ形式はこれらの効率に優れる一方、可読化のための専用ソフトを要する。

データベース管理

[編集]

関係データベースには、メタデータ保存の独自機構がある。例として、次のようなメタデータが挙げられる。

  • データベース内の全テーブルの一覧、名称、サイズ、各テーブルの行数。
  • 各テーブルの列の一覧、それらが用いられるテーブル、および各列のデータ型。

データベース用語では、これらのメタデータ集合をデータベースカタログ英語版と呼ぶ。SQL標準は、このカタログにアクセスするための統一手段として情報スキーマ英語版を規定するが、他のSQL標準要素を実装していても、情報スキーマを実装しないデータベースもある。データベース固有のメタデータアクセス法の例としてはOracle metadata英語版が挙げられる。JDBCやSchemaCrawlerのようなAPIを用いれば、プログラムからメタデータへアクセス可能である[101]

標準

[編集]

メタデータには国際標準が存在し、とりわけ米国国家規格協会および国際標準化機構の国内外コミュニティにおいて、メタデータおよびレジストリの標準化に関する合意形成が精力的に進められている。

ISO/IEC 11179

[編集]

中核的なメタデータ・レジストリ標準は ISO/IEC 11179であり、その枠組みはISO/IEC 11179-1:2004に記述されている[102]。Part1の新エディションはConcept Systemsの登録をサポートする ISO/IEC 11179-3:2013(MDRの拡張)に整合するよう改訂された(ISO/IEC 11179英語版参照)[103]。これはデータの意味と技術構造の双方を記録するスキーマを規定する。

ISO/IEC 11179標準では、メタデータはデータに関する情報オブジェクト、すなわち「データに関するデータ」として言及される。ISO/IEC 11179 Part3では、情報オブジェクトはデータ要素、値領域その他の、データ項目の意味と技術的詳細を記述する再利用可能な意味論的・表現論的情報オブジェクトに関するデータである。本標準はまた、メタデータレジストリの詳細、ならびにレジストリ内で情報オブジェクトを登録・管理するための詳細も規定する。Part3には、計算による派生、複数のデータ要素の集合、その他の形態の派生データなど、他のデータ要素から派生する複合構造の記述に関する規定も含まれる。本標準の目的は、特定アプリケーションに依存せずにメタデータ内容を記述し登録することを支援することであり、記述は人間やコンピュータによって新規アプリケーションやデータベースの開発、あるいは登録済みメタデータ内容に従って収集されたデータの分析に再利用され得る。本標準は、標準の登録・管理部分を再利用・拡張することで、他種のメタデータ・レジストリの一般的基盤ともなっている。

地理空間メタデータ

[編集]

地理空間コミュニティには、地図・画像の図書館や目録の伝統に基づく専門的な地理空間メタデータ英語版標準の蓄積がある。地理空間情報においては、通常のテキスト処理アプローチが適用できないため、形式的メタデータが不可欠となることが多い。

ダブリン・コア

[編集]

ダブリン・コア・メタデータ語彙[104]は、資料の発見を目的に資料を記述するための語彙である。15の基本語からなる語彙集合[105]は、以下の標準文書で承認されている。

W3Cデータカタログ語彙英語版(DCAT)[109]は、ダブリン・コアを補完するRDF語彙であり、データセット、データサービス(Webサービスを参照)、カタログ、カタログレコードのクラスを備える。データカタログ語彙はFOAFPROV-O英語版OWL-Time の要素も利用する。データカタログ語彙は、レコードからなる典型的なカタログ構造(各レコードがデータセットまたはサービスを記述する)を支援するRDFモデルを提供する。

標準ではないが、マイクロフォーマットは、既存のHTML/XHTMLタグを再利用してメタデータを表現しようとするウェブベースのセマンティック・マークアップ手法である。コンピュータ科学者のタンテク・チェリク英語版はマイクロフォーマットを指示して次のように述べている。「今ここに学んで欲しい新しい言語があり、さらにサーバ上に追加ファイルを出力してもらう必要がある。面倒だろう?(マイクロフォーマットは)参入障壁を下げる。[110]

大衆文化

[編集]

現代的意味でのメタデータ概念を風刺的に扱った初期例の一つとして、アメリカのSF作家ハル・ドレイパー英語版による短篇「MS Fnd in a Lbry」(1961年)がある。人類の全知識が机の引き出しほどの大きさの物体に凝縮されるが、メタデータ(目録の目録…、索引や沿革)の巨大さが、やがて人類に深刻かつ滑稽な帰結をもたらすという筋立てである。実データよりもメタデータが重要になってしまう事態の現代的帰結を先取りし、その内在するリスクへの警鐘として読まれてきた。

関連項目

[編集]

脚注

[編集]
  1. ^ International, DAMA (March 11, 2011) (English). The DAMA Dictionary of Data Management, 2nd Edition: Over 2,000 Terms Defined for IT and Business Professionals (2nd ed.). Technics Publications, LLC. ISBN 978-1-935504-12-2 
  2. ^ A Guardian Guide to your Metadata”. theguardian.com. Guardian News and Media Limited (2013年6月12日). 2016年3月6日時点のオリジナルよりアーカイブ。2025年10月31日閲覧。
  3. ^ ADEO Imaging: TIFF Metadata”. 2013年5月17日時点のオリジナルよりアーカイブ。2025年10月31日閲覧。
  4. ^ a b Rouse, Margaret (2014年7月). “Metadata”. WhatIs. TechTarget. 2015年10月29日時点のオリジナルよりアーカイブ。2025年10月31日閲覧。
  5. ^ Hüner, K.; Otto, B.; Österle, H.: Collaborative management of business metadata, in: International Journal of Information Management, 2011
  6. ^ Metadata Standards And Metadata Registries: An Overview”. 2011年6月29日時点のオリジナルよりアーカイブ。2011年12月23日閲覧。
  7. ^ Bagley, Philip (1968年11月). “Extension of programming language concepts”. Philadelphia: University City Science Center. 2012年11月30日時点のオリジナルよりアーカイブ。2025年10月31日閲覧。
  8. ^ "The notion of "metadata" introduced by Bagley". Solntseff, N.; Yezerski, A. (1974年). “A survey of extensible programming languages”. 7. Elsevier Science Ltd. pp. 267–307. doi:10.1016/0066-4138(74)90001-9 
  9. ^ a b NISO (2004). Understanding Metadata. NISO Press. p. 1. ISBN 978-1-880124-62-8. オリジナルの7 November 2014時点におけるアーカイブ。. https://web.archive.org/web/20141107022958/http://www.niso.org/publications/press/UnderstandingMetadata.pdf 2010年1月5日閲覧。 
  10. ^ Wolff, Josephine (2013年11月20日). “Newly Released Documents Show How Government Inflated the Definition of Metadata”. Slate Magazine. 2021年6月15日時点のオリジナルよりアーカイブ。2021年6月12日閲覧。
  11. ^ An Architecture for Information in Digital Libraries”. 2017年3月27日時点のオリジナルよりアーカイブ。2017年5月10日閲覧。
  12. ^ Zeng, Marcia (2004年). “Metadata Types and Functions”. NISO. 2016年10月7日時点のオリジナルよりアーカイブ。2016年10月5日閲覧。
  13. ^ National Information Standards Organization (NISO) (2001). Understanding Metadata. NISO Press. p. 1. ISBN 978-1-880124-62-8. オリジナルの7 November 2014時点におけるアーカイブ。. https://web.archive.org/web/20141107022958/http://www.niso.org/publications/press/UnderstandingMetadata.pdf 2008年6月20日閲覧。 
  14. ^ a b Directorate, OECD Statistics. “OECD Glossary of Statistical Terms – Reference metadata Definition”. stats.oecd.org. 2021年7月11日時点のオリジナルよりアーカイブ。2018年5月24日閲覧。
  15. ^ a b The Role of Metadata in Statistics”. Bureau of Labor Statistics. 2021年7月14日時点のオリジナルよりアーカイブ。2021年2月3日閲覧。
  16. ^ Bretherton, F. P.; Singley, P.T. (1994). Metadata: A User's View, Proceedings of the International Conference on Very Large Data Bases (VLDB). pp. 1091–1094.
  17. ^ a b National Information Standards Organization; Rebecca Guenther; Jaqueline Radebaugh (2004). Understanding Metadata. Bethesda, MD: NISO Press. p. 15. ISBN 978-1-880124-62-8. オリジナルの7 November 2014時点におけるアーカイブ。. https://web.archive.org/web/20141107022958/http://www.niso.org/publications/press/UnderstandingMetadata.pdf 2022年7月13日閲覧。 
  18. ^ a b c d e Beyene, Wondwossen Mulualem (2017). “Metadata and universal access in digital library environments”. Library Hi Tech 35 (2): 210–221. doi:10.1108/LHT-06-2016-0074. hdl:10642/5994. 
  19. ^ Metadata = Surveillance”. 2016年6月21日時点のオリジナルよりアーカイブ。2016年6月6日閲覧。
  20. ^ Holly, Yu; Scott, Breivold (28 February 2008) (英語). Electronic Resource Management in Libraries: Research and Practice: Research and Practice. IGI Global. p. 4. ISBN 978-1-59904-892-5. オリジナルの26 November 2022時点におけるアーカイブ。. https://web.archive.org/web/20221126135426/https://books.google.com/books?id=aZGyjL3uatIC&pg=PA4 2022年11月26日閲覧。 
  21. ^ Tedd, Lucy A.; Large, J. Andrew (4 April 2005) (英語). Digital Libraries: Principles and Practice in a Global Environment. Walter de Gruyter. p. 90. ISBN 978-3-598-44005-2. オリジナルの26 November 2022時点におけるアーカイブ。. https://web.archive.org/web/20221126140825/https://books.google.com/books?id=u_Gi1CPuP3kC&pg=PA90 2022年11月26日閲覧。 
  22. ^ Steiner, Tobias (23 November 2017). “Metadaten und OER: Geschichte einer Beziehung (Metadata and OER: [hi]story of a relationship)” (ドイツ語). Synergie. Fachmagazin für Digitalisierung in der Lehre 04: 54. doi:10.17613/m6p81g. ISSN 2509-3096. 
  23. ^ Best Practices for Structural Metadata”. University of Illinois (2010年12月15日). 2016年6月24日時点のオリジナルよりアーカイブ。2016年6月17日閲覧。
  24. ^ “NSA Recorded the CONTENT of 'EVERY SINGLE' CALL in a Foreign Country … and Also in AMERICA?”. Washingtonindependent.com. (2014年3月18日). オリジナルの2021年1月22日時点におけるアーカイブ。. https://web.archive.org/web/20210122171034/https://washingtonindependent.com/2014/03/nsa-recorded-every-single-call-one-country-country-america/ 2016年12月21日閲覧。 
  25. ^ Cathro, Warwick (1997年). “Metadata: an overview”. 2009年12月22日時点のオリジナルよりアーカイブ。2010年1月6日閲覧。
  26. ^ DCMI (2009年10月5日). “Semantic Recommendations”. 2009年12月31日時点のオリジナルよりアーカイブ。2010年1月6日閲覧。
  27. ^ ISO 25964-1:2011(en)”. ISO.org. 2016年6月17日時点のオリジナルよりアーカイブ。2025年10月31日閲覧。
  28. ^ Types of Metadata”. University of Melbourne (2006年8月15日). 2009年10月24日時点のオリジナルよりアーカイブ。2010年1月6日閲覧。
  29. ^ The Design and Development of a Geologic Hypermap Prototype”. 2013年10月3日時点のオリジナルよりアーカイブ。2025年10月31日閲覧。
  30. ^ What is metadata?” (英語). IONOS Digitalguide. 2022年5月17日時点のオリジナルよりアーカイブ。2022年5月17日閲覧。
  31. ^ How To Copyright Your Photos With Metadata”. Guru Camera. gurucamera.com (2016年5月21日). 2016年6月30日時点のオリジナルよりアーカイブ。2025年10月31日閲覧。
  32. ^ VRA Core Support Pages”. Visual Resource Association Foundation. 2016年4月9日時点のオリジナルよりアーカイブ。2016年2月27日閲覧。
  33. ^ Homeland Security (2012年10月). “System Assessment and Validation for Emergency Responders (SAVER)”. 2018年1月31日時点のオリジナルよりアーカイブ。2018年1月30日閲覧。
  34. ^ Webcase, Weblog (2011年). “Examining video file metadata”. 2015年11月26日時点のオリジナルよりアーカイブ。2015年11月25日閲覧。
  35. ^ Oak Tree Press (2011年). “Metadata for Video”. 2015年11月26日時点のオリジナルよりアーカイブ。2015年11月25日閲覧。
  36. ^ Geospatial Metadata – Federal Geographic Data Committee”. www.fgdc.gov. 2019年9月27日時点のオリジナルよりアーカイブ。2019年10月10日閲覧。
  37. ^ Metadata-Driven Design: Designing a Flexible Engine for API Data Retrieval”. InfoQ. 2017年4月26日時点のオリジナルよりアーカイブ。2017年4月25日閲覧。
  38. ^ a b Gløersen, R. (2011年4月30日). “Improving interoperability in Statistics – The impact of SDMX: Some Considerations”. United Nations Economic Commission for Europe. 2018年5月17日時点のオリジナルよりアーカイブ。2018年5月17日閲覧。
  39. ^ Laurila, S. (2012年12月21日). “Metadata system meeting requirements of standardisation, quality and interaction and integrity with other metadata systems: Case Variable Editor Statistics Finland”. European Commission. 2018年5月2日時点のオリジナルよりアーカイブ。2018年5月17日閲覧。
  40. ^ European Statistics Code of Practice”. European Commission. 2018年5月19日時点のオリジナルよりアーカイブ。2018年5月17日閲覧。
  41. ^ a b c Economic and Social Council, Statistical Commission (2015年3月3日). “Report on the Statistical Data and Metadata Exchange sponsors”. United Nations. 2019年6月21日時点のオリジナルよりアーカイブ。2018年5月18日閲覧。
  42. ^ EPA Metadata Technical Specification”. U.S. Environmental Protection Agency (2017年8月15日). 2018年5月19日時点のオリジナルよりアーカイブ。2018年5月18日閲覧。
  43. ^ Zavalina, Oksana L.; Zavalin, Vyacheslav; Shakeri, Shadi; Kizhakkethil, Priya (2016). “Developing an Empirically-based Framework of Metadata Change and Exploring Relation between Metadata Change and Metadata Quality in MARC Library Metadata” (英語). Procedia Computer Science 99: 50–63. doi:10.1016/j.procs.2016.09.100. 
  44. ^ What is metadata?”. Pro-Tek Vaults (2012年1月11日). 2022年7月14日時点のオリジナルよりアーカイブ。2022年7月13日閲覧。
  45. ^ National Archives of Australia (2002年). “AGLS Metadata Element Set – Part 2: Usage Guide – A non-technical guide to using AGLS metadata for describing resources”. 2010年3月30日時点のオリジナルよりアーカイブ。2010年3月17日閲覧。
  46. ^ Solodovnik, Iryna (2011). “Metadata issues in Digital Libraries: key concepts and perspectives”. JLIS.it (University of Florence) 2 (2). doi:10.4403/jlis.it-4663. オリジナルの16 June 2013時点におけるアーカイブ。. https://web.archive.org/web/20130616093855/http://leo.cilea.it/index.php/jlis/article/view/4663 2013年6月29日閲覧。. 
  47. ^ Library of Congress Network Development and MARC Standards Office (2005年9月8日). “Library of Congress Washington DC on metadata”. Loc.gov. 2011年12月15日時点のオリジナルよりアーカイブ。2011年12月23日閲覧。
  48. ^ Deutsche Nationalbibliothek Frankfurt on metadata”. 2012年10月24日時点のオリジナルよりアーカイブ。2012年10月23日閲覧。
  49. ^ Miller, George A. (1990). “WordNet: An on-line lexical database”. International Journal of Lexicography 3 (4): 235–244. doi:10.1093/ijl/3.4.235. 
  50. ^ Vossen, Piek (1998). “EuroWordNet: A multilingual database with lexical semantic networks”. Computers and the Humanities 32 (2–3): 123–152. doi:10.1023/A:1001183308162. 
  51. ^ R. Navigli and S. P. Ponzetto. 2012. BabelNet: The Automatic Construction, Evaluation and Application of a Wide-Coverage Multilingual Semantic Network. Artificial Intelligence, 193, Elsevier, pp. 217-250.
  52. ^ Global WordNet Association”. 2025年8月24日閲覧。
  53. ^ Fellbaum, Christiane, ed (1998). WordNet: An Electronic Lexical Database. MIT Press. ISBN 978-0-262-06197-1 
  54. ^ Evangelou, Evangelos; Trikalinos, Thomas A.; Ioannidis, John P.A. (2005). “Unavailability of online supplementary scientific information from articles published in major journals” (英語). The FASEB Journal 19 (14): 1943–1944. doi:10.1096/fj.05-4784lsf. ISSN 0892-6638. PMID 16319137. 
  55. ^ AlQuraishi, Mohammed; Sorger, Peter K. (18 May 2016). “Reproducibility will only come with data liberation” (英語). Science Translational Medicine 8 (339): 339ed7. doi:10.1126/scitranslmed.aaf0968. ISSN 1946-6234. PMC 5084089. PMID 27194726. https://pmc.ncbi.nlm.nih.gov/articles/PMC5084089/. 
  56. ^ Wilkinson, Mark D.; Dumontier, Michel; Aalbersberg, IJsbrand Jan; Appleton, Gabrielle; Axton, Myles; Baak, Arie; Blomberg, Niklas; Boiten, Jan-Willem et al. (15 March 2016). “The FAIR Guiding Principles for scientific data management and stewardship” (英語). Scientific Data 3. Bibcode2016NatSD...360018W. doi:10.1038/sdata.2016.18. ISSN 2052-4463. PMC 4792175. PMID 26978244. https://pmc.ncbi.nlm.nih.gov/articles/PMC4792175/. 
  57. ^ Singh Chawla, Dalmeet (2022年1月24日). “Massive open index of scholarly papers launches” (英語). Nature. doi:10.1038/d41586-022-00138-y. オリジナルの2022年2月7日時点におけるアーカイブ。. https://web.archive.org/web/20220207140943/https://www.nature.com/articles/d41586-022-00138-y 2022年2月14日閲覧。 
  58. ^ “OpenAlex: The Promising Alternative to Microsoft Academic Graph” (英語). Singapore Management University (SMU). オリジナルの2022年2月14日時点におけるアーカイブ。. https://web.archive.org/web/20220214174827/https://library.smu.edu.sg/topics-insights/openalex-promising-alternative-microsoft-academic-graph 2022年2月14日閲覧。 
  59. ^ OpenAlex Documentation”. 2022年2月2日時点のオリジナルよりアーカイブ。2022年2月18日閲覧。
  60. ^ a b Waagmeester, Andra; Willighagen, Egon L.; Su, Andrew I.; Kutmon, Martina; Gayo, Jose Emilio Labra; Fernández-Álvarez, Daniel; Groom, Quentin; Schaap, Peter J. et al. (22 January 2021). “A protocol for adding knowledge to Wikidata: aligning resources on human coronaviruses”. BMC Biology 19 (1): 12. doi:10.1186/s12915-020-00940-y. ISSN 1741-7007. PMC 7820539. PMID 33482803. https://pmc.ncbi.nlm.nih.gov/articles/PMC7820539/. 
  61. ^ McNutt, Marcia K.; Bradford, Monica; Drazen, Jeffrey M.; Hanson, Brooks; Howard, Bob; Jamieson, Kathleen Hall; Kiermer, Véronique; Marcus, Emilie et al. (13 March 2018). “Transparency in authors' contributions and responsibilities to promote integrity in scientific publication” (英語). Proceedings of the National Academy of Sciences 115 (11): 2557–2560. Bibcode2018PNAS..115.2557M. doi:10.1073/pnas.1715374115. ISSN 0027-8424. PMC 5856527. PMID 29487213. https://pmc.ncbi.nlm.nih.gov/articles/PMC5856527/. 
  62. ^ Brand, Amy; Allen, Liz; Altman, Micah; Hlava, Marjorie; Scott, Jo (1 April 2015). “Beyond authorship: attribution, contribution, collaboration, and credit”. Learned Publishing 28 (2): 151–155. doi:10.1087/20150211. https://www.researchgate.net/publication/274098676. 
  63. ^ Khamsi, Roxanne (2020年5月1日). “Coronavirus in context: Scite.ai tracks positive and negative citations for COVID-19 literature” (英語). Nature. doi:10.1038/d41586-020-01324-6. オリジナルの2022年2月19日時点におけるアーカイブ。. https://web.archive.org/web/20220219212737/https://www.nature.com/articles/d41586-020-01324-6 2022年2月19日閲覧。 
  64. ^ Fortunato, Santo; Bergstrom, Carl T.; Börner, Katy; Evans, James A.; Helbing, Dirk; Milojević, Staša; Petersen, Alexander M.; Radicchi, Filippo et al. (2 March 2018). “Science of science”. Science 359 (6379). doi:10.1126/science.aao0185. PMC 5949209. PMID 29496846. https://www.researchgate.net/publication/323502497 2021年11月22日閲覧。. 
  65. ^ Baykoucheva, Svetla (2015). “Measuring attention”. Managing Scientific Information and Research Data: 127–136. doi:10.1016/B978-0-08-100195-0.00014-7. ISBN 978-0-08-100195-0. https://www.researchgate.net/publication/280568406. 
  66. ^ “A new replication crisis: Research that is less likely to be true is cited more” (英語). phys.org. オリジナルの2021年6月13日時点におけるアーカイブ。. https://web.archive.org/web/20210613043457/https://phys.org/news/2021-05-replication-crisis-true-cited.html 2021年6月14日閲覧。 
  67. ^ Serra-Garcia, Marta; Gneezy, Uri (1 May 2021). “Nonreplicable publications are cited more than replicable ones” (英語). Science Advances 7 (21). Bibcode2021SciA....7.1705S. doi:10.1126/sciadv.abd1705. ISSN 2375-2548. PMC 8139580. PMID 34020944. https://pmc.ncbi.nlm.nih.gov/articles/PMC8139580/. 
  68. ^ a b c d Zange, Charles S. (2015年1月31日). “Community makers, major museums, and the Keet S'aaxw: Learning about the role of museums in interpreting cultural objects”. Museums and the Web. 2016年11月4日時点のオリジナルよりアーカイブ。2025年10月31日閲覧。
  69. ^ a b c d e f g h i j k Baca, Murtha (2006). Cataloging cultural objects: a guide to describing cultural works and their images. Visual Resources Association. Visual Resources Association. p. 4 
  70. ^ a b c d e f g h i j k l m n o p q Baca, Murtha (2016). Introduction to Metadata: Third Edition.. Los Angeles: Getty Publications. https://www.getty.edu/publications/intrometadata/ 2025年1月14日閲覧。 
  71. ^ a b c d Hooland, Seth Van; Verborgh, Ruben (2014). Linked Data for Libraries, Archives and Museums: How to Clean, Link and Publish Your Metadata. London: Facet 
  72. ^ Srinivasan, Ramesh (December 2006). “Indigenous, ethnic and cultural articulations of new media”. International Journal of Cultural Studies 9 (4): 497–518. doi:10.1177/1367877906069899. オリジナルの9 November 2020時点におけるアーカイブ。. https://web.archive.org/web/20201109215925/https://escholarship.org/uc/item/40p4k54t 2019年12月9日閲覧。. 
  73. ^ Suggested metadata practices for legislation and regulations”. Legal Information Institute (2010年3月27日). 2016年10月9日時点のオリジナルよりアーカイブ。2018年4月17日閲覧。
  74. ^ M. Löbe, M. Knuth, R. Mücke TIM: A Semantic Web Application for the Specification of Metadata Items in Clinical Research Archived 11 May 2012 at the Wayback Machine., CEUR-WS.org, urn:nbn:de:0074-559-9
  75. ^ Myneni, Sahiti; Patel, Vimla L. (1 June 2010). “Organization of Biomedical Data for Collaborative Scientific Research: A Research Information Management System”. International Journal of Information Management 30 (3): 256–264. doi:10.1016/j.ijinfomgt.2009.09.005. ISSN 0268-4012. PMC 2882303. PMID 20543892. https://pmc.ncbi.nlm.nih.gov/articles/PMC2882303/. 
  76. ^ Sansone, Susanna-Assunta; Rocca-Serra, Philippe; Field, Dawn; Maguire, Eamonn; Taylor, Chris; Hofmann, Oliver; Fang, Hong; Neumann, Steffen et al. (2012). “Toward interoperable bioscience data” (英語). Nature Genetics 44 (2): 121–126. doi:10.1038/ng.1054. ISSN 1061-4036. PMC 3428019. PMID 22281772. https://pmc.ncbi.nlm.nih.gov/articles/PMC3428019/. 
  77. ^ Martens, Lennart; Chambers, Matthew; Sturm, Marc; Kessner, Darren; Levander, Fredrik; Shofstahl, Jim; Tang, Wilfred H.; Römpp, Andreas et al. (1 January 2011). “mzML – a Community Standard for Mass Spectrometry Data” (英語). Molecular & Cellular Proteomics 10 (1). doi:10.1074/mcp.R110.000133. ISSN 1535-9476. PMC 3013463. PMID 20716697. https://pmc.ncbi.nlm.nih.gov/articles/PMC3013463/. 
  78. ^ Wohlgemuth, Gert; Mehta, Sajjan S; Mejia, Ramon F; Neumann, Steffen; Pedrosa, Diego; Pluskal, Tomáš; Schymanski, Emma L; Willighagen, Egon L et al. (2016). “SPLASH, a hashed identifier for mass spectra” (英語). Nature Biotechnology 34 (11): 1099–1101. doi:10.1038/nbt.3689. ISSN 1087-0156. PMC 5515539. PMID 27824832. https://pmc.ncbi.nlm.nih.gov/articles/PMC5515539/. 
  79. ^ Westbrook, J.; Ito, N.; Nakamura, H.; Henrick, K.; Berman, H. M. (27 October 2004). “PDBML: the representation of archival macromolecular structure data in XML” (英語). Bioinformatics 21 (7): 988–992. doi:10.1093/bioinformatics/bti082. ISSN 1367-4803. PMID 15509603. オリジナルの7 August 2018時点におけるアーカイブ。. https://web.archive.org/web/20180807191926/https://academic.oup.com/bioinformatics/article/21/7/988/268819 2018年10月2日閲覧。. 
  80. ^ Leinonen, R.; Sugawara, H.; Shumway, M. (9 November 2010). “The Sequence Read Archive” (英語). Nucleic Acids Research 39 (Database): D19–D21. doi:10.1093/nar/gkq1019. ISSN 0305-1048. PMC 3013647. PMID 21062823. https://pmc.ncbi.nlm.nih.gov/articles/PMC3013647/. 
  81. ^ Inmon, W.H. Tech Topic: What is a Data Warehouse? Prism Solutions. Volume 1. 1995.
  82. ^ Kimball, Ralph (2008). The Data Warehouse Lifecycle Toolkit (Second ed.). New York: Wiley. pp. 10, 115–117, 131–132, 140, 154–155. ISBN 978-0-470-14977-5 
  83. ^ Kimball 2008, pp. 116–117
  84. ^ National Archives of Australia, AGLS Metadata Standard, accessed 7 January 2010, AGLS Metadata Standard”. 2010年1月10日時点のオリジナルよりアーカイブ。2010年1月7日閲覧。
  85. ^ Making Use of Affective Features from Media Content Metadata for Better Movie Recommendation Making”. 2025年10月31日閲覧。
  86. ^ Metacrap: Putting the torch to 7 straw-men of the meta-utopia Metacrap: Putting the torch to 7 straw-men of the meta-utopia”. 2007年5月8日時点のオリジナルよりアーカイブ。2007年5月8日閲覧。
  87. ^ The impact of webpage content characteristics on webpage visibility in search engine results The impact of webpage content characteristics on webpage visibility in search engine results (Part I)”. 2012年9月7日時点のオリジナルよりアーカイブ。2012年4月3日閲覧。
  88. ^ Meta tags that Google understands”. 2014年5月22日時点のオリジナルよりアーカイブ。2014年5月22日閲覧。
  89. ^ Swiftype-specific Meta Tags”. Swiftype Documentation. Swiftype (2014年10月3日). 2014年10月6日時点のオリジナルよりアーカイブ。2025年10月31日閲覧。
  90. ^ HBS is the FIFA host broadcaster”. Hbs.tv (2011年8月6日). 2012年1月17日時点のオリジナルよりアーカイブ。2011年12月23日閲覧。
  91. ^ Host Broadcast Media Server and Related Applications”. 2011年11月2日時点のオリジナルよりアーカイブ。2013年8月17日閲覧。
  92. ^ logs during sport events”. Broadcastengineering.com. 2011年11月16日時点のオリジナルよりアーカイブ。2011年12月23日閲覧。
  93. ^ Ecological Metadata Language (EML) Specification”. Ecoinformatics. 2011年4月23日時点のオリジナルよりアーカイブ。2022年7月16日閲覧。
  94. ^ Metavist 2”. Metavist.djames.net. 2011年8月21日時点のオリジナルよりアーカイブ。2011年12月23日閲覧。
  95. ^ KNB Data :: Morpho”. Knb.ecoinformatics.org (2009年5月20日). 2012年1月13日時点のオリジナルよりアーカイブ。2011年12月23日閲覧。
  96. ^ Morris, Jeremy W (28 February 2012). “Making music behave: Metadata and the digital music commodity”. New Media & Society 14 (5): 850–866. doi:10.1177/1461444811430645. オリジナルの24 February 2021時点におけるアーカイブ。. https://web.archive.org/web/20210224051543/https://journals.sagepub.com/doi/abs/10.1177/1461444811430645 2023年3月12日閲覧。. 
  97. ^ Pohlmann, Ken C. (1989). The Compact Disc: A Handbook of Theory and Use. A-R Editions, Inc.. pp. 48–. ISBN 978-0-89579-228-0. https://archive.org/details/compactdischandb0000pohl 
  98. ^ Unofficial CD Text FAQ”. Computall Services. 2022年4月8日時点のオリジナルよりアーカイブ。2022年7月16日閲覧。
  99. ^ O'Neill, Dan. “ID3.org”. 2011年11月11日時点のオリジナルよりアーカイブ。2020年4月1日閲覧。
  100. ^ De Sutter, Robbie; Notebaert, Stijn; Van de Walle, Rik (September 2006). “Evaluation of Metadata Standards in the Context of Digital Audio-Visual Libraries”. In Gonzalo, Julio; Thanos, Constantino; Verdejo, M. Felisa et al.. Research and Advanced Technology for Digital Libraries: 10th European Conference, EDCL 2006. Springer. p. 226. ISBN 978-3-540-44636-1. オリジナルの27 April 2016時点におけるアーカイブ。. https://books.google.com/books?id=kU7Lqqowp54C&pg=PA226 
  101. ^ Fatehi, Sualeh. “SchemaCrawler”. SourceForge. 2009年9月3日時点のオリジナルよりアーカイブ。2025年10月31日閲覧。
  102. ^ ISO/IEC 11179-1:2004 Information technology – Metadata registries (MDR) – Part 1: Framework”. Iso.org (2009年3月18日). 2012年1月17日時点のオリジナルよりアーカイブ。2011年12月23日閲覧。
  103. ^ ISO/IEC 11179-3:2013 Information technology-Metadata registries – Part 3: Registry metamodel and basic attributes”. iso.org (2014年). 2017年7月5日時点のオリジナルよりアーカイブ。2015年8月23日閲覧。
  104. ^ Dublin Core Metadata Element Set, Version 1.1”. Dublincore.org. 2013年8月16日時点のオリジナルよりアーカイブ。2013年8月17日閲覧。
  105. ^ DCMI Specifications”. Dublincore.org (2009年12月14日). 2013年8月17日時点のオリジナルよりアーカイブ。2013年8月17日閲覧。
  106. ^ The Dublin Core Metadata Element Set”. ietf.org (2007年). 2013年8月4日時点のオリジナルよりアーカイブ。2013年8月17日閲覧。
  107. ^ ISO 15836:2009 – Information and documentation – The Dublin Core metadata element set”. Iso.org (2009年2月18日). 2014年3月27日時点のオリジナルよりアーカイブ。2013年8月17日閲覧。
  108. ^ NISO Standards – National Information Standards Organization”. Niso.org (2007年5月22日). 2011年11月16日時点のオリジナルよりアーカイブ。2013年8月17日閲覧。
  109. ^ Data Catalog Vocabulary (DCAT) – Version 2”. w3.org (2020年2月4日). 2020年11月8日時点のオリジナルよりアーカイブ。2020年11月23日閲覧。
  110. ^ What's the Next Big Thing on the Web? It May Be a Small, Simple Thing – Microformats”. Knowledge@Wharton. Wharton School of the University of Pennsylvania (2005年7月27日). 2013年8月6日時点のオリジナルよりアーカイブ。2012年8月19日閲覧。