2017年11月18日
そもそも、スキーマって何?
2017/10/10にJPCOARスキーマが正式に公開されました。
こちらを参考
junii2スキーマと互換性を持たせる、としつつ、ダブリンコアなどを意識し、かなり詳細な記述の書き込みが可能な形式になったのですが、その分、リポジトリ担当者の負担もしばらくは大きくなりそうな気配です。まあ、落ち着いたらそうでもなくなると思います。現在の、「リポジトリって何?」な環境から、今後リポジトリの価値を高めるためにも、国際環境を意識したスキーマは必要になると思います。
で、そもそもなのですが、「スキーマ」って何?という疑問をお持ちの方もおられると思います。
用語的にはこちら(IT用語辞典 e-Words)などを参考にしていただければと思いますが、いろいろ端折って平たく言うと、今回の場合は「リポジトリ版書誌規則」です。もうちょっと正確に言うとXML版書誌規則です。
基本的に、リポジトリはXMLという形式でデータを持っています。これは、インターネット間で情報をやりとりするのに便利な形式で、XML自体はさまざまなところで使われています。
XMLの記述ですが、例えば、
<タイトル>源氏物語</タイトル>
<著者>紫式部</著者>
というように<>と</>で囲まれた形式で構成され、開始の<>は「ここからが〜ですよ」と開始を
宣言する部分。終わりの</>は「ここで終了ですよ」と明確な区切りを意味します。そして<>と</>で囲まれた中身がデータとなります。この<>と</>を「タグ」と呼びます。ブログとかでHTMLに触れている方にはお馴染みですね。
この場合、「タイトル」は「源氏物語」で、「著者」は「紫式部」です。という意味を持たせていますが、このタグ、実はXMLでは自由に設定することができます。
タイトルのところでも、<本の名前>にしてもいいですし、平仮名にしてもいいです。言語にも制限がなく、<Title>と英語にしても、ドイツ語にしても、韓国語にしても、中国語にしても、ロシア語にしても、アラビア語にしてもいいわけです。つまり、なんでも自由に使えるため、データをやり取りしたり、保管したりするのにも便利なコンピュータ言語なのです。
そのXMLを読み取って、どう処理するかはシステム側の問題です。データベースとしてどのように格納するか、またはOPACやリポジトリなどのWeb上にどのように表示するか、それらはすべてシステム側の役目になります。そこで問題になるのが、この自由さです。
例えば、リポジトリの論文名の欄に論文のタイトルを表示するのに、システムではXMLの「タイトル」というタグを探し出し、読み取って表示するとします。でも、必ずしもタイトルが「タイトル」というタグで設定されているとは限りません。「論文名」「Title」「論文の名前」「論文タイトル」など、XMLではまちまちに設定することが可能です。で、これらをシステムで処理することはできるでしょうか?不可能です。ある程度はいけても、限界があります。きっと、100件200件と処理していたら、人間だって「表記を統一してくれ」と思うに違いありません。システムは、もっと応用が利きません。そこで、統一したルールを作りましょう、というのが、スキーマです。目録の書誌規則も同じような背景ですよね。なので、初めに「リポジトリの書誌規則」と表現しました。
別に自分の館一つで完結しているなら、リポジトリのスキーマも不要なのですが、相互利用を推し進めるためにはやはり統一された形式が必要です。A館のリポジトリのデータがB館では使えない、というのでは、相互利用はなかなか進みません。そしてそのためには、データ提供側も協力する必要があります。その結果、世界から日本のリポジトリに注目が集まり、個々のリポジトリが世界から利用されるようになる。そういういい循環が作れるようになったらいいなと思います。大変な部分はありますが、前向きにとらえていただければと思います。
こちらを参考
junii2スキーマと互換性を持たせる、としつつ、ダブリンコアなどを意識し、かなり詳細な記述の書き込みが可能な形式になったのですが、その分、リポジトリ担当者の負担もしばらくは大きくなりそうな気配です。まあ、落ち着いたらそうでもなくなると思います。現在の、「リポジトリって何?」な環境から、今後リポジトリの価値を高めるためにも、国際環境を意識したスキーマは必要になると思います。
で、そもそもなのですが、「スキーマ」って何?という疑問をお持ちの方もおられると思います。
用語的にはこちら(IT用語辞典 e-Words)などを参考にしていただければと思いますが、いろいろ端折って平たく言うと、今回の場合は「リポジトリ版書誌規則」です。もうちょっと正確に言うとXML版書誌規則です。
基本的に、リポジトリはXMLという形式でデータを持っています。これは、インターネット間で情報をやりとりするのに便利な形式で、XML自体はさまざまなところで使われています。
XMLの記述ですが、例えば、
<タイトル>源氏物語</タイトル>
<著者>紫式部</著者>
というように<>と</>で囲まれた形式で構成され、開始の<>は「ここからが〜ですよ」と開始を
宣言する部分。終わりの</>は「ここで終了ですよ」と明確な区切りを意味します。そして<>と</>で囲まれた中身がデータとなります。この<>と</>を「タグ」と呼びます。ブログとかでHTMLに触れている方にはお馴染みですね。
この場合、「タイトル」は「源氏物語」で、「著者」は「紫式部」です。という意味を持たせていますが、このタグ、実はXMLでは自由に設定することができます。
タイトルのところでも、<本の名前>にしてもいいですし、平仮名にしてもいいです。言語にも制限がなく、<Title>と英語にしても、ドイツ語にしても、韓国語にしても、中国語にしても、ロシア語にしても、アラビア語にしてもいいわけです。つまり、なんでも自由に使えるため、データをやり取りしたり、保管したりするのにも便利なコンピュータ言語なのです。
そのXMLを読み取って、どう処理するかはシステム側の問題です。データベースとしてどのように格納するか、またはOPACやリポジトリなどのWeb上にどのように表示するか、それらはすべてシステム側の役目になります。そこで問題になるのが、この自由さです。
例えば、リポジトリの論文名の欄に論文のタイトルを表示するのに、システムではXMLの「タイトル」というタグを探し出し、読み取って表示するとします。でも、必ずしもタイトルが「タイトル」というタグで設定されているとは限りません。「論文名」「Title」「論文の名前」「論文タイトル」など、XMLではまちまちに設定することが可能です。で、これらをシステムで処理することはできるでしょうか?不可能です。ある程度はいけても、限界があります。きっと、100件200件と処理していたら、人間だって「表記を統一してくれ」と思うに違いありません。システムは、もっと応用が利きません。そこで、統一したルールを作りましょう、というのが、スキーマです。目録の書誌規則も同じような背景ですよね。なので、初めに「リポジトリの書誌規則」と表現しました。
別に自分の館一つで完結しているなら、リポジトリのスキーマも不要なのですが、相互利用を推し進めるためにはやはり統一された形式が必要です。A館のリポジトリのデータがB館では使えない、というのでは、相互利用はなかなか進みません。そしてそのためには、データ提供側も協力する必要があります。その結果、世界から日本のリポジトリに注目が集まり、個々のリポジトリが世界から利用されるようになる。そういういい循環が作れるようになったらいいなと思います。大変な部分はありますが、前向きにとらえていただければと思います。
【このカテゴリーの最新記事】
-
no image
-
no image
この記事へのコメント
コメントを書く
この記事へのトラックバックURL
https://fanblogs.jp/tb/6982538
※ブログオーナーが承認したトラックバックのみ表示されます。
この記事へのトラックバック