# 10.(2008年)今後実施すべきことと連携協力(図書館総合展)【詳細】 **2008****年図書館総合展での発表内容** 平成20年11月25日 関西館 中山 ## 目次 ```table-of-contents title: minLevel: 0 maxLevel: 0 includeLinks: true ``` ## 1. 挨拶 国立国会図書館の関西館 主任司書の中山です。デジタルアーカイブシステムを担当しています。 引き続いて、様々な機関や個人が提供するデジタルコンテンツを「見える化」して、統合的に利用できるようにすること、と 組織としても、公文書館、博物館・美術館、図書館等のいわゆるMLAが館種を超えた連携により、国全体のデジタルコレクションを構築していくための取り組みについて、「夢」を含めてお話しさせていただきます。 この図書館総合展のセッションには、専門家としての情報の組織化、レファレンスを重視している方が多く参加されていると思います。 私自身は、いわゆる図書館屋ではありません。そこで、別の観点から、一般ユーザ、情報処理技術者の視点で、今後実施すべきことをお話しさせていただきます。 ## 2. 本日お話しすること 今日のお話しは、次のような内容を用意しています。 何をすべきか、どのようにシステムを構築するか、どのようにしてコレクションを構築するか、をお話しし、最後に、5年程度の将来に向けた方向性として、想定していることをまとめたいと思います。 - 何をすべきか - _データベースの見える化_ - _情報を集合知化_ - _情報の組織化_ - _利用者の組織化_ - _情報と利用者の関連付け_ - _情報探索方法の変化_ - どのようにシステムを構築するか - _当館システム構築の考え方_ - _デジタルアーカイブシステム構築に向けた連携協力_ - どのようにしてデジタルコレクションを構築するか - _政府の施策(2008年)_ - _公共図書館との連携_ - _学術機関との連携_ - _商用サイトとの連携_ - _出版社、著作権者との連携_ - _MLA__連携_ - _日中韓連携_ - _WDL__との連携_ - まとめ - 最後に、5年程度の将来に向けた方向性として、想定していることをまとめたいと思います。 ## 3. 現状の再認識 - まずは、現状の再確認です。 - インターネット上では、指数的に、デジタル情報が増大しています。 - 従来のように組織、マスメディアからの発信に加えて、個人からの多くの情報が発信されています。 - 情報の質に関しても、個人からの情報も、専門家の情報に負けないくらい質の高いものも多く見られます。 - 現在のユーザの、インターネットでの情報探索の行動の目的は、まさに問題・課題の解決であり、目録などで、情報がどこにあるのかを確認するのが目的ではありません。 - 多くのユーザは、インターネットで問題解決をしており、Googleなどの検索エンジンで見えない情報はないも同然と言われています。 - また、有用な情報は、民間、個人のデータベース、ブログなどに多く存在します。 - それらのインターネット上の情報は膨大で、すべてを1つの組織で、収集・保存し、提供することは不可能です。 - また、膨大な情報を、体系的に整理 (紙資料の書誌に相当するメタデータ付与等の組織化)することは、専門家の人海戦術では、到底追いつきません。 - 個人が持つ情報の集合知は、専門家をしのぎ、質的にも劣らない可能性があります。 - インターネット上の個人の知が集まれば、専門家が用意できる量に比べて格段多く、また質的にも劣らないものになる可能性があります。 - 膨大な情報を検索できる時代に、従来の図書館的な考え方で、単独の図書館が所蔵資料の検索から入るようなサービスを提供していては、一般のユーザからは利用されなくなります。 ## 4. 実施すべきこと - これは、 (0時代の次を見据えて) このような現状を踏まえて、何をすべきかを図示したものです。 - 個々のデータベースのなかに隠れている情報を「見える化」すること。 - それらを集合知化すること。 - 情報と情報の関連付けをすること。 - 人と人の関連付けをすること。 - さらに、情報と人の関連付けをすること。 - その上で、情報の選択の絞込みや、範囲の拡大、利用者属性に応じた情報閲覧環境を提供していくことです。 ## 5. 実施すべきことと、必要な機能の関連 実施すべきことを、具体的に実現するために必要な機能を、考えていきます。これらの機能をどのようにして開発していくかについて、連携のところでお話しさせていただきます。 ### 5.1. データベース内の情報の「見える化」(可視化) - まずは、データベース内の情報の「見える化」です。 - 一般のユーザの情報探索行動として、検索の入り口は、まずは検索エンジンです。検索エンジンで見えない情報はないも同然です。データベースを公開していても、検索エンジンでは、データベースの中までは検索できません。 - また、検索エンジンで見つかった無数のデータベースを、個別に確認していくことは困難です。 - 個々に公開されているデータベースを、「見える化」すれば、検索エンジンや他のシステムからデータベースの中まで検索できるようになります。 - データベースの中まで検索できるようになると、情報量は、また飛躍的に増加します。 - ユーザの個々の検索ニーズに答えるためには、ニーズに応じて特化した多様な入り口(ポータル)が必要です。 ### 5.2. 情報を全体で集合知化 次に情報の集約に関してです。 - 組織を超えて知識を集約すること、として - 現在、図書館、公文書館、博物館などのそれぞれの機関は、多くの書物を所蔵していますが、明確な基準に沿って、分担保存されていません。 - 例えば、GoogleやPORTAで「源氏物語」を検索して見ると、様々な機関、個人が情報を発信しています。1つの機関だけを検索しても、全体から見ると一部に過ぎません。 - 個々の機関が網羅的なコレクションを構築しようとしても、原本を交換し合うのは不可能です。しかし、デジタルコンテンツなら、組織を超えて、必要なコレクションを持ち合うことが可能です。 - 専門家の知識を集約すること、として - 図書館、文書館等の専門組織の強みは、司書、学芸員などの職員が持つ知識です。その知識は、多岐に亘っていますが、それぞれが持つ知識は、単独では網羅的ではありません。これらの知識を集合して使えるようにすることが大切です。 - その方法として、古くから、ナレッジデータベースの構築が叫ばれています。 - 当館では公共図書館を中心とした司書による「レファレンス協同データベース」を運用し、また「ナレッジデータベース」の構築と提供も目指しているが、これらに参加する専門家が多くなればなるほど、利用価値の高いものになります。 - 専門家によるWikipediaのようなものを作ってもいいのではないでしょうか? - 個人の知識を活用すること、として - CGM(Consumer Generated Media)の活用 - ここ2~3年で、組織や専門家だけでなく、一般ユーザが直接生成する情報は、膨大になってきました。それらは、個々には断片であっても、集合すると有用な情報になっています。 - はてな、Yahoo知恵袋、教えてgooなどでは、専門家のレファレンス情報を凌ぐ情報提供も多々あります。Wikipediaを辞書や解題として利用して、問題解決できる場合も多いと思います。 - また、ユーザの利用行動の情報、コメントも、集約するとそれ自身も他のユーザにとって、有用な情報源となります。 - _多数の意見、類似嗜好の人の行動を情報として提供することにより、利用者の行動の参考となるようにする。_ ### 5.3. 集合知の永久保存 - 永久保存のために実施すべきことの1つとして - _組織、専門家、個人が生成しインターネットで公開した情報は、どれも現在のユーザにとって、重要なものです。_ - _それらは、いつの時代も歴史的文献として古い資料を閲覧利用するのと同じで、将来のユーザにとっても重要なものです。そのために、将来に亘って利用できる形で保存しておくことが必要です。_ - _インターネット上の情報は消え行くものです。各サイトから消えるまえにアーカイブ機関が保存できるようにする必要があります。_ - _各サイトで利用できるうちはアーカイブからコンテンツを公開できなくても、消える前に保存する必要があります。_ - 現在の媒体、ファイルフォーマットは、そのままでは、将来、読めなくなります。紙で残すのが一番いいという意見も聞かれますが、動画、音声を含んでいたり、動的に生成されるコンテンツは紙では保存できません。→国際標準、業界標準を策定した団体、その仕様に基づいて製造したベンダの協力のもと、マイグレーション、エミュレーションができるようにすることが必要です。 - _インターネット上の情報は、すべてを1つの組織で保存することは不可能です。_ - _複数のアーカイブ組織で分担して保存できるようにする必要があります。_ - _各アーカイブ組織が、自らの組織のタスクに応じて、必要なコンテンツを交換し合って保存できるようにしていく必要があります。_ - _永久保存の観点からのディザスタリカバリ対策の面からも有効なことです。_ ### 5.4. 情報の組織化、 - 情報の組織化として、 - 情報が膨大になるほど、情報の選択が必要になります。最近は、コンテンツの内容をキーワードで全文検索することで十分、という声もありますが、それでは本当に必要な情報が見逃される可能性も多くあります。 - そのために情報に対する情報として、ある程度のメタデータが付与されることが有効です。メタデータは一義的には、コンテンツの作成者が付与するのが望ましいと考えます。 - CGM(Consumer Generated Media) という概念がありますが、 - 現在、blog、wiki、SNSのような CMS (Contents Management System)を利用した環境で生成されたコンテンツは、ユーザが意識しなくても、システムにより、自動的に、ある程度のメタデータが付与されます。 - また、htmlで書かれた文書に、システムにより、マイクロフォーマットのような形で、システムが判断できる意味ある情報をもたらすことも可能になってきています。 - また、フォークソノミーの1つとしてのソーシャルタギングとして、はてなブックマーク等のようにユーザが有用と思うページをソーシャルブックマークして、ユーザ自身の分類のためにタグを付与します。 - 統制語彙のようにあらかじめ定められた言葉でものごとを分類するのではなく、各人が任意のタグ(自然語)を追加するものです。ユーザが自ら情報群を作ることです。 - より精度の高い検索を可能にするためには、情報に対して、 タイトル、著者、作成日はもとより、多角的な検索のための各種分類を付与することが必要です。 - 自動組織化(自動メタデータ付与) - それには、人手を介さないで、コンテンツの文書構造、文脈、画像や音声の特徴を、システム的に自動で認識し、メタデータを生成する、自動メタデータ付与の仕組みが必要です。 - 現在利用されている例としては、はてなブックマークでは、ブックマークすると、自動的にカテゴリ分類とキーワードが候補として提示されています。 - 現在、また、今後も、様々な機関で研究開発や製品開発が進んでいくと思われます。 - 情報と情報の関連付け、として - 情報にある程度、メタデータが付与されれば、著作の内容、属性での類似性などで、グルーピング (いわゆるクラスタリング)して情報群を形成できます。 - あとで図示する、FRBR、書誌ファミリーの概念での組織化も一つの方法です。 - FRBRや書誌ファミリーの概念で、同一著作、原作から様々な媒体や形式に派生した著作物を書誌事項で体系的に把握することも有効です。 - CGMの活用例として、 ソーシャルタギングなどにおいて、統制語が使われていけば、より確実な分類になって、ユーザの情報だけででも、精度の高いグルーピングが可能になっていきます。 - セマンティックウェブ技術の活用←分かりやすく解説 - 個々の情報に対して、ある程度、統制されたメタデータが付与されれば、情報の関連性も把握しやすくなり、また、オントロジーなどの仕組みにより、異なる文化で生成された情報のグルーピングが進みます。 ### 5.5. 利用者情報の組織化 - 図書館では、従来、利用者情報、利用情報は、情報検索、閲覧には利用してきませんでした。 - しかし、ユーザの利用傾向がわかれば、ユーザの趣味、嗜好などを推定でき、同じ検索手段でも、あらかじめ、提示する情報の機械的な絞込みが可能になります。 - 決して、実在する特定個人のプロフィールや、行動を監視するのが、目的ではありません。 - その意味では、実在する個人として登録されないと使えない申し込み機能と、情報探索のためのユーザ管理は別物として運用されることが好ましいかもしれません。 - また、推定に当たっては、ユーザには、公的、私的で別の嗜好を持つことも考慮する必要があります。 - 例えば、情報処理の仕事をしているが、草花が好きという人がいます。どちらも自分自身ですが、それを一人の興味・嗜好と認識すると、誤った推薦をしてしまいます。 - ユーザの特別な行動は排除されなければ、的確な情報の提示ができません。(人から頼まれて調べた。。。) - 人と人の関係付け、として、 - ユーザ個人の利用情報だけなく、複数のユーザ同士の利用傾向の類似性が把握できれば、他のユーザの利用傾向を、あたかも自らの利用傾向として認識でき、人と人のコミュニティが形成できます。そのコミュニティ内の誰かの行動は、自分の情報探索の行動にも参考になるものです。 - ユーザ同士の類似性で、が作られ、そのコミュニティに参加することにより、より大きなユーザ群としての利用行動として認識できるようになります。 - これは、ユーザ群が情報群を作ることです。 ### 5.6. 情報と人の関係付け - 情報と人との関係付けとして、 - どういうユーザ群が、どういう情報群を利用したかという形で、ユーザ群と情報群が関係付けられれば情報の選択がより一層容易になって、 、 インターネット上の情報が膨大になっても、的確に情報に辿り着けるようにすることができます。また、ユーザ群から情報群の中にある情報を見つけ出すことにより、通常では見つけられなかったような情報も見えてきます。このような形で、ロングテールにもつながります。 - これは、協調フィルタリング(Collaborative Filtering, CF)の考え方です。 - 多くのユーザの嗜好情報を蓄積し、あるユーザと嗜好の類似した他のユーザの情報を用いて自動的に推論を行う方法論である。協調フィルタリングはリコメンデーション(推薦)やパーソナライゼーションに利用されている。実際にcomの「おすすめの商品」や、はてなアンテナの「おとなりアンテナ」などに応用されており、Web 2.0においてロングテールを支える要素技術として捉えることができる。(Wikipediaより) - ユーザが利用者の視点で分類する情報群は、 - 図書館、公文書館、博物館、美術館とかの所蔵館や館種の区分ではありません。 - また、一次、二次、参考情報といった区分でもありません。 - ユーザ群ごとに情報が検索しやすくなっていることが重要です。 ### 5.7. 情報検索手段(利用方法)の変革 このような状況において、情報の検索・閲覧環境として必要なサービスを想定します。 - **情報の関連を活用した検索(情報の選択範囲の拡大・絞込み)** - 全文検索だけでは、的確に絞り込めません。また、検索語など、適切な検索条件を、入力することは困難です。 - 連想検索、あいまい検索、さらに多角的な絞込み検索のために、ファセット検索、クラスタリング検索が効果的です。 - 異業種、異文化圏の情報の検索として - オントロジー等の技術を活用した検索語の翻訳、検索結果の自動翻訳などの技術も期待しています。 - 組織を越えた統合検索と、関連する情報への芋づる的なナビゲーションができれば、 - 組織を越えた大きな集合知の中から、多角的に絞込み、関連しそうな情報を提示することが可能になります。 - **利用者属性、利用情報を活用した検索および閲覧(利用者属性・利用環境に応じた情報閲覧)** - いわゆるパーソナライズ機能として、 - ユーザの属性、行動履歴を参考に - 利用場所、利用機器に応じて、最適なコンテンツを自動選択する仕組みを作ることができます。 - 同一原本から、様々な媒体、形式に派生したコンテンツを、利用場所・利用機器により閲覧可能なコンテンツを選別し、 - 利用場所:図書館内、移動中、自宅等 - 利用機器:PC、携帯電話、PDA等 - 最適なコンテンツ形態のものを利用できるようになります。 - 今や、インターネットはPCだけで見るものではありません。携帯電話や携帯端末での利用が増加しています。 - 携帯電話で近代デジタルライブラリーのようなイメージ画像を見ることは困難ですが、青空文庫なら容易に読めます。また、朗読の音声データがあれば満員電車の中でも聴けます。 - 協調フィルタリングの考え方に基づいて - 他人の利用情報により推奨する検索が有効です。 ### 5.8. まとめ - 情報の利用の仕方も、技術の進展とともに変化しています。 - ニーズとしての利用の仕方の調査研究も必要で、新たなニーズが見えてくれば、それに対応して、技術シーズも生まれてきます。 ## 6. PORTAにおける「見える化」のイメージ NDL-DAのシステム構築の考え方については、割愛。 ### 6.1. NDL-DA、PORTAシステムの構築の考え方 _以上のようなニーズを満足するため、当館のサービス構築、システム開発では、次のような考え方で実装を推進していきます。_ - _サービス構築_ - _基本的には作らない。OSSの組合せ、サービスのマッシュアップ。_ - _技術シーズ、利用者ニーズに速やかに対応するためには、研究開発成果のタイムリーな実装が必要。_ - _研究開発成果や、先進機能を使ってタイムリーにバージョンアップされていくOSSを組み合わせていくことが有効。(図書館用の商用パッケージでは、タイムリーに対応できない。)_ - _システムはWeb上にあるサービスを組み合わせて、マッシュアップで構築することが効率的。_ - _各機関のサービスを活用しあうサービス連携を想定。_ - _今後は、Webサービス連携から、コンピュータ資源やサービスを共有しあうクラウドコンピュータの世界への適応_ - _デジタルアーカイブ機能_ - _対等な関係での分散デジタルアーカイブを指向_ - _当館は国のデジタルアーカイブを構成するデータプロバイダの1つ。日本中のデジタルコンテンツを1つの機関ですべて収集・保存することは不可能。_ - _分散デジタルアーカイブが連携して、1つの巨大なデジタルアーカイブとして利用できるようにすることを目指す_ - _メタデータ交換の統合検索連携は第一歩。次に、コンテンツの相互交換による連携。_ - _次期システムでのコンテンツを交換し合う方法として、セキュアなPeerToPeer(P2P)ネットワークでの連携も想定_ - _ポータル機能_ - _一般の利用者にとって、データベースの所在を探すのも含めて、実質的な入り口は、GoogleやYahooのような検索サイト。_ - _Google__、Yahoo等の表層ウェブを中心にした検索エンジンと、検索エンジンからはアクセスが困難な深層ウェブとのワンストップ検索サービスの融合が必要。_ - _目的とするコンテンツを直接検索・閲覧できるサービスが求められている。たらいまわし的なナビゲーションは好まれない。_ - _利用者層、直接統合検索できるコンテンツのカバレージなど、目的を明確にして、ユーザニーズに対応したポータル機能が必要。_ - _現状のPORTAは?_ - _当館が所蔵する資料をデジタル化したコンテンツに加えて、インターネット上から収集したコンテンツと、各機関が構築し提供しているコンテンツを検索できるようにしたデータプロバイダです。_ - _PORTA__の統合検索は、統合検索先のメタデータを検索用データとしてハーベストして保持するリポジトリ機能と、検索要求の都度横断検索することにより実現しています。_ - _データプロバイダとして、検索機能をWebサービスのAPIの形で、他のサービスプロバイダーに提供します。_ - _PORTA__が持つGUI機能は、このAPIを利用して提供しているもので、デジタルコンテンツをアクセスするための入り口の一つです。デジタルアーカイブがWeb上で「見える化」されるのを加速させ、各機関のデジタルコンテ_ ### 6.2. 情報の組織化の1つ。FRBRの概念での組織化による検索・閲覧サービスの実現(1m) これは参考です。情報の組織化の1つとして、書誌的体系に基づいた分類のモデルの1つです。 一つの著作物は、デジタル化されたコンテンツも含めると、この体現形の例示にありますように、様々な形態のコンテンツとして派生して流通しています。 体系的に分類されていると 利用者属性(知識レベル、嗜好等)、利用環境(PC、モバイル、アクセス場所等)を考慮して、コンテンツを的確に選択できるようにすることができます。 また、選択されたコンテンツを実際に入手する際には、個別資料として管理されている資料の中から、最も入手しやすいところで所蔵しているコンテンツを選択できるようにすることが容易になります。 ### 6.3. コンテンツ交換の方法の1つ(PeerToPeer)対等な関係でのデジタルアーカイブの構築 これも参考です。コンテンツ交換の方法の1つとして、組織が対等な関係でデジタルアーカイブを構築するイメージです。 **メ**タデータだけでなく、コンテンツ、さらに、コンピュータ資源も共有しあう仕組みが可能になり、コンテンツや、メタデータを、必要に応じて交換しあうことができるようになります。 当館は保存のためにコンテンツを保有し、また、各組織はそれぞれの利用者ニーズに応じて、必要なコンテンツを保有して、提供する形が見えてきます。 ## 7. デジタルアーカイブシステムの構築に向けた主な連携協力 「デジタルアーカイブシステムを構築」していくためには、これらの機関の協力なしには成しえません。 ### 7.1. 産学官の研究機関との連携 産学官の研究機関の成果をベースに構築していきたいと考えています。 - 進め方、としては - 国際標準、業界標準の積極的な適用 - 政府機関、民間を問わず、国内外の研究機関、研究者等と連携して調査研究 - 各機関の研究成果を組み合わせて機能を実現 - まずは、海外ではIIPC、国内では研究開発を行っている JST 、NII、NICT、AIST、IPA等の政府機関、大学の研究室等との連携 - 有用な検索サービスを実施している商用ポータル機関(Google、Yahoo等)との連携 - 産官学の研究開発プロジェクトの成果の活用を基本的な方針としています。 - デジタルアーカイブシステム及びPORTAの構築において、技術的な課題があり、パッケージやOSSが存在しない技術に関して、政府機関、大学等の研究開発成果の技術移転を期待してします。 - 縮減された予算の中でも機能強化を可能とする方策の一つ。 - 主な研究開発プロジェクトとして、総務省の「文明開化プロジェクト」、経済産業省の「情報大航海プロジェクト」、文部科学省の「情報爆発」などがあります。 - 文明開化プロジェクト(総務省:21~23年度) - 概要 - 「ICT 成長力強化プラン」に基づき、国立国会図書館、国立公文書館、他府省庁、地方公共団体、図書館・博物館・美術館、大学等との連携を図り、産学官を挙げてデジタル化を推進、日本中の知的財産を総デジタル化してつなぐ「デジタル文明開化プロジェクト」を実施する(重点計画2008(案)(6月11日)IT戦略本部) - デジタルアーカイブ構築のために必要な技術開発 - 複数のデジタルアーカイブの統合に関する技術 - 分散型・大規模デジタルアーカイブの長期保管・利用に関する技術 - デジタルアーカイブの多目的な利活用に関する技術 - 状況 - 総務省での予算要求のために、技術開発が必要な分野、テーマ候補の提示、説明資料等の作成に協力 - 大航海プロジェクト(経済産業省) - 経済産業省情報政策課に対して、今年度の「共同活用基盤を用いた実証実験」及び、来年度以降の「大規模図書館が将来的に活用可能なモデルサービス等の実証実験」として検討していただきたい研究開発テーマの一覧を提示。具体的なアクションにまでなっていませんが、12月12日に、デジタルアーカイブWGが開催される予定です。 - 情報爆発 IT 基盤(文部科学省) - 「情報爆発IT基盤」に対して、直接具体的な申入れはしていないが、このプロジェクトの個別研究開発テーマの研究者(木俵先生、黒橋先生)とはコンタクトを取っている。 - 民間の技術開発、製品開発 - 図書館パッケージベンダー (図書館が利用する冊子体OPACからデジタルコンテンツの目録提供システムへ) - 共通仕様・技術提供 - 日本規格協会 (メタデータ交換、サービス連携のための、通信プロトコル、メタデータ記述要素・記述規則) - 電子情報技術産業協会(JEITA) (製品開発者として、各種デジタルフォーマットの適用、長期的な利用を保証するためのエミュレーション、マイグレーション技術の提供、現在、オーディオアーカイブに関して仕様検討会が開催され、NDLはオブザーバ参加) ### 7.2. (連携協力)国際インターネット保存コンソーシアム(IIPC)との連携 - 概要 - 国際インターネット保存コンソーシアム (International Internet Preservation Consortium ) 、略称IIPCは、Webアーカイビングに関する相互運用が可能なツールや技術の開発・標準化を推進し、国際的な利用を促進することを目的として結成された機関です - 現在、各国の国立図書館や公文書館など38の機関が参加 - 当館は、今年4月に加盟しました。 - IIPC を通じて国際的に貢献することはもちろん、相互運用可能なツールや技術を国内に還元することで、日本のウェブアーカイブの進展にも貢献できると思っています。 - ワーキンググループとして、「スタンダード、ハーベスティング、アクセス、プリザベーション」の4つがありますが、当館は、現在、アクセスのWGに参加しています。 来年度以降、プリザベーションのWGへの参加も検討しています。 - ワーキング - スタンダード - 短期的にはWARCの標準化、将来的にはメタデータ、評価基準の標準化等の標準化 - ハーベスティング - Heritrixの開発、WARCフォーマットの開発とサポート、クローラに特化した要望、深層ウェブの収集、ビデオやストリーミングの収集 - アクセス - アクセスツール(Wayback machine,WERA)改善、NutchWAXを使った全文検索のテスト、ユーザ認証、ユーザ権限、アクセスコントロール、アーカイブのコンテンツ解析のためのツール、アーカイブの構造解析のためのツール - プリザベーション - デジタル情報の保存をめぐる技術的課題への取り組み、ストレージの拡張性に関する研究、WARCフォーマットの保存機能の向上、ウェブをめぐる技術環境の変化の記録、再現できなくなりつつあるファイルフォーマットの特定 ### 7.3. 国のデジタルコレクションの構築に向けた主な連携協力 これは、国のコレクションを構築するための連携協力先のリストです。予定も含んでいますが、様々な機関と連携協力のための調整を行っています。 この中から2、3、簡単に説明します。 - 内閣官房。美術館、博物館、文書館、図書館連携(MLA連携) 。学術情報機関。公共図書館。出版者等。民間デジタルアーカイブ。歴史的音盤アーカイブ協議会。商用ポータルサイト。政府情報などがあります。 - _内閣官房_ - _知的財産戦略本部 (知財計画2008で示された、NDLのデジタルアーカイブ化、図書館資料の利用の促進、著作物のフェアユース規定の日本版、、、)_ - _IT__戦略本部 (e-Japan重点計画I・重点計画2008?)_ - _美術館、博物館、文書館、図書館連携(MLA連携) (関係機関のサイトへのアクセス、来館利用が促進される形での連携・協力、デジタル情報資源ラウンドテーブルを設置予定)_ - _国立公文書館 、東京国立博物館 、各美術館、博物館、公文書館、図書館_ - _学術情報機関 (学術情報、科学技術情報の統合検索、コンテンツの長期保存、学位論文の保存と提供、NDLと大学図書館との連絡会議の下に学位論文電子化の諸問題に関するWGを設置して検討してきた)_ - _NII__、JST 、大学図書館 、電子ジャーナル出版者_ - _公共図書館(各図書館での郷土資料のデジタル化とアーカイブ構築を支援、公共図書館の総合目録ネットワークの便利さをデジタルの世界でも実現)_ - _都道府県立図書館 政令指定都市立図書館 、市町村立図書館 、専門図書館_ - _出版者等 (電子書籍作成支援、電子出版用に出版者へ提供、各出版者へのナビゲーション、出版者等のビジネスが拡大できる形での連携・協力)_ - _日本電子出版協会(JEPA) 、日本印刷技術協会(JAGAT) 、冊子体書籍出版 、電子書籍出版者 、インターネット書籍販売者_ - _電子書籍ポータルjpの統合検索(12月初旬公開予定)_ - _PORTA__から、jp Webサービス を利用して、hon.jpの電子書籍メタデータDBを統合検索する。冊子体資料として存在しない、「ケータイコミック」、「ケータイ小説」も検索可能となる。PORTAは、関連情報リンクで、既に商用サービスとの連携を実現しているが、統合検索先としての連携はこれが初めてのケースとなる。_ - _日経BP社の日経BPビズボードの統合検索(11月17日意見交換)_ - _日経BPビズボードで提供している雑誌記事、WebニュースをPORTAで統合検索。_ - _雑誌記事のメタデータはDCベース、プロトコルは、OAI-PMH。(実装に時間を要するようであればファイル転送も可)。WebニュースはRSS。_ - _歴史的音盤アーカイブ協議会(HiRAC) (SPレコード3万タイトル6万曲、その他記録音盤、音源フォーマット、メタデータ仕様、デジタル化分担、統合検索、歴史的音盤を将来に亘って聞くことができるように)_ - _商用ポータルサイト (実質的なインターネットの入り口、色々考えられる)_ - _Google__、Yahoo等 (デジタル化、深層ウェブの可視化、サービス連携、商用ポータルが保有する情報の利用、検索システム構築の技術トランスファー) 、ソーシャルブックマークサイト_ - _政府情報_ - _総務省行政管理局(e-GOV) (政府サイト情報の統合検索、収集保存)_ - _各府省支部図書館 (政府情報のデジタル化、長期保存、デジタルコンテンツの統合検索)_ - _国立印刷局 (政府刊行物のデジタルフォーマットとしてXMLベースの原本作成)_ - _国際協力_ - _World Digital Library_ _(歴史的文化遺産を世界中の国立図書館が協同でデジタル化して提供するもの、NDLは日本として、東アジアの一員として参画し、世界規模でのデジタルライブラリが構築されることを目指す)_ - _LC_ _LCが発行するガイドラインや施策は、今後の図書館を考える上で、とても参考になる。毎年、情報交換を行っている。_ - _IIPC_ _(ウェブアーカイブに関して、標準、収集、提供、長期保存の観点から、研究開発、NDLも4月より参加、構築中のデジタルアーカイブシステムでの適用と成果のフィードバックを目指す)_ - _日中韓連携 (漢字文化圏の三国が協力してデジタルアーカイブを構築して、コンテンツの長期保存と提供を目指す。昨年度協力の合意をして、現在各国の現状をまとめている。まずはパイロットシステムを構築して、メタデータ交換、横断検索を試行する予定)_ ### 7.4. 政府の施策(2008年度) - まずは、政府機関の施策との関連です。 - 今年度は、国のデジタルアーカイブ事業に直接関連する政府の施策として、このようなものがあります 。 - 一つ目として 、「e-Japan重点計画特命委員会 自民党デジタルアーカイブ小委員会」が、平成20年3月12日に公表した「デジタルアーカイブの推進に向けた申入れ」。です。 - 主な内容として、 - 平成16年6月の「国立デジタルアーカイブ構想」の提言に沿って、わが国のデジタルアーカイブの総合ポータルとなるPORTAが開設された。 - 国立国会図書館のウェブアーカイブの本格実施のための法制度の実現 - 全国図書館のデジタルアーカイブの統合化 - 全国の図書館が統合的なデジタルアーカイブの構築。 - 図書館間でのデジタル化された収集資料の相互利用、館内公衆端末での閲覧が可能となる著作権制度の創設。 - 著作権データベースの活用等著作権者が不明な場合の文化庁裁定制度の円滑な利用のための制度改善。 - 国立公文書館と国立国会図書館が協力 - 相互の役割の違いを尊重して、利用者の利便性の向上を図る観点から、連携・協力 - 全国の公文書館、図書館でのデジタルアーカイブ構築について、メタデータ付与等に係る技術面、ノウハウ面における支援、協力を行う。 - 国のデジタルアーカイブの総合ポータルの検索機能の充実等により、各分野でのデジタルアーカイブの利用の拡大を図る。 - 世界最先端のデジタルアーカイブ技術への対応 - など、提言として政府に申し入れられました。 - 次に、内閣官房 知財本部 (知的財産戦略本部)が6月18日に発表した「知財計画2008」です。 - 「当館のデジタルアーカイブ化と図書館資料の利用を進める」ということで、 - 当館において行われている 貴重な図書等のデジタル化や、インターネット情報資源等を収集保存し、ネット上で一般ユーザーの利用に供する取組'について、その促進が図られるよう一層の連携を進める。と、うたわれています。 - このため、'権利者の経済的利益や出版ビジネスとの関係を考慮''しつつ、国立国会図書館における蔵書のデジタル化の推進に必要な法的措置を2008年度中に講ずるとともに、国立国会図書館と他の図書館等との連携や図書館等利用者への資料提供の在り方については、関係者間の協議を促進し、2008年度中に一定の結論を得る。(113/157ページ) - 次に、同じく内閣官房のIT戦略本部が8月20日に発表した'重点計画2008の中では、 - 総務省の「ICT 成長力強化プラン」の中で記述されている、「デジタル文明開化プロジェクト」の推進(総務省及び関係省庁) があります。 - 国立国会図書館、国立公文書館、他府省庁、地方公共団体、図書館・博物館・美術館、大学等との連携を図り、産学官を挙げてデジタル化を推進、日本中の知的財産を総デジタル化してつなぐ「デジタル文明開化プロジェクト」を実施する。とされています。 - 具体的な内容の一つとして、地域公共図書館支援を想定しています。 - 「ICT 成長力強化プラン」の実施が盛り込まれた形で、「経済財政改革の基本方針」(いわゆる骨太方針2008)として、6月27日に決定されました。 - これに基づいて、各省庁において、来年度予算要求が行われています。 ### 7.5. 公共図書館支援のイメージ - これは、連携協力の例の1つとして、公共図書館支援のイメージです。 - 公共図書館が、地域情報ハブとして、郷土資料をデジタル化したり、県域の情報を収集して提供する役割を支援するものです。 - _公共図書館が、県内有用サイトの収集もしくは横断検索することを支援_ - _公共図書館が、郷土資料をデジタル化することを支援_ - _公共図書館が、収集コンテンツ及びデジタル化コンテンツのデジタルアーカイブを構築し、提供することを支援(必要に応じて当館が利用しているデジタルデポジットシステム等を貸与する)_ - _デジタルアーカイブを構築し運用することが困難な図書館に対しては、当館がASP的なサービスを行う。_ - _NDL__は、各公共図書館のデジタルアーカイブを長期保存もしくはバックアップのために収集保存する。_ - _NDL__は、各公共図書館のデジタルアーカイブのメタデータをハーベストもしくは横断検索して、利用者に対して、全国公共図書館が持つ郷土資料を統合的に検索し、各図書館サイトへナビゲートするポータル機能を提供する。_ - _また、NDLは、標準として適用すべき仕様のガイドラインや手引き類を提示し、実装を支援します。_ - _デジタル化及びシステム構築用の手引きの提供_ - _「デジタル化の手引き」(公開中)_ - _「デジタルアーカイブ構築の手引き」(計画中)_ - _「共通仕様及び連携に関するガイドライン」(公開中)_ - _「外部提供インタフェース仕様書」(公開中)_ - _「メタデータスキーマガイドライン」、「メタデータ記述規則」(策定中)_ - _各機関での地域情報収集用及びアーカイブ構築用の汎用ソフトウェアの提供も想定しています。_ - PORTAでの連携協力先の拡大がなかなか進まなかった要因として、左の枠のように、各機関の対応が困難だったことがあげられます。 - 資料を、デジタル化する費用がない - 自前で、サーバを立ち上げられない。運用できない - 意義は理解したが、標準プロトコルを実装できない - ウェブページに貼り付けて、データベースとして検索できる形になっていない - データベース化されていても、外部提供インタフェースを持っていない - 外部提供インタフェースを実装する費用がない - メタデータのマッピング調整に膨大な時間(工数・費用)がかかる - DCをベースにした記述要素を使っていても、使い方がそれぞれまちまち - 同じ要素を使っていても、記述規則が異なり、同じ内容として認識できない - さらに、統合検索できることのメリットが理解されていないということもあります。 - アクセスが増えることが不安 - サービスが横取りされるのでは? - これらを解決することが、関係機関の拡大につながると考えています。 ### 7.6. 関係機関拡大策の例公共図書館支援のスキーム - 支援のスキームとして、 - 当館は、デジタルアーカイブシステムをオープンソースとして開発し、 - そのシステムをベースに、 研究開発により、公共図書館用のソフトウェアを作成。 - そのソフトウェアを各図書館が実装するために、国は、何らかの資金援助を行い、 - 同時に、当館は、構築のためのガイドラインを提示して支援するものです。 - これにより、各図書館の郷土資料が、デジタル化して公開され、それが、インターネットで発見されるようになって、資料の利活用が進み、さらに、サイトや来館での利用者が増えることを期待しています。 ### 7.7. 学術機関との連携協力 - これは、大学機関リポジトリと、当館が遡及デジタル化するコンテンツを含めて、学位論文のネットワークを形成するイメージです。 - 学位論文のネットワーク形成 - 当館、大学図書館、国立情報学研究所の連絡会において、「学位論文電子化の諸問題に関するWG」が設置され、この内容に従って、国の学位論文のデジタル化とネットワーク化の実施に向けて、活動をしていきます。 平成20年3月27日に中間報告を公表しました。 - 三者による協調の下、デジタル化を推進するため、学位論文を、大学機関リポジトリに搭載し、リポジトリ、国立情報学研究所、当館などのシステムで、相互にメタデータを交換するためのメタデータプロファイルを検討しています。各機関は、このプロファイルにしたがい、リポジトリに搭載する学位論文の標準メタデータを作成します。 - 学位論文等の検索システムとメタデータの関係として、機関リポジトリでの学位論文メタデータプロファイルと、当館が所蔵する紙媒体の学位論文、当館が遡及デジタル化する学位論文のメタデータの関係を整理しています。 - 電子ジャーナルとの相互連携も視野に検討 - 大学において共通のメタデータプロファイルを策定中 - NDLにおいて、紙媒体、及び、紙から遡及デジタル化した資料のメタデータ案(DC-NDLベース)を策定中 - 三者で整合をとり、クロスウォークを可能にすることにより、一元的なアクセスが可能になると考えています。 - 国立情報学研究所(NII)のCiNii、JuNii+との統合検索(平成21年4月頃公開予定) - _CiNii__、JuNiiのメタデータのハーベストは、両システムが改修中のため、新システム稼動後に実施することで内諾を得ている。_ - _CiNii__に関しては、OpenURLによる横断検索の準備は完了したが、CiNiiへの負荷が懸念されるため、メタデータをハーベストすることとした。_ - _JuNii+__に関しては、OAI-PMHでのハーベストの準備は完了。_ - 科学技術振興機構(JST)のJ-Stage、Jurnal@rchiveとの統合検索の準備を行っています。(12月頃公開予定) - _J-Stage__、Jurnal@rchiveに関しては、メタデータをファイル転送で受領することとして、準備は完了。現在、JSTから学会に対して、PORTAへのメタデータ提供及びPORTAから商用サイトを含めた機関への提供の許諾確認を行っている。_ ### 7.8. 商用サイトとの連携協力 - 商用サイトとの連携協力として、まず、電子書籍ポータルjpの統合検索の公開準備を進めています。12月に公開予定です。 - PORTA から、jp のWebサービスAPI を利用して、 hon.jp の電子書籍データベースを統合検索するものです。冊子体資料として存在しない、「ケータイコミック」、「ケータイ小説」も検索可能となります。 - PORTA では、関連情報リンクで、既に商用サービスとの連携を実現していますが、統合検索先としての連携はこれが初めてのケースとなります。 - また、日経BP社との連携の検討も行っています。 (11月17日意見交換) - 日経BPビズボードで提供している雑誌記事、Webニュースを、PORTAで統合検索できるようにするものです。現在、意見交換を進めており、比較的早く実現できる可能性があります。 - 雑誌記事のメタデータはDCベース、プロトコルは、OAI-PMH。(実装に時間を要するようであればファイル転送も可)。WebニュースはRSS。 ### 7.9. Google,Yahoo等との連携の可能性 - 商用ポータルは、実質的なインターネット情報の入り口であり、利用者の利便性向上、サービスの役割分担の上からも、重要な連携先の1つです。_特定商用ポータルとの排他的な連携ではなく、等距離での_ 連携の実現を目指して、意見交換を行っています。 - 現在インターネットで提供されている各機関の表層ウェブ、データベースなどの深層ウェブ、それに加えて過去のウェブで公開されていた表層ウェブをあわせて検索できるようになれば、網羅的な検索利用が可能になります。 - _Google_ - _Google__との連携として、GoogleBookSearchの検索結果から、PORTA(近代デジタルライブラリー、貴重書データベース等)、及び、総合目録ネットワークへのナビゲーション_ - _蔵書のデジタル化、検索用テキスト化の可能性に関して、意見交換を行いました。(7月)_ - _Google__社ストラテジックパートナーディベロップメントマネージャと意見交換。。現在、日本Google社より、米国Google社に実施可能性について打診中。_ - _今後、Googleが保有するデジタル化技術、検索技術等の技術移転の可能性についても意見交換することとしています。_ - _Yahoo_ - _また、Yahooとの連携として、Yahooカテゴリの分類ルール、登録されたURLを、有用なサイト・ページとして、PORTAからのナビゲーション先として検索、_ - _また、ウェブアーカイブでの有用なコンテンツの収集起点としての活用させていただくこと、_ - _Yahoo__での検索キーワードを辞書として利用させていただく等、Yahoo検索事業部と意見交換(8月_) ### 7.10. 出版社、著作者等との連携協力 - 出版者、著作権者との連携協力ということで、 - 資料の長期保存と利用の促進のために - 現在、協議会を設置して、デジタル化とコンテンツ提供に関して、制度面での課題解決に向けた協議を進めています。 - 合意が形成されたのち、実施に向けた具体的な検討を進めます。 - まず、当館は出版物のデジタルコンテンツを長期保存します。 - デジタルコンテンツの収集 - マルチユースコンテンツの原本、印刷用原本等、DRMのないもの - 可能な限り詳細なメタデータの提供 - 資料のデジタル化 - 出版物を当館がデジタル化することの許諾 - 当館からのコンテンツ提供 - インターネット提供が許諾できない場合は、公共図書館内もしくは館内での閲覧提供まで - 出版者のビジネス支援として、 - 各出版者の電子書籍作成支援、データベースの立上げ支援、各出版者サイトへのナビゲーションなどを想定しています。 - 各出版者の電子書籍作成支援 - 当館がデジタル化したコンテンツを電子出版用に提供 - 各出版者の電子書籍データベースの立上げ支援 - 当館デジタルアーカイブを利用して、出版者が販売することも検討 - 各出版者サイトへのナビゲーション - 出版者の電子書籍データベースを、PORTAで統合検索 - 電子出版物の購読が促進されるように - PORTAでの統合検索結果に、入手先として出版者へのリンクを表示 - _日本版「Book Rights Registry」実現の可能性_ - _2008__年10月、米国の著者団体と出版社団体は、Google社との和解条件の1つとして、著作権料徴収NPO「Book Rights Registry」の設立を発表した。日本国内でも似たようなシステムの整備を求める声は今後高まってくると思われるが、残念ながら現時点では、類似団体として音楽世界のJASRAC等があるが、雑誌や書籍出版業界にそのようなものはない。日本版「Book RightsRegistry」の実現に向けての制度面/法律面/技術面で問題点等を明確にしていく。_ ### 7.11. MLA連携 - 背景 - 文書館、博物館、図書館においては、大量の歴史的資料を所蔵していますが、デジタル化は十分には進捗していません、 - また、デジタル化形式の標準化や、各組織・機関の作成するデータベース間の連携についても、その利活用において、多くの課題を抱えています。 - 目的 - 各機関の所蔵資料のデジタル化が進んで、利用者が、所在場所を意識せず、必要な資料を探せるように。 - 統合検索結果から各機関のデータベースへ案内できるようにすることにより、各機関のデータベースの利活用が進むように。 - さらに来館して実物を見る利用者が増えるようにする。ことを目指します。 - 主な検討項目は、 - デジタル化における標準・ガイドラインの検討 - 地域におけるデジタルアーカイブ構築支援 - 一元的な閲覧環境の構築 - コンテンツの長期保存 - 状況 - 平成20年3月準備会開催しました。 - 国立公文書館、東京国立博物館、国立情報学研究所、科学技術振興機構、慶応大学、奈良女子大、国立国会図書館 - 横断的アーカイブズ論研究会 - 平成20年度中に、ラウンドテーブルを発足させる予定です。 - 日本国内の博物館、図書館、文書館が、館種を超えたデジタル化による仮想的なコレクションの構築を目指す。 - デジタル化の進展に係る共通の課題について、その解決に向けた協議・検討を行う。 - 連携の現状 - MLAに関連する個別の連携の準備状況として、 - まず、国立美術館との連携があります。 (12月初旬、公開予定) - _5__国立美術館長会議(9月30日)にて、PORTAでの統合検索の承認が得られた。_ - 国立美術館の4つの機関 (東京国立美術館、京都国立近代美術館、国立西洋美術館、国立国際美術館) の総合目録である「所蔵作品総合目録検索システム」をPORTAから統合検索できるようにする予定です。現在、メタデータの交換機能の実装作業中で、12月中の公開を目指しています。 - 次が、人間文化研究機構との連携です。 (未定) - 人間文化研究機構内の5つの研究機関_京都大学地域研究統合情報センター原正一郎教授を通じて、_まだ、意見交換の段階ですが、歴史的資料として、図書館を含めて分散所蔵されている資料が統合的に利用できることが加速されることを期待しています。 (国立歴史民俗博物館、国文学研究資料館、国際日本文化研究センター、総合地球環境学研究所、国立民族学博物館) のデータベースを統合した「資源共有化システム」をPORTAで統合検索するものです。 28 日に意見交換を行う予定です。 - _人間文化研究機構研究資源共有化事業委員会(8月)において、PORTAとの連携について、話し合われ、好意的な反応であり、人間文化研究機構側で調整を行っている。委員会において再度、議論され、原氏、東京大学史料編纂所の石上理事とで打合せを行うことになった。(10月28日、東京にて)_ - OAI-PMHもしくはSRWで、DCベースのメタデータを受領可能と聞いているので、決定後、速やかに統合検索が実現できるものと思われる。 - さらに大学図書館の歴史的資料のコレクションとの統合検索を目指して、各大学と個別に調整を行っています。 - 慶應義塾大学の「慶應義塾図書館稀覯書画像」、「慶應義塾写真データベース」、「慶應義塾図書館デジタルギャラリー」(実施時期未定) - 各データベースは別々に構築されているものであるが、メタデータをハーベストする方法で統合検索が可能とのこと。_現在、慶應義塾大学メディアセンター本部を窓口として、学内調整を行っていただいている。_ - 早稲田大学の「古典籍総合データベース」(実施時期未定) - メタデータをファイル転送していただくことで統合検索可能とのこと。_現在、図書館情報管理課と_メタデータのマッピングの調整を行っている。 - 東京大学の「東京大学総合研究博物館データベース」、「デジタル展示館」等(実施時期未定) - _東京大学大学院情報学環 学環長は、前向きに検討したいとのことで、連絡あり。(10月7日)。_ - _東京大学大学院情報学環 学環長に正式な依頼文書を送付済み(11月)_ - 今後、参加の仕方、プロセスを説明するとともに、具体的な検討を開始する。 - 奈良女子大学附属図書館(奈良女子大学所蔵資料電子画像集)(10月27日公開) - 奈良女子大学の歴史や、奈良女子大学の所蔵する貴重資料のほか、社寺等が所蔵する奈良地域に関連する貴重資料 - 茨城県立図書館デジタルライブラリー(11月4日公開) - 茨城県の貴重な郷土資料 - 神戸大学付属図書館(11月25日公開予定) - 「神戸大学経済経営研究所によって作成された明治末から昭和45年までの新聞切抜資料を、デジタル化したアーカイブ」 - 筑波大学付属図書館(12月末公開予定) - マッピングの調整終了(11月20日)。現在、実装作業中。 ### 7.12. 歴史的音盤アーカイブの構築支援 - 歴史的音盤アーカイブとは、SPレコードなどに記録された音源の保存と利活用を目指すものです。 - 歴史的音盤アーカイブ推進協議会(HiRAC)が、設置され、当館もオブザーバ参加しています。 - 趣意としては、 - 文化的遺産であるSPレコード原盤が散逸・劣化し始めており、 - これをデジタル化して保存し、広く国民に公開することによって、日本の文化と音楽産業界の発展に寄与するものです。 - 対象としては - SP レコード:3万タイトル(6万曲)、その他、商業用レコード以外の記録物をデジタル化して提供できるようにすることを目指しています。 - HiRACメンバー - 日本放送協会、日本音楽著作権協会(JASRAC)、日本芸能実演家団体協議会、日本伝統文化振興財団、映像産業振興機構、日本レコード協会 - _考えられる協力_ - _方針_ - _HiRAC__へのオブザーバ参加_ - _HiRAC__による音盤デジタル化の支援_ - _デジタル化音源の当館への納本_ - _NDL__デジタルアーカイブからの公開 (館内、公共図書館、インターネット(?))_ - _オーディオアーカイブの標準規格の策定作業(JEITA)への参画_ - _アーカイブ及び公開用システムの構築_ - _デジタル化、統合検索等に関する研究開発の実装_ - _著作権管理機能の研究成果の実装_ ### 7.13. 日中韓の国立図書館との連携 - 10 月 (23~24日)には、日中韓の三国交流を開催し、デジタルアーカイブの構築と提供に関する協力として、メタデータ基準、統合的な情報サービス、長期保存に関して、意見交換しました。 - 交換用メタデータ仕様、交換用プロトコルに関しては、各国で大きな差はなく、統合検索サービスは、早ければ、来年中 (5月)に実現できる可能性があります。 - また、今後の情報交換として、収集・組織化・保存及び提供機能に関する研究開発成果の情報に加えて、デジタルアーカイブに関しての制度化に関する各国の状況も情報交換することになりました。 - メタデータ基準 - 保存のためのメタデータの形式は、各国の基準を尊重する。 - ・メタデータ交換は、DCベースとする。 - ・語彙等の違いは、オントロジー等による吸収を検討する - 統合的な情報サービス - コンテンツは3館で分散して持ち、統合検索できるようにする - 機械翻訳は研究開発の状況をウオッチ - 統合検索のプロトコルは、ハーベスト系(OAI-PMH、RSS)、横断検索系(SRU/SOAP、OpenSearch、OpenURL、50)のどの方法も3国とも可能 - 3国共通のポータルを立ち上げるのではなく、各国のポータルで見せていく - 早ければ、来年の5月に統合検索が実現 - まずは、歴史的資料から統合検索 - 長期保存 - DRセンターは、まず各国内で立ち上げ、その後、3国でのDRセンターの立上げを検討する。 その際は、CDNLAOでのシンガポールの提案のように国際的なDRの方向性で検討する。 - OAISはフレームワークであり、実装は各国の開発状況により異なる - 情報パッケージの仕様は、3国とも手探り状態。まだ共通化する段階にない。 - まだ、コンテンツの交換の候補を提示する段階にない - 情報交換 - 収集・組織化・保存及び提供機能に関する研究開発成果に関する情報 - デジタルアーカイブに関しての制度化に関する各国状況 ### 7.14. World Digital Library構想との連携 - World Digital Library は、 - 米国議会図書館(LC)のビリントン館長が2005年6月に打ち出した「世界電子図書館構想」です。 - 2005年6月、ユネスコ米国国内委員会のユネスコ米国国内委員会で - 貴重書など一つしかない歴史的文化遺産を,世界各地の国立図書館等と協同でデジタル化し,公開しようとするものです。 - 当面のアクション - 現在のアクションは、World Digital Libraryのサイトに、各国が、テーマを特定したコンテンツを提供することで、来年、公開される予定です。 - WDL サイトに、各国がテーマを特定したコンテンツを提供 - 画像データ、メタデータ、解題 ## 8. まとめ ### 8.1. まずは、連携による組織を越えた統合検索 まとめとして、まずは、各機関が持っている情報を可視化して、MLA、学術、公共図書館連携、国際連携など、様々な形での連携により、各機関にデータベースが分かれていても、検索できるようにすることです。 当館が唯一の入り口になることを目指したものではなく、様々な連携の入り口から統合的に検索できるようにすることを目指します。 ### 8.2. 次世代は、人と情報が関係付けられたサービスの連携 次は、人と情報が関連付けられて、精緻な検索の絞込みと、ニーズに応じた閲覧ができるサービスを提供することです。 ### 8.3. 5年程度までの方向性(クラウドコンピュータの世界の普及をイメージして) - 過去2~3年の変化。 - Blog_0__でメタデータの配信、RSS2.0やatomでコンテンツの配信まで行われるようになった。_ 、wiki、SNS等で個人の情報が発信されるようになり、ソーシャルブックマーク機能で個人がタギングして情報を分類できるようになりました。 - クラウドコンピュータの世界でのサービスのイメージ(図を作成) - 5 年後には、大きなパラダイムシフトがあると想定されます。その一つとして、クラウドコンピュータの世界があります。 - クラウドコンピュータは、ネットワークコンピューティング、グリッドコンピューティング、SaaS (Software as a Service)、Webサービス等の技術を融合させた、データセンターのようなものです。 - クラウドコンピュータ自身は、コンピュータシステムの概念ですが、システムの共通基盤(インフラ)の上で稼動することになる各サービスは、共通のサービスインタフェースを持つことが必然となっていきます。 - 個別の組織が、単独でコンピュータ資源 (ハードウェア、ソフトウェア)や、情報を抱えて、サービスを提供し、ユーザが、個別のサービスを利用するような形ではありません。 - クラウドコンピュータの普及する時代には、単に情報を共有する世界ではなく、サービスを共有する世界になっていると思われます。 - 0 が2~3年で爆発的に普及したことを考えると、このような時代が、5年後には到来すると思われます。 - 各機関、当館のサービスも、このパラダイムシフトに対応していかなければ、利用されなくなります。 - そういう時代になることを予測して、情報の管理の仕方、サービスのあり方を考えていく必要があります。 - 今後ますます、 情報と情報が情報群、サービスとサービスがサービス群、人と人がユーザ群として有機的に関連付けられていくものと思われます。 - 従来のように検索し、コンテンツを閲覧するような形から、 クラウドコンピュータの世界のリソースを、所在を意識せずに、また、インタフェースの違いを意識せずサービス群として利用していくことになると思われます。 - 0では、パーソナライズ、人と人の関係を活用して情報を選択してきました。また、サービスも先進的な機関が提供するWebサービスを個別に利用してきました。 - 次世代は、それに加えて、情報と情報、サービスとサービスの関係を組み合わせて、ユーザ群と情報群の多対多の関係で、より的確な情報の活用が可能になっていきます。 - このような時代には、所蔵機関、専門家・一般個人の区別なく集合が作られていきます。その中では、当館のサービスは、複数のサービス群、情報群の1つにすぎません。 - 当館は、 - 国の情報資源を後世に残す役割と - 現在のユーザのために、当館を収集・保存した情報資源を含めて、国の情報資源を的確に利用できるようにする役割を持ちます。 - しかし、 - インターネットの世界での情報発信の状況が変革すると、当館が進めているウェブアーカイブ、ポータルのサービスのあり方にも大きく影響します。_(もし対応していかなければ、利用されない孤立したサービスになってしまいます。)_ - 今後のウェブの世界では、情報を提供するというより、サービスを提供する時代に、どのようにして情報を収集していくのかを考える必要があります。サービスの形をそのまま保存することは困難です。 - また、当館のシステム構築においても、それらの仕組みを取り入れていく必要があります。 - _5__年後に当館を入り口としたサービスを想定しても、世の中の情報探索、情報入手の入り口として使われるものになるとは思えない。_ - 膨大な情報資源を保有する当館が、これらの変化に対応して、情報の保存と利活用の両面で、先導的な役割を果たすべきと考えますが、当館の資源(人・物・金)だけで対応することは不可能です。 当館におけるシステム構築、デジタルコレクション構築の双方ともに、関係機関の協力なしでは対応できません。 - _(当館がすべての情報アクセスの入り口になることはない)_ - _(有用な情報は必ずしも図書館に集約されない。図書館員が作れる有用な解題情報、レファレンス情報はほんのわずか。一般の人の集合知は、少数の専門家の知識に勝る。図書館を中心に考えた世界では利用者ニーズに応えられない)_ - デジタルアーカイブシステムや統合検索システムの開発においても、当館からベンダーへの開発請負業務で行っていたり、図書館に閉じた世界でのパッケージ導入では、先導的な役割は果たせず、広く一般の利用者のニーズに応えたサービスは提供できません。 - システム開発においては、研究開発、技術開発の成果を活用させていただくことが重要で、それらを組み合わせて適用することが、効率的でありかつ効果的です。_(統合検索のAPIから、サービス連携のAPIによる連携を目指す)_ - また、コレクション構築においても、当館が収集・保存できるデジタルコンテンツは、国の情報資源のごく一部です。 - 公共図書館、大学図書館を含めて、MLAの各機関、民間、政府、さらに個人が持つ有用な情報を「見える化」して、 クラウドコンピュータの上で、各機関の持つ分散データベース、分散サービスが統合して、1つの巨大なデジタルアーカイブサービスとして利用できるようにしていかなければなりません。 - そのためには、まず、関係機関のサービスが相互に補完して、一つのサービスとして利用し合えるようにしていくことが重要で、それの実現に向けて、連携協力を進めていきたいと考えています。 ## 9. デジタルアーカイブの今後の構築計画(想定) - これは、デジタルアーカイブの今後の構築計画です。 - 世界レベルでの電子図書館構築の構想の一翼を担うことを目指して、まずは、日本としてのデジタルコレクションを構築していきたいと思います。 - 関係機関の協力のもとで、人と情報が有機的に関係付けられて利用できるシステムを構築する。 - 当館としてのコレクションを構築する。 - 関係機関と協力して、国のデジタルコレクションの構築を目指す - それを、関係機関と分担して、国のコレクションとして後世に残していく - 以上を、この線表のようなスケジュール感で進めていきたいと考えています。 ## 10. おわりに 当館は、デジタル化されていく情報を、日本の文化遺産として後世に残し、新たな知識を創出するための知識として、現在及び将来に亘って活用できるようにする役割をもっています。 この役割を果たすためには、技術の進展やニーズの変化に対応して、ユーザへの新たな形態のサービスを提供していかなければなりません。 このような取り組みに関して、今後とも、ご協力をお願いします。 以上で、ご説明を終わらせていただきます。 ご清聴ありがとうございました。