## 17.(2012年)電子書籍等のディジタルコンテンツの長期保存と、将来にわたっての利用の保証-文化的資産の保存に向けた関係機関との連携協力-
「情報処理学会誌(特集:電子書籍の未来)」(2012年8月情報処理学会)
## 目次
```table-of-contents
title:
minLevel: 0
maxLevel: 0
includeLinks: true
```
## 1. タイトル
電子書籍等のデジタルコンテンツの長期保存と、将来にわたっての利用保証
―文化的資産の保存に向けた関係機関との連携協力―
Long-term Preservation of Digital Contents (eBooks etc.) and Ensuring Access to them in the Future
―Cooperation and Coordination with the Relevant Organizations for Preserving Cultural Heritage
## 2. 要約
国立国会図書館では、電子書籍等のデジタルコンテンツの長期保存と、将来にわたっての利用の保証に取り組んでいる。これを実現するためには、収集、組織化、保存、提供のシステム構築・運用、業務実施のあらゆる局面での関係機関との連携協力が不可欠である。
The National Diet Library is engaged in the long-term preservation of digital contents (eBooks etc.) and ensuring access to them in the future. To achieve these goals, it is essential to cooperate and coordinate with the relevant organizations throughout all phases of acquisition, organization, preservation, establishment and operation of providing system, and service implementation.
## 3. 目指すところ
国立国会図書館(NDL)は、納本図書館として、印刷出版物を網羅的に収集保存し、将来にわたって利用を保証する責務を持っている。しかしながら印刷出版物として発行されないボーンデジタルの電子情報を含めて、その全てを収集することは不可能である。 NDLは、NDL及び他機関が分散して収集・保存している資料・情報を、意味的に関連付け、一元的に検索・ナビゲートできるようにする。また、情報を文化的資産として、将来にわたって利活用できるようにすることを目指している。
## 4. 使命・経緯
### 4.1. 経緯
NDLは、1994年頃から電子図書館構築に向けた活動を行ってきている。1995年にはパイロット電子図書館プロジェクトでの実証実験を実施し、2002年、電子図書館サービスの拠点として中心的な機能を持つ関西館が開館し、電子図書館事業を開始した。2004年には、「電子図書館中期計画2004」を策定し、デジタルアーカイブの構築、レファレンス情報等に到達するための仕組みの充実、さらに、所蔵場所に依らず一元的にアクセスできるポータルの構築に取り組んできた。
「電子図書館中期計画2004」が策定されてからの電子情報に対する取組みは、国の高度情報通信ネットワーク社会推進本部(IT戦略本部)が策定したe-Japan戦略等の取組としても掲げられ、関係府省の協力のもと、デジタルアーカイブ構築事業として進めてきた。その実現形が、2012年1月にリニューアルオープンした国立国会図書館サービスシステムの基本的な形であり、印刷刊行物等の物理的な資料の収集整理と閲覧提供を管理する業務基盤システム、電子情報を統合的に収集保存するデジタルアーカイブシステム(DAシステム)、NDLおよび他の機関が保有する印刷刊行物、電子情報等を一元的に検索・ナビゲートする国立国会図書館サーチ(NDLサーチ)等で構成する。[[17.(2012年)電子書籍等のディジタルコンテンツの長期保存と、将来にわたっての利用の保証-文化的資産の保存に向けた関係機関との連携協力-]]
### 4.2. NDLの使命と目標
NDLでは、2012年7月末に、今後5年程度の活動の基本となる使命として「私たちの使命・目標2012-2016」を策定し、文化的資産としての収集・保存、迅速かつ的確なアクセス環境・手段の整備、国内外の関係機関と連携して、知識・文化の基盤を一層豊かにすること、さらに、東日本大震災に関しては、出版物に限らず全ての記録を後世に残すことを、柱になる目標として掲げた。
### 5. 関係機関との連携の観点
様々な資料・情報を文化的資産として保存し、利活用を促進するためには、収集、組織化、保存、提供のシステム構築・運用、業務実施のあらゆる局面での関係機関との連携協力が不可欠である。連携協力の実施に当たっては、姿勢として合意形成に留まらず、具体的なアクションとして、実施していくことが重要である。
## 6. 収集の観点
### 6.1. 「インターネット資料」の許諾に基づく収集
ウェブサイトでは日々刻々と新しい情報が発信され、同時に消されていく。時に、機関・組織の改廃・合併により、サイトそのものが消失する。消されていく情報には、後世に残すべき文化的資産も多く含まれ、印刷出版物の形態を取っていないものもある。NDLでは、2002年から、各機関の協力のもと、個別の許諾に基づいて、ウェブサイトを収集し、時間軸で再現できるように保存している。
### 6.2. 公的機関の「インターネット資料」の制度的収集
2009年7月に国立国会図書館法と著作権法が改正され、国、地方公共団体、国立大学等の公的機関が発信するインターネット資料について、個別著作権者の許諾なく収集できるようになった。 この法改正に基づき、NDLは、2010年4月から、公的機関のウェブサイトの網羅的な収集を開始した。公的機関の協力により、順調に収集が行われている。なお、国公立大学の機関リポジトリ等は、早期に消失されることなく保存・提供が保証されているとみなされるので、当面は制度的収集対象とはせず、国立国会図書館サーチで、資料の所在場所にナビゲートして、閲覧利用を保証している。
### 6.3. 民間の「オンライン資料」の制度的収集
電子書籍、電子雑誌など従来の図書、雑誌に相当しネットワーク上を流通する電子情報を「オンライン資料」と定義している。2012年6月に、国立国会図書館法と著作権法が改正され、オンライン資料の収集が許諾なしにできるようになった。この法律は、2013年7月に施行される。しかしながら、有償で提供されているオンライン資料に関しては、条件の整備等、時間を要するため、当分の間、無償で提供され、閲覧制限機能が実装されていないものを収集することとし、2013年7月からの収集に向けて、運用の準備を行っている。これにより、無償の電子書籍、電子雑誌は、ネットワーク上から消えていっても、将来にわたって利用が可能になる。
## 7. 保存の観点
### 7.1. 所蔵資料のデジタル化
NDLが収集保存している印刷出版物は、経年劣化が進むとともに、閲覧・複写提供により劣化が加速される。原本保存のために、2009年に著作権法が改正され、著作権者の許諾を得ないで所蔵資料をデジタル化することが認められた。 NDLでは、約150億円で、和図書約90万冊(1968年以前刊行分)、和雑誌約114万冊(2000年受入分まで)、博士論文約14万冊(1991年度~2000年度受入分)等、所蔵資料の1/4程度をデジタル化したが、引き続きデジタル化を進めていく必要がある。しかしながら、今後も継続的にデジタル化を行うための予算確保には課題がある。
### 7.2. 文化的資産の保存
NDLが収集したパッケージ系電子出版物、インターネット資料、もしくはデジタル化した電子情報も、国の知識・文化の基盤となる資料・情報であり、データを失うことはあってはならない。
電子書庫としてのストレージは、東日本大震災アーカイブのためのものも含めると、 現在においても2PB(ペタバイト)の容量となる。今後、更に増加する電子情報の利用を保証するためには、大きく2つの観点がある。一つは、物理的に読めなくならないように保存(物理保存)すること、もう一つは、ファイルの内容が読めなくならないように保存(論理保存)することに留意する必要がある。
物理保存について、現時点において半永久的に保存できる記録媒体は実用化されていないので、膨大なデータを物理的に読めるようにしていく仕組みの確立が課題である。現在、 GlusterFSというシステムの適用を試行している。これは、寿命が5~10年で数TB(テラバイト)程度の容量の磁気ディスクを備えたPCを並列に配置した拡張容易な大容量分散ファイルシステムで、順次容量の大きな磁気ディスクに置き換えることで、少しずつ媒体変換を進め、かつ、必要な容量を確保できる仕組みである。また、このシステムにより、大規模災害に備えたディザスタ・リカバリー対策として、複数の分散したセンターで同期する仕組みの実装も想定している。近い将来には、クラウドサービスを活用し、複数の民間クラウドサービスを組み合わせて、相互に同期させることで災害時も含めたデータの保存を図ることも想定する。
論理保存については、ITの発展とともに、様々な国際標準、業界標準のフォーマット仕様を適用した電子情報が存在するが、将来にわたって読めるようにすることは大きな課題である。
この問題は、保存の使命を持つNDLだけでは解決が不可能である。新しい媒体、フォーマット仕様を開発してきた技術者・研究者の方々、国際標準・業界標準を策定してきた機関、その仕様を適用したアプリケーションやコンテンツを開発、販売してきた企業などの協力が不可欠である。様々な関係者に対して、現在の利用者のみならず、文化的資産として後世においても利用できるようにするために、仕様の共通化、マイグレーション等への協力を働き掛けていきたい。
## 8. 組織化の観点
### 8.1. 組織化の意義
組織化とは、利用者が迅速、的確かつ容易に検索できるように、メタデータ(書誌データを含む)を付与して整理することである。
一つの著作物が、単行本として出版され、のちに文庫本となり、また様々な形態の電子書籍として、派生して流通しているが、体系的に整理されたメタデータが付与されていると、利用者属性(知識レベル、嗜好等)、利用環境(PC、モバイル、アクセス場所等)を考慮して、コンテンツを的確に選択できるようにすることが容易になる。
外形的な情報によるメタデータのみならず、本文テキスト等からの組織化も行う技術(例えばセマンティックウェブ技術等)を駆使することにより、利便性の高い検索サービスが実現できる。
### 8.2. 組織化の連携協力
図書・雑誌の出版者、博物館、文書館、図書館等のいわゆるMLA機関、その他著作物を提供する全ての機関が、語彙の違いを吸収できる共通のメタデータ記述規則を適用し、意味的に関連付けられることが重要である。関係機関で協力してメタデータの相互交換の仕組みを構築する必要がある。
また、爆発的に増加する電子情報には、従来の印刷刊行物のように人海戦術的な精緻なメタデータの付与は困難である。自動的にメタデータを付与する技術、本文情報も含めて組織化する技術等、大量のデータを構造化・意味的情報を取り出す技術(例えばデータマイニング技術等)の研究開発とその成果の実用化が期待されている。
## 9. 電子書籍出版社等との連携
電子書籍は、印刷出版物の延長にあるものであり、文化的資産の1つの形態である。
現在、電子書籍出版は、ビジネスとして立ち上がろうとしている。NDLは、電子書籍によって読者人口が増えて、出版全体の市場が拡大し、出版ビジネスが加速されるように支援するとともに、電子書籍の将来に亘る利用を保証することが役割と考える。そのためにも、民間の市場経済活動を阻害することなく、市場拡大のために、出版界と下記のような様々な連携協力が今後の課題である。
・NDLデジタル化コンテンツの二次利用の促進
・電子書籍サイト等、商用サイトへの案内の強化
・電子書籍ビジネスのプラットフォーム整備
・電子書籍フォーマットの共通化
・電子書籍に対する永続的識別子の付与
・公共図書館での利用環境の共通化
・著作権管理センターの構築・運用の協力
### 9.1. NDLデジタル化コンテンツの二次利用の促進
国のオープンガバナンスの方向性に沿って、NDL保有の資産で、第三者の権利を侵害しないものは、積極的に二次利用を促進させたい。電子書籍出版社に、画像データをとして提供し、二次利用によって、電子書籍を作成してビジネスが行えるように支援することも想定する。
### 9.2. 電子書籍サイト等、商用サイトへの案内の強化
NDLサーチは、紙・デジタル、有償・無償、商用サイト・公的機関等に関わらず、ロングテールで容易に資料の存在を確認することを目的としている。利用者が最も迅速に入手し閲覧可能な入手先へ利用者をナビゲートすることが目的である。NDLは今後利用者の資料の有力な入手手段となる電子書籍サイト等への案内を強化することを想定している。
### 9.3. 電子書籍ビジネスのプラットフォーム整備に協力
NDLが構築しているデジタルアーカイブ機能とポータル機能は、スケーラブルな書籍データベース及び配信サービスシステムであり、検索及び閲覧のAPIを公開している。今後ソフトウェア資産もオープンプラットフォームとして公開することにより、他の公的機関サイト、商用サイトでも適用もしくは連携が容易になる。
### 9.4. 電子書籍フォーマットの共通化
現在の電子書籍フォーマットは多種多様であり、かつ、電子出版サイト毎にビューアが異なる状態である。これは、電子書籍の流通の拡大、NDL等による長期保存の観点からみると障害になっている。電子書籍フォーマットの国際標準、業界標準の策定を支援して、共通フォーマットの普及を促進させたい。
### 9.5. 電子書籍に対する永続的識別子の付与
出版に先立って販売促進のために作られた出版前情報、出版情報は、NDLで蔵書として管理するための書誌情報には活用されておらず、また関連付けもされていない。出版情報はONIXで、書誌情報はMARCで、電子情報はDCベースでというように、書誌的事項の記述規則も共通化されず、再利用もされていないため、検索時に同一のものと認識することも困難な状態になっている。
著者が作品を作成した時点で、永続的識別子を付与し、販売のために作成された出版情報と、図書館での書誌情報をリンクさせる形で相互連携できるようにしていきたい。また、実際に永続的識別子を付与する手段として、JaLCを活用したDOI付与も想定している。
### 9.6. 公共図書館での利用環境の共通化
今後、電子書籍が、公共図書館等でも電子書籍サイトからそれぞれのビューアを利用する形で提供されることが予想される。NDLからの提供は、別の著作権保護方式で別のビューアを利用する形では、利用者にとって利便性が悪い。電子書籍サイトとNDLとで、共通の著作権保護機能とビューアで提供できるように、システムの共通化を図っていくことが、市場の拡大に繋がると考える。今後、NDLでの資料のデジタル化状況、出版社でまだ電子書籍化されていない資料の著作権状況など、出版界とNDLで協力して、著作権管理データベースを構築すべきと考える。
### 9.7. 著作権管理センターの構築・運用の協力
今後、NDLでの資料のデジタル化状況、出版社でまだ電子書籍化されていない資料の著作権状況など、出版界とNDLで協力して、著作権管理データベースを構築すべきと考える。
## 10. 新たな取組
### 10.1. 東日本大震災アーカイブ
東日本大震災アーカイブは、大震災に関連する、災害現象そのもの、災害前・災害直後・復興の過程、災害時の対応、他地域・次世代への教訓等を記録として網羅的に収集し、後世に残すものである。大震災の記録は、従来からの収集対象である印刷刊行物に留まらず、ビラ類、写真、動画、音声はもとより観測記録等、多種多様である。また、記録を保有している機関も様々であり、早期に収集保存に着手しなければ、散逸の恐れがある。記録を保有もしくは集約している関係府省、博物館・美術館、図書館、文書館、企業及び先行して震災アーカイブを構築・運営している組織と協力して、分担収集し一元的なアクセスを保証したい。
大震災アーカイブポータルに関しては、既存のデジタルアーカイブシステムをベースに、分散アーカイブを構築し、また、統合的に利用できるポータルを構築している。また、見せ方も記録の日時、場所も意識した閲覧機能の実装を目指している。
### 10.2. 知の共有化に向けた連携
国の第4期科学技術基本計画で示された「知識インフラ」は、知の共有化を目指す分野を問わないモデルであり、2012年1月にリニューアルしたサービスシステムの延長線上にあるものである。
東日本大震災アーカイブは、コンテンツ、システムともに、分野を特定した「知識インフラ」の実現形であり、既存のサービスをベースに、必要な機能を実装する。このアプローチは、国の施策としての「ビッグデータの利活用」「知の共有化」に繋がる。
## 11. 政府の施策との連携
知的財産推進計画2012 (2012年5月知的財産戦略本部)[[17.(2012年)電子書籍等のディジタルコンテンツの長期保存と、将来にわたっての利用の保証-文化的資産の保存に向けた関係機関との連携協力-]][2]の「戦略2:日本を元気にするコンテンツ総合戦略」では、「電子書籍の本格的な市場形成」及び「コンテンツのアーカイブ化とその活用促進」において、著作物のデジタル化、コンテンツ流通の一層の促進や、アーカイブに関する博物館、図書館及び公文書館の連携の取組、東日本大震災のデジタル・データを一元的に検索・利用できるポータルサイトを構築等、関係府省とNDLが協力して取り組むべき事項の内容とスケジュールが示されている。
「電子行政オープンデータ戦略」(2012年7月IT戦略本部)[[17.(2012年)電子書籍等のディジタルコンテンツの長期保存と、将来にわたっての利用の保証-文化的資産の保存に向けた関係機関との連携協力-]][3]では、オープンガバナンスの方向性として、国民共有財産である公共データを積極的に公開すること、機械判読可能な形式で公開し、営利目的、非営利目的を問わず活用を促進することが示されている。
また、内閣府総合科学技術会議の科学技術イノベーション政策推進専門調査会[[17.(2012年)電子書籍等のディジタルコンテンツの長期保存と、将来にわたっての利用の保証-文化的資産の保存に向けた関係機関との連携協力-]][4]において、第4期科学技術基本計画の重点化課題「新たな産業基盤の創出」の重点的取組として「大規模情報(ビッグデータ)の利活用の基盤技術の開発・標準化・普及促進」が明確化され、ビッグデータの収集・蓄積・分析等の研究開発及び国際標準化を進めるとされている。NDLのデジタルアーカイブ構築、東日本大震災アーカイブポータル構築は、まさにビッグデータを扱うシステムであり、これらの施策での技術開発、実証実験の成果を活用していきたい。
## 12. 関係機関を繋ぐ役割を果たす
NDLは、「私たちの使命・目標2012-2016」を策定し、具体的な実施計画の策定作業を進めている
NDLは、関係機関との連携により、国として資料・情報を収集・組織化し、ビッグデータとして利活用できることを目指していく。
今後、様々な業種・業態で情報を発信者している機関同士、それらの情報を発信している機関と情報の利用者同士、また、膨大な情報を高度に処理・活用するための研究開発・技術開発を行っている組織同士を繋ぐ役割を果たしたいと考えている。
繋ぐに当たっては、 関係機関間の利害調整ではなく、未来志向でより創造性を持って、資料・情報の権利保持者の権利を尊重し、将来的な利活用の拡大を目指して、共存共栄で協力・分担して進めることが大切である。