# 24.(2013年)我が国の知識インフラとしてのナショナル・アーカイブ構想(本文) - [ ] 図を追加予定 #ToDo 平成26年2月4日 電子情報部 ## 目次 ```table-of-contents title: minLevel: 0 maxLevel: 0 includeLinks: true ``` ## 1. ナショナル・アーカイブ構築の意義と目標 情報化の進展とインターネットの普及により、世界的にコンテンツのデジタル化が進展している。我が国で生産されるコンテンツは、質も高く、競争力があるが、それを体系的、統合的に集約し、活用するための枠組みは、必ずしも十分ではない。 例えば、コンテンツの所在が管理されていないために、その所在が不明である、若しくは、コンテンツ自体が消失する事例、コンテンツ自体は存在しても、その権利の所在が管理されていないためにコンテンツが死蔵される事例、又は、コンテンツの所在及びその権利の所在は明らかであっても、権利処理の手続やコスト等の問題により、コンテンツが活用できない事例等が多数生じており、競争力の高いコンテンツを、弾力的に流通させ、活用し、将来にわたり長期的に保存するための総合的枠組みは不十分である。 IT産業、コンテンツ産業において、コンテンツのマス・デジタイゼーションが世界的に進行し、多国籍企業による寡占化が進む中で、我が国の出版物、音楽作品、美術作品等のコンテンツの流出や散逸等を防ぎ、適正かつ継続的な利用と保存を図るためには、コンテンツの生成から収集・保存、配信・流通に至る全体の流れを総合的に集約し、国民的利用と世界に向けた発信を可能とする「ナショナル・アーカイブ」(以下、本文中においては「NA」という。)の早急な構築が求められている。そのためには、産官学民の枠を超えた共通プラットフォーム基盤を作る必要がある。 すでに出版コンテンツの分野では、国立国会図書館や国立情報学研究所による広範なデータベースの形成と横断的な検索、出版界における書誌・管理情報の統合化や図書館等への電子書籍流通モデル構築への取り組み、電子書籍流通基盤整備のための制度改正等を目的とする議員連盟の成立など、近年共通プラットフォーム形成に向かうと見られる動きが顕著であり、それらが整合性をもって、国として統合的に構築・運用されていくことが望ましい。 NAは文字・静止画・動画・音像など各種のコンテンツを含む統合的な概念であるが、以下では、その核となるであろう出版コンテンツを中心に、今後のNA構築のあり方について構想したい。 ## 2. ナショナル・アーカイブの定義と社会的役割 NAとは、「我が国で公表されたコンテンツのメタデータ(所蔵情報を含む)及びコンテンツの権利の所在情報、並びに、電子的に複製可能なものにあっては、コンテンツの複製データを統合的に集約するデータベースを構築・運用し、著作者等及びコンテンツ利用者等の間で、コンテンツの弾力的な利用と継続的な保存のための一定の手続を整備することにより、我が国のコンテンツの国民的利用と世界に向けた発信を可能とするための社会基盤」である。 NAは、とりわけ出版分野においては、電子書籍のビジネスプラットフォーム整備、仕様の共通化、権利情報データベースの整備、図書館等公共施設での電子書籍利用促進、デジタル化資料の利活用等を通じ、我が国の出版文化の発展と国民の利便性を確保するためのエコシステムとして社会的に機能することをめざしている。 ## 3. ナショナル・アーカイブを構成する主要機能 NAは、コンテンツの生成機能、収集・一時保管機能、保存機能、権利情報・管理情報の収集・管理機能、配信・流通機能の5つの機能から構成される(図1)。 コンテンツの創出から収集・保存、配信・流通に至る全体の流れを一元的に集約するため、NA全体のメタデータを集約するデータベース(以下、「中央データベース」という。)においては、多様な主体が多様なデータを扱えるよう、柔軟かつ多層的なデータ構造を実現する。具体的には、著作物・著作者・出版者等の書誌情報、販売データ・販売者・所蔵機関等の所蔵情報、目次・索引・シソーラス等の情報探索情報等の多様なデータを一元的に管理可能な仕組みとする(図2)。 図1. NAの主な機能構成 図2. NA権利情報データ関連図(ER図) ### 3.1. コンテンツの生成機能(図3) 我が国のコンテンツ産業の競争力と文化資源の充実によるソフトパワーを一層高めるため、コンテンツ創作に携わる著作者、出版者等が、余計なコストや手間をかけずに創作活動に専念できる支援機能をNAの中に組み込むと共に、既存の我が国の出版物、音楽作品、美術作品等のデジタル化を推進し、国全体のデジタルコレクションを、質、量ともに充実させることを目指す必要がある。そのためには、主要な資料・コンテンツ所蔵機関が積極的にNAに参加するための条件整備も求められる。 とりわけ出版分野においては、既存の紙媒体の出版物のデジタル化、構造化、テキスト化、バリアフリー化等を支援し、EPUB、DAISY等をはじめとする電子書籍フォーマットの国際標準化を推進する。また、既存の出版物の二次利用が円滑に進むよう、裁定制度等の既存の手続の簡素化、オープンデータ化等に取り組む。 また、コンテンツの制作主体、流通主体、流通経路等が多様化、複雑化する中で、海賊版の流布やデータの拡散を防止し、著作者から始まる権利情報の来歴等を着実に把握する必要性から、コンテンツ制作の上流工程である生成段階において、コンテンツの一意的な識別が可能となるよう、コンテンツのメタデータを、中央データベースに登録し、識別子の発行を行う。いわゆるCIP(Cataloguing In Publication)にとどまらず、コンテンツの生成段階で、LOD(Linked Open Data)、RDF(Resource Description Framework)等を活用する、コンテンツに権利情報を埋め込む、あるいは、クラウドソーシングによりメタデータを付与する等、インターネット等での流通や二次利用を意識した情報の組織化を図ることも視野に入れる。 図3. コンテンツの生成機能 ### 3.2. コンテンツの収集・一時保管機能(図4) 前項の機能により生成されたコンテンツが公表される直前において、コンテンツに識別子及び電子署名を付与し、メタデータ(書誌情報、管理情報及び権利情報)を中央データベースに登録する。 コンテンツは、データを蓄積し、商用利用等の一次利用を担う、個別のデータベース(以下、「個別データベース」という。)に格納され、公表されるが、一定期間内に、コンテンツの複製データを公的に蓄積し、将来にわたる国民的利用を担う、長期保存用のデータベース(以下、「長期保存データベース」という。)にも複製、格納され、(3)の機能により、長期保存が図られる。 また、個別データベースに格納されない非商用等コンテンツについては、長期保存データベースに直接収集、格納される。とりわけ、HTML等で構成される表層Webのコンテンツについては、我が国のインターネット文化の足跡を後世に残すため、.JPドメイン全体を広く体系的に収集・保存することも視野に入れる。 図4. コンテンツの収集・一時保管機能 ### 3.3. 保存機能(図5) - 保存対象 NAの保存対象となるデータとしては、長期保存データベースに格納される「保存用コンテンツ」、商用利用等の一次利用を担う個別データベースに格納される「一時保管コンテンツ」、「書誌・目次・索引情報」、LODのように他の情報との有機的連携に有用な「組織化情報」、コンテンツに係る「権利情報」、保存のために必要な技術情報及び流通管理関係情報が考えられる。 ② システム 保存機能を担うシステムとしては、OAIS参照モデル(Open Archival Information System --reference model; ISO 14721:2003)に準拠したシステムを視野に置く。同モデルが備える機能としては、受入、データ管理、保管、アクセス、保存計画及び運用統括の各機能が想定される。 デジタルコンテンツの複製を物理的に離れた場所に置き、災害に備える「ディザスタ・リカバリ」の仕組みは、「保管」機能の一つと考えられる。 ただし、保存システムについては、多くの技術的課題、たとえば、適切な長期保存環境、長期保存に適した媒体、原本性を保証するマイグレーションやエミュレーションの技術といった課題が未解決のままである。 ③ 運用 a.ダークアーカイブ ダークアーカイブとは、「出版社がコンテンツを提供している間はアーカイブの構築(収集・保存)のみを行い、出版社が何らかの理由でコンテンツを提供できなくなった際に初めて、保存したコンテンツを公開するという方式のアーカイブ」と説明されており、CLOCKSSやPorticoが知られている。世の中に登場したコンテンツが保存されないまま消滅してしまっては元も子もないので、とにかく収集し保存する上で有効な方式だと考えられる。 本構想においては、ダークアーカイブとは言っても、当該コンテンツが市場に流通している限り決して公開しないということではなく、たとえば非公開期間や非公開の方法(施設内閲覧も含め全面非公開/施設内閲覧は可だが複写は禁止など)によっていくつかのバリエーションを設けることができると考える。どのような形態のダークアーカイブとするかは、当該コンテンツに対する利害関係者との合意に基づいて決定されることを想定する。その際、当該権利者等に対しては当該コンテンツの将来的な優先的利用を保証するなどの何らかの便宜供与の方法についても併せて検討する。 b.維持が困難になったデジタルアーカイブの移管 個別に構築・運用されている国内の各種デジタルアーカイブのうち、運用維持が困難になったものについて、アーカイブそのものあるいはアーカイブ内のコンテンツをNAが引き取ることも必要である。そのためには、個別アーカイブをNAが引き取ることを可能とする移管ルールを整備すると共に、移管を技術的に可能とするための標準仕様の整備が必要となる。 c.商用サイトコンテンツを含めた長期保存と提供サービス NAの運用に際しては、民間の商業活動を阻害するのでなく振興に寄与するという視点を持つことが極めて重要である。その意味から、現用の商用サイトとの連携による提供サービス及び長期保存の実現に向けた取組みを行う。 図5. 保存機能(保存計画を含む) ### 3.4. 権利情報・管理情報の収集・管理機能(図6) コンテンツの円滑・適正な利用を促進するため、コンテンツの利用(二次利用)を希望する者が、そのコンテンツの利用に関わる著作権の存否や所在に関する情報を容易に得られるようにする仕組みを構築する。 そのために、著作物に識別子を付与し、管理するシステムを構築・運営する。著作物の識別子を管理するデータベースでは、各著作物の固有情報(名称、著作者等)も管理・提供し、さらに著作権等管理事業者が管理する個別の著作権管理データベースと連携することで、各著作物の著作権管理に関する情報(著作権者、著作権の管理を委託された著作権等管理事業者、使用料等)を参照できるようにする。 その上で、中央データベースに各コンテンツに関わる著作物の識別子を登録し、参照できるようにすることで、コンテンツの利用を希望する者に対して、必要な著作権関係の情報を提供することが可能になる。さらに、著作物の識別子を管理するシステムに著作権等管理事業者による使用料の徴収等を代行する機能を持たせることにより、著作権処理をより簡便に行えるようにすることも考えられる。 図6. 権利情報・管理情報の収集・管理機能 ### 3.5. 配信・流通機能(図7) ファイルフォーマットの異なる電子書籍やデジタルコンテンツを一元的に利用できる共通配信プラットフォームをNA上に構築することで、様々な出版社(又は配信サービス)等が提供する電子書籍・デジタルコンテンツを、国民が広く簡便に利用できる環境を整備することが必要である。 この共通配信プラットフォームは、課金・決済機能を備えることにより、商用プラットフォームとしての役割を果たすものである。一方で、商業サービスだけでなく、図書館における電子書籍等の貸出サービスを実現するためのプラットフォームとして、また、各種図書館(国立国会図書館、公共図書館、大学図書館等)等のデジタル化資料を利用者に提供するためのプラットフォームとしても利用できる公共性を備えた配信プラットフォームである必要がある。さらに、読むことに困難を伴う国民の読書環境を充実させるために、読上げ機能や文字拡大機能などアクセシビリティに配慮するとともに、ユニバーサルデザインを志向したプラットフォームである必要がある。 この共通プラットフォーム上で、ユーザが様々な電子書籍やデジタルコンテンツを一元的に検索し、求めるコンテンツを、必要に応じて購入したり、図書館から借りたり、また、無償コンテンツについては、自由に閲覧することができるような統合検索サービス(ポータルサイト)を構築し提供する。このサービスを使って、ユーザは、スマートフォンやタブレット端末など様々なデバイスに対応したユーザインターフェイスから、これまでにない新しい読書体験、コンテンツの利用体験を得ることができる。 このNA共通配信プラットフォームは、商用プラットフォームとしての役割を果たすことから民間主導で構築されるのが望ましいと考えるが、上記に掲げた公共性を有するものでもあるため、出版文化の振興、図書館振興等の観点から一定の公的支援を検討する必要がある。なお、将来的にはファイルフォーマット、メタデータ等の標準化が図られることが、利用の観点及び電子書籍・デジタルコンテンツの保存・継承の観点から望まれる。 図7. 配信・流通機能(検索・閲覧機能を含む) ## 4. 国立国会図書館及び関係機関の役割と分担 NAの構築は国家的課題として、産官学民を横断した広範な関係機関・関係者の連携・協力体制の下で行うべきものであるが、国立国会図書館もその中で主要な役割を果たす必要がある。 ### 4.1. 関係諸機関の役割 NAにおいて、関係各機関はおおむね次の表に掲げるような役割を担うことが想定される。 表. NAにおける関係機関の役割 |プロパティ|全体|(1)コンテンツの生成機能|(2)コンテンツの収集・一時保管機能|(3)保存機能|(4)権利情報・管理情報の収集・管理機能|(5)配信・流通機能| |---|---|---|---|---|---|---| |[[出版者]]|・新規コンテンツを創出し、業界としてフォーマットの標準化を推進する。|・フォーマットの標準化推進 ・メタデータの登録|||・出版に関わる関連情報の整備|・商用コンテンツの配信| |[[著作権等管理事業者]]|・権利情報等を管理し、使用料の徴収や分配を行う。||||・権利情報管理、使用料分配|| |[[取次]]|・コンテンツの創出を支援し、一時保管機能を担う。|・既存コンテンツのデジタル化等|・個別DBの維持管理|||・商用コンテンツの配信| |[[電子書籍配信事業者]]|・コンテンツの配信プラットフォームを提供し、円滑な流通を支える。||・個別DBの維持管理|||・配信プラットフォームの提供| |[[関連省庁]]|・制度の見直し等により、コンテンツの創出や円滑な利用を促進する。|・手続簡素化|||・円滑・適正な利用の促進|| |[[MLA]]|・既存コンテンツのデジタル化を推進し、分担保存機能を担う。|・既存コンテンツのデジタル化等||・分担保存||| |[[研究開発機関]]|・構築段階におけるシステム開発支援を行う。|・中央DBの構築支援 <br> <br>・デジタル化、テキスト化、構造化||・エミュレーション <br> <br>・マイグレーション|・システム開発支援|・配信プラットフォーム構築支援| |[[Knowledge/History_of_activities/活動記録【論文等】DB/24.(2013年)我が国の知識インフラとしてのナショナル・アーカイブ構想(本文)/無題のデータベース/国立国会図書館]]|・既存コンテンツのデジタル化を推進し、コンテンツの長期保存を担う。|・既存コンテンツのデジタル化等 ・中央DBの構築推進 ・フォーマットの標準化推進 ・識別子体系の整備|・識別子の付与 ・非商用コンテンツの収集|・長期保存|・著作物ID等の登録|・一部非商用コンテンツの配信| ### 4.2. 国立国会図書館の役割 NAの各機能において、国立国会図書館(以下、「NDL」という。)は次の役割を担う。① コンテンツの生成機能 a.NAの中央データベースの構築推進 NA全体のメタデータの集約を担う中央データベースの構築及び運用において、中核的な役割を果たす。具体的には、CIP(Cataloguing In Publication)、クラウドソーシング対応等を含め、電子書籍等のビジネスプラットフォームとして活用するための大幅なシステム機能拡張を行い、コンテンツの生成段階における情報の組織化を目指す。 b.NDL資料の二次利用の推進 NDL資料について、紙の出版物に係る権利処理及び二次利用手続における簡素化と利便性向上を図り、NDL以外の主体によるNDL資料のデジタル化を推進するほか、既存のデジタル化資料についても、同様に、権利処理及び二次利用手続の簡素化及び利便性向上を図る。 c.利用円滑化のための標準化の推進 図書館界・出版界における、出版物のデジタル化、構造化、テキスト化、バリアフリー化等を支援し、EPUB、DAISY等をはじめとする電子書籍フォーマットの国際標準化を推進する。NDLの刊行物及びデジタル化資料についても、当該標準に即し、新しいフォーマットの採用やデータ変換等を実施する。 d.識別子体系の整備 サイト、タイトル、巻号、記事、マイクロコンテンツ、ファイル等、多様な粒度で流通するデジタルコンテンツに対応した識別子体系を整備する。NAの標準的な識別子体系として、どのようなものを採用するのが適切か、例えば、DOI採用の可能性も含めて検討する。なお、識別子体系の整備にあたっては、関係諸機関の協力が不可欠である。 ② コンテンツの収集・一時保管機能 a.識別子及び電子署名の付与 コンテンツに識別子及び電子署名を付与し、中央データベースへの登録を行う。照会に応じ、コンテンツの受入等に係る証明を行う。 b.商用等コンテンツの収集 個別データベースに格納され、公表されたコンテンツの複製データを収集する。具体的には、有償オンライン資料収集実証実験事業を、NAにおける商用等コンテンツの収集の先駆けとして位置付ける。 c.非商用等コンテンツの収集 個別データベースに格納されない非商用等コンテンツについては、平成26年2月にリリース予定のオンライン資料の送信による収集機能を活用し、コンテンツの収集を図る。 d..JPドメインの収集 HTML等で構成される表層Webのコンテンツについて、我が国のインターネット文化の足跡を後世に残すため、.JPドメイン全体を広く体系的に収集・保存することも視野に入れる。 ③ 保存機能 NA全体の保存機能をNDLが単独で引き受けることは現実的ではないが、NDLが所蔵するコンテンツに関しては、OAIS参照モデルが想定するすべての機能を備えておくことがコンテンツ管理の観点から合理的であるが、ディザスタ・リカバリについては、他のNA構成機関との共同により実現することは考えられる。 また、マイグレーションやエミュレーションについては、他の専門機関に委ねる、情報の所在、内容記述、権利情報、入手可能性などについての情報はNA全体のシステムが処理する、逆に当該情報についてはNDLが一元的に管理するといった分担方式も検討する。 ④ 権利情報・管理情報の収集・管理機能 NDLは、中央データベースへの著作物の識別子の登録作業を、出版者等の協力を得て行う。 また、著作物の識別子等を管理するデータベースに対して、著作者情報(人名典拠)、コンテンツに表示されている情報(クリエイティブ・コモンズ・ライセンスの適用等)、NDLが申請した裁定結果の情報等を登録する役割を担う。 ⑤ 配信・流通機能 NDLは、NA配信プラットフォームを通じて、商業ベースで流通しないコンテンツの一部を配信する役割を担う。具体的には、配信プラットフォームを通じて、著作権保護期間が満了した著作物のデジタルデータについては、誰もがインターネットからアクセスできる形で配信し、著作権保護期間内の著作物については、NDLの館内利用者端末に限定して配信する。 なお、配信プラットフォームを利用するに当たっては、当該プラットフォームの運営主体に使用料を支払うことで、一定の経費負担を行う。 また、配信プラットフォームを通じてデジタルコンテンツの配信を行う事業者・機関に対して、標準的な書誌データ(メタデータ)を提供する。 ## 5. 実現に向けた取り組みの方向性 ### 5.1. 今後の取組課題 構想するNAが本来の機能を果たすためには、制度面等における以下の条件整備が不可欠である。そのためには、関係者・関係機関に対して本構想を提示する場を設け、広く意見交換を行いながら、構想への合意形成を図る必要がある。 ① 法規・制度面の整備 NA構築にはNDLや出版社を始めとする官民に渡る多くの関係諸機関の協力・分担が不可欠であり、協力内容や権限に関する取り決め、関係機関間のデータ使用等手続きの簡素化、メタデータ等技術標準化、配信プラットフォームの共通化等についての協議と、こうした協力関係の裏付けとなる法規上の整備が必要である。 長期保存データベースへの複製・格納については、納本制度を参考にして、NAへの「納入」に関する規定を整備し、コンテンツの納入が事実上の著作権登録機能を担うようにする。民間出版社等による出版関連情報の提供に合わせて、NDLを含む公的機関所蔵情報のオープンデータ化は不可欠の要件であり、利用のための適正なルールを設定する必要がある。 また、コンテンツの収集・一時保管・長期保存や図書館送信等の弾力的な利用を推進するためには、コンテンツの複製・公衆送信等について著作権の制限、裁定手続の簡素化等の措置を講じること、NAへの個人情報の提供について法令上の根拠を明確化することなどが考えられる。さらに、NAで保存するコンテンツについて、NDL等国の機関が行う場合は、その二次利用に関しては使用料を求めないことができるような法的規定を設ける必要がある。 複数の著作権管理事業者間でデータ処理上の齟齬が生じた場合の調整機能のありあり方について検討する。 ② 財政面の裏付け NA全体の構築経費及びその後の運営経費について試算を行うと共に、その資金源における官民の役割分担の原則を明確にする必要がある。出版物デジタル化、データの永久保存等基盤整備に係る分野については、公的資金の投入が不可欠と考えられるが、NA全体が発展的に機能するためには、民間流通部門のビジネスモデルを確立する必要がある。 ③ 人的資源の整備 NAのセンター的機能を果たすべき幾つかの機関では、NA全体のマネジメント、研究開発等を担う専門的人材を配置すると共に、参加各機関における担当要員の確保が不可欠である。そのための訓練・養成の仕組みも整備する必要がある。 ④ 標準化等技術的対応 コンテンツのメタデータ識別子の統一化・標準化の方向性を定めると共に、オープンデータへの識別子付与についても検討する。また、コンテンツの長期保存メディアのあり方についても、緊急に取り組むべき課題である。 ⑤ 施設・設備の整備 NAのセンターとしては、必ずしも独立した施設は前提とせず、既存施設の活用も十分考えられるが、センター機能を果たすための組織・施設・設備の整備は不可欠である。また、参加各機関及びNAのサービス提供施設における利用環境整備を図る必要がある。 ### 5.2. 利用促進・啓発普及活動の必要性 NAが本来の機能を果たすためには、関係者はもとより、最終的な利用者である国民各層の理解を得ることが大前提であり、そのための啓発・利用促進活動は、構想当初から取り組む必要がある。関係者が・関係機関がNAに自発的に参加・利用してもらうための啓発と、最終的に国民各層によってNAの諸機能が活用されるための普及事業の二つのフェイズが想定される。 ① 関係者・関係機関の理解・参加を促すための啓発・利用促進事業 NAの仕組みの理解・支援を目的とし、さらに出版関係者等に対しては実際の参加・利用を促進する必要がある。対象は以下のとおり。 - 国会議員、各府省、地方公共団体等 - 著作者・著作者団体・学術団体 - 出版社、編集者等出版関係者 - 出版流通・提供事業者 - 図書館、博物館、文書館等情報文化施設関係者 - 新聞等マスコミ関係者 ② 国民各層向け広報事業 国民全般、ネット世論、読書層・図書館利用者層、海外関係者等へ、それぞれの対象者特性にふさわしい広報手段を用いて、NAの存在と意義についての理解促進を図る。 ③ 利用促進事業 国民各層における利用の促進がNAの最終的な目標であり、NAコンテンツの学校教育教材への採用、図書館等公共施設における利用啓発等の利用促進事業に取り組む必要がある。