The Japan Society of Archives Institutions Kinki District Branch Bulletin
全史料協近畿部会会報デジタル版
No.79
2022.7.30 ONLINE ISSN 2433-3204
全史料協近畿部会第161回例会報告
2022年(令和4)7月1日(金)
会場:京都大学楽友会館2階会議・講演室
テーマ 電子記録の優雅なライフサイクル
:無料公開のソフトウェアによる実現を考える の開催
金原祐樹(徳島県立文書館・全史料協近畿部会事務局)
会場の京都大学楽友会館は、1925(大正14)年の京都大学創立25年を記念して建築された、鉄筋コンクリート2階建ての瀟洒な建物で、2010(平成22)年に改装を終え学術交流の場として利用されている。7月1日とは思えない猛暑の中、テーマとして「電子記録の優雅なライフサイクル」と掲げられたとおり、高価な文書管理のパッケージソフトではなく、全世界に開かれている無料のオープンソースアプリケーションを利用して、電子記録のライフサイクルをいかに実現するのかという各報告への期待感が高まる中、今例会の担当者である橋本陽氏の趣旨説明が始まった。
現在、DX(Digital Transformation)という言葉と共に、日本各地で業務の電子化が叫ばれ進められている。その反面電子化された業務から産み出される大量の電子文書やデータの適切な処理については、関心が低い。現在のまま顧みられることがなければ、証拠性の低い脆弱な電子文書を大量に抱えるのみになってしまう。対して諸外国では、文書・記録の適正な保管方法を定めた標準に準拠してシステムを整備し、それによって、文書を証拠性のある記録として管理するだけでなく、アーカイブズへの移管後の長期保存をも実行する仕組みを実現している。
この例会においては、ライフサイクルの全ての局面において電子記録を適正に保管するための手法を考える。電子記録の定義やそれに関わる標準について言及した上で、抽象的な議論を実際にどのように実践に生かすことができるかを、全て無料公開されている専用のソフトウェア(オープンソースアプリケーション)の紹介を交えながら説明するとされた。
橋本陽氏からの第一報告では、電子記録の特性、記録管理の標準およびその標準に沿って電子文書・記録を作成するツールであるアルフレスコ(Alfresco)の説明があった。
記録の信頼性・真正性(同一性・完全性)・正確性を守るには、文書の作成および維持管理の段階からの対策が必須であり、それは、ISO 15489などの標準によっても規定されている。しかし、実体のある紙の文書であれば判断を付けやすかった記録の信頼性・真正性・正確性は、もともと実体のなく、改ざん等がされやすい電子文書では担保することが難しい。電子文書を作成段階からメタデータにより管理して、その後のアクセスや監査、管理の移動やマイグレーションの状況などをふくめた必要なメタデータを確実に作成していく、そのためのツールのひとつがアメリカで開発された電子文書記録管理システムであるアルフレスコ(Alfresco)である。電子データでは、こうした記録管理の標準に準拠したシステムによって作成・管理されることが、記録の信頼性・真正性・正確性に直結する。
金甫榮氏からの第二報告では、非現用段階となり、アーカイブズに移管された電子記録の長期保存に必要な管理の標準であるOAIS参照モデル(Reference Model for an Open Archival Information System)に準拠してアーカイブズ用に構築されたアーカイブマティカ(Archivematica)を解説していただいた。電子記録は、その記録データ自身を維持するだけでは不十分であり、将来にわたって保存対象となった資料の意味が理解できることが保証されてこそ、実質的な長期保存が実現したといえる。そのためには、記録データ本体の外に、記録がどのようにできているかを示す表現情報、記録が残された背景や環境との関係を示すコンテクスト情報、コンテンツがどのような来歴をたどったかを示す来歴情報、コンテンツが意図しない変更がされていないことを示す不変性情報などの様々な情報(メタデータ)とともにひとまとまりのものとして保存することが求められている。このまとまりを情報パッケージというが、これを作成し管理するシステムとして開発されたのが、アーカイブマティカ(Archivematica)である。アーカイブマティカ(Archivematica)は、アルフレスコなどで作成され提出されたデータを受け入れ、それに前処理を施したデータ(SIP)を、さらに長期保存用のデータ(AIP)に変換する機能を備えたシステムである。実際にわずか2つのPDFデータに数千行にもわたるメタデータが付属する様子を見せていただき、電子文書を信頼性・真正性・正確性を担保しつつ長期保存・管理するための標準が作られる必要性について理解した。
元ナミ氏の第三報告では、アーカイブマティカ(Archivematica)等で処理された公開用の電子記録を検索・供覧させるためのシステムであるアトム(AtoM)とオメカ(Omeka)について説明していただいた。
アトム(AtoM)はアーカイブズ記述標準に準拠して開発されており、主に階層構造を持つ資料に対応している。一方オメカ(Omeka)は、博物館資料や図書の様に1点単位の記録を対象としながらリンクトデータに対応した検索システムであるといえる。どちらもダブリンコア(Dublin Core)メタデータをデフォルトで採用しており、資料ごとの目録やデジタル媒体の登録と公開が簡単にできる。アトムの場合、ICAの国際記述標準(ISAD (G)、ISAAR (CPF)、ISDF、ISDIAH))に準拠した目録をそれぞれアップロードすることで、資料の内容とコンテクスト情報が相互リンクできる。それぞれの特長を生かした利用が必要であることを紹介された。
最後に堀内暢行氏の第四報告では、文書記録システムでは補足しきれないが、重要な記録資料であることは自明である電子メールの長期保存について、電子メールのデータを整理して標準化するためのソフトウェアであるイ−パッド(ePADD)の機能について説明していただいた。メールは物理的な数が多く、人の目で評価選別を行うことはほぼ不可能である一方、イ−パッド(ePADD)においては選別を可能とするモジュールが有効に機能する。さらに自然言語処理(NLP)が利用できれば選別への有効性はいっそう高まる。われわれが利用するためには日本語化が必須となるが、現在はまだ課題となっているとされた。
こうした各報告の後、会場の参加者と報告者間で質問が交わされ、活発な意見交換が行われた。
現在、自治体公文書の電子化は、かなり速いスピードで進んでいるのが実態だろう。今回話題としたオープンソースアプリケーション以外を利用した方法もあるとは思うが、今例会のような課題と向き合うことがなければ、諸外国とは異なった基準で電子文書が作成され、信頼性・真正性・正確性が他から認められない多数の文書を長期にわたって保存・管理するという無駄を生みかねない。今後さらに速度を上げて真摯な議論が重ねられていく必要があるだろう。参加者は講師を含む23名であった。
7月1日、京都大学楽友会館で開催された161回のリアル例会「電子記録の優雅なライフサイクル:無料公開のソフトウエアによる実現を考える」に参加した。デジタルに疎い私は、どちらかといえば、アナログの世界に身を置きたい方であり、今日の例会の内容は理解できるのだろうかと思いつつの参加であった。例会では、脆弱性を有する電子記録のライフサイクルをどのように管理するかについての考え方や、無料公開のソフトウエアの紹介、実践例が報告された。
報告1 「アルフレスコ:現用段階の記録管理」(橋本陽氏)では、現用記録の管理ソフトウエアとして、記録管理の国際標準ISO 15489やDoD 5015.2の双方に準拠可能なアルフレスコ(Alfresco)が紹介される。実体がなく、脆弱性を有する電子記録は、その記録の信用価値(信頼性・真正性・正確性等)をメタデータで担保する。メタデータはデータについてのデータで、電子記録においては必須のものである。例えば、真正性を持つ記録は最初に作成された時と同じ同一性を有し、時間経過後も完全性を維持している記録とされる。完全性は「管理に責任を持つ正当な主体が記録を保管していく連鎖が不可欠な要素となる」という。イタリアの実践事例とデータ、情報、文書、記録について、インターパレスの定義が紹介されている。
報告2 「アーカイブマティカ:アーカイブズにおける長期保存」(金甫榮氏)では、電子記録の長期保存の管理ソフト、アーカイブマティカ(Archivematica)について、開発の歴史、特徴、導入事例が紹介され、アーカイブマティカが準拠している標準、OAIS(Open Archival Information System)の機能の説明があった。OASIS参照モデルの機能モデルには、提出用(Submission Information Package :SIP)、長期保存用(Archival Information Package :AIP)、公開用(Dissemination Information Package:DIP)の三つの情報パッケ−ジがあり、特に、AIPについて、詳細な図解の説明がなされた。AIPはアーカイブマティカによって、保存対象の受け入れ→一時保管→評価選別→取り込み→保存ストレージ→保存計画→公開→運営というように処理されると理解した。
報告3 「アトムとオメカ:性格の異なる二つの検索システム」(元ナミ氏)は、アトム(AtoM :Access to Memory)とオメカ(Omeka)の検索システムについての説明であった。アトムは、国際公文書会議(ICA :International Council on Archives) のアーカイブズ国際記述標準に準拠しており、目録作成時に階層構造を必要とするアーカイブズ資料の集合記述が可能であり、アーカイブズ資料に適し、オメカは、「デジタルコレクションを共有し、メディアが豊富なオンライン展示物を作成するためのオープンソースweb出版プラットフォーム」で、1点資料(図書館・博物館)の公開、利用を目的にすることが多いと説明された。記述事例も紹介された。
報告4 「イーパッド(ePADD):電子メールの整理と利用提供」(堀内暢行氏)は、電子メールもISO 15489 の「記録は、業務活動の証拠であり、情報資産である。」の定義に当てはまるとし、電子メールの特性、保存と整理、ePADDを用いた電子メール整理についての報告であった。電子メールは、RFC:Request for Cmments 5322 により構造が規定されており、その構造の保持がメタデータの保持になるという。PDF等別のフォーマットに変換した時点でメタデータを残すことはできないとされている。OSS として配布されている保存管理用アプリePADDは、eMailの保存管理に適しており、多言語への対応等様々な課題はあるが、現時点においてベストな選択であるという。
文書管理のデジタル化について、大変勉強になる例会であった。それと同時に、デジタル庁を設置した政府の文書管理のデジタル化がどのように進められるのか気になり、内閣府の公文書管理委員会の配布資料や議事録、デジタルWG報告書を読んでみた。配布資料には、今後の取り組みの内容が示されているが、今回報告されたような様々な知見を活かして、行政の現場でも両者の協力により開発を進めて行くことはできないのだろうかと思った。諸外国では、そうした協力関係を通じてシステムが開発されている。例えば、米国の国内標準となったDoD 5015.2は、米国国防総省とブリティッシュ・コロンビア大学に所属するアーカイブズ学の専門家とが協力し合った研究の成果だという。ほかにもこういう事例は見受けられる。日本でもこうした事例を参考にして、行政側だけでなく、専門家も交えた研究開発の場を設定する必要があると感じた。