基盤研究

公募型共同研究

歴史資料デジタルアーカイブデータを用いた知的構造の創生に関する研究- 小袖屏風を対象として

研究期間:平成25年度~平成27年度

研究代表者 濱上 知樹 (横浜国立大学大学院)
研究組織 内田 誠一 (九州大学大学院)
富井 尚志 (横浜国立大学大学院)
福永 香 ((独)情報通信研究機構電磁波計測研究所)
白川 真一 (青山学院大学)
矢田 紀子 (千葉大学大学院)
中島 慶人 (電力中央研究所)
澁谷 長史 (筑波大学大学院)
澤田 和人 (本館研究部)
安達 文夫 (本館研究部)

研究目的

研究の背景
近年、急速に進む歴史資料のデジタルアーカイブ化により、貴重な歴史資料を計算機に取り込み、高度な知的利用や新たな展示技術として活用する研究が盛んに行われている。また、そのデジタルデータの取り扱いや記述・構造化について、メタデータの記述・モデル化の検討が進められている。このように、歴史資料のデジタルアーカイブの流れと関連研究は、人類共有の貴重な歴史資料の永続的な記録と再発見の手段として大きく期待されている。国立歴史民俗博物館においても、江戸図屏風を始め、正倉院文書、小袖屏風画等、数々貴重な歴史資料がデジタルデータ化され、資源共有する研究が進められてきた。

一方、近年の計算機技術とネットワークの飛躍的な発展を背景にBig dataと呼ばれる超大規模データを取り扱う技術が注目されている。Big dataでは、従来のデータの取り扱いとは異なり、単に大規模というだけではなく、多様で非構造なデータ発生源が時間的広がりを持って大量に存在する点に特徴がある。そのため、発生したデータを収集・蓄積する基盤技術と、収集・蓄積したデータを操作するための高度なツールが求められている。そのための重要な技術の1つが「機械学習」である。機械学習とは、データから有用な規則、知識表現、弁別基準、クラスタリングを抽出する人工知能の技術であり、蓄積されたデータの中から、有用な知識抽出を行う有効な手段として近年飛躍的な研究進展を遂げている。また、Big data 時代を切り開くもう1つの重要な技術が、1998年に提唱されたセマンティックWebである。セマンティックWebとは「情報リソースに意味(セマンティック)を付与することで、人を介さずにコンピュータが自律的に処理できるようにするための技術」と定義される。メタデータとオントロジーによる自律的なデータの知的構造化、あるいは機械学習とセマンティックデータ技術の連携は、既に現実のネットワークの中で進み、様々な知的構造の構築とこれを用いた知的システムの構築に貢献をしている。

また、歴史資料にとって重要な要素であるイメージング処理技術についても、計算機処理能力の向上と共に目覚ましい高度化を遂げている。莫大な画像の中から意味のある情報や構造を抽出し、知識利用する技術は、医療、セキュリティ、アミューズメント等、社会の多くの場面で実用化されている。

翻って、増え続ける様々な歴史資料デジタルアーカイブ-特に画像を中心としたデジタルデータとは、様々な非構造的特徴を有し、データ発生源の地理的・時間的拡がりを有するBig dataに他ならない。例えば、小袖屏風画像データベースに含まれる属性は、構図および衣装モティーフといった連続空間的属性から、染めや絞りといった技術的分類、さらには、時代や身分等、様々な外部属性につながっている。特に、研究上重要なモティーフ、染色方法、刺繍、文様のミクロ・マクロな連続特徴量を扱うことから、非表象・非定型・非構造化された高精度画像情報からのセマンティクス抽出が重要な技術となる。しかし、このような大規模な歴史資料に対し機械学習のような自律的データマイニングを試みた研究は過去に類がなく、データ間のメタ構造を抽出する試みは緒についたばかりである。今後、機械学習やセマンティクデータ技術をこれらの歴史資料に応用することで、新たな文理融合領域の研究が期待できる。以上の前提から、本研究の意義・必要性を以下のように定める。

研究の意義 
歴史資料デジタルアーカイブデータに最新のイメージング処理をフロントエンドとする機械学習・セマンティックデータ処理を試みることで、デジタルアーカイブデータからの新たな知的構造の創出と、データマネージメント技術の発展をはかり、新たな学際領域の発展と歴史資料を用いた視覚的情報提示手法の確立-歴史資料高度データマネージメントシステム(仮称)の構築を行う。

研究の必要性 
歴史資料デジタルアーカイブの蓄積が進む中、その莫大なデータの利活用の方法が重要となっている。電子的に保存されたデータベースとしての静的な存在ではなく、非構造化されたデータから意味や新たな構造を抽出する自律性を付与することで、歴史資料の新たな利活用とこれを用いた研究の発展が期待できる。本研究では、歴史資料デジタルアーカイブをBig dataとみなし、様々な分野で活用されている画像処理・解析を初めとする特徴抽出と、これらの解析技術で培われた機械学習、セマンティックデータ処理を用いて、莫大なデジタルアーカイブからの知識発見をはかるシステムをつくることで、この期待に応えるものである。

この研究の嚆矢として、まず野村コレクション小袖屏風のデジタルアーカイブデータについて検討を開始する。小袖屏風画像は、既にデジタル化がなされており、画像の様々なレベルにおける特徴量の抽出とその構造化を進め,さらに他の史資料についても検討を拡大する。

以上の試みにより、歴史資料デジタルアーカイブデータを用いた知的構造の創生をはかり、歴史研究の新たな展開と、得られた成果の効果的な展示技術に結びつけることを目的と定める。