今年の幕張メッセで行われたニコニコ超会議やニコニコ生放送で、古文書解読したことでも話題に!
世界初!日本の古文書研究躍進のために 研究者と市民が協働作業
最新のAI技術を使用し、ゲーム感覚で古文書を解読! 歴史研究に参加しよう!

  • 日本の古文書に対して、様々な市民が、オンラインで「みんなで」協働することを実現させた初めての事例になります。
  • 翻刻(ほんこく)」とは、くずし字で書かれている古文書を、活字化して現代の私たちが読めるようにする作業のことです。

謹啓 時下ますますご清栄のこととお慶び申し上げます。平素は格別の配慮を賜り、厚くお礼申し上げます。

国立歴史民俗博物館・京都大学古地震研究会・東京大学地震研究所のメンバーを中心に開発を進める古文書史料の市民参加型翻刻プラットフォーム「みんなで翻刻」(※1)が、2019年7月22日にリニューアル公開されます。2017年1月に公開された「みんなで翻刻」では、約5,000人の市民の参加により600万文字以上の「くずし字」で書かれた史料が解読されました。

新バージョンの「みんなで翻刻」では、さらに多くの災害史料やユネスコ世界記憶遺産「東寺百合文書」の未翻刻部分を市民参加によって解読します。さらに、最新のAIを使った「くずし字」の自動認識機能も提供します。

つきましては、「みんなで翻刻」のリニューアルを貴媒体にてぜひ多くの方々にご紹介くださいますようお願い申し上げます。

謹白

リニューアルの概要

  • デジタルアーカイブの国際標準規格IIIF(※2)に対応しました。国立国会図書館や国文学研究資料館など、さまざまな機関が公開するデジタル史料を「みんなで翻刻」で扱うことが可能になりました。
  • 今回のリニューアルでは、ユネスコ世界記憶遺産にも指定されている「東寺百合文書」や、東京大学附属図書館が所蔵する地震史料のコレクション「石本コレクション」を公開し、市民と協働で翻刻を進めます。翻刻されたテキストはオープンデータとして公開され、歴史研究や科学研究に役立てられます。
  • AIによる「くずし字」の自動認識機能を搭載しています。凸版印刷株式会社が開発したくずし字認識システム(※3)、および人文学オープンデータ共同利用センター(ROIS-CODH)が開発したくずし字認識システムを利用できます。「くずし字」に慣れない初心者でも、AIの支援を受けながら翻刻作業に参加することができます。

※1 みんなで翻刻 https://honkoku.org
※2 International Image Interoperability Framework (IIIF). デジタルアーカイブの画像データ公開の国際標準形式。
※3 凸版印刷が国文学研究資料館との共同研究を通じて開発。システム構築にあたり、一部学習データとして国文学研究資料館が日本語の歴史的典籍の国際共同研究ネットワーク構築計画の一環として制作した字形データセットを使用しています。

◀史料の翻刻(文字起こし)画面
(地震年代記,東京大学地震研究所所蔵)

 

「みんなで翻刻」について

  • オンラインでの市民参加型の古文書史料の翻刻プロジェクトです。
  • 国立歴史民俗博物館・京都大学古地震研究会・東京大学地震研究所のメンバーを中心にシステムを開発・運用しています。
  • 過去の地震の理解のために、大量に存在する史料を解読することを目的としています。
  • 2017年1月にスタートし、現在も他所蔵機関の史料を追加しながら運用中です。
  • ご参加いただいた方が古文書に親しみ、その解読の楽しみを知ることに寄与しています。
  • 地域の災害の歴史に目を向けることにもつながっています。

「みんなで翻刻」の主な機能と特徴

  • 「まなぶ」
    数多くのくずし字のパターンや、江戸時代の本から収集した熟語約3000パターンを収録。くずし字学習支援アプリKuLA(※4)と連携。AIによるくずし字自動認識機能を活用しながら、「翻刻」作業初心者の方でも楽しく学びながら参加できます。
  • 「翻刻する」
    当初東京大学地震研究所所蔵「石本文庫」(※5)から約114点を収録し、その後499点まで増強。今回のリニューアルにより、さらに多くの史料が翻刻の対象になります。Wikipediaのように、多人数が同時に書き込める「ライブ」機能付き。
  • 「つながる」
    SNS機能で写真や文章の投稿が可能。
  • 史料をパラパラめくるように閲覧できます。

「みんなで翻刻」の現状と今後

  • 他の資料館等の所蔵する史料も登録し、翻刻を続けています。
    これまで次のような他機関史料を登録してきました:
    『岩手県海岸巡回古文書拾集録』(遠野市立博物館所蔵)、『安政大地震繪』(国立国会図書館所蔵)、
    『山脇弁治日記』(秋田県公文書館所蔵)、『地震奇談/平安万歳楽』(国文学研究資料館所蔵)、
    『訓蒙天地辨』(国文学研究資料館所蔵)
  • 他所蔵機関の史料も含めて499点の史料を解読してきました。
  • 総入力文字数は600万文字を越えています。
  • たくさんの市民が協働して翻刻することで、解読正解率が98.5%に達しています。

※4 くずし字学習支援アプリKuLA(大阪大学大学院文学研究科)
    http://www.let.osaka-u.ac.jp/ja/research/community/hodo/iikura_KuLA
※5 石本文庫は、第2代地震研究所所長の石本巳四雄 (いしもと みしお、1893-1940)が収集した災害関係のかわら版、鯰絵等のコレクションで、東京大学地震研究所と東京大学総合図書館に収蔵されています。

史料一例

東寺長者御教書 
京都府立京都学・歴彩館所蔵

骨抜どうせうなまづ大家破焼 
東京大学総合図書館所蔵

 

大坂大地震津浪記
東京大学総合図書館所蔵

 

なお、「みんなで翻刻」の開発と運用には、国立歴史民俗博物館開発型共同研究「歴史災害研究のオープンデータ化に向けた研究」、災害の軽減に貢献するための地震火山観測研究計画、日本学術振興会(JSPS)科研費 JP15H02948、JP18K18338、東京大学地震研究所共同研究プログラム2015-G-22「石本文庫の翻刻」ほか3件、および京都大学防災研究所一般共同研究25G-01の助成を受けています。

広報画像の提供について

ご希望の写真を送付いたしますので、プレスリリースの画像番号をご連絡ください。
画像(JPEG)はメールで送付いたします。
問い合わせ先は「このリリースに関するお問い合わせ」をご参照ください。

「みんなで翻刻」リニューアル公開 広報画像

1)AIによる文字認識(「みんなで翻刻」HPより

2)KuLAとの連携(「みんなで翻刻」HPより)

3) 史料一覧(「みんなで翻刻」HPより)

 

<広報画像使用に際しての注意事項>

■「みんなで翻刻」の広報目的でのご使用に限ります。
■掲載図版のキャプション(史料名, 所蔵者等)を必ず掲載してください。
■資料画像は全図で使用してください。文字を重ねるなど画像の加工・改変はできません。
   部分使用については事前申請・許諾が必要です。
■Web上に掲載する場合は、72dpi以下の解像度にしてください。
■資料画像の使用は「みんなで翻刻」の紹介目的に限ります。2次使用はできません。
■転載、再放送など2次使用をされる場合には、別途申請いただきますようお願いいたします。
■基本情報、図版使用の確認のため、校正紙(Web上の場合は掲載URL)をお送りください。
■掲載、放送後は必ず、掲載誌(掲載面PDF)、同録テープを、1部お送り願います。

「みんなで翻刻」に関するお問い合わせ

橋本雄太(国立歴史民俗博物館・助教)
中西一郎(京都大学大学院理学研究科・名誉教授/京都大学古地震研究会)
加納靖之(東京大学地震研究所/地震火山史料連携研究機構・准教授/京都大学古地震研究会)
E-mail : support@honkoku.org(橋本・中西・加納)
Twitter : @CloudHonkoku(「みんなで翻刻」のアカウント)

本リリースに関するメディア問い合わせ先

大学共同利用機関法人 人間文化研究機構 国立歴史民俗博物館
管理部 広報サービス室 広報・普及係
〒285-8502 千葉県佐倉市城内町117番地
TEL : 043-486-6488(直通),FAX : 043-486-4941,E-mail : koho@ml.rekihaku.ac.jp