KOMONJO CAMERA

古文書カメラの概要

ABOUT US

「古文書カメラ」について

  1.  「古文書カメラ」は、スマートフォンで撮影したくずし字資料を、高精度のAI-OCR技術によりその場で手軽に解読できるアプリです。TOPPAN株式会社が提供する、古文書解読とくずし字資料の利活用サービス「ふみのは」事業の一環として、開発されました。
  2. 運営:TOPPAN株式会社
  3. iOS版アプリ(2023年6月1日 配信開始)
    Android版アプリ(2023年10月25日 配信開始)

TOPPANのくずし字に関する取り組み

  1.  古文書は、日本国内に数十億点以上残存すると言われていますが、現代の社会課題にも直結する災害や地域文化の記録など、防災や観光資源の創出・地域の活性化にもつながる貴重な情報が記されています。しかし、古文書のほとんどは「くずし字」で書かれているため現代人にとって判読が困難となってしまい、当時の記録・文献を活用する際の大きな障壁になっています。また、個人が所有している古文書は、内容がわからないために破棄されるケースも多く、解読されないまま災害による損傷や紛失、焼失などのリスクにさらされた状態で全国各地に眠っています。
  2.  TOPPANは、これらの課題を解決する新たな手法として、2015年よりくずし字OCR技術の研究開発を開始し、以後、多数の研究機関等とくずし字OCR技術の開発・実証を重ねてきました。2017年にリリースした原本画像と解読テキストを重ねて表示できる「ふみのはビューア」、2021年にリリースしたオンラインくずし字解読支援システム「ふみのはゼミ」をはじめ、“古文書解読とくずし字資料の利活用サービス「ふみのは®」”として、様々なくずし字解読ソリューションを提供してまいりました。
  3. 「ふみのは®」公式サイト:https://www.toppan.com/ja/joho/fuminoha/
  4. 「ふみのは®」公式Twitter:@fuminoha_jp

くずし字AI-OCRについて

  1.  「古文書カメラ」など、「ふみのは」が提供するソリューションには、2023年6月現在「古文書AI」と「古典籍AI」の2つのエンジンを搭載しています。AI による解読精度については、今後さまざまな筆跡の文字を学習させていくことによって、段階的に向上を実施します。
  1. 「古文書AI」および「古典籍AI」は、下記の機関が公開するオープンデータおよび提供いただいたデータからくずし字の字形を学習しています。
  2.  ・国文学研究資料館ほか
      日本古典籍字形データセット http://codh.rois.ac.jp/pmjt/
     ・みんなで翻刻データ https://github.com/yuta1984/honkoku-data

     ・熊本大学永青文庫研究センター
     ・公益財団法人三井文庫
     ・国立国語研究所
     ・京都市歴史資料館
     ・早稲田大学坪内博士記念演劇博物館
     ・慶應義塾大学メディアセンター
     ・山口県立文書館
     ・印刷博物館

     ・個別に資料をご提供いただいた機関・個人のみなさま
TOP