-
「古文書カメラ」は、スマートフォンで撮影したくずし字資料を、高精度のAI-OCR技術によりその場で手軽に解読できるアプリです。TOPPAN株式会社が提供する、古文書解読とくずし字資料の利活用サービス「ふみのは」事業の一環として、開発されました。
-
運営:TOPPAN株式会社
-
iOS版アプリ(2023年6月1日 配信開始)
Android版アプリ(2023年10月25日 配信開始)
-
古文書は、日本国内に数十億点以上残存すると言われていますが、現代の社会課題にも直結する災害や地域文化の記録など、防災や観光資源の創出・地域の活性化にもつながる貴重な情報が記されています。しかし、古文書のほとんどは「くずし字」で書かれているため現代人にとって判読が困難となってしまい、当時の記録・文献を活用する際の大きな障壁になっています。また、個人が所有している古文書は、内容がわからないために破棄されるケースも多く、解読されないまま災害による損傷や紛失、焼失などのリスクにさらされた状態で全国各地に眠っています。
-
TOPPANは、これらの課題を解決する新たな手法として、2015年よりくずし字OCR技術の研究開発を開始し、以後、多数の研究機関等とくずし字OCR技術の開発・実証を重ねてきました。2017年にリリースした原本画像と解読テキストを重ねて表示できる「ふみのはビューア」、2021年にリリースしたオンラインくずし字解読支援システム「ふみのはゼミ」をはじめ、“古文書解読とくずし字資料の利活用サービス「ふみのは®」”として、様々なくずし字解読ソリューションを提供してまいりました。
-
「ふみのは®」公式サイト:https://www.toppan.com/ja/joho/fuminoha/
-
「ふみのは®」公式Twitter:@fuminoha_jp
-
「古文書カメラ」など、「ふみのは」が提供するソリューションには、2023年6月現在「古文書AI」と「古典籍AI」の2つのエンジンを搭載しています。AI による解読精度については、今後さまざまな筆跡の文字を学習させていくことによって、段階的に向上を実施します。
-
「古文書AI」および「古典籍AI」は、下記の機関が公開するオープンデータおよび提供いただいたデータからくずし字の字形を学習しています。
-
・国文学研究資料館ほか
日本古典籍字形データセット http://codh.rois.ac.jp/pmjt/
・みんなで翻刻データ https://github.com/yuta1984/honkoku-data
・熊本大学永青文庫研究センター
・公益財団法人三井文庫
・国立国語研究所
・京都市歴史資料館
・早稲田大学坪内博士記念演劇博物館
・慶應義塾大学メディアセンター
・山口県立文書館
・印刷博物館
・個別に資料をご提供いただいた機関・個人のみなさま
TOP