歴史的アラビア語刊本のOCR全文検索を初めて可能に

大英図書館の所蔵する宗教、法律、科学、歴史、地理、文学、言語等、イスラーム諸学の古典的著作のアラビア語刊本と欧米諸語訳刊本、ヨーロッパ諸語のキリスト教関係著作のアラビア語訳刊本を原本に忠実に再現し全文検索可能にする、この種のものとしては初めてのデータベースです。

収録資料の言語は、アラビア語のみならず、英語、フランス語、ドイツ語、ギリシア語、ヒンディー語、オスマン・トルコ語、ラテン語、ペルシア語、シリア語など約30言語におよびます。このうち、ラテン文字を使う欧語刊本に加え、アラビア語刊本についてもOCRで読み取り、全文検索を可能にしました。

西はイギリスから東はシンガポールまで、アジア、中東、ヨーロッパの200以上の都市で、15世紀後半から19世紀末までの400年の間に出版された約5,100タイトル、約7,000冊を搭載し、中世以来のイスラーム文化圏とヨーロッパ文化圏の思想と学術の交流、19世紀におけるイスラーム書物文化の興隆を甦らせる大型企画です。


プラットフォームの特色とツール

アラビア語の光学文字認識(OCR)

本商品のために開発された光学文字認識(OCR)技術を用い、初期アラビア語刊本に含まれる様々なフォントをテキスト化、検索可能にしました。検索語は文書画像中でハイライトされます。

アラビア語のインターフェース

ネイティブ・ユーザーのためにアラビア語インターフェースを用意しました。画面上の文字だけでなく、検索ボックスの位置等も、右から左に読むテキストに合わせて設計しています。

正確な主題分類

大英図書館所蔵目録の詳細なメタデータに加え、米国議会図書館にもとづく主題分類を各資料にほどこし、すべての主題がアラビア語・英語の二か国語で表示・検索可能です。

»