WDBシステムは、Drupal 10/11用のカスタムモジュールとして利用可能です。
1. 概要
Word-Database (WDB) Core モジュールは、言語学者、歴史学者、文献学者、そしてデジタル・ヒューマニティーズの研究者のために設計された、Drupalのための包括的なツールキットです。WDBの最も重要な特徴は、その柔軟性です。様々な時代や地域の複数の言語資料を、単一の統一されたプラットフォーム上で取り扱うことができます。
このシステムの中核となるのは、IIIFに準拠した高精細画像に対して詳細なアノテーションを付与し、個々の文字(sign
)や単語(word
)を、詳細な言語情報と結びつける機能です。この深いデータ構造により、画像上の文脈から直接テキスト情報を検索する、といった強力な検索が可能になります。OpenSeadragonとAnnotorious v3をベースにしたリッチなユーザーインターフェース、堅牢なデータ投入ワークフロー、そしてDrupalのコアシステムとの深い統合を特徴としています。
WDBは、デジタル化された画像アーカイブを、学術研究と公開活用のための、構造化され、検索可能で、相互運用性の高い言語データベースへと変換するために設計されています。
2. 主な機能
- IIIF準拠のビューアとエディタ: OpenSeadragonとAnnotorious v3で構築された、高精細画像の閲覧とアノテーション付与のための、強力で直感的なインターフェース。
- 詳細なアノテーション機能: 個々の文字(
sign
)に対するポリゴン形式でのアノテーションをサポート。単語のポリゴンは、これらの文字の集合から自動的に計算され、精密な言語分析を可能にします。 - 柔軟な言語データ投入: TSVファイルを用いた言語データ一括投入システム。安全なデータ管理のためのロールバック機能も完備。
- テンプレート生成機能: 形態素解析結果(現在はWeb茶まめ の「Chakiインポート形式」のような日本語フォーマットに対応)や、システム内の既存データから、TSVテンプレートを自動生成。データ投入のハードルを大幅に下げます。
- 動的な設定とアクセス制御: モジュールとサブシステム(資料群)の全ての設定を、統一された管理画面から操作可能。資料群ごとに、匿名ユーザーに対してギャラリーページと検索フォームを公開するかどうかを設定できます。
- IIIF Presentation API v3準拠: 単語レベルのアノテーション(豊富なリンク情報付き)を含む、IIIF Presentation API v3準拠のマニフェストを自動生成し、Mirador 3のような外部ビューアとの相互運用性を保証します。
- カスタマイズ可能なデータエクスポート: 言語データをTEI/XMLおよびRDF/XML形式でエクスポートできます。これらのフォーマットのテンプレートは管理画面から直接編集でき、ユーザーが自由に出力構造を定義できます。
- Viewsとの深い連携: DrupalのViewsモジュールと完全に統合されており、サイト管理者はコードを書くことなく、完全にカスタマイズされた検索結果ページやデータ一覧を作成できます。
- 拡張可能なエンティティ構造: Drupalの標準的なエンティティシステム上に構築されています。サイト管理者は、他のコンテンツタイプと同様に、「資料」などの中心的なデータに新しいフィールドを簡単に追加し、その表示をカスタマイズできます。
- Cantaloupe連携(オプション): オプションのサブモジュールが、Cantaloupe IIIF画像サーバのDelegateスクリプトと連携するための、安全なAPIエンドポイントを提供。Drupalサイトへのログイン状態に応じてIIIF画像へのアクセスを許可するかどうかを制御できます。
3. 要件
- Drupal Core:
^10
または^11
- PHP:
^8.1
- 必須Drupalモジュール(
wdb_core.info.yml
により自動で有効化されます):- Taxonomy, Content Translation, Language
- File, Image
- Field, Field UI
- jQuery UI, jQuery UI Dialog
- オプション:
- IIIF画像サーバ(Cantaloupeを推奨) (自身で画像を配信する場合)