TEI (Text Encoding Initiative) とは、歴史書をはじめ、文学作品、哲学書などを SGML / XML でマークアップするためのガイドラインである。電子化された史資料をマークアップをすることでどんなメリットがあるかについては、授業でやってるはずだと思うのでここではパスするが、TEIはそれをさらに押し進め、例えば本のタイトルページだったら、
<titlepage>...</titlepage>というタグで統一してしまったほうがいいんじゃないか、統一しようぜ、という発想のもと、人文系で研究対象となるような文書ならどんなものでもマークアップできてしまうような、巨大なタグセットを開発している。
TEIを使ったテキストデータベースは、Projects using the TEIで探すことができる。日本がらみだと、ヴァージニア大学のJapanese Text Initiativeとかかな。これは文学系だけど、歴史系もたくさんある。
しかし、日本のプロジェクトにおいて、TEIが採用された例は乏しい。というか、ほとんど普及していない。今回のイベントで、土屋俊先生(千葉大学)の「TEIはなぜ日本で知られなかった、知られていないか、知られるようになるか」という講演があるけど、その意味でも大変興味深い。
ちなみに昔々、TEIのLou Burnard老師と台湾でお話をしたことがあるが、そのときずいぶんアグレッシブに「日本でも使ってくれ!」みたいなことを言われたので、こちらも勢いで「TEIのガイドラインを和訳しますよ!」みたいなことを答えたことがある(結局、全然やっていない (^_^;;)。老師はすでに、そんなことは忘れていると思う(思いたい)が、私の中では消えない過去の悔恨のひとつである。
ともあれ、TEI本家のイベントが日本で、しかも京都で開催されるというのは滅多にないこと(というか、今回初めて)なので、情報歴史学コースの諸君はぜひとも足を運んでほしい。
No comments:
Post a Comment