Sunday, May 21, 2006

メタ文献学としてのTEI (2)

情報歴史学研究室: メタ文献学としてのTEI (1)の続き。

土屋先生の問題提起は非常に重要だと思うが、歴史的な(文献学外の)問題や、日本語の問題にのみ還元するのは無理があるように思う。特に、「日本語の文書は「構造化」されていない」から、という理由付けは、 日本文学以外にも日本人がやっている文献学はたくさんあるわけで、理由になっていないのではないだろうか。

とは言え、本質的な問題はどこにあるのだ?お前は答えられるのか?と問われると、非常に難しい。

ぱっと思いつくところでは、辞書(字書、事典など)の位置づけに関係しているのではないかという気がしている。(門外漢であることを棚に上げて言うと)欧米の文献学においては、長大な時間をかけて辞書を作るという伝統がある。日本では、いくつか大きな辞書、辞典はあるが、何世代にもわたって作り続けられるというものはない。

辞書作りというのは、単語などの文献や文脈を超えた共通性を見いだす作業である。TEIにおけるマークアップというのは、(乱暴に言えば)文献を超えた共通の文書構造を見いだし、文書中の単語に文脈を超えてIDをふるという行為だと言えるが、これは辞書作りに似ていると思われる。私は以前、「Unicodeのcharacter概念について」という論文の中で、ドレイファス氏が批判した、「道徳的、知的、実際的な不明確さを取り除く」ことを目標とした結果、世界は離散的要素に分析可能であるとの結論に至る「西洋文化に埋め込まれた哲学的伝統」や、デリダ師が批判した西洋哲学の音声中心主義=ロゴス中心主義と関連させて、辞書の「形而上学」について論じたことがあるが、TEIも同じように「西洋文化に埋め込まれた哲学的伝統」の延長線上に位置づけることができるだろう。

一方、日本の文献学における辞書の位置づけはどうだろうか。諸橋大漢和など、日本にも世界に誇る辞書はあるが、辞書や辞書作りはあまり重視されていないように思われる。このあたりが、TEIの活動への不理解へとつながっているような印象もある。

(続く...)

Friday, May 19, 2006

メタ文献学としてのTEI (1)

国際セミナー TEI Day in Kyoto 2006に参加した。お目当ては、土屋俊先生TEIはなぜ日本で知られなかった、知られていないか、知られるようになるかである。

TEIは情報歴史学研究室: TEI Day in Kyoto 2006に書いた通り、「人文系で研究対象となるような文書ならどんなものでもマークアップできてしまうような、巨大なタグセットを開発している」わけだが、それが欧米圏で始まったものの、日本では受け入れられないのはなぜか。もちろん、いろいろ歴史的、政治的なむにゃむにゃがあったりするのは世の常だろうが、想像をたくましくすれば、そこにはもしかして「文献」「テキスト」というものの捉え方が、あちらとこちらで根本的に異なるからではないか?という問い方も可能であろう(そっちの方が、研究対象としては面白い)。土屋先生の発表はまさに、そのような問題意識を狙い撃ちしているものと期待されるのだ。

ということで実際の発表であるが、土屋先生のスライドを記憶とメモをたよりに、出来る限り再現してみよう(つっこみ歓迎)。ただし「#」とか「→」とかは、先生のコメント(だと記憶しているもの)。


反省
  • 1988の会議へ京都大学の中村順一氏(故人)が参加
  • P2、P3作成へ土屋氏参加(1994年P3公表)
    • ここまでのキーパーソンは長尾真先生
      →人文系じゃない、自然言語処理研究な人が日本では中心
  • P3の国内配布
  • Susan Hockey 来日
  • Sperberg-McQueen氏、Lou Burnard氏 来日
    →周知につとめたけどいまいち。1997年ごろまで。
  • 特定領域研究「人文科学とコンピュータ」(1995-1999)に乗らず。
    # ロビー活動はしたがとりあげられず。90年代後半を「棒に振った」。


論点(1)
  • プレインテキスト至上主義
    • 80年代になって日本語入力が容易になったため、さらにタグをつけるということについての抵抗がつよい?
      # 日本のLaTeXの普及も遅い(1997〜)のも原因?
    • 文字コードに関する議論がやかましく構造化の話までいかなかった?
    • ウェブの普及の遅れにより、タグの有益さの認識ができていなかった?


論点(2)
  • いや、問題はもっと本質的だ。日本語の文書は「構造化」されていない!(人文系の意見?)
    • 連綿と書き継ぐスタイルは構造化になじまない
      # 信仰?
    • 日本語文書は「様式」のような構造化が一般的である様式は二次元の配置によるものであって階層構造の存在を想定する構造化文書に考え方はなじまない
      • 現実にHTMLよりPDFが好まれる
    • (いや、返り点、ふりがななど注記によってテキストを可読化する伝統はむしろ日本的である)。
      # 脚注より高級な構造化じゃないか?


論点 (3)
# 計算機屋さん、技術者の発想。
  • 日本のカルチャーとして、ウェブというものは文書を提供するものではない。インタラクティブなコミュニケーションこそが本質。
    • そういう文化の中で、文書構造の標準化は「後ろ向き」。
    • XMLもデータベースの記述方式、画像などを扱うための方法に関心。
    • メタデータに関する関心も低い。


将来は?
  • 楽観論
    • このままやっていけばいずれみんなタグをつけるようになる。
      # ウィキペディアなんかも普及してるし、構造化文書のよさにきっと気づくよ。
    • そのときに存在する標準を使えばよいじゃない。
  • 悲観論
    • 構造化文書嫌いは日本人にとって本質的。
    • 標準化は構築のための作業が重要であり、後から勉強して使うのでは無理である。

Sunday, May 14, 2006

Il Codice Atlantico virtuale

Il Codice Atlantico virtualeとは、レオナルド=ダ=ヴィンチの所謂『アトランティコ手稿』をマルチメディアで再構成したもの(ヴァーチャル『アトランティコ手稿』)。書籍+CD-ROMで販売されているほか、東京で展示したりしている(書籍版については購入してみたい。展示も観てみたかったなぁ〔ソニービルの告知〕。今年のゼミ合宿はいよいよ東京か? (^_^;;)。

ダヴィンチが描いた設計図などを綿密な考証の上3D画像化したり、複数のページにバラバラに書かれている記述をリンクさせたりしているらしい。テキスト検索などができるのかどうかは不明(どこかに書いてあるかもしれないけど)だが、もしその辺も充実しているとしたら、古典文献のデジタル化の一つの到達点を示している可能性もあり、興味深いところだ。

ちなみにこのプロジェクトでは、EDUTAINMENT (EDUcation 教育 + EnterTAINMENT エンターテインメント) を目指しているそうである。つまり、マルチメディアやインタラクティブなインターフェースなどを駆使すれば、教育効果は高まり人々が自主的に学習することを促進することができる、言い換えれば、コンピュータを使えば(従来苦痛でしかなかった)勉強が楽しくなるのだ!という主張のことである。エデュテインメントで検索してみればわかるが、けっこう盛んに研究・開発され、実践されている(それ以外にも、「教育工学」などのキーワードで検索してみよう)。一方で、『コンピュータが子供たちをダメにする』のように、この手の主張を真っ向から否定する論者も(多くはないが)いる。

現在、情報歴史学コースの3回生ゼミでは、高度な歴史学的な知識に裏打ちされた(かどうかはわからないが (^_^;; 少なくともそれを目指した)3Dコンテンツなどを学部学生や一般向けに作ることで様々な効果が期待できる、というプレゼンをする学生が何人かいる。それはそれでOKなのだが、上に挙げたような議論があることを一度深く考えてみる必要はあるだろう。博物館学などにおける同様の議論も参考になるはずだ。

Wednesday, May 03, 2006

TEI Day in Kyoto 2006

来る5月17日に、京大の時計台で国際セミナー TEI Day in Kyoto 2006が開催される。いやー、イベント目白押しすぎ (^_^;;

TEI (Text Encoding Initiative) とは、歴史書をはじめ、文学作品、哲学書などを SGML / XML でマークアップするためのガイドラインである。電子化された史資料をマークアップをすることでどんなメリットがあるかについては、授業でやってるはずだと思うのでここではパスするが、TEIはそれをさらに押し進め、例えば本のタイトルページだったら、
<titlepage>...</titlepage>
というタグで統一してしまったほうがいいんじゃないか、統一しようぜ、という発想のもと、人文系で研究対象となるような文書ならどんなものでもマークアップできてしまうような、巨大なタグセットを開発している。

TEIを使ったテキストデータベースは、Projects using the TEIで探すことができる。日本がらみだと、ヴァージニア大学のJapanese Text Initiativeとかかな。これは文学系だけど、歴史系もたくさんある。

しかし、日本のプロジェクトにおいて、TEIが採用された例は乏しい。というか、ほとんど普及していない。今回のイベントで、土屋俊先生(千葉大学)の「TEIはなぜ日本で知られなかった、知られていないか、知られるようになるか」という講演があるけど、その意味でも大変興味深い。

ちなみに昔々、TEIのLou Burnard老師と台湾でお話をしたことがあるが、そのときずいぶんアグレッシブに「日本でも使ってくれ!」みたいなことを言われたので、こちらも勢いで「TEIのガイドラインを和訳しますよ!」みたいなことを答えたことがある(結局、全然やっていない (^_^;;)。老師はすでに、そんなことは忘れていると思う(思いたい)が、私の中では消えない過去の悔恨のひとつである。

ともあれ、TEI本家のイベントが日本で、しかも京都で開催されるというのは滅多にないこと(というか、今回初めて)なので、情報歴史学コースの諸君はぜひとも足を運んでほしい。

Monday, May 01, 2006

Wikipediaは信頼できるか?という問いかけ

歴史学を含む人文諸学に関するオンラインリソース集成として有名なアリアドネが、「ご自分の専門分野の記述に関して、ウィキペディア日本語版をどう評価されますか?」というアンケートをしている。ネットのあちこちで行われた同種のアンケートを受けてのものだ。

ウィキペディア日本語版は言うまでもなく、インターネット上の有志がよってたかって作ってしまったオンライン百科事典である。学生諸君の中には、レポートを書く際にお世話になったという者も少なくないだろう。他のアンケートでは肯定的な評価が目立つが、アリアドネでのアンケート結果を見ると、はっきり言ってぼろくそな評価が多い。アリアドネは、その性格上、人文学の研究者が偏って集まるところだろうから、ウィキペディアの人文系のエントリはだめだめということなのだろうか?

ウィキペディアは、情報歴史学研究室: 広告を試してみるで少し触れた Web 2.0 の代表選手のひとつ。ウィキペディアが Web 2.0 という名で喧伝され、高く評価されているのと、アリアドネでの低い評価は、非常に興味深い対照をなしている。そしてこのコントラストは、誰のために、何のためにデータベースや3D画像を作り、公開するのか?という情報歴史学のスタート地点を考える上で、とても多くの示唆を与えてくれる。

何が問題なのか、どうしてこのような正反対の評価になるのか等々については、ゼミの中で議論したいと思うので、考えておいてね。

情報知識学会 第14回(2006年度)年次大会

情報知識学会第14回(2006年度)年次大会(研究報告会&総会)ご案内 にあるように、今年は初の関西(近畿大学)で開催するとのこと。ガッデム!情報歴史学研究室: 情報処理学会 第70回人文科学とコンピュータ研究会発表会と日程がかぶってるじゃないか (^_^;;

直接歴史に関わるものは少ないが、
  • 相良佳弘(聖徳大学). 問題解決を目的とした情報探索行動の特徴.
  • 堀幸雄(香川大学)ほか. ユーザの検索要求に基づいた興味関心の定量的評価法.
  • 斎藤伸雄(凸版印刷). ミュージアム資料情報構造化モデル応用の検討.
あたりは、気になるところであろう。特に、データベースによる検索サービスを作りたい人にとっては、2番目の発表なんかは是非聞いておきたいところ。