整理されていない各種データを収集し、独自の視点から編纂することで、各自の研究領域において有用なコンテンツを構築する。
(主にネット上にある)構造化されていない各種データを収集し、分析することで、そこから意味のあるパタンを見出す。
出所:http://japan.cnet.com/column/web20/story/0,2000055933,20090039,00.htm
出所:http://japan.cnet.com/media/2005/web2.0/meme_map_small.gif
今後のWeb の方向性(Web 3.0?)について、さまざまなアイデアや展望が示されている。Web コンテンツにおける「意味性」の向上を目指す「セマンティック・ウェブ」の考え方は、それらの中でも最も活発な動きを見せている1つである。
![]() |
引用元:Querying Federated Knowledge for Web 3.0 Applications |
セマンティック・ウェブは、コンテンツを記述するための言語、それらの記述の枠組みを意味づける「メタデータ」、さらにメタデータの実世界での意味を記述する「オントロジー」によって構成される。
![]() |
出典:曽根原、岸上、赤植(2006) |
XML (Extensible Markup Language)
XML は、コンテンツを記述するための言語であり、HTML と同様に、汎用的な文書記述言語SGMLから派生したものである。HTMLが、コンテンツ間のリンクとレイアウトを定義するのに対して、XML は、データの意味や構造を記述するための言語である。
XMLを用いることで、データの意味や関係構造を柔軟に定義することができる。XMLを使って作成された言語としては、マルチメディアデータを同期させるための SMIL、Web上でベクター画像を扱うための SVG、コンピュータ間でのサービス共有を目的としたSOAP、などがある。また、XHTML は、XML 使って、HTML の文法構造を定義した言語である。
メタデータ (Metadeta)
メタデータは、特定の事象に帯するデータについての、メタな情報を表すデータ。例えば、個々の書籍に対応するデータの場合、書籍全般を表すための著者名、タイトル、出版年、出版社、といった情報は、メタな情報(メタデータ)である。分野毎に、メタデータの枠組み(メタデータスキーマ)を共通化することで、データの相互利用が可能となる。
RDF (Resource Description Framework) とは、ウェブ上にあるリソースを記述するための仕組みであり、メタデータの記述言語として普及している。RDFは、XML 形式で定義されており、W3C (World Wide Web Consorsium) によって規格化されている。ブログなどの更新情報を記述する RSS (RDF Site Summary) や、友人関係を表現する FOAF (Friend of a Friend) は、RDF の一種である。
オントロジー (Ontology)
オントロジーとは、メタデータの項目が、実世界との関係においてどのような意味を持つのかを記述する枠組みである。具体的には、日本画は絵画の一種であり、絵画は、作者と作成時期といった属性を持つ、といった情報をコンピュータ上で扱える形で定義するのが、オントロジーの考え方である。
Web 上でオントロジーを記述するための言語として、OWL (Web Ontology Language) が W3C によって提案され、標準化の作業が行われている。OWL では、階層的に定義されたクラス、およびクラスの属性であるプロパティによって、対象(領域)についての意味を記述する。このスタイルは、人工知能研究における「知識表現」の方法、特に「フレーム表現」を、XML ベースで再定義したしたものであると言える。
以下は、OWLの記述例である。RDFと同様に、XML 表現が用いられている。
<owl:Class rdf:ID="日本画"> <rdfs:subClassOf rdf:resource="絵画" /> ... </owl:Class>
![]() |
稲葉(2009)DH-JAC2009発表スライドより |