끄적이는 메모장

2. triple data? 본문

학문/semantic web

2. triple data?

밥보92 2018. 3. 15. 23:25
반응형

2. triple data란 무엇인가 ?

 

앞서 시맨틱웹을 소개할 때, 시맨틱 웹을 구성하는 데이터는 트리플 구조를 갖는다고 설명하였다.

우리는 이러한 데이터를 트리플 데이터라고 부른다.

 

트리플 데이터는 주어, 술어, 목적어 (s,p,o)를 하나의 세트로 하는 데이터로 이해할 수 있다.

주어(subject)와 목적어(object)는 술어(혹은 속성) (property)를 통해 의미적으로 연관을 갖게 되는데,

예를 들어 (seoul, isLocatedIn, korea)라는 트리플 데이터는 이 자체만으로 서울이 한국에 위치한다는 정보를 표현할수 있다는 것을 보여준다.

 

이러한 트리플 데이터의 개념을 확장하여 메타데이터 간의 효율적인 교환 혹은 상호운영을 목적으로 WWW(월드와이드웹) 컨소시엄에서 하나의 규격으로 정의한 것이 RDF(Resource Description Framework)이다.

RDF는 메타데이터 간의 어의, 구문, 구조 등에 공통적인 규칙을 지원하게 되는데 트리플 구조를 기초에 두어 정보 자원(Resource), 속성 유형(Property Type), 속성값(Value) 값으로 이루어진 데이터 모형을갖는다.

하나의 정보 자원은 URI로 나타내어지며 하나 이상의 속성과 속성 값을 가질 수 있다. 다음은 그 예를 보여준다.

<?xml version="1.0"?>

<rdf:RDF
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:si="https://www.w3schools.com/rdf/"
>


<rdf:Description rdf:about="https://www.w3schools.com">
  <si:title>W3Schools</si:title>
  <si:author>Jan Egil Refsnes</si:author>
</rdf:Description>

</rdf:RDF>  

여기서는 https://www.weschools.com이라는 정보 자원이 두 개의 트리플 구조를 가지고 있다.

 

1. <https://www.w3schools.com, https://www.w3schools.com/rdf/title, "W3Schools">

2. <https://www.w3schools.com, https://www.w3schools.com/rdf/author, "Jan Egil Refsnes">

즉, 하나의 정보 자원이 재사용 되며 의미의 확장이 일어나는 것을 관찰 할 수있다.

 

그럼, 이를 조금 더 확장하면 어떨까

<?xml version="1.0"?>

<rdf:RDF
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"

xmlns:si="https://www.w3schools.com/rdf/"
>

<rdf:Description rdf:about="https://www.w3schools.com">
  <si:title>W3Schools</si:title>
  <si:author>Jan Egil Refsnes</si:author>

  <si:family rdf:resouce="https://www.w3schools2.com"/>
</rdf:Description>

</rdf:RDF>

 

세 번째 관계인

<https://www.w3schools.com, https://www.w3schools.com/rdf/family, https://www.w3schools2.com>는 자원간의 관계를 트리플 구조로서 표현하고 있다.

이를 통해서 볼 수 있는 것은 자원간의 통합, 도메인간의 통합이 RDF를 이용하면 용이하다는 것을 볼 수 있다. 즉, RDF가 가진 상호 운용성의 특징을 단적으로 보여주는 예라고 할 수있다.

 

위의 RDF 데이터를 그래프로 표현하면 아래와 같은데, 작은 그래프가 그래프 간의 통합이 지속적으로 이루어지면서 거대한 지식그래프를 생성하게 된다.

 

이러한 지식 그래프는 데이터의 추론에 활용되며 다양한 기계학습 및 인공지능 분야에 활용되기도 한다.

Image result for RDF graph

그림 : https://stackoverflow.com/questions/12975239/great-rdf-visualization-tools

 

본 글에서는 트리플 데이터가 무엇인지 그리고 이를 규격화한 RDF가 무엇인지 간략하게 살펴 보았다. 다음 글에서는 RDF에 대해 조금 더 상세하게 다루어 볼 예정이다.

반응형

'학문 > semantic web' 카테고리의 다른 글

[Jena ARQ] 1. fuseki - remote endpoint  (1) 2018.04.03
1. semantic web?  (0) 2018.03.13