우리가 다루는 세상은 수많은 데이터로 이루어져 있습니다. 숫자, 텍스트, 이미지, 센서 값 같은 원시 데이터가 있고, 이 데이터가 서로 연결되고 맥락을 가지면 ‘지식’이 됩니다.
예를 들어, “철수는 영희의 친구이다”라는 문장은 단순한 텍스트 데이터이지만, 이를 사람(노드) 과 관계(엣지) 로 표현하면 지식이 됩니다.
즉, 데이터는 재료, 지식은 관계를 통해 구조화된 의미라 할 수 있습니다. 여기서 중요한 개념이 바로 데이터 링크(Data Link) 입니다.
데이터 링크란, 개별 데이터 조각들을 서로 이어주는 연결고리를 말합니다.
결국 데이터 링크는 사람과 사람은 친구로, 도시와 도시는 도로로, 웹페이지 데이터는 링크로 서로 이어져 있지요. 이렇게 점과 점을 선으로 연결해 표현하는 구조를 수학에서는 그래프 라고 부릅니다. 데이터를 단순한 나열에서 관계적 지식으로 전환시키는 다리 역할입니다.
그래프는 단순히 데이터를 나열하는 표와는 다릅니다. 표는 개별 항목의 값만 보여주지만, 그래프는 “누가 누구와 연결되어 있는지, 그 관계가 어떤 의미를 갖는지”를 드러내 줍니다. 예를 들어, 어떤 학생을 평가할 때 성적만 본다면 평범할 수 있지만, 친구 관계나 동아리 활동까지 고려하면 그 학생의 리더십이나 잠재력이 보일 수 있습니다. 이처럼 그래프는 관계 속 의미를 보여줍니다.
이미지 출처: ResearchGate
그래프(Graph)는 노드(Node, 점) 와 엣지(Edge, 선) 로 이루어진 구조입니다.
그래프는 수학적으로 G = (V, E)
로 표현합니다.
이 구조는 네트워크, 지식 그래프, 소셜 미디어 관계, 물류망 등 현실 세계의 다양한 현상을 모델링할 수 있습니다.
현실의 많은 문제는 단순한 테이블 데이터가 아니라 관계로 이루어져 있습니다.
즉, 그래프는 연결성과 구조적 정보를 이해하는 데 꼭 필요합니다.
GNN 이전에는 그래프 알고리즘이 주요 도구였습니다.
하지만 이들 방법은 패턴 학습이 아닌 규칙 기반 계산이었기에, 복잡한 구조 패턴을 자동으로 학습하는 데 한계가 있었습니다.
인공지능은 지금까지 사진, 글, 소리 같은 데이터를 잘 처리해왔습니다. 하지만 관계가 중요한 그래프 데이터는 기존 방식으로는 다루기 어려웠습니다. 여기서 등장한 것이 바로 그래프 신경망(Graph Neural Network, GNN)입니다.
GNN은 한 노드의 속성뿐만 아니라 그 노드가 어떤 이웃과 연결되어 있는지를 함께 학습합니다. 다시 말해, 단순히 “이 점이 어떤 특징을 가졌는가?”가 아니라 “이 점이 누구와 연결되어 있고, 그 관계가 어떤 의미를 가지는가?”를 이해하려는 인공지능입니다.
그래프 신경망(GNN)은 딥러닝의 강력한 표현 능력을 그래프 데이터에 적용한 방법입니다.
핵심 아이디어는 간단합니다:
즉, “이웃을 통해 배우는 노드”라는 개념입니다.
1) Node Classification (노드 분류)
→ “이 점은 어떤 종류일까?”
그래프의 각 노드에 라벨을 붙이는 문제입니다.
2) Link Prediction (링크 예측)
→ “이 둘은 연결될 가능성이 있을까?”
노드 간 새로운 연결이 생길 가능성을 찾는 문제입니다.
3) Graph Classification (그래프 분류)
→ “이 전체 네트워크는 어떤 유형일까?”
그래프 전체를 하나의 개체로 보고 분류하는 문제입니다.
즉, GNN은 노드 단위, 링크 단위, 그래프 전체 단위에서 문제를 해결할 수 있습니다.
그래프 신경망은 데이터를 단순히 독립된 점으로 보지 않고, 서로 얽히고 설킨 관계망 속에서 의미를 찾는 인공지능입니다. 우리가 사는 현실을 더 잘 닮은 방식으로 학습하기 때문에, 앞으로 인공지능의 중요한 축으로 자리 잡을 가능성이 큽니다.
결국 GNN은 데이터를 보는 AI가 아니라, 연결을 이해하는 AI입니다.
앞으로 더 많은 분야에서 GNN이 활용되면서, 우리 생활 속 다양한 관계의 비밀을 풀어내 줄 것입니다.
기업 홍보를 위한 확실한 방법
협회 홈페이지에 회사정보를 보강해 보세요.