최단 경로 Shortest Path 알고리즘은 말 그대로 가장 짧은 경로를 찾는 알고리즘이다.
최단 경로 알고리즘 유형에는 여러가지가 있다.
'한 지점에서 다른 특정 지점까지의 최단 경로를 구해야 하는 경우', '모든 지점에서 다른 모든 지점까지의 최단 경로를 모두 구해야 하는 경우' 등등.
최단 경로 알고리즘은 보통 그래프로 표현한다. 각 지점은 그래프에서 노드로 표현되고, 지점 간 연결된 도로는 그래프에서 간선으로 표현된다.
여기서는 다익스트라(Dijkstra's algorithm)에 대해 배우겠다.
그리디 알고리즘과 다이나믹 알고리즘이 최단 경로 알고리즘에 그대로 적용된다.
다익스트라 알고리즘은, 그래프 내의 특정 정점에서 갈 수 있는 모든 정점들까지의 최단 경로를 구하는 알고리즘이다.
특정한 노드에서 출발, 다른 노드로 가는 각각의 최단 경로를 구해주는 알고리즘인 것이다.
그래프가 큰 경우에도 사용할 수 있어 효율적이지만,
'음의 간선'이 있으면 정상적으로 작동하지 않는다. '음의 간선'이란 0보다 작은 값을 가지는 간선을 의미한다.
다익스트라 알고리즘은 노드 주변을 탐색할 때 BFS(너비 우선 탐색)를 이용하는 대표적인 알고리즘이기도 하다.
//DFS와 BFS 관련
DFS는 한 사람이 미로를 찾아 헤매는 과정과 비슷한 반면, BFS는 여러 명의 사람이 각기 서로 다른 갈림길로 흩어져서 길을 찾는 것과 비슷하다. 이때 각자 실뭉치를 가지고 풀어 놓았다가 되감으면서 새로운 길을 탐색한다. 길을 따라가다 갈림길이 나오면 사람들을 나눠 다시 각자 새로운 길을 탐색하고, 다시 갈림길을 만나 새로 탐색할 길이 하나로 모이면, 나뉘어 탐색하던 사람들이 다시 모여서 함께 탐색한다.
다익스트라 알고리즘은 이때 먼저 도착한 사람의 실뭉치를 사용한다.
다익스트라 알고리즘은 임의의 정점을 출발 집합에 더할 때, 그 정점까지의 최단거리는 계산이 끝났다는 확신을 가지고 더한다. 만일 이후에 더 짧은 경로가 존재한다면 다익스트라 알고리즘의 논리적 기반이 무너진다. 이때는 모두 값을 더해서 양수로 변환하는 방법이 있다. 같은 이유로 최장거리를 구하는 데에는 다익스트라 알고리즘을 사용할 수 없다.
다익스트라 알고리즘은 매번 가장 비용이 적은 노드를 선택해서 임의의 과정으로 반복하기 때문에 그리디 알고리즘으로 분류된다 알고리즘의 과정은 다음과 같다.
1. 출발 노드를 설정한다.
2. 최단 거리 테이블을 초기화 한다. (초기에는 전부 무한대 값으로 초기화 한다)
3. 방문하지 않은 노드 중에서 최단 거리가 가장 짧은 노드를 선택한다.
4. 해당 노드를 거쳐 다른 노드로 가는 비용을 계산하여 최단 거리 테이블을 갱신한다.
5. 위 과정의 3,4를 반복한다.
다익스트라 알고리즘은 최단 경로를 구하는 과정에서 '각 노드에 대한 현재까지의 최단 거리' 정보를 항상 1차원 리스트에 저장하며 리스트를 계속 갱신한다. 3번에서 방문하지 않은 노드 중에서 최단 거리가 가장 짧은 노드를 선택해서 4번을 수행한다는 점에서 그리디 알고리즘으로 볼 수 있다.
다익스트라 최단 경로 알고리즘에서는 '방문하지 않은 노드 중에서 가장 최단 거리가 짧은 노드를 선택'하는 과정을 반복한다. 그래서 최적의 해답을 구할 수 있다.
다익스트라 알고리즘 구현
1. 첫번째 방법
import sys
input = sys.stdin.readline
INF = int(1e9)#무한
#노드의 개수, 간선의 개수 입력 받기
n,m = map(int,input().split())
#시작 노드
start = int(input())
#각 노드에 연결되어 있는 노드에 대한 정보 담는 리스트 만들기
graph=[[] for i in range(n+1)]
#방문 리스트
visited = [False]*(n+1)
#최단 거리 테이블 무한으로 초기화
distance = [INF]*(n+1)
#모든 간선 정보 입력받기
for _ in range(m):
a,b,c = map(int,input().split())
#a번 노드에서 b번 노드로 가는 비용이 c
graph[a].append((b,c))
#방문하지 않은 노드 중에서, 가장 최단 거리가 짧은 노드의 번호를 반환
def get_smallest_node():
min_value = INF
index =0 #가장 최단 거리가 짧은 노드
for i in range(1,n+1):
if distance[i]<min_value and not visited[i]:
min_value = distance[i]
index = i
return index
def dijkstra(start):
#시작 노드 초기화
distance[start]=0
visited[start]=True
for j in graph[start]:
distance[j[0]]=j[1]
#시작 노드를 제외한 전체 n-1개의 노드에 대해 반복
for i in range(n-1):
#현재 최단 거리가 가장 짧은 노드를 꺼내서, 방문 처리
now = get_smallest_node()
visited[now]=True
#현재 노드와 연결된 다른 노드를 확인
for j in graph[now]:
cost = distance[now]+j[1]
#현재 노드를 거쳐서 다른 노드로 이동하는 거리가 더 짧은 경우
if cost<distance[j[0]]:
distance[j[0]]=cost
#다익스트라 알고리즘 실행
dijkstra(start)
#모든 노드로 가기 위한 최단 거리를 출력
for i in range(1,n+1):
#도달할 수 없는 경우, 무한(INFINITY)출력
if distance[i]==INF:
print("INFINITY")
#도달할 수 있는 경우 거리를 출력
else:
print(distance[i])
-첫번째 다익스트라 알고리즘의 시간 복잡도 : O(N^2)
다익스트라 알고리즘의 코드를 보면 전체 노드에서 for문을 돌릴때 get_smallest_node()함수를 계속 사용한다.
get_smallest_node()함수에서는 전체 노드에서 제일 거리가 짧은 노드를 찾기 때문에 O(V)번 걸린다. 결국 시간복잡도는 O(V^2)이 된다. 따라서 노드의 개수가 10000개를 넘어가면 문제를 해결할 때 이 방법을 쓰면 시간 초과가 날 수 있다.
2. 두번째 방법
-두번째 다익스트라 알고리즘의 시간 복잡도 : O(MlogN)
이 방법은 최악의 경우에도 O(MlogN)을 보장하여 해결할 수 있다. 여기서 N은 노드의 개수, M은 간선의 개수에 해당한다. 첫번째 알고리즘에서 최단 거리 노드를 하나하나씩 탐색했다면 이 과정에서 시간을 단축하여 알고리즘을 개선하였다. 여기서는 힙 자료구조를 사용한다. 힙 자료구조를 이용하게 되면 특정 노드까지의 최단 거리에 대한 정보를 힙에 담아서 처리하므로 출발 노드로부터 가장 거리가 짧은 노드를 더욱 빠르게 찾을 수 있다. 이 과정에서 로그 시간이 걸린다.
//힙 관련
데이터의 개수가 N개일 때, 힙 자료구조에 N개의 데이터를 모두 넣은 뒤에 다시 모든 데이터를 꺼낸다고 해보자. 이때의 시간 복잡도는 어떻게 될가? 삽입할 때는 O(logN)의 연산을 N번 반복하므로 O(NlongN)이고 삭제할 때에서 O(logN)의 연산을 N번 반복하므로 O(NlogN)이다. 따라서 전체 연산 횟수는 대략 2NlogN으로 시간복잡도는 O(NlogN)이 될 것이다.
최소 힙을 이용하는 경우 힙에서 원소를 꺼내면 '가장 값이 작은 원소'가 추출되는 특징이 있으며, 파이썬의 우선순위 큐라이브러리는 최소 힙에 기반한다. 우선순위 큐를 이용해서 시작 노드로부터 '거리'가 짧은 노드 순서대로 큐에서 나올 수 잇도록 다익스트라 알고리즘을 작성하면 된다.
1번 방법에서 현재 가장 가까운 노드를 저장하기 위한 목적으로만 우선순위 큐를 추가로 이용한다고 보면 된다. 파이썬의 heapq 라이브러리는 원소로 튜플을 입력받으면 튜플의 첫 번째 원소를 기준으로 우선순위 큐를 구성한다. 따라서 (거리, 노드 번호) 순서대로 튜플 데이터를 구성해 우선순위 큐에 넣으면 거리순으로 정렬된다.
import heapq
import sys
input = sys.stdin.readline
INF = int(1e9)
#노드의 개수, 간선의 개수 입력받기
n,m = map(int,input().split())
#시작 노드 번호를 입력받기
start = int(input())
#각 노드에 연결되어 있는 노드에 대한 정보를 담는 리스트 만들기
graph=[[] for i in range(n+1)]
#최단 거리 테이블을 모두 무한으로 초기화
distance=[INF]*(n+1)
#모든 간선 정보를 입력받기
for _ in range(m):
a,b,c = map(int,input().split())
#a번 노드에서 b번 노드로 가는 비용이 c
graph[a].append((b,c))
def dijkstra(start):
q=[]
#시작 노드로 가기 위한 최단 경로는 0으로 설정하여, 큐에 삽입
heapq.heappush(q,(0,start))
distance[start]=0
while q:#큐가 비어있지 않다면
#가장 최단 거리가 짧은 노드에 대한 정보 꺼내기
dist,now = heapq.heappop(q)
#현재 노드가 이미 처리된 적이 있는 노드라면 무시
if distance[now]<dist:
continue
#현재 노드와 연결된 다른 인접한 노드들을 확인
for i in graph[now]:
cost = dist + i[1]
#현재 노드를 거쳐서, 다른 노드로 이동하는 거리가 더 짧은 경우
if cost < distance[i[0]]:
distance[i[0]] = cost
heapq.heappush(q,(cost,i[0]))
#다익스트라 알고리즘 수행
dijkstra(start)
#모든 노드로 가기 위한 최단 거리 출력
for i in range(1,n+1):
if distance[i]==INF:
print("INFINITY")
else:
print(distance[i])