목록AI (43)
hojeomi blog
1. 군집(Community)의 정의 집합에 속하는 정점 사이에는 많은 간선이 존재 집합에 속하는 정점과 그렇지 않은 정점 사이에는 적은 수의 간선이 존재 2. 군집 구조의 통계적 유의성과 군집성 성공적인 군집 탐색을 정의하기 위해 - 비교대상: 배치 모형 배치모형: 각 정점의 연결성(degree)을 보존한 상태에서, 간선들을 무작위로 재배치하여 얻은 그래프 군집성(Modularity) 그래프와 군집들의 집합 S가 주어졌을 때, 각 군집 s가 군집 집합 S의 성질을 잘 만족하는지를 살펴보기 위해, 군집 내부의 간선의 수를 그래프와 배치 모형에서 비교함 (그래프에서 군집 s 내부 간선의 수 - 배치 모형에서 군집 s 내부 간선의 수의 기댓값)을 정규화 한 값 → 군집성은 항상 -1과 +1 사이의 값을 갖음..
1. 페이지랭크 계산법 - 반복곱(power iteration) 1. 각 웹페이지 i의 페이지랭크 점수 초기값 r을 동일하게 1/웹페이지수(노드수)로 초기화함 2. 아래 식을 이용하여 각 웹페이지의 페이지랭크 점수를 갱신함 3. 페이지랭크 점수가 수렴하면 종료, 아니면 2.로 돌아감 수렴 확인: r(t) - r(t+1)가 하이퍼파라미터인 에러 e 값보다 작으면 수렴 2. 순간이동(Teleport) 기존 페이지랭크의 한계를 극복하기 위해 → 순간이동을 통해 스파이더 트랩(간선이 엄청 많이 늘어나는)이나, 막다른 정점에 갇히는 일 없어짐 임의 보행(random walk) 관점에서 웹을 서핑하는 웹서퍼의 행동을 다음과 같이 수정함 현재 웹페이지에 하이퍼링크가 없다면, 임의로 웹페이지로 순간이동을 함 현재 웹페..
0. Intro 정점(Vertex): 노드(Node), 간선: 엣지(Edge) 또는 링크(Link) 1. 동종(Unpartite) 그래프 vs 이종(Bipartite) 그래프 동종 그래프는 단일 종류의 정점을 가짐 이종 그래프는 두 종류의 정점을 가짐 예) 영화 출연 그래프(배우, 영화) 2. 일반 행렬 vs 희소 행렬 일반 행렬 인접 행렬: 전체 원소를 저장하므로 원소 대부분이 0이라면 비효율적 희소 행렬: 0이 아닌 원소만 저장함. 간선의 수에 비례하는 저장 공간을 사용 예) 정점의 수가 10만, 간선의 수가 100만이라면, 일반 행렬로 저장 시 정점의 수 제곱(100억), 희소 행렬로 저장 시 간선의 수(100만)큼 저장함 3. 작은 세상 효과 여섯 단계 분리(Six Degree of Separat..
출처: wikidocs.net/22893 0. Intro seq2seq 모델은 인코더에서 입력 시퀀스를 컨텍스트 벡터라는 하나의 고정된 크기의 벡터 표현으로 압축하고, 디코더는 이 컨텍스트 벡터를 통해서 출력 시퀀스를 만듦 하지만, 이러한 RNN에 기반한 seq2seq 모델에는 크게 두 가지 문제가 있음 하나의 고정된 크기의 벡터에 모든 정보를 압축하려다 보니, 정보 손실이 발생함 RNN의 고질적인 문제인 기울기 소실(Vanishing Gradient) 문제가 존재함 결국, 기계 번역 분야에서 입력 문장이 길면 번역 품질이 떨어지는 현상이 나타남 이를 위한 대안으로 입력 시퀀스가 길어지면 출력 시퀀스의 정확도가 떨어지는 것을 보정해 주기 위해 등장한 기법이 어텐션(attention) 1. 어텐션의 아이디..